AI开源项目 | 第 16 页

LLaVA-o1：清华&北大等联合推出的一种新型视觉语言模型

LLaVA-o1简介 LLaVA-o1是由北京大学电子与计算机工程学院、清华大学跨学科信息科学研究所、鹏城实验室以及AI for Science (AI4S)-Preferred Program联合开发...

2-1.应用工具文本

2个月前

AnimateAnything简介 AnimateAnything是由浙江大学CAD&CG国家重点实验室、清华大学、北京航空航天大学和浙江工商大学联合开发的先进视频生成技术。这项技...

2-3.应用工具视频

2个月前

RAG-Diffusion简介 RAG-Diffusion是由南京大学的研究团队开发的一种先进的文本到图像生成方法，它通过区域感知的硬绑定和软细化技术，实现了对图像中各个区域...

2-2.应用工具图像

2个月前

FitDiT简介 FitDiT是由腾讯公司与复旦大学合作开发的一项先进技术，旨在通过Diffusion Transformers（DiT）提升虚拟试穿的真实感和细节保真度。该技术通过专...

2-2.应用工具图像

2个月前

MagicClay简介 MagicClay是由Adobe 推出3D建模工具。该技术通过混合使用有符号距离场（SDF）和三角形网格的表示方法，允许用户根据文本提示对3D模型的特定区...

2-6.应用工具3D

2个月前

StableV2V简介 StableV2V是中国科技大学推出的开源视频编辑项目，旨在通过稳定的形状一致性来改进视频到视频编辑的质量。该方法通过分解编辑流程，首先编辑视...

2-3.应用工具视频

2个月前

JoyVASA简介 JoyVASA是由京东健康国际公司与浙江大学联合开发的一种创新的音频驱动肖像动画项目。该技术基于扩散模型，通过解耦动态面部表情与静态3D面部表示...

2-3.应用工具视频

2个月前

OMNI-EDIT简介 OMNI-EDIT是由加拿大滑铁卢大学、威斯康星大学麦迪逊分校和Vector Institute的研究人员共同开发的新型全能图像编辑模型。该模型能够处理包括对...

2-2.应用工具图像

2个月前

MagicQuill简介 MagicQuill是一个创新的智能交互式图像编辑系统，它利用扩散模型和直观的笔触操作，让用户能够轻松实现精确的图像编辑。用户可以通过添加、减...

2-2.应用工具图像

2个月前

MikuDance简介 MikuDance是一个创新的动画制作工具，它通过结合混合运动建模和混合控制扩散技术，能够有效地为风格化的角色艺术注入动态生命。这个工具不仅能...

2-3.应用工具视频

2个月前