AI开源项目
LLaVA-o1:清华&北大等联合推出的一种新型视觉语言模型
LLaVA-o1简介 LLaVA-o1是由北京大学电子与计算机工程学院、清华大学跨学科信息科学研究所、鹏城实验室以及AI for Science (AI4S)-Preferred Program联合开发...
AnimateAnything:能够实现对视频内容的精确和一致性操控
AnimateAnything简介 AnimateAnything是由浙江大学CAD&CG国家重点实验室、清华大学、北京航空航天大学和浙江工商大学联合开发的先进视频生成技术。这项技...
RAG-Diffusion:南京大学推出的区域感知文本到图像生成技术
RAG-Diffusion简介 RAG-Diffusion是由南京大学的研究团队开发的一种先进的文本到图像生成方法,它通过区域感知的硬绑定和软细化技术,实现了对图像中各个区域...
FitDiT:够生成穿着特定服装的逼真图像 提升消费者的购物体验
FitDiT简介 FitDiT是由腾讯公司与复旦大学合作开发的一项先进技术,旨在通过Diffusion Transformers(DiT)提升虚拟试穿的真实感和细节保真度。该技术通过专...
MagicClay:Adobe推出的3D建模工具
MagicClay简介 MagicClay是由Adobe 推出3D建模工具。该技术通过混合使用有符号距离场(SDF)和三角形网格的表示方法,允许用户根据文本提示对3D模型的特定区...
StableV2V:中国科技大学推出的开源视频编辑项目
StableV2V简介 StableV2V是中国科技大学推出的开源视频编辑项目,旨在通过稳定的形状一致性来改进视频到视频编辑的质量。该方法通过分解编辑流程,首先编辑视...
JoyVASA:京东健康国际公司等推出的音频驱动肖像动画项目
JoyVASA简介 JoyVASA是由京东健康国际公司与浙江大学联合开发的一种创新的音频驱动肖像动画项目。该技术基于扩散模型,通过解耦动态面部表情与静态3D面部表示...
OMNI-EDIT:滑铁卢大学等推出的新型全能图像编辑模型
OMNI-EDIT简介 OMNI-EDIT是由加拿大滑铁卢大学、威斯康星大学麦迪逊分校和Vector Institute的研究人员共同开发的新型全能图像编辑模型。该模型能够处理包括对...
MagicQuill:可以通过简单的添加、减去和上色笔触来编辑图像
MagicQuill简介 MagicQuill是一个创新的智能交互式图像编辑系统,它利用扩散模型和直观的笔触操作,让用户能够轻松实现精确的图像编辑。用户可以通过添加、减...
MikuDance:能够将静态的角色艺术作品转化为动态视频
MikuDance简介 MikuDance是一个创新的动画制作工具,它通过结合混合运动建模和混合控制扩散技术,能够有效地为风格化的角色艺术注入动态生命。这个工具不仅能...