AI开源项目
JoyVASA:京东健康国际公司等推出的音频驱动肖像动画项目
JoyVASA简介 JoyVASA是由京东健康国际公司与浙江大学联合开发的一种创新的音频驱动肖像动画项目。该技术基于扩散模型,通过解耦动态面部表情与静态3D面部表示...
OMNI-EDIT:滑铁卢大学等推出的新型全能图像编辑模型
OMNI-EDIT简介 OMNI-EDIT是由加拿大滑铁卢大学、威斯康星大学麦迪逊分校和Vector Institute的研究人员共同开发的新型全能图像编辑模型。该模型能够处理包括对...
MagicQuill:可以通过简单的添加、减去和上色笔触来编辑图像
MagicQuill简介 MagicQuill是一个创新的智能交互式图像编辑系统,它利用扩散模型和直观的笔触操作,让用户能够轻松实现精确的图像编辑。用户可以通过添加、减...
MikuDance:能够将静态的角色艺术作品转化为动态视频
MikuDance简介 MikuDance是一个创新的动画制作工具,它通过结合混合运动建模和混合控制扩散技术,能够有效地为风格化的角色艺术注入动态生命。这个工具不仅能...
SAMPart3D:香港大学推出的多粒度3D对象语义分割框架
SAMPart3D简介 SAMPart3D是由香港大学的研究团队开发的一个创新框架,它能够在不需要预定义部件标签或文本提示的情况下,将3D对象分割成多个语义的部件。这个...
Add-it:能够在图像中根据文本指令自然地添加新对象
Add-it简介 Add-it是由NVIDIA和Tel-Aviv University的研究团队开发的一种创新方法,它能够在图像中无缝添加对象,同时保持场景的自然性和结构一致性。这一训...
FabricDiffusion:将现实世界的服装纹理精确转移到三维服装模型上
FabricDiffusion 简介 FabricDiffusion 是由卡内基梅隆大学和谷歌研究团队开发的一种先进方法,用于将现实世界的服装纹理精确转移到三维服装模型上。这一方法...
GenXD:新加坡国立大学&微软推出的多视角3D和4D场景生成模型
GenXD简介 GenXD是由新加坡国立大学和微软公司的研究团队联合开发的一个统一模型,它能够从任意数量的条件图像中高效生成高质量的3D和4D场景。该模型利用日常...
AlphaFold 3:极大地提高了生物分子复合体结构预测的准确性
AlphaFold 3简介 AlphaFold 3是由Google DeepMind推出的一款人工智能模型,它极大地提高了生物分子复合体结构预测的准确性。该模型采用了扩散架构,能够预测...
URAvatar:能够从单台手机扫描中创建具有真实感的头部化身
URAvatar简介 URAvatar是由Meta开发的一种创新技术,它允许从单台手机扫描创建高度逼真的可重光照头部化身。这些化身能够在各种光照环境中实时动画和重光照,...