AI开源项目
EfficientTAM:Meta AI团队推出的轻量级视频对象分割和跟踪模型
EfficientTAM简介 EfficientTAM是由Meta AI团队开发的一种轻量级视频对象分割和跟踪模型,旨在解决现有技术在移动设备上应用时面临的高计算复杂性问题。该模...
MotionFix:用自然语言描述来编辑3D人体动作
MotionFix简介 MotionFix是由德国马克斯普朗克智能系统研究所的研究团队开发的一种创新的3D人体动作编辑数据集。该数据集通过半自动方式收集,包含源动作、目...
PersonaCraft:从单一参考图像生成多个人物的个性化全身图像
PersonaCraft简介 PersonaCraft是由首尔国立大学电气与计算机工程系的研究团队开发的一种创新方法,它结合了扩散模型和3D人类建模技术,能够从单一参考图像生...
StableAnimator:复旦大学和微软联合推出的人类图像动画扩散框架
StableAnimator简介 StableAnimator是由复旦大学智能信息处理实验室和微软亚洲研究院共同开发的一种先进的人类图像动画扩散框架。该框架能够在无需任何后处理...
VISTA:提升对长时和高分辨率视频的理解能力
VISTA简介 VISTA是一个由加拿大滑铁卢大学和Vector Institute联合开发的创新框架,旨在通过视频时空增强技术提升对长时和高分辨率视频的理解能力。该框架通过...
Make-It-Animatable:中科大联合腾讯推出的3D角色动画框架
Make-It-Animatable简介 Make-It-Animatable是中国科学技术大学GIPAS关键实验室与腾讯PCG合作开发的一项高效框架,旨在为3D角色创作提供动画准备服务。该框架...
PSHuman:跨尺度扩散全身体人类重建模型
PSHuman简介 PSHuman是由香港科技大学、东南大学、清华大学和Vast联合开发的一种基于扩散的全身体人类重建模型。该模型能够从单张穿着衣物的人物图像中,快速...
AnchorCrafter:专门设计用于生成高保真度的主播风格产品推广视频
AnchorCrafter简介 AnchorCrafter是由中国科学院计算技术研究所、美团、大湾大学和腾讯的联合研究团队开发的一款创新系统,它基于扩散模型,专门设计用于生成...
SANA:英伟达联合清华大学等推出的文本到图像的生成框架
SANA简介 SANA是由NVIDIA、MIT和清华大学的联合研究团队开发的一款文本到图像的生成框架,它能够高效地生成高达4096×4096分辨率的高清晰度图像。SANA通过深度...
Generative Omnimatte:谷歌推出的的视频分解技术
Generative Omnimatte简介 Generative Omnimatte是由Google DeepMind团队开发的一种创新视频分解技术,它能够将视频解析成包含独立对象及其相关效果(如阴影...