EfficientTAM:Meta AI团队推出的轻量级视频对象分割和跟踪模型
EfficientTAM简介 EfficientTAM是由Meta AI团队开发的一种轻量级视频对象分割和跟踪模型,旨在解决现有技术在移动设备上应用时面临的高计算复杂性问题。该模...
MotionFix:用自然语言描述来编辑3D人体动作
MotionFix简介 MotionFix是由德国马克斯普朗克智能系统研究所的研究团队开发的一种创新的3D人体动作编辑数据集。该数据集通过半自动方式收集,包含源动作、目...
PersonaCraft:从单一参考图像生成多个人物的个性化全身图像
PersonaCraft简介 PersonaCraft是由首尔国立大学电气与计算机工程系的研究团队开发的一种创新方法,它结合了扩散模型和3D人类建模技术,能够从单一参考图像生...
StableAnimator:复旦大学和微软联合推出的人类图像动画扩散框架
StableAnimator简介 StableAnimator是由复旦大学智能信息处理实验室和微软亚洲研究院共同开发的一种先进的人类图像动画扩散框架。该框架能够在无需任何后处理...
VISTA:提升对长时和高分辨率视频的理解能力
VISTA简介 VISTA是一个由加拿大滑铁卢大学和Vector Institute联合开发的创新框架,旨在通过视频时空增强技术提升对长时和高分辨率视频的理解能力。该框架通过...
RollingDepth:为视频的每一帧提供准确的深度信息
RollingDepth简介 RollingDepth是由ETH Zurich和卡内基梅隆大学的研究团队开发的一种先进的单目视频深度估计方法,它通过将单图像潜在扩散模型(LDM)扩展到...
FLOAT:DeepBrain AI等推出的音频驱动肖像视频生成框架
FLOAT简介 FLOAT是一种创新的音频驱动肖像视频生成框架,由DeepBrain AI Inc.和韩国科学技术院(KAIST)的研究团队共同开发。这项技术通过流匹配生成模型,将...
HiFiVFS:腾讯和VIVO的联合推出的高保真视频换脸框架
HiFiVFS简介 HiFiVFS是由腾讯和VIVO的联合研究团队开发的一种高保真视频换脸框架。该技术通过结合扩散模型的强大生成能力和时间先验,能够在视频中实现源图像...
MultiFoley:Adobe&密歇根大学推出的音效生成模型
MultiFoley简介 MultiFoley是由密歇根大学和Adobe Research的联合研究团队开发的一款先进的视频引导Foley音效生成模型,它通过结合文本、音频和视频的多模态...
Make-It-Animatable:中科大联合腾讯推出的3D角色动画框架
Make-It-Animatable简介 Make-It-Animatable是中国科学技术大学GIPAS关键实验室与腾讯PCG合作开发的一项高效框架,旨在为3D角色创作提供动画准备服务。该框架...