博客 | 第 87 页 | 柒柒AI导航

EfficientTAM：Meta AI团队推出的轻量级视频对象分割和跟踪模型

EfficientTAM简介 EfficientTAM是由Meta AI团队开发的一种轻量级视频对象分割和跟踪模型，旨在解决现有技术在移动设备上应用时面临的高计算复杂性问题。该模...

2-3.应用工具视频

7个月前

MotionFix简介 MotionFix是由德国马克斯普朗克智能系统研究所的研究团队开发的一种创新的3D人体动作编辑数据集。该数据集通过半自动方式收集，包含源动作、目...

2-6.应用工具3D

7个月前

PersonaCraft简介 PersonaCraft是由首尔国立大学电气与计算机工程系的研究团队开发的一种创新方法，它结合了扩散模型和3D人类建模技术，能够从单一参考图像生...

2-2.应用工具图像

7个月前

StableAnimator简介 StableAnimator是由复旦大学智能信息处理实验室和微软亚洲研究院共同开发的一种先进的人类图像动画扩散框架。该框架能够在无需任何后处理...

2-3.应用工具视频

7个月前

VISTA简介 VISTA是一个由加拿大滑铁卢大学和Vector Institute联合开发的创新框架，旨在通过视频时空增强技术提升对长时和高分辨率视频的理解能力。该框架通过...

2-3.应用工具视频

8个月前

RollingDepth简介 RollingDepth是由ETH Zurich和卡内基梅隆大学的研究团队开发的一种先进的单目视频深度估计方法，它通过将单图像潜在扩散模型（LDM）扩展到...

2-3.应用工具视频

8个月前

FLOAT简介 FLOAT是一种创新的音频驱动肖像视频生成框架，由DeepBrain AI Inc.和韩国科学技术院（KAIST）的研究团队共同开发。这项技术通过流匹配生成模型，将...

2-3.应用工具视频

8个月前

HiFiVFS简介 HiFiVFS是由腾讯和VIVO的联合研究团队开发的一种高保真视频换脸框架。该技术通过结合扩散模型的强大生成能力和时间先验，能够在视频中实现源图像...

2-2.应用工具图像

8个月前

MultiFoley简介 MultiFoley是由密歇根大学和Adobe Research的联合研究团队开发的一款先进的视频引导Foley音效生成模型，它通过结合文本、音频和视频的多模态...

2-4.应用工具音频

8个月前

Make-It-Animatable简介 Make-It-Animatable是中国科学技术大学GIPAS关键实验室与腾讯PCG合作开发的一项高效框架，旨在为3D角色创作提供动画准备服务。该框架...

2-3.应用工具视频

8个月前