2-3.应用工具视频

VideoMind:香港理工大学等推出的视频语言智能体

VideoMind简介 VideoMind是由香港理工大学和新加坡国立大学Show Lab联合开发的一种新型视频语言智能体,专为长视频的时序理解而设计。它通过角色化工作流程,...

ChatAnyone:阿里通义推出的实时肖像视频生成框架

ChatAnyone简介 ChatAnyone是由阿里巴巴集团通义实验室开发的一种新型实时肖像视频生成框架。它通过分层运动扩散模型和混合控制融合生成模型,能够根据输入的...

Video-T1:通过测试时扩展(TTS)显著提升视频生成质量

Video-T1简介 Video-T1 是一种创新的视频生成框架,旨在通过测试时扩展(Test-Time Scaling, TTS)显著提升视频生成质量。它将视频生成的 TTS 重新定义为从高...

KDTalker:音频驱动说话肖像生成框架

KDTalker简介 KDTalker是一个创新的音频驱动说话肖像生成框架,它通过结合无监督隐式3D关键点和时空扩散模型,实现了高精度的唇部同步和丰富的头部姿态多样性...

YT Navigator:AI 驱动的 YouTube 内容搜索工具

YT Navigator 简介 YT Navigator 是一款 AI 驱动的 YouTube 内容搜索工具。它能够帮助用户高效地搜索和浏览 YouTube 频道中的视频内容,通过自然语言查询快速...

I2V3D:将静态图像转化为具有精确 3D 控制的动态视频

I2V3D简介 I2V3D 是由香港城市大学和微软通用人工智能项目团队共同开发的一种创新框架,旨在将静态图像转化为具有精确 3D 控制的动态视频。该技术结合了计算...

ReCamMaster:快手联合浙大等推出的视频重渲染框架

ReCamMaster简介 ReCamMaster是由浙江大学、快手科技、香港中文大学和华中科技大学的研究团队共同开发的一种创新的视频重渲染框架。该框架能够通过改变相机轨...

Open-LLM-VTuber:开源数字人 支持实时语音对话和视觉感知

Open-LLM-VTuber 简介 Open-LLM-VTuber 是一个开源的 AI 数字人项目,支持实时语音对话和视觉感知。它结合了大语言模型(LLM)、语音识别(ASR)和语音合成(...

VACE:阿里通义推出的的视频生成与编辑框架

VACE简介 VACE(Video All-in-One Creation and Editing)是由阿里巴巴集团通义实验室开发的视频生成与编辑框架。它基于扩散变换器(Diffusion Transformer)...

VideoPainter:香港中文大学等推出的视频修复和编辑框架

VideoPainter简介 VideoPainter是由香港中文大学、腾讯ARC实验室、东京大学和澳门大学联合开发的一种新型视频修复和编辑框架。它通过高效的双分支架构和轻量...
1 2 3 4 22