2.应用工具相关 | 第 79 页

Still-Moving：Google DeepMind 团队开发的一种创新视频生成框架

Still-Moving简介 Still-Moving 是由 Google DeepMind 团队开发的一种创新视频生成框架，它允许在无需定制视频数据的情况下，对文本到视频（T2V）模型进行个...

2-3.应用工具视频

11个月前

LongVILA简介 LongVILA是由英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校的联合研究团队开发的一种先进的多模态视觉语言模型。它专为长视频理解而设计，通...

2-3.应用工具视频

11个月前

CrewAI简介 CrewAI是一个开源框架，它通过促进AI代理之间的协作智能，使它们能够像专业团队一样协同工作，共同完成复杂任务。这个框架支持角色定制、任务动态...

2-5.应用工具其他

11个月前

DistriFusion简介 DistriFusion是由MIT、普林斯顿大学、Lepton AI和NVIDIA的联合研究团队开发的一种创新算法，旨在通过在多个GPU上实现分布式并行推理，显著...

2-5.应用工具其他

11个月前

Seed-ASR简介 Seed-ASR是由字节跳动的Seed团队开发的一款基于大型语言模型（LLM）的语音识别模型。它通过结合超过2亿参数的音频编码器和具有数十亿参数的专家...

2-4.应用工具音频

11个月前

TurboEdit简介 TurboEdit是由Adobe Research开发的一项创新技术，它通过引入基于编码器的迭代反演技术和条件化处理，实现了对图像的精确反演和解耦图像编辑。...

2-2.应用工具图像

11个月前

FancyVideo简介 FancyVideo 是由360和中山大学共同开发的一款创新视频生成模型。它通过引入跨帧文本引导模块（Cross-frame Textual Guidance Module, CTGM）...

2-3.应用工具视频

11个月前

Tavus简介 Tavus 是一个先进的AI视频生成平台，它支持数字人克隆和实时对话功能。这个平台基于Phoenix-2模型和对话式视频接口（CVI），能够实现接近人类的自...

2-3.应用工具视频

11个月前

Buzz简介 Buzz是一个开源的离线音频转录和翻译工具，由OpenAI的Whisper模型提供技术支持。它允许用户在个人电脑上自动将音频文件转换成文字，同时支持多语言...

2-4.应用工具音频

11个月前

Linly-Dubbing简介 Linly-Dubbing 是一个开源的AI视频工具，它支持视频的配音、翻译和对口型功能。这个工具能够自动将视频内容翻译成多种语言，并生成相应的...

2-3.应用工具视频

11个月前