3-3.视频生成模型
Video-XL:智源联合多数高校推出的超长视频理解大模型
Video-XL简介 Video-XL是智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校联合推出的超长视觉语言模型,专为小时级视频理解而设...
Mochi 1:Genmo推出的开源视频生成模型
Mochi 1简介 Mochi 1是由Genmo推出的开源视频生成模型,基于非对称扩散变换器(AsymmDiT)架构,拥有10亿个参数,是当前最大的公开视频生成模型。它能够生成...
Allegro:Rhymes AI推出的一款商业级视频生成模型
Allegro简介 Allegro是由Rhymes AI推出的一款商业级视频生成模型,它通过高质量的文本描述能够生成具有卓越质量和时间一致性的视频内容。该模型在用户研究中...
Loong:香港大学与字节跳动联合推出的一款长视频生成模型
Loong简介 Loong是由香港大学与字节跳动公司联合开发的一款新型的长视频生成模型,它能够生成内容连贯、动态丰富的分钟级长视频。该模型通过将文本和视频标记...
Pyramid Flow:北大和快手联合推出的新型视频生成模型
Pyramid Flow简介 Pyramid Flow是一种创新的视频生成模型,由北京大学和快手科技的开发团队联合研发。该框架通过引入空间和时间金字塔的概念,优化了视频生成...
Movie Gen:Meta 推出的AI视频生成工具
Movie Gen 简介 Movie Gen 是 Meta 推出的AI视频生成工具,能够根据文本提示自动创建高质量的视频和音频。该模型基于一个拥有300亿参数的变换器,经过大量图...
CogVideoX-5B-I2V:智谱 AI 最新开源的文本到视频生成模型
CogVideoX-5B-I2V简介 CogVideoX-5B-I2V 是智谱 AI 开源的文本到视频生成模型,基于 3D 因果变分自编码器和专家自适应 LayerNorm 技术,能够根据文本提示生成...
abab-video-1:MiniMax推出的首款AI高清视频生成模型
abab-video-1简介 abab-video-1是MiniMax推出的首款AI高清视频生成模型,旨在革新视频创作方式。该模型支持生成最高分辨率为1280x720、帧率为25fps的视频,最...
Vchitect 2.0:书生蒲语团队推出的AI视频生成模型
Vchitect 2.0简介 Vchitect 2.0 是由书生蒲语团队推出的AI视频生成模型,它通过深度学习和自然语言处理技术,实现了文本到视频和图像到视频的转换功能。这个...
Loopy:字节&浙大推出的音频驱动视频生成模型
Loopy简介 Loopy是由字节跳动公司和浙江大学的研究团队共同开发的一种先进的音频驱动视频生成模型。该模型采用端到端的设计,专注于利用长期运动依赖性来提高...