3-3.视频生成模型

MinT:Snap与多伦多大学团队推出的视频生成模型

MinT简介 MinT(Mind the Time)是由Snap与多伦多大学团队推出的视频生成模型,它能够根据文本提示和预定的时间戳生成具有精确时间控制的视频序列。通过创新...

Ruyi:图森未来推出的图生视频大模型

Ruyi简介 Ruyi是图森未来推出的图生视频大模型,基于DiT架构,拥有约71亿参数,支持多分辨率、多时长视频生成。它能够根据用户控制的起始帧和结束帧定制视频...

Veo 2:谷歌 DeepMind 推出的最新版 AI 视频生成模型

Veo 2 简介 Veo 2 是谷歌 DeepMind 推出的最新版 AI 视频生成模型,它能够生成高达 4K 分辨率的视频,支持长达 2 分钟的视频片段。Veo 2 通过深度学习技术,...

STIV:苹果推出的可扩展文本和图像条件视频生成框架

STIV简介 STIV是一种新型的可扩展文本和图像条件视频生成框架,由苹果和加州大学洛杉矶分校的研究团队共同开发。该框架通过整合图像条件和文本条件,能够同时...

CausVid:麻省理工学院和Adobe联合推出的视频生成模型

CausVid简介 CausVid是由麻省理工学院(MIT)和Adobe研究院共同开发的先进视频生成模型,它通过将双向扩散模型转换为因果模型,显著降低了视频生成的延迟,并...

MarDini:Meta AI 和 KAUST 联合推出的视频扩散模型

MarDini 简介 MarDini 是 Meta AI 和 KAUST 联合推出的一种新型视频扩散模型,它融合了掩码自回归(MAR)和扩散模型(DM)的优势,用于大规模视频生成。该模...

Video-XL:智源联合多数高校推出的超长视频理解大模型

Video-XL简介 Video-XL是智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校联合推出的超长视觉语言模型,专为小时级视频理解而设...

Mochi 1:Genmo推出的开源视频生成模型

Mochi 1简介 Mochi 1是由Genmo推出的开源视频生成模型,基于非对称扩散变换器(AsymmDiT)架构,拥有10亿个参数,是当前最大的公开视频生成模型。它能够生成...

Allegro:Rhymes AI推出的一款商业级视频生成模型

Allegro简介 Allegro是由Rhymes AI推出的一款商业级视频生成模型,它通过高质量的文本描述能够生成具有卓越质量和时间一致性的视频内容。该模型在用户研究中...

Loong:香港大学与字节跳动联合推出的一款长视频生成模型

Loong简介 Loong是由香港大学与字节跳动公司联合开发的一款新型的长视频生成模型,它能够生成内容连贯、动态丰富的分钟级长视频。该模型通过将文本和视频标记...
1 2 3 4