3-3.视频生成模型

Wan 2.1:阿里推出的视频生成大模型

Wan 2.1简介 Wan 2.1 是由阿里云开源的视频生成大模型。它能够根据文本、图像等多种输入信号生成高质量的视频内容,展现了强大的多模态生成能力。该模型基于...

Step-Video-T2V:阶跃星辰开源的文本到视频预训练模型

Step-Video-T2V简介 Step-Video-T2V是由阶跃星辰开源的文本到视频预训练模型,拥有300亿参数,能够生成长达204帧的高质量视频。该模型采用深度压缩的变分自编...

Magic 1-For-1:北京大学等推出的高效视频生成模型

Magic 1-For-1简介 Magic 1-For-1 是由北京大学、Hedra公司和Nvidia联合开发的高效视频生成模型。该模型通过将复杂的文本到视频生成任务分解为文本到图像生成...

InternVideo2.5:南京大学等推出的新型视频多模态大模型

InternVideo2.5简介 InternVideo2.5是由上海人工智能实验室、南京大学和中国科学院深圳先进技术研究院联合开发的新型视频多模态大模型。该模型专注于通过长且...

MinT:Snap与多伦多大学团队推出的视频生成模型

MinT简介 MinT(Mind the Time)是由Snap与多伦多大学团队推出的视频生成模型,它能够根据文本提示和预定的时间戳生成具有精确时间控制的视频序列。通过创新...

Ruyi:图森未来推出的图生视频大模型

Ruyi简介 Ruyi是图森未来推出的图生视频大模型,基于DiT架构,拥有约71亿参数,支持多分辨率、多时长视频生成。它能够根据用户控制的起始帧和结束帧定制视频...

Veo 2:谷歌 DeepMind 推出的最新版 AI 视频生成模型

Veo 2 简介 Veo 2 是谷歌 DeepMind 推出的最新版 AI 视频生成模型,它能够生成高达 4K 分辨率的视频,支持长达 2 分钟的视频片段。Veo 2 通过深度学习技术,...

STIV:苹果推出的可扩展文本和图像条件视频生成框架

STIV简介 STIV是一种新型的可扩展文本和图像条件视频生成框架,由苹果和加州大学洛杉矶分校的研究团队共同开发。该框架通过整合图像条件和文本条件,能够同时...

CausVid:麻省理工学院和Adobe联合推出的视频生成模型

CausVid简介 CausVid是由麻省理工学院(MIT)和Adobe研究院共同开发的先进视频生成模型,它通过将双向扩散模型转换为因果模型,显著降低了视频生成的延迟,并...

MarDini:Meta AI 和 KAUST 联合推出的视频扩散模型

MarDini 简介 MarDini 是 Meta AI 和 KAUST 联合推出的一种新型视频扩散模型,它融合了掩码自回归(MAR)和扩散模型(DM)的优势,用于大规模视频生成。该模...
1 2 3 4 5