3-3.视频生成模型
Pyramid Flow:北大和快手联合推出的新型视频生成模型
Pyramid Flow简介 Pyramid Flow是一种创新的视频生成模型,由北京大学和快手科技的开发团队联合研发。该框架通过引入空间和时间金字塔的概念,优化了视频生成...
Movie Gen:Meta 推出的AI视频生成工具
Movie Gen 简介 Movie Gen 是 Meta 推出的AI视频生成工具,能够根据文本提示自动创建高质量的视频和音频。该模型基于一个拥有300亿参数的变换器,经过大量图...
CogVideoX-5B-I2V:智谱 AI 最新开源的文本到视频生成模型
CogVideoX-5B-I2V简介 CogVideoX-5B-I2V 是智谱 AI 开源的文本到视频生成模型,基于 3D 因果变分自编码器和专家自适应 LayerNorm 技术,能够根据文本提示生成...
abab-video-1:MiniMax推出的首款AI高清视频生成模型
abab-video-1简介 abab-video-1是MiniMax推出的首款AI高清视频生成模型,旨在革新视频创作方式。该模型支持生成最高分辨率为1280x720、帧率为25fps的视频,最...
Vchitect 2.0:书生蒲语团队推出的AI视频生成模型
Vchitect 2.0简介 Vchitect 2.0 是由书生蒲语团队推出的AI视频生成模型,它通过深度学习和自然语言处理技术,实现了文本到视频和图像到视频的转换功能。这个...
Loopy:字节&浙大推出的音频驱动视频生成模型
Loopy简介 Loopy是由字节跳动公司和浙江大学的研究团队共同开发的一种先进的音频驱动视频生成模型。该模型采用端到端的设计,专注于利用长期运动依赖性来提高...
StreamingT2V:从文本生成一致、动态且可扩展的长视频
StreamingT2V简介 StreamingT2V是由Picsart AI Research团队开发的一项创新技术,它通过先进的自回归方法,能够将文本描述转换成具有丰富动态效果和时间连贯...
CustomCrafter :浙江大学和腾讯联合开发的一款创新视频生成框架
CustomCrafter简介 CustomCrafter 是由浙江大学和腾讯联合开发的一款创新视频生成框架。它能够根据文本提示和主题参考图像生成高质量视频,同时保留运动生成...
CogVideoX:智谱AI开源的视频生成模型(新增CogVideoX-5B模型)
CogVideo简介 CogVideoX是由智谱AI推出的一款先进的文本到视频扩散模型。是 清影 同源的开源版本视频生成模型。它通过结合3D变分自编码器和专家变换器架构,...
TrackGo:一种灵活高效的可控视频生成方法
TrackGo简介 TrackGo是由北京航空航天大学和AISphere Tech的联合研究团队开发的一种创新视频生成方法。这项技术允许用户通过自由形式的遮罩和箭头来指定目标...