AtomoVideo:阿里开发的先进图像到视频生成框架
AtomoVideo项目介绍 AtomoVideo是一款由阿里巴巴研究团队开发的先进图像到视频(I2V)生成框架。它采用前沿的AI技术,能够将静态图像快速、高效地转化为高质...
ELLA:腾讯开发的扩散模型适配器,让语义对齐更精准
ELLA项目介绍 ELLA是由腾讯研发团队开发的一款高效大型语言模型适配器,旨在提升文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过将大型语言模型...
2024年3月AI快讯
2024.3.31 1.微软 Azure 新增 9 款逼真 AI 语音,包括美式英语、中文等 根据微软博客文章,这些新语音可用于各种工作和任务,例如商务聊天机器人、语音助手、...
EMO:阿里推出的能让图片开口说话唱歌的框架
EMO项目介绍 EMO(Emote Portrait Alive)是由阿里巴巴集团智能计算研究所开发的先进框架,它利用音频驱动的视频生成技术,通过扩散模型直接从音频信号合成具...
UniEdit:支持动作编辑、风格迁移、背景替换视频编辑框架
UniEdit项目介绍 UniEdit是一款由浙江大学、微软研究院和北京大学的研究人员共同开发的先进视频编辑框架。它凭借无需训练即可使用的特点,为用户提供了强大的...
InstantID:生成风格多样且高度个性化的图像
InstantID项目介绍 InstantID 是由 InstantX Team 开发的一项创新技术,它能够在几秒钟内实现零样本的身份保持图像生成。这项技术利用单一面部图像,通过一个...
ActAnywhere:生成与前景主体动作相匹配的视频背景
ActAnywhere项目介绍 ActAnywhere是由斯坦福大学和Adobe Research的联合团队开发的一款先进的视频生成模型。它专注于自动化生成与前景主体动作相匹配的视频背...
Make-A-Character:几分钟内生成高质量的3D角色
Make-A-Character项目介绍 Make-A-Character (Mach) 是一个由阿里巴巴集团智能计算研究所开发的框架,它允许用户通过文本描述在几分钟内生成高质量的3D角色。...
AnimateDiff:文本到图像模型扩展为动画生成器的框架
AnimateDiff项目介绍 AnimateDiff 是由上海人工智能实验室、香港中文大学和斯坦福大学的研究人员联合推出的一款先进框架。该框架允许用户将个性化的文本到图...
Boximatorz:控制视频中对象的位置、形状和运动路径
Boximator项目介绍 Boximator 是 由字节跳动开发的一项先进视频合成技术,它通过硬框和软框的创新约束方法,实现了对视频动作的精细控制。该技术作为一个插件...