DUSt3R:一种突破性的3D视觉重建技术
DUSt3R项目介绍 DUSt3R是一种突破性的3D视觉重建技术,由Naver Labs Europe的研究团队开发,它允许用户无需依赖相机校准参数,直接从任意图像集合中进行密集...
PixArt-Σ – 华为开发的文本到高清图像生成模型
PixArt-Σ项目介绍 PixArt-Σ是一款由华为诺亚方舟实验室联合多个研究机构共同开发的强大文本到图像生成模型。它采用了先进的扩散Transformer(DiT)架构,能够...
Follow-Your-Click:可生成局部动画的图像到视频模型
Follow-Your-Click项目介绍 'Follow-Your-Click' 是一款由腾讯、清华大学及香港科技大学联合开发的图像到视频生成模型。该模型的主要特点是可以通过用户的点...
AtomoVideo:阿里开发的先进图像到视频生成框架
AtomoVideo项目介绍 AtomoVideo是一款由阿里巴巴研究团队开发的先进图像到视频(I2V)生成框架。它采用前沿的AI技术,能够将静态图像快速、高效地转化为高质...
ELLA:腾讯开发的扩散模型适配器,让语义对齐更精准
ELLA项目介绍 ELLA是由腾讯研发团队开发的一款高效大型语言模型适配器,旨在提升文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过将大型语言模型...
2024年3月AI快讯
2024.3.31 1.微软 Azure 新增 9 款逼真 AI 语音,包括美式英语、中文等 根据微软博客文章,这些新语音可用于各种工作和任务,例如商务聊天机器人、语音助手、...
EMO:阿里推出的能让图片开口说话唱歌的框架
EMO项目介绍 EMO(Emote Portrait Alive)是由阿里巴巴集团智能计算研究所开发的先进框架,它利用音频驱动的视频生成技术,通过扩散模型直接从音频信号合成具...
UniEdit:支持动作编辑、风格迁移、背景替换视频编辑框架
UniEdit项目介绍 UniEdit是一款由浙江大学、微软研究院和北京大学的研究人员共同开发的先进视频编辑框架。它凭借无需训练即可使用的特点,为用户提供了强大的...
人工智能AIGC系列技能培训大纲
为贯彻落实党和国家关于“数字中国”的伟大战略,满足社会对学习科技的强烈需求,帮助大学生、青年群体和从业人群提升人工智能 2.0 时代所需的职业技能、增加人...
AIGC评测项目合作机构
柒柒AI导航网站隶属深圳市艾柒柒科技有限公司,是一个集合全球最先进,最实用AI工具的导航网。深圳市艾柒柒科技有限公司是工信部工业文化发展中心尚工行动 《...