AI项目合集
LayerDiffusion:生成具有透明度的图像
LayerDiffusion项目介绍 LayerDiffuse 是由斯坦福大学的 Lvmin Zhang 和 Maneesh Agrawala 开发的一种先进的图像生成技术。这项技术通过利用潜在透明度的概念...
HiDiffusion:提高图像的细节丰富度和清晰度
HiDiffusion项目介绍 HiDiffusion是由MEGVII Technology和南开大学的研究团队联合开发的创新框架,旨在大幅提升扩散模型在高分辨率图像生成方面的表现。通过...
TripoSR:由 Stability AI 等开源的3D 物体重建模型
TripoSR项目介绍 TripoSR 是一项由 Stability AI 和国内 AI 企业 VAST 合作开源的快速 3D 物体重建模型,它能够在极短的时间内从单张 2D 图像快速生成高质量...
DUSt3R:一种突破性的3D视觉重建技术
DUSt3R项目介绍 DUSt3R是一种突破性的3D视觉重建技术,由Naver Labs Europe的研究团队开发,它允许用户无需依赖相机校准参数,直接从任意图像集合中进行密集...
PixArt-Σ – 华为开发的文本到高清图像生成模型
PixArt-Σ项目介绍 PixArt-Σ是一款由华为诺亚方舟实验室联合多个研究机构共同开发的强大文本到图像生成模型。它采用了先进的扩散Transformer(DiT)架构,能够...
Follow-Your-Click:可生成局部动画的图像到视频模型
Follow-Your-Click项目介绍 'Follow-Your-Click' 是一款由腾讯、清华大学及香港科技大学联合开发的图像到视频生成模型。该模型的主要特点是可以通过用户的点...
AtomoVideo:阿里开发的先进图像到视频生成框架
AtomoVideo项目介绍 AtomoVideo是一款由阿里巴巴研究团队开发的先进图像到视频(I2V)生成框架。它采用前沿的AI技术,能够将静态图像快速、高效地转化为高质...
ELLA:腾讯开发的扩散模型适配器,让语义对齐更精准
ELLA项目介绍 ELLA是由腾讯研发团队开发的一款高效大型语言模型适配器,旨在提升文本到图像生成模型在处理复杂文本提示时的语义对齐能力。通过将大型语言模型...
EMO:阿里推出的能让图片开口说话唱歌的框架
EMO项目介绍 EMO(Emote Portrait Alive)是由阿里巴巴集团智能计算研究所开发的先进框架,它利用音频驱动的视频生成技术,通过扩散模型直接从音频信号合成具...
UniEdit:支持动作编辑、风格迁移、背景替换视频编辑框架
UniEdit项目介绍 UniEdit是一款由浙江大学、微软研究院和北京大学的研究人员共同开发的先进视频编辑框架。它凭借无需训练即可使用的特点,为用户提供了强大的...