AI项目库

FlexiAct:清华联合腾讯开发的一种灵活动作控制技术

FlexiAct项目简介 FlexiAct是由清华大学深圳国际研究生院和腾讯ARC实验室联合开发的一种灵活动作控制技术。该技术能够在异构场景中将参考视频的动作精准地转...

LaRI:从单张图像中推理三维几何结构的新方法

LaRI项目简介 LaRI(Layered Ray Intersections)是由KAUST(阿卜杜拉国王科技大学)、Google和慕尼黑工业大学联合开发的一种从单张图像中推理三维几何结构的...

ACE-Step:ACE Studio和StepFun联合开发的开源音乐生成模型

ACE-Step项目简介 ACE-Step是由ACE Studio和StepFun联合开发的开源音乐生成模型。它通过整合多种先进技术,如基于扩散的生成方式、深度压缩自编码器和轻量级...

T2I-R1:香港中文大学等推出的文本到图像生成模型

T2I-R1项目简介 T2I-R1是由中国香港中文大学(深圳)多媒体实验室(MMLab)和上海人工智能实验室联合开发的一种新型推理增强型文本到图像生成模型。该模型通...

ReasonIR-8B:Meta AI研究团队开发的新型检索器

ReasonIR-8B项目简介 ReasonIR-8B是由 Meta AI研究团队开发的一种新型检索器。它是首个专门针对推理密集型任务训练的检索器,通过结合公共数据和合成数据进行...

Voila:一款语音基础模型,提供个性化语音定制

Voila项目简介 Voila是由Maitrix.org、加州大学圣地亚哥分校和穆罕默德·本·扎耶德人工智能大学(MBZUAI)联合开发的语音语言基础模型家族。该团队致力于打造...

UniTok:香港大学联合字节推出的统一视觉分词器

UniTok项目简介 UniTok是由香港大学、字节跳动公司和华中科技大学联合开发的一种创新的统一视觉分词器。它旨在弥合视觉生成与理解之间的差距,为多模态大语言...

HoloTime:将静态全景图像转化为沉浸式的360度4D场景

HoloTime项目简介 HoloTime是由北京大学深圳研究生院电子与计算机工程学院、哈尔滨工业大学(深圳)以及鹏城实验室的研究团队共同开发的创新框架,旨在将静态...

PixelHacker:华科大联合VIVO 推出的新型图像修复模型

PixelHacker项目简介 PixelHacker是由华中科技大学和VIVO AI实验室联合开发的一种新型图像修复模型,旨在解决复杂结构和语义一致性问题。该模型基于潜在类别...

X-Fusion:Adobe等推出的创新多模态框架

X-Fusion项目简介 X-Fusion 是由加州大学洛杉矶分校、威斯康星大学麦迪逊分校和 Adobe Research 的研究团队共同开发的一种创新框架,旨在将预训练的大型语言...
1 2 3 4 129