AI项目库
PixelHacker:华科大联合VIVO 推出的新型图像修复模型
PixelHacker项目简介 PixelHacker是由华中科技大学和VIVO AI实验室联合开发的一种新型图像修复模型,旨在解决复杂结构和语义一致性问题。该模型基于潜在类别...
X-Fusion:Adobe等推出的创新多模态框架
X-Fusion项目简介 X-Fusion 是由加州大学洛杉矶分校、威斯康星大学麦迪逊分校和 Adobe Research 的研究团队共同开发的一种创新框架,旨在将预训练的大型语言...
KeySync:能够生成与输入音频紧密对齐的高分辨率视频
KeySync项目简介 KeySync是由帝国理工学院(Imperial College London)和弗罗茨瓦夫大学(University of Wrocław)的研究团队共同开发的一种先进的唇部同步框...
DianJin-R1:阿里云通义点金联合苏大开发的推理增强框架
DianJin-R1项目简介 DianJin-R1是由阿里巴巴云计算团队和苏州大学联合开发的推理增强框架,旨在提升大型语言模型(LLMs)在金融领域的推理能力。该框架通过推...
Phi-4-reasoning-plus:一款经过强化学习优化的推理模型
Phi-4-reasoning-plus项目简介 Phi-4-reasoning-plus是由微软团队开发的一款经过强化学习优化的推理模型。该模型在Phi-4-reasoning的基础上,通过专注于数学...
3DV-TON:阿里推出的一种新型视频试穿技术
3DV-TON项目简介 3DV-TON是由阿里巴巴集团达摩院、湖畔实验室以及浙江大学联合开发的一种新型视频试穿技术。该技术通过纹理化的3D网格作为显式帧级指导,利用...
F-Lite:Freepik团队开发的文生图模型
F-Lite项目简介 F Lite是由Freepik团队开发的开源文本到图像生成模型,拥有100亿参数,基于扩散变换器(Diffusion Transformer)架构。它利用交叉注意力机制...
URM:阿里开发的一种新型推荐系统框架
URM项目简介 Universal Recommendation Model(URM)是由阿里巴巴集团淘宝与天猫团队开发的一种新型推荐系统框架。URM利用大型语言模型(LLMs)的强大能力,...
TesserAct:哈佛大学等推出的4D体现世界模型
TesserAct项目简介 TesserAct 是由 UMass Amherst、HKUST 和 Harvard University 的研究团队共同开发的一种创新的 4D 体现世界模型。该模型通过输入图像和文...
Embodied Reasoner:浙大联合阿里等机构推出的具身化交互模型
Embodied Reasoner项目简介 Embodied Reasoner是由浙江大学计算机科学与技术学院、中国科学院软件研究所、阿里巴巴集团和达摩院等机构联合开发的具身化交互模...