AI项目库

KeySync:能够生成与输入音频紧密对齐的高分辨率视频

KeySync项目简介 KeySync是由帝国理工学院(Imperial College London)和弗罗茨瓦夫大学(University of Wrocław)的研究团队共同开发的一种先进的唇部同步框...

DianJin-R1:阿里云通义点金联合苏大开发的推理增强框架

DianJin-R1项目简介 DianJin-R1是由阿里巴巴云计算团队和苏州大学联合开发的推理增强框架,旨在提升大型语言模型(LLMs)在金融领域的推理能力。该框架通过推...

Phi-4-reasoning-plus:一款经过强化学习优化的推理模型

Phi-4-reasoning-plus项目简介 Phi-4-reasoning-plus是由微软团队开发的一款经过强化学习优化的推理模型。该模型在Phi-4-reasoning的基础上,通过专注于数学...

3DV-TON:阿里推出的一种新型视频试穿技术

3DV-TON项目简介 3DV-TON是由阿里巴巴集团达摩院、湖畔实验室以及浙江大学联合开发的一种新型视频试穿技术。该技术通过纹理化的3D网格作为显式帧级指导,利用...

F-Lite:Freepik团队开发的文生图模型

F-Lite项目简介 F Lite是由Freepik团队开发的开源文本到图像生成模型,拥有100亿参数,基于扩散变换器(Diffusion Transformer)架构。它利用交叉注意力机制...

URM:阿里开发的一种新型推荐系统框架

URM项目简介 Universal Recommendation Model(URM)是由阿里巴巴集团淘宝与天猫团队开发的一种新型推荐系统框架。URM利用大型语言模型(LLMs)的强大能力,...

TesserAct:哈佛大学等推出的4D体现世界模型

TesserAct项目简介 TesserAct 是由 UMass Amherst、HKUST 和 Harvard University 的研究团队共同开发的一种创新的 4D 体现世界模型。该模型通过输入图像和文...

Embodied Reasoner:浙大联合阿里等机构推出的具身化交互模型

Embodied Reasoner项目简介 Embodied Reasoner是由浙江大学计算机科学与技术学院、中国科学院软件研究所、阿里巴巴集团和达摩院等机构联合开发的具身化交互模...

RepText:Shakker Labs推出的的文本渲染框架

RepText项目简介 RepText是由Shakker Labs开发的一种创新的文本渲染框架,旨在通过复制字符形状而非理解文本内容,实现高质量的多语言视觉文本渲染。该框架基...

Xiaomi MiMo:小米推出的人工智能大语言模型项目

Xiaomi MiMo项目简介 Xiaomi MiMo 是小米公司推出的人工智能大语言模型项目。该项目由小米人工智能与云服务部的自然语言处理团队主导开发,汇聚了众多在人工...
1 2 3 4 5 129