AI开源项目 | 第 15 页

LEOPAR：腾讯AI西雅图实验室推出的一款多模态大型语言模型

LEOPARD简介 LEOPARD是由腾讯AI西雅图实验室推出的一款多模态大型语言模型（MLLM），专门针对包含丰富文本的多图像任务而设计。该模型通过创建一个包含约一百...

3-5.多模态模型

1个月前

PANGEA简介 PANGEA是由卡内基梅隆大学的研究团队开发的一款多语言多模态大型语言模型（LLM），旨在缩小视觉理解任务中的语言和文化差距。该模型经过39种语言...

3-5.多模态模型

1个月前

DreamPolish简介 DreamPolish是由智普AI与清华大学联合开发的一款先进的文本到3D生成模型，它通过利用多种神经网络表示和表面抛光技术，能够生成具有精细几何...

2-6.应用工具3D

2个月前

OmniBooth简介 OmniBooth是由香港科技大学与华为诺亚方舟实验室联合开发的一种先进的图像生成框架，它通过多模态指令实现空间控制和实例级别的定制化。该框架...

3-2.图片生成模型

2个月前

MVPaint简介 MVPaint是由腾讯PCG、上海人工智能实验室和南洋理工大学S-Lab联合开发的创新3D纹理生成框架。该框架能够根据文本提示生成具有高分辨率和多视图一...

2-6.应用工具3D

2个月前

EchoMimicV2简介 EchoMimicV2是由阿里蚂蚁集团推出的一种创新的半身人体动画生成技术。该技术通过结合参考图像、音频剪辑和手部姿势序列，能够生成与音频内容...

2-3.应用工具视频

2个月前

SAMURAI简介 SAMURAI是一种基于Segment Anything Model 2（SAM 2）的增强型视觉目标跟踪框架，专门设计用于处理快速移动或自遮挡目标的挑战。它通过整合时序...

2-3.应用工具视频

2个月前

DanceFusion简介 DanceFusion是由清华大学的研究团队开发的一种创新框架，旨在通过时空骨架扩散变换器重建和生成与音乐同步的舞蹈动作。该框架特别针对社交媒...

2-3.应用工具视频

2个月前

AgileGen简介 AgileGen是由天津大学智能与计算学院的研究团队开发的一种基于敏捷方法论的人机协作生成式软件开发框架。该框架通过引入Gherkin语言，将用户需...

2-5.应用工具其他

2个月前

LLaVA-o1简介 LLaVA-o1是由北京大学电子与计算机工程学院、清华大学跨学科信息科学研究所、鹏城实验室以及AI for Science (AI4S)-Preferred Program联合开发...

2-1.应用工具文本

2个月前