AI开源项目

Genesis:卡内基梅隆大学联合多所机构推出的开源生成式物理引擎

Genesis简介 Genesis是由卡内基梅隆大学(CMU)与20多所研究机构联合开发的开源生成式物理引擎,旨在推动机器人技术和物理模拟的进步。该引擎以其超高性能著...

Genex:允许智能体在心理上探索3D环境

Genex简介 Genex是由约翰霍普金斯大学的研究团队开发的一种创新框架,它允许智能体在无需物理移动的情况下,通过心理上探索大规模3D环境并更新其对世界状态的...

EMMA-X:新加坡科技设计大学推出的多模态动作模型

EMMA-X简介 EMMA-X是由新加坡科技设计大学的研究团队开发的一个多模态动作模型,它通过结合具体化的思考链和前瞻性空间推理,显著提升了机器人在复杂任务中的...

MV-Adapter:生成在不同视角下一致的图像

MV-Adapter简介 MV-Adapter是由北京航空航天大学软件学院、VAST以及上海交通大学的研究团队共同开发的一种创新适配器,旨在简化多视图一致图像的生成过程。它...

ColorFlow:腾讯联合清华大学推出的图像序列着色模型

ColorFlow简介 ColorFlow是由清华大学与腾讯PCG的ARC实验室联合开发的一种先进的图像序列着色模型,旨在自动化地将黑白图像转换为彩色版本,同时精确保持角色...

RDT-1B:清华大学推出的机器人双手臂操作的基础模型

RDT-1B简介 RDT-1B是由清华大学的研究团队开发的机器人双手臂操作的基础模型,它基于扩散模型,能够有效地表示多模态性,并采用创新的可扩展Transformer架构...

Apollo:Meta和斯坦福大学联合推出的大型多模态模型

Apollo简介 Apollo是Meta GenAI与斯坦福大学合作开发的一系列先进的大型多模态模型(LMMs),旨在深入探索和提升视频理解能力。该模型家族通过系统性研究,优...

BrushEdit:腾讯联合清华等高校推出的图像编辑框架

BrushEdit简介 BrushEdit是由北京大学、腾讯ARC实验室、香港中文大学和清华大学的联合研究团队开发的一款先进的交互式图像编辑框架。该框架结合了多模态大型...

Ruyi:图森未来推出的图生视频大模型

Ruyi简介 Ruyi是图森未来推出的图生视频大模型,基于DiT架构,拥有约71亿参数,支持多分辨率、多时长视频生成。它能够根据用户控制的起始帧和结束帧定制视频...

Megrez-3B-Omni:无问芯穹开源的全球首个端侧全模态理解模型

Megrez-3B-Omni 简介 Megrez-3B-Omni 是无问芯穹开源的全球首个端侧全模态理解模型,它能够处理图像、音频和文本等多种数据类型,具有30亿参数,推理速度快,...
1 5 6 7 8 9 45