AI项目库
DSO:能够生成在物理上更稳定的3D对象
DSO简介 DSO(Direct Simulation Optimization)是一种创新的框架,旨在通过物理模拟器的反馈来优化3D生成器,使其能够生成在物理上更稳定的3D对象。它通过构...
SWEET-RL:Meta等推出的多轮强化学习框架
SWEET-RL简介 SWEET-RL是由Meta的FAIR团队和加州大学伯克利分校的研究人员共同推出的多轮强化学习框架,专门用于优化大型语言模型(LLM)代理在多轮交互任务...
EasyControl Ghibli:专注于将普通图像转换为吉卜力风格的图像
EasyControl Ghibli简介 EasyControl Ghibli 是一款基于 EasyControl 框架开发的 AI 模型,可在 Hugging Face 平台免费使用。它专注于将普通图像转换为吉卜力...
Dolphin:海天瑞声联合清华推出的多语言自动语音识别模型
Dolphin简介 Dolphin是由海天瑞声与清华大学电子工程系语音与音频技术实验室共同开发的大型多语言自动语音识别(ASR)模型。该模型基于Whisper架构进行扩展,...
WorldScore:斯坦福大学推出的世界生成模型统一评估基准
WorldScore简介 WorldScore是由斯坦福大学的研究团队开发的一个用于世界生成模型的统一评估基准。该基准旨在系统地评估不同类型的3D、4D、I2V和T2V世界生成模...
PaperBench:OpenAI 开源的 AI 智能体评测基准
PaperBench简介 PaperBench是由OpenAI团队开发的一个基准测试,旨在评估人工智能代理复制最新人工智能研究的能力。它要求代理从头开始复制20篇ICML 2024会议...
MoCha:Meta等推出的端到端对话角色视频生成模型
MoCha简介 MoCha是由Meta和滑铁卢大学联合开发的端到端对话角色视频生成模型。它仅需语音和文本输入,无需额外辅助条件,即可生成电影级的多角色对话动画。Mo...
Easi3R:西湖大学等推出的4D重建技术
Easi3R简介 Easi3R是由西湖大学、马普智能系统研究所和图宾根大学人工智能中心联合开发的一种无需训练的4D重建技术。该方法通过巧妙利用DUSt3R模型中的注意力...
AutoAgent:港大推出的零代码、全自动化的LLM代理开发框架
AutoAgent简介 AutoAgent是由香港大学开发团队推出的一款零代码、全自动化的LLM代理开发框架。它通过自然语言驱动的方式,让用户无需任何编程技能就能轻松创...
EasyControl:高效灵活的多条件控制图像生成框架
EasyControl简介 EasyControl是由Tiamat AI、上海科技大学、新加坡国立大学和Liblib AI联合开发的高效灵活的条件控制框架,专为扩散Transformer(DiT)设计。...