2-5.应用工具其他
DriveDreamer4D:通过世界模型增强4D驾驶场景表示的框架
DriveDreamer4D简介 DriveDreamer4D是一个创新的4D驾驶场景表示框架,它通过整合世界模型先验来显著提升自动驾驶系统中复杂驾驶操作(如变道、加速、减速)的...
Ferret-UI 2:苹果推出的专门用于理解UI的多模态模型
Ferret-UI 2简介 Ferret-UI 2是由苹果推出的专门用于理解UI的多模态模型,旨在实现跨多个平台的通用用户界面理解,包括iPhone、Android、iPad、Webpage和Appl...
Unbounded:谷歌推出的利用大模型生成角色和环境的游戏
Unbounded简介 Unbounded是一款由Google和北卡罗来纳大学教堂山分校的研究团队共同开发的开创性游戏。这款游戏采用了前沿的生成模型,包括经过特殊优化的大型...
DuoAttention:提高LLMs在处理长文本上下文时的推理效率
DuoAttention简介 DuoAttention是由麻省理工学院(MIT)的研究团队开发的一种新型框架,旨在提高大型语言模型在处理长文本上下文时的推理效率。该框架通过区...
DIAMOND:能够在视觉细节丰富的环境中实现高效的样本学习
DIAMOND简介 DIAMOND是由瑞士日内瓦大学和爱丁堡大学的研究团队共同开发的一种新型强化学习代理,它通过在扩散世界模型中进行训练,能够在视觉细节丰富的环境...
GS3:旨在实现实时、高质量的新光照和视角合成
GS3简介 GS3(Efficient Relighting with Triple Gaussian Splatting)是一项由浙江大学CAD&CG国家重点实验室开发的创新技术,旨在实现实时、高质量的新...
FakeShield:北京推出的多模态大型图像伪造检测和定位框架
FakeShield简介 FakeShield是由北京大学电子与计算机工程学院的研究团队开发的一种先进的多模态大型图像伪造检测和定位框架。该框架能够评估图像的真实性,生...
Easegen:一个开源的数字人课程制作平台
Easegen简介 Easegen是一个开源的AI数字人课程制作平台,旨在简化教育内容的创建与管理。用户可以通过上传PPT课件,轻松生成数字人视频课程,提升课程的互动...
MLE-bench:OpenAI团队推出的一项基准测试工具
MLE-bench简介 MLE-bench是由OpenAI团队开发的一项基准测试,旨在衡量人工智能代理在机器学习工程领域的表现。该基准测试通过汇集75个来自Kaggle的竞赛,模拟...
LightRAG:北邮&香港大学推出的检索增强型生成系统
LightRAG简介 LightRAG是由北京邮电大学和香港大学的研究团队共同开发的一种先进的检索增强型生成系统。该系统通过整合图结构到文本索引和检索过程中,显著提...