2-5.应用工具其他
DIAMOND:能够在视觉细节丰富的环境中实现高效的样本学习
DIAMOND简介 DIAMOND是由瑞士日内瓦大学和爱丁堡大学的研究团队共同开发的一种新型强化学习代理,它通过在扩散世界模型中进行训练,能够在视觉细节丰富的环境...
GS3:旨在实现实时、高质量的新光照和视角合成
GS3简介 GS3(Efficient Relighting with Triple Gaussian Splatting)是一项由浙江大学CAD&CG国家重点实验室开发的创新技术,旨在实现实时、高质量的新...
FakeShield:北京推出的多模态大型图像伪造检测和定位框架
FakeShield简介 FakeShield是由北京大学电子与计算机工程学院的研究团队开发的一种先进的多模态大型图像伪造检测和定位框架。该框架能够评估图像的真实性,生...
Easegen:一个开源的数字人课程制作平台
Easegen简介 Easegen是一个开源的AI数字人课程制作平台,旨在简化教育内容的创建与管理。用户可以通过上传PPT课件,轻松生成数字人视频课程,提升课程的互动...
MLE-bench:OpenAI团队推出的一项基准测试工具
MLE-bench简介 MLE-bench是由OpenAI团队开发的一项基准测试,旨在衡量人工智能代理在机器学习工程领域的表现。该基准测试通过汇集75个来自Kaggle的竞赛,模拟...
LightRAG:北邮&香港大学推出的检索增强型生成系统
LightRAG简介 LightRAG是由北京邮电大学和香港大学的研究团队共同开发的一种先进的检索增强型生成系统。该系统通过整合图结构到文本索引和检索过程中,显著提...
RobotFingerPrint:为多种不同的机械夹爪生成有效的抓取姿态
RobotFingerPrint简介 RobotFingerPrint是由德克萨斯大学达拉斯分校计算机科学系的研究团队开发的一种创新性抓取合成方法。该技术提出了统一夹爪坐标空间(UG...
WebDesignAgent:一款自动化网站设计工具
WebDesignAgent 简介 WebDesignAgent 是一款自动化网站设计工具,旨在简化网站创建过程。用户只需输入文本描述、上传图片或提供视觉布局,WebDesignAgent 就...
Voice-Pro:一款集字幕、翻译和TTS于一体的多语言音频处理工具
Voice-Pro简介 Voice-Pro是一款集字幕、翻译和文本转语音(TTS)于一体的多语言音频处理工具,旨在为内容创作者提供高效的解决方案。它支持超过90种语言的实...
Screenpipe:能够全天候记录用户的屏幕活动和音频输入
Screenpipe简介 Screenpipe是一款创新的开源软件,它通过24小时不间断地记录用户的屏幕和音频活动,结合AI技术,为用户提供个性化智能服务。它的核心优势在于...