2-5.应用工具其他

AlphaFold 3:极大地提高了生物分子复合体结构预测的准确性

AlphaFold 3简介 AlphaFold 3是由Google DeepMind推出的一款人工智能模型,它极大地提高了生物分子复合体结构预测的准确性。该模型采用了扩散架构,能够预测...

ReCapture:为已有的视频内容生成具有全新相机轨迹的版本

ReCapture简介 ReCapture是由Google的研究团队开发的一种创新视频处理技术,它能够让用户为已有的视频内容生成具有全新相机轨迹的版本。这项技术通过掩码视频...

Docling:IBM推出的开源PDF文档转换工具

Docling简介 Docling是一个开源的PDF文档转换工具,由IBM Research开发,提供易于使用的接口和自包含的解决方案。它利用先进的AI模型进行布局分析和表格结构...

WEBRL:清华与智谱AI联合推出的自进化在线课程强化学习框架

WEBRL简介 WEBRL是由清华大学与智谱AI联合开发的自进化在线课程强化学习框架,旨在训练基于大型开放语言模型的高性能网络代理。通过解决训练任务稀缺、反馈信...

GameGen-X:首个开放世界游戏视频生成与交互控制模型

GameGen-X简介 GameGen-X 是由香港科技大学、中国科学技术大学和中国科学院合肥物质科学研究院联合开发的一款先进的扩散变换模型,它专门设计用于生成和交互...

π0:Physical Intelligence推出的机器人控制模型

π0简介 π0是由Physical Intelligence团队开发的一种先进的机器人控制模型,它通过预训练视觉-语言模型(VLM)和流匹配架构,能够理解和执行复杂的物理任务。...

Oasis:Decart和Etched联合推出的AI实时生成游戏系统

Oasis简介 Oasis是由Decart和Etched合作开发的全球首款AI实时生成游戏系统,它能够以每秒20帧的速度实时渲染交互式视频内容,无需游戏引擎,直接通过AI模型生...

HOVER:NVIDIA等推出的人形机器人多模式控制框架

HOVER简介 HOVER(Humanoid Versatile Controller)是由NVIDIA、CMU、UC Berkeley、UT Austin和UC San Diego的联合研究团队开发的一种先进的人形机器人全身控...

ROCKET-1:提升视觉语言模型在开放世界环境中的交互能力

ROCKET-1简介 ROCKET-1是一个由北京大学、加州大学洛杉矶分校和BIGAI团队共同开发的先进低层次策略模型,旨在通过视觉-时间上下文提示协议,提升视觉语言模型...

DriveDreamer4D:通过世界模型增强4D驾驶场景表示的框架

DriveDreamer4D简介 DriveDreamer4D是一个创新的4D驾驶场景表示框架,它通过整合世界模型先验来显著提升自动驾驶系统中复杂驾驶操作(如变道、加速、减速)的...
1 3 4 5 6 7 10