AI论文

GameNGen:首个由神经模型驱动的实时游戏引擎

GameNGen简介 GameNGen是由谷歌推出的创新游戏引擎,它完全基于神经模型,能够实现实时与复杂环境的交互。这个引擎能够以高帧率和高质量模拟经典游戏,如DOOM...

DiPIR:在真实世界场景图像中逼真地插入虚拟对象

DiPIR简介 DiPIR是由NVIDIA的研究团队开发的先进技术,利用扩散模型作为指导,结合基于物理的逆渲染过程,实现在真实世界场景图像中逼真地插入虚拟对象。这种...

MUMU:一款创新的多模态图像生成模型

MUMU简介 MUMU是由Sutter Hill Ventures的研究团队开发的一款创新的多模态图像生成模型,它能够通过结合文本和图像输入生成新的图像。该模型通过自举方法构建...

HMoE:腾讯混元联合实验室提出的一种新型混合专家模型

HMoE简介 HMoE(Heterogeneous Mixture of Experts)是由腾讯混元联合实验室提出的一种新型混合专家模型,它通过引入大小不同的专家以处理不同复杂性的输入数...

ItiNera:TuTu. AI联合多所高校开发的智能城市行程规划系统

ItiNera简介 ItiNera是由TuTu. AI与麻省理工学院、上海交通大学、香港大学和香港理工大学的研究人员联合开发的智能城市行程规划系统。该系统创新性地结合了大...

ReSyncer:可以实现音视频唇型同步、说话风格迁移和换脸

ReSyncer简介 ReSyncer是由清华大学BNRist实验室与百度公司共同开发的先进框架,它通过创新性地重新配置基于风格的生成器,并融合3D人脸动态预测技术,实现了...

Surgical RT:通过模仿学习实现机器人手术操作的潜力

Surgical RT简介 Surgical RT(Surgical Robot Transformer)是由约翰霍普金斯大学和斯坦福大学的研究团队共同开发的一项创新研究,旨在通过模仿学习技术,提...

CLASI:腾讯开发的一种先进的同声传译系统

CLASI简介 CLASI是由腾讯研究团队开发的一种先进的同声传译系统,旨在通过利用大型语言模型(LLM)实现与人类口译员相媲美的翻译质量和流畅度。CLASI采用了创...

NeuralGCM:谷歌发布的最新天气预报AI 模型

NeuralGCM简介 NeuralGCM是由Google Research团队开发的一种创新的神经通用循环模型,它突破了传统气象预报和气候模拟的局限。这一模型通过将深度学习技术与...
1 2