亚马逊推出通用 AI 智能体 Amazon Nova Act

亚马逊今天推出通用 AI 智能体 Amazon Nova Act ,它能通过网络浏览器执行各种操作,帮助用户完成复杂任务。它允许开发者构建代理(agents),这些代理可以代...

Amodal3R:南洋理工大学等推出的3D生成模型

Amodal3R简介 Amodal3R是由南洋理工大学S-Lab、牛津大学视觉几何组和新加坡科技学院联合开发的新型3D生成模型。该模型专注于从部分遮挡的2D图像中重建完整的3...

Qlib:微软研究院开发的AI导向量化投资平台

Qlib简介 Qlib是由微软研究院开发的AI导向量化投资平台,专为应对AI技术在量化投资领域带来的挑战而设计。它采用模块化架构,涵盖数据处理、模型创建、投资组...

Open Deep Search:华盛顿大学等开源的搜索AI框架

Open Deep Search简介 Open Deep Search(ODS)是由Sentient、华盛顿大学、普林斯顿大学和加州大学伯克利分校的研究团队共同开发的开源搜索AI框架,旨在缩小...

Hi3DGen:字节联合清华等高校推出的3D几何生成框架

Hi3DGen简介 Hi3DGen是由香港中文大学(深圳)、字节跳动和清华大学联合开发的高保真3D几何生成框架。该框架通过法线图作为中间表示,有效解决了从2D图像生成...

2025年4月AI快讯

2025.4.29 1.通义灵码正式上线 Qwen3,编程智能体马上来了 2025年4月29日,Qwen3正式发布并全部开源8款「混合推理模型」,包括两款MoE模型和六个Dense模型。...

MegaTTS 3:字节跳动开源的文本到语音模型

MegaTTS 3简介 MegaTTS 3是由字节跳动开源的高效文本到语音(TTS)模型。它以轻量级和高效性为特点,参数量仅0.45亿,却能实现超高音质的语音克隆,支持中文...

GAIA-2:Wayve团队开发的可控多视角生成式世界模型

GAIA-2简介 GAIA-2是由Wayve团队开发的可控多视角生成式世界模型,专为自动驾驶领域设计。该模型通过其创新的架构和训练方法,能够生成高分辨率、时空一致的...

ObjectMover:在移动图像位置时能保持物体的身份和外观

ObjectMover简介 ObjectMover是由香港大学和Adobe Research联合开发的一种新型生成模型。该模型能够在一个图像中移动物体,同时保持物体的身份、调整光照和阴...

PhysGen3D:将单张图像转化为一个交互式的3D世界

PhysGen3D简介 PhysGen3D是由清华大学、伊利诺伊大学香槟分校和哥伦比亚大学的研究团队共同开发的一个创新框架,它能够将单张图像转化为一个交互式的3D世界,...
1 11 12 13 14 15 214