2025年3月AI快讯

0 61

2025.3.31

1.ChatGPT 原生图像生成功能已向免费用户推出

ChatGPT 的原生图像生成功能已向免费用户推出，此前该功能仅限于付费用户。该功能引发争议，吉卜力工作室粉丝和宫崎骏拥趸认为其“吉卜力风格”图像生成近乎抄袭。宫崎骏曾表示对 AI 创作艺术极度厌恶，认为这是对生命的侮辱。因功能热度高，OpenAI 首席执行官山姆・奥尔特曼称 GPU“过热”，将对 ChatGPT 免费版暂时引入速率限制，每天提供 3 次图像生成机会。
来源：IT之家

2.千寻智能完成5.28亿元Pre-A轮融资，领先VLA模型加速具身智能落地

千寻智能（Spirit AI）完成5.28亿元人民币Pre-A轮融资，由阿美风险投资旗下Prosperity7 Ventures（P7）领投，多家资本参与。老股东持续加码，凸显资本市场对其高度认可。千寻智能成立于2024年2月，是国内领先的具身智能公司，团队成员来自顶尖高校和知名企业。公司在具身智能领域取得多项技术突破
来源：千寻智能 Spirit AI

3.面壁发布首个纯端侧智能助手，构建汽车超性能端侧大脑

面壁智能于2025年3月29日发布首个纯端侧智能助手小钢炮超级助手cpmGO，旨在构建汽车超性能端侧大脑。面壁智能的「面壁小钢炮」MiniCPM端侧模型在全球开源社区广受好评，具有数据隐私保护、突破网络限制等优势。在汽车行业，已适配主流芯片，实现毫秒级响应速度。面壁智能认为大模型与Agent密不可分
来源：面壁智能

4.埃隆·马斯克旗下xAI收购社交媒体平台X，交易价值330亿美元

埃隆·马斯克旗下xAI公司以330亿美元收购社交媒体平台X（原Twitter）。这是一次全股票交易，xAI估值800亿美元，X估值330亿美元，含120亿美元债务。X首席执行官琳达·亚卡里诺称尽管自2022年出售以来价值损失约110亿美元，但未来光明。马斯克将xAI与X紧密联系，xAI的Grok工具已集成到X及Telegram。
来源：AIYUN

5.擎朗智能正式发布首款人形具身服务机器人“XMAN-R1”

擎朗智能基于15年服务机器人经验，发布首款人形具身服务机器人XMAN-R1。XMAN-R1以岗位化、亲和力、安全性为设计理念，完成服务场景内长任务闭环，未来将探索更多场景。擎朗提出“机器人岗位化”概念，助力商业化应用。XMAN系列将与现有机器人实现数据共享与任务协同，打造多形态具身服务机器人协作生态，满足多样化商业需求。
来源：擎朗智能

6.马斯克看好的AI玩具，成了商场新印钞机

2025 年，AI 玩具成为市场新宠，订单量暴涨，市场规模预计超 300 亿。从马斯克点赞到国内大厂纷纷布局，AI 玩具凭借情感交流、IP 绑定等优势，满足了不同人群需求，如儿童教育、情感疗愈等。其火爆背后，是玩具行业供应链升级与文化 IP 融合的推动。未来，AI 玩具将走向 “内容 + 服务 + 数据” 的生态竞争，需学习小米模式，融入用户生活，满足情感连接与个性化体验需求。
来源：凤凰网科技

7.我国首个公共采购知识体系模型“水母模型”发布

2025 年 3 月 29 日，中国物流与采购联合会在京发布了中国首个公共采购知识体系模型 ——“水母模型”，该模型以“PROCURE”为框架，系统、全面地阐述了公共采购的理论、方法、工具、实践和发展趋势，将服务于政府部门、事业单位、公共组织、中央企业、国有企业的人才培养，可帮助采购机构建立专业化、规范化、高效化和智能化的采购管理体系。
来源：IT之家

8.Google向免费公众开放Gemini 2.5 Pro先进AI模型

Google宣布将免费向所有Gemini应用用户提供最新、最先进的Gemini AI模型2.5 Pro版。该模型最初仅限Gemini Advanced用户使用，现在从本周六开始向公众开放。Gemini 2.5 Pro是Google迄今为止“最智能的AI模型”，具有更复杂的思维能力，支持应用和浏览器扩展、文件上传以及与Google Canvas协作工具的集成。它还拥有100万个token上下文窗口，未来计划扩展到200万个token窗口。
来源：cnBeta

9.全球首个通用智能人“通通”2.0正式发布

在2025中关村论坛年会上，北京通用人工智能研究院推出的全球首个通用智能人“通通” 2.0正式发布。“通通”定位为具有自主学习、认知和决策能力的虚拟人，预计今年内将具备6岁儿童的智能水平。
来源：钛媒体

10.AI Agent 产品 Manus 公布收费方案：提供 39 美元和 199 美元两种套餐

Manus 是由中国创业公司 Monica 推出的 AI Agent 产品，号称“全球首款通用 Agent 产品”。它能自主完成复杂任务，理解用户需求并调用外部资源。Manus 已公布收费方案，标志着从免费测试阶段向商业化运营转变。Manus Starter 每月收费 39 美元，Manus Pro 每月收费 199 美元，两者积分、可同时运行任务数量及支持功能有所不同。
来源：IT之家

11.Midjourney V7内测图首曝，电影级画质干翻GPT-4o！人物蜡像感消失，AI生图迎最强地震

Midjourney V7版本即将发布，目前处于最后微调阶段，其生成图像效果惊艳，画质细腻度大幅提升，伪影减少，人物皮肤细节得到进化。V7可能是Midjourney首个Omini模型，历经一年多沉淀，能否扳回一局引人关注。V7在创意设计方面表现出色，能生成广告、抽象艺术等多种风格的设计。同时，GPT-4o的生图能力也引发关注，其生成的吉卜力风格图片成为焦点，但也引发了版权和艺术价值的争论。
来源：新智元

12.DeepSeek月访问量超ChatGPT

3月31日消息，据AI分析平台aitools.xyz，DeepSeek已经成为全球增长最快的AI工具，其每月新增网站访问量已经超过OpenAI的ChatGPT。报告称，DeepSeek2025年2月访问量达到5.25亿次，超过ChatGPT5亿次。目前，DeepSeek市场份额6.58%，仅次于ChatGPT和Canva，二者分别占比43.16%和8.27%。
来源：钛媒体

13.优艾智合-西安交大具身智能机器人研究院公布人形机器人矩阵

优艾智合与西安交通大学联合创立的具身智能机器人研究院首次公布人形机器人矩阵，包含7款产品，涵盖双足、轮式、四足、履带式等形态。“巡霄”轮式人形机器人针对大面积复杂室内场景，已应用于半导体制造及能源行业等领域。
来源：机器之心

14.谷歌DeepMind推出TxGemma：推动AI驱动的药物发现与开发

谷歌DeepMind推出TxGemma，这是一套基于Gemma模型家族的开放AI模型，旨在提升药物发现和临床试验预测的效率，简化药物开发过程，加速新疗法的发现。TxGemma利用大型语言模型提高治疗特性预测，提供三种规模的模型和专门的Predict版本
来源：AIYUN

15.百度端到端语音语言大模型发布成本宣称最高降90%

在今日的百度AI DAY上，百度发布首个基于全新互相关注意力（Cross-Attention）的端到端语音语言大模型，宣布实现超低时延与超低成本，在电话语音频道的语音问答场景中，调用成本较行业均值下降约50%-90%。
来源：科创板日报

16.智谱将开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414

31日讯，记者独家获悉，智谱将于4月14日开源推理模型GLM-Z1-Air和基座模型GLM-4-Air0414，并于近期陆续上线bigmodel.cn。上述模型是智谱新推出的AI Agent“沉思”背后的模型。（记者李明明）
来源：科创板日报

2025.3.28

1.豆包测试新版深度思考功能，支持边想边搜

本文报道了 AI 助手豆包测试新版 “深度思考” 功能，该功能将推理过程的思维链与搜索深度结合，支持 “边想边搜”，能提供更全面、准确的结果，适用于复杂问题和多维度分析场景，如旅游规划、抽象问题解答等。目前豆包已小范围测试自研深度思考能力，此次升级进一步将思考和联网深度结合并免费提供，与 x AI 旗下 Grok3 的 DeepSearch 有相似之处，但豆包将其结合而非拆分。
来源：机器之心

2.OpenAI 宣布升级 GPT-4o 并面向所有付费用户开放，免费用户仍需等待数周

OpenAI 宣布升级 GPT-4o 并面向所有付费用户开放，免费用户还需等待数周。此次更新聚焦多指令解析优化、技术问题处理增强、逻辑推理与创造力提升、交互界面精简四大核心部分。新模型可通过 chatgpt-4o-latest API 访问，未来几周内改进将扩展到 API 中的旧模型。在 LMArena 众包 AI 基准测试网站上，GPT-4o 模型成绩显著提升，多个关键类别排名大幅上升。
来源：IT之家

3.华为ModelEngine全流程AI开发工具链正式开源！

华为ModelEngine AI全流程工具链在2025华为中国合作伙伴大会上正式开源。该工具链围绕数据使能、模型使能、应用使能，旨在解决AI行业化落地难题，缩短通用大模型训练周期，加速AI应用开发。它内置数据处理算子和完整模型管理流程，提供低代码编排等功能，为各类工程师提供高效开发体验。代码已托管在多个平台，门户网站将持续迭代并提供相关资源。
来源：华为开源

4.AI眼镜有潜力复刻TWS耳机 MicroOLED成AR显示终极方案

本文探讨了AI眼镜市场的发展前景及Micro OLED技术在AR显示中的应用。在SEMICON China 2025同期举办的中国元宇宙显示大会-硅基显示论坛上，专家们对Micro OLED技术的长期趋势表示看好。2024年多个AR品牌采用Micro-OLED显示技术，如Meta的Orion原型机、星纪魅族和雷鸟创新的AR眼镜等。
来源：科创板日报

5.重磅更新：可灵AI平台全面焕新

2025年3月27日，可灵AI平台完成全面改版，以“可灵AI，灵感成真”为核心理念，对视觉体系和交互体验进行升级。视觉方面采用极简主义设计，减少视觉干扰，突出创意。功能上新增“AI音效”和“资产管理”，分别提供更丰富的表达方式和提升文件管理效率，助力创作者重新定义AI创作边界。
来源：可灵AI

6.阿里通义千问推出视觉推理模型 QVQ-Max：可分析、推理图片和视频内容

2025年3月28日，阿里通义千问团队推出新一代视觉推理模型QVQ-Max。该模型可理解、分析并推理图片和视频内容，还能设计插图、生成短视频剧本、创建角色扮演内容等。其核心能力包括细致观察、深入推理和灵活应用，在职场、学习和生活场景中均有广泛应用，目前已上线Qwen Chat，未来将持续优化和扩展功能。
来源：IT之家

7.Telegram整合Grok AI聊天机器人，仅限Premium订阅用户使用

Telegram应用迎来了一项新变动，Grok AI聊天机器人被正式整合进了这款加密消息应用。然而，这一功能并非所有用户都能享受，只有Telegram Premium订阅用户才有权与这一智能聊天机器人进行互动。
来源：AIYUN

8.OpenAI因GPU压力限制ChatGPT图像生成请求

OpenAI首席执行官萨姆·奥尔特曼表示，由于ChatGPT的图像生成功能受到热烈追捧，公司不得不“暂时”对图像生成请求进行限流。奥尔特曼在社交媒体上发文称：“看到大家喜欢ChatGPT的图像功能很开心，但我们的GPU快撑不住了。”他并未具体说明限流的程度，但表示希望这一措施不会持续太久，因为OpenAI正在努力提高效率以应对汹涌的请求量。
来源：AIYUN

9.广安门医院、百度智能云等联合发布中医医疗服务大模型“广医·岐智”

3月28日，AI赋能医院高质量发展论坛暨广安门医院中医医疗服务大模型发布会上，中国中医科学院广安门医院、百度智能云、全诊医学联合发布中医医疗服务大模型“广医·岐智”。这标志着广安门医院成为中国第一家本地化部署“算力—模型—应用”一体化服务的中医医院。
来源：科创板日报

2025.3.27

1.Reve Image 1.0 登顶，低价高质挑战 Midjourney 和 Flux

2025 年 3 月 27 日消息，新锐 AI 图像生成工具 Reve Image 1.0 以低价高质为卖点，正式向 Midjourney 和 Flux 发起挑战。该工具以精准理解用户指令、卓越美学表现和文字渲染能力为特色，支持通过自然语言修改现有图片和风格迁移，图像生成质量在第三方平台排行榜中位列第一。目前提供免费试用，未来可能开放 API，基础套餐有免费生成额度，长期用户可享低价。
来源：IT之家

2.Agent重大突破！OpenAI智能体支持MCP，已开源

2025年3月27日，OpenAI对Agent SDK进行重大更新，支持MCP服务并开源。MCP即Model Context Protocol，是专为大模型开放的统一开放接口，其核心框架由模型、上下文、协议三部分组成。Agent通过MCP可快速集成多种工具，如网络搜索、专业分析等，极大地扩展了第三方工具库，减少了集成复杂性，还具备动态工具发现能力
来源：凤凰网科技

3.全模态模型Qwen2.5-Omni开源，7B尺寸实现全球最强性能

通义千问Qwen2.5-Omni-7B正式开源，这是首个端到端全模态大模型，可处理多种输入并实时生成文本与语音输出。在OmniBench等测评中，其性能远超同类模型。该模型采用创新技术，展现出全球最强全模态性能，且以7B小尺寸便于广泛应用。自2023年起，通义团队已开发多款大模型，Qwen系列衍生模型数量突破10万，成为全球第一开源模型。
来源：阿里云

4.昆仑万维发布全球首款音乐推理大模型Mureka O1

3月27日消息，昆仑万维正式发布Mureka O1模型与Mureka V6模型。Mureka O1作为全球首款音乐推理大模型，性能超越Suno、模型登顶SOTA。据悉，2024年4月，昆仑万维发布了第一代音乐生成模型：Mureka V1（SkyMusic），截至目前，全球范围内已经获得超过100个国家和地区的用户访问。
来源：钛媒体

5.百度网盘和文库联合推出首个一站式视频AI笔记

3月27日消息，华为近日举行的新品发布会上，余承东现场介绍鸿蒙版百度网盘及其推出的视频AI笔记。据悉，该功能由百度网盘和文库联合推出，是业内首个一站式视频AI笔记，打通学习资料从存储、总结、创作、编辑到消费的闭环。用户在百度网盘PC端、网页端、APP端观看学习视频时，点击“笔记”侧边栏即可体验。
来源：钛媒体

6.微信 AI 搜索新增“快速思考”，采用混元 T1 模型

微信自2025年2月起灰度测试接入DeepSeek，为用户提供AI搜索功能。用户可在对话框顶部搜索入口点击进入，免费使用DeepSeek-R1模型。时隔一个多月，微信AI搜索新增“快速思考”选项，由腾讯混元T1模型提供回答。AI搜索引用公众号推文和网页信息，支持继续提问、社交功能及查看历史问答。微信官方承诺保护用户隐私，仅整合公开信息。
来源：IT之家

7.ima正式上线知识号，知识库创作者可通过特定入口申请账号

ima于2025年3月27日正式上线知识号。知识库创作者可通过特定入口申请账号，在知识广场发布知识库。知识号提供数据分析工具，当知识库加入人数超500时，还能查看单个知识库的访问、问答次数及数据趋势，助力优化内容。ima还提供30G个人云存储空间，发布到广场的知识库不占个人空间。
来源：ima.copilot

8.OpenAI的吉卜力工作室风格图像病毒式传播凸显了AI所带来的版权问题

ChatGPT 的新 AI 图像生成器上线仅一天时间，社交媒体上就已经充斥着吉卜力工作室风格的 AI 生成图像。吉卜力工作室是日本一家备受追捧的动画工作室，曾制作过《龙猫》和《千与千寻》等卖座电影。
来源：cnBeta

9.Krisp正在利用AI帮助印度人在通话中听起来像美国人

音频初创公司Krisp推出新功能，利用AI在通话中实时将印度英语口音转换为美国英语口音。该功能保留说话者声音，只切换音素匹配美音，已在企业环境中测试，现推出测试版。尽管测试中存在语音不自然、漏词等问题，但公司表示会改进。Krisp声称该功能可提高销售转化率和客单价，计划增加更多口音支持，还将在今年发布iOS和Android应用程序，开发Chrome扩展程序以更好地与Google Meet集成。
来源：cnBeta

10.据报道，Nvidia正洽谈收购Lepton AI

半导体巨头Nvidia正寻求进入服务器租赁市场。据The Information报道，Nvidia已接近达成一项收购Lepton AI的协议。Lepton AI是一家租用由Nvidia AI芯片驱动的服务器的公司。该报道未透露消息来源，但称交易价值达数亿美元。
来源：AIYUN

11.OpenAI推迟ChatGPT内置图像生成器对免费用户的开放

OpenAI公司首席执行官萨姆·奥尔特曼宣布，ChatGPT的内置图像生成器对免费用户的开放将被推迟。该功能自周二推出后，因受欢迎程度超出预期，目前仅对ChatGPT Plus、Pro和Team订阅用户开放，免费用户何时能使用尚不确定。
来源：AIYUN

12.Manus：将举行线下活动正努力让更多人用上Manus

3月27日凌晨，国产AI智能体Manus在社交平台上表示，他们对已形成的Manus社区深表感激，为了让大家更好地了解，他们将在未来几天举办一些面对面的Manus聚会，具体日程为：3月26日/27日在旧金山、3月29日在普若佛、3月31日在纽约以及4月9日在东京举行。Manus还表示，他们每天都会将等待名单中的用户添加到封闭测试中，其团队正在努力让更多的人尽快使用Manus。
来源：科创板日报

13.OpenAI接近敲定由软银牵头的一轮400亿美元融资

3月27日电，据知情人士称，人工智能(AI)开发商OpenAI接近敲定一轮400亿美元的融资，由软银集团领投，同时Magnetar Capital、Coatue Management、Founders Fund和Altimeter Capital Management等投资者都在磋商参投事宜。数据显示，OpenAI的这轮融资将是有史以来最大的一轮。
来源：科创板日报

2025.3.26

1.OpenAI发布生图神器狙击谷歌！一句话P图奥特曼现场玩梗

2025年3月26日，OpenAI宣布在GPT-4o模型中集成先进的图像生成器，CEO Sam Altman对其生成效果表示惊叹。新功能亮点包括精确渲染文本内容、支持多模态输入输出、理解复杂指令、创建第一人称视角图像、处理上传图片进行编辑或风格转换等。
来源：凤凰网科技

2.谷歌地表最强模型深夜来袭！Gemini 2.5 Pro发布即屠榜，代码推理杀疯了

Gemini 2.5 Pro，刚刚深夜上线了！这个「思考」模型专为复杂任务打造，推理能力强大，一经诞生就横扫各大榜单、拿下各类TOP 1，还创下了历史上最大分数飞跃纪录。
来源：新智元

3.微软为Copilot添加AI深度研究工具：Researcher与Analyst

微软在其 AI 聊天机器人应用程序 Microsoft 365 Copilot 中引入了一款“深度研究”AI 工具。最近，聊天机器人领域推出了大量深度研究代理，包括 OpenAI 的 ChatGPT、Google的 Gemini 和 xAI 的 Grok。为它们提供动力的是所谓的推理 AI 模型，它具有思考问题和自我核实事实的能力——这些技能对于对某个主题进行深入研究至关重要。
来源：cnBeta

4.阿里通义千问与DeepSeek开源两款新模型

3月26日消息，阿里通义千问与DeepSeek均于昨日低调开源了两款新模型。阿里发布了更适合本地部署的高性能“多模态模型”Qwen2.5-VL-32B，DeepSeek则将此前热门的“基座模型”V3更新到0324版本，并官宣在魔搭社区上架开源。截至目前，魔搭社区模型总数已超4万个，已成为中国最大的AI开源社区。
来源：钛媒体

5.腾讯自研深度思考模型“混元 T1”正式版上线元宝

2025 年 3 月 26 日，腾讯元宝宣布完成两大模型升级，接入腾讯自研深度思考模型 “混元 T1” 正式版和 DeepSeek V3 – 0324 模型。升级后，其在代码生成、数学推理、长文本处理等方面能力提升，且元宝是最早一批上线 DeepSeek V3 – 0324 的 AI 应用，从模型上线到接入仅用一天。“混元 T1” 于 3 月 21 日正式发布，所有用户都可无限量使用，其吐字快、能秒回，擅长超长文处理。
来源：IT之家

2025.3.25

1.DeepSeek发布V3模型更新：除了编程能力大幅提升，还有更宽松的开源协议

2025年3月24日晚，DeepSeek发布了V3模型更新，开源版本模型体积达6850亿参数，目前可在开源网站下载。此次为小版本升级，初代V3以高性价比著称，更新后由新的32KGPU集群上改进的后训练支持。用户测试显示，新版V3前端编码能力大幅提升，多轮对话中上下文理解能力增强，其生成的前端内容与Claude3.7等模型效果接近。
来源：凤凰网科技

2.阿里开源最新多模态模型 Qwen2.5-VL-32B：主打视觉语言，数学推理也很强

2025 年 3 月 25 日，阿里巴巴开源了最新多模态模型 Qwen2.5-VL-32B-Instruct。该模型在视觉语言方面表现出色，同时数学推理能力也很强。它进一步平衡了尺寸和性能，可在本地运行，并经过强化学习优化，在回答符合人类偏好、数学推理能力以及图像解析等任务中表现出色，甚至在多个基准上超过了 72B 的模型。此外，该模型已开源，用户可在 Hugging Face 上体验。
来源：IT之家

3.大国重器细胞家谱开建，我国打造数字细胞AI大模型

3月25日消息，“十四五”重大科技基础设施——人类细胞谱系大科学研究设施25日在广州国际生物岛正式启动建设，建成后，这一装置有望将人体每一个细胞的全生命周期动态演化过程进行数字化刻画，探索生命奥秘，打造研究人类发育、疾病、衰老的“国之重器”。
来源：钛媒体

4.生数科技AI平台Vidu获7部热文IP改编权，启动短剧改编计划

生数科技的AI视频生成平台Vidu获得7部热门网文IP改编权，涵盖奇幻仙侠、未来科幻等题材。AI技术实现剧本、分镜等自动化生成，缩短制作周期。Vidu还发起“热门网文IP动漫改编大赛”，参赛者制作1分钟预告片，优胜者获现金奖及参与剧集开发机会。
来源：AIYUN

5.Trae 支持配置 DeepSeek V3 最新版

Trae 预置了业内出色的模型，并支持自定义模型接入。其最新支持的 DeepSeek-V3–0324 拥有 685B 参数，是 DeepSeek V3 的小版本升级。用户可通过简单配置接入该模型，提升编程体验。相关配置教程及完整功能介绍可在 Trae 官方文档查看。
来源：Trae&MarsCode

6.美团正研发 NativeAI 产品，目标让人人都有“专属的生活小秘书”

美团正研发 NativeAI 产品，目标是让人人都能拥有“专属的生活小秘书”。美团核心本地商业 CEO 王莆中透露了这一消息，公司目前在招聘 AI 研发和产品人员。美团 CEO 王兴也表明了美团在人工智能技术方面的“主动进攻”策略。美团已开发内部大语言模型 LongCat，并结合其他模型为员工推出一系列工具。
来源：IT之家

7.中国人工智能公司ELU.AI获数亿元人民币Pre-A轮融资

3月25日消息，ELU.AI（原力无限机器人）近日成功完成数亿元人民币的Pre-A轮融资，参与投资的机构包括力鼎资本、杭实产投、兴泰资本以及继续追加投资的创世伙伴创投。这一轮融资将主要用于强化AI决策系统，推进下一代智能机器人研发，并加速全球市场布局。
来源：钛媒体

8.OpenAI更新高级语音模式，提升AI语音助手交互体验

2025年3月25日，OpenAI更新了ChatGPT的高级语音模式，旨在让AI语音助手更人性化，减少对用户讲话的打断。此次更新后，免费用户可使用新版高级语音模式，暂停对话时不会被打断；付费用户在使用时将遇到更少打断，且AI助手的个性得到改进。这一改进是在AI语音助手领域竞争激烈的背景下进行的，其他公司也在积极进入该领域。
来源：AIYUN

9.不用写代码：百度全量上线国内首个对话式应用开发平台“秒哒”

百度全量上线国内首个对话式应用开发平台“秒哒”，用户通过自然语言描述需求，即可自动生成完整功能代码，实现快速开发。该平台采用无代码编程等技术组合，内置多个垂直领域智能体，可灵活组建虚拟开发团队，还集成多种第三方工具和服务，构建全链路支持。秒哒上线使 AI 应用开发进入全民时代，推动技术普及。
来源：IT之家

2025.3.24

1.海洋大语言模型“瀚海智语”发布

记者从自然资源部获悉，国家海洋环境预报中心联合海洋出版社有限公司和三六零数字安全科技集团有限公司，以360智脑13B和Deepseek-R1-70B大模型为基座成功开发了海洋垂直领域大语言模型——“瀚海智语”（英文名称OceanDS）。
来源：科创板日报

2.上海交大发布Venus，可让蛋白质“定向进化”

上海交通大学特聘教授洪亮团队发布了大模型Venus，其核心能力是让蛋白质实现功能的“定向进化”。团队将AI与蛋白质设计与改造相结合，建立了全球最大的蛋白质数据集，基于该数据集训练的模型，可以精准、高效地预测、设计蛋白质的功能，把蛋白质生产由“缓慢的试错”变为“高效率的精准设计”。
来源：钛媒体

3.GPT-4o代码补全模型现已在VS Code Copilot公开预览中可用

最近，GPT-4o Copilot为Visual Studio Code (VS Code)用户推出。这个AI模型基于GPT-4o mini基础构建，并从超过30种广泛使用的编程语言的275,000多个高质量公共代码库中进行了广泛训练。增强的训练预计将提供更准确和上下文相关的代码建议，提升性能，提高开发者的生产力并帮助编码过程。
来源：AIYUN

4.AI 健身教练上线，预计 2025 年中国智能健身市场规模达 820 亿

本文主要介绍了 AI 健身教练的兴起及其带来的影响。随着 AI 大模型的发展，众多健身企业将 AI 技术应用于智能健身领域，为消费者带来全新运动体验。AI 不仅能作为虚拟健身教练，还能根据个人身体数据和健身目标制定个性化健身计划。据预计，2025 年中国智能运动健身市场规模将达 820 亿元，人机协同健身模式将为用户带来更高效优质体验，智能科技使健身及体育教育等多方面得到提升。
来源：IT之家

5.AI新工具创建大脑代谢组高清3D图谱

美国佛罗里达大学研究团队借助超级计算机，创建出一款强大的人工智能（AI）工具MetaVision3D，其能生成小鼠大脑代谢组的高分辨率3D图谱。用户可从各个角度放大、缩小这些图像，查看与小鼠大脑代谢功能相关的所有分子。相关研究成果发表于新一期《自然·代谢》杂志。
来源：科创板日报

6.AI“长眼”，谷歌推出Gemini实时视频功能

北京时间3月24日，据科技博客TheVerge报道，谷歌发言人亚历克斯·约瑟夫(Alex Joseph)证实，该公司已开始向其语音模式Gemini Live推出新的AI功能，使其能够“查看”用户的屏幕或通过智能手机摄像头观察并实时回答相关问题。
来源：凤凰网科技

7.腾讯混元自研深度思考模型「T1」正式发布

腾讯正式发布自研深度思考模型混元T1正式版，该模型上线腾讯云，即将在腾讯元宝灰度上线。混元T1通过大规模强化学习及专项优化，推理能力出色，在多项基准测试中成绩领先。其沿用混元Turbo S的创新架构，有效降低成本，且在超长文本推理领域有独特优势，能解决长文推理常见问题，同时提升解码速度。
来源：腾讯混元

2025.3.21

1.Anthropic为聊天机器人Claude添加网页搜索功能

Anthropic公司近日为其聊天机器人Claude增添了网页搜索功能。该公司周三宣布，这一功能目前以“功能预览”的形式提供给美国付费用户，用户需在个人设置中开启网页搜索选项。Anthropic公司Claude产品负责人Scott White表示，公司计划在“未来几周内”将这一功能扩展至免费用户及更多国家。
来源：AIYUN

2.上海财经大学联合财跃星辰开源首个金融领域R1类推理大模型Fin-R1

上海财经大学联合财跃星辰开源发布首款金融领域R1类推理大模型Fin-R1，仅7B参数却在权威评测中逼近DeepSeek满血版效果。该模型通过构建高质量金融推理数据集与两阶段混合框架训练，探索出金融领域全闭环链路，能在银行、基金、保险和证券等多个场景中应用，为金融智能化发展提供有力支持。
来源：科创板日报

3.告别公式，腾讯元宝已支持通过自然语言分析复杂 Excel

2025 年 3 月 21 日，腾讯元宝升级上线读 Excel 能力，用户上传表格后，用一句话提问，元宝可完成计算、分析和重点提取，无需手动输入公式。面对数据量大的表格，可切换至混元模型，关闭深度思考模式，混元 Turbo S 自动生成代码，高效处理复杂表格。该功能支持本地上传表格，还支持从微信和腾讯文档直接导入，混元 + DeepSeek 都支持，且支持电脑版、Web、移动端。
来源：IT之家

4.OpenAI 升级其转录和语音生成 AI 模型

OpenAI 正在为其 API 引入新的转录和语音生成 AI 模型，该公司声称这些模型比以前的版本有所改进。对于 OpenAI 来说，这些模型符合其更广泛的“代理”愿景：构建能够代表用户独立完成任务的自动化系统。“代理”的定义可能存在争议，但 OpenAI 产品负责人 Olivier Godemont 描述了一种解释，即可以与企业客户交谈的聊天机器人。
来源：cnBeta

5.估值翻番，Perplexity AI据悉洽谈以180亿美元估值融资

钛媒体App 3月21日消息，据报道，人工智能创企Perplexity AI正洽谈以180亿美元估值筹资5亿至10亿美元，较去年年底的90亿美元估值翻番。
来源：钛媒体

6.Adobe 推出“数据讲故事”利器 Project Slide Wow：AI 自动转换企业数据至精美 PPT

Adobe 公司推出名为 Project Slide Wow 的 AI 工具，处于预览阶段且已集成到 Customer Journey Analytics 中，可将企业原始数据自动转为含演讲者笔记、数据可视化等内容的 PowerPoint 演示文稿。该工具配备互动 AI 助手，能实时调整优化演示内容，有专有排名系统筛选相关见解，还与实时数据源同步，被定位为营销团队等的理想解决方案。
来源：IT之家

2025.3.20

1.阶跃星辰 Step-Video-TI2V 图生视频模型开源，运动可控，动漫效果尤佳！

阶跃星辰开源了图生视频模型Step-Video-TI2V，基于30B参数的Step-Video-T2V训练，能生成102帧、5秒、540P分辨率的视频，具备运动幅度可控和镜头运动可控两大核心特点，特效生成能力出色，尤其在动漫效果上表现优异。该模型已完成与华为昇腾计算平台的适配，并在魔乐社区上线。其引入图像条件和运动幅度控制两大关键优化
来源：阶跃星辰

2.Hugging Face 推出本地 AI 助手 HuggingSnap，实现手机端即时视觉解析

Hugging Face 推出了 iOS 应用 HuggingSnap，这是一个本地 AI 助手，能够实现手机端即时视觉解析。该应用基于轻量级多模态模型 smolVLM2，参数规模在 2.56 亿至 22 亿之间，可在本地完成所有计算，确保用户数据的隐私安全。尽管其准确率略低于云端大模型，但该应用能够高效处理图文任务，如图像和视频分析。
来源：IT之家

3.OpenAI推出o1-pro 目前最昂贵的人工智能模型

OpenAI在其开发者API中推出o1-pro，这是o1“推理”人工智能模型的更强大版本，使用更多计算提供更好响应，目前仅提供给特定开发者，价格昂贵。尽管OpenAI认为性能提升会让开发者付费，但早期印象显示o1-pro在处理数独谜题和视错觉笑话时表现不佳，内部基准测试也仅略高于标准版o1，不过在回答问题时更可靠。
来源：cnBeta

4.xAI 推出用于生成图像的 API

埃隆-马斯克的人工智能公司 xAI 在其 API中添加了图像生成功能。目前，API 中只有一个模型”grok-2-image-1212″可用。给出提示后，该模型每次请求最多可生成 10 张 JPG 格式的图片（每秒仅限 5 次请求），每张图片售价 0.07 美元。
来源：cnBeta

5.英伟达发布 Llama Nemotron 系列开放推理 AI 模型及 Cosmos Nemotron 新成员

2025 年 3 月 20 日，英伟达发布 Llama Nemotron 系列开放推理 AI 模型，包含 Nano、Super 和 Ultra 三种规模，分别适用于不同部署环境，可按需激活深度推理模式，降低推理成本，还通过 NVIDIA NIM 微服务支持全场景应用。同时，英伟达介绍 Cosmos Nemotron 新成员，专注视觉语言模型，可解析多类型数据，扩展平台能力，应用于多模态推理领域，实现协同决策。
来源：IT之家

6.融入AI搜索，金山办公悄然上线灵犀AI，可进行AI写作、PPT创作等

金山办公旗下WPS Office推出新功能“WPS 灵犀”，可进行AI写作、阅读、PPT创作和图像生成等。该功能已接入DeepSeek R1，支持联网搜索，生成内容可直接编辑。目前处于内测阶段，有望不久后向所有用户开放。
来源：钛媒体

7.Razer推出新游戏开发平台Wyvrn，内置AI自动测试工具

Razer于2025年3月20日推出Wyvrn新游戏开发平台，集成AI QA Copilot等自动化工具，可自动检测游戏bug和性能问题，比手动测试多识别20%至25%的bug，节省QA时间和成本。平台还含AI Gamer Copilot语音助手、Chroma RGB平台、THX Spatial Audio Plus插件及Razer Sensa HD Haptics软件等。
来源：AIYUN

8.实时物理AI仿真平台公司松应科技完成数千万元天使轮融资

日实时物理AI仿真平台公司松应科技完成数千万元天使轮融资，本轮领投机构为中科创星，上海天使会、接力天使、奇绩创坛跟投。公司核心技术团队来自华为、海思、英特尔、腾讯等，自主研发了国内首个物理AI仿真系统ORCA，以提升智能机器人的训练效率。本次融资后，资金将主要用于产品研发，扩充团队和开发者生态构建。
来源：科创板日报

9.中科紫东太初大模型发布多模态RAG

紫东太初多模态检索增强生成框架—Taichu-mRAG发布。该框架基于统一多模态细粒度检索引擎和紫东太初多模态大模型，旨在提升内容理解与生成质量，实现对多模态信息的协同感知、精准检索与深度推理问答。据悉，紫东太初为中国科学院自动化研究所和武汉人工智能研究院推出新一代多模态大模型。
来源：科创板日报

2025.3.19

1.告别复杂建模：Stability AI 推出 Stable Virtual Camera，单图秒变 3D 视频

Stability AI 发布了 Stable Virtual Camera 模型，可将静态图像转化为沉浸式 3D 视频，无需复杂场景建模，利用 AI 扩散技术创造逼真效果，目前仅供研究使用，代码开源。
来源：IT之家

2.Google为 Gemini 带来了“画布”以及音频概览功能

Google为其基于人工智能的Gemini聊天机器人添加了Canvas功能及音频概览功能。Canvas概念类似于OpenAI等的同名工具，为用户提供互动空间以创建、改进和分享写作和编码项目，可通过网页版和移动版Gemini应用启动，用户可起草长篇信息并编辑微调，还能导出到Google Docs。Canvas还包含以编程为中心的功能，可生成和预览HTML等Web应用原型。
来源： cnBeta

3.黄仁勋甩出三代核弹AI芯片！个人超算每秒运算1000万亿次

英伟达GTC大会上，黄仁勋发布全新核弹级AI芯片Blackwell Ultra及下一代芯片Rubin等产品。Blackwell Ultra性能强劲，适用于多种AI任务，还推出基于它的DGX Station台式电脑和DGX Spark迷你主机。Rubin性能大幅提升，引入新CPU设计。此外，英伟达推出Spectrum-X和Quantum-X网络交换机，以及Dynamo分布式推理服务库。
来源： APPSO

4.西安科技企业实现AI定制器官，在3D生物打印与仿生组织工程领域获突破性进展

3月19日消息，据“西安发布”，近日，陕西麦克斯韦医疗科技实验室里，实现了AI数字医疗定制再造“原生”鼻子，这得益于公司在3D生物打印与仿生组织工程领域的突破性进展。随着研发不断推进，麦克斯韦通过AI生成模式，实现了义鼻、义肢等的智能化“量身”“远程”定制生产。
来源：钛媒体

5.谷歌将发布用于药物发现的“开放”AI模型

谷歌宣布开发名为TxGemma的“开放”AI模型，用于药物发现，将在本月晚些时候发布。这些模型能理解常规文本和治疗实体结构，帮助预测潜在新疗法特性。尽管AI在药物发现领域面临挑战，但大型制药公司和投资者对其潜力仍充满热情，目前有众多初创公司从事相关工作，投资者已投入大量资金。
来源：AIYUN

6.全国首个面向制造领域的城市级大模型中心落地东莞

东莞市人工智能大模型中心宣布开服，这是全国首个面向制造领域的城市级大模型中心正式落地东莞。据悉，大模型中心计划2025年打造50个以上AI+先进制造示范应用场景，力争到2027年打造135个以上AI+先进制造示范应用场景。开服活动上，东莞数字集团和东莞东阳光人工智能医药研发有限公司
来源：科创板日报

7.豆包宣布AI编程功能再升级

3月19日消息，豆包宣布，AI编程功能迎来三项升级，包括HTML预览、Python运行、生成完整项目。目前豆包支持HTML代码实时预览和交互，可以更加直观地制作各类小游戏和网页。豆包目前支持Python代码直接运行，报错可一键修复。
来源：钛媒体

8.开启多模态思考新时代：昆仑万维开源 R1V 视觉思维链推理模型

昆仑万维开源了首款工业界多模态思维链推理模型 Skywork R1V，成为中国首个开源此类模型的企业。该模型具备顶尖的逻辑推理与数学分析能力，在多个基准测试中取得优异成绩。其拥有三项关键技术创新，包括文本推理能力的多模态高效迁移、多模态混合式训练和自适应长度思维链蒸馏，显著提升了多模态推理的精度与泛化性能。
来源：IT之家

9.NVIDIA 推出仿人机器人基础模型 Groot N1

NVIDIA在2025年GTC大会上推出仿人机器人基础模型Groot N1，该模型是Project Groot的进化版，采用“双系统架构”，慢速思维系统负责感知、推理环境和指令并规划行动，快速思维系统将计划转化为机器人行动。Groot N1已开源，还发布了生成合成训练数据的模拟框架和蓝图，NVIDIA首席执行官黄仁勋称“通用机器人时代已经到来”
来源：cnBeta

10.韩国首款开源推理AI模型：LG推出EXAONE Deep，数学、编程、科学全优

LG推出韩国首个开源推理AI模型EXAONE Deep，定位为“智能体型AI”，能自主提出并验证假设。该模型参数量达320亿，在韩国大学修学能力考试数学部分等多领域测试中表现优异。LG还同步推出两款轻量化模型，其中EXAONE Deep-2.4B专为终端设备设计，支持本地数据处理，提升安全性。
来源：凤凰网科技

11.Anthropic正为聊天机器人Claude开发语音功能

AI初创公司Anthropic正在为其聊天机器人Claude开发语音功能。首席产品官Mike Krieger透露，公司正在探索Claude桌面版的语音交互功能，并已开发出原型产品。Anthropic已与亚马逊和语音技术公司ElevenLabs洽谈合作，但尚未达成最终协议。Krieger表示，公司已与多家合作伙伴讨论，以加速语音功能的推出。
来源：AIYUN

12.倒计时1天！参展商1000+、AI唱主角 AWE2025这些看点值得期待

AWE2025于3月20日在上海开幕，以“AI科技、AI生活”为主题，吸引千余家全球领先企业参展。展会聚焦“以旧换新”与“首发经济”，推出丰富消费活动，助力消费能级提升。AI成展会主角，众多企业展示AI家电、智能机器人等创新产品，推动家电及消费电子行业变革。同时，顶级论坛将解析行业趋势，探讨智慧生活构建等议题。
来源：科创板日报

2025.3.18

1.Mistral AI发布新轻量级模型Mistral Small 3.1

Mistral AI开源了其最新轻量级AI模型Mistral Small 3.1，该模型仅含240亿参数，性能却超越了OpenAI和Google同类模型。它在文本和图像处理上表现出色，数据处理速度可达每秒约150个标记，适合快速响应场景。与前代产品相比，它在文本性能、多模态理解及内容窗口扩展等方面都有提升，且能在相对简陋的基础设施上运行，提高了AI的可访问性。
来源：AIYUN

2.QwQ-32B推理大模型已集成至超算互联网平台

2025年3月17日，超算互联网平台宣布QwQ-32B推理大模型正式集成至其Chatbot可视化对话服务与API在线调用服务。此前，QwQ-32B凭借强化学习技术，在数学推理、代码生成等核心能力上比肩千亿级模型DeepSeek-R1，获得全球关注。平台新增Chat对话入口，用户可零门槛体验其多轮交互能力、长文本解析等，满足学术研究、代码生成、日常咨询等需求。
来源：凤凰网科技

3.摩尔线程开源 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架

摩尔线程开源了 MT-MegatronLM 和 MT-TransformerEngine 两大 AI 框架，通过深度融合 FP8 混合训练策略和高性能算子库，在国产全功能 GPU 上实现混合并行训练和推理，提升训练效率与稳定性。MT-MegatronLM 支持多种模型的高效训练，MT-TransformerEngine 则用于 Transformer 模型的训练与推理优化。
来源：IT之家

4.xAI 收购了一家生成式人工智能视频初创公司

埃隆-马斯克（Elon Musk）的人工智能公司 xAI 收购了 Hotshot，这是一家致力于开发人工智能驱动的视频生成工具的初创公司，与 OpenAI 的Sora类似。Hotshot 的首席执行官兼联合创始人 Aakash Sastry 周一在 X 上发表文章宣布了这一消息。
来源：cnBeta

5.Roblox发布可使用人工智能创建3D物体的开源模型

Roblox 推出并开源其 3D 模型“Cube”，创作者可通过生成式人工智能创建 3D 物体，其 3D 网格生成功能处于测试阶段，允许创作者在 Roblox Studio 中调整生成的物体。此外，Roblox 还计划推出文本生成、文本转语音和语音转文本等人工智能工具，未来还将推出更复杂的对象和场景生成工具，以实现“4D 创造”。
来源：cnBeta

6.腾讯混元推出5款3D生成模型，全部开源

腾讯混元3月18日布推出5个全新3D生成模型，在生成速度、细节和材质表达上均有提升，并且全部开源。同时，其自研的3D AI创作引擎也迎来升级，新增多视图输入、模型智能减面、格式全兼容等能力，面向C端用户全面开放使用。
来源：钛媒体

7.OpenAI高管离职创立材料科学初创公司

OpenAI的后训练研究副总裁Liam Fedus将离职创立一家专注于材料科学的AI初创公司。Fedus表示，其本科时学的是物理，希望在该领域应用AI技术。OpenAI计划投资并与他的新公司合作。其新公司将与Google DeepMind、微软等公司展开竞争，DeepMind和微软此前均在材料发现领域有所布局。不过，一些专家对AI能否真正实现科学创新发现持怀疑态度。
来源：AIYUN

8.腾讯ima更新：上线混元T1模型支持Markdown格式导入与笔记升级

腾讯AI工作台ima.copilot（简称ima）在电脑端、移动端分别更新，推出三大核心功能升级：新增混元T1模型、新增markdown格式导入和解读、升级问答交互，问答消息可修改，笔记面板的AI写作支持多轮追问和知识库调用写作。
来源：科创板日报

2025.3.17

1.百度正式发布文心大模型4.5和文心大模型X1

2025年3月16日，百度发布文心大模型4.5和文心大模型X1，两款模型在文心一言官网免费开放。文心大模型4.5是原生多模态基础大模型，多模态理解能力优秀，语言能力全面提升，关键技术包括FlashMask动态注意力掩码等。文心大模型X1是能力更全面的深度思考模型，支持多模态，能自主运用工具，关键技术有递进式强化学习训练方法等。
来源：百度

2.谷歌 Gemini 2.0 Flash 模型拥有强大图片去水印功能，或触犯版权红线

谷歌推出的 Gemini 2.0 Flash 模型因强大的图片去水印功能引发争议。该模型可去除包括盖蒂图片社等知名图库图片水印，且能填补空白区域，目前免费提供给用户使用。但其缺乏使用限制，可能触犯版权红线，如美国版权法下未经原所有者同意擅自去除水印通常被视为非法行为。目前谷歌尚未对此作出回应。
来源：IT之家

3.可灵AI全面接入DeepSeek，降低AI创意内容门槛

3月17日消息，快手可灵AI已全面接入DeepSeek-R1，在视频生成、图片生成等场景下，用户可通过DeepSeek协助生成或者优化提示词，轻松将灵感转化为专业提示词，打造高质量创意视频。在文生视频场景下，DeepSeek灵感版还可以和此前的“灵感词库”功能联动，进一步掌控场景、镜头、景别、光影、氛围等细节，提升表现力。
来源：钛媒体

4.Claude将推出新功能Harmony及更多工具升级

Claude即将推出新功能Harmony，其亮点包括扫描本地目录、链接文件、编辑文件并展示修改差异、搜索关键词及作为简约版IDE使用。新版网页应用还发现与“Compas”功能相关的“记忆”“任务”等工具，新增“创建子代理”“思考”“休眠”“完成任务”“批处理”等功能调用，更多新功能待揭晓。
来源：AIYUN

5.3·15曝光AI外呼机器人涉事公司智优擎产品已应用超3万家项目

央视3·15晚会曝光AI外呼机器人成骚扰电话帮凶，上海智优擎网络科技有限公司被点名。天眼查App显示，上海智优擎网络科技有限公司成立于2021年9月，法定代表人为张秀芳，注册资本100万人民币，经营范围包括互联网销售、专业设计服务、平面设计等，由田航、刘文涛共同持股。
来源：科创板日报

6.零一万物宣布推出万智企业大模型一站式平台

2025年3月17日，李开复创立的零一万物推出万智企业大模型一站式平台，助力企业快速部署定制DeepSeek解决方案。该平台预装高性能GPU，内置多种前沿模型架构，AI搜索准确性高，还自研高可扩展性RAG架构，提升数据部署速度与模型性能。李开复表示，零一万物已全面转向应用阶段，2025年是AI-First应用爆发年与大模型商业化大考年
来源：钛媒体

7.蝴蝶效应备案manus.cn顶级域名此前曾称尽快将创新体验带给中文用户

3月17日电，北京蝴蝶效应科技有限公司manus.cn域名备案审核通过。据悉，“．cn”域名是中国国家顶级域名，此前manus官网为域名“manus.im”。3月11日，manus官博曾发文表示“尽快将Manus的创新体验带给广大中文用户，敬请期待”。
来源：财联社

8.钉钉推出AI智能体客服可自主接管企业官网和公众号

《科创板日报》17日讯，钉钉推出AI智能体客服，可自动接入企业官网、公众号，目前云深处科技、Rokid（乐奇）、瑞德林、艾为电子、精准学等在内的700多家企业已接入。
来源：科创板日报

9.小米大模型团队音频推理取得重大突破，登顶音频理解评测榜首

小米官方技术微博传来喜讯，其大模型团队在音频推理领域取得了突破性进展。受DeepSeek-R1项目的启发，该团队创新性地引入了强化学习算法，应用于多模态音频理解任务中。短短一周内，他们便实现了64.5%的准确率，这一成绩在国际知名的MMAU（大规模多任务音频理解与推理）基准测试中拔得头筹，并同时向公众开源了相关技术。
来源：AIYUN

2025.3.14

1.北京市新增34款已完成登记的生成式人工智能服务，小米AI搜索、AI写作等在列

3月14日消息，据“网信北京”，截至今日（14日），北京市新增34款已完成登记的生成式人工智能服务，其中，小米AI搜索、小米AI写作等产品在列。北京累计已完成46款生成式人工智能服务登记。
来源：钛媒体

2.推出热门虚拟助手Maya的初创公司Sesame发布其基础AI模型

人工智能公司Sesame发布了支持Maya的基础模型CSM-1B，参数量达10亿，采用Apache 2.0许可证，能从文本和音频输入生成“RVQ音频代码”，使用Meta的Llama系列模型作为骨干。该模型未针对特定声音微调，对非英语语言处理能力有限，且无真正安全措施，仅采用荣誉制度规范使用。Sesame由Oculus联合创始人Brendan Iribe共同创立，曾因助手技术走红，还计划开发“全天佩戴”的AI眼镜。
来源：AIYUN

3.MiniMax将收购深圳AI视频生成创企鹿影科技

上海大模型独角兽MiniMax将收购深圳AI视频生成创企鹿影科技，双方已敲定收购意向，相关流程还在持续进行。鹿影科技在天使轮融资时估值约1亿人民币，去年8月左右一直在寻求第二轮融资但过程不顺，最终选择和MiniMax合作实现共赢。此外，张江集团与智谱联合发布了“模力社区-智谱大模型MaaS平台”，智谱AutoGLM已接入多种应用场景。
来源：科创板日报

4.软银和OpenAI拟将前夏普工厂改造为运营AI智能体的数据中心

3月14日消息，据报道，软银计划将日本一家前夏普液晶面板工厂改造为数据中心，用于运行与OpenAI联合开发的人工智能智能体。据悉，收购该工厂及土地的协议最快周五签署，收购价格预计约为1000亿日元。
来源：钛媒体

5.感谢 DeepSeek，春节后中国 AI 创企融资井喷

2025 年 3 月 13 日消息，DeepSeek 在人工智能领域取得突破性进展，引发中国风投界热潮，结束连续三年下滑趋势。Insilico Medicine 等公司受其影响，融资活跃。中国人工智能投资在春节后井喷，全球投资者兴趣浓厚。中国政府政策支持明确，设立基金、扩大科技创新贷款规模，推动人工智能发展。但中美紧张关系仍是国际投资者考虑投资时的障碍。
来源：IT之家

6.加拿大AI公司周四将发布新模型，算力需求或比DeepSeek更低

2025年3月13日，彭博社报道，加拿大AI公司Cohere计划于周四发布名为Command A的新模型，仅需两块英伟达A100或H100芯片就能执行复杂商业任务，算力需求可能低于DeepSeek。Cohere首席执行官艾丹・戈麦斯表示，该模型研发早于DeepSeek震动科技界，对商业客户而言，用更少芯片运行AI模型至关重要，因客户算力有限，轻量化可扩展解决方案才是刚需。
来源：凤凰网科技

7.微软正在Windows记事本中测试基于AI的摘要功能

微软正在Windows记事本中测试人工智能驱动的摘要。在向 Canary 和 Dev 频道中的 Windows Insiders推出的更新中，您将能够在记事本中汇总信息，方法是突出显示一大段文本，右键单击该文本并选择汇总。
来源：cnBeta

8.OpenAI提案建议美国政府禁止中国DeepSeek模型

OpenAI在提交给美国政府的提案中建议禁止中国DeepSeek模型，称其存在安全隐患且可能受中国政府控制。尽管DeepSeek的开源模型并无直接数据访问机制，且多家国际公司也在使用，但OpenAI仍指责其“蒸馏”知识并受中国资助。该提案引发美国网络强烈反响，被批双重标准和阻碍行业创新。
来源：AIYUN

2025.3.13

1.潞晨科技推出开源视频生成模型 Open-Sora 2.0，性能接近 OpenAI Sora

潞晨科技推出开源视频生成模型 Open-Sora 2.0，全面开源模型权重、推理代码及分布式训练全流程。该模型仅用 224 张 GPU 成功训练出商业级 11B 参数视频生成大模型，性能直追腾讯混元和 30B 参数的 Step-Video，与 OpenAI Sora 闭源模型之间的性能差距大幅缩减。
来源：潞晨科技

2.从聊天机器人到智能玩具：人工智能正在中国蓬勃发展

中国正积极推动人工智能产业发展，目标是到 2030 年成为全球科技强国。本土人工智能公司如 DeepSeek 取得显著成就，政府投资和教育系统支持，推动人工智能应用迅速扩展。中国有 4500 多家企业开发和销售人工智能产品，学校和大学增加相关课程和专业学生名额。尽管面临美国关税压力等挑战，但中国仍在大力押注人工智能，计划投资 10 万亿元，已成立 600 亿元投资基金。
来源：IT之家

3.集成多模态模型阿里AI旗舰应用“新夸克”发布

2025 年 3 月 13 日，阿里巴巴集团发布全新 AI 旗舰应用 “新夸克”，基于通义系列大模型技术，从传统搜索引擎升级为整合多场景能力的 “AI 超级框”，覆盖 2 亿用户。新版本融合 AI 对话等功能，提供全链路服务。其采用阿里通义多模态与推理大模型支撑，智能中枢系统可自动解析指令。通义系列模型未来迭代优先接入夸克平台。
来源：阿里巴巴

4.中关村科金发布得助大模型平台2.5、得助智能客服4.0

3月13日消息，在与上海市人工智能行业协会联合举办的”DeepSeek企业应用之道”论坛上，中关村科金发布得助大模型平台2.5与得助智能客服4.0。其中，得助大模型平台2.5目前已接入DeepSeek，并覆盖算力、数据、模型、智能体等全链路大模型开发和应用能力。
来源：钛媒体

5.谷歌推出 Gemma 3：号称可在单块 GPU 上运行的最强 AI 模型

谷歌推出Gemma 3人工智能模型，专为开发者设计，支持多设备运行，涵盖35种语言，可分析文本、图像及短视频。其性能在单GPU主机上超越Facebook的Llama、DeepSeek和OpenAI等竞争对手，且针对Nvidia GPU和专用硬件优化。尽管存在对模型吸引力的疑虑，但市场对低硬件要求的AI技术兴趣浓厚。
来源：IT之家

6.机械臂模拟人类按摩，德壹发布全球首款端侧大模型 AI 具身理疗机器人

德壹机器人推出全球首款端侧大模型 AI 具身理疗机器人——全能王 AI 具身机器人。它融合尖端 AI 技术、中医理疗智慧与具身智能，搭载“中医 AI 辨证系统”，通过多模态感知技术实时扫描用户身体，动态生成个性化理疗方案。依托移远通信端侧 AI 整体解决方案，无需理疗师介入和网络连接，可完成多种任务，配备 8 自由度灵巧机械臂模拟人手手法，安全方面采用端侧部署模式，降低推理成本。
来源：IT之家

7.精准渲染 + 智能叙事：Gemini 2.0 Flash 原生图像生成功能正式开放

Gemini 2.0 Flash原生图像生成功能开放，结合多模态输入、增强推理和自然语言理解能力，可生成图像。其应用场景包括文本与图像融合讲述故事、对话式图像编辑、利用世界知识理解创建图像、精准文本渲染等。开发者可通过Gemini API使用该功能，反馈将助其完善。
来源：AIYUN

8.Google DeepMind推出两款新AI模型助力机器人技术

Google DeepMind推出两款新AI模型Gemini Robotics和Gemini Robotics-ER助力机器人技术。Gemini Robotics基于Gemini 2.0构建，融合多模态理解能力，添加物理行动模态，实现通用性、交互性和灵巧性提升，可执行复杂任务。Gemini Robotics-ER是先进视觉语言模型，能理解复杂动态世界，与低级控制器连接实现新功能。
来源：AIYUN

2025.3.12

1.豆包文生图技术报告发布！数据处理、预训练、RLHF全流程公开

豆包大模型团队发布文生图技术报告，公开 Seedream 2.0 图像生成模型技术细节，涵盖数据构建、预训练框架、后训练 RLHF 全流程。该模型原生中英双语理解，文字渲染、美感、分辨率与画幅变换等特性出色，服务上亿用户，成专业设计师首选。相比主流模型，解决文本渲染、中国文化理解等问题，支持双语，美感、指令遵循能力提升。
来源：豆包大模型团队

2.“人工智能+”成两会高频词 “+”什么？如何“+”？

2025年3月12日，《科创板日报》报道，“人工智能+”在两会成为高频词汇。政府工作报告提出持续推进该行动，推动数字技术与制造、市场优势结合，支持大模型广泛应用，发展智能网联新能源汽车等新一代智能终端及智能制造装备。企业代表们在不同专业领域探讨人工智能赋能千行百业，如“具身智能”“教育”“安全”等，但也面临成本与性能权衡等问题。
来源：科创板日报

3.“一脑多机”通用具身智能平台“慧思开物”发布

北京人形机器人创新中心（国家地方共建具身智能机器人创新中心）3月12日在京发布全球首个“一脑多能”“一脑多机”的通用具身智能平台“慧思开物”。“慧思开物”的应用是对基于单一场景单一任务做专项开发这一传统机器人应用开发模式的颠覆，同时也填补了具身智能领域在通用软件系统方面的空白，真正推动智能机器人从单一任务执行向复杂环境下的自主决策与执行能力跃升。
来源：科创板日报

4.刚刚，OpenAl 发布 Agent 工具包，网友：谢谢 Manus AI

OpenAI 发布了一系列新工具和 API，旨在帮助开发者更轻松地创建能自动完成任务的 AI Agents。新工具包括 Responses API、Web 搜索工具、文件搜索工具、计算机使用工具和 Agents SDK。这些工具和 API 能够让 AI Agents 读懂用户喜好、获取实时资讯、执行复杂操作，并在不同任务间灵活切换。
来源： APPSO

5.Manus 与阿里通义千问团队达成战略合作，在国产模型和算力平台上实现 Manus 全部功能

Manus 官方微博宣布与阿里通义千问团队达成战略合作，基于通义千问系列开源模型，在国产模型和算力平台上实现 Manus 全部功能，致力于为中国用户打造更具创造力的通用智能体产品。Manus 是由创业公司 Monica 发布的首款 AI Agent 产品，近期在社交媒体火爆出圈。此前公司已完成多轮融资，领投方包括腾讯和红杉中国等。
来源：IT之家

6.阿里通义团队开源 R1-Omni：多模态模型 + RLVR，让各模态作用清晰可见

阿里通义团队开源 R1-Omni 模型，该模型结合多模态与 RLVR 方法，使各模态作用清晰可见，尤其在情绪识别任务中能明确展示关键模态信息。实验表明，其在同分布测试集上相较于原始基线模型平均提升超 35%，在不同分布测试集上泛化能力卓越，充分证明 RLVR 在提升推理能力和泛化性能上的优势。
来源：IT之家

7.硅基智能开源数字人模型3天斩获1k Stars

硅基智能（南京硅基智能科技集团股份有限公司）旗下数字人模型HeyGem.ai在GitHub开源仅3天即突破1000颗Stars。该模型以“1秒视频/1张照片”输入实现30秒克隆形象与声音、60秒生成4K超清视频，在复杂场景下仍能保持100%口型匹配及多表情动作输出，性能达全球TOP级水平。
来源：凤凰网科技

8.10秒生成4分钟音乐，8GB显存就能跑！已登Hugging Face趋势榜一

DiffRhythm 是一款新型 AI 音乐生成模型，由西北工业大学和香港中文大学（深圳）的研究团队提出。它采用全 diffusion 架构，仅需歌词和风格提示，10 秒内就能生成长达 4 分 45 秒的完整双轨高保真歌曲，最低 8G 显存可本地部署。该模型摒弃复杂多阶段架构，具有快速推理速度和易于扩展数据的优势，还解决了歌词与歌声对齐难题。
来源：新智元

9.又一家AI机器人公司Dexterity获得大笔融资

Dexterity是一家专注于生产具有“类人”精细度的工业机器人的初创公司，已融资9500万美元，估值16.5亿美元。该公司的机器人旨在为联邦快递和UPS等客户在仓库和工厂中执行重复性且有时危险的任务，如装箱和分拣包裹。公司创始人Samir Menon表示，这些机器人使用专门的人工智能模型，每个模型都专注于一项特定的任务。目前，Dexterity已筹集近3亿美元资金。
来源：cnBeta

10.阿里国际站旗下AI搜索引擎Accio企业用户已超百万

《科创板日报》11日讯，记者获悉，阿里国际站面向海外买家推出的AI搜索引擎Accio企业用户已超百万。据悉，Accio相继接入Qwen2.5、DeepSeek等先进推理模型。
来源：科创板日报

11.江苏首例AI版权图片案宣判：作者有创新设计，享有著作权

江苏首例AI版权图片案宣判，原告林某使用AI软件Midjourney创作并修改生成图片《伴心》，后发现某技术公司和房地产公司分别在小红书账号和微信推文中使用该图片，林某起诉。法院认定林某对提示词及图片细节设计的修改体现独特选择与安排，该图片有独创性，属《著作权法》保护作品，判决侵权方公开道歉并赔偿损失，同时明确林某著作权限于平面图片。
来源：凤凰网科技

12.多家985、211高校接入阿里通义千问大模型

2025 年 3 月 12 日消息，东南大学、天津大学等多所国内 985、211 高校完成阿里通义千问 QwQ – 32B 大模型部署。该模型 3 月 6 日开源，32B 参数规模，在数学推理、代码生成等任务中性能对标 671B 的 DeepSeek – R1，且适配消费级显卡，降低高校 AI 应用门槛。高校已将其应用于实验模拟、数据分析、学科研究等场景，推动教学科研智能化升级。
来源：钛媒体

2025.3.11

1.果然是机器人“政策年”！广东拟12方面推动产业创新发展

2025年3月10日，广东省人民政府办公厅印发推动人工智能与机器人产业创新发展若干政策措施，涵盖技术攻关、企业培育等12个细分方面，如支持创建创新中心并给予资金支持，推动产业集聚发展，打造多领域应用场景等。近期，具身智能机器人政策明显发力，多地出台相关行动计划，明确产业规模、应用场景等目标，且政策从推出发展目标转向资金支持，体现国家扶持决心，地方政府有望成为产业推动力量。
来源：科创板日报

2.万卡集群真实部署，已节省数百万 GPU 小时！MoE 通信优化技术 COMET 开源

当前，MoE 架构是业界拓展模型规模的重要方向，然而，其在分布式训练中存在的大量通信开销，仍严重制约了训练效率和成本。为攻克这一瓶颈，豆包大模型团队提出了一个全新的通信优化系统 COMET，通过更精准、细粒度的计算-通信重叠技术，在大规模 MoE 模型上可达到单层 1.96 倍加速，端到端平均 1.71 倍效率提升，且在不同并行策略、输入规模及硬件环境下均表现稳定。
来源：豆包大模型团队

3.OpenAI 发布 CoT 思维链研究成果，监控阻止大模型恶意行为

OpenAI 发布 CoT 思维链研究成果，旨在监控推理模型的“想法”，阻止 AI 大模型恶意行为，如胡说八道、隐藏真实意图等。测试中，以 o3-mini 为被监控对象，GPT-4o 为监控器，在编码任务环境下，CoT 监控器检测系统性“奖励黑客”行为召回率高达 95%。
来源：IT之家

4.行业首例：亚马逊云科技宣布上线DeepSeek-R1全托管服务

2025 年 3 月 11 日，亚马逊云科技在 Amazon Bedrock 上线完全托管的 DeepSeek-R1 服务，成为首个推出该服务的云服务提供商。DeepSeek-R1 作为完全托管服务，无需用户进行配置或维护，提供全套安全防护和工具，方便各类用户轻松访问并应用于企业级部署，解决复杂问题、编写代码、处理数据等。
来源：IT之家

5.AI教父Hinton评开源DeepSeek：中国AI如何打破西方技术垄断？（附视频）

本文是关于“AI教父”Geoffrey Hinton对开源DeepSeek的评价及对AI未来发展的看法的专访。Hinton认为DeepSeek以较低成本取得接近西方AI巨头的成果，改变了全球AI格局。他回顾了自己60年神经网络研究历程，包括早期研究的困难、ImageNet挑战赛的突破、与谷歌的合作等。Hinton对AI未来持谨慎乐观态度，认为神经网络推理能力已很强，未来可能有新进展但未必需要根本性变革。
来源：IT之家

6.网易有道完成翻译底层技术迭代，翻译质量超国内外主流通用大模型

3月11日，网易有道宣布完成翻译底层技术迭代，基于自主研发的子曰翻译大模型2.0，在测试中实现翻译质量超越国内外主流通用大模型。此次突破，也标志着国产大模型在专业领域取得实质性进展，通过数据、算法等技术创新，使得小参数垂类模型实现性能大幅提升。
来源：36氪

7.越疆科技发布全球首款“灵巧操作+直膝行走”具身智能人形机器人

3月11日消息，越疆科技发布全球首款“灵巧操作+直膝行走”具身智能人形机器人，可实现跨场景、多台协同胜任复杂操作泛化任务。该款被命名为Dobot Atom的机器人，是面向工业级精细操作全尺寸仿生人形机器人，搭载自研神经驱动灵巧操作系统NDS和仿⼈直膝行走系统AWS，引领具身智能技术向工业、服务等多元场景深度落地‌。
来源：钛媒体

8.智元机器人发布最新双足人形机器人灵犀X2

3月11日消息，智元机器人发布最新搭载情感计算引擎的双足智能交互人形机器人灵犀X2。
来源：钛媒体

9.谷歌推出基于Gemini AI的新功能，自动向Google日历添加事件

谷歌近期宣布了一项利用Gemini AI机器人技术的新功能，该功能能够基于Gmail中的邮件详情自动向用户的Google日历中添加事件。当Gemini识别到邮件内容描述了一个事件时，该邮件将会显示一个新的“添加到日历”按钮，用户点击后，将启动一系列交互操作。
来源：AIYUN

10.AI市场格局巨变：Poe平台发布最新报告揭示行业趋势

2025年的最新数据显示，AI市场份额发生了显著变化，企业和消费者使用人工智能工具的方式也迅速演进。Poe平台，作为一个托管超过100种AI模型的综合性平台，发布了一份全面报告，首次深入揭示了文本、图像和视频生成技术的真实使用模式。这份报告基于过去一年中数百万用户的互动数据，为技术决策者提供了宝贵的竞争洞察，尽管这一领域的数据通常高度保密。
来源：AIYUN

11.百度上线AI陪伴产品“月匣”App

百度近期低调推出情感陪伴类App“月匣”，主打高自由度AI对话与沉浸式剧本互动两大核心功能。这款产品不仅搭载自研的文心一言大模型，还整合了DeepSeek、豆包、MiniMax abab三大外部的大模型，通过构建虚拟角色生态，试图在泛娱乐社交领域开辟新赛道。
来源：科创板日报

2025.3.10

1.VLA进化到ViLLA，智元发布首个通用具身基座大模型GO-1

智元发布了首个通用具身基座大模型GO-1，采用Vision-Language-Latent-Action (ViLLA)架构，由VLM和MoE组成。VLM负责场景感知和语言理解，MoE中的Latent Planner和Action Expert分别负责动作理解和精细动作执行。GO-1利用高质量数据集AgiBot World，通过预测隐式动作标记弥合输入与动作执行的差距，显著提升了任务成功率，推动具身智能向通用化、开放化、智能化方向发展。
来源：智元机器人

2.谷歌推出迄今最强大的文本嵌入模型：Gemini Embedding

谷歌于2025年3月10日在其Gemini开发者API中推出全新的实验性文本嵌入模型Gemini Embedding。该模型将文本转换为数字形式以捕获语义含义，适用于文档检索和分类等应用。Gemini Embedding在性能上超越了谷歌此前的text-embedding-004模型，支持更大文本块和更多语言（超100种）。目前处于实验阶段，未来几个月将推出稳定版本。
来源：AIYUN

3.智元机器人：正与阶跃星辰合作，将多模态能力赋能至机器人

3月10日消息，今日，据智元机器人方面介绍，公司已与阶跃星辰合作，后续围绕阶跃的多模态、推理和训练、工程化等底层模型能力，进行深度的合作，将阶跃星辰多模态等能力赋能到机器人上面。
来源：钛媒体

4.AI 编程助手受投资者热捧，消息称 Cursor 开发商 Anysphere 正以 100 亿美元估值进行融资

近期 AI 编程助手领域投资热度攀升，相关企业估值不断刷新纪录。Anysphere 公司计划以接近 100 亿美元估值融资，其开发的 Cursor 是人工智能编程助手。三个月前 Anysphere 完成 1 亿美元融资，当时估值 25 亿美元。如今公司估值有望达其 1 亿美元年度经常性收入（ARR）的 66 倍，目前 ARR 可能已增长至 1.5 亿美元，此轮融资预计将由 Thrive Capital 领投
来源：IT之家

5.OWL：0天复刻Manus通用智能体，完全开源！GAIA Benchmark最强性能！

CAMEL-AI的OWL项目在0天内复刻了Manus通用智能体，并完全开源。OWL在GAIA Benchmark上达到58.18%的性能，超越Huggingface的Open Deep Research。Manus的内测邀请码价格高昂，而OWL免费且开源，开发者可参与贡献。OWL对比Manus在代码、获取难度、工具链、执行环境和价格等方面更具优势。
来源：CAMEL AI

6.星纪魅族 StarV 系列智能眼镜将在澳大利亚亮相

星纪魅族 StarV 系列智能眼镜即将于 3 月 11 日在澳大利亚亮相，该系列智能眼镜配备旗舰级 AI 技术，主打续航、信号、精准定位及实用 AI 功能等特性。其中 StarV Air2 支持提词器、实时翻译、AR 导航、AI 会议记录等功能，并接入 Deep Seek 大模型能力
来源：IT之家

7.全国产API，零门槛部署！超算互联网QwQ-32B API接口服务上线，免费100万Tokens

超算互联网平台于 2025 年 3 月 8 日上线阿里巴巴开源推理模型 QwQ-32B API 接口服务，用户可免费获 100 万 Tokens。平台基于国产深算智能加速卡及全国一体化算力网，支持海量用户便捷调用 QwQ-32B 等国产开源大模型接口服务，还同步上线 QwQ-32B 模型镜像、文件，用户无需下载本地，可一键启动 Notebook 功能快速开发或私有化部署。
来源：超算互联网

8.浙大研制出可穿戴变脸面具：一张面具无痕切换8种不同脸型

浙江大学机械工程学院邹俊教授课题组研制出一种可穿戴变脸面具，能实现一张面具在多个相貌间无痕切换，为人类和机器人面部变装及表达提供新思路。目前一张面具可切换至少8种脸型，未来有望实现不同年龄阶段面部切换
来源：快科技

9.西湖大学发布新智能体，可自我进化

3月10日消息，日前，西湖大学AGI实验室张驰团队推出了AppAgentX——一款具备自我进化能力的GUI代理。它能够在不断执行任务的过程中学习并优化自身的行为模式，实现更加高效的操作。从实验结果来看，AppAgentX从单步的执行效率到总体的API token消耗，在多个GUI交互任务上展现出了显著的“降本增效”。
来源：钛媒体

10.Tammy Nam加入AI广告初创公司Creatopy担任首席执行官

AI广告初创公司Creatopy任命Tammy Nam为新CEO。Nam曾是PicsArt的首席运营官和首席营销官，以及Viki的CEO。她加入Creatopy是因为其熟悉美国市场、有初创公司扩展经验、与欧洲创始人合作过且了解营销技术。她还加入了公司董事会，前任CEO转任顾问。
来源：AIYUN

11.广州：正部署成立产业办专门推进人工智能相关工作

作为现代化产业体系中的5个关键产业之一，目前广州市正按市委、市政府工作部署成立产业办，专门推进人工智能相关工作。据悉，将结合广州应用场景资源丰富的特点，选择广州具有比较优势和发展潜力的生命健康、智能交通、能源环保、智能制造等行业为重点方向，通过为各类创新主体搭建便捷、优质、普惠的AI+行业应用共性技术服务基地
来源：科创板日报

12.对话式AI即将爆发！将在手机助手、陪伴机器人、学习机等场景率先落地

在生成式AI浪潮下，对话式AI技术日益成熟，应用场景爆炸式增长。其在桌面助手、手机助手、智能硬件、陪伴机器人等场景率先爆发。对话式AI产品如亚马逊Alexa+、汤姆猫AI情感陪伴机器人等不断涌现。声网发布全球首个对话式AI引擎，助力开发者快速部署多种对话式AI场景
来源：科创板日报

2025.3.7

1.Microsoft Copilot 用户可免费、无限制地访问 o3-mini-high 模型

去年 9 月，OpenAI 宣布推出 o1 系列 AI 模型，旨在花更多时间思考后再做出反应。这些模型能够推理复杂的任务，能够解决比其他领先的科学、编程和数学 AI 模型更难的问题。随后，在 10 月，微软宣布为 Pro 计划用户提供一项名为 Think Deeper 的 Copilot 新功能，该功能使用 OpenAI 的 o1 推理模型帮助用户解决棘手的问题。
来源：cnBeta

2.Manus 邀请码被曝炒到10万元，代写申请邮件也成有偿业务

3月7日消息，最新国产AI产品Manus成为继DeepSeek之后又一火爆全网的产品。目前，该产品还在内测之中，用户可在登录后申请加入内测。据多家媒体报道，在二手交易平台上，所谓Manus邀请码价格最高被炒至10万元。据了解，在一些社交平台上，代写申请邀请码的邮件也成了有偿业务。
来源：钛媒体

3.AMD推出全新开源语言模型Instella：先进的3B参数语言模型

在当今快速发展的数字时代，对高效且易访问的语言模型的需求日益迫切。为了满足这一需求，AMD近日正式推出了全新的开源语言模型——Instella。这款拥有30亿参数的模型，不仅性能卓越，而且完全开源，为学术界和工业界提供了一个全新的选择。
来源：AIYUN

4.Tavus推出AI模型家族以支持实时人脸互动

Tavus公司是一家专注于开发能够模拟与他人交谈体验的实时AI技术模型的人工智能研究初创公司，今天宣布推出一系列突破性的AI模型。公司表示正在构建他们称之为人机交互操作系统，名为“对话视频界面”，这将使AI能够自然地感知、解释和回应，就像在Zoom或FaceTime通话中与另一个人交谈一样。
来源：AIYUN

5.OpenAI 更新 macOS 版 ChatGPT，可在 Xcode 等 IDE 中直接编辑代码

2025 年 3 月 6 日，OpenAI 宣布升级 macOS 版 ChatGPT 应用，新增在 Xcode、VS Code 等 IDE 中直接编辑代码的功能，简化开发者编码流程，与 Apple 内置的 Swift Assist 和 GitHub Copilot 竞争。更新还引入“自动应用”模式，无需额外授权即可直接编辑代码，目前向 ChatGPT Plus、Pro 和 Team 订阅用户开放
来源：IT之家

6.在国内爆火被质疑炒作，Manus官方X账号被冻结

Manus官方X账号于2025年3月7日被冻结。Manus是全球首款通用AI智能体，于3月6日凌晨发布，官网访问量迅速达千万级别。其发布者是AI团队Monica，创始人肖弘2015年毕业于华中科技大学软件工程专业。Manus擅长多种任务，在GAIA基准测试中成绩大幅超过OpenAI。但Manus因采用邀请内测限制，被质疑“饥饿营销+套壳炒作”，且其出圈首先在自媒体界而非专业科技圈。
来源：凤凰网科技

7.WPS AI 数据助手新增深度思考能力，WPS表格类产品全系已接入

3月7日消息，金山办公旗下WPS AI数据助手升级，增添深度思考能力，并结合金山办公自主研发的文档图片识别与理解、图表引擎、跨格式数据融合等技术，接入WPS智能表格、WPS多维表格、WPS表格，成为国内办公软件赛道首个支持表格类产品深度思考的AI应用。用户当前可通过新建WPS智能表格、WPS多维表格、WPS表格，在WPS AI选项卡之下选择AI数据分析功能，启用深度思考模式。
来源：钛媒体

8.全球消费级AI应用排名：DeepSeek火箭蹿升至第二海螺和可灵已赶超Sora

2025年3月7日，全球著名投资基金、咨询公司Andreessen Horowitz发布了2025年全球100生成式AI消费级应用排行榜。中国AI应用表现亮眼，DeepSeek在网页端AI应用中排名第二，其用户增速惊人，仅用14天达到100万用户，20天突破1000万用户。海螺视频和快手可灵在文生视频赛道超越Sora。ChatGPT依靠功能更新守住榜首，从2024年8月到2025年2月中旬，每月活跃用户从2亿翻倍至4亿。
来源：科创板日报

2025.3.6

1.中国团队发布通用型AI Agent产品Manus

3月6日消息，日前，一支来自中国的团队正式对外发布通用型AI Agent产品Manus。据团队介绍，Manus在GAIA基准测试中取得了SOTA（State-of-the-Art）的成绩，显示其性能超越OpenAI的同层次大模型。从介绍来看，相较于目前的大模型产品，作为通用型Agent，Manus定位于一位性能强大的通用型助手，对于用户不仅仅是提供想法，而是能将想法付诸实践，真正解决问题。
来源：钛媒体

2.阿里云推出最新通义千问 QwQ-32B 推理模型并开源

Qwen团队推出QwQ-32B推理模型，该模型拥有320亿参数，性能可与参数量更大的DeepSeek-R1媲美。通过大规模强化学习提升模型智能，使其具备批判性思考和根据环境反馈调整推理过程的能力。在多项基准测试中，QwQ-32B表现优异，超越多个领先模型。团队还展示了通过API使用该模型的示例代码，并展望了未来在强化学习和实现人工通用智能方面的探索。
来源：通义千问Qwen

3.字节跳动豆包上线「深度思考」推理模式，覆盖问答、搜索、写作和阅读场景

字节跳动旗下 AI 助手豆包于 2025 年 3 月 5 日上线「深度思考」推理模式，覆盖问答、搜索、写作和阅读场景。用户打开「深度思考 Beta」开关即可进入该模式。该模式基于豆包 1.5 基座模型研发，能让用户看到模型的思考过程，包括思维链展示、自我质疑、假设验证、错误修正等步骤，如解决数学题时会展示完整过程。
来源：IT之家

4.具身机器人公司“逐际动力”完成 5 亿元 A 轮系列融资，阿里巴巴等参投

具身智能机器人公司「逐际动力」近期完成A+轮融资，半年累计完成5亿元A轮系列融资，获得阿里巴巴集团、蔚来资本、联想创投等多家头部机构的战略支持。该公司成立于2022年，聚焦全尺寸通用人形机器人，提供人形机器人本体软硬件系统和具身Agent开发工具链。
来源：36氪

5.OpenAI 宣布 GPT-4.5 正式面向所有 ChatGPT Plus 用户开放

OpenAI于2月28日推出GPT-4.5“研究预览版”，3月6日宣布向ChatGPT Plus用户开放，比预期早。该模型将逐步扩展至不同用户群体，还将在微软Azure AI Foundry平台上线。OpenAI计划5月底前推出GPT-5，目前正整合o3模型功能。GPT-4.5价格远高于GPT-4o，输入成本是其30倍，输出成本是15倍。
来源：IT之家

6.Google在搜索结果中引入新的人工智能模式

2025 年 3 月 6 日消息，Google 在搜索结果中引入新的人工智能模式。其 AI 概览功能有了新进展，美国的 AI 概览现使用 Gemini 2.0 模型，能为复杂问题提供更高质量响应，还向青少年开放且无需登录。同时，Google 推出 AI 模式，利用 “查询扇出” 技术，跨子主题和多数据源搜索并汇总结果，提供更全面深入的回应
来源：cnBeta

7.邀请码被炒到天价 Manus AI合伙人张涛回应

全球首款通用AI Agent“Manus”发布后，其邀请码在二手交易平台被高价炒作。Manus AI合伙人张涛回应称，产品仍处内测阶段，团队将专注于产品研发与用户体验优化。他澄清Manus从未付费发放邀请码，也未投入市场推广预算。张涛透露团队目前重心是完善产品功能，未来将逐步扩大测试范围。
来源：凤凰网科技

8.OpenAI被曝博士级AI智能体2万美元/月，网友：DeepSeek快把价格打下去

OpenAI计划推出三类智能体产品，价格从每月2千美元到2万美元不等，分别针对不同层次的任务需求。其中，博士级AI智能体月费高达2万美元，引发网友对价格的质疑和对竞争对手DeepSeek的期待。OpenAI预计智能体产品将贡献公司20%至25%的收入，其高管Sam Altman强调AI智能体定价远高于现有产品。
来源：新智元

9.Prime Video测试AI配音技术用于部分电影和电视剧

Prime Video正在测试AI辅助配音服务，涵盖英语和拉丁美洲西班牙语，结合AI与人工本地化专业人员确保质量。该服务将应用于12部此前无配音支持的作品，包括《El Cid: La Leyenda》等。AI配音在娱乐行业逐渐流行，多家流媒体巨头已涉足，如Deepdub服务Paramount+，YouTube也推出自动配音功能。
来源：AIYUN

10.Contextual AI发布新模型，在事实准确性上超越GPT-4o

Contextual AI发布了接地语言模型（GLM），在FACTS基准测试中，其事实准确性超过谷歌、Anthropic和OpenAI的领先AI系统，得分88%。该初创公司以检索增强生成（RAG）技术先驱者创立，专注于为企业RAG应用优化模型，解决企业采用AI技术时面临的关键挑战——事实性不准确问题。在高度监管的行业，对幻觉现象零容忍，通用语言模型不适合对错误敏感的企业环境。
来源：AIYUN

11.机构：预计2025年全球智能眼镜市场同比增长60%

市场调查机构CounterPoint Research报告显示，在Ray-Ban Meta智能眼镜的强劲需求推动下，2024年全球智能眼镜出货量同比大幅增长210%，2023年则同比增长了156%。预计全球智能眼镜市场将持续增长，2025年同比增长60% ，并且到2029年将保持超过60%的年均增长率，受益于更广泛的应用场景、多样化的价格段和不断扩展的玩家生态系统。
来源：科创板日报

12.英特尔发布商用AI PC产品将于3月底出货

2025年世界移动通信大会上，英特尔发布了商用AI PC产品阵容，搭载了英特尔® 酷睿™ Ultra 200V、200U、200H、200HX和200S系列处理器。其中，搭载英特尔® 酷睿™Ultra 200U、200H、200HX和200S系列处理器的系统将于2025年3月底出货。英特尔vPro Fleet Services目前处于预览阶段，预计将在未来几周内正式开启使用。
来源：科创板日报

13.腾讯混元发布并开源图生视频模型：可生成 5 秒短视频，还能自动配上背景音效

腾讯混元发布并开源图生视频模型，用户上传图片并描述后，可生成 5 秒短视频并自动配上背景音效，还支持对口型、动作驱动等功能。该模型参数量 130 亿，适用于多种角色和场景，开源内容包含权重、推理代码和 LoRA 训练代码，支持开发者训练专属模型，在 Github 等平台可下载体验，混元开源系列模型已覆盖多个模态，累计获超 2.3 万开发者关注。
来源：IT之家

2025.3.5

1.政府工作报告：支持大模型广泛应用

十四届全国人大三次会议于3月5日上午9时在北京开幕，国务院总理李强作政府工作报告。报告提出，激发数字经济创新活力。持续推进“人工智能+”行动，将数字技术与制造优势、市场优势更好结合起来，支持大模型广泛应用，大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备。
来源：科创板日报

2.即梦 AI 上线 “动作模仿” 功能：照片 + 参考视频即可让人物动起来

2025年3月5日，字节跳动旗下即梦AI上线“动作模仿”功能。用户上传一张人物图片和一条参考视频，就能生成动态视频，让图片人物模仿参考视频动作及情绪。该功能由字节跳动智能创作数字人团队支持，采用混合驱动方式，精准抓取表情细节。目前提供3个动作模板，支持本地文件上传，视频最长30秒，平台会安全审核并添加“AI生成”水印。
来源：IT之家

3.抖音回应接入豆包：相关能力测试中

3月5日消息，据报道，抖音App于近期测试接入豆包App的AI能力，并且在抖音App内为豆包App开放了两个超级入口，一个位于短视频界面，与点赞、评论、转发等功能处于同一竖列；另外一个入口则位于抖音App的消息列表内。对此，抖音相关负责人表示，相关能力测试中，主要是希望为用户提供更丰富的AI服务。
来源：钛媒体

4.美国法院否决马斯克针对OpenAI的初步禁令请求

3月5日消息，美国一联邦法院否决了马斯克此前请求的初步禁令，该禁令旨在阻止ChatGPT制造商OpenAI转型为营利性公司。据报道，美国加利福尼亚州奥克兰地区法官伊冯·冈萨雷斯·罗杰斯表示，马斯克未能满足获得初步禁令所需的“高门槛”证据要求，以阻止OpenAI从非营利组织转为营利性实体。
来源：钛媒体

5.亚马逊正在开发一种新的”推理”人工智能模型以与OpenAI和Anthropic 竞争

亚马逊正在开发新的“推理”人工智能模型，计划6月在Nova品牌下推出，采用“混合推理”方法，提供快速答案和复杂扩展思维。该模型旨在价格效率上超越OpenAI、Anthropic和Google的竞争对手，并在外部基准性能排名中进入前五。此举显示了亚马逊投资自身人工智能模型系列的决心，也加剧了与Anthropic的竞争，尽管双方在人工智能芯片和云计算等领域仍有合作。
来源： cnBeta

6.OpenAI启动NextGenAI联盟，携手15家研究机构获5000万美元资助

OpenAI成立NextGenAI联盟，联合15所顶尖研究机构，获5000万美元资助。联盟旨在利用AI技术推动科研突破和教育改革，成员包括多所知名高校和机构。资助项目涵盖医疗、能源、交通等领域，教育领域则着重于AI素养和模型创新。此举延续了OpenAI对教育的支持，旨在加速研究进展，培养新一代利用AI变革的机构。
来源：AIYUN

7.AI初创公司Cohere发布多模态开源模型Aya Vision

AI初创公司Cohere旗下的非营利性研究实验室发布多模态开源AI模型Aya Vision，包含Aya Vision 32B和Aya Vision 8B两个版本，具备多种功能，如为图像添加文字说明、回答关于照片的问题、进行文本翻译以及用23种主要语言生成摘要等。该模型训练采用了多样化的英文数据集，并通过合成标注训练，在使用较少资源的同时实现具有竞争力的性能。
来源：AIYUN

8.独家对话倪飞：AI一直未能驱动用户购买手机，直到它来了

本文是凤凰网科技《凤凰V现场》对中兴通讯高级副总裁、终端事业总裁倪飞的独家对话。倪飞认为AI将彻底改变手机行业，中兴通讯通过DeepSeek实现全民AI普及，主打多种模型混搭的组合拳，以提升用户体验。他还提到中兴的星云大模型并非只针对办公场景，而是通过多专家系统实现全能工具。在卫星通信方面，中兴已解决终端体积和续航难题，并与合作伙伴共同开发产品。
来源：凤凰网科技

9.大模型Token流量激增33倍！生成式AI或成未来网络流量的主力军

本文主要探讨了人工智能（AI）在中国市场带来的网络流量增长以及相关影响。华为高层在MWC2025期间透露，AI产生的Token流量在过去8个月内激增33倍，其中付费Token增长15倍，每Token价格下降97%。预计到2030年，Token日均网络流量将达500TB，远超当前90TB的全国移动网络流量。
来源：科创板日报

2025.3.4

1.智谱发布并开源了最新的图像生成模型CogView4

智谱技术团队于2025年3月4日发布并开源了最新的图像生成模型CogView4。该模型具备强大的复杂语义对齐和指令跟随能力，支持任意长度的中英双语输入以及任意分辨率图像生成，还具备较强的文字生成能力，是首个遵循Apache 2.0协议开源的图像生成模型。
来源：智谱

2.绕不开的AI！机器人、智能眼镜、AI萌宠在MWC齐登场

MWC 2025上人工智能成为焦点，众多企业加码AI布局。荣耀发布阿尔法战略，向AI终端生态公司转型，计划五年投入超100亿美元建生态，并推出多款新品。星纪魅族、联想等也展示多款智能产品。华为等企业强调更高效算力优化是AI产业发展重点，中兴、九章云极等展示算力基础设施方案。此外，宇树机器人、AI萌宠等吸引眼球，如宇树科技的机器人、大象机器人的AI陪伴玩具、珞博的口袋AI毛绒宠物等。
来源：科创板日报

3.德国电信计划年内推出 AI 手机：集成 Perplexity、谷歌等合作方 AI 服务

德国电信在MWC 2025巴塞罗那宣布，2025年内将推出集成Magenta AI平台的AI手机，为用户提供一站式AI体验，可作为“虚拟管家”满足多种需求，简化多项流程。用户可通过双击电源键或锁屏页面点击进入该平台，平台将导入Perplexity的AI助手，并计划新增谷歌Google Cloud AI、ElevenLabs、Picsart的服务。
来源：IT之家

4.通义灵码上新推理模型，快来体验数学和编程双冠王 Qwen2.5-Max

通义灵码上线了 Qwen2.5-Max 模型，该模型使用超过 20 万亿 token 的预训练数据及精心设计的后训练方案进行训练。在多项基准测试中，Qwen2.5-Max 的表现领先，包括 Arena-Hard、LiveBench、LiveCodeBench 和 GPQA-Diamond 等。在基座模型对比中，Qwen2.5-Max 也展现出显著优势。
来源：通义灵码

5.腾讯元宝升至App Store中国区免费下载榜第一超越DeepSeek

2025年3月3日，腾讯元宝升至中国区苹果应用商店免费App下载排行榜第一，超越DeepSeek。此前，腾讯元宝2月22日超越豆包排名升至第二，2月13日排名还在100名之外。2月13日，腾讯元宝宣布DeepSeek R1模型联网、满血上线，支持深度思考、逻辑推理和详细回答，同时也支持联网搜索信息。
来源：凤凰网科技

6.深度融合DeepSeek与有道翻译大模型，有道智云推出AI新产品语音同传

近日，有道智云发布全新产品“有道语音同传”，基于DeepSeek-R1和有道翻译大模型，提供多功能的语音同传服务，在不同语言的使用者之间实现即时沟通，可广泛应用于国际会议、商务谈判、教育培训、旅游导览等场景，提升跨语言交流的效率。
来源：36氪

7.中国信通院拟于 3 月 12 日举办 AI 眼镜产业推进专题研讨会

中国信通院拟于2025年3月12日在浙江大学计算机创新技术研究院举办“AI眼镜产业推进专题研讨会”。随着人工智能技术发展，AI眼镜迎来发展机遇，但产品质量、核心技术、应用场景、技术标准、隐私保护等问题亟待解决。会议旨在促进产业健康发展，加强企业交流合作，探讨产业发展趋势等关键问题。
来源：IT之家

8.《深圳市加快推进人工智能终端产业发展行动计划（2025—2026年）》的通知

深圳市工业和信息化局发布《深圳市加快推进人工智能终端产业发展行动计划（2025—2026年）》，旨在推动人工智能技术赋能智能终端产品，加快建设国际国内领先的人工智能终端产业集聚区。计划明确到2026年，产业规模达8000亿元以上、力争1万亿元，集聚不少于10家现象级企业，产品产量突破1.5亿台，推出50款以上爆款产品
来源：深圳市工业和信息化局

9.Podcastle推出AI文本转语音模型Asyncflow v1.0

Podcastle，一家专注于播客录制与编辑的平台，近日正式加入了AI文本转语音技术的竞争行列，发布了其自主研发的AI模型——Asyncflow v1.0。同时，该公司还面向开发者推出了API接口，以便他们能将这一文本转语音模型直接集成到各自的应用程序中。
来源：AIYUN

10.海螺视频发布图生视频模型I2V-01-Director，完善01-Director系列

近期，海螺视频平台正式上线了图生视频模型I2V-01-Director，该模型与此前推出的文生视频模型T2V-01-Director共同构成了01-Director系列。这一系列的发布标志着Video-01系列的圆满收官，同时预示着Video-02系列即将开启新的篇章。
来源：AIYUN

11.中信建投：AI教育奇点时刻来临

中信建投指出，AI变革教育到了临界点。学习是一个慢过程且具有反人性的特点，但每一轮技术革新都带来教育行业的重大变化。ChatGpt开启生成式AI时代，DeepSeek则大幅降低成本，AI教育蝶变在即
来源：科创板日报

12.“中国首个 AI IDE”字节跳动 Trae 国内版发布：配置豆包 1.5pro，可切换满血版 DeepSeek

字节跳动发布“中国首个 AI 原生集成开发环境（AI IDE）”Trae 国内版，配置 Doubao-1.5-pro，支持切换 DeepSeek R1、V3 模型。Trae 定位为“智能协作 AI IDE”，支持代码补全、理解、Bug 修复等功能，还搭载全新 Builder 模式，可基于自然语言生成代码。国内版针对中国开发场景优化，后续支持模型自定义
来源：IT之家

13.小红书AI搜索神器「点点」接入DeepSeek，我们拿它单挑百度

本文主要介绍了小红书旗下的独立AI搜索App「点点」接入DeepSeek R1后的情况。点点主打生活场景搜索，覆盖多种生活问题，其首页简洁，有预设问答场景和聊天搜索框，支持多模态输入。在接入DeepSeek R1后，点点的表现有亮点也有不足，如旅游攻略制作出色，但有时会出现错误回答等。
来源：机器之心

14.估值升至 615 亿美元，Anthropic 完成 35 亿美元 E 轮融资

2025 年 3 月 4 日消息，AI 模型企业 Anthropic 完成 35 亿美元 E 轮融资，估值升至 615 亿美元。本轮融资由 Lightspeed Venture Partners 领导，思科、Salesforce 投资部门参与。Anthropic 计划推进下一代 AI 系统开发，扩大计算能力，深化机制可解释性和对齐研究，加速国际业务扩张
来源：IT之家

15.Google发布旨在识别野生动物的人工智能模型SpeciesNet

Google开源了人工智能模型SpeciesNet，旨在通过分析相机陷阱照片识别动物物种。六年前，Google推出Wildlife Insights项目，提供平台让研究人员共享、识别和分析野生动物图像。SpeciesNet在大量图片上训练，可将图片分类到2000多个标签中。
来源：cnBeta

16.斯坦福大学推出免费AI工具Storm：高效生成研究报告

斯坦福大学的研究人员近期发布了一款面向研究人员的免费AI工具，名为Storm。该工具旨在快速生成具有维基百科水准的研究报告，且准确率高达99%，同时包含相应的引用信息。
来源：AIYUN

17.耶鲁、剑桥等高校联合推出 MindLLM 医疗行业 AI 工具，可将大脑磁共振成像数据转为直观文字信息

耶鲁大学、剑桥大学等高校联合推出MindLLM医疗AI工具，可将脑部功能性磁共振成像数据转化为文字，表现优于业界其他技术。该工具由fMRI编码器和大型语言模型组成，采用神经科学注意力机制，引入脑部指令调优方法，增强语义信息提取能力。测试显示其在多方面优于传统模型，未来有望发展成实时解码器，应用于神经控制等多领域，相关论文已发布在ArXiv上。
来源：IT之家