
2025.6.23
1.MiniMax“技术发布周”落幕:发布五款AI新品
6月23日,上海AI独角兽公司MiniMax“技术发布周”已结束,宣告其在基座模型、多模态技术和通用智能体Agent、视频Agent等领域有所突破。据MiniMax表示,从全球首个开源大规模混合架构推理模型MiniMax-M1、到实现极致物理表现的视频模型Hailuo-02、定义“靠谱”生产力的MiniMax Agent
来源:科创板日报
2.银河通用机器人完成新一轮 11 亿融资,宁德时代领投
6 月 23 日消息,银河通用今日宣布正式完成由宁德时代领投的 11 亿元人民币新一轮融资,两年累计融资超 24 亿元。本轮融资汇聚了宁德时代上市公司战投、溥泉资本 (CATL Capital)、国家开发银行国开科创、北京机器人产业基金、纪源资本等投资方。
来源:IT之家
3.模型即 Agent,Kimi-Researcher(深度研究)开启内测
Kimi-Researcher 是月之暗面推出的基于端到端自主强化学习技术训练的新一代 Agent 模型,专为深度研究任务设计。它能自主规划任务执行流程,包括澄清问题、深入思考、主动搜索和调用工具交付结果。其采用异步执行方式,输出高质量深度研究报告和动态可视化报告。
来源:Kimi
4.Meta推出售价399美元的AI驱动Oakley Meta HSTN智能眼镜
eta Platforms公司今天发布了一款名为Oakley Meta HSTN的智能眼镜,内置人工智能助手。这款设备是与运动眼镜制造商Oakley合作的成果。其母公司,总部位于米兰的Luxottica集团公司,也曾协助Meta打造其早期的Ray-Ban Meta系列AI智能眼镜。后者产品系列在二月份的销量已超过200万台。
来源:AIYUN
5.抖音上线AI饭搭子“探饭” 知情人士:目前仅支持小程序
6月23日电,有媒体报道称,字节跳动的用户增长团队做了一个名为“探饭”的AI产品,搭载的是豆包大模型,其开发公司为北京有竹居网络技术有限公司,经查询,为字节跳动的全资子公司。
来源:科创板日报
6.华为盘古大模型5.5问世!推理、智能体能力大爆发
在华为开发者大会 2025(HDC 2025)上,华为重磅发布了盘古大模型 5.5,其中自然语言处理(NLP)能力比肩国际一流模型,并在多模态世界模型方面做到全国首创。
来源:机器之心
2025.6.18
1.Gemini 2.5 AI全家桶三连发:Pro硬刚DeepSeek R1
Google Gemini 2.5 模型家族迎来更新,包含 Gemini 2.5 Flash-Lite 预览版上线、Gemini 2.5 Flash 更新及定价调整、Gemini 2.5 Pro 正式版上线三大亮点。Gemini 2.5 Flash-Lite 支持多模态输入、长上下文窗口等;Gemini 2.5 Flash 定价更实惠;Gemini 2.5 Pro 在多基准测试中超越多个竞争对手,在视频理解方面表现强劲。同时,模型更新为 Google DeepMind 带来流量增长。
来源:凤凰网科技
2.腾讯元宝上线 AI 编程模式:支持边修改代码边实时预览
2025年6月18日,腾讯元宝上线AI编程模式,用户可在电脑版选择DeepSeek V3模型并关闭深度思考后,通过输入“@AI编程”在双栏界面左侧生成代码,右侧实时预览并支持运行。该模式适用于教育、亲子场景,支持多种开发语言,无需配置环境,写完即运行。
来源:IT之家
3.Adobe Firefly 应用登陆 iOS 和 Android
Adobe 一直致力于吸引用户使用其平台来满足他们的 AI 需求。今年 4 月,该公司推出了一款重新设计的 Firefly Web 应用,让用户可以使用 Adobe 自己的 Firefly 图像和视频生成模型以及第三方模型。
来源:cnBeta
4.月之暗面推新开源模型 ,超越 DeepSeek-R1,登顶全球开源榜首
2025年6月17日,月之暗面团队推出开源代码大模型Kimi-Dev-72B,在SWE-bench Verified编程基准测试中以720亿参数量超越6710亿参数量的DeepSeek-R1,登顶全球开源模型榜首。其优势源于独特架构设计和训练优化,如BugFixer与TestWriter组合、大规模中期训练、强化学习阶段的多种策略等。
来源:凤凰网科技
5.OpenAI推出o3-pro模型,专注于可靠性,用户反馈褒贬不一
OpenAI推出了o3-pro,这是其最先进模型的新版本,旨在为复杂任务提供更可靠、深思熟虑的响应。现在,o3-pro已在ChatGPT的专业版和团队版用户以及API中可用,取代了早期的o1-pro。
来源:AIYUN
6.B站接入千问3,618期间商单成交效率提升5倍以上
B站已接入阿里大模型通义千问3(简称千问3)、VL等模型,用于打造数据洞察智能体InsightAgent,帮助“花火”和“必达”等商业平台提效。据悉在618期间,花火的商单成交效率提升5倍以上,必达的数据洞察效率提升3倍以上。
来源:科创板日报
2025.6.17
1.MiniMax 推出全球首个开源大规模混合架构的推理模型 M1
MiniMax 稀宇科技开源了首个大规模混合架构推理模型 M1,拥有 456B 参数,性能出色且性价比高。M1 训练高效,仅用 3 周、512 块 H800 GPU 完成强化学习训练,成本大幅降低。其支持 100 万上下文输入和 8 万 Token 推理输出,依托独创混合架构和强化学习算法 CISPO,算力效率优势显著
来源:IT之家
2.豆包上线“AI播客”功能,可一键生成自然语音
2025年06月17日,凤凰网科技报道豆包电脑版和网页版上线“AI播客”功能,可一键生成播客内容,语音效果自然,模拟真人播客口语习惯。豆包App已开启小流量测试,近期将全量上线。
来源:凤凰网科技
3.百度:推出首个多模态高度融合数字人
6月17日电,百度在“AI Day”开放日上宣布推出业界首个双数字人互动直播间,同时也是业内首个多模态高度融合数字人。据介绍,该技术基于文心大模型4.5T升级,实现了语言、声音、形象的协调一致。
来源:科创板日报
4.Meta 将推出 Oakley 品牌智能眼镜
Oakley 今天在社交媒体上分享了即将与 Facebook 母公司 Meta 合作推出的一款产品的预告,这款产品很可能就是今年早些时候传闻的 Oakley 品牌智能眼镜。
来源: cnBeta
5.阿里一口气开源32款Qwen3模型!全系适配苹果MLX
智东西6月17日报道,阿里昨日宣布正式开源Qwen3全系列32款MLX量化模型。MLX是一个专为苹果芯片深度适配的开源机器学习框架,可高效地训练和部署AI大模型。此次开源被推测意味着苹果智能(Apple Intelligence)在国内的推出指日可待。
来源:凤凰网科技
2025.6.16
1.OpenAI Codex 人工智能编程工具推出新功能:可一次生成多个方案
OpenAI 的 ChatGPT Codex 推出新功能,可为单一任务生成多个解决方案供用户选择。Codex 是 AI 编程工具,能帮开发者编写代码、分配任务。此次更新还添加了键盘快捷键、提高专业版等用户设置脚本时长限制、优化代码差异显示等,基于 codex-1 构建,需订阅 Plus 服务使用。
来源:IT之家
2.CVPR传来好消息,腾讯混元3D 2.1全链路开源
2025年6月14日,在CVPR 2025会议上,腾讯宣布开源混元3D 2.1大模型,这是首个全链路开源的工业级3D生成大模型。该模型在混元3D 2.0基础上,优化了几何生成质量,开放了PBR材质生成大模型,提升了3D资产的质感和光影表现。其全面开源为开发者、创作者和研究者提供了便利,降低了开发门槛,有望加速3D内容创作的普及。
来源:腾讯混元
3.首款保险业“Online Sales Agent”智能体发布
上海暖哇科技今日发布最新版面向保险行业的“Online Sales Agent”,该AI 智能体产品具备三大核心技术能力:全天候客户服务承接能力、全流程多轮交互沟通能力、自主推进任务与结果交付能力。 Online Sales Agent可独立完成从客户初步沟通、个性化产品推荐,到复购引导与续期服务的完整销售流程
来源:科创板日报
4.全球首发「司机智能体」|带上智能副驾,上路即⾃由
这是一篇关于百度地图发布“司机智能体”功能的宣传文章,旨在介绍该功能如何为司机提供智能辅助,提升驾驶体验和安全性,同时通过福利活动吸引用户参与互动。
来源:百度地图
5.a16z合伙人:AI正在重构消费范式,除了速度都谈不上护城河,真正的AI+社交仍未出现
文章主要探讨了 AI 对消费范式和社交模式的重构。从 Facebook 到 TikTok,传统社交演化以连接人为主,而如今 AI 工具如 ChatGPT 等正以“完成任务”取代“建立关系”成为产品主线,重塑内容生成方式、用户付费结构与产品变现路径。a16z 合伙人指出当前 AI 工具虽强大但缺乏社交结构,真正的 AI 原生社交系统未出现
来源:凤凰网科技
6.当大模型接入玩具 AI硬件与情绪消费殊途同归?
大模型巨头纷纷布局AI玩具领域,如OpenAI与美泰合作开发AI玩具和游戏,字节跳动火山引擎也展示了AI玩具应用成果。AI玩具具有交互、陪伴与教育三重能力,其需求向全年龄段辐射,有望成为玩具市场的核心催化剂。目前全球已有多款AI玩具面世且数据亮眼
来源:科创板日报
2025.6.12
1.翻译平台 DeepL 启用最新英伟达芯片,宣称短短 18 天就能“译遍整个互联网”
德国初创公司 DeepL 启用英伟达最新的 DGX SuperPOD 系统,使其能在 18 天内翻译整个互联网内容,远超此前的 194 天。DeepL 开发了自有的生成式 AI 模型,与谷歌翻译竞争。英伟达正拓展 AI 芯片客户群体。DeepL 希望借助更强算力推动研发团队打造更先进的模型,升级后的硬件将强化现有产品的能力。
来源:IT之家
2.夸克发布行业首个高考志愿大模型!
夸克APP于2025年6月12日发布行业首个高考志愿大模型,旨在高考出分前的志愿填报黄金期为考生提供专业服务。其推出全新高考知识库,通过夸克搜索为考生提供专业准确的大学、专业及志愿问题解答。同时,智能选志愿功能涵盖冲、稳、保多种填报策略,还可定制专属志愿报告,包含填报策略、志愿表及院校专业推荐说明,助力考生科学填报志愿。
来源:夸克
3.亚马逊商家将可在平台上用AI快速生成视频广告
亚马逊正在让卖家更轻松地在其平台上快速创建生成式人工智能广告,有时只需单击一下即可。亚马逊广告的视频生成器是一款免费的广告工具,去年以测试版的形式推出,现在增加了一些新功能,美国卖家通常可以使用它在五分钟或更短的时间内创建“逼真的视频资产”
来源:cnBeta
4.Meta发布J-VEPA 2 AI模型,通过视频理解世界
Meta发布了J-VEPA 2 AI模型,该模型通过视频理解物理世界,帮助机器人和AI代理在行动前进行思考和规划。它基于之前的J-VEPA工作,使AI能够构建物理世界的概念,预测行动后果,从而规划行动路线。这种世界模型减少了在现实世界中进行大量试验的需求,还可用于防止工作场所事故,帮助机器人执行任务。
来源:AIYUN
5.Meta 推出 AI 视频编辑功能:可轻松更换服装、场景、风格
2025 年 6 月 12 日,Meta 发布了一个全新的短视频编辑功能,灵感来源于其 Movie Gen AI 技术。该功能强大,用户可轻松改变视频中的服装、场景、风格等诸多元素,还可添加光影效果和色彩叠加。目前用户尚无法输入自定义提示词,但该功能将在今年晚些时候推出
来源:IT之家
6.中科蓝讯、实丰文化与字节豆包大模型合作开发AI智能玩具
在字节跳动火山引擎Force原动力大会上,中科蓝讯展示了与豆包大模型合作的AI玩具方案。双方基于对儿童智能硬件市场的洞察达成战略级合作,将豆包大模型的AI交互能力与中科蓝讯的WIFI IoT芯片AB6003G的连接性能进行了融合。
来源:科创板日报
7.上海市委网信办指导小红书、B站等平台清理违规AI产品营销信息
据“网信上海”微信公号,为贯彻落实中央网信办“清朗·整治AI技术滥用”工作部署,4月下旬以来,上海市委网信办聚焦6类突出问题深入开展第一阶段专项行动。现向社会公布阶段性工作成果,进一步凝聚共识,共同营造清朗网络生态。
来源:科创板日报
2025.6.11
1.豆包大模型升级1.6版,视频模型上新
字节跳动在火山引擎Force原动力大会上宣布豆包大模型升级至1.6版,推理、数学、指令遵循、Agent等能力大幅提升,在多个权威测评集中表现优异。同时,豆包·视频生成模型Seedance 1.0 pro和豆包·语音播客模型正式发布,前者可生成高品质视频,后者能生成自然播客内容,均已上线供用户体验。
来源:字节跳动
2.谷歌 AI 搜索功能被指冲击新闻出版商流量:未经许可提取内容 + 低链接率
谷歌的 AI 搜索功能,如 AI 概览工具和聊天机器人,因未经许可提取新闻内容且链接率低,导致新闻出版商流量大幅下降。《纽约时报》等出版商流量占比显著降低。谷歌声称 AI 概览提升搜索流量,但出版商面临威胁,正通过与 AI 公司合作等方式应对。
来源:IT之家
3.消息称搭载字节豆包大模型的老凤祥 AI 眼镜下月发布,聚焦老年群体
老凤祥与字节旗下火山引擎合作的 AI 眼镜预计 7 月发布,由豆包大模型提供技术支持,主要面向老年人群体,具备视觉理解、语音对话等功能。此前字节跳动已有推出自家 AI 智能眼镜的计划,正攻克电池续航与拍摄质量等技术难题,且在消费级硬件领域经验丰富,近年来不断加码 AI 硬件。
来源:IT之家
4.OpenAI发布o3-pro 其o3 AI推理模型的增强版
OpenAI 推出了 o3-pro,该公司声称这是迄今为止功能最强大的 AI 模型。O3-pro 是 OpenAI o3 的一个增强版本,o3 是该公司今年早些时候推出的推理模型。与传统的人工智能模型不同,推理模型会逐步解决问题,从而使其在物理、数学和编程等领域的表现更加可靠。
来源:cnBeta
2025.6.10
1.Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 展开竞争
法国 AI 初创公司 Mistral 将推出其首个推理模型 Magistral,与 OpenAI 和 DeepSeek 等竞争对手展开竞争。Magistral 能实现欧洲语言逻辑推理,突破美国模型仅限英语、中国模型仅限中文的局限。Mistral 今年还推出了 Mistral Small 3.1 和 Medium 3 等模型,性能出色且成本较低。
来源:IT之家
2.Hugging Face 公布 4.5 亿参数开源机器人模型 SmolVLA,消费级硬件设备即可运行
Hugging Face 公布了 4.5 亿参数开源机器人模型 SmolVLA,该模型具有高普适性,能在消费级硬件设备如 MacBook Pro 上运行,大大降低了开发者的入门成本。SmolVLA 采用“视觉 – 语言 – 行动”设计,通过多项优化技术提升性能,其训练策略包括预训练和微调,且引入“异步推理架构”提高实用性。
来源:IT之家
3.Cursor 创始人复盘:AI 编程工具本质是提升人类指令表达能力,持续构建优秀产品才是壁垒
Cursor 是一款由 AnySphere 联合创始人兼 CEO Michael Truell 构建的 AI 编程产品,上线 20 个月实现 1 亿美元年化经常性收入,两年增长至 3 亿美元。其成功源于对软件开发流程的重构与再定义,而非单纯提升代码生成能力。Michael 认为未来开发方式将是多形态并存,代码不会被完全取代,人们将以接近自然语言的方式表达软件功能设想,系统转化为程序逻辑。
来源: 有新Newin
2025.6.9
1.ChatGPT 的高级语音模式获得重大更新 听起来更自然
OpenAI 去年推出了GPT-4o,同时带来了高级语音模式。该功能使用原生多模态模型(例如 GPT-4o),最快可在 232 毫秒内响应音频输入,平均响应时间为 320 毫秒,与人类在典型对话中的响应时间相似。它还可以生成更自然的音频,捕捉非语言线索(例如说话速度),并表达情感。
来源:cnBeta
2.字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
字节跳动Seed团队发布图像编辑模型SeedEdit 3.0,已在即梦网页端开启测试,豆包App也即将上线。该模型基于文生图模型Seedream 3.0,通过数据融合方法与特定奖励模型,解决了图像编辑中主体与背景保持、指令遵循等难题,在人像编辑、背景更改等场景表现突出
来源:IT之家
3.美团发布国内首个酒店商家AI工具“美团既白” 可预知客人潜在需求
2025年6月8日,在美团住宿生态伙伴大会上,美团发布了国内首个酒店商家端AI工具“美团既白”。该工具旨在从高效获客、长效经营、重塑服务三方面助力酒店商家,通过整合本地活动实时数据、历史预订曲线等生成动态经营建议,还能自动识别客人历史偏好并记录特色需求,结合当日天气、交通信息等响应个性化诉求,可为酒店管理者节省大量时间。
来源:凤凰网科技
4.Cudis押注可穿戴设备、人工智能和Solana代币推动长寿运动
Cudis是一家总部位于洛杉矶的可穿戴设备开发商,成立于2023年,致力于通过健康追踪和奖励机制延长寿命。其最新举措包括推出基于Solana的代币CUDIS,通过AI智能戒指和长寿应用程序奖励用户养成更好的健康习惯。智能戒指可追踪关键健康指标,并与配套应用程序同步,提供个性化健康见解。CUDIS代币可质押提升健康收益、访问高级服务等,且注重用户隐私保护
来源:AIYUN
5.谷歌称其更新的Gemini 2.5 Pro AI模型在编程方面表现更佳
谷歌更新了其Gemini 2.5 Pro AI模型,声称该模型在编程任务上表现更出色。此次更新是基于之前的版本进行的改进,谷歌表示该模型在编程基准测试中处于领先地位,并在数学、科学、知识和推理能力的测试中表现出色。此外,谷歌还根据反馈提升了模型的风格和结构,使其能够提供更具创意的响应。
来源:AIYUN
6.面壁智能发布端侧大模型MiniCPM 4.0
面壁智能6月6日晚发布端侧大模型MiniCPM 4.0。该公司称新模型通过自研CPM.cu推理框架,在极限场景下实现最高220倍提速,常规5倍提速,支持在vLLM、SGLang、LlamaFactory等框架部署。
来源:科创板日报