2025年1月AI快讯

AI每日新闻6个月前更新 AI-77

0 70

2025.1.31

1.英伟达：DeepSeek R1有最先进推理能力，现已上架NVIDIA NIM

据英伟达官网最新消息，为了帮助开发人员安全地试验这些功能并构建自己的专用代理，6710亿参数的DeepSeek-R1模型现已作为NVIDIA NIM微服务预览版在Build.nvidia.com上提供。
来源：凤凰网科技

2.OpenAI最新融资目标估值最高达3400亿美元

知情人士透露，软银的确正在主导这一轮OpenAI的融资，出资规模介于150亿-250亿美元之间。而这轮融资的规模将达到400亿美元，使得OpenAI的估值最多膨胀到3400亿美元。
来源：科创板日报

3.Ai2 称其新型人工智能模型击败了 DeepSeek

本周四，Ai2- 一家位于西雅图的非营利性人工智能研究机构发布了一个模型，声称其性能优于DeepSeek V3 – 这是中国人工智能公司 DeepSeek 的领先系统之一。
来源：cnBeta

4.微软向所有 Copilot 用户免费提供 OpenAI 的 o1 推理模型

微软本周将为所有 Copilot 用户带来 OpenAI 的 o1 推理模型。不再需要订阅每月 20 美元的 Copilot Pro 或 ChatGPT Plus 计划就能获得它，因为微软将免费向所有 Copilot 用户提供它。
来源：cnBeta

5.美国国会办公室被警告不要使用DeepSeek

路透社1月30日援引美国阿克西奥斯新闻网站的报道称，美国众议院首席行政事务官向国会办公室发出通知，警告国会办公室不要使用中国的人工智能应用DeepSeek（深度求索）的服务。
来源：科创板日报

2025.1.30

1.能思考会搜索的国产大模型，全网疯测的 DeepSeek 牛在哪？

文章主要介绍了国产大模型DeepSeek的性能、技术优势以及发展动态。DeepSeek-V3在评测中表现优异，其推理模型DeepSeek-R1性能对标OpenAI的o1模型，且开源免费，还能联网搜索。DeepSeek采用MoE混合专家模型降低成本，使用RL强化学习提升推理能力。
来源：IT之家

2.中国AI新星DeepSeek引发全球关注，OpenAI质疑其模型来源

近日，中国人工智能公司DeepSeek凭借一款价格低廉且性能卓越的人工智能模型，在全球范围内引起了巨大轰动。然而，这一创新成果却引发了OpenAI的质疑，后者怀疑DeepSeek的模型可能基于其数据开发而成。
来源：AIYUN

3.微软宣布为Win11用户优化DeepSeek-R1模型，让Copilot+PC实现本地化AI推理

微软宣布为 Win11 用户优化 DeepSeek-R1 模型，使其能在搭载特定芯片的 Copilot+ PC 上实现本地化 AI 推理。DeepSeek-R1 已在 Azure AI Foundry 和 GitHub 上提供，首个版本 DeepSeek-R1-Distill-Qwen-1.5B 将在 AI Toolkit 中提供，7B 和 14B 版本也将推出。
来源：凤凰网科技

4.报道称软银正在洽谈向 OpenAI投资250亿美元的事宜

据英国《金融时报》报道，软银（SoftBank）正在洽谈向 OpenAI 投资高达 250 亿美元，作为更广泛合作的一部分，这间日本企业集团可能会与这家微软支持的初创公司在人工智能项目上投入 400 多亿美元。
来源：cnBeta

5.Meta表态将”大力”投资人工智能甚至长期投资”数千亿美元”

Meta公司首席执行官马克·扎克伯格在2025年第一季度财报电话会议上表示，Meta将大力投资人工智能，甚至长期投资数千亿美元。尽管市场因DeepSeek的人工智能模型可能挤压GPU需求而陷入恐慌，但Meta并未退缩。
来源：cnBeta

6.鲍威尔：人工智能是股市发展的重要因素但美联储更关注宏观经济

财联社1月30日电，美联储主席鲍威尔表示，人工智能是股市发展的重要因素，但美联储更关注宏观经济。人工智能行业引发的抛售并不是一个实质性的、持续的变化。
来源：财联社

7.OpenAI称有DeepSeek「偷窃」证据？美军已发起攻击！Anthropic CEO喊话加强芯片管制

他们急了！特朗普的AI沙皇和微软纷纷指控DeepSeek「偷窃」数据，DeepSeek不断遭受来自美国IP的不间断大规模攻击。Anthropic CEO更是发出檄文：再不加强对中国的芯片管制，就来不及了！
来源：新智元

2025.1.29

1.DeepSeek有望激发新一波人工智能创新浪潮

中国人工智能(AI)企业深度求索(DeepSeek)日前发布其最新开源模型DeepSeek-R1，用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖，其影响波及资本市场。
来源：科创板日报

2.里云通义千问旗舰版模型Qwen2.5-Max升级发布

01月29日大年初一，阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果，预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能，在多项公开主流模型评测基准上录得高分，全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。
来源：36氪

3.DeepSeek遭美国IP网攻暴力破解

1月29日消息，深度求索（DeepSeek）官网显示，其线上服务受到大规模恶意攻击，据专家介绍，DeepSeek这次受到的网络攻击，IP地址都在美国。
来源：钛媒体

4.软银将以40亿美元估值投资机器人初创公司Skild AI

财联社1月29日电，软银据悉正在洽谈对机器人初创公司Skild AI进行5亿美元投资，这家公司目前估值已达到40亿美元（当前约290.61亿元人民币）。
来源：科创板日报

2025.1.28

DeepSeek除夕炸场！开源多模态模型发布，仅128颗A100训练，英伟达市值减4.3万亿

DeepSeek在除夕发布了开源多模态人工智能模型Janus-Pro，该模型拥有10亿和70亿参数规模，仅使用128颗英伟达A100进行训练1周。Janus-Pro在多模态理解基准MMBench上取得了79.2的分数，超越了Janus、TokenFlow等最先进的统一多模态模型，和MetaMorph。
来源：钛媒体

2.一岁半“出道” 宇树详解春晚扭秧歌的人形机器人Unitree H1

在今日晚间的 2025 央视春晚中，著名电影导演张艺谋携手杭州宇树科技、新疆艺术学院带来了一个名为《秧 BOT》的节目。人形机器人穿着花坎肩，拿着手绢扭秧歌，看起来十分喜感，甚至还能“0 帧起手转手绢”。
来源：凤凰网科技

3.特朗普：DeepSeek给美国敲响警钟，如果真便宜我们也会效仿

据路透社报道，美国总统唐纳德·特朗普周一表示，中国初创公司 DeepSeek 的技术应该对美国公司起到激励作用，并表示中国公司找到一种更便宜、更快捷的人工智能方法是件好事。
来源：凤凰网科技

2025.1.27

1.DeepSeek超越ChatGPT 登顶苹果美国区免费APP下载排行榜

国产大模型公司杭州深度求索开发的DeepSeek应用在2025年1月27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜，超越了ChatGPT。DeepSeek来自量化巨头幻方量化旗下大模型公司，其推理大模型DeepSeek-R1于1月20日正式发布，凭借“物美价廉”的特性在海外开发者社区引发轰动
来源：科创板日报

2.中国电信发布“复杂推理大模型”TeleAI-t1-preview

中国电信人工智能研究院（TeleAI）“复杂推理大模型”TeleAI-t1-preview正式发布。TeleAI-t1-preview使用了强化学习训练方法，通过引入探索、反思等思考范式，提升模型在数学推导、逻辑推理等复杂问题的准确性。
来源：科创板日报

3.开源全模态模型Baichuan-Omni-1.5上线，多项能力跑赢GPT-4o mini

百川大模型团队于2025年1月26日上线了Baichuan-Omni-1.5开源全模态模型，该模型在视觉、语音及多模态流式处理等方面表现优于GPT-4o mini，尤其在多模态医疗应用领域优势突出。通过完善的数据处理和多阶段训练流程，Baichuan-Omni-1.5解决了多模态模型的“模型降智”难题，实现了理解与生成的统一
来源：百川大模型

4.全球首个港口服务类大模型方舟 TaaS 开启公测，支持智能规划路线并估算费用

山东港口青岛港与山东港口科技集团共同打造的全球首个港口服务类大模型——方舟TaaS大模型正式开启公测。该模型覆盖六大核心应用场景，包括智能规划运输路线、估算费用、提供业务咨询和港区导航、船舶动态问询、政策法规智能问答、货物编码匹配及通关流程解答
来源：IT之家

5.阿里巴巴发布Qwen Chat v0.2及Qwen2.5-1M开源语言模型

2025年1月26日，阿里巴巴正式推出了其AI平台Qwen Chat的更新版本v0.2，并同时发布了最新的开源语言模型Qwen2.5-1M系列。此次更新标志着阿里巴巴在多模态AI工具开发方面取得了重要进展。
来源：AIYUN

6.AI语音克隆公司ElevenLabs完成2.5亿美元C轮融资，估值达30亿

合成语音初创公司Eleven Labs近期成功完成了2.5亿美元的C轮融资，使其估值达到30亿至33亿美元之间。本轮融资由ICONIQ Growth领投，早期投资者Andreessen Horowitz也参与其中。
来源：AIYUN

2025.1.24

1.OpenAI推出可自主执行任务的人工智能代理Operator

OpenAI 首席执行官 Sam Altman 在一篇博客文章中表示，2025 年将是人工智能代理的重要一年，这些代理可以自动执行任务并代表您采取行动。现在，我们看到了 OpenAI 的第一次真正尝试。
来源： cnBeta

2.国内首个全场景深度思考模型Baichuan-M1-preview发布

百川智能发布了国内首个全场景深度思考模型Baichuan-M1-preview。该模型是国内目前唯一同时具备语言、视觉和搜索三大领域推理能力的模型。在数学、代码等多个权威评测中，Baichuan-M1-preview的表现均超越了o1-preview。
来源：36氪

3.1万亿元！提供专项综合金融支持助力人工智能产业链发展

根据《中国银行支持人工智能产业链发展行动方案》，中国银行计划未来五年为人工智能全产业链各类主体提供合计规模不低于1万亿元专项综合金融支持，其中股、债合计不低于3000亿元，同时建立与人工智能技术创新相适配的专项制度保障，服务产业链各环节金融需求。
来源：中国人民银行

4.商务部：2025年将升级商品消费稳住消费大盘，推动“人工智能+消费”

商务部副部长盛秋平表示，2025年将升级商品消费稳住消费大盘，推动“人工智能+消费”。2025年是“十四五”规划收官之年，中央经济工作会议提出大力提振消费、全方位扩大国内需求。商务部将协同推进提振消费专项行动，推出更多务实有效的政策举措，包括升级商品消费、扩大服务消费、培育新型消费、创新消费场景等。
来源：钛媒体

5.特朗普签署加密货币、人工智能相关行政措施

1月24日消息，美国总统特朗普表示，他签署了与加密货币和人工智能相关的行政措施。特朗普签字时白宫人工智能和加密货币总管David Sacks也在场。Sacks是风险投资家和政治捐赠者。有关上述措施行动的详情暂未公之于众。
来源：钛媒体

6.Hugging Face开源新型轻量级视觉语言模型SmolVLM-256M

Hugging Face开源了新型轻量级视觉语言模型SmolVLM-256M，它参数少，能在消费级设备上运行，支持WebGPU技术可在浏览器运行，能处理多种视觉数据任务。其采用新编码器，基于SigLIP算法，参数少且能高分辨率处理图像。训练时使用改进数据集，加入手写数学表达式等提升性能
来源：AIYUN

7.Perplexity 推出 Android 助手应用

人工智能搜索引擎 Perplexity 推出了名为 Perplexity Assistant 的 Android 助手应用。该应用可执行多应用程序操作，如叫车、搜索歌曲等，还能通过网络访问完成创建日历条目提醒事件等操作，且是多模态的，能利用手机摄像头回答问题，并保持操作上下文。
来源：cnBeta

8.ChatGPT 用户可免费体验 o3-mini，付费用户将获得更多额度

OpenAI CEO 阿尔特曼宣布，ChatGPT 免费用户可体验 o3-mini，付费用户享更多额度。o3-mini 是新推理 AI 模型，计划几周内推出，含 API 和 ChatGPT 选项，旨在让高级推理 AI 更易用实惠。o3 系列大模型在 12 Days of OpenAI 活动上登场，其推理能力接近通用人工智能（AGI），o3-mini 自去年 12 月 21 日内测，现宣布开放。
来源：IT之家

9.跃问App上新创意板功能可自制应用或游戏

《科创板日报》24日讯，阶跃星辰旗下的AI工具跃问上线“创意板”功能，用户可以通过简单的指令，让AI为其生成游戏、应用、海报图片、趣味游戏、互动网页、可视化图表等。这个功能无需用户具备代码知识，也不需要长时间等待，极大地降低了创作门槛。
来源：科创板日报

10.秘塔AI上线阅读模式提升文献阅读体验

《科创板日报》24日讯，秘塔AI上线“阅读模式”，旨在提升用户在手机上阅读PDF文献的体验。该模式利用智能渲染技术，能够清晰排版各种格式的PDF，包括多列文字和图表混排，可识别复杂公式。此外，用户还可以使用全文翻译功能，支持英文及小语种的沉浸式翻译，可方便阅读外文文献。
来源：科创板日报

2025.1.23

1.Adobe Premiere Pro新测试版惊艳亮相：增加AI搜索功能

Adobe在圣丹斯电影节上发布了Adobe Premiere Pro新测试版，引入AI技术，通过媒体智能和搜索面板功能，帮助编辑者快速找到素材，提高效率。新版本支持字幕翻译，覆盖17种语言，并计划增加更多语言选项。Adobe After Effects测试版性能提升，新增PQ和HLG视频HDR监控功能。
来源：AIYUN

2.华为春节将推出小艺APP，包含多种智能体

钛媒体App 1月23日消息，华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东日前在视频中透露，华为春节将推出小艺APP，包含多种智能体。
来源：钛媒体

3.智谱自主操作电脑的多模态Agent推出“深度思考”模式

1月23日消息，智谱宣布，其自主操作电脑的多模态Agent——GLM-PC自2024年11月29日发布GLM-PC v1.0并开放内测以来，最新推出“深度思考”模式，并增加专用来做逻辑推理和代码生成的功能。此外，智谱也提供了对Windows系统的支持。
来源：钛媒体

4.Step-Video 开年震撼升级：更强大的真实世界模拟器来了！

相比去年发布的 Step-Video V1，V2 版本模型参数量更多，语义理解和指令遵循能力都有大幅提升，在复杂运动、美感人物、视觉想象力、基础文字生成、原生中英双语输入和镜头语言等方面具备更强的生成能力。这些提升，源于我们在 VAE 模型、DiT架构与强化学习、以及多模态大模型与视频知识库应用上的持续积累和创新。
来源：阶跃星辰

5.在头部大模型厂商带动下 AI眼镜、AI玩具等新型智能终端将迎来落地良机

民生证券表示，展望未来，云厂商从模型训练、到ASIC算力建设、再至端侧应用落地，将全面引领AI产业发展。随着字节等AI公司与各领域硬件厂商持续加深合作，看好在头部大模型厂商带动下，智能对话、儿童早教等多样化创新应用将持续涌现，AI眼镜、AI玩具等新型智能终端迎来落地良机，品牌厂商和供应链企业都将受益于此轮AI浪潮。
来源：科创板日报

6.谷歌向人工智能公司Anthropic再投资10亿美元

Alphabet Inc.旗下谷歌向人工智能AI开发商Anthropic进一步投入10亿美元，提高对这家颇有前途与OpenAI一较高下公司的持股。一位知情人士透露了这一消息，此前谷歌已经投资超过20亿美元。谷歌与Anthropic签订了一份商业协议，涵盖使用一套在线工具和服务。亚马逊是这家公司最大支持者之一。
来源：科创板日报

2025.1.22

1.豆包大模型1.5正式发布，全面上线火山方舟

豆包大模型1.5正式发布并上线火山方舟。Doubao-1.5-pro模型综合能力显著增强，在多个权威测评基准上优于业界一流模型，达到全球领先水平。Doubao-1.5-lite在轻量版语言模型中也处于全球一流水平。Doubao-1.5-vision-pro在多模态数据合成等方面升级，表现全球领先
来源：火山引擎

2.有道子曰-o1推理模型正式发布！消费级显卡即可部署

网易有道于2025年1月22日发布并开源国内首个输出分步式讲解的推理模型“子曰-o1”，作为14B轻量级单模型，其支持在消费级显卡上部署，采用思维链技术，具备强逻辑推理能力与高解题准确性，还提供中文逻辑推理。
来源：网易有道

3.规模或达5000亿！特朗普揭幕“星际之门”AI基建计划

美国新任总统特朗普在白宫宣布了“星际之门”人工智能基础设施投资计划，OpenAI、软银和甲骨文三家公司最初将投入1000亿美元，未来四年增加至5000亿美元，项目从得克萨斯州数据中心开始。消息导致美股芯片板块和核电概念股走强。
来源：科创板日报

4.Mistral AI 计划进行首次公开募股

法国人工智能实验室Mistral计划进行首次公开募股（IPO）。联合创始人兼首席执行官亚瑟 – 门施表示，公司计划在新加坡开设办事处，专注于亚太地区，并在欧洲和美国发展。Mistral由门施与Google DeepMind和Meta的前研究人员于2023年共同创办，被视为欧洲对美国OpenAI等公司的回应
来源：cnBeta

5.AI叠加“两新”拉动需求，PCB公司抢抓产业升级机遇

本文主要介绍了PCB行业在2024年的发展情况以及2025年的展望。2024年第二季度起，PCB市场需求回暖，产品价格回升。2024年有13家PCB公司发布业绩预告，6家预计盈利，8家实现业绩同比增长。2025年，端侧AI加速落地，AI手机、AI眼镜等可穿戴设备有望加速放量，云侧AI需求持续增长，行业将进入良性循环
来源：钛媒体

6.Perplexity推出Sonar API服务，拓展生成式AI搜索工具应用

Perplexity公司推出Sonar API服务，助力企业和开发者将生成式AI搜索工具集成到自有应用中。该服务分基础版和经济版Sonar Pro，支持自定义信息来源。Sonar已应用于Zoom视频会议平台，提供实时AI助手功能。Sonar有望成为Perplexity新的收入增长点，其API价格在市场上具有竞争力。Perplexity近期融资7360万美元，公司估值约5.2亿美元。
来源：AIYUN

7.Runway全面开放新文生图模型Frames

日前文生视频模型平台Runway首次展示了全新文生图片模型Frames。Frames不仅能够保持风格的一致性和可控性，还允许用户进行广泛的创意探索，能生成复古、数码、杂志、动态、运动、拼图等不同类型风格的图片。但那个时候Frames仅向高级用户提供使用。Runway已经向所有用户开放了Frames使用权，可以在其官网使用该工具。
来源：科创板日报

2025.1.21

1.清影2.0重磅更新，模型能力大幅提升

清影2.0是一款AI生视频工具，其模型结构、训练方法和数据工程全面更新，使图生视频基础模型能力提升38%。它支持画面主体大幅度运动并保持稳定，指令遵从能力强，能理解和实现复杂提示词。此外，清影2.0可驾驭多种艺术风格，画面美感大幅提升。目前，清影2.0已上线智谱清言，用户可免费试用。
来源：智谱

2.k1.5 新模型登场：Kimi 如何做到满血版多模态o1水平

本文介绍了 Kimi 的 k1.5 多模态思考模型，该模型实现了 SOTA 级别的多模态推理和通用推理能力，在 short-CoT 模式下大幅超越全球范围内短思考 SOTA 模型，在 long-CoT 模式下达到长思考 SOTA 模型 OpenAI o1 正式版的水平。同时，Kimi 首次公开了模型训练技术报告，分享了模型设计和训练的关键要素。
来源：月之暗面

3.DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

2025年1月20日，深度求索公司正式发布DeepSeek-R1模型并开源模型权重，遵循MIT License，允许用户通过蒸馏技术借助R1训练其他模型。DeepSeek-R1上线API，开放思维链输出，官网与App同步更新。该模型在后训练阶段大规模使用强化学习技术，在极少标注数据下，推理能力大幅提升，在多项任务上性能比肩OpenAI o1正式版
来源： DeepSeek

4.欧莱雅业内首创化妆品 AI 基础模型，与 IBM 合作开发

IBM与欧莱雅合作开发化妆品AI基础模型，利用IBM的生成式人工智能技术，帮助欧莱雅使用可持续原材料，减少能源和材料浪费。该模型基于大量配方和成分数据点创建，将辅助欧莱雅全球4000多位研究人员进行新产品配方、现有产品重新配方和规模化生产优化，助力欧莱雅实现“2030承诺”，为全球消费者打造多元、个性化的可持续产品。
来源：IT之家

5.字节跳动发布面向海外的AI 中文开发环境IDE

字节跳动正式发布面向专业开发者提供服务的全新AI Coding产品,Trae(trae.ai），实现了从Copilot向Autopilot的演进。据了解，Trae由字节跳动旗下新加坡公司SPRING(SG)PTE.LTD.提供服务,支持AI问答、代码自动补全、基于Agent的AI编程等功能
来源：钛媒体

6.飞算科技发布完整工程代码生成的AI开发助手“飞算JavaAI”

1月21日消息，飞算科技宣布完整工程代码生成的AI开发助手飞算JavaAI正式上线。据了解，飞算JavaAI实现了在需求分析、软件设计、工程代码生成等环节的全程智能引导，帮助开发者快速完成项目开发。
来源：钛媒体

2025.1.20

1.商汤「日日新融合大模型交互版」开放商用，限时免费！

商汤科技推出“日日新”融合大模型交互版（SenseNova-5o），正式对外提供实时音视频对话服务，且限时免费。该模型具备强大的实时交互、视觉识别、记忆思考、持续对话和复杂推理等能力，能优化人机交流体验。它拥有卓越的记忆能力，支持超长多模态交互记忆
来源：商汤科技

2.豆包实时语音大模型上线即开放！情商智商双高

豆包实时语音大模型于2025年1月20日正式推出并在豆包APP全量开放，用户升级至7.2.0版本即可体验。该模型是语音理解和生成一体化的端到端语音对话系统，主要面向中文语境，具备低时延、可随时打断等特性，在语音表现力、控制力、情绪承接方面表现惊艳，整体满意度较GPT-4o有明显优势
来源：豆包大模型团队

3.阶跃星辰语言模型上新：既有文学大师，又有性价比之王

阶跃星辰语言模型推出新版本，包括极速响应且高性价比的Step-2 mini和创作能力强大的Step-2文学大师版。Step-2 mini以3%的参数量保留了Step-2 80%以上的性能，拥有更快的生成速度和极高的性价比，采用新型注意力机制架构节省了大量缓存开销。
来源：阶跃星辰

4.全球首个亿级参数量地震波大模型今年对外开放

全球首个亿级参数量地震波大模型“谛听”于2025年1月17日在国家超级计算机成都中心发布第三阶段测试版本，并成功应用于西藏定日6.8级地震数据处理。该模型由国家超级计算成都中心、中国地震局地球物理研究所及清华大学联合开发，2025年将开放微调、推理框架和配套数据处理流程，供用户在超算平台使用，短期应用于地震信号识别等领域，长期助力地震学观测数据理解。
来源：IT之家

5.Meta宣布推出名为Edits的视频剪辑应用替代下架的CapCut

Instagram 主管 Adam Mosseri 刚刚宣布了一款名为 Edits 的视频编辑应用。并表示该应用旨在与 CapCut 竞争，后者是一款与 TikTok 一起下线的视频编辑应用。 Edits 可在 iOS 应用商店预购。
来源：cnBeta

6.人工智能搜索引擎公司Perplexity提交与TikTok美国业务合并申请

人工智能搜索引擎公司Perplexity AI向TikTok母公司字节跳动提交了合并申请，欲创建由Perplexity、TikTok U.S.和新资本合作伙伴组成的新实体。新实体将使字节跳动现有投资者保留股权，Perplexity获得更多视频。此前字节跳动曾表示不售TikTok美国业务，此次是合并而非出售，且公允价格或超500亿美元
来源：DONEWS

7.微软在Windows 11 Insider测试版中试验AI驱动的搜索功能

微软在Windows 11 Insider测试版中试验AI驱动的搜索功能，该功能利用语义索引技术，使用户能用自然语言搜索本地文件，目前支持Windows设置及JPEG、PNG、PDF、TXT和XLS等格式文件，且仅限于用户选择索引的位置，未来将扩展至云服务数据。
来源：AIYUN

8.山姆·奥尔特曼爆料：OpenAI即将推出o3-mini

为了在人工智能技术竞赛中保持领先地位，OpenAI现已准备好推出其最新的人工智能模型——o3-mini。OpenAI首席执行官Sam Altman在一篇博文中确认，公司已经完成了最新推理人工智能模型o3-mini的第一个版本，并将在经过外部安全研究人员的测试后，于几周内正式发布。
来源：AIYUN

9.国家AI产业投资基金成立，出资额600.6亿元

1月20日消息，企查查App显示，1月17日，国家人工智能产业投资基金合伙企业（有限合伙）成立，出资额600.6亿元，经营范围包含：以私募基金从事股权投资、投资管理、资产管理等活动。企查查股权穿透显示，该企业由国家集成电路产业投资基金三期股份有限公司（简称“大基金三期”）、国智投（上海）私募基金管理有限公司共同出资。
来源：钛媒体

10.小红书AI翻译加急上线，网友评论区玩起Prompt，背后模型被扒

小红书上线 AI 翻译功能，网友盛赞。它不仅能翻译多种语言，还能翻译颜文字、网络热梗、化学式、摩斯电码等。用户可向其提 Prompt，如要求输出 emoji 或翻译成其他语言等，但部分功能不稳定。该功能背后模型被扒，有智谱清言和 GPT – 4 的输出，有猜测其用 GPT 数据蒸馏
来源：量子位

2025.1.17

1.用 AI 打假 AI，腾讯上线大模型检测工具

腾讯推出AI生成文本检测和AI生成图像检测工具，以应对AI应用成熟带来的信任危机。其图片检测系统通过捕捉真实图片与AI生图的差异，如不符合常识逻辑、需“加水印”、含隐层特征等，利用140万份样本训练，测试检出率超95%。文本检测系统则通过海量数据学习，对比检测文本与大模型预测内容重叠度，涵盖多种文体，还在持续优化中。
来源：IT之家

2.字节跳动豆包推出全新AI编程功能，助力开发者高效编码

字节跳动旗下豆包于2025年1月16日上线全新AI编程功能，该功能支持一键上传本地代码文件和实时引入GitHub开源仓库，无需逐段复制代码。新代码编辑器支持沉浸式阅读，可精准圈选代码片段进行操作。豆包还提供编程语言自学引导，帮助用户生成、解释、修复和优化代码，助力开发者高效编码。
来源：DONEWS

3.利用深度学习工具科学家设计出抗致命蛇毒蛋白质

《自然》杂志报道了一项计算生物学研究成果：华盛顿大学医学蛋白质设计研究所和丹麦技术大学科学家领导研究团队利用深度学习工具，设计出一种新型蛋白质，能与致命的眼镜蛇毒素结合并使其失效。
来源：科创板日报

4.法律AI初创公司Harvey估值将翻倍至30亿美元

1月17日消息，据彭博社报道，据知情人士透露，红杉资本正在洽谈牵头为 Harvey 进行 3 亿美元融资，Harvey 是一家总部位于旧金山的初创公司，为律师事务所开发生成式人工智能工具。其中一位知情人士表示，此轮融资对该公司的估值为 30 亿美元。
来源：凤凰网科技

5.阿里AI To C再变阵：天猫精灵与夸克融合，将探索AI眼镜

阿里AI To C布局调整持续进行，智能互联事业群由吴嘉统管，天猫精灵与夸克融合，探索AI眼镜等新硬件方向。此前，阿里已将AI应用“通义”团队划入智能信息事业群。此次调整旨在整合To C大模型业务，建立从内容到AI应用再到AI硬件的完整链条，推动大模型业务创新迭代，提升天猫精灵业务重视度。
来源：凤凰网科技

6.三星将与OpenAI合作开发”AI电视”

三星电子正在与 ChatGPT 的创建者 OpenAI 合作开发人工智能电视。这标志着三星的战略，即在竞争日益激烈的电视市场中保持领先地位，而中国的低成本电视品牌正日益占据主导地位。三星希望将 OpenAI 的力量融入电视，进一步巩固其作为世界顶级电视品牌的主导地位–这一头衔它已连续保持了 19 年。
来源：cnBeta

7.Black Forest Labs发布FLUX Pro Finetuning API，推动AI图像生成定制化

近期，Black Forest Labs在开源AI图像生成领域崭露头角，其提供的模型质量甚至超越了其创始人曾供职的Stability AI。此前，该公司的产品还短暂成为xAI的Grok语言模型中的默认图像生成器。
来源：AIYUN

2025.1.16

1.马斯克 xAI 再放大招：网页版 Grok 上线，无需 X 账户

埃隆・马斯克旗下 xAI 公司推出网页版 Grok AI 聊天机器人，用户无需 X 账户即可体验其功能，包括实时信息收集、获取问题答案、生产图像等。网页版提供多种模式切换，登录有免费计划限制，还有临时模式等特色功能。
来源：IT之家

2.国产视频生成大模型 Vidu 2.0 上线：10 秒即可“出片”

国产AI视频生成平台Vidu发布2.0版本，其生成4秒512P单片段视频时间在10秒内，生成单秒视频仅需4分钱，还实现了效果升级，提供错峰模式，支持一次性生成4条素材，但目前不支持文生视频功能。Vidu中国站点同步上线，针对国内用户优化。
来源：IT之家

3.OpenAI 测试仅用电话号码完成 ChatGPT 注册

OpenAI 已经开始测试一项功能，可让新加入的ChatGPT用户只需电话号码即可注册，无需电子邮件。软件工程师 Tibor Blaho 发现了这一新增功能。该功能目前正在美国和印度进行测试。不过，也有一些限制。
来源：cnBeta

4.阶跃星辰推理模型Step R-mini上线

1月16日消息，阶跃星辰自研推理模型Step Reasoner mini上线。据介绍，这是Step系列模型家族的首个推理模型，擅长主动进行规划、尝试和反思，能通过慢思考和反复验证的逻辑机制，为用户提供准确可靠的回复。它既擅长通过超长推理能力，解决逻辑推理、代码和数学等复杂问题，也能兼顾文学创作等通用领域。
来源：钛媒体

5.阿里云通义开源首个推理步骤评估标准

1月16日消息，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准 ProcessBench，填补了大模型推理过程错误评估的空白。
来源：钛媒体

6.微软推出免费版Microsoft 365 Copilot Chat，面向企业用户

微软近日正式推出了面向企业用户的免费聊天工具Microsoft 365 Copilot Chat，该工具集成了人工智能（AI）代理功能。这是微软为推广AI在工作场景中的应用而采取的最新举措，旨在吸引用户并最终促使他们升级到每月30美元的Microsoft 365 Copilot完整版本。
来源：AIYUN

7.smart与元戎启行达成战略合作，布局智能驾驶AI大模型

近日，smart与人工智能企业元戎启行宣布达成战略合作。双方共同研发的AI大模型技术将赋能新一代智能驾驶系统，该系统应用了端到端算法模型，支持车位到车位的智能驾驶功能，能够应对环岛、锐角转弯、拥堵窄路、无车道线道路等复杂行车场景。
来源：36氪

8.百度升级发布生物计算大模型工具HelixFold 3

1月15日，百度智能云举办千帆思享会——生命科学专场。会上，重磅升级发布了由百度螺旋桨PaddleHelix团队与百度智能云“云高性能计算平台CHPC”团队联合打造的生物计算大模型工具HelixFold 3。升级后的HelixFold 3将在RNA结构预测、共价修饰、抗原抗体等复杂场景中实现更高准确性，为研发工作带来更为精确、高效、便捷的解决方案。
来源：36氪

9.Meta实现101种语言“语音到语音”AI即时翻译

《自然》杂志15日介绍了一款人工智能（AI）模型，其宛如科幻小说里的“巴别鱼”，能直接“语音到语音”翻译多达101种语言的语音和文本。由Meta推出的这一模型名为SEAMLESSM4T，其填补了语言覆盖方面的空白，且性能优于现有其他系统。该成果为快速通用翻译铺平道路，其资源公开可用（用于非商业用途），以协助进一步研究包容性语音翻译技术。
来源：科创板日报

10.面壁智能发布端侧全模态模型MiniCPM-o 2.6

今日，人工智能公司面壁智能宣布发布MiniCPM-o 2.6，这是首个端侧全模态模型，仅8B参数。据介绍，MiniCPM-o 2.6取得实时流式全模态开源模型SOTA；在语音方面，取得理解、生成开源双SOTA；在视觉领域，称得上最强端侧视觉通用模型。
来源：科创板日报

2025.1.15

1.稀宇科技发布并开源新一代 MiniMax 01 系列模型

MiniMax发布了MiniMax-01系列开源模型，包括基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。该系列模型参数量达4560亿，单次激活459亿，性能比肩GPT-4o等海外顶尖模型，能高效处理长达400万token的上下文
来源：MiniMax

2.科大讯飞发布深度推理模型讯飞星火X1，同时首发星火语音同传大模型

2025年1月15日，讯飞星火大模型升级发布，正式发布星火深度推理模型X1，讯飞星火4.0 Turbo底座能力迎来全新升级，同时首发星火语音同传大模型
来源：科大讯飞

3.OpenAI 发布首个AI Agent！ChatGPT能自动帮你干活了

刚刚，ChatGPT的全新功能「Tasks」上线了。用户可以通过设置需要执行的任务和执行时间，来指挥ChatGPT在未来某个时间，自动完成任务。随着ChatGPT新功能「Tasks」的上线，OpenAI Agent在今天正式登场了
来源：凤凰网科技

4.Kimi多模态图片理解模型API发布

1月15日消息，月之暗面旗下Kimi开放平台发布全新多模态图片理解模型moonshot-v1-vision-preview正式发布，该模型完善了moonshot-v1模型系列的多模态能力，具备图像识别、文字识别和理解能力。Vision模型实行按量计费方式，单张图片按1024tokens合并计算在Input请求的tokens用量中
来源：钛媒体

5.上海 AI 实验室书生・浦语大模型升级：通用模型首次融合常规对话与深度思考

上海人工智能实验室的书生大模型迎来3.0版本升级。InternLM3-8B-Instruct仅用4T数据训练，数据效率大幅提升，综合性能超同量级开源模型，节省超75%训练成本。首次融合常规对话与深度思考能力，可应对更多真实场景。经多维度评测，其综合性能接近GPT-4o-mini，还拓展了智能体任务能力，支持浏览器使用及20步以上网页跳转深度信息挖掘。
来源：IT之家

6.“人手一副AI眼镜”还有多远？端侧算力成可穿戴设备商业化“痛点” 这些上市公司透露最新进展

CES 2025上AI眼镜备受关注，其大规模商业化进程成为市场焦点。端侧算力是制约可穿戴设备交互体验感及大规模商业化的核心要素之一，高性能低能耗集成芯片、大小模型协同处理的混合AI、提升设备续航能力是解决限制的主要方式。全球龙头厂商正研究端侧AI部署，高通、瑞芯微、晶晨股份等均有相关芯片研发进展
来源：科创板日报

2025.1.14

1.Adobe的新AI工具可一键编辑10000张图片

Adobe推出新AI工具“Firefly Bulk Create”，可一键编辑多达10000张图片，包括调整大小、更换背景等，无需单独编辑。该工具整合Adobe Firefly多个API，旨在方便创意人员使用。测试版已推出，分为“删除背景”和“调整大小”两个工具，支持PNG、JPEG格式，未来将增加PSD文件支持。
来源：cnBeta

2.美国商务部发布新的AI相关出口管制措施外交部回应

2025年1月14日，美国商务部发布新的AI相关出口管制措施，中国外交部发言人郭嘉昆回应称，美方此举泛化国家安全概念，将经贸科技问题政治化、武器化，滥用出口管制，恶意打压中国，严重破坏市场规则和国际经贸秩序，严重影响全球产供链稳定，严重损害中美两国和各国工商界利益，中方坚决反对并将采取坚定措施维护中国企业正当合法权益。
来源：科创板日报

3.AI语音厂商思必驰完成5亿元融资

AI语音厂商思必驰在近日完成了5亿元融资，本轮资方包括知名产业基金、国资平台、私募基金等多家机构。本轮融资后，思必驰将持续加速垂域大模型（DFM-2）与全链路对话技术在汽车、IoT等智能终端领域及会议办公、金融等行业场景的规模化落地。
来源：科创板日报

4.加速AI和机器人融入生活空间，「一目科技」完成数亿元D轮融资

多模态感知+AI计算解决方案提供商「一目科技」近期完成数亿元D轮融资。本轮融资由赛富投资基金领投，南京市创新投资集团、A股上市公司松霖科技跟投。融得资金将主要用于多模态感知技术、AI计算能力提升及具身智能应用领域拓展。
来源：智能涌现

5.英伟达发布 6.3 万亿 Token 大型 AI 训练数据库 Nemotron-CC

英伟达推出名为Nemotron-CC的大型英文AI训练数据库，含6.3万亿个Token，其中1.9万亿为合成数据。该数据库基于Common Crawl网站数据构建，经严格处理形成高质量子集Nemotron-CC-HQ。与DCLM相比，使用Nemotron-CC-HQ训练的模型在MMLU基准测试中分数提高5.6分，80亿参数模型在多项测试中表现优异。
来源：IT之家

6.MBZUAI发布LlamaV-o1模型，推动多模态AI系统逐步推理能力

阿联酋穆罕默德・本・扎耶德人工智能大学（MBZUAI）近日发布了一款名为LlamaV-o1的先进人工智能模型，该模型能够高效解决复杂的文本和图像推理任务。LlamaV-o1通过结合前沿的课程学习和先进的优化技术，如波束搜索（Beam Search），在多模态人工智能系统中树立了新的基准，特别是在逐步推理的透明性和效率方面。
来源：AIYUN

7.Mistral发布Codestral 25.01编程模型，提升编码效率

Mistral公司近期对其开源编程模型Codestral进行了更新，推出了新版本Codestral 25.01。该模型在开发者群体中备受欢迎，进一步加剧了面向开发者的编程模型市场竞争。Mistral在官方博客中表示，新版本的Codestral采用了更高效的架构。公司承诺，Codestral 25.01将在其同类模型中占据领先地位，且运行速度是前一版本的两倍。
来源：AIYUN

2025.1.13

1.方大特钢与华为开展全面合作，打造钢铁行业大模型

方大特钢与华为于2025年1月10日签署全面合作协议，合作领域涵盖企业数据治理体系与应用、钢铁行业大模型应用、信息安全及数字化人才培养等。双方将共同攻关钢铁行业大模型应用难题，打造钢铁行业大模型，赋能智能化场景应用，并深化合作打造绿色低碳数据中心，以促进数字技术与钢铁主业深度融合，推动方大特钢数字化转型，提升其信息化应用水平和市场竞争力。
来源：IT之家

2.DeepSeek官方App上线！功能完整且免费

DeepSeek正式推出支持苹果安卓的手机app，此前仅有网页端和API调用方式。此次上线官方未宣传，官网也未提供下载链接。手机app功能与网页端一致，底层用DeepSeek V3模型，支持联网搜索、上传文件和图片，图片解析通过OCR实现，非多模态能力。
来源：凤凰网科技

3.京东健康发布业内首个医疗健康全场景应用大模型产品体系

2025年1月11日，京东健康在京举办年度医生盛典和数智医疗大会，发布了“AI京医”大模型全系产品及业内首个面向医院全场景应用的大模型产品“京东卓医”。基于“京医千询”技术，京东健康打造了覆盖线上线下医疗健康全场景的大模型产品服务体系，旨在提升患者就医体验、助力医生临床科研、优化医院运营。
来源：京东黑板报

4.脑机接口开年利好消息不断，预计2030年应用市场规模400亿美元

1月13日消息，2025年伊始，脑机接口利好消息不断。马斯克旗下脑机接口公司成功将脑机芯片植入第三名受试者体内。北京、上海也相继发布脑机接口五年行动方案。国泰君安研报显示我国脑机接口产业链加速完善，预计2030年脑机接口医疗应用市场规模达400亿美元。
来源：钛媒体

5.中信证券：OpenAI亲自下场，自研机器人或成通向AGI必由之路

1月13日消息，中信证券研报指出，OpenAi重启机器人项目，网络公开招聘项目管理、系统集成、机械结构各方面领导型人才。我们认为此次OpenAi重启机器人项目意味着公司当下具备了资金、人才条件，且开始重视AGI领域探索中自研自产机器人的重要性
来源：钛媒体

6.3D 生成大模型公司影眸科技完成数千万美元 A 轮融资，美团龙珠、字节跳动领投

影眸科技完成数千万美元A轮融资，美团龙珠、字节跳动领投。融资将用于推进3D大模型前沿探索及推动Hyper3D系列产品商业化落地。其3D生成大模型Rodin上线45天后实现100万美金年经常性收入，并持续高速增长，已与Amazon、字节跳动等全球知名客户建立深度合作，获得数百万元B端商业化订单，覆盖多个行业。
来源：IT之家

7.淘宝星辰图生视频工具上线，对淘宝天猫商家开放

2025年，淘宝星辰图生视频工具上线，对淘宝天猫商家开放。该工具基于阿里妈妈自研大模型，具多项核心优势，如更懂商品展示手法、多语种语义遵循能力强、物理动作规律合理、人物商品装饰保持稳定等。操作便捷，输入图片或文本描述即可生成高质量视频，应用于商品主图视频、卖点吸睛视频、服饰一体化解决方案等多场景
来源：机器之心

8.Video Ocean V2.0：视频质量全面升级，依旧完全免费

本文介绍了潞晨 Video Ocean V2.0 的正式上线，该版本在模型、速度、功能等方面进行了全面升级，且完全免费。其具有超级真实的画质、运动幅度显著提升以及风格更加多样等三大亮点，支持文生、图生、角色生等多种视频生成方式，还具备“视频续写 & 重试”功能，界面简洁好用，为不同用户群体提供了便捷的创意视频制作平台。
来源：机器之心

9.中文互联网语料 AI 资源平台发布:27 个数据集、总量 2.7T

中国网络空间安全协会发布中文互联网语料资源平台，含27个数据集、总量2.7T。该平台在中央网信办指导下，由中国网络空间安全协会联合国家互联网应急中心完成，基于1.0版本，经严格处理形成2.0版本，规模达120GB，含3800万条数据。
来源：AIYUN

10.Cohere发布企业AI平台North，挑战微软与谷歌

Cohere公司推出企业AI平台North，旨在挑战微软Copilot和谷歌Vertex AI。North整合大型语言模型、搜索功能和自动化工具，适用于私有云或本地安装，特别针对金融、医疗保健等受监管行业。其内置搜索系统Compass可处理多种数据类型，任务完成时间较手动搜索缩短80%以上
来源：AIYUN

11.扎克伯格预测：2025年AI编程将达到中级工程师水平

财联社1月13日电，Meta创始人兼首席执行官扎克伯格近日在乔·罗根播客节目中大胆预测，“2025年，软件工程领域将迎来剧变，AI将达到中级工程师的编程水平。”
来源：科创板日报

12.新人工智能模型可精确预测人体细胞基因表达

美国研究人员开发出一个新的人工智能模型，经过大量数据的训练后，该模型能精确预测各种人体细胞内部的基因表达情况，将为生物和医学研究带来便利。这个名为“通用表达转换器”（GET）的模型由美国哥伦比亚大学和卡内基-梅隆大学等机构研究人员联合开发，其准确性和有效性已得到实验验证，论文发表在新一期英国《自然》杂志上。
来源：科创板日报

2025.1.10

1.阿里通义万相 2.1 模型宣布升级：首次实现中文文字视频生成功能，支持无限长 1080P 视频的高效编解码

阿里通义万相2.1版本模型升级，视频生成和图像生成能力显著提升。首次实现中文文字视频生成功能，支持无限长1080P视频高效编解码，登上VBench榜单第一。还支持中英文视频一键生成艺术字、多种视频特效，以及复杂运镜还原真实物理规律。图片生成方面，支持文生组图，采用IC-LoRA图像生成训练方法，增强文本到图像的上下文能力，可实现关联图像间的组合生成并保持特征稳定连续。
来源：IT之家

2.银河通用发布全球首个端到端具身抓取基础大模型 GraspVLA，预训练数据十亿帧“视觉-语言-动作”对

银河通用联合北京智源人工智能研究院及北京大学和香港大学研究人员，发布了全球首个端到端具身抓取基础大模型 GraspVLA。该模型预训练数据达十亿帧“视觉 – 语言 – 动作”对，可实现从模拟到现实的零样本测试，并通过小样本学习满足特定需求。官方公布其满足七大泛化“金标准”。
来源：IT之家

3.商汤推出“日日新”融合大模型，勇夺“双冠王”

商汤推出“日日新”融合大模型，在深度推理与多模态信息处理能力上大幅提升，于SuperCLUE与OpenCompass两大权威评测榜单夺冠。该模型突破模态融合技术，实现文理兼修，在办公、金融、自动驾驶等多领域有广泛应用，其成功源于在计算机视觉领域深耕及独特研发见解，通过融合模态数据合成与任务增强训练等创新技术完成训练。
来源：商汤科技

4.Perplexity与Tripadvisor合作从真实用户处获取酒店信息

人工智能搜索引擎 Perplexity 正在与 Tripadvisor 进行整合，这将增加资料库中更多关于酒店的信息。现在，当您搜索住宿地点时，Perplexity 将向您提供一份井然有序的酒店列表，以及使用来自 Tripadvisor 的信息选择这些酒店的原因摘要。
来源：cnBeta

5.VLC下载量突破60亿次在CES展示AI生成字幕功能

VLC 媒体播放器是一款流行的开源软件，由非营利组织 VideoLAN 开发，今天官方宣布其全球下载量已突破 60 亿次，并预告了一款由人工智能驱动的字幕系统。
来源：cnBeta

6.人工智能重塑华尔街：20万个工作岗位将被削减

人工智能技术对金融服务业产生重大影响，华尔街金融机构预计未来三到五年内将大规模裁员约20万人，主要集中在后台运营等常规性重复性任务岗位。花旗集团研究指出，华尔街员工技能需求发生根本性转变，银行业将加速向计算机科学等领域倾斜，同时催生新职位如人工智能监督员等。
来源：快科技

7.小盒科技刘夜：AI原生教育公司有机会追平甚至赶超“元老”教育机构

1月10日消息，美西时间1月7日-9日，钛媒体CES2025「Talk to the World·对话世界」系列论坛在拉斯维加斯举办。会上，小盒科技创始人、Vision Flow创始人刘夜表示，教育行业是一个复杂且长链路的产业，想要学的又有效又轻松——这个痛点一直没改变。
来源：钛媒体

8.亚马逊云科技田锋：AI可以为供应链企业提供全新产品溢价，而非仅仅降低成本

1月10日消息，美西时间1月7日-9日，钛媒体CES2025「Talk to the World·对话世界」系列论坛在拉斯维加斯举办。会上，亚马逊云科技中国区行业集群总经理田锋表示，一直以来，硬件产品都是依据成本来制定价格，供应链几乎决定了整个成本结构。为了提高利润，硬件企业需要不断精进其供应链、提升生产效率，让成本可以降到极致。
来源：钛媒体

9.Midjourney接近“全面改革”，计划推出视频功能

Midjourney的V7版本处于最终测试阶段，此次更新几乎重建了AI图像生成器系统的每个部分，包括新的架构、数据集和语言处理方法。内部测试后将进入调试和可能的alpha阶段。同时，团队正在探索视频生成能力，面临用户友好性和成本效益的挑战。此外，平台计划引入实时和高容量两种生成模式，并扩展个性化系统功能。自V6发布以来，团队还增加了多项新功能，并开始关注用户反馈以规划未来路线图。
来源：AIYUN

10.马斯克旗下人工智能公司xAI推出独立Grok应用上架苹果商店

《科创板日报》10日讯，1月9日消息，马斯克旗下人工智能公司xAI推出首款面向消费者的独立应用。这款应用名为Grok，这也是xAI开发的人工智能语言模型的名称。当地时间周四起，用户可以开始免费使用这款新的Grok应用。此前，用户只能通过社媒平台X访问xAI的旗舰产品Grok聊天机器人。
来源：科创板日报

2025.1.9

1.国家网信办：截至2024年12月31日，共302款生成式人工智能服务在国家网信办完成备案

据网信中国消息，2024年，网信部门会同有关部门按照《生成式人工智能服务管理暂行办法》要求，持续开展生成式人工智能服务备案工作。截至2024年12月31日，共302款生成式人工智能服务在国家网信办完成备案，其中2024年新增238款备案
来源：36氪

2.雷蛇推出“AI 游戏伴侣”Project AVA：支持实时指导 + 赛后复盘

雷蛇在CES 2025上发布了名为Project AVA的AI游戏伴侣，该产品通过学习顶尖电竞玩家的游戏理解，为MOBA和FPS类游戏提供实时指导和赛后复盘分析。它还能在ARPG游戏中快速模拟数百万次游戏过程，提供专业攻略。此外，Project AVA可对电脑硬件进行性能调优，提升游戏体验，并通过多种交互模式与玩家互动。雷蛇表示该产品将从概念走向现实，并正在征集测试者。
来源：IT之家

3.一秒内从单个图像生成3D对象，支持实时编辑，Stability AI推出3D生成新方法SPAR3D

Stability AI 在 2025 年的 CES 上宣布推出了一种名为 SPAR3D 的两阶段 3D 生成新方法。该方法能够从单个图像生成完整的 3D 对象，并支持实时编辑。SPAR3D 通过轻量级点扩散模型生成稀疏 3D 点云，然后利用这些点云和输入图像创建详细的网格。
来源：机器之心

4.微软发布小型语言模型Phi-4代码

微软公司公开了Phi-4小型语言模型的代码，该模型拥有140亿个参数，基于Transformer架构中的仅解码器变体，能生成文本并解答数学问题。Phi-4在GPQA和MATH基准测试中表现优异，优于参数量更大的LLama 3.3 70B模型。微软通过直接偏好优化和监督微调两种后训练优化技术提高了Phi-4的输出质量。Phi-4的代码已在Hugging Face网站上开放下载。
来源：AIYUN

5.马云：接下来10年变化可能超出想象，未来的世界会被AI重塑

马云分享了自己对乡村教师、AI 时代发展的看法。他表示，接下来的十年，变化可能会超出想象。中国的人口结构在改变，未来的世界会被 AI 重塑，社会对乡村教育会有新的要求，但是有一件事不会变，马云公益基金会将继续投入助力边远乡村教育的未来。
来源：凤凰网科技

6.麦肯锡称2030年中国AI人才缺口或达400万

1月9日消息，据麦肯锡最新报告显示，到2030年，中国对AI专业人才的需求预计将达到600万，而人才缺口可能高达400万。人工智能代理（AI Agents）的广泛应用将成为缓解这一压力的关键。这些智能代理不仅能够承担重复性高、劳动强度大的任务
来源：钛媒体

7.TrendForce：机器人大语言模型市场规模预估于2028年破千亿美元

根据TrendForce集邦咨询最新研究，随着人型机器人迈向高度系统整合，并有望从工业场景走进家庭生活，前端的AI模型训练将更为关键，以满足更多后端理解与互动需求。
来源：科创板日报

8.中信证券：AI驱动商业化加速 2025智驾拐点正在到来

中信证券研报指出，智能车作为AI领域重要的落地场景，有望在渗透率提升和体验突破方面展现“非线性”的增长。其中渗透率方面，比亚迪的入局是2025年国内智驾行业最大变量，有望推动L2+级别销量基盘快速从100万辆提升至1000万辆级别，带动L2+渗透率从14%提升到30%，实现翻倍以上增长。
来源：科创板日报

2025.1.8

1.英伟达开源世界基础模型人形机器人加速迈向“ChatGPT时刻”

英伟达在CES上推出开源的物理AI大模型Cosmos，旨在通过文本、图像、视频和传感器数据生成基于物理的视频，以训练机器人和自动驾驶汽车。这一模型能够理解世界语言、物理特性和空间位置等要素，合成相关物理数据，推动智能汽车和具身智能的普及。首批用户包括多家国内外机器人和汽车厂商。
来源：科创板日报

2.阿里云通义灵码AI程序员上线，可与人类协作完成复杂开发任务

据悉，阿里云通义灵码AI程序员已全面上线，成为全球首个同时支持VSCode、JetBrainsIDEs开发工具的AI程序员产品。此次上线的AI程序员相比传统AI辅助编程工具，能力更全面，可以让开发者以更高效、更沉浸的方式完成编码任务，通过全程对话协作的方式，就能完成从0到1的业务需求开发、问题修复、单元测试批量生成等复杂编码任务。
来源：钛媒体

3.用AI大模型重塑服装设计制版，「深服科技」获数千万元Pre-A轮融资

浙江深服人工智能科技股份有限公司（深服科技）完成数千万元Pre-A轮融资，由上海厚毅资本领投。资金将用于模型开发、技术人才引进和市场拓展。深服科技成立于2023年，专注于服装行业AI解决方案，旨在通过AI大模型技术优化服装设计和制版流程，降低设计门槛和研发成本。其产品“画衣衣AI制版”可让设计师自主生成CAD制版图，提升工作效率。
来源：36氪

4.国内人形机器人产业崛起，胡宇航：已接近美国发展规模

首形科技创始人、哥大机器人学博士生胡宇航表示，国内已接近赶超美国人形机器人的发展规模了。早在 2019 年，美国的波士顿动力 Atlas 人形机器人已具备出色的任务执行能力，能完成多种复杂任务，而当时国内人形机器人数量相对较少。然而，如今国内人形机器人发展迅猛，已有约四五十家企业在上下游产业链全面发力。
来源：凤凰网科技

5.讯飞星火深度推理模型X1计划将于1月15日正式对外发布

e公司讯，记者从公司获悉，科大讯飞讯飞星火深度推理模型X1计划将于1月15日正式对外发布。作为当前业界全国产算力平台上唯一的深度推理模型，中文数学对标OpenAI o1，并将在讯飞AI学习机、数学教学助手、医疗等真实场景中率先应用。
来源：e公司讯

6.AI创企Anthropic拟募资20亿美元，估值达600亿美元

1月8日消息，据报道，Anthropic公司正在进行融资20亿美元的谈判，这笔交易将使其估值达到600亿美元，是一年前估值的三倍多。知情人士透露，此轮融资由风险投资公司光速创投（Lightspeed Venture Partners）牵头，600亿美元的估值包括Anthropic计划在本轮融资中筹集的资金。
来源：钛媒体

7.闪极发布海外全新子品牌 loomos：推出 loomos AI 眼镜，搭载 GPT-4o

闪极在CES 2025上发布了海外子品牌loomos及其新品loomos AI眼镜，该眼镜搭载GPT-4o语音助手，提供文字翻译、物品识别等功能。产品将于1月21日在Kickstarter众筹，计划在北美和欧洲设立分公司。眼镜设计考虑亚洲人面部特征，重约50g，内置3块电池，支持边充边戴，搭载索尼1600万像素摄像头和紫光展锐W517芯片，具备全天候佩戴、独立手机使用等特性。
来源：IT之家

8.可灵AI V1.6模型现已开放API

可灵AI V1.6模型于2025年1月7日开放API，其生成质量更稳定，内容质量与效果显著提升。新模型在广告视频素材生成方面表现优异，对运动、时序类动作等文字描述响应更好，提高了素材生成成功率
来源：可灵AI

9.智元机器人发布机器人4D世界模型

智元机器人推出EnerVerse架构，旨在解决具身智能领域中机器人动作规划的挑战。该架构通过自回归扩散模型生成未来具身空间，并引入稀疏记忆机制和自由锚定视角，以提升动作规划的准确性和实时性。实验结果显示，EnerVerse在动作规划任务中达到了当前最佳水平（SOTA），并在视频生成方面展现出优越性能.
来源：量子位

10.众筹超百万的AI陪伴机器人，展台被外国人挤爆

2025 年 CES 展上，萌友智能发布人工智能机器宠物 Ropet。其创始人何嘉斌介绍，它能通过多模态感知系统识别动作、一样有体温、会饥饿。在 Kickstarter 上筹款超 150 倍，台，成交用户女性占比超 70%。它聚焦 30 代女性白领，以“弱陪伴”理念，为陪伴机器人领域带来新方向
来源：凤凰网科技

2025.1.7

1.超级AI PC、巨型芯片、世界基础模型？黄仁勋CES 2025主题演讲10条要闻速览

在2025年CES国际消费电子展上，英伟达CEO黄仁勋展示了多款新品，包括新一代GeForce RTX 50系列显卡、世界基础模型NVIDIA Cosmos、超级AI PC“NVIDIA Project DIGITS”、汽车处理器“NVIDIA DRIVE Thor”等。此外，还介绍了与丰田等公司合作开发自动驾驶汽车的计划，以及巨型芯片和多种计算网络架构的进展，标志着英伟达在AI和计算领域的重大突破.
来源：钛媒体

2.阿加犀发布通天晓 Ultra Magnus 人形机器人原型

在2025年1月7日的CES 2025上，阿加犀智能科技发布了一款名为通天晓（Ultra Magnus）的人形机器人原型，与高通合作布局具身智能。该机器人搭载高通QCS8550处理器，结合边缘AI技术和端侧大语言模型（LLM），实现自然语音交互、动作控制和场景服务功能，旨在提升商业领域的创新应用和实际效能.
来源：IT之家

3.传音控股与阿里云达成合作，旗下 AI 手机已搭载通义千问大模型

传音控股与阿里云达成合作，将通义千问大模型搭载于其旗下品牌TECNO的AI手机PHANTOM V Fold2中。该手机通过特定的AI按键，可在离线环境中流畅运行多轮AI对话，并实现文档及通话摘要。合作基于联发科芯片，涉及模型瘦身、工具链优化等多个维度，借助阿里巴巴的MNN-LLM大模型推理引擎实现高效GPU加速.未来，双方将继续在大模型落地终端上进行深入探索。
来源：IT之家

4.Google正在组建一支新团队以打造能够模拟物理世界的AI

Google正在组建一支新团队，致力于开发能够模拟物理世界的人工智能模型。该团队由前OpenAI视频生成器Sora的共同负责人蒂姆-布鲁克斯领导，将与Google的Gemini、Veo和Genie团队合作，解决关键问题并扩展模型的计算能力。这一计划旨在实现人工通用智能，推动视觉推理、模拟和实时互动娱乐等领域的发展。然而，该技术在创意产业的应用引发了争议，同时版权问题也尚未解决.
来源：cnBeta

5.Avataar推出AI生成视频工具Velocity

Avataar公司推出了一款名为Velocity的AI生成视频工具，旨在降低视频制作成本并实现批量生成。该工具能够根据产品链接自动生成高质量的产品视频，适用于预算有限的产品。Avataar通过3D渲染技术确保视频质量，并提供API接口供企业集成使用。尽管市场竞争激烈，Avataar凭借其独特的数据收集和定制能力在AI视频生成领域脱颖而出.
来源：AIYUN

6.中国信通院MaaS系列标准正式发布

为解决MaaS平台服务质量参差不齐、选型困难等问题，中国信通院紧跟MaaS领域最新发展趋势，依托中国人工智能产业发展联盟于2023年成立MaaS工作组，联合产学研各界专家共同启动MaaS系列标准编制，经过一年多的持续努力，现正式发布MaaS系列标准。
来源：科创板日报

7.高通推出可运行人工智能软件的新型个人电脑芯片

高通在拉斯维加斯的CES展会上宣布，由8核Oryon中央处理器、图形组件和专用AI芯片组成的Snapdragon X Platform将运行微软的Copilot+软件。该芯片制造商表示，戴尔科技和联想集团等个人电脑制造商将在“2025年初”推出基于该新产品的笔记本电脑。
来源：科创板日报

2025.1.6

1.「天工大模型4.0」o1版和4o版正式上线天工APP和网页免费使用

昆仑万维集团于2025年1月6日宣布，其自主研发的「天工大模型4.0」o1版和4o版正式上线天工网页和APP，并向公众免费开放。o1版专注于逻辑推理，具备强大的数学、代码和逻辑推理能力，通过多智能体体系和强化学习等技术实现高效推理。
来源：昆仑万维

2.罗永浩AI初创项目“J1 Assistant AI助理”海外上线

罗永浩的AI初创项目Jarvis在海外上线，推出了J1 Assistant AI助理软件。该软件支持用户将语音信息发送至谷歌搜索引擎、自家AI模型、ChatGPT等，或作为新建备忘录使用.
来源：凤凰网科技

3.马斯克：Grok 3即将推出，计算量比Grok 2高10倍

钛媒体App 1月4日消息，马斯克在X平台上表示，Grok 3即将推出，其预训练现已完成，计算量比Grok 2高10倍。
来源：钛媒体

4.微软计划本年度投资超800亿美元建设AI数据中心

微软公司宣布将在当前财年内投资超过800亿美元建设支持人工智能工作负载的数据中心，以巩固其在AI领域的领先地位。其中超过一半的资金将用于美国的数据中心建设。微软通过与OpenAI等公司的合作，以及自身AI软件平台和应用的开发，进一步推动AI技术的发展
来源：AIYUN

5.模仿婴儿的好奇心：陪伴型机器人“Mirumi”问世

Yukai Engineering 在 CES 2025 展览会上推出了一款名为 Mirumi 的陪伴型机器人，其设计灵感来源于婴儿的好奇心。Mirumi 通过内置传感器感知周围环境，能够做出害羞、摇头等反应，旨在为用户提供情感陪伴和欢乐.公司计划于 2025 年中期通过众筹活动推出该产品
来源：IT之家

2025.1.3

1.阿里入局AI眼镜与雷鸟创新达成深度战略合作

《科创板日报》3日讯，1月2日，消费级AR品牌雷鸟创新RayNeo与阿里云举行战略签约仪式，双方宣布在AI眼镜领域达成独家战略合作，通义系列大模型将为雷鸟创新的AI眼镜提供独家定制的技术支持。
来源：科创板日报

2.复旦等提出「中国版GPT-Zero」！毕业论文AI率自查神器

复旦大学等机构研究人员提出了AI内容检测器ImBD，它能够检测润色、扩写、改写和纯生成等多种任务，支持多语言，并在训练时间短、样本数量少的情况下超越商用检测器。该检测器通过学习和模仿机器写作风格特征进行检测，有效识别机器修订文本，对学术诚信和信息可信度评估具有重要意义。
来源：新智元

3.Matter 协议将解锁智能音箱新玩法：联动更丰富场景、跨平台音乐播放等

本文介绍了智能家居标准Matter协议的新进展，该协议将支持智能音箱设备类型，使得智能音箱不仅能播放音乐，还能与其他Matter设备联动，实现更便捷的控制和更丰富的场景应用。Matter协议将允许跨平台音乐播放，打破生态系统和品牌限制，为用户带来更丰富的智能家居体验。
来源：IT之家

4.OpenAI押注，这家语音AI初创如何扛起10亿美元估值？

语音AI初创公司Speak通过生成式AI技术，专注于“开口说”的语言学习平台，完成了7800万美元C轮融资，估值达10亿美元。Speak利用AI技术模拟真实语言环境，提升学习效率和效果，用户平均每日使用时长10-20分钟，订阅价格亲民。Speak不仅在个人用户中受欢迎，也被企业作为语言培训工具。
来源：凤凰网科技

5.周亚辉：人类2030年开始实现AGI，RoboTaxi将在2年后大规模普及

昆仑万维创始人周亚辉在其投资笔记中预测，2030年后通用人工智能（AGI）将逐步实现，标志为机器人广泛融入人类社会。他预计2027年无人驾驶的RoboTaxi将大规模普及，并预测十年后中国首富可能来自字节张一鸣、小米雷军、美团王兴三人中。
来源：钛媒体

6.人工智能媒体公司Rembrand宣布完成2300万美元A轮融资

人工智能媒体公司Rembrand完成2300万美元A轮融资，计划将业务从社交媒体拓展至联网电视领域。公司利用AI技术在视频内容中自然融入虚拟物体进行品牌营销，提高视频完成率和品牌知名度，同时为品牌和广告商提供定制化目标受众服务。
来源：AIYUN

7.斯坦福AI科研神器开源，一键成文GPT-4o mini加持！科研写作彻底解放双手

斯坦福大学开源了STORM&Co-STORM系统，这是一个AI写作工具，能够通过输入主题词生成高质量长文。该系统利用必应搜索和GPT-4o mini模型，通过多角度问答迭代生成文章，并能生成动态思维导图以避免信息遗漏。STORM&Co-STORM系统旨在提高科研写作效率，降低信息搜集和整合的认知负担。
来源：新智元

2025.1.2

1.清华大学推 AutoDroid-V2：AI 离线在线协同，优化移动端自动化 GUI 控制

清华大学智能产业研究院（AIR）发布了AutoDroid-V2 AI模型，该模型通过在移动设备上使用小型语言模型（SLM）显著提升了自然语言控制的自动化程度，与传统依赖云端大型语言模型（LLM）的方法相比，在效率、隐私和安全性方面有显著优势。
来源：IT之家

2.Meta AI 推出 LIGER 混合检索 AI 模型，计算效率与推荐精度兼得

Meta AI 推出了新型AI模型LIGER，该模型结合了密集检索和生成检索的优势，有效提升了推荐系统的性能，同时解决了计算资源、存储需求和冷启动项目处理上的难题，为构建更高效、更精准的推荐系统提供了新思路。
来源：IT之家

3.阿里云与零一万物达成战略合作，成立“产业大模型联合实验室”

近期，阿里云和大模型头部企业零一万物达成模型平台业务的战略合作，双方将成立“产业大模型联合实验室”，联手加速大模型从技术到应用的落地，进一步扩大产业大模型的生态整合。据了解，双方深度战略合作的产业大模型联合实验室包含技术、业务、人才等板块
来源：36氪

4.4o-mini只有8B o1也才300B！微软论文意外曝光GPT核心机密

本文报道了微软在论文中意外曝光了OpenAI的GPT系列模型参数，包括o1-preview约300B参数，GPT-4o约200B，GPT-4o-mini约8B等。这些数据虽然被声明为估计值，但引起了人们对模型参数和性能的关注。文章还介绍了微软论文中提到的医学相关benchmark——MEDEC，旨在识别和纠正临床笔记中的错误。
来源：快科技

5.大规模3D场景2分钟生成，效率提升30倍！中科院发布空间智能新框架

中国科学院自动化研究所和北京科技大学联合团队发布了名为SceneX的3D场景生成框架，该框架能够根据简单的文字描述快速创建高质量、逼真的虚拟场景，极大提升了构建虚拟世界的效率和灵活性。SceneX包含PCGHub和PCGPlanner两个核心模块，分别负责程序化资产与布局生成以及智能规划场景生成。
来源：新智元