2024年9月AI快讯

0 71

2024.9.30

1.OpenAI死里逃生？加州AI法案刚刚被毙，LeCun李飞飞吴恩达狂喜

加州州长Gavin Newsom否决了SB-1047法案，该法案旨在通过追究开发者责任来防止AI系统造成大规模伤亡或超过5亿美元的网络安全事件。否决决定受到AI界广泛欢迎，特别是LeCun、李飞飞和吴恩达等AI领袖。州长认为法案没有考虑到AI系统的具体应用环境，对所有功能应用了过于严格的标准，可能会遏制创新。Bengio和Hinton对此持不同意见，支持法案通过。
来源：新智元

2.我国无锡超算“太湖之光 A+”项目亮相：算力密度国内最高，单个机柜达 40P

2024中国算力大会在郑州举行，会上发布了8项年度重大成果，包括无锡超算“太湖之光 A+”项目。该项目采用国产智算加速卡，单个机柜算力达到40P，算力密度国内领先。此外，还有“九州”算力互联网、中国联通超大规模智算中心、阿里云无影云电脑等项目上榜，展示了中国在算力领域的创新和进步。
来源：IT之家

3.Meta的新眼镜Orion，就是下一代消费级AI设备的“GPT3时刻”

Meta公司发布的Orion眼镜，被认为是下一代消费级AI设备的重要里程碑，类似于AI发展史上GPT3的地位。Orion眼镜是轻便的全息增强现实眼镜，具备手势和眼动追踪功能，集成了全息显示技术和个性化AI助手。它采用新材料和工艺，实现了大视场角和轻便设计，无需线缆连接。Orion的推出预示着智能交互平台的新时代，可能改变AI竞争格局。
来源：凤凰网科技

4.重庆AI独角兽赴港 IPO，三年半亏71亿、估值却暴增百倍，中国AIoT第一股有多强？

重庆特斯联智慧科技股份有限公司，一家AIoT领域的独角兽企业，向港交所提交上市申请，计划将融资用于研发、商业化和城市拓展。特斯联提供全栈AIoT产品，通过AIoT操作系统TacOS服务企业及公共管理者。尽管估值暴增百倍，但公司近三年半亏损71亿，负债超公司资产三倍，面临财务压力。
来源：凤凰网科技

5.大神卡帕西安利爆火AI应用，称「或是下一个ChatGPT」

谷歌推出的Notebook LM AI应用，由Gemini 1.5 Pro模型支持，新增上传文件后AI生成对话播客的功能，受到业界和用户的广泛好评。该应用支持多种文件格式和语言，能将文档内容转化为AI讨论，提供问答、小测验等多种文字功能，以及音频概述。尽管不支持中文回答，但Notebook LM的交互方式和内容生成能力展现了AI应用的新方向。
来源：量子位

6.米哈游等入股星海图人工智能科技公司

爱企查App显示，近日，星海图（苏州）人工智能科技有限公司发生工商变更，杭州金沙江初向量创业投资合伙企业（有限合伙）退出股东行列，新增上海米哈游阿尔戈科技有限公司、北京高瓴裕润股权投资基金合伙企业（有限合伙）等为股东，同时注册资本由约69.46万人民币增至约77.55万人民币。
来源：36氪

7.Character AI正在开发由AI定制生成的聊天壁纸功能

Character AI正在开发一项新功能，允许用户自定义聊天壁纸，以增强个性化和沉浸感。该功能目前处于内部测试阶段，用户可以通过输入提示让AI生成四种独特的壁纸，选择后可设置为聊天背景。这与之前推出的“故事”功能相结合，旨在提升用户体验。
来源：AIYUN

8.Meta测试AI生成内容插入Facebook和Instagram动态

Meta正在测试一项新功能，该功能利用AI根据用户兴趣和趋势在Facebook和Instagram动态中插入个性化内容。AI生成的图像会根据用户偏好进行调整，用户可以通过互动引导内容生成。此外，Meta AI助手新增了语音功能，支持照片编辑和Reels视频自动翻译。Meta在AI领域的投入巨大，目标是到年底使其AI助手成为全球使用最广泛的产品。
来源：AIYUN

9.阿里妈妈开源全新 AI 图像修复模型 FLUX-Controlnet-Inpainting

阿里妈妈创意团队开源了名为FLUX-Controlnet-Inpainting的AI图像修复模型，该模型结合了FLUX.1-dev和ControlNet的优势，能够理解用户的语言描述并修复图像，同时支持改变风格。目前模型处于Alpha测试阶段，并将持续优化。
来源：IT之家

10.长城汽车与面壁智能签署战略合作协议，加快大模型在汽车领域的落地

长城汽车与面壁智能签署战略合作协议，共同推进大模型技术在汽车领域的应用。此次合作将结合长城汽车的AI技术与面壁智能的端侧大模型研发能力，旨在加速大模型技术在汽车行业的落地，为智慧出行和用户服务提供新动力。
来源：IT之家

11.AI如何赋能新质生产力？这场路演会创业者们这样说

2024世界设计之都大会（WDCC2024）在上海举办期间，财联社和《科创板日报》主办的科创好公司DEMODAY——设计赋能新质生产力专场活动吸引了众多创业者参与。重庆摇橹船科技创始人郑道勤强调了产业数字化转型的重要性，并介绍了其公司在智能化检测技术方面的成就。此外，其他企业如零异造物、Style3D、魔珐科技等也展示了AI技术在不同领域的应用。
来源：科创板日报

2024.9.29

1.AMD 推出自家首款小语言 AI 模型“Llama-135m

AMD在Huggingface平台发布了其首款小型语言AI模型“Llama-135m”，该模型以“推测解码”能力为特色，通过小型草稿模型生成候选token后由大型模型验证，以减少RAM占用并提升效率。该模型在AMD Instinct MI250节点上训练了六天，另有四天用于微调编程专用版本。
来源：IT之家

2.OpenAI融资文件曝光！ChatGPT年收入涨4倍，月费5年内翻倍

OpenAI内部文件披露，公司8月份月收入达3亿美元，年销售额预计37亿美元，预计2029年将达到1000亿美元。ChatGPT月订阅费预计5年内翻倍至44美元。尽管收入增长迅猛，但OpenAI预计2024年将亏损50亿美元。公司正寻求新一轮融资，目标70亿美元，估值1500亿美元。
来源：智东西

3.微软计划11月重新推出隐私噩梦AI截图工具

微软计划在11月重新推出其AI截图工具Recall，该工具在2024年5月发布时因定期截取用户活动截图而引发隐私争议。新版本将提供更多隐私保护措施，如选择加入、加密快照和生物识别登录等。英国信息专员办公室(ICO)对此工具进行了调查。尽管微软已做出改进，但一些专家仍持谨慎态度。
来源：凤凰网科技

4.三只羊“财色录音”是假的，但背后技术是真的恐怖

三只羊高管卢某的录音门事件在网上引起热议，后经警方证实为AI生成。Reecho睿声公司作为TTS技术提供者，其技术能克隆人声。AI语音技术发展成熟，能模拟真实语音和情感，但技术滥用问题也日益凸显。
来源：凤凰网科技

5.图灵奖得主姚期智：将来机器人的数目会比人更多

9月29日消息，中国科学院院士，清华大学教授姚期智9月28日在2024“青年科学家50²论坛”上发表了《人工智能的科学视角》的演讲，他表示：“未来的世界一定是一个人和机器人相处的世界，机器人当然可以有各种样子，但是我相信将来机器人的数目会比人更多，会变成社会上重要的一分子。
来源：钛媒体

6.神秘「蓝莓」登顶文生图竞技场，疑似Flux续作，网友：都来打广告

文章报道了神秘模型“蓝莓”登顶文生图模型排行榜，与Flux模型相似，疑似黑森林实验室的续作。蓝莓模型在细节和真实性上优于Midjourney v6.1和Stable Diffusion XL 1.0，但文本生成能力不足。网友猜测其背后公司可能是黑森林实验室，认为这是一种免费广告方式。目前蓝莓模型的生成质量和速度均位于第一梯队。
来源：量子位

7.智谱 AI 宣布 10 月最低 1 折开放全部官方模型 API

智谱AI宣布10月推出促销活动，用户可最低1折调用官方模型API，每位用户将获得1亿tokens额度。此外，根据前一天的token消耗量，用户可享受不同的折扣，最高可达1折优惠。智谱AI在KDD 2024大会上发布了新一代基础模型，并在MaaS平台免费开放GLM-4-Flash API。
来源：IT之家

8.中国移动“算网大脑”规模商用，推动算力像水电一样即取即用

中国移动在2024中国算力大会上宣布“算网大脑”系统规模商用，该系统通过统一管理和智能调度，实现算力资源的汇聚与即取即用，支持算网资源全量纳管，实现智能订购。已在长三角、京津冀等枢纽节点落地应用，推动AI应用部署。
来源：IT之家

2024.9.28

1.什么信号？苹果据称已退出OpenAI本轮融资谈判

苹果公司退出了OpenAI的新一轮融资谈判，该轮融资预计筹资65亿美元，由兴盛资本领投，微软和英伟达等参与。OpenAI的首席财务官表示融资已超额认购，但苹果退出的具体原因不明。可能与OpenAI高层人事变动、公司结构调整以及财务状况有关。
来源：财联社

2.微软被曝拓展 Copilot AI 应用，打造专属于你的新闻主播

微软公司正计划扩展 Copilot，打造个性化的虚拟新闻主播，播报用户感兴趣的相关新闻和动态信息。消息称微软在文生图和网络搜索之外，积极推动各项 AI 服务落地。不久前，微软启动第二波 Copilot 更新，引入了全新的 Pages，为 Excel 支持 Python 语言，以及上线 Copilot Agents 等。
来源：金融界

3.中国电信 AI 研究院完成首个全国产化万卡万参大模型训练，TeleChat2-115B 对外开源

中国电信人工智能研究院成功完成国内首个基于全国产化万卡集群训练的万亿参数大模型，并对外开源了基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型TeleChat2-115B。这标志着国产大模型训练实现全国产化替代，进入自主创新、安全可控的新阶段。
来源：IT之家

4.Voyage-3 系列嵌入式 AI 模型登场：1/2.2 成本、1/3 嵌入维度下性能超 OpenAI v3 Large 模型 7.55%

Voyage AI 公司推出了 Voyage-3 和 Voyage-3-Lite 两个嵌入式AI模型，这些模型在技术、法律、金融、多语言应用和长文本理解等方面表现出色，提供高效、易集成的解决方案。Voyage-3 以更低的成本和嵌入维度，性能超越 OpenAI 的 v3 Large 模型。Voyage-3-Lite 在检索准确性上也优于 OpenAI 模型，且成本和嵌入维度更低。
来源：IT之家

文章讲述了电商平台Etsy如何从手工艺品交易市场转变为AI生成虚拟产品的聚集地。Etsy最初由Robert Kalin创立，专注于手工艺品的在线交易，但随着AI技术的发展，平台上出现了大量AI生成的虚拟产品，如数字贺卡和虚拟背景等。这导致了传统手工艺品创作者的生存空间受到挤压，引发了关于原创性和平台定位的讨论。Etsy最终更新了商品分类方式，允许AI生成产品的存在，但要求透明标注。
来源：凤凰网科技

6.未来几年OpenAI或将把ChatGPT的订阅价格提高到44美元

OpenAI计划提高ChatGPT订阅价格，预计到2029年每月收费将达到44美元。这一决策反映了投资者对公司缩小亏损的压力，尽管OpenAI月收入达到3亿美元，但预计今年将亏损约50亿美元。价格上涨可能会影响用户增长，因为许多用户认为目前每月20美元的价格已经过高。
来源： cnBeta

7.微软 OneDrive 中的 Copilot 现已全面可用

微软OneDrive的Copilot功能已全面对所有商业用户开放，提供AI驱动的文件处理能力，旨在提高工作效率。用户可通过Copilot生成文档摘要、比较多个文件差异，并回答有关存储文件的复杂问题。该功能需要商业Copilot许可证，因此仅限商业用户使用。
来源： cnBeta

8.Gemini将让Gmail的智能回复更智能甚至可以不碰键盘

Google为Gmail的Android和iOS版本引入了名为Gemini的更新，该更新通过考虑整个电子邮件线程的内容，提供更详细的智能回复。这项新功能旨在节省时间并提高回复的多样性，同时支持即时编辑和发送。目前，此功能仅对Gemini Business、Enterprise、Education、Education Premium和Google One AI Premium用户开放，并且只有英文版。
来源： cnBeta

9.三星高管：2025年将是AI普及元年

三星Galaxy AI项目负责人Young Jip Kim表示：“2025年将是AI普及元年，未来AI将出现在生活的每个角落”。Kim在采访中表示：“消费者对于AI技术的期望不断拔高，而大多数科技公司都在这方面非常努力。AI技术的蓬勃发展，将会进一步扩充聊天互动之外的方式，用更多元化的方式、更先进的技术变革我们的日常生活”。
来源：科创板日报

10.苹果将于春季推出新款智能家居设备能够支持AI功能

据报道，计划在2025年春季推出一款新的智能家居设备，该设备将结合iPad、Apple TV和HomePod的功能。这款新的智能家居设备代号为J490，并被称“HomeAccessory”，目前有一个方形显示屏和一个内置摄像头，可用于视频会议，用于识别可以控制的手势和识别用户，其上市时可能会被赋予一个新的名字。
来源：科创板日报

2024.9.27

1.初创公司 Redbird Software 推出人工智能数据分析平台

Redbird Software Inc.是一家由风险投资支持的初创公司，今天推出了一个名为Redbird的人工智能驱动的数据分析平台。这个平台能帮助公司在数据中找到有用的模式。该公司在完成了由Y Combinator支持的760万美元种子轮融资大约两年后，达到了这个产品里程碑。
来源：柒柒AI导航

2.谷歌实验室为人工智能笔记助手 NotebookLM 添加了视频和音频输入

Google Labs为其人工智能笔记和研究助手NotebookLM推出了新功能，包括直接上传YouTube视频URL和音频文件的能力，此外还支持文本、PDF、Google文档和网页。NotebookLM利用Google强大的Gemini 1.5大型语言模型的多模态能力，增强笔记、组织想法并从源材料中提取洞见。
来源：柒柒AI导航

3.Airtable 刚刚推出了一个可以改变你工作方式的 AI 平台

Airtable 发布了一个新的企业级人工智能平台，它能够将 AI 集成到关键的业务流程中，使企业能够更高效地利用 AI 技术。这个新平台包括了应用库和 HyperDB 等新功能，其中应用库可以让用户创建标准化的 AI 应用，而 HyperDB 可以整合超过一亿条记录的大型数据集。
来源：柒柒AI导航

4.Gaxos 为游戏开发者推出 Gaxos Labs AI 开发工具

Gaxos公司推出了Gaxos Labs AI，这是一套新的AI开发工具，旨在帮助游戏开发者加速开发流程、提高玩家创造力并增加收入。这些工具包括一个生成性AI资产编辑器和Unity插件，使开发者能够快速创建和管理AI生成的游戏资产。
来源：柒柒AI导航

5.猫眼娱乐发布首个长剧本解析AI工具“神笔马良”，可一键生成电影动态故事板

9月27日消息，猫眼娱乐发布了首个面向长剧本解析的动态故事板AI生成工具“神笔马良”。据悉，该产品可根据用户上传的剧本，进行一键智能分析、智能角色创作、智能分镜创作、智能台词朗读，实现剧本内容的视听化呈现。
来源：环球网

6.美图公司旗下 AI 短片创作工具 MOKI 开放：覆盖动画短片、网文短剧、故事绘本等

美图公司推出的AI短片创作工具MOKI于2024年9月26日向所有用户开放。该工具专注于AI短片创作，支持动画短片、网文短剧、故事绘本、MV等视频内容的生成。MOKI通过输入故事梗概或导入脚本，自动生成分镜脚本和画面，并在后期制作阶段生成带有配乐的视频内容。
来源：IT之家

7.黑石集团将投资近千亿元在英国建设全欧最大规模的AI数据中心

黑石集团计划在英国诺森伯兰郡布莱斯地区投资100亿英镑建设欧洲最大的人工智能数据中心之一，预计将创造约4000个就业岗位。英国首相斯塔默称赞此举是“对英国投下的巨大信任票”，显示英国商业开放态度。黑石集团还承诺额外投资1.1亿英镑用于地区技能培训和交通基础设施。
来源：财联社

8.谷歌公布鲸鱼声音识别 AI 科研模型，可辨别 8 种不同鲸群

谷歌开发了一种AI模型，能够识别8种不同鲸鱼的叫声，包括座头鲸、虎鲸、蓝鲸等。该技术主要用于海洋学术研究，帮助科研团队获取难以观察的鲸群行为模式。模型已公开供学术人员下载使用。谷歌自2018年起与美国国家海洋和大气管理局合作，最初针对座头鲸开发检测模型，后扩展至其他鲸种。模型通过将音频转换为时频谱，利用梅尔刻度法调整声音频率，并加入背景声音训练以提高识别准确率。
来源：IT之家

9.中国信通院、北邮与清华联合发布开源具身智能操作系统

中国信通院、北京邮电大学与清华大学联合发布了一款名为有形具身智能操作系统（Embodied Operating System，简称EOS）的开源智能机器人操作系统。EOS专为具身智能体设计，具备实时操作系统内核，支持国产芯片，强调自主可控和开源开放。它旨在满足实时性、安全性以及智能交互的需求，为开发者提供低门槛的开发范式，并为用户提供AI原生的人机交互体验。
来源：中国信通院

10.一AI音频公司声明：三只羊录音门嫌疑人使用其产品，对卢某录音克隆

Reecho睿声公司声明，三只羊“卢某录音门”事件中的音频系嫌疑人王某使用其AI配音平台克隆。Reecho睿声是一家成立不到一年的AI音频公司，强烈谴责不当使用其产品的行为，并已加强安全管控。合肥警方已抓获嫌疑人王某，案件正在进一步侦办中。
来源：凤凰网科技

11.腾讯、同济大学达成合作：共建“大设计大模型行动”，上线大学教授 AI 智能体

腾讯与同济大学合作，在2024年世界设计之都大会上宣布共建“同济-腾讯大设计大模型行动（TT）”，旨在创建设计领域首个全链路设计大模型生态，连接设计院校、专家、产业和消费者，推动教学科研与产业创新。合作初步尝试为“大学教授 AI 智能体”Prof.Lou，能回答设计相关问题。
来源：IT之家

2024.9.26

1.OpenAI 首席研究官随首席技术官 Mira Murati 离职而离职

OpenAI 的首席研究官 Bob McGrew 和研究副总裁 Barret Zoph 在首席技术官 Mira Murati 宣布离职的同一天也离开了公司。CEO Sam Altman 在一篇博客文章中透露了这些高层变动，并宣布了领导层的过渡计划。他强调这些决定是独立且友好的，但时机的巧合使得他们决定一起进行，以便平稳过渡到下一代领导层。
来源：柒柒AI导航

2.Reddit 正在向数十个新国家推出人工智能自动翻译

Reddit正在将其由机器学习驱动的翻译服务扩展到欧洲、亚洲和拉丁美洲的35个新地区，这一举措旨在将这个主要使用英语的社交网络开放给更多的用户。这项服务是在Reddit首次为法语使用者推出全站翻译功能近五个月之后推出的，尽管该公司此前已允许用户翻译几种不同语言的个别帖子。
来源：柒柒AI导航

3.艾伦人工智能研究所推出全新 Molmo 系列开源多模态模型

艾伦人工智能研究所（Allen Institute for AI，简称Ai2）发布了一个名为Molmo的新型开源多模态语言模型系列，这些模型能够处理文本和图像。Molmo系列包含四种神经网络模型，参数数量从1亿到72亿不等。这些模型不仅能够回答自然语言提示，还能进行多模态处理，例如识别图像中的对象、计数和描述。
来源：柒柒AI导航

4.陈睿：B站已上线自研大模型 index 并应用于 AI 字幕，具备近 10 种语言实时翻译能力

B站已推出自研大语言模型index，应用于AI字幕，支持近10种语言实时翻译，准确度接近90%。B站CEO陈睿强调开源生态的重要性，认为AI是年轻人最关注的内容之一。B站第二季度日活用户达1.023亿，月活用户3.36亿，各业务板块均实现增长。
来源：IT之家

5.阿里推出角色可控视频合成框架MIMO

MIMO 是由阿里巴巴集团智能计算研究所推出的角色可控视频合成框架。它能够根据用户简单的输入，如单一图像、姿势序列或单一视频/图像，合成具有控制属性（例如角色、动作和场景）的逼真角色视频。
来源：柒柒AI导航

6.Meta 推出新款混合现实 Quest 3S 耳机、更新的 AI 模型和下一代 AR 眼镜

Meta在2024年的Connect大会上宣布推出Quest 3S头显、Ray-Ban Meta智能眼镜的AI升级、更新的AI模型以及Orion AR眼镜原型。Quest 3S提供更高的分辨率和更长的电池续航，而Ray-Ban Meta眼镜增强了助手功能。Meta AI更新允许跨平台对话，Llama 3.2模型结合视觉和语言能力。Orion AR眼镜展示了Meta在AR技术小型化方面的进展。
来源：柒柒AI导航

7.我国团队打造糖尿病专用 AI 模型，助力个性化糖尿病护理

上海交通大学清源研究院与复旦大学附属中山医院合作开发了一款名为Diabetica的糖尿病专用AI模型。该模型通过结合强大的语言处理能力和糖尿病领域的专业知识，为医生、患者和医疗机构提供智能支持，助力个性化糖尿病护理。
来源：IT之家

8.全国首例AI生成声音人格权侵权案、AI陪伴案

本文报道了两起与人工智能相关的法律案件。第一起是全国首例AI生成声音人格权侵权案，配音师殷女士发现网络平台上未经授权使用其声音的AI产品，最终法院判决侵权方赔偿25万元。第二起是AI陪伴案，公众人物何某发现自己被用作AI陪伴者，法院判决软件公司赔偿经济损失和精神损失共计20.3万元。两案均强调了在AI技术应用中需尊重和保护个人人格权。
来源：凤凰网科技

2024.9.25

1.OpenAI 推出高级语音模式，提供更多声音和新外观

OpenAI宣布将向ChatGPT的付费用户推出增强语音模式（Advanced Voice Mode，简称AVM），这项功能将使ChatGPT的语音交互更加自然。AVM最初将向ChatGPT Plus和Teams用户推出，企业版和教育版用户将在下周开始获得访问权限。
来源：柒柒AI导航

2.Spotify 的 AI 播放列表功能即将登陆美国及更多市场

Spotify 将其人工智能（AI）播放列表功能扩展到美国、加拿大、爱尔兰和新西兰，此前该功能已在英国和澳大利亚的高级订阅用户中推出。这项功能目前处于测试阶段，可在 Android 和 iOS 设备上使用，允许用户根据书面提示创建个性化播放列表。
来源：柒柒AI导航

3.Snapchat 利用谷歌 Gemini 为其聊天机器人的生成 AI 功能提供支持

Snapchat已经与Google Cloud扩展了合作关系，利用Google的Gemini AI为Snapchat的“My AI”聊天机器人提供支持，使其能够理解文本、音频、图像和视频等不同类型的信息。Gemini AI为Snapchat的聊天机器人提供了类似Google Lens的功能，例如翻译外国街道标志的照片或从菜单中选择最健康的选项。
来源：柒柒AI导航

4.Tabnine 引入了 AI 代理，可根据 Jira 问题生成和验证代码

Tabnine，一家为开发者提供人工智能代码补全工具的公司，宣布了两个与Atlassian公司的Jira集成的AI代理的正式发布。这些AI代理能够根据Jira问题生成和验证代码。Jira问题通常是开发者接收代码更新需求的主要来源，并且通常以自然语言提供。
来源：柒柒AI导航

5.谷歌推出用于客户参与的全新生成式人工智能创新和 Workspace 中的 Gemini

Google Cloud在2024年9月24日宣布了一系列新的生成式人工智能（AI）模型，这些模型专门针对客户参与应用程序，并集成在其Contact Center AI服务中。这一新推出的客户参与套件在Google的虚拟Gemini at Work在线活动中公布，由Google最先进的生成式AI模型家族Gemini提供支持。
来源：柒柒AI导航

6.微软推出“值得信赖的人工智能”功能，以修复幻觉并增强隐私

微软公司在2024年9月24日宣布了一系列新的人工智能安全特性，这些特性被统称为“Trustworthy AI”，旨在解决AI安全、隐私和可靠性方面的日益增长的担忧。这些新特性包括Azure OpenAI服务的机密推理、增强的GPU安全性以及改进的AI输出评估工具。
来源：柒柒AI导航

7.百度全面升级百舸 AI 异构计算平台 4.0、千帆大模型平台 3.0

2024年百度云智大会上，百度宣布全面升级百舸AI异构计算平台4.0和千帆大模型平台3.0，以支持大模型产业落地。百舸4.0提高了算力管理能力，缩短了集群准备时间，优化了故障处理和推理效率。千帆3.0则增强了模型调用、开发和应用开发服务。同时，百度还升级了智能客服、数字人和代码助手等AI原生应用产品。
来源：IT之家

8.谷歌发布两款Gemini 1.5升级生产级模型

谷歌发布了两款升级版的Gemini模型：Gemini-1.5-Pro-002和Gemini-1.5-Flash-002，这些模型基于之前在Google I/O上发布的Gemini 1.5进行了重大改进。新模型在生产环境中表现更好、更快、成本更低，尤其在数学、长上下文和视觉方面有显著提升。此外，谷歌降低了模型的输入和输出费用，并提高了输出速度和降低了延迟。
来源：腾讯网

9.好莱坞著名导演詹姆斯·卡梅隆宣布加入Stability AI，成为其董事会成员

好莱坞著名导演詹姆斯·卡梅隆宣布加入Stability AI，成为其董事会成员，标志好莱坞对AI技术态度的转变。Stability AI以开源AI模型Stable Diffusion闻名。卡梅隆的加入，以及狮门影业与AI视频公司Runway的合作，显示了AI在影视制作中的潜力和未来趋势。此前，好莱坞曾因担心AI威胁工作而多次罢工抗议，但随着技术的发展，行业开始接受AI作为创新工具。
来源：凤凰网科技

10.国内首个视频大模型Vidu正式开放API，并接入百度智能云千帆平台

国内首个纯自研视频大模型Vidu由生数科技联合清华大学研发，现已开放API并接入百度智能云千帆平台。Vidu能够一键生成长达16秒的视频，具有“主体参照”技术，支持任意主体的一致性生成。自7月上线以来，已获得数万企业用户的接入申请，推动视频大模型的创新和应用场景多元化。
来源：钛媒体

11.医疗领域新添多模态大模型，华大基因开启生物智能时代

华大基因在医疗领域引入多模态大模型GeneT，旨在通过AI技术提升基因检测的准确性和效率。该模型结合基因检测大数据和AI算法，有望降低医疗成本、平衡区域医疗资源。华大基因的GBI ALL理念和“13311i”智能化疾病预防系统，将推动大健康领域的全面进步。
来源：钛媒体

12.百度李彦宏：未来会有百万量级智能体

百度创始人李彦宏表示，智能体是他最看好的AI应用发展方向，“智能体相当于PC时代的网站、自媒体时代的账号，它最明显的特点是门槛足够低，但天花板足够高，可以做出非常复杂非常强大的应用，将来会有数以百万量级的智能体出现，从而形成一个庞大的产品生态。”
来源：科创板日报

13.百度曦灵数字人平台4.0发布：3D超写实数字人价格降至199元

在2024百度云智大会上，百度智能云发布曦灵数字人平台4.0，将3D超写实数字人的价格从万元大幅降价至199元，达到业内最低价。
来源：科创板日报

2024.9.24

1.Cloudflare 推出工具，供网站所有者向抓取其内容的 AI 公司收费

Cloudflare最近推出了名为AI Audit的工具，帮助网站所有者控制他们的在线内容如何被人工智能模型使用，甚至尝试从中获利。这个工具套件允许网站所有者了解AI模型如何使用他们的内容，并决定是否允许AI开发者访问这些内容。
来源：柒柒AI导航

2.OpenAI 首席执行官 Sam Altman 预计超级智能即将出现

OpenAI的CEO Sam Altman在他的个人博客上发表了一篇罕见的文章，阐述了他对人工智能未来的看法。他相信深度学习是有效的，并且能够基于训练数据泛化到多个领域和困难的问题集上，从而帮助人们解决难题，比如修复气候、建立太空殖民地和发现所有物理定律
来源：柒柒AI导航

3.Anthropic 正就筹集新资金进行初步谈判，估值最高可达 400 亿美元

Anthropic，一家致力于开发通用人工智能技术的初创公司，正在寻求以高达400亿美元的估值进行新一轮融资。这一消息来自The Information的一篇报道，援引了一位未具名的现有投资者的话。目前，融资讨论仍处于早期阶段，尚不清楚投资者是否会接受如此高的估值。
来源：柒柒AI导航

4.字节跳动进军视频AI 豆包视频生成大模型发布

字节跳动通过旗下火山引擎发布两款AI视频生成大模型“豆包视频生成-PixelDance”和“豆包视频生成-Seaweed”，面向企业市场。这些模型在视频生成效果上达到业界先进水平，能够处理复杂指令和多镜头切换，保持内容一致性。豆包模型基于DiT架构，具备多镜头语言能力，适配多种设备比例，适用于多种企业场景。
来源：北京日报

5.政府帮助相亲　日本东京推出人工智能相亲系统

日本东京政府推出了名为“东京结缘”的人工智能相亲系统，旨在帮助18岁以上未婚人士寻找伴侣。该系统要求用户支付一定费用并提供个人信息，通过价值观评估进行匹配，并提供专业咨询和线下活动。政府希望通过此系统帮助人们迈出寻找伴侣的第一步。
来源：新华社

6.诺基亚、英伟达、T-Mobile 合作，共建业内首个 AI-RAN 创新中心

诺基亚、英伟达和T-Mobile合作建立了业内首个AI-RAN创新中心，位于美国华盛顿州贝尔维尤市。该中心的目的是利用AI技术提升无线网络性能，包括网络速度、降低延迟和提高可靠性。合作还将探索5G和未来6G技术中GPU和AI的潜力，以及蜂窝网络的计算能力如何服务于AI。诺基亚还与日本软银集团签署了合作备忘录，共同研究AI-RAN和6G技术。
来源：IT之家

7.OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文

OpenAI 发布了 MMMLU 数据集，这是一个多语言大规模多任务语言理解的数据集，旨在评估大型语言模型（LLMs）在不同语言、认知和文化背景下的性能。MMMLU 覆盖了广泛的任务和语言，包括简体中文，支持对模型进行深层次的认知能力的测试。
来源：IT之家

8.全球首个 AI 自动水下潜航器开始测试，海上风电场检查时间可缩短 50%

Beam公司开发了全球首个AI驱动的自动水下潜航器(AUV)，用于海上风电场检测，预计能将检测时间缩短50%。该技术在苏格兰Seagreen风电场进行了测试，展现了其自主性和高效性。Beam计划在2025年和2026年将这项技术推广至更多船队。
来源：品玩

9.美国政府与英伟达、OpenAI、Meta等合作建立1亿美元人工智能合作关系

美国国务卿安东尼-布林肯宣布与私营部门合作，提供1亿美元资金以扩大全球人工智能技术的覆盖面。该合作旨在通过技术计算、能力和环境投资，让中低收入国家的开发人员能够开发符合当地需求的人工智能模型和应用程序。资金将用于获取范围扩大、人工智能治理框架建设、教育和文化交流。
来源：美国新闻网

10.腾讯推出第五代机器人，可完成行走、搬运物体等动作

腾讯Robotics X实验室发布第五代机器人“5号”（The Five，小五），这是一款人居环境机器人，具备行走、搬运物体等能力，旨在与人居环境和谐相处。小五集成了多项自研技术，包括四腿轮足复合设计、大面积触觉皮肤、多指灵巧手和安全人机物理交互技术。它能够在不同地形上自主适应，具有强大的负载能力和灵敏的移动操作能力，特别适合辅助老年人。
来源：财中社

11.IBM与NASA联合发布先进气候AI模型Prithvi

IBM和NASA合作发布了名为Prithvi的先进AI模型，专注于气候与天气研究。Prithvi模型在Hugging Face平台发布，旨在提供从即时天气预测到长期气候变化研究的多种用途。该模型具有高分辨率细化模型和重力波参数化模型两个特别版本，能够以少量数据进行微调，提高预测的准确性和效率。Prithvi基于NASA MERRA-2数据集预训练，支持全球、区域和地方尺度的应用。
来源：AIYUN

12.加密货币骗子入侵OpenAI在X上的新闻账户

OpenAI在X上的官方新闻账户被加密货币骗子攻破，发布了虚假的OpenAI品牌区块链代币”$OPENAI”。链接到一个钓鱼网站，鼓励用户连接加密货币钱包，可能用于窃取登录凭据。这不是OpenAI首次遭遇此类攻击。2023年6月，OpenAI首席技术官米拉-穆拉提的账户也发布了类似的虚假消息。
来源：cnBeta

2024.9.23

1.爱诗科技视频生成大模型 PixVerse 全新 UI 发布

爱诗科技今天发布了其视频生成大模型PixVerse的全新用户界面。新UI引入了万能创作浮板，允许用户在任何界面上即刻开始创作，无需频繁切换模块。首页灵感库精选全球创意视频，支持一键套用模板，简化爆款视频复刻过程。
来源：柒柒AI导航

2.美图：“奇想大模型”视频生成能力已完成全面升级，可生成 1 分钟视频

美图公司宣布其“奇想大模型”视频生成能力全面升级，实现视频生成时长、画质、流畅性、真实性及可信度的提升。新功能将逐步覆盖美图秀秀、美颜相机等产品。
来源：IT之家

3.OpenAI学院今日启动目标是实现人工智能应用民主化

OpenAI学院启动，旨在通过提供培训、技术资源和资金支持，实现人工智能应用的民主化。该计划首先关注中低收入国家，支持医疗、农业、教育和金融等领域的AI应用。此外，OpenAI还提供多语言的MMLU基准翻译和API信用，支持全球开发者利用AI解决挑战。
来源： cnBeta

4.Cognition Labs发布Devin AI重大更新：速度、准确性与决策能力显著提升

Cognition Labs发布了Devin AI的重大更新，显著提升了速度、准确性和决策能力。更新包括自动化PR评论回复、MultiDevin并行任务管理、自动知识建议、Custom Devins定制服务和虚拟专用云部署。这些改进使全栈开发、DevOps、代码重构等任务的完成时间缩短了80%。
来源：AIYUN

5.钉钉推出个人会员产品，包含AI搜索、个人AI助理等高级功能

钉钉于2024年9月23日宣布推出“365会员”，面向个人用户提供包括AI搜索、个人AI助理、个人认证等10+项高级功能。会员服务旨在通过AI技术提高个人用户的工作效率和个性化体验。目前会员尝鲜价为19元/月或169元/年。
来源：新浪科技

6.字节Loopy对口型功能在即梦上线

字节跳动开发的Loopy对口型功能已经在其旗下的即梦平台上线。这项技术能够使数字人的声音、表情和情绪与画面完美匹配，提供了非常逼真的对口型体验。与传统的对口型视频相比，Loopy技术解决了声音与画面割裂的问题，让数字人在说话或唱歌时能够自动匹配相应的语气、情绪和表情。
来源：柒柒AI导航

2024.9.22

1.华知大模型5.0发布

华知大模型5.0在上海举行的行业应用研讨会上发布，该模型由同方知网与华为云联合推出，具备更全面的适用场景、更强的推理能力以及更可信的内容生成能力。新版本还引入了智能PPT、AI科技查新、华知APP、3D全息交互数字人等应用。
来源：证券时报网

2.腾讯元器 AI 智能体接入微信公众号，变身 7*24 小时智能客服

腾讯混元宣布推出腾讯元器AI智能体，该智能体可发布至微信公众号，实现与粉丝的实时互动，提供24小时智能客服服务，并能插入公众号文章。用户可通过简单步骤创建智能体，享受智能体商店、低门槛创建、丰富的插件与知识库以及腾讯全域分发等优势。
来源：IT之家

3.Google宣布为全球人工智能教育设立1.2亿美元基金

Google首席执行官桑达尔·皮查伊在联合国未来峰会上宣布设立1.2亿美元的全球人工智能教育基金。他强调了AI在促进信息获取、加速科学发现、气候灾害预警和经济进步方面的潜力，并提出需要避免出现“人工智能鸿沟”。皮查伊同时呼吁对智能产品进行监管，以减轻潜在危害。
来源：cnBeta

4.国产AI出海应用超百款，AI助推IT领域投资金额或达440亿元

2024年2月Open AI发布视频大模型Sora后，国产文生视频大模型迅速发展，半年内约10款产品亮相。市场机构统计显示，今年上半年AI投资金额达到440亿元，同比增长22.4%。国产AI出海应用超过百款，产业链加速拓展海外市场。
来源：钛媒体

5.微软亚洲研究院牵手“600号”，用人工智能干预阿尔茨海默症治疗

微软亚洲研究院与上海市精神卫生中心合作，利用微软Azure OpenAI服务中的多模态大模型，开发了个性化认知训练框架“忆我”（ReMe），旨在通过自动化认知训练延缓阿尔茨海默症等认知障碍疾病的病程进展。
来源：第一财经

6.JetBrains AI Assistant 编程助手正式在国内发布，基于阿里通义大模型

JetBrains在2024云栖大会上发布了基于阿里云通义大模型的JetBrains AI Assistant，专为中国开发者设计，以提升开发效率。该助手集成于JetBrains产品中，支持全链路优化开发，具备代码补全、生成单元测试、上下文感知AI聊天、代码问题检测与修正、文档生成和代码优化等功能。JetBrains保证模型不会在开发者代码库上训练，确保代码安全。
来源：IT之家

2024.9.21

1.全球首个百亿参数级遥感解译基础模型发布

在第一届空天信息技术大会上，中国科学院空天信息创新研究院与鹏城实验室联合发布了全球首个百亿参数级遥感解译基础模型“空天·灵眸”3.0版。该模型能精准提取遥感图像信息并高效转化为可用产品，显著提升遥感数据使用效率。模型采用基于热传导的工作架构，计算速度较传统模型提升2.4倍以上，目前已在多个行业试运行，未来将更广泛地应用于国民经济各行业。
来源：新华网

2.瞄准垂直领域，浩鲸科技“鲸智大模型”重磅发布

浩鲸科技在云栖大会上发布“鲸智大模型”，推出“1+1+4+5+X”技术体系，旨在加速行业数字化转型。该技术体系通过高效适配算力、灵活兼容模型、降低数据成本、提升场景准确性和敏捷支撑下沉场景，助力企业提升效率和质量，降低成本。浩鲸科技与中国信通院签署战略合作协议，共同推进AI技术创新和产业发展。鲸智大模型技术体系包括鲸智文档、BI、代码大模型等，已在多个行业深度赋能。
来源：砍柴网

3.最癫AI社交App上线3天爆火！注册即送百万粉丝，网友警告：别试，上瘾

SocialAI，一款新上线的AI社交App，通过提供机器人粉丝和互动，模拟了社交媒体体验。用户注册即获得百万粉丝，尽管这些粉丝均为AI生成，但互动体验逼真，令人上瘾。该应用由17岁加入Facebook的Michael Sayman创立，旨在提供支持和反馈，改善用户心理健康。目前免费，尚未加入充值氪金功能。
来源：量子位

4.OpenAI 朝 AI 第 3 阶段迈进，正招募人才组建“多智能体”团队

OpenAI 正朝着 AI 第三阶段迈进，计划组建“多智能体”研究团队以提高 AI 能力。该公司研究员诺姆・布朗表示，多智能体系统是 AI 发展的必经之路，旨在通过不同智能体间的协同合作解决复杂问题。同时，谷歌 DeepMind 也在开发类似的 AI Agent，预计未来一两年内投入使用。
来源：IT之家

5.英伟达 NVLM 1.0 引领多模态 AI 变革：媲美 GPT-4o，不牺牲性能平衡文本和图像处理难题

英伟达发布NVLM 1.0系列多模态大型语言模型，通过高质量文本数据集和创新架构设计，实现文本和图像处理的平衡。NVLM 1.0在多个基准测试中表现出色，超越了现有专有模型和开放式模型，推动多模态AI系统发展。
来源：IT之家

6.AIGC产业联盟在京成立推动AI生成内容技术创新与应用

第二十七届北京·香港经济合作研讨洽谈会期间，AIGC产业联盟在京成立，旨在促进AI生成内容技术的创新与应用。联盟将聚焦AI技术在内容创作、媒体传播、数字娱乐等领域的深度应用，并推动石景山区成为全国AI产业应用的先锋。
来源：中国新闻网

7.据报高通公司已向英特尔提出收购要约

高通公司据报向英特尔提出收购要约，但交易尚未确定。英特尔近年面临财务和市场挑战，包括裁员和业绩下滑。高通则在移动处理器市场保持领先，并尝试扩大个人电脑业务。收购可能受到监管机构审查，高通可能需出售部分英特尔股份以满足监管要求。
来源： cnBeta

8.OpenAI o1-preview和o1-mini现已在 GitHub Copilot和GitHub Models中提供

微软GitHub宣布在GitHub Copilot和Models中引入两个新的OpenAI模型：o1-preview和o1-mini。这些模型通过更深入的推理能力，提升了在科学、编码和数学领域的复杂任务解决能力。开发人员可以在VS Code中选择这些模型以优化Copilot体验，或在GitHub Models的Playground中测试并集成到自己的应用中。
来源：cnBeta

9.浪潮信息发布自动驾驶分布式计算框架AutoDRRT 2.0

浪潮信息在边缘计算合作伙伴大会上发布了自动驾驶分布式计算框架AutoDRRT 2.0，该框架针对BEV+Transformer大模型在车端的落地挑战，实现了在计算、通信和IO方面的显著性能提升。此外，文章还提及了人工智能领域的最新动态，包括推理端的发展趋势、AI在游戏领域的应用前景，以及华为鸿蒙应用注册开发者数量的增长。
来源：科创板日报

10.微软希望重启三里岛核电站以满足其人工智能动力需求

微软签署协议重启三里岛核电站，以满足其人工智能数据中心的能源需求。该核电站预计于2028年重新启动，将为微软提供837兆瓦的电力。此举旨在支持微软在2025年前实现数据中心使用清洁能源的计划，并为多个地区的数据中心扩建提供电力。
来源：cnBeta

11.Black Forest Labs以10亿美元的估值融资1亿美元

Black Forest Labs，一家专注于生成式人工智能图像模型的初创公司，据报道正在以10亿美元的估值筹集1亿美元的资金。这家初创公司由Stability AI背后的工程师联合创立，并且已经有了一位知名客户：Elon Musk的X.ai公司，该公司使用Black Forest的 Flux.1文本到图像模型来为其Grok聊天机器人生成图像。
来源：柒柒AI导航

12.AI教育服务公司【精准学】获阿里2亿元人民币的战略投资

精准学，一家专注于AI教育服务的公司，最近宣布完成了阿里巴巴集团2亿元人民币的战略投资，并在云栖大会上展示了其基于阿里通义模型研发的超拟人一对一AI老师产品。该公司自2018年成立以来，已经获得了包括元璟资本和快手在内的多轮融资。
来源：柒柒AI导航

13.Match Global 推出AI职业社交平台Osmos，与 LinkedIn 展开竞争

Match Global 推出了一个名为 Osmos 的人工智能职业社交平台，旨在超越 LinkedIn 成为技术专业人士和企业家的首选平台。Osmos 专注于使用 AI 匹配引擎帮助用户建立更有意义的联系并促进更深入的对话。尽管 LinkedIn 在职业网络领域占据主导地位，但 Osmos 认为 LinkedIn 过于侧重于创作者和视频内容，从而忽视了其帮助人们建立有意义联系的原始目标。
来源：柒柒AI导航

2024.9.20

1.亚马逊推出面向卖家的 AI 助手 Project Amelia

亚马逊推出了名为Project Amelia的人工智能助手，旨在帮助卖家通过回答有关其指标的问题来发展业务，并在后续阶段帮助解决出现的问题。这个助手建立在AWS的Amazon Bedrock上，目前以测试版形式向美国卖家提供，并于周四开始使用。
来源：柒柒AI导航

2.Deepgram 推出语音代理 API，让 AI 对话变得生动有趣

Deepgram 推出了一项新的语音代理API，这项技术能够实现大规模的实时人机自然对话。通过集成语音识别和语音合成的AI模型，Deepgram的系统能够提供类似人类的响应性，并且通过单一API提供完整的服务。用户只需设置提示并告诉系统他们想要执行的任务，系统就会自动处理其余部分。
来源：柒柒AI导航

3.Uniphore 推出 X-Stream，可将 RAG 应用的构建速度提高 8 倍

Uniphore公司推出了名为X-Stream的新产品，这是一个统一的知识服务平台，旨在帮助企业更高效地构建检索增强生成（RAG）应用程序。X-Stream通过提供一个统一和开放的架构，简化了AI数据准备流程，将原本分散的步骤整合为一个无缝过程，减少了对多个工具的需求。
来源：柒柒AI导航

4.腾讯元器推出智能体应用新方向，为公众号打造AI助手

腾讯元器推出新功能，使公众号运营者能通过无代码开发快速创建专属智能体，提供互动、答疑等智能化服务，提升用户体验和运营效率。智能体可应用于数字分身、智能客服等场景，支持个性化语料库和多模态能力。腾讯元宝小程序和APP智能体专区等渠道支持智能体分发，优质智能体有机会获得收益。
来源：DOIT

5.亚马逊面向所有美国客户推出 Rufus 人工智能购物助手

亚马逊宣布其人工智能购物助手Rufus向所有美国客户开放，该助手使用生成式人工智能技术，如ChatGPT，帮助用户做出更明智的购买决策。用户可以通过亚马逊购物应用程序或桌面访问Rufus，提出问题并获得产品推荐。尽管Rufus目前处于测试阶段，但其功能灵活，能够搜索产品详情、客户评论和社区问答，为用户提供多样化的购物建议。
来源：cnBeta

6.摩尔线程开源 OpenCV-MUSA：支持绝大部分 cv::cuda 命名空间下数据结构及 API

摩尔线程宣布其自研统一系统架构MUSA与开源计算机视觉库OpenCV完成适配，发布OpenCV-MUSA开源项目。该项目支持多个模块和大部分cv::cuda命名空间下的数据结构及API，允许开发者通过替换命名空间实现MUSA设备上的相同功能。
来源：IT之家

7.OpenAI o1全方位SOTA登顶lmsys排行榜！数学能力碾压Claude和谷歌模型

OpenAI的o1模型在lmsys排行榜上取得显著成绩，超越GPT-4o成为榜首，尤其在数学、困难提示和编码领域表现突出。o1-mini也与GPT-4o并列第二。lmsys社区认为这是AI领域的里程碑。尽管存在对模型推理时间和社区评分客观性的质疑，o1模型的编码能力在编程竞赛中表现优异，OpenAI公开了o1模型的代码，展示了其推理过程的复杂性。
来源：新智元

8.中国首个音频生成类大模型通过备案

2024年9月20日，上海网信办宣布喜马拉雅音频大模型通过备案，成为全国首个通过网信办生成式人工智能服务的音频生成类大模型。该模型由珠峰AI团队基于自研的LLM框架开发，采用文本音频联合建模技术，具备15秒音色克隆和声音转换能力，以及超拟人、多情感的语音生成能力。
来源：凤凰网科技

9.武汉大学首个人形机器人“天问”亮相：身长 1.7m、体重 65kg、36 个自由度

武汉大学展示了其首个人形机器人“天问”，该项目于3月18日启动，6月完成样机组装并测试。机器人身高1.7米，体重65公斤，具有36个自由度，包括7个自由度的灵巧手。经过数月调试，团队实现了机器人稳定行走的功能。
来源：IT之家

10.英伟达AI Aerial平台瞄准无线网络智能化市场

英伟达的AI Aerial平台通过整合AI技术与无线通信网络，推动蜂窝网络进入智能化新时代，为电商和供应链行业带来变革。该平台提升网络性能，加速5G和自动驾驶车辆等技术部署，优化零售和物流的自动化和数据驱动决策能力。尽管面临投资和数据隐私挑战，AI Aerial平台的潜力巨大，预计能显著提升网络效率和企业战略意义。
来源：AIYUN

11.海通证券：智能体发展前景可期,商业化或将迎来新突破

海通证券的研报预测，到2026年，中国人工智能市场规模将超过260亿美元，并将在多个关键领域实现智能化应用。报告强调了智能体技术的进步，特别是在算力提升的背景下，多模态智能体将推动行业智能化升级，预示着智能体商业化可能迎来新突破。
来源：钛媒体

12.AI热潮将重回巅峰？Wedbush：美联储降息为科技股注入“强心针”！

美联储的降息举措为人工智能（AI）和科技股带来积极影响，推动了纳斯达克100指数及英伟达、博通和阿斯麦等关键AI基础设施公司股价的显著上涨。分析师认为，降息是高科技成长型交易的绿灯，预示着科技和AI领域将迎来前所未有的增长期，未来几年内可能达到1万亿美元的资本支出。
来源：科创板日报

13.古农文垂直领域大语言模型“齐民”发布，基于我国大量农业古籍文本训练

“齐民”大语言模型是由农业农村部农业大数据重点实验室等单位联合开发，基于中国大量农业古籍文本训练而成。该模型旨在挖掘古代农业技术、农耕经验和社会生态知识，支持农业知识问答、文本自动处理和语义检索等应用，为农业古籍研究提供高效分析支撑。
来源：IT之家

2024.9.19

1.YouTube Shorts 将整合谷歌的 AI 视频模型 Veo

YouTube在其“Made On YouTube”活动中宣布，将把谷歌DeepMind的AI视频生成模型Veo集成到YouTube Shorts中。这一新功能使创作者能够通过简单的文本提示生成高质量的背景和六秒钟的视频片段。
来源：柒柒AI导航

2.Lionsgate 与 Runway AI 合作开发定制视频生成模型

Lionsgate 与人工智能视频生成初创公司 Runway AI达成合作，共同开发定制的视频生成模型。这一合作将利用 AI 技术来探索电影制作中的新应用，标志着娱乐产业与 AI 技术的结合迈出了积极的一步。
来源：柒柒AI导航

3.HubSpot 推出一款提升营销效率的人工智能工具Breeze

HubSpot 最近推出了名为 Breeze 的 AI 驱动工具，旨在提升营销、销售和服务团队的工作效率。Breeze 通过集成一个虚拟助手 Copilot，能够根据用户当前的任务提供个性化的见解和建议。这一功能使得用户可以更轻松地生成内容、总结数据和管理客户互动，从而提高工作效率。
来源：柒柒AI导航

4.腾讯的 EzAudio AI 将文本转换为逼真的声音，引发创新和争论

腾讯和约翰霍普金斯大学联合推出了一款名为EzAudio的文本到音频（T2A）生成模型，它能够通过文本提示高效地生成高质量的音效。EzAudio采用了不同于传统使用频谱图的方法，它在音频波形的潜在空间中操作，这使得它在保持高时间分辨率的同时，无需额外的神经声码器。
来源：柒柒AI导航

5.Hume 的 EVI 2 现已推出，带有情感化的语音 AI 和 API

Hume AI公司推出了其最新的情感语音接口EVI 2，这是一个先进的语音人工智能和应用程序编程接口（API）。EVI 2通过使用跨文化的不同说话者的声音录音和自我报告的情感调查结果，创建了一个专有的AI模型，能够提供逼真的声音表达和理解，支持多种语言和方言。
来源：柒柒AI导航

6.SiFive 推出用于高性能 AI 工作负载的 RISC-V 芯片设计

SiFive公司最近宣布了其为高性能人工智能工作负载设计的一系列新型AI芯片。这些芯片属于SiFive Intelligence XM系列，专为加速高性能AI工作负载而设计，是SiFive首次推出的包含高度可扩展AI矩阵引擎的知识产权。
来源：柒柒AI导航

7.阿里通义千问开源 Qwen2.5 大模型，号称性能超越 Llama

在2024云栖大会上，阿里云CTO周靖人发布了通义千问新一代开源模型Qwen2.5，其中旗舰模型Qwen2.5-72B的性能被宣称超越了Llama 405B。Qwen2.5系列包括不同尺寸的语言模型、多模态模型、数学模型和代码模型，提供基础版、指令跟随版和量化版，共计100多个模型。
来源：IT之家

8.中国发布全球首个多模态地理科学大模型“坤元”

中国科学院地理科学与资源研究所联合其他单位发布全球首个多模态地理科学大模型“坤元”，该模型专注于地理科学领域，具备专业语言处理能力，实现地理问题解答、文献分析、数据查询、挖掘分析和地图绘制等功能。该研究所成立于1999年，拥有强大的科研团队和丰富的学术资源。
来源：中国新闻网

9.ChatGPT 推出自动模式，可根据用户提示词自动选择 AI 模型

OpenAI 为 ChatGPT 引入了自动模式，该模式能够根据用户输入的复杂性自动选择最合适的 AI 模型。用户可以选择使用最先进的模型或更快的模型以节省时间。这一更新旨在改善用户体验，让用户在不同情况下都能获得最佳的交互效果。
来源：品玩

10.传音控股与联发科技携手共建人工智能联合实验室，加速推进端侧AI技术创新

传音控股与联发科技合作成立人工智能联合实验室，旨在整合双方技术资源，推动AI技术在智能终端的应用。实验室将专注于大型语言模型、Agent智能体、AI语音、影像等领域的创新，提供端侧部署和优化方案。传音控股利用其在新兴市场的优势，提供算法和应用场景支持，而联发科技则提供芯片设计和算力平台，共同探索AI智能体服务和手机端应用场景，加速AI技术在智能手机领域的融合和创新。
来源：证券时报网

11.普渡初代类人形机器人 PUDU D7 发布：算力 200 TOPS、自由度 30 DOF

普渡机器人公司发布了初代类人形机器人PUDU D7，该机器人具备仿生双臂和全向移动底盘，能在多个场景中执行复杂任务。PUDU D7预计在2025年商业化，拥有30个自由度，负载能力达10公斤，定位精度0.1毫米，续航超过8小时，具备AI智能交互和学习能力。
来源：IT之家

12.巨人网络发布两款“游戏+AI”自研大模型应用

9月19日，2024云栖大会在杭州开幕，巨人网络携多项“游戏+AI”新成果首次参展，两款自研大模型GiantGPT、BaiLing-TTS应用首发，巨人摹境、AI数字人等AI新技术亮相。据介绍，GiantGPT是专注于游戏业务的垂类大模型，结合高质量自有数据与互联网公共数据训练，并针对角色演绎、情景推理、长期记忆等基础能力进行深度优化。
来源：36氪

13.Anthropic即将发布“Claude Nest”桌面应用，并集成VSCode新功能

Anthropic即将推出名为“Claude Nest”的桌面应用程序，该程序将集成VSCode的新功能，允许用户通过专属扩展将工件无缝导出至VSCode环境，预计能显著提升开发者的工作效率和体验。
来源：AIYUN

14.精准学发布全球首个超拟人一对一AI老师

在2024云栖大会上，精准学集团发布“超拟人AI一对一老师”，基于其自研的语音端到端“心流大模型”打造。精准学集团创始人&CEO杨仁斌表示，其价值是让AI最大化还原真人老师，能够一对一辅导孩子进行个性化的学习。
来源：科创板日报

15.通义千问三款主力模型再降价最高降幅85%

9月19日消息，继5月首次大幅降价后，阿里云百炼平台上的三款通义千问主力模型9月19日再次降价。Qwen-Turbo价格直降85%，低至百万tokens0.3元，Qwen-Plus和Qwen-Max分别再降价80%和50%。阿里云表示，降价后，Qwen-Plus同等规模较行业价格低84%。
来源：财联社

16.快手可灵 AI 发布 1.5 模型：新增“运动笔刷”，支持生成 1080p 视频

9月19日消息，快手可灵AI今天面向全球发布1.5模型，新增”运动笔刷”功能，可为图片中的元素指定运动轨迹和静止区域，提升画面可控性。同时，可灵1.5模型在画面质量、动态质量、文本响应度等方面均有大幅提升，支持生成1080p高清视频，构图更美观、动作更合理。
来源：柒柒AI导航

17.阿里通义万相视觉生成大模型升级，支持文生视频、图生视频等

阿里云在2024年杭州云栖大会上宣布对通义万相Wanx 视觉生成大模型进行全面升级，新增了文生视频和图生视频功能。文生视频允许用户通过输入任意文字提示生成高质量的动态视频，支持中英文多语言输入，并能根据灵感扩写功能智能丰富视频内容
来源：柒柒AI导航

2024.9.18

1.Mistral 推出免费套餐，供开发人员测试其 AI 模型

Mistral AI，一家总部位于巴黎的初创公司，最近推出了一项新的免费套餐，允许开发者使用其人工智能模型进行微调和构建测试应用程序。这一举措是该公司为了吸引开发者而进行的一系列更新的一部分，包括大幅降低通过API端点访问其AI模型的价格，并在其免费的消费者AI聊天机器人le Chat中增加了图像处理功能。
来源：柒柒AI导航

2.Snap 为创作者推出 AI 视频生成工具

Snapchat 在其年度合作伙伴峰会上宣布推出一款新的人工智能视频生成工具，旨在帮助创作者从文本提示生成 AI 视频，并很快将支持从图像提示生成。这项工具将首先在网页上以 beta 版本提供给一小部分创作者使用，目前没有计划向创作者之外的用户开放。
来源：柒柒AI导航

3.Arzeda 正在利用人工智能设计天然甜味剂等的蛋白质

Arzeda 是一家专注于利用人工智能设计蛋白质的公司，由华盛顿大学贝克实验室的研究人员于2009年创立。该公司不仅关注生物医学应用，还致力于重新设计化学密集型产品，以使用更可持续的、由AI设计的蛋白质和酶。
来源：柒柒AI导航

4.谷歌将在多项服务中推出检测人工智能生成的图像的功能

Google计划在其搜索引擎和广告系统中实施C2PA技术，以验证媒体文件的真实性。C2PA（内容来源和真实性联盟）是一个由英特尔、苹果等公司于2021年成立的行业组织，旨在开发一种技术标准，通过附加元数据文件（称为清单）来确定图像是否使用人工智能生成或在创建后被修改。
来源：柒柒AI导航

5.人力资源提供商 Magnit 推出人工智能助手 Maggi

Magnit，一家总部位于旧金山的全球人力资源提供商，推出了一款名为“Maggi”的人工智能助手，旨在简化和加速招聘流程。Maggi是首个在人力资源管理行业推出的此类工具，它允许招聘经理通过单一界面访问数据、人才搜索和劳动力管理工具，主要针对季节性和临时职位的招聘。
来源：柒柒AI导航

6.ClickUp 推出人工智能“万能”聊天功能，与 Slack 和 Teams 展开竞争

ClickUp，一家位于加利福尼亚州圣地亚哥的项目管理软件公司，推出了ClickUp Chat，这是一个集成了团队沟通功能的AI驱动聊天工具，直接嵌入到公司的项目管理平台中。ClickUp Chat的推出旨在通过提供AI支持的建议、摘要和其他功能，来改善工作场所的沟通和生产力，从而与Slack和Microsoft Teams等竞争对手区分开来。
来源：柒柒AI导航

7.人工智能除草机器人威胁 370 亿美元的市场

全球农业部门正迅速采用人工智能技术来减少化学除草剂的使用，这一趋势可能对价值37亿美元的除草剂市场产生显著影响。通过使用AI摄像头识别和精准喷洒入侵性植物，新技术有望将除草剂的使用量减少高达90%。这不仅有助于降低种植者的成本，还有助于减少环境损害，因为化学农药的过度使用会导致作物损害和动物健康问题，甚至引发法律诉讼。
来源：柒柒AI导航

8.YouTube 将推出 AI“一站式服务”：可生成创意、标题、完整视频

谷歌在“Made on YouTube”特别活动上宣布推出一系列AI功能，旨在改变视频制作方式。新功能包括AI驱动的“灵感”选项卡，提供视频概念、标题和缩略图建议；Veo工具，利用谷歌DeepMind技术生成视频背景和短片段；以及“自动配音”功能，支持多语言转换。这些工具预计将于年底或明年年初推出。
来源：IT之家

9.提前6天预测“贝碧嘉”将在浦东登陆！上海AI气象大模型今年已多次精准预测

2024年9月16日，台风“贝碧嘉”在上海浦东登陆，成为1949年以来最强台风。上海AI气象大模型如伏羲和书生·风乌在预测台风路径中发挥关键作用，提前数天准确预测，为防台工作提供重要指引。这些模型利用人工智能技术，通过分析历史气象数据，快速预测天气变化，相比传统模型具有更高的精度和效率。。
来源：中国气象局

10.字节跳动豆包大模型 9 月 24 日发布视频生成模型

字节跳动宣布将在9月24日发布豆包大模型的视频生成模型，并将在深圳举行的火山引擎AI创新巡展上展示其进展和AI产品的最新动态。同时，将分享多个行业企业AI落地实践。
来源：品玩

11.沙特阿美同 AI 芯片创企 Groq 签署备忘录，将在沙特建设全球最大推理数据中心

沙特阿美与AI芯片初创公司Groq签署备忘录，计划在沙特建设全球最大的推理数据中心。该数据中心将利用沙特的能源价格优势和建设空间，预计于2024年底建成，初期将配备19000个Groq的LPU处理器，处理能力将在未来几年内大幅提升。沙特阿美将提供资金支持，Groq首席执行官强调合作对AI发展的贡献。
来源：IT之家

12.字节跳动回应与台积电合作AI芯片：报道不实

针对媒体报道的字节跳动计划与台积电就AI芯片开展合作，字节方面回应《科创板日报》表示，报道不实，字节跳动在芯片领域确实有一些探索，但还处于初期阶段，主要是围绕推荐、广告等业务的成本优化，所有项目也完全符合相关的贸易管制规定。
来源：科创板日报

13.Snap 发布第 5 代 Spectacles AR 眼镜：集成 OpenAI 多模态 AI 模型，支持语音控制

Snap公司发布了第五代Spectacles AR眼镜，该产品集成了OpenAI的多模态AI模型，支持语音控制和AR滤镜。新眼镜通过叠加AR效果覆盖用户周围环境，并通过语音指令和手势进行控制。尽管技术先进，但重量和电池续航限制了其普及。
来源：IT之家

2024.9.17

1.Sam Altman离开OpenAI董事会下属安全与安保委员会

OpenAI宣布其首席执行官Sam Altman将离开安全和保障委员会，以增强委员会的独立性。委员会现由卡内基梅隆大学Zico Kolter领导，成员包括Quora CEO Adam D’Angelo、前美国国家安全局局长Paul Nakasone等。委员会负责审查模型产品，有权推迟新模型发布，以确保安全。最近审查了被评为”中等风险”的o1模型。OpenAI致力于提高透明度和与外部团体合作，统一安全实践。
来源：cnBeta

2.微软的Office组件正在获得更多实用的Copilot AI功能

微软推出Microsoft 365 Copilot包月套餐，增强Office组件的AI功能。Excel集成Python，PowerPoint改进叙事构建器，Word提升AI草稿生成能力，Outlook收件箱整理功能。Excel的Copilot和Python集成公开预览，Teams的Copilot将总结会议对话，Word和OneDrive的Copilot功能也得到增强。微软表示，财富500强企业中有60%使用Copilot，用户数量翻倍。沃达丰为员工购买大量许可证。
来源：cnBeta

3.Runway 宣布推出适用于其视频生成 AI 模型的 API

Runway 宣布推出其最先进的视频生成模型Gen-3 Alpha Turbo的API接口，目前处于早期访问阶段。这使得公司能够将该模型直接集成到自己的应用程序、平台和服务中，便于开发者和其他员工在日常工作中使用他们熟悉的工具创建新视频内容。
来源：柒柒AI导航

4.Slack 推出人工智能聊天机器人和自动化工作流程

Slack在其协作平台中引入了一系列人工智能功能，旨在为知识工作者节省时间。这些更新是在Salesforce的Dreamforce 2024产品活动之前公布的。新增功能包括名为Agentforce Agents的聊天机器人集合，它们是Salesforce上周推出的更广泛AI功能包的一部分。这些聊天机器人嵌入了新的机器学习功能，以提高用户生产力。
来源：柒柒AI导航

5.Luma 在 Runway 开幕数小时后宣布 Dream Machine API，AI 视频竞争愈演愈烈

Luma AI，一家由前Google、Meta、Adobe和Apple工程师创立的旧金山初创公司，宣布推出了其Dream Machine视频生成模型的应用程序接口（API）。这一动作紧随其竞争对手Runway宣布自己的API之后。Dream Machine API允许用户构建应用程序和服务，利用Luma的热门视频生成模型，这可能会将AI视频技术带到全球更多的应用程序、团队和用户手中。
来源：柒柒AI导航

6.微软宣布更新 AI 驱动的 365 Copilot，其中包含 Pages 和自主代理

微软宣布对Microsoft 365应用的AI驱动Copilot进行更新，引入自主代理功能，以自动执行业务流程。Copilot Pages旨在促进团队协作，通过大型语言模型从Business Chat引入信息，构建共享页面。同时，Excel、PowerPoint、Teams、Outlook和Word等应用程序也获得AI更新，简化了自主代理的构建过程。
来源：柒柒AI导航

2024.9.16

1.消息称字节跳动计划与台积电合作，2026 年前量产两款自主设计 AI 芯片

字节跳动计划与台积电合作，目标在2026年前量产两款自主设计的AI芯片，以减少对英伟达芯片的依赖，加速AI模型的开发和运行，以期在中国AI聊天机器人市场保持领先地位。
来源：IT之家

2024.9.15

1.消息称 OpenAI 明年调整结构，转变为传统的营利性公司

OpenAI计划在保留非营利部门的同时，转变为传统的营利性公司。创始人山姆·阿尔特曼在员工会议上宣布了这一决定，但未透露更多细节。尽管如此，公司发言人强调，OpenAI仍致力于构建造福所有人的AI，非营利性部门将继续存在。自2015年成立以来，OpenAI一直依赖捐赠，但面临资金与研究成本不匹配的问题。
来源：IT之家

2.微软发布Windows Agent Arena 为生成式AI代理提供基准测试

微软研究院发布了Windows Agent Arena，这是一个专为Windows PC上测试人工智能代理的基准。该基准测试框架评估AI代理与Windows应用程序的交互能力，包括浏览器、文件资源管理器、编码应用等。微软还开发了多模式代理Navi进行测试，但成功率低于人类。此基准旨在推动AI代理更接近人类水平。
来源：cnBeta

3.英伟达开源Nemotron-Mini-4B-Instruct小语言模型

英伟达开源了Nemotron-Mini-4B-Instruct AI模型，这是一个专为角色扮演、检索增强生成（RAG）及函数调用等任务设计的小语言模型（SLM）。通过剪枝、量化和蒸馏技术优化，使其小巧高效，特别适合设备端部署。模型在Minitron-4B-Base上微调，能处理4096个上下文窗口词元，生成长且连贯的回复。基于Transformer解码器架构，适合对话生成等任务。
来源：凤凰网科技

2024.9.14

1.国家网信办就人工智能生成合成内容标识办法公开征求意见

国家互联网信息办公室发布《人工智能生成合成内容标识办法（征求意见稿）》，旨在规范AI生成内容的标识，保护公民和组织的合法权益，维护社会公共利益。该办法规定了显式和隐式标识要求，明确了服务提供者的责任，并鼓励平台采取相应措施。公众可通过电子邮件或信函方式提出反馈，截止日期为2024年10月14日。
来源：中国网信网

2.阿里通义将发布 AI 视频生成大模型，支持文生视频、图生视频

阿里通义计划在2024年云栖大会上发布一款AI视频生成大模型，该模型具备“文生视频”和“图生视频”两种创作模式。目前，通义App和PC端已开放预约，但尚未提供使用。预约成功后，用户将获得通知及66灵感值作为奖励。
来源：IT之家

3.加速蛋白质工程，微软开发蛋白突变效应预测AI框架µFormer

微软研究院科学智能中心的研究人员开发了深度学习框架µFormer，用于预测蛋白质突变效应，以加速蛋白质工程。该框架结合预训练的蛋白质语言模型和定制评分模块，预测高阶突变体和上位相互作用，处理插入问题，并与强化学习框架结合，探索广泛的突变空间，设计活性增强的蛋白质变体。研究发表在bioRxiv上。
来源：机器之心

2024.9.13

1.OpenAI 发布其首款具备推理能力的 AI 模型 OpenAI o1

OpenAI 在今天凌晨1点发布了名为 o1 的新模型（传闻中的‘草莓’模型），这是其首款具备推理能力的 AI 模型。o1 采用了全新的训练方法，结合强化学习和思维链机制，使其在处理复杂问题时能够像人类一样进行深入思考。
来源：柒柒AI导航

2.元象发布中国最大MoE开源大模型落地应用登顶港台榜

元象XVERSE发布了中国最大的MoE开源模型XVERSE-MoE-A36B，具有36B激活参数，实现了100B模型的性能。该模型在训练时间、推理性能和成本效益方面均有显著提升。此外，元象的MoE模型在多个权威评测中表现优异，超越了国内外同类模型。元象还基于MoE模型开发了AI角色扮演APP Saylo，在港台娱乐应用榜上取得了优异成绩。
来源：极客公园

3.美国银行谈 AI 热潮：当前仍处早期阶段，才相当于互联网的 1996 年

美国银行在2024年9月12日发布的报告中指出，人工智能（AI）的繁荣目前处于早期阶段，与20世纪90年代的互联网发展相似。报告基于对超过3000家公司分析师的调查，认为AI是继1981年个人计算机和1994年互联网之后的第三次重大技术周期。尽管当前对AI的怀疑情绪增加，但报告预测生成式AI将在未来5至10年内颠覆各行业，改变全球经济。
来源：IT之家

4.快手：可灵 AI 已累计生成超 2700 万个视频，正内测全新 1.5 版本基础模型

快手的高级副总裁盖坤在投资者日上宣布，其视频生成大模型可灵 AI 用户数已超过260万，累计生成视频超过2700万个。自产品发布以来，经过9次迭代升级，目前正内测1.5版本基础模型。8月27日，盖坤曾报告160万人使用，累计生成视频1600万。8月23日，推出会员订阅计划，提供高表现视频生成等会员专属功能。
来源：IT之家

5.北京市发出首张“具身智能机器人食品经营许可证”

北京市发出首张“具身智能机器人食品经营许可证”，让具有感知和学习能力的智能机器人能够成功进入餐饮市场，为消费者服务。考虑到智能机器人进入餐饮领域后的监管空白，海淀区市场监管局还在全国率先制定了“餐饮服务智能机器人”的管理规范和47项监管项目，确保机器人安全上岗。
来源：财联社

6.文生图 AI Midjourney 雄心：7.0 版未来 1-2 月登场、开发新图像编辑器

Midjourney创始人透露，7.0版本将在1-2月内发布，并计划涉足视频生成。公司注重提高现有技术易用性，开发新图像编辑器、3D系统并探索硬件领域。同时，个性化功能也将推出，为用户提供更个性化的体验。
来源：DoNews

7.谷歌推出DataGemma模型，可嵌入真实世界数据

谷歌发布DataGemma模型，利用真实世界数据提高大语言模型处理数值和统计数据的准确性。该模型通过检索交错生成（RIG）和检索增强生成（RAG）技术，从超过2400亿个数据点中获取信息，确保输出基于现实世界信息，提升模型在处理数值事实和统计查询方面的性能。
来源：中关村在线

8.昆仑万维发布奖励模型 Skywork-Reward，登顶 RewardBench 排行榜

昆仑万维公司发布了两款新的奖励模型Skywork-Reward-Gemma-2-27B和Skywork-Reward-Llama-3.1-8B，它们在RewardBench评估基准上分别排名第一和第三。这些模型在强化学习中用于评估智能体表现并提供奖励信号，对大语言模型训练至关重要，以生成符合人类偏好的内容。Skywork-Reward模型使用来自网络公开数据的偏序数据集，通过微调基座模型获得。
来源：IT之家

9.Cybever 推出基于 AI 的 3D 世界创作平台

Cybever公司宣布即将在本月底推出其基于人工智能的3D世界创建平台的测试版。这个平台旨在简化和民主化3D内容开发，无论是对于创作者还是开发者。它已经吸引了创意工作室和资产市场的广泛关注。
来源：柒柒AI导航

10.Salesforce 宣布推出 Agentforce 自主 AI 代理构建平台

Salesforce 推出了名为 Agentforce 的新型人工智能自主代理平台，该平台旨在增强员工工作并跨服务、销售、市场营销和商务领域处理任务。该平台使用户能够构建可定制的 AI 代理，这些代理可以根据劳动力需求进行扩展，分析数据、做决策、理解客户需求并代表他们采取行动。
来源：柒柒AI导航

11.Hume发布EVI 2，新一代语音语言融合模型

Hume公司近日推出了EVI 2，新一代的语音语言融合模型，它集成了语音处理和文本处理，提供更自然、响应迅速的交互体验。EVI 2在语音质量和响应速度上显著提升，响应延迟平均约500毫秒，情感智能功能更准确理解用户情感背景。开发者可定制声音特性，模型价格降低30%，目前处于测试阶段，未来几周内将优化性能。
来源：AIYUN

12.Gemini的语音聊天模式现已在安卓上免费推出

谷歌宣布向所有安卓用户免费推出Gemini Live语音聊天模式，该功能之前仅限Gemini Advanced订阅用户。用户可通过Gemini应用或叠加层访问，支持语音提问和打断，提供多种语音选择。目前仅提供英语版本，未来将扩展至iOS并支持新语言。
来源：AIYUN

13.全球首台第5.5代COFE+咖啡机器人发布

上海氦豚科技在2024年中国国际服务贸易交易会上发布了全球首款（第5代升级版）COFE+5.5全智能·机器人咖啡馆。其通过人工智能学习，已熟练掌握了世界各国上千个特色咖啡产品配方，实现了产品“一键一秒全球上架”
来源：科创板日报

14.奥尔特曼等一众科技领袖与拜登团队会面！AI跨部门工作组官宣成立

科技领袖与拜登团队在白宫会面，讨论了人工智能基础设施需求。会后，白宫宣布成立跨部门工作组，以促进数据中心发展，确保美国AI领域领导地位。《芯片与科学法案》和《通货膨胀削减法案》也助力制造业增长。能源部将创建团队，引导数据中心利用政府资源，转向清洁能源。谷歌总裁强调能源基础设施对AI领域领导地位的重要性。
来源：财联社

2024.9.12

1.OpenAI 正在洽谈以 1500 亿美元的估值进行融资

OpenAI正在进行新一轮的筹资活动，计划从投资者那里筹集65亿美元，这将使其估值达到1500亿美元。这一估值显著高于该公司今年早些时候的860亿美元估值，使其成为世界上最有价值的初创公司之一。同时，OpenAI也在与银行讨论以循环信贷设施的形式筹集50亿美元的债务。
来源：柒柒AI导航

2.夸克发布全新CueMe 打造“超能写”的智能对话助手

夸克公司于2024年9月12日推出了名为CueMe的全新智能对话助手，该产品基于夸克大模型自主研发，具备强大的AI写作能力。CueMe支持全体裁写作，能够生成高质量内容，满足用户对不同体裁和篇幅的写作需求。
来源：和讯网

3.谷歌为 NotebookLM 增加新功能，利用 AI 生成播客

谷歌为其AI笔记应用NotebookLM新增了Audio Overview功能，该功能能够将文档、幻灯片和图表转化为音频播客。用户可以利用此功能生成文本，并由AI主持人进行对话式播客制作。目前，该功能仅支持英语，且处于试验阶段。
来源：柒柒AI导航

4.小心！AI能「看懂」你的唇语，悄悄话不再安全！

近期，一款名为Readtheirlips的AI软件因其读唇语的能力而受到关注。该软件能够通过分析嘴部运动来识别视频中人物的说话内容。尽管在面对语速过快或非正脸镜头时存在识别误差，但开发团队Symphonic Labs表示将不断改进。目前，该软件支持3分钟以内视频的识别，且识别时间约一分钟。
来源：量子位

5.亚马逊开始在其Rufus生成式人工智能聊天机器人中测试广告投放

亚马逊正在其Rufus生成式人工智能聊天机器人中测试广告投放。Rufus作为购物助手，利用AI帮助用户在亚马逊移动应用中寻找商品。广告将根据搜索和会话上下文显示，旨在帮助客户发现与对话相关的产品。目前，广告测试仅在美国进行，广告商对Rufus内广告的潜力持谨慎态度。
来源：cnBeta

6.中科院研发新型AI模型LLaMA-Omni，或将重塑数字助手交互方式

中国科学院研发的新型AI模型LLaMA-Omni，基于Meta的Llama 3.1 8B Instruct模型，实现了与大语言模型的实时语音交互，有望改变多个行业的交互方式。该模型能处理语音指令并生成文本和语音回应，延迟低，训练资源需求少，对AI行业具有重大意义。尽管面临语言和隐私挑战，LLaMA-Omni的开源将推动AI社区的快速迭代，促进AI技术的普及和多样化应用。
来源：AIYUN

7.做软件比死磕大模型更有商机？红杉资本合伙人眼中的“AI生意经”

红杉资本合伙人Pat Grady认为，未来人工智能领域中十亿美元级公司将主要来自应用层开发，而非大模型构建。尽管红杉资本对基础模型公司如OpenAI和xAI进行了投资，但更看好应用层的商业潜力。Grady强调，优秀的AI应用初创公司会在大模型基础上精心设计产品，如基于AI的客户关系管理软件Day.ai。同时，他指出AI支出超支的一个原因是“科学惊叹效应”，并期待OpenAI即将发布的Strawberry模型。
来源：财联社

8.DomoAI 推出提升图像和视频分辨率的新功能

DomoAI 是一款功能强大的 AI 视频和图像处理工具，它能够将视频和图片转换成多种不同的艺术风格。最近，DomoAI 推出了一个新功能，可以在不损失质量的情况下放大图像和视频，提升分辨率至2K和4K级别的高清画质。这项功能支持最大50MB的文件上传，以及长达60秒的视频处理能力，为用户提供了前所未有的画质提升体验。
来源：柒柒AI导航

9.Adobe 即将推出AI视频生成模型 Firefly Video Model

Adobe公司最近宣布了其创意工具套件的新成员——Adobe Firefly Video Model。这是Adobe在AI视频生成领域的新尝试，它基于公司现有的Firefly生成式AI静态图像模型构建。Firefly Video模型支持文本到视频、图像到视频的转换，甚至包括视频编辑功能，但生成的视频长度限制为最多5秒。
来源：柒柒AI导航

10.AI芯片独角兽“壁仞科技”启动IPO上市辅导，估值达155亿

壁仞科技，一家致力于AI芯片研发的中国独角兽企业，已启动科创板IPO上市辅导，目前估值高达155亿元人民币。自2019年成立以来，该公司已完成超过50亿元人民币的融资，投资方包括启明创投、IDG资本、华登中国、平安集团、高瓴创投、格力创投、松禾资本、云晖资本、国盛资本、招商局资本等知名机构。
来源：柒柒AI导航

2024.9.11

1.Arcee AI 推出 SuperNova：一种可定制、符合指令的企业模型

Arcee AI公司推出了SuperNova，这是一个70亿参数的大型语言模型，专为企业部署设计，具备高级指令遵循能力和完全定制化选项。SuperNova旨在解决企业在使用基于API的AI服务时对数据隐私、模型稳定性和定制化的需求。
来源：柒柒AI导航

2.Stampli 的Cognitive AI旨在自主处理您企业的所有采购订单

Stampli公司在Oracle NetSuite的年度SuiteWorld 2024大会上推出了其最新创新——Cognitive AI，旨在自动化处理企业的所有采购订单。这项技术结合了大型语言模型（LLMs）和精确的商业逻辑，模仿经验丰富的财务专业人员的复杂决策过程，以提高财务自动化的水平。
来源：柒柒AI导航

3.ServiceNow 推出了一个企业 AI 代理库，您可以自定义它以适应您的工作流程

ServiceNow即将对其Now Assist AI平台进行更新，引入一项新功能，允许企业将人工智能（AI）代理集成到他们的工作流程中。这个更新包括一个AI代理库和Now Assist Skill Kit，后者允许客户构建、测试和部署新的生成性AI技能，并将这些技能分配给应用程序。这些AI代理将能够与员工一起管理业务，提供定制化的服务。
来源：柒柒AI导航

4.深圳：鼓励金融企业联合腾讯、华为等科技企业增强AI大模型等技术在金融领域应用

深圳市地方金融管理局就《深圳市关于支持数字金融高质量发展的实施意见（征求意见稿）》公开征求意见。其中提出，鼓励金融科技企业开展数字金融源头创新，推动大数据、云计算、区块链等重点方向新产品在金融领域应用；推进深圳市金融信创攻关基地建设，完成银行、证券、保险等金融机构及合作伙伴信创攻关课题
来源：科创板日报

5.Adobe Premiere Pro 将集成视频生成功能，年底前推出

Adobe 计划在年底前推出由 Adobe Firefly Video 模型驱动的视频生成功能，包括生成续帧、文本转视频和图像转视频。这些功能旨在补充和加速专业创作工作流程，同时确保内容的可控性和安全性。Adobe 强调其工具的可控性，并在初期采取谨慎措施，屏蔽不适宜内容的生成。
来源：IT之家

6.视频大模型Vidu推出“主体参照”功能

生数科技与清华大学联合研发的视频大模型Vidu在2024年9月11日发布了“主体参照”功能，这一功能能够实现对任意主体的一致性生成，无论是人物、动物、商品，还是动漫角色和虚构主体，都能在视频中保持形象的连贯性和一致性。
来源：柒柒AI导航

7.OpenAI“草莓”推理大模型两周内就要上架？用户恐将面临耐心考验

OpenAI计划在两周内推出新型AI模型“草莓”，该模型以推理能力为核心，预计加入ChatGPT服务。“草莓”在复杂问题处理上优于GPT-4o，能进行更深入的思考和细节关注。然而，该模型可能面临用户耐心考验，因为它需要10-20秒的响应时间。此外，“草莓”目前仅支持文字输入输出，未实现多模态交互。
来源：财联社

8.Mistral 发布首款多模态模型 Pixtral 12B

法国人工智能初创公司Mistral发布了首款可处理图像和文本的模型。该模型名为 Pixtral 12B，拥有 120 亿个参数，大小约为 24GB。参数大致相当于模型解决问题的能力，参数越多的模型通常比参数越少的模型性能越好。
来源： cnBeta

9.Audible邀请解说员训练AI语音以加快有声读物的制作速度

Audible正在利用人工智能技术加速有声读物的制作，通过邀请专业解说员训练AI模型来生成“声音克隆”。这些AI克隆可用于快速制作有声读物，同时解说员负责监督质量控制。此举旨在提高有声读物的制作效率，同时确保质量，并通过版税分成模式支付解说员报酬。Audible强调AI技术是作为辅助而非替代人类解说员的工具。
来源：cnBeta

10.百度梁志祥：基于大模型的智能体正为营销行业带来深远变革

在近日召开的2024中国广告论坛上，中国广告协会副会长、百度集团资深副总裁梁志祥表示，基于大模型的智能体正为营销行业带来深远变革，不仅能成为每家企业的“金牌员工”、为每位用户带来“专属助理”，而且智能体搭建门槛低、易分发，可以让营销变得更简单。
来源：36氪

11.20秒内透视30万家公司瑞银用人工智能工具助力并购业务

瑞银集团开发了一种人工智能工具，旨在加速并购交易过程，该工具能在20秒内分析超过30万家公司的数据库。该工具被比喻为并购“副驾驶”，用于提出买方想法和识别潜在买家。尽管瑞银已使用此工具一年，但对支持公司评估、基准测试和财务分析的AI工具测试结果并不理想，且合规风险和责任归属问题使得AI工具的应用变得复杂。
来源：新浪财经

12.Anthropic的Workspaces：为企业AI量身定制的精细化管理工具

Anthropic公司推出Workspaces功能，旨在为企业AI提供精细化管理工具，增强AI部署的控制与灵活性。通过隔离环境、灵活权限控制、精细化成本管理及定制工作流程，Workspaces助力企业AI发展，加速创新，降低风险，提高效率，增强竞争力。Anthropic的Claude Enterprise AI助手以高达50万个标记的上下文窗口，在企业AI市场中展现其数据处理与理解能力。
来源：AIYUN

13.Chai Discovery发布强大的新型开源人工智能模型

Chai Discovery公司推出了新型人工智能模型Chai-1，该模型在分子结构预测方面与AlphaFold 3相媲美，尤其在药物发现和生物研究领域表现出色。Chai-1能够预测多种生物分子结构，并在单序列模式下超越依赖多重序列比对的模型。模型还整合实验数据以提高预测准确性，并通过开源软件库免费提供给学术和商业使用。
来源：AIYUN

14.Nous Research推出优化器DisTrO，降低AI 训练门槛

Nous Research 团队推出了一款名为 DisTrO 的新优化器，旨在降低大模型训练的门槛。DisTrO 通过减少 GPU 间传输的信息量，使得 AI 模型能在普通网络条件下训练，促进全球合作。技术论文显示，DisTrO 将训练效率提升了857倍，信息传输量从74.4GB降至86.8MB，大幅降低训练成本并拓宽了 AI 领域的参与机会。
来源：品玩

15.「Her」主创 Alexis Conneau 宣布从 OpenAI 离职创业

Alexis Conneau，OpenAI版“Her”项目技术负责人和GPT-4o实时音频技术的关键人物，宣布离职创业。Conneau在AI领域有丰富经验，曾在Meta和谷歌工作，专注于语音技术和多模态语言模型研究。他参与了GPT-5的研发，并在OpenAI领导了“Her”项目和GPT-4o的研究工作。离职后，Conneau计划创办新公司，但具体细节尚未透露。
来源：IT之家

16.大模型上车面壁智能端侧大模型支撑梧桐科技智能座舱

近日，面壁智能宣布成为TINNOVE梧桐科技芯算一体AI座舱方案中端侧大模型重要合作伙伴，以其研发的 MiniCPM 车载多模态大模型实现舱驾协控相关的功能控制，这是面壁 MiniCPM 端侧多模态模型首次支撑汽车智能座舱的系统底座。
来源：科创板日报

17.iPhone 16将引爆“换机潮”！Wedbush：苹果市值明年有望达4万亿美元

苹果在秋季新品发布会上推出了iPhone 16系列，这是苹果首款搭载人工智能（AI）功能的手机。尽管初期测评显示AI功能存在一些错误，知名投行Wedbush依然对iPhone 16及其对苹果市值的推动作用持乐观态度，预计2025年苹果市值将达到4万亿美元。
来源：财联社

2024.9.10

1.苹果刚刚发布史上首台 AI iPhone，最大亮点是按键

苹果公司发布了史上首款AI iPhone，即iPhone 16系列，强调了AI功能，包括视觉智能和Apple智能。iPhone 16系列在外观上变化不大，但引入了新的相机控制功能和更窄的边框。Pro系列在影像和性能上进行了升级，包括四棱镜长焦和4K 120fps视频拍摄能力。标准版iPhone 16也得到了升级，包括A18芯片和空间视频录制功能。此外，苹果还发布了Apple Watch Series 10和AirPods 4，均支持更多健康监测和降噪功能。所有新产品均保持了与上一代相同的价格。
来源：爱范儿

2.Salesforce 利用 Industries AI 释放人工智能机器人大军

Salesforce 宣布推出 Industries AI，这是一个全面的人工智能更新，旨在通过自动化平台减轻人类工作者的负担。该平台将嵌入 Salesforce 的所有 15 个云平台，如 Sales Cloud、Data Cloud、Service Cloud、Commerce Cloud 和 Marketing Cloud。
来源：柒柒AI导航

3.SiMa.ai 推出用于网络边缘多模态 AI 的新型片上系统

SiMa Technologies Inc. 推出了一款名为 MLSoC Modalix 的新型系统级芯片（SoC），这是一款专为嵌入式边缘环境中的多模态人工智能（AI）工作负载设计的平台。这款芯片能够支持包括大型语言模型（如 OpenAI 的 GPT 系列）、卷积神经网络、变换器模型等在内的多种 AI 模型
来源：柒柒AI导航

4.AI2 的新模型旨在实现开放、强大且具有成本效益

艾伦人工智能研究所（AI2）推出了一款名为OLMoE的新型开源大型语言模型（LLM），旨在提供既强大又具有成本效益的解决方案。OLMoE采用稀疏混合专家（MoE）架构，拥有7亿参数，但每个输入令牌仅激活10亿参数。它有两个版本：通用版OLMoE-1B-7B和针对指令调整的OLMoE-1B-7B-Instruct。
来源：柒柒AI导航

5.AI超级周期才刚刚开启！AMD苏姿丰：将加速推出AI芯片

AMD首席执行官苏姿丰在高盛的通信和技术会议上宣布，人工智能（AI）的超级周期已经启动，AMD计划加速推出高性能AI芯片以挑战英伟达的市场领导地位。AMD计划在未来几年内推出新一代MI系列芯片，预计到2024年底，仅MI300芯片的销售额就可能达到45亿美元，远超去年的AI芯片收入。
来源：财联社

6.字节再试硬件：探索AI耳机、眼镜等产品，与豆包大模型联动

9月10日消息，字节正在探索将大模型与硬件结合，既自己开发 AI 硬件，也会与外部硬件公司合作。字节 AI 硬件相关团队负责人为 Kayden（花名），他正带领团队开发一款与豆包大模型和豆包 App 联动的智能耳机。Kayden 同时在推动豆包大模型与其它手机厂商的智能助手合作，类似 OpenAI 与苹果的结合。
来源：钛媒体

7.持续构建大模型能力拉勾招聘推出AI模拟面试产品勾小爱

拉勾招聘推出AI智能招聘助手“勾小爱”，利用预训练大模型技术，提供文字和语音面试模拟，支持普通话及方言，旨在提升求职者面试技能和成功率。拉勾招聘此前已推出HRMind和SmartATS等AI招聘产品，致力于提升招聘效率和匹配精准度。
来源：新闻晨报

8.政策供给加码　央企深度“拥抱”人工智能

近期，中央企业在人工智能领域动作频频，通过“AI+专项行动”在电力、油气等关键领域实现人工智能产品密集亮相。国资委强调加强政策供给，支持企业在关键核心技术和前沿领域加大创新力度，推动人工智能产业发展。同时，国资央企与民企、高校院所合作，探索人工智能在生产场景的深度应用。尽管面临技术、数据挑战和应用落地难题，国资委将继续精准施策，推动人工智能产业发展。
来源：经济参考报

9.CancerLLM：癌症领域的大型语言模型

CancerLLM是一款专为癌症领域设计的70亿参数语言模型，由明尼苏达大学和耶鲁大学等机构联合开发。该模型在260万份临床记录和50万份病理报告中进行预训练与微调，覆盖17种癌症类型。CancerLLM在癌症表型提取、诊断生成等任务上表现突出，尤其在资源消耗与生成效率之间找到了平衡点，为癌症治疗带来革命性变化。
来源：AIYUN

10.还在死磕AI咒语？北大-百川搞了个自动提示工程系统PAS

北京大学-百川联合实验室研发的PAS自动提示工程系统，通过高质量的数据集构建、少样本学习、数据筛选和微调，有效提升大语言模型在特定任务上的表现。PAS系统在多个基准测试中表现优异，并且计算效率高，为大模型应用提供了新途径。
来源：机器之心

11.Kimi智能助手Kimi API现已支持联网搜索功能

月之暗面近日宣布，旗下Kimi智能助手的Kimi API现在支持联网搜索功能，这标志着用户可以通过API获取互联网上的信息，从而增强了交互体验。Kimi API的这一更新意味着开发者可以利用这一功能，使应用程序能够“网上冲浪”，即在对话中遇到问题时自动进行网络搜索并提供答案。
来源：品玩

12.Canalys：到2028年全球54%的智能手机出货为AI手机

Canalys报告显示，2024年全球16%的智能手机出货为AI手机，到2028年，这一比例将激增至54%。受消费者对AI助手和端侧处理等增强功能需求的推动，2023年至2028年间， AI手机市场以63% 的年均复合增长率(CAGR)增长。预计这一转变将先出现在高端机型上，然后逐渐为中端智能手机所采用，反映出端侧生成式AI作为更普适性的先进技术渗透整体手机市场的趋势。
来源：科创板日报

2024.9.9

1.顺丰发布“丰语”大语言模型：摘要准确率超 95%，号称物流垂域能力超越通用模型

顺丰科技在国际人工智能展上发布了专为物流行业设计的大语言模型“丰语”。该模型在物流供应链数据训练中表现出色，摘要准确率超95%，显著提高了客服效率和快递小哥问题定位的准确率。此外，“丰语”还能处理多国语言和海关清关标准，优化了物流领域的服务。
来源：IT之家

2.Sora陷研究泥潭？OpenAI一年血亏50亿，高盛报告乌龙引AI股地震！

Sora AI模型因安全风险和好莱坞合作问题陷入研究困境，尚未全面开放。高盛报告误读ChatGPT流量下降，引发AI股抛售。尽管面临挑战，OpenAI仍在与艺术家合作，探索Sora在艺术和电影制作中的应用，预计对行业产生深远影响。高盛撤回AI泡沫言论，认为AI领域存在不确定性，但新竞争者和开源替代方案的出现可能改变现状。
来源：新智元

3.快手可灵AI联合9位知名导演启动首个AIGC电影短片共创计划

快手宣布启动“可灵AI”导演共创计划，与9位知名导演合作，利用AI技术制作9部AIGC电影短片。这是中国首次尝试使用国产视频生成大模型技术进行电影级内容创作。可灵AI自6月发布以来，已服务超160万用户，生成1600万个视频。此次合作旨在探索“人+AI共创”模式，推动影视产业技术变革。
来源：中国新闻网

4.vivo全新蓝心大模型下月发布！落地OriginOS 5

vivo即将在下月的开发者大会上发布全新蓝心大模型，该模型包括多个AI技术领域，如语言、语音、视觉等。AI技术将成为手机操作系统未来五年的核心，vivo将通过OriginOS 5系统提供系统级和场景化的AI体验。蓝心大模型自2023年11月公布以来，已经包括了不同级别的模型，其中70亿级别的模型7B专为手机设计，表现出色。
来源：快科技

5.全球最大商业图库 Getty Images 推出免费高画质照片 AI 训练集

全球最大的商业图库Getty Images宣布推出一个包含3750张高画质照片的免费AI训练数据集，旨在帮助开发者和企业训练AI模型。该数据集分为15个类别，包含商业、教育、医疗健康等主题，并已在Hugging Face上线。Getty Images拥有超过5.72亿张照片，其中2亿多张可用于商业用途，每张图片均附有结构化的元数据和关键词，以降低侵权风险。
来源：IT之家

6.反击韩国 N 号房 2.0 ！当普通人在 AI 换脸面前一败涂地，他们用魔法打败魔法

本文探讨了Deepfake技术的最新发展及其对个人隐私和社会安全的威胁。文章通过韩国“N号房2.0”事件引入，介绍了Deepfake技术如何从娱乐明星和政治人物扩散到普通人，以及其在伪造图像、音频、视频和文本方面的应用。文章还讨论了如何通过技术手段对抗Deepfake，包括主动式防御和被动式检测，并强调了提高公众意识和法律监管的重要性。
来源：爱范儿

7.规范各类AI、算法！我国《人工智能安全治理框架》1.0版正式发布

全国网络安全标准化技术委员会发布《人工智能安全治理框架》1.0版，旨在规范AI技术发展，确保安全。《框架》提出了包容审慎、确保安全等原则，并针对模型算法、数据和系统安全等风险，提供了技术应对和综合防治措施。同时，也关注了网络、现实、认知和伦理领域的应用安全风险，为AI的安全开发和应用提供了基础性指导。
来源：快科技

8.韩国举办新一届AI峰会协调各国军队绘制人工智能”蓝图”

韩国首尔举办了一场国际峰会，旨在为人工智能在军事领域的负责任使用制定指导原则。超过90个国家的代表参与了此次为期两天的会议，其中包括美国和中国。峰会讨论了AI在军事应用中可能带来的风险，并寻求建立国际法律审查和监督机制，以防止自主武器系统在无人监督下做出致命决策。尽管预计不会有法律约束力的协议，但峰会希望达成行动蓝图，为AI在军队中的使用设定基本防护措施。
来源： cnBeta

9.小商品城与面壁智能在义乌成立人工智能科技公司

爱企查App显示，近日，义乌智周万物人工智能科技有限公司成立，法定代表人为缪钧玮，注册资本1000万元人民币，经营范围包括软件开发、人工智能基础软件开发、人工智能应用软件开发、人工智能理论与算法软件开发、人工智能基础资源与技术平台等。
来源：36氪

10.AI眼镜引发消费电子热潮，国内企业准备好了吗？

2024年AI眼镜市场迎来热潮，海外Ray-Ban Meta眼镜销量达200万副，A股市场AI眼镜概念股如博士眼镜股价大涨。市场在9月趋于冷静后，概念股回落。雷鸟创新CEO李宏伟预测，AI眼镜短期内销量将超过AR眼镜，但2027年后AR眼镜将反超。科技企业与眼镜验配终端的合资模式被认为是推动AI眼镜发展的关键。
来源：钛媒体

11.ChatGPT开始在欧洲和韩国推出macOS应用的重要更新

本文报道了ChatGPT在欧洲和韩国推出macOS应用的重要更新，新增了“记忆”功能。该功能允许用户在聊天机器人中存储数据，并在不同会话中使用这些数据，以获得个性化的回复。用户可以要求ChatGPT记住个人信息，并根据这些信息获得定制化的服务。此外，用户可以完全控制“记忆”功能，选择存储或删除特定信息。
来源： cnBeta

12.Replit推出AI开发助手，革新软件构建流程

Replit推出了一款AI开发助手，该工具能够自主构建完整应用程序，为软件开发带来技术革新。与常规代码辅助工具相比，Replit的AI助手具备更高的自主性和主动性，能独立执行复杂任务，并在实际应用中不断学习提升。AI助手通过分析平台数据和赏金服务数据，优化性能，理解软件开发生命周期，从项目搭建到部署全程辅助开发者。
来源：AIYUN

13.Salesforce发布开源“大型动作模型”xLAM系列

Salesforce公司宣布开源其“大型动作模型”（xLAM）系列，旨在以更低的成本实现更高的准确性。xLAM系列专注于执行特定任务，而非复杂的对话或生成能力。核心模型xLAM-1B，尽管参数较少，但在工具使用和推理任务上表现优于更大规模模型。xLAM-1B能在移动设备上运行自动化命令，已在Hugging Face开源平台发布。
来源：AIYUN

14.热门 AI 图像助墨西哥初创公司拿下阿迪达斯大单

墨西哥初创公司“某地某人”通过结合传统手工艺与现代技术，成功与阿迪达斯签订合同，生产墨西哥国家队足球球衣。该公司利用人工智能技术Stable Diffusion设计产品，并通过社交媒体营销，获得广泛关注。其产品不仅体现了对墨西哥工匠的尊重，还促进了当地社区的经济发展。
来源：科技的视界

15.就在今晚！苹果发布会重磅来袭除了新款iPhone我们还能期待什么？

苹果秋季发布会将于北京时间周二凌晨1点举行，预计发布iPhone 16系列、新款Apple Watch、AirPods、M4 Mac、HomePods和Mac mini等产品。iPhone 16系列可能包括四种型号，屏幕和颜色有变化，将搭载A18芯片和新功能。Apple Watch迎来十周年，可能推出两款新型号，屏幕更大，芯片更新。
来源：财联社

2024.9.8

1.Roblox官宣AI秒生3D物体模型，引爆10亿玩家游戏新世界

Roblox在开发者大会上宣布推出基于AI的3D模型生成工具，该工具通过文本提示即可创建3D物体，目标是服务10亿玩家。AI技术正在改变游戏创作方式，从文本、图像到3D资产和场景生成。Roblox计划开源此模型，允许包括竞争对手在内的任何人使用。AI工具的集成将赋予开发者更大的创作自由，推动游戏产业的创新和发展。
来源：新智元

2.长虹发布首款沧海智能体 AI TV 和智汇家 AI 大模型

长虹在IFA 2024上发布了首款沧海智能体AI TV和智汇家AI大模型，AI TV基于自研的沧海智能体，集成了大模型集群、算力集群、感知集群及AI集群，支持创建虚拟人，实现交流、思考和成长。同时，长虹建立了“记忆体”和“知识库”数据库，用于记录智能终端数据和提供专业知识。智汇家AI大模型在IFA现场展示，冰箱和空调实现个性化功能。
来源：IT之家

3.AI 冲击职场，调查显示 83% 的入门级专业人士担心失业

在线教育平台Great Learning的调查显示，83%的入门级专业人士担心人工智能技术将颠覆他们的工作，导致失业。尽管如此，人工智能和机器学习（AI/ML）技能在2025财年成为最受欢迎的技能提升方向。Great Learning的联合创始人Hari Krishnan Nair指出，IT服务、咨询公司和全球能力中心（GCC）通过采用生成式AI技术，有望短期内获得显著收益，同时，企业希望将AI技能培训扩展到各个职能部门。
来源：IT之家

4.马斯克旗下xAI与特斯拉联手：用AI技术换收入分成

埃隆·马斯克的人工智能初创公司xAI正在与特斯拉商讨合作协议，旨在通过授权特斯拉使用其AI技术来优化特斯拉的全自动驾驶功能，并分享由此产生的部分收入。xAI还将参与特斯拉的其他创新项目，包括车载语音交互系统和人形机器人Optimus的核心软件开发。协议的具体收入分成条款将基于特斯拉对xAI技术的依赖程度及其自有技术的贡献进行评估。
来源：凤凰网科技

5.ChatGPT网站的月度访问总量遭遇断崖式暴跌

根据Similarweb的最新数据，ChatGPT网站的月度访问量自春季以来经历了显著下降。高盛的首席全球股票策略师Peter Oppenheimer分析认为，这可能表明用户对ChatGPT的兴趣正在减少，他们可能对GPT-4感到疲倦或转向其他大型语言模型。用户可能认为没有必要将AI聊天机器人纳入日常生活。
来源：凤凰网科技

6.新的人工智能模型可在大地震发生前数月预测地震结果

阿拉斯加费尔班克斯大学科学家塔西洛-吉罗纳领导的团队，通过机器学习分析地震前兆活动，发现在大地震发生前数月至数天，低震级区域地震活动异常增加。研究以2018年安克雷奇7.1级地震和2019年加利福尼亚州里奇克雷斯特6.4至7.1级地震序列为例，揭示了地震前约15%至25%的区域异常低震级地震活动。该技术虽有潜力提前数月预测地震，但有效性和道德影响仍存争议。
来源： cnBeta

7.外滩大会上，我们看到了人工智能五年后的样子

本文讨论了人工智能（AI）的当前状态和未来趋势。尽管AI技术发展迅速，但实际应用并未显著改变日常生活。技术端面临大模型能力问题，如GPT 5.0的延迟发布和幻觉问题。乐观者认为这是技术融入日常的缓冲期。外滩大会上，AI的未来趋势被讨论，包括算力军备竞赛、异构计算、小模型的潜力、行业应用，以及AI Agent作为新型终端形态的可能性。文章强调，AI技术需要时间来实现其在各个领域的应用和普及。
来源：机器之心

16.2024-2030年间中国在AI产业的总投资规模将超过10万亿元

中金公司董事长陈亮在第二十四届中国国际投资贸易洽谈会上预测，2024-2030年间中国在AI产业的总投资规模将超过10万亿元。他指出，过去十年中国数字经济规模显著增长，AI产业具有巨大的市场空间和投资需求，对企业和投资机构来说是一个重大机遇。据中金研究估算，到2030年，中国AI产业的市场需求将达到5.6万亿元。
来源：财联社

2024.9.7

1.首届人工智能能力建设研讨班在上海举办

首届人工智能能力建设研讨班于2024年9月3日至6日在上海举办，由中国外交部和联合国共同主办，上海市人民政府承办。来自近40个国家的政府官员和专家参与了研讨班，旨在帮助“全球南方”国家代表深入了解人工智能技术发展现状及趋势，以弥合智能鸿沟。
来源：人民网

2.湖南发布50个人工智能典型应用场景

湖南省工信厅近日公布了2024年“智赋万企”人工智能赋能新型工业化的50个典型应用场景，这些场景已建成并投入使用，总投资超过15亿元。这些应用场景覆盖装备制造、原材料、消费品、电子信息等重点行业，涉及研发设计、生产制造、运营管理等多个智能化方向。
来源：湖南省工信厅

3.英伟达携手达慕思大学推出免费生成式 AI 教学工具包

英伟达深度学习研究院与达慕思大学合作开发了免费的“生成式人工智能教学工具包”，旨在教授学生开发GPU加速的生成式AI应用。该工具包包括讲义、实验、Jupyter笔记本、知识检查及在线课程，并计划提供能力证书。课程内容涵盖自然语言处理基础知识，以及使用英伟达云平台进行GPT模型训练等。
来源：IT之家

4.业内首个 AI 大模型供应链安全国际标准发布

世界数字技术院（WDTA）宣布发布业内首个AI大模型供应链安全国际标准《大模型供应链安全要求》，由云安全联盟（CSA）大中华区联合蚂蚁集团、微软、谷歌、百度等单位共同编制。该标准为大模型系统提供全生命周期的安全管理框架，强调多层次安全方法，涵盖网络层、系统层、平台和应用层、模型层及数据层，旨在确保大模型技术的全球安全性和可持续发展。
来源：IT之家

5.第一批抢跑的人，用Al搞了上千万？

本文讲述了AI技术如何被一些个体户和创业者用于商业化，从而获得收益。AI技术的应用场景包括自媒体内容创作、跨境电商、设计、以及“复活”亲人等。文章通过个体户陈子豪的故事，展示了如何利用AI技术进行内容创作和商业化尝试。同时，文章也提到了AI技术在顶层市场的竞争和应用，以及一些AI应用个体开发者的成功案例。
来源：凤凰网科技

6.从中报看六大行大模型最近进展，落地场景探索成为主要着力点

国有六大行半年报披露了数字金融和AI大模型研发及应用的最新进展。工行新增56个业务场景应用，深化大模型技术建设；建行开发79个行内业务场景，推进数字基础设施建设；农行加快数字金融服务质效提升；中行提升“金融+科技”品牌影响力；邮储银行构建数据智能分析体系；交行加快“人工智能+”行动方案。各行均在金融科技领域取得显著进展，推动数字金融创新。
来源：钛媒体

7.外滩大会今日闭幕 30余项AI新成果在会上首次发布

2024年外滩大会成功闭幕，大会期间首次发布了30余项AI新成果，包括蚂蚁集团的AI生活管家“支小宝”和AI金融管家“蚂小财”，西湖心辰的端到端语音大模型“心辰Lingo”，以及多个数据要素和数字化技术产品。大会还展示了100余项前沿科技，覆盖AI硬件、大语言模型、数字人等领域。同时，大会发布了AI标准和技术规范，推动了AI技术的应用和发展，为数字经济带来新的增长点。
来源：风口财经

2024.9.6

1.谷歌扩展人工智能虚拟试穿工具，将礼服也纳入其中

Google 宣布扩展其基于生成式人工智能的虚拟试穿工具，新增支持试穿裙子的功能。用户现在可以虚拟试穿来自数百个品牌的数千种款式的裙子，包括 Boden、Maje、Sandro、Simkhai 和 Staud 等。裙子是该工具中搜索量最大的服装类别之一。
来源：柒柒AI导航

2.YouTube 致力于通过新工具为创作者解决 AI 生成内容管理问题

YouTube正在推出新工具来检测和管理通过人工智能生成的内容，以保护其平台上的创作者并维护他们内容的完整性。该公司开发了一种新的合成歌声检测技术，该技术集成在其自动内容识别系统Content ID中，能够标记人工生成的声音。这项新工具将允许合作伙伴追踪和管理模仿他们歌声的视频，并计划在2025年初投入使用。
来源：柒柒AI导航

3.Red Hat 推出 RHEL AI 平台，用于混合云生成式 AI 开发

Red Hat公司推出了Red Hat Enterprise Linux AI平台，这是一个专门用于混合云环境中生成型人工智能开发的平台。该平台集成了IBM开发的开源Granite大型语言模型和Red Hat自行构建的InstructLab模型对齐工具，作为一个优化的、可启动的RHEL镜像，用于混合云和本地环境中的个别服务器部署。
来源：柒柒AI导航

4.医疗初创公司 Paige 推出用于病理学研究的 Alba AI 一体化助手

Paige 是一家位于纽约的医疗技术初创公司，专注于开发用于病理学研究的 AI 工具。最近，该公司推出了名为 Alba AI 的全功能助手，旨在提高病理学家的工作效率。Alba AI 通过整合来自电子健康记录、实验室信息系统和图像管理系统的患者数据，为病理学家提供快速、全面的患者信息。
来源：柒柒AI导航

5.蚂蚁集团“AI金融管家”蚂小财在支付宝APP全量对外

在9月6日的外滩大会财富论坛上，蚂蚁集团AI金融管家“蚂小财”新版升级亮相，并在支付宝APP内全量对外。升级后的“蚂小财”能更实时解读热点，更有锐度表达观点，提供有问必答、个性化的专业服务。同时，蚂蚁财富全新APP搭载“蚂小财”Pro版上线灰测，带来语控一切、定制简报等全新的服务体验。
来源：动点科技

6.面壁智能发布最新端侧 AI 模型MiniCPM 3.0

MiniCPM 3.0 是面壁智能最新发布的端侧 AI 模型，它以 4B 参数的规模实现了对 GPT-3.5 的性能超越。这款模型在自然语言处理、知识掌握、编程代码理解和数学问题解决等多个方面都显示出了卓越的能力。通过运用 LLMxMapReduce 技术，MiniCPM 3.0 能够处理无限长度的文本，大大提升了其对上下文的理解力。
来源：柒柒AI导航

7.谷歌 AlphaProteo AI 模型登场：突破蛋白质结合剂设计挑战

谷歌公司近日发布了AlphaProteo AI模型，这是首个用于设计新型高强度蛋白质结合剂的人工智能系统。该技术能成功生成与目标分子结合的蛋白质，有望推动药物设计和疾病认识的发展。AlphaProteo能为多种目标蛋白生成新的蛋白结合体，包括与癌症和糖尿病并发症有关的血管内皮生长因子-A（VEGF-A），并已在体外实验中显示出高成功率。
来源：IT之家

8.字节打造“ AI 全家桶”：教育 App 河马爱学更名“豆包爱学”

字节跳动旗下的AI教育App“河马爱学”更名为“豆包爱学”，成为豆包品牌下首款以豆包命名的App。此举是大力教育ZERO团队并入豆包团队后的品牌升级，旨在加强豆包大模型在教育领域的应用。
来源：IT之家

9.角逐百万元科技奖金，国内首个大模型攻防赛启动

2024年9月6日，国内首个大模型攻防主题科技赛事“全球AI攻防挑战赛”在2024外滩大会上宣布启动。该赛事由多方联合主办，旨在通过技术竞赛解决大模型应用中的安全风险，推动AI产业的健康发展。大赛分为“攻击”和“防守”两大赛道，分别针对大模型自身安全和生成内容的防伪检测。赛事提供百万级奖金池，鼓励技术创新和优秀人才的选拔。
来源：京报网

10.阿里巴巴国际站总裁张阔：要用AI让全球贸易像网购一样简单

阿里巴巴国际站总裁张阔在CoCreate 2024峰会上宣布，通过AI技术简化全球贸易流程，推出AI采购智能体，与万事达卡和马士基合作提供资金和物流服务，以促进B2B贸易增长。AI采购智能体通过对话式体验和智能比较功能，帮助买家精准匹配供应商，降低跨境采购门槛，为中小企业带来订单增长。
来源：量子位

11.智谱清言 App 视频通话功能面向所有用户限时免费开放

智谱 AI 今日宣布，清言 App 视频通话功能面向所有用户全面放开，限时免费。据介绍，用户在清言 App 点击首页右下方的打 Call 按钮，跳转视频通话后，把摄像头对准你希望让其看到的物品，便可以开启视频通话。
来源：金融界

12.Deepseek AI 模型升级推出 2.5 版：合并 Coder 和 Chat

DeepSeek AI 模型升级至2.5版本，合并了DeepSeek Coder V2和DeepSeek V2 Chat，提升了通用能力与代码生成能力，优化了写作任务和指令跟随。新模型在多个测试集上表现优异，DeepSeek AI由杭州深度求索人工智能公司推出，专注于通用人工智能底层模型与技术研究。
来源：IT之家

13.“算力版滴滴”发布 AI 云新品，PPIO CEO预测三年模型推理成本将下降1000倍

PPIO派欧云CEO姚欣在2024年中国国际大数据产业博览会上发布专为AI推理场景设计的Serverless产品，旨在通过算法、系统和硬件协同创新，降低AI大模型推理成本。姚欣预测未来三年AI大模型推理成本将下降1000倍，分布式算力将成为科技革命的重要推动力。
来源：钛媒体

14.AI写作公司HyperWrite推出Reflection 70B，宣称为“世界上最顶级的开源AI模型

开源大模型领域迎来了新突破，AI写作公司HyperWrite推出的Reflection 70B模型在多项基准测试中超越了GPT-4o和Llama 3.1。该模型在MMLU、MATH、IFEval、GSM8K等测试中表现出色，尤其在GSM8K中达到了99.2%的得分。
来源：机器之心

15.直击国产AI芯片生存现状：GPU造血，TPU突袭，Chiplet成大势，网络卡脖子

2024年全球AI芯片峰会（GACS 2024）在北京举行，聚焦AI芯片发展，吸引了众多行业专家和企业参与。壁仞科技宣布了异构GPU协同训练方案HGCT，AMD、高通等公司分享了其在AI领域的最新进展。专家们探讨了AI芯片产业的现状、挑战和未来方向，强调了技术创新和市场需求对行业发展的推动作用。
来源：智东西

16.AI产业赋能与投资机遇在哪里？这场AI创新大会上投资大咖们这样说！

2024年9月5日，由上海报业集团主办的“AI创新大会”在外滩大会举行，聚焦AI产业赋能与投资机遇。云启资本、金沙江创投、毅达资本、红点创投和常垒资本等投资机构的代表就AI技术路径、商业场景、赋能领域进行了深入讨论。他们指出，AI在2B和2C领域均有广阔应用前景，尤其在电商、营销、金融、法律、医疗、工业等专业领域，以及娱乐行业。
来源：财联社

17.微软Win10/Win11“带飞”国产开源AI大模型，RWKV装机量一夜从5万增加到15亿

微软Win10/Win11系统内置的RWKV AI模型安装量激增至15亿，引发关注。RWKV由彭博独立开发，旨在构建开放AI模型，目标是打造类似“安卓系统”的AI操作系统。微软利用Apache 2许可协议内置此模型，推动了其快速普及。
来源：中关村在线

18.哈佛大学医学院的新人工智能实现诊断癌症

哈佛大学医学院开发的人工智能CHIEF，通过在1500万张未标记图像和6万张组织图像上的训练，能以94%的准确率诊断19种癌症，并预测患者对治疗的反应。该AI在检测癌细胞、识别肿瘤起源、预测结果和识别DNA模式等方面表现优于其他模型，准确率可达96%。研究团队计划进一步训练CHIEF以识别罕见病和非癌性疾病。
来源：AIYUN

19.云知声推出「蓝藻AI智播」自动直播系统支持24小时不间断直播

云知声公司推出了名为“蓝藻AI智播”的自动直播系统，利用人工智能技术实现24小时不间断的直播。该系统基于云知声的山海大模型和高拟人AI声音技术，无需传统直播设备，通过一台电脑即可开播，支持多平台直播，降低成本并提升体验。
来源：品玩

20.百度文心一言接入百度网盘文件可从百度网盘直接导入

百度AI宣布文心一言服务新增功能，用户现可从百度网盘直接导入文件至文心一言，支持Word、PDF、TXT、Excel、PPT格式。普通版用户可上传10个文件，专业版用户可上传100个文件。此外，文心一言推出邀请好友领会员活动，用户通过邀请链接参与可获得5天会员。
来源：百度AI

21.大咖云集座无虚席！这场AI创新盛会为何如此吸睛？

2024年外滩大会上的“‘In AI·无限未来’创新大会”聚焦人工智能的未来、新闻业和教育的变革、算力投资、软件优化、金融研究、AIGC技术、大模型在心理学的应用、3D内容消费市场、AI产业赋能与投资机遇等议题。大会汇聚了众多学者、企业高管和投资专家，共同探讨AI技术发展、产业应用、创新方向与投资机会。
来源：科创板日报

22.Canalys预测：2025年Windows AI PC出货量将激增

Canalys报告显示，Lunar Lake处理器为Intel AI PC目标增添动力，随着LunarLake处理器的推出，助力Intel在2025年底实现出货1亿台AI PC的目标方面取得了重大进展。2024年第二季度，搭载Intel Core Ultra的AI PC出货量环比增长一倍多，自2023年12月以来，芯片出货量已超过1500万。
来源：证券时报

23.苹果重磅发布会下周来袭！高盛：四大惊喜值得期待股价或上涨24%

苹果公司计划在9月10日举行新产品发布会，高盛预测此次发布会将带来四大惊喜：新款iPhone可能提价、智能功能和应用程序发布日期提前、新iPad发布以及电信公司促销活动超预期。这些因素可能推动苹果股价上涨24%，达到276美元的目标价。
来源：财联社

2024.9.5

1.短剧应用 My Drama 推出全新 AI 伴侣，挑战 Character.AI

My Drama 是一款新推出的短视频应用，主打超过30部剧集，其中多数采用肥皂剧格式以吸引观众。该应用由乌克兰媒体科技公司 Holywater 开发，该公司由 Bogdan Nesvit（CEO）和 Anatolii Kasianov（CTO）创立，他们还运营着一个名为 My Passion 的阅读应用，以浪漫题材著称。
来源：柒柒AI导航

2.Anthropic 推出 Claude Enterprise 计划与 OpenAI 竞争

Anthropic公司推出了针对企业客户的AI聊天机器人Claude的新订阅计划——Claude Enterprise，旨在与OpenAI的ChatGPT Enterprise竞争。这个计划为企业提供更多的管理控制和增强的安全性。企业可以上传专有知识到Claude，使其能够分析信息、回答问题、创建图形和简单的网页，或作为公司特定的AI助手。
来源：柒柒AI导航

3.Paradigm 推出利用生成式 AI 重塑电子表格的功能

Paradigm是一家由Anna Monaco创立的初创公司，旨在通过生成式人工智能（AI）重新定义电子表格的使用。该公司由旧金山的Y Combinator加速器支持，并已获得200万美元的种子轮融资。Paradigm的软件利用AI代理，这些代理基于包括OpenAI的GPT-4o和Meta的Llama家族在内的第三方专有和开源模型，能够自动从互联网上搜索信息并填充电子表格单元格。
来源：柒柒AI导航

4.Stability AI 为 Amazon Bedrock 带来新的稳定扩散模型

Stability AI正在扩大其与亚马逊网络服务（AWS）的合作，将三个先进的文本到图像生成AI模型引入亚马逊的Bedrock服务。这些模型包括Stable Image Ultra、Stable Diffusion 3 Large和Stable Image Core，它们各自针对不同的应用场景，从超逼真图像到高容量资产生成。
来源：柒柒AI导航

5.Seekr 推出 SeekrFlow 平台，用于训练和部署值得信赖的企业级 AI

Seekr Technologies 推出了 SeekrFlow，这是一个面向企业客户的自助服务平台，专注于简化人工智能（AI）应用的训练、验证、部署和扩展过程。该平台通过提供单一的接口和用户友好的无代码界面，使企业能够快速构建和部署大型语言模型。
来源：柒柒AI导航

6.多模式搜索初创公司 Objective 推出了一款人工智能代理 Anton

Objective Inc. 是一家专注于人工智能原生搜索的初创公司，它通过人工智能技术来提高搜索结果的质量。最近，Objective 推出了一个名为 Anton 的新 AI 代理，这个代理能够帮助其搜索服务客户提升搜索结果的相关性，通过像人类用户一样评估搜索结果来实现这一点。
来源：柒柒AI导航

7.零一万物开源 Yi-Coder 系列编程助手模型，支持 52 种编程语言

Yi-Coder是由零一万物推出的一系列AI编程助手模型，包含1.5B和9B参数两个版本，专为高效推理和灵活训练设计。这些模型在预训练了2.4万亿高质量代码标记的基础上，支持52种主要编程语言，展现了出色的长上下文建模能力和项目级代码理解与生成能力。
来源：柒柒AI导航

8.支付宝发布AI生活管家App“支小宝”

支付宝在2024 Inclusion·外滩大会上发布了AI生活管家App“支小宝”，该应用基于蚂蚁百灵大模型，提供订票、点餐、打车等服务，并通过场景感知系统推荐个性化服务。蚂蚁集团强调将利用AI技术为用户创造极致体验。“支小宝”支持对话式交互，简化用户操作流程，同时通过智能体生态开放计划，与旅游景区等合作提供更专业的服务。
来源：新华网

9.腾讯发布新一代大模型“混元 Turbo”：推理效率提升 100%，成本降低 50%

腾讯在2024全球数字生态大会上发布了新一代大模型“混元 Turbo”，该模型采用MoE架构，实现了推理效率提升100%和成本降低50%。混元 Turbo 价格较前代降低50%，性能在中文大模型测评中领先。腾讯内部多个业务场景已接入此模型，包括腾讯云、QQ、微信读书等。
来源：IT之家

10.魅族“Flyme 星愿计划”手机 AI 分享会官宣明日举行

星纪魅族宣布将于9月6日举行“Flyme 星愿计划”手机AI分享会，旨在提供更实用的手机AI体验。此前，魅族宣布与时空道宇合作发射“星纪魅族幸运星号”卫星，该卫星将支持魅族在智能汽车、智能手机和XR技术等领域的创新应用，并为魅族矩阵提供通信解决方案。关于“星愿计划”的详细内容，IT之家将持续报道。
来源：IT之家

11.OpenAI商用订阅用户数突破100万新模型传出惊人涨价传言

OpenAI的商用订阅用户数突破100万，企业版ChatGPT订阅服务增长迅速。企业用户订阅费用高于个人用户，提供增值服务。个人用户数量翻倍，周活用户数超2亿。公司估值可能超过1000亿美元，有传言称即将推出的新模型可能涨价。
来源：财联社

12.美英欧有望今日签署！全球首份具法律约束力的人工智能公约落地

美国、欧盟和英国预计将签署《人工智能公约》，这是全球首份具有法律约束力的人工智能国际公约，由50多个国家历时两年起草。公约旨在确保人工智能系统的输出尊重平等权和隐私权，为受害者提供法律追索权。公约的签署有望解决科技企业对法规碎片化可能阻碍创新的担忧，同时标志着全球在人工智能立法方面迈出重要一步。
来源：财联社

13.我国首个脑血管专病大模型发布

北京清华长庚医院神经内科武剑教授团队发布了我国首个脑血管病专病大模型，这是基于海量临床医学数据构建的医学人工智能模型。该模型通过AI技术提供精准医疗指导和个性化治疗方案，旨在提升诊疗规范化水平和改善患者预后。
来源：钛媒体

14.OpenAI 联合创始人 Sutskever 的新安全 AI 初创公司 SSI 融资 10 亿美元

OpenAI前首席科学家Ilya Sutskever联合创立的专注于安全的人工智能初创公司Safe Superintelligence (SSI)成功筹集了10亿美元资金，以开发超越人类能力的人工智能系统。SSI目前估值为50亿美元，计划利用这些资金获取计算能力并招聘顶尖人才。
来源：柒柒AI导航

15.Nyra Health发布CrisperWhisper模型：语音识别技术的突破

Nyra Health公司发布了CrisperWhisper模型，这是语音识别技术的一项重大创新。该模型在继承现有技术的基础上进行了全面优化，特别是在噪音环境下的鲁棒性、单发言者识别的精准度以及捕捉言语中的不流畅之处方面有显著提升。其在多项测试中表现出色，预示着在临床、辅助功能服务及语言处理等领域的广泛应用前景。
来源：AIYUN

16.Soul语音大模型重磅升级，实时端到端语音通话

Soul语音大模型经过最新升级，推出了端到端全双工语音通话功能，旨在提供更自然流畅的虚拟人语音通话体验。新功能包括超低延迟、快速自动应答、逼真声音和情绪感知。Soul计划继续发展多模态端到端大模型，以增强人与AI的互动体验。
来源：品玩

17.智谱完成新一轮数十亿元融资投前估值达200亿元

智谱AI作为中国大模型领域的独角兽企业，最近以200亿元的投前估值完成了新一轮数十亿元的融资，中关村科学城公司领投。这是智谱在2024年完成的第三笔融资，其股东包括高瓴资本、启明创投、君联资本等知名投资机构，以及美团、阿里、腾讯、小米等互联网巨头。
来源：柒柒AI导航

2024.9.4

1.2790 亿美元市值蒸发：英伟达股价创纪录下跌，科技股受创

美国科技公司英伟达（Nvidia）股价下跌9.5%，市值蒸发2790亿美元，创单日纪录。此次下跌主要受到投资者对AI热情减退和对公司前景悲观预期的影响。美国司法部对英伟达可能的反垄断违规行为的调查进一步打击了市场情绪。这一事件也导致其他科技巨头股价下跌，包括微软和Alphabet。英特尔因计划重组应对AI领域的竞争压力而股价大跌。美国芯片股指数下跌近8%，亚洲市场也受到影响。
来源：柒柒AI导航

2.韩国AI 芯片初创公司Rebellions计划于 2025 年上市

韩国初创公司Rebellions Inc.计划最早于 2025 年底上市，希望利用对生成式 AI 芯片的旺盛需求。该公司首席执行官朴成铉对彭博电视台表示，该公司计划在 11 月与SK 电信公司旗下Sapeon Korea完成合并后，于 3 月左右选择全球银行进行国内上市。
来源：柒柒AI导航

3.AI 健康初创公司 Neko Health 在伦敦开业

Neko Health 是一家由 Spotify 创始人 Daniel Ek 和 Hjalmar Nilsonne 共同创立的瑞典健康初创公司，专注于通过年度全身扫描和人工智能（AI）分析来改善预防性医疗保健。该公司能够检测出心脏病和皮肤癌等疾病。现在，Neko Health 正在扩展到伦敦，这是其在本土市场之外的第一个城市。
来源：柒柒AI导航

4.Spotter 推出 AI 工具，帮助 YouTube 用户集思广益制作视频创意、缩略图等

Spotter Studio 是一家为内容创作者提供财务解决方案的初创公司 Spotter 推出的 AI 创意套件。这个工具旨在帮助 YouTube 创作者在整个创作过程中，包括帮助他们构思视频概念、生成缩略图和标题想法、规划项目、组织任务和与团队协作。
来源：柒柒AI导航

5.谷歌宣布发布 Android 15 并为设备带来新功能

Google宣布发布 Android 15 移动操作系统，并很快将其源代码在 Android Open Source Project (AOSP) 上提供。Android 15 经过一年的开发，将在未来几周内支持 Pixel 设备，并在未来几个月内扩展到三星、荣耀、iQOO、联想、摩托罗拉、Oppo、夏普、索尼、小米等品牌的选定设备。
来源：柒柒AI导航

6.Luma AI 宣布推出其最新版的AI视频工具Dream Machine 1.6

9月4日消息，Luma AI 宣布推出其最新版的AI视频工具Dream Machine 1.6，它通过增加一系列精确的控制选项，使得用户能够对生成的视频进行更细致的操作。该生成器提供了12种不同的摄像机运动方式，如“Pull Out”、“Pan Left”、“Orbit Right”等，用户可以在输入文本提示时通过键入“camera”来访问这些选项。
来源：柒柒AI导航

7.谷歌悄然在 Chrome 地址栏中推出了 Gemini AI 集成

Google 在其 Chrome 浏览器中悄悄推出了一项重大更新，将先进的 Gemini AI 聊天机器人直接集成到了地址栏中。这一更新标志着人工智能技术普及化的重要时刻，可能会改变数百万用户与互联网的互动方式，这是向用生成性 AI 响应取代传统搜索查询的第一步
来源：柒柒AI导航

8.OpenAI 今年启动 GPT Next 计划：AI 性能百倍级跃升，Orion 有望接棒 GPT-4

OpenAI Japan 在 KDDI 峰会上宣布2024年将启动GPT Next计划，预计AI性能将实现百倍提升。首席执行官长崎忠雄强调AI技术正以指数级速度发展，而新系统“Orion”可能成为GPT-4的继任者。
来源：IT之家

9.百度文心一言 App 获推 4.0.0 版本升级：更名文小言、9 月内文心 4.0 大模型免费用

百度文心一言App升级至4.0.0版本，更名为文小言，提供更强大的功能和更丰富的场景。新版本增强了搜索、创作、聊天等AI能力，包括记忆订阅、文章图片创作、语聊数字人和智能体助手团。9月内文心4.0大模型将免费供用户使用。文心一言用户数已突破2亿，API日均调用量也超过2亿。
来源：IT之家

10.OpenAI 基础设施计划曝光！从数据中心到能源，在美投资数百亿美元

OpenAI 正在筹备一项全球基础设施计划，计划在美国各州投资数百亿美元，以支持 AI 发展所需的物理基础设施。项目包括建设数据中心、增加能源容量和传输、扩大半导体制造。全球投资者联盟可能包括加拿大、韩国、日本和阿联酋的投资者，微软可能是潜在合作伙伴。该计划旨在推进 AI 并使其优势广泛普及，同时创造就业机会。
来源：华尔街见闻

11.OpenAI 的 GPT-4o-2024-08-06 模型现已通过 Azure OpenAI 服务提供

OpenAI的GPT-4o-2024-08-06模型通过Azure OpenAI服务提供，支持结构化输出以确保与开发者提供的JSON模式匹配。微软宣布该模型在美国和瑞典上市，定价为输入每100万个词元2.50美元，输出每100万个词元10.00美元，价格较之前降低。该模型提供用户自定义JSON模式和更精确的工具输出，旨在简化应用程序开发，提升用户体验。
来源：cnBeta

12.大模型进厨房，万得厨发布厨房智能体

万得厨在AGIC大会上发布了首款厨房智能体，该产品搭载祝融烹饪大模型，利用英伟达GPU和高清摄像头识别食材，实现自动化烹饪。该智能体通过四年研发，能识别1500种家常菜并自动完成烹饪，同时具备“同腔不同温”功能，可根据不同食材进行温度控制。万得厨还计划推出无人厨房商业解决方案，预计2026年覆盖1万个核心点位，并与食品企业合作开发更多菜品。
来源：钛媒体

13.微软Copilot AI功能将于11月登陆新款英特尔笔记本电脑

英特尔表示，微软新的 Windows AI 功能将于 11 月开始在其部分笔记本电脑上推出。此前AMD 已经推出了能够满足微软对 Windows AI 功能的 Copilot Plus PC 硬件要求的笔记本电脑，但到目前为止，这些功能只出现在由高通公司（Qualcomm）驱动的新设备上。
来源： cnBeta

14.xAI Colossus AI系统上线，GPU达10万张

xAI公司宣布其人工智能训练系统Colossus上线，该系统配备10万张Nvidia H100 GPU卡，旨在成为全球最强大的AI训练系统。CEO埃隆·马斯克表示，Colossus将支持开发更强大的语言模型，并计划将GPU数量增至20万张。此外，部分原定给特斯拉的GPU被重新分配给xAI。
来源：AIYUN

15.Runway平台推出Gen3 Motion Brush功能，解锁视频编辑新技能

Runway平台即将推出Gen3 Motion Brush功能，该功能通过自定义动作路径和新增的“冻结”区域及“关键帧”编辑功能，显著提升了视频编辑的精准度和灵活性。同时，Runway也在开发“扩展视频”功能，旨在通过智能修剪和自动生成延伸内容，进一步拓宽视频创作的边界。这些创新工具将简化复杂流程，强化创意控制，为视频生成与编辑树立新的行业标准。
来源：AIYUN

16.英伟达投资日本AI研发初创公司Sakana AI

日本人工智能研发初创公司Sakana AI宣布完成超过1亿美元的A轮融资，由New Enterprise Associates、Khosla Ventures和Lux Capital领投，英伟达也参与其中。此外，该公司宣布将与英伟达围绕在日本的研究、基础设施和人工智能社区建设方面开展新的合作。
来源：科创板日报

17.亚洲芯片股集体受挫！英伟达狂泻放大市场担忧：AI涨势真热过了头？

2024年9月3日美股科技股普遍下跌，英伟达股价大跌9.53%，引发亚洲芯片股集体受挫。市场担忧AI行业涨势过热，导致亚洲基准股指出现一个月来最大跌幅。英伟达市值单日蒸发2789亿美元，美国司法部反垄断调查是主要原因。亚洲芯片股如台积电、Advantest Corp.和SK海力士均大幅下跌。尽管有担忧，部分分析师对AI前景保持乐观，认为需求将保持强劲。
来源：财联社

18.英伟达股价狂泻原因找到了？美司法部升级对其反垄断调查

美国司法部正在对英伟达进行反垄断调查，怀疑其市场行为可能违反反垄断法。调查聚焦于英伟达是否通过限制客户转向其他供应商、提供优惠给只使用其产品的客户以及收购软件公司Run:ai来巩固市场地位。这些行为可能导致英伟达面临更广泛的监管问题，特别是在AI技术对国家安全和经济实力日益重要的背景下。
来源：财联社

2024.9.3

1.ComfyUI 最新版本 0.2.0的发布！此更新带来了一系列改进和新功能

ComfyUI 0.2.0版本发布，引入Flux ControlNets技术，增强图像处理能力，优化队列管理，提升工作效率。新功能包括快速定位、图像显示选项、任务输出文件夹视图、节点库增强、用户体验优化等。此次更新为设计师带来工作流程的革命。
来源：ComfyUI

2.谷歌 AI 宣布推出大模型基准测试 CardBench

谷歌AI团队宣布推出CardBench，这是一个大模型基准测试，旨在为学习型基数估计（cardinality estimation）模型提供系统评估框架。CardBench包含20个真实数据库中的数千个查询，支持基于实例、零点和微调模型的评估。它提供工具用于数据统计、SQL查询生成和查询图创建，旨在降低开发和测试新CE模型的门槛。
来源：品玩

3.阶跃星辰开放平台迎来多项更新，上线 Step-1X 图像生成大模型

阶跃星辰开放平台推出了图像生成大模型Step-1X，该模型具备深度语义对齐和细节生成能力，支持长文本指令，满足多种创作需求。Step-1X特别优化了对中国元素和文化的处理，展现了在不同创作场景下的应用潜力。平台还更新了极速版模型Step-1-flash，增强了用户体验，并推出了“繁星计划”支持AI应用开发者。
来源：雷锋网

4.OpenAI首颗芯片曝光：台积电1.6nm，为Sora定制

OpenAI的首颗自研芯片将采用台积电1.6纳米工艺，专为AI视频生成工具Sora定制。这一合作标志着OpenAI在减少对外部AI芯片依赖上迈出重要一步，同时可能为苹果的Apple Intelligence集成提供支持。尽管面临产能挑战，但A16工艺的先进性为数据中心产品带来显著的性能提升和功耗降低。
来源：量子位

5.李飞飞团队提出ReKep，让机器人具备空间智能，还能整合GPT-4o

李飞飞团队提出了ReKep方法，通过关系关键点约束使机器人具备空间智能，实现复杂任务的高效执行。ReKep将任务分解为多个阶段，每个阶段设定子目标和路径约束，优化机器人动作。该方法与GPT-4o等多模态大模型结合，显著提升机器人的空间智能和任务执行能力。实验验证了ReKep在多任务、野外场景、双手操作和反应行为中的高成功率，展示了机器人技术在视觉与学习融合方面的突破。
来源：机器之心

6.Meta 公布 Llama AI 模型家族下载量数据：全球超 3.5 亿、3.1-405B 模型最受欢迎

Meta公司宣布，其Llama AI模型家族在Hugging Face的下载量已超过3.5亿次，其中Llama 3.1-405B版本最受欢迎。自7月推出Llama 3.1以来，Meta与多家平台合作，使用量显著增加。公司计划继续扩大合作伙伴阵容。
来源：IT之家

7.MiniMax大模型日均交互时长排名第一每日处理超3万亿token

2024年9月2日，MiniMax在上海举办“2024 MiniMax Link伙伴日”活动，聚焦AI创新技术。MiniMax创始人闫俊杰分享了基于MOE+Linear Attention的新一代模型技术，展示了公司在音乐、视频模型研发的成果。MiniMax大模型日均交互时长排名第一，每日处理超3万亿文本token，生成2000万张图片及合成7万小时语音。MiniMax致力于构建开放生态系统，推动AI技术加速发展。
来源：新浪科技

8.AI眼镜或将成为下一个大趋势

AI眼镜正成为科技行业的新趋势，结合AI语音助手、AR全息视觉和蓝牙耳机功能，为用户带来科幻般的体验。全球科技巨头如Snap和Meta正积极开发此类产品，预计不久将推向市场。亚洲市场已有类似产品，如小米的Jiehuan和香港Solos的AirGo智能眼镜，预示AI眼镜将成为日常生活的一部分。
来源：AIYUN

9.钉钉发布全新“低代码+AI”产品和方案，降低中小企业用AI门槛

钉钉近日发布了基于“低代码+AI”和“多维表+AI”的新产品和功能，旨在降低中小企业使用AI的门槛，加速业务数字化。推出了面向中小企业的AI精品应用和中大型企业的行业解决方案，同时，通过宜搭平台，企业可以简单配置快速创建AI助理，实现“一键AI化”。此外，钉钉还推出了多款结合AI能力的多维表产品，如“超级工单助理”，以满足不同企业场景需求。
来源：新浪科技