2024.3.31
1.微软 Azure 新增 9 款逼真 AI 语音,包括美式英语、中文等
根据微软博客文章,这些新语音可用于各种工作和任务,例如商务聊天机器人、语音助手、电子学习以及娱乐和游戏领域。微软表示:“这一扩展扩大了我们在 91 种语言及其变体中表达内容的能力。这一进展凸显了我们对克服语言障碍和促进更具包容性和可访问性的全球通信环境的坚定承诺。”
来源:IT之家
2.人工智能“天启”可能让英国800万个岗位消失,女性和Z世代面临最大风险
公共政策研究所(Institute for Public Policy Research)警告,根据英国政府当前的政策,将有多达800万英国上班族可能被人工智能抢走工作。该智库在本周发布的一份报告中表示,人工智能已经影响到英国上班族11%的工作任务,随着企业进一步整合人工智能技术,这个比例可能提高到约60%。
来源:财富
3.2024Q1人工智能“里程碑”盘点:Sora和Kimi做对了什么
盘点一季度资本市场最“出圈”的AI应用,文生视频赛道上,Sora在2月春节假期后引起市场关注;3月国产AI对话助手Kimi在突破200万字的长文本技术后,访问量与市场关注度激增;3月下旬,初创企业Suno发布同名模型V3版本发布,一条龙“包办”歌词、歌声、配乐,指向多模态应用流行新趋势。、
来源:快科技
4.吴恩达:现在做GPT-4智能体,或将提前达到GPT-5效果
根据吴恩达分享的数据,你使用 GPT-3.5 进行零样本提示,它的正确率是48%。GPT-4 的表现要好得多,正确率是 67%。但是如果你在 GPT-3.5 的基础上建立一个 AI 智能体的工作流,它甚至能比 GPT-4 做得更好。换句话说,如果我们现在基于 GPT-4 做一个 AI 智能体的工作流,甚至可以提前到达 GPT-5 的水平。
来源:钛媒体
5.Databricks 推出 1320 亿参数大语言模型 DBRX,号称“现阶段最强开源 AI”
3 月 31 日消息,Databricks 近日在推出了一款通用大语言模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。DBRX 是一个基于 Transformer 的大语言模型,采用 MoE(Mixture of Experts)架构,具备 1320 亿个参数,并在 12T Token 的源数据上进行预训练。
来源:IT之家
6.百亿token免费用!国产平台一键拖拽定制大模型,多元算力极具性价比
大模型落地并不缺场景,却往往因算力不够遇难题。这家国产平台从今日起,免费送百万token。开发者们不仅可以对20多种开源模型精调,还能用上极具性价比的多元算力。
来源:新智元
2024.3.30
1.消息称微软和OpenAI计划投资1000亿美元建造“星际之门”AI超级计算机
根据知名科创媒体The Information周五报道,微软、OpenAI正在进行一项分为五个阶段的超级计算机建设项目,拟动用的投资将超过1150亿美元,其中大部分的成本将用在采购驱动AI所需的算力设施——这笔钱最终会落到股民们炒作一年多的那批“算力概念股”兜里。
来源:财联社
2.15 秒语音片段就能合成某人声音,OpenAI 小规模开放 Voice Engine 模型
3 月 30 日消息,OpenAI 公司近日发布公告,有限开放 Voice Engine 的访问权限,该模型可以根据某人的 15 秒语音片段创建合成语音。OpenAI 在新闻稿中表示:“通过开放小规模部署,有助于我们按照现有方法、保障措施等推进产品落地,并在不断磨合、探索过程中思考,如何将 Voice Engine 用于各行各业”。
来源:IT之家
3.记者手记:“人工智能+”让“未来医院”不再遥远
“AI医生”进行问询分诊,医学影像设备智能出具检查报告,医生操作手术机器人进行微创手术……走进3月29日至31日在重庆召开的2024中国医学装备大会展览现场,仿若走进科幻小说中“未来医院”的场景。
来源:新华网
4.比人类便宜20倍!谷歌DeepMind推出「超人」AI系统
大模型的幻觉问题怎么解?谷歌DeepMind:用AI来做同行评审!事实核验正确率超过人类,而且便宜20倍。AI的同行评审来了!一直以来,大语言模型胡说八道(幻觉)的问题最让人头疼,而近日,来自谷歌DeepMind的一项研究引发网友热议:大模型的幻觉问题,好像被终结了?
来源:新智元
5.Omdia:预计今年 AI 笔记本电脑出货约 100 万台,2028 年将占笔记本出货总量约八成
3 月 30 日消息,行业分析机构 Omdia Mobile PC 研究团队最新人工智能笔记本电脑 (AI Notebook PC) 出货预测数据显示,2024 年 AI 笔记本电脑(AI Notebook PC)出货量约为 100 万台,且约 80% 的 AI 笔记本电脑出货为 ARM 芯片架构。
来源:IT之家
6.担心“泄密”!美国众议院禁止工作人员使用微软Copilot
据当地媒体报道,美国众议院目前已严禁国会工作人员使用微软的Copilot生成式人工智能助手。据悉,众议院首席行政官Catherine Szpindor在发送给国会办公室的一份指南中表示,“网络安全办公室认为微软Copilot应用程序构成了风险,因为它有可能将众议院的敏感数据,泄露到未经众议院批准的云服务中。
来源:财联社
2024.3.29
1.通义千问开源首个MoE模型
今天,通义千问团队开源首个MoE模型,名为Qwen1.5-MoE-A2.7B。它仅有27亿个激活参数,但性能可与当前公认最先进的70亿参数模型(Mistral 7B、Qwen1.5-7B等)相媲美。
来源:阿里通义千问
2.大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
Stability AI在大佬出走后似乎并未受到影响,最近又官宣了新的代码模型Stable Code Instruct 3B,在之前的基础上更进一步,干掉了所有同级竞品,甚至能和7B、15B的模型掰手腕。大佬出走后,第一个模型来了!就在今天,Stability AI官宣了新的代码模型Stable Code Instruct 3B。
来源:新智元
3.马斯克突发Grok 1.5!上下文长度至128k、HumanEval得分超GPT-4
就在刚刚,马斯克Grok大模型宣布重大升级。难怪之前突然开源了Grok-1,因为他有更强的Grok-1.5了,主打推理能力。来自xAI的官方推送啥也没说,直接甩链接。主打一个“字少事大”(旺柴)
来源:量子位
4.OpenAI据悉向电影行业巨头高管们推荐Sora
OpenAI与派拉蒙、环球和华纳兄弟探索等主要电影公司举行了会议,展示其视频生成技术Sora,并缓解对人工智能模型将损害电影行业的担忧。据多位知情人士透露,首席执行官山姆·奥特曼和首席运营官布拉德·莱特凯普在最近几天举行的会议上向电影行业巨头的高管们做了介绍。
来源:钛媒体
5.周鸿祎自称“开源信徒”:宣布将开源 360 智脑 7B 模型,支持 50 万字长文本输入
3 月 29 日消息,360 创始人周鸿祎近日透露即将开源 360 智脑 7B(70 亿参数模型),支持 360k(50 万字)长文本输入。周鸿祎表示,前段时间大模型行业卷文本长度,100 万字“很快将是标配”。“我们打算将这个能力开源,大家没必要重复造轮子,定为 360k 主要是为了讨个口彩。”他还自称“开源的信徒”,信奉开源的力量。
来源:IT之家
6.消息称数据标注独角兽 Scale AI 正进行新一轮融资谈判,估值接近130亿美元
据The Information 报道,知情人士透露,数据标注初创公司 Scale Al的早期投资者风险投资公司Accel 正在就领投其新一轮融资进行谈判,这将使该初创公司的估值提高近80%,达到约130亿美元。
来源:
The Information
7.提前 0.9 秒预测,Emo 机器人问世:能同步模仿你的面部表情
纽约哥伦比亚大学的霍德・利普森(Hod Lipson)及其同事们创造了一个名为 Emo 的机器人,它利用人工智能模型和高分辨率摄像头预测人们的面部表情,并试图复制这些表情。它能在某人微笑前约 0.9 秒预测到他是否会微笑,并能同步微笑。
来源:IT之家
8.大型药企依靠人工智能掌握行业动态
Lifescience Dynamics的实力源于它的五款主要科技产品,这些产品整合了人工智能元素,包括机器学习、大语言模型和生成式AI等,可以计算大数据集、汇总信息和提供明智的建议。
来源:财富
2024.3.28
1.号称全球最强开源 AI 模型,DBRX 登场:1320 亿参数,语言理解、编程能力等均超 GPT-3.5
初创公司 Databricks 近日发布公告,推出了开源 AI 模型 DBRX,声称是迄今为止全球最强大的开源大型语言模型,比 Meta 的 Llama 2 更为强大。
来源:IT之家
2.周鸿祎:打算开源360AI浏览器 让国内所有大模型都能支持超过20万字
28日晚间,360董事长周鸿祎发微博称,大家前段时间都在卷文本长度,很快100万字就是标配了。最近360AI浏览器也火了一把,原因是拥有长文本能力。所以他打算把这个能力开源,让国内所有大模型都能支持超过20万字,大家不用再各自闭门造车,重复发明轮子。
来源:DONEWS
3.GPTs大翻车后,OpenAI再宣布给开发者送钱!美国码农狂欢
OpenAI,又要和开发者分钱了!就在刚刚,OpenAI宣布,将要和一群美国开发者合作,测试GPT基于使用情况的收入。此举的目标,是创建一个充满活力的生态系统,让开发者的创造力和影响力得到回报。\
来源:新智元
4.钉钉AI升级多模态,新增图片理解、工作流等
3月28日消息,钉钉AI助理宣布升级,上线图片理解、文档速读、工作流等产品能力,探索多模态、长文本与RPA技术在AI应用的落地。
来源:钛媒体
5.亚马逊向人工智能公司 Anthropic 追加 27.5 亿美元投资,总投资额达 40 亿美元
3 月 28 日消息,亚马逊宣布向人工智能公司 Anthropic 追加 27.5 亿美元投资,这笔投资是继去年 12.5 亿美元的投资之后的追加注资,使亚马逊对 Anthropic 的总投资额达到 40 亿美元(IT之家备注:当前约 289.6 亿元人民币)。
来源:CNBC
6.科大讯飞:讯飞星火大模型预计6月发布4.0版本
科大讯飞副总裁、研究院院长刘聪在博鳌2024年会现场表示,科大讯飞计划在今年6月正式发布对标GPT-4 (Turbo)当前能力的讯飞星火大模型V4.0版本。
来源:36氪
7.一张图即出AI视频!谷歌全新扩散模型,让人物动起来
近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!只需一张照片,和一段音频,就能直接生成人物说话的视频!
来源:新智元
8.阿里云 x 联发科,天玑 9300 等手机芯片适配端侧通义千问大模型
联发科宣布已成功在天玑 9300 等旗舰芯片上部署通义千问大模型,首次实现大模型在手机芯片端深度适配。通义千问在离线情况下运行多轮 AI 对话
来源:IT之家
2024.3.27
1.Stable Code Instruct 3B AI 模型亮相:可精准翻译转换编程语言
Stability AI 公司近日面向程序员,推出 Stable Code Instruct 3B 大语言模型,其亮点在于可以从一种编程语言翻译转换成另一种编程语言
来源:IT之家
2.聚焦AI战略!苹果本届全球开发者大会将于6月10-14日举办
3月27日,苹果公司今日宣布,其第35届全球开发者大会(WWDC)将于6月10日(周一)至14日(周五)在线举行。自2020年以来,WWDC活动一直以线上形式向所有开发者免费开放。
来源:华尔街见闻
3.Adobe Firefly 添加结构参考,为生成的图像带来更多控制权
当与文本到图像模块中的另一项 Firefly 功能–Adobe 的 “样式参考 “相结合时,用户可以同时参考图像的结构和样式,从而快速将他们的想法变为现实。这一强大的组合提供了最先进的视觉质量和全新的创意控制水平。
来源:maginative
4.抖音划定AI创作“禁区”:假外国人将被严打
抖音安全中心今日发布不当利用AI生成虚拟人物的治理公告,指出将严格处罚违规使用AI生成虚拟人物发布违背科学常识、弄虚作假、造谣传谣的内容
来源:财联社
5.麻省理工学院携手 Adobe 演示 DMD AI 技术:每秒可生成 20 幅图像
主流文生图模型固然已经能生成非常逼真的图片,但通常渲染时间非常缓慢。麻省理工学院携手 Adobe 公司近日研发了 DMD 方法,在尽量不影响图像质量的情况下,加快图像生成速度。
来源:IT之家
6.北京新增3500P算力供给人工智能大模型
北京数据基础制度先行区26日在北京市海淀区揭牌,先行区扩展至海淀。仪式上,3500P新增算力部署就位,将为大模型企业提供算力、数据一体化服务,强化人工智能关键要素供给
来源:新华网
7.迄今最大大模型!马斯克:Grok聊天机器人将向所有X订阅用户开放
根据媒体报道,马斯克今天凌晨宣布,本周晚些时候,聊天机器人Grok将会为特定等级的X订阅者提供服务,而不仅限于高级+订阅者。马斯克解释说,Grok拥有两种模式:分别为普通模式和娱乐模式,其中,Super Grok是新增的疯狂娱乐模式。
来源:快科技
8.将大模型能力融入7大产品,百度智能云交出“企业大模型应用成绩单”
数字人带货仅需真人15%的成本,获得85%的GMV;过去说两句就找人工客服的用户,如今90%的问题已经通过智能客服自助解决;面对霸道老板的灵魂发问,一句话就能让数据表变成图文并茂的销售情况总结;一个文字描述,直接AI生成海报、脚本、视频,甚至还能二次加工……
来源:财经网
2024.3.26
1.工信部谈新质生产力:加快推动以大模型为代表的AI赋能制造业发展
3月26日,国务院新闻办举行了近期生产、消费、进出口有关数据及政策情况新闻发布会。会上,工业和信息化部新闻发言人、总工程师赵志国表示,发展新质生产力是推动高质量发展的内在要求和重要着力点。
来源:澎湃新闻
2.AI 大模型升级:蓝心千询、vivo 办公套件开放下载,其他品牌手机同样可用
在今天的 vivo X Fold3 系列发布会上,vivo 官方宣布蓝心大模型迎来全新升级,整体数据量跨越式升级到「端侧 7B」+「云侧 70B」的超大组合,实现超 700 种手机相关功能。
来源:IT之家
3.银行业大模型落地,遇到五大难题
由于银行业本身的特性,不管是政府层面还是行业监管层面对银行数据的合规性、安全性、准确性、可信性都存在较高要求,因此运用在银行业的大模型技术都是研发成熟品。从整个大模型行业来看,部分业内人士认为,银行业大模型的落地进展略滞后于整体行业。
来源:钛媒体
4.消息称高通、谷歌、英特尔等联合开发 AI 软件:让代码不挑硬件,打破英伟达统治格局
英伟达凭借 AI 芯片的领先,如今已成为行业巨无霸,包括微软等巨头也需要与其合作,全球超过 400 万开发者依靠英伟达的 CUDA 软件平台来构建 AI 和其他应用。
来源:IT之家
5.快意通用大语言模型能力超过GPT-3.5,在营销领域的能力已与GPT-4齐平
3月26日,快手商业化算法负责人江鹏在2024快手磁力大会上表示,快意通用大语言模型能力超过GPT-3.5,通过对快意大模型进行千亿级Token商业知识预训练、百万级商业指令对齐等,快手进一步研发了业界领先的营销域大语言模型
来源:新浪财经
6.博鳌论坛:人工智能的迅速发展将为亚洲发展与合作提供新的机遇
3月26日,博鳌论坛2024年年会上,《亚洲经济前景及一体化进程2024年度报告》正式发布。报告指出,人工智能的迅速发展正在深刻改变人类社会生活、改变世界,将为亚洲发展与合作提供新的机遇。
来源:证券时报网
2024.3.25
1.OpenAI 公关跳起来捂他嘴:Transformer 作者公开承认参与 Q*!
Transformer 作者中唯一去了 OpenAI 的那位,公开承认了:他参与了 Q * 项目,是这项新技术的发明者之一。这几天除了英伟达老黄组局把 Transformer 作者聚齐,他们中的几位还接受了连线杂志的采访,期间出了这么一个小插曲。当记者试图询问 Lukasz Kaiser 更多关于 Q * 的问题时时,OpenAI 的公关人员几乎跳过桌子去捂他的嘴。
来源:IT之家
2.字节提速AI:Flow部门下设四大业务线,挖角大批百度阿里员工
据了解,“话炉”由字节跳动的Flow部门打造。新浪科技独家获悉,Flow部门隶属于字节跳动的产品研发与工程部(内部简称“PDI”),目前下设四大业务线,包括AI教育、国际化、社区和豆包,“话炉”则属于社区业务线旗下。
来源:新浪科技
3.百度将为苹果今年国行iPhone16等设备提供AI功能
《科创板日报》记者从知情人士处了解到,百度将为苹果今年发布的iPhone16、Mac系统和iOS18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。
来源:科创板日报
4.AI不会取代绝大多数工作,年轻人要重新思考就业技能
“AI的发展,尤其由ChatGPT引领的生成式AI的发展,相较于以前的技术 给经济带来更大的影响,因为它们能够涵盖更广泛的职业,对这些职业的工作模式构成深刻影响。”伦敦政治经济学院教授、2010年诺贝尔经济学奖获得者克里斯多夫·皮萨里德斯说道。
来源:21世纪经济报道
5.Meta 推出 SceneScript AI 视觉模型,利用可编程语言实时预测建立 3D 场景
据 Meta 公司官方新闻稿,该公司开发了一款名为“SceneScript”的视觉模型,该模型号称能够使用可编程语言来快速“建立”场景,实时推断房间几何形状,并将相关数据转换为建筑学层面的近似值。
来源:IT之家
6.2024胡润全球富豪榜发布!一半以上的新增财富来自于AI
3月25日,胡润研究院发布《2024胡润全球富豪榜》。全球共有3279位十亿美金企业家,比去年增加了167位,增幅为5%。中国仍是世界上十亿美金企业家最多的国家,有814位,美国紧随其后,有800位。值得一提的是,AI今年第一次深度影响全球富豪榜,一半以上的新增财富是来自于AI。
来源: 智通财经
2024.3.24
1.“AI 教父”杰弗里・辛顿:超越人类智慧的 AI 可用语言操纵我们
人工智能领域的开创者之一,被誉为“AI 教父”的杰弗里・辛顿(Geoffrey Hinton)近日接受日本经济新闻采访,讲述了 AI 与人类的未来。去年 5 月,杰弗里・辛顿宣布离开他工作了十年的谷歌公司,原因是他对人工智能技术的发展越来越担忧。
来源:IT之家
2.国产大模型Kimi爆火,能否如愿“登月”?
近日,能一气吞下200万字的国产大模型Kimi爆火,引燃人工智能领域新一轮投资热情。Kimi由成立仅一年的人工智能初创公司月之暗面(Moonshot AI)研发,公司创始人杨植麟多次用“登月”来描绘他的通用人工智能(AGI)梦想。
来源:澎湃
3.32K上下文,Mistral 7B v0.2 基模型突然开源了
这次开源的 Mistral 7B v0.2 Base Model ,是 Mistral-7B-Instruct-v0.2 背后的原始预训练模型,后者属于该公司的「Mistral Tiny」系列。此次更新主要包括三个方面:将 8K 上下文提到了 32K;Rope Theta = 1e6;取消滑动窗口。
来源:机器之心
4.东莞市与百度签署战略合作协议,涉及人工智能、新能源汽车等领域
据百度官方消息,3 月 22 日,东莞市人民政府与百度签署战略合作协议,双方将围绕人工智能产业发展,推动人工智能的全场景应用落地。根据合作协议,双方将聚焦东莞市电子信息、高端装备、新能源汽车等重点产业,提升企业研发、生产环节的人工智能水平。
来源:IT之家
5.经济日报:进一步利用AI、大数据、5G等先进技术赋能大健康产业
经济日报发文表示,面对健康消费领域的新趋势、新特点,行业需要立足大健康产业布局,以高质量供给满足健康消费需求。业内人士认为,企业应加快产品研发创新更迭,更加精准地为消费者提供定制化的健康产品和服务。
来源:财联社
2024.3.23
1.Stability AI 首席执行官辞职,要专注开发去中心化 AI
Stability AI 公司创始人、首席执行官埃马德・莫斯塔克(Emad Mostaque)本周五宣布,已经卸任不再担任公司 CEO,且会辞去公司董事会职务。莫斯塔克的离职拉紧了 AI 圈内媒体、投资人、专家等人的神经,毕竟 OpenAI 阿尔特曼的“宫斗”刚刚过去没有多久。
来源:IT之家
2.OpenAI上门推荐Sora!下周将密集拜会好莱坞大咖、电影工作室
周五有媒体报道称,OpenAI将在下周前往洛杉矶,与一众好莱坞电影公司、媒体行业高管和经纪公司展开会面。主要目的有二:首先是在娱乐行业建立合作关系,同时鼓励电影制片人将Sora工具融入到他们的创作流程中。
来源:财联社
3.阶跃星辰发布Step-2万亿参数MoE语言大模型预览版
在今日上海开幕的2024全球开发者先锋大会上,通用大模型创业公司阶跃星辰正式对外亮相。阶跃星辰研发的Step-1V 千亿参数多模态大模型,在中国权威的大型模型评估平台“司南”(OpenCompass)多模态模型评测榜单中位列第一,性能比肩 GPT-4V。
来源:科创板日报
4.脑机接口首位受试者用意念在X上发帖!马斯克转发回应
Neuralink成立于2016年,该公司希望建立人脑与外部设备的通信通道:通过在大脑内植入超细线,并将这些线程连接到一个定制设计的芯片上,该芯片包含可以读取神经元组信息的电极。马斯克曾表示Neuralink的短期目标是帮助瘫痪者实现意念打字功能,未来还将可以实现让瘫痪者行走、让盲人看见,并最终实现“人机共生体”。
来源:快科技
5.OpenAI前商业化负责人:AGI将在2030年前实现
“我与AI共同成长了14年,现在我基本上确定AGI(通用人工智能)的时代要来了。”在今日开幕的2024全球开发者先锋大会上,OpenAI前全球商业化负责人扎克·卡斯带来了题为《AI向善》的演讲。
来源:财联社
6.深圳3公里精准预报!华为发布首个区域天气预报AI模型“智霁”1.0
在今天世界气象日的“气候行动最前线”主题活动上,华为云与深圳市气象局共同发布了首个人工智能区域预报模型——“智霁”1.0,标志着气象预报迎来了新的里程碑。
来源:快科技
7.财跃星辰发布国内首个千亿参数多模态金融大模型
国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”今日在2024全球开发者先锋大会上正式发布。这款由上海财跃星辰智能科技有限公司研发的金融大模型,基于万亿级金融语料预训练,具备强大的通用图像处理和图表理解能力,相比GPT-4等通用大模型在金融知识理解方面更为突出。
来源:科创板日报
8.OpenAI可能会推出Jarvis一样的个人助理
OpenAI正在申请一个新商标Voice Engine,商标的覆盖范围主要是围绕语音识别、语音合成和语音生成几个方面。这暗示着OpenAI可能即将推出围绕语音引擎开发的产品或者服务,很有可能是类似Siri那样的个人助理产品。
来源:金融届
2024.3.22
1.历史首个!联合国大会通过有关人工智能的全球决议草案
当地时间周四(3月21日),联合国大会通过了首个有关人工智能(AI)的全球决议草案,以确保这项强大的新技术能够造福所有国家、尊重人权,并且是“安全的、可靠的和值得信赖的”。
来源:财联社
2.阿里通义千问升级:免费开放 1000 万字长文档处理功能
即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和 App 快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文章。
来源:IT之家
3.工信部王正:我国人工智能核心产业规模接近5800亿元
在3月22日举行的昇思人工智能框架峰会2024上,工业和信息化部科技司科技发展处处长王正表示,今年以来,以大模型为代表的人工智能深入演进,已经进入新一轮发展加速期,我国面临难得发展机遇。
来源:证券时报·e公司
4.“AI教父”辛顿:AI将操控人类
被誉为“AI教父”的多伦多大学名誉教授杰弗里·辛顿接受采访时谈及AI的威胁。他说:“很多人主张,要防止AI失控,只要关掉电源开关就可以。但超越人类智慧的AI可以用语言操纵我们”,他预测:“未来10年内将出现自主杀死人类的机器人武器”……
来源:日经中文网
5.Suno 发布v3版本AI音乐生成模型,几秒生成两分钟歌曲
在Suno,我们正在建设一个任何人都可以创作音乐的未来。你只需几个简短的单词,就可以用任何主要语言在任何时候创作一首歌。屡获殊荣的艺术家使用Suno,但我们的核心用户群是制作音乐的普通人——通常是第一次。
来源:Suno
6.Runway与Musixmatch合作,允许音乐人生成人工智能歌词视频
音乐家现在将能够使用 Gen-2 生成 AI 视频,然后使用 Musixmatch 的平台将其同步到他们歌曲的歌词中,这可能会加快“歌词视频”的创建速度,即在环境视觉效果上及时显示歌曲歌词和音乐的流行视频——而不是通常以艺术家为特色的完整音乐视频, 乐队或叙事中的人物。
来源:venturebeat
7.大模型向中端手机普及 周鸿祎:手机厂商不做AI会成为下个诺基亚
昨日360集团创始人周鸿祎意外亮相一加 Ace 3V发布会。他在演讲中表示,大模型和硬件结合会带来新产业革命”,而未来五年,手机都是AI的最佳载体。IDC预计,2024年中国智能手机市场出货量将达到2.77亿台,同比增长2.3%。其中AI手机出货量将会达到3660万,同比增幅超过3位数。手机端AI大模型的应用将更为广泛。
来源:科创板日报
8.国内首部!AI全流程微短剧《中国神话》启播 总台央视频AI频道上线
在中央广播电视总台成立6周年之际,3月22日,央视频AI微短剧启播暨AI频道正式上线,我国首部AI全流程微短剧《中国神话》与受众见面。中宣部副部长、中央广播电视总台台长慎海雄出席,并与教育部、科技部、国家广电总局等单位嘉宾共同为微短剧启播和央视频AI频道上线。
来源:央视新闻
9.消息称苹果在中国与百度就 iOS 18 生成式 AI 合作进行谈判
据华尔街日报报道,苹果公司正与百度就其生成式人工智能模型进行合作洽谈,这可能是为了满足中国大陆境内 iPhone 用户的人工智能需求,因为中国法律法规要求此类模型在使用前必须经过监管机构的批准。
来源:IT之家
2024.3.21
1.黄仁勋对话Transformer七位论文作者:大模型资源浪费巨大
2017年,一篇具有里程碑意义的论文——《Attention is All You Need》横空出世,它首次引入了基于自注意力机制的Transformer模型,这一创新架构摆脱了传统的RNN和CNN的束缚,通过并行处理的注意力机制,有效克服了长距离依赖的难题,并显著提升了序列数据处理的速度。
来源:腾讯科技
2.突发!Stable Diffusion核心团队被曝集体离职
最新消息,Stable Diffusion核心研究团队已集体辞职!名单包括研究团队领导、论文一作Robin Rombach,共同一作Andreas Blattmann,以及另一位作者Dominik Lorenz。尽管当事人尚未回应离职原因,但《福布斯》爆料:Stability AI正因入不敷出且融不到新资金而陷入困境。
来源:量子位
3.淘宝“星辰”大模型亮相,布局电商和生活服务场景
淘宝天猫集团自研大模型“淘宝星辰”官网已经上线,这也是淘天集团公开的首个自研大模型。官网除了显示该大模型的介绍外,还设置有“立即体验”和“登录/注册”入口,或将在不久对外开放。
来源:Tech星球
4.腾讯发布GiiNEX游戏AI引擎 用AIGC助力游戏研发运营
3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术,GiiNEX将为游戏全生命周期提供丰富的AI解决方案。
来源:快科技
5.百度智能云宣布发布3款轻量级大模型+2款场景大模型
3月21日上午消息,百度智能云召开千帆产品发布会,发布包括ERNIE Speed、ERNIE Lite、ERNIE Tiny在内的三款轻量级大模型。相比千亿级别参数的大模型,轻量级大模型的参数量更小,更便于客户针对特定使用场景进行模型精调,更容易达成使用效果预期,同时节约更多成本开销。
来源:新浪科技
6.华为云入局人形机器人,与创企乐聚机器人签署合作协议
综合科创板日报、“乐聚机器人”官方公众号消息,3 月 15 日,华为云与人形机器人创业企业乐聚机器人签署合作协议,共同探索“华为盘古大模型 + 夸父人形机器人”应用场景,这是华为云合作的首个人形机器人企业。
来源:IT之家
7.GitHub 最新 AI 工具可帮助用户自动修复代码中的错误和漏洞
GitHub 今天为所有 Advanced Security(GHAS)许可用户推出了全新的“代码扫描”功能(预览版),用于搜索 GitHub 代码中潜在的安全漏洞和编码错误。
来源:IT之家
8.视旅科技VtripGPT大模型通过国家网信办备案
视旅科技开发的VtripGPT大模型通过国家网信办等主管部门的备案审核,成为湖南省两个首批通过生成式人工智能备案的大模型之一,这也是旅游行业首个通过备案的大模型。
来源:36氪
9.猎聘推出HR数字助理“多面·Dori”
今日,同道猎聘集团董事会主席兼首席执行官戴科彬分享了AI时代下的组织审美和人才评鉴的演变趋势,并推出了HR数字助理多面·Doris。多面·Doris是一个数字面试官、组织诊断官,未来它还能够进行人才陪练,同时是员工自助服务伙伴
来源:智东西
2024.3.20
1.OpenAI大模型GPT-5要来了!“提升很大”
OpenAI准备在未来几个月内发布新版大语言模型GPT-5。目前,ChatGPT使用的是GPT-4大模型,这款热门聊天机器人引发了当前的人工智能项目和投资浪潮。知情人士称,OpenAI将在今年年中的某个时候发布GPT-5,很可能是在今年夏天期间。一些企业客户最近已经收到了GPT-5大模型及其对ChatGPT相关改进的演示。
来源:凤凰科技
2.快手 CEO 程一笑放出豪言:自研大模型有信心在半年内达 GPT4.0 水平
在今晚的快手业绩电话会上,快手创始人兼 CEO 程一笑披露了公司在生成式 AI 领域的进展。程一笑表示,公司在去年启动 AI 战略后,一步步扎实推进自研大模型的研发训练。程一笑还放出豪言,声称有信心在未来半年内,使大模型的综合性能达到 GPT4.0 的水平。
来源:IT之家
3.360发布国内首个实现AI实战应用安全大模型
360公司今日发布安全大模型3.0,系国内首个实现AI实战应用的安全行业大模型。360称,以大语言模型为代表的的AI技术,不仅要为安全防护提供技术支撑,同时也要推动安全领域的创新与发展。
来源:新浪科技
4.腾讯混元大模型参数规模扩至万亿 去年视频号总用户使用时长翻番
今日盘后,腾讯控股(00700.HK)发布的2023年度业绩透露出信号:得益于视频号、AI大模型等多项业务渐露头角,代表数实经济的腾讯三大主业之一金融科技及企业服务业务实现了双位数增长。
来源:财联社
5.昔日对手变队友!OpenAI劲敌Inflection AI官宣“加盟”微软(MSFT.US)
人工智能初创公司Inflection AI表示,计划将其技术授权给微软(MSFT.US),这是这家初创公司转向与企业客户合作的一部分,此前该公司的大部分员工都跳槽去了微软。
来源:智通财经
6.给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资
多模态大模型公司「若愚科技」完成超5000万天使轮融资,本轮融资由东方精工领投,昆仲资本跟投,源合资本担任独家融资顾问。公司称,资金将主要用于产品研发,业务拓展以及团队搭建等方面。
来源:36氪
7.奥特曼回应一切:GPT-5、董事会宫斗、Ilya当时看到了什么
今年 2 月,随着 Sora 的横空出世,大家再一次把目光聚集到 OpenAI。不仅如此,去年亮相的 ChatGPT、GPT-4,更是把 AI 直接带入到生成式人工智能领域。作为一家引领科技潮流的机构,大家自然对其方方面面都产生了好奇。
来源:机器之心
2024.3.19
1.奥特曼剧透GPT-5,将在高级推理功能上实现重大进步
奥特曼:“GPT-5的能力提升幅度将超乎人们的想象…”自 Claude 3 发布以来,外界对 GPT-5 的期待越来越强。毕竟Claude 3已经全面超越了 GPT-4,成为迄今为止最强大模型。
来源:华尔街见闻
2.北京人工智能顶尖人才占全国43%左右
国新办就“立足首都城市战略定位 奋力开创高质量发展新局面”举行发布会。北京市委副书记、市长殷勇表示,北京有411人次入选全球“高被引科学家”,在全球城市名列首位。
来源:中国新闻网
3.谷歌推出多模态 VLOGGER AI:让静态肖像图动起来“说话”
谷歌近日在 GitHub 页面发布博文,介绍了 VLOGGER AI 模型,用户只需要输入一张肖像照片和一段音频内容,该模型可以让这些人物“动起来”,富有面部表情地朗读音频内容。
来源:IT之家
4.一文读懂英伟达GTC:黄仁勋晒“AI核弹”,人型机器人也来了
通过为包括OpenAI、Meta等人工智能企业提供包括H200、H100、A100等不同规格的GPU,英伟达一跃成为全球市值增速最快的企业之一,也因此被外界称之为人工智能时代的“卖水人”。以至于黄仁勋和他的财务团队,会在财报中,通过直观的图表来说明英伟达对于业绩的自信。
来源:腾讯科技
5.阿里大模型产品“通义听悟”升级:超长视频自由问,还会做思维导图
通义听悟本次升级上新了六大功能点,其中最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言 Query 处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。
来源:IT之家
6.Stability AI 开源上新:3D 生成引入视频扩散模型,质量一致性 up,4090 可玩
Stable Diffusion 背后公司 Stability AI 又上新了。这次带来的是图生 3D 方面的新进展:基于 Stable Video Diffusion 的 Stable Video 3D(SV3D),只用一张图片就能生成高质量 3D 网格。
来源:量子位
7.Unity 调查:超六成游戏工作室采用 AI 进行开发
根据 Unity 的调查显示,超过六成(62%)的游戏工作室在其项目开发过程中会利用人工智能的辅助,这些工具通常被用于节省时间和提高效率。
来源:IT之家
8.调查显示85%的中国企业将加速AI采用,比例为全球最高
IBM 委托Morning Consult调研并发布的《2023年全球 AI 采用指数》显示,中国企业的AI采用率稳居“第一阵营”,85%的中国企业表示未来会加速AI采用,这一比例为全球最高。技能不足和数据治理仍是阻碍企业落地AI 技术的主要障碍;正因如此,全球约 40% 的企业仍处于探索和试验阶段,尚未部署 AI 能力。
来源:界面新闻
9.YouTube 新规上路:上传视频需标注是否为 AI 制作,包括合成配音 / 换脸等
YouTube 将“逼真内容”定义为“任何观众容易误认为是真实的人事物或地点”的内容。若视频创作者使用真人声音的合成版本来为视频配音,或发布“AI 换脸”主题的视频,就需要附上标签。此举的本质目的是防止 AI 生成内容可能导致的虚假信息传播,而非反对创作者通过 AI 制作内容。
来源:IT之家
2024.3.18
1.马斯克开源Grok-1:3140亿参数迄今最大,权重架构全开放,磁力下载
说到做到,马斯克承诺的开源版大模型 Grok 终于来了!今天凌晨,马斯克旗下大模型公司 xAI 宣布正式开源 3140 亿参数的混合专家(MoE)模型「Grok-1」,以及该模型的权重和网络架构。这也使得Grok-1成为当前参数量最大的开源大语言模型。
来源:机器之心
2.李开复:目前最好的大模型智能已达人类平均智力水平三倍
创新工场董事长、零一万物 CEO 李开复在今天的活动中表示,大模型的智力水平在两年前就已经比普通人水平“好一点”,而在目前,世界上最好的大模型已经是人类平均智力水平的三倍。李开复以“答题”举例,即在 100 道考题里,普通人平均只能答对 33 题,而“最好的 AI 大模型”可答对 99 道以上。
来源:IT之家
3.苹果与谷歌就人工智能洽谈合作:将Gemini引入iPhone
据媒体报道,苹果正在与谷歌商谈,让大模型Gemini为iPhone的AI功能提供支持。据悉,谷的”Gemini”人工智能模型在自然语言处理和语音识别等方面表现出色,其在人工智能领域拥有广泛的应用前景。若双方达成协议,Gemini很可能被整合到iPhone的语音助手Siri、相机应用等多项应用中,显著提升人工智能的交互和创作体验。
来源:快科技
4.没等来OpenAI,等来了Open-Sora全面开源
不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红,在一众文生视频模型中突出重围,成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后,Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型
来源:机器之心
5.大模型增速远超摩尔定律!MIT 最新研究:人类快要喂不饱 AI 了
近日,来自 MIT (麻省理工学院)的研究人员发表了关于大模型能力增速的研究,结果表明,LLM 的能力大约每 8 个月就会翻一倍,速度远超摩尔定律!硬件马上就要跟不上啦!我们人类可能要养不起 AI 了!
来源:新智元
6.姚期智等数十名中外专家签署北京 AI 安全国际共识:禁止 AI 自行复制
据腾讯科技报道,包括图灵奖得主约书亚・本吉奥、杰弗里・辛顿、姚期智等在内的数十位的中外专家日前在北京联合签署了由智源研究院发起的《北京 AI 安全国际共识》,涉及人工智能“风险红线”和“路线”两大块,其中“风险红线”包含“自主复制、改进”“权力寻求”“协助不良行为者”和“欺骗”四个部分。
来源:IT之家
2024.3.17
1.ChatGPT 参数规模被扒:只有 7B
ChatGPT 惨遭攻击,参数规模终于被扒出来了 —— 很可能只有 7B(70 亿)。消息来自南加州大学最新研究,他们使用一种攻击方法,花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。
来源:量子位
2.微软 AI 程序员 AutoDev 登场:996 自主生成代码,性能超 GPT-4 30%
全球首个 AI 程序员 Devin 诞生之后,让码农纷纷恐慌。没想到,微软同时也整出了一个 AI 程序员 ——AutoDev,能够自主生成、执行代码等任务。网友惊呼,AI 编码发展太快了。
来源:IT之家
3.谷歌推出 Cappy “打分”框架,可评估 AI 准确性“教模型更聪明”
据谷歌官方新闻稿,谷歌近日推出了一项名为 Cappy 的模型打分框架,该框架以 RoBERTa 语言模型为基础,主要用于检测模型输出的内容,并为相关内容打分,之后相关分数将会作为参考基准让模型学习,从而让模型更聪明。
来源:IT之家
2024.3.16
1.苹果推出 300 亿参数 MM1 多模态 AI 大模型,可识别图像推理自然语言
苹果公司旗下研究团队近日在 ArXiv 中公布了一篇名为《MM1:Methods, Analysis & Insights from Multimodal LLM Pre-training》的论文,其中介绍了一款 “MM1”多模态大模型,该模型提供 30 亿、70 亿、300 亿三种参数规模,拥有图像识别和自然语言推理能力。
来源:IT之家
2.美图创始人吴欣鸿:Sora 给行业较大心理冲击,原本以为 2-3 年后才能实现
美图公司创始人、董事长兼首席执行官吴欣鸿在业绩会上表示,AI 原生工作流会是未来非常巨大的机会,美图会致力于 AI 原生应用的进一步打造。同时他还强调,美图不会做通用大模型,但美图会针对不同垂直场景的需求做模型的训练和微调。
来源:IT之家
3.机器人和人工智能技术拯救了美国经济
经济学家们认为,生产力大幅提高提供了一剂灵丹妙药。当公司推出更高效的机器或技术时,员工的效率就会变得更高:他们每小时的单位产出也会随之增加。结果就是,公司通常能够在不涨价的情况下,增加利润和提高员工薪酬。通货膨胀仍然可以得到控制。
来源:财富
4.“生物人工智能”复活玛丽莲·梦露,AI打造真实情感互动体验
事实上这个能够进行视频对话的玛丽莲·梦露并非真人,而是她的AI虚拟人。在技术不断飞跃的当下,AI技术给人们带来了许多难以想象的帮助,不仅是与玛丽莲·梦露聊天,更有机会和喜欢的明星、爱豆们进行单独交流与互动。
来源:钛媒体
5.何小鹏称18个月内迎来高阶智驾拐点
随着新能源汽车智能化下半场竞争的展开,头部汽车企业均在加码智能驾驶领域的资源投入。小鹏汽车CEO何小鹏认为,未来18个月内,高阶智驾的拐点将会到来,并做到全场景、更聪明和更经济。
来源:界面新闻
6.遭企业家、投资者强烈反对后,印度搁置 AI 模型发布审批计划
印度在收到诸多当地和国际企业家和投资者的批评之后,宣布搁置此前的 AI 审核计划:任何企业发布 AI 模型之前需要经过审批。
来源:IT之家
2024.3.15
1.“人工智能+”不止是加法
今年,“人工智能+”首次被写入《政府工作报告》,这个新提法为发展数字经济、推进数实融合指明了新路径。值得注意的是,“人工智能+”不是简单相加,而是要通过新技术催生新质生产力,为经济社会各个领域带来新产业、新模式、新动能,发挥出乘数效应。
来源:经济日报
2.海信发布电视行业自研星海大模型 并推出旗舰新品
海信视像 AI美好生活”全场景显示新品发布会上,海信正式发布了自研星海大模型,这也是目前电视行业最强中文大模型。在AI的加持下,海信推出全新ULED X全场景AI计算画质平台和多款旗舰新品。
来源:凤凰网科技
3.华尔街加速拥抱AI,摩根士丹利任命首位AI主管
据CNBC报道,摩根士丹利近期对其财富管理部门的技术负责人Jeff McMillan进行了晋升,任命他为集团首位AI主管,大摩联合总裁Andy Saperstein和Dan Simkowitz在周四发出的备忘录中确认了这一人事任命。
来源:华尔街见闻
4.苹果收购加拿大人工智能初创公司 将其并入AI部门
据外媒报道,苹果公司收购了加拿大人工智能初创公司DarwinAI,为其2024年大举进军生成式人工智能领域增添了技术实力。据知情人士透露,苹果今年早些时候收购了DarwinAI,数十名DarwinAI员工加入了苹果的人工智能部门。
来源:金十数据
5.海尔联合乐聚展出人形机器人“夸父”:支持洗衣、浇花等操作,搭载开源鸿蒙
3 月 14 日至 16 日,海尔机器人、乐聚机器人在 2024 年中国家电及消费电子博览会(简称:AWE)联合展出了国内首款面向家庭场景的人形机器人 ——Kuavo(夸父)。
来源:IT之家
2024.3.14
1.OpenAI 提供支持,Figure 01 人形机器人演示,网友:未来 5-10 年开启疯狂时代
Figure 01 最大的亮点在于利用 OpenAI 的大型语言模型,可以和人类进行正常的完整对话。由于 OpenAI 模型还支持多模态输入,因此可为 Figure 01 提供高级视觉和语言智能。Figure 神经网络可提供快速、低级、灵巧的机器人动作。
来源:IT之家
2.清华系大模型公司智谱AI完成新一轮融资 北京市人工智能产业投资基金参与投资
智谱AI 2024 年初已完成新一轮融资,北京市人工智能产业投资基金参与投资。智谱AI也向腾讯科技表示,本次不方便透露具体的投资金额,但智谱 AI 是该基金成立以来投资的第一家人工智能大模型公司。
来源:腾讯科技
3.英特尔公布 AI 战略路线图:今年推 Gaudi 3、明年推 Falcon Shores 等
英特尔近日发布公告,分享了关于 AI 战略和加速器的更多信息,在更多产品和软件中整合 AI 元素,更好服务企业和数据中心未来发展。
来源:IT之家
4.获千万级天使轮融资,华为系团队以AI大模型改造用工模式
夸夸菁领成立于2023年,主要为企业和政府客户提供基于AI大模型的新型用工模式。其主要产品为虚拟数字人“数智员工”,该员工目前可担任招聘助理、数智博士助理、政务助理和法律助理等职位,在企业和政府上岗。截止目前,夸夸菁领已与比亚迪、bilibili等数十家客户合作,产品也已进入深圳部分政府单位。
来源:36氪
5.阿里通义千问推出AI阅读助手功能:可一键速读百份文档 解析超万页长文档
阿里通义千问推出免费的文档解析功能,可解析网页、文档、论文、图书,突破当前大模型长文档处理的天花板。针对单个文档,通义千问能够处理超万页的极长资料,换算成中文篇幅约1000万字。针对多个文档,可一键速读100份不同格式的资料,还可解析在线网页。
来源:快科技
6.零一万物API正式上线:支持输入30万汉字,看不懂《百年孤独》的人有救了
2024 年,大模型领域的一个趋势越来越清晰:重视优化,面向应用。在去年的百模大战中,科技巨头、创业力量你追我赶,将大模型技术卷到了一个新的高度。有了强大的模型之后,更重要的是将这些能力输出到现实中的应用场景,提升用户体验、构建生态。
来源:机器之心
7.亚马逊将允许卖家粘贴链接 以便人工智能协助制作产品页面
亚马逊上的卖家很快就能通过复制粘贴链接来制作产品页面。亚马逊发布了一项新的人工智能生成功能,该功能可以从卖家的外部网站获取信息,然后为该商品生成一个亚马逊产品页面,并附上文字说明和图片。
来源:今日头条
8.Anthropic 宣布Claude 3系列模型中的Haiku型号上线,速度快且便宜
人工智能初创公司 Anthropic 刚刚发布了 Claude 3 系列人工智能模型的最新成员 Claude 3 Haiku。Haiku 在同类智能模型中速度最快、价格最实惠,具有先进的视觉功能,在行业基准测试中表现出色。
来源:VentureBeat
2024.3.13
1.OpenAI 首席技术官:文生视频工具 Sora 数月内将公开发布,拟支持生成音频
《华尔街日报》当地时间 13(今)日刊登了对 OpenAI 首席技术官米拉・穆拉蒂的采访。她表示,Sora 将在今年推出,“可能要等几个月”。穆拉蒂表示,除了面向公众公开提供 Sora 外,OpenAI 还计划加入音频生成功能,可能会使场景更为逼真。
来源:IT之家
2.OpenAI 官方博客提前泄露 GPT-4.5 Turbo,有望今年夏天发布
OpenAI 近期可能意外泄露了旗下即将发布的 GPT-4.5 Turbo 大型语言模型信息。网友发现,OpenAI 博客上疑似上线了一篇有关 GPT-4.5 Turbo 的文章,但该页面目前已被撤回,搜索引擎也无法再检索到相关信息。
来源:IT之家
3.李强在北京调研:人工智能是发展新质生产力的重要引擎
中共中央政治局常委、国务院总理李强3月13日在北京调研。他强调,要深入学习贯彻习近平总书记在全国两会期间的重要讲话精神,认真落实两会明确的各项任务,牢牢把握新一轮科技革命和产业变革趋势,在推进科技创新和产业创新深度融合中培育和壮大新质生产力,加快塑造高质量发展新动能新优势。
来源:澎湃新闻
4.国内团队发布“视频生音频”通用工具Sora Opera,文生视频解除“静音模式”
今年3月初,娱乐资本论·视智未来得知国内有团队已经有了pika“同款”音频生成工具,并且在内部试用了小半年,用于给文生视频的静音画面添加音效或背景音乐。当时,这个应用尚未对外发布。如今,该技术背后的团队“天图万境”已准备好对外亮相。由他们开发,并与华为云合作部署的这款名为Sora Opera的小工具,将在3月内上线。
来源:界面新闻
5.欧洲议会通过《人工智能法案》:禁止人工智能操纵人类行为、利用人类弱点
欧洲议会今日以 523 票赞成、46 票反对、49 票弃权的压倒性多数支持通过了《人工智能法案》,据悉,这项法案将会“具有里程碑意义”。欧洲议会表示,该法案旨在保护基本权利、环境可持续性等方面免受“高风险人工智能”的影响,同时促进创新,以将欧洲“打造成为该领域的领导者”。
来源:IT之家
6.美媒:美国务院委托撰写的报告警告,AI可能对人类构成“灭绝级”威胁
根据美国有线电视新闻网(CNN)当地时间12日报道,美国国务院委托撰写的一份报告于本周发布,报告中警告,AI可能对人类构成“灭绝级”威胁,美国必须进行干预
来源:环球网
7.马斯克预测:明年人工智能将比任何人都聪明,2029年将超过整个人类
3月13日,马斯克在X社交媒体上再发表“疯狂”预测,他写道:“明年人工智能可能会比任何人类个体都聪明,到2029年,人工智能可能比所有人类加起来还要聪明。”
来源:第一财经
8.微软 Copilot 全面升级 OpenAI GPT-4 Turbo 模型,包括免费用户
微软 Copilot 最初是作为 Bing Chat 聊天机器人推出的一款产品,早期迭代依赖于 GPT-3.5 模型,后来升级到 GPT-4 后有了大幅改进,而现在又升级到了 GPT-4 Turbo 模型,这意味着 Copilot 功能又一次实现飞跃。
来源:IT之家
2024.3.12
1.阿尔特曼、老黄齐预测:AGI 五年内降临,代替 95% 工作!但马斯克断言 AGI 将被电力卡脖子
AGI 已经成为了一个新的「5 年内实现」的未来技术。从 Altman 到老黄,都在不同场合表示,达到人类智能水平的 AI 将很快到来。而技术路径和未来可能出现的能源短缺,可能是达到 AGI 过程中的最大变数。
Claude 3、Sora、Gemini 1.5 Pro 的纷纷出现,以及或许今年内就会被放出的 GPT-5,让所有人都不约而同地隐隐感觉:我们似乎离 AGI 似乎越来越近了。
来源:IT之家
2.Midjourney 能让角色保持一致了!网友实测称直呼“改变游戏规则”
Midjourney 发布新功能,网友直呼“不可思议”!现在你可以让生成的图像几乎保持角色一致。新功能名为角色参照(Character Reference),和之前的风格参照类似,不过这次不是保持风格一致,而是保持生成图像的角色与给定的参照角色一致。
来源:IT之家
3.中东土豪重仓AI!阿联酋成立AI投资公司 资管规模或超千亿美元
随着AI热潮席卷全球,中东土豪也在快速布局。当地时间周一,阿联酋宣布成立一家专注于AI和半导体领域的科技投资公司。据消息人士透露,其资产管理规模可能在未来几年内超过1000亿美元。
来源:财联社
4.Intel Gaudi 2 AI训练比英伟达H100快55%:希望夺取更多市场份额
目前在AI领域,最受关注的就是ChatGPT,以及引起巨大震撼的Sora模型,此外基于Stable Diffusion打造的AI生图也是各大厂商目前所重点宣传的。而作为AI背后的算力硬件支持,英伟达的计算卡可以说备受追捧,供不应求,英伟达也是赚的盆满钵满。
来源:热点科技
5.老板电器将发布全球首个烹饪AI大模型
老板电器将于近期发布全球首个烹饪AI大模型, 并且,该大模型是由国内某知名实验室与老板电器合作开发。公开资料显示,老板电器近年在人工智能领域早有布局。2023年12月,老板电器提出全新企业定位——烹饪全链路整体解决方案提供商
来源:36氪
6.消息称苹果正测试基于 AI 的广告平台,Omdia 预测苹果今年广告收入可达 70 亿美元
两位知情人士向 Business Insider 透露:苹果正借鉴谷歌和 Meta 的做法,尝试利用 AI 进行广告推广,从而在 App Store 广告投放方面提供更优的服务。知情人士称,苹果已经开始向一小部分广告客户测试一款产品,该产品可以自动决定广告在 App Store 中的位置,类似于谷歌的 Performance Max 和 Meta 的 Advantage+
来源:IT之家
2024.3.11
1.世界最大开源 AI 社区 Hugging Face 涉足开源机器人领域,前特斯拉科学家领衔
据外媒 VentureBeat 报道,AI 创企 Hugging Face 设立开源机器人项目,前特斯拉科学家 Remi Cadene 领衔。Remi Cadene 的 X 平台动态显示,这位前特斯拉人形机器人 Optimus 团队成员加入 Hugging Face 并启动了一个开源机器人项目,招募愿在巴黎建造“真正的机器人”的工程师。
来源:IT之家
2.京东推出“AI 全能服务包”,帮助商家免费生成图文、视频和直播
京东日前宣布推出“AI 全能服务包”,各类 AI 工具免费生成图文、视频和直播,号称“帮助商家节省 50% 运营成本”。据介绍,京小智支持 7×24 小时自动接待,降低客服成本超 50%。“羚珑”工具可实现秒级免费生成图片,“京点点”支持秒级免费生成文案,支持 AI 生成视频。此外,京东还支持免费数字人“智能代播”,实现 24 小时不间断直播。
来源:IT之家
3.刘作虎内部讲话:AI手机不是噱头,3个月内友商必定都会跟进
OPPO高级副总裁、首席产品官,一加创始人刘作虎近日在一加内部会中回应了行业热议的AI手机话题。他表示,AI手机不是噱头,而是行业大势所趋,3个月内友商必定都会跟进。
来源:新浪科技
4.目标3-6个月赶超Sora,「爱诗科技」获达晨亿级A1轮融资
视频大模型公司「爱诗科技」近日已完成亿级A1轮融资,本轮融资由达晨财智独家投资。光源资本担任独家财务顾问。公司称,资金将主要用于底层视频大模型的技术研发及团队搭建等方面。
来源:36氪
5.继起诉 OpenAI 并要求对方恢复开源后,马斯克宣布本周 xAI 将开源 Grok
马斯克今日下午通过 X(推特)宣布,自家人工智能公司 xAI 将在本周内开源人工智能助手 Grok。随后,马斯克在回应网友“OpenAI 也应当如此,如果它们要像名字中的‘Open’那样”的帖子时表示,“OpenAI 就是谎言。”
来源:IT之家
2024.3.10
1.文生视频平台 Pika 喜提功能升级:视频有声音了,可生成各种背景音效
IT之家 3 月 10 日消息,文生视频平台 Pika 今日凌晨通过 X 平台官宣新功能:视频可以集成 AI 生成的音效了。用户现可在 Pika 生成的视频中无缝生成、整合声音,可以通过提示词来描述想要的声音,或者直接让 Pika 根据视频内容自动生成声音。“如果您觉得它很酷,那是因为它的确很酷。抱歉,我们之前静音了!”
来源:IT之家
2.ChatGPT日耗电超过50万度:美国普通家庭用电量的1.7万多倍
据媒体报道,OpenAI的热门聊天机器人ChatGPT每天可能要消耗超过50万千瓦时的电力。作为参考,美国普通家庭的日均用电量仅为29千瓦时,这意味着ChatGPT的能耗是普通家庭的近1.7万倍。
来源:快科技
3.黄仁勋最新2万字对话全文:AI 缩小了人类间的技术差距,未来10年算力将再提高100万倍
2024年3月初,NVIDIA英伟达CEO黄仁勋回到了他的母校美国斯坦福大学,参加了斯坦福商学院SIEPR经济峰会以及View From The Top 系列活动。在两场已公开的对话视频中,黄仁勋详细谈到英伟达的市场价值定位、AGI(通用人工智能)发展、AI 算力的增长,以及如何通过人类反馈将 AI 根植于人类价值观话题,而且他也回应对于“皮衣黄”来历等。
来源:钛媒体
4.李彦宏:百度文心一言4.0中文已超过ChatGPT 4.0
百度创始人李彦宏在央视2024《对话·开年说》节目中谈到了百度文心一言。李彦宏表示,文心一言4.0在中文上已经超过ChatGPT4.0。
来源:快科技
5.阿里巴巴 CEO 吴泳铭:通义千问正释放基础大模型能力,加快追赶 GPT-4
阿里巴巴集团 CEO、阿里云智能董事长吴泳铭近日在《中国网信杂志》撰文称,作为国内基础大模型的代表之一,通义千问正加快追赶 GPT-4,并把基础大模型能力释放出来。
来源:IT之家