Kimi-VL:月之暗面开源的MoE视觉-语言模型

Kimi-VL简介 Kimi-VL是由月之暗面科技有限公司(Moonshot AI)开发团队推出的一款开源的高效混合专家(MoE)视觉-语言模型(VLM)。该模型具备强大的多模态推...

HiDream-I1:智象未来开源的文生图模型

HiDream-I1简介 HiDream-I1是由HiDream-ai团队开源的图像生成基础模型,拥有17亿参数。它能在短时间内生成高质量图像,表现卓越。团队于2025年4月7日开源此模...

谷歌推出最新 AI 推理模型Gemini 2.5 Flash

2025年4月10日,谷歌正式发布了全新的AI推理模型Gemini 2.5 Flash。该模型主打高效能与灵活计算能力,具备“动态且可控”的计算特性,开发者可根据查询请求的复...

A2A:谷歌开源的首个智能体交互协议

A2A简介 Agent2Agent(A2A)协议是由谷歌开源的首个标准智能体交互协议。它旨在打破不同AI智能体之间的技术壁垒,使来自不同框架或供应商的智能体能够无缝协...

Runway发布最新视频生成模型Gen-4 Turbo

2025年4月8日,Runway公司发布了其最新视频生成模型Gen-4 Turbo。该模型以“30秒生成10秒高质量视频”的速度,重新定义了AI视频创作的效率。它在保持高保真度和...

亚马逊推出新一代生成式AI语音模型Nova Sonic

2025年4月8日,亚马逊正式推出新一代生成式AI语音模型Nova Sonic。该模型能够原生处理语音输入并生成自然流畅的语音输出,在速度、语音识别准确率和对话质量...

美图WHEE推出全新AI图像生成模型Miracle F1

2025年4月9日,美图WHEE推出了全新AI图像生成模型Miracle F1。该模型具备强大的图像生成能力,能像摄影师、建筑师和画家一样精准地处理光影、空间和材质效果...

微软 Bing 推出智能搜索模式Copilot Search

2025年4月5日,微软在其成立50周年纪念活动中正式推出了Bing的Copilot Search功能。Copilot Search将传统网络搜索与生成式AI相结合,通过整合多个网站的信息...

阶跃星辰发布全新多模态推理模型Step-R1-V-Mini

2025年4月8日,阶跃星辰正式发布了全新的多模态推理模型Step-R1-V-Mini。该模型支持图文输入和文字输出,具备良好的指令遵循能力与通用性,能够高精度感知图...

OmniCam:浙江大学等推出的多模态视频生成框架

OmniCam简介 OmniCam是由浙江大学、上海交通大学、北京工业大学、江南大学、中国科学技术大学和南京大学联合开发的统一多模态视频生成框架。该框架通过相机控...
1 6 7 8 9 10 214