MiniMax Audio发布全新的语音模型Speech-02

2025年4月2日,MiniMax Audio正式发布了全新的语音模型Speech-02。该模型支持30多种语言,一次性可输入高达20万字符。其人声相似度高达99%,合成语音自然流畅...

Krea AI 推出 Gemini 图像编辑功能

2025年4月2日,Krea AI 宣布推出 Gemini 图像编辑功能,用户可在 Krea Chat 中上传图片,通过自然语言指令编辑图片,如改变背景、调整元素的光线和颜色等。此...

ElevenLabs推出AI“狗语”文本转语音模型Text To Bark

2025年4月1日,ElevenLabs宣布推出全球首个AI“狗语”文本转语音模型“Text To Bark”。该模型可将用户输入的文字转化为高度逼真的狗吠声,支持多种犬种选择,如...

EasyControl:高效灵活的多条件控制图像生成框架

EasyControl简介 EasyControl是由Tiamat AI、上海科技大学、新加坡国立大学和Liblib AI联合开发的高效灵活的条件控制框架,专为扩散Transformer(DiT)设计。...

HSMR:从单张图像中恢复具有生物力学精确骨骼的人体模型

HSMR简介 HSMR(Human Skeleton and Mesh Recovery)是一种创新的3D人体重建方法,能够从单张图像中恢复具有生物力学精确骨骼的人体模型。它基于SKEL模型,结...

Free4D:华中科技大学推出的4D场景生成框架

Free4D简介 Free4D是由华中科技大学、南洋理工大学S-Lab以及大湾区大学的研究团队共同开发的一种新型4D场景生成框架。它能够从单张图像生成具有时空一致性的4...

AI-ClothingTryOn:开源的桌面虚拟试衣应用

AI-ClothingTryOn 简介 AI-ClothingTryOn 是一款基于 Google Gemini 技术的开源桌面虚拟试衣应用。用户只需上传人物照片和服装图片,即可生成多达 10 种逼真...

SECOND ME:心识宇宙推出的的AI原生记忆系统

SECOND ME简介 SECOND ME是由Mindverse【心识宇宙】推出的的AI原生记忆系统,旨在通过大型语言模型(LLM)技术重新定义个人记忆管理。它作为一个智能的、持久...

Runway 推出最新视频生成模型Runway Gen-4

2025年4月1日,人工智能初创公司Runway正式发布其最新一代视频生成模型——Runway Gen-4。它专为媒体生成和世界一致性构建而设计,能够精确生成跨场景一致的角...

VantAI推出全球首个原子级基础模型Neo-1

VantAI推出全球首个原子级基础模型 Neo-1,它将结构预测与分子设计统一起来,能够根据多模态和精细的结构信息进行提示,用于设计生物分子和加速结构数据收集...
1 10 11 12 13 14 214