博客 | 第 12 页 | 柒柒AI导航

MiniMax Audio发布全新的语音模型Speech-02

2025年4月2日，MiniMax Audio正式发布了全新的语音模型Speech-02。该模型支持30多种语言，一次性可输入高达20万字符。其人声相似度高达99%，合成语音自然流畅...

AI新发布/功能更新

4周前

2025年4月2日，Krea AI 宣布推出 Gemini 图像编辑功能，用户可在 Krea Chat 中上传图片，通过自然语言指令编辑图片，如改变背景、调整元素的光线和颜色等。此...

AI新发布/功能更新

4周前

2025年4月1日，ElevenLabs宣布推出全球首个AI“狗语”文本转语音模型“Text To Bark”。该模型可将用户输入的文字转化为高度逼真的狗吠声，支持多种犬种选择，如...

AI新发布/功能更新

4周前

EasyControl简介 EasyControl是由Tiamat AI、上海科技大学、新加坡国立大学和Liblib AI联合开发的高效灵活的条件控制框架，专为扩散Transformer（DiT）设计。...

2-2.应用工具图像

4周前

HSMR简介 HSMR（Human Skeleton and Mesh Recovery）是一种创新的3D人体重建方法，能够从单张图像中恢复具有生物力学精确骨骼的人体模型。它基于SKEL模型，结...

3-9.其他模型

4周前

Free4D简介 Free4D是由华中科技大学、南洋理工大学S-Lab以及大湾区大学的研究团队共同开发的一种新型4D场景生成框架。它能够从单张图像生成具有时空一致性的4...

2-6.应用工具3D

4周前

AI-ClothingTryOn 简介 AI-ClothingTryOn 是一款基于 Google Gemini 技术的开源桌面虚拟试衣应用。用户只需上传人物照片和服装图片，即可生成多达 10 种逼真...

2-2.应用工具图像

4周前

SECOND ME简介 SECOND ME是由Mindverse【心识宇宙】推出的的AI原生记忆系统，旨在通过大型语言模型（LLM）技术重新定义个人记忆管理。它作为一个智能的、持久...

3-9.其他模型

4周前

2025年4月1日，人工智能初创公司Runway正式发布其最新一代视频生成模型——Runway Gen-4。它专为媒体生成和世界一致性构建而设计，能够精确生成跨场景一致的角...

AI新发布/功能更新

4周前

VantAI推出全球首个原子级基础模型 Neo-1，它将结构预测与分子设计统一起来，能够根据多模态和精细的结构信息进行提示，用于设计生物分子和加速结构数据收集...

AI新发布/功能更新

4周前