3.AI大模型数据库 | 第 29 页

Bark： Suno AI 推出的一个开源文本到音频模型

Bark简介 Bark 是由 Suno AI 推出的一个开源文本到音频模型，它基于转换器架构，能够生成逼真的多语言语音以及其他类型的音频，包括音乐、背景噪音和简单的音...

2-4.应用工具音频

8个月前

Stable Video 4D简介 Stable Video 4D 是由 Stability AI 推出的一款人工智能视频生成模型。它通过先进的算法，能够将单一视频输入转化为八个不同视角下的多...

2-3.应用工具视频

8个月前

Mistral Large 2简介 Mistral Large 2 是由法国人工智能初创公司 Mistral AI 开发的最新一代大型语言模型。它拥有 1230 亿参数，支持 128k 的上下文窗口，能...

1-2.大模型&国外

8个月前

NeuralGCM简介 NeuralGCM是由Google Research团队开发的一种创新的神经通用循环模型，它突破了传统气象预报和气候模拟的局限。这一模型通过将深度学习技术与...

1-1.大模型&国内

8个月前

Llama3.1简介 Llama 3.1 是 Meta 发布的一系列大型多语言语言模型，包含 8B、70B 和 405B 参数的版本。这些模型不仅支持预训练和指令调整，还具备更长的上下...

1-2.大模型&国外

8个月前

SadTalker简介 SadTalker是由西安交通大学、腾讯AI实验室和蚂蚁集团的联合研究团队开发的一项先进技术。这项技术能够利用单张静态人脸图像和音频输入，生成逼...

2-3.应用工具视频

9个月前

Mistral NeMo模型简介 Mistral NeMo是由Mistral AI与NVIDIA合作推出的一款具有120亿参数的大型语言模型，它以高达128k tokens的上下文窗口和出色的推理、世界...

1-2.大模型&国外

9个月前

浦语灵笔IXC-2.5简介浦语灵笔IXC-2.5是由上海人工智能实验室联合香港中文大学、商汤科技集团和清华大学共同开发的一款多功能大型视觉语言模型。它具有长上下...

1-1.大模型&国内

9个月前