3.AI大模型数据库
Bark: Suno AI 推出的一个开源文本到音频模型
Bark简介 Bark 是由 Suno AI 推出的一个开源文本到音频模型,它基于转换器架构,能够生成逼真的多语言语音以及其他类型的音频,包括音乐、背景噪音和简单的音...
Stable Video 4D:Stability AI最新推出的用于动态多角度视频生成的 AI 模型
Stable Video 4D简介 Stable Video 4D 是由 Stability AI 推出的一款人工智能视频生成模型。它通过先进的算法,能够将单一视频输入转化为八个不同视角下的多...
Mistral Large 2:Mistral AI 推出的最新一代大语言模型
Mistral Large 2简介 Mistral Large 2 是由法国人工智能初创公司 Mistral AI 开发的最新一代大型语言模型。它拥有 1230 亿参数,支持 128k 的上下文窗口,能...
NeuralGCM:谷歌发布的最新天气预报AI 模型
NeuralGCM简介 NeuralGCM是由Google Research团队开发的一种创新的神经通用循环模型,它突破了传统气象预报和气候模拟的局限。这一模型通过将深度学习技术与...
Llama 3.1:Meta 推出迄今为止最大、最好的开源 AI 模型
Llama3.1简介 Llama 3.1 是 Meta 发布的一系列大型多语言语言模型,包含 8B、70B 和 405B 参数的版本。这些模型不仅支持预训练和指令调整,还具备更长的上下...
SadTalker:单张静态人脸图像和音频输入,生成逼真且风格化的3D动态谈话视频
SadTalker简介 SadTalker是由西安交通大学、腾讯AI实验室和蚂蚁集团的联合研究团队开发的一项先进技术。这项技术能够利用单张静态人脸图像和音频输入,生成逼...
Mistral NeMo:Mistral AI与英伟达合作推出的一款具有120亿参数的大型语言模型
Mistral NeMo模型简介 Mistral NeMo是由Mistral AI与NVIDIA合作推出的一款具有120亿参数的大型语言模型,它以高达128k tokens的上下文窗口和出色的推理、世界...
浦语灵笔IXC-2.5:支持长上下文输入和输出的多功能大视觉语言模型
浦语灵笔IXC-2.5简介 浦语灵笔IXC-2.5是由上海人工智能实验室联合香港中文大学、商汤科技集团和清华大学共同开发的一款多功能大型视觉语言模型。它具有长上下...