Pixtral 12B：Mistral 推出的其首款多模态AI模型

0 50

9月11日，Mistral AI 公司发布了名为 Pixtral 12B 的多模态 AI 模型，这是他们首次推出的同时具备语言和视觉处理能力的模型。目前，虽然模型还未对公众开放，但开发者可以通过 Hugging Face 或 GitHub 下载源代码进行测试。Mistral 计划通过其网络聊天机器人和 La Platforme 平台的 API 端点，让开发者更容易地使用这个模型。

Pixtral 12B 的主要特点是能够让用户结合文本提示分析图像，支持任意数量和大小的图像输入。模型架构包含40层、14,336个隐藏维度和32个注意力头，专门设计用于处理复杂的计算任务。在视觉处理方面，它配备了一个视觉编码器，能够处理高达1024×1024分辨率的图像，拥有24个隐藏层以支持先进的图像处理。

Mistral AI 通过推出 Pixtral 12B 模型，旨在进一步推动 AI 技术在视觉应用和数据分析领域的民主化。自公司成立以来，Mistral 一直在积极构建模型管道，与行业领导者竞争，并与微软、AWS 和 Snowflake 等大公司合作，扩大其技术的影响力。此外，Mistral 还推出了其他先进的 AI 模型，如 Mistral Large 2、Mixtral 8x22B 和 Codestral，以支持多语言能力、编程和数学推理等领域。

# 1-2.大模型&国外 # 1.大模型相关 # 3-5.多模态模型 # 3.AI大模型数据库 # AI开源项目 # AI项目库

文章版权归作者所有，未经允许请勿转载。