Pixtral 12B:Mistral 推出的其首款多模态AI模型

Pixtral 12B:Mistral 推出的其首款多模态AI模型

9月11日,Mistral AI 公司发布了名为 Pixtral 12B 的多模态 AI 模型,这是他们首次推出的同时具备语言和视觉处理能力的模型。目前,虽然模型还未对公众开放,但开发者可以通过 Hugging FaceGitHub 下载源代码进行测试。Mistral 计划通过其网络聊天机器人和 La Platforme 平台的 API 端点,让开发者更容易地使用这个模型。

Pixtral 12B 的主要特点是能够让用户结合文本提示分析图像,支持任意数量和大小的图像输入。模型架构包含40层、14,336个隐藏维度和32个注意力头,专门设计用于处理复杂的计算任务。在视觉处理方面,它配备了一个视觉编码器,能够处理高达1024×1024分辨率的图像,拥有24个隐藏层以支持先进的图像处理。

Mistral AI 通过推出 Pixtral 12B 模型,旨在进一步推动 AI 技术在视觉应用和数据分析领域的民主化。自公司成立以来,Mistral 一直在积极构建模型管道,与行业领导者竞争,并与微软、AWS 和 Snowflake 等大公司合作,扩大其技术的影响力。此外,Mistral 还推出了其他先进的 AI 模型,如 Mistral Large 2、Mixtral 8x22B 和 Codestral,以支持多语言能力、编程和数学推理等领域。

© 版权声明
pANYIIS.jpg

相关文章

暂无评论

暂无评论...