1.大模型相关

XVERSE-MoE-A36B:元象推出的国内最大的MoE开源模型

XVERSE-MoE-A36B简介 XVERSE-MoE-A36B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),使用混合专家模型(MoE,Mixture-of-exp...

OpenAI o1:OpenAI最新推出的具备推理能力的 AI 模型

OpenAI o1简介 OpenAI 在今天凌晨1点发布了名为 o1 的新模型(传闻中的‘草莓’模型),这是其首款具备推理能力的 AI 模型。o1 采用了全新的训练方法,结合强化...

Vchitect 2.0:书生蒲语团队推出的AI视频生成模型

Vchitect 2.0简介 Vchitect 2.0 是由书生蒲语团队推出的AI视频生成模型,它通过深度学习和自然语言处理技术,实现了文本到视频和图像到视频的转换功能。这个...

Pixtral 12B:Mistral 推出的其首款多模态AI模型

9月11日,Mistral AI 公司发布了名为 Pixtral 12B 的多模态 AI 模型,这是他们首次推出的同时具备语言和视觉处理能力的模型。目前,虽然模型还未对公众开放,...

丰语 :顺丰推出的物流行业垂直领域大语言模型

丰语简介 顺丰科技在2024年9月8日的深圳国际人工智能展上发布了名为“丰语”的物流行业垂直领域大语言模型。这个模型专门针对物流行业的特定需求进行了优化,以...

DeepSeek-V2.5:深度求索新推出的融合通用与代码能力的AI开源模型

DeepSeek-V2.5简介 DeepSeek-V2.5 是 DeepSeek-V2-Chat 与 DeepSeek-Coder-V2-Instruct 的升级版本。新模型融合了这两个版本的通用能力和编码能力,还更好地...

Reflection 70B:AI写作公司HyperWrite推出的开源AI大模型

Reflection 70B简介 Reflection 70B是由AI写作公司HyperWrite推出的开源AI大模型,它基于Meta的开源Llama 3.1-70B Instruct模型,并采用了一种创新的自我纠错...

MiniCPM 3.0 :面壁智能最新发布的端侧 AI 模型

MiniCPM 3.0 简介 MiniCPM 3.0 是面壁智能最新发布的端侧 AI 模型,它以 4B 参数的规模实现了对 GPT-3.5 的性能超越。这款模型在自然语言处理、知识掌握、编...

Yi-Coder:零一万物推出的一系列AI编程助手模型 支持52种编程语言

Yi-Coder简介 Yi-Coder是由零一万物推出的一系列AI编程助手模型,包含1.5B和9B参数两个版本,专为高效推理和灵活训练设计。这些模型在预训练了2.4万亿高质量...

Step-1X:阶跃星辰推出的图像生成大模型

Step-1X简介 Step-1X是阶跃星辰公司开发的一款图像生成大模型,它专注于深度语义对齐和细节生成能力,采用全链路自研的 DiT(Diffusion Models with transfor...
1 2 3 4