1-2.大模型&国外

OpenAI o1:OpenAI最新推出的具备推理能力的 AI 模型

OpenAI o1简介 OpenAI 在今天凌晨1点发布了名为 o1 的新模型(传闻中的‘草莓’模型),这是其首款具备推理能力的 AI 模型。o1 采用了全新的训练方法,结合强化...

Pixtral 12B:Mistral 推出的其首款多模态AI模型

9月11日,Mistral AI 公司发布了名为 Pixtral 12B 的多模态 AI 模型,这是他们首次推出的同时具备语言和视觉处理能力的模型。目前,虽然模型还未对公众开放,...

Reflection 70B:AI写作公司HyperWrite推出的开源AI大模型

Reflection 70B简介 Reflection 70B是由AI写作公司HyperWrite推出的开源AI大模型,它基于Meta的开源Llama 3.1-70B Instruct模型,并采用了一种创新的自我纠错...

xGen-MM:Salesforce推出的一款开源多模态AI模型

xGen-MM简介 xGen-MM(原BLIP-3)是由Salesforce推出的一款开源的大型多模态模型(LMMs)。这些模型基于精心策划的数据集,采用统一的训练方法和优化的模型架...

Phi-3.5:微软最新推出的系列AI模型,包含三个模型

Phi-3.5简介 Phi-3.5是微软最新推出的系列AI模型,Phi-3.5系列包括三个模型:Phi-3.5-mini-instruct、Phi-3.5-MoE-instruct和Phi-3.5-vision-instruct,分别...

Llama-3.1-Minitron:英伟达推出的仅4B参数的小型语言模型

Llama-3.1-Minitron简介 Llama-3.1-Minitron是由英伟达公司利用先进的剪枝和知识蒸馏技术,从Llama 3.1 8B模型中提炼而成的4B参数小型语言模型。它在保持与更...

Grok-2:马斯克xAI公司推出的新一代AI模型

Grok-2简介 Grok-2是由x.ai公司新推出的一个AI语言模型,它是Grok-1.5的显著进步版本,具有在聊天、编码和推理方面的前沿能力。同时,公司还推出了Grok-2的小...

Falcon Mamba 7B:TII 推出的首个通用Mamba开源大模型

Falcon Mamba 7B简介 Falcon Mamba 7B 是由阿布扎比技术创新研究所推出的一款先进的开源人工智能语言模型,它采用了创新的 Mamba 状态空间语言模型架构,有效...

EXAONE 3.0:LG AI Research开发的7.8B参数指令调整型语言模型

EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型,具有7.8亿参数的指令调优能力,专门设计以提升双语环境下的表现,尤其在韩语上表现卓...

谷歌发布全新“开放式”人工智能模型,重点关注安全

Gemma 2系列新成员 谷歌DeepMind于2024年8月1日宣布发布了Gemma 2系列的新成员,其中包括20亿参数的小模型Gemma 2B。这个新模型在大模型竞技场LMSYS Chatbot ...
1 2