3-1.大语言模型 | 第 6 页

EXAONE 3.0：LG AI Research开发的7.8B参数指令调整型语言模型

EXAONE 3.0简介 EXAONE 3.0是由LG AI Research团队开发的先进语言模型，具有7.8亿参数的指令调优能力，专门设计以提升双语环境下的表现，尤其在韩语上表现卓...

1-2.大模型&国外

8个月前

LSLM简介 LSLM（Listening-while-Speaking Language Model）是由上海交通大学人工智能教育部重点实验室X-LANCE实验室与字节跳动公司联合开发的创新性端到端模...

2-1.应用工具文本

8个月前

Qwen2-Math简介 Qwen2-Math是阿里巴巴通义团队开发的一款先进的数学解决方案模型，它通过专门化的预训练和精细调整，显著提升了解决包括代数、几何、概率在内...

1-1.大模型&国内

8个月前

MiniCPM-V 2.6简介 MiniCPM-V 2.6 是由面壁智能开发的端侧多模态大型语言模型，是 MiniCPM-V 系列中最新、功能最强大的模型。该模型基于 SigLip-400M 和 Qwen...

1-1.大模型&国内

8个月前

Gemma 2系列新成员谷歌DeepMind于2024年8月1日宣布发布了Gemma 2系列的新成员，其中包括20亿参数的小模型Gemma 2B。这个新模型在大模型竞技场LMSYS Chatbot ...

1-2.大模型&国外

8个月前

Mistral Large 2简介 Mistral Large 2 是由法国人工智能初创公司 Mistral AI 开发的最新一代大型语言模型。它拥有 1230 亿参数，支持 128k 的上下文窗口，能...

1-2.大模型&国外

9个月前

Llama3.1简介 Llama 3.1 是 Meta 发布的一系列大型多语言语言模型，包含 8B、70B 和 405B 参数的版本。这些模型不仅支持预训练和指令调整，还具备更长的上下...

1-2.大模型&国外

9个月前

Mistral NeMo模型简介 Mistral NeMo是由Mistral AI与NVIDIA合作推出的一款具有120亿参数的大型语言模型，它以高达128k tokens的上下文窗口和出色的推理、世界...

1-2.大模型&国外

9个月前

浦语灵笔IXC-2.5简介浦语灵笔IXC-2.5是由上海人工智能实验室联合香港中文大学、商汤科技集团和清华大学共同开发的一款多功能大型视觉语言模型。它具有长上下...

1-1.大模型&国内

9个月前