3-1.大语言模型 | 第 2 页

通古大模型：专注于古籍理解和处理的大语言模型

通古大模型简介通古大模型是由华南理工大学深度学习与视觉计算实验室（SCUT-DLVCLab）开发的一款专注于古籍理解和处理的大语言模型。该模型基于Baichuan2-7B...

2-1.应用工具文本

5个月前

Mistral Small 3 简介 Mistral Small 3 是由 Mistral AI开发的一款低延迟优化的 240 亿参数模型，采用 Apache 2.0 许可证开源。该模型在性能上与更大规模的模...

1-2.大模型&国外

5个月前

Qwen2.5-1M简介 Qwen2.5-1M是由阿里通义千问团队开发的先进语言模型系列，专注于扩展上下文处理能力至100万tokens，显著提升了长文本任务的处理性能。该系列...

1-1.大模型&国内

5个月前

OpenAI o3-mini简介 OpenAI于2025年1月31日推出了全新推理模型o3-mini，这是OpenAI首次向免费用户开放的推理模型，用户可通过ChatGPT中的“Reason”按钮直接体...

1-2.大模型&国外

6个月前

VideoChat-Flash 简介 VideoChat-Flash 是由上海人工智能实验室、南京大学和中国科学院深圳先进技术研究院联合开发的一种新型多模态大语言模型（MLLM），专门...

3-1.大语言模型

6个月前

DeepSeek-R1简介 DeepSeek-R1 是由 DeepSeek-AI 团队开发的新一代推理模型，旨在通过强化学习（RL）显著提升大型语言模型（LLMs）的推理能力。该模型分为两个...

1-1.大模型&国内

6个月前

豆包大模型1.5 Pro简介豆包大模型1.5 Pro是字节跳动最新发布的先进人工智能模型，具备强大的综合性能和多模态交互能力。它采用高效的稀疏MoE架构，性能超越G...

1-1.大模型&国内

6个月前

SocraticLM简介 SocraticLM是由中国科学技术大学与认知智能国家重点实验室联合开发的一款大型语言模型，旨在通过苏格拉底式教学法实现个性化教学。该模型通过...

3-1.大语言模型

6个月前

ILLUME简介 ILLUME是由华为诺亚方舟实验室开发的一款创新的统一多模态大型语言模型（MLLM），它通过集成多模态理解和生成能力，能够在单一的大型语言模型框架...

3-1.大语言模型

7个月前

YuLan-Mini简介 YuLan-Mini是由中国人民大学高瓴人工智能学院开发的一个具有2.42亿参数的轻量级语言模型。该模型以其数据高效和训练稳定性而著称，能够在相对...

3-1.大语言模型

7个月前