3-1.大语言模型

通古大模型:专注于古籍理解和处理的大语言模型

通古大模型简介 通古大模型是由华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)开发的一款专注于古籍理解和处理的大语言模型。该模型基于Baichuan2-7B...

Mistral Small 3:Mistral AI开源的低延迟优化大语言模型

Mistral Small 3 简介 Mistral Small 3 是由 Mistral AI开发的一款低延迟优化的 240 亿参数模型,采用 Apache 2.0 许可证开源。该模型在性能上与更大规模的模...

Qwen2.5-1M:阿里通义开源的语言模型

Qwen2.5-1M简介 Qwen2.5-1M是由阿里通义千问团队开发的先进语言模型系列,专注于扩展上下文处理能力至100万tokens,显著提升了长文本任务的处理性能。该系列...

OpenAI o3-mini:OpenAI首次向免费用户开放的推理模型

OpenAI o3-mini简介 OpenAI于2025年1月31日推出了全新推理模型o3-mini,这是OpenAI首次向免费用户开放的推理模型,用户可通过ChatGPT中的“Reason”按钮直接体...

VideoChat-Flash:南京大学等推出的多模态大语言模型

VideoChat-Flash 简介 VideoChat-Flash 是由上海人工智能实验室、南京大学和中国科学院深圳先进技术研究院联合开发的一种新型多模态大语言模型(MLLM),专门...

DeepSeek-R1:DeepSeek推出的新一代AI推理模型

DeepSeek-R1简介 DeepSeek-R1 是由 DeepSeek-AI 团队开发的新一代推理模型,旨在通过强化学习(RL)显著提升大型语言模型(LLMs)的推理能力。该模型分为两个...

豆包大模型1.5 Pro:字节跳动发布的最新大语言模型

豆包大模型1.5 Pro简介 豆包大模型1.5 Pro是字节跳动最新发布的先进人工智能模型,具备强大的综合性能和多模态交互能力。它采用高效的稀疏MoE架构,性能超越G...

SocraticLM:个性化教学的苏格拉底式对话模型

SocraticLM简介 SocraticLM是由中国科学技术大学与认知智能国家重点实验室联合开发的一款大型语言模型,旨在通过苏格拉底式教学法实现个性化教学。该模型通过...

ILLUME:华为诺亚方舟实验室推出的多模态模型

ILLUME简介 ILLUME是由华为诺亚方舟实验室开发的一款创新的统一多模态大型语言模型(MLLM),它通过集成多模态理解和生成能力,能够在单一的大型语言模型框架...

YuLan-Mini:中国人民大学推出的具有2.42亿参数的轻量级语言模型

YuLan-Mini简介 YuLan-Mini是由中国人民大学高瓴人工智能学院开发的一个具有2.42亿参数的轻量级语言模型。该模型以其数据高效和训练稳定性而著称,能够在相对...
1 2 3 4 6