3-1.大语言模型
ILLUME:华为诺亚方舟实验室推出的多模态模型
ILLUME简介 ILLUME是由华为诺亚方舟实验室开发的一款创新的统一多模态大型语言模型(MLLM),它通过集成多模态理解和生成能力,能够在单一的大型语言模型框架...
YuLan-Mini:中国人民大学推出的具有2.42亿参数的轻量级语言模型
YuLan-Mini简介 YuLan-Mini是由中国人民大学高瓴人工智能学院开发的一个具有2.42亿参数的轻量级语言模型。该模型以其数据高效和训练稳定性而著称,能够在相对...
Phi-4:微软推出的14亿参数的大型语言模型
Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型,它通过专注于数据质量的训练方法,在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...
Hunyuan-Large:腾讯推出的大型混合专家(MoE)模型
Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家(MoE)模型,拥有 3890 亿参数和 520 亿激活参数,能够处理高达 256K 个 token。该模型在语言...
Granite 3.0:IBM 推出的专为企业打造的高性能AI模型
Granite 3.0简介 Granite 3.0是IBM开发团队最新推出的高性能AI模型,旨在为企业提供高效、安全的人工智能解决方案。该模型系列包括多种类型,如通用语言模型...
Claude 3.5 Haiku:Anthropic推出的新型人工智能模型
Claude 3.5 Haiku简介 Claude 3.5 Haiku是由Anthropic推出的新型人工智能模型,旨在提供高效的编码和交互式任务支持。该模型以其快速处理能力和增强的推理性...
Ministral 3B/8B:Ministral AI推出的两款新型AI模型
Ministral 3B/8B简介 Ministral 3B和 8B是Ministral AI推出的两款新型AI模型,旨在提升边缘计算和设备端的智能能力。这些模型支持高达128,000个token的上下文...
Nemotron-70B-Instruct:英伟达开源的大语言模型
Nemotron-70B-Instruct简介 Nemotron-70B-Instruct 是英伟达开原的一款高性能大型语言模型,专注于提升自然语言处理的质量和效率。基于先进的变换器架构,该...
Yi-Lightning:零一万物最新推出的高性能语言模型
Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型,采用了混合专家模型架构(Mixture of Experts, MoE),结合了动态Top-P路由机制和混合...
Qwen2.5 :阿里通义千问团队推出的最新大型语言模型系列
Qwen2.5 简介 Qwen2.5是阿里通义千问团队最新发布的一系列大型语言模型,参数范围从0.5B到72B。与前一版本Qwen2相比,Qwen2.5在知识获取、编程能力和数学推理...