3-1.大语言模型
Phi-4:微软推出的14亿参数的大型语言模型
Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型,它通过专注于数据质量的训练方法,在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...
Hunyuan-Large:腾讯推出的大型混合专家(MoE)模型
Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家(MoE)模型,拥有 3890 亿参数和 520 亿激活参数,能够处理高达 256K 个 token。该模型在语言...
Granite 3.0:IBM 推出的专为企业打造的高性能AI模型
Granite 3.0简介 Granite 3.0是IBM开发团队最新推出的高性能AI模型,旨在为企业提供高效、安全的人工智能解决方案。该模型系列包括多种类型,如通用语言模型...
Claude 3.5 Haiku:Anthropic推出的新型人工智能模型
Claude 3.5 Haiku简介 Claude 3.5 Haiku是由Anthropic推出的新型人工智能模型,旨在提供高效的编码和交互式任务支持。该模型以其快速处理能力和增强的推理性...
Ministral 3B/8B:Ministral AI推出的两款新型AI模型
Ministral 3B/8B简介 Ministral 3B和 8B是Ministral AI推出的两款新型AI模型,旨在提升边缘计算和设备端的智能能力。这些模型支持高达128,000个token的上下文...
Nemotron-70B-Instruct:英伟达开源的大语言模型
Nemotron-70B-Instruct简介 Nemotron-70B-Instruct 是英伟达开原的一款高性能大型语言模型,专注于提升自然语言处理的质量和效率。基于先进的变换器架构,该...
Yi-Lightning:零一万物最新推出的高性能语言模型
Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型,采用了混合专家模型架构(Mixture of Experts, MoE),结合了动态Top-P路由机制和混合...
Qwen2.5 :阿里通义千问团队推出的最新大型语言模型系列
Qwen2.5 简介 Qwen2.5是阿里通义千问团队最新发布的一系列大型语言模型,参数范围从0.5B到72B。与前一版本Qwen2相比,Qwen2.5在知识获取、编程能力和数学推理...
XVERSE-MoE-A36B:元象推出的国内最大的MoE开源模型
XVERSE-MoE-A36B简介 XVERSE-MoE-A36B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),使用混合专家模型(MoE,Mixture-of-exp...
OpenAI o1:OpenAI最新推出的具备推理能力的 AI 模型
OpenAI o1简介 OpenAI 在今天凌晨1点发布了名为 o1 的新模型(传闻中的‘草莓’模型),这是其首款具备推理能力的 AI 模型。o1 采用了全新的训练方法,结合强化...