3-1.大语言模型 | 第 3 页

Phi-4：微软推出的14亿参数的大型语言模型

Phi-4简介 Phi-4是由微软研究团队开发的14亿参数的大型语言模型，它通过专注于数据质量的训练方法，在STEM领域的问答能力上超越了其教师模型GPT-4。该模型在...

3-1.大语言模型

7个月前

Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家（MoE）模型，拥有 3890 亿参数和 520 亿激活参数，能够处理高达 256K 个 token。该模型在语言...

1-1.大模型&国内

8个月前

Granite 3.0简介 Granite 3.0是IBM开发团队最新推出的高性能AI模型，旨在为企业提供高效、安全的人工智能解决方案。该模型系列包括多种类型，如通用语言模型...

3-1.大语言模型

9个月前

Claude 3.5 Haiku简介 Claude 3.5 Haiku是由Anthropic推出的新型人工智能模型，旨在提供高效的编码和交互式任务支持。该模型以其快速处理能力和增强的推理性...

3-1.大语言模型

9个月前

Ministral 3B/8B简介 Ministral 3B和 8B是Ministral AI推出的两款新型AI模型，旨在提升边缘计算和设备端的智能能力。这些模型支持高达128,000个token的上下文...

1-2.大模型&国外

9个月前

Nemotron-70B-Instruct简介 Nemotron-70B-Instruct 是英伟达开原的一款高性能大型语言模型，专注于提升自然语言处理的质量和效率。基于先进的变换器架构，该...

1-2.大模型&国外

9个月前

Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型，采用了混合专家模型架构（Mixture of Experts, MoE），结合了动态Top-P路由机制和混合...

1-1.大模型&国内

9个月前

Qwen2.5 简介 Qwen2.5是阿里通义千问团队最新发布的一系列大型语言模型，参数范围从0.5B到72B。与前一版本Qwen2相比，Qwen2.5在知识获取、编程能力和数学推理...

1-1.大模型&国内

10个月前

XVERSE-MoE-A36B简介 XVERSE-MoE-A36B 是由深圳元象科技自主研发的支持多语言的大语言模型（Large Language Model），使用混合专家模型（MoE，Mixture-of-exp...

1-1.大模型&国内

10个月前

OpenAI o1简介 OpenAI 在今天凌晨1点发布了名为 o1 的新模型（传闻中的‘草莓’模型），这是其首款具备推理能力的 AI 模型。o1 采用了全新的训练方法，结合强化...

1-2.大模型&国外

10个月前