3-1.大语言模型

Qwen2.5 :阿里通义千问团队推出的最新大型语言模型系列

Qwen2.5 简介 Qwen2.5是阿里通义千问团队最新发布的一系列大型语言模型,参数范围从0.5B到72B。与前一版本Qwen2相比,Qwen2.5在知识获取、编程能力和数学推理...

XVERSE-MoE-A36B:元象推出的国内最大的MoE开源模型

XVERSE-MoE-A36B简介 XVERSE-MoE-A36B 是由深圳元象科技自主研发的支持多语言的大语言模型(Large Language Model),使用混合专家模型(MoE,Mixture-of-exp...

OpenAI o1:OpenAI最新推出的具备推理能力的 AI 模型

OpenAI o1简介 OpenAI 在今天凌晨1点发布了名为 o1 的新模型(传闻中的‘草莓’模型),这是其首款具备推理能力的 AI 模型。o1 采用了全新的训练方法,结合强化...

丰语 :顺丰推出的物流行业垂直领域大语言模型

丰语简介 顺丰科技在2024年9月8日的深圳国际人工智能展上发布了名为“丰语”的物流行业垂直领域大语言模型。这个模型专门针对物流行业的特定需求进行了优化,以...

DeepSeek-V2.5:深度求索新推出的融合通用与代码能力的AI开源模型

DeepSeek-V2.5简介 DeepSeek-V2.5 是 DeepSeek-V2-Chat 与 DeepSeek-Coder-V2-Instruct 的升级版本。新模型融合了这两个版本的通用能力和编码能力,还更好地...

Reflection 70B:AI写作公司HyperWrite推出的开源AI大模型

Reflection 70B简介 Reflection 70B是由AI写作公司HyperWrite推出的开源AI大模型,它基于Meta的开源Llama 3.1-70B Instruct模型,并采用了一种创新的自我纠错...

MiniCPM 3.0 :面壁智能最新发布的端侧 AI 模型

MiniCPM 3.0 简介 MiniCPM 3.0 是面壁智能最新发布的端侧 AI 模型,它以 4B 参数的规模实现了对 GPT-3.5 的性能超越。这款模型在自然语言处理、知识掌握、编...

ancient_text_generation_LLM:输入现代汉语句子,生成古汉语风格的句子

ancient_text_generation_LLM简介 'ancient_text_generation_LLM'是一个现代文转古文的模型。该模型利用荀子基座大模型,并通过'文言文-现代文'的平行语料库...

GLM-4-Plus:智谱AI推出的高智能旗舰大模型

GLM-4-Plus简介 GLM-4-Plus是智谱AI最新推出的旗舰大模型,它在语言理解和长文本处理方面实现了显著的性能提升。采用先进的PPO技术,GLM-4-Plus在推理和指令...

GLM-4-Flash:智谱AI首个免费API,零成本使用大模型

GLM-4-Flash简介 GLM-4-Flash是由智谱AI开发的一款高性能大语言模型,以其快速的生成速度和支持多语言的能力而闻名。这款模型专为简单、低成本且需要快速响应...
1 2 3 4 5