3-1.大语言模型 | 柒柒AI导航

OLMo 2 32B：Allen Institute for AI推出的大型语言模型

OLMo 2 32B简介 OLMo 2 32B 是由 Allen Institute for AI (Ai2) 开发的大型语言模型，是 OLMo 2 系列中规模最大且性能最强的模型。它拥有 320 亿参数，经过 6...

3-1.大语言模型

4个月前

Command A 简介 Command A 是由 Cohere 团队开源的语言模型，专为企业级应用设计，旨在提供卓越性能与极低硬件成本。它在处理商业、STEM 和编程任务时表现出...

1-2.大模型&国外

4个月前

Gemini Embedding简介 Gemini Embedding 是谷歌 DeepMind 团队推出的一款文本嵌入模型。该模型基于 Gemini 架构开发，能够将文本转化为高维数值向量，捕捉其...

3-1.大语言模型

4个月前

LAWGPT简介 LAWGPT是由南京大学国家新型软件技术重点实验室、人工智能学院和智能科学技术学院联合开发的开源中文法律知识增强型大型语言模型。该模型专为中文...

3-1.大语言模型

4个月前

QwQ-32B简介 QwQ-32B 是由阿里 Qwen 团队开发的一款开源中型推理模型。它拥有 320 亿参数，凭借先进的强化学习技术和优化策略，其性能可媲美参数量达 6710 亿...

1-1.大模型&国内

4个月前

Phi-4-mini 简介 Phi-4-mini 是由微软开发团队推出的一款 38 亿参数的小型语言模型。它采用密集型解码器架构，具备分组查询注意力、20 万词汇量和共享输入输...

1-2.大模型&国外

5个月前

Claude 3.7 Sonnet简介 Claude 3.7 Sonnet 是由 Anthropic 推出的全球首款混合推理模型。它结合了快速响应和深度思考的能力，用户可以根据需求选择标准模式或...

1-2.大模型&国外

5个月前

Moonlight-16B-A3B简介 Moonlight-16B-A3B 是由 Moonshot AI 开发的一款混合专家（MoE）模型，具有 160 亿总参数和 30 亿激活参数。该模型使用了改进后的 Muo...

1-1.大模型&国内

5个月前

LLaDA简介 LLaDA（Large Language Diffusion with mAsking）是由中国人民大学高瓴人工智能学院和蚂蚁集团联合开发的一种新型大语言模型。该模型采用扩散模型...

3-1.大语言模型

5个月前

Mistral Saba 简介 Mistral Saba 是由法国人工智能初创公司 Mistral AI 开发的一款专注于中东和南亚地区语言及文化的区域定制 AI 模型。该模型拥有 240 亿参...

1-2.大模型&国外

5个月前