3-1.大语言模型
OLMo 2 32B:Allen Institute for AI推出的大型语言模型
OLMo 2 32B简介 OLMo 2 32B 是由 Allen Institute for AI (Ai2) 开发的大型语言模型,是 OLMo 2 系列中规模最大且性能最强的模型。它拥有 320 亿参数,经过 6...
Command A:Cohere 团队开源的语言模型
Command A 简介 Command A 是由 Cohere 团队开源的语言模型,专为企业级应用设计,旨在提供卓越性能与极低硬件成本。它在处理商业、STEM 和编程任务时表现出...
Gemini Embedding:谷歌 DeepMind 推出的文本嵌入模型
Gemini Embedding简介 Gemini Embedding 是谷歌 DeepMind 团队推出的一款文本嵌入模型。该模型基于 Gemini 架构开发,能够将文本转化为高维数值向量,捕捉其...
LAWGPT:南京大学开源的中文法律知识增强型语言模型
LAWGPT简介 LAWGPT是由南京大学国家新型软件技术重点实验室、人工智能学院和智能科学技术学院联合开发的开源中文法律知识增强型大型语言模型。该模型专为中文...
QwQ-32B:阿里 Qwen 团队推出的开源中型推理模型
QwQ-32B简介 QwQ-32B 是由阿里 Qwen 团队开发的一款开源中型推理模型。它拥有 320 亿参数,凭借先进的强化学习技术和优化策略,其性能可媲美参数量达 6710 亿...
Phi-4-mini:微软推出的38 亿参数的小型语言模型
Phi-4-mini 简介 Phi-4-mini 是由微软开发团队推出的一款 38 亿参数的小型语言模型。它采用密集型解码器架构,具备分组查询注意力、20 万词汇量和共享输入输...
Claude 3.7 Sonnet:Anthropic 推出的全球首款混合推理模型
Claude 3.7 Sonnet简介 Claude 3.7 Sonnet 是由 Anthropic 推出的全球首款混合推理模型。它结合了快速响应和深度思考的能力,用户可以根据需求选择标准模式或...
Moonlight-16B-A3B:月之暗面开源的 MoE 模型
Moonlight-16B-A3B简介 Moonlight-16B-A3B 是由 Moonshot AI 开发的一款混合专家(MoE)模型,具有 160 亿总参数和 30 亿激活参数。该模型使用了改进后的 Muo...
LLaDA:中国人民大学联合蚂蚁集团推出的大语言模型
LLaDA简介 LLaDA(Large Language Diffusion with mAsking)是由中国人民大学高瓴人工智能学院和蚂蚁集团联合开发的一种新型大语言模型。该模型采用扩散模型...
Mistral Saba:Mistral AI 推出的针对阿拉伯语区定制语言模型
Mistral Saba 简介 Mistral Saba 是由法国人工智能初创公司 Mistral AI 开发的一款专注于中东和南亚地区语言及文化的区域定制 AI 模型。该模型拥有 240 亿参...