1.大模型相关

Claude 3.7 Sonnet:Anthropic 推出的全球首款混合推理模型

Claude 3.7 Sonnet简介 Claude 3.7 Sonnet 是由 Anthropic 推出的全球首款混合推理模型。它结合了快速响应和深度思考的能力,用户可以根据需求选择标准模式或...

Moonlight-16B-A3B:月之暗面开源的 MoE 模型

Moonlight-16B-A3B简介 Moonlight-16B-A3B 是由 Moonshot AI 开发的一款混合专家(MoE)模型,具有 160 亿总参数和 30 亿激活参数。该模型使用了改进后的 Muo...

Grok 3:马斯克旗下xAI公司发布的最新一代AI大模型

Grok 3简介 Grok 3是由马斯克旗下xAI公司发布的最新一代人工智能大模型。它在性能上实现了巨大飞跃,相较于前代提升了数个数量级,尤其在数学推理、科学逻辑...

Mistral Saba:Mistral AI 推出的针对阿拉伯语区定制语言模型

Mistral Saba 简介 Mistral Saba 是由法国人工智能初创公司 Mistral AI 开发的一款专注于中东和南亚地区语言及文化的区域定制 AI 模型。该模型拥有 240 亿参...

Step-Video-T2V:阶跃星辰开源的文本到视频预训练模型

Step-Video-T2V简介 Step-Video-T2V是由阶跃星辰开源的文本到视频预训练模型,拥有300亿参数,能够生成长达204帧的高质量视频。该模型采用深度压缩的变分自编...

Mistral Small 3:Mistral AI开源的低延迟优化大语言模型

Mistral Small 3 简介 Mistral Small 3 是由 Mistral AI开发的一款低延迟优化的 240 亿参数模型,采用 Apache 2.0 许可证开源。该模型在性能上与更大规模的模...

Qwen2.5-1M:阿里通义开源的语言模型

Qwen2.5-1M简介 Qwen2.5-1M是由阿里通义千问团队开发的先进语言模型系列,专注于扩展上下文处理能力至100万tokens,显著提升了长文本任务的处理性能。该系列...

Janus-Pro:DeepSeek推出的开源统一多模态模型

Janus-Pro简介 Janus-Pro是由DeepSeek推出的一款开源统一多模态模型,具备强大的图像理解和生成能力。它采用创新的视觉编码解耦架构,通过SigLIP编码器和适配...

OpenAI o3-mini:OpenAI首次向免费用户开放的推理模型

OpenAI o3-mini简介 OpenAI于2025年1月31日推出了全新推理模型o3-mini,这是OpenAI首次向免费用户开放的推理模型,用户可通过ChatGPT中的“Reason”按钮直接体...

DeepSeek-R1:DeepSeek推出的新一代AI推理模型

DeepSeek-R1简介 DeepSeek-R1 是由 DeepSeek-AI 团队开发的新一代推理模型,旨在通过强化学习(RL)显著提升大型语言模型(LLMs)的推理能力。该模型分为两个...
1 2 3 4 5 9