1-1.大模型&国内 | 第 2 页

Qwen2.5-1M：阿里通义开源的语言模型

Qwen2.5-1M简介 Qwen2.5-1M是由阿里通义千问团队开发的先进语言模型系列，专注于扩展上下文处理能力至100万tokens，显著提升了长文本任务的处理性能。该系列...

1-1.大模型&国内

2个月前

Janus-Pro简介 Janus-Pro是由DeepSeek推出的一款开源统一多模态模型，具备强大的图像理解和生成能力。它采用创新的视觉编码解耦架构，通过SigLIP编码器和适配...

1-1.大模型&国内

2个月前

DeepSeek-R1简介 DeepSeek-R1 是由 DeepSeek-AI 团队开发的新一代推理模型，旨在通过强化学习（RL）显著提升大型语言模型（LLMs）的推理能力。该模型分为两个...

1-1.大模型&国内

2个月前

Kimi k1.5简介 Kimi k1.5 是由 Kimi 团队开发的最新多模态大型语言模型（LLM），专注于通过强化学习（RL）提升模型的推理能力和效率。该模型在长文本推理和多...

1-1.大模型&国内

2个月前

豆包大模型1.5 Pro简介豆包大模型1.5 Pro是字节跳动最新发布的先进人工智能模型，具备强大的综合性能和多模态交互能力。它采用高效的稀疏MoE架构，性能超越G...

1-1.大模型&国内

2个月前

MiniMax-01简介 MiniMax-01是MiniMax推出的全新系列模型，旨在突破大型语言模型（LLMs）和视觉语言模型（VLMs）在处理长文本上下文时的限制。该系列包括MiniM...

1-1.大模型&国内

3个月前

Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家（MoE）模型，拥有 3890 亿参数和 520 亿激活参数，能够处理高达 256K 个 token。该模型在语言...

1-1.大模型&国内

5个月前

Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型，采用了混合专家模型架构（Mixture of Experts, MoE），结合了动态Top-P路由机制和混合...

1-1.大模型&国内

6个月前

CogVideoX-5B-I2V简介 CogVideoX-5B-I2V 是智谱 AI 开源的文本到视频生成模型，基于 3D 因果变分自编码器和专家自适应 LayerNorm 技术，能够根据文本提示生成...

1-1.大模型&国内

7个月前

Qwen2.5 简介 Qwen2.5是阿里通义千问团队最新发布的一系列大型语言模型，参数范围从0.5B到72B。与前一版本Qwen2相比，Qwen2.5在知识获取、编程能力和数学推理...

1-1.大模型&国内

7个月前