1-1.大模型&国内

Qwen2.5-1M:阿里通义开源的语言模型

Qwen2.5-1M简介 Qwen2.5-1M是由阿里通义千问团队开发的先进语言模型系列,专注于扩展上下文处理能力至100万tokens,显著提升了长文本任务的处理性能。该系列...

Janus-Pro:DeepSeek推出的开源统一多模态模型

Janus-Pro简介 Janus-Pro是由DeepSeek推出的一款开源统一多模态模型,具备强大的图像理解和生成能力。它采用创新的视觉编码解耦架构,通过SigLIP编码器和适配...

DeepSeek-R1:DeepSeek推出的新一代AI推理模型

DeepSeek-R1简介 DeepSeek-R1 是由 DeepSeek-AI 团队开发的新一代推理模型,旨在通过强化学习(RL)显著提升大型语言模型(LLMs)的推理能力。该模型分为两个...

Kimi k1.5:Kimi 最新推出的多模态大型语言模型

Kimi k1.5简介 Kimi k1.5 是由 Kimi 团队开发的最新多模态大型语言模型(LLM),专注于通过强化学习(RL)提升模型的推理能力和效率。该模型在长文本推理和多...

豆包大模型1.5 Pro:字节跳动发布的最新大语言模型

豆包大模型1.5 Pro简介 豆包大模型1.5 Pro是字节跳动最新发布的先进人工智能模型,具备强大的综合性能和多模态交互能力。它采用高效的稀疏MoE架构,性能超越G...

MiniMax-01:MiniMax推出的全新系列模型

MiniMax-01简介 MiniMax-01是MiniMax推出的全新系列模型,旨在突破大型语言模型(LLMs)和视觉语言模型(VLMs)在处理长文本上下文时的限制。该系列包括MiniM...

Hunyuan-Large:腾讯推出的大型混合专家(MoE)模型

Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家(MoE)模型,拥有 3890 亿参数和 520 亿激活参数,能够处理高达 256K 个 token。该模型在语言...

Yi-Lightning:零一万物最新推出的高性能语言模型

Yi-Lightning简介 Yi-Lightning是由零一万物公司推出的高性能语言模型,采用了混合专家模型架构(Mixture of Experts, MoE),结合了动态Top-P路由机制和混合...

CogVideoX-5B-I2V:智谱 AI 最新开源的文本到视频生成模型

CogVideoX-5B-I2V简介 CogVideoX-5B-I2V 是智谱 AI 开源的文本到视频生成模型,基于 3D 因果变分自编码器和专家自适应 LayerNorm 技术,能够根据文本提示生成...

Qwen2.5 :阿里通义千问团队推出的最新大型语言模型系列

Qwen2.5 简介 Qwen2.5是阿里通义千问团队最新发布的一系列大型语言模型,参数范围从0.5B到72B。与前一版本Qwen2相比,Qwen2.5在知识获取、编程能力和数学推理...
1 2 3 4 5