1-1.大模型&国内

Qwen2.5-Omni:阿里开源的端到端全模态大模型

Qwen2.5-Omni简介 Qwen2.5-Omni是由阿里开源的端到端全模态大模型,能够处理文本、图像、音频和视频等多种模态输入,并以流式方式同时生成文本和自然语音响应...

Qwen2.5-VL-32B:阿里开源的最新多模态模型

Qwen2.5-VL-32B简介 Qwen2.5-VL-32B 是由阿里巴巴团队开发的最新多模态模型,参数规模为为32B。该模型在视觉语言理解和生成方面表现出色,能够处理图像描述、...

Open-Sora 2.0:潞晨科技推开源的SOTA视频生成模型

Open-Sora 2.0简介 Open-Sora 2.0是由潞晨科技推出的全新开源SOTA(State-of-the-Art)视频生成模型。该模型仅用20万美元的训练成本,便实现了与全球领先视频...

HunyuanVideo-I2V:腾讯推出的可定制化图像到视频生成模型

HunyuanVideo-I2V简介 HunyuanVideo-I2V 是由腾讯开发的一款可定制化图像到视频生成模型,基于强大的 HunyuanVideo 架构。该模型通过图像潜在拼接技术,将静...

QwQ-32B:阿里 Qwen 团队推出的开源中型推理模型

QwQ-32B简介 QwQ-32B 是由阿里 Qwen 团队开发的一款开源中型推理模型。它拥有 320 亿参数,凭借先进的强化学习技术和优化策略,其性能可媲美参数量达 6710 亿...

Image-01:MiniMax 推出文本到图像生成模型

Image-01 简介 Image-01 是由 MiniMax 团队开发的一款高效且低成本的文本到图像生成模型。它能够根据用户输入的文本描述快速生成高质量、高分辨率的图像,支...

CogView4:生成图像时能够精准地融入汉字元素

CogView4 简介 CogView4 是由智谱清言团队开发的开源 AI 文生图模型,专为高质量图像生成而设计。它支持生成汉字,能够精准理解汉字的笔画与布局,并将其融入...

Wan 2.1:阿里推出的视频生成大模型

Wan 2.1简介 Wan 2.1 是由阿里云开源的视频生成大模型。它能够根据文本、图像等多种输入信号生成高质量的视频内容,展现了强大的多模态生成能力。该模型基于...

Moonlight-16B-A3B:月之暗面开源的 MoE 模型

Moonlight-16B-A3B简介 Moonlight-16B-A3B 是由 Moonshot AI 开发的一款混合专家(MoE)模型,具有 160 亿总参数和 30 亿激活参数。该模型使用了改进后的 Muo...

Step-Video-T2V:阶跃星辰开源的文本到视频预训练模型

Step-Video-T2V简介 Step-Video-T2V是由阶跃星辰开源的文本到视频预训练模型,拥有300亿参数,能够生成长达204帧的高质量视频。该模型采用深度压缩的变分自编...
1 2 3 5