1.大模型相关 | 第 2 页

HunyuanVideo-I2V：腾讯推出的可定制化图像到视频生成模型

HunyuanVideo-I2V简介 HunyuanVideo-I2V 是由腾讯开发的一款可定制化图像到视频生成模型，基于强大的 HunyuanVideo 架构。该模型通过图像潜在拼接技术，将静...

1-1.大模型&国内

4个月前

QwQ-32B简介 QwQ-32B 是由阿里 Qwen 团队开发的一款开源中型推理模型。它拥有 320 亿参数，凭借先进的强化学习技术和优化策略，其性能可媲美参数量达 6710 亿...

1-1.大模型&国内

4个月前

Image-01 简介 Image-01 是由 MiniMax 团队开发的一款高效且低成本的文本到图像生成模型。它能够根据用户输入的文本描述快速生成高质量、高分辨率的图像，支...

1-1.大模型&国内

4个月前

CogView4 简介 CogView4 是由智谱清言团队开发的开源 AI 文生图模型，专为高质量图像生成而设计。它支持生成汉字，能够精准理解汉字的笔画与布局，并将其融入...

1-1.大模型&国内

4个月前

CSM简介 CSM（Conversational Speech Model）是由Sesame团队开发的一款先进对话语音模型，旨在让AI语音交互更加自然和富有情感。它采用多模态Transformer架构...

1-2.大模型&国外

4个月前

Scribe简介 Scribe 是由 ElevenLabs 团队开发的高精度语音转文本模型。它专为复杂音频环境和多语言转录设计，支持超过 99 种语言，其中 25 种语言的词错率低...

1-2.大模型&国外

4个月前

Wan 2.1简介 Wan 2.1 是由阿里云开源的视频生成大模型。它能够根据文本、图像等多种输入信号生成高质量的视频内容，展现了强大的多模态生成能力。该模型基于...

1-1.大模型&国内

4个月前

Phi-4-multimodal简介 Phi-4-multimodal是由微软推出的首个多模态语言模型，由微软的GenAI团队负责开发。该模型拥有56亿参数，能够同时处理语音、图像和文本...

1-2.大模型&国外

4个月前

Phi-4-mini 简介 Phi-4-mini 是由微软开发团队推出的一款 38 亿参数的小型语言模型。它采用密集型解码器架构，具备分组查询注意力、20 万词汇量和共享输入输...

1-2.大模型&国外

4个月前

GPT-4.5简介 GPT-4.5是由OpenAI开发的最新语言模型，代表了其在无监督学习领域的重大进步。该模型通过大规模计算和数据训练，以及架构和优化创新，展现出更广...

1-2.大模型&国外

4个月前