1.大模型相关

HunyuanVideo-I2V:腾讯推出的可定制化图像到视频生成模型

HunyuanVideo-I2V简介 HunyuanVideo-I2V 是由腾讯开发的一款可定制化图像到视频生成模型,基于强大的 HunyuanVideo 架构。该模型通过图像潜在拼接技术,将静...

QwQ-32B:阿里 Qwen 团队推出的开源中型推理模型

QwQ-32B简介 QwQ-32B 是由阿里 Qwen 团队开发的一款开源中型推理模型。它拥有 320 亿参数,凭借先进的强化学习技术和优化策略,其性能可媲美参数量达 6710 亿...

Image-01:MiniMax 推出文本到图像生成模型

Image-01 简介 Image-01 是由 MiniMax 团队开发的一款高效且低成本的文本到图像生成模型。它能够根据用户输入的文本描述快速生成高质量、高分辨率的图像,支...

CogView4:生成图像时能够精准地融入汉字元素

CogView4 简介 CogView4 是由智谱清言团队开发的开源 AI 文生图模型,专为高质量图像生成而设计。它支持生成汉字,能够精准理解汉字的笔画与布局,并将其融入...

CSM:Sesame发布的超真实AI语音模型

CSM简介 CSM(Conversational Speech Model)是由Sesame团队开发的一款先进对话语音模型,旨在让AI语音交互更加自然和富有情感。它采用多模态Transformer架构...

Scribe:ElevenLabs推出的高精度语音转文本模型

Scribe简介 Scribe 是由 ElevenLabs 团队开发的高精度语音转文本模型。它专为复杂音频环境和多语言转录设计,支持超过 99 种语言,其中 25 种语言的词错率低...

Wan 2.1:阿里推出的视频生成大模型

Wan 2.1简介 Wan 2.1 是由阿里云开源的视频生成大模型。它能够根据文本、图像等多种输入信号生成高质量的视频内容,展现了强大的多模态生成能力。该模型基于...

Phi-4-multimodal:微软推出的首个多模态语言模型

Phi-4-multimodal简介 Phi-4-multimodal是由微软推出的首个多模态语言模型,由微软的GenAI团队负责开发。该模型拥有56亿参数,能够同时处理语音、图像和文本...

Phi-4-mini:微软推出的38 亿参数的小型语言模型

Phi-4-mini 简介 Phi-4-mini 是由微软开发团队推出的一款 38 亿参数的小型语言模型。它采用密集型解码器架构,具备分组查询注意力、20 万词汇量和共享输入输...

GPT-4.5:OpenAI推出的最新语言模型

GPT-4.5简介 GPT-4.5是由OpenAI开发的最新语言模型,代表了其在无监督学习领域的重大进步。该模型通过大规模计算和数据训练,以及架构和优化创新,展现出更广...
1 2 3 4 9