3.AI大模型数据库 | 第 4 页

Fugatto：英伟达推出的一款多功能音频合成和转换模型

Fugatto简介 Fugatto是由NVIDIA团队开发的一款多功能音频合成和转换模型，它能够理解和执行自由形式的文本指令，并结合可选的音频输入进行创作。该模型通过特...

3-7.语音模型

1个月前

Illustrious简介 Illustrious是由Onoma AI Research团队开发的一款先进的文本到图像生成模型，专注于生成高质量的动漫风格图像。该模型通过精细控制批处理大...

3-2.图片生成模型

1个月前

DINO-X简介 DINO-X是由IDEA研究院开发的一款先进的通用视觉大模型，它在开放世界对象检测和理解方面具有卓越的性能。该模型采用Transformer编码器-解码器架构...

3-9.其他模型

1个月前

OmniBooth简介 OmniBooth是由香港科技大学与华为诺亚方舟实验室联合开发的一种先进的图像生成框架，它通过多模态指令实现空间控制和实例级别的定制化。该框架...

3-2.图片生成模型

1个月前

IC-LoRA简介 IC-LoRA（In-Context LoRA）是由阿里通义团队推出的一种创新图像生成框架，旨在通过简化的流程和最小的调整，激活扩散变换器（DiTs）的内在上下...

3-2.图片生成模型

2个月前

JanusFlow简介 JanusFlow是由DeepSeek-AI、北京大学、香港大学和清华大学的研究团队联合开发的一个多模态框架，它通过整合自回归语言模型和修正流技术，实现...

3-2.图片生成模型

2个月前

HiCo简介 HiCo是由360 AI Research团队开发的一种层次化可控扩散模型，旨在通过整合不同对象的边界框条件来增强布局到图像生成的控制能力。该模型通过其独特...

3-2.图片生成模型

2个月前

Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家（MoE）模型，拥有 3890 亿参数和 520 亿激活参数，能够处理高达 256K 个 token。该模型在语言...

1-1.大模型&国内

2个月前

Red_Panda 简介 Red_Panda 也称为Recraft V3）是由Recraft 推出的AI图像生成模型，它在Artificial Analysis基准测试中表现优异，超越了 Midjourney 和 OpenAI...

1-2.大模型&国外

2个月前

MarDini 简介 MarDini 是 Meta AI 和 KAUST 联合推出的一种新型视频扩散模型，它融合了掩码自回归（MAR）和扩散模型（DM）的优势，用于大规模视频生成。该模...

3-3.视频生成模型

2个月前