3.AI大模型数据库
Fugatto:英伟达推出的一款多功能音频合成和转换模型
Fugatto简介 Fugatto是由NVIDIA团队开发的一款多功能音频合成和转换模型,它能够理解和执行自由形式的文本指令,并结合可选的音频输入进行创作。该模型通过特...
Illustrious:专注于生成高质量的动漫风格图像的绘画模型
Illustrious简介 Illustrious是由Onoma AI Research团队开发的一款先进的文本到图像生成模型,专注于生成高质量的动漫风格图像。该模型通过精细控制批处理大...
DINO-X:IDEA研究院推出的一款通用视觉大模型
DINO-X简介 DINO-X是由IDEA研究院开发的一款先进的通用视觉大模型,它在开放世界对象检测和理解方面具有卓越的性能。该模型采用Transformer编码器-解码器架构...
OmniBooth:华为联合香港科技大学推出的图像生成框架
OmniBooth简介 OmniBooth是由香港科技大学与华为诺亚方舟实验室联合开发的一种先进的图像生成框架,它通过多模态指令实现空间控制和实例级别的定制化。该框架...
IC-LoRA:阿里通义团队推出的一种创新图像生成框架
IC-LoRA简介 IC-LoRA(In-Context LoRA)是由阿里通义团队推出的一种创新图像生成框架,旨在通过简化的流程和最小的调整,激活扩散变换器(DiTs)的内在上下...
JanusFlow:DeepSeek推出的多模态统一框架
JanusFlow简介 JanusFlow是由DeepSeek-AI、北京大学、香港大学和清华大学的研究团队联合开发的一个多模态框架,它通过整合自回归语言模型和修正流技术,实现...
HiCo:360推出的用于布局到图像生成的 分层可控扩散模型
HiCo简介 HiCo是由360 AI Research团队开发的一种层次化可控扩散模型,旨在通过整合不同对象的边界框条件来增强布局到图像生成的控制能力。该模型通过其独特...
Hunyuan-Large:腾讯推出的大型混合专家(MoE)模型
Hunyuan-Large简介 Hunyuan-Large 是由腾讯推出的大型混合专家(MoE)模型,拥有 3890 亿参数和 520 亿激活参数,能够处理高达 256K 个 token。该模型在语言...
Red_Panda:AI设计平台Recraft 推出的图像生成模型
Red_Panda 简介 Red_Panda 也称为Recraft V3)是由Recraft 推出的AI图像生成模型,它在Artificial Analysis基准测试中表现优异,超越了 Midjourney 和 OpenAI...
MarDini:Meta AI 和 KAUST 联合推出的视频扩散模型
MarDini 简介 MarDini 是 Meta AI 和 KAUST 联合推出的一种新型视频扩散模型,它融合了掩码自回归(MAR)和扩散模型(DM)的优势,用于大规模视频生成。该模...