3-2.图片生成模型

Red_Panda:AI设计平台Recraft 推出的图像生成模型

Red_Panda 简介 Red_Panda 也称为Recraft V3)是由Recraft 推出的AI图像生成模型,它在Artificial Analysis基准测试中表现优异,超越了 Midjourney 和 OpenAI...

FlexGen:香港科技大学推出的多视图图像生成框架

FlexGen简介 FlexGen是由香港科技大学(HKUST)的研究团队开发的一种创新的多视图图像生成框架,它能够根据单一视图图像或文本提示生成可控和一致的多视图图...

FLUID:谷歌&MIT联合推出的自回归文本到图像生成模型

FLUID简介 FLUID是由Google DeepMind和MIT的研究团队共同开发的一种自回归文本到图像生成模型,它通过使用连续标记和随机顺序生成的方法,在图像生成的视觉质...

Stable Diffusion 3.5: Stability AI 最新推出的图像生成模型

Stable Diffusion 3.5简介 Stable Diffusion 3.5 是由 Stability AI 最新推出的开源图像生成模型,旨在提升用户的创作体验。该版本引入了三种模型:Stable Di...

HART:麻省理工学院、英伟达和清华联合推出的图像生成模型

HART简介 HART(Hybrid Autoregressive Transformer)是由麻省理工学院、英伟达和清华大学的联合研究团队开发的一种先进的自回归图像生成模型。该模型能够直...

BiGR:香港大学等推出的新型条件图像生成模型

BiGR简介 BiGR是由香港大学、香港科技大学、云天励飞和香港中文大学联合推出的一种创新的条件图像生成模型,它通过使用紧凑的二进制潜在代码来增强图像的生成...

ComfyGen:NVIDIA和特拉维夫大学联合推出的文本到图像生成系统

ComfyGen简介 ComfyGen是由NVIDIA和特拉维夫大学的研究团队共同开发的一种创新的文本到图像生成系统。该系统通过利用大型语言模型(LLM)自动创建与用户输入...

DisEnvisioner:根据用户提供的视觉提示和文本指令生成个性化的图像

DisEnvisioner简介 DisEnvisioner是由香港科技大学(广州)和诺亚方舟实验室联合开发的一种创新图像生成模型,它通过分离和丰富视觉提示中的主体本质特征,有...

Meissonic:开源可商用的非自回归文本到图像生成模型

Meissonic简介 Meissonic是由Skywork AI团队开发的一款先进的文本到图像生成模型,它通过创新的非自回归遮蔽图像建模(MIM)技术,实现了与业界领先的扩散模...

SANA:能够生成高达4096×4096分辨率的图像

SANA简介 SANA是由NVIDIA、麻省理工学院和清华大学的联合研究团队开发的一种高效的文本到图像生成框架,它能够快速生成高达4096×4096分辨率的高清晰度图像。...
1 2 3 4 5 6