3-2.图片生成模型
DisEnvisioner:根据用户提供的视觉提示和文本指令生成个性化的图像
DisEnvisioner简介 DisEnvisioner是由香港科技大学(广州)和诺亚方舟实验室联合开发的一种创新图像生成模型,它通过分离和丰富视觉提示中的主体本质特征,有...
Meissonic:开源可商用的非自回归文本到图像生成模型
Meissonic简介 Meissonic是由Skywork AI团队开发的一款先进的文本到图像生成模型,它通过创新的非自回归遮蔽图像建模(MIM)技术,实现了与业界领先的扩散模...
SANA:能够生成高达4096×4096分辨率的图像
SANA简介 SANA是由NVIDIA、麻省理工学院和清华大学的联合研究团队开发的一种高效的文本到图像生成框架,它能够快速生成高达4096×4096分辨率的高清晰度图像。...
CogView3:智谱AI推出的文本到图像生成模型
CogView3简介 CogView3是智谱AI推出的文本到图像生成模型,它采用了名为“接力扩散”的先进技术。这一模型通过先创建低分辨率图像,然后利用超分辨率生成高清晰...
StoryMaker:小红书开源的文生图一致性解决方案
StoryMaker简介 StoryMaker 是由小红书推出的一款开源的文生图保持一致性解决方案。这个工具能够确保在生成图像时,角色的面部特征、服装、发型和身体特征保...
OmniGen:可处理包括文本到图像生成、图像编辑等多种任务
OmniGen简介 OmniGen是由北京智源人工智能研究院(BAAI)开发的新一代统一图像生成模型。该模型通过简化的架构设计,无需额外模块即可处理包括文本到图像生成...
SwiftBrush V2:一步式文本到图像扩散模型
SwiftBrush V2简介 SwiftBrush v2是一种先进的一步式文本到图像扩散模型,旨在通过创新的训练方法和改进的模型架构,实现与多步Stable Diffusion模型相媲美甚...
FilmPortrait:生成色彩风格较为低饱和度的日系胶片风格
FilmPortrait简介 FilmPortrait 是一个基于FLUX.1-dev 上微调的 LoRA 模型,专注于探索和复现胶片摄影的独特质感。这个模型以较低的饱和度和典型的日式胶片色...
LinFusion :新加坡国立大学推出的一种新型的图像生成模型
LinFusion 简介 LinFusion是由新加坡国立大学推出的一种新型的图像生成模型,该模型通过引入线性注意力机制,显著减少了生成高分辨率图像的时间和内存复杂度...
RB-Modulation:根据参考风格图像和文本提示,生成具有特定艺术风格的图像
RB-Modulation简介 RB-Modulation是一种创新的图像生成技术,由Google的研究团队开发,它通过随机最优控制方法实现了扩散模型的训练自由个性化。这种方法允许...