2-2.应用工具图像
新StoryWeaver:知识增强型故事角色定制模型
StoryWeaver简介 StoryWeaver是一个知识增强型故事角色定制模型,旨在通过构建角色图谱(Character Graph)和知识增强型空间引导(KE-SG)技术,实现故事中的...
新GraphAgent:香港大学联合香港科技大学推出的自动化图语言助手
GraphAgent简介 GraphAgent是由香港大学和香港科技大学(广州)的研究团队共同开发的一款先进的自动化图语言助手。它通过集成语言模型与图语言模型,能够处理...
DynamicControl:腾讯等推出的多条件自适应文本到图像生成框架
DynamicControl简介 DynamicControl是由腾讯联合南洋理工、浙大等研究机构推出的一种创新框架,旨在提升文本到图像生成任务中的条件控制能力。该框架通过动态...
Infinity:字节跳动推出的高分辨率图像合成模型
Infinity简介 Infinity是由字节跳动公司开发的一种先进的比特视觉自回归模型,它能够根据语言指令生成高分辨率、逼真的图像。该模型通过采用无限词汇量的标记...
DreamOmni:图像生成与编辑的多任务统一模型
DreamOmni简介 DreamOmni 是由字节跳动、香港中文大学和香港科技大学联合推出的一款图像生成和编辑模型。该模型通过统一框架整合了文本到图像(T2I)生成和多...
HelloMeme:专注于生成具有高度细节和真实感的表情包视频
HelloMeme简介 HelloMeme是一种文本到图像扩散模型,专注于生成具有高度细节和真实感的表情包视频。它通过优化2D特征图相关的注意力机制,提升了模型在处理夸...
InvSR:从低分辨率图像恢复出高分辨率图像
InvSR简介 InvSR是一种创新的图像超分辨率技术,由南洋理工大学S-Lab的团队开发。这项技术基于扩散反转原理,通过预测最优噪声图来初始化采样过程,从而利用...
CAP4D:能够从参考图像中重建出逼真的4D人像化身
CAP4D简介 CAP4D是由加拿大多伦多大学和Vector Institute的研究团队开发的一种创新方法,它利用可变形的多视图扩散模型(Morphable Multi-View Diffusion Mod...
CLEAR:提高预训练扩散变换器在超分辨率图像生成中的效率
CLEAR简介 CLEAR是一种线性注意力机制,由新加坡国立大学的研究团队开发,旨在提高预训练扩散变换器(DiTs)在高分辨率图像生成任务中的效率。通过引入局部性...
CrossFlow:能够直接将一种模态(如文本)演化成另一种模态(如图像)
CrossFlow简介 CrossFlow是一个创新的跨模态演变框架,它能够直接将一种模态(如文本)演化成另一种模态(如图像),而无需依赖噪声分布或条件机制。利用流匹...