2-2.应用工具图像
OmniConsistency:新加坡国立大学推出的图像风格迁移模型
OmniConsistency项目简介 OmniConsistency是由新加坡国立大学Show Lab团队提出的一种创新的图像风格化方法,旨在解决扩散模型在复杂场景中保持风格一致性和防...
MagicTryOn:浙大联合vivo等推出的视频虚拟试衣框架
MagicTryOn项目简介 MagicTryOn是由浙江大学计算机科学与技术学院、vivo移动通信有限公司以及BoardWare Information System Limited的联合开发团队提出的一种...
FLUX.1 Kontext:Black Forest Labs 推出的图像生成与编辑模型
FLUX.1 Kontext项目简介 FLUX.1 Kontext是由Black Forest Labs开发的一种先进的生成式流匹配模型,旨在将图像生成与编辑功能融合于单一架构之中。该模型借助...
SuperEdit:字节等推出的新型图像编辑方法
SuperEdit项目简介 SuperEdit是由字节跳动智能创作团队(ByteDance Intelligent Creation)和佛罗里达中央大学计算机视觉研究中心(Center for Research in C...
Insert Anything:浙大联合哈佛大学等推出的图像插入框架
Insert Anything项目简介 “Insert Anything”是由浙江大学、哈佛大学和南洋理工大学联合开发的创新图像插入框架。该框架能够将参考图像中的对象无缝集成到目标...
ICEdit:浙大联合哈佛大学推出的新型指令式图像编辑方法
ICEdit项目简介 ICEdit是由浙江大学与哈佛大学共同开发的一种新型指令式图像编辑方法。该方法基于大规模扩散变换器(Diffusion Transformer),通过上下文生...
LaRI:从单张图像中推理三维几何结构的新方法
LaRI项目简介 LaRI(Layered Ray Intersections)是由KAUST(阿卜杜拉国王科技大学)、Google和慕尼黑工业大学联合开发的一种从单张图像中推理三维几何结构的...
T2I-R1:香港中文大学等推出的文本到图像生成模型
T2I-R1项目简介 T2I-R1是由中国香港中文大学(深圳)多媒体实验室(MMLab)和上海人工智能实验室联合开发的一种新型推理增强型文本到图像生成模型。该模型通...
UniTok:香港大学联合字节推出的统一视觉分词器
UniTok项目简介 UniTok是由香港大学、字节跳动公司和华中科技大学联合开发的一种创新的统一视觉分词器。它旨在弥合视觉生成与理解之间的差距,为多模态大语言...
PixelHacker:华科大联合VIVO 推出的新型图像修复模型
PixelHacker项目简介 PixelHacker是由华中科技大学和VIVO AI实验室联合开发的一种新型图像修复模型,旨在解决复杂结构和语义一致性问题。该模型基于潜在类别...