2-2.应用工具图像

SuperEdit:字节等推出的新型图像编辑方法

SuperEdit项目简介 SuperEdit是由字节跳动智能创作团队(ByteDance Intelligent Creation)和佛罗里达中央大学计算机视觉研究中心(Center for Research in C...

Insert Anything:浙大联合哈佛大学等推出的图像插入框架

Insert Anything项目简介 “Insert Anything”是由浙江大学、哈佛大学和南洋理工大学联合开发的创新图像插入框架。该框架能够将参考图像中的对象无缝集成到目标...

ICEdit:浙大联合哈佛大学推出的新型指令式图像编辑方法

ICEdit项目简介 ICEdit是由浙江大学与哈佛大学共同开发的一种新型指令式图像编辑方法。该方法基于大规模扩散变换器(Diffusion Transformer),通过上下文生...

LaRI:从单张图像中推理三维几何结构的新方法

LaRI项目简介 LaRI(Layered Ray Intersections)是由KAUST(阿卜杜拉国王科技大学)、Google和慕尼黑工业大学联合开发的一种从单张图像中推理三维几何结构的...

T2I-R1:香港中文大学等推出的文本到图像生成模型

T2I-R1项目简介 T2I-R1是由中国香港中文大学(深圳)多媒体实验室(MMLab)和上海人工智能实验室联合开发的一种新型推理增强型文本到图像生成模型。该模型通...

UniTok:香港大学联合字节推出的统一视觉分词器

UniTok项目简介 UniTok是由香港大学、字节跳动公司和华中科技大学联合开发的一种创新的统一视觉分词器。它旨在弥合视觉生成与理解之间的差距,为多模态大语言...

PixelHacker:华科大联合VIVO 推出的新型图像修复模型

PixelHacker项目简介 PixelHacker是由华中科技大学和VIVO AI实验室联合开发的一种新型图像修复模型,旨在解决复杂结构和语义一致性问题。该模型基于潜在类别...

RepText:Shakker Labs推出的的文本渲染框架

RepText项目简介 RepText是由Shakker Labs开发的一种创新的文本渲染框架,旨在通过复制字符形状而非理解文本内容,实现高质量的多语言视觉文本渲染。该框架基...

DreamO:字节联合北大推出的统一图像定制框架

DreamO项目简介 DreamO是由字节跳动智能创作团队与北京大学电子与计算机工程学院联合开发的统一图像定制框架。它基于扩散变换器(DiT)架构,通过大规模训练...

Concept Lancet:宾夕法尼亚大学推出的新型图像编辑框架

Concept Lancet项目简介 Concept Lancet(CoLan)是由宾夕法尼亚大学的研究团队开发的一种新型图像编辑框架,旨在通过精确的表示操作改善基于扩散模型的图像...
1 2 3 23