2-2.应用工具图像

Cobra:清华大学联合腾讯推出的高效线稿上色框架

Cobra简介 Cobra是由清华大学和腾讯ARC实验室联合开发的高效线稿上色框架,专为漫画行业设计。它通过整合超过200张参考图像,实现高精度、高效率和灵活的上色...

FlexIP:腾讯推出的新型图像生成编辑框架

FlexIP简介 FlexIP是由腾讯推出的一种新型图像生成编辑框架,旨在解决在个性化图像生成中身份保持与多样化编辑之间的权衡问题。该框架通过引入双适配器架...

FantasyTalking:阿里联合北邮推出的音视频驱动的肖像动画生成框架

FantasyTalking简介 FantasyTalking是由阿里巴巴集团AMAP团队和北京邮电大学联合开发的一种新型音视频驱动的肖像动画生成框架。该技术利用预训练的视频扩...

UNO:字节跳动推出的新型图像生成模型

UNO简介 UNO是由字节跳动推出的新型图像生成模型。它通过“少到多”的泛化方法,利用上下文生成能力解锁了更多的可控性,能够实现从单主体到多主体的高一致性图...

DCEdit:北交联合美图推出的文本引导图像编辑方法

DCEdit简介 DCEdit是由北京交通大学信息科学研究所与美图公司MT Lab联合开发的一种新型文本引导图像编辑方法。它通过精确语义定位(PSL)策略和双层控制(DLC...

OmniSVG:复旦大学联合 StepFun 推出的多模态SVG生成框架

OmniSVG简介 OmniSVG是由复旦大学和StepFun团队共同开发的一个强大的多模态SVG生成框架。它利用预训练的视觉-语言模型(VLMs),能够自回归地生成从简单图标...

MagicColor:香港科技大学推出的多实例草图着色框架

MagicColor简介 MagicColor是由香港科技大学的研究团队共同开发的一种基于扩散模型的多实例草图着色框架。该框架通过自玩训练策略、实例引导器以及细粒度颜色...

IntrinsiX:直接从文本描述生成反照率、粗糙度、金属度和法线贴图

IntrinsiX简介 IntrinsiX是一种文本到PBR贴图生成方法,能够直接从文本描述中生成高质量的反照率、粗糙度、金属度和法线贴图。它通过利用预训练的文本到图像...

OmniTalker:阿里推出的实时文本驱动的说话头像生成框架

OmniTalker简介 OmniTalker是由阿里巴巴集团通义实验室开发的一款实时文本驱动的说话头像生成框架。它通过创新的双分支扩散变换器架构和跨模态注意力机制,能...

Mini DALL·E 3:清华大学等推出的交互式文本到图像生成模型

Mini DALL·E 3简介 Mini DALL·E 3是由北京理工大学、上海人工智能实验室、清华大学和香港中文大学联合开发的交互式文本到图像生成模型。它通过自然语言与用户...
1 2 3 4 5 24