Stable-Hair:能够将现实世界中的各种发型转移到用户提供的面孔上
Stable-Hair简介
Stable-Hair是由上海交通大学、Tiamat AI、新加坡国立大学和中国科学院沈阳自动化研究所的联合研究团队开发的一种创新的基于扩散模型的头发转移技术。这项技术能够稳定且精细地将现实世界中的各种发型转移到用户提供的面孔上,用于虚拟试穿,同时保持原有面貌的身份内容和结构。通过一个两阶段的流程,包括秃头转换器和专门设计的头发提取器、潜在身份网络及头发交叉注意力层,Stable-Hair在头发转移的准确性和自然度上实现了突破,为个性化虚拟形象创造和美容行业带来革命性的影响。
Stable-Hair主要功能
- 头发转移:能够将各种现实世界中的发型稳健地转移到用户提供的面孔图像上。
- 虚拟试穿:用户可以利用这项技术在虚拟环境中试戴不同的发型,无需实际改变发型。
- 身份内容保持:在头发转移过程中,保持原有面孔的身份特征和背景结构不变。
- 高细节和高保真:转移的发型具有高细节和高保真度,确保视觉效果自然且逼真。
Stable-Hair技术原理
- 两阶段流程:
- 第一阶段:使用Bald Converter将用户上传的面孔图像转换为秃头图像。
- 第二阶段:通过特别设计的头发转移模型将目标发型应用到秃头图像上。
- 三个核心组件:
- Hair Extractor:负责从参考图像中提取所需发型的详细特征。
- Latent IdentityNet:编码源图像以保持身份内容和背景的一致性。
- Hair Cross-Attention Layers:在U-Net结构中加入,确保头发特征能够精确地融入源图像。
- 潜在控制网络(Latent ControlNet):一种新颖结构,将头发去除和转移过程从像素空间映射到潜在空间,以提高颜色一致性。
- 自动化数据生产管线:通过自动化方式生成训练所需的数据集,包括原始图像、参考图像和秃头代理图像。
- 扩散模型(Diffusion Model):基于迭代去噪过程的生成模型,用于从高斯先验分布生成目标数据分布。
- 训练与推理:
- 使用特定的损失函数和数据增强技术来训练模型,以适应现实世界的场景。
- 在推理阶段,模型通过两阶段方法生成高保真的头发转移结果。
- 评估指标:使用FID、PSNR、SSIM和IDS等指标对头发转移的效果进行全面评估。
- 用户研究:通过用户研究验证了Stable-Hair在不同方面的性能,包括转移准确性、属性保留和视觉自然性。
- 跨域转移能力:展示了Stable-Hair在不同领域图像上的头发转移效果,证明了其方法的鲁棒性和适用性。
Stable-Hair应用场景
- 虚拟试衣间:用户可以在线上试穿不同发型,无需实际改变。
- 美容应用:为客户提供个性化的发型推荐和预览。
- 电影和游戏制作:为角色设计和快速更改发型,提高制作效率。
- 社交媒体:用户分享具有不同发型的自拍照,增加互动乐趣。
- 电子商务:在产品页面展示模特不同发型的效果,提升用户体验。
- 广告行业:快速生成模特或产品与不同发型搭配的广告图像。
Stable-Hair项目入口
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...