ObjectMover:在移动图像位置时能保持物体的身份和外观
ObjectMover简介
ObjectMover是由香港大学和Adobe Research联合开发的一种新型生成模型。该模型能够在一个图像中移动物体,同时保持物体的身份、调整光照和阴影效果、填补遮挡部分,并理解材料和调整物体的透视图。ObjectMover通过将物体移动任务建模为序列到序列的问题,并利用预训练的视频生成模型来解决这一问题,从而在复杂的现实场景中实现高质量的图像编辑效果。开发团队通过使用现代游戏引擎生成高质量的合成数据,并采用多任务学习策略,使模型能够同时处理物体移动、移除和插入任务。ObjectMover在多个任务上均优于现有方法,为图像编辑领域带来了新的突破。

ObjectMover主要功能
-
物体移动:
-
在图像中将物体从一个位置移动到另一个位置,同时保持物体的身份和外观。
-
自动调整光照、阴影和反射效果,确保物体与新位置的环境一致。
-
处理复杂的场景,包括透明物体、复杂背景和遮挡关系。
-
-
物体移除:
-
从图像中完全移除物体及其相关效果(如阴影和反射)。
-
无缝填补移除物体后的空白区域,确保背景的完整性和自然性。
-
-
物体插入:
-
将物体插入到图像中的指定位置,同时确保物体与周围环境的自然融合。
-
生成逼真的阴影、反射和光照效果,使物体看起来像是原本就属于该场景的一部分。
-
ObjectMover技术原理
-
序列到序列建模:
-
将物体移动任务建模为序列到序列的问题,利用预训练的视频扩散模型来解决。
-
将输入场景图像、感兴趣物体、用户指令和目标帧视为一系列帧,利用视频模型中的视频先验知识来捕捉跨帧的光照、物体身份和场景上下文的一致性演变。
-
-
视频扩散模型:
-
使用预训练的视频扩散模型(基于扩散变换器架构)作为基础,通过微调使其适应物体移动任务。
-
通过噪声注入和逐步去噪的过程生成目标图像,确保生成结果的自然性和一致性。
-
-
合成数据生成:
-
使用现代游戏引擎(如Unreal Engine)生成高质量的合成数据对。
-
数据生成流程包括背景场景生成、运动模板预配置和物体运动序列生成,确保数据的多样性和现实性。
-
合成数据包含完整的背景图像,支持无掩码的物体移除和插入训练。
-
-
多任务学习:
-
在合成数据上同时训练物体移动、移除和插入三个任务,充分利用数据的多样性和丰富性。
-
在现实世界视频数据上训练基于掩码的插入任务,增强模型对复杂光照效果的适应能力。
-
通过多任务学习,模型能够更好地泛化到不同的场景和任务。
-
-
光照和阴影调整:
-
利用视频先验知识,自动调整物体移动后的光照和阴影效果,确保与新位置的环境一致。
-
处理复杂的光照条件,如从阳光到阴影的过渡,以及透明物体的反射和折射效果。
-
-
遮挡关系处理:
-
理解物体之间的遮挡关系,生成自然的遮挡效果。
-
在物体移动过程中,动态调整遮挡关系,确保生成的图像符合物理规律。
-
ObjectMover应用场景
-
摄影后期处理:摄影师可以轻松地将照片中的主体移动到更理想的位置,调整光照和阴影,提升照片的整体效果。
-
广告设计:广告设计师可以快速调整产品在广告画面中的位置,确保产品与背景的完美融合,增强视觉吸引力。
-
影视特效制作:在影视后期制作中,可以将角色或物体移动到不同的场景位置,生成逼真的特效,节省时间和成本。
-
虚拟现实(VR)和增强现实(AR):在虚拟场景中,可以动态调整物体的位置和光照效果,增强沉浸感和交互性。
-
游戏开发:游戏开发者可以利用该技术快速调整游戏场景中的物体位置,优化游戏画面的布局和视觉效果。
-
室内设计:室内设计师可以将家具或装饰品移动到不同的位置,预览不同的布局效果,帮助客户更好地规划空间。
ObjectMover项目入口
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...