CN114820292A - 图像合成方法、装置、设备及存储介质 - Google Patents
图像合成方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN114820292A CN114820292A CN202210557450.5A CN202210557450A CN114820292A CN 114820292 A CN114820292 A CN 114820292A CN 202210557450 A CN202210557450 A CN 202210557450A CN 114820292 A CN114820292 A CN 114820292A
- Authority
- CN
- China
- Prior art keywords
- image
- composite
- target
- candidate
- map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001308 synthesis method Methods 0.000 title claims abstract description 38
- 239000002131 composite material Substances 0.000 claims abstract description 219
- 239000000203 mixture Substances 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000012545 processing Methods 0.000 claims abstract description 40
- 238000012805 post-processing Methods 0.000 claims abstract description 31
- 230000008569 process Effects 0.000 claims abstract description 20
- 238000013461 design Methods 0.000 claims description 94
- 238000005034 decoration Methods 0.000 claims description 74
- 230000004927 fusion Effects 0.000 claims description 59
- 238000012549 training Methods 0.000 claims description 47
- 238000013210 evaluation model Methods 0.000 claims description 42
- 238000010586 diagram Methods 0.000 claims description 37
- 230000006870 function Effects 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 17
- 230000002194 synthesizing effect Effects 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000005286 illumination Methods 0.000 claims description 6
- 230000007246 mechanism Effects 0.000 claims description 4
- 239000003086 colorant Substances 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 abstract description 56
- 238000003786 synthesis reaction Methods 0.000 abstract description 56
- 230000000694 effects Effects 0.000 abstract description 18
- 239000000463 material Substances 0.000 description 11
- 241001465754 Metazoa Species 0.000 description 5
- 230000008676 import Effects 0.000 description 4
- 238000009877 rendering Methods 0.000 description 4
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000002932 luster Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/04—Context-preserving transformations, e.g. by using an importance map
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Processing Or Creating Images (AREA)
Abstract
本申请提供一种图像合成方法、装置、设备及存储介质,该方法包括:获取待合成的目标对象轮廓图以及背景图,首先根据背景图确定目标对象在背景图的尺寸范围,再根据尺寸范围构建多张候选合成图,多张候选合成图包括一个或多个尺寸的目标对象在背景图的不同位置的合成图。随后从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,再对目标合成图进行图像后处理,获得满足图像要求的合成图。基于上述处理过程,可提升图像合成的效率和效果,生成的合成图更加自然和真实。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种图像合成方法、装置、设备及存储介质。
背景技术
图像合成包括将一张图片的前景剪切后合成到另一张图片中,例如从一张图片中提取人物,将该人物合成到另一张图片中。相关技术中,在获得前景图片后,通常由专业作图人员使用图像处理软件,对前景图片和背景图片进行像素级别的调整,该方式存在人力成本高且效率低下的问题。
发明内容
本申请实施例提供一种图像合成方法、装置、设备及存储介质,提高图像合成的效率和效果。
本申请实施例的第一方面提供一种图像合成方法,包括:
获取待合成的目标对象轮廓图以及背景图;
根据所述背景图确定目标对象在所述背景图的尺寸范围;
构建多张候选合成图,所述多张候选合成图中的目标对象符合所述尺寸范围且位于所述背景图的不同位置;
从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图;
对所述目标合成图进行图像后处理,获得满足图像要求的合成图。
本申请第一方面的一个可选实施例中,所述多张候选合成图包括不同尺寸的目标对象轮廓图;所述构建多张候选合成图,包括:
通过窗口滑动的方式将目标尺寸对应的目标对象轮廓图合成到所述背景图的不同位置,获得所述多张候选合成图;所述目标尺寸包括所述尺寸范围内的多个不同的尺寸,每张候选合成图包括目标对象的掩膜图。
本申请第一方面的一个可选实施例中,所述从所述多张候选合成图中确定合理系数大于或等于阈值的目标合成图,包括:
将第一候选合成图输入至预置的构图评价模型,获得所述第一候选合成图对应的构图合理系数,所述构图合理系数用于指示合成图中目标对象尺寸和位置的合理程度;
若所述第一候选合成图对应的构图合理系数大于或等于阈值,则将所述第一候选合成图作为所述目标合成图;
其中,所述第一候选合成图为所述多张候选合成图的任意一张,所述构图评价模型是采用卷积神经网络训练得到的。
本申请第一方面的一个可选实施例中,所述构图评价模型的训练过程,包括:
获取第一训练样本集,所述第一训练样本集包括多张第一样本图以及每张第一样本图的第一标签值,所述第一样本图包括包含目标对象的合成图,所述第一标签值用于指示所述第一样本图中目标对象尺寸和位置的合理程度;
将所述多张第一样本图依次输入所述构图评价模型中,得到每张第一样本图对应的第一预测值;
根据每张第一样本图对应的第一预测值与第一标签值,确定所述构图评价模型的损失函数,在所述构图评价模型的损失函数收敛时,停止对所述构图评价模型的训练,获取所述构图评价模型的模型参数。
本申请第一方面的一个可选实施例中,所述从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,包括:
若构图合理系数大于或等于阈值的合成图有多张,将构图合理系数最大的合成图作为所述目标合成图。
本申请第一方面的一个可选实施例中,所述对所述目标合成图进行图像后处理,获得满足图像要求的合成图,包括:
将所述目标合成图输入至预置的图像融合模型的编码器,提取所述目标合成图的高维图像特征;
将所述高维图像特征输入至所述图像融合模型的解码器,在所述解码器中,采用注意力机制,对所述高维图像特征进行图像还原,获得满足图像要求的合成图;所述满足图像要求包括满足目标对象在背景图中色彩、光照以及明暗的图像特征要求。
本申请第一方面的一个可选实施例中,所述图像融合模型还包括判别器,所述图像融合模型的训练过程,包括:
获取第二训练样本集,所述第二训练样本集中包括多张第二样本图以及每张第二样本图的第二标签值,所述第二样本图包括包含目标对象的合成图和/或真实图,所述第二标签值用于指示所述第二样本图中的目标对象是否真实;
将所述多张第二样本图分别作为所述图像融合模型的输入,依次经过所述图像融合模型的编码器、解码器以及判别器,得到每张第二样本图对应的第二预测值;
根据每张第二样本图对应的第二预测值与第二标签值,确定所述图像融合模型的损失函数,在所述图像融合模型的损失函数收敛时,停止对所述图像融合模型的训练,获取所述图像融合模型中编码器和解码器的相关参数。
本申请第一方面的一个可选实施例中,所述根据所述背景图确定目标对象在所述背景图的尺寸范围,包括:
获取所述背景图中参考物的点云数据,根据所述参考物的点云数据确定所述背景图的比例尺信息;
根据所述比例尺信息确定目标对象在所述背景图的尺寸范围。
本申请第一方面的一个可选实施例中,所述根据所述背景图确定目标对象在所述背景图的尺寸范围,包括:
根据所述背景图中参考物的尺寸信息确定所述背景图的比例尺信息;
根据所述比例尺信息确定目标对象在所述背景图的尺寸范围。
本申请实施例的第二方面提供一种图像合成方法,包括:
响应作用于第一界面的第一操作,获取用户上传的人物图以及家装设计图;
响应作用于所述第一界面的第二操作,从所述人物图中获取人物轮廓图;根据所述家装设计图确定人物在所述家装设计图的尺寸范围;从构建的多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,对所述目标合成图进行图像后处理,获得满足图像要求的包含所述人物的家装设计图;所述多张候选合成图中的人物符合所述尺寸范围且位于所述家装设计图的不同位置;
显示包含所述人物的家装设计图。
本申请实施例的第三方面提供一种图像合成装置,包括:
获取模块,用于获取待合成的目标对象轮廓图以及背景图;
处理模块,用于根据所述背景图确定目标对象在所述背景图的尺寸范围;
构建多张候选合成图,所述多张候选合成图中的目标对象符合所述尺寸范围且位于所述背景图的不同位置;
从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图;
对所述目标合成图进行图像后处理,获得满足图像要求的合成图。
本申请实施例的第四方面提供一种图像合成装置,包括:
获取模块,用于响应作用于第一界面的第一操作,获取用户上传的人物图以及家装设计图;
处理模块,用于响应作用于所述第一界面的第二操作,从所述人物图中获取人物轮廓图;根据所述家装设计图确定人物在所述家装设计图的尺寸范围;从构建的多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,对所述目标合成图进行图像后处理,获得满足图像要求的包含所述人物的家装设计图;所述多张候选合成图中的人物符合所述尺寸范围且位于所述家装设计图的不同位置;
显示模块,用于显示包含所述人物的家装设计图。
本申请实施例的第五方面提供一种电子设备,包括:存储器,处理器以及计算机程序;所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如本申请第一方面任一项所述的方法,或者,如本申请第二方面所述的方法。
本申请实施例的第六方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如本申请第一方面任一项所述的方法,或者,如本申请第二方面所述的方法。
本申请实施例的第七方面提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现本申请第一方面任一项所述的方法,或者,如本申请第二方面所述的方法。
本申请实施例提供一种图像合成方法、装置、设备及存储介质,该方法包括:获取待合成的目标对象轮廓图以及背景图,首先根据背景图确定目标对象在背景图的尺寸范围,再根据尺寸范围构建多张候选合成图,多张候选合成图包括一个或多个尺寸的目标对象在背景图的不同位置的合成图。随后从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,再对目标合成图进行图像后处理,获得满足图像要求的合成图。基于上述处理过程,可提升图像合成的效率和效果,生成的合成图更加自然和真实。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例提供的图像合成方法的应用场景示意图;
图2为本申请实施例提供的图像合成方法的流程示意图一;
图3为本申请实施例提供的构建候选合成图的示意图;
图4为本申请实施例提供的图像合成方法的流程示意图二;
图5为本申请实施例提供的构图评价模型的训练方法的示意图;
图6为本申请实施例提供的图像融合模型的训练方法的示意图;
图7为本申请实施例提供的图像合成方法的流程示意图三;
图8a至8b为本申请实施例提供的界面变化示意图;
图9为本申请实施例提供的图像合成方法的处理过程及效果展示图;
图10为本申请实施例提供的图像合成装置的结构示意图一;
图11为本申请实施例提供的图像合成装置的结构示意图二;
图12为本申请实施例提供的电子设备的硬件结构图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例的说明书、权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述之外的顺序实施。
应当理解,本文中使用的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请实施例的描述中,术语“对应”可表示两者之间具有直接对应或间接对应的关系,也可以表示两者之间具有关联关系,也可以是指示与被指示、配置与被配置等关系。
本申请实施例提供的技术方案可应用于任意图像合成场景,例如将人物素材合成到风景图中,又例如将家具素材合成到用户拍摄的室内场景图中,再例如将人物素材合成到室内设计图中。
以室内设计的图像合成场景为例,室内设计通常采用空间渲染图的方式来展现。在渲染图的基础上增加人物元素能够使用户更好地理解设计场景,增强室内设计的真实感,更好地展示室内设计和渲染效果。例如,在客厅场景下的一家三口,在儿童房场景下的儿童,或者将用户照片加入到室内设计场景的渲染图中。
目前,在获得需要加入的人物素材图片后,通常由专业作图人员使用图像处理软件,对人物素材图片和室内场景图进行像素级别的调整,该方式存在人力成本高且效率低下的问题。随着图像处理技术的发展,基于规则的图像合成算法可实现对合成图的优化,即根据预设的像素参数调整规则,优化图像拼接部分的像素参数。然而,针对场景内容复杂的室内家装设计图,上述算法无法达到理想效果,存在视觉效果差,合成感明显,缺乏真实感等问题。
针对上述问题,本申请实施例提出一种图像合成方法,其主要发明思路如下:首先识别待合成的前景目标,确定前景目标在待合成的背景图片的尺寸范围,采用遍历策略和构图评价,生成符合构图要求的多张候选合成图。然后通过对每张候选合成图进行图像特征调整,从多张调整后的候选合成图中确定合成效果最佳的一张合成图,将其作为最终合成图,展示给用户。上述方案中,通过预置遍历策略和构图评价,实现智能生成目标合成图,目标合成图中前景目标的位置和尺寸最佳,再通过对目标合成图的图像后处理,使得前景目标与背景图融合,最终生成的合成图更加自然。
下面首先对本申请实施例提供的技术方案的应用场景进行简要介绍。
图1为本申请实施例提供的图像合成方法的应用场景示意图。如图1所示,本实施例的应用场景包括客户端101和服务端102,客户端101与服务端102通信连接。用户通过客户端101上传待合成的至少两张图片,服务端102对至少两张图片进行图片合成后,将融合效果满足要求的合成图发送至客户端101。
示例性的,以待合成的两张图片为例,服务端102接收第一图片和第二图片。第一图片包含待合成的目标对象,目标对象既可以是人物,也可以是任意物体。第二图片可以是包含任意信息的图片,即将第二图片看作是背景图片。服务端102首先从第一图片中获取目标对象对应的图像块,即获取目标对象轮廓图,再将目标对象轮廓图以合理的大小和位置合成到第二图片中。为了使得目标对象更好地融合在第二图片中,还可以对合成图进行图像后处理,进一步提升合成效果,以获得更加自然的合成图。
一种图像合成场景中,第一图片为人物/动物素材图,第二图片为风景图。用户通过客户端上传待合成的人物/动物素材图和风景图,服务端首先从人物/动物素材图中获取人物/动物轮廓图,再将人物/动物轮廓图以合理的大小和位置合成到风景图中。
一种图像合成场景中,第一图片为静物素材图,静物包括但不限于各类家具、摆件、用品等,第二图片为室内场景图,室内场景包括但不限于家居、办公等场景。用户通过客户端上传待合成的静物素材图和室内场景图,服务端首先从静物素材图中获取静物轮廓图,再将静物轮廓图以合理的大小和位置合成到室内场景图中。
可选的,第一图片可以是实拍图,也可以是模型图/设计图。第二图片可以是实拍图,也可以是模型图/设计图。例如,第一图片为人物实拍图,第二图片为室内家装设计图,将人物实拍图中的人物合成到室内家装设计图中。又例如,第一图片为家具设计图,第二图片为客厅实拍图,将家具设计图中的家具合成到客厅实拍图中。
上述图像合成场景仅作为示例,本申请实施例对图像合成场景不作限定。本申请实施例提供的技术方案同样适用于将多张图片中的不同目标对象合成到同一图片的场景,只需依次对多张图片进行目标识别与合成即可。
本申请实施例中,并不限定图像合成方法的执行设备。可选的,图像合成方法可以借助云计算系统实现整体的图像合成功能。例如,图像合成方法可以应用于云服务器,以便借助于云上资源的优势运行各种生成合成图的神经网络模型。相对于应用于云端,图像合成方法也可以应用于常规服务器或服务器阵列等服务端设备。可选的,图像合成方法还可以应用于客户端。例如,客户端通过远程调用服务端的执行算法进行图像合成,或者客户端通过预置在本地的执行算法进行图像合成。
基于上述应用场景,下面通过具体实施例对本申请实施例提供的技术方案进行详细说明。需要说明的是,本申请实施例提供的技术方案可以包括以下内容中的部分或全部,下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
图2为本申请实施例提供的图像合成方法的流程示意图一。本实施例的图像合成方法可应用于任意图像合成场景,图像合成方法的执行主体可以是图1所示的客户端101或服务端102。如图2所示,本实施例的图像合成方法,包括以下步骤:
步骤201、获取待合成的目标对象轮廓图以及背景图。
本实施例中,目标对象轮廓图包括人物的轮廓图,和/或,任意物体的轮廓图。目标对象轮廓图可以是从目标对象的实拍图中获取的轮廓图,也可以是目标对象的模型设计图中获取的轮廓图,对此本实施例不作任何限制。背景图可以是实拍图或设计图。
示例性的,例如将人物合成到风景图中,目标对象为人物,背景图为风景图。又例如,将家具合成到室内设计图中,目标对象为家具,背景图为室内设计图。再例如,将车辆合成到交通道路图中,目标对象为车辆,背景图为交通道路图。
步骤202、根据背景图确定目标对象在背景图的尺寸范围。
本实施例中,目标对象在背景图的尺寸范围是指目标对象在背景图的像素大小范围。例如,确定目标人物在背景图的竖直方向的像素值范围。又例如,确定目标车辆在背景图的竖直方向和/或水平方向的像素值范围。
一种可选的实施方式中,通过获取背景图中参考物的点云数据,首先根据参考物的点云数据确定背景图的比例尺信息,再根据比例尺信息确定目标对象在背景图的尺寸范围。本实施方式中,背景图通常为实拍图,即采用深度相机实拍的图片,可通过分析图片中参考物的点云数据确定图片的比例尺信息。参考物可以是任意对象,例如客厅实拍图中的窗户、墙壁与地面/吊顶的交线,又例如风景图中小屋、树木等。
一种可选的实施方式中,通过获取背景图中参考物的尺寸信息,首先根据参考物的尺寸信息确定背景图的比例尺信息,再根据比例尺信息确定目标对象在背景图的尺寸范围。本实施方式中,背景图通常为设计图,可通过获取设计图中参考物的尺寸信息,确定图片的比例尺信息,例如家装设计图中预置衣柜,根据衣柜的尺寸信息,确定家装设计图的比例尺信息。
步骤203、构建多张候选合成图,多张候选合成图中的目标对象符合尺寸范围且位于背景图的不同位置。
本实施例中,多张候选合成图包括一个或多个尺寸的目标对象轮廓图在背景图的不同位置的合成图。需要说明的是,一个或多个尺寸是指在步骤202确定的目标对象在背景图的尺寸范围内的尺寸。
应理解,目标对象在背景图的尺寸范围不会太大,目标对象过大或过小都会导致图像合成的不真实感,因此在构建候选合成图时,需要根据目标对象在真实场景图的物理尺寸以及真实场景图的比例尺信息,确定目标对象在真实场景图的一个合理尺寸范围。
一种可选的实施方式中,通过窗口滑动的方式将目标尺寸对应的目标对象轮廓图合成到背景图的不同位置,获得多张候选合成图。可选的,目标尺寸包括目标对象在背景图的尺寸范围内的多个不同的尺寸。
为了便于理解,下面结合附图3对多张候选合成图的构建过程进行图示化展示。
图3为本申请实施例提供的构建候选合成图的示意图。如图3所示,第一图片包含目标对象,首先通过图像识别算法提取目标对象的图像块,即目标对象轮廓图。其次根据第二图片的比例尺信息确定目标对象在待合成的第二图片中的尺寸范围,例如确定目标对象在第二图片中的尺寸包括尺寸1、尺寸2和尺寸3。随后分别对不同尺寸的目标对象轮廓图,通过窗口滑动的方式获取不同尺寸的目标对象轮廓图在第二图片不同位置的候选合成图。以图3中尺寸1的目标对象轮廓图为例,从第二图片的右上角开始,从左至右、从上至下,获取尺寸1的目标对象轮廓图在第二图片不同位置的候选合成图,最终获得n个包含尺寸1的目标对象的候选合成图。同理,获得m个包含尺寸2的目标对象的候选合成图,以及p个包含尺寸3的目标对象的候选合成图。其中,n,m,p均为正整数。
需要说明的是,窗口滑动的方式不限于上述示例,还可以根据其他预设的滑动方式获取候选合成图,对此实施例不作具体限定。
还需要说明的是,图3仅作为构建多张候选合成图的原理示例,在实际处理过程中,目标对象在候选合成图中的尺寸变化不会如图所示的如此明显。
可选的,在一些实施例中,每张候选合成图包括目标对象的掩膜图,目标对象的掩膜图用于指示目标对象在背景图的位置信息。应理解,窗口滑动过程中即可获取每张候选合成图的目标对象的掩膜图。
步骤204、从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图。
本实施例中,构图合理系数用于指示合成图中目标对象的尺寸和位置的合理程度。具体的,可通过如下几种可选的实施方式确定目标合成图。
一种可选的实施方式中,获取多张候选合成图中每张候选合成图的构图合理系数,从中确定构图合理系数大于或等于阈值的目标合成图。
一种可选的实施方式中,获取多张候选合成图中每张候选合成图的构图合理系数,若构图合理系数大于或等于阈值的合成图有多张,则将构图合理系数最大的合成图作为目标合成图。
一种可选的实施方式中,多张候选合成图作为一个图的集合,从该集合中随机选取一张候选合成图,确定该候选合成图的构图合理系数。一种可能的情况,若该候选合成图的构图合理系数小于阈值,则从集合中剩余的候选合成图中随机选取一张新的候选合成图,确定该新的候选合成图的构图合理系数,直至从集合中确定构图合理系数大于或等于阈值的目标合成图。一种可能的情况,若该候选合成图的构图合理系数大于或等于阈值,则将该候选合成图作为目标合成图。
步骤205、对目标合成图进行图像后处理,获得满足图像要求的合成图。
一种可选的实施方式中,对目标合成图进行图像后处理仅包括对目标合成图中目标对象的图像特征进行处理,例如对目标对象的图像色彩、光照、明暗的调节。
一种可选的实施方式中,对目标合成图进行图像后处理包括对目标合成图中目标对象的图像特征进行处理,以及对目标合成图中目标对象与背景图拼接的边缘部分的图像特征进行处理。
一种可选的实施方式中,对目标合成图进行图像后处理包括对目标合成图中目标对象的图像特征进行处理,对目标合成图中目标对象与背景图拼接的边缘部分的图像特征进行处理,以及对目标合成图中背景图的图像特征进行处理。
本申请实施例示出的图像合成方法,通过获取待合成的目标对象轮廓图以及背景图,首先根据背景图确定目标对象在背景图的尺寸范围,再根据尺寸范围构建多张候选合成图,多张候选合成图包括一个或多个尺寸的目标对象在背景图的不同位置的合成图。随后从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,再对目标合成图进行图像后处理,获得满足图像要求的合成图。基于上述处理过程,可提升图像合成的效率和效果,生成的合成图更加自然和真实。
在上述实施例的基础上,下面通过几个具体实施例对如何获取候选合成图的构图合理系数,以及如何进行图像后处理进行详细说明。
图4为本申请实施例提供的图像合成方法的流程示意图二。在上述实施例的基础上,如图4所示,本实施例的图像合成方法,包括以下步骤:
步骤401、获取待合成的目标对象轮廓图以及背景图。
步骤402、根据背景图确定目标对象在背景图的尺寸范围。
步骤403、构建多张候选合成图,多张候选合成图中的目标对象符合尺寸范围且位于背景图的不同位置。
本实施例中,步骤401至步骤403与上述实施例的步骤201至步骤203类似,可参见上文,此处不再赘述。
步骤404、将第一候选合成图输入至预置的构图评价模型,获得第一候选合成图对应的构图合理系数。
本实施例中,第一候选合成图为多张候选合成图的任意一张,构图合理系数用于指示合成图中目标对象尺寸和位置的合理程度,构图评价模型是采用卷积神经网络训练得到的,用于输出对合成图的构图合理系数,构图合理系数也称为构图和谐度。可选的,构图评价模型可采用Resnet-18的网络结构训练得到。Resnet-18是由残差块堆叠而成的网络结构,包括1个卷积层,8个残差块和1个全连接层,每个残差块有2个卷积层。
下面结合附图5对构图评价模型的训练过程进行说明。
图5为本申请实施例提供的构图评价模型的训练方法的示意图。如图5所示,本实施例对构图评价模型的训练方法,包括以下步骤:
步骤501、获取第一训练样本集,第一训练样本集包括多张第一样本图以及每张第一样本图的第一标签值,第一样本图包括包含目标对象的合成图,第一标签值用于指示第一样本图的构图合理系数。
本实施例中,第一标签值可由人工标注。可选的,构图合理系数的取值范围为0至1,取值越大表示样本图的构图越合理,即取值越大表示样本图中目标对象的尺寸和位置越合理。
步骤502、将多张第一样本图依次输入构图评价模型中,得到每张第一样本图对应的第一预测值。
步骤503、根据每张第一样本图对应的第一预测值与第一标签值,确定构图评价模型的损失函数,在构图评价模型的损失函数收敛时,停止对构图评价模型的训练,获取构图评价模型的模型参数。
通过上述训练过程使得构图评价模型能够对任意输入的合成图进行构图合理性打分,判断当前合成图是否满足预设的构图合理性要求,如构图合理系数是否大于阈值,从而快速筛选出目标合成图,以便进行图像后处理。
步骤405、若第一候选合成图对应的构图合理系数大于或等于阈值,则将第一候选合成图作为目标合成图。
本实施例中,通过设置构图合理系数的阈值,判定目标对象在第一候选合成图中的位置和尺寸是否均满足要求,如果第一候选合成图的构图合理系数大于或等于阈值(例如阈值取0.8),表明目标对象在第一候选合成图中的位置合理且大小适中。
可选的,在一些实施例中,若第一候选合成图对应的构图合理系数小于阈值,表明目标对象在第一候选合成图中的位置和尺寸不满足要求,即位置和/或尺寸不合理,则需要从多张候选合成图的剩余候选合成图中重新选取一张候选合成图,重新执行步骤404,直至找到构图合理系统大于或等于阈值的候选合成图,将其作为目标合成图。
步骤406、对目标合成图进行图像后处理,获得满足图像要求的合成图。
一种可选的实施方式中,通过预置的图像融合模型对目标合成图进行图像后处理,获得满足图像要求的合成图。本实施例中,图像融合模型可采用编码器-解码器(encoder-decoder)的模型架构训练得到,编码器-解码器的模型架构也被称为U-Net模型架构。U-Net网络架构的前半部分(即编码器)主要用于特征提取,后半部分(即解码器)主要用于上采样。
通过图像融合模型对目标合成图的图像特征的优化,以获得更加自然的合成图。
一种可选的实施方式中,通过预置的图像融合模型对目标合成图进行图像后处理,具体包括:将目标合成图输入至预置的图像融合模型的编码器,提取目标合成图的高维图像特征;将高维图像特征输入至图像融合模型的解码器,在解码器中,采用注意力机制,对高维图像特征进行图像还原,获得满足图像要求的合成图。本实施例中,满足图像要求包括满足目标对象在背景图中色彩、光照以及明暗的图像特征要求。
可选的,在一些实施例中,图像融合模型除了包含编码器和解码器之外,还包括判别器,判别器用于辅助对编码器和解码器的训练,通过判断输入的样本图是合成图片还是真实图片,来指导图像融合模型生成的合成图的数据分布接近真实图片的数据分布。
可选的,判别器可采用包含7个卷积层的轻量化卷积神经网络架构。
需要指出的是,判别器仅在图像融合模型的训练阶段使用,在实际部署推理时无需运行。下面结合附图6对图像融合模型的训练过程进行详细说明。
图6为本申请实施例提供的图像融合模型的训练方法的示意图。如图6所示,本实施例对图像融合模型的训练方法,包括以下步骤:
步骤601、获取第二训练样本集,第二训练样本集中包括多张第二样本图以及每张第二样本图的第二标签值,第二样本图包括包含目标对象的合成图和/或真实图,第二标签值用于指示第二样本图中的目标对象是否真实。
可选的,第二标签值包括0和1,例如0表示第二样本图中的目标对象真实,1表示第二样本图中的目标对象不真实。可选的,第二标签值可由人工标注。
步骤602、将多张第二样本图分别作为图像融合模型的输入,依次经过图像融合模型的编码器、解码器以及判别器,得到每张第二样本图对应的第二预测值。
步骤603、根据每张第二样本图对应的第二预测值与第二标签值,确定图像融合模型的损失函数,在图像融合模型的损失函数收敛时,停止对图像融合模型的训练,获取图像融合模型中编码器和解码器的相关参数。
通过上述训练过程更新图像融合模型中编码器和解码器的相关参数,使得图像融合模型能够更好地对目标合成图的图像特征进行优化,以获得更加自然的合成图。
本申请实施例示出的图像合成方法,通过获取待合成的目标对象轮廓图以及背景图,首先根据背景图确定目标对象在背景图的尺寸范围,再根据尺寸范围构建多张候选合成图,多张候选合成图包括一个或多个尺寸的目标对象在背景图的不同位置的合成图。随后依次将多张候选合成图输入构图评价模型,获取每张候选合成图对应的构图合理系数,从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,最后经图像融合模型对目标合成图进行图像后处理,获得满足图像要求的合成图。其中,构图评价模型可采用卷积神经网络训练得到,用于评价每张候选合成图的构图合理性。图像融合模型可采用编码器-解码器的模型架构训练得到,用于优化合成图的合成效果。基于上述处理过程,可提升合成图的总体效果,使得合成图更加自然和真实。
下面结合一个具体的图像合成场景,对本申请实施例提供的图像合成方法进行应用举例。图7为本申请实施例提供的图像合成方法的流程示意图三。本实施例的图像合成方法应用于家装设计图的人物图像合成场景,图像合成方法的执行主体可以是图1所示的客户端101或服务端102。如图7所示,本实施例的图像合成方法,包括以下步骤:
步骤701、响应作用于第一界面的第一操作,获取用户上传的人物图以及家装设计图。
本实施例中,第一界面也称为图片导入界面,第一界面包括图片上传控件,图片上传控件可以是一个或多个,具体可参见图8a和图8b。第一操作可以是用户通过手指或鼠标在第一界面的触控操作,例如点击操作。
图8a至8b为本申请实施例提供的界面变化示意图。
如图8a所示,图片导入界面800包括一个图片上传控件802和一个图片合成控件803,用户点击图片上传控件802,可同时选取待合成的至少两个图片,实现一键上传。进一步的,用户点击图片合成控件803,图片合成控件803用于触发对待合成的至少两张图片进行智能处理,处理完毕后界面跳转至合成预览界面801。可选的,合成预览界面801除了显示最终的合成图,例如包含人物的家装设计图,合成预览界面801还包括保存控件,分享控件,返回控件。其中,保存控件用于将合成图保存至用户指定位置,例如相册或文件系统;分享控件用于将合成图分享给其他用户;返回控件用于返回图片导入界面800,用户可重新添加图片,再次合成图片,直至用户满意。
如图8b所示,图片导入界面800包括两个图片上传控件,分别为第一控件804和第二控件805,第一控件804用于上传包含目标人物的图片,第二控件805用户上传背景图片。用户分别点击第一控件804和第二控件805,依次上传待合成的两张图片。进一步的,用户点击图片合成控件803,触发对待合成的两张图片进行智能处理,处理完毕后界面跳转至合成预览界面801。
需要指出的是,图示界面以手机界面为例,还可根据实际需求设计电脑端界面,电脑端界面的控件布局与手机界面类似。
可选的,若待合成的目标人物有多个,且多个目标人物位于不同图片中。用户点击第一控件804,可同时选取多张图片,多张图片包含不同的目标人物,用户点击第二控件805,上传背景图片。随后用户点击图片合成控件803,可将用户选取的多张图片中的多个目标人物合成到同一背景图片中。
可选的,若待合成的目标人物有多个,且多个目标人物在同一张图片中。用户点击第一控件804,上传包含多个目标人物的图片,用户点击第二控件805,上传背景图片。随后用户点击图片合成控件803,可将多个目标人物一并合成到同一背景图片中。
步骤702、响应作用于第一界面的第二操作,从人物图中获取人物轮廓图。
本实施例中,第一界面还包括图片合成控件,图片合成控件用于触发对用户上传的两张或多张图片的图片合成,例如触发对用户上传的人物图和家装设计图的图片合成,将人物图中人物合成到家装设计图中。第二操作可以是用户通过手指或鼠标在第一界面的触控操作,例如点击操作。
一种可选的实施方式中,通过人物识别模型从人物图中获取人物轮廓图。其中人物识别模型的识别过程包括:首先采用基于深度学习的人物抠图技术,获取前景、背景和不确定区域的掩码,即获取人物的大致轮廓;再将获取的前景、背景和不确定区域的掩码,以及红绿蓝RGB原图,共6个通道数据输入编解码结构网络,例如U-Net网络,获取前景人物的精细alpha透明通道,最终输出人物轮廓图。
步骤703、根据家装设计图确定人物在家装设计图的尺寸范围。
本实施例中,人物在家装设计图的尺寸范围是指人物在家装设计图的像素大小范围。例如人物在家装设计图的竖直方向的像素值范围。
一种可选的实施方式中,通过获取家装设计图中预置家具模型的尺寸信息,首先根据预置家具模型的尺寸信息确定家装设计图的比例尺信息,再根据比例尺信息确定人物在家装设计图的尺寸范围。
可选的,在一些实施例中,用户还可以手动调节家装设计图中人物的尺寸大小和位置,以辅助设备进行构图分析和图像后处理。
步骤704、构建多张候选合成图,多张候选合成图中的人物符合尺寸范围且位于家装设计图的不同位置。
本实施例中,多张候选合成图包括一个或多个尺寸的人物轮廓图在不同位置的合成图。需要说明的是,一个或多个尺寸是指在步骤703确定的人物在家装设计图的尺寸范围内的尺寸。
一种可选的实施方式中,通过窗口滑动的方式将目标尺寸对应的人物轮廓图合成到家装设计图的不同位置,获得多张候选合成图。可选的,目标尺寸包括人物在家装设计图的尺寸范围内的多个不同的尺寸。
可选的,在一些实施例中,每张候选合成图包括人物的掩膜图,人物的掩膜图用于指示人物在家装设计图的位置信息。应理解,窗口滑动过程中即可获取每张候选合成图的人物的掩膜图。
步骤705、从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图。
本实施例中,构图合理系数用于指示合成图中人物的尺寸和位置的合理程度。
一种可选的实施方式中,依次将多张候选合成图输入至预置的构图评价模型,获取每张候选合成图对应的构图合理系数。从多张候选合成图中确定构图合理系数大于或等于预置的目标合成图。可选的,若构图合理系数大于或等于阈值的合成图有多张,则将构图合理系数最大的合成图作为目标合成图。对于构图评价模型的相关内容,可参照上文,此次不再赘述。
步骤706、对目标合成图进行图像后处理,获得满足图像要求的包含人物的家装设计图。
一种可选的实施方式中,通过预置的图像融合模型对目标合成图进行图像后处理,获得满足图像要求的包含人物的家装设计图。对于图像融合模型的相关内容,可参照上文,此处不再赘述。
步骤707、显示包含人物的家装设计图。
响应作用于第一界面的第二操作,对人物图和家装设计图进行图片合成,获得满足图片要求的包含人物的家装设计图后,在第二界面显示包含人物的家装设计图。第二界面也称为合成预览界面。
需要指出的是,本实施例提供的图片导入界面和合成预览界面为家装设计平台(服务端)提供的用户操作界面,用户可通过浏览器、小程序或应用程序APP访问家装设计平台,并在家装设计平台提供的用户操作界面上导入待合成的图片、预览合成的图片。
本申请实施例示出的图像合成方法,基于用户在图片导入界面导入的待合成的人物图和家装设计图,首先根据家装设计图确定人物在家装设计图的尺寸范围,再根据尺寸范围构建多张候选合成图,多张候选合成图包括一个或多个尺寸的人物在家装设计图的不同位置的合成图。随后从多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,再对目标合成图进行图像后处理,获得满足图像要求的包含人物的家装设计图。最后在合成预览界面显示包含人物的家装设计图。现有图像合成算法对于场景内容复杂的家装设计图的人物合成,无法达到理想合成效果,存在合成效果图的合成感严重、图像出现畸变、缺乏真实感等问题。相比之下,基于本案的处理过程,能够稳定高效的生成高质量的图像,实现将人物智能合成到家装设计图的合理位置,生成的家装设计图更加生活化,增强了家装设计的真实感,能够让用户更好的理解家装设计场景。
下面再结合附图9对家装设计场景的图像合成方案进行图示化展示。图9为本申请实施例提供的图像合成方法的处理过程及效果展示图。如图9所示,获取用户上传的人物图和客厅设计图,客厅设计图展示了沙发和落地灯。首先将人物主体从人物图中提取出来,作为合成图片的前景。在确定人物主体在客厅设计图的尺寸大小后,采用遍历策略构建多张候选合成图,再通过构图评价模型判断多张候选合成图的构图合理性。具体来说,在给定人物主体图像的尺寸范围内,从人物主体的最大尺寸开始遍历,以滑窗的方式将人物主体合成到室内设计图上,得到候选合成图与人物前景位置掩膜。将候选合成图和人物前景位置掩膜输入构图评价模型(图中未示出),获取候选合成图的构图合理系数。一种情况,如果候选合成图的构图合理系数小于阈值,则需要遍历下一个候选合成图。另一种情况,如果候选合成图的构图合理系数大于或等于阈值,则停止继续判断其他候选合成图。由于前景和背景是在不同的环境条件下获得的,因此合成图存在亮度色泽等方面的不匹配、缺乏真实感等问题,需要将合成图和人物前景位置掩膜输出到图像融合模型,图像融合模型包括编码器和解码器,图像融合模型的作用是调节合成图中人物主体(前景)的色彩、光照、明暗等图像特征,使其更好的融合到室内设计图(背景)中。经图像融合模型对合成图的图像优化,最终输出满足图像要求的人物场景合成图。
上文描述了本申请实施例提供的图像合成方法,下面将描述本申请实施例提供的图像合成装置。
本申请实施例可以根据上述方法实施例对图像合成装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以使用硬件的形式实现,也可以使用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。下面以使用对应各个功能划分各个功能模块为例进行说明。
图10为本申请实施例提供的图像合成装置的结构示意图一。如图10所示,本实施例的图像合成装置1000,包括:获取模块1001以及处理模块1002。
获取模块1001,用于获取待合成的目标对象轮廓图以及背景图;
处理模块1002,用于根据所述背景图确定目标对象在所述背景图的尺寸范围;
构建多张候选合成图,所述多张候选合成图中的目标对象符合所述尺寸范围且位于所述背景图的不同位置;
从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图;
对所述目标合成图进行图像后处理,获得满足图像要求的合成图。
本实施例的一个可选实施例中,所述多张候选合成图包括不同尺寸的目标对象轮廓图;处理模块1002,用于通过窗口滑动的方式将目标尺寸对应的目标对象轮廓图合成到所述背景图的不同位置,获得所述多张候选合成图;所述目标尺寸包括所述尺寸范围内的多个不同的尺寸,每张候选合成图包括目标对象的掩膜图。
本实施例的一个可选实施例中,处理模块1002,用于:
将第一候选合成图输入至预置的构图评价模型,获得所述第一候选合成图对应的构图合理系数,所述构图合理系数用于指示合成图中目标对象尺寸和位置的合理程度;
若所述第一候选合成图对应的构图合理系数大于或等于阈值,则将所述第一候选合成图作为所述目标合成图;
其中,所述第一候选合成图为所述多张候选合成图的任意一张,所述构图评价模型是采用卷积神经网络训练得到的。
本实施例的一个可选实施例中,获取模块1001,用于获取第一训练样本集,所述第一训练样本集包括多张第一样本图以及每张第一样本图的第一标签值,所述第一样本图包括包含目标对象的合成图,所述第一标签值用于指示所述第一样本图中目标对象尺寸和位置的合理程度;
处理模块1002,用于将所述多张第一样本图依次输入所述构图评价模型中,得到每张第一样本图对应的第一预测值;
根据每张第一样本图对应的第一预测值与第一标签值,确定所述构图评价模型的损失函数,在所述构图评价模型的损失函数收敛时,停止对所述构图评价模型的训练,获取所述构图评价模型的模型参数。
本实施例的一个可选实施例中,处理模块1002,用于:
若构图合理系数大于或等于阈值的合成图有多张,将构图合理系数最大的合成图作为所述目标合成图。
本实施例的一个可选实施例中,处理模块1002,用于:
将所述目标合成图输入至预置的图像融合模型的编码器,提取所述目标合成图的高维图像特征;
将所述高维图像特征输入至所述图像融合模型的解码器,在所述解码器中,采用注意力机制,对所述高维图像特征进行图像还原,获得满足图像要求的合成图;所述满足图像要求包括满足目标对象在背景图中色彩、光照以及明暗的图像特征要求。
本实施例的一个可选实施例中,所述图像融合模型还包括判别器,获取模块1001,还用于获取第二训练样本集,所述第二训练样本集中包括多张第二样本图以及每张第二样本图的第二标签值,所述第二样本图包括包含目标对象的合成图和/或真实图,所述第二标签值用于指示所述样本图中的目标对象是否真实;
处理模块1002,还用于将所述多张第二样本图分别作为所述图像融合模型的输入,依次经过所述图像融合模型的编码器、解码器以及判别器,得到每张第二样本图对应的预测值;
根据每张第二样本图对应的第二预测值与第二标签值,确定所述图像融合模型的损失函数,在所述图像融合模型的损失函数收敛时,停止对所述图像融合模型的训练,获取所述图像融合模型中编码器和解码器的相关参数。
本实施例的一个可选实施例中,处理模块1002,用于:
获取所述背景图中参考物的点云数据,根据所述参考物的点云数据确定所述背景图的比例尺信息;
根据所述比例尺信息确定目标对象在所述背景图的尺寸范围。
本实施例的一个可选实施例中,处理模块1002,用于:
根据所述背景图中参考物的尺寸信息确定所述背景图的比例尺信息;
根据所述比例尺信息确定目标对象在所述背景图的尺寸范围。
本实施例提供的图像合成装置,可以执行图2或图4所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图11为本申请实施例提供的图像合成装置的结构示意图二。如图11所示,本实施例的图像合成装置1100,包括:获取模块1101,处理模块1102以及显示模块1103。
获取模块1101,用于响应作用于第一界面的第一操作,获取用户上传的人物图以及家装设计图;
处理模块1102,用于响应作用于所述第一界面的第二操作,从所述人物图中获取人物轮廓图;根据所述家装设计图确定人物在所述家装设计图的尺寸范围;从构建的多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,对所述目标合成图进行图像后处理,获得满足图像要求的包含所述人物的家装设计图;所述多张候选合成图中的人物符合所述尺寸范围且位于所述家装设计图的不同位置;
显示模块1103,用于显示包含所述人物的家装设计图。
本实施例提供的图像合成装置,可以执行图7所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图12为本申请实施例提供的电子设备的硬件结构图。如图12所示,本实施例提供的电子设备1200,包括:
存储器1201,处理器1202以及计算机程序;其中,计算机程序存储在存储器1201中,并被配置为由处理器1202执行以实现前述任一方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
可选的,存储器1201既可以是独立的,也可以跟处理器1202集成在一起。当存储器1201是独立于处理器1202之外的器件时,电子设备1200还包括:总线1203,用于连接存储器1201和处理器1202。
本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器1202执行以实现如前述任一方法实施例的技术方案。
本申请实施例提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如前述任一方法实施例的技术方案。
本申请实施例提供了一种芯片,包括:处理模块与通信接口,该处理模块能执行前述任一方法实施例的技术方案。
可选的,该芯片还包括存储模块(如,存储器),存储模块用于存储指令,处理模块用于执行存储模块存储的指令,并且对存储模块中存储的指令的执行使得处理模块执行前述任一方法实施例的技术方案。
应理解,上述处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘、只读存储器、磁盘或光盘等。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
上述存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。当然,处理器和存储介质也可以作为分立组件存在于电子设备中。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例的技术方案的范围。
Claims (14)
1.一种图像合成方法,其特征在于,包括:
获取待合成的目标对象轮廓图以及背景图;
根据所述背景图确定目标对象在所述背景图的尺寸范围;
构建多张候选合成图,所述多张候选合成图中的目标对象符合所述尺寸范围且位于所述背景图的不同位置;
从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图;
对所述目标合成图进行图像后处理,获得满足图像要求的合成图。
2.根据权利要求1所述的方法,其特征在于,所述多张候选合成图包括不同尺寸的目标对象轮廓图;所述构建多张候选合成图,包括:
通过窗口滑动的方式将目标尺寸对应的目标对象轮廓图合成到所述背景图的不同位置,获得所述多张候选合成图;所述目标尺寸包括所述尺寸范围内的多个不同的尺寸,每张候选合成图包括目标对象的掩膜图。
3.根据权利要求1所述的方法,其特征在于,所述从所述多张候选合成图中确定合理系数大于或等于阈值的目标合成图,包括:
将第一候选合成图输入至预置的构图评价模型,获得所述第一候选合成图对应的构图合理系数,所述构图合理系数用于指示合成图中目标对象尺寸和位置的合理程度;
若所述第一候选合成图对应的构图合理系数大于或等于阈值,则将所述第一候选合成图作为所述目标合成图;
其中,所述第一候选合成图为所述多张候选合成图的任意一张,所述构图评价模型是采用卷积神经网络训练得到的。
4.根据权利要求3所述的方法,其特征在于,所述构图评价模型的训练过程,包括:
获取第一训练样本集,所述第一训练样本集包括多张第一样本图以及每张第一样本图的第一标签值,所述第一样本图包括包含目标对象的合成图,所述第一标签值用于指示所述第一样本图中目标对象尺寸和位置的合理程度;
将所述多张第一样本图依次输入所述构图评价模型中,得到每张第一样本图对应的第一预测值;
根据每张第一样本图对应的第一预测值与第一标签值,确定所述构图评价模型的损失函数,在所述构图评价模型的损失函数收敛时,停止对所述构图评价模型的训练,获取所述构图评价模型的模型参数。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,包括:
若构图合理系数大于或等于阈值的合成图有多张,将构图合理系数最大的合成图作为所述目标合成图。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述对所述目标合成图进行图像后处理,获得满足图像要求的合成图,包括:
将所述目标合成图输入至预置的图像融合模型的编码器,提取所述目标合成图的高维图像特征;
将所述高维图像特征输入至所述图像融合模型的解码器,在所述解码器中,采用注意力机制,对所述高维图像特征进行图像还原,获得满足图像要求的合成图;所述满足图像要求包括满足目标对象在背景图中色彩、光照以及明暗的图像特征要求。
7.根据权利要求6所述的方法,其特征在于,所述图像融合模型还包括判别器,所述图像融合模型的训练过程,包括:
获取第二训练样本集,所述第二训练样本集中包括多张第二样本图以及每张第二样本图的第二标签值,所述第二样本图包括包含目标对象的合成图和/或真实图,所述第二标签值用于指示所述第二样本图中的目标对象是否真实;
将所述多张第二样本图分别作为所述图像融合模型的输入,依次经过所述图像融合模型的编码器、解码器以及判别器,得到每张第二样本图对应的第二预测值;
根据每张第二样本图对应的第二预测值与第二标签值,确定所述图像融合模型的损失函数;在所述图像融合模型的损失函数收敛时,停止对所述图像融合模型的训练,获取所述图像融合模型中编码器和解码器的相关参数。
8.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述背景图确定目标对象在所述背景图的尺寸范围,包括:
获取所述背景图中参考物的点云数据,根据所述参考物的点云数据确定所述背景图的比例尺信息;
根据所述比例尺信息确定目标对象在所述背景图的尺寸范围。
9.根据权利要求1-4中任一项所述的方法,其特征在于,所述根据所述背景图确定目标对象在所述背景图的尺寸范围,包括:
根据所述背景图中参考物的尺寸信息确定所述背景图的比例尺信息;
根据所述比例尺信息确定目标对象在所述背景图的尺寸范围。
10.一种图像合成方法,其特征在于,包括:
响应作用于第一界面的第一操作,获取用户上传的人物图以及家装设计图;
响应作用于所述第一界面的第二操作,从所述人物图中获取人物轮廓图;根据所述家装设计图确定人物在所述家装设计图的尺寸范围;从构建的多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,对所述目标合成图进行图像后处理,获得满足图像要求的包含所述人物的家装设计图;所述多张候选合成图中的人物符合所述尺寸范围且位于所述家装设计图的不同位置;
显示包含所述人物的家装设计图。
11.一种图像合成装置,其特征在于,包括:
获取模块,用于获取待合成的目标对象轮廓图以及背景图;
处理模块,用于根据所述背景图确定目标对象在所述背景图的尺寸范围;
构建多张候选合成图,所述多张候选合成图中的目标对象符合所述尺寸范围且位于所述背景图的不同位置;
从所述多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图;
对所述目标合成图进行图像后处理,获得满足图像要求的合成图。
12.一种图像合成装置,其特征在于,包括:
获取模块,用于响应作用于第一界面的第一操作,获取用户上传的人物图以及家装设计图;
处理模块,用于响应作用于所述第一界面的第二操作,从所述人物图中获取人物轮廓图;根据所述家装设计图确定人物在所述家装设计图的尺寸范围;从构建的多张候选合成图中确定构图合理系数大于或等于阈值的目标合成图,对所述目标合成图进行图像后处理,获得满足图像要求的包含所述人物的家装设计图;所述多张候选合成图中的人物符合所述尺寸范围且位于所述家装设计图的不同位置;
显示模块,用于显示包含所述人物的家装设计图。
13.一种电子设备,其特征在于,包括:存储器,处理器以及计算机程序;所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-10中任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210557450.5A CN114820292A (zh) | 2022-05-20 | 2022-05-20 | 图像合成方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210557450.5A CN114820292A (zh) | 2022-05-20 | 2022-05-20 | 图像合成方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114820292A true CN114820292A (zh) | 2022-07-29 |
Family
ID=82517515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210557450.5A Pending CN114820292A (zh) | 2022-05-20 | 2022-05-20 | 图像合成方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114820292A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309918A (zh) * | 2023-03-31 | 2023-06-23 | 深圳市欧度利方科技有限公司 | 一种基于平板电脑的场景合成方法和系统 |
CN117557689A (zh) * | 2024-01-11 | 2024-02-13 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
-
2022
- 2022-05-20 CN CN202210557450.5A patent/CN114820292A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116309918A (zh) * | 2023-03-31 | 2023-06-23 | 深圳市欧度利方科技有限公司 | 一种基于平板电脑的场景合成方法和系统 |
CN116309918B (zh) * | 2023-03-31 | 2023-12-22 | 深圳市欧度利方科技有限公司 | 一种基于平板电脑的场景合成方法和系统 |
CN117557689A (zh) * | 2024-01-11 | 2024-02-13 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN117557689B (zh) * | 2024-01-11 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7090113B2 (ja) | 線画の生成 | |
US10657652B2 (en) | Image matting using deep learning | |
US10198839B2 (en) | Style transfer-based image content correction | |
US10600171B2 (en) | Image-blending via alignment or photometric adjustments computed by a neural network | |
US20180082715A1 (en) | Artistic style transfer for videos | |
KR102485503B1 (ko) | 이미지 데이터베이스 분석 기반 상품 추천 장치 및 방법 | |
TW202234341A (zh) | 圖像處理方法及裝置、電子設備、儲存媒體和程式產品 | |
CN114820292A (zh) | 图像合成方法、装置、设备及存储介质 | |
CN110246209B (zh) | 图像处理方法及装置 | |
US9251169B2 (en) | Systems and methods for creating photo collages | |
US10198794B2 (en) | System and method for adjusting perceived depth of an image | |
JP7477260B2 (ja) | 情報処理装置、情報処理プログラム及び情報処理方法 | |
US20230244940A1 (en) | Methods and systems for geometry-aware image contrast adjustments via image-based ambient occlusion estimation | |
US20220156987A1 (en) | Adaptive convolutions in neural networks | |
CN107408401A (zh) | 用于图像的简化调整的用户滑块 | |
CN109964254A (zh) | 用于在虚拟视图中渲染对象的方法和系统 | |
CN106447756B (zh) | 用于生成用户定制的计算机生成动画的方法和系统 | |
Liu et al. | Progressive complex illumination image appearance transfer based on CNN | |
KR102430740B1 (ko) | 데이터 증강 기반 스타일 분석 모델 학습 장치 및 방법 | |
CN112132923A (zh) | 一种基于风格小图高清化的两阶段数字图像风格变换方法及系统 | |
CN109658360B (zh) | 图像处理的方法、装置、电子设备和计算机存储介质 | |
Gao et al. | PencilArt: a chromatic penciling style generation framework | |
CN107945201B (zh) | 基于自适应阈值分割的视频风景处理方法及装置 | |
CN115836319A (zh) | 图像处理方法及装置 | |
TW202143173A (zh) | 智能影像拼接系統及拼接方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |