CN111861867B - 图像背景虚化方法和装置 - Google Patents
图像背景虚化方法和装置 Download PDFInfo
- Publication number
- CN111861867B CN111861867B CN202010628271.7A CN202010628271A CN111861867B CN 111861867 B CN111861867 B CN 111861867B CN 202010628271 A CN202010628271 A CN 202010628271A CN 111861867 B CN111861867 B CN 111861867B
- Authority
- CN
- China
- Prior art keywords
- image
- blurring
- generator
- discriminator
- processed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000011218 segmentation Effects 0.000 claims abstract description 29
- 238000010801 machine learning Methods 0.000 claims abstract description 18
- 230000006870 function Effects 0.000 claims description 42
- 239000013598 vector Substances 0.000 claims description 36
- 238000012549 training Methods 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000008485 antagonism Effects 0.000 claims description 5
- 239000000758 substrate Substances 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 16
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 239000000835 fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010428 oil painting Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G06T3/04—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/194—Segmentation; Edge detection involving foreground-background segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Abstract
本发明公开了一种图像背景虚化方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像。该实施方式能够对待处理图像自动执行背景虚化处理,同时可产生多样化的虚化效果。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种图像背景虚化方法和装置。
背景技术
在图像处理过程中,往往需要将图像中的背景进行适当的虚化从而突出人像等主体目标,由此使主体目标的细节和质感得到更完美的呈现。现有技术中,一般通过光圈虚化、焦距虚化等物理手段或者Photoshop等图像处理软件实现图像背景虚化。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:现有的各种图像背景虚化方法需要人工操作且操作较为繁琐,同时虚化方式多为高斯模糊虚化,虚化效果单一。
发明内容
有鉴于此,本发明实施例提供一种图像背景虚化方法和装置,能够对待处理图像自动执行背景虚化处理,同时可产生多样化的虚化效果。
为实现上述目的,根据本发明的一个方面,提供了一种图像背景虚化方法。
本发明实施例的图像背景虚化方法包括:从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像。
可选地,所述机器学习模型为包含第一生成器、第二生成器、第一鉴别器和第二鉴别器的循环生成对抗网络;其中,第一生成器用于将输入的原始类型图像或第二生成器生成的原始类型图像转换为虚化类型图像;第二生成器用于将输入的虚化类型图像或第一生成器生成的虚化类型图像转换为原始类型图像;第一鉴别器用于判断进入第一鉴别器的图像是否为真实的原始类型图像;第二鉴别器用于判断进入第二鉴别器的图像是否为真实的虚化类型图像。
可选地,所述将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,包括:将待处理图像输入预先训练完成的所述循环生成对抗网络中的第一生成器。
可选地,第一生成器包括第一编码器、第一转换器和第一解码器;其中,第一编码器用于提取进入第一编码器的图像的特征向量,第一转换器用于将第一编码器提取的特征向量转换为对应于虚化类型图像的特征向量,第一解码器用于依据第一转换器转换得到的特征向量生成虚化类型图像;第二生成器包括第二编码器、第二转换器和第二解码器;其中,第二编码器用于提取进入第二编码器的图像的特征向量,第二转换器用于将第二编码器提取的特征向量转换为对应于原始类型图像的特征向量,第二解码器用于依据第二转换器转换得到的特征向量生成原始类型图像;第一鉴别器和第二鉴别器都包括:至少一个用于提取图像特征的卷积层以及用于依据该卷积层提取的图像特征对图像进行分类的输出层。
可选地,所述循环生成对抗网络通过以下步骤进行训练:获取多幅原始类型图像和多幅虚化类型图像,将任一原始类型图像和任一虚化类型图像组成一个训练数据对;将所述训练数据对输入所述循环生成对抗网络并分别最小化为第一生成器、第二生成器、第一鉴别器和第二鉴别器预设的损失函数。
可选地,所述方法进一步包括:在按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像之后,对所述分布区域图像与所述虚化图像的边界执行模糊化处理。
可选地,所述从待处理图像中检测预先确定的至少一个类别的主体目标,包括:利用预先训练完成的YOLO网络执行所述检测;所述对检测出的主体目标执行语义分割,包括:利用预先训练完成的MASK-RCNN网络执行所述语义分割;第一转换器和第二转换器都包括多个特征重置模块,每一特征重置模块都包括两个卷积层。
为实现上述目的,根据本发明的另一方面,提供了一种图像背景虚化装置。
本发明实施例的图像背景虚化装置可以包括:检测及分割单元,用于从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;虚化处理单元,用于将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;叠加单元,用于按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像。
为实现上述目的,根据本发明的又一方面,提供了一种电子设备。
本发明的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的图像背景虚化方法。
为实现上述目的,根据本发明的再一方面,提供了一种计算机可读存储介质。
本发明的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明所提供的图像背景虚化方法。
根据本发明的技术方案,上述发明中的实施例具有如下优点或有益效果:在对待处理图像执行背景虚化时,可以从两方面同时执行或依次执行:一方面,可以从待处理图像中检测出需要突出的一个或多个主体目标,利用语义分割方法准确获取主体目标的分布区域图像(即待处理图像中主体目标包含的像素组成的图像)并存储,由此保留主体目标的原有细节和质感;另一方面,可以将待处理图像输入预先训练完成的循环生成对抗网络,从而得到待处理图像的虚化图像。此后,将主体目标的分布区域图像与待处理图像的虚化图像在相应位置进行叠加,即可得到主体目标突出的背景虚化图像。以上处理过程可自动完成,不需人工执行选取虚化区域等操作。同时由于循环生成对抗网络可以根据训练数据的不同生成各种风格的虚化图像,因此本发明能够实现多样化的背景虚化效果。此外,为了形成较佳的图像虚化处理能力,本发明对上述循环生成对抗网络的内部结构以及各模块的损失函数进行了更为合理的设计。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是本发明实施例中图像背景虚化方法的主要步骤示意图;
图2是本发明实施例中循环生成对抗网络的结构示意图;
图3是本发明实施例中图像背景虚化方法的具体执行过程示意图;
图4是本发明实施例中图像背景虚化装置的组成部分示意图;
图5是根据本发明实施例可以应用于其中的示例性系统架构图;
图6是用来实现本发明实施例中图像背景虚化方法的电子设备结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明的实施例以及实施例中的技术特征可以相互结合。
图1是根据本发明实施例中图像背景虚化方法的主要步骤示意图。
如图1所示,本发明实施例的图像背景虚化方法可具体按照如下步骤执行:
步骤S101:从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像。
在本步骤中,可以首先检测并提取待处理图像中的主体目标。主体目标的类别可以由用户预先确定。例如,在一种场景中,可以将待处理图像中的人作为主体目标;在另一场景中,可以将待处理图像中的动物作为主体目标;当然,也可以将待处理图像中的人、动物、花等一起作为主体目标。在本发明实施例中,系统可以根据用户预设的主体目标类别自动检测出待处理图像中所有的主体目标,也可以通过自动检测结合手动选择的方式确定主体目标。例如,系统首先根据用户预设的主体目标类别自动检测出待处理图像中所有的候选目标(即待定的主体目标),如果判断候选目标的数量是一个,则自动将其设置为主体目标;如果判断候选目标的数量是多个,则可以将这些候选目标中的全部或部分自动设置为主体目标,例如,用户预先设置的主体目标类别为人和动物,当检测到的人和动物的数量为多个时,可以自动将优先级较高的人作为主体目标。如果系统判断候选目标的数量是多个,也可以通过用户手动选择来确定其中的主体目标。可以理解的是,上述目标可以是待处理图像中的任何对象或个体。
作为一个优选方案,系统可以利用预先训练完成的YOLO网络执行上述主体目标检测。YOLO是一种将物体检测作为回归问题求解的网络,可以由多个卷积层和多个全连接层组成。
在获得待处理图像的主体目标之后,系统可以对检测出的主体目标执行语义分割,从而获得主体目标的分布区域图像(即主体目标在待处理图像包含的每一像素组成的图像)。在图像处理以及模式识别领域,语义分割(semantic segmentation)指的是识别图像中存在的特定内容以及准确位置,该位置一般通过查找属于该特定内容的所有像素来确定。在一些实施例中,系统可以利用预先训练完成的MASK-RCNN网络执行上述语义分割,MASK-RCNN是一种目标检测和语义分割架构,可以由卷积层、FPN(Feature PyramidNetwork,特征金字塔网络)、RPN(Region Proposal Network,区域推荐网络)等部分组成。在获得主体目标的分布区域图像之后,系统可以将分布区域图像存储在预设文件供后续使用。
步骤S102:将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像。
在本步骤中,机器学习模型可以是循环生成对抗网络(CycleGAN,CycleGenerative Adversarial Networks)。图2是本发明实施例中循环生成对抗网络的结构示意图,如图2所示,循环生成对抗网络可以包括第一生成器、第二生成器、第一鉴别器和第二鉴别器。具体地,第一生成器可以用于将输入循环生成对抗网络的原始类型图像或第二生成器生成的原始类型图像转换为虚化类型图像,第二生成器可以用于将输入循环生成对抗网络的虚化类型图像或第一生成器生成的虚化类型图像转换为原始类型图像。其中,原始类型图像和虚化类型图像对应于不同的两个图像域(一般地,每一图像域具有特定的图像风格),二者都是用于训练循环生成对抗网络的训练数据。实际应用中,原始类型图像可以是任何类型的图像,虚化类型图像可以是具有虚化效果的图像。为了提升循环生成对抗网络的图像处理效果,较佳地,可以将原始类型图形选取为不具有虚化效果的图形。可以理解,上述虚化指的是图像所呈现的朦胧、模糊等视觉效果以及相应的图像处理手段。
在本发明实施例中,可以将输入循环生成对抗网络的原始类型图像认定为真实的原始类型图像,将第二生成器生成的原始类型图像认定为虚假的原始类型图像,将输入循环生成对抗网络的虚化类型图像认定为真实的虚化类型图像,将第一生成器生成的虚化类型图像认定为虚假的虚化类型图像。循环生成对抗网络中的第一鉴别器可以用于判断进入第一鉴别器的图像是否为真实的原始类型图像(可以通过计算概率的方式来判断),第二鉴别器可以用于判断进入第二鉴别器的图像是否为真实的虚化类型图像。可以看到,第一鉴别器和第二鉴别器均用于执行图像为真实或虚假的二分类判断。
如图2所示,循环生成对抗网络可以由两个镜像对称的单向生成对抗网络构成。在上侧的单向生成对抗网络中,从外部输入的原始类型图像分别进入第一鉴别器和第一生成器,第一生成器将该原始类型图像转换为虚化类型图像(即生成的虚化类型图像),该生成的虚化类型图像分别进入第二鉴别器和第二生成器,第二鉴别器鉴别该生成的虚化类型图像是否为真实的虚化类型图像,第二生成器用于将该生成的虚化类型图像转换为原始类型图像(即重建的原始类型图像),该重建的原始类型图像由第一鉴别器基于输入的原始类型图像进行真实性判断。
在下侧的单向生成对抗网络中,从外部输入的虚化类型图像分别进入第二鉴别器和第二生成器,第二生成器将该虚化类型图像转换为原始类型图像(即生成的原始类型图像),该生成的原始类型图像分别进入第一鉴别器和第一生成器,第一鉴别器鉴别该生成的原始类型图像是否为真实的原始类型图像,第一生成器用于将该生成的原始类型图像转换为虚化类型图像(即重建的虚化类型图像),该重建的虚化类型图像由第二鉴别器基于输入的虚化类型图像进行真实性判断。
在一些实施例中,第一生成器可以包括第一编码器、第一转换器和第一解码器;其中,第一编码器包括多个卷积层,其用于提取进入第一编码器的图像的特征向量,例如提取出256个64*64的特征向量(256为卷积核的数量,两个64分别表示特征图feature map的宽度和高度)。第一转换器可以包括多个特征重置模块(每一特征重置模块都包括两个卷积层),其用于将第一编码器提取的特征向量转换为对应于虚化类型图像的特征向量(即虚化类型图像所在图像域的特征向量),第一转换器采用上述结构能够在特征转换的同时保留输入图像的特征。第一解码器可以包括多个反卷积层,其可以用于依据第一转换器转换得到的特征向量生成虚化类型图像。
类似地,第二生成器可以包括第二编码器、第二转换器和第二解码器;其中,第二编码器包括多个卷积层,其用于提取进入第二编码器的图像的特征向量,例如提取出256个64*64的特征向量。第二转换器可以包括多个特征重置模块(每一特征重置模块都包括两个卷积层),其用于将第二编码器提取的特征向量转换为对应于原始类型图像的特征向量(即原始类型图像所在图像域的特征向量),第二转换器采用上述结构能够在特征转换的同时保留输入图像的特征。第二解码器可以包括多个反卷积层,其可以用于依据第二转换器转换得到的特征向量生成原始类型图像。此外,第一鉴别器和第二鉴别器均可以包括至少一个用于提取图像特征的卷积层以及用于依据该卷积层提取的图像特征对图像进行分类的输出层。
具体应用中,上述循环生成对抗网络可以通过以下步骤进行训练:首先,从预设的图像数据集中获取多幅原始类型图像和多幅虚化类型图像作为训练数据,将任一原始类型图像和任一虚化类型图像组成一个训练数据对。需要说明的是,同一训练数据对中的两幅图像不必是匹配图像(匹配图像指的是两幅图像具有相同目标,仅颜色、风格等具有差异),可以是两个图像域中的任何图像。之后,使用上述训练数据对输入循环生成对抗网络进行训练以分别最小化为第一生成器、第二生成器、第一鉴别器和第二鉴别器预设的损失函数。特别地,上述虚化类型图像可以是任何风格的虚化图像,包括高斯模糊虚化、运动模糊虚化、油画风格虚化、卡通风格虚化等。这样,在循环生成对抗网络训练完成之后,即可将待处理图像处理为相应风格的虚化图像,由此实现多样化的背景虚化处理。
在本发明实施例中,第一鉴别器需要针对输入循环生成对抗网络的原始类型图像输出1(表示真实),需要针对生成的或重建的原始类型图像输出零(表示虚假)。第二鉴别器需要针对输入循环生成对抗网络的虚化类型图像输出1,需要针对生成的或重建的虚化类型图像输出零。第一生成器试图使第二鉴别器通过其生成的图像,第二生成器试图使第一鉴别器通过其生成的图像。此外,使用两个生成器生成的重建图像应尽可能与输入循环生成对抗网络的图像相同,此过程需要满足循环一致性。因此,可以为第一生成器、第二生成器、第一鉴别器和第二鉴别器设置以下损失函数:
其中,DA为第一鉴别器,DB为第二鉴别器,GA2B为第一生成器,GB2A为第二生成器,x表示原始类型图像数据,y表示虚化类型图像数据,E表示期望,表示第一鉴别器的损失函数,/>为第二鉴别器的损失函数,/>表示第一生成器的损失函数,/>表示第二生成器的损失函数,Pdata(x)表示原始类型图像数据的概率分布,Pdata(y)表示虚化类型图像数据的概率分布,/>表示第一生成器的固有损失函数,/>表示第二生成器的固有损失函数,/>为第一循环一致性损失函数,/>为第二循环一致性损失函数,λ1和λ2为平衡因子。
和/>可以表示如下:
其中,||||为1范数符号。
以上损失函数在现有损失函数的基础上进行优化,特别是通过考虑生成器的固有损失以及循环一致性损失实现更为合理的模型训练目标,进而提升循环生成对抗网络的图像虚化处理能力。实际训练过程中,可以在每个EPOCH(即全部训练数据通过模型一次并且返回一次的时间段)内依次训练第一生成器、第二鉴别器、第二生成器和第一鉴别器。为保证训练的稳定性,可以将bench size(每批样本的大小)设置为1,取λ1和λ2为10,并循环训练100次,最终将循环生成对抗网络训练完成。
可以理解,在步骤S102中,可以将待处理图像输入预先训练完成的循环生成对抗网络中的第一生成器,即可得到待处理图像的虚化图像。步骤S102中机器学习模型也可以采用其它任何适用的模型如单向生成对抗网络等,本发明并不对此进行限制。此外,步骤S102可以与步骤S101同时执行,也可以执行在步骤S101之前或之后。
步骤S103:按照分布区域图像在待处理图像中的位置将分布区域图像叠加在虚化图像,获得待处理图像的背景虚化图像。
在本步骤中,可以首先将预先存储的主体目标的分布区域图像叠加在第一生成器生成的虚化图像。实际操作时,需要按照主体目标的分布区域图像在待处理图像中的原始位置(由于虚化图像与待处理图像相比仅具有虚化效果,其它没有差异,因此分布区域图像在待处理图像中的原始位置即分布区域图像在虚化图像中的合适位置)进行叠加。叠加之后,可以对上述分布区域图像与虚化图像的边界执行模糊化处理,例如基于预设模糊核的高斯模糊,从而使上述边界的过渡较为自然。这样,即可得到待处理图像的背景虚化图像。
图3是本发明实施例中图像背景虚化方法的具体执行过程示意图,如图3所示,在对待处理图像执行背景虚化时,首先可以从两个方面进行处理。第一方面,对待处理图像进行目标检测以获取候选目标,如果候选目标的数量为一个,则以直接将其设置为主体目标;如果候选目标的数量为多个,则通过自动方式或手动方式选取主体目标。之后对主体目标执行语义分割并存储主体目标的分布区域图像。第二方面,将待处理图像输入预先训练完成的循环生成对抗网络,得到待处理图像的虚化图像。此后,可以将主体目标的分布区域图像叠加在上述虚化图像,并对边界进行模糊化处理,即可得到待处理图像的背景虚化图像。
根据本发明实施例的技术方案,在对待处理图像执行背景虚化时,可以从两方面同时执行或依次执行:一方面,可以从待处理图像中检测出需要突出的一个或多个主体目标,利用语义分割方法准确获取主体目标的分布区域图像并存储,由此保留主体目标的原有细节和质感;另一方面,可以将待处理图像输入预先训练完成的循环生成对抗网络,从而得到待处理图像的虚化图像。此后,将主体目标的分布区域图像与待处理图像的虚化图像在相应位置进行叠加,即可得到主体目标突出的背景虚化图像。以上处理过程可自动完成,不需人工执行选取虚化区域等操作。同时由于循环生成对抗网络可以根据训练数据的不同生成各种风格的虚化图像,因此本发明能够实现多样化的背景虚化效果。此外,为了形成较佳的图像虚化处理能力,本发明对上述循环生成对抗网络的内部结构以及各模块的损失函数进行了更为合理的设计。
需要说明的是,对于前述的各方法实施例,为了便于描述,将其表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,某些步骤事实上可以采用其它顺序进行或者同时进行。此外,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是实现本发明所必须的。
为便于更好的实施本发明实施例的上述方案,下面还提供用于实施上述方案的相关装置。
请参阅图4所示,本发明实施例提供的图像背景虚化装置400可以包括:检测及分割单元401、虚化处理单元402和叠加单元403。
其中,检测及分割单元401可用于从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;虚化处理单元402可用于将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;叠加单元403可用于按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像。
在本发明实施例中,所述机器学习模型为包含第一生成器、第二生成器、第一鉴别器和第二鉴别器的循环生成对抗网络;其中,第一生成器用于将输入的原始类型图像或第二生成器生成的原始类型图像转换为虚化类型图像;第二生成器用于将输入的虚化类型图像或第一生成器生成的虚化类型图像转换为原始类型图像;第一鉴别器用于判断进入第一鉴别器的图像是否为真实的原始类型图像;第二鉴别器用于判断进入第二鉴别器的图像是否为真实的虚化类型图像。
具体应用中,虚化处理单元402可进一步用于:将待处理图像输入预先训练完成的所述循环生成对抗网络中的第一生成器。
实际应用中,第一生成器包括第一编码器、第一转换器和第一解码器;其中,第一编码器用于提取进入第一编码器的图像的特征向量,第一转换器用于将第一编码器提取的特征向量转换为对应于虚化类型图像的特征向量,第一解码器用于依据第一转换器转换得到的特征向量生成虚化类型图像;第二生成器包括第二编码器、第二转换器和第二解码器;其中,第二编码器用于提取进入第二编码器的图像的特征向量,第二转换器用于将第二编码器提取的特征向量转换为对应于原始类型图像的特征向量,第二解码器用于依据第二转换器转换得到的特征向量生成原始类型图像;第一鉴别器和第二鉴别器都包括:至少一个用于提取图像特征的卷积层以及用于依据该卷积层提取的图像特征对图像进行分类的输出层。
作为一个优选方案,所述装置400可进一步包括模型训练单元,其用于:获取多幅原始类型图像和多幅虚化类型图像,将任一原始类型图像和任一虚化类型图像组成一个训练数据对;将所述训练数据对输入所述循环生成对抗网络并分别最小化为第一生成器、第二生成器、第一鉴别器和第二鉴别器预设的损失函数。
较佳地,所述装置400可进一步包括边界处理单元,其用于:在按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像之后,对所述分布区域图像与所述虚化图像的边界执行模糊化处理。
此外,在本发明实施例中,检测及分割单元401可进一步用于:利用预先训练完成的YOLO网络执行所述检测,利用预先训练完成的MASK-RCNN网络执行所述语义分割。第一转换器和第二转换器都可以包括多个特征重置模块,每一特征重置模块都包括两个卷积层。
根据本发明实施例的技术方案,在对待处理图像执行背景虚化时,可以从两方面同时执行或依次执行:一方面,可以从待处理图像中检测出需要突出的一个或多个主体目标,利用语义分割方法准确获取主体目标的分布区域图像并存储,由此保留主体目标的原有细节和质感;另一方面,可以将待处理图像输入预先训练完成的循环生成对抗网络,从而得到待处理图像的虚化图像。此后,将主体目标的分布区域图像与待处理图像的虚化图像在相应位置进行叠加,即可得到主体目标突出的背景虚化图像。以上处理过程可自动完成,不需人工执行选取虚化区域等操作。同时由于循环生成对抗网络可以根据训练数据的不同生成各种风格的虚化图像,因此本发明能够实现多样化的背景虚化效果。此外,为了形成较佳的图像虚化处理能力,本发明对上述循环生成对抗网络的内部结构以及各模块的损失函数进行了更为合理的设计。
图5示出了可以应用本发明实施例的图像背景虚化方法或图像背景虚化装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505(此架构仅仅是示例,具体架构中包含的组件可以根据申请具体情况调整)。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种客户端应用,例如执行图像背景虚化处理的应用等(仅为示例)。
终端设备501、502、503可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,例如对用户利用终端设备501、502、503所操作的执行图像背景虚化处理的应用提供支持的图像处理服务器(仅为示例)。图像处理服务器可以对接收到的背景虚化请求进行处理,并将处理结果(例如背景虚化图像--仅为示例)反馈给终端设备501、502、503。
需要说明的是,本发明实施例所提供的图像背景虚化方法一般由服务器505执行,相应地,图像背景虚化装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
本发明还提供了一种电子设备。本发明实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的图像背景虚化方法。
下面参考图6,其示出了适于用来实现本发明实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有计算机系统600操作所需的各种程序和数据。CPU601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文的主要步骤图描述的过程可以被实现为计算机软件程序。例如,本发明实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在上述实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括检测及分割单元、虚化处理单元和叠加单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,检测及分割单元还可以被描述为“向叠加单元提供主体目标的分布区域图像的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中的。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该设备执行时,使得该设备执行的步骤包括:从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像。
根据本发明实施例的技术方案,在对待处理图像执行背景虚化时,可以从两方面同时执行或依次执行:一方面,可以从待处理图像中检测出需要突出的一个或多个主体目标,利用语义分割方法准确获取主体目标的分布区域图像并存储,由此保留主体目标的原有细节和质感;另一方面,可以将待处理图像输入预先训练完成的循环生成对抗网络,从而得到待处理图像的虚化图像。此后,将主体目标的分布区域图像与待处理图像的虚化图像在相应位置进行叠加,即可得到主体目标突出的背景虚化图像。以上处理过程可自动完成,不需人工执行选取虚化区域等操作。同时由于循环生成对抗网络可以根据训练数据的不同生成各种风格的虚化图像,因此本发明能够实现多样化的背景虚化效果。此外,为了形成较佳的图像虚化处理能力,本发明对上述循环生成对抗网络的内部结构以及各模块的损失函数进行了更为合理的设计。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (9)
1.一种图像背景虚化方法,其特征在于,包括:
从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;其中,所述分布区域图像为所述主体目标在所述待处理图像包含的每一像素组成的图像;
将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;所述机器学习模型为包含第一生成器、第二生成器、第一鉴别器和第二鉴别器的循环生成对抗网络;其中,第一生成器用于将输入的原始类型图像或第二生成器生成的原始类型图像转换为虚化类型图像;第二生成器用于将输入的虚化类型图像或第一生成器生成的虚化类型图像转换为原始类型图像;第一鉴别器用于判断进入第一鉴别器的图像是否为真实的原始类型图像;第二鉴别器用于判断进入第二鉴别器的图像是否为真实的虚化类型图像;
按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像;
所述机器学习模型的损失函数为:
其中,DA为第一鉴别器,DB为第二鉴别器,GA2B为第一生成器,GB2A为第二生成器,x表示原始类型图像数据,y表示虚化类型图像数据,E表示期望,表示第一鉴别器的损失函数,/>为第二鉴别器的损失函数,/>表示第一生成器的损失函数,/>表示第二生成器的损失函数,Pdata(x)表示原始类型图像数据的概率分布,Pdata(y)表示虚化类型图像数据的概率分布,/>表示第一生成器的固有损失函数,/>表示第二生成器的固有损失函数,/>为第一循环一致性损失函数,/>为第二循环一致性损失函数,λ1和λ2为平衡因子。
2.根据权利要求1所述的方法,其特征在于,所述将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,包括:
将待处理图像输入预先训练完成的所述循环生成对抗网络中的第一生成器。
3.根据权利要求1所述的方法,其特征在于,
第一生成器包括第一编码器、第一转换器和第一解码器;其中,第一编码器用于提取进入第一编码器的图像的特征向量,第一转换器用于将第一编码器提取的特征向量转换为对应于虚化类型图像的特征向量,第一解码器用于依据第一转换器转换得到的特征向量生成虚化类型图像;
第二生成器包括第二编码器、第二转换器和第二解码器;其中,第二编码器用于提取进入第二编码器的图像的特征向量,第二转换器用于将第二编码器提取的特征向量转换为对应于原始类型图像的特征向量,第二解码器用于依据第二转换器转换得到的特征向量生成原始类型图像;
第一鉴别器和第二鉴别器都包括:至少一个用于提取图像特征的卷积层以及用于依据该卷积层提取的图像特征对图像进行分类的输出层。
4.根据权利要求1所述的方法,其特征在于,所述循环生成对抗网络通过以下步骤进行训练:
获取多幅原始类型图像和多幅虚化类型图像,将任一原始类型图像和任一虚化类型图像组成一个训练数据对;
将所述训练数据对输入所述循环生成对抗网络并分别最小化为第一生成器、第二生成器、第一鉴别器和第二鉴别器预设的损失函数。
5.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
在按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像之后,对所述分布区域图像与所述虚化图像的边界执行模糊化处理。
6.根据权利要求3所述的方法,其特征在于,
所述从待处理图像中检测预先确定的至少一个类别的主体目标,包括:利用预先训练完成的YOLO网络执行所述检测;
所述对检测出的主体目标执行语义分割,包括:利用预先训练完成的MASK-RCNN网络执行所述语义分割;
第一转换器和第二转换器都包括多个特征重置模块,每一特征重置模块都包括两个卷积层。
7.一种图像背景虚化装置,其特征在于,包括:
检测及分割单元,用于从待处理图像中检测预先确定的至少一个类别的主体目标;对检测出的主体目标执行语义分割,获得主体目标的分布区域图像;其中,所述分布区域图像为所述主体目标在所述待处理图像包含的每一像素组成的图像;
虚化处理单元,用于将待处理图像输入预先训练完成的、用于执行图像虚化处理的机器学习模型,得到待处理图像的虚化图像;所述机器学习模型为包含第一生成器、第二生成器、第一鉴别器和第二鉴别器的循环生成对抗网络;其中,第一生成器用于将输入的原始类型图像或第二生成器生成的原始类型图像转换为虚化类型图像;第二生成器用于将输入的虚化类型图像或第一生成器生成的虚化类型图像转换为原始类型图像;第一鉴别器用于判断进入第一鉴别器的图像是否为真实的原始类型图像;第二鉴别器用于判断进入第二鉴别器的图像是否为真实的虚化类型图像;
叠加单元,用于按照所述分布区域图像在待处理图像中的位置将所述分布区域图像叠加在所述虚化图像,获得待处理图像的背景虚化图像;
所述机器学习模型的损失函数为:
其中,DA为第一鉴别器,DB为第二鉴别器,GA2B为第一生成器,GB2A为第二生成器,x表示原始类型图像数据,y表示虚化类型图像数据,E表示期望,表示第一鉴别器的损失函数,/>为第二鉴别器的损失函数,/>表示第一生成器的损失函数,/>表示第二生成器的损失函数,Pdata(x)表示原始类型图像数据的概率分布,Pdata(y)表示虚化类型图像数据的概率分布,/>表示第一生成器的固有损失函数,/>表示第二生成器的固有损失函数,/>为第一循环一致性损失函数,/>为第二循环一致性损失函数,λ1和λ2为平衡因子。
8.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010628271.7A CN111861867B (zh) | 2020-07-02 | 2020-07-02 | 图像背景虚化方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010628271.7A CN111861867B (zh) | 2020-07-02 | 2020-07-02 | 图像背景虚化方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111861867A CN111861867A (zh) | 2020-10-30 |
CN111861867B true CN111861867B (zh) | 2024-02-13 |
Family
ID=73151795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010628271.7A Active CN111861867B (zh) | 2020-07-02 | 2020-07-02 | 图像背景虚化方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111861867B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112862852A (zh) * | 2021-02-24 | 2021-05-28 | 深圳市慧鲤科技有限公司 | 图像处理方法及装置、电子设备及计算机可读存储介质 |
CN113052068B (zh) * | 2021-03-24 | 2024-04-30 | 深圳威富云数科技有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN114445301A (zh) * | 2022-01-30 | 2022-05-06 | 北京字跳网络技术有限公司 | 图像处理方法、装置、电子设备及存储介质 |
WO2024025224A1 (en) * | 2022-07-25 | 2024-02-01 | Samsung Electronics Co., Ltd. | Method and system for generation of a plurality of portrait effects in an electronic device |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683147A (zh) * | 2017-01-23 | 2017-05-17 | 浙江大学 | 一种图像背景虚化的方法 |
CN108230243A (zh) * | 2018-02-09 | 2018-06-29 | 福州大学 | 一种基于显著性区域检测模型背景虚化方法 |
CN109684797A (zh) * | 2018-11-21 | 2019-04-26 | 众安信息技术服务有限公司 | 基于区块链的对抗网络生成图片的虚拟ip保护方法及系统 |
CN110363702A (zh) * | 2019-07-10 | 2019-10-22 | Oppo(重庆)智能科技有限公司 | 图像处理方法及相关产品 |
CN110570433A (zh) * | 2019-08-30 | 2019-12-13 | 北京影谱科技股份有限公司 | 基于生成对抗网络的图像语义分割模型构建方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5971954B2 (ja) * | 2012-01-12 | 2016-08-17 | キヤノン株式会社 | 画像処理装置、画像処理装置を有する撮像装置、画像処理方法、プログラム、及びプログラムを記憶した記憶媒体 |
-
2020
- 2020-07-02 CN CN202010628271.7A patent/CN111861867B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683147A (zh) * | 2017-01-23 | 2017-05-17 | 浙江大学 | 一种图像背景虚化的方法 |
CN108230243A (zh) * | 2018-02-09 | 2018-06-29 | 福州大学 | 一种基于显著性区域检测模型背景虚化方法 |
CN109684797A (zh) * | 2018-11-21 | 2019-04-26 | 众安信息技术服务有限公司 | 基于区块链的对抗网络生成图片的虚拟ip保护方法及系统 |
CN110363702A (zh) * | 2019-07-10 | 2019-10-22 | Oppo(重庆)智能科技有限公司 | 图像处理方法及相关产品 |
CN110570433A (zh) * | 2019-08-30 | 2019-12-13 | 北京影谱科技股份有限公司 | 基于生成对抗网络的图像语义分割模型构建方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111861867A (zh) | 2020-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111861867B (zh) | 图像背景虚化方法和装置 | |
Xiang et al. | Single-image de-raining with feature-supervised generative adversarial network | |
CN111787242B (zh) | 用于虚拟试衣的方法和装置 | |
CN108629823B (zh) | 多视角图像的生成方法和装置 | |
CN109472264B (zh) | 用于生成物体检测模型的方法和装置 | |
CN109711508B (zh) | 图像处理方法和装置 | |
CN109389640A (zh) | 图像处理方法和装置 | |
CN109377508A (zh) | 图像处理方法和装置 | |
CN112330527A (zh) | 图像处理方法、装置、电子设备和介质 | |
CN109272050B (zh) | 图像处理方法和装置 | |
CN109118456A (zh) | 图像处理方法和装置 | |
JP2023131117A (ja) | 結合感知モデルのトレーニング、結合感知方法、装置、機器および媒体 | |
CN110633717A (zh) | 一种目标检测模型的训练方法和装置 | |
CN114792355A (zh) | 虚拟形象生成方法、装置、电子设备和存储介质 | |
CN109510943A (zh) | 用于拍摄图像的方法和装置 | |
CN110414593B (zh) | 图像处理方法及装置、处理器、电子设备及存储介质 | |
CN113034393A (zh) | 照片修复方法、装置、设备以及存储介质 | |
CN110895699B (zh) | 用于处理图像的特征点的方法和装置 | |
Mafi et al. | Deep convolutional neural network for mixed random impulse and Gaussian noise reduction in digital images | |
CN115578614A (zh) | 图像处理模型的训练方法、图像处理方法和装置 | |
CN109949332B (zh) | 用于处理图像的方法和装置 | |
CN109657523B (zh) | 一种可行驶区域检测方法和装置 | |
CN113496140A (zh) | 虹膜定位方法以及美瞳虚拟试戴方法和装置 | |
CN113066038A (zh) | 图像评估方法、装置、电子设备及计算机存储介质 | |
CN112070022A (zh) | 人脸图像识别方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |