CN112581355A

CN112581355A - 图像处理方法、装置、电子设备和计算机可读介质

Info

Publication number: CN112581355A
Application number: CN202011206689.5A
Authority: CN
Inventors: 汤诗雨; 贾澜鹏; 王氚; 刘帅成
Original assignee: Chengdu Kuangshi Jinzhi Technology Co ltd; Beijing Megvii Technology Co Ltd
Current assignee: Chengdu Kuangshi Jinzhi Technology Co ltd; Beijing Megvii Technology Co Ltd
Priority date: 2020-11-02
Filing date: 2020-11-02
Publication date: 2021-03-30

Abstract

本发明提供了一种图像处理方法、装置、电子设备和计算机可读介质，涉及图像处理的技术领域，包括获取待处理图像和目标风格图像；基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同；对所述目标迁移图像进行图像分割处理，得到图像分割结果，本申请缓解了现有的领域自适应的特征对齐方法中图片特征不匹配导致的领域自适应方法适应能力差的技术问题。

Description

图像处理方法、装置、电子设备和计算机可读介质

技术领域

本发明涉及图像处理的技术领域，尤其是涉及一种图像处理方法、装置、电子设备和计算机可读介质。

背景技术

领域自适应是解决深度学习模型在应用中由于外部协变量偏移，即数据集的分布产生变化之后，导致性能发生显著变化的算法的统称。以基于语义分割的领域自适应算法为例，可以使用源域图像集对该语义分割网络进行训练，并利用训练后的网络对在真实场景下采集的数据进行测试处理。

现有的领域自适应方法包含特征对齐方法，输出熵最小化等方法。特征对齐方法中，首先，通过生成网络和判断网络对输入的数据进行分布变换，并通过深度神经网络对变换之后的数据进行特征提取，并利用判别器判别源域图像的特征和目标域图像的特征是否对齐。若对齐，则利用带有标签的源域图像训练出的网络就能对目标域图像有较好地分割。但是，在该方法中存在的问题主要有：源域图像和目标域图像往往不存在配对关系，因此，直接对其进行特征对齐是存在本质性错误的；上述方法往往是将一个数据集的分布向另一特定数据集的分布靠拢，从而基于这一特定分布下训练的模型并不具有普适性。

发明内容

有鉴于此，本发明的目的在于提供一种图像处理方法、装置、电子设备和计算机可读介质，以缓解了现有的领域自适应的特征对齐方法中图片特征不匹配导致的领域自适应方法适应能力差的技术问题。

第一方面，本发明实施例提供了一种图像处理方法，包括：获取待处理图像和目标风格图像；基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同；对所述目标迁移图像进行图像分割处理，得到图像分割结果。

进一步地，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像包括：提取所述待处理图像和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征；利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理，以实现对所述待处理图像进行图像风格迁移，得到目标迁移图像。

进一步地，利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理包括：通过所述第一图像特征的风格参数对所述第一图像特征进行归一化处理，得到归一化之后的所述第一图像特征，所述第一图像特征的风格参数包括均值和/或方差；通过所述第二图像特征的风格参数对所述归一化之后的第一图像特征进行调整，以实现对所述待处理图像进行特征对齐处理，所述第二图像特征的风格参数包括均值和/或方差。

进一步地，通过所述第二图像特征的风格参数对所述归一化之后的第一图像特征进行调整包括：通过以下公式对所述归一化之后的第一图像特征进行调整：

其中，Feat_c为所述第一图像特征的特征值，Feat_s为所述第二图像特征的特征值，Var(Feat_c)为所述第一图像特征的方差，μ为所述第一图像特征的均值，Var(Feat_s)为所述第二图像特征的方差。

进一步地，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像包括：通过目标图像迁移网络对所述目标风格图像和所述待处理图像进行图像风格迁移处理，得到所述目标迁移图像；对所述目标迁移图像进行图像分割处理，得到图像分割结果包括：通过目标域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割结果。

进一步地，所述目标图像迁移网络包括：图像迁移网络；提取所述待处理图像的图像特征和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征包括：通过所述图像迁移网络提取所述待处理图像的图像特征和所述目标风格图像的图像特征。

进一步地，所述目标图像迁移网络包括：特征对齐网络；利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理包括：通过所述特征对齐网络对所述第一图像特征和所述第二图像特征进行处理，以对所述待处理图像进行特征对齐处理。

进一步地，所述方法还包括：获取目标训练样本和目标风格图像，其中，所述目标训练样本中包含：源域图像、目标域图像；利用初始图像迁移网络对所述目标训练样本和所述目标风格图像进行处理，以得到所述目标训练样本的目标迁移图像；通过初始域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割预测结果；利用所述图像分割预测结果计算目标损失值，并通过所述目标损失值调整所述初始图像迁移网络和所述初始域适应网络的参数值，得到所述目标图像迁移网络和所述目标域适应网络。

进一步地，利用所述图像分割预测结果计算目标损失值包括：当所述目标训练样本为源域图像时，基于所述源域图像的标签信息和所述源域图像的图像分割预测结果确定目标交叉熵损失值，并将所述目标交叉熵损失值作为所述目标损失值；当所述目标训练样本为目标域图像时，计算所述目标域图像的图像分割预测结果的平方损失值，并将所述平方损失值作为所述目标损失值。

第二方面，本发明实施例提供了一种图像处理装置，包括：获取单元，用于获取待处理图像和目标风格图像；图像风格迁移单元，用于基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同；图像分割处理单元，用于对所述目标迁移图像进行图像分割处理，得到图像分割结果。

第三方面，本发明实施例提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面中任一项所述的方法。

第四方面，本发明实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质，所述程序代码使所述处理器执行上述第一方面中任一项所述的方法。

在本发明实施例中，首先，获取待处理图像和目标风格图像，然后，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像；最后，对目标迁移图像进行图像分割处理，得到图像分割结果。通过上述描述可知，在本申请实施例中，通过引入基于辅助域的目标风格图像的方式，能够使得领域自适应方法不需要对待处理图像的特征和源域图像的特征进行匹配就可以将待处理图像迁移到目标风格图像所代表的图像分布域中，并使得领域自适应方法不再从目标域图像分布迁移到源域图像分布，从而能够适应更多新的数据场景，进而缓解了现有的领域自适应的特征对齐方法中图片特征不匹配导致的领域自适应方法适应能力差的技术问题。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的一种电子设备的示意图；

图2是根据本发明实施例的一种图像处理方法的流程图；

图3是根据本发明实施例的一种待处理图像的示意图；

图4是根据本发明实施例的一种待处理图像的目标迁移图像的示意图；

图5是根据本发明实施例的另一种图像处理方法的流程图；

图6(a)是根据本发明实施例的一种源域图像的实际分割结果的示意图；

图6(b)是根据本发明实施例的一种目标域图像的实际分割结果的示意图；

图7(a)是采用熵最小化方法对源域图像进行处理的图像分割结果的示意图；

图7(b)是采用熵最小化方法对目标域图像进行处理的图像分割结果的示意图；

图8(a)是采用本申请所提供的方法对源域图像进行处理的图像分割结果的示意图；

图8(b)是采用本申请所提供的方法对目标域图像进行处理的图像分割结果的示意图；

图9是根据本发明实施例的一种图像处理装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

首先，参照图1来描述用于实现本发明实施例的电子设备100，该电子设备可以用于运行本发明各实施例的图像处理方法。

如图1所示，电子设备100包括一个或多个处理设备102、一个或多个存储装置104、输入装置106、输出装置108以及图像采集装置110，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理设备102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理设备102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如，用户)输出各种信息(例如，图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述图像采集装置110可以拍摄用户期望的图像(例如照片、视频等)，并且将所拍摄的图像存储在所述存储装置104中以供其它组件使用。

示例性地，用于实现根据本发明实施例的图像处理方法的示例电子设备可以被实现为诸如智能手机、平板电脑等移动终端上。

实施例2：

根据本发明实施例，提供了一种图像处理方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图2是根据本发明实施例的一种图像处理方法的流程图，如图2所示，该方法包括如下步骤：

步骤S202，获取待处理图像和目标风格图像。

在一些实施例中，所述待处理图像和所述目标风格图像的图像分布域不相同，但本申请对此不作限定。

申请实施例中，待处理图像为目标域图像，目标风格图像为辅助域图像，其中，该目标域可以理解为真实场景下的分布，辅助域可以理解为其他场景下的分布。也就是说，待处理图像和目标风格图像的图像分布域是不相同的。需要说明的是，在一些实施例中，图像分布域可以理解为图像所对应的数据分布，不同数据分布的图像具有不同的分布域，例如不同数据分布的图像所具有的纹理、颜色等特征不同，但本发明对此不作限定。在一些实施例中，图像所对应的场景不同的图像具有不同的数据分布，因而属于不同的图像分布域，例如，一类图像的场景为真实场景，另一类图像场景的为游戏动漫场景，以上两种不同场景的图像属于不同的图像分布域。在另一些实施例中，具有不同制作手法、来源的图像具有不同的数据分布，属于不同的图像分布域，例如A图像为从购物网站下载的图片，B图像为抓拍相机拍摄的图片，C图像为油画或手绘的图像等，A图像、B图像、C图像分布具有不同的图像分布域。

步骤S204，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同。

图像风格迁移为通过神经网络模型或图像处理算法将图像的语义内容与特定视觉风格(简称为“风格”)融合起来的过程。一般一张图像包括语义内容和风格，语义内容为图像中包含的目标对象，例如人、脸、车辆、马路、树木、建筑物等；风格包括图像中的除目标对象之外的其他细节特征，例如纹理、颜色等。示例地，对A图像进行图像风格迁移转变为具有B图像风格的图像，可以理解将B图像中的纹理、颜色等特征迁移到A图像中。例如A图像为一张长城的照片，特定风格为中国山水画，通过对A图像进行图像风格迁移，可以将A图像转变为一张具有中国山水画风格的长城图像，也即经图像风格迁移后的A图像既具有原本的语义内容(即长城)，又具有中国山水画的视觉风格，进而能达到艺术化长城照片的目的。或者，还可以反过来，将艺术画，比如梵高、莫奈的画，转化为实物照片风格类的图像。

在本申请实施例中，在获取到目标风格图像和待处理图像之后，就可以将待处理图像迁移为与目标风格图像具有相同风格的图像，即，目标迁移图像。目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同。例如具有相同的视觉风格，也即目标迁移图像与目标风格图像的纹理、颜色等特征相同。

如图3所示的即为待处理图像，如图4所示的即为对待处理图像进行图像风格迁移之后得到目标迁移图像。通过图3和图4可以看出，在对待处理图像进行图像风格迁移处理之后，可以得到其他风格的图像。其中，图4所示图像的图像分布域与目标风格图像的图像分布域相同。步骤S206，对所述目标迁移图像进行图像分割处理，得到图像分割结果。

需要说明的是，在一些方法中，在获取到待处理图像之后，就直接对该待处理图像进行风格迁移处理，风格迁移处理之后的迁移图像的图像分布域与源域图像的图像分布域相同。也就是说，在该方法中，由于源域图像和待处理图像的特征往往不相同，因此，直接对源域图像和待处理图像进行特征对齐，会出现本质性错误，且该方法往往会将一个数据集的分布向另一特定数据集的分布靠拢。基于此，在本申请实施例中，借助于辅助域来对待处理图像进行图像风格迁移，采用该方法，能够将源域图像和目标域图像的特征进行对齐，从而尽可能地提取有效特征，从而同时增强对不同数据集的特征提取和判别能力。

在本发明实施例中，首先，获取待处理图像和目标风格图像，然后，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像；最后，对目标迁移图像进行图像分割处理，得到图像分割结果。

通过上述描述可知，在本申请实施例中，通过引入基于辅助域的目标风格图像的方式，能够使得领域自适应方法不需要对待处理图像的特征和源域图像的特征进行匹配就可以将待处理图像迁移到目标风格图像所代表的图像分布域中，并使得领域自适应方法不再从目标域图像分布迁移到源域图像分布，从而能够适应更多新的数据场景，进而缓解了现有的领域自适应的特征对齐方法中图片特征不匹配导致的领域自适应方法适应能力差的技术问题。

通过上述描述可知，在本申请实施例中，首先，获取待处理图像和目标风格图像，然后，可以通过目标图像迁移网络对所述目标风格图像和所述待处理图像进行图像风格迁移处理，得到所述目标迁移图像。

在得到目标迁移图像之后，就可以通过目标域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割结果。在本申请实施例中，目标域适应网络可以为基于Deeplabv2的域适应网络，除此之外，还可以选择其他的域适应网络，本申请实施例对此不作具体限定。

在一个可选的实施方式中，步骤S204，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像包括如下过程：

(1)，通过目标图像迁移网络提取所述待处理图像和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征。

在本申请实施例中，可以通过VGG网络的前31层网络对待处理图像和目标风格图像进行特征提取，分别得到第一图像特征和第二图像特征。当然还可以通过其他已有网络模型或自主设计的网络模型对待处理图像和目标风格图像进行特征提取，得到该第一图像特征和第二图像特征，本申请实施例对此不作限定。

(2)，通过目标图像迁移网络，利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理，以实现对所述待处理图像进行图像风格迁移，得到目标迁移图像。

在本申请实施例中，在提取到第一图像特征和第二图像特征之后，可以通过目标图像迁移网络对第一图像特征和第二特征进行特征归一化处理，使得根据归一化处理结果对待处理图像进行特征对齐处理。其中，归一化处理结果可以理解为：待处理图像的第一图像特征的均值和方差和目标风格图像的第二特征图像的均值和方差相同。

在本申请实施例中，目标图像迁移网络包括：图像迁移网络和特征对齐网络。在一个可选的实施方式中，该图像迁移网络可以为基于实例正则化instance Norm的风格迁移网络，例如，可以为VGG网络的前31层网络。instance Norm主要用于风格化迁移网络中。

除此之外，还可以选择其他的迁移网络，本申请实施例对此不作具体限定。在本申请实施例中，特征对齐网络可以选择为实例归一化模块。

在深度神经网络的数据处理过程中，归一化算法一直是常用的算法之一，其中，归一化算法包括批量归一化和实例归一化。归一化算法是指对图像特征的均值和方差进行归一化处理。例如，可以将输入样本特征进行归一化处理，使数据变为均值为0，标准差为1的分布或者范围在0～1的分布。批量归一化是使用批量样本的统计数据(例如，风格参数)进行归一化，实例归一化使用单个样本的统计数据(例如，风格参数)进行归一化，而不是使用小批处理对特性进行归一化。

例如，在本申请实施例中，可以通过实例归一化模块来计算图像特征的风格参数，例如均值和/或方差，然后，对均值和/或方差进行归一化处理，从而得到归一化之后的图像特征。基于此，在本申请实施例中，在提取所述待处理图像的图像特征和所述目标风格图像的图像特时，可以通过目标图像迁移网络中的图像迁移网络提取所述待处理图像的图像特征和所述目标风格图像的图像特征。例如，可以通过VGG网络的前31层网络提取待处理图像的图像特征和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征。

在本申请实施例中，在利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理时，可以通过所述特征对齐网络对所述第一图像特征和所述第二图像特征进行处理，以对所述待处理图像进行特征对齐处理。

需要说明的是，在本申请实施例中，在对待处理图像进行特征对齐处理之后，就可以通过解码器decoder对特征对齐处理之后的第一图像特征进行处理，得到目标迁移图像。

如图5所示的为另一种可选的图像处理方法的流程图。如图5所示，首先，获取待处理图像和目标风格图像，其中，图5中内容图片所示的即为待处理图像，辅助域风格图片即为目标风格图像。然后，通过VGG网络的前31层网络提取内容图片的特征，得到第一图像特征，并通过VGG网络的前31层网络提取辅助域风格图片的特征，得到第二图像特征。然后，通过实例归一化模块对第一图像特征和第二图像特征进行处理，以实现对内容图片进行特征对齐处理。接下来，通过解码器decoder对特征对齐处理之后的第一图像特征进行图像生成处理，得到目标迁移图像。如图5所示，接下来，将目标迁移图像输入至域适应网络中进行图像分割处理，得到图像分割结果。

通过上述描述可知，申请实施例中基于此，在本申请实施例中，借助于辅助域来对待处理图像进行图像风格迁移，采用该方法，能够将源域图像和目标域图像的特征进行对齐，从而尽可能地提取有效特征，从而同时增强对不同数据集的特征提取和判别能力。

在本申请实施例中，可以通过下述所描述的方式利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理，具体包括：

首先，通过所述第一图像特征的风格参数对所述第一图像特征进行归一化处理，得到归一化之后的所述第一图像特征，第一图像特征的风格参数包括均值和/或方差。

具体地，在本申请实施例中，可以计算第一图像特征的均值和方差，然后，对通过该均值和方差对第一图像特征进行归一化处理。

然后，通过所述第二图像特征的风格参数对所述归一化之后的第一图像特征进行调整，以实现对所述待处理图像进行特征对齐处理，第二图像特征的风格参数包括均值和/或方差。

需要说明的是，第一图像特征的风格参数和第二图像特征的风格参数不限于均值、方差，还可以为第一图像特征和第二图像特征的其他的特征参数，比如亮度、色度、场景分类等，本申请实施例对此不作限定。

具体地，在本申请实施例中，在得到归一化之后的第一图像特征后，还可以计算第二图像特征的均值和方差，并通过第二图像特征的均值和方差对归一化之后的第一图像特征进行调整。

在一个可选的实施方式中，可以通过以下公式对所述归一化之后的第一图像特征进行调整：

在一个可选的实施方式中，还可以通过下述所描述的方式对初始图像迁移网络和初始域适应网络进行训练，得到目标图像迁移网络和目标域适应网络，具体包括以下过程：

(1)、获取目标训练样本和目标风格图像，其中，所述目标训练样本中包含源域图像和目标域图像。

需要说明的是，在本申请实施例中，目标训练样本包含源域图像和目标域图像，其中，目标域图像可以为上述步骤S202中获取到的待处理图像。

进一步需要说明的是，目标训练样本中的待处理图像可以为分布于多个图像分布域中的图像本申请实施例对此不作具体限定。

在本申请实施例中，源域图像携带标签信息，该标签信息用于表征源域图像的图像分割结果。目标风格图像为辅助域图像。示例地，该目标域可以理解为真实场景下的分布，辅助域可以理解为其他场景下的分布。

(2)、利用初始图像迁移网络对所述目标训练样本和所述目标风格图像进行处理，以得到所述目标训练样本的目标迁移图像。

在本申请实施例中，可以通过初始图像迁移网络对目标训练样本和目标风格图像进行特征提取，得到目标训练样本的图像特征和目标风格图像的图像特征。接下来，基于目标风格图像的图像特征对目标训练样本的图像特征进行特征对齐处理，使得目标风格图像的图像特征的均值和方差与目标风格图像的图像特征的相同。在得到对齐处理之后的目标训练样本的图像特征之后，就可以通过解码器decoder对特征对齐处理之后的目标训练样本的图像特征进行处理，得到目标训练样本的目标迁移图像。

(3)、通过初始域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割预测结果。

在本申请实施例中，在得到目标训练样本的目标迁移图像之后，就可以通过初始域适应网络对目标迁移图像进行图像分割处理，得到图像分割预测结果。其中，初始域适应网络可以为基于Deeplabv2的域适应网络。

(4)、利用所述图像分割预测结果计算目标损失值，并通过所述目标损失值调整所述初始图像迁移网络和所述初始域适应网络的参数值，得到所述目标图像迁移网络和所述目标域适应网络。

在本申请实施例中，在得到图像分割预测结果之后，就可以基于图像分割预测结果计算目标损失值，并通过该目标损失值对初始图像迁移网络和所述初始域适应网络进行训练，例如，通过目标损失值调整初始图像迁移网络和所述初始域适应网络的参数值，直至满足迭代停止条件，其中，该迭代停止条件可以为：迭代次数达到预设次数，或者，初始图像迁移网络和所述初始域适应网络的处理精度满足预设要求。

通过上述描述可知，在本申请实施例中，在传统领域自适应方法的基础上，引入基于辅助域的风格迁移网络(即，目标图像迁移网络)，通过该目标图像迁移网络将源域图像和目标域的图像迁移到辅助域代表的数据分布，实现两个数据分布都迁移到和之前较为不同的分布子空间中，从而减少了源域和目标域中的特有性特征，增加了源域和目标域的共性特征，实现两个数据集的特征对齐，从而解决传统特征对齐方法的图片配对问题和拓展性较弱问题。

通过上述描述可知，目标训练样本包含源域图像和目标域图像。源域图像和目标域图像所对应的目标损失值的计算方式是不相同，下面分开进行介绍。

情况一、目标训练样本为源域图像；

基于此，利用所述图像分割预测结果计算目标损失值包括如下过程：

若所述目标训练样本为源域图像，则基于所述源域图像的标签信息和所述源域图像的图像分割预测结果确定目标交叉熵损失值，并将所述目标交叉熵损失值作为所述目标损失值。

由于源域图像携带标签信息，因此，在得到源域图像的图像分割预测结果之后，可以基于标签信息和图像分割预测结果一起建立交叉熵分类损失(即，目标交叉熵损失函数)，并反向传播使得初始图像迁移网络和初始域适应网络能进一步学习源域的特征并用于判别。

情况二、目标训练样本为目标域图像；

若所述目标训练样本为目标域图像，则计算所述目标域图像的图像分割预测结果的平方损失值，并将所述平方损失值作为所述目标损失值。

由于目标域图像没有标签信息，但是可以从输出熵最小的方法出发，建立图像分割预测结果的平方损失值，反向传播之后使得输出结果能趋于某一类概率很大，其他概率均很小的分布，即达到目标域输出结果确定化的结果。

通过上述描述可知，在本申请实施例中，引入了熵最小化方法，该熵最小化方法减少了熵最小化方法中由于特征没有对齐强行迁移特征引入的误差，对原本的领域自适应算法得到了较好的指标提升。

需要说明的是，传统的熵最小化方法只要减小目标域图像的分割结果的熵，就能得到在目标域图像上的准确分割结果。该方法实际上就是让特征提取器提取的目标域的特征远离现有判别边界，从而目标域的特征分布趋近于源域的特征分布。但是由于在该方法中没有进行特征对齐，使用特征提取器提取出的同一类别的目标域和源域特征并不能保证相近，因此盲目促使相近的源域和目标域特征趋近反而会增加分类错误。

在本申请实施例中，在传统熵最小化方法的基础上，引入了特征对齐网络，减少原网络中因为特征对齐不足，导致的分类错误的现象。

通过上述描述可知，在本申请实施例中，针对现有领域自适应方法中特征对齐方法中图片不配对问题和仅从一个数据分布迁移到另一分布从而无法适应新场景的问题进行了改进。通过将源域图像和目标域图像传入基于辅助域的风格迁移网络，使得网络无需配对，就可通过迁移到同一风格进行特征对齐；同时新场景下的数据只需要进行风格迁移，不需要重新训练分割网络，就可以较为不错的分割结果。进一步地，针对熵最小化系列方法中由于特征分布没有对齐从而产生的误分类进行改进，增加特征对齐网络，进一步改进熵最小化方法，并提升分割系列指标。

在本申请实施例中，发明人还对本申请所提出的图像处理方法进行了性能测试，测试过程描述如下：

下面展示了不同实验的指标对比，对比结果如下：

其中，如下表所示，实验一是以熵最小化方法复现的各项指标，是当前的前沿结果，也是比较的基础。

随后，基于现有网络架构，探索了不适用辅助域进行风格迁移的指标情况，以及不同风格迁移网络超参对于实验结果输出的影响。可以发现，使用辅助域的实验效果(实验三、四、五)均好于不使用辅助域的实验(实验二)，说明辅助域的表现优于不使用辅助域；同时不同的风格迁移超参通过对生成图片的影响，进一步影响最后的分割结果。

如图6(a)、图6(b)、图7(a)、图7(b)、图8(a)、图8(b)所示，图6(a)和图6(b)分别为源域图像和目标域图像的实际分割结果。图7(a)和图7(b)为采用基于熵最小化对图6(a)和图6(b)分别进行预测得到的图像分割结果。图8(a)和图8(b)为采用本申请所提供的方式对图6(a)和图6(b)分别进行预测得到的图像分割结果。

由此可见，迁移前源域图像和目标域图像之间的差距较大。图8(a)和图8(b)可知，迁移之后，源域图像和目标域图像的特征更为相近，同时，因为辅助域的介入，迁移之后的图片和之前有较大变化，从而达到减少某一数据集内特有分布的作用。同时从分割结果可以看出，相较于没有采用基于辅助域特征的方法，有了辅助域进行分割对齐的实验能减少对特征认识不明确而产生的混乱的输出，输出结果更加合理化。

综上所述，本申请实施例所提供的技术方案能够解决以下技术问题：

1、解决特征对齐网络中图片特征不同而不能对齐问题，通过风格迁移而不是判别器针对特征判别，使得不同数据集之间进行特征对齐的同时规避图片需要两两配对的问题。

2、通过将数据集迁移到辅助域，提升数据集之间的共性特征，减少数据集特有特征，实现有效特征进一步增多。

3、通过迁移到辅助域提升网络的拓展性，新场景的图片只需要进行风格迁移，而不需要重新训练分割网络就能得到无监督下不错的效果。

4、基于熵最小化网络引入特征对齐网络，减少原网络中因为特征对齐不足，导致的分类错误。

实施例3：

本发明实施例还提供了一种图像处理装置，该图像处理装置主要用于执行本发明实施例上述内容所提供的图像处理方法，以下对本发明实施例提供的图像处理装置做具体介绍。

图9是根据本发明实施例的一种图像处理装置的示意图，如图9所示，该图像处理装置主要包括获取单元10，图像风格迁移单元20和图像分割处理单元30，其中：

获取单元10，用于获取待处理图像和目标风格图像；

图像风格迁移单元20，用于基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同；

图像分割处理单元30，用于对所述目标迁移图像进行图像分割处理，得到图像分割结果。

可选地，图像风格迁移单元用于：提取所述待处理图像和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征；利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理，以实现对所述待处理图像进行图像风格迁移，得到目标迁移图像。

可选地，图像风格迁移单元还用于：通过所述第一图像特征的风格参数对所述第一图像特征进行归一化处理，得到归一化之后的所述第一图像特征，所述第一图像特征的风格参数包括均值和/或方差；通过所述第二图像特征的风格参数对所述归一化之后的第一图像特征进行调整，以实现对所述待处理图像进行特征对齐处理，所述第二图像特征的风格参数包括均值和/或方差。

可选地，图像风格迁移单元还用于：通过以下公式对所述归一化之后的第一图像特征进行调整：

可选地，图像风格迁移单元还用于：通过目标图像迁移网络对所述目标风格图像和所述待处理图像进行图像风格迁移处理，得到所述目标迁移图像；图像分割处理单元还用于：通过目标域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割结果。

可选地，所述目标图像迁移网络包括：图像迁移网络；图像风格迁移单元还用于：通过所述图像迁移网络提取所述待处理图像的图像特征和所述目标风格图像的图像特征。

可选地，所述目标图像迁移网络包括：特征对齐网络；图像风格迁移单元还用于：通过所述特征对齐网络对所述第一图像特征和所述第二图像特征进行处理，以对所述待处理图像进行特征对齐处理。

可选地，所述装置还用于：获取目标训练样本和目标风格图像，其中，所述目标训练样本中包含：源域图像、目标域图像；利用初始图像迁移网络对所述目标训练样本和所述目标风格图像进行处理，以得到所述目标训练样本的目标迁移图像；通过初始域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割预测结果；利用所述图像分割预测结果计算目标损失值，并通过所述目标损失值调整所述初始图像迁移网络和所述初始域适应网络的参数值，得到所述目标图像迁移网络和所述目标域适应网络。

可选地，还装置还用于：当所述目标训练样本为源域图像时，基于所述源域图像的标签信息和所述源域图像的图像分割预测结果确定目标交叉熵损失值，并将所述目标交叉熵损失值作为所述目标损失值；当所述目标训练样本为目标域图像时，计算所述目标域图像的图像分割预测结果的平方损失值，并将所述平方损失值作为所述目标损失值。

本发明实施例所提供的装置，其实现原理及产生的技术效果和前述方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种图像处理方法，其特征在于，包括：

获取待处理图像和目标风格图像；

基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同；

对所述目标迁移图像进行图像分割处理，得到图像分割结果。

2.根据权利要求1所述的方法，其特征在于，基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像包括：

提取所述待处理图像和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征；

利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理，以实现对所述待处理图像进行图像风格迁移，得到目标迁移图像。

3.根据权利要求2所述的方法，其特征在于，利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理包括：

通过所述第一图像特征的风格参数对所述第一图像特征进行归一化处理，得到归一化之后的所述第一图像特征，所述第一图像特征的风格参数包括均值和/或方差；

通过所述第二图像特征的风格参数对所述归一化之后的第一图像特征进行调整，以实现对所述待处理图像进行特征对齐处理，所述第二图像特征的风格参数包括均值和/或方差。

4.根据权利要求3所述的方法，其特征在于，通过所述第二图像特征的风格参数对所述归一化之后的第一图像特征进行调整包括：

通过以下公式对所述归一化之后的第一图像特征进行调整：

5.根据权利要求2所述的方法，其特征在于，

基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像包括：通过目标图像迁移网络对所述目标风格图像和所述待处理图像进行图像风格迁移处理，得到所述目标迁移图像；

对所述目标迁移图像进行图像分割处理，得到图像分割结果包括：通过目标域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割结果。

6.根据权利要求5所述的方法，其特征在于，所述目标图像迁移网络包括：图像迁移网络；

提取所述待处理图像的图像特征和所述目标风格图像的图像特征，分别得到第一图像特征和第二图像特征包括：

通过所述图像迁移网络提取所述待处理图像的图像特征和所述目标风格图像的图像特征。

7.根据权利要求5所述的方法，其特征在于，所述目标图像迁移网络包括：特征对齐网络；

利用所述第一图像特征和所述第二图像特征对所述待处理图像进行特征对齐处理包括：

通过所述特征对齐网络对所述第一图像特征和所述第二图像特征进行处理，以对所述待处理图像进行特征对齐处理。

8.根据权利要求5所述的方法，其特征在于，所述方法还包括：

获取目标训练样本和目标风格图像，其中，所述目标训练样本中包含：源域图像、目标域图像；

利用初始图像迁移网络对所述目标训练样本和所述目标风格图像进行处理，以得到所述目标训练样本的目标迁移图像；

通过初始域适应网络对所述目标迁移图像进行图像分割处理，得到图像分割预测结果；

利用所述图像分割预测结果计算目标损失值，并通过所述目标损失值调整所述初始图像迁移网络和所述初始域适应网络的参数值，得到所述目标图像迁移网络和所述目标域适应网络。

9.根据权利要求8所述的方法，其特征在于，利用所述图像分割预测结果计算目标损失值包括：

当所述目标训练样本为源域图像时，基于所述源域图像的标签信息和所述源域图像的图像分割预测结果确定目标交叉熵损失值，并将所述目标交叉熵损失值作为所述目标损失值；

当所述目标训练样本为目标域图像时，计算所述目标域图像的图像分割预测结果的平方损失值，并将所述平方损失值作为所述目标损失值。

10.一种图像处理装置，其特征在于，包括：

获取单元，用于获取待处理图像和目标风格图像；

图像风格迁移单元，用于基于所述目标风格图像对所述待处理图像进行图像风格迁移，得到目标迁移图像，其中，所述目标迁移图像的图像分布域与所述目标风格图像的图像分布域相同；

图像分割处理单元，用于对所述目标迁移图像进行图像分割处理，得到图像分割结果。

11.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至9中任一项所述的方法。

12.一种具有处理器可执行的非易失的程序代码的计算机可读介质，其特征在于，所述程序代码使所述处理器执行上述权利要求1至9中任一项所述的方法。