CN112419342A

CN112419342A - 图像处理方法、装置、电子设备和计算机可读介质

Info

Publication number: CN112419342A
Application number: CN202011143529.0A
Authority: CN
Inventors: 董斌; 汪天才
Original assignee: Beijing Megvii Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd
Priority date: 2020-10-22
Filing date: 2020-10-22
Publication date: 2021-02-26

Abstract

本发明提供了一种图像处理方法、装置、电子设备和计算机可读介质，包括：对待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图；获取Anchor Based实例分割方法对待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图；基于第一实例分割特征图和第二实例分割特征图确定待处理图像中目标对象的蒙版。本发明的第二实例分割特征图中带有目标对象的边缘信息，最后确定的待处理图像中目标对象的蒙版的边缘效果更好，提升了实例分割的性能和准确率，并且本发明的方法计算量小，图像处理效率高。

Description

图像处理方法、装置、电子设备和计算机可读介质

技术领域

本发明涉及图像处理的技术领域，尤其是涉及一种图像处理方法、装置、电子设备和计算机可读介质。

背景技术

目标实例分割任务，是指网络能够精确分割出图像上不同类别的目标以及相同类别目标的不同个体。当前实例分割框架设计方法主要有Anchor Free方法和Anchor Based(基于锚点的实例分割)方法两大类。Anchor Based方法先生成目标框，然后进行逐目标分割；Anchor Free方法则直接预测Mask和类别并进行组合得到最终分割结果；Anchor Free方法的速度比Anchor Based方法快，但精度相对较差。然而，不同于语义分割任务有着较大分辨率的输入，实例分割分支的输入往往是目标区域经过ROI Pooling或者ROI Align之后的特征(7x7)，分辨率较小，这样导致边缘细节分割性能受限。当前通用的提高实例分割分支性能的方法有增大ROI尺寸、增加额外的监督Loss、级联多个Stage等。

目前的实例分割框架设计方法主要有：(1)Mask R-CNN，在Faster R-CNN的基础上，将ROI尺寸改为14x14，并增加FCN分支实现实例Mask分割；(2)BMask R-CNN，基于MaskR-CNN，增加了Boundary分支，与Mask分支的特征进行融合并进行边缘监督，达到增强边缘的效果；(3)SOLO，将图像网格化，每一个小格子都进行语义类别预测和实例Mask生成。

这些实例分割框架存在的问题是：(1)ROI尺寸和精度、速度之间无法权衡；(2)需要额外的监督信息，即制作新的多任务学习标签；(3)额外的级联Stage增加了计算量。

综上，现有的实例分割方法在对图像进行实例分割时，存在计算量大、分割效果差的技术问题。

发明内容

有鉴于此，本发明的目的在于提供一种图像处理方法、装置、电子设备和计算机可读介质，以缓解现有的实例分割方法在对图像进行实例分割时，计算量大、分割效果差的技术问题。

第一方面，本发明实施例提供了一种图像处理方法，包括：获取待处理图像，并对所述待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，所述目标对象的浅层特征图中包含有目标对象的边缘信息；获取Anchor Based实例分割方法对所述待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；基于所述目标对象的浅层特征图对所述第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，所述第二实例分割特征图带有目标对象的边缘信息；基于所述第一实例分割特征图和所述第二实例分割特征图确定所述待处理图像中目标对象的蒙版。

进一步的，对所述待处理图像中的目标对象进行浅层特征提取包括：对所述待处理图像进行多尺度缩放处理，得到多尺度的待处理图像；根据所述Anchor Based实例分割方法中预测的目标对象的目标框坐标在所述多尺度的待处理图像中确定目标尺度的待处理图像；将所述目标尺度的待处理图像输入至浅层特征提取网络，得到所述目标对象的浅层特征图，其中，所述浅层特征提取网络包括两个串联的第一目标卷积层。

进一步的，基于所述目标对象的浅层特征图对所述第一实例分割特征图进行导向滤波运算包括：根据所述目标框坐标对所述目标对象的浅层特征图进行ROI Align运算，得到目标尺度的目标对象的浅层特征图；对所述第一实例分割特征图进行上采样，得到上采样的第一实例分割特征图；基于所述目标尺度的目标对象的浅层特征图对所述上采样的第一实例分割特征图进行导向滤波运算，得到所述第二实例分割特征图。

进一步的，基于所述目标尺度的目标对象的浅层特征图对所述上采样的第一实例分割特征图进行导向滤波运算包括：对所述目标尺度的目标对象的浅层特征图和所述上采样的第一实例分割特征图分别进行均值滤波运算，得到均值滤波运算结果；计算所述目标尺度的目标对象的浅层特征图与所述目标尺度的目标对象的浅层特征图的第一相关系数矩阵，并计算所述目标尺度的目标对象的浅层特征图与所述上采样的第一实例分割特征图的第二相关系数矩阵；基于所述均值滤波运算结果、所述第一相关系数矩阵和所述第二相关系数矩阵确定所述第二实例分割特征图。

进一步的，基于所述均值滤波运算结果、所述第一相关系数矩阵和所述第二相关系数矩阵确定所述第二实例分割特征图包括：根据所述均值滤波运算结果和所述第一相关系数矩阵计算所述目标尺度的目标对象的浅层特征图与所述目标尺度的目标对象的浅层特征图的第一方差，并根据所述均值滤波运算结果和所述第二相关系数矩阵计算所述目标尺度的目标对象的浅层特征图与所述上采样的第一实例分割特征图的第二方差；根据所述第一方差和所述第二方差计算第一系数矩阵，并根据所述第一系数矩阵和所述均值滤波运算结果计算第二系数矩阵；对所述第一系数矩阵、所述第二系数矩阵和所述目标尺度的目标对象的浅层特征图进行线性组合，得到所述第二实例分割特征图。

进一步的，基于所述第一实例分割特征图和所述第二实例分割特征图确定所述待处理图像中目标对象的蒙版包括：将所述第二实例分割特征图输入至拉普拉斯卷积网络，得到目标对象的边缘特征图；将所述第一实例分割特征图输入至预设数量的第二目标卷积层，得到第三实例分割特征图；将所述目标对象的边缘特征图与所述第三实例分割特征图进行相加运算，并根据相加运算得到的结果确定所述待处理图像中目标对象的蒙版。

进一步的，根据相加运算得到的结果确定所述待处理图像中目标对象的蒙版包括：将所述相加运算得到的结果输入至第三目标卷积层，得到所述待处理图像中目标对象的蒙版。

进一步的，所述第一实例分割特征图为所述Anchor Based实例分割方法对所述待处理图像进行ROI Align运算后得到的特征。

第二方面，本发明实施例还提供了一种图像处理装置，包括：浅层特征提取单元，用于获取待处理图像，并对所述待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，所述目标对象的浅层特征图中包含有目标对象的边缘信息；获取单元，用于获取Anchor Based实例分割方法对所述待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；导向滤波单元，用于基于所述目标对象的浅层特征图对所述第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，所述第二实例分割特征图带有目标对象的边缘信息；确定单元，用于基于所述第一实例分割特征图和所述第二实例分割特征图确定所述待处理图像中目标对象的蒙版。

第三方面，本发明实施例提供了一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面任一项所述的方法的步骤。

第四方面，本发明实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质，所述程序代码使所述处理器执行上述第一方面任一项所述的方法的步骤。

在本发明实施例中，首先，获取待处理图像，并对待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，目标对象的浅层特征图中包含有目标对象的边缘信息；然后，获取Anchor Based实例分割方法对待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；进而基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，第二实例分割特征图带有目标对象的边缘信息；最后，基于第一实例分割特征图和第二实例分割特征图确定待处理图像中目标对象的蒙版。通过上述描述可知，由于第二实例分割特征图中带有目标对象的边缘信息，所以最后基于第一实例分割特征图和第二实例分割特征图确定的待处理图像中目标对象的蒙版的边缘效果更好，提升了实例分割的性能和准确率，另外，本发明的图像处理方法无需使用额外的监督，只需浅层特征提取和导向滤波运算，计算量小，图像处理效率高，缓解了现有的实例分割方法在对图像进行实例分割时，计算量大、分割效果差的技术问题。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种电子设备的示意图；

图2为本发明实施例提供的一种图像处理方法的流程图；

图3为本发明实施例提供的图像处理方法的框架结构图；

图4为本发明实施例提供的对待处理图像中的目标对象进行浅层特征提取的方法流程图；

图5为本发明实施例提供的待处理图像的示意图；

图6为本发明实施例提供的目标对象的浅层特征图的示意图；

图7为本发明实施例提供的基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算的方法流程图；

图8为本发明实施例提供的第一实例分割特征图的示意图；

图9为本发明实施例提供的基于目标尺度的目标对象的浅层特征图对上采样的第一实例分割特征图进行导向滤波运算的方法流程图；

图10为本发明实施例提供的第二实例分割特征图的示意图；

图11为本发明实施例提供的基于第一实例分割特征图和第二实例分割特征图确定待处理图像中目标对象的蒙版的流程图；

图12为本发明实施例提供的与图5的待处理图像对应的目标对象的蒙版示意图；

图13为本发明实施例提供的一种图像处理装置的示意图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

实施例1：

首先，参照图1来描述用于实现本发明实施例的电子设备100，该电子设备可以用于运行本发明各实施例的图像处理方法。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储器104、输入装置106、输出装置108以及摄像机110，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以采用数字信号处理器(DSP，Digital Signal Processing)、现场可编程门阵列(FPGA，Field－Programmable Gate Array)、可编程逻辑阵列(PLA，Programmable Logic Array)和ASIC(Application Specific Integrated Circuit)中的至少一种硬件形式来实现，所述处理器102可以是中央处理单元(CPU，Central ProcessingUnit)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储器104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如，用户)输出各种信息(例如，图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述摄像机110用于进行待处理图像的采集，其中，摄像机所采集的待处理图像经过所述图像处理方法进行处理之后得到待处理图像中目标对象的蒙版，例如，摄像机可以拍摄用户期望的图像(例如照片、视频等)，然后，将该图像经过所述图像处理方法进行处理之后得到待处理图像中目标对象的蒙版，摄像机还可以将所拍摄的图像存储在所述存储器104中以供其它组件使用。

示例性地，用于实现根据本发明实施例的图像处理方法的电子设备可以被实现为诸如智能手机、平板电脑等智能移动终端。

实施例2：

根据本发明实施例，提供了一种图像处理方法的实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

图2是根据本发明实施例的一种图像处理方法的流程图，如图2所示，该方法包括如下步骤：

步骤S102，获取待处理图像，并对待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，目标对象的浅层特征图中包含有目标对象的边缘信息；

在本发明实施例中，上述目标对象可以为任一感兴趣的对象，例如，待处理图像中有多条狗的图像，那么目标对象可以为待处理图像中任意一条狗的图像，再例如，待处理图像中有多个人的图像，那么目标对象可以为待处理图像中任意一个人的图像，本发明实施例对上述目标对象不进行具体限制。

传统的实例分割分支的输入往往是目标区域(例如，目标对象的区域)经过ROIPooling或者ROI Align之后的特征，分辨率小，导致边缘细节分割性能受限，最终得到的目标对象的蒙版准确性差，基于此，发明人考虑到CNN网络的浅层特征具有丰富的边缘等高频信息，其对指导高层特征恢复边缘细节信息具有重要的作用，若将其应用于实例分割可大大提高实例分割的效果，便设计了本发明的方案。在获取到待处理图像后，提取待处理图像中的目标对象的浅层特征图。

步骤S104，获取Anchor Based实例分割方法对待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；

在Anchor Based实例分割方法中，先生成目标对象的目标框，然后逐个进行目标分割。参考图3，其中包含有特征提取网络(backbone网络)、特征金字塔网络(FPN，FeaturePyramid Networks)、ROI Align运算和预设数量的卷积运算(图中未示出)，上述第一实例分割特征图为Anchor Based实例分割方法对待处理图像进行ROI Align运算后得到的特征。

上述Anchor Based实例分割方法具体可以为Mask RCNN实例分割方法，本发明实施例对上述Anchor Based实例分割方法不进行具体限制。

步骤S106，基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，第二实例分割特征图带有目标对象的边缘信息；

在得到目标对象的浅层特征图和第一实例分割特征图后，基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算，使得得到的第二实例分割特征图上边缘细节特征被保留，一些噪声特征被平滑。

步骤S108，基于第一实例分割特征图和第二实例分割特征图确定待处理图像中目标对象的蒙版。

下文中再对该过程进行详细描述，在此不再赘述。

上述内容对本发明的图像处理方法进行了简要介绍，下面对其中涉及到的具体内容进行详细描述。

在本发明的一个可选实施例中，参考图4，步骤S102，对待处理图像中的目标对象进行浅层特征提取的过程包括如下步骤：

步骤S401，对待处理图像进行多尺度缩放处理，得到多尺度的待处理图像；

具体的，在对待处理图像X进行多尺度缩放处理时，按照Anchor Based实例分割方法中特征提取网络(backbone网络)的下采样倍数(如图3所示，下采样倍数分别为4、8、16、32)对待处理图像进行多尺度缩放处理，得到多尺度的待处理图像(如图3所示，得到的为1/4、1/8、1/16和1/32的待处理图像)，从而构成图像金字塔，表示为{X_1/4,X_1/8,X_1/16,X_1/32}。

步骤S402，根据Anchor Based实例分割方法中预测的目标对象的目标框坐标在多尺度的待处理图像中确定目标尺度的待处理图像；

具体的，在Anchor Based实例分割方法中，每次只能预测一个目标框，也就是只能对一个目标对象的目标框坐标进行预测，在得到目标对象的目标框坐标后，就能够根据目标框坐标在多尺度的待处理图像中确定目标尺度的待处理图像。

下面以图5所示的待处理图像为例对本发明的图像处理方法进行介绍，在图5所示的待处理图像中，若其中的大狗作为目标对象。Anchor Based实例分割方法对大狗的目标框坐标进行预测，根据结果可知上述大狗对应的尺度为1/32，那么就在多尺度的待处理图像中将尺度为1/32的待处理图像作为目标尺度的待处理图像；若其中的小狗为目标对象，Anchor Based实例分割方法对小狗的目标框坐标进行预测，根据结果可知上述小狗对应的尺度为1/4，那么就在多尺度的待处理图像中将尺度为1/4的待处理图像作为目标尺度的待处理图像。

步骤S403，将目标尺度的待处理图像输入至浅层特征提取网络，得到目标对象的浅层特征图，其中，浅层特征提取网络包括两个串联的第一目标卷积层。

在本发明实施例中，浅层特征提取网络实际为共享权重的两个串联的1x1的卷积层。如步骤S402中所述，若将1/4尺度的待处理图像输入至浅层特征提取网络，得到的目标对象的浅层特征图表示为DGF_1/4；若将1/32尺度的待处理图像输入至浅层特征提取网络，得到的目标对象的浅层特征图表示为DGF_1/32。上述两个串联的1x1的卷积层的卷积通道分别为(3，64)和(64，Num_Classes)，其中的(3，64)中，3表示第一个1x1的卷积层的输入卷积通道，64表示第一个1x1的卷积层的输出卷积通道，而(64，Num_Classes)中，64表示第二个1x1的卷积层的输入卷积通道，Num_Classes表示第二个1x1的卷积层的输出卷积通道，另外，Num_Classes表示实例的类别，其大小可根据数据集的不同进行调整，例如，COCO数据集的Num_Classes＝80，而Citycapes数据集的Num_Classes＝19。

上述共享权重是指不同目标尺度的待处理图像公用一组参数，如上所述，1/4尺度的待处理图像与1/32尺度的待处理图像公用同一组参数。

与图5中大狗对应的目标对象的浅层特征图如图6所示，从中可以看出，大狗的边缘信息被勾勒出来。

上述内容对浅层特征提取的过程进行了详细介绍，下面对导向滤波运算的过程进行详细描述。

在本发明的一个可选实施例中，参考图7，步骤S106，基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算的过程包括如下步骤：

步骤S701，根据目标框坐标对目标对象的浅层特征图进行ROI Align运算，得到目标尺度的目标对象的浅层特征图；

具体的，若目标对象为图5中所示的大狗，对其浅层特征图(如上步骤S402中的介绍，其为1/32尺度的浅层特征图DGF_1/32)进行ROI Align运算，得到的目标尺度的目标对象的浅层特征图的形状为(256，28，28)，其中的256表示通道数，28*28表示浅层特征图的尺寸，此时，目标尺度的目标对象的浅层特征图表示为I＝DGFFt_1/32；若目标对象为图5中所示的小狗，对其浅层特征图(如上步骤S402中的介绍，其为1/4尺度的浅层特征图DGF_1/4)进行ROI Align运算，得到的目标尺度的目标对象的浅层特征图的形状为(256，28，28)，其中的256表示通道数，28*28表示浅层特征图的尺寸，此时，目标尺度的目标对象的浅层特征图表示为I＝DGFFt_1/4。

步骤S702，对第一实例分割特征图进行上采样，得到上采样的第一实例分割特征图；

如上所述，第一实例分割特征图为Anchor Based实例分割方法对待处理图像进行ROI Align运算后得到的特征，与图5中大狗对应的第一实例分割特征图为图8(从中可以看出，除了大狗这一目标对象之外有噪声特征，且大狗的边缘信息不够图突出)，表示为Ft_1/32，形状为(256，14，14)，其中的256表示通道数，14*14表示第一实例分割特征图的尺寸；对应的与图5中小狗对应的第一实例分割特征图表示为Ft_1/4，形状也为(256，14，14)。

对上述第一实例分割特征图进行上采样，上采样后形状变为(256，28，28)，且对应的上采样的第一实例分割特征图分别为I_p＝UFt_1/32、I_p＝UFt_1/4。

步骤S703，基于目标尺度的目标对象的浅层特征图对上采样的第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图。

参考图9，具体包括如下步骤：

步骤S901，对目标尺度的目标对象的浅层特征图和上采样的第一实例分割特征图分别进行均值滤波运算，得到均值滤波运算结果；

具体的，对目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)进行均值滤波运算M_I＝F_m(I)，并对上采样的第一实例分割特征图I_p(如UFt_1/32)进行均值滤波运算M_P＝F_m(I_p)，其中，F_m表示均值滤波运算。

步骤S902，计算目标尺度的目标对象的浅层特征图与目标尺度的目标对象的浅层特征图的第一相关系数矩阵，并计算目标尺度的目标对象的浅层特征图与上采样的第一实例分割特征图的第二相关系数矩阵；

具体的，计算目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)与目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)的第一相关系数矩阵C_I＝F_m(I*I)，其中，C_I表示第一相关系数矩阵，并计算目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)与上采样的第一实例分割特征图I_p(如UFt_1/32)的第二相关系数矩阵C_P＝F_m(I*I_P)，其中，C_P表示第二相关系数矩阵。

步骤S903，根据均值滤波运算结果和第一相关系数矩阵计算目标尺度的目标对象的浅层特征图与目标尺度的目标对象的浅层特征图的第一方差，并根据均值滤波运算结果和第二相关系数矩阵计算目标尺度的目标对象的浅层特征图与上采样的第一实例分割特征图的第二方差；

具体的，根据均值滤波运算结果和第一相关系数矩阵计算目标尺度的目标对象的浅层特征图与目标尺度的目标对象的浅层特征图的第一方差V_I＝C_I-M_I*M_I，其中，V_I表示第一方差，C_I表示第一相关系数矩阵，M_I表示对目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)进行均值滤波运算，得到的结果，并根据均值滤波运算结果和第二相关系数矩阵计算目标尺度的目标对象的浅层特征图与上采样的第一实例分割特征图的第二方差V_P＝C_p-M_I*M_P，其中，V_P表示第二方差，C_p表示第二相关系数矩阵，M_I表示对目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)进行均值滤波运算，得到的结果，M_P表示对上采样的第一实例分割特征图I_p(如UFt_1/32)进行均值滤波运算，得到的结果。

步骤S904，根据第一方差和第二方差计算第一系数矩阵，并根据第一系数矩阵和均值滤波运算结果计算第二系数矩阵；

具体的，根据第一方差和第二方差计算第一系数矩阵M_a＝V_P/(V_I+ε)，其中，M_a表示第一系数矩阵，V_P表示第二方差，V_I表示第一方差，并根据第一系数矩阵和均值滤波运算结果计算第二系数矩阵M_b＝M_P-M_a*M_I，其中，M_b表示第二系数矩阵，M_P表示对上采样的第一实例分割特征图I_p(如UFt_1/32)进行均值滤波运算，得到的结果，M_a表示第一系数矩阵，M_I表示对目标尺度的目标对象的浅层特征图I(如DGFFt_1/32)进行均值滤波运算，得到的结果。

步骤S905，对第一系数矩阵、第二系数矩阵和目标尺度的目标对象的浅层特征图进行线性组合，得到第二实例分割特征图。

具体的，线性组合的方式为Q＝M_a*I+M_b，其中，Q表示第二实例分割特征图，M_a表示第一系数矩阵，I表示目标尺度的目标对象的浅层特征图(如DGFFt_1/32)，M_b表示第二系数矩阵，*表示矩阵中对应元素的乘积运算，上述大狗对应的第二实例分割特征图表示为QFt_1/32、上述小狗对应的第二实例分割特征图表示为QFt_1/4。

基于图6的目标对象的浅层特征图对图7的第一实例分割特征图进行导向滤波运算后，得到的第二实例分割特征图如图10所示，从中可以看出，大狗的边缘细节特征被保留，噪声特征被平滑抹去。

上述内容对本发明的导向滤波运算过程进行了详细介绍，下面对确定待处理图像中目标对象的蒙版的过程进行详细描述。

在本发明的一个可选实施例中，参考图11，步骤S108，基于第一实例分割特征图和第二实例分割特征图确定待处理图像中目标对象的蒙版的过程包括如下步骤：

步骤S111，将第二实例分割特征图输入至拉普拉斯卷积网络，得到目标对象的边缘特征图；

上述拉普拉斯卷积网络的卷积核参数为K_3x3＝[[-1,-1,-1],[-1,-8,-8],[-1,-1,-1]]，上述第二实例分割特征图QFt_1/32对应的目标对象的边缘特征图表示为LFt_1/32，上述第二实例分割特征图QFt_1/4对应的目标对象的边缘特征图表示为LFt_1/4。拉普拉斯卷积网络能够进一步加强边缘信息的显著性。

步骤S112，将第一实例分割特征图输入至预设数量的第二目标卷积层，得到第三实例分割特征图；

上述预设数量的第二目标卷积层可以为4个3x3的卷积层。

步骤S113，将目标对象的边缘特征图与第三实例分割特征图进行相加运算；

步骤S114，将相加运算得到的结果输入至第三目标卷积层，得到待处理图像中目标对象的蒙版。

具体的，上述第三目标卷积层可以为一个1x1的卷积层。如图12所示，即为与图5对应的大狗的蒙版。

下面结合图3对本发明的图像处理方法进行整体介绍。参考图3，获取第一实例分割特征图(第一实例分割特征图为Anchor Based实例分割方法对待处理图像进行ROIAlign运算后得到的特征)，并获取待处理图像，然后对待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，进而，根据目标对象的目标框坐标对目标对象的浅层特征图进行ROI Align运算，得到目标尺度的目标对象的浅层特征图，进而再对第一实例分割特征图进行上采样，得到上采样的第一实例分割特征图，再基于目标尺度的目标对象的浅层特征图对上采样的第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，再将第二实例分割特征图输入至拉普拉斯卷积网络，得到目标对象的边缘特征图，并将第一实例分割特征图输入至4个3x3的卷积层，得到第三实例分割特征图，进而将目标对象的边缘特征图与第三实例分割特征图进行相加运算，将相加运算得到的结果输入至1个1x1的卷积层，得到待处理图像中目标对象的蒙版。

在实例分割任务中，本发明在同等Backbone的设置下，相对已知的公开算法具有显著的提升。相比于其他实例分割模型，本发明的浅层特征提取网络、导向滤波运算以及拉普拉斯网络不需要额外监督，能够即插即用，可以拓展到其他模块如特征金字塔FPN上。在COCO数据集上做了对比实验，本发明的方法相比于之前最好的方法在mAP上有提升，比有边缘监督的BMask RCNN模型也有提升，比Mask RCC提升1.5％，在相同速度下，比BMask RCNN提升0.1％，具体结果如下：

从上述实验结果中可以看出，本发明在实例分割任务上，同等的设置下可以达到当前最好的分割效果。

本发明的图像处理方法具有以下特点：

1)充分利用了浅层特征边缘丰富的特性，设计了可学习的导向滤波模块，对ROIAlign后的特征进行导向滤波，消除了第一实例分割特征图上非目标对象区域的噪声；

2)采用拉普拉斯卷积网络对边缘进行加强，在不引入边缘监督Loss的情况下，达到边缘特征显著性增强的效果；

3)将增强后的边缘特征与原FCN分支的特征进行融合以强化边缘，最终达到实例分割性能的提升；

4)浅层特征提取过程中采用图像金字塔的生成方式，且浅层特征提取网络的权重共享，因此，不会因分辨率过大而引入大量的计算量。

实施例3：

本发明实施例还提供了一种图像处理装置，该图像处理装置主要用于执行本发明实施例上述内容所提供的图像处理方法，以下对本发明实施例提供的图像处理装置做具体介绍。

图13是根据本发明实施例的一种图像处理装置的示意图，如图13所示，该图像处理装置主要包括：浅层特征提取单元10，获取单元20、导向滤波单元30和确定单元40，其中：

浅层特征提取单元，用于获取待处理图像，并对待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，目标对象的浅层特征图中包含有目标对象的边缘信息；

获取单元，用于获取Anchor Based实例分割方法对待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；

导向滤波单元，用于基于目标对象的浅层特征图对第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，第二实例分割特征图带有目标对象的边缘信息；

确定单元，用于基于第一实例分割特征图和第二实例分割特征图确定待处理图像中目标对象的蒙版。

可选地，浅层特征提取单元还用于：对待处理图像进行多尺度缩放处理，得到多尺度的待处理图像；根据Anchor Based实例分割方法中预测的目标对象的目标框坐标在多尺度的待处理图像中确定目标尺度的待处理图像；将目标尺度的待处理图像输入至浅层特征提取网络，得到目标对象的浅层特征图，其中，浅层特征提取网络包括两个串联的第一目标卷积层。

可选地，导向滤波单元还用于：根据目标框坐标对目标对象的浅层特征图进行ROIAlign运算，得到目标尺度的目标对象的浅层特征图；对第一实例分割特征图进行上采样，得到上采样的第一实例分割特征图；基于目标尺度的目标对象的浅层特征图对上采样的第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图。

可选地，导向滤波单元还用于：对目标尺度的目标对象的浅层特征图和上采样的第一实例分割特征图分别进行均值滤波运算，得到均值滤波运算结果；计算目标尺度的目标对象的浅层特征图与目标尺度的目标对象的浅层特征图的第一相关系数矩阵，并计算目标尺度的目标对象的浅层特征图与上采样的第一实例分割特征图的第二相关系数矩阵；基于均值滤波运算结果、第一相关系数矩阵和第二相关系数矩阵确定第二实例分割特征图。

可选地，导向滤波单元还用于：根据均值滤波运算结果和第一相关系数矩阵计算目标尺度的目标对象的浅层特征图与目标尺度的目标对象的浅层特征图的第一方差，并根据均值滤波运算结果和第二相关系数矩阵计算目标尺度的目标对象的浅层特征图与上采样的第一实例分割特征图的第二方差；根据第一方差和第二方差计算第一系数矩阵，并根据第一系数矩阵和均值滤波运算结果计算第二系数矩阵；对第一系数矩阵、第二系数矩阵和目标尺度的目标对象的浅层特征图进行线性组合，得到第二实例分割特征图。

可选地，确定单元还用于：将第二实例分割特征图输入至拉普拉斯卷积网络，得到目标对象的边缘特征图；将第一实例分割特征图输入至预设数量的第二目标卷积层，得到第三实例分割特征图；将目标对象的边缘特征图与第三实例分割特征图进行相加运算，并根据相加运算得到的结果确定待处理图像中目标对象的蒙版。

可选地，确定单元还用于：将相加运算得到的结果输入至第三目标卷积层，得到待处理图像中目标对象的蒙版。

可选地，第一实例分割特征图为Anchor Based实例分割方法对待处理图像进行ROI Align运算后得到的特征。

本发明实施例所提供的图像处理装置，其实现原理及产生的技术效果和前述实施例2中的方法实施例相同，为简要描述，装置实施例部分未提及之处，可参考前述方法实施例中相应内容。

在另一个实施例中，还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质，所述程序代码使所述处理器执行上述权实施例2中任意实施例所述的方法的步骤。

另外，在本发明实施例的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种图像处理方法，其特征在于，包括：

获取待处理图像，并对所述待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，所述目标对象的浅层特征图中包含有目标对象的边缘信息；

获取Anchor Based实例分割方法对所述待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；

基于所述目标对象的浅层特征图对所述第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，所述第二实例分割特征图带有目标对象的边缘信息；

基于所述第一实例分割特征图和所述第二实例分割特征图确定所述待处理图像中目标对象的蒙版。

2.根据权利要求1所述的方法，其特征在于，对所述待处理图像中的目标对象进行浅层特征提取包括：

对所述待处理图像进行多尺度缩放处理，得到多尺度的待处理图像；

根据所述Anchor Based实例分割方法中预测的目标对象的目标框坐标在所述多尺度的待处理图像中确定目标尺度的待处理图像；

将所述目标尺度的待处理图像输入至浅层特征提取网络，得到所述目标对象的浅层特征图，其中，所述浅层特征提取网络包括两个串联的第一目标卷积层。

3.根据权利要求2所述的方法，其特征在于，基于所述目标对象的浅层特征图对所述第一实例分割特征图进行导向滤波运算包括：

根据所述目标框坐标对所述目标对象的浅层特征图进行ROI Align运算，得到目标尺度的目标对象的浅层特征图；

对所述第一实例分割特征图进行上采样，得到上采样的第一实例分割特征图；

基于所述目标尺度的目标对象的浅层特征图对所述上采样的第一实例分割特征图进行导向滤波运算，得到所述第二实例分割特征图。

4.根据权利要求3所述的方法，其特征在于，基于所述目标尺度的目标对象的浅层特征图对所述上采样的第一实例分割特征图进行导向滤波运算包括：

对所述目标尺度的目标对象的浅层特征图和所述上采样的第一实例分割特征图分别进行均值滤波运算，得到均值滤波运算结果；

计算所述目标尺度的目标对象的浅层特征图与所述目标尺度的目标对象的浅层特征图的第一相关系数矩阵，并计算所述目标尺度的目标对象的浅层特征图与所述上采样的第一实例分割特征图的第二相关系数矩阵；

基于所述均值滤波运算结果、所述第一相关系数矩阵和所述第二相关系数矩阵确定所述第二实例分割特征图。

5.根据权利要求4所述的方法，其特征在于，基于所述均值滤波运算结果、所述第一相关系数矩阵和所述第二相关系数矩阵确定所述第二实例分割特征图包括：

根据所述均值滤波运算结果和所述第一相关系数矩阵计算所述目标尺度的目标对象的浅层特征图与所述目标尺度的目标对象的浅层特征图的第一方差，并根据所述均值滤波运算结果和所述第二相关系数矩阵计算所述目标尺度的目标对象的浅层特征图与所述上采样的第一实例分割特征图的第二方差；

根据所述第一方差和所述第二方差计算第一系数矩阵，并根据所述第一系数矩阵和所述均值滤波运算结果计算第二系数矩阵；

对所述第一系数矩阵、所述第二系数矩阵和所述目标尺度的目标对象的浅层特征图进行线性组合，得到所述第二实例分割特征图。

6.根据权利要求1所述的方法，其特征在于，基于所述第一实例分割特征图和所述第二实例分割特征图确定所述待处理图像中目标对象的蒙版包括：

将所述第二实例分割特征图输入至拉普拉斯卷积网络，得到目标对象的边缘特征图；

将所述第一实例分割特征图输入至预设数量的第二目标卷积层，得到第三实例分割特征图；

将所述目标对象的边缘特征图与所述第三实例分割特征图进行相加运算，并根据相加运算得到的结果确定所述待处理图像中目标对象的蒙版。

7.根据权利要求6所述的方法，其特征在于，根据相加运算得到的结果确定所述待处理图像中目标对象的蒙版包括：

将所述相加运算得到的结果输入至第三目标卷积层，得到所述待处理图像中目标对象的蒙版。

8.根据权利要求1所述的方法，其特征在于，所述第一实例分割特征图为所述AnchorBased实例分割方法对所述待处理图像进行ROI Align运算后得到的特征。

9.一种图像处理装置，其特征在于，包括：

浅层特征提取单元，用于获取待处理图像，并对所述待处理图像中的目标对象进行浅层特征提取，得到目标对象的浅层特征图，其中，所述目标对象的浅层特征图中包含有目标对象的边缘信息；

获取单元，用于获取Anchor Based实例分割方法对所述待处理图像中的目标对象进行实例分割时，得到的第一实例分割特征图；

导向滤波单元，用于基于所述目标对象的浅层特征图对所述第一实例分割特征图进行导向滤波运算，得到第二实例分割特征图，其中，所述第二实例分割特征图带有目标对象的边缘信息；

确定单元，用于基于所述第一实例分割特征图和所述第二实例分割特征图确定所述待处理图像中目标对象的蒙版。

10.一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述权利要求1至8中任一项所述的方法的步骤。

11.一种具有处理器可执行的非易失的程序代码的计算机可读介质，其特征在于，所述程序代码使所述处理器执行上述权利要求1至8中任一项所述的方法的步骤。