CN111292335A

CN111292335A - 一种前景掩模特征图的确定方法、装置及电子设备

Info

Publication number: CN111292335A
Application number: CN201910061824.2A
Authority: CN
Inventors: 李彦玮; 陈新泽; 黄冠
Original assignee: Beijing Horizon Robotics Technology Research and Development Co Ltd
Current assignee: Beijing Horizon Robotics Technology Research and Development Co Ltd
Priority date: 2018-12-10
Filing date: 2019-01-23
Publication date: 2020-06-16
Anticipated expiration: 2039-01-23
Also published as: CN111292334B; CN111292335B; CN111292334A

Abstract

本申请公开了一种前景掩模特征图的确定方法，包括：提取输入图像的多尺度特征图；在所述多尺度特征图中提取区域候选框；根据区域候选框在所述多尺度特征图中提取区域候选特征图；将区域候选特征图中每个前景掩膜的像素的像素值分配到多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的1/N；N为自然数；确定所述每个点在多尺度特征图的对应区域的像素点的像素值；基于所述像素值，确定所述前景掩模特征图。本申请实施例提供的方法可以得到信息量丰富、精度高的前景掩模。

Description

一种前景掩模特征图的确定方法、装置及电子设备

技术领域

本申请涉及一种前景掩模特征图的确定方法、装置及电子设备，属于图像处理领域。

背景技术

目前，计算机视觉是深度学习领域最热门的研究领域之一，其主要是通过将图像分割来识别特定的事物。

图像分割中的语义分割是一种典型的计算机视觉问题，是指将一些原始数据(例如，平面图像)作为输入并将它们转换为具有突出显示的感兴趣区域的掩模。现有技术中掩模为二维矩阵数组或者为多值图像。但是这种掩模所表示的信息精度不高，信息量也较少。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种前景掩模特征图的确定方法、装置及电子设备，其可以得到信息量丰富、精度高的前景掩模。

根据本申请的一个方面，提供了一种前景掩模特征图的确定方法，包括：

提取输入图像的多尺度特征图；

在所述多尺度特征图中提取区域候选框；

根据区域候选框在所述多尺度特征图中提取区域候选特征图；

将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的 1/N；N为自然数；

确定所述每个点在多尺度特征图的对应区域的像素点的像素值；

基于所述像素值，确定所述前景掩模特征图。

根据本申请的另一个方面，提供了一种前景掩模特征图的确定装置，包括：

第一提取模块，用于提取输入图像的多尺度特征图，并在所述多尺度特征图中提取区域候选框；

第二提取模块，用于根据所述区域候选框在所述多尺度特征图中提取区域候选特征图；

分配模块，用于将所述区域候选特征图中每个前景掩膜的像素的像素值映射到所述多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的1/N；N为自然数；

第一确定模块，用于确定每个点在所述多尺度特征图的对应区域的像素点的像素值；

第二确定模块，用于根据所述像素值，确定所述前景掩模特征图。

根据本申请的再一个方面，提供了一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述可执行指令在被所述处理器运行时使得所述处理器执行所述的前景掩模特征图的确定方法。

根据本申请的又一个方面，提供了一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行所述的前景掩模特征图的确定方法。

与现有技术相比，采用本申请实施例的前景掩模特征图的确定方法、装置和电子设备，通过提取输入图像的多尺度特征图，在所述多尺度特征图中提取区域候选框，根据区域候选框在所述多尺度特征图中提取区域候选特征图；然后将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点，确定所述每个点在多尺度特征图的对应区域的像素点的像素值；最后基于所述像素值，确定所述前景掩模特征图，这样得到的前景掩模特征图的前景掩模信息量大，精度高，可以广泛应用于语义分割中。

附图说明

通过结合附图对本申请实施例进行更详细的描述，本申请的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本申请实施例的进一步理解，并且构成说明书的一部分，与本申请实施例一起用于解释本申请，并不构成对本申请的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1图示了根据本申请实施例的前景掩模特征图的确定方法流程示意图。

图2图示了根据本申请实施例的将区域候选特征图中的前景掩膜的像素的像素值分配示意图。

图3图示了根据本申请实施例的另一种前景掩模特征图的确定方法流程示意图。

图4图示了根据本申请实施例的前景掩模特征图的确定装置结构示意图。

图5示出了根据本申请实施例的另一种前景掩模特征图的确定装置结构示意图。

图6图示了根据本申请实施例的电子设备的框图。

具体实施方式

下面，将参考附图详细地描述根据本申请的示例实施例。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是本申请的全部实施例，应理解，本申请不受这里描述的示例实施例的限制。

申请概述

如上所述，图像分割中的语义分割是一种典型的计算机视觉问题。目前，图像分割中的语义分割分为标准语义分割和实例感知语义分割，标准语义分割也称为全像素语义分割，它是将每个像素分类为属于对象类的过程；实例感知语义分割是标准语义分割或全像素语义分割的子类型，它将每个像素分类为属于对象类以及该类的实体ID。但无论是哪种语义分割，均要得到感兴趣区域的掩模。图像掩模是指用选定的图像、图形或物体, 对待处理的图像进行遮挡以控制图像处理的区域或处理过程，其中用于覆盖的特定图像或物体称为掩模。

但是，现有技术得到的掩模所表示的信息精度不高，信息量也较少。

针对上述技术问题，本申请的构思是提出一种前景掩模特征图的确定方法、装置和电子设备，通过提取输入图像的多尺度特征图，在多尺度特征图中提取区域候选特征图，然后将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点，并确定所述每个点在多尺度特征图的对应区域的像素点的像素值，最后基于所述像素值，确定前景掩模特征图，这样得到的前景掩模特征图的前景掩模信息量大，精度高，可以广泛应用于语义分割和Loss计算中。

示例性方法

图1是本申请一示例性实施例提供的前景掩模特征图的确定方法流程示意图。本实施例可应用在电子设备上，如图1所示，包括如下步骤：

步骤S101，提取输入图像的多尺度特征图。

本申请中，图像的尺度并非指图像的大小，而是指图像的模糊程度，例如，人近距离看一个物体和远距离看一个物体模糊程度是不一样的，从近距离到远距离图像越来越模糊的过程，也是图像的尺度越来越大的过程。

用计算机视觉识别特定物体时，计算机并不预先知道图像中物体的尺度，如果采用固定尺度识别特定物体，识别精度较低，因此本申请实施例提取原图像的多尺度特征图，这样可使计算机视觉具有较高的识别精度。

步骤S102，在多尺度特征图中提取区域候选框。本申请在提取了输入图像的多尺度特征图之后，可以采用区域候选网络(Region Proposal Net，简称RPN)网络在多尺度特征图中提取区域候选框，也可以采用基于区域候选提取的其它网络，本申请实施例对区域候选框的提取网络不作限制，只要能在多尺度特征图中提取出区域候选框即可。

这里，输入图像中的前景图像包括大小不同的多个物体，因此本申请实施例在多尺度特征图中提取多个不同尺度的区域候选框。

步骤S103，根据区域候选框在上述多尺度特征图中提取区域候选特征图。本申请中，可以采用RoIAlign或者RoIPooling根据区域候选框的坐标值在上述多尺度特征图中提取区域候选特征图。RoIPooling和RoIAlign属于本领域技术人员的公知常识，因此本申请实施例在此不再赘述。

步骤S104，将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的1/N；N为自然数。

具体的，前景掩膜的像素映射(RoIUpsample)是将前景分支中所得到的每个物体的精细的掩膜(28x28像素大小)精确地恢复到原图像(WxH 大小)中该物体的区域候选框(RoIs)对应的位置，为了方便理解，如图 2所示，这里以2x2像素大小的掩膜的像素映射作为示例。图2中的N取 4，即每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的4个点，每个点的值为原前景掩膜对应像素值的1/4。

需要说明的是，实际应用该前景特征图的场景中，由于前景特征图需要进行卷积操作，因此可以将候选框的大小调整到指定的尺寸，例如 28*28，然后将指定尺寸的候选框映射回多尺度特征图中时，再次将指定尺寸的候选框的大小调整到原候选框尺寸。

最后，步骤S105，确定所述每个点在多尺度特征图的对应区域的像素点的像素值，基于上述像素值，确定前景掩模特征图。

这里，用映射后的区域候选框中对应像素的每个点计算出该点在多尺度特征图的对应区域的像素点的像素值，从而确定出前景掩模特征图。

本申请通过提取输入图像的多尺度特征图，在多尺度特征图中提取区域候选特征图，然后将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点，并确定所述每个点在多尺度特征图的对应区域的像素点的像素值，最后基于所述像素值，确定前景掩模特征图，这样得到的前景掩模特征图的前景掩模信息量大，精度高，可以广泛应用于语义分割和Loss计算中。

如图3所示，在上述图1所示实施例的基础上，步骤105可包括如下步骤：

步骤S1051、按照预设分配规则将每个点的值分配给所述多尺度特征图中的与所述点相邻的M个像素点；

步骤S1052、基于每个点对应的相邻M个像素点所分配到的像素值，确定所述前景掩模特征图。

通过上述步骤，可以将每个点的值有规律性的分配给多尺度特征图中的与所述点相邻的M个像素点，然后根据与该点相邻的M个像素点的每一个像素点得到的像素值，确定出前景掩模特征图，使得该前景掩模特征图中的掩模信息更加精确。

并且，在步骤1051中，按照预设分配规则将每个点的值分配给所述多尺度特征图中的与所述点相邻的M个像素点，包括：基于每个点与相邻 M个像素点中每个像素点的距离分别给所述相邻M个像素点中每个像素点分配像素值。其中预设分配规则表示为，与每个点距离最近的像素点得到的像素值最大。

通过上述预设分配规则将每个点的值分配给多尺度特征图中的与所述点相邻的M个像素点，使得每个与所述点相邻的像素点得到的像素值更加合理，贴合实际中图像像素的显示。

实际应用中，基于每个点与相邻M个像素点中每个像素点的距离，根据逆向双线性插值方法将每个点的值分配给相邻M个像素点。

具体的，如图2所示，设R(P_j,k)为其中一个点P_g在多尺度特征图中分配给区域候选框对应区域上坐标为(j,k)的像素P_j,k的像素值；

其中，value_x和value_y为归一化权重，x_p和y_p为P_g点距离P_1,1在x轴和 y轴方向的距离，R(p_g)为P_g点的值。根据每个点计算对应像素值的计算过程满足正向双线性插值运算，即从多尺度特征图中的前景特征图经过正向的双线性插值可以恢复出对应点，因此根据逆向双线性插值方法将每个点的值分配给相邻4个像素点，也就是说，value_x和value_y满足逆向双线性插值算法，也可以将value_x和value_y称为逆向双线性插值系数，该逆向双线性插值系数可以根据上述的预设分配规则来确定。

并且，在步骤1052中，基于每个点对应的相邻M个像素点所分配到的像素值，确定所述前景掩模特征图，包括：将每个点对应的相邻M个像素点中每个像素点得到的所有像素值相加，得到前景掩模特征图。

通过将每个点对应的相邻M个像素点中每个像素点得到的所有像素值相加，可使得该像素点的显示更加明确，便于后续应用。

进一步地，本申请实施例中N个点平均布置在多尺度特征图中的区域候选框的每个像素中。

具体地，如图2所示，本发明以N等于4为例进行说明，可以利用4 条分割线，将多尺度特征图中的区域候选框的每个像素平均划分为9个子区域，将所述4条分割线的4个交叉点位置确定为4个点的位置。

本申请实施例得到的前景掩模特征图的前景掩模信息量大，精度高，可以广泛应用于语义分割中，例如，自动驾驶，面部分割，地质检测等场景，也可以应用于Loss计算过程，从而提高语义分割精度、Loss计算精度。

示例性装置

图4示出了根据本申请实施例的前景掩模特征图的确定装置的结构示意图。

如图4所示，根据本申请实施例的前景掩模特征图的确定装置40包括：第一提取模块41，用于提取输入图像的多尺度特征图，并在所述多尺度特征图中提取区域候选框；第二提取模块42，用于根据区域候选框在所述多尺度特征图中提取区域候选特征图；分配模块43，用于将所述区域候选特征图中每个前景掩膜的像素的像素值分配到所述多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的1/N；N为自然数；第一确定模块44，用于确定每个点在所述多尺度特征图的对应区域的像素点的像素值；以及，第二确定模块45，用于根据所述像素值，确定所述前景掩模特征图。

通过提取输入图像的多尺度特征图，在多尺度特征图中提取区域候选特征图，然后将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点，并确定所述每个点在多尺度特征图的对应区域的像素点的像素值，最后基于所述像素值，确定前景掩模特征图，这样得到的前景掩模特征图的前景掩模信息量大，精度高，可以广泛应用于语义分割和Loss计算中。

如图5所示，在上述前景掩模特征图的确定装置40中，所述第一确定模块44包括分配单元441，该分配单元441用于按照预设分配规则将每个点的值分配给所述多尺度特征图中的与所述点相邻的M个像素点；

相应的，第二确定模块45，用于根据所述每个点对应的相邻M个像素点所分配到的像素值，确定所述前景掩模特征图。

通过分配单元和第二确定模块，可以将每个点的值有规律性的分配给多尺度特征图中的与所述点相邻的M个像素点，然后根据与该点相邻的M 个像素点的每一个像素点得到的像素值，确定出前景掩模特征图，使得该前景掩模特征图中的掩模信息更加精确。

在一个示例中，分配单元441基于每个点与相邻M个像素点中每个像素点的距离分别给所述相邻M个像素点中每个像素点分配像素值。

在一个示例中，分配单元441基于每个点与相邻M个像素点中每个像素点的距离，根据逆向双线性插值方法将每个点的值分配给相邻M个像素点。

在一个示例中，在上述前景掩模特征图的确定装置40中，第二确定模块45，用于将每个点对应的相邻M个像素点中每个像素点得到的所有像素值相加，得到前景掩模特征图。

这里，本领域技术人员可以理解，上述前景掩模特征图的确定装置40 中的各个模块和单元的具体功能和操作已经在上面参考图1至3描述的前景掩模特征图的确定方法中详细介绍，因此，示例性装置中省略部分重复描述。

如上所述，根据本申请实施例的前景掩模特征图的确定装置40可以实现在各种终端设备中。在一个示例中，根据本申请实施例的前景掩模特征图的确定装置40可以一个软件模块和/或硬件模块而集成到终端设备中。例如，该装置40可以是该终端设备的操作系统中的一个软件模块，或者也可以是针对于该终端设备所开发的一个应用程序；当然，该装置40 同样可以是该终端设备的众多硬件模块之一。

替换地，在另一个示例中，该前景掩模特征图的确定装置40与终端设备也可以是分立的设备，并且该装置40可以通过有线和/或无线网络连接到终端设备，并且按照约定的数据格式来传输交互信息。

示例性电子设备

下面，参考图6来描述根据本申请实施例的电子设备。图6图示了根据本申请实施例的电子设备的框图。

如图6所示，电子设备10包括一个或多个处理器11和存储器12。

处理器11可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备10中的其他组件以执行期望的功能。

存储器12可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM) 和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器11可以运行所述程序指令，以实现上文所述的本申请的各个实施例的前景掩模特征图的确定方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入图像、多尺度特征图、区域候选特征图、前景掩模特征图等各种内容。

在一个示例中，电子设备10还可以包括：输入装置13和输出装置14，这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

例如，该输入装置13可以包括摄像装置，用于采集输入图像。此外，该输入设备13还可以包括例如键盘、鼠标等等。

该输出装置14可以向外部输出各种信息，包括确定出的前景掩模特征图。该输出设备14可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图6中仅示出了该电子设备10中与本申请有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备10还可以包括任何其他适当的组件。

示例性计算机程序产品和计算机可读存储介质

除了上述方法和设备以外，本申请的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的声源定位方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本申请的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本申请各种实施例的前景掩模特征图的确定方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种前景掩模特征图的确定方法，包括：

提取输入图像的多尺度特征图；

在所述多尺度特征图中提取区域候选框；

将区域候选特征图中每个前景掩膜的像素的像素值映射到多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的1/N；N为自然数；

基于所述像素值，确定所述前景掩模特征图。

2.根据权利要求1所述的方法，其中，所述确定所述每个点在多尺度特征图的对应区域的像素点的像素值包括：

按照预设分配规则将每个点的值分配给所述多尺度特征图中的与所述点相邻的M个像素点；

相应的，基于所述像素值，确定所述前景掩模特征图包括：

基于所述每个点对应的相邻M个像素点所分配到的像素值，确定所述前景掩模特征图。

3.根据权利要求2所述的方法，其中，按照预设分配规则将每个点的值分配给所述多尺度特征图中的与所述点相邻的M个像素点，包括：

基于每个点与相邻M个像素点中每个像素点的距离分别给所述相邻M个像素点中每个像素点分配像素值。

4.根据权利要求3所述的方法，其中，基于每个点与相邻M个像素点中每个像素点的距离分别给所述相邻M个像素点中每个像素点分配像素值，包括：

基于每个点与相邻M个像素点中每个像素点的距离，根据逆向双线性插值方法将每个点的值分配给相邻M个像素点。

5.根据权利要求1所述的方法，其中，所述N个点平均布置在多尺度特征图中的区域候选框的每个像素中。

6.一种前景掩模特征图的确定装置，包括：

映射模块，用于将所述区域候选特征图中每个前景掩膜的像素的像素值映射到所述多尺度特征图中的区域候选框中对应像素的N个点；每个点的值为所述像素值的1/N；N为自然数；

7.根据权利要求6所述的装置，其中，所述第一确定模块包括分配单元，所述分配单元用于按照预设分配规则将每个点的值分配给所述多尺度特征图中的与所述点相邻的M个像素点；

相应的，所述第二确定模块，用于根据所述每个点对应的相邻M个像素点所分配到的像素值，确定所述前景掩模特征图。

8.根据权利要求7所述的装置，其中，所述分配单元用于根据每个点与相邻M个像素点中每个像素点的距离分别给所述相邻M个像素点中每个像素点分配像素值。

9.一种电子设备，包括：

处理器；

用于存储所述处理器可执行指令的存储器；

所述可执行指令在被所述处理器运行时使得所述处理器执行如权利要求1～5中任一项所述的前景掩模特征图的确定方法。

10.一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1～5中任一项所述的前景掩模特征图的确定方法。