WO2021143207A1

WO2021143207A1 - 图像处理方法、装置、计算处理设备及介质

Info

Publication number: WO2021143207A1
Application number: PCT/CN2020/118866
Authority: WO
Inventors: 李彦玮; 宋林; 黎泽明
Original assignee: 北京迈格威科技有限公司
Priority date: 2020-01-16
Filing date: 2020-09-29
Publication date: 2021-07-22
Also published as: CN111275054B; CN111275054A

Abstract

一种图像处理方法、装置、计算处理设备及介质，包括：获取待处理图像（S101）；将待处理图像输入到图像处理模型中，基于待处理模型的输出得到待处理图像的图像处理结果（S102）；其中，图像处理模型包括多个层级的特征处理子网络，每个层级包括不同深度的特征处理节点，对于除最后一个层级的之外的各层级的每个特征处理节点，基于该特征处理节点中包括的门控网络确定特征处理节点的输出特征图，以形成动态的图像处理模型，并基于图像处理模型中最后一个层级的各特征处理节点所输出的输出特征图，得到待处理图像的处理结果。上述方法可以自适应地选择已知网络结构，适用于不同尺度分布的图像，对实际运行计算量进行控制，降低了计算量。

Description

图像处理方法、装置、计算处理设备及介质

本申请要求在2020年1月16日提交中国专利局、申请号为202010058004.0、发明名称为“图像处理方法、装置、电子设备及存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理技术领域，具体而言，本申请涉及一种图像处理方法、装置、计算处理设备及介质。

背景技术

现有针对图像处理的网络结构均为使用预先定义好的静态网络对输入图片进行预测，主要分为手工设计的网络和网络结构搜索两种。其中，手工设计的网络一般使用多个层次特征图融合的方法来丰富特征图的语的细节信，以建立特征图之间的上下文关系。而网络结构搜索主要使用基于强化学习或梯度更新的方法,在一个数据集去拟合一个固定的网络结构。

但是，在实际应用中，待处理图像的尺寸分布往往有很大的差别，例如在一张图片中既有占图像很小比例的前景物体，也有占图像大部分比例的背景区域，若使用现有技术中的图像处理的网络结构，由于其均为固定的结构，对于这种尺寸分布相差很大的图像将无法准确地建立特征图之间的上下文关系，进而无法得到准确地处理结果。

发明内容

本申请的目的旨在至少能解决上述的技术缺陷之一。

第一方面，本申请实施例提供了一种图像处理方法，该方法包括：

获取待处理图像；

将待处理图像输入到图像处理模型中，基于图像处理模型的输出得到待处理图像的图像处理结果；

其中，图像处理模型包括多个层级的特征处理子网络，每个层级包括不同深度的特征处理节点，对于除最后一个层级的之外的各层级的每个特征处理节点，基于该特征处理节点中包括的门控网络确定特征处理节点的输出特征图，以形成动态的图像处理模型，并基于图像处理模型中最后一个层级的各特征处理节点所输出的输出特征图，得到待处理图像的处理结果。

第一方面可选的实施例中，对于除最后一个层级的之外的各层级的每个特征处理节点，基于该特征处理节点中包括的门控网络确定特征处理节点的输出特征图，包括：

基于特征处理节点的输入特征图，确定初始输出特征图；

将特征处理节点的输入特征图输入至门控网络，以确定特征处理节点对应于各尺寸的输出特征图的使用概率；

基于初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定特征处理节点的输出特征图。

第一方面可选的实施例中，各尺寸的特征图的使用概率包括针对初始特征图进行上采样处理的使用概率、进行分辨率不变处理的使用概率、以及进行分辨率下采样处理的使用概率中的至少两种。

第一方面可选的实施例中，基于初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定特征处理节点的输出特征图，包括：

对于使用概率大于设定阈值的每一个使用概率，对初始输出特征图分别进行相对应的尺寸的特征提取，以确定特征处理节点的输出特征图。

第一方面可选的实施例中，若特征处理节点对应于各尺寸的输出特征图的使用概率均不大于设定阈值，则不执行基于特征处理节点的输入特征图，确定初始输出特征图的步骤。

第一方面可选的实施例中，每个特征处理节点中还包括依次级联的卷积层和残差层，依次级联的卷积层和残差层用于基于特征处理节点的输入特征图，确定初始输出特征图。

第一方面可选的实施例中，门控网络中包括神经网络和激活函数层，将特征处理节点的输入特征图输入至门控网络，以确定特征处理节点对应于各尺寸的输出特征图的使用概率，包括：

基于门控网络中包括的神经网络，确定特征处理节点对应于各尺寸的输出特征图的初始使用概率；

基于激活函数对各尺寸的输出特征图的初始使用概率进行激活，得到特征处理节点对应于各尺寸的输出特征图的使用概率。

第二方面，本申请实施例提供了一种图像处理装置，包括：

图像获取模块，用于获取待处理图像；

图像处理结果确定模块，用于将待处理图像输入到图像处理模型中，基于图像处理模型的输出得到待处理图像的图像处理结果；

第二方面可选的实施例中，对于除最后一个层级的之外的各层级的每个特征处理节点，图像处理模型在基于该特征处理节点中包括的门控网络确定特征处理节点的输出特征图时，具体用于：

基于特征处理节点的输入特征图，确定初始输出特征图；

第二方面可选的实施例中，各尺寸的特征图的使用概率包括针对初始特征图进行上采样处理的使用概率、进行分辨率不变处理的使用概率、以及进行分辨率下采样处理的使用概率中的至少两种。

第二方面可选的实施例中，图像处理模型在基于初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定特征处理节点的输出特征图时，具体用于：

第二方面可选的实施例中，若特征处理节点对应于各尺寸的输出特征图的使用概率均不大于设定阈值，则不执行基于特征处理节点的输入特征图，确定初始输出特征图的步骤。

第二方面可选的实施例中，每个特征处理节点中还包括依次级联的卷积层和残差层，依次级联的卷积层和残差层用于基于特征处理节点的输入特征图，确定初始输出特征图。

第二方面可选的实施例中，门控网络中包括神经网络和激活函数层，图像处理模型在将特征处理节点的输入特征图输入至门控网络，以确定特征处理节点对应于各尺寸的输出特征图的使用概率时，具体用于：

第三方面，本申请实施例提供了一种计算处理设备，包括：

存储器，其中存储有计算机可读代码；

一个或多个处理器，当所述计算机可读代码被所述一个或多个处理器执行时，所述计算处理设备执行如第一方面中任一项所述的图像处理方法。

第四方面，本申请实施例提供了一种计算机程序，包括计算机可读代码，当所述计算机可读代码在计算处理设备上运行时，导致所述计算处理设备执行如第一方面中任一项所述的图像处理方法。

第五方面，本申请实施例提供了一种计算机可读存储介质，其上存储有如第四方面所述的计算机程序。

本申请实施例提供的技术方案带来的有益效果是：

在本申请实施例中，由于图像处理模型中包括多个层级的特征处理子网络，并且每个层级的特征处理子网络中还包括不同深度的特征处理节点，也就是说，该图像处理模型中包含大量的网络结构,从而在根据输入的待处理图像进行动态选择的过程中，可以自适应地选择多个已知网络结构,进而可以适用于不同尺度分布的图像。进一步的，由于除最后一个层级的之外的各层级的每个特征处理节点包括了用于控制输出特征图的门控网络，此时可以自适应地关闭不重要的特征处理节点,从而可以拟合不同的网络结构并对实际运行计算量进行控制，即可以保证确定出适用的网络结构，又可以降低了计算量。

上述说明仅是本申请技术方案的概述，为了能够更清楚了解本申请的技术手段，而可依照说明书的内容予以实施，并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂，以下特举本申请的具体实施方式。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种图像处理方法的流程示意图；

图2为本申请实施例提供的一种图像处理模型的部分结构示意图；

图3为本申请实施例提供的一种深度特征提取网络的部分结构示意图；

图4为本申请实施例提供的一种图像处理装置的结构示意图；

图5为本申请实施例提供的一种计算处理设备的结构示意图；

图6示意性地示出了用于保持或者携带实现根据本发明的方法的程序代码的存储单元。

具体实施例

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

本申请实施例提供了一种图像处理方法，如图1所示，该方法包括：

步骤S101，获取待处理图像。

其中，待处理图像指的是需要进行图像处理的图像，该待处理图像的具体类型本申请实施例不限定，如可以为通过拍摄装置拍摄的照片，也可以是视频中的帧图像等。

步骤S102，将待处理图像输入到图像处理模型中，基于图像处理模型的输出得到待处理图像的图像处理结果；

本申请可选的实施例中，图像处理模型可以为图像语义分割模型，图像处理结果可以为该待处理图像的语义分割结果。

在实际应用中，该图像处理模型可以包括深度特征提取网络，而深度特征提取网络中包括不同的层级(每个层级为一个特征处理子网络)，并且每个层级中包括了不同深度的特征处理节点。此外，该图像处理模型中除最后一个层级的之外的各层级的每个特征处理节点可以包括门控网络，该门控网络可以根据输入特征图控制该特征处理节点的输出特征图。其中，当特征处理节点不存在输出特征图时，说明该特征处理节点处于关闭状态，也就是说，门控网络可以控制特征处理节点的通断。相应的，当图像处理模型中的特征处理节点包括门控网络时，由于门控网络可以控制特征处理节点的通断，因此该图像处理模型为可动态调整的模型。

在实际应用中，图像处理模型中还包括初始特征提取网络，当待处理图像输入到图像处理模型时，初始特征提取网络可以将该待处理图像的图片特征提取到高维特征空间，得到待处理图像的初始特征图。其中，初始特征提取网络的具体网络结构可以预先配置，本申请实施例不限定。例如，初始特征提取网络中可以包括多尺度特征提取模块和多尺度特征融合模块；相应的，当待处理图像输入到图像处理模型后，初始特征提取网络中的多尺度特征提取模块可以先提取待处理图像的多个尺度的特征图，然后多尺度特征融合模块对多个尺度的特征图进行融合，得到待处理图像的初始特征图。

在本申请实施例中，由于可以先通过初始特征提取网络将待处理图像的图片特征提取到高维特征空间，此时可以保证后续在对待处理图像进行处理的过程中可以更加稳定。

本申请可选的实施例中，每个特征处理节点对应一种输入特征图尺寸，若当前特征处理节点为第一个层级节点，该节点的输入为初始特征图，且初始特征图中尺寸等于该节点的输入特征图尺寸；若当前特征处理节点为除第一个层级之外的其它层级的节点，该节点的输入为其上一层级的各特征处理节点所输出的尺寸等于该节点的输入特征图尺寸的输出特征图；若当前特征处理节点为最后一个层级的节点，则该节点的输出特征图为将其各输入特征图融合后的输出特征图。

在实际应用中，在通过初始特征提取网络提取待处理图像的初始特征图后，可以基于图像处理模型中的深度特征提取网络对初始特征图进行进一步的特征提取进而得深度特征。

其中，深度特征提取网络中每个层级的特征处理节点的输入特征图对应于一种尺寸，不同的特征处理节点对应的输入特征图尺寸可能相同，也可能是不同的。

在实际应用中，不同层级的特征处理节点的输入特征图或输出特征图是存在不同的。如若当前特征处理节点为第一个层级的特征处理节点，该特征处理节点的输入特征图为初始特征图，且输入的初始特征图等于该特征处理节点对应的输入特征图尺寸；若当前特征处理节点是除第一个层级之外的其它层级的特征处理节点，则该特征处理节点的输入为其上一层级的各特征处理节点所输出的等于该特征处理节点对应的输入特征图尺寸的输出特征图；此外，若当前特征处理节点为最后一个层级的特征处理节点，由于最后一个层级的特征处理节点不包含门控网络，此时该特征处理节点的输出特征图为将其各输入特征图融合后的输出特征图。

在一示例中，假设当前特征处理节点属于第三个层级的特征处理子网络，对应的输入特征图尺寸为待处理图像的1/8，此时上一层级即为第二个层级的特征处理子网络，且第二个层级的特征处理子网络中包括特征处理节点1和特征处理节点2，特征处理节点1的输出特征图的尺寸分别为待处理图像大小和待处理图像的1/8，特征处理节点2的输出特征图的尺寸分别为待处理图像的1/4、待处理图像的1/8和待处理图像的1/16，此时当前特征处理节点的输入特征图为特征处理节点1输出的待处理图像的1/8大小的输出特征图和特征处理节点2输出的待处理图像的1/8大小的输出特征图。相应的，若第三个层级的特征处理子网络为图像处理模型中的最后一个层级，此时当前特征处理节点则可以对特征处理节点1和特征处理节点2输出的待处理图像的1/8大小的输出特征图进行特征融合，得到输出特征图。

也就是说，在深度特征提取网络中，只有第一个层级的特征处理节点输入为初始特征图，而除最后一个层级的之外的各层级的每个特征处理节点的输出均为至少两种不同尺寸的特征图。

在本公开实施例中，基于最后一个层级的各特征处理节点所输出的输出特征图，得到待处理图像的处理结果，包括：

将最后一个层级的各特征处理节点的输出特征图进行融合，得到尺寸等于待处理图像的尺寸的融合特征图；

基于融合特征图，得到待处理图像的语义分割结果并输出。

在实际应用中，图像处理模块中还可以包括处理结果输出模块，其用于基于最后一个层级的各特征处理节点所输出的输出特征图，得到待处理图像的处理结果。也就是说，在得到最后一个层级的各特征处理节点所输出的输出特征图后，即可确定出待处理图像的处理结果。

其中，处理结果输出模块中包括依次级联的特征融合模块和语义分割结果输出模块。此时所包括的特征融合模块可以将最后一个层级的各特征处理节点的输出特征图进行融合，得到尺寸等于待处理图像的尺寸的融合特征图，然后通过语义分割结果输出模块基于融合特征图，得到待处理图像的语义分割结果，并将得到的语义分割结果输出。

其中，将最后一个层级的各特征处理节点的输出特征图进行融合的具体实现方式本申请实施例不限定。例如，将各尺寸的输出特征图进行融合并进行上采样分辨率处理，直至得到尺寸等于待处理图像的尺寸的融合特征图。

在一示例中，假设，最后一个层级的各特征处理节点的输出特征图的尺寸分别为待处理图像尺寸的1/8，待处理图像尺寸的1/4、待处理图像尺寸的1/2，此时可以对尺寸为待处理图像尺寸的1/8的输出特征图进行上采样分辨率处理，得到尺寸为待处理图像尺寸的1/4的特征图，并将得到的尺寸为待处理图像尺寸的1/4的特征图和尺寸为原待处理图像尺寸的1/4的输出特征图进行融合，得到第一融合的特征图，然后对第一融合的特征图进行上采样分辨率处理，得到尺寸为待处理图像尺寸的1/2的特征图，并将得到的尺寸为待处理图像尺寸的1/2的特征图和原尺寸为待处理图像尺寸的1/2的输出特征图进行融合，得到第二融合的特征图，然后对第二融合的特征图进行上采样分辨率处理，得到尺寸为待处理图像尺寸的融合特征图。

在本申请实施例中，对于除最后一个层级的之外的各层级的每个特征处理节点，基于该特征处理节点中包括的门控网络确定特征处理节点的输出特征图，包括：

基于特征处理节点的输入特征图，确定初始输出特征图；

其中，为了描述方便，下文中将除最后一个层级的之外的各层级的每个特征处理节点称之为目标特征处理节点。在实际应该用中，对于每个目标特征处理节点，在将等于该目标特征处理节点的输入特征图尺寸的输出特征图输入至目标特征处理节点时，该目标特征处理节点所包括的特征提取模块可以根据所输入的输入特征图，确定初始输出特征图，并且所包括的特征选择模块(即门控网络)可以根据所输入的输入特征图确定该目标特征处理节点对应于各尺寸的输出特征图的使用概率，然后所包括的特征输出模块可以基于对应于的每一种尺寸的输出特征图的使用概率对初始输出特征图进行特征提取，进而得到该目标特征处理节点对应于各尺寸的输出特征图。

其中，使用概率指的是对应尺寸的特征图的使用可能性，当使用概率越大时，其对应尺寸的特征图的使用可能性越高，反之，则使用可能性越低。

本申请可选的实施例中，各尺寸的特征图的使用概率包括针对初始特征图进行上采样处理的使用概率、进行分辨率不变处理的使用概率、以及进行分辨率下采样处理的使用概率中的至少两种。

也就是说，在目标特征处理节点根据输入特征图确定初始输出特征图后，可以对初始输出特征图进行上采样处理，分辨率不变处理或分辨率下采样处理等，而门控网络用于确定对初始输出特征图的进行上采样处理，分辨率不变处理或分辨率下采样处理的使用概率。

在本申请实施例中，基于初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定特征处理节点的输出特征图，包括：

在实际应用中，目标特征处理节点在确定输出特征图时，可以将使用概率小于设定阈值使用概率过滤掉，即不执行使用概率小于设定阈值所对应的特征提取方式。也就是说，本申请实施例中，可以根据各尺寸的特征图的使用概率，确定对初始输出特征图进行特征提取的方式。其中，阈值的具体数值可以预先设置，本申请实施例不限定。在本申请可选的实施例中，设定阈值可以设置0，也就是说，若使用概率为0，此时将不执行该使用概况对应的特征提取方式。

在一示例中，假设目标特征处理节点通过门控网络确定对应于上采样处理的使用概率为0.5、对应于分辨率不变处理的使用概率为0.6、以及对应于分辨率下采样处理的使用概率为0，且设定阈值为0；相应的，由于对应于上采样处理的使用概率为0.5和对应于分辨率不变处理的使用概率为0.6大于设定阈值，此时目标特征处理节点可以不执行对初始输出特征图进行分辨率上采样处理和对初始特征图进行分辨率不变处理，仅对初始输出特征图进行分辨率下采样处理。

可以理解的是，在本申请实施例中，若特征处理节点对应于各尺寸的输出特征图的使用概率均不大于设定阈值，则不执行基于特征处理节点的输入特征图，确定初始输出特征图的步骤。

在实际应用中，若特征处理节点对应于各尺寸的输出特征图的使用概率均不大于设定阈值，此时不需要对初始输出特征图进行特征提取，而为了减少计算量，目标特征处理节点可以不执行基于特征处理节点的输入特征图，确定初始输出特征图的步骤(即将目标特征处理节点处于关闭的状态)。

在本申请实施例中，可以通过各目标特征处理节点中的门控网络确定各目标特征处理节点的输出特征图的使用概率,进而可以动态地将计算量大但对最终结果贡献较小的目标特征处理节点删除,从而在有计算量约束时，可以动态选择网络结构，达到减小计算量的目的。

在本申请可选的实施例中，每个特征处理节点中还包括依次级联的卷积层和残差层，依次级联的卷积层和残差层用于基于特征处理节点的输入特征图，确定初始输出特征图。

在实际应用中，对于图像处理模型中的每个特征处理节点，其还包括依次级联的卷积(SepConv)层和残差(Residual)层，基于该依次级联的卷积层和残差层可以根据输入特征图确定初始输出特征图。其中，需要说明的是，对于最后一个层级中的特征处理节点，基于该卷积层和残差层确定的初始输出特征图即为最后的输出特征图。

此外，在实际应用中，在将等于该特征处理节点的输入特征图尺寸的输出特征图输入至特征处理节点前，可以先对各输入特征图进行融合，得到融合特征图，然后将融合特征图输入至依次级联的卷积层和残差层；也可以直接将各输入特征图输入至依次级联的卷积层和残差层，依次级联的卷积层和残差层先对各输入特征图输进行融合，得到融合特征图，然后基于得到的融合特征图确定初始输出特征图。

在本申请可选的实施例中，门控网络中包括神经网络和激活函数层，将特征处理节点的输入特征图输入至门控网络，以确定特征处理节点对应于各尺寸的输出特征图的使用概率，包括：

在实际应用中，门控网络可以为轻量级门控网络，其可以包括卷积神经网络和激活函数层，该卷积神经网络可以将输入特征图映射到隐空间并输出对应于各尺寸的输出特征图的激活值，然后激活函数层对各激活值进行激活，得到对应于各尺寸的输出特征图的使用概率。另外，由于使用概率是经过激活函数层确定的，此时各使用概率被限制在[0,1]之间，而激活函数层可以为max((0,tanh(x))，其中，x为激活值个数。

此外，在实际应用中，在训练图像处理模型中，对于每个目标特征处理节点中门控网络输出的各使用概率，可以将其与对应的输出特征图中的特征值相乘，以达到将特征处理节点和其所包括的门控网络一起进行端到端的训练。

如图2所示，本申请实施例提供一种图像处理模型的结构示意图，并结合该结构示意图。其中，图2中的Scale(比例)下方的数字(即1、1/4、…1/64)表示特征图尺寸(即不同的深度)，如当为1时即特征图尺寸为待处理图像大小，当为1/4时即特征图尺寸为待处理图像的1/4等。

在本示例中，假设图像处理模型为图像语义分割模型，该图像语义分割模型可以包括初始特征提取网络、深度特征提取网络、以及处理结果输出模块。其中，深度特征提取网络中包括L+1个层级的特征处理子网络(图中1列为一个层级)，每个特征处理子网络中包括各特征处理节点(如图中的深度特征提取网络中所包括的圆点所示)，其所包括的各特征处理节点对应一种输入特征图尺寸。例如，对于第一个层级的两个特征处理节点，其对应的输入特征图尺寸分别为尺寸为待处理图像的1/4的初始特征图、以及尺寸为待处理图像的1/8的初始特征图。

在本示例中，获取到待处理图像后，可以通过图中所示的Input(输入)将待处理图像输入至初始特征提取网络，初始特征提取网络中所包括的多尺度特征提取模块(即图中的STEM)将待处理图像的多个尺度的特征图，然后所包括的多尺度特征融合模块可以对得到的多个尺度的特征图进行融合，得到初始特征图。相应的，将初始特征图输入至深度特征提取网络中的第一个层级的特征处理节点，第一个层级的特征处理节点对初始特征图分别进行分辨率不变采样处理(如图2中水平方向的箭头所示)和分辨率下采样处理 (如图3中指向右下方的箭头所示)，得到不同的尺寸的输出特征图，然后根据输出特征图的尺寸，将各输出特征图分别输入至对应的第二个层级中的特征处理节点，并以此类推，直至到最后一个层级的特征处理节点。

为了更好的理解。在本示例中以其中一个特征处理节点为例，对除最后一个层级的之外的各层级的每个特征处理节点的处理过程进行说明。其中，该特征处理节点的内容结构如图3所示，具体的：

该特征处理节点的上一层级存在3个特征处理节点所输出的输出特征图的尺寸等于该节点的输入特征图尺寸(如图中C区域所示)，然后可以对该特征处理节点的输入特征图进行融合，得到融合后的特征图(具体如图中的A所示)；进一步，依次级联的卷积层和残差层(具体如图中的cell部分中的SepConv和Identity所示)基于该融合后的特征图确定初始输出特征图，门控网络(如图2中的Gate)基于该融合后的特征图，确定对应于分辨率上采样处理的使用概率、对应于分辨率不变处理的使用概率以及对应于分辨率上采样处理的使用概率；进一步的，假设得到的3个使用概率均大于设定阈值，此时可以对初始输出特征图分别进行分辨率上采样处理(如图3中指向右上方的箭头所示)、分辨率不变处理(如图3中水平方向的箭头所示)、以及分辨率下采样处理(如图3中指向右下方的箭头所示)，得到3种不同尺寸的输出特征图(如图中Rounting区域所示)。其中，图3中Rounting区域为图3中b区域的详细结构示意图。

可以理解是的，在实际应用中，若门控网络确定的各尺寸的输出特征图的使用概率均不大于设定阈值，此时便可以不再执行图中cell部分，也就是说，此时可以不再执行该特征处理节点，进而可以减少了计算量。

进一步的，处理结果输出模块将最后一个层级的各特征处理节点的输出特征图基于分辨率上采样处理方式(如图2中的Upsample)进行融合，得到尺寸等于待处理图像的尺寸的融合特征图，并基于该融合特征图得到待处理图像的语义分割结果并输出(如图2中的Output)。

本申请实施例中，图像处理模型中包括多个尺度的特征处理节点的路径选择空间,可以使所设计的路径选择包含现有大多数的静态网络结构能够高效地提取多个尺度的特征。

进一步的，图像处理模型中包括多个尺度的特征处理节点主要用来聚合多尺度特征并进行后续传播的路径选择.并且可以使用门控网络来对各个特征处理节点进行通断控制。进而在实际应用中，可以根据实际应用场景(如在终端设备或在服务器)的计算量需求，在训练图像处理模型时，通过损失函数进行约束控制网络动态地将计算量大但对最终结果贡献较小的特征处理节点删除,即可以根据输入图像动态地决定是否使用该节点进行特征聚合，从而达到在有计算量约束时动态选择网络结构的目的。

如图4所示，本申请实施例提供了一种图像处理装置，如图4所示，该图像处理装置60可以包括：图像获取模块601以及图像处理结果确定模块602，其中，

图像获取模块601，用于获取待处理图像；

图像处理结果确定模块602，用于将待处理图像输入到图像处理模型中，基于图像处理模型的输出得到待处理图像的图像处理结果；

本申请可选的实施例中，对于除最后一个层级的之外的各层级的每个特征处理节点，图像处理模型在基于该特征处理节点中包括的门控网络确定特征处理节点的输出特征图时，具体用于：

基于特征处理节点的输入特征图，确定初始输出特征图；

本申请可选的实施例中，图像处理模型在基于初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定特征处理节点的输出特征图时，具体用于：

本申请可选的实施例中，若特征处理节点对应于各尺寸的输出特征图的使用概率均不大于设定阈值，则不执行基于特征处理节点的输入特征图，确定初始输出特征图的步骤。

本申请可选的实施例中，每个特征处理节点中还包括依次级联的卷积层和残差层，依次级联的卷积层和残差层用于基于特征处理节点的输入特征图，确定初始输出特征图。

本申请可选的实施例中，门控网络中包括神经网络和激活函数层，图像处理模型在将特征处理节点的输入特征图输入至门控网络，以确定特征处理节点对应于各尺寸的输出特征图的使用概率时，具体用于：

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

本申请的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本申请实施例的计算处理设备中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

例如，本申请实施例提供了一种计算处理设备，如图5所示，图5所示的计算处理设备2000包括：处理器2001和存储器2003。其中，处理器2001和存储器2003相连，如通过总线2002相连。可选地，计算处理设备2000还可以包括收发器2004。需要说明的是，实际应用中收发器2004不限于一个，该计算处理设备2000的结构并不构成对本申请实施例的限定。

其中，处理器2001应用于本申请实施例中，用于实现图4所示的各模块的功能。

处理器2001可以是CPU，通用处理器，DSP，ASIC，FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器2001也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线2002可包括一通路，在上述组件之间传送信息。总线2002可以是PCI总线或EISA总线等。总线2002可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器2003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备，RAM或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器2003用于存储执行本申请方案的应用程序代码，并由处理器2001来控制执行。存储器2003具有用于执行上述方法中的任何方法步骤的程序代码的存储空间2005。例如，用于程序代码的存储空间2005可以包括分别用于实现上面的方法中的各种步骤的各个程序代码2006。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘，紧致盘(CD)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为如参考图6所述的便携式或者固定存储单元。该存储单元可以具有与图5的计算处理设备中的存储器2003类似布置的存储段、存储空间等。程序代码可以例如以适当形式进行压缩。通常，存储单元包括计算机可读代码2006’，即可以由例如诸如2001之类的处理器读取的代码，这些代码当由计算处理设备运行时，导致该计算处理设备执行上面所描述的方法中的各个步骤。

本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上用于存储计算机指令，当计算机指令在计算机上运行时，使得计算机可以执行实现图像处理方法。

本申请中的一种计算机可读存储介质所涉及的名词及实现原理具体可以参照本申请实施例中的一种图像处理方法，在此不再赘述。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上所述仅是本发明的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

一种图像处理方法，其特征在于，包括：

获取待处理图像；

将所述待处理图像输入到图像处理模型中，基于所述图像处理模型的输出得到所述待处理图像的图像处理结果；

其中，所述图像处理模型包括多个层级的特征处理子网络，每个层级包括不同深度的特征处理节点，对于除最后一个层级的之外的各层级的每个特征处理节点，基于该特征处理节点中包括的门控网络确定所述特征处理节点的输出特征图，以形成动态的图像处理模型，并基于所述图像处理模型中最后一个层级的各特征处理节点所输出的输出特征图，得到所述待处理图像的处理结果。
根据权利要求1所述的方法，其特征在于，对于除最后一个层级的之外的各层级的每个特征处理节点，所述基于该特征处理节点中包括的门控网络确定所述特征处理节点的输出特征图，包括：

基于所述特征处理节点的输入特征图，确定初始输出特征图；

将所述特征处理节点的输入特征图输入至所述门控网络，以确定所述特征处理节点对应于各尺寸的输出特征图的使用概率；

基于所述初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定所述特征处理节点的输出特征图。
根据权利要求2所述的方法，其特征在于，所述各尺寸的特征图的使用概率包括针对所述初始特征图进行上采样处理的使用概率、进行分辨率不变处理的使用概率、以及进行分辨率下采样处理的使用概率中的至少两种。
根据权利要求2所述的方法，其特征在于，所述基于所述初始输出特征图、以及所确定出的对应于各尺寸的特征图的使用概率，确定所述特征处理节点的输出特征图，包括：

对于使用概率大于设定阈值的每一个使用概率，对所述初始输出特征图分别进行相对应的尺寸的特征提取，以确定所述特征处理节点的输出特征图。
根据权利要求4所述的方法，其特征在于，若所述特征处理节点对应于各尺寸的输出特征图的使用概率均不大于设定阈值，则不执行所述基于所述特征处理节点的输入特征图，确定初始输出特征图的步骤。
根据权利要求2所述的方法，其特征在于，每个特征处理节点中还包括依次级联的卷积层和残差层，所述依次级联的卷积层和残差层用于基于特征处理节点的输入特征图，确定初始输出特征图。
根据权利要求2所述的方法，其特征在于，所述门控网络中包括神经网络和激活函数层，所述将所述特征处理节点的输入特征图输入至所述门控网络，以确定所述特征处理节点对应于各尺寸的输出特征图的使用概率，包括：

基于所述门控网络中包括的神经网络，确定所述特征处理节点对应于各尺寸的输出特征图的初始使用概率；

基于所述激活函数对各尺寸的输出特征图的初始使用概率进行激活，得到所述特征处理节点对应于各尺寸的输出特征图的使用概率。
一种图像处理装置，其特征在于，包括：

图像获取模块，用于获取待处理图像；

图像处理结果确定模块，用于将所述图像处理图像输入到图像处理模型中，基于所述待处理模型的输出得到所述待处理图像的图像处理结果；

其中，所述图像处理模型包括多个层级的特征处理子网络，每个层级包括不同深度的特征处理节点，对于除最后一个层级的之外的各层级的每个特征处理节点，基于该特征处理节点中包括的门控网络确定所述特征处理节点的输出特征图，以形成动态的图像处理模型，并基于所述图像处理模型中最后一个层级的各特征处理节点所输出的输出特征图，得到所述待处理图像的处理结果。
一种计算处理设备，其特征在于，包括：

存储器，其中存储有计算机可读代码；

一个或多个处理器，当所述计算机可读代码被所述一个或多个处理器执行时，所述计算处理设备执行如权利要求1-7中任一项所述的图像处理方法。
一种计算机程序，包括计算机可读代码，当所述计算机可读代码在计算处理设备上运行时，导致所述计算处理设备执行根据权利要求1-7中任一项所述的图像处理方法。
一种计算机可读介质，其中存储了如权利要求10所述的计算机程序。