WO2019128726A1

WO2019128726A1 - 图像处理方法和装置

Info

Publication number: WO2019128726A1
Application number: PCT/CN2018/120830
Authority: WO
Inventors: 杨帆
Original assignee: 华为技术有限公司
Priority date: 2017-12-29
Filing date: 2018-12-13
Publication date: 2019-07-04
Also published as: CN109996023A; CN109996023B

Abstract

本申请提供了一种图像处理方法和装置，该方法包括：获取第一图像；通过卷积神经网络的第一图像处理层对该第一图像进行B倍的下采样处理，得到第二图像，该卷积神经网络包括多个图像处理层，该多个图像处理层包括该第一图像处理层，其中，B为大于1的整数；通过该多个图像处理层中的第二图像处理层对该第二图像进行A倍的上采样处理，得到第三图像，其中，A为大于1的整数，且A不等于B。采用本申请提供的图像处理方法和装置，能够实现对图像的非整数倍的上采样或非整数倍的下采样。

Description

图像处理方法和装置

本申请要求于2017年12月29日提交中国专利局、申请号为201711471002.9、申请名称为“图像处理方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及图像处理领域，更具体地，涉及图像处理领域中的图像处理方法和装置。

背景技术

随着图像处理技术的不断发展，以及人们对图像显示画质要求的不断提升，基于深度学习的卷积神经网络(convolutional neural network，CNN)以其局部权值共享的特殊结构，在图像处理领域得到了快速发展，并逐渐成为了行业内一个重要的技术选择。

在实际应用中，经常存在需要将图像的分辨率由720逐行扫描(progressive，p)放大至1080p，即需要对图像进行非整数倍的上采样处理，或由1080p缩小至720p的场景，即需要对图像进行非整数倍的下采样处理。然而，目前采用由卷积层构成的卷积神经网络模型，例如有效亚像素卷积神经网络(efficient sub-pixel convolutional neural network，ESPCN)模型、快速超分辨率卷积神经网络(fast super-resolution convolutional neural networks，FSRCNN)模型等，能够实现对图像的整数倍(包括倍率为1)上采样，例如图像超分辨率算法。

因此，需要提供一种图像处理方法解决如何实现图像的非整数倍的上采样或非整数倍的下采样的问题。

发明内容

本申请提供一种图像处理方法和装置，能够实现对图像的非整数倍的上采样或非整数倍的下采样。

第一方面，本申请提供了一种图像处理方法，该方法包括：

获取第一图像；

通过卷积神经网络的第一图像处理层对该第一图像进行B倍的下采样处理，得到第二图像，该卷积神经网络包括多个图像处理层，该多个图像处理层包括该第一图像处理层，其中，B为大于1的整数；

通过该多个图像处理层中的第二图像处理层对该第二图像进行A倍的上采样处理，得到第三图像，其中，A为大于1的整数，且A不等于B。

本申请实施例提供的图像处理方法，通过卷积神经网络的第一图像处理层对获取到的第一图像进行B倍的下采样处理，得到第二图像，再通过该卷积神经网络的第二图像处理层对该第二图像进行A倍的上采样处理，得到第三图像，能够实现对该第一图像的非整数倍的上采样或非整数倍的下采样。

此外，由于先进行下采样处理，再进行上采样处理，减少了卷积神经网络处理的数据量，从而能够降低图像处理的计算复杂度，以及提高图像处理效率。

应理解，图像的尺寸可以包括多个维度，当图像的维度为二维时，图像的尺寸包括高度和宽度；当图像的维度为三维时，图像的尺寸包括宽度、高度和深度。

还应理解，像素是组成图像的最基本的元素，是一种逻辑尺寸单位。

还应理解，图像的高度可以理解为该图像在高度方向上包括的像素的数量；图像的宽度可以理解为该图像在宽度方向上包括的像素的数量；图像的深度可以理解为该图像的通道数量。

还应理解，在卷积神经网络模型中，图像的深度可以理解为图像包括的特征图(feature maps)的数量，其中，该图像的任意一张特征图的宽度和高度都与该图像的其他特征图的宽度和高度相同。也就是说，一张图像为三维图像，可以理解为该三维图像是由多张二维特征图构成的，且该多张二维特征图的尺寸相同。

还应理解，本申请实施例中，下采样的倍率B大于上采样的倍率A时，能够实现对该第一图像的非整数倍的下采样；下采样的倍率B小于上采样的倍率A时，能够实现对该第一图像的非整数倍的上采样。

结合第一方面，在第一方面的第一种可能的实现方式中，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该通过卷积神经网络的第一图像处理层对该第一图像进行B倍的下采样处理，得到第二图像，包括：通过该第一图像处理层将该每张第一特征图划分为互不重叠的(H×W)/B ²个图像块，该(H×W)/B ²个图像块中每个图像块的高度为B个像素，该每个图像块的宽度为B个像素；根据该(H×W)/B ²个图像块，得到B ²张第二特征图，该B ²张第二特征图中每张第二特征图的高度为H/B个像素，该每张第二特征图的宽度为W/B个像素，该每张第二特征图中的每个像素取自该(H×W)/B ²个图像块中的不同图像块，该每个像素在该每张第二特征图中的位置与该每个像素所属的图像块在该第一特征图中的位置相关联。其中，(H×W)/B ²、H/B和W/B均为整数。

应理解，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素、该每张第一特征图的宽度为W个像素，可以理解为该第一图像为三维图像，该三维的第一图像的尺寸为H×W×M，即该第一图像的高度为H个像素、宽度为W个像素、深度为M个第一特征图，也就是说，该三维的第一图像包括M张H×W的二维的第一特征图。

可选地，该第一图像可以为原始采集的待处理图像，或者该第一图像可以为经过预处理的图像，或者该第一图像可以为经过该卷积神经网络中的其它图像处理层处理后得到的图像，或者该第一图像可以为经过其他图像处理装置处理后得到的图像，本申请实施例对此不作限定。

可选地，本申请实施例中可以通过多种不同的方式获取该第一图像，本申请实施例对此不作限定。

例如，该第一图像为原始采集的待处理图像时，可以从图像采集装置获取该第一图像；该第一图像为经过该卷积神经网络中的其他图像处理层处理后得到的图像时，可以获取该其它图像处理层输出的该第一图像；该第一图像为经过其他图像处理装置处理后得到的图像时，可以获取该其它图像处理装置输出的该第一图像。

应理解，对一张第一特征图进行B倍的下采样处理，可以得到B ²张第二特征图，那么对M张第一特征图进行B倍的下采样处理，可以得到M×B ²张第二特征图，即得到该第二图像。

还应理解，该第二图像包括M×B ²张第二特征图，该M×B ²张第二特征图中每张第二特征图的高度为H/B个像素、该每张第二特征图的宽度为H/B个像素，可以理解为该第二图像为三维图像，该三维的第一图像的尺寸为(H/B)×(W/B)×(M×B ²)，即该第一图像的高度为H/B个像素、宽度为W/B个像素、深度为M×B ²个第一特征图，也就是说，该三维的第一图像包括M×B ²张(H/B)×(W/B)的二维的第二特征图。

还应理解，该每个像素在该每张第二特征图中的位置与该每个像素所属的图像块在该第一特征图中的位置相关联，可以理解为，该第二特征图中包括的每个像素在该第二特征图中的相对位置与该每个像素所属的图像块在该第一特征图中的相对位置相同。

本申请实施例提供的图像处理方法，通过对每个第一特征图中包括的像素进行拆分和组合重排，得到B ²个第二特征图，能够实现对该第一图像的B倍下采样处理。

此外，该B ²个第二特征图包括了该第一特征图中的所有像素，即该B ²个第二特征图中保留了该每个第一特征图中的所有图像信息；每个第二特征图中包括的像素之间的相对位置是根据该像素所属的图像块在第一特征图中的相对位置决定的，即由一个第一特征图得到的每个第二特征图都是该第一特征图的一个缩略图。

结合第一方面，在第一方面的第二种可能的实现方式中，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该通过卷积神经网络的第一图像处理层对该第一图像进行B倍的下采样处理，得到第二图像，包括：通过该第一图像处理层对该M张第一特征图进行卷积操作，得到该第二图像，该卷积操作在宽度方向和高度方向上的卷积步长均为B，该卷积操作采用N个卷积核，该N个卷积核中每个卷积核的高度为K个像素，该每个卷积核的宽度为J个像素，该每个卷积核的深度为M个特征图，该每张第一特征图填充的高度边界为P个像素，该每张第一特征图填充的宽度边界为P个像素，该第二图像包括N个第二特征图，该N个第二特征图中每个第二特征图的高度为

个像素，该每个第二特征图的宽度为

个像素，其中，N为大于0的整数，P为大于或等于0的整数，J和K大于或等于B。

应理解，卷积核是一种滤波器，用于提取图像的特征图。卷积核的尺寸包括宽度、高度和深度，其中，卷积核的深度与输入图像的深度相同。对一张输入图像使用多少种不同的卷积核进行卷积操作，就可以提取多少张不同的特征图。

可选地，在卷积神经网络的卷积层中，可以通过设置不同大小的卷积核、不同权重值或以不同的卷积步长对同一张图像进行多次卷积，以尽可能多的抽取该图像的特征。

还应理解，卷积步长是指卷积核在输入图像的特征图上滑动提取该输入图像的特征图的过程中，该卷积核在高度方向和宽度方向上执行两次卷积操作之间滑动的距离。

应理解，卷积步长可以决定输入图像的下采样倍率，例如，在宽度(或高度)方向上的卷积步长为B，可以使输入特征图在宽度(或高度)方向上实现B倍的下采样。

还应理解，在卷积神经网络中，卷积层主要起到作用是抽取特征的作用。主要是根据设定的卷积核，对输入图像进行卷积操作。

应理解，在使用一个K×K的卷积核对一张二维的输入图像进行卷积操作时，将卷积核在该图像上滑动时覆盖的K×K的图像块与卷积核做点乘，即图像块上每个点的灰度值与卷积核上相同位置的权重值相乘，共得到K×K个结果，累加后加上偏置，得到一个结果，输出为输出图像的单一像素，该像素在该输出图像上的坐标位置对应该图像块的中心在该输入图像上的坐标位置。

还应理解，在使用卷积核对输入的一张三维图像进行卷积操作时，该卷积核的维度也需为三维，且该卷积核的第三维度(深度)与该三维图像的第三维度(深度或特征图数量)相同。该三维图像与三维卷积核的卷积操作，可以转化为将三维图像和卷积核以深度(图像通道数或特征图数量)维度拆分为多张二维的特征图与卷积核进行二维卷积操作，最终在图像深度这一维度进行累加，最终获得一张二维图像输出。

还应理解，在卷积神经网络中，卷积层的输出图像通常也包括多张特征图，三维的卷积核对三维输入图像进行处理后得到一张二维输出特征图，而获得多张输出特征图需要多个三维卷积核，因此卷积核的维度比输入图像的维度大1，增加的维度的数值对应输出图像的深度，即输出图像包括的特征图的数量。

还应理解，卷积操作分为填充(padding)方式或非padding方式。padding方式可以理解为一种图像的预处理操作，same padding方式包括相同填充(same padding)方式和有效填充(valid padding)方式。

还应理解，same padding方式是指对输入图像的宽度和高度都加上一个相同边界，并对加边界后的图像进行卷积操作，其中，该边界是指该输入图像的外边界。例如，输入图像的尺寸为5×5×2，采用same padding方式进行卷积操作时，该输入图像填充的高度边界为1个像素，该输入图像填充的宽度边界为1个像素，可以得到一个7×7×2的图像，再对该7×7×2的图像进行卷积操作。

应理解，在输入图像填充的宽度边界＝(卷积核的宽度-1)/2、填充的高度边界＝(卷积核的高度-1)/2，且卷积步长为1的情况下，该输入图像与卷积核进行卷积后，得到的输出图像与输入图像具有相同的宽度和高度。

可选地，一般来说，卷积核的尺寸为3×3时，输入图像填充的高度边界和宽度边界均为1个像素；卷积核的尺寸为5×5时，输入图像填充的高度边界和宽度边界均为2个像素；卷积核的尺寸为7×7时，输入图像填充的高度边界和宽度边界均为3个像素，但本申请实施例对此不作限定。

还应理解，本申请实施例采用same padding方式进行卷积操作时，仅以边界元素的取值全部为0作为示例性介绍，边界元素还可以取值还可以为其他值，本申请实施例对此不作限定。

可选地，假设输入特征图的宽度(或高度)为W，卷积核的宽度(或高度)为F，卷积步长为S，采用same padding方式进行卷积操作，该输入特征图填充的宽度(或高度)边界为P，则得到的输出特征图的宽度(或高度)可以表示为：

其中，W、F 和S为大于0的整数，P为大于或等于0的整数，

代表对·向下取整。

应理解，若卷积操作采用非padding方式进行卷积操作，则可以认为P为0。

本申请实施例提供的图像处理方法，通过卷积神经网络的第一图像处理层对该第一图像进行卷积操作，该卷积操作在宽度方向和高度方向上的卷积步长均为B，该卷积操作采用N个卷积核，该N个卷积核中每个卷积核的高度为K个像素，该每个卷积核的宽度为J个像素，该每个卷积核的深度为M个特征图，该第一图像填充的高度边界为P个像素，宽度边界为P个像素，能够实现对该第一图像的B倍下采样。

另外，J和K大于或等于B，能够使得卷积核在卷积过程中至少遍历该第一图像中的每个像素，即保留该第一图像中的所有图像信息。

结合第一方面的第二种可能的实现方式，在第一方面的第三种可能的实现方式中，M、N和B满足以下公式：N≥M×B/2。

由于在通过卷积操作抽象图像特征过程中会损失输入图像所携带的小部分图像信息，可以通过增加输出图像包括的特征图的数量以达到更好的保留这部分图像信息的目的。

本申请实施例中，N≥M×B/2，即按一定限定条件增加第二图像的深度，可以达到弥补第一图像损失的图像信息的效果。

结合第一方面，在第一方面的第四种可能的实现方式中，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该通过卷积神经网络的第一图像处理层对该第一图像进行B倍的下采样处理，得到第二图像，包括：通过该第一图像处理层对该M张第一特征图中每张第一特征图进行池化操作，得到该第二图像，该池化操作在宽度方向和高度方向上的池化步长为B，该池化操作的池化核的高度为B个像素，该池化核的宽度为B个像素，该第二图像包括M张第二特征图，该M张第二特征图中每张第二特征图的高度为H/B个像素，该每张第二特征图的宽度为W/B个像素。其中，H/B和W/B均为整数。

可选地，两种常见的池化操作为均值池化(average pooling)和最大值池化(max pooling)，上述两种的池化操作是在特征图的宽度和高度这两个维度进行处理，并不影响输出特征图的深度。

另外，均值池化操作是指在池化核滑过的每个区域中寻找平均值。

本申请实施例提供的图像处理方法，通过池化层对该第一图像进行B倍的下采样处理，能够减少特征层的数据量，从而降低卷积神经网络的计算复杂度，以及该卷积神经网络的缓存带宽需求。

结合第一方面、第一方面的第一种至第四种可能的实现方式中的任一种可能的实现方式，在第一方面的第五种可能的实现方式中，A和B为互质数。

由于若A和B存在公约数，下采样过程中可能会损失更多的图像信息，并且破坏图像纹理信息的连续性。

因此，本申请实施例提供的图像处理方法，A和B为互质数相比与A和B有公约数的情况，能够更多程度保障该第一图像的图像信息的完整性和图像纹理信息的连续性。

结合第一方面、第一方面的第一种至第五种可能的实现方式中的任一种可能的实现方式，在第一方面的第六种可能的实现方式中，该通过该卷积神经网络对该第二图像进行A 倍的上采样处理，得到第三图像，包括：通过该卷积神经网络对该第二图像进行第一处理，得到第四图像，对该第四图像进行A倍的上采样处理，得到该第三图像。

可选地，该第一处理为非上采样处理或下采样处理的操作，例如卷积步长为1的卷积操作等。

第二方面，本申请提供了一种图像处理方法，该方法包括：

获取第一图像；

通过卷积神经网络的第一图像处理层对该第一图像进行A倍的上采样处理，得到第二图像，该卷积神经网络包括多个图像处理层，该多个图像处理层包括该第一图像处理层，其中，A为大于1的整数；

通过该多个图像处理层中的第二图像处理层对该第二图像进行B倍的下采样处理，得到第三图像，其中，B为大于1的整数，且A不等于B。

本申请实施例提供的图像处理方法，通过卷积神经网络的第一图像处理层对获取到的第一图像进行A倍的上采样处理，得到第二图像，再通过该卷积神经网络的第二图像处理层对该第二图像进行B倍的下采样处理，得到第三图像，能够实现对该第一图像的非整数倍的上采样或非整数倍的下采样。

结合第二方面，在第二方面的第一种可能的实现方式中，该第二图像包括M张第二特征图，该M张第二特征图中每张第二特征图的高度为H个像素，该每张第二特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该通过卷积神经网络的第二图像处理层对该第二图像进行B倍的下采样处理，得到第三图像，包括：通过该第二图像处理层将该每张第二特征图划分为互不重叠的(H×W)/B ²个图像块，该(H×W)/B ²个图像块中每个图像块的高度为B个像素，该每个图像块的宽度为B个像素；根据该(H×W)/B ²个图像块，得到B ²张第三特征图，该B ²张第三特征图中每张第三特征图的高度为H/B个像素，该每张第三特征图的宽度为W/B个像素，该每张第三特征图中的每个像素取自该(H×W)/B ²个图像块中的不同图像块，该每个像素在该每张第三特征图中的位置与该每个像素所属的图像块在该第二特征图中的位置相关联。其中，(H×W)/B ²、H/B和W/B均为整数。

结合第二方面，在第二方面的第二种可能的实现方式中，该第二图像包括M张第二特征图，该M张第二特征图中每张第二特征图的高度为H个像素，该每张第二特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该通过卷积神经网络的第二图像处理层对该第二图像进行B倍的下采样处理，得到第三图像，包括：通过该第二图像处理层对该M张第二特征图进行卷积操作，得到该第三图像，该卷积操作在宽度方向和高度方向上的卷积步长均为B，该卷积操作采用N个卷积核，该N个卷积核中每个卷积核的高度为K个像素，该每个卷积核的宽度为J个像素，该每个卷积核的深度为M个特征图，该每张第二特征图填充的高度边界为P个像素，该每张第二特征图填充的宽度边界为P个像素，该第三图像包括N个第三特征图，该N个第三特征图中每个第三特征图的高度为

个像素，该每个第三特征图的宽度为

结合第二方面的第二种可能的实现方式，在第二方面的第三种可能的实现方式中，M、N和B满足以下公式：N≥M×B/2。

结合第二方面，在第二方面的第四种可能的实现方式中，该第二图像包括M张第二特征图，该M张第二特征图中每张第二特征图的高度为H个像素，该每张第二特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该通过卷积神经网络的第二图像处理层对该第二图像进行B倍的下采样处理，得到第三图像，包括：通过该第二图像处理层对该M张第二特征图中每张第二特征图进行池化操作，得到该第三图像，该池化操作在宽度方向和高度方向上的池化步长为B，该池化操作的池化核的高度为B个像素，该池化核的宽度为B个像素，该第三图像包括M张第三特征图，该M张第三特征图中每张第三特征图的高度为H/B个像素，该每张第三特征图的宽度为W/B个像素。其中，(H×W)/B ²、H/B和W/B均为整数。

结合第二方面、第二方面的第一种至第四种可能的实现方式中的任意一种可能的实现方式，在第二方面的第五种可能的实现方式中，A和B为互质数。

第三方面，本申请提供了一种图像处理装置，用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。

第四方面，本申请提供了一种图像处理装置，用于执行上述第二方面或第二方面的任意可能的实现方式中的方法。

第五方面，本申请提供了一种图像处理装置，该装置包括：存储器、处理器、通信接口及存储在该存储器上并可在该处理器上运行的计算机程序，其特征在于，该处理器执行该计算机程序时执行上述第一方面或第一方面的任意可能的实现方式中的方法。

第六方面，本申请提供了一种图像处理装置，该装置包括：存储器、处理器、通信接口及存储在该存储器上并可在该处理器上运行的计算机程序，其特征在于，该处理器执行该计算机程序时执行上述第二方面或第二方面的任意可能的实现方式中的方法。

第七方面，本申请提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行第一方面或第一方面的任意可能的实现方式中的方法的指令。

第八方面，本申请提供了一种计算机可读介质，用于存储计算机程序，该计算机程序包括用于执行第二方面或第二方面的任意可能的实现方式中的方法的指令。

第九方面，本申请提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面或第一方面的任意可能的实现方式中的方法。

第十方面，本申请提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第二方面或第二方面的任意可能的实现方式中的方法。

第十一方面，本申请提供了一种芯片，包括：输入接口、输出接口、至少一个处理器、存储器，所述输入接口、输出接口、所述处理器以及所述存储器之间通过内部连接通路互相通信，所述处理器用于执行所述存储器中的代码，当所述代码被执行时，所述处理器用于执行上述第一方面或第一方面的任意可能的实现方式中的方法。

第十二方面，本申请提供了一种芯片，包括：输入接口、输出接口、至少一个处理器、存储器，所述输入接口、输出接口、所述处理器以及所述存储器之间通过内部连接通路互相通信，所述处理器用于执行所述存储器中的代码，当所述代码被执行时，所述处理器用于执行上述第二方面或第二方面的任意可能的实现方式中的方法。

附图说明

图1是三维图像的高度、宽度和深度的示意图；

图2是卷积层实现卷积操作过程的示意图；

图3是池化层实现池化操作过程的示意图；

图4是亚像素卷积层实现亚像素卷积操作过程的示意图；

图5是本申请实施例提供的应用场景示意图；

图6是本申请实施例提供的图像处理方法的示意性流程图；

图7是本申请实施例提供的下采样处理的示意图；

图8是本申请实施例提供的采用不同尺寸的卷积核进行卷积操作的过程的示意图；

图9是本申请实施例提供的图像处理装置的示意性框图；

图10是本申请实施例提供的另一图像处理装置的示意性框图。

具体实施方式

为了清楚起见，首先对本申请中所使用的术语作以解释。

1、像素

像素是组成图像的最基本的元素，是一种逻辑尺寸单位。

2、图像的尺寸

图像的尺寸可以包括多个维度，当图像的维度为二维时，图像的尺寸包括高度和宽度；当图像的维度为三维时，图像的尺寸包括宽度、高度和深度。

应理解，图像的高度可以理解为该图像在高度方向上包括的像素的数量；图像的宽度可以理解为该图像在宽度方向上包括的像素的数量；图像的深度可以理解为该图像的通道数量。

在卷积神经网络模型中，图像的深度可以理解为图像包括的特征图(feature maps)的数量，其中，该图像的任意一张特征图的宽度和高度都与该图像的其他特征图的宽度和高度相同。

也就是说，一张图像为三维的图像，可以理解为该三维的图像是由多张二维的特征图构成的，且该多张二维的特征图的尺寸相同。

应理解，一张图像包括M张特征图、该M张特征图中每张特征图的高度为H个像素，给每个特征图的宽度为W个像素，可以理解为该图像为三维的图像，且该三维的图像的尺寸为H×W×M，也就是说，该三维的图像包括M张H×W的二维的特征图。其中，H、W为大于1的整数，M为大于0的整数。

图1示出了一张5×5×3的图像，该图像包括3张特征图(例如红色(red，R)特征图、绿色(green，G)特征图和蓝色(blue，B)特征图，每张特征图的尺寸为5×5。

应理解，不同色彩的特征图可以理解为是图像的不同通道，卷积神经网络中可以把不同的通道看作为不同的特征图。

还应理解，图1中仅以深度为3的图像为例进行描述，图像的深度还可以为其它取值，例如，例如灰度图像的深度为1，RGB-深度(depth，D)图像的深度为4等，本申请实施例对此不作限定。

还应理解，图像(或特征图)的分辨率可以理解为该图像(或特征图)的宽度与高度的积，即若图像(或特征图)的高度为H个像素，该图像(或特征图)的宽度为W个像素，则该图像(或特征图)的分辨率为H×W。

3、卷积核

卷积核是一种滤波器，用于提取图像的特征图。卷积核的尺寸包括宽度、高度和深度，其中，卷积核的深度与输入图像的深度相同。对一张输入图像使用多少种不同的卷积核进行卷积操作，就可以提取多少张不同的特征图。

例如，采用一个5×5×3的卷积核对7×7×3的输入图像进行卷积操作，可以得到一个输出特征图，采用多个不同的5×5×3的卷积核对7×7×3的输入图像进行卷积操作，可以得到多个不同的输出特征图。

4、卷积步长

卷积步长是指卷积核在输入图像的特征图上滑动提取该输入图像的特征图的过程中，该卷积核在高度方向和宽度方向上执行两次卷积操作之间滑动的距离。

应理解，卷积步长可以决定输入图像的下采样倍率，例如，在宽度(或高度)方向上的卷积步长为B，可以使输入特征图在宽度(或高度)方向上实现B倍的下采样，B为大于1的整数。

5、卷积层(convolutional layer)

在卷积神经网络中，卷积层主要起到作用是抽取特征的作用。主要是根据设定的卷积核，对输入图像进行卷积操作。

应理解，本申请实施例中所述的padding方式，均指same padding方式，但本申请实施例不限于此。

还应理解，假设输入特征图的宽度(或高度)为W，卷积核的宽度(或高度)为F，卷积步长为S，采用same padding方式进行卷积操作，该输入特征图填充的宽度(或高度)边界为P，则得到的输出特征图的宽度(或高度)可以表示为：

其中，W、F和S为大于0的整数，P为大于或等于0的整数，

代表对·向下取整。

图2中示出了卷积层对输入图像进行卷积操作的过程，三维的输入图像的尺寸为5×5×3，该输入图像填充的高度边界和宽度边界均为1个像素，得到7×7×3的输入图像，卷积操作在宽度方向和高度方向上的卷积步长为2，卷积操作采用卷积核w0进行卷积，卷积核w0的尺寸为3×3×3，将该输入图像包括的3张输入特征图(输入特征图1、输入特征图2和输入特征图3)分别与卷积核的三层深度(卷积核w0-1、卷积核w0-2和卷积核w0-3)进行卷积，得到输出特征图1，该输出特征图1的尺寸为3×3×2。

具体地，w0的第一层深度(即w0-1)和输入特征图1蓝色方框中对应位置的元素相乘再求和得到0，同理，卷积核w0的其他两个深度(即w0-2和w0-3)分别与输入特征图2和输入特征图3进行卷积操作，得到2和0，则图1中输出特征图1的第一个元素为0+2+0＝2。经过卷积核w0的第一次卷积操作后，蓝色方框依次沿着每个输入特征图的宽度方向和高度方向上滑动，继续进行下一次卷积操作，其中，每次滑动的距离为2(即宽度和高度方向上的卷积步长均为2)，直到完成对该输入图像的卷积操作，得到3×3×1的输出特征图1。

同理，若卷积操作还采用另1个卷积核w1对该输入图像进行卷积，基于与卷积核w0类似的过程，可以得到输出特征图2，该输出特征图2的尺寸为3×3×2。

可选地，还可以通过激活函数对该该输出特征图1和该输出特征图2进行激活，得到激活后的输出特征图1和激活后的输出特征图2。

6、池化层(padding layer)

池化层一方面使特征图的宽度和高度变小，通过减少特征层数据量降低卷积神经网络计算复杂度；一方面进行特征压缩，提取主要特征。

图3示出了池化层对输入图像进行池化操作的过程，输入图像为4×4×1的图像，通过2×2池化核对该输入图像进行max pooling操作，即在池化核滑过的每个区域中寻找最大值作为输出图像中的一个像素，输出图像中每个像素的位置与该每个像素所属的区域在该输入图像中的位置相同，其中，池化步长为2，最终在输入图像中提取主要特征得到输出图像。

7、反卷积层(deconvolution layer)

反卷积层也称反置卷积层(transposed convolution layer)，通过设定反卷积步长可以决定输入图像的下采样倍率，例如，在宽度(或高度)方向上的卷积步长为A，可以使输入特征图在宽度(或高度)方向上实现A倍的下采样，B为大于1的整数。

应理解，反卷积操作可以理解为如图2所示的卷积操作的逆过程。

还应理解，假设输入特征图的宽度(或高度)为W，卷积核的宽度(或高度)为F，反卷积步长为S，对输出特征图裁剪的宽度(或高度)边界为P，则得到的输出特征图的宽度(或高度)可以表示为：S×(W-1)+F-2P，其中，W、F和S为大于0的整数，P为大于或等于0的整数。

例如，在使用一个3×3×3的卷积核对5×5×1输入图像进行反卷积操作，将该输入图像的输入特征图中的每个像素与3×3反卷积核的第一层深度上的每个权重相乘，得到与该每个像素对应的3×3的图像块，将该图像块放置于一个7×7×1的输出特征图1上，且该图像块的中心位置为该每个像素的位置，相邻两个图像块的中心位置之间的距离等于反卷积步长。然后，将该输出特征图中每个像素上被赋予的多个值做累加，得到最终的一张输出特征图，同理，可得到通过反卷积核的第二层深度和第三层深度对输入特征图进行反卷积后得到输出特征图2和输出特征图3，然后对3个特征图边界1个像素进行裁剪得到5×5×3的输出图像。

8、亚像素卷积层(sub-pixel convolutional layer)

亚像素卷积层通过整合输入图像深度这一维度中的多张特征图，实现对输入图像的宽度和高度的整数比例放大的作用。

亚像素卷积操作可以被理解为一种对输入图像包括的特征图进行数据排列重组的方法。

例如，亚像素卷积层的输入特征层的尺寸为H×W×r ²(r是图像的放大倍数)时，亚像素卷积层将r ²个特征图中相同位置的像素重新排列成一个r×r的图像块，对应于输出特征图中的一个r×r的图像块，该r×r的图像块的中心位置为该每个像素，从而H×W×r ²的输入特征图被重新排列成rH×rW×1的输出特征图。这个变换虽然被称作亚像素卷积，但实际上并没有卷积操作，是对该r ²个H×W的输入特征图中像素的排列组合的过程。

例如，如图4所示，4个2×2的输入特征图，通过亚像素卷积层的亚像素卷积操作后，得到一个如图4中所示的输出特征图，该输出特征图的尺寸为4×4，应理解，为描述清楚起见，图4中每个像素上带括号的数字表示该像素的编号或标识，而不是该像素上的像素值。

应理解，本申请实施例提供的技术方案可以应用于各种需要对输入图像进行图像处理以得到相应地输出图像的场景，本申请实施例对此不作限定。

例如，如图5所示，本发明实施例的技术方案可以应用于终端设备，该终端设备可以为移动的或固定的，例如该终端设备可以是具有图像处理功能的移动电话、平板个人电脑(tablet personal computer，TPC)、媒体播放器、智能电视、笔记本电脑(laptop computer，LC)、个人数字助理(personal digital assistant，PDA)、个人计算机(personal computer，PC)、照相机、摄像机、智能手表、可穿戴式设备(wearable device，WD)等，本发明实施例对此不作限定。

图6示出了本申请实施例提供的图像处理方法600的示意性流程图，该方法例如可以由图像处理装置执行。

S610，获取第一图像。

S620，通过卷积神经网络的第一图像处理层对该第一图像进行B倍的下采样处理，得到第二图像，该卷积神经网络包括多个图像处理层，该多个图像处理层包括该第一图像处理层，其中，B为大于1的整数。

S630，通过该多个图像处理层中的第二图像处理层，该卷积神经网络的第二图像处理层对该第二图像进行A倍的上采样处理，得到第三图像，其中，A为大于1的整数，且A不等于B。

假设该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数。

应理解，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素、该每张第一特征图的宽度为W个像素，可以理解为该第一图像为三维的图像，该三维的第一图像的尺寸为H×W×M，即该第一图像的高度为H个像素、宽度为W个像素、深度为M个第一特征图，也就是说，该三维的第一图像包括M张H×W的二维的第一特征图。

例如，该第一图像为原始采集的待处理图像时，S610可以为从图像采集装置获取该第一图像；该第一图像为经过该卷积神经网络中的其他图像处理层处理后得到的图像时，S610可以为获取该其它图像处理层输出的该第一图像；该第一图像为经过其他图像处理装置处理后得到的图像时，S610可以为获取该其它图像处理装置输出的该第一图像。

应理解，本申请实施例中所述的卷积神经网络可以包括多个图像处理层，其中，该卷积神经网络的第一图像处理层可以包括该多个图像处理层中的一部分图像处理层，该卷积神经网络的第二图像处理层可以包括该多个图像处理层中的另一部分图像处理层，本申请实施例对此不作限定。

可选地，S620中，该图像处理装置可以通过该第一图像处理层采用多种不同操作，对该第一图像进行B倍的下采样处理，得到该第二图像，本申请实施例对此不作限定。

作为一个可选实施例，该图像处理装置通过该第一图像处理层将该每张第一特征图划分为互不重叠的(H×W)/B ²个图像块，该(H×W)/B ²个图像块中每个图像块的高度为B个像素，该每个图像块的宽度为B个像素；根据该(H×W)/B ²个图像块，得到B ²张第二特征图，该B ²张第二特征图中每张第二特征图的高度为H/B个像素，该每张第二特征图的宽度为W/B个像素，该每张第二特征图中的每个像素取自该(H×W)/B ²个图像块中的不同图像块，该每个像素在该每张第二特征图中的位置与该每个像素所属的图像块在该第一特征图中的位置相关联。其中，(H×W)/B ²、H/B和W/B均为整数。

例如，图6示出了4×4×1的输入图像经卷积神经网络进行处理得到输出图像的示意图，应理解，为描述清楚起见，图6中每个像素上带括号的数字为该像素的编号或标识，而不是该像素上的像素值。

如图6所示，该输入图像包括1张4×4的输入特征图，将该输入特征图划分为4个2×2的图像块；图像块1包括编号为1、2、5、6的像素，图像块2包括编号为3、4、7、8的像素，图像块3包括编号为9、10、13、14的像素，图像块4包括编号为11、12、15、16的像素；从每个图像块的左上角位置取出一个像素组成输出特征图1，其中，该输出特征图1中的每个像素在该输出特征图1中的相对位置与该每个像素所属的图像块在该输入特征图中的相对位置相同，即输出特征图1中编号为1、3、9、11的像素的相对位置与图像块1、2、3、4的相对位置相同。

也就是说，不管该输出特征图1沿任何方向平移，该输出特征图中包括的像素之间的相对位置是不变的。

同理，从每个图像块的右上角位置取出一个像素组成输出特征图2，从每个图像块的左下角位置取出一个像素组成输出特征图3，以及从每个图像块的右下角位置取出一个像素组成输出特征图4，即得到输出图像的尺寸为2×2×4。

作为另一个可选实施例，该图像处理装置通过该第一图像处理层对该M张第一特征图进行卷积操作，得到该第二图像，该卷积操作在宽度方向和高度方向上的卷积步长均为B，该卷积操作采用N个卷积核，该N个卷积核中每个卷积核的高度为K个像素，该每个卷积核的宽度为J个像素，该每个卷积核的深度为M个特征图，该每张第一特征图填充的高度边界为P个像素，该每张第一特征图填充的宽度边界为P个像素，该第二图像包括N个第二特征图，该N个第二特征图中每个第二特征图的高度为

个像素，该每个第二特征图的宽度为

可选地，该第一图像处理层例如可以为卷积层，但本申请实施例对此不作限定。

例如，图7示出了6×6×1的输入图像，通过same padding的卷积方式，高度方向和宽度方向上的卷积步长均为3个像素，当采用3个不同尺寸的卷积核例如，1×1×1、3×3×1和5×5×1进行卷积操作时，卷积过程的示意图。

由图7可以获知，(1)当卷积核的宽度(或高度)小于在宽度(或高度)方向上的卷积步长(例如图7中卷积核的尺寸为1×1×1，宽度和高度方向上的卷积步长为3个像素的卷积过程)时，相邻两次卷积操作中卷积核对应的卷积区域之间没有重叠，且卷积核滑动的过程中并没有覆盖到输入图像的所有像素，这种情况下，从信号源的方面考虑，输出图像会由于并没有使用该输入图像的全部像素计算而造成大量图像信息的流失。

(2)当卷积核的宽度(或高度)等于在宽度(或高度)方向上的卷积步长(例如图7中卷积核的尺寸为3×3×1，宽度和高度方向上的卷积步长为3个像素的卷积过程)时，相邻两次卷积操作中卷积核对应的卷积区域之间没有重叠，但卷积核滑动的过程中覆盖到输入图像的所有像素。

(3)当卷积核的宽度(或高度)大于在宽度(或高度)方向上的卷积步长(例如图7中卷积核的尺寸为5×5×1，宽度和高度方向上的卷积步长为3个像素的卷积过程)时，相邻两次卷积操作中卷积核对应的卷积区域之间有重叠，且卷积核滑动的过程中覆盖到输入图像的所有像素。

因此，在(2)和(3)这两种情况下，从信号源的方面考虑，输出图像并不会由于并没有使用输入图像的全部像素计算而造成大量图像信息的流失。

应理解，由于在抽象图像特征过程中会损失输入图像所携带的小部分图像信息，可以通过增加输出图像包括的特征图的数量以达到更好的保留这部分图像信息的目的。

因此，在采用方式二对该第一图像进行B倍的下采样处理时，M、N和B可以满足以下公式：N≥M×B/2，即按一定限定条件增加输出图像的深度，以达到弥补输入图像损失的图像信息的效果。

本申请实施例提供的图像处理方法，通过该第一图像处理层对该第一图像进行卷积操作，该卷积操作在宽度方向和高度方向上的卷积步长均为B，该卷积操作采用N个卷积核，该N个卷积核中每个卷积核的高度为K个像素，该每个卷积核的宽度为J个像素，该每个卷积核的深度为M个特征图，该第一图像填充的高度边界为P个像素，宽度边界为P个像素，能够实现对该第一图像的B倍下采样。

作为又一个可选实施例，该图像处理装置通过该第一图像处理层对该M张第一特征图进行池化操作，得到该第二图像，该池化操作在宽度方向和高度方向上的池化步长为B，该池化操作的池化核的高度为B个像素，该池化核的宽度为B个像素，该第二图像包括M张第二特征图，该M张第二特征图中每张第二特征图的高度为H/B个像素，该每张第二特征图的宽度为W/B个像素。其中，H/B和W/B均为整数。

可选地，该第一图像处理层可以为池化层，本申请实施例对此不作限定。

具体过程，可以参考上述术语解释中对池化层的解释以及图3，为避免重复，此处不再赘述。

可选地，该第一图像处理层可以包括P个子图像处理层，P为大于1的整数。

相应地，该图像处理装置通过该P个子图像处理层中的每个子图像处理层实现对该第一图像的B _i倍的下采样处理，其中，B _i满足以下公式：

其中，B _i>1。

可选地，S630中，该图像处理装置可以通过该第二图像处理层采用多种不同的操作，对该第二图像进行A倍的上采样处理，得到该第三图像，本申请实施例对此不作限定。

作为一个可选实施例，该图像处理装置可以通过该第二图像处理层对该第二图像进行反卷积操作，得到该第三图像，该反卷积操作在宽度和高度上的反卷积步长为A。

可选地，该第二图像处理层可以为反卷积层，但本申请实施例对此不作限定。

具体的上采样过程，可以参考上述术语解释中对反卷积层实现反卷积操作过程的解释，为避免重复，此处不再赘述。

作为另一个可选实施例，该图像处理装置可以通过该第二图像处理层对该第二图像进行亚像素卷积操作，则该图像处理装置对该第二图像进行亚像素卷积操作，得到第三图像，其中，该第三图像的宽度(或高度)为第二图像的宽度(或高度)的A倍，该第三图像的深度为该第二图像的深度的1/A。

可选地，该第二图像处理层可以为亚像素卷积层，但本申请实施例对此不作限定。

具体的上采样过程，可以参考上述术语解释中对亚像素卷积层实现亚像素卷积过程的解释以及图4，为避免重复，此处不再赘述。

可选地，该第二图像处理层可以包括Q个子图像处理层，Q为大于1的整数。

相应地，该图像处理装置通过该Q个子图像处理层中的每个子图像处理层实现对该第二图像的A _i倍的上采样处理，其中，A _i满足以下公式：

其中，A _i>1。

可选地，S630可以包括：该图像处理装置通过该第二图像处理层对该第二图像进行第一处理，得到第四图像，通过该第二图像处理层对该第四图像进行A倍的上采样处理，得到该第三图像。

其中，该第一处理可以为非采样处理(非采样处理包括非上采样处理和非下采样处理)，例如使用宽度方向和高度方向上的卷积步长为1的卷积操作对第二图像进行处理，或者采用激活函数对该第二图像进行处理等，本申请实施例对此不作限定。

应理解，本申请实施例中，该图像处理装置可以先对该第一图像进行整数倍下采样处理，得到第二图像，再对该第二图像进行整数倍的上采样处理，得到第三图像，以实现对该第一图像的非整数倍下采样或非整数倍的上采样，但本申请实施例的保护范围不应受限于此。相应地，该图像处理装置也可以先对第一图像进行A倍的上采样处理，得到第五图像，再对该第五图像进行B倍的下采样处理，得到第六图像，同样可以实现对该第一图像的非整数倍的下采样或非整数倍的上采样，因此，该方案也应在本申请实施例的保护范围内。

上面结合图1至图8详细描述了本申请实施例提供的图像处理方法，下面将结合图9至同10介绍本申请实施例提供的图像处理装置。

图9示出了本申请实施例提供的图像处理装置900的示意性框图。该装置900包括：

获取单元910，用于获取第一图像；

处理单元920，用于通过卷积神经网络的第一图像处理层对该获取单元910获取的该第一图像进行B倍的下采样处理，得到第二图像，该卷积神经网络包括多个图像处理层，该多个图像处理层包括该第一图像处理层，其中，B为大于1的整数；通过该多个图像处理层中的第二图像处理层对该第二图像进行A倍的上采样处理，得到第三图像，其中，A为大于1的整数，且A不等于B。

可选地，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该处理单元具体用于：将该每张第一特征图划分为互不重叠的(H×W)/B ²个图像块，该(H×W)/B ²个图像块中每个图像块的高度为B个像素，该每个图像块的宽度为B个像素；根据该(H×W)/B ²个图像块，得到B ²张第二特征图，该B ²张第二特征图中每张第二特征图的高度为H/B个像素，该每张第二特征图的宽度为W/B个像素，该每张第二特征图中的每个像素取自该(H×W)/B ²个图像块中的不同图像块，该每个像素在该每张第二特征图中的位置与该每个像素所属的图像块在该第一特征图中的位置相关联。其中，(H×W)/B ²、H/B和W/B均为整数。

可选地，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该处理单元具体用于通过该第一图像处理层对该M张第一特征图进行卷积操作，得到该第二图像，该卷积操作在宽度方向和高度方向上的卷积步长均为B，该卷积操作采用N个卷积核，该N个卷积核中每个卷积核的高度为K个像素，该每个卷积核的宽度为J个像素，该每个卷积核的深度为M个特征图，该每张第一特征图填充的高度边界为P个像素，该每张第一图像填充的宽度边界为P个像素，该第二图像包括N个第二特征图，该N个第二特征图中每个第二特征图的高度为

个像素，该每个第二特征图的宽度为

可选地，M、N和B满足以下公式：N≥M×B/2。

可选地，该第一图像包括M张第一特征图，该M张第一特征图中每张第一特征图的高度为H个像素，该每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；该处理单元具体用于通过该第一图像处理层对该M张第一特征图进行池化操作，得到该第二图像，该池化操作在宽度方向和高度方向上的池化步长为B，该池化操作的池化核的高度为B个像素，该池化核的宽度为B个像素，该第二图像包括M张第二特征图，该M张第二特征图中每张第二特征图的高度为H/B个像素，该每张第二特征图的宽度为W/B个像素。其中，H/B和W/B均为整数。

可选地，A和B为互质数。

应理解，这里的图像处理装置900以功能单元的形式体现。这里的术语“单元”可以指应用特有集成电路(application specific integrated circuit，ASIC)、电子电路、用于执行一个或多个软件或固件程序的处理器(例如共享处理器、专有处理器或组处理器等)和存储器、合并逻辑电路和/或其它支持所描述的功能的合适组件。在一个可选例子中，本领域技术人员可以理解，图像处理装置900可以具体为上述方法600实施例中的图像处理装置，图像处理装置900可以用于执行上述方法600实施例中与图像处理装置对应的各个流程和/或步骤，为避免重复，在此不再赘述。

图10示出了本申请实施例提供的图像处理装置1000的示意性框图，该图像处理装置1000可以为图9中所述的图像处理装置，该图像处理装置可以采用如图10所示的硬件架构。该图像处理装置可以包括处理器1010、通信接口1020和存储器1030，该处理器1010、通信接口1020和存储器1030通过内部连接通路互相通信。图9中的处理单元920所实现的相关功能可以由处理器1010来实现，获取单元910所实现的相关功能可以由处理器1010控制通信接口1020来实现。

该处理器1010可以包括是一个或多个处理器，例如包括一个或多个中央处理单元(central processing unit，CPU)，在处理器是一个CPU的情况下，该CPU可以是单核CPU，也可以是多核CPU。

该通信接口1020用于发送和/或接收数据。该通信接口可以包括发送接口和接收接口，发送接口用于发送数据，接收接口用于接收数据。

该存储器1030包括但不限于是随机存取存储器(random access memory，RAM)、只读存储器(read-only memory，ROM)、可擦除可编程存储器(erasable programmable read only memory，EPROM)、只读光盘(compact disc read-only memory，CD-ROM)，该存储器1030用于存储相关指令及数据。

存储器1030用于存储图像处理装置的程序代码和数据，可以为单独的器件或集成在处理器1010中。

具体地，所述处理器1010用于控制通信接口与其它装置，例如与其他图像处理装置进行数据传输。具体可参见方法实施例中的描述，在此不再赘述。

可以理解的是，图10仅仅示出了图像处理装置的简化设计。在实际应用中，图像检索装置还可以分别包含必要的其他元件，包含但不限于任意数量的通信接口、处理器、控制器、存储器等，而所有可以实现本申请的图像处理装置都在本申请的保护范围之内。

在一种可能的设计中，图像处理装置1000可以被替换为芯片装置，例如可以为可用于图像处理装置中的芯片，用于实现图像处理装置中处理器1010的相关功能。该芯片装置可以为实现相关功能的现场可编程门阵列，专用集成芯片，系统芯片，中央处理器，网络处理器，数字信号处理电路，微控制器，还可以采用可编程控制器或其他集成芯片。该芯片中，可选的可以包括一个或多个存储器，用于存储程序代码，当所述代码被执行时，使得处理器实现相应的功能。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

Claims

一种图像处理方法，其特征在于，包括：

获取第一图像；

通过卷积神经网络的第一图像处理层对所述第一图像进行B倍的下采样处理，得到第二图像，所述卷积神经网络包括多个图像处理层，所述多个图像处理层包括所述第一图像处理层，其中，B为大于1的整数；

通过所述多个图像处理层中的第二图像处理层对所述第二图像进行A倍的上采样处理，得到第三图像，其中，A为大于1的整数，且A不等于B。
根据权利要求1所述的方法，其特征在于，所述第一图像包括M张第一特征图，所述M张第一特征图中每张第一特征图的高度为H个像素，所述每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；

所述通过卷积神经网络的第一图像处理层对所述第一图像进行B倍的下采样处理，得到第二图像，包括：

将所述每张第一特征图划分为互不重叠的(H×W)/B ²个图像块，所述(H×W)/B ²个图像块中每个图像块的高度为B个像素，所述每个图像块的宽度为B个像素；

根据所述(H×W)/B ²个图像块，得到B ²张第二特征图，所述B ²张第二特征图中每张第二特征图的高度为H/B个像素，所述每张第二特征图的宽度为W/B个像素，所述每张第二特征图中的每个像素取自所述(H×W)/B ²个图像块中的不同图像块，所述每个像素在所述每张第二特征图中的位置与所述每个像素所属的图像块在所述第一特征图中的位置相关联。
根据权利要求1所述的方法，其特征在于，所述第一图像包括M张第一特征图，所述M张第一特征图中每张第一特征图的高度为H个像素，所述每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；

所述通过卷积神经网络的第一图像处理层对所述第一图像进行B倍的下采样处理，得到第二图像，包括：

通过所述第一图像处理层对所述M张第一特征图进行卷积操作，得到所述第二图像，所述卷积操作在宽度方向和高度方向上的卷积步长均为B，所述卷积操作采用N个卷积核，所述N个卷积核中每个卷积核的高度为K个像素，所述每个卷积核的宽度为J个像素，所述每个卷积核的深度为M个特征图，所述每张第一特征图填充的高度边界为P个像素，所述每张第一特征图填充的宽度边界为P个像素，所述第二图像包括N个第二特征图，所述N个第二特征图中每个第二特征图的高度为
个像素，所述每个第二特征图的宽度为
个像素，其中，N为大于0的整数，P为大于或等于0的整数，J和K大于或等于B。
根据权利要求3所述的方法，其特征在于，M、N和B满足以下公式：N≥M×B/2。
根据权利要求1所述的方法，其特征在于，所述第一图像包括M张第一特征图，所述M张第一特征图中每张第一特征图的高度为H个像素，所述每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；

所述通过卷积神经网络的第一图像处理层对所述第一图像进行B倍的下采样处理，得到第二图像，包括：

通过所述第一图像处理层对所述M张第一特征图中每张第一特征图进行池化操作，得到所述第二图像，所述池化操作在宽度方向和高度方向上的池化步长为B，所述池化操作的池化核的高度为B个像素，所述池化核的宽度为B个像素，所述第二图像包括M张第二特征图，所述M张第二特征图中每张第二特征图的高度为H/B个像素，所述每张第二特征图的宽度为W/B个像素。
根据权利要求1至5中任一项所述的方法，其特征在于，A和B为互质数。
一种图像处理装置，其特征在于，包括：

获取单元，用于获取第一图像；

处理单元，用于通过卷积神经网络的第一图像处理层对所述获取单元获取的所述第一图像进行B倍的下采样处理，得到第二图像，所述卷积神经网络包括多个图像处理层，所述多个图像处理层包括所述第一图像处理层，其中，B为大于1的整数；通过所述多个图像处理层中的第二图像处理层对所述第二图像进行A倍的上采样处理，得到第三图像，其中，A为大于1的整数，且A不等于B。
根据权利要求7所述的装置，其特征在于，所述第一图像包括M张第一特征图，所述M张第一特征图中每张第一特征图的高度为H个像素，所述每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；

所述处理单元具体用于：

将所述每张第一特征图划分为互不重叠的(H×W)/B ²个图像块，所述(H×W)/B ²个图像块中每个图像块的高度为B个像素，所述每个图像块的宽度为B个像素；

根据所述(H×W)/B ²个图像块，得到B ²张第二特征图，所述B ²张第二特征图中每张第二特征图的高度为H/B个像素，所述每张第二特征图的宽度为W/B个像素，所述每张第二特征图中的每个像素取自所述(H×W)/B ²个图像块中的不同图像块，所述每个像素在所述每张第二特征图中的位置与所述每个像素所属的图像块在所述第一特征图中的位置相关联。
根据权利要求7所述的装置，其特征在于，所述第一图像包括M张第一特征图，所述M张第一特征图中每张第一特征图的高度为H个像素，所述每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；

所述处理单元具体用于通过所述第一图像处理层对所述M张第一特征图进行卷积操作，得到所述第二图像，所述卷积操作在宽度方向和高度方向上的卷积步长均为B，所述卷积操作采用N个卷积核，所述N个卷积核中每个卷积核的高度为K个像素，所述每个卷积核的宽度为J个像素，所述每个卷积核的深度为M个特征图，所述每张第一特征图填充的高度边界为P个像素，所述每张第一图像填充的宽度边界为P个像素，所述第二图像包括N个第二特征图，所述N个第二特征图中每个第二特征图的高度为
个像素，所述每个第二特征图的宽度为
个像素，其中，N为大于0的整数，P为大于或等于0的整数，J和K大于或等于B。
根据权利要求9所述的装置，其特征在于，M、N和B满足以下公式：N≥M×B/2。
根据权利要求7所述的装置，其特征在于，所述第一图像包括M张第一特征图，所述M张第一特征图中每张第一特征图的高度为H个像素，所述每张第一特征图的宽度为W个像素，H和W为大于1的整数，M为大于0的整数；

所述处理单元具体用于通过所述第一图像处理层对所述M张第一特征图中每张第一特征图进行池化操作，得到所述第二图像，所述池化操作在宽度方向和高度方向上的池化步长为B，所述池化操作的池化核的高度为B个像素，所述池化核的宽度为B个像素，所述第二图像包括M张第二特征图，所述M张第二特征图中每张第二特征图的高度为H/B个像素，所述每张第二特征图的宽度为W/B个像素。
根据权利要求7至11中任一项所述的装置，其特征在于，A和B为互质数。
一种图像处理装置，所述装置包括存储器、处理器、通信接口及存储在所述存储器上并可在所述处理器上运行的指令，其中，所述存储器、所述处理器以及所述通信接口之间通过内部连接通路互相通信，其特征在于，所述处理器执行所述指令使得所述装置实现上述权利要求1至权利要求6中任一项所述的方法。
一种计算机可读介质，用于存储计算机程序，其特征在于，所述计算机程序包括用于实现上述权利要求1至权利要求6中任一项所述的方法的指令。
一种计算机程序产品，所述计算机程序产品中包含指令，其特征在于，当所述指令在计算机上运行时，使得计算机实现上述权利要求1至权利要求6中任一项所述的方法。