CN110555341B

CN110555341B - 池化方法和装置、检测方法和设备、电子设备、存储介质

Info

Publication number: CN110555341B
Application number: CN201810551982.1A
Authority: CN
Inventors: 高梓桁
Original assignee: Xilinx Technology Beijing Ltd
Current assignee: Xilinx Technology Beijing Ltd
Priority date: 2018-05-31
Filing date: 2018-05-31
Publication date: 2023-04-07
Anticipated expiration: 2038-05-31
Also published as: CN110555341A

Abstract

本发明公开了一种池化方法和装置、检测方法和设备、电子设备、存储介质。一种参数编码池化方法，用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图，包括：对于多个特征图中的每一个，将大小与该特征图划分出的各个不相交的特征矩阵单元相同的参数矩阵中的各参数与各特征矩阵单元中的对应位置的特征值相乘以实现参数编码，从而得到一个新特征图；以及采用压缩编码对新特征图的各特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图，由此实现特征图的池化。本发明的参数编码池化方法能够有效减少信息的丢失，大大提高目标检测的效率和性能。

Description

池化方法和装置、检测方法和设备、电子设备、存储介质

技术领域

本公开涉及图像处理领域，尤其涉及参数编码池化方法和参数编码池化装置、目标检测方法和目标检测设备、电子设备以及存储介质。

背景技术

目标检测技术是指给定一张图像或者一帧视频，通过一系列技术处理来确定其中是否存在目标(例如人脸)，若存在，则返回其位置和大小。该技术被大量应用在安防、生物识别等领域中，是目标识别(例如人脸识别)、目标关键点检测(例如人脸关键点检测)的先要技术，所以完善该技术的性能和准确率是至关重要的。

在过去，人们使用传统的视觉方法或者机器学习方法来寻找目标在一张图里的位置，例如最常用的Haar特征目标检测方法；如今，随着深度学习的发展，大量新的高效的目标检测方法不断涌出，例如DenseBox、MTCNN、TinyFace等。

上述这些方法都使用了由卷积和池化等方法构成的层次结构算法，其中，池化方法是一种下采样方法，即通过一种既定的选择方式(最大值或者平均值)进行采样，达到缩小特征图的目的。但是，这样的方法具有潜在的缺陷，即导致信息大量的缺失，这种信息的缺失会使得对于小脸的检测失效。

由此，如何在执行目标检测的特征缩小过程中有效减少重要信息的丢失，从而提高目标检测的效率和性能，是亟需解决的技术问题。

发明内容

鉴于上述技术问题，本发明提供了参数编码池化方法、目标检测方法、参数编码池化装置、目标检测装置、电子设备以及存储介质，使得在执行目标检测的特征缩小过程中有效减少信息的丢失，大大提高目标检测的效率和性能。

具体地，本发明提出一种用于目标检测的全新的池化方法，即，利用参数编码池化的目标检测技术，来取代之前的最大池化的目标检测技术。通过可学习的编码参数对特征图进行下采样，有效减少重信息丢失，从而大大提高目标检测的准确度和效率。

本发明提供一种参数编码池化方法，用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图，该参数编码池化方法包括：参数编码步骤，对于多个特征图中的每一个，将大小与该特征图划分出的各个不相交的特征矩阵单元相同的参数矩阵中的各参数与各特征矩阵单元中的对应位置的特征值相乘以实现参数编码，从而得到一个新特征图；以及压缩编码步骤，采用压缩编码对新特征图的各特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图，由此实现特征图的池化。

可选地，对于与不同的特征对应的各特征图，所用的参数矩阵不同。

可选地，每个特征图中的特征矩阵单元进行参数编码时所用的参数矩阵相同。

可选地，用于进行参数编码的参数矩阵是通过机器学习、实验、经验、或人为设定得到的。

可选地，所述压缩编码的方式包括对所述新特征图中的特征矩阵单元中的各值求和。

本发明提供一种目标检测方法，包括以下步骤：从输入图像得到多个特征图；通过使用上述的参数编码池化方法，对多个特征图进行下采样的编码池化操作，从而得到多个新的、特征数量减少的特征图；以及对所述多个新的、特征减少的特征图进行上采样放大操作，从而得到多个上采样的特征图；以及对所述多个上采样的特征图进行恢复操作，以得到目标检测结果。

可选地，该目标检测方法的检测目标是人脸。

本发明提供一种参数编码池化装置，用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图，其特征在于，该参数编码池化装置包括：参数编码模块，被配置为对于多个特征图中的每一个，将大小与该特征图划分出的各个不相交的特征矩阵单元相同的参数矩阵中的各参数与各特征矩阵单元中的对应位置的特征值相乘以实现参数编码，从而得到一个新特征图；以及压缩编码模块，被配置为采用压缩编码对新特征图的特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图，由此实现特征图的池化。

可选地，参数编码模块对于每个特征图中的特征矩阵单元进行参数编码时所用的参数矩阵相同。

本发明提供一种目标检测设备，包括：特征图获得装置，被配置为从输入图像得到多个特征图；上面描述的参数编码池化装置，被配置为对多个特征图进行下采样的编码池化操作，以得到多个新的、特征减少的特征图；以及上采样放大装置，被配置为对所述多个新的、特征减少的特征图进行上采样放大操作，从而得到多个上采样的特征图；以及恢复装置，被配置为对所述多个上采样的特征图进行恢复操作，以得到目标检测结果。

可选地，该目标检测设备的检测目标是人脸。

根据本发明的实施例的一种电子设备，包括：处理器；以及存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行本发明要求保护的方法中的任何一个。

根据本发明的实施例的一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行本发明要求保护的方法中的任何一个。

通过本发明的目标检测方法，能够有效减少信息的缺失，大大提高目标检测的效率和性能。

附图说明

通过结合附图对本公开示例性实施方式进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施方式中，相同的参考标号通常代表相同部件。

图1给出了最大池化的一个示意性例子。

图2给出了平均池化的一个示意性例子。

图3给出了本发明的参数编码池化方法的一个示意性例子。

图4给出了根据本发明的一个实施例的参数编码池化方法的示意性流程图。

图5给出了根据本发明的一个实施例的目标检测方法的示意性流程图。

图6给出了最大池化和本发明的参数编码池化的检测结果对比。

图7给出了使用本发明的参数编码池化方法的目标检测输出结果。

图8给出了根据本发明的一个实施例的参数编码池化装置的示意性框图。

图9给出了根据本发明的一个实施例的目标检测设备的示意性框图。

图10示出了根据本发明的一个实施例的电子设备。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式，然而应该理解，可以以各种形式实现本公开，而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。这里需要说明的是，本申请中的附图标记和数字以及序号仅是为了方便描述而给出的，对于本发明的步骤、顺序等等均不构成任何限制，除非在说明书中明确指出了步骤的先后顺序。

如上所述，池化方法是一种下采样方法，现有的池化方法一般通过一种既定的选择方式，最大值或者平均值来进行采样，可称为最大池化或平均池化，使得特征减少，以达到缩小特征图的目的。

具体来说，最大池化就是：如果把特征图划分为若干个不相交单元(可称为特征矩阵单元)，对于所划分成的每个特征矩阵单元中的特征取最大值，可以得到一个特征数量减少的新的特征图。图1示意性地给出了一个最大池化的例子，其中，特征图为4×4的矩阵，划分成的各特征矩阵单元为2×2的矩阵，通过本例子可以看出，经由最大池化的方式，N×N的特征图被压缩成了(N/2)×(N/2)的特征图。

平均池化就是：如果把特征图划分为若干个不相交单元(可称为特征矩阵单元)，对于所划分成的每个特征矩阵单元中的特征取平均值，可以得到一个特征数量减少的新的特征图。图2示意性地给出了一个平均池化的例子。同样，特征图为4×4的矩阵，划分成的各特征矩阵单元为2×2的矩阵，通过图2的例子可以看出，经由平均池化的方式，N×N的特征图被压缩成了(N/2)×(N/2)的特征图。

但是，从图1和图2可以看出，最大池化和平均池化导致了大量的信息丢失，以致严重影响目标检测的精确度和效率。

为了解决上述问题，本发明提出在目标检测过程中采用编码池化，以尽可能减少信息丢失。

由此，根据本发明的一种实施方式，提供了一种编码池化方法。

具体地，本发明的编码池化方法用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图，在本发明中，不是像现有技术那样单纯地直接取特征矩阵单元中的各特征值的最大值或平均值，而是通过用参数矩阵对每张特征图中划分出的各个不相交的特征矩阵单元进行参数编码来实现池化操作，如图3所示。

更具体地，在步骤S10，对于一个原特征图，将参数矩阵中的各参数与该特征图的各个不相交的特征矩阵单元中的对应位置的特征值相乘来实现参数编码，从而得到一个新特征图。

然后，在步骤S20，采用压缩编码方法对新特征图的特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图。

可选地，每个特征图中的特征矩阵单元进行参数编码时所用的参数矩阵可以相同。具体地，如图3所示，参数矩阵

中的各数值分别与原特征图中的各特征矩阵单元

中的相应位置的数值进行相乘，得到的结果是如图3所示的新特征图。

另一方面，对于与不同的特征相对应的多个特征图，所用的参数矩阵可以不同。例如，一个特征图所用的参数矩阵

另一个特征图所用的参数矩阵可以为

这里，用于进行参数编码的参数矩阵可以通过机器学习(例如通过神经网络)来得到，具体地，可以通过例如神经网络方法来获得参数矩阵的各个数值。而且，请注意，上面示出的特征图的特征矩阵和参数矩阵里元素的数值只是为了方便描述而给出的例子，实际这些矩阵的元素的数值不限于整数，可以是小数、负数、甚至是复数等等。

另外，用于进行参数编码的参数矩阵也可以通过实验、经验或者人为设定来得到。本发明对于参数矩阵的获得方式不加任何限制。

可选地，压缩编码的方式可以是对通过参数编码得到的新特征图中的特征矩阵单元中的各个值求和。当然也可以包括其它压缩编码方式，本发明对此不作任何限制。

从图1和图2可以看出，最大池化和平均池化对于不同的数据组成结构，输出都是相同的，这样导致了严重的信息丢失。而从图3可以看出，本发明的参数编码池化可以看作是一种编码过程，通过参数编码，将高维信息编码为低维的信息，这样就尽可能多地保留了上一层的信息，从而有效减少了信息的丢失，大大提高了目标检测的效果和性能。

根据本发明的一个实施例，提供一种目标检测方法。

如图5所示，根据本发明的一个实施例的目标检测方法包括以下步骤。

在步骤S1，通过例如神经网络等方法从输入图像得到多个特征图，这多个特征图对应于不同的特征，例如纹理、颜色等等。

在步骤S2，可以利用上面描述的参数编码池化方法，对多个特征图进行下采样的参数编码池化操作，从而得到多个新的、特征数量减少的特征图。

在步骤S3，对多个新的、特征减少的特征图进行上采样放大操作，从而得到多个上采样的特征图。

在步骤S4，对多个上采样的特征图进行恢复操作，以得到目标检测结果。

这里，本发明的目标检测方法的检测目标可以是人脸，也可以是物体，例如车辆、建筑物等等。本发明对此不作任何限制。

图6给出了本发明的参数编码池化(横向)和最大池化(纵向)的检测结果对比。可以清楚看出，如果原图中具有三个人脸，最大池化结果只保留一个人脸信息，然而通过本发明的参数编码池化，将三个人脸的信息编码到一个信息位中，虽然与最大池化和平均池化一样，特征数量都减少了，但是仍然可以准确地得到三个人脸，也就是说，本发明的参数编码池化方法可以保留更多的目标信息，大大减少了信息的丢失。

图7示出了根据本发明的一个实施例的目标检测过程和结果示意，其中，输入为要检测的图片，输出为检测出的人脸位置和大小。从图7可以看出，根据本发明的目标检测方法能够获得非常好的检测结果。

根据本发明的一个实施例，提供一种参数编码池化装置。

如图8所示，根据本发明的一个实施例的参数编码池化装置1000用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图。其中，该参数编码池化装置1000可以包括参数编码模块1001和压缩编码模块1002。

具体地，参数编码模块1001可以被配置为对于多个特征图中的每一个，将大小与该特征图划分出的各个不相交的特征矩阵单元相同的参数矩阵中的各参数与各特征矩阵单元中的对应位置的特征值相乘以实现参数编码，从而得到一个新特征图。

压缩编码模块1002可以被配置为采用压缩编码对新特征图的特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图，由此实现特征图的池化。

与上面所描述的参数编码池化方法类似，对于与不同的特征对应的各特征图，参数编码模块1001所用的参数矩阵不同。

另一方面，参数编码模块1002对于每个特征图中的特征矩阵单元进行参数编码时，可以采用相同的参数矩阵。

进一步地，用于进行参数编码的参数矩阵可以是通过机器学习(例如通过神经网络)、实验、经验、或人为设定而得到的，与上面所描述的参数编码池化方法中类似。

可选地，所述压缩编码的方式可以是对所述新特征图中的特征矩阵单元中的各值进行求和。

本发明的参数编码池化装置通过参数编码，将输入的高维信息编码为低维信息，这样就尽可能多地保留了上一层的信息，从而有效减少了信息的丢失，大大提高了目标检测的效果和性能。

需要注意，与上面所描述的参数编码池化方法类似，本发明中给出了一些数值和实现示例，但是这些仅是为了有助于描述和理解而给出的，因此它们并不构成对本发明的限定。

根据本发明的一个实施例，提供一种目标检测设备。

如图9所示，根据本发明的一个实施例的目标检测设备100包括特征图获得装置101、参数编码池化装置102、上采样放大装置103以及恢复装置104。

具体地，特征图获得装置101可以被配置为通过例如神经网络方法从输入图像得到多个特征图。

参数编码池化装置102可以被配置为对多个特征图进行下采样的编码池化操作，以得到多个新的、特征减少的特征图。这里的参数编码池化装置102可以是上面描述的参数编码池化装置1000。

上采样放大装置103可以被配置为对多个新的、特征减少的特征图进行上采样放大操作，从而得到多个上采样的特征图。

恢复装置104可以被配置为对多个上采样的特征图进行恢复操作，以得到目标检测结果。

可选地，与上面描述的类似，该目标检测设备100的检测目标可以是人脸，也可以是物体，本发明对此不作任何限制。

本发明的目标检测设备能够有效减少信息的丢失，大大提高目标检测的效果和性能。

图10示出了根据本发明实施例的可用于实现上述方法的处理的电子设备的结构示意图。

参见图10，电子设备1包括存储器10和处理器20。

处理器20可以是一个多核的处理器，也可以包含多个处理器。在一些实施例中，处理器20可以包含一个通用的主处理器以及一个或多个特殊的协处理器，例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中，处理器20可以使用定制的电路实现，例如特定用途集成电路(ASIC，Application Specific Integrated Circuit)或者现场可编程逻辑门阵列(FPGA，Field Programmable Gate Arrays)。

存储器10可以包括各种类型的存储单元，例如系统内存、只读存储器(ROM)，和永久存储装置。其中，ROM可以存储处理器20或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外，存储器10可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片(DRAM，SRAM，SDRAM，闪存，可编程只读存储器)，磁盘和/或光盘也可以采用。在一些实施方式中，存储器10可以包括可读和/或写的可移除的存储设备，例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM，双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器10上存储有可处理代码，当可处理代码被处理器20处理时，可以使处理器20执行上文述及的方法。

上文中已经参考附图详细描述了根据本发明的实施例的参数编码池化和目标检测方法。

此外，本发明还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。

或者，本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质)，其上存储有可执行代码(或计算机程序、或计算机指令代码)，当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时，使所述处理器执行根据本发明的上述方法的各个步骤。

本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims

1.一种目标检测方法，包括以下步骤：

从输入图像得到多个特征图；

通过使用参数编码池化方法，对多个特征图进行下采样的编码池化操作，从而得到多个新的、特征数量减少的特征图；以及

对所述多个新的、特征减少的特征图进行上采样放大操作，从而得到多个上采样的特征图；以及

对所述多个上采样的特征图进行恢复操作，以得到目标检测结果，

其中，所述参数编码池化方法用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图，并且包括：

参数编码步骤，对于多个特征图中的每一个，将大小与该特征图划分出的各个不相交的特征矩阵单元相同的参数矩阵中的各参数与各特征矩阵单元中的对应位置的特征值相乘以实现参数编码，从而得到一个新特征图，所述参数矩阵的参数分别包括1、2、4、8，所述特征值的取值为0或1；以及

压缩编码步骤，采用压缩编码对新特征图的各特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图，由此实现特征图的池化，其中，所述压缩编码的方式包括对所述新特征图中的特征矩阵单元中的各值求和。

2.如权利要求1所述的目标检测方法，其特征在于，该目标检测方法的检测目标是人脸。

3.一种目标检测设备，包括：

特征图获得装置，被配置为从输入图像得到多个特征图；

参数编码池化装置，被配置为对多个特征图进行下采样的编码池化操作，以得到多个新的、特征减少的特征图；以及

上采样放大装置，被配置为对所述多个新的、特征减少的特征图进行上采样放大操作，从而得到多个上采样的特征图；以及

恢复装置，被配置为对所述多个上采样的特征图进行恢复操作，以得到目标检测结果，

其中，所述参数编码池化装置用于对从输入图像得到的多个特征图进行池化操作以得到特征数量减少的新的特征图，并且包括：

参数编码模块，被配置为对于多个特征图中的每一个，将大小与该特征图划分出的各个不相交的特征矩阵单元相同的参数矩阵中的各参数与各特征矩阵单元中的对应位置的特征值相乘以实现参数编码，从而得到一个新特征图，所述参数矩阵的参数分别包括1、2、4、8，所述特征值的取值为0或1；以及

压缩编码模块，被配置为采用压缩编码对新特征图的特征矩阵单元进行压缩，从而得到一个编码后的特征数量减少了的新特征图，由此实现特征图的池化，其中，所述压缩编码的方式包括对所述新特征图中的特征矩阵单元中的各值求和。

4.如权利要求3所述的目标检测设备，其特征在于，该目标检测设备的检测目标是人脸。

5.一种电子设备，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1或2所述的方法。

6.一种非暂时性机器可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1或2所述的方法。