CN108875486A

CN108875486A - 目标对象识别方法、装置、系统和计算机可读介质

Info

Publication number: CN108875486A
Application number: CN201710898022.8A
Authority: CN
Inventors: 林浩彬
Original assignee: Beijing Megvii Technology Co Ltd; Beijing Maigewei Technology Co Ltd
Current assignee: Beijing Megvii Technology Co Ltd; Beijing Maigewei Technology Co Ltd
Priority date: 2017-09-28
Filing date: 2017-09-28
Publication date: 2018-11-23

Abstract

本发明提供了一种目标对象识别方法、装置、系统和计算机可读介质，所述目标对象识别方法包括：获取待识别图像；利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像；以及基于所述去模糊图像进行目标对象的特征提取和识别。根据本发明实施例的目标对象识别方法、装置、系统和计算机可读介质基于训练好的去模糊神经网络对待识别图像进行去模糊处理，使得特征提取在更加清晰的目标对象上进行，从而能够解决模糊图像对识别的干扰问题，提高目标对象识别的准确率和效率。

Description

目标对象识别方法、装置、系统和计算机可读介质

技术领域

本发明涉及对象识别技术领域，更具体地涉及一种目标对象识别方法、装置、系统和计算机可读介质。

背景技术

对于图像中某对象的识别(例如人脸识别)，现有的方法常常是从输入图像上提取识别特征，然后进行匹配和识别。然而，在各种对象识别(例如人脸识别)的真实场景中，大量存在图像模糊现象，现有的方法缺乏图像去模糊的针对性预处理，而图像模糊现象可能严重干扰对目标对象的识别，严重降低了识别精度。

发明内容

为了解决上述问题，本发明提出了一种关于目标对象识别的方案，其不仅可以用于人脸识别，也可以用于任何目标对象的识别。下面简要描述本发明提出的关于目标对象识别的方案，更多细节将在后续结合附图在具体实施方式中加以描述。

根据本发明一方面，提供了一种目标对象识别方法，所述目标对象识别方法包括：获取待识别图像；利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像；以及基于所述去模糊图像进行目标对象的特征提取和识别。

在本发明的一个实施例中，所述利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像包括：利用所述去模糊神经网络得到所述待识别图像的重建残差，并将所述重建残差与所述待识别图像相加以得到所述去模糊图像。

在本发明的一个实施例中，所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层，其中：所述第一卷积层输出与原始输入图像尺寸相同的第一特征层；所述卷积池化层包括依次连接的反池化层和第三卷积层，所述卷积池化层输出与所述原始输入图像相比尺寸按比例缩小的第二特征层；所述反池化卷积层包括依次连接的反池化层和第三卷积层，所述反池化卷积层输出按比例增大的第三特征层，所述至少一层反池化卷积层中的最后一层反池化卷积层输出的第三特征层的尺寸与所述原始输入图像的尺寸相同；以及所述第四卷积层输出重建残差，所述重建残差与原始输入图像相加的结果为重建的去模糊图像。

在本发明的一个实施例中，所述卷积池化层与所述反池化卷积层的数目相等。

在本发明的一个实施例中，所述去模糊神经网络还包括跳跃连接，所述跳跃连接用于将相同尺寸的特征层拼接在一起。

在本发明的一个实施例中，所述去模糊神经网络还包括第五卷积层，所述第五卷积层与所述反池化卷积层连接，用于减少因所述特征层的拼接而导致增加的通道数。

在本发明的一个实施例中，所述去模糊神经网络的训练所基于的样本是模糊图像集，所述模糊图像集中的模糊图像是通过对包括目标对象的清晰图像实施图像模糊算法而得到的。

在本发明的一个实施例中，所述基于所述去模糊图像进行目标对象的特征提取和识别，包括：基于所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。

在本发明的一个实施例中，所述训练好的去模糊神经网络与所述特征提取网络连在一起，所述去模糊神经网络与所述特征提取网络被进行共同调优训练，以用于所述目标对象的识别。

在本发明的一个实施例中，所述目标对象为人脸。

根据本发明另一方面，提供了一种目标对象识别装置，所述目标对象识别装置包括：获取模块，用于获取待识别图像；去模糊模块，用于利用训练好的去模糊神经网络对所述获取模块获取到的所述待识别图像进行去模糊操作以生成去模糊图像；以及识别模块，用于基于所述去模糊模块生成的所述去模糊图像进行目标对象的特征提取和识别。

在本发明的一个实施例中，所述去模糊模块进一步用于：利用所述去模糊神经网络得到所述获取模块获取到的所述待识别图像的重建残差，并将所述重建残差与所述待识别图像相加以得到所述去模糊图像。

在本发明的一个实施例中，所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层，其中：所述第一卷积层输出与原始输入图像尺寸相同的第一特征层；所述卷积池化层包括依次连接的第二卷积层和池化层，所述卷积池化层输出与所述原始输入图像相比尺寸按比例缩小的第二特征层；所述反池化卷积层包括依次连接的反池化层和第三卷积层，所述反池化卷积层输出按比例增大的第三特征层，所述至少一层反池化卷积层中的最后一层反池化卷积层输出的第三特征层的尺寸与所述原始输入图像的尺寸相同；以及所述第四卷积层输出重建残差，所述重建残差与原始输入图像相加的结果为重建的去模糊图像。

在本发明的一个实施例中，所述识别模块进一步用于：基于所述去模糊模块生成的所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。

在本发明的一个实施例中，所述目标对象为人脸。

根据本发明又一方面，提供了一种目标对象识别系统，所述目标对象识别系统包括存储装置和处理器，所述存储装置上存储有由所述处理器运行的计算机程序，所述计算机程序在被所述处理器运行时执行上述任一项所述的目标对象识别方法。

根据本发明再一方面，提供了一种计算机可读介质，所述计算机可读介质上存储有计算机程序，所述计算机程序在运行时执行上述任一项所述的目标对象识别方法。

根据本发明实施例的目标对象识别方法、装置、系统和计算机可读介质基于训练好的去模糊神经网络对待识别图像进行去模糊处理，使得特征提取在更加清晰的目标对象上进行，从而能够解决模糊图像对识别的干扰问题，提高目标对象识别的准确率和效率。

附图说明

通过结合附图对本发明实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解，并且构成说明书的一部分，与本发明实施例一起用于解释本发明，并不构成对本发明的限制。在附图中，相同的参考标号通常代表相同部件或步骤。

图1示出用于实现根据本发明实施例的目标对象识别方法、装置、系统和计算机可读介质的示例电子设备的示意性框图；

图2示出根据本发明实施例的目标对象识别方法的示意性流程图；

图3A示出根据本发明实施例的去模糊神经网络的结构模型的示意图；

图3B示出根据本发明另一实施例的去模糊神经网络的结构模型的示意图；

图4示出根据本发明实施例的目标对象识别装置的示意性框图；以及

图5示出根据本发明实施例的目标对象识别系统的示意性框图。

具体实施方式

为了使得本发明的目的、技术方案和优点更为明显，下面将参照附图详细描述根据本发明的示例实施例。显然，所描述的实施例仅仅是本发明的一部分实施例，而不是本发明的全部实施例，应理解，本发明不受这里描述的示例实施例的限制。基于本发明中描述的本发明实施例，本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本发明的保护范围之内。

首先，参照图1来描述用于实现本发明实施例的目标对象识别方法、装置、系统和计算机可读介质的示例电子设备100。

如图1所示，电子设备100包括一个或多个处理器102、一个或多个存储装置104、输入装置106、输出装置108以及图像采集装置110，这些组件通过总线系统112和/或其它形式的连接机构(未示出)互连。应当注意，图1所示的电子设备100的组件和结构只是示例性的，而非限制性的，根据需要，所述电子设备也可以具有其他组件和结构。

所述处理器102可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制所述电子设备100中的其它组件以执行期望的功能。

所述存储装置104可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器102可以运行所述程序指令，以实现下文所述的本发明实施例中(由处理器实现)的客户端功能以及/或者其它期望的功能。在所述计算机可读存储介质中还可以存储各种应用程序和各种数据，例如所述应用程序使用和/或产生的各种数据等。

所述输入装置106可以是用户用来输入指令的装置，并且可以包括键盘、鼠标、麦克风和触摸屏等中的一个或多个。

所述输出装置108可以向外部(例如用户)输出各种信息(例如图像或声音)，并且可以包括显示器、扬声器等中的一个或多个。

所述图像采集装置110可以采集用户期望的图像(例如照片、视频等)，并且将所采集的图像存储在所述存储装置104中以供其它组件使用。图像采集装置110可以是摄像头。应当理解，图像采集装置110仅是示例，电子设备100可以不包括图像采集装置110。在这种情况下，可以利用其他图像采集装置采集待识别图像，并将采集的待识别图像发送给电子设备100。

示例性地，用于实现根据本发明实施例的目标对象识别方法和装置的示例电子设备可以被实现为诸如智能手机、平板电脑等。

下面，将参考图2描述根据本发明实施例的目标对象识别方法200。如图2所示，目标对象识别方法200可以包括如下步骤：

在步骤S210，获取待识别图像。

在一个实施例中，所获取的待识别图像可以为包括待识别的目标对象的图像。在一个示例中，目标对象可以为任意一种类别或多种类别的对象(如人脸、动物、各种物体等)。

在一个示例中，所获取的待识别图像可以为实时采集的图像。在其他示例中，所获取的待识别图像也可以为来自任何源的图像。此处，所获取的待识别图像可以为图片数据，也可以为视频数据。

在步骤S220，利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像。

在一个实施例中，可以首先训练去模糊神经网络。去模糊神经网络的训练可以包括样本生成阶段和基于所生成样本进行去模糊训练的训练阶段。

在样本生成阶段，示例性地，可以收集一批(例如数量为5000以上或其他合适的数量)包括待识别的目标对象(例如人脸)的、带标注的清晰图像；然后，对于每一张清晰图像，用图像模糊算法生成相应的模糊图像，以得到模糊图像集。其中，图像模糊算法可以包括但不限于对清晰图像加入高斯模糊、高斯噪声、缩放模糊等。

此处，“清晰图像”可以理解为能够准确地对其进行目标对象的识别、基本不会干扰目标对象的识别的图像。相应地，“模糊图像”可以理解为无法准确地对其进行目标对象的识别、会干扰目标对象的识别的图像。

在去模糊训练阶段，可以包括去模糊神经网络的结构的设计以及对该结构模型的训练。

在一个实施例中，去模糊神经网络可以是深度神经网络，根据实际需求可以有多种不同计算量、不同深度的结构设计。下面结合图3A和图3B描述根据本发明实施例的去模糊神经网络300和300’的结构模型的示意图。

如图3A所示，去模糊神经网络300包括依次连接的输入层301、第一卷积层302、第二卷积层303、池化层304、反池化层305、第三卷积层306以及第四卷积层307。

其中，输入层301输入原始输入图像(也即模糊图像)I。第一卷积层302输出与原始输入图像I尺寸相同的第一特征层F1。在一个示例中，第一卷积层302所包括的滤波器的数目为8，滤波器大小为3×3。因此，第一特征层F1为8通道的特征层。当然，这仅是示例性的，第一卷积层302所包括的滤波器的数目及滤波器的大小也可以为其他合适的设置，这取决于对去模糊神经网络300的要求和/或其他需求。类似地，下面将描述的第二卷积层、第三卷积层、第四卷积层、第五卷积层所包括的滤波器的数目及滤波器的大小也是示例性的，其还可以为其他合适的设置。

第二卷积层303连接池化层304组成卷积池化层(或称为卷积+池化层)，其输出与原始输入图像I相比尺寸按比例缩小的第二特征层。示例性地，第二卷积层303和池化层304的数目可以为多个，且彼此相等，例如如图3A所示的，去模糊神经网络300包括形成依次连接的三个卷积池化层，分别为卷积池化层310(1)、310(2)和310(3)，它们分别输出的第二特征层为F2(1)、F2(2)和F2(3)。其中每个卷积池化层包括依次连接的第二卷积层303和池化层304。

其中，示例性地，卷积池化层310(1)、310(2)和310(3)中的第二卷积层303所包括的滤波器的大小可以相同，例如均为3×3，但其所包括的滤波器的数目可以不同。在一个示例中，卷积池化层310(1)、310(2)和310(3)各自中的第二卷积层303所包括的滤波器的数目可以分别为16、32和64。因此，第二特征层F2(1)为16通道，且其尺寸为原始输入图像I的尺寸的二分之一；第二特征层F2(2)为32通道，且其尺寸为原始输入图像I的尺寸的四分之一；第二特征层F2(3)为64通道，且其尺寸为原始输入图像I的尺寸的八分之一。

反池化层305连接第三卷积层306组成反池化卷积层(或称为反池化+卷积层)，其输出按比例增大的第三特征层，最后一层反池化层305输出的第三特征层的尺寸与原始输入图像I的尺寸相同。示例性地，反池化层305和第三卷积层306的数目可以为多个，且彼此相等，且与第二卷积层303和池化层304的数目均相等，即卷积池化层与反池化卷积层的数目相等。例如如图3A所示的，去模糊神经网络300包括依次连接的三个反池化卷积层，分别为反池化卷积层320(1)、320(2)和320(3)，它们分别输出的第三特征层为F3(1)、F3(2)和F3(3)。其中每个反池化卷积层包括依次连接的反池化层305和第三卷积层306。

其中，示例性地，反池化卷积层320(1)、320(2)和320(3)中的第三卷积层306所包括的滤波器的大小可以相同，例如均为3×3，但其所包括的滤波器的数目可以不同。在一个示例中，反池化卷积层320(1)、320(2)和320(3)各自中的第三卷积层306所包括的滤波器的数目可以分别为32、16和8。因此，第三特征层F3(1)为32通道，且其尺寸为原始输入图像I的尺寸的四分之一；第三特征层F3(2)为16通道，且其尺寸为原始输入图像I的尺寸的二分之一；第三特征层F3(3)为8通道，且其尺寸等于原始输入图像I的尺寸。

最后，第三特征层F3(3)经由第四卷积层307后输出重建残差R，所述重建残差R与原始输入图像I相加的结果为重建的去模糊图像。

在另一实施例中，去模糊神经网络还可以包括跳跃连接，如图3B中所示的，所述跳跃连接用于将相同尺寸的特征层拼接在一起。图3B示出了根据本发明另一实施例的去模糊神经网络300’的结构模型的示意图。去模糊神经网络300’的结构与去模糊神经网络300的结构类似，不同之处在于，去模糊神经网络300’包括跳跃连接。为了简洁，与去模糊神经网络300相同的部分不再描述。

如图3B所示的，第二特征层F2(2)与第三特征层F3(1)拼接在一起，第二特征层F2(1)与第三特征层F3(2)拼接在一起，第一特征层F1与第三特征层F3(3)拼接在一起。将相同尺寸的两个特征层拼接起来，能够保留图像的更多细节信息，更有助于后续的识别处理。

由于拼接的关系，使得拼接在一起的特征层的通道数变为原来的2倍。基于此，在一个实施例中，去模糊神经网络300’还可以包括第五卷积层308，第五卷积层308可连接到被拼接了特征的特征层，即连接到用于输出被拼接了特征的特征层的反池化卷积层，用于减少因特征层的拼接而导致增加的通道数。第五卷积层308的数量可以与通过跳跃连接拼接得到的特征层的数量相同。如图3B所示的，由于拼接在一起的特征层有三个，因此可包括三个第五卷积层308，其分别连接到反池化卷积层320(1)、320(2)和320(3)，每个第五卷积层308可将因拼接变为2倍通道数的特征层变回原来的通道数。示例性地，第五卷积层308可以为1×1大小的滤波器。将拼接得到的特征层的通道数减少为与原特征层的通道数相同可以降低计算量。

最后，第一特征层F1与第三特征层F3(3)拼接在一起后又被第五卷积层308减通道后形成的特征层经由第四卷积层307后输出重建残差R，所述重建残差R与原始输入图像I相加的结果为重建的去模糊图像。

以上示例性地描述了去模糊神经网络的示意性结构，应理解，其仅是示例性的，还可以采用其他合适的结构。例如，卷积池化层的层数还可以为4层、5层或其他合适的层数，反池化卷积层的层数相应也可以为4层、5层或其他合适的层数。再如，去模糊神经网络中可以不采用跳跃连接的结构。相应地，可以无需采用1×1滤波器(即第五卷积层)进行降通道处理。

基于上述去模糊神经网络的结构模型，可以对其进行训练。在一个实施例中，去模糊神经网络的训练可以包括：对比去模糊神经网络输出的重建图像与相应原始清晰图像，确定损失函数，并根据损失函数优化去模糊神经网络中参数的取值。示例性地，每次训练可以使用512对图像，每轮训练50次，训练5000轮。每次训练确定去模糊神经网络的损失函数，并根据损失函数优化去模糊神经网络中的参数的取值。经过多次训练，当损失函数的值最小化时，得到训练好的去模糊神经网络。

现在返回参考图2，基于训练好的去模糊神经网络，可以对步骤S210中所获取的待识别图像进行去模糊操作以生成去模糊图像。

在步骤S230，基于所述去模糊图像进行目标对象的特征提取和识别。

在一个实施例中，对目标对象的特征提取可以基于特征提取网络，即可以基于所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。

在一个示例中，在训练好的去模糊神经网络接入特征提取网络之前，去模糊神经网络的参数被冻结，特征提取网络被进行预热训练。也就是说，特征提取网络的训练可以独立于去模糊神经网络的训练，互不干扰。

在一个实施例中，当训练好的去模糊神经网络连接到特征提取网络之后，去模糊神经网络的参数被解冻，去模糊神经网络与特征提取网络被进行共同调优训练，以用于目标对象的识别。在去模糊神经网络与特征提取网络各自训练完成并相互连接在一起之后，可以对其进行共同调优训练，以形成更为优化的整体网络用于目标对象的识别。

基于上面的描述，根据本发明实施例的目标对象识别方法基于训练好的去模糊神经网络对待识别图像进行去模糊处理，使得特征提取在更加清晰的目标对象上进行，从而能够解决模糊图像对识别的干扰问题，提高目标对象识别的准确率和效率。

此外，根据本发明实施例的目标对象识别方法中的去模糊神经网络中可以使用跳跃连接和残差结构，如上所述的，可以显著改善去模糊效果。进一步地，根据本发明实施例的目标对象识别方法中的去模糊神经网络中可以对接各种特征提取网络，适应能力强，应用范围广。另外，根据本发明实施例的目标对象识别方法对模糊图片有明显改善效果，提升了后续人脸识别表现，对于清晰图片则不会产生影响。

以上示例性地描述了根据本发明实施例的目标对象识别方法。示例性地，根据本发明实施例的目标对象识别方法可以在具有存储器和处理器的设备、装置或者系统中实现。

此外，根据本发明实施例的目标对象识别方法处理速度快，可以方便地部署到智能手机、平板电脑、个人计算机等移动设备上。替代地，根据本发明实施例的目标对象识别方法还可以部署在服务器端(或云端)。替代地，根据本发明实施例的目标对象识别方法还可以分布地部署在服务器端(或云端)和个人终端处。

下面结合图4描述本发明另一方面提供的目标对象识别装置。图4示出了根据本发明实施例的目标对象识别装置400的示意性框图。

如图4所示，根据本发明实施例的目标对象识别装置400包括获取模块410、去模糊模块420以及识别模块430。所述各个模块可分别执行上文中结合图2描述的目标对象识别方法的各个步骤/功能。以下仅对目标对象识别装置400的各模块的主要功能进行描述，而省略以上已经描述过的细节内容。

获取模块410用于获取待识别图像。去模糊模块420用于利用训练好的去模糊神经网络对所述获取模块获取到的所述待识别图像进行去模糊操作以生成去模糊图像。识别模块430用于基于所述去模糊模块生成的所述去模糊图像进行目标对象的特征提取和识别。获取模块410、去模糊模块420以及识别模块430均可以由图1所示的电子设备中的处理器102运行存储装置104中存储的程序指令来实现。

在一个实施例中，获取模块410所获取的待识别图像可以为包括待识别的目标对象的图像。在一个示例中，目标对象可以为任意一种类别或多种类别的对象(如人脸、动物、各种物体等)。

在一个示例中，获取模块410所获取的待识别图像可以为实时采集的图像。在其他示例中，获取模块410所获取的待识别图像也可以为来自任何源的图像。此处，获取模块410所获取的待识别图像可以为图片数据，也可以为视频数据。

在一个实施例中，去模糊模块420所利用的去模糊神经网络的训练可以包括样本生成阶段和基于所生成样本进行去模糊训练的训练阶段。

在一个实施例中，去模糊神经网络可以是深度神经网络，根据实际需求可以有多种不同计算量、不同深度的结构设计。

在一个实施例中，所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层，其中：所述第一卷积层输出与原始输入图像尺寸相同的第一特征层；所述卷积池化层包括依次连接的第二卷积层和池化层，所述卷积池化层输出与所述原始输入图像相比尺寸按比例缩小的第二特征层；所述反池化卷积层包括依次连接的反池化层和第三卷积层，所述反池化卷积层输出按比例增大的第三特征层，所述至少一层反池化卷积层中的最后一层反池化卷积层输出的第三特征层的尺寸与所述原始输入图像的尺寸相同；以及所述第四卷积层输出重建残差，所述重建残差与原始输入图像相加的结果为重建的去模糊图像。

在一个实施例中，所述卷积池化层与所述反池化卷积层的数目相等。

在一个实施例中，所述去模糊神经网络还包括跳跃连接，所述跳跃连接用于将相同尺寸的特征层拼接在一起。

在一个实施例中，所述去模糊神经网络还包括第五卷积层，所述第五卷积层与所述反池化卷积层连接，用于减少因所述特征层的拼接而导致增加的通道数。

可以参照图3A和图3B理解根据本发明实施例的目标对象识别装置400的去模糊模块420所利用的去模糊神经网络的示例性结构，为了简洁，此处不再赘述。

基于上述去模糊神经网络的结构模型，可以对其进行训练。在一个实施例中，去模糊模块420所利用的去模糊神经网络的训练可以包括：对比去模糊神经网络输出的重建图像与相应原始清晰图像，确定损失函数，并根据损失函数优化去模糊神经网络中参数的取值。示例性地，每次训练可以使用512对图像，每轮训练50次，训练5000轮。每次训练确定去模糊神经网络的损失函数，并根据损失函数优化去模糊神经网络中的参数的取值。经过多次训练，当损失函数的值最小化时，得到训练好的去模糊神经网络。

在一个实施例中，识别模块430对目标对象的特征提取可以基于特征提取网络，即识别模块430可以基于所述去模糊模块420生成的所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。在一个示例中，在训练好的去模糊神经网络接入特征提取网络之前，去模糊神经网络的参数被冻结，特征提取网络被进行预热训练。也就是说，特征提取网络的训练可以独立于去模糊神经网络的训练，互不干扰。

基于上面的描述，根据本发明实施例的目标对象识别装置基于训练好的去模糊神经网络对待识别图像进行去模糊处理，使得特征提取在更加清晰的目标对象上进行，从而能够解决模糊图像对识别的干扰问题，提高目标对象识别的准确率和效率。

此外，根据本发明实施例的目标对象识别装置中的去模糊神经网络中可以使用跳跃连接和残差结构，可以显著改善去模糊效果。进一步地，根据本发明实施例的目标对象识别装置中的去模糊神经网络中可以对接各种特征提取网络，适应能力强，应用范围广。另外，根据本发明实施例的目标对象识别装置对模糊图片有明显改善效果，提升了后续人脸识别表现，对于清晰图片则不会产生影响。

图5示出了根据本发明实施例的目标对象识别系统500的示意性框图。目标对象识别系统500包括存储装置510以及处理器520。

其中，存储装置510存储用于实现根据本发明实施例的目标对象识别方法中的相应步骤的程序代码。处理器520用于运行存储装置510中存储的程序代码，以执行根据本发明实施例的目标对象识别方法的相应步骤，并且用于实现根据本发明实施例的目标对象识别装置中的相应模块。此外，目标对象识别系统500还可以包括图像采集装置(未在图5中示出)，其可以用于采集待识别图像。当然，图像采集装置不是必需的，可直接获取来自其他源的待识别图像的输入。

在一个实施例中，在所述程序代码被处理器520运行时使得目标对象识别系统500执行以下步骤：获取待识别图像；利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像；以及基于所述去模糊图像进行目标对象的特征提取和识别。

在本发明的一个实施例中，所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层，其中：所述第一卷积层输出与原始输入图像尺寸相同的第一特征层；所述卷积池化层包括依次连接的第二卷积层和池化层，所述卷积池化层输出与所述原始输入图像相比尺寸按比例缩小的第二特征层；所述反池化卷积层包括依次连接的第二卷积层和池化层，所述反池化卷积层输出按比例增大的第三特征层，所述至少一层反池化卷积层中的最后一层反池化卷积层输出的第三特征层的尺寸与所述原始输入图像的尺寸相同；以及所述第四卷积层输出重建残差，所述重建残差与原始输入图像相加的结果为重建的去模糊图像。

在本发明的一个实施例中，所述目标对象为人脸。

此外，根据本发明实施例，还提供了一种存储介质，在所述存储介质上存储了程序指令，在所述程序指令被计算机或处理器运行时用于执行本发明实施例的目标对象识别方法的相应步骤，并且用于实现根据本发明实施例的目标对象识别装置中的相应模块。所述存储介质例如可以包括智能电话的存储卡、平板电脑的存储部件、个人计算机的硬盘、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器、或者上述存储介质的任意组合。所述计算机可读存储介质可以是一个或多个计算机可读存储介质的任意组合，例如一个计算机可读存储介质包含获取待识别图像的计算机可读的程序代码，另一个计算机可读存储介质包含利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像的计算机可读的程序代码，又一个计算机可读存储介质包含基于所述去模糊图像进行目标对象的特征提取和识别的计算机可读的程序代码。

在一个实施例中，所述计算机程序指令在被计算机运行时可以实现根据本发明实施例的目标对象识别装置的各个功能模块，并且/或者可以执行根据本发明实施例的目标对象识别方法。

在一个实施例中，所述计算机程序指令在被计算机或处理器运行时使计算机或处理器执行以下步骤：获取待识别图像；利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像；以及基于所述去模糊图像进行目标对象的特征提取和识别。

在本发明的一个实施例中，所述目标对象为人脸。

根据本发明实施例的目标对象识别装置中的各模块可以通过根据本发明实施例的目标对象识别的电子设备的处理器运行在存储器中存储的计算机程序指令来实现，或者可以在根据本发明实施例的计算机程序产品的计算机可读存储介质中存储的计算机指令被计算机运行时实现。

根据本发明实施例的目标对象识别方法、装置、系统以及存储介质基于训练好的去模糊神经网络对待识别图像进行去模糊处理，使得特征提取在更加清晰的目标对象上进行，从而能够解决模糊图像对识别的干扰问题，提高目标对象识别的准确率和效率。

此外，根据本发明实施例的目标对象识别方法、装置、系统以及存储介质中的去模糊神经网络中可以使用跳跃连接和残差结构，可以显著改善去模糊效果。进一步地，根据本发明实施例的目标对象识别装置中的去模糊神经网络中可以对接各种特征提取网络，适应能力强，应用范围广。另外，根据本发明实施例的目标对象识别装置对模糊图片有明显改善效果，提升了后续人脸识别表现，对于清晰图片则不会产生影响。

尽管这里已经参考附图描述了示例实施例，应理解上述示例实施例仅仅是示例性的，并且不意图将本发明的范围限制于此。本领域普通技术人员可以在其中进行各种改变和修改，而不偏离本发明的范围和精神。所有这些改变和修改意在被包括在所附权利要求所要求的本发明的范围之内。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。例如，以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个设备，或一些特征可以忽略，或不执行。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本发明并帮助理解各个发明方面中的一个或多个，在对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该本发明的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如相应的权利要求书所反映的那样，其发明点在于可以用少于某个公开的单个实施例的所有特征的特征来解决相应的技术问题。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域的技术人员可以理解，除了特征之间相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

以上所述，仅为本发明的具体实施方式或对具体实施方式的说明，本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种目标对象识别方法，其特征在于，所述目标对象识别方法包括：

获取待识别图像；

利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像；以及

基于所述去模糊图像进行目标对象的特征提取和识别。

2.根据权利要求1所述的目标对象识别方法，其特征在于，所述利用训练好的去模糊神经网络对所述待识别图像进行去模糊操作以生成去模糊图像包括：

利用所述去模糊神经网络得到所述待识别图像的重建残差，并将所述重建残差与所述待识别图像相加以得到所述去模糊图像。

3.根据权利要求2所述的目标对象识别方法，其特征在于，所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层，其中：

所述第一卷积层输出与原始输入图像尺寸相同的第一特征层；

所述卷积池化层包括依次连接的第二卷积层和池化层，所述卷积池化层输出与所述原始输入图像相比尺寸按比例缩小的第二特征层；

所述反池化卷积层包括依次连接的反池化层和第三卷积层，所述反池化卷积层输出按比例增大的第三特征层，所述至少一层反池化卷积层中的最后一层反池化卷积层输出的第三特征层的尺寸与所述原始输入图像的尺寸相同；以及

所述第四卷积层输出重建残差，所述重建残差与原始输入图像相加的结果为重建的去模糊图像。

4.根据权利要求3所述的目标对象识别方法，其特征在于，所述卷积池化层与所述反池化卷积层的数目相等。

5.根据权利要求3所述的目标对象识别方法，其特征在于，所述去模糊神经网络还包括跳跃连接，所述跳跃连接用于将相同尺寸的特征层拼接在一起。

6.根据权利要求5所述的目标对象识别方法，其特征在于，所述去模糊神经网络还包括第五卷积层，所述第五卷积层所述反池化卷积层连接，用于减少因所述特征层的拼接而导致增加的通道数。

7.根据权利要求1-6中的任一项所述的目标对象识别方法，其特征在于，所述去模糊神经网络的训练所基于的样本是模糊图像集，所述模糊图像集中的模糊图像是通过对包括目标对象的清晰图像实施图像模糊算法而得到的。

8.根据权利要求1-6中的任一项所述的目标对象识别方法，其特征在于，所述基于所述去模糊图像进行目标对象的特征提取和识别，包括：

基于所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。

9.根据权利要求8所述的目标对象识别方法，其特征在于，所述训练好的去模糊神经网络与所述特征提取网络连在一起，所述去模糊神经网络与所述特征提取网络被进行共同调优训练，以用于所述目标对象的识别。

10.根据权利要求1-6中的任一项所述的目标对象识别方法，其特征在于，所述目标对象为人脸。

11.一种目标对象识别装置，其特征在于，所述目标对象识别装置包括：

获取模块，用于获取待识别图像；

去模糊模块，用于利用训练好的去模糊神经网络对所述获取模块获取到的所述待识别图像进行去模糊操作以生成去模糊图像；以及

识别模块，用于基于所述去模糊模块生成的所述去模糊图像进行目标对象的特征提取和识别。

12.根据权利要求11所述的目标对象识别装置，其特征在于，所述去模糊模块进一步用于：

利用所述去模糊神经网络得到所述获取模块获取到的所述待识别图像的重建残差，并将所述重建残差与所述待识别图像相加以得到所述去模糊图像。

13.根据权利要求12所述的目标对象识别装置，其特征在于，所述去模糊神经网络包括依次连接的输入层、第一卷积层、至少一层卷积池化层、至少一层反池化卷积层以及第四卷积层，其中：

14.根据权利要求13所述的目标对象识别装置，其特征在于，所述卷积池化层与所述反池化卷积层的数目相等。

15.根据权利要求13所述的目标对象识别装置，其特征在于，所述去模糊神经网络还包括跳跃连接，所述跳跃连接用于将相同尺寸的特征层拼接在一起。

16.根据权利要求15所述的目标对象识别装置，其特征在于，所述去模糊神经网络还包括第五卷积层，所述第五卷积层与所述反池化卷积层连接，用于减少因所述特征层的拼接而导致增加的通道数。

17.根据权利要求11-16中的任一项所述的目标对象识别装置，其特征在于，所述去模糊神经网络的训练所基于的样本是模糊图像集，所述模糊图像集中的模糊图像是通过对包括目标对象的清晰图像实施图像模糊算法而得到的。

18.根据权利要求11-16中的任一项所述的目标对象识别装置，其特征在于，所述识别模块进一步用于：

基于所述去模糊模块生成的所述去模糊图像和特征提取网络进行所述目标对象的特征提取和识别。

19.根据权利要求18所述的目标对象识别装置，其特征在于，所述训练好的去模糊神经网络与所述特征提取网络连在一起，所述去模糊神经网络与所述特征提取网络被进行共同调优训练，以用于所述目标对象的识别。

20.根据权利要求11-16中的任一项所述的目标对象识别装置，其特征在于，所述目标对象为人脸。

21.一种目标对象识别系统，其特征在于，所述目标对象识别系统包括存储装置和处理器，所述存储装置上存储有由所述处理器运行的计算机程序，所述计算机程序在被所述处理器运行时执行如权利要求1-10中的任一项所述的目标对象识别方法。

22.一种计算机可读介质，其特征在于，所述计算机可读介质上存储有计算机程序，所述计算机程序在运行时执行如权利要求1-10中的任一项所述的目标对象识别方法。