WO2021184894A1

WO2021184894A1 - 一种去模糊的人脸识别方法、系统和一种巡检机器人

Info

Publication number: WO2021184894A1
Application number: PCT/CN2020/140410
Authority: WO
Inventors: 刘业鹏; 程骏; 顾景; 曾钰胜; 庞建新; 熊友军
Original assignee: 深圳市优必选科技股份有限公司
Priority date: 2020-03-20
Filing date: 2020-12-28
Publication date: 2021-09-23
Also published as: CN111460939A

Abstract

本申请适用于智能机器人技术领域，提供了一种去模糊的人脸识别方法、系统和一种巡检机器人，该方法包括：获取来自巡检机器人摄像头的视频流，并对视频流进行视频解码，得到解码后的视频图像；采用人脸检测算法对视频图像进行人脸检测，得到视频图像中包含人脸ROI区域的区域图像；对区域图像进行模糊度判断；若区域图像不是模糊图像，则对视频图像进行人脸识别，得到人脸识别结果；若模区域图像是模糊图像，则提取视频图像前后连续的多帧图像；将多帧图像输入至去模糊网络，得到去模糊图像，去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；对去模糊图像进行人脸识别，得到人脸识别结果。

Description

一种去模糊的人脸识别方法、系统和一种巡检机器人

本申请要求于2020年03月20日在中国专利局提交的、申请号为202010202422.2的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请属于智能机器人技术领域，尤其涉及一种去模糊的人脸识别方法、系统和一种巡检机器人。

背景技术

随着信息化技术的提升，城市安防系统越来越完善。城市巡检系统离不开巡检机器人，巡检机器人可以在指定安防领域对来往行人进行监控，并通过人脸识别系统进行人脸分析，如果遇到可疑犯罪分子或者突发情况可以通过网络将信息传输到公安局系统进行报警。巡检机器人可以24小时持续巡逻，相比固定的监控摄像头，它的活动范围更大、效率更高。但是巡检机器人在行驶的过程中遇到凹凸不平的地面时会造成机器人机身的抖动，这种抖动会造成机器人上面的摄像头产生图像的运动模糊，这种模糊的人脸图像对人脸识别的精度有很大的影响。

针对巡检机器人抖动产生的人脸图像模糊问题，目前主要的解决方法是通过机器人云台里面的电机对抖动的云台进行矫正，以使得云台上的摄像头采集到的图像是清晰的。然而，这种带有稳像功能的云台成本昂贵，不利于存量巡检机器人的改装或更新。

因此，寻找一种应用范围广泛、成本较低、且适用于巡检机器人的去模糊的人脸识别方法成为本领域技术人员亟需解决的问题。

技术问题

本申请实施例提供了一种去模糊的人脸识别方法、系统和一种巡检机器人，可以解决因巡检机器人抖动产生的人脸图像模糊导致人脸识别不准确的问题。

技术解决方案

第一方面，本申请实施例提供了一种去模糊的人脸识别方法，包括：

获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；

采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；

对所述区域图像进行模糊度判断；

若模糊度判断结果为所述区域图像不是模糊图像，则对所述视频图像进行人脸识别，得到人脸识别结果；

若模糊度判断结果为所述区域图像是模糊图像，则提取所述视频图像前后连续的多帧图像；

将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；

对所述去模糊图像进行人脸识别，得到人脸识别结果。

本方法可以保证人脸识别的图像都是清晰的，且本申请无需安装带有稳像功能的云台，降低了巡检机器人的成本，应用范围广泛，利于对存量巡检机器人进行改造以解决巡检机器人抖动产生的人脸图像模糊问题。

优选地，所述去模糊网络通过以下步骤预先训练得到：

收集多张清晰图像样本，并对每张清晰图像样本进行模糊处理，得到多张连续的、与之对应的模糊图像样本，得到多组训练样本，每组训练样本由一张清晰图像样本和对应的多张模糊图像样本组成；

针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像；

以预设损失函数的计算结果为调整目标，在迭代学习的过程中，通过调整所述去模糊网络的网络参数，以最小化所述损失函数的计算结果，所述损失函数用于计算每组训练样本中清晰图像样本与目标图像之间的误差；

若所述损失函数的计算结果满足预设的训练终止条件，则确定所述去模糊网络已训练完成。

可见，去模糊网络的训练过程能够有效保证去模糊网络的训练完成，通过投入多组训练样本，训练后使得去模糊网络具备对模糊图片的去模糊功能。

优选地，所述去模糊网络包括编码网络和解码网络；

针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像包括：

在编码网络中，将所述每组训练样本中的多张模糊图像样本压缩成第一指定尺寸图像，再将所述第一指定尺寸图像经过两组残差卷积，得到第二指定尺寸图像；

在解码网络中，将所述第二指定尺寸图像经过两组残差反向卷积并解压缩，得到一张与所述模糊图像样本尺寸相同的目标图像。

通过由编码网络和解码网络组成的自编码网络，能够实现深度学习网络的基本功能，具备深度学习的网络结构。

优选地，所述对所述去模糊图像进行人脸识别，得到人脸识别结果包括：

将所述去模糊图像输入人脸特征提取网络进行人脸特征提取，得到第一目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；

将所述第一目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述去模糊图像中各张人脸对应的身份信息。

通过人脸特征提取网络对去模糊图像进行人脸特征提取，提高准确率，从而实现后续的人脸身份识别更准确。

优选地，所述对所述视频图像进行人脸识别，得到人脸识别结果包括：

将所述视频图像输入人脸特征提取网络进行人脸特征提取，得到第二目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；

将所述第二目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述视频图像中各张人脸对应的身份信息。

通过人脸特征提取网络对视频图像进行人脸特征提取，提高准确率，从而实现后续的人脸身份识别更准确。

优选地，所述对所述区域图像进行模糊度判断包括：

采用Laplacian算法计算所述区域图像的模糊度；

判断计算得到的模糊度是否大于预设的模糊度阈值；

若计算得到的模糊度大于预设的模糊度阈值，则确定所述区域图像不是模糊图像；

若计算得到的模糊度小于或等于预设的模糊度阈值，则确定所述区域图像是模糊图像。

采用Laplacian算法计算模糊度并判断模糊度是否超过阈值，可以实现对区域图像是否为模糊图像的区分。

优选地，所述提取所述视频图像前后连续的多帧图像具体为：提取所述视频图像前后连续的六帧图像。这样，不仅兼顾了处理效率，而且可以融合不同图像之间的信息，深度学习网络学习到更多细节特征，实现对图像的去模糊。

第二方面，本申请实施例提供了一种去模糊的人脸识别系统，包括：

视频解码模块，用于获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；

人脸检测模块，用于采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；

模糊度判断模块，用于对所述区域图像进行模糊度判断；

第一识别模块，用于若所述模糊度判断模块的判断结果为所述区域图像不是模糊图像，则对所述视频图像进行人脸识别，得到人脸识别结果；

多帧图像提取模块，用于若所述模糊度判断模块的判断结果为所述区域图像是模糊图像，则提取所述视频图像前后连续的多帧图像；

图像去模糊模块，用于将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；

第二识别模块，用于对所述去模糊图像进行人脸识别，得到人脸识别结果。

第三方面，本申请实施例提供了一种巡检机器人，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现上述的去模糊的人脸识别方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述的去模糊的人脸识别方法。

可以理解的是，上述第二方面至第四方面的有益效果可以参见上述第一方面中的相关描述，在此不再赘述。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例中去模糊的人脸识别方法的一流程图；

图2是本申请一实施例中上下文模块的示意图；

图3是本申请一实施例中去模糊的人脸识别方法步骤103在一个应用场景下的流程示意图；

图4是本申请一实施例中去模糊的人脸识别方法在一个应用场景下预先训练去模糊网络的流程示意图；

图5是本申请一实施例中去模糊的人脸识别方法步骤302在一个应用场景下的流程示意图；

图6是本申请一实施例去模糊网络在一个应用场景下的结构示意图；

图7是本申请一实施例中去模糊的人脸识别系统的结构示意图；

图8是本申请一实施例中巡检机器人的一示意图。

本发明的实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

应当理解，当在本申请说明书和所附权利要求书中使用时，术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本申请说明书和所附权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

另外，在本申请说明书和所附权利要求书的描述中，术语“第一”、“第二”、“第三”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

在本申请说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本申请的一个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此，在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例，而是意味着“一个或多个但不是所有的实施例”，除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”，除非是以其他方式另外特别强调。

在一实施例中，如图1所示，提供一种去模糊的人脸识别方法，以该方法应用与巡检机器人为例进行说明，包括如下步骤：

101、获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；

本实施例中，巡检机器人在工作时，会通过其云台上的摄像头记录周围的图像信息，从而在巡检机器人内部形成视频流。巡检机器人的系统可以获取到这些视频流，然后对视频流进行视频解码，得到解码后的视频图像。可以理解的是，得到的视频图像将以一帧一帧的形式得到，且视频图像之间的先后顺序可以根据时间确定。

102、采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；

巡检机器人在实现人脸识别和人脸分析时，一般无需对每帧图像进行处理，可以根据接收到的指令或者预设的规则确定要检测的图像。比如，当巡检机器人的系统接收到针对某帧视频图像进行人脸识别时，其可以采用人脸检测算法对该视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像。

需要说明的是，本实施例中采用的人脸检测算法可以是基于可分离卷积和上下文模块构建的轻量级神经网络，具有速度快、精度高的优点。如图2所示，网络的上下文模块可以分为三个分支，三个分支采用不同大小的卷积核进行卷积，这样最后特征提取的时离特征中心的远近不同决定了最后的卷积权重参数不同，可以有效提升检测精度。人脸检测算法可以将整帧视频图像中的人脸部分区域提取出来得到ROI(region of interest)区域，即该区域图像，以便后续的分析。

103、对所述区域图像进行模糊度判断，若模糊度判断结果为所述区域图像不是模糊图像，则执行步骤104，若模糊度判断结果为所述区域图像是模糊图像，则执行步骤105；

可以理解的是，系统此时得到的区域图像一般有两种情况。第一种情况为，该区域图像来源的视频图像为巡检机器人在平整路面上运动时拍摄的，因此该区域图像中的人脸应当是清晰的；第二种情况为，该区域图像来源的视频图像为巡检机器人在崎岖、凹凸不平的路面上运动时拍摄的，拍摄过程中存在抖动，因此该区域图像中的人脸很可能是模糊的。可见，对于第一种情况，系统可以直接对图像进行人脸识别，能够得到较为准确的识别结果；而第二种情况，则如背景技术所述，对其直接进行人脸识别得到的识别结果往往并不准确，人脸识别精度降低。

因此，本申请中，系统可以先对所述区域图像进行模糊度判断，以确定该视频图像是清晰的还是模糊的。

进一步地，如图3所示，步骤103可以包括：

201、采用Laplacian算法计算所述区域图像的模糊度；

202、判断计算得到的模糊度是否大于预设的模糊度阈值，若是，则执行步骤203，若否，则执行步骤204；

203、确定所述区域图像不是模糊图像；

204、确定所述区域图像是模糊图像。

对于上述步骤201-204，本申请可以采用Laplacian算法计算所述区域图像的模糊度，Laplacian算法的公式如下所示：

该Laplacian算法可以通过衡量区域图像的二阶导，能够强调图像中密度快速变化的区域，也就是边界，故常用于边界检测。在正常图像中边界比较清晰，因此其方差会比较大；而在模糊图片中包含的边界信息很少，所以方差会较小。经过该公式的计算可以得到清晰图像对应的模糊度值会比较大，模糊图像对应的模糊度值比较小。由经验确定可知，在一应用场景下，本申请的模糊度阈值可以设定为600。

由此可知，若计算得到的模糊度大于预设的模糊度阈值，则可以确定所述区域图像不是模糊图像；反之，若计算得到的模糊度小于或等于预设的模糊度阈值，则确定所述区域图像是模糊图像。

104、对所述视频图像进行人脸识别，得到人脸识别结果；

由上述内容可知，当模糊度判断结果为所述区域图像不是模糊图像时，说明该视频图像中的人脸是清晰的，因此，系统可以直接对所述视频图像进行人脸识别，得到人脸识别结果。

105、提取所述视频图像前后连续的多帧图像；

当模糊度判断结果为所述区域图像不是模糊图像时，说明该视频图像中的人脸是清模糊的，不适合将其直接进行人脸识别。为此，系统需要对该视频图像进行去模糊处理，首先，可以提取所述视频图像前后连续的多帧图像。由上述步骤101的内容可知，视频图像均有相应的时间信息，因此，对于某一视频图像来说，其前后连续的多帧图像是容易获取到的。

在某一具体应用场景中，为了兼顾处理效率和去模糊成功率，步骤105具体可以为：提取所述视频图像前后连续的六帧图像。也即，选取该视频图像前后连续的6张图像作为所述多帧图像，以用于后续步骤的去模糊处理。可以理解的是，选取六帧图像，不仅兼顾了处理效率，而且可以融合不同图像之间的信息，深度学习网络学习到更多细节特征，实现对图像的去模糊。

106、将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；

为了实现图像的去模糊处理，本申请预先训练好一个去模糊网络，该去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络，经过大量训练样本训练后，通过该去模糊网络可以将多帧图像中模糊的人脸信息还原成清晰的人脸信息。

为便于理解，首先对该去模糊网络的训练过程进行详细描述。进一步地，如图4所示，所述去模糊网络可以通过以下步骤预先训练得到：

301、收集多张清晰图像样本，并对每张清晰图像样本进行模糊处理，得到多张连续的、与之对应的模糊图像样本，得到多组训练样本，每组训练样本由一张清晰图像样本和对应的多张模糊图像样本组成；

302、针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像；

303、以预设损失函数的计算结果为调整目标，在迭代学习的过程中，通过调整所述去模糊网络的网络参数，以最小化所述损失函数的计算结果，所述损失函数用于计算每组训练样本中清晰图像样本与目标图像之间的误差；

304若所述损失函数的计算结果满足预设的训练终止条件，则确定所述去模糊网络已训练完成。

对于步骤301，本实施例中，可以收集多张清晰图像样本，然后对每张清晰图像样本进行模糊处理，得到多张连续的、与之对应的模糊图像样本。比如，针对清晰的图像a，可以对图像a进行模糊处理，得到图像a对应的模糊图像a1、a2、a3、a4、a5和a6。从而，得到由图像a、a1、a2、a3、a4、a5和a6组成的一组训练样本。针对每张清晰图像样本均做上述处理，即可得到多组训练样本。

对于步骤302，在训练过程中，系统可以针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像。具体地，本实施例中的去模糊网络可以包括编码网络和解码网络，为此，如图5所示，步骤302可以包括：

401、在编码网络中，将所述每组训练样本中的多张模糊图像样本压缩成第一指定尺寸图像，再将所述第一指定尺寸图像经过两组残差卷积，得到第二指定尺寸图像；

402、在解码网络中，将所述第二指定尺寸图像经过两组残差反向卷积并解压缩，得到一张与所述模糊图像样本尺寸相同的目标图像。

对于步骤401-402，举例说明，该去模糊网络可以是基于深度学习的自编码网络，其是对称的，分成编码和解码两部分。如图6所示，在一个应用场景下，假设一组训练样本共6帧模糊图样样本，则首先连续输出这6帧模糊图像样本到编码网络，其被压缩成第一指定尺寸图像，假设为256*256，然后，经过两组残差卷积，图像大小变成64*64*128(即第二指定尺寸)，该过程可以称为编码。而解码过程则与编码过程相反，可以将该第二指定尺寸图像经过两组残差反向卷积，即可将图像的尺寸恢复成256*256大小，再经过解压缩，此时，得到的图像为一张与所述模糊图像样本尺寸相同的目标图像。

对于步骤303，可以理解的是，为了评估该去模糊网络是否已训练完成，具体地，系统可以以预设损失函数的计算结果为调整目标，在迭代学习的过程中，通过调整所述去模糊网络的网络参数，以最小化所述损失函数的计算结果。其中，损失函数(即loss函数)用于计算每组训练样本中清晰图像样本与目标图像之间的误差。需要说明的是，损失函数可以为均方误差损失、平均偏差损失、平方损失等多种函数，在具体应用时，可以根据需要选取其中一种，此处不作赘述。

对于步骤304，经过大量训练样本的训练和学习，多次迭代后，若所述损失函数的计算结果满足预设的训练终止条件，则可以确定所述去模糊网络已训练好。其中，该预设的训练终止条件可以根据实际训练需要设定，比如损失函数的计算结果在一定范围内，且迭代次数超过N次，则可确定该去模糊网络训练完成，等等。

107、对所述去模糊图像进行人脸识别，得到人脸识别结果。

可以认为，去模糊网络输出的去模糊图像是清晰的，对其进行人脸识别得到的识别结果是准确的。因此，系统可以对所述去模糊图像进行人脸识别，得到人脸识别结果。

本实施例中，为了提高人脸识别的准确性和效率，进一步地，步骤107具体可以包括：将所述去模糊图像输入人脸特征提取网络进行人脸特征提取，得到第一目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；将所述第一目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述去模糊图像中各张人脸对应的身份信息。需要说明的是，本实施例汇总采用的人脸特征提取网络具体可以是基于resnet50的深度学习网络，在网络训练时，可以采用三元组损失函数，该损失函数可以使同一个人的人脸的特征向量的欧式距离尽可能的小，不同的人的人脸的特征向量的欧式距离比较大。关于该人脸特征提取网络的训练过程，本实施例不再赘述。

同理，上述步骤104也可以具体包括：将所述视频图像输入人脸特征提取网络进行人脸特征提取，得到第二目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；将所述第二目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述视频图像中各张人脸对应的身份信息。可以理解的是，步骤104可以与步骤107采用同一张人脸特征提取网络，也可以训练两张不同的人脸特征提取网络来分别针对视频图像和去模糊图像进行人脸识别，以取得较好的人脸识别结果。

可以理解的是，在步骤104、步骤107中，将第一目标人脸特征、或第二目标人脸特征与预设人脸特征库中的人脸特征进行比较，可以从该预设人脸特征库中确定出与第一、第二目标人脸特征相同的预留人脸特征，该预留人脸特征记录有对应的人员身份，则该人员身份可以认为就是图像中识别到的人员的身份信息。当然，若比较发现，该预设人脸特征库中不存在与第一目标人脸特征、或第二目标人脸特征相同的人脸特征，则可以认为图像中的该人脸的人员身份无法确认，具体可以在系统中将其身份标注为“未知”或“识别失败”等。

本申请实施例中，首先，获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；然后，采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；接着，对所述区域图像进行模糊度判断；若模糊度判断结果为所述区域图像不是模糊图像，则对所述视频图像进行人脸识别，得到人脸识别结果；若模糊度判断结果为所述区域图像是模糊图像，则提取所述视频图像前后连续的多帧图像；再之，将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到；最后，对所述去模糊图像进行人脸识别，得到人脸识别结果。可见，本申请在人脸识别前，可以先对视频图像中的人脸进行模糊度判断，如果人脸不模糊，则可以直接对该视频图像进行人脸识别；反之，如果人脸模糊，则将该视频图像前后连续的多帧图像输入至去模糊网络，得到包含人脸的、清晰的图像(即该去模糊图像)，再对去模糊图像进行人脸识别。从而，可以保证人脸识别的图像都是清晰的，且本申请无需安装带有稳像功能的云台，降低了巡检机器人的成本，应用范围广泛，利于对存量巡检机器人进行改造以解决巡检机器人抖动产生的人脸图像模糊问题。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

在一实施例中，提供一种去模糊的人脸识别系统，该去模糊的人脸识别系统与上述实施例中去模糊的人脸识别方法一一对应。如图7所示，该去模糊的人脸识别系统包括视频解码模块501、人脸检测模块502、模糊度判断模块503、第一识别模块504、多帧图像提取模块505、图像去模糊模块506和第二识别模块507。各功能模块详细说明如下：

视频解码模块501，用于获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；

人脸检测模块502，用于采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；

模糊度判断模块503，用于对所述区域图像进行模糊度判断；

第一识别模块504，用于若所述模糊度判断模块的判断结果为所述区域图像不是模糊图像，则对所述视频图像进行人脸识别，得到人脸识别结果；

多帧图像提取模块505，用于若所述模糊度判断模块的判断结果为所述区域图像是模糊图像，则提取所述视频图像前后连续的多帧图像；

图像去模糊模块506，用于将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；

第二识别模块507，用于对所述去模糊图像进行人脸识别，得到人脸识别结果。

进一步地，所述去模糊网络可以通过以下模块预先训练得到：

样本收集模块，用于收集多张清晰图像样本，并对每张清晰图像样本进行模糊处理，得到多张连续的、与之对应的模糊图像样本，得到多组训练样本，每组训练样本由一张清晰图像样本和对应的多张模糊图像样本组成；

网络训练模块，用于针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像；

网络参数调整模块，用于以预设损失函数的计算结果为调整目标，在迭代学习的过程中，通过调整所述去模糊网络的网络参数，以最小化所述损失函数的计算结果，所述损失函数用于计算每组训练样本中清晰图像样本与目标图像之间的误差；

训练完成模块，用于若所述损失函数的计算结果满足预设的训练终止条件，则确定所述去模糊网络已训练完成。

进一步地，所述去模糊网络可以包括编码网络和解码网络；

所述网络训练模块可以包括：

编码单元，用于在编码网络中，将所述每组训练样本中的多张模糊图像样本压缩成第一指定尺寸图像，再将所述第一指定尺寸图像经过两组残差卷积，得到第二指定尺寸图像；

解码单元，用于在解码网络中，将所述第二指定尺寸图像经过两组残差反向卷积并解压缩，得到一张与所述模糊图像样本尺寸相同的目标图像。

进一步地，所述第一识别模块可以包括：

第一特征提取单元，用于将所述视频图像输入人脸特征提取网络进行人脸特征提取，得到第二目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；

第一特征比较单元，用于将所述第二目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述视频图像中各张人脸对应的身份信息。

进一步地，所述第二识别模块可以包括：

第二特征提取单元，用于将所述去模糊图像输入人脸特征提取网络进行人脸特征提取，得到第一目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；

第二特征比较单元，用于将所述第一目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述去模糊图像中各张人脸对应的身份信息。

进一步地，所述模糊度判断模块可以包括：

模糊度计算单元，用于采用Laplacian算法计算所述区域图像的模糊度；

判断单元，用于判断计算得到的模糊度是否大于预设的模糊度阈值；

第一确定单元，用于若所述判断单元的判断结果为是，则确定所述区域图像不是模糊图像；

第二确定单元，用于若所述判断单元的判断结果为否，则确定所述区域图像是模糊图像。

进一步地，所述多帧图像提取模块具体用于：提取所述视频图像前后连续的六帧图像。

关于去模糊的人脸识别系统的具体限定可以参见上文中对于去模糊的人脸识别方法的限定，在此不再赘述。上述去模糊的人脸识别系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种巡检机器人，如图8所示，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中去模糊的人脸识别方法的步骤，例如图1所示的步骤101至步骤107。或者，处理器执行计算机程序时实现上述实施例中去模糊的人脸识别系统的各模块/单元的功能，例如图7所示模块501至模块507的功能。为避免重复，这里不再赘述。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述实施例中去模糊的人脸识别方法的步骤，例如图1所示的步骤101至步骤107。或者，计算机程序被处理器执行时实现上述实施例中去模糊的人脸识别系统的各模块/单元的功能，例如图7所示模块501至模块507的功能。为避免重复，这里不再赘述。

需要说明的是，上述装置/单元之间的信息交互、执行过程等内容，由于与本申请方法实施例基于同一构思，其具体功能及带来的技术效果，具体可参见方法实施例部分，此处不再赘述。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，所述计算机程序包括计算机程序代码，所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质至少可以包括：能够将计算机程序代码携带到拍照装置/终端设备的任何实体或装置、记录介质、计算机存储器、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、电载波信号、电信信号以及软件分发介质。例如U盘、移动硬盘、磁碟或者光盘等。在某些司法管辖区，根据立法和专利实践，计算机可读介质不可以是电载波信号和电信信号。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置/网络设备和方法，可以通过其它的方式实现。例如，以上所描述的装置/网络设备实施例仅仅是示意性的，例如，所述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

以上所述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

一种去模糊的人脸识别方法，其特征在于，包括：

获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；

采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；

对所述区域图像进行模糊度判断；

若模糊度判断结果为所述区域图像不是模糊图像，则对所述视频图像进行人脸识别，得到人脸识别结果；

若模糊度判断结果为所述区域图像是模糊图像，则提取所述视频图像前后连续的多帧图像；

将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；

对所述去模糊图像进行人脸识别，得到人脸识别结果。
如权利要求1所述的去模糊的人脸识别方法，其特征在于，所述去模糊网络通过以下步骤预先训练得到：

收集多张清晰图像样本，并对每张清晰图像样本进行模糊处理，得到多张连续的、与之对应的模糊图像样本，得到多组训练样本，每组训练样本由一张清晰图像样本和对应的多张模糊图像样本组成；

针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像；

以预设损失函数的计算结果为调整目标，在迭代学习的过程中，通过调整所述去模糊网络的网络参数，以最小化所述损失函数的计算结果，所述损失函数用于计算每组训练样本中清晰图像样本与目标图像之间的误差；

若所述损失函数的计算结果满足预设的训练终止条件，则确定所述去模糊网络已训练完成。
如权利要求2所述的去模糊的人脸识别方法，其特征在于，所述去模糊网络包括编码网络和解码网络；

针对每组训练样本，将所述每组训练样本中的多张模糊图像样本输入去模糊网络，得到所述去模糊网络输出的一张目标图像包括：

在编码网络中，将所述每组训练样本中的多张模糊图像样本压缩成第一指定尺寸图像，再将所述第一指定尺寸图像经过两组残差卷积，得到第二指定尺寸图像；

在解码网络中，将所述第二指定尺寸图像经过两组残差反向卷积并解压缩，得到一张与所述模糊图像样本尺寸相同的目标图像。
如权利要求1所述的去模糊的人脸识别方法，其特征在于，所述对所述去模糊图像进行人脸识别，得到人脸识别结果包括：

将所述去模糊图像输入人脸特征提取网络进行人脸特征提取，得到第一目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；

将所述第一目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述去模糊图像中各张人脸对应的身份信息。
如权利要求1所述的去模糊的人脸识别方法，其特征在于，所述对所述视频图像进行人脸识别，得到人脸识别结果包括：

将所述视频图像输入人脸特征提取网络进行人脸特征提取，得到第二目标人脸特征，所述人脸特征提取网络为由多张人脸样本预先训练好的深度学习网络；

将所述第二目标人脸特征与预设人脸特征库中的人脸特征进行比较，确定出所述视频图像中各张人脸对应的身份信息。
如权利要求1所述的去模糊的人脸识别方法，其特征在于，所述对所述区域图像进行模糊度判断包括：

采用Laplacian算法计算所述区域图像的模糊度；

判断计算得到的模糊度是否大于预设的模糊度阈值；

若计算得到的模糊度大于预设的模糊度阈值，则确定所述区域图像不是模糊图像；

若计算得到的模糊度小于或等于预设的模糊度阈值，则确定所述区域图像是模糊图像。
如权利要求1至6中任一项所述的去模糊的人脸识别方法，其特征在于，所述提取所述视频图像前后连续的多帧图像具体为：提取所述视频图像前后连续的六帧图像。
一种去模糊的人脸识别系统，其特征在于，包括：

视频解码模块，用于获取来自巡检机器人摄像头的视频流，并对所述视频流进行视频解码，得到解码后的视频图像；

人脸检测模块，用于采用人脸检测算法对所述视频图像进行人脸检测，得到所述视频图像中包含人脸ROI区域的区域图像；

模糊度判断模块，用于对所述区域图像进行模糊度判断；

第一识别模块，用于若所述模糊度判断模块的判断结果为所述区域图像不是模糊图像，则对所述视频图像进行人脸识别，得到人脸识别结果；

多帧图像提取模块，用于若所述模糊度判断模块的判断结果为所述区域图像是模糊图像，则提取所述视频图像前后连续的多帧图像；

图像去模糊模块，用于将所述多帧图像输入至去模糊网络，得到所述去模糊网络输出的去模糊图像，所述去模糊网络为由多张模糊图像样本和对应的清晰图像样本作为训练样本预先训练得到的深度学习网络；

第二识别模块，用于对所述去模糊图像进行人脸识别，得到人脸识别结果。
一种巡检机器人，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的去模糊的人脸识别方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的去模糊的人脸识别方法。