WO2021237968A1

WO2021237968A1 - 一种应用于人脸遮挡场景的活体检测方法及装置

Info

Publication number: WO2021237968A1
Application number: PCT/CN2020/112222
Authority: WO
Inventors: 王烨; 王�琦
Original assignee: 上海依图网络科技有限公司
Priority date: 2020-05-28
Filing date: 2020-08-28
Publication date: 2021-12-02
Also published as: CN111582238A; CN111582238B

Abstract

一种应用于人脸遮挡场景的活体检测方法及装置，该方法为：针对被遮挡的目标人脸，分别获得一张RGB图像和一张红外图像，结合RGB图像中的人脸未遮挡区域的人脸特征识别结果和红外图像中的人脸特征识别结果，获得活体检测的第一检测结果，以及，基于RGB图像眼睛图像的红外线反射率和红外图像眼睛图像的红外线反射率，获得活体检测的第二检测结果，从而在第一检测结果和第二检测结果均表征存在活体时，确定通过活体检测。这样，在人脸被遮挡的情况下，可以迅速对通过的目标人物进行活体检测，进而有效地提升了活体检测的检测效率，同时也保证了检测准确度。

Description

一种应用于人脸遮挡场景的活体检测方法及装置

相关申请的交叉引用

本公开要求在2020年05月28日提交中国专利局、申请号为202010468727.8、申请名称为“一种应用于人脸遮挡场景的活体检测方法及装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及计算机技术，特别涉及一种应用于人脸遮挡场景的活体检测方法及装置。

背景技术

随着人脸识别技术的发展，提高识别安全性也日益受到了重视。通常情况下，安全性高的人脸识别技术都会配备活体检测环节来甄别虚假欺骗行为，以保障用户利益，例如，活体检测环节可以有效甄别以下攻击隐患：照片攻击、屏幕攻击、面具攻击等等。

已有技术下，活体检测技术已经趋于完善，但是在特殊应用场合，还会有检测不准确的情况发生。例如，在发生疫情期间，众人均佩戴口罩，从而造成人脸遮挡面积过大，人脸特征减少，进而令人脸检测识别以及活体检测环节都受到了很大程度的影响。

有鉴于此，需要设计一种新的活体检测方法，以克服上述缺陷。

发明内容

本公开实施例提供一种应用于人脸遮挡场景的活体检测方法及装置，用以在人脸遮挡场景下，提高活体检测的准确度。

本公开实施例提供的具体技术方案如下：

第一方面，一种应用于人脸遮挡场景的活体检测方法，包括：

针对目标人脸，拍摄RGB图像以及拍摄红外图像，并采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别，获得相应的RGB图像人脸特征识别结果和红外图像人脸特征识别结果；

根据针对所述RGB图像的遮挡物检测结果确定非遮挡物位置,并从所述RGB图像人脸特征识别结果中筛选出，所述非遮挡物位置对应的部分RGB图像人脸特征识别结果，以及采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果；

从所述RGB图像中提取RGB图像眼睛图像，以及从所述红外图像中提取红外图像眼睛图像，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果；

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测。

可选的，针对目标人脸，拍摄RGB图像以及拍摄红外图像之后，采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别之前，进一步执行以下操作中的任意一种或组合：

对所述RGB图像和所述红外图像进行扫描，确定所述RGB图像和所述红外图像均包含所述目标人脸；

从所述RGB图像和所述红外图像中，删除非目标人脸，所述非目标人脸为人脸面积未达到预设的面积门限值的人脸；

对所述RGB图像和所述红外图像进行扫描，确定所述RGB图像包含的目标人脸和所述红外图像包含的目标人脸的IOU面积达到第一设定阈值；

对所述RGB图像进行遮挡物检测，确定所述RGB图像中的目标人脸上的遮挡物的遮挡面积，与所述目标人脸的人脸面积的比值于第二设定阈值。

可选的，采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果，包括：

采用所述活体检测模型，判定所述红外图像人脸特征识别结果中包含有活体特征，以及所述部分RGB图像人脸特征识别结果包含的人脸特征的数目达到预设的数目门限值时，确定第一检测结果表征存在活体。

可选的，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果，包括：

采用所述活体检测模型，判定所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率不同时，确定所述第二检测结果表征存在活体。

可选的，判定所述第一检测结果和所述第二检测结果均表征存在活体之前，进一步包括：

从所述RGB图像中进一步提取出RGB图像眼部图像，所述RGB图像眼部图像的面积大于所述RGB图像眼睛图像的面积；

从所述红外图像中进一步提取出红外图像眼部图像，所述红外图像眼部图像的面积大于所述红外图像眼睛图像的面积；

采用预设的活体检测模型，基于所述RGB图像眼部图像的拼接边缘的纹理识别结果，或/和，基于所述红外图像眼部图像的拼接边缘的纹理识别结果，进行活体检测，获得第三检测结果，其中，若所述第三检测结果表征不存在任何拼接边缘的纹理信息，则确定存在活体；

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测，包括：

判定所述第一检测结果和所述第二检测结果均表征存在活体，以及所述第三检测结果也表征存在活体时，确定通过活体检测。

可选的，在确定通过活体检测之前，进一步包括：

获取所述目标人脸对应的人物录入的音频数据，提取所述音频数据的声纹特征，并基于所述声纹特征，确定存在活体。

第二方面，一种应用于人脸遮挡场景的活体检测装置，包括：

拍摄单元，用于针对目标人脸，拍摄RGB图像以及拍摄红外图像，并采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别，获得相应的RGB图像人脸特征识别结果和红外图像人脸特征识别结果；

第一检测单元，用于根据针对所述RGB图像的遮挡物检测结果确定非遮挡物位置,并从所述RGB图像人脸特征识别结果中筛选出，所述非遮挡物位置对应的部分RGB图像人脸特征识别结果，以及采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果；

第二检测单元，用于从所述RGB图像中提取RGB图像眼睛图像，以及从所述红外图像中提取红外图像眼睛图像，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果；

判定单元，用于判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测。

可选的，针对目标人脸，拍摄RGB图像以及拍摄红外图像之后，采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别之前，所述拍摄单元进一步用于执行以下操作中的任意一种或组合：

可选的，采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果时，所述第一检测单元用于：

可选的，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果时，所述第二检测单元用于：

可选的，进一步包括：

第三检测单元，用于在判定所述第一检测结果和所述第二检测结果均表征存在活体之前，执行以下操作：

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测，所述判定单元用于：

可选的，进一步包括：

声纹检测单元，用于在确定通过活体检测之前，获取所述目标人脸对应的人物录入的音频数据，提取所述音频数据的声纹特征，并基于所述声纹特征，确定存在活体。

第三方面，一种活体检测装置，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行存储器中存储的可执行指令，以实现如第一方面中任一项所述的媒体数据加密处理的方法。

第四方面，一种计算机可读存储介质，当所述计算机可读存储介质中的指令由处理器执行时，使得能够执行如第一方面中任一项所述媒体数据加密处理的方法。

本公开实施例中，采用双摄像头对被遮挡的人脸进行拍摄，分别获得一张RGB图像和一张红外图像，接着，结合RGB图像中的人脸未遮挡区域的人脸特征识别结果和红外图像中的人脸特征识别结果，获得活体检测的第一检测结果，进一步地，基于RGB图像眼睛图像的红外线反射率和红外图像眼睛图像的红外线反射率，获得活体检测的第二检测结果，从而在第一检测结果和第二检测结果均表征存在活体时，确定通过活体检测。这样，可以在由于人脸被遮挡而造成人脸特征减少的情况下，采用RGB图像的识别结果对红外图像的识别结果进行弥补，同时，结合未被遮挡的眼睛部位在RGB图像和红外图像中的红外线反射率的差异化，迅速对通过的目标人物进行活体检测，进而有效地提升了活体检测的检测效率，同时也保证了检测准确度。

附图说明

图1为本公开实施例中在人脸遮挡场景下进行活体识别流程图；

图2A为本公开实施例中未遮挡的目标人脸示意图；

图2B为本公开实施例中被遮挡的目标人脸示意图；

图3A为本公开实施例中真实人眼的RGB图像和红外图像对比示意图；

图3B为本公开实施例中虚拟人眼的RGB图像和红外图像对比示意图；

图4为本公开实施例中孔洞攻击检测示意图；

图5为本公开实施例中活体检测装置逻辑结构示意图；

图6为本公开实施例中活体检测装置实体结构示意图。

具体实施方式

为了在人脸遮挡场景下，提高活体检测的准确度，本公开实施例中，采用双摄像头对被遮挡的人脸进行拍摄，分别获得一张红绿蓝(Red Green Blue，RGB)图像和一张红外图像，接着，再对两张图像进行综合分析，利用红外图像的人脸识别结果，弥补RGB图像的人脸识别结果的不足，进行实现人脸准确识别以及活体识别。

下面结合附图对本公开优先的实施方式作出进一步详细说明。

参阅图1所示，本公开实施例中，应用于人脸遮挡场景的活体检测流程，具体如下：

步骤101：通过普通摄像头，拍摄RGB图像，以及通过红外摄像头，拍摄红外图像。

具体的，当人物通过检测地点时，可以采用一个普通摄像头，采集一张正常光照下的RGB图像，相应的，也可以采用一个红摄像头，同步采集一张红外光下的灰度图像。

步骤102：判断所述RGB图像和所述红外图像中是否均未包含目标人脸，若是，则结束当前流程；否则，执行步骤103。

本公开实施例中，若拍摄获得的RGB图像和红外图像中均未包含人脸，则无需执行后续的活体检测流程，直接结束即可。

步骤103：判断所述RGB图像中是否包含目标人脸？若是，则执行步骤105；否则，执行步骤104。

实际应用中，如果RGB图像中包含有目标人脸，则红外图像中必定会包含有目标人脸，因此，只需要判断RGB图像即可，如果，RGB图像中没有目标人脸，而红外图像中包含有目标人脸，则有可以人物在拍摄过程中出现了移动，因此，需要重新拍摄RGB图像。

上述步骤102和步骤103是针对意外未拍摄到目标人脸的情况而设置的，实际应用中，若人物在通过时，必须站定拍照，则无需执行步骤102和步骤103，此处仅为举例，不再赘述。

步骤104：通过普通摄像头，重新拍摄RGB图像。

步骤105：在RGB图像和红外图像中过滤掉非目标人脸。

可选的，可以在RGB图像和红外图像中，将人脸面积在预设的面积门限值之下的人脸视为非目标人脸，并进行删除，从而避免在后续人脸特别识别过程中，影响目标人脸的识别结果的准确性。

实际应用中，若能够确定人物通过时，背景中不会存在其他人物，则无需执行步骤105，此处仅为举例，不再赘述。

步骤106：判断所述RGB图像包含的目标人脸和所述红外图像包含的目标人脸的交并比(Intersection-over-Union，IOU)面积是否达到第一设定阈值？若是，则结合当前流程；否则，执行步骤107。

实际应用中，由于人物始终在运动，并且不同的摄像头的拍摄角度不同，因此，普通摄像头抓拍的RGB图像中的目标人脸，与红外摄像头抓拍的红外图像中的目标人脸，会存在些许差异。

针对这一情况，可以通过执行步骤106，来判断RGB图像中的目标人脸和红外图像中的目标人脸的面积差异，只有面积差异不大时(即IOU面积低于第一设定阈值时)，才会继续执行后续的活体检测流程。

当然，假设能够通过准确布置摄像头，保证普通摄像头和红外摄像头的拍摄角度相近，拍摄得到的目标人脸的面积差异不大，则也可以不执行步骤106，此处仅为举例，不再赘述。

步骤107：采用预设的遮挡物检测模型对RGB图像中的目标人脸进行遮挡物检测，基于遮挡物检测结果确定目标人脸上的遮挡物的遮挡面积，并判断所述遮挡面积与所述目标人脸的人脸面积的比值是否低于第二设定阈值？若是，则执行步骤108，否则，结束当前流程。

具体的，遮挡物检测模型可以基于深度神经网络训练获得的，在输入RGB图像后，会输出遮挡物的检测坐标位置，如，检测框。

例如，若目标人脸上没有佩戴口罩，则按普通活体检测流程处理，本公开实施例中不做过多介绍。

若目标人脸上佩戴的口罩的面积与人脸面积的比值超过第二设定阈值，则说明口罩佩戴不合理，则可以结束当前流程，并提示目标人物重新调整口罩后，再次重新触发活体检测流程。

若目标人物脸上佩戴的口罩的面积与人脸面积的比值未超过第二设定阈值，说明口罩佩戴合理，可以执行后续的活体检测流程。

步骤108：采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别，获得相应的RGB图像人脸特征识别结果和红外图像人脸特征识别结果。

可选的，在执行步骤108之前，可以需要采用仿射变换方式，对所述RGB图像和所述红外图像进行归一化处理，以保证后续数据处理的便捷性，在此不再赘述。

参阅图2A所示，实际应用中，在人脸上，存在着一些特殊的关键点，如眉骨、眼框、颧骨、鼻子，嘴巴，颌骨、下巴等等，这些关键点的相对位置受人脸姿态变化的影响较小，同时又能体现出人脸特征，因此，采用人脸特征识别模型，对这些关键点的相对坐标位置进行识别，便可以准确识别出人物身份，因此，这些关键点又被称为人脸特征点。

本公开实施例中，预先训练完毕的人脸特征识别模型，可以用于识别RGB图像中的人脸特征，也可以用于识别红外图像中的人脸特征，其区别在于，由于RGB图像包含的像素更多，细节更为清晰，因此，可以识别出更为准确的人脸特征。

进一步的，参阅图2B所示，本公开实施例中，由于人物戴有口罩，因此，通过RGB图像，只能准确识别出人脸上半部分，如，准确识别出眉骨、眼框和部分鼻子的特征。

但是，RGB图像人脸特征识别结果中，还是会包含人脸全脸特征，除上述准确识别的特征之外，其余特征均为预测，即识别结果并不准确，如，颧骨、鼻子，嘴巴，颌骨、下巴等的特征，均为预测特征。

相应的，红外图像虽然包含的像素较少，细节不多，但是，不受口罩遮挡的限制，因此，通过红外图像，依然可以识别出人脸全脸特征，即红外图像人脸特征识别结果中，也包含有人脸全脸特征。

步骤109：根据所述遮挡物检测结果确定非遮挡物位置，并从所述RGB图像人脸特征识别结果中筛选出，所述非遮挡物位置对应的部分RGB图像人脸特征识别结果。

步骤110：采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果。

具体的，所述活体检测模型，是预先基于深度神经网络进行训练后获得的，虽然，RGB图像中只有部分人脸特征，但是，对于活体检测流程，却可以起到很好的辅助作用，由于活体检测装置遭遇照片攻击和屏幕攻击时，对方会手持人脸照片或手持人脸屏幕，而在这种情况下，人脸中的细节是模糊的，如，眉骨、眼框和鼻骨位置相对不清晰，因此，利用RGB图像中的部分人脸特征对活体检测进行辅助，可以起到很好的作用。

换言之，只要判定红外图像人脸特征识别结果中包含有活体特征，以及所述部分RGB图像人脸特征识别结果包含的人脸特征的数目达到预设的数目门限值，即可确定第一检测结果表征存在活体。

可选的，所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果，可以采用左右拼接、上下拼接或同时输入的方式输入上述活体检测模型。

步骤111：从所述RGB图像中提取RGB图像眼睛图像，以及从所述红外图像中提取红外图像眼睛图像，基于所述RGB图像眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果。

实际应用中，真实人眼和虚拟人眼，对于红外线的反射率不同，因此，可以比较RGB图像眼睛图像的红外反射率和红外图像眼睛图像的红外反射率，以区分虚拟人眼。

例如，参阅图3A所示，对于真实人眼，RGB图像眼睛图像中的红外线反射率，与红外图像眼睛图像中的红外线反射率不同，并且具有明显差异。

又例如，参阅图3B所示，对于虚拟人眼，RGB图像眼睛图像中的红外线反射率，与红外图像眼睛图像中的红外线反射率相同，不具有明显差异。

因此，若RGB图像眼睛图像中的红外线反射率，与红外图像眼睛图像中的红外线反射率不同，即可确定第二检测结果表征存在活体。

可选的，所述RGB图像眼睛图像和所述红外图像眼睛图像，可以采用左右拼接、上下拼接或同时输入的方式输入上述活体检测模型。

步骤112：判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测。

基于上述实施例，为了进一步防止孔洞攻击，可选的，还可以在执行步骤111之后，在执行步骤112之前，进一步执行以下步骤：

从所述RGB图像中进一步提取出RGB图像眼部图像，所述RGB图像眼部图像的面积大于所述RGB图像眼睛图像的面积；从所述红外图像中进一步提取出红外图像眼部图像，所述红外图像眼部图像的面积大于所述红外图像眼睛图像的面积，以及进一步地，采用预设的活体检测模型，基于所述RGB图像眼部图像的拼接边缘的纹理识别结果，或/和，基于所述红外图像眼部图像的拼接边缘的纹理识别结果，进行活体检测，获得第三检测结果。

其中，若所述第三检测结果表征存在拼接边缘的纹理信息，则确定存在孔洞攻击，即RGB图像眼部图像和红外图像眼部图像中的任何一个图像表征存在拼接边缘的纹理信息，则确定存在孔洞攻击。

若所述第三检测结果表征不存在任意拼接边缘的纹理信息，则确定不存在孔洞攻击，即存在活体，即RGB图像眼部图像和红外图像眼部图像均表征不存在拼接边缘的纹理信息，则确定不存在孔洞攻击。

例如，参阅图4所示，在进行孔洞攻击时，对方可能会手持一张人脸照片，但在眼部挖有孔洞，以躲避步骤111中所述的针对照片攻击和屏幕攻击的活体检测。

而人脸照片部分的纹理信息，与真实人脸眼部的纹理信息，不是均匀过渡的，一定会存在拼接边缘，因此，通过检测拼接边缘的纹理信息，即可获知是否存在孔洞攻击。

在获得第三检测结果之后，在执行步骤112时，需要第一检测结果、第二检测结果和第三检测结果均表征存在活体，才能确定人物最终通过活体检测。

可选的，本公开实施例中，在最终通过活体检测之前，还可以进一步利用声纹辨别技术来确定是否存在活体。

具体的，可以获取所述目标人脸对应的人物录入的音频数据，提取所述音频数据的声纹特征，并基于所述声纹特征，确定存在活体。

实际应用中，活体发音和机器发音的特征不同，活体的发声控制器官包括声带、软颚、舌头、牙齿、唇等；发声共鸣器包括咽腔、口腔、鼻腔，这些器官的微小差异都会导致发声气流的改变，造成音质、音色的差别，此外，活体发声的习惯也有快有慢，用力有大有小，也造成音强、音长的差别。

因此，可以把音频数据转换成电讯号，再通过电讯号的强度、波长、频率、节奏变化，绘制成相应的波谱图形，从而形成声纹图，这样，便可以采用直观形式来体现活体声音的音质、音色、音强、音长等特征。

因此，采用声纹特征，可以很容易地识别出是否存在活体。

进一步地，上述声纹检测步骤，可以在获得第一检测结果之前；也可以在获得第一检测结果之后，而在获得第二检测结果之前；还可以在获得第二检测结果之后，而在第三检测结果之前；具体的执行时机不做限定，只需在最终确定存在活体之前执行即可，在此不再赘述。

基于同一发明构思，参阅图5所示，本公开实施例中，活体检测装置至少包括：拍摄单元50，第一检测单元51，第二检测单元52和判定单元54，其中，

拍摄单元50，用于针对目标人脸，拍摄RGB图像以及拍摄红外图像，并采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别，获得相应的RGB图像人脸特征识别结果和红外图像人脸特征识别结果；

第一检测单元51，用于根据针对所述RGB图像的遮挡物检测结果确定非遮挡物位置,并从所述RGB图像人脸特征识别结果中筛选出，所述非遮挡物位置对应的部分RGB图像人脸特征识别结果，以及采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果；

第二检测单元52，用于从所述RGB图像中提取RGB图像眼睛图像，以及从所述红外图像中提取红外图像眼睛图像，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果；

判定单元54，用于判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测。

可选的，针对目标人脸，拍摄RGB图像以及拍摄红外图像之后，采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别之前，所述拍摄单元50进一步用于执行以下操作中的任意一种或组合：

可选的，采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果时，所述第一检测单元51用于：

可选的，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果时，所述第二检测单元52用于：

可选的，所述装置进一步包括：

第三检测单元53，用于在判定所述第一检测结果和所述第二检测结果均表征存在活体之前，执行以下操作：

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测，所述判定单元54用于：

可选的，进一步包括：

声纹检测单元55，用于在确定通过活体检测之前，获取所述目标人脸对应的人物录入的音频数据，提取所述音频数据的声纹特征，并基于所述声纹特征，确定存在活体。

基于同一发明构思，参阅图6所示，本公开实施例提供一种活体检测装置，包括：

存储器60，用于存储可执行指令；

处理器61，用于读取并执行存储器中存储的可执行指令，以实现上述实施例中介绍的任意一种方法。

基于同一发明构思，本申请实施例提供一种计算机可读存储介质，当所述计算机可读存储介质中的指令由处理器执行时，使得能够执行上述实施例中介绍的任意一种方法。

综上所述，本公开实施例中，采用双摄像头对被遮挡的人脸进行拍摄，分别获得一张RGB图像和一张红外图像，接着，结合RGB图像中的人脸未遮挡区域的人脸特征识别结果和红外图像中的人脸特征识别结果，获得活体检测的第一检测结果，进一步地，基于RGB图像眼睛图像的红外线反射率和红外图像眼睛图像的红外线反射率，获得活体检测的第二检测结果，从而在第一检测结果和第二检测结果均表征存在活体时，确定通过活体检测。这样，可以在由于人脸被遮挡而造成人脸特征减少的情况下，采用RGB图像的识别结果对红外图像的识别结果进行弥补，同时，结合未被遮挡的眼睛部位在RGB图像和红外图像中的红外线反射率的差异化，迅速对通过的目标人物进行活体检测，进而有效地提升了活体检测的检测效率，同时也保证了检测准确度。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本公开的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本公开范围的所有变更和修改。

显然，本领域的技术人员可以对本公开实施例进行各种改动和变型而不脱离本公开实施例的精神和范围。这样，倘若本公开实施例的这些修改和变型属于本公开权利要求及其等同技术的范围之内，则本公开也意图包含这些改动和变型在内。

Claims

一种应用于人脸遮挡场景的活体检测方法，其特征在于，包括：

针对目标人脸，拍摄红绿蓝RGB图像以及拍摄红外图像，并采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别，获得相应的RGB图像人脸特征识别结果和红外图像人脸特征识别结果；

根据针对所述RGB图像的遮挡物检测结果确定非遮挡物位置,并从所述RGB图像人脸特征识别结果中筛选出，所述非遮挡物位置对应的部分RGB图像人脸特征识别结果，以及采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果；

从所述RGB图像中提取RGB图像眼睛图像，以及从所述红外图像中提取红外图像眼睛图像，采用所述活体检测模型，基于所述RGB图像眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果；

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测。
如权利要求1所述的方法，其特征在于，针对目标人脸，拍摄RGB图像以及拍摄红外图像之后，采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别之前，进一步执行以下操作中的任意一种或组合：

对所述RGB图像和所述红外图像进行扫描，确定所述RGB图像和所述红外图像均包含所述目标人脸；

从所述RGB图像和所述红外图像中，删除非目标人脸，所述非目标人脸为人脸面积未达到预设的面积门限值的人脸；

对所述RGB图像和所述红外图像进行扫描，确定所述RGB图像包含的目标人脸和所述红外图像包含的目标人脸的交并比IOU面积达到第一设定阈值；

对所述RGB图像进行遮挡物检测，确定所述RGB图像中的目标人脸上的遮挡物的遮挡面积，与所述目标人脸的人脸面积的比值于第二设定阈值。
如权利要求1所述的方法，其特征在于，采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果，包括：

采用所述活体检测模型，判定所述红外图像人脸特征识别结果中包含有活体特征，以及所述部分RGB图像人脸特征识别结果包含的人脸特征的数目达到预设的数目门限值时，确定第一检测结果表征存在活体。
如权利要求1所述的方法，其特征在于，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果，包括：

采用所述活体检测模型，判定所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率不同时，确定所述第二检测结果表征存在活体。
如权利要求1－4任一项所述的方法，其特征在于，判定所述第一检测结果和所述第二检测结果均表征存在活体之前，进一步包括：

从所述RGB图像中进一步提取出RGB图像眼部图像，所述RGB图像眼部图像的面积大于所述RGB图像眼睛图像的面积；

从所述红外图像中进一步提取出红外图像眼部图像，所述红外图像眼部图像的面积大于所述红外图像眼睛图像的面积；

采用预设的活体检测模型，基于所述RGB图像眼部图像的拼接边缘的纹理识别结果，或/和，基于所述红外图像眼部图像的拼接边缘的纹理识别结果，进行活体检测，获得第三检测结果，其中，若所述第三检测结果表征不存在任何拼接边缘的纹理信息，则确定存在活体；

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测时，包括：

判定所述第一检测结果和所述第二检测结果均表征存在活体，以及所述第三检测结果也表征存在活体时，确定通过活体检测。
如权利要求5所述的方法，其特征在于，在确定通过活体检测之前，进一步包括：

获取所述目标人脸对应的人物录入的音频数据，提取所述音频数据的声纹特征，并基于所述声纹特征，确定存在活体。
一种应用于人脸遮挡场景的活体检测装置，其特征在于，包括：

拍摄单元，用于针对目标人脸，拍摄红绿蓝RGB图像以及拍摄红外图像，并采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别，获得相应的RGB图像人脸特征识别结果和红外图像人脸特征识别结果；

第一检测单元，用于根据针对所述RGB图像的遮挡物检测结果确定非遮挡物位置,并从所述RGB图像人脸特征识别结果中筛选出，所述非遮挡物位置对应的部分RGB图像人脸特征识别结果，以及采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果；

第二检测单元，用于从所述RGB图像中提取RGB图像眼睛图像，以及从所述红外图像中提取红外图像眼睛图像，采用所述活体检测模型，基于所述RGB眼睛图像的红外线反射率和所述红外图像眼睛图像的红外线反射率进行活体检测，获得第二检测结果；

判定单元，用于判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测。
如权利要求7所述的装置，其特征在于，针对目标人脸，拍摄RGB图像以及拍摄红外图像之后，采用预设的人脸特征识别模型，分别对所述RGB图像和所述红外图像进行人脸识别之前，所述拍摄单元进一步用于执行以下操作中的任意一种或组合：

对所述RGB图像和所述红外图像进行扫描，确定所述RGB图像和所述红外图像均包含所述目标人脸；

从所述RGB图像和所述红外图像中，删除非目标人脸，所述非目标人脸为人脸面积未达到预设的面积门限值的人脸；

对所述RGB图像和所述红外图像进行扫描，确定所述RGB图像包含的目标人脸和所述红外图像包含的目标人脸的交并比IOU面积达到第一设定阈值；

对所述RGB图像进行遮挡物检测，确定所述RGB图像中的目标人脸上的遮挡物的遮挡面积，与所述目标人脸的人脸面积的比值于第二设定阈值。
如权利要求7所述的装置，其特征在于，采用预设的活体检测模型，基于所述部分RGB图像人脸特征识别结果和所述红外图像人脸特征识别结果进行活体检测，获得第一检测结果时，所述第一检测单元用于：

采用所述活体检测模型，判定所述红外图像人脸特征识别结果中包含有活体特征，以及所述部分RGB图像人脸特征识别结果包含的人脸特征的数目达到预设的数目门限值时，确定第一检测结果表征存在活体。
如权利要求7所述的装置，其特征在于，采用所述活体检测模型，基于所述RGB眼睛图像的红外线折射率和所述红外图像眼睛图像的红外线折射率进行活体检测，获得第二检测结果时，所述第二检测单元用于：

采用所述活体检测模型，判定所述RGB眼睛图像的红外线折射率和所述红外图像眼睛图像的红外线折射率不同时，确定所述第二检测结果表征存在活体。
如权利要求7－10任一项所述的装置，其特征在于，进一步包括：

第三检测单元，用于在判定所述第一检测结果和所述第二检测结果均表征存在活体之前，执行以下操作：

从所述RGB图像中进一步提取出RGB图像眼部图像，所述RGB图像眼部图像的面积大于所述RGB图像眼睛图像的面积；

从所述红外图像中进一步提取出红外图像眼部图像，所述红外图像眼部图像的面积大于所述红外图像眼睛图像的面积；

采用预设的活体检测模型，基于所述RGB图像眼部图像的拼接边缘的纹理识别结果，或/和，基于所述红外图像眼部图像的拼接边缘的纹理识别结果，进行活体检测，获得第三检测结果，其中，若所述第三检测结果表征不存在任何拼接边缘的纹理信息，则确定存在活体；

判定所述第一检测结果和所述第二检测结果均表征存在活体时，确定通过活体检测，所述判定单元用于：

判定所述第一检测结果和所述第二检测结果均表征存在活体，以及所述第三检测结果也表征存在活体时，确定通过活体检测。
如权利要求11所述的装置，其特征在于，进一步包括：

声纹检测单元，用于在确定通过活体检测之前，获取所述目标人脸对应的人物录入的音频数据，提取所述音频数据的声纹特征，并基于所述声纹特征，确定存在活体。
一种活体检测装置，其特征在于，包括：

存储器，用于存储可执行指令；

处理器，用于读取并执行存储器中存储的可执行指令，以实现如权利要求1至6中任一项所述的媒体数据加密处理的方法。
一种计算机可读存储介质，其特征在于，当所述计算机可读存储介质中的指令由处理器执行时，使得能够执行如权利要求1至6中任一项所述媒体数据加密处理的方法。