WO2022133993A1

WO2022133993A1 - 基于视频数据进行人脸注册的方法、装置和电子白板

Info

Publication number: WO2022133993A1
Application number: PCT/CN2020/139354
Authority: WO
Inventors: 许景涛
Original assignee: 京东方科技集团股份有限公司
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2022-06-30
Also published as: CN115053268A; US20220398866A1; US11908235B2

Abstract

本公开实施例提供了一种基于视频数据进行人脸注册的方法，包括：接收视频数据；从视频数据中获取第一图像帧序列，第一图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框；根据每个图像帧中的人脸检测框之间的相对位置确定图像帧是否达到预设清晰度；在确定图像帧达到预设清晰度的情况下，基于多个人脸检测框的图像信息提取多组人脸特征，并根据多组人脸特征确定人脸是否表示同一对象；以及在确定人脸表示同一对象的情况下，根据第一图像帧序列注册对象。本公开实施例还提供了一种基于视频数据进行人脸注册的装置和电子白板。

Description

基于视频数据进行人脸注册的方法、装置和电子白板

技术领域

本公开实施例涉及人脸识别领域，尤其涉及一种基于视频数据进行人脸注册的方法、装置和电子白板。

背景技术

随着无纸化会议和无纸化办公的逐渐普及，电子白板的应用也越来越广泛。电子白板可以接收书写在其白板板面上的内容并将接收到的内容传输至计算机，从而方便地对白板板面上的内容进行记录和存储。在使用电子白板时，为了能够在任何距离处都方便地对电子白板进行操作，不会设置对电子白板进行锁定的功能。因此，任何人都可以对电子白板上的内容进行修改，这导致电子白板在使用过程中存在保密性差的问题。

发明内容

本公开实施例提供了一种基于视频数据进行人脸注册的方法、装置以及一种电子白板。

根据本公开实施例的第一方面，提供了一种基于视频数据进行人脸注册的方法，包括：接收视频数据；从所述视频数据中获取第一图像帧序列，所述第一图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框；根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否达到预设清晰度；在确定所述图像帧达到预设清晰度的情况下，基于所述多个人脸检测框的图像信息提取多组人脸特征，并根据所述多组人脸特征确定所述人脸是否表示同一对象；以及在确定所述人脸表示同一对象的情况下，根据所述第一图像帧序列注册所述对象。

在一些实施例中，从所述视频数据中获取第一图像帧序列包括：按照视频的捕获顺序从所述视频数据中获取多个图像帧；基于人脸检测模型确定所述图像帧是否包含人脸；以及在确定所述图像帧包含人脸的情况下，在所述多个图像帧中的每个图像帧中确定包含所述人脸的人脸检测框。

在一些实施例中，从所述视频数据中获取第一图像帧序列还包括：确定所获取的图像帧是否包含完整人脸特征；在所述图像帧包含完整人脸特征的情况下，将所述图像帧存储为第一图像帧序列中的一帧；在已存储的第一图像帧序列包括预定帧数的情况下，结束获取图像帧。

在一些实施例中，确定所获取的图像帧是否包含完整人脸特征包括：基于人脸姿态检测模型确定所述人脸是否是正脸；在确定所述图像帧中所包含的人脸是正脸的情况下，基于人脸遮挡检测模型确定所述人脸是否被遮挡；在确定所述图像帧中所包含的人脸未被遮挡的情况下，确定所述图像帧包含完整人脸特征；以及否则，确定所述图像帧不包含完整人脸特征。

在一些实施例中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否达到预设清晰度包括：确定所述第一图像帧序列中的两个图像帧中的人脸检测框的交集区域的面积相对于该两个图像帧中的人脸检测框的并集区域的面积的第一比率；以及在所确定的第一比率均大于第一阈值的情况下，确定所述图像帧达到预设清晰度。

在一些实施例中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否达到预设清晰度包括：确定所述第一图像帧序列中的两个图像帧中的人脸检测框的交集区域的面积相对于该两个图像帧中的人脸检测框的并集区域的面积的第一比率；确定大于第一阈值的所述第一比率的数量相对于所述第一比率总的数量的第二比率；以及在所述第二比率大于或等于第二阈值的情况下，确定所述图像帧达到预设清晰度。

在一些实施例中，根据所述多组人脸特征确定所述人脸是否表示同一对象包括：确定所述第一图像帧序列中任意相邻两个图像帧中的人脸特征之间的相似度；以及在所确定的相似度均大于第三阈值的情况下，确定所述人脸表示同一对象。

在一些实施例中，所述人脸特征包括人脸特征向量，并且其中，确定所述第一图像帧序列中任意相邻两个图像帧中的人脸特征之间的相似度包括：确定所述第一图像帧序列中相邻两个图像帧中的人脸特征向量之间的距离。

在一些实施例中，根据所述第一图像帧序列注册所述对象包括：以所述第一图像帧序列中的指定图像帧作为注册数据注册所述对象。

在一些实施例中，方法还包括：将根据所述第一图像帧序列注册所述对象而得到的注册数据存储为人脸库；以及基于所述人脸库对所接收的视频数据中的人脸进行识别。

在一些实施例中，基于所述人脸库对所接收的视频数据中的人脸进行识别包括：从接收的视频数据中获取第二图像帧序列，所述第二图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框；根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否包括活体人脸；在确定所述图像帧包括活体人脸的情况下，基于所述人脸检测框提取人脸特征；以及确定所述人脸特征是否与所述人脸库中的注册数据相匹配，以识别所述人脸。

在一些实施例中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否包括活体人脸包括：在每个图像帧中的人脸检测框中确定符合重合条件的人脸检测框；确定所述符合重合条件的人脸检测框的数量相对于所述人脸检测框中全部人脸检测框的数量的第三比率；以及在所述第三比率大于或等于第四阈值的情况下，确定所述人脸是非活体人脸；在所述第三比率小于所述第四阈值的情况下，确定所述人脸是活体人脸。

在一些实施例中，在每个图像帧中的人脸检测框中确定符合重合条件的人脸检测框包括：确定所述人脸检测框中任意两个人脸检测框之间的交集区域的面积相对于该任意两个人脸检测框中每个人脸检测框的面积的第四比率；在所确定的第四比率均大于第五阈值的情况下，确定所述任意两个人脸检测框是符合重合条件的人脸检测框；以及在所确定的第四比率均小于第五阈值的情况下，确定所述任意两个人脸检测框是不符合重合条件的人脸检测框。

在一些实施例中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否包括活体人脸还包括：在所确定的第四比率中的一个第四比率大于所述第五阈值且另一个第四比率小于或等于所述第五阈值的情况下，确定所述人脸是非活体人脸。

根据本公开实施例的第二方面，提供了一种基于视频数据进行人脸注册的装置，包括：存储器，配置为存储指令；以及处理器，配置为执行所述指令，以执行根据本公开实施例的第一方面所提供的方法。

根据本公开实施例的第三方面，提供了一种电子白板，包括根据本公开实施例的第二方面提供的装置。

根据本公开实施例的基于视频数据进行人脸注册的方法，无需用户在注册过程中进行复杂的交互就能够实现人脸的注册，从而简化注册操作的步骤，缩短注册时间，提升了用户体验。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对本公开实施例描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图，在附图中：

图1示出了根据本公开实施例的基于视频数据进行人脸注册的方法的流程图；

图2示出了根据本公开实施例的从视频数据中获取第一图像帧序列的过程；

图3A和图3B分别示出了根据本公开实施例的基于人脸检测框之间的相对位置确定图像帧是否达到预设清晰度的示例；

图4示出了根据本公开实施例的基于人脸检测框的坐标和尺寸计算人脸检测框的交集的示例；

图5示出了根据本公开另一实施例的基于人脸库对所接收的视频数据中的人脸进行识别解锁的方法的流程图；

图6示出了根据本公开实施例的在多个人脸检测框中确定符合重合条件的人脸检测框的过程；

图7示出了根据本公开另一实施例的基于视频数据进行人脸注册的装置的框图；以及

图8示出了根据本公开另一实施例的电子白板的框图。

具体实施方式

为使本公开实施例的目的、技术方案和优点更加清楚，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整的描述。显然，所描述的实施例是本公开的一部分实施例，而不是全部。基于所描述的本公开实施例，本领域普通技术人员在无需创造性劳动的前提下获得的所有其他实施例都属于本公开保护的范围。应注意，贯穿附图，相同的元素由相同或相近的附图标记来表示。在以下描述中，一些具体实施例仅用于描述目的，而不应该理解为对本公开有任何限制，而只是本公开实施例的示例。在可能导致对本公开的理解造成混淆时，将省略常规结构或构造。应注意，图中各部件的形状和尺寸不反映真实大小和比例，而仅示意本公开实施例的内容。

除非另外定义，本公开实施例使用的技术术语或科学术语应当是本领域技术人员所理解的通常意义。本公开实施例中使用的“第一”、“第二”以及类似词语并不表示任何顺序、数量或重要性，而只是用于区分不同的组成部分。

图1示出了根据本公开实施例的基于视频数据进行人脸注册的方法100的流程图。如图1所示，基于视频数据进行人脸注册的方法100可以包括以下步骤。

在步骤S110中，接收视频数据。

在步骤S120中，从视频数据中获取第一图像帧序列，第一图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框。

在步骤S130中，根据每个图像帧中的人脸检测框之间的相对位置确定图像帧是否达到预设清晰度。

在步骤S140中，在确定图像帧达到预设清晰度的情况下，基于多个人脸检测框的图像信息提取多组人脸特征，并根据多组人脸特征确定人脸是否表示同一对象。

在步骤S150中，在确定人脸表示同一对象的情况下，根据第一图像帧序列注册对象。

根据实施例，在步骤S110中，可以通过诸如摄像头之类的视频采集设备来捕获对象的视频数据。在其他的实施例中，也可以通过具有定时拍照功能的相机来捕获对象的视频数据。只要是能够获得连续图像帧的视频采集设备或图像采集设备即可。此外，在本公开的实施例中，对视频数据的格式不做限制。

根据实施例，在步骤S120中，在接收到视频数据之后，从视频数据中获取第一图像帧序列。在第一图像帧序列中的每个图像帧中包括包含完整人脸特征的人脸检测框。未在其中包括包含完整人脸特征的人脸检测框的图像帧不能用于人脸注册过程。

根据实施例，如果视频采集设备在一个图像帧中捕获到多个对象，则可以根据预设的规则对对象进行筛选。通过对注册对象进行筛选，确保仅针对一个对象进行注册。根据实施例，按照视频的捕获顺序从视频数据中获取多个图像帧，并基于人脸检测模型确定图像帧是否包含人脸，在确定图像帧包含人脸的情况下，在多个图像帧中的每个图像帧中确定人脸检测框。本公开实施例对所采用的人脸检测模型不做限制，可以采用任何人脸检测模型，也可以通过模型训练建立专门的检测模型。人脸检测框的参数可以具有四元数组的形式，分别记录人脸检测框的参考点的坐标和两个边长，以用于确定人脸检测框(或人脸)的位置和尺寸。根据实施例，对注册对象进行筛选的过程可以包括：确定包括图像帧中的每个对象人脸的人脸检测框，并分别比较各人脸检测框所包围区域的面积，从中选择所包围区域的面积最大的人脸检测框，并将该人脸检测框所包含的人脸作为注册对象。在本公开的其他实施例中，也可以在视频采集设备捕获视频时，通过图形用户界面(Graphical User Interface，GUI)提供视频捕获窗口，以提示对象将自己的脸置于该视频捕获窗口中来完成视频采集。

根据实施例，在步骤S130中，通过分析人脸检测框之间的相对位置来分析对象在第一图像帧序列中顺序排列的多个图像帧中所表现的动作行为。例如，可以分析对象是否在运动、运动的方向以及运动的幅度等。如果对象的运动幅度过大，则有可能导致视频采集设备所捕获的图像帧模糊。模糊的图像帧不能用于注册过程中的认证，也不能作为对象的最终注册数据进行存储。因此，在本公开的实施例中，通过分析人脸检测框之间的相对位置来确定人脸的运动幅度是否在预定范围内，可以确定所捕获的图像帧是否达到预设清晰度。

根据实施例，在步骤S140中，如果能够确定人脸的运动幅度在预定范围内，即图像帧达到预设清晰度，则可以基于该图像帧进一步确定各图像帧中的人脸是否属于同一个对象。根据实施例，可以利用人脸特征提取模型来提取多组人脸特征，所提取得到的人脸特征是具有一定维度的特征向量。

根据实施例，在步骤S150中，在确保已经使用了包含完整人脸特征的清晰图像帧进行注册认证，且各图像帧中的人脸都属于同一个对象的情况下，可以将第一图像帧序列中的一个指定图像帧作为对象的注册数据进行存储。

根据本公开的实施例，可以仅通过对接收的视频数据进行分析，而不需要注册对象配合眨眼、张嘴等交互方式就能够完成注册认证过程，极大地简化了注册认证的过程。

图2示出了根据本公开实施例的从视频数据中获取第一图像帧序列的过程。如图2所示，在步骤S201中，从多个图像帧中依次获取图像帧，该多个图像帧是按照视频的捕获顺序从视频数据中获取的连续图像帧，可以将提取到的图像帧序列暂时存储在缓存中。

接下来，在步骤S202中，可以设置用于提取第一图像帧序列的参数，包括设置循环变量i的初始值i＝1。

接下来，在步骤S203中，从多个图像帧中的第1帧开始，依次获取第i个图像帧。接下来，确定所获取的图像帧是否包含完整的人脸特征。这是因为对人脸进行处理的模型对输入数据的质量是有一定要求的。如果图像帧中的人脸被遮挡，或者人脸较大地偏离正脸姿态，都不利于模型对数据的处理。

接下来，在步骤S204中，基于人脸姿态检测模型确定人脸是否是正脸。例如，可以通过使用深度对齐网络(Deep Alignment Network，DAN)、微调卷积神经网络(Tweaked Convolutional Neural Network，TCNN)等对人脸关键点进行训练来得到人脸关键点。并且将所得到的人脸关键点输入到人脸姿态检测模型中，以根据人脸关键点对图像帧中的人脸的姿态进行估计。人脸姿态检测模型可以分别计算人脸的俯仰角、偏航角和翻滚角，并基于俯仰角、偏航角和翻滚角确定人脸是否为正脸，或者人脸的偏转范围是否在允许的范围内。

接下来，在步骤S205中，在确定人脸是正脸的情况下，基于人脸遮挡检测模型确定人脸是否被遮挡。例如，可以通过使用seetaface的人脸遮挡模型来确定人脸是否被遮挡。或者，也可以使用shuffleNet、mobileNet等轻量级网络对正脸和遮挡人脸进行分类训练以得到人脸遮挡模型来确定人脸是否被遮挡。

接下来，在步骤S206中，即在已经确定在所提取的图像帧中包含正脸且未被遮挡的情况下，确定所提取的图像帧中包含完整人脸特征，并将所提取的图像帧，即第i个图像帧存储为第一图像帧序列S1中的一帧。

接下来，在步骤S207中，确定已存储的第一图像帧序列S1中是否包括预定帧数的图像帧。这里，预定帧数的图像帧可以根据执行注册的计算设备的计算能力来确定。例如，如果计算设备的计算能力较强，则可以适当增加预定帧数，例如可以将预定帧数确定为30或50帧或者更多。如果计算设备的计算能力较弱，则可以将预定帧数确定为20帧或者更少。可以权衡注册过程中的认证准确率要求、设备的计算能力和注册认证时间要求来确定预定帧数。如果确定第一图像帧序列S1中已经存储了预定帧数的图像帧，则退出继续提取图像帧的过程，得到包括预定帧数的多个图像帧的第一图像帧序列S1。如果确定第一图像帧序列S1中尚未存储预定帧数的图像帧，则在步骤S208中，将循环变量i加1，即令i＝i+1后返回到步骤S203，继续从多个图像帧中获取第i个图像帧，直到第一图像帧序列S1中存储了预定帧数的图像帧。

根据本公开实施例的方法得到的第一图像帧序列，包括各自包括完整的人脸特征的多个图像帧，可以将其用于注册过程中针对人脸的动作行为的分析和人脸特征的识别。

根据本公开的实施例，根据每个图像帧中的人脸检测框之间的相对位置确定图像帧是否达到预设清晰度包括：确定第一图像帧序列中的两个图像帧中的人脸检测框的交集区域的面积相对于该两个图像帧中的人脸检测框的并集区域的面积的第一比率，以及在所确定的第一比率均大于第一阈值的情况下，确定图像帧达到预设清晰度。

根据本公开的另一实施例，根据每个图像帧中的人脸检测框之间的相对位置确定图像帧是否达到预设清晰度包括：确定第一图像帧序列中的两个图像帧中的人脸检测框的交集区域的面积相对于该两个图像帧中的人脸检测框的并集区域的面积的第一比率，确定大于第一阈值的第一比率的数量相对于第一比率总的数量的第二比率，以及在第二比率大于或等于第二阈值的情况下，确定图像帧达到预设清晰度。

根据实施例，用于执行计算的第一图像帧序列中的两个图像帧可以是相邻的图像帧，也可以是间隔的图像帧。例如，令第一图像帧序列S1包括图像帧F ₁、F ₂、F ₃、F ₄、F ₅、F ₆……等图像帧。在针对相邻的图像帧计算第一比率的实施例中，可以分别在F ₁和F ₂之间计算第一比率，在F ₂和F ₃之间计算第一比率，在F ₃和F ₄之间计算第一比率，……并以此类推。在针对间隔的图像帧计算第一比率的另一实施例中，可以间隔一个图像帧来执行计算，例如分别在F ₁和F ₃之间计算第一比率，在F ₃和F ₅之间计算第一比率，……并以此类推。在针对间隔的图像帧计算第一比率的又一实施例中，可以间隔两个或更多个图像帧来执行计算，例如在F ₁和F ₄之间计算第一比率，……并以此类推。

图3A和图3B分别示出了根据本公开实施例的基于人脸检测框之间的相对位置确定图像帧是否达到预设清晰度的示例。在图3A和图3B中，仅以针对相邻的图像帧计算第一比率的情况作为示例进行说明。

如图3A所示，第一图像帧序列包括多个图像帧，计算两个图像帧中的人脸检测框的交集区域的面积与并集区域的面积之比，以分析对象的动作行为。如图3A所示，相邻两个人脸检测框的交集区域的面积与并集区域的面积之比可以计算为F ₁₂/(F ₁+F ₂-F ₁₂)，其中，F ₁表示第1个图像帧中的人脸检测框，F ₂表示第2个图像帧中的人脸检测框，并同时以F ₁和F ₂表示人脸检测框F ₁和F ₂的面积，以F ₁₂表示人脸检测框F ₁和F ₂的交集区域的面积。

根据实施例，第一阈值可以根据注册的可靠性要求与图像清晰度要求进行设置。如果第一阈值设置得较大，则可以提高图像的质量，即确保图像更清晰，但有可能导致多次注册认证不能继续进行。反之，如果第一阈值设置得较小，则可以使注册认证的进行更流畅，但有可能引入比较多的不清晰图像，从而影响注册认证的可靠性。根据实施例，可以通过调整第一阈值来保证图像的质量。

如图3B所示，计算相邻图像帧中的人脸检测框的交集区域的面积与并集区域的面积之比的过程与图3A中所示的过程相同，可以参考图3A计算得到F ₁₂/(F ₁+F ₂-F ₁₂)。在图3B中，对大于第一阈值的第一比率的数量N ₁进行统计，然后计算大于第一阈值的第一比率的数量N ₁相对于第一比率总的数量N的第二比率N ₁/N。如果N ₁/N大于或等于第二阈值，则确定图像帧达到预设清晰度。

在该实施例中，即使部分图像帧的清晰度未达到预设的第一阈值，例如F ₂₃/(F ₂+F ₃-F ₂₃)小于第一阈值，也不因此而认为图像帧未达到预设清晰度。根据实施例，在达到预设清晰度的图像帧达到一定规模时，即大于第一阈值的第一比率的数量N ₁在第一比率总的数量N中所占的比率达到一定要求，即在大于第一阈值的第一比率的数量N ₁相对于第一比率总的数量N的第二比率N ₁/N大于或等于第二阈值的情况下，就认为图像帧达到预设清晰度。根据实施例，可以通过协调调整第一阈值和第二阈值来保证图像的质量。通过引入两个调整参数，使得判断图像帧是否达到预设清晰度时更加灵活和准确。

图4示出了根据本公开实施例的基于人脸检测框的坐标和尺寸计算人脸检测框的交集的示例。如图4所示，图4上方的坐标系是以图像帧的左上角点为坐标原点建立的坐标系，X轴正方向为沿图像帧的一个边延伸的方向，Y轴正方向为沿图像帧的另一个边延伸的方向。如图4所示，可以以参数集合[x ₁,y ₁,w ₁,h ₁]来表示第1个图像帧中人脸检测框的位置和尺寸。其中，x ₁和y ₁表示人脸检测框左上角点的坐标，w ₁表示人脸检测框沿X轴方向的长度，h ₁表示人脸检测框沿Y轴方向的长度。在该坐标系下方示出的是第1个图像帧中的人脸检测框与第2个图像帧中的人脸检测框做交集的过程。如图4所示，可以确定交集区域的左上角点坐标分别为x _min＝max(x ₁,x ₂)，y _min＝max(y ₁,y ₂)，并且可以确定交集区域的右下角点坐标分别为x _max＝min(x ₁+w ₁,x ₂+w ₂)，y _max＝min(y ₁+h ₁,y ₂+h ₂)。可以根据交集区域左上角点坐标和右下角点坐标计算交集区域的面积为S ₁₂＝(x _max-x _min)*(y _max-y _min)。

根据实施例，根据多组人脸特征确定人脸是否表示同一对象包括，确定第一图像帧序列中任意相邻两个图像帧中的人脸特征之间的相似度，以及在所确定的相似度均大于第三阈值的情况下，确定人脸表示同一对象；否则，确定人脸表示不同对象。在本公开的实施例中，可以通过调用人脸特征提取模型来获取人脸特征。不同的人脸特征提取模型输出不同维度的特征向量。对于特征向量，可以通过计算特征向量之间的距离来确定第一图像帧序列中任意相邻两个图像帧中的人脸特征之间的相似度。根据实施例，可以采用欧式距离

曼哈顿距离c＝|m _i-n _i|、或马氏距离

等计算特征向量之间的距离，其中m _i和n _i均表示向量。根据实施例，第三阈值的设置可以根据所采用的人脸特征提取模型所使用的数据库来确定。不同的人脸特征提取模型会给出识别准确率与相应阈值的设置。如果通过分析识别，确定第一图像帧序列中各图像帧中的人脸属于同一个对象，则可以以第一图像帧序列中的指定图像帧作为注册数据注册对象。

根据实施例，在保存注册数据之前，可以将注册数据与先前保存在人脸库中的注册数据进行相似度比较，如果该人脸已经注册，因此可以不覆盖存储。

根据本公开的实施例，通过使用视频进行注册，并通过对多个图像帧中人脸检测框之间的相对位置进行分析就可以确定图像帧的清晰度，不需要用户配合眨眼，张嘴等操作，由此简化了注册认证的过程，且保证了注册数据的可靠性。

图5示出了根据本公开另一实施例的基于人脸库对所接收的视频数据中的人脸进行识别解锁的方法500的流程图。如图5所示，方法500包括以下步骤：

在步骤S510中，接收输入视频帧数据。

在步骤S520中，从接收的视频数据中获取第二图像帧序列，第二图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框。

在步骤S530中，根据每个图像帧中的人脸检测框之间的相对位置确定图像帧是否包括活体人脸。

在步骤S540中，在确定图像帧包括活体人脸的情况下，基于人脸检测框提取人脸特征。

在步骤S550中，确定人脸特征是否与人脸库中的注册数据相匹配，以识别人脸。

在步骤S560中，识别解锁。

其中，步骤S510、S520、S540和S550的操作可以参加前述实施例中的基于视频数据进行人脸注册的方法100中的步骤S110、S120和S140获得，此处不再赘述。

根据实施例，根据每个图像帧中的人脸检测框之间的相对位置确定图像帧是否包括活体人脸包括，在每个图像帧中的人脸检测框中确定符合重合条件的人脸检测框，确定符合重合条件的人脸检测框的数量相对于多个人脸检测框中全部人脸检测框的数量的第三比率，以及在第三比率大于或等于第四阈值的情况下，确定人脸是非活体人脸，在第三比率小于第四阈值的情况下，确定人脸是活体人脸。

根据实施例，在每个图像帧中的人脸检测框中确定符合重合条件的人脸检测框包括，确定人脸检测框中任意两个人脸检测框之间的交集区域的面积相对于该任意两个人脸检测框中每个人脸检测框的面积的第四比率，在所确定的第四比率均大于第五阈值的情况下，确定任意两个人脸检测框是符合重合条件的人脸检测框，以及在所确定的第四比率均小于第五阈值的情况下，确定任意两个人脸检测框是不符合重合条件的人脸检测框。

在本实施例中，在多个人脸检测框中任意两个人脸检测框两两之间执行交集运算，并计算所得交集区域的面积与执行交集运算的两个人脸检测框中每个人脸检测框的面积之比，可以通过所得比值确定这两个人脸检测框之间的重合程度。根据实施例，设置第五阈值来衡量两个人脸检测框之间的重合程度。如果将第五阈值设置得较高，则必须在两个人脸检测框重合程度较高的情况下才能被确定为重合，人脸检测框重合表示对象在两个人脸检测框之间的时间段内大概率是没有动作行为的，即可以认为对象是静止的，进一步地，认为对象不是活体。因此如果将第五阈值设置得较高，将会降低重合的人脸检测框在全部人脸检测框之中的占比，会增加非活体被识别为活体的可能性。反之，如果将第五阈值设置的较低，则更多的人脸检测框将会被确定为是重合的，会增加活体被识别为非活体的可能性。在应用中，第五阈值可以根据注册认证应用的场合进行设置。例如，对于一些利用本公开实施例的方法来进行解锁功能的场合，可以将第五阈值设置的较高些，因为在这些场合中，基本可以保证对象为活体，因此降低活体被识别为非活体的可能性，可以充分保证活体对象被正确识别，由此提高用户的体验。

通过分析对象的动作行为可以确定人脸是否是活体人脸。即在本公开的实施例中，仅通过对多个图像帧中人脸检测框之间的相对位置进行分析就可以确定对象是否是活体，由此能够有效地阻止基于非活体的视频进行解锁的操作，例如可以避免使用对象的照片进行解锁的操作，提高了锁定的安全性。

图6示出了根据本公开实施例的在多个人脸检测框中确定符合重合条件的人脸检测框的过程。如图6所示，在得到第1个图像帧中的人脸检测框F ₁与第2个图像帧中的人脸检测框F ₂之间的交集区域之后，需要分别计算该交集区域F ₁₂的面积与人脸检测框F ₁的面积的第四比率F ₁₂/F ₁，以及计算该交集区域F ₁₂的面积与人脸检测框F ₂的面积的第四比率F ₁₂/F ₂。这里，仍以F ₁和F ₂表示人脸检测框区域F ₁和F ₂的面积。然后，需要分别比较第四比率F ₁₂/F ₁和F ₁₂/F ₂与第五阈值的关系，只有在第四比率F ₁₂/F ₁和F ₁₂/F ₂均大于第五阈值的情况下，才确定人脸检测框F ₁与人脸检测框F ₂符合重合条件。同理计算人脸检测框F ₁与人脸检测框F ₇的第四比率F ₁₇/F ₁和F ₁₇/F ₇，如果第四比率F ₁₇/F ₁和F ₁₇/F ₇均小于或等于第五阈值，则确定人脸检测框F ₁与人脸检测框F ₇不符合重合条件。

根据实施例，如果第二比率中的一个第二比率小于或等于第二阈值，另一个第二比率大于第二阈值，则确定人脸是非活体人脸。这是一种比较特殊的情况，造成这种情况的原因在于两个人脸检测框的尺寸相差较大。如图6所示，各人脸检测框(例如F ₁、F ₂、F ₇)被示出为具有相同的尺寸。实际中，人脸检测框的尺寸可以彼此不相同，但彼此之间的尺寸相差不大。如果某个人脸检测框的尺寸与其他人脸检测框的尺寸相差较大，则说明该人脸检测框中所包含的人脸可能运动幅度很大，或者该人脸检测框中所包含的人脸可能与其他人脸检测框中所包含的人脸不属于同一个人。因此，这种情况下，可以根据第四比率与第五阈值的比较结果直接确定对象是非活体，不再继续确定其他人脸检测框是否符合重合条件。

图7示出了根据本公开另一实施例的基于视频数据进行注册的装置700的框图。如图7所示，该装置700包括处理器701、存储器702和摄像头703，在存储器702中存储有机器可读指令，处理器701可以执行这些机器可读指令来实现根据本公开实施例的基于视频数据进行人脸注册的方法100。摄像头703可以被配置为获取视频数据，且摄像头703的帧数可以在每秒15～25帧的范围内。

存储器702可以具有以下形式：非易失性或易失性存储器，例如，电可擦除可编程只读存储器(EEPROM)、闪存等。

根据本公开实施例的装置700内部的各种组件可以通过多种器件来实现，这些器件包括但不限于：模拟电路器件、数字电路器件、数字信号处理(DSP)电路、可编程处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、可编程逻辑器件(CPLD)，等等。

图8示出了根据本公开另一实施例的电子白板800的框图。如图8所示，根据本公开实施例的电子白板800包括显示白板801和根据本公开实施例的基于视频数据进行人脸注册的装置802。

根据本公开实施例的电子白板，安装了基于视频数据进行注册的装置，无需人为交互，直接通过视频流截取方式进行人脸注册，采用直接获取视频帧的方式注册更加方便。根据本公开实施例的电子白板无需手动开关机，一定距离内就可以通过人脸信息直接解锁使用，保密性好。并且，只有预约注册的固定人脸才可以解锁，有效的保护了预约用户在电子白板使用过程中的信息安全。

以上的详细描述通过使用示意图、流程图和/或示例，已经阐述了众多实施例。在这种示意图、流程图和/或示例包含一个或多个功能和/或操作的情况下，本领域技术人员应理解，这种示意图、流程图或示例中的每一功能和/或操作可以通过各种结构、硬件、软件、固件或实质上它们的任意组合来单独和/或共同实现。

虽然已参照几个典型实施例描述了本公开，但应当理解，所用的术语是说明和示例性、而非限制性的术语。由于本公开能够以多种形式具体实施而不脱离公开的精神或实质，所以应当理解，上述实施例不限于任何前述的细节，而应在随附权利要求所限定的精神和范围内广泛地解释，因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。

Claims

一种基于视频数据进行人脸注册的方法，包括：

接收视频数据；

从所述视频数据中获取第一图像帧序列，所述第一图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框；

根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否达到预设清晰度；

在确定所述图像帧达到预设清晰度的情况下，基于所述多个人脸检测框的图像信息提取多组人脸特征，并根据所述多组人脸特征确定所述人脸是否表示同一对象；以及

在确定所述人脸表示同一对象的情况下，根据所述第一图像帧序列注册所述对象。
根据权利要求1所述的方法，其中，从所述视频数据中获取第一图像帧序列包括：

按照视频的捕获顺序从所述视频数据中获取多个图像帧；

基于人脸检测模型确定所述图像帧是否包含人脸；以及

在确定所述图像帧包含人脸的情况下，在所述多个图像帧中的每个图像帧中确定包含所述人脸的人脸检测框。
根据权利要求2所述的方法，其中，从所述视频数据中获取第一图像帧序列还包括：

确定所获取的图像帧是否包含完整人脸特征；

在所述图像帧包含完整人脸特征的情况下，将所述图像帧存储为第一图像帧序列中的一帧；

在已存储的第一图像帧序列包括预定帧数的情况下，结束获取图像帧。
根据权利要求3所述的方法，其中，确定所获取的图像帧是否包含完整人脸特征包括：

基于人脸姿态检测模型确定所述人脸是否是正脸；

在确定所述图像帧中所包含的人脸是正脸的情况下，基于人脸遮挡检测模型确定所述人脸是否被遮挡；

在确定所述图像帧中所包含的人脸未被遮挡的情况下，确定所述图像帧包含完整人脸特征；以及

否则，确定所述图像帧不包含完整人脸特征。
根据权利要求1至4中任一项所述的方法，其中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否达到预设清晰度包括：

确定所述第一图像帧序列中的两个图像帧中的人脸检测框的交集区域的面积相对于该两个图像帧中的人脸检测框的并集区域的面积的第一比率；以及

在所确定的第一比率均大于第一阈值的情况下，确定所述图像帧达到预设清晰度。
根据权利要求1至4中任一项所述的方法，其中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否达到预设清晰度包括：

确定所述第一图像帧序列中的两个图像帧中的人脸检测框的交集区域的面积相对于该两个图像帧中的人脸检测框的并集区域的面积的第一比率；

确定大于第一阈值的所述第一比率的数量相对于所述第一比率总的数量的第二比率；以及

在所述第二比率大于或等于第二阈值的情况下，确定所述图像帧达到预设清晰度。
根据权利要求5或6所述的方法，其中，根据所述多组人脸特征确定所述人脸是否表示同一对象包括：

确定所述第一图像帧序列中任意相邻两个图像帧中的人脸特征之间的相似度；以及

在所确定的相似度均大于第三阈值的情况下，确定所述人脸表示同一对象。
根据权利要求7所述的方法，其中，所述人脸特征包括人脸特征向量，并且其中，确定所述第一图像帧序列中任意相邻两个图像帧中的人脸特征之间的相似度包括：

确定所述第一图像帧序列中相邻两个图像帧中的人脸特征向量之间的距离。
根据权利要求1至8中任一项所述的方法，其中，根据所述第一图像帧序列注册所述对象包括：

以所述第一图像帧序列中的指定图像帧作为注册数据注册所述对象。
根据权利要求1所述的方法，还包括：

将根据所述第一图像帧序列注册所述对象而得到的注册数据存储为人脸库；以及

基于所述人脸库对所接收的视频数据中的人脸进行识别。
根据权利要求10所述的方法，其中，基于所述人脸库对所接收的视频数据中的人脸进行识别包括：

从接收的视频数据中获取第二图像帧序列，所述第二图像帧序列中的每个图像帧各自包括包含完整人脸特征的人脸检测框；

根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否包括活体人脸；

在确定所述图像帧包括活体人脸的情况下，基于所述人脸检测框提取人脸特征；以及

确定所述人脸特征是否与所述人脸库中的注册数据相匹配，以识别所述人脸。
根据权利要求11所述的方法，其中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否包括活体人脸包括：

在每个图像帧中的人脸检测框中确定符合重合条件的人脸检测框；

确定所述符合重合条件的人脸检测框的数量相对于所述人脸检测框中全部人脸检测框的数量的第三比率；以及

在所述第三比率大于或等于第四阈值的情况下，确定所述人脸是非活体人脸；在所述第三比率小于所述第四阈值的情况下，确定所述人脸是活体人脸。
根据权利要求12所述的方法，其中，在每个图像帧中的人脸检测框中确定符合重合条件的人脸检测框包括：

确定所述人脸检测框中任意两个人脸检测框之间的交集区域的面积相对于该任意两个人脸检测框中每个人脸检测框的面积的第四比率；

在所确定的第四比率均大于第五阈值的情况下，确定所述任意两个人脸检测框是符合重合条件的人脸检测框；以及

在所确定的第四比率均小于第五阈值的情况下，确定所述任意两个人脸检测框是不符合重合条件的人脸检测框。
根据权利要求13所述的方法，其中，根据每个图像帧中的人脸检测框之间的相对位置确定所述图像帧是否包括活体人脸还包括：

在所确定的第四比率中的一个第四比率大于所述第五阈值且另一个第四比率小于或等于所述第五阈值的情况下，确定所述人脸是非活体人脸。
一种基于视频数据进行人脸注册的装置，包括：

存储器，配置为存储指令；以及

处理器，配置为执行所述指令，以执行如权利要求1至14中任一项所述的方法。
一种电子白板，包括如权利要求15所述的装置。