CN112819863A

CN112819863A - 一种远距离虹膜识别中的抓拍目标跟踪方法及计算设备

Info

Publication number: CN112819863A
Application number: CN202110408636.XA
Authority: CN
Inventors: 张小亮; 王秀贞; 戚纪纲; 杨占金; 其他发明人请求不公开姓名
Original assignee: Beijing Superred Technology Co Ltd
Current assignee: Beijing Superred Technology Co Ltd
Priority date: 2021-04-16
Filing date: 2021-04-16
Publication date: 2021-05-18
Anticipated expiration: 2041-04-16
Also published as: CN112819863B

Abstract

本发明公开了一种远距离虹膜识别中的抓拍目标跟踪方法，包括：利用人脸检测器，从初始图像帧中确定出待抓拍人脸；基于待抓拍人脸，从与初始图像帧相邻的连续多个图像帧中确定出抓拍轨迹；利用第一追踪器，提取各图像帧在抓拍轨迹上的图像特征；通过对当前图像帧进行特征匹配，来跟踪抓拍轨迹；对后续的图像帧重复跟踪抓拍轨迹的步骤，若未跟踪到抓拍轨迹，则判断当前图像帧的图像质量是否达标；若当前图像帧的图像质量达标，则利用人脸检测器，从当前图像帧中确定出至少一个人脸检测框，并判断所确定的人脸检测框与抓拍轨迹是否存在重叠；若存在重叠，则利用第二追踪器来确认抓拍轨迹。本发明一并公开了相应的计算设备。

Description

一种远距离虹膜识别中的抓拍目标跟踪方法及计算设备

技术领域

本发明涉及图像处理技术领域，尤其涉及一种远距离虹膜识别中的抓拍目标跟踪方法及计算设备。

背景技术

当前，虹膜识别技术飞速发展，已经在生物识别市场中占有一定的份额。虹膜识别的业务范围很广，按识别距离，可分为近距离（40cm内）虹膜识别和远距离（1m以外）虹膜识别。在进行远距离虹膜识别任务时，通常需要先定位到待识别的目标，再执行虹膜识别的相关的任务。由于待识别目标较小、处于运动状态等原因，通常需要对待识别目标进行抓拍，来对其进行定位及轨迹跟踪，以避免在识别过程中，发送虹膜区域切换、待识别目标丢失的问题，影响远距离虹膜识别的精度和效率。

因此，有必要实现一种针对远距离虹膜识别任务的跟踪抓拍目标的方案。

发明内容

为此，本发明提供了一种远距离虹膜识别中的抓拍目标跟踪方法及计算设备，以力图解决或至少缓解上面存在的问题。

根据本发明的第一个方面，提供了一种抓拍目标跟踪方法，在计算设备中执行，包括步骤：利用人脸检测器，从初始图像帧中确定出待抓拍人脸；基于待抓拍人脸，从与初始图像帧相邻的连续多个图像帧中确定出抓拍轨迹，抓拍轨迹中包含待抓拍人脸在各图像帧中的位置信息；利用第一追踪器，提取各图像帧在抓拍轨迹上的图像特征，并保存到特征集合；通过从特征集合中对当前图像帧进行特征匹配，来跟踪抓拍轨迹，并将当前图像帧的图像特征保存到特征集合；对后续的图像帧重复跟踪抓拍轨迹的步骤，若未跟踪到抓拍轨迹，则判断当前图像帧的图像质量是否达标；若当前图像帧的图像质量达标，则利用人脸检测器，从当前图像帧中确定出至少一个人脸检测框，并判断所确定的人脸检测框与抓拍轨迹是否存在重叠；若存在重叠，则利用第二追踪器来确认抓拍轨迹；若不存在重叠，则通过在抓拍轨迹一定范围内进行特征匹配，来跟踪抓拍轨迹。

可选地，根据本发明的方法还包括步骤：从与初始图像帧相邻的连续多个图像帧中，分别匹配待抓拍人脸，得到匹配到的人脸的位置信息；基于所匹配到的位置信息，确定抓拍轨迹。

可选地，根据本发明的方法还包括步骤：基于所确定的抓拍轨迹，训练生成第一追踪器，以提取各图像帧在所述抓拍轨迹上的图像特征，其中，所提取的图像特征至少包括：方向梯度直方图、颜色特征、PCA-SIFT特征。

可选地，在根据本发明的方法中，通过从特征集合中对当前图像帧进行特征匹配，来跟踪抓拍轨迹，并将当前图像帧的图像特征保存到特征集合的步骤包括：利用第一追踪器，从当前图像帧中确定人脸追踪框及其中的图像特征，作为当前图像帧的图像特征；对特征集合中上一图像帧的图像特征与当前图像帧的图像特征进行特征匹配，若匹配通过则将人脸追踪框的位置信息保存到抓拍轨迹中；以及将当前图像帧的图像特征保存到特征集合。

可选地，在根据本发明的方法中，对后续的图像帧重复跟踪所述抓拍轨迹的步骤还包括：判断跟踪抓拍轨迹的时间是否达到时间阈值；若跟踪抓拍轨迹的时间未达到时间阈值，则在特征集合中，分时段对图像特征进行排序，并对后续的图像帧重复跟踪抓拍轨迹的步骤；若跟踪抓拍轨迹的时间达到时间阈值，则对特征集合中的图像特征进行采样，得到新的特征集合。

可选地，根据本发明的方法还包括步骤：若当前图像帧的图像质量未达标，则判断当前图像帧之后的连续的多个图像帧的图像质量是否达标；若多个图像帧的图像质量达标，则利用人脸检测器，从当前图像帧中确定出至少一个人脸检测框；若多个图像帧的图像质量未达标，则对后续的图像帧重复跟踪抓拍轨迹的步骤，并在预定时长内未跟踪到抓拍轨迹时，删除抓拍轨迹，以便于重新执行确定待抓拍人脸的步骤。

可选地，在根据本发明的方法中，利用第二追踪器来确认抓拍轨迹的步骤包括：利用第二追踪器，提取与当前图像帧相邻的多个图像帧中的图像特征并进行特征匹配；若匹配成功，则将第二追踪器所指向的人脸追踪框的位置信息保存到抓拍轨迹；利用第一追踪器提取人脸追踪框的图像特征，以保存到特征集合，来对后续的图像帧重复跟踪抓拍轨迹的步骤。

可选地，在根据本发明的方法中，利用人脸检测器，从初始图像帧中确定出待抓拍人脸的步骤包括：利用人脸检测器，对初始图像帧进行人脸检测，得到至少一个人脸检测框；从至少一个人脸检测框中选取满足预定条件的人脸检测框，所选取的人脸检测框指向待抓拍人脸。

可选地，根据本发明的方法还包括步骤：基于自注意力机制，分时段对图像特征进行排序。

根据本发明的第二个方面，提供了一种计算设备，包括：至少一个处理器；和存储有程序指令的存储器，当程序指令被处理器读取并执行时，使得计算设备执行上述方法。

根据本发明的第三个方面，提供一种存储有程序指令的可读存储介质，当程序指令被计算设备读取并执行时，使得计算设备执行上述方法。

根据本发明的技术方案，考虑到目标追踪过程中因快速移动、图像模糊、目标遮挡等，而造成追踪目标丢失问题，设置了相应的处理流程，以尽可能排除影响跟踪抓拍轨迹的因素，最大程度缩减处理虹膜识别及抓拍任务的耗时。同时，采用人脸检测器和人脸追踪器相结合的方式，实现对抓拍人脸的准确跟踪。

上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

附图说明

为了实现上述以及相关目的，本文结合下面的描述和附图来描述某些说明性方面，这些方面指示了可以实践本文所公开的原理的各种方式，并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述，本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开，相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的计算设备100的示意图；

图2示出了根据本发明一个实施例的远距离虹膜识别中的抓拍目标跟踪方法200的流程示意图；

图3示出了根据本发明一个实施例的预定区域的示意图；

图4示出了根据本发明一个实施例的人脸追踪框周围区域的示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

针对现有技术中存在的问题，本发明提供了一种远距离虹膜识别中的抓拍目标的跟踪方法。通过该方法，能在一定程度上解决远距离虹膜识别领域中，因遮挡、快速移动、待识别目标过小（图像模糊）等问题所造成的抓拍目标（即，待识别目标）丢失问题。

根据本发明的实施方式，通过计算设备来执行该抓拍目标跟踪方法。图1是示例性的计算设备100的构造图。

如图1所示，在基本配置102中，计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。

取决于期望的配置，处理器104可以是任何类型的处理，包括但不限于：微处理器（µP）、微控制器（µC）、数字信息处理器（DSP）或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。示例的处理器核心114可以包括运算逻辑单元（ALU）、浮点数单元（FPU）、数字信号处理核心（DSP核心）或者它们的任何组合。示例的存储器控制器118可以与处理器104一起使用，或者在一些实现中，存储器控制器118可以是处理器104的一个内部部分。

取决于期望的配置，系统存储器106可以是任意类型的存储器，包括但不限于：易失性存储器（诸如RAM）、非易失性存储器（诸如ROM、闪存等）或者它们的任何组合。计算设备中的物理内存通常指的是易失性存储器RAM，磁盘中的数据需要加载至物理内存中才能够被处理器104读取。系统存储器106可以包括操作系统120、一个或者多个应用122以及程序数据124。在一些实施方式中，应用122可以布置为在操作系统上由一个或多个处理器104利用程序数据124执行指令。操作系统120例如可以是Linux、Windows等，其包括用于处理基本系统服务以及执行依赖于硬件的任务的程序指令。应用122包括用于实现各种用户期望的功能的程序指令，应用122例如可以是浏览器、即时通讯软件、软件开发工具（例如集成开发环境IDE、编译器等）等，但不限于此。当应用122被安装到计算设备100中时，可以向操作系统120添加驱动模块。

在计算设备100启动运行时，处理器104会从存储器106中读取操作系统120的程序指令并执行。应用122运行在操作系统120之上，利用操作系统120以及底层硬件提供的接口来实现各种用户期望的功能。当用户启动应用122时，应用122会加载至存储器106中，处理器104从存储器106中读取并执行应用122的程序指令。

计算设备100还包括存储设备132，存储设备132包括可移除存储器136和不可移除存储器138，可移除存储器136和不可移除存储器138均与存储接口总线134连接。

计算设备100还可以包括有助于从各种接口设备（例如，输出设备142、外设接口144和通信设备146）到基本配置102经由总线/接口控制器130的通信的接口总线140。示例的输出设备142包括图形处理单元148和音频处理单元150。它们可以被配置为有助于经由一个或者多个A/V端口152与诸如显示器153或者扬声器之类的各种外部设备进行通信。示例外设接口144可以包括串行接口控制器154和并行接口控制器156，它们可以被配置为有助于经由一个或者多个I/O端口158和诸如输入设备（例如，键盘、鼠标、笔、语音输入设备、触摸输入设备）或者其他外设（例如打印机、扫描仪等）之类的外部设备进行通信。示例的通信设备146可以包括网络控制器160，其可以被布置为便于经由一个或者多个通信端口164与一个或者多个其他计算设备162通过网络通信链路的通信。

网络通信链路可以是通信介质的一个示例。通信介质通常可以体现为在诸如载波或者其他传输机制之类的调制数据信号中的计算机可读指令、数据结构、程序模块，并且可以包括任何信息递送介质。“调制数据信号”可以是这样的信号，它的数据集中的一个或者多个或者它的改变可以在信号中编码信息的方式进行。作为非限制性的示例，通信介质可以包括诸如有线网络或者专线网络之类的有线介质，以及诸如声音、射频（RF）、微波、红外（IR）或者其它无线介质在内的各种无线介质。这里使用的术语计算机可读介质可以包括存储介质和通信介质二者。

计算设备100还包括与总线/接口控制器130相连的存储接口总线134。存储接口总线134与存储设备132相连，存储设备132适于进行数据存储。示例的存储设备132可以包括可移除存储器136（例如CD、DVD、U盘、可移动硬盘等）和不可移除存储器138（例如硬盘驱动器HDD等）。

在根据本发明的计算设备100中，应用122包括用于执行本发明的远距离虹膜识别中的抓拍目标跟踪方法200的指令。上述指令可以指示处理器104执行本发明的远距离虹膜识别中的抓拍目标跟踪方法200，来跟踪出抓拍目标，以实现远距离虹膜识别。

图2示出了根据本发明一个实施例的远距离虹膜识别中的抓拍目标跟踪方法200的流程示意图。根据一种实施例，方法200可以在计算设备（如上所述的计算设备100）中执行。如图2所示，方法200始于步骤S210。

在步骤S210中，利用人脸检测器，从初始图像帧中确定出待抓拍人脸。

根据本发明的实施例，对于一段视频（或称为一次跟踪抓拍轨迹的任务）中的初始图像帧，利用人脸检测器，对初始图像帧进行人脸检测，得到至少一个人脸检测框。之后，从这至少一个人脸检测框中选取满足预定条件的人脸检测框，所选取的人脸检测框就指向待抓拍目标的人脸（简称之，待抓拍人脸）。

在一种实施例中，预定条件包括以下条件中的至少一个：人脸检测框处于预定区域、人脸检测框的面积满足面积区间、人脸置信度是最大置信度分数。

图3示出了根据本发明一个实施例的预定区域的示意图。如图3所示，预定区域310是位于图像中心区域，即，不包含图像上边界区域322、下边界区域324、左边界区域326和右边界区域328。可选地，设图像的宽为W，高为H，那么，上边界区域322和下边界区域324的宽均为W，高均为H/8，左边界区域326和右边界区域328的高均为H，宽均为W/6，不限于此。

人脸检测框的面积区间设为(a, b)。在一种实施例中，采集大量垂直距离摄像头第一距离的人脸图像，对其进行人脸检测并计算出人脸检测框的面积均值a，同时，采集大量垂直距离摄像头第二距离的人脸图像（第一距离大于第二距离），对其进行人脸检测并计算出人脸检测框的面积均值b。这样，待追踪的人脸距离摄像头的范围就在第二距离到第一距离之间，能更好地与远距离虹膜识别算法相结合。需要说明的是，第一距离和第二距离可根据实际场景来进行设置，本发明不受限于此。

根据本发明的实施例，对于所检测出的至少一个人脸检测框，先过滤到非中心区域的人脸检测框，若过滤后无人脸检测框，则对下一个图像帧执行步骤S210；若有则选取在面积区间内的人脸检测框。同样地，若不存在在面积区间内的人脸检测框，则对下一个图像帧执行步骤S210；若在面积区间内有人脸检测框，则判定该人脸检测框为待抓拍人脸。

此外，若在面积区间内不止一个人脸检测框，则对这多个人脸检测框，按照人脸置信度进行降序排序，选出最大置信度分数对应的人脸检测框，作为待抓拍人脸。

随后，在步骤S220中，基于待抓拍人脸，从与初始图像帧相邻的连续多个图像帧中确定出抓拍轨迹。抓拍轨迹中包含待抓拍人脸在各图像帧中的位置信息。

根据本发明的实施方式，对与初始图像帧相邻的下一图像帧进行人脸检测，得到至少一个人脸检测框。对下一图像帧的人脸检测框与待抓拍人脸进行匹配，若达到匹配标准，则将所匹配到的人脸检测框的位置信息，作为该图像帧的待抓拍人脸。

在一种实施例中，采用CIoU方法，来对两个图像帧进行匹配。若CIoU值大于80%，则确认达到匹配标准。若有多个人脸检测框达到匹配标准，则选取CIoU值最大的人脸检测框，作为待抓拍人脸。

具体表示如下：

式中，

，A和B分别表示两个相邻图像帧，更具体地，A表示当前图像帧（初始图像帧），B表示A的下一图像帧，

为待抓拍人脸的中心点，

为下一图像帧中人脸检测框的中心点，

为两个中心点间的欧氏距离，

为能够同时包含这两个相邻图像帧的最小闭包区域的对角线距离，

是权重系数，用来控制

的比重，

用来度量长宽比的相似性，表示如下：

，

和

表示图像帧B中所检测到的人脸检测框的宽和高，

和

表示图像帧A中待抓拍人脸的宽和高。

对与初始图像帧相邻的连续多个图像帧（例如，选取连续的4个图像帧），均执行上述匹配步骤，若均达到匹配标准，则可分别匹配出各图像帧中的待抓拍人脸的位置信息。之后，基于所匹配到的位置信息，确定出抓拍轨迹。

根据本发明的实施例，在对前后两个相邻的图像帧进行匹配时，考虑了前后帧人脸检测框的中心距离、长宽比判定、最小闭包区域等信息，与常规IOU计算前后帧交并比相比，有效提高了匹配准确率。

随后在步骤S230中，利用第一追踪器，提取各图像帧在抓拍轨迹上的图像特征，并保存到特征集合。

根据一种实施例，在确定出抓拍轨迹后，还需要基于该抓拍轨迹，训练生成第一追踪器。对所确定的抓拍轨迹，使用经典相关滤波KCF方法训练追踪滤波器，具体来说，使用抓拍轨迹周围区域的循环矩阵采集正负样本，利用脊回归训练目标检测器，利用循环矩阵在傅里叶空间可对角化的性质，将矩阵的运算转化为向量元素点乘。用多通道的形式训练出多个滤波器，提取抓拍轨迹周围区域的图像特征。图像特征包括但不限于，方向梯度直方图HOG、颜色特征CN、PCA-SIFT特征。之后，以HOG特征为主，CN特征、PCA-SIFT特征为辅，通过相应的权重链接组合成专注于提取浅层特征的第一追踪器。权重的确定主要是通过实验测试来确定，本发明实施例不做限制。

可选地，抓拍轨迹周围区域可以是根据抓拍轨迹的位置信息所确定的抓拍框所指示的矩形区域。

之后，将经过第一追踪器提取的图像特征，保存到特征集合。

在确定出抓拍轨迹后，将接下来的一个图像帧，作为当前图像帧，执行步骤S240：通过从特征集合中对当前图像帧进行特征匹配，来跟踪抓拍轨迹，并将当前图像帧的图像特征保存到特征集合。

同样地，利用训练好的第一追踪器，可以从当前图像帧中确定出抓拍人脸的区域，作为人脸追踪框，并提取出人脸追踪框的图像特征，作为当前图像帧的图像特征。之后，对特征集合中上一图像帧的图像特征与当前图像帧的图像特征进行特征匹配，若匹配通过则将人脸追踪框的位置信息保存到抓拍轨迹中，并将当前图像帧的图像特征保存到特征集合。

根据本发明的实施例，采用余弦距离来对上一图像帧的图像特征与当前图像帧的图像特征进行特征匹配。若余弦距离达到阈值，则认为匹配通过。

另外，在对前后两个图像帧的图像特征进行特征匹配时，先基于抓拍轨迹上的位置信息，在其所指示的图像区域内进行特征匹配，若匹配未通过，可以扩大匹配范围，在全局图像上进行特征匹配。若在全局图像上特征匹配通过，则利用此时当前图像帧的人脸追踪框的位置信息，来更新抓拍轨迹，并将其对应的图像特征保存到特征集合，继续抓拍轨迹的跟踪。

之后，对后续的图像帧重复步骤S240，来跟踪抓拍轨迹。

若跟踪丢失，即未跟踪到抓拍轨迹，则首先判断是否是由图像质量问题所引起的跟踪丢失。故在随后的步骤S250中，判断当前图像帧的图像质量是否达标。

根据本发明的一种实施例，采用无参考图像质量评价算法（NR-IQA），来确定图像质量。可选地，在确定当前图像帧的图像质量时，仅针对人脸追踪框的周围区域来计算质量分数。本发明实施例并不限制具体采用何种算法来计算质量分数，例如可以采用传统的无参考图像质量评价方法，如Brenner 梯度函数、Tenengrad 梯度函数、Laplacian 梯度函数等。

在一种实施例中，人脸追踪框的周围区域按照如下方式来定义。假设，人脸追踪框的宽和高分别为w和h，那么，其周围区域为以人脸追踪框为中心、宽为5*w、高为5*h的矩形区域。图4示出了根据本发明一个实施例的人脸追踪框周围区域的示意图。如图4，图像帧400中，人脸追踪框410位于人脸追踪框周围区域420的中心。

此外，还可以通过当前的图像采集设备（如，抓拍设备）抓拍得到大量包含人脸的清晰图像，利用NR-IQA算法确定它们的质量分数，并据此设置一个分数阈值。当质量分数不小于阈值时，认为图像质量达标（即，图像清晰、无失真）；反之，当质量分数小于阈值时，认为图像质量未达标。

若当前图像帧的图像质量达标，则执行步骤S260，判断是否是由于目标被遮挡所引起的跟踪丢失。反之，若当前图像帧的图像质量未达标，则确认是由于图像质量问题所引起的跟踪丢失，继续执行步骤S270。

在步骤S260中，利用人脸检测器，从当前图像帧中确定出至少一个人脸检测框，并判断所确定的人脸检测框与抓拍轨迹是否存在重叠。

在一种实施例中，判断从当前图像帧中确定出的人脸检测框，与抓拍轨迹所指向的上一图像帧中待抓拍人脸的位置信息是否存在重叠。可采用前文所述的CIoU方法来计算是否存在重叠，例如，只要CIoU值大于0，则说明二者存在重叠。

若存在重叠，则认为有其他目标遮挡了待抓拍人脸，执行步骤S262，利用第二追踪器来确认抓拍轨迹。

第二追踪器采用ECO算法与VGG(1:m)模型相结合的方式。其中，ECO算法主要使用因式分解卷积算子、训练样本分布紧凑的生成模型、提高鲁棒性和降低复杂度的保守模型更新策略等方法，来对单目标跟踪相关滤波C-COT算法进行进一步优化。VGG(1:m)模型为神经网络经典结构VGG系列，其中，(1：m)表示使用VGG网络结构系列中第1层到第m层作用到目标图像区域提取到的图像特征。第二追踪器将ECO算法提取到的图像特征与VGG(1:m)模型提取到的图像特征进行加权，来提取在被其他目标遮挡时，前预定帧数内图像帧的抓拍轨迹所指向的位置信息的深度图像特征，并将所提取的深度图像特征保存到特征集合中。特别地，深度图像特征可以单独作为一个子集，保存在特征集合中，以区别于由第一追踪器所提取的图像特征。

在一种实施例中，利用第二追踪器，提取与当前图像帧相邻的多个图像帧中的图像特征并进行特征匹配。可选地，该多个图像帧的帧数帧数可调节，对待抓拍人脸的抓拍轨迹丢失前，该抓拍轨迹周围区域内进行深度图像特征的匹配。关于深度图像特征的匹配，可采用CIoU方法，具体可参考前文相关描述，此处不再赘述。

若在预定帧数内有一帧匹配得上，则认为匹配成功。当然不限于此，也可以通过设置帧数阈值来确定是否匹配成功。若匹配成功，则继续跟踪该抓拍轨迹，并将第二追踪器所指向的人脸追踪框的位置信息保存到该抓拍轨迹。同时，用第一追踪器提取此时人脸追踪框的图像特征，并保存到特征集合。之后，对后续的图像帧重复步骤S240，来跟踪抓拍轨迹。

反之，若在预定帧数内未匹配成功，则保留特征集合中的深度图像特征和图像特征，并在后续的图像帧中全局范围内进行深度图像特征的匹配，若在一定时间内（如15秒）无深度图像特征匹配成功，即，未搜索到该抓拍轨迹，则删除该抓拍轨迹（包括位置信息及特征集合），并返回步骤S210，重新从当前视频帧中确认待抓拍人脸，并将当下的图像帧作为初始图像帧。

若不存在重叠，则执行步骤S264，通过在抓拍轨迹一定范围内进行特征匹配，来跟踪抓拍轨迹。这里的“一定范围”包括空间和时间两层含义，即，在一定帧数（如，8帧，但不限于此）内，在抓拍轨迹附近的一定区域内（例如，将抓拍轨迹的位置信息所指向的矩形区域扩大1.5倍，不限于此）进行特征匹配。关于特征匹配的过程此处不再赘述，可以采用余弦距离等方法来计算。若匹配成功，则更新抓拍轨迹并保存图像特征；反之，若匹配不成功，则删除抓拍轨迹，并返回步骤S210，重新确认待抓拍人脸。

在步骤S270中，先判断当前图像帧之后的连续的多个图像帧（如3帧，不限于此）的图像质量是否达标。若这多个图像帧的图像质量达标，则认为不存在图像质量问题，返回步骤S260。

反之，若这多个图像帧的图像质量未达标，则确认存在质量问题。此时，对后续的图像帧重复步骤S240来跟踪抓拍轨迹，若在预定时长（如，15秒）内未跟踪到抓拍轨迹，则删除抓拍轨迹，并重新执行步骤S210，来重新确定待抓拍人脸。

根据本发明的实施方式，在执行步骤S240跟踪抓拍轨迹的过程中，还会执行步骤S280，判断跟踪抓拍轨迹的时间是否达到时间阈值。

若跟踪抓拍轨迹的时间未达到时间阈值，则执行步骤S292，在特征集合中，分时段对图像特征进行排序。在一种实施例中，基于transformer框架中的自注意力机制，分时段对图像特征进行排序，排序后，利用特征集合中排序后的图像特征，对后续的图像帧重复步骤S240，跟踪抓拍轨迹的步骤。在一种实施例中，时间阈值设为120秒，不限于此。

根据本发明的实施方式，运用自注意力机制为抓拍轨迹的图像特征进行重要性排序，使得特征匹配时准确性更高，并含有时序性。

若跟踪抓拍轨迹的时间达到时间阈值，则执行步骤S294，对特征集合中的图像特征进行采样，得到新的特征集合。在一种实施例中，采样时，以120s时刻为起点，往前每3帧抽取1帧，一共抽取50帧，并获取其追踪信息（包括抓拍轨迹上的位置信息和图像特征），由所抽取的50帧的图像特征，组成新的特征集合。这样操作，主要是对内存进行管理，防止长时间抓拍一个轨迹时，保留的特征及位置信息过长导致内存泄漏，程序崩溃。之后，继续执行步骤S240，跟踪抓拍轨迹。

根据本发明的一种实施方式，所抓拍到的人脸，可以应用于远距离虹膜识别场景中。具体地，计算设备100还会对所跟踪的抓拍人脸进行虹膜识别，或交由后端设备对其进行虹膜识别，本发明实施例对此不做限制。在完成虹膜识别任务后，计算设备100便可结束本次跟踪抓拍轨迹的任务。之后，计算设备100清理内存，并重新执行方法200：确定下一个虹膜识别任务所指向的待抓拍人脸，并对其进行跟踪。

根据本发明的方法200，考虑到目标追踪过程中因快速移动、图像模糊、目标遮挡等，而造成追踪目标的丢失，设置了相应的处理流程，以尽可能排除影响跟踪抓拍轨迹的因素，最大程度缩减处理虹膜识别及抓拍任务的耗时。同时，采用人脸检测器和人脸追踪器（第一追踪器、第二追踪器）相结合的方式，实现对抓拍人脸的准确跟踪。

此外，为防止内存爆炸，影响处理效率，在跟踪过程中还会定期对特征集合进行采样，以实现内存清理。

这里描述的各种技术可结合硬件或软件，或者它们的组合一起实现。从而，本发明的方法和设备，或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介，例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式，其中当程序被载入诸如计算机之类的机器，并被所述机器执行时，所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下，计算设备一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件)，至少一个输入装置，和至少一个输出装置。其中，存储器被配置用于存储程序代码；处理器被配置用于根据该存储器中存储的所述程序代码中的指令，执行本发明的方法。

以示例而非限制的方式，可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据，并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。

在此处所提供的说明书中，算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的优选实施方式。

在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。

类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中，或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书（包括伴随的权利要求、摘要和附图）中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书（包括伴随的权利要求、摘要和附图）中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

此外，所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此，具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外，装置实施例的在此所述的元素是如下装置的例子：该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样，除非另行规定，使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例，并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明，但是受益于上面的描述，本技术领域内的技术人员明白，在由此描述的本发明的范围内，可以设想其它实施例。此外，应当注意，本说明书中使用的语言主要是为了可读性和教导的目的而选择的，而不是为了解释或者限定本发明的主题而选择的。因此，在不偏离所附权利要求书的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围，对本发明所做的公开是说明性的而非限制性的，本发明的范围由所附权利要求书限定。

Claims

1.一种远距离虹膜识别中的抓拍目标跟踪方法，在计算设备中执行，所述方法包括步骤：

利用人脸检测器，从初始图像帧中确定出待抓拍人脸；

基于所述待抓拍人脸，从与所述初始图像帧相邻的连续多个图像帧中确定出抓拍轨迹，所述抓拍轨迹中包含所述待抓拍人脸在各图像帧中的位置信息；

利用第一追踪器，提取各图像帧在所述抓拍轨迹上的图像特征，并保存到特征集合；

通过从所述特征集合中对当前图像帧进行特征匹配，来跟踪所述抓拍轨迹，并将所述当前图像帧的图像特征保存到所述特征集合；

对后续的图像帧重复跟踪所述抓拍轨迹的步骤，若未跟踪到所述抓拍轨迹，则判断所述当前图像帧的图像质量是否达标；

若所述当前图像帧的图像质量达标，则利用人脸检测器，从所述当前图像帧中确定出至少一个人脸检测框，并判断所确定的人脸检测框与所述抓拍轨迹是否存在重叠；

若存在重叠，则利用第二追踪器来确认抓拍轨迹；

若不存在重叠，则通过在所述抓拍轨迹一定范围内进行特征匹配，来跟踪所述抓拍轨迹。

2.如权利要求1所述的方法，其中，所述基于所述待抓拍人脸，从与初始图像帧相邻的连续多个图像帧中确定出抓拍轨迹的步骤包括：

从与所述初始图像帧相邻的连续多个图像帧中，分别匹配所述待抓拍人脸，得到匹配到的人脸的位置信息；

基于所匹配到的位置信息，确定抓拍轨迹。

3.如权利要求2所述的方法，其中，利用第一追踪器，提取各图像帧在所述抓拍轨迹上的图像特征的步骤还包括：

基于所确定的抓拍轨迹，训练生成第一追踪器，以提取各图像帧在所述抓拍轨迹上的图像特征，其中，所提取的图像特征至少包括：方向梯度直方图、颜色特征、PCA-SIFT特征。

4.如权利要求3所述的方法，其中，所述通过从特征集合中对当前图像帧进行特征匹配，来跟踪所述抓拍轨迹，并将当前图像帧的图像特征保存到特征集合的步骤包括：

利用第一追踪器，从所述当前图像帧中确定人脸追踪框及其中的图像特征，作为所述当前图像帧的图像特征；

对特征集合中上一图像帧的图像特征与所述当前图像帧的图像特征进行特征匹配，若匹配通过则将所述人脸追踪框的位置信息保存到抓拍轨迹中；以及

将所述当前图像帧的图像特征保存到所述特征集合。

5.如权利要求4所述的方法，其中，对后续的图像帧重复跟踪所述抓拍轨迹的步骤还包括：

判断跟踪所述抓拍轨迹的时间是否达到时间阈值；

若跟踪所述抓拍轨迹的时间未达到时间阈值，则在所述特征集合中，分时段对所述图像特征进行排序，并对后续的图像帧重复跟踪所述抓拍轨迹的步骤；

若跟踪所述抓拍轨迹的时间达到时间阈值，则对所述特征集合中的图像特征进行采样，得到新的特征集合。

6.如权利要求5所述的方法，其中，判断所述当前图像帧的图像质量是否达标的步骤之后，还包括：

若所述当前图像帧的图像质量未达标，则判断所述当前图像帧之后的连续的多个图像帧的图像质量是否达标；

若所述多个图像帧的图像质量达标，则利用人脸检测器，从所述当前图像帧中确定出至少一个人脸检测框；

若所述多个图像帧的图像质量未达标，则对后续的图像帧重复跟踪所述抓拍轨迹的步骤，并在预定时长内未跟踪到所述抓拍轨迹时，删除所述抓拍轨迹，以便于重新执行确定待抓拍人脸的步骤。

7.如权利要求6所述的方法，其中，利用第二追踪器来确认抓拍轨迹的步骤包括：

利用第二追踪器，提取与所述当前图像帧相邻的多个图像帧中的图像特征并进行特征匹配；

若匹配成功，则将所述第二追踪器所指向的人脸追踪框的位置信息保存到所述抓拍轨迹；

利用第一追踪器提取所述人脸追踪框的图像特征，以保存到所述特征集合，来对后续的图像帧重复跟踪所述抓拍轨迹的步骤。

8.如权利要求7所述的方法，其中，所述利用人脸检测器，从初始图像帧中确定出待抓拍人脸的步骤包括：

利用人脸检测器，对初始图像帧进行人脸检测，得到至少一个人脸检测框；

从所述至少一个人脸检测框中选取满足预定条件的人脸检测框，所选取的人脸检测框指向待抓拍人脸。

9.如权利要求5所述的方法，其中，在所述特征集合中，分时段对所述图像特征进行排序的步骤包括：

基于自注意力机制，分时段对所述图像特征进行排序。

10.一种计算设备，包括：

至少一个处理器和存储有程序指令的存储器；

当所述程序指令被所述处理器读取并执行时，使得所述计算设备执行如权利要求1-9中任一项所述的方法。