CN116665272A

CN116665272A - 机场场景人脸识别融合决策方法、装置、电子设备及介质

Info

Publication number: CN116665272A
Application number: CN202310625029.8A
Authority: CN
Inventors: 底帅; 张玄弋; 李颖; 徐英超; 雷宁; 李丰
Original assignee: Beijing Capital International Airport Co ltd
Current assignee: Beijing Capital International Airport Co ltd
Priority date: 2023-05-30
Filing date: 2023-05-30
Publication date: 2023-08-29

Abstract

本发明公开了一种一种机场场景人脸识别融合决策方法、装置、电子设备及介质，该方法，包括：S1：获取机场场景内的人员图像；S2：采用多模型融合算法对人员图像进行人脸识别；多模型融合算法包括：S21：从模型池中寻找一个最优的模型组合，模型组合包括多个不同场景下的人脸识别模型；S22：以多个模型计算出的top‑k图像的相似度为基础，利用预设的神经网络模型确定多种人脸特征信息在相似度级别上的关联；S23：计算得到一个综合的人脸比对排序和打分。本发明能够提高人脸识别模型的准确性和鲁棒性。

Description

机场场景人脸识别融合决策方法、装置、电子设备及介质

技术领域

本发明涉及机场智能人像预警领域，更具体地，涉及一种机场场景人脸识别融合决策方法、装置、电子设备及介质。

背景技术

在机场场景的智能人像预警系统的人脸识别应用中，一个人在多幅人脸图像上可能会表现出多种表情变化或姿态旋转，甚至会受到光照改变、外界遮挡和模糊等因素影响，获取的人脸特征也会随之发生巨大的差别，这些复杂情况给人脸识别任务带来了很大挑战。因此仅依靠一种人脸识别模型的方法很难在机场的所有场景中表现出很高的准确率和鲁棒性。

发明内容

本发明的目的是提出一种机场场景人脸识别融合决策方法、装置、电子设备及介质，实现提高人脸识别模型的准确性和鲁棒性。

为实现上述目的，第一方面，本发明提出了一种机场场景人脸识别融合决策方法，包括：

S1：获取机场场景内的人员图像；

S2：采用多模型融合算法对所述人员图像进行人脸识别；

所述多模型融合算法包括：

S21：从模型池中寻找一个最优的模型组合，所述模型组合包括多个不同场景下的人脸识别模型；

S22：以多个模型计算出的top-k图像的相似度为基础，利用预设的神经网络模型确定多种人脸特征信息在相似度级别上的关联；

S23：计算得到一个综合的人脸比对排序和打分。

可选地，步骤S22包括：

S201：以图像对为基础，计算图像对在不同场景人脸识别模型上的相似度，形成相似度向量；

S202：基于所述相似度向量，利用所述神经网络模型确定图像对中两张图像不属于同一类别的第一概率以及两张图像属于同一类别的第二概率；

S203：对所述第一概率和所述第二概率进行归一化处理，得到相似度阈值。

可选地，步骤S201包括：

利用多种不同场景下的人脸识别模型提取人脸特征，获得每个人脸图像对中图像I_a和图像I_b的人脸特征集，其中图像I_a的人脸特征集为F_a＝{f_1a,f_2a,f_3a,...,f_ma}；图像I_b的人脸特征集为F_b＝{f_1b,f_2b,f_3b,...,f_mb}；

计算图像I_a和图像I_b在各个特征上的相似度，得到得到一组相似度向量其中，/>式中，i＝1～m，m为特征集中特征的数量。

可选地，步骤S202包括：

将每一个相似度向量传递给所述神经网络模型进行计算，得到第一概率P₁和第二概率P₂，其中，第一概率P₁表示两张图像不是同一类别的概率，第一概率P₁越大表示两张图像越不可能是同一类；第二概率P₂表示两张图像是同一类别的概率，第二概率越大，表示两张图像越可能是同一类别。

可选地，步骤S203包括：

采用sigmoid函数将第一概率P₁和第二概率P₂转换到(0,1)区间内,并且保持单调递增；

将归一化的第一概率P₁和第二概率P₂统一为一个值，以确定人脸识别的相似度阈值。

可选地，通过以下公式将归一化的第一概率P₁和第二概率P₂统一为一个值：

可选地，步骤S23包括：

基于所述相似度阈值，利用knn算法从人脸数据库中寻找出与比对图片最接近的top-k个人脸图片。

第二方面，本发明提出一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行第一方面所述的机场场景人脸识别融合决策方法。

第三方面，本发明提出一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行第一方面所述的机场场景人脸识别融合决策方法。

第三方面，本发明提出一种机场场景的人脸识别融合决策装置，包括：

图像获取模块，用于获取机场场景内的人员图像；

人脸识别模块，用于采用多模型融合算法对所述人员图像进行人脸识别；

所述多模型融合算法包括：

从模型池中寻找一个最优的模型组合，所述模型组合包括多个不同场景下的人脸识别模型；

以多个模型计算出的top-k图像的相似度为基础，利用预设的神经网络模型确定多种人脸特征信息在相似度级别上的关联；

计算得到一个综合的人脸比对排序和打分。

本发明的有益效果在于：

本发明通过多模型融合算法，首先从模型池中寻找一个最优的模型组合，以多个模型计算出的top-k图像的相似度为基础，利用神经网络技术挖掘出多种人脸特征信息在相似度级别上的关联，最后计算得到一个综合的人脸比对排序和打分，本发明采用相似度级别的多模型融合策略能够避免直接拼接多个人脸识别模型特征所造成的过大的计算开销，同时，本发明的方法将通过自动融合多个不同模型的输出综合给出搜索结果，可以达到超过任意单个模型的性能，具有更高的召回率，更低的误识率。

本发明的系统具有其它的特性和优点，这些特性和优点从并入本文中的附图和随后的具体实施方式中将是显而易见的，或者将在并入本文中的附图和随后的具体实施方式中进行详细陈述，这些附图和具体实施方式共同用于解释本发明的特定原理。

附图说明

通过结合附图对本发明示例性实施例进行更详细的描述，本发明的上述以及其它目的、特征和优势将变得更加明显，在本发明示例性实施例中，相同的参考标号通常代表相同部件。

图1示出了本发明一个实施例的一种机场场景人脸识别融合决策方法的步骤图。

图2示出了本发明一个实施例的一种机场场景人脸识别融合决策方法中的多模型融合算法的原理图。

图3示出了本发明一个实施例的一种机场场景人脸识别融合决策方法中的神经网络模型的示意图。

图4示出了本发明一个实施例的一种机场场景人脸识别融合决策方法与现有单一人脸识别模型的通过率及误识率的对比曲线图。

具体实施方式

下面将参照附图更详细地描述本发明。虽然附图中显示了本发明的优选实施例，然而应该理解，可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了使本发明更加透彻和完整，并且能够将本发明的范围完整地传达给本领域的技术人员。

实施例1

如图1所示，本实施例提供了一种机场场景人脸识别融合决策方法，包括：

S1：获取机场场景内的人员图像；

S2：采用多模型融合算法对所述人员图像进行人脸识别；

所述多模型融合算法包括：

S23：计算得到一个综合的人脸比对排序和打分。

人脸识别算法是指在检测到人脸并定位面部关键特征点之后，主要的人脸区域就可以被裁剪出来，经过预处理之后，馈入后端的识别算法。识别算法要完成人脸特征的提取，并与库存的已知人脸进行比对，完成最终的分类。本方法对于给定的一张比对人脸图像(如通过机场内不同场景的用AI智能检测相机获取的动态图像)，首先从模型池中寻找一个最优的模型组合，以多个模型计算出的top-k图像的相似度为基础，利用神经网络技术挖掘出多种人脸特征信息在相似度级别上的关联，最后计算得到一个综合的人脸比对排序和打分。本方法能够有效利用不同特征之间的互补性，弥补单一特征对人脸描述能力不足的缺点。

对于目前常用的人脸识别模型如：VGGFace、Lightened CNN、Caffe-face等，这些模型常用输出的特征维数为512维，多个人脸识别模型特征拼接以后可能会得到一个512*n长度的特征，若在这么长的特征上进行融合算法权重的学习会造成很大的计算开销。本方法通过相似度级别的多模型融合策略来避免直接拼接多个人脸识别模型特征所造成的过大的计算开销。本方法采用相似度级别的模型融合策略为：如图2所示，以图像对为基础，计算图像对在不同场景人脸识别模型上的相似度，形成相似度向量，再利用相似度融合算法挖掘多个相似度之间的潜在关联并给出一个综合的相似度。本方法通过相似度级别的模型融合策略可有由512*n维的特征输入被压缩为n维，极大的提升了计算效率。

上述步骤S22包括：

具体地，利用多种不同场景下的人脸识别模型提取人脸特征，对于每张人脸图像I_j都会得到一个人脸特征集F_j＝{f_1j,f_2j,f_3j,...,f_mj}。假设需要计算人脸图像对中图像I_a和图像I_b的相似度，对于图像I_a的人脸特征集:F_a＝{f_1a,f_2a,f_3a,...,f_ma}；对于图像I_b的人脸特征集:F_b＝{f_1b,f_2b,f_3b,...,f_mb},计算图像I_a和图像I_b在各个特征上的相似度就是分别计算他们每种特征向量的上的相似度，相似度的计算方法如公式(1)所示，

具体的计算过程如下：

...

这样对于每个图像对，都会得到一组相似度向量

具体地，如图3所示，将每一个相似度向量传递给如图3所示的预设的神经网络模型进行计算，得到第一概率P₁和第二概率P₂，其中，第一概率P₁表示两张图像不是同一类别的概率，第一概率P₁越大表示两张图像越不可能是同一类；第二概率P₂表示两张图像是同一类别的概率，第二概率越大，表示两张图像越可能是同一类别。

具体地，由于预设的神经网络模型的输出第一概率P₁和第二概率P₂并不严格在[0,1]内，针对每一个第一概率和其对应的第二概率，计算其对应的人脸图像对的相似度，采用sigmoid函数将第一概率P₁和第二概率P₂都转换到(0,1)区间内,并且保持单调递增，转换过程如下：

公式(2)的目的是为了将第一概率P₁和第二概率P₂统一为一个值方便人脸识别时确定相似度阈值，Sigmoid函数是一个在生物学中常见的S型函数，也称为S型生长曲线。在信息科学中，由于其单增以及反函数单增等性质，Sigmoid函数常被用作神经网络的激活函数，将变量映射到0,1之间。

本实施例中，上述步骤S23包括：基于所述相似度阈值，利用knn算法从人脸数据库中寻找出与比对图片最接近的topk个人脸图片。

具体地，得到相似度后利用knn算法寻找出与比对图片最接近的topk个人脸图片。其中，knn算法为k-近邻算法(k-NearestNeighbouralgorithm)，其工作原理是：给定一个已知标签类别的训练数据集，输入没有标签的新数据后，在训练数据集中找到与新数据最邻近的k个实例，如果这k个实例的多数属于某个类别，那么新数据就属于这个类别，即由那些离新数据最近的k个实例来投票决定新数据归为哪一类。本方法利用knn算法从人脸数据库中寻找出与比对图片最接近的top-k个人脸图片。

需要说明的是，上述多模型融合策略的上限依赖于每一个单模型的性能，也依赖于模型间的互补性。为了最大程度的提升多模型融合的策略的性能，首先从模型池中选取各个场景下最优的人脸识别模型，这个选举方式根据不同人脸识别模型在实际应用场景应用过程中的主要召回率的表现值进行比对，择优选择。然后穷举这些模型的每一种组合可能，并在预设场景的小规模评估测试集上评估每种组合的性能，同时得到每种组合的最优阈值，最优阈值是根据组合后的人脸识别模型召回率进行判断，择优选择。最后，我们选取其中性能最好的模型组合，以及其对应的最优阈值。

如图4所示，本实施例的算法模型将通过自动融合多个不同模型的输出综合给出搜索结果，可以达到超过任意单个模型的性能(更高的召回，更低的误识)。

在本发明的一个具体应用示例中：在首都机场智能人像预警平台系统中进行了如下应用：

系统采用的1种主算法和2种辅助算法，共3种人脸算法分别计算，融合决策模型基于3种算法结果进一步计算，融合决策模型应支持从一维融合到多维融合到自学习式融合的不断发展，且具有可扩展性，最终形成区别于表层的仅三种算法投票表决报警或任一算法报警即报警的简单机制。融合算法决策模型需通过对3种算法比对过程以及比对结果的深度分析，进一步融合计算，从而对某种单一算法有可能造成的错识、误识进行结果纠正，在不降低准确率的情况下，减少漏报率。该套融合决策模型应有完善的算法评价功能，在使用过程中，针对不同场景的三种人像比对成功率进行自动统计、打分、排名的功能。在其中一套或两套人脸算法系统发生宕机的情况下，不影响整套融合算法模型推送比对结果，保证系统运行。辅算法厂商需按照甲方需求，提供满足融合需求的辅算法，辅助算法能够配合融合决策模型提供TOP100的比对记录及分数。

实施例2

本实施例提供一种机场场景的人脸识别融合决策装置，包括：

图像获取模块，用于获取机场场景内的人员图像；

所述多模型融合算法包括：

计算得到一个综合的人脸比对排序和打分。

本实施例中，多模型融合算法具体包括如下处理流程：

通过以下公式将归一化的第一概率P₁和第二概率P₂统一为一个值：

基于所述相似度阈值，利用knn算法从人脸数据库中寻找出与比对图片最接近的topk个人脸图片。

实施例3

本实施例提供一种电子设备，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行实施例1所述的机场场景人脸识别融合决策方法。

根据本公开实施例的电子设备包括存储器和处理器，该存储器用于存储非暂时性计算机可读指令。具体地，存储器可以包括一个或多个计算机程序产品，该计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。该易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。该非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。

该处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其它形式的处理单元，并且可以控制电子设备中的其它组件以执行期望的功能。在本公开的一个实施例中，该处理器用于运行该存储器中存储的该计算机可读指令。

本领域技术人员应能理解，为了解决如何获得良好用户体验效果的技术问题，本实施例中也可以包括诸如通信总线、接口等公知的结构，这些公知的结构也应包含在本公开的保护范围之内。

有关本实施例的详细说明可以参考前述各实施例中的相应说明，在此不再赘述。

实施例4

本实施例提供一种非暂态计算机可读存储介质，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行第一方面所述的机场场景人脸识别融合决策方法。

根据本公开实施例的计算机可读存储介质，其上存储有非暂时性计算机可读指令。当该非暂时性计算机可读指令由处理器运行时，执行前述的本公开各实施例方法的全部或部分步骤。

上述计算机可读存储介质包括但不限于：光存储介质(例如：CD－ROM和DVD)、磁光存储介质(例如：MO)、磁存储介质(例如：磁带或移动硬盘)、具有内置的可重写非易失性存储器的媒体(例如：存储卡)和具有内置ROM的媒体(例如：ROM盒)。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。

Claims

1.一种机场场景人脸识别融合决策方法，其特征在于，包括：

S1：获取机场场景内的人员图像；

S2：采用多模型融合算法对所述人员图像进行人脸识别；

所述多模型融合算法包括：

S23：计算得到一个综合的人脸比对排序和打分。

2.根据权利要求1所述的机场场景人脸识别融合决策方法，其特征在于，步骤S22包括：

3.根据权利要求2所述的机场场景人脸识别融合决策方法，其特征在于，步骤S201包括：

4.根据权利要求3所述的机场场景人脸识别融合决策方法，其特征在于，步骤S202包括：

5.根据权利要求4所述的机场场景人脸识别融合决策方法，其特征在于，步骤S203包括：

6.根据权利要求5所述的机场场景人脸识别融合决策方法，其特征在于，通过以下公式将归一化的第一概率P₁和第二概率P₂统一为一个值：

7.根据权利要求6所述的机场场景人脸识别融合决策方法，其特征在于，步骤S23包括：

8.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7任一所述的机场场景人脸识别融合决策方法。

9.一种非暂态计算机可读存储介质，其特征在于，该非暂态计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行权利要求1-7任一所述的机场场景人脸识别融合决策方法。

10.一种机场场景的人脸识别融合决策装置，其特征在于，包括：

图像获取模块，用于获取机场场景内的人员图像；

所述多模型融合算法包括：

计算得到一个综合的人脸比对排序和打分。