CN108985168A

CN108985168A - 一种基于最小归一化距离学习的视频人脸识别方法

Info

Publication number: CN108985168A
Application number: CN201810617583.0A
Authority: CN
Inventors: 陈莹; 余拓; 化春键
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2018-06-15
Filing date: 2018-06-15
Publication date: 2018-12-11
Anticipated expiration: 2038-06-15
Also published as: CN108985168B

Abstract

本发明公开了一种基于最小归一化距离学习的视频人脸识别方法，属于视频人脸识别技术领域。本发明通过构建损失函数并求取梯度，使用随机梯度下降法对损失函数进行优化，得到最小归一化距离度量矩阵M，在进行人脸识别过程中，利用度量矩阵M计算每一个目标图像与查询视频序列之间的最小归一化距离，并最终得到识别结果，使得仅需待识别目标的单幅图像作为目标图像，更符合真实场景，且训练后得到的距离模型计算量小，能够满足现实使用中对实时性的要求。

Description

一种基于最小归一化距离学习的视频人脸识别方法

技术领域

本发明涉及一种基于最小归一化距离学习的视频人脸识别方法，属于视频人脸识别技术领域。

背景技术

在视频人脸识别中，尤其在视频监控场景中，待识别人物图像与实际场景中拍摄到的查询图像序列往往存在较大的差异，传统的基于图片的人脸识别方法不能有效处理这些差异，且无法有效运用视频信息，因此效果不佳；

目前流行的方法是使用点到集的距离度量学习方法，学习度量目标图像和查询图像序列之间的特征距离，但这类方法往往需要累积获得一定数量的视频帧，并对这些视频帧进行处理，才能度量静态目标图像到视频序列之间的特征距离，所述在测试阶段耗时过长，且识别效果容易受到查询图像序列中低质量图片的干扰，所以无法应用在实时性要求高或识别精度要求较高的应用场景中。因此本发明致力于设计并优化一个距离度量方法，以高效而准确地度量单幅目标图像和查询图像序列之间的特征距离，提高人脸识别的准确率。

发明内容

本发明所要解决的技术问题是提供一种基于最小归一化距离学习的视频人脸识别方法，本发明仅需待识别目标的单幅图像作为目标图像，更符合真实场景，且训练后得到的距离模型计算量小，能够满足现实使用中对实时性的要求。

为解决上述技术问题，本发明所采用的技术方案是：

S01、读入训练数据并提取人脸特征：读入N名个体的单幅静态图像和包含N_i幅视频图像的视频V_i，对每幅静态图像提取人脸特征，将静态图像的人脸特征记为其标签记为同样对所述视频V_i中的每幅视频图像提取人脸特征，将所述视频V_i的人脸特征记为其中其标签记为

其中，指视频V_i中的第p幅图像的人脸特征，p＝1、2、…N_i；

S02、训练距离模型：构建损失函数并求取梯度，使用随机梯度下降法对损失函数进行优化，得到最小归一化距离度量矩阵M；

S03、进行人脸识别：在识别过程中，对于组成目标集的N′幅静态图像提取人脸特征，记为其标签记为记包含L幅视频图像且标签未知的视频为V_b，对其中包含的L幅视频图像提取人脸特征，并将所述标签未知的视频V_b的人脸特征记为其中，指所述标签未知的视频中的第m幅图像的人脸特征；利用训练得到的度量矩阵M，计算每一个目标图像的人脸特征与所述标签未知的视频V_b的人脸特征之间的最小归一化距离并最终得到识别结果g_c，其中所述识别结果g_c表明目标图像对应的人脸和所述标签未知的视频对应的标签相同，即身份相同。

可选的，所述步骤S02包括：

(1)定义最小归一化距离其中为最小归一化约束，是马氏距离，M是度量矩阵，是和之间差值的外积，K＝N÷20；其中，是视频V_i中的第p幅图像的人脸特征，1≤q≤N_i；表示与其特征距离最小的K个静态图像的人脸特征之间的特征距离之和；

(2)初始化参数，令迭代次数t＝0，度量矩阵M初值为单位矩阵M₀＝I，损失函数初值为f(M)₀＝0，步进λ₀＝1×10^-3；

(3)对于每段视频V_i，找到其最小的类内最小归一化距离和最小的类间最小归一化距离其中i、j和k满足y_j＝z_i且y_k≠z_i，1≤u≤N_i，1≤v≤N_i，1≤k≤N；

其中，是视频V_i中的第u帧图像的人脸特征；

(4)使用和对应的人脸特征的索引构建触发集，

当时将(i,j,k,u,v)加入触发集其中，0≤t≤500；

(5)计算损失函数

α是权衡损失函数中两项的系数，0≤α≤1，这里取α＝0.2；

(6)计算梯度

(7)更新度量矩阵M_t+1＝M_t-λ_tG_t，并更新步进，当f(M)_t+1>f(M)_t时，令λ_t+1＝λ_t-1×10-³，否则令λ_t+1＝λ_t+2×10^-3；

(8)通过在特征分解后取出负特征值的方法来保持M_t+1为半正定矩阵；

(9)如果t≥500或|f(M)_t+1-f(M)_t|<0.1，则算法中止，得到优化后的度量矩阵M＝M_t，否则返回(3)。

可选的，所述步骤S03包括：

a、计算目标集中的静态图像的人脸特征与所述标签未知的视频V_b的人脸特征之间的最小归一化距离其中

b、得到查询视频的识别结果g_c，其中

本发明的有益效果：

通过构建损失函数并求取梯度，使用随机梯度下降法对损失函数进行优化，得到最小归一化距离度量矩阵M，在进行人脸识别过程中，利用度量矩阵M计算每一个目标图像与查询视频序列之间的最小归一化距离，并最终得到识别结果，使得仅需待识别目标的单幅图像作为目标图像，更符合真实场景，且训练后得到的距离模型计算量小，能够满足现实使用中对实时性的要求。

附图说明

图1为本发明所提供的一种基于最小归一化距离学习的视频人脸识别方法流程图。

具体实施方案

下面结合附图所示的各实施方式对本发明进行详细说明，但应当说明的是，这些实施方式并非对本发明的限制，本领域普通技术人员根据这些实施方式所作的功能、方法、或者结构上的等效变换或替代，均属于本发明的保护范围之内。

传统的基于图片的人脸识别方法不能有效处理视频人脸识别中图像之间的差异，且无法有效运用视频信息；目前流行的方法是使用点到集的距离度量学习方法，在测试阶段耗时过长，且识别效果容易受到查询图像序列中低质量图片的干扰。针对这些问题，本发明提出了基于最小归一化距离学习的视频人脸识别方法，下面结合附图进行详细说明：

如图1所示,为本发明所提供的一种基于最小归一化距离学习的视频人脸识别方法具体实施方式中的流程示意图。在本实施方式中，一种基于最小归一化距离学习的视频人脸识别方法，其包括以下部分：

其中，指视频V_i中的第p幅图像的人脸特征，p＝1、2、…N_i。

所述步骤S02具体为：

其中，是视频V_i中的第u帧图像的人脸特征；

(4)使用和对应的人脸特征的索引构建触发集，

当时，将(i,j,k,u,v)加入触发集其中，0≤t≤500；

(5)计算损失函数

α是权衡损失函数中两项的系数，0≤α≤1，这里取α＝0.2；

(6)计算梯度

(7)更新度量矩阵M_t+1＝M_t-λ_tG_t，并更新步进，当f(M)_t+1>f(M)_t时，令λ_t+1＝λ_t-1×10^-3，否则令λ_t+1＝λ_t+2×10^-3；

S03、进行人脸识别：在识别过程中，对于组成目标集的N′幅静态图像提取人脸特征，记为其标签记为记包含L幅视频图像且标签未知的视频为V_b，对其中包含的L幅视频图像提取人脸特征，并将所述标签未知的视频V_b的人脸特征记为其中，指所述标签未知的视频中的第m幅图像的人脸特征；利用训练得到的度量矩阵M，计算每一个目标图像的人脸特征与所述标签未知的视频V_b的人脸特征之间的最小归一化距离并最终得到识别结果gc，其中

所述步骤S03包括：

b、得到查询视频的识别结果gc，其中所述识别结果gc表明目标图像对应的人脸和所述标签未知的视频对应的标签相同，即身份相同。

本发明通过构建损失函数并求取梯度，使用随机梯度下降法对损失函数进行优化，得到最小归一化距离度量矩阵M，在进行人脸识别过程中，利用度量矩阵M计算每一个目标图像与查询视频序列之间的最小归一化距离，并最终得到识别结果，使得仅需待识别目标的单幅图像作为目标图像，更符合真实场景，且训练后得到的距离模型计算量小，能够满足现实使用中对实时性的要求。

虽然本发明已以较佳实施例公开如上，但其并非用以限定本发明，任何熟悉此技术的人，在不脱离本发明的精神和范围内，都可做各种的改动与修饰，因此本发明的保护范围应该以权利要求书所界定的为准。

Claims

1.一种基于最小归一化距离学习的视频人脸识别方法，其特征在于，包括以下步骤：

其中，指视频V_i中的第p幅图像的人脸特征，p＝1、2、…N_i；

S03、进行人脸识别：在识别过程中，对于组成目标集的N′幅静态图像提取人脸特征，记为其标签记为记包含L幅视频图像且标签未知的视频为V_b，对其中包含的L幅视频图像提取人脸特征，并将所述标签未知的视频V_b的人脸特征记为其中，指所述标签未知的视频中的第m幅图像的人脸特征；利用训练得到的度量矩阵M，计算每一个目标图像的人脸特征与所述标签未知的视频V_b的人脸特征之间的最小归一化距离并最终得到识别结果g_c，其中

2.根据权利要求1所述的一种基于最小归一化距离学习的视频人脸识别方法，其特征在于，所述步骤S02包括：

其中，是视频V_i中的第u帧图像的人脸特征；

(4)使用和对应的人脸特征的索引构建触发集，

当时，将(i,j,k,u,v)加入触发集

其中，0≤t≤500；

(5)计算损失函数α是权衡损失函数中两项的系数，0≤α≤1；

(6)计算梯度

3.根据权利要求1所述的一种基于最小归一化距离学习的视频人脸识别方法，其特征在于，所述步骤S03包括：

b、得到查询视频的识别结果g_c，其中