WO2020134409A1

WO2020134409A1 - 一种跨域人脸识别算法、存储介质及处理器

Info

Publication number: WO2020134409A1
Application number: PCT/CN2019/112514
Authority: WO
Inventors: 刘若鹏; 栾琳; 赵盟盟
Original assignee: 深圳光启空间技术有限公司
Priority date: 2018-12-28
Filing date: 2019-10-22
Publication date: 2020-07-02
Also published as: CN111382602B; CN111382602A

Abstract

本发明提供了一种跨域人脸识别算法、存储介质及处理器。所述跨域人脸识别算法方法包括：搭建Facenet神经网络；在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层，将特征向量变为单通道一维向量；用单通道一维向量计算最大均值差异损失；将最大均值差异损失加入Facenet神经网络的损失函数中，共同参与反向传播和梯度求导。将原Facenet算法的网络结构进行改进，在特征维度最高层处计算不同域MMD值，将其加入合成损失函数中。由于改进后的算法消除了域间统计分布差异，达到了跨域人脸识别的效果。

Description

一种跨域人脸识别算法、存储介质及处理器

技术领域

本发明涉及人脸识别算法技术领域，尤其涉及一种跨域人脸识别算法、存储介质及处理器。

背景技术

人脸识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部识别的一系列相关技术，通常也叫做人像识别、面部识别。

现有人脸识别算法大多可以解决单域人脸识别（即待识别图像和训练样本图像具有相同的统计分布特性）问题，Florian Schroff等人提出的Facenet算法是目前效果较好的单域人脸识别算法。

FaceNet为一个通用人脸识别系统，采用深度卷积神经网络（CNN）学习将图像映射到欧式空间。空间距离直接和图片相似度相关：同一个人的不同图像在空间距离很小，不同人的图像在空间中有较大的距离，可以用于人脸验证、识别和聚类。

技术问题

在实际应用场景下，监控摄像头拍摄视频中提取出的人脸照片具有十分复杂的光照、角度、分辨率和表情等变化因素，这使得待识别图像与训练样本图像具有差异巨大的统计分布特性，即跨域识别问题。对于跨域识别，使用Facenet等传统的识别算法并不能取的很好效果，识别准确率低，识别效率低。

技术解决方案

本发明所要解决的技术问题是提供一种跨域人脸识别算法、存储介质及处理器，能够将原Facenet算法的网络结构进行改进，在特征维度最高层处计算不同域MMD值，将其加入合成损失函数中。由于改进后的算法消除了域间统计分布差异，达到了跨域人脸识别的效果。

为解决上述技术问题，一方面，本发明一实施例提供了一种跨域人脸识别算法，一种跨域人脸识别算法，包括：搭建Facenet神经网络；在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层，将特征向量变为单通道一维向量；用单通道一维向量计算最大均值差异损失；将最大均值差异损失加入Facenet神经网络的损失函数中，共同参与反向传播和梯度求导。

优选地，所述在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层包括：

根据数据流中固定的排列方式，在Facenet神经网络特征向量最高维处分别取出两路数据，计算最大均值差异损失。

优选地，所述用单通道一维向量计算最大均值差异损失包括：根据数据流中固定的排列方式，在网络最后层分别取出两路数据，各自计算三元组损失。

优选地，所述将最大均值差异损失加入Facenet神经网络的损失函数中，包括：将损失函数对每一个网络参数求偏导数，根据求导链式法则计算出损失函数对参数的梯度值。

优选地，所述搭建Facenet神经网络包括：将原Facenet神经网络输入拆分为两路输入，分别对应不同域的图像集。

优选地，根据损失函数对参数的梯度求导结果，更新参数取值，使得损失函数沿着负梯度方向收敛至全局最优。

优选地，所述跨域人脸识别指的是：待识别人脸图像与训练样本人脸图像具有差异巨大的统计分布特性。

优选地，所述两路输入分别用于训练分类效果和消除域间差异。

另一方面，本发明一实施例提供了一种存储介质，所述存储介质包括存储的程序，其中，所述程序运行时执行上述的跨域人脸识别算法。

另一方面，本发明一实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行上述的跨域人脸识别算法。

有益效果

与现有技术相比，上述技术方案具有以下优点：将原Facenet算法的网络结构进行改进，在特征维度最高层处计算不同域MMD值，将其加入合成损失函数中。由于改进后的算法消除了域间统计分布差异，因此达到了跨域人脸识别的效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。

图1是现有技术中Facenet神经网络结构示意图。

图2是本发明跨域人脸识别算法模块结构示意图。

图3是本发明跨域人脸识别算法流程图。

图4是图3中的模块E结构示意图。

图5是图3中的最大差异均值计算过程示意图。

图6是图3中的损失函数模块示意图。

本发明的实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

实施例一、

图1是现有技术中Facenet神经网络结构示意图。Facenet神经网络结构，输入模块经过模块A、模块B-1、模块B-2、模块C-1、模块C-2、模块D、再经过Siftmax层，再进行Triplet-Loss计算。

图2是本发明跨域人脸识别算法模块结构示意图。如图2所示，在图1现有Facenet神经网络基础上，该实施例加入MMD模块和合成损失函数模块。S10为神经网络模块，S20为最大差异均值模块，S30为损失函数模块。模块A至模块E为特征提取网络模块。其中模块A是常规特征提取网络；模块B-1、C-1和D借鉴Inception-Resnet思想，在保证非线性卷积复杂度的同时降低参数计算量；模块B-2和C-2为Reduction层，用于增加网络非线性程度。

图3是本发明跨域人脸识别算法流程图。如图3所示，一种跨域人脸识别算法，包括：搭建Facenet神经网络；在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层，将特征向量变为单通道一维向量；用单通道一维向量计算最大均值差异损失；将最大均值差异损失加入Facenet神经网络的损失函数中，共同参与反向传播和梯度求导。

在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层包括：根据数据流中固定的排列方式，在Facenet神经网络特征向量最高维处分别取出两路数据，计算最大均值差异损失。

用单通道一维向量计算最大均值差异损失包括：根据数据流中固定的排列方式，在网络最后层分别取出两路数据，各自计算三元组损失。

将最大均值差异损失加入Facenet神经网络的损失函数中，共同参与反向传播和梯度求导包括：所述搭建Facenet神经网络包括：将原Facenet神经网络输入拆分为两路输入，分别对应不同域的图像集。

该实例的特征提取网络可将输入人脸图像转化为用于分类的特征向量，且输入图像像素为160*160，输出特征向量维度为512维。其中，D模块输出处为全网络中特征维数最大处，为1792维，因此将D网络的输出分为两路，一路进入E网络，另一路进入最大差异均值（Maximum Mean Discrepancy，MMD）网络用于解决跨域分布问题。

图4是图3中的模块E结构示意图。模块E包括输入层、平均池化层、Dropout层、三元组损失（Triplet-loss）层，输出层。它与模块A-D共同构成特征提取模块。

图5是图3中的最大差异均值计算过程示意图。最大差异均值（Maximum Mean Discrepancy，MMD）是统计学中用来度量两个不同但相关的分布的距离函数。域X特征向量和域Y的特征向量，形成最大差异均值，再通过计算跨域分布损失函数，最终消除不同域的差别，解决跨域识别问题。该实施例创新性地在D模块后加入最大差异均值计算，以计算不同域图像的分布差异，通过神经网络梯度下降和反向传播过程，最终消除不同域的差别，解决跨域识别问题。

图6是图3中的损失函数模块示意图。如图6所示，该实施例中，合成损失函数由两部分组成：三元组损失（Triplet-loss）和最大差异均值损失（MMD-Loss），分别来自E模块和MMD模块，其作用分别是训练分类效果和消除域间差异。如图6所示，来自域X的三元组损失和域Y的三元组损失，连同最大差异均值损失（MMD-Loss）三者一起形成合并损失函数，合并损失函数在通过反向传播，达到消除域间差异的效果。

实施例二

本发明的实施例还提供了一种存储介质，该存储介质包括存储的程序，其中，上述程序运行时执行上述的人脸属性识别方法流程。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下人脸属性识别方法流程的程序代码：

S11、搭建Facenet神经网络；

S12、在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层，将特征向量变为单通道一维向量；

S13、用单通道一维向量计算最大均值差异损失；

S14、将最大均值差异损失加入Facenet神经网络的损失函数中，共同参与反向传播和梯度求导。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器（Read-Only Memory，简称为ROM）、随机存取存储器（Random Access Memory，简称为RAM）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

由此可见，通过采用本发明存储介质，将原Facenet算法的网络结构进行改进，在特征维度最高层处计算不同域MMD值，将其加入合成损失函数中。由于改进后的算法消除了域间统计分布差异，达到了跨域人脸识别的效果。

实施例三

本发明的实施例还提供了一种处理器，该处理器用于运行程序，其中，该程序运行时执行上述的人脸属性识别方法中的步骤。

可选地，在本实施例中，上述程序用于执行以下步骤：

S11、搭建Facenet神经网络；

S13、用单通道一维向量计算最大均值差异损失；

可选地，本实施例中的具体示例可以参考上述实施例及具体实施时所描述的示例，本实施例在此不再赘述。

由此可见，通过采用本发明处理器，将原Facenet算法的网络结构进行改进，在特征维度最高层处计算不同域MMD值，将其加入合成损失函数中。由于改进后的算法消除了域间统计分布差异，达到了跨域人脸识别的效果。

工业实用性

由上述说明可知，使用根据本发明的跨域人脸识别算法、存储介质及处理器，在传统Facenet识别算法的基础上，在神经网络特定位置加入统计分布损失函数，并改进数据流方式，达到跨域识别效果。

以上对本发明实施例进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

一种跨域人脸识别算法，其特征在于，包括：

搭建Facenet神经网络；

在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层，将特征向量变为单通道一维向量；

用单通道一维向量计算最大均值差异损失；

将最大均值差异损失加入Facenet神经网络的损失函数中，共同参与反向传播和梯度求导。
根据权利要求1所述的跨域人脸识别算法，其特征在于，所述在Facenet神经网络特征向量最高维层处加入平均池化层和Faltten层包括：

根据数据流中固定的排列方式，在Facenet神经网络特征向量最高维处分别取出两路数据，计算最大均值差异损失。
根据权利要求1所述的跨域人脸识别算法，其特征在于，所述用单通道一维向量计算最大均值差异损失包括：

根据数据流中固定的排列方式，在网络最后层分别取出两路数据，各自计算三元组损失。
根据权利要求1所述的跨域人脸识别算法，其特征在于，所述将最大均值差异损失加入Facenet神经网络的损失函数中，包括：

将损失函数对每一个网络参数求偏导数，根据求导链式法则计算出损失函数对参数的梯度值。
根据权利要求1所述的跨域人脸识别算法，其特征在于，所述搭建Facenet神经网络包括：

将原Facenet神经网络输入拆分为两路输入，分别对应不同域的图像集。
根据权利要求4所述的跨域人脸识别算法，其特征在于，还包括：

根据损失函数对参数的梯度求导结果，更新参数取值，使得损失函数沿着负梯度方向收敛至全局最优。
根据权利要求1所述的跨域人脸识别算法，其特征在于，所述跨域人脸识别指的是：待识别人脸图像与训练样本人脸图像具有差异巨大的统计分布特性。
根据权利要求5所述的跨域人脸识别算法，其特征在于，所述两路输入分别用于训练分类效果和消除域间差异。
一种存储介质，其特征在于，所述存储介质包括存储的程序，其中，所述程序运行时执行权利要求1至8中任一项所述的跨域人脸识别算法。
一种处理器，其特征在于，所述处理器用于运行程序，其中，所述程序运行时执行权利要求1至8中任一项所述的跨域人脸识别算法。