CN111488763A

CN111488763A - W-ltp人脸识别算法

Info

Publication number: CN111488763A
Application number: CN201910076378.2A
Authority: CN
Inventors: 徐江涛; 史兴萍; 王瑞硕; 查万斌; 李凤
Original assignee: Tianjin University Marine Technology Research Institute
Current assignee: Tianjin University Marine Technology Research Institute
Priority date: 2019-01-26
Filing date: 2019-01-26
Publication date: 2020-08-04

Abstract

W‑LTP人脸识别算法，分为三个步骤，第一步是对人脸图像的预处理，包括白平衡、像素压缩等过程；第二步是求图像的LTP特征值，获得图像的LTP表达；第三步是计算Wasserstein距离，计算由上一步得到的LTP特征图的直方图分布与期待目标和非期待目标的Wasserstein距离，定义多元距离函数，即置信度判断待测人脸是否是期待的目标。该算法采用新的数学方法来解决人脸识别问题，针对光照和角度问题加以研究和改进，在理论上，该算法考虑到人脸识别的现实条件，提升了算法的适用性。

Description

W-LTP人脸识别算法

技术领域

本发明涉及模式识别领域，尤其涉及在人脸检测与性别识别应用中，采用Wasserstein距离和局部三值模式（LTP）结合，寻找人脸的高级特征表达，从而达到人脸识别的目的，即W-LTP人脸识别算法。

背景技术

随着目前对人脸识别的广泛而深入的研究，卷积神经网络表现出了极好的效果，但是其计算量大且训练过程对数据量的要求很大。这就将要求转换到改进传统人脸识别算法，在保障计算速度的情况下，达到与神经网络相当的水平。

Wasserstein距离又叫Earth-Mover距离（EM距离），是概率论中的一个基本理论，该距离函数用于分析两个分布之间的距离，或者说从A分布变换到到B分布所需要移动的最短距离。这是一个与最优化相结合的概念，能够巧妙分析不同分布之间的距离，在统计分析中有非常有价值的应用。由于Wasserstein距离的特性，使其具有很高的旋转不变性，在人脸识别领域这样的特性有很高的价值，但是Wasserstein距离对于光照的不能敏感性很差，在光照变化之后，图像直方图会发生很大变化，进而导致Wasserstein距离的变化。而LTP算法能够很好弥补Wasserstein算法的不足之处。LTP算法通过对比采样点和周围像素值的大小关系获得采样点的特征表达，它的旋转不变性较差，但对于光照的不敏感性很好。所以将上述两种算法结合，以在不同角度，不同光照条件下实现人脸识别。

发明内容

针对现有技术存在的问题，本发明提出了一种W-LTP人脸识别算法，该算法采用新的数学方法来解决人脸识别问题，针对光照和角度问题加以研究和改进，在理论上，该算法考虑到人脸识别的现实条件，提升了算法的适用性。

W-LTP人脸识别算法分为三个步骤，第一步是对人脸图像的预处理，包括白平衡、像素压缩、统一图像大小的过程；第二步是求图像的LTP特征值，获得图像的LTP表达；第三步是计算Wasserstein距离，计算由上一步得到的LTP特征图的直方图分布与期待目标和非期待目标的Wasserstein距离，定义多元距离函数，即置信度判断待测人脸是否是期待的目标。详细算法流程图如图1。

（1）LTP特征计算

LTP算子是对LBP算子的一种推广，它定义一个长度为2t的区间，考虑中心像素的邻域共八个像素点灰度值x_i与它本身的灰度值x_c的差值在该区间右边，则编码为1；若差值在该区间左边，编码为-1，若差值在该区间之中，则编码为0，由此可见该算法对光照变化和噪声更加鲁棒，LTP采用三值编码形式，从x轴正方向开始按逆时针方向取权重，分别为3⁰，3¹，……，3⁷，计算公式如下：

（2）计算Wasserstein距离

Wasserstein距离的计算公式如下：

式中P_m、P_n分别为利用（1）中所述LTP计算之后的人脸的直方图分布，需要将上一步获得的LTP特征值进行归一化才可获得直方图分布，通过上式可以计算出两种分布的最短移动距离，进而可以判断两个分布的距离；由于在之前采用了LTP获取特征值，在这里直接计算Wasserstein距离可以减少光照和随机噪声对于检验结果的干扰；

（3）计算置信度C

在分析结果时，由于计算之后一定会有一个Wasserstein距离的最小值，虽然Wasserstein距离的最小值代表了两种分布距离最近，但是从人脸识别角度来看，不能仅仅根据距离最小就认定当前检测目标是目标库中的人物，在这里定义一个多元距离函数对目标的可靠性或称置信度进行判断，函数表达式如下式（4），又称置信度函数：

式中，q表示当前系统的已知人脸数量，W1,W2…是将Wasserstein距离由小到大排列后的距离，上式的计算结果是一个介于（0,1）的量，其数值越接近1则代表目标是当前与其距离最近的人脸是同一人的可靠性越高。

本发明根据Wasserstein距离这一统计学、数学概念，设计了一种基于该距离的人脸识别算法——W-LTP算法，Wasserstein距离这一计算方法，本身在统计学和最优化的应用中一直有着较高的认可度，同时相比于传统LTP人脸识别算法，该算法对于光照和角度的鲁棒性都更好。同时在对高维数据的处理方面，细节把握效果更好，更容易得到更加精准的结果。本算法还针对最终结果的判断设计了多元函数求解可信度的计算，将计算结果更加精准可视地展现。

附图说明

图1是 W-LTP人脸识别算法流程图。

具体实施方式

以下根据附图和实施例对本发明进行详细说明，但是本发明的保护范围不限于此。

该算法由Wasserstein距离和LTP算法为主题，由于涉及最优化问题，所需的计算量较大，对于图片像素要求不能太大，但同时如果输入图像像素太低，则不容易获得较好的特征，综合来看，人脸像素取256*256即可满足计算要求又不会造成太大计算量，所以对于高分辨率图像要求在预处理过程中先将像素降低至要求范围，从而简化计算。在计算LTP时，有文献表明人脸区域灰度差值在7以内基本不存在特征变化，结合这一规律，设计LTP的区间长度为3，这样保障了LTP能够更加有效清晰地描述人脸的纹理、特征变化。在计算置信度时，置信度的阈值设置也需要至关重要，若阈值太低容易出现不一致的目标被错误匹配，而阈值太高又会导致算法无法将目标检测。一般设置阈值0.7可以实现比较满意的判断结果。

Claims

1.W-LTP人脸识别算法，其特征在于：分为三个步骤，第一步是对人脸图像的预处理，包括白平衡、像素压缩、统一修剪图像大小的过程；第二步是求图像的LTP特征值，获得图像的LTP表达；第三步是计算Wasserstein距离，计算由上一步得到的LTP特征图的直方图分布与期待目标和非期待目标的Wasserstein距离，定义多元距离函数，即置信度判断待测人脸是否是期待的目标；

（1）LTP特征计算

（2）计算Wasserstein距离

Wasserstein距离的计算公式如下：

式中 P_m、P_n 分别为利用（1）中所述LTP计算之后的人脸的直方图分布，需要将上一步获得的LTP特征值进行归一化才可获得直方图分布，通过上式可以计算出两种分布的最短移动距离，进而可以判断两个分布的距离；由于在之前采用了LTP获取特征值，在这里直接计算Wasserstein距离可以减少光照和随机噪声对于检验结果的干扰；

（3）计算置信度C

式中，q表示当前系统的已知人脸数量，W1,W2…是将Wasserstein距离由小到大排列后的距离，上式的计算结果是一个介于（0，1）的量，其数值越接近1则代表目标是当前与其距离最近的人脸是同一人的可靠性越高。