CN111488763A - W-ltp人脸识别算法 - Google Patents
W-ltp人脸识别算法 Download PDFInfo
- Publication number
- CN111488763A CN111488763A CN201910076378.2A CN201910076378A CN111488763A CN 111488763 A CN111488763 A CN 111488763A CN 201910076378 A CN201910076378 A CN 201910076378A CN 111488763 A CN111488763 A CN 111488763A
- Authority
- CN
- China
- Prior art keywords
- distance
- value
- wasserstein
- face
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 20
- 238000009826 distribution Methods 0.000 claims abstract description 17
- 238000000034 method Methods 0.000 claims abstract description 5
- 230000006835 compression Effects 0.000 claims abstract description 3
- 238000007906 compression Methods 0.000 claims abstract description 3
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000005286 illumination Methods 0.000 claims description 6
- 238000001514 detection method Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012360 testing method Methods 0.000 claims description 2
- 238000009966 trimming Methods 0.000 claims 1
- 238000005457 optimization Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Image Analysis (AREA)
- Collating Specific Patterns (AREA)
Abstract
W‑LTP人脸识别算法,分为三个步骤,第一步是对人脸图像的预处理,包括白平衡、像素压缩等过程;第二步是求图像的LTP特征值,获得图像的LTP表达;第三步是计算Wasserstein距离,计算由上一步得到的LTP特征图的直方图分布与期待目标和非期待目标的Wasserstein距离,定义多元距离函数,即置信度判断待测人脸是否是期待的目标。该算法采用新的数学方法来解决人脸识别问题,针对光照和角度问题加以研究和改进,在理论上,该算法考虑到人脸识别的现实条件,提升了算法的适用性。
Description
技术领域
本发明涉及模式识别领域,尤其涉及在人脸检测与性别识别应用中,采用Wasserstein距离和局部三值模式(LTP)结合,寻找人脸的高级特征表达,从而达到人脸识别的目的,即W-LTP人脸识别算法。
背景技术
随着目前对人脸识别的广泛而深入的研究,卷积神经网络表现出了极好的效果,但是其计算量大且训练过程对数据量的要求很大。这就将要求转换到改进传统人脸识别算法,在保障计算速度的情况下,达到与神经网络相当的水平。
Wasserstein距离又叫Earth-Mover距离(EM距离),是概率论中的一个基本理论,该距离函数用于分析两个分布之间的距离,或者说从A分布变换到到B分布所需要移动的最短距离。这是一个与最优化相结合的概念,能够巧妙分析不同分布之间的距离,在统计分析中有非常有价值的应用。由于Wasserstein距离的特性,使其具有很高的旋转不变性,在人脸识别领域这样的特性有很高的价值,但是Wasserstein距离对于光照的不能敏感性很差,在光照变化之后,图像直方图会发生很大变化,进而导致Wasserstein距离的变化。而LTP算法能够很好弥补Wasserstein算法的不足之处。LTP算法通过对比采样点和周围像素值的大小关系获得采样点的特征表达,它的旋转不变性较差,但对于光照的不敏感性很好。所以将上述两种算法结合,以在不同角度,不同光照条件下实现人脸识别。
发明内容
针对现有技术存在的问题,本发明提出了一种W-LTP人脸识别算法,该算法采用新的数学方法来解决人脸识别问题,针对光照和角度问题加以研究和改进,在理论上,该算法考虑到人脸识别的现实条件,提升了算法的适用性。
W-LTP人脸识别算法分为三个步骤,第一步是对人脸图像的预处理,包括白平衡、像素压缩、统一图像大小的过程;第二步是求图像的LTP特征值,获得图像的LTP表达;第三步是计算Wasserstein距离,计算由上一步得到的LTP特征图的直方图分布与期待目标和非期待目标的Wasserstein距离,定义多元距离函数,即置信度判断待测人脸是否是期待的目标。详细算法流程图如图1。
(1)LTP特征计算
LTP算子是对LBP算子的一种推广,它定义一个长度为2t的区间,考虑中心像素的邻域共八个像素点灰度值xi与它本身的灰度值xc的差值在该区间右边,则编码为1;若差值在该区间左边,编码为-1,若差值在该区间之中,则编码为0,由此可见该算法对光照变化和噪声更加鲁棒,LTP采用三值编码形式,从x轴正方向开始按逆时针方向取权重,分别为30,31,……,37,计算公式如下:
(2)计算Wasserstein距离
Wasserstein距离的计算公式如下:
式中Pm、Pn分别为利用(1)中所述LTP计算之后的人脸的直方图分布,需要将上一步获得的LTP特征值进行归一化才可获得直方图分布,通过上式可以计算出两种分布的最短移动距离,进而可以判断两个分布的距离;由于在之前采用了LTP获取特征值,在这里直接计算Wasserstein距离可以减少光照和随机噪声对于检验结果的干扰;
(3)计算置信度C
在分析结果时,由于计算之后一定会有一个Wasserstein距离的最小值,虽然Wasserstein距离的最小值代表了两种分布距离最近,但是从人脸识别角度来看,不能仅仅根据距离最小就认定当前检测目标是目标库中的人物,在这里定义一个多元距离函数对目标的可靠性或称置信度进行判断,函数表达式如下式(4),又称置信度函数:
式中,q表示当前系统的已知人脸数量,W1,W2…是将Wasserstein距离由小到大排列后的距离,上式的计算结果是一个介于(0,1)的量,其数值越接近1则代表目标是当前与其距离最近的人脸是同一人的可靠性越高。
本发明根据Wasserstein距离这一统计学、数学概念,设计了一种基于该距离的人脸识别算法——W-LTP算法,Wasserstein距离这一计算方法,本身在统计学和最优化的应用中一直有着较高的认可度,同时相比于传统LTP人脸识别算法,该算法对于光照和角度的鲁棒性都更好。同时在对高维数据的处理方面,细节把握效果更好,更容易得到更加精准的结果。本算法还针对最终结果的判断设计了多元函数求解可信度的计算,将计算结果更加精准可视地展现。
附图说明
图1是 W-LTP人脸识别算法流程图。
具体实施方式
以下根据附图和实施例对本发明进行详细说明,但是本发明的保护范围不限于此。
该算法由Wasserstein距离和LTP算法为主题,由于涉及最优化问题,所需的计算量较大,对于图片像素要求不能太大,但同时如果输入图像像素太低,则不容易获得较好的特征,综合来看,人脸像素取256*256即可满足计算要求又不会造成太大计算量,所以对于高分辨率图像要求在预处理过程中先将像素降低至要求范围,从而简化计算。在计算LTP时,有文献表明人脸区域灰度差值在7以内基本不存在特征变化,结合这一规律,设计LTP的区间长度为3,这样保障了LTP能够更加有效清晰地描述人脸的纹理、特征变化。在计算置信度时,置信度的阈值设置也需要至关重要,若阈值太低容易出现不一致的目标被错误匹配,而阈值太高又会导致算法无法将目标检测。一般设置阈值0.7可以实现比较满意的判断结果。
Claims (1)
1.W-LTP人脸识别算法,其特征在于:分为三个步骤,第一步是对人脸图像的预处理,包括白平衡、像素压缩、统一修剪图像大小的过程;第二步是求图像的LTP特征值,获得图像的LTP表达;第三步是计算Wasserstein距离,计算由上一步得到的LTP特征图的直方图分布与期待目标和非期待目标的Wasserstein距离,定义多元距离函数,即置信度判断待测人脸是否是期待的目标;
(1)LTP特征计算
LTP算子是对LBP算子的一种推广,它定义一个长度为2t的区间,考虑中心像素的邻域共八个像素点灰度值xi与它本身的灰度值xc的差值在该区间右边,则编码为1;若差值在该区间左边,编码为-1,若差值在该区间之中,则编码为0,由此可见该算法对光照变化和噪声更加鲁棒,LTP采用三值编码形式,从x轴正方向开始按逆时针方向取权重,分别为30,31,……,37,计算公式如下:
(2)计算Wasserstein距离
Wasserstein距离的计算公式如下:
式中 Pm、Pn 分别为利用(1)中所述LTP计算之后的人脸的直方图分布,需要将上一步获得的LTP特征值进行归一化才可获得直方图分布,通过上式可以计算出两种分布的最短移动距离,进而可以判断两个分布的距离;由于在之前采用了LTP获取特征值,在这里直接计算Wasserstein距离可以减少光照和随机噪声对于检验结果的干扰;
(3)计算置信度C
在分析结果时,由于计算之后一定会有一个Wasserstein距离的最小值,虽然Wasserstein距离的最小值代表了两种分布距离最近,但是从人脸识别角度来看,不能仅仅根据距离最小就认定当前检测目标是目标库中的人物,在这里定义一个多元距离函数对目标的可靠性或称置信度进行判断,函数表达式如下式(4),又称置信度函数:
式中,q表示当前系统的已知人脸数量,W1,W2…是将Wasserstein距离由小到大排列后的距离,上式的计算结果是一个介于(0,1)的量,其数值越接近1则代表目标是当前与其距离最近的人脸是同一人的可靠性越高。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910076378.2A CN111488763A (zh) | 2019-01-26 | 2019-01-26 | W-ltp人脸识别算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910076378.2A CN111488763A (zh) | 2019-01-26 | 2019-01-26 | W-ltp人脸识别算法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111488763A true CN111488763A (zh) | 2020-08-04 |
Family
ID=71811476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910076378.2A Pending CN111488763A (zh) | 2019-01-26 | 2019-01-26 | W-ltp人脸识别算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111488763A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11921818B2 (en) | 2020-12-01 | 2024-03-05 | Samsung Electronics Co., Ltd. | Image recognition method and apparatus, image preprocessing apparatus, and method of training neural network |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996399A (zh) * | 2009-08-18 | 2011-03-30 | 三星电子株式会社 | 在左图像与右图像之间估计视差的设备和方法 |
CN103778412A (zh) * | 2014-01-16 | 2014-05-07 | 重庆邮电大学 | 一种基于局部三值模式自适应阈值的人脸识别方法 |
CN104008370A (zh) * | 2014-05-19 | 2014-08-27 | 清华大学 | 一种视频人脸识别方法 |
-
2019
- 2019-01-26 CN CN201910076378.2A patent/CN111488763A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101996399A (zh) * | 2009-08-18 | 2011-03-30 | 三星电子株式会社 | 在左图像与右图像之间估计视差的设备和方法 |
CN103778412A (zh) * | 2014-01-16 | 2014-05-07 | 重庆邮电大学 | 一种基于局部三值模式自适应阈值的人脸识别方法 |
CN104008370A (zh) * | 2014-05-19 | 2014-08-27 | 清华大学 | 一种视频人脸识别方法 |
Non-Patent Citations (7)
Title |
---|
姚乃明等: "基于生成式对抗网络的鲁棒人脸表情识别", 《自动化学报》, vol. 44, no. 5, 18 April 2018 (2018-04-18), pages 865 - 877 * |
姜明星;胡敏;王晓华;任福继;王浩文;: "视频序列中表情和姿态的双模态情感识别", 激光与光电子学进展, no. 07, 16 January 2018 (2018-01-16) * |
杜振龙;叶超;李晓丽;沈海洋;宋国美;: "基于Wasserstein直方图欧氏度量的图像重复区域盲检测算法", 光学与光电技术, no. 06, 10 December 2018 (2018-12-10) * |
林玉池;崔彦平;黄银国;: "复杂背景下边缘提取与目标识别方法研究", 光学精密工程, no. 03, 25 June 2006 (2006-06-25) * |
王小虎;黄银珍;张石清;: "结合FSVM和KNN的人脸表情识别", 微电子学与计算机, no. 10, 5 October 2013 (2013-10-05) * |
郑昌金;章登义;苏科华;武小平;洪程;: "基于LBP特征和熵正则化Wasserstein距离的人脸表情识别", 计算机与数字工程, no. 02, 20 February 2017 (2017-02-20) * |
闫河;王朴;刘婕;陈伟栋;: "自适应中心对称局部三值模式的人脸识别", 计算机应用与软件, no. 09, 15 September 2016 (2016-09-15), pages 143 - 147 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11921818B2 (en) | 2020-12-01 | 2024-03-05 | Samsung Electronics Co., Ltd. | Image recognition method and apparatus, image preprocessing apparatus, and method of training neural network |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109271960B (zh) | 一种基于卷积神经网络的人数统计方法 | |
CN108154118B (zh) | 一种基于自适应组合滤波与多级检测的目标探测系统及方法 | |
CN107529650B (zh) | 闭环检测方法、装置及计算机设备 | |
CN113344976B (zh) | 一种基于目标物表征点估计的视觉跟踪方法 | |
WO2021129569A1 (zh) | 一种人体动作识别方法 | |
CN113689428A (zh) | 基于图像处理的机械零件应力腐蚀检测方法及系统 | |
CN112435221A (zh) | 一种基于生成式对抗网络模型的图像异常检测方法 | |
CN111369597B (zh) | 一种基于多特征融合的粒子滤波目标跟踪方法 | |
WO2021093275A1 (zh) | 一种人群计数系统中自适应计算高斯核大小的方法 | |
CN110287777B (zh) | 一种自然场景下的金丝猴躯体分割算法 | |
CN107833239B (zh) | 一种基于加权模型约束的寻优匹配目标跟踪方法 | |
CN110633643A (zh) | 一种面向智慧社区的异常行为检测方法及系统 | |
CN110853074A (zh) | 一种利用光流增强目标的视频目标检测网络系统 | |
CN112270691A (zh) | 一种基于动态滤波器网络的单目视频结构和运动预测方法 | |
CN112084895B (zh) | 一种基于深度学习的行人重识别方法 | |
CN116703932A (zh) | 一种基于卷积注意力机制的CBAM-HRNet模型小麦穗粒分割与计数方法 | |
CN108986083B (zh) | 基于阈值优化的sar图像变化检测方法 | |
CN114549525A (zh) | 一种基于改进canny算法的工业图像检测方法 | |
CN111488763A (zh) | W-ltp人脸识别算法 | |
CN113989275A (zh) | 基于初始权重优化的神经网络的木板类型识别方法及装置 | |
JP6600288B2 (ja) | 統合装置及びプログラム | |
CN110705568B (zh) | 一种图像特征点提取的优化方法 | |
CN109344758B (zh) | 基于改进局部二值模式的人脸识别方法 | |
CN111275751A (zh) | 一种无监督绝对尺度计算方法及系统 | |
CN109447952B (zh) | 一种基于Gabor差分盒加权维数的半参考型图像质量评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |