CN107993311B - 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 - Google Patents
一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 Download PDFInfo
- Publication number
- CN107993311B CN107993311B CN201711126624.8A CN201711126624A CN107993311B CN 107993311 B CN107993311 B CN 107993311B CN 201711126624 A CN201711126624 A CN 201711126624A CN 107993311 B CN107993311 B CN 107993311B
- Authority
- CN
- China
- Prior art keywords
- cost
- sensitive
- matrix
- latent semantic
- access control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G07—CHECKING-DEVICES
- G07C—TIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
- G07C9/00—Individual registration on entry or exit
- G07C9/00174—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys
- G07C9/00563—Electronically operated locks; Circuits therefor; Nonmechanical keys therefor, e.g. passive or active electrical keys or other data carriers without mechanical keys using personal physical data of the operator, e.g. finger prints, retinal images, voicepatterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法;属于人脸图像处理领域;包含如下步骤:设置错分代价矩阵;代价敏感的隐语义回归;模型预测;本发明针对真实人脸识别门禁系统中的半监督和代价敏感学习问题,设计了一种代价敏感的统一学习框架,用于联合学习人脸图像的隐语义表示、无标签训练样本的标签信息和代价敏感的分类器。在仅使用少量监督训练样本的条件下,本发明提出的代价敏感隐语义回归模型能够最小化人脸识别门禁系统的整体错分损失,因此具有较高的实用价值。
Description
技术领域
本发明属于人脸图像处理领域,特别涉及一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法。
背景技术
随着科学技术的发展,人脸识别技术取得了飞速发展和广泛应用。传统的人脸识别方法追求最小的识别错误率,即假设不同错分所带来的损失相同。然而,在真实的人脸识别应用中,这一假设往往不成立,不同错分所带来的损失不同。例如,在人脸识别门禁系统中,存在入侵者类I和合法者类Gi,i=1,2,L,c-1。一般而言,将入侵者错分成合法者的损失高于将合法者错分成入侵者的损失,而将合法者错分成其他合法者的损失又要低于将合法者错分成入侵者的损失。此外,在真实的人脸识别应用中,用于训练识别模型的训练样本集通常是半监督的,即训练集中只有少量监督样本,大部分样本的标签信息未知。这是因为要获取样本的标签信息难,需要付出大量人力和财力。
针对人脸识别门禁系统中的不同错分损失问题和半监督学习问题,研究者提出了代价敏感的半监督学习方法。它们采用两步学习的策略,即先标签扩展无标签样本的标签信息,然后根据监督样本的标签信息和学得的无监督样本的标签信息,将错分代价信息嵌入学习算法,设计代价敏感的学习模型。
虽然现有代价敏感的半监督学习方法,在人脸识别门禁系统中取得了不错的识别性能,其两步学习的策略主要存在如下两个方面的缺陷:1)采用的标签扩展算法代价不敏感,如稀疏学习或L2范数方法。这将导致错误的标签预测结果,从而丢失大量有用的代价信息。2)标签扩展和代价敏感的学习模型相互独立,很难预学习得到全局最优的标签信息,用于随后的代价敏感学习模型。
发明内容
发明目的:本发明为了解决人脸识别门禁系统中的不同错分损失问题和半监督学习问题,提出了一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法,从而在仅使用少量监督训练样本的条件下,学得的最优分类器能够最小化人脸识别门禁系统的整体错分损失,有效的将入侵者拒之门外,而允许合法者进入。
发明内容:本发明公开了一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法,包含如下步骤:
步骤1,设置错分代价矩阵;
步骤2,建立代价敏感的隐语义回归模型;
步骤3,模型预测:利用步骤2学得的代价敏感分类器,预测待验证的人脸图像;
步骤2“代价敏感的隐语义回归”构建了一种代价敏感的统一学习框架,用于联合学习人脸图像的隐语义特征S、训练样本的标签矩阵F和代价敏感的分类器W,该统一学习框架的目标函数表达式为:
s.t.||fi||0=1,fi∈{0,1}c,i=1,2,L,N (1)
其中,X=[x1,K xN]∈RD×N表示分布于D维空间上的N个训练样本;B∈RD×d表示d维隐语义空间;h(i)定义了第i个训练样本的重要性;c表示样本的类别数;si和fi分别表示第i个样本的隐语义特征和其预测标签;标签矩阵由Nl个监督样本的标签矩阵YL和全零矩阵构成;Q∈Rc×N表示惩罚矩阵;是为了避免过拟合的正则化项;e表示矩阵点积;||g||F表示Frobenius范数;μ,γ,λ是三个平衡参数。
进一步地,人脸图像隐语义特征S的学习过程,不仅依赖于人脸图像X本身,还有效利用了训练样本的标签矩阵F和代价敏感的分类器W,人脸图像隐语义特征S的学习函数为:
进一步地,在鲁棒的隐语义空间中,基于代价敏感的分类器W,学习训练样本的标签矩阵F;并且通过定义代价敏感的正则化项,有效利用了监督样本的标签信息YL,训练样本的标签矩阵F的学习函数为:
s.t.||fi||0=1,fi∈{0,1}c,i=1,2,L,N (3)。
进一步地,在鲁棒的隐语义空间中,基于训练样本的标签矩阵F,学习代价敏感的分类器W,使得学得的最优分类器W满足最小错分损失准则,代价敏感分类器W的学习函数为:
进一步地,采用如下的核心步骤,进行交替迭代的求解,
步骤2-3:固定变量S、F以及W,优化求解如下的目标函数
采用拉格朗日乘子法,更新隐语义空间B=XST(SST+λI)-1,I∈Rd×d是单位矩阵;
步骤2-4:固定变量B、F以及W,优化求解公式(2)所定义的目标函数,这里,本发明对每一个训练样本分别求解其隐语义表示si,i=1,L,N,具体地,采用拉格朗日乘子法,获得样本xi的隐语义表示si=(BTB+μh(i)WWT+λI)-1(BTxi+μh(i)Wfi);
步骤2-5:固定变量B、S以及W,优化求解公式(3)所定义的目标函数,这里,本发明对每一个训练样本分别求解其预测标签fi,i=1,L,N,具体地,采用穷举法,令预测标签fi的c个元素值依次为1,将获得最大目标函数值的fi作为该样本的预测标签;
步骤2-6:固定变量B、S以及F,优化求解公式(4)所定义的目标函数,具体地,采用拉格朗日乘子法,获得代价敏感的分类器W=(μSHST)-1(μSHF),其中H=diag(h(1),L,h(N));
步骤2-7:根据步骤2-3~2-6学得的变量值B、S、F以及W,计算公式(1)所定义的目标函数值。如果第t次与第t-1次目标函数值的差,小于某个阈值T,或者迭代次数t达到最大迭代次数Tn,算法结束;否则,返回步骤2-3继续执行。
进一步地,步骤3的具体步骤如下:
步骤3-1:根据步骤2学得的隐语义空间B,矩阵分解待测试图像xt,
本发明是专门针对半监督人脸识别门禁系统而提出的人脸识别方法。与现有技术相比,本发明具有以下特征:
首先,本发明提出了一种代价敏感的统一学习框架,用于联合学习人脸图像的隐语义特征S、训练样本的标签矩阵F和代价敏感的分类器W。代价敏感的分类器W和标签矩阵F的学习过程相互依赖,交替更新。这不仅建立了标签扩展和代价敏感学习模型之间的联系,有利于获得最优的标签信息,而且使得标签扩展过程代价敏感,避免了代价信息的丢失。
其次,本发明学得的代价敏感分类器W满足最小错分损失准则。相应地,本发明提出的统一学习框架,经过多次迭代,能够保证收敛,获得封闭解。
附图说明
图1为本发明整体流程图。
图2为本发明中代价敏感的隐语义回归步骤的子流程图。
图3为本发明中模型预测步骤的子流程图。
具体实施方式
以下结合附图说明本发明的具体实施方式。
如图1所示,本发明公开了一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法,具体步骤如下:
步骤1,设置错分代价矩阵C:假设在人脸识别门禁系统中,存在入侵者类I和c-1个合法者类Gi,i=1,2,L,c-1。对于任意一张待测试人脸图像,可能存在如下三种不同类型的错分:1)False rejection:错误的将合法者错分成入侵者;2)False acceptance:错误的将入侵者错分成合法者;3)False identification:错误的将某一合法者错分成其他合法者。相应地,本发明用符号CGI、CIG、CGG分别表示上述三种错分的错分代价,并得到表1所示的错分代价矩阵。值得注意的是,这里错分代价矩阵C可由门禁系统的使用者或领域专家自主设置。本发明的实验结果表明,对于不同设置的错分代价矩阵,本发明都能获得较高识别效果。
表1错分代价矩阵C
G<sub>1</sub> | … | G<sub>c-1</sub> | I | |
G<sub>1</sub> | 0 | … | C<sub>GG</sub> | C<sub>GI</sub> |
… | ||||
G<sub>c-1</sub> | C<sub>GG</sub> | … | 0 | C<sub>GI</sub> |
I | C<sub>IG</sub> | … | C<sub>IG</sub> | 0 |
步骤2,建立代价敏感的隐语义回归模型:通过构建一种代价敏感的统一学习框架,联合学习人脸图像的隐语义特征S、训练样本的标签矩阵F和代价敏感的分类器W。该统一学习框架的目标函数表达式为:
s.t.||fi||0=1,fi∈{0,1}c,i=1,2,L,N
其中,X=[x1,K xN]∈RD×N表示分布于D维空间上的N个训练样本;B∈RD×d表示d维隐语义空间;h(i)定义了第i个训练样本的重要性;c表示样本的类别数;si和fi分别表示第i个样本的隐语义特征和其预测标签;标签矩阵由Nl个监督样本的标签矩阵YL和全零矩阵构成;Q∈Rc×N表示惩罚矩阵;是为了避免过拟合的正则化项;e表示矩阵点积;||g||F表示Frobenius范数;μ,γ,λ是三个平衡参数。
对于公式(1)所定义的统一学习框架,本发明采用交替迭代的方法,求解、更新变量B、S、F以及W。如图2所示,步骤2的具体实施步骤如下:
步骤2-1:人脸向量归一化。归一化是图像预处理中最重要的内容之一,是一种简化计算的方式,对平移、旋转、缩放等仿射变换具有不变性,是获得高识别率的基础保障,给定人脸向量采用公式将人脸向量归一到单位向量x。
步骤2-2:随机生成4个变量B、S、F以及W的初始值。
步骤2-3:固定变量S、F以及W,优化求解如下的目标函数
采用拉格朗日乘子法,更新隐语义空间B=XST(SST+λI)-1,I∈Rd×d是单位矩阵。
步骤2-4:固定变量B、F以及W,优化求解如下的目标函数
这里,本发明对每一个训练样本分别求解其隐语义表示si,i=1,L,N。具体地,采用拉格朗日乘子法,获得样本xi的隐语义表示si=(BTB+μh(i)WWT+λI)-1(BTxi+μh(i)Wfi)。
步骤2-5:固定变量B、S以及W,优化求解如下的目标函数
s.t.||fi||0=1,fi∈{0,1}c,i=1,2,L,N
这里,本发明对每一个训练样本分别求解其预测标签fi,i=1,L,N。具体地,采用穷举法,令预测标签fi的c个元素值依次为1,将获得最大目标函数值的fi作为该样本的预测标签。
步骤2-6:固定变量B、S以及F,优化求解如下的目标函数
采用拉格朗日乘子法,获得代价敏感的分类器W=(μSHST)-1(μSHF),其中H∈RN×N=diag(h(1),L,h(N))。
步骤2-7:根据步骤2-3~2-6学得的变量值B、S、F以及W,计算公式(1)定义的目标函数值。如果第t次与第t-1次目标函数值的差,小于某个阈值T,或者迭代次数t达到最大迭代次数Tn,算法结束;否则,返回步骤2-3继续执行。
步骤3,模型预测:利用步骤2学得的代价敏感分类器,预测待验证的人脸图像。如图3所示,具体步骤如下:
步骤3-1:根据步骤2学得的隐语义空间B,矩阵分解待测试图像xt。
以上对本发明所提供的一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法进行了详细介绍。值得注意的是,具体实现该技术方案的方法和途径有很多,以上所述仅是本发明的优选实施方式,只用于帮助理解本发明的方法及核心思想;同时,对于本领域的一般技术人员,在本发明核心思想的基础上,做出的修改和调整都将视为本发明的保护范围。综上所述,本说明书内容不应理解为对本发明的限制,本发明的保护范围应由所附的权利要求来限定。
Claims (6)
1.一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法,其特征在于,包含如下步骤:
步骤1,设置错分代价矩阵;
步骤2,建立代价敏感的隐语义回归模型;
步骤3,模型预测:利用步骤2学得的代价敏感分类器,预测待验证的人脸图像;
步骤2“代价敏感的隐语义回归”构建了一种代价敏感的统一学习框架,用于联合学习人脸图像的隐语义特征S、训练样本的标签矩阵F和代价敏感的分类器W,该统一学习框架的目标函数表达式为:
5.如权利要求1所述的一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法,其特征在于,采用如下的核心步骤,进行交替迭代的求解;
步骤2-3:固定变量S、F以及W,优化求解如下的目标函数
采用拉格朗日乘子法,更新隐语义空间B=XST(SST+λI)-1,I∈Rd×d是单位矩阵;
步骤2-4:固定变量B、F以及W,优化求解公式(2)所定义的目标函数,这里,本发明对每一个训练样本分别求解其隐语义表示si,i=1,L,N,具体地,采用拉格朗日乘子法,获得样本xi的隐语义表示si=(BTB+μh(i)WWT+λI)-1(BTxi+μh(i)Wfi);
步骤2-5:固定变量B、S以及W,优化求解公式(3)所定义的目标函数,这里,本发明对每一个训练样本分别求解其预测标签fi,i=1,L,N,具体地,采用穷举法,令预测标签fi的c个元素值依次为1,将获得最大目标函数值的fi作为该样本的预测标签;
步骤2-6:固定变量B、S以及F,优化求解公式(4)所定义的目标函数,具体地,采用拉格朗日乘子法,获得代价敏感的分类器W=(μSHST)-1(μSHF),其中H=diag(h(1),L,h(N));
步骤2-7:根据步骤2-3~2-6学得的变量值B、S、F以及W,计算公式(1)所定义的目标函数值,如果第t次与第t-1次目标函数值的差,小于某个阈值T,或者迭代次数t达到最大迭代次数Tn,算法结束;否则,返回步骤2-3继续执行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711126624.8A CN107993311B (zh) | 2017-11-15 | 2017-11-15 | 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711126624.8A CN107993311B (zh) | 2017-11-15 | 2017-11-15 | 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107993311A CN107993311A (zh) | 2018-05-04 |
CN107993311B true CN107993311B (zh) | 2020-05-26 |
Family
ID=62030953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711126624.8A Active CN107993311B (zh) | 2017-11-15 | 2017-11-15 | 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107993311B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110135466B (zh) * | 2019-04-23 | 2022-07-15 | 中国科学技术大学 | 一种污染物排放超标车辆判断方法及系统 |
CN111415289B (zh) * | 2020-03-25 | 2022-04-01 | 武汉大学 | 基于自适应代价敏感特征学习的不平衡隐写分析方法 |
CN115374859B (zh) * | 2022-08-24 | 2024-07-02 | 东北大学 | 一种针对非平衡、多类别的复杂工业数据的分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103035050A (zh) * | 2012-12-19 | 2013-04-10 | 南京师范大学 | 一种用于复杂人脸识别门禁系统的高精度人脸识别方法 |
CN106599787A (zh) * | 2016-11-17 | 2017-04-26 | 河海大学 | 基于半监督子块联合回归的单样本人脸识别方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096557B (zh) * | 2016-06-15 | 2019-01-18 | 浙江大学 | 一种基于模糊训练样本的半监督学习人脸表情识别方法 |
CN106845336A (zh) * | 2016-12-02 | 2017-06-13 | 厦门理工学院 | 一种基于局部信息和组稀疏约束的半监督人脸识别方法 |
CN106601235A (zh) * | 2016-12-02 | 2017-04-26 | 厦门理工学院 | 一种半监督多任务特征选择的语音识别方法 |
-
2017
- 2017-11-15 CN CN201711126624.8A patent/CN107993311B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103035050A (zh) * | 2012-12-19 | 2013-04-10 | 南京师范大学 | 一种用于复杂人脸识别门禁系统的高精度人脸识别方法 |
CN106599787A (zh) * | 2016-11-17 | 2017-04-26 | 河海大学 | 基于半监督子块联合回归的单样本人脸识别方法 |
Non-Patent Citations (7)
Title |
---|
Cost Sensitive Semi-Supervised Canonical Correlation Analysis for Multi-view Dimensionality Reduction;Jianwu Wan;《Neural Processing Letters》;20170415;第45卷(第2期);全文 * |
Cost-sensitive dictionary learning for face recognition;Guoqing Zhang;《Pattern Recognition》;20161231;第60卷;第613-629页 * |
Discriminative cost sensitive Laplacian score for face recognition;Jianwu Wan;《Neurocomputing》;20150615;第152卷;全文 * |
Pairwise Costs in Semisupervised Discriminant Analysis for Face Recognition;Jianwu Wan;《IEEE TRANSACTIONS ON INFORMATION FORENSICS AND SECURITY》;20141031;第9卷(第10期);全文 * |
一种面向人脸识别的加权代价敏感局部保持投影;万建武;《软件学报》;20130515(第5期);全文 * |
代价敏感的半监督Laplacian支持向量机;万建武;《电子学报》;20120715(第7期);全文 * |
代价敏感降维及其人脸识别应用研究;万建武;《中国博士学位论文全文数据库信息科技辑》;20140131;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN107993311A (zh) | 2018-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | Zero-shot learning via joint latent similarity embedding | |
Sun et al. | Deep learning face representation by joint identification-verification | |
Chen | Deep learning with nonparametric clustering | |
Zhang et al. | Deep transfer network: Unsupervised domain adaptation | |
EP3767536A1 (en) | Latent code for unsupervised domain adaptation | |
Nigam et al. | Impact of noisy labels in learning techniques: a survey | |
Wang et al. | Feature selection and multi-kernel learning for adaptive graph regularized nonnegative matrix factorization | |
Ju et al. | Fish species recognition using an improved AlexNet model | |
CN110516537B (zh) | 一种基于自步学习的人脸年龄估计方法 | |
CN107993311B (zh) | 一种用于半监督人脸识别门禁系统的代价敏感隐语义回归方法 | |
CN112232395B (zh) | 一种基于联合训练生成对抗网络的半监督图像分类方法 | |
Das et al. | NAS-SGAN: a semi-supervised generative adversarial network model for atypia scoring of breast cancer histopathological images | |
CN114882534B (zh) | 基于反事实注意力学习的行人再识别方法、系统、介质 | |
CN116740384B (zh) | 洗地机的智能控制方法及系统 | |
Zhao et al. | Efficient detection method for foreign fibers in cotton | |
Dwivedi et al. | A leaf disease detection mechanism based on L1-norm minimization extreme learning machine | |
Mehrkanoon et al. | Incremental multi-class semi-supervised clustering regularized by Kalman filtering | |
Lee et al. | Learning in the wild: When, how, and what to learn for on-device dataset adaptation | |
CN107491735B (zh) | 人类行为识别的标签和交互关系联合学习方法 | |
CN116910571B (zh) | 一种基于原型对比学习的开集域适应方法及系统 | |
Xi et al. | Robust semi-supervised learning for self-learning open-world classes | |
CN111259938A (zh) | 基于流形学习和梯度提升模型的图片偏多标签分类方法 | |
Heesch et al. | Markov random fields with asymmetric interactions for modelling spatial context in structured scene labelling | |
CN117070741B (zh) | 酸洗机组的控制方法及其系统 | |
Orrite et al. | One-sequence learning of human actions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |