CN113111781A - 一种基于Sigmoid函数的分类层监督用于人脸识别的方法 - Google Patents
一种基于Sigmoid函数的分类层监督用于人脸识别的方法 Download PDFInfo
- Publication number
- CN113111781A CN113111781A CN202110397616.7A CN202110397616A CN113111781A CN 113111781 A CN113111781 A CN 113111781A CN 202110397616 A CN202110397616 A CN 202110397616A CN 113111781 A CN113111781 A CN 113111781A
- Authority
- CN
- China
- Prior art keywords
- face recognition
- loss function
- function
- sigmoid
- supervision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000012549 training Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 91
- 230000009466 transformation Effects 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 14
- 238000013528 artificial neural network Methods 0.000 abstract description 11
- 238000002474 experimental method Methods 0.000 abstract description 2
- 238000005457 optimization Methods 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000005286 illumination Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012886 linear function Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于Sigmoid函数的分类层监督用于人脸识别的方法,属于计算机视觉领域。本发明基于Sigmoid非线性函数和Softmax分类层监督两个方面提出了一种可用于训练人脸识别深度神经网络的损失函数。该方法适用于当前以深度神经网络为基础的人脸识别网络训练。在公开数据集上的实验表明,使用本发明作为损失函数训练得到的人脸识别网络具有较高的人脸识别准确率,在侧脸拍摄、强弱光照射等极端场景中也具有较强的人脸识别能力。
Description
技术领域
本发明涉及计算机视觉领域,尤其是一种基于Sigmoid函数的分类层监督用于人脸识别的方法。
背景技术
自从21世纪以来,人脸识别技术就一直是计算机视觉领域的一个热点研究问题,在安防、民生、交通等领域应用广泛。在当下以深度神经网络为基础的人脸识别技术研究中,网络结构优化和损失函数优化是两个主要的研究方向。网络结构的优化主要着眼于人脸识别任务中特征提取网络如何能够提取到更有效的人脸特征,这些特征包括低级的轮廓、颜色等特征,也包括高级的富含有丰富语意信息的特征。网络结构的优化可以带来人脸识别准确率的提升,但是可能存在网络整体参数量和计算量变大的缺点。损失函数的优化主要着眼于人脸识别任务中训练人脸识别网络时的分类层监督,一般的分类层监督是指使用全连接层作为分类层时为网络引入的“代价”,典型的分类层监督是Softmax分类层监督,在深度神经网络发展的初期被广泛应用于各种图像分类任务,且具有不错的表现。损失函数的优化也可以带来人脸识别准确率的提升,并且由于分类层监督只存在于网络训练阶段,即使非常复杂的分类层监督在网络推理阶段也是没有任何代价的。
当前主流的人脸识别网络分类层监督一般以Softmax损失函数为基础。Softmax损失函数将分类层得到的每一个输出视为每一个类别的未归一化的对数概率,并且将线性分类器SVM中的折叶损失替换为交叉熵损失。从信息论的角度来看,Softmax损失函数最小化了预测概率分布和真实概率分布之间的交叉熵,其中真实概率分布是指所有概率密度都分布在正确的类别上。从概率论的角度来看,Softmax损失函数最小化了正确分类的负对数概率,本质上是最大似然估计。事实上,在深度神经网络中Softmax损失函数的正则化部分可以看作权重矩阵的高斯先验,网络在推理过程中进行了最大后验估计,这符合分类网络设计的初衷。因此,Softmax分类层监督用于图像分类等任务是合适的。
使用Softmax分类层监督训练得到的图像分类网络可以准确分类多达上千类的自然图像,但是却不能直接应用于人脸识别网络。Softmax损失函数只关注分类正确的类别,对分类错误的类别没有优化,因此使用Softmax损失函数训练得到的特征类内距离不够紧凑,类间距离不够远离。在人脸识别这一特殊场景中,由于不同人脸在不同环境下的特征向量可能非常接近,也可能差异较大,因此,人脸识别任务需要特征具有“类内距离紧凑,类间距离远离”这一特性。为了解决Softmax分类层监督无法直接应用于人脸识别网络这一问题,研究人员显式引入了一个基于度量学习的角度裕量,在网络训练优化的过程中人为压缩同一类别的特征向量之间的距离,扩大不同类别的特征向量之间的距离,使得训练得到的网络的输出端输出的特征具有“类内距离紧凑,类间距离远离”这一特性。
发明内容
发明目的:为解决上述在人脸识别过程中Softmax分类层监督存在的问题,本发明设计了一种基于Sigmoid函数的分类层监督,该损失函数具有较强的非线性表达能力,使用该损失函数训练得到的人脸识别网络具有较高的人脸识别准确率。
为达到上述目的,本发明提供了一种基于Sigmoid函数的分类层监督用于人脸识别的方法,包含以下步骤:
步骤1,以原始的Softmax损失函数作为分类层监督的基础。
原始的Softmax损失函数的一般形式为:
其中,N表示batchsize的大小,n表示总共的类别数目。
步骤2,在原始Softmax损失函数的基础上引入角度裕量,角度裕量直接作用于特征夹角,并归一化特征;
步骤3,为步骤2得到的损失函数引入Sigmoid非线性变换,得到耦合了Sigmoid非线性变换后的损失函数,即基于Sigmoid函数的分类层监督。
步骤4,根据步骤3得到的基于Sigmoid函数的分类层监督,在训练数据集上训练人脸识别网络,直到网络收敛,形成训练好的人脸识别网络。
步骤5,将训练好的人脸识别网络用于人脸识别。
进一步的,所述步骤2具体为,在原始Softmax损失函数的基础上引入第一角度裕量m1,第一角度裕量m1直接作用于特征夹角,并归一化特征;经过上述操作后的Softmax损失函数的一般形式为:
其中,第一角裕量m1=4。
在原始Softmax损失函数的基础上引入第一角度裕量,第一角度裕量直接作用于特征夹角,并归一化特征。归一化特征可以将光照因素建模到神经网络中,从而减小数据预处理部分的压力。第一角度裕量的引入可以使得不同物体之间的类内距离更加紧凑,类间距离更加远离
所述步骤3具体为,为步骤2得到的损失函数分别引入Sigmoid非线性变换,得到损失函数为:
进一步的,所述步骤2还可以是,在原始Softmax损失函数的基础上引入第二个角度裕量m2,第二角度裕量m2直接作用于特征夹角,并归一化特征和权重向量;经过上述操作后的Softmax损失函数的一般形式为:
归一化特征可以将光照因素建模到神经网络中,从而减小数据预处理部分的压力。归一化权重向量可以减小除特征本身外的因素对高维向量分类的影响。第二角度裕量的引入可以使得不同物体之间的类内距离更加紧凑,类间距离更加远离。
所述步骤3具体为,对步骤2得到的损失函数引入Sigmoid非线性变换后,得到的损失函数为:
进一步的,步骤3还包括,将已经引入了Sigmoid非线性变换后得到的损失函数losssig1和损失函数losssig2进行加权组合,得到所述基于Sigmoid函数的分类层监督。所述基于Sigmoid函数的分类层监督的一般形式为:
其中,λ为加权系数,m1和m2分别为第一角裕量和第二角裕量。
有益效果:本发明基于Sigmoid非线性函数和Softmax分类层监督两个方面提出了一种可用于训练人脸识别深度神经网络的损失函数,属于计算机视觉领域。该方法适用于当前以深度神经网络为基础的人脸识别网络训练。在公开数据集上的实验表明,使用本发明作为损失函数训练得到的人脸识别网络具有较高的人脸识别准确率,在侧脸拍摄、强弱光照射等极端场景中也具有较强的人脸识别能力。
附图说明
图1为引入第一角度裕量和第二角度裕量所得损失函数的决策边界示意图。
图2为本发明的决策边界示意图。
图3为测试准确率与裕量大小关系图。
具体实施方式
下面结合附图和具体实施方式对本发明做进一步详细描述:
本发明提出了一种基于Sigmoid函数的分类层监督,旨在为人脸识别网络训练过程中的损失函数引入更强的非线性表达能力,从而提高人脸识别网络的人脸识别准确率。
本发明的具体实施方式如下:
步骤1,以原始的Softmax损失函数作为本发明的基础。Softmax损失函数一般用于分类网络中,作为分类层的监督。使用Softmax损失函数训练得到的分类网络可以有效处理二分类和多分类等各种常见图像分类问题。因此,Softmax损失函数是当前各种不同类型的分类层监督的设计基础。原始的Softmax损失函数的一般形式为:
其中,N表示batchsize的大小,n表示总共的类别数目。以Softmax在二分类问题中的应用为例,决策边界上的样本点被分类器划分为两个类别的概率需要相等。为了表达简洁,以下将列向量的转置省略不写。对于某一样本x而言,它被Softmax分类器划分为类别1的概率为:
被划分为类别2的概率为:
上式W1,W2和b1,b2分别表示对应于不同类别的权重。决策边界将使得P1=P2,因此可以得到二分类问题中Softmax的决策边界如下:
可以发现,Softmax损失函数的决策边界是线性的,使用其作为分类层监督缺少一定的非线性表达能力。
步骤2,在原始Softmax损失函数的基础上引入第一角度裕量和第二角度裕量。
步骤2.1,在原始Softmax损失函数的基础上引入第一角度裕量,第一角度裕量直接作用于特征夹角,并归一化特征。归一化特征可以将光照因素建模到神经网络中,从而减小数据预处理部分的压力。第一角度裕量的引入可以使得不同物体之间的类内距离更加紧凑,类间距离更加远离。经过上述操作后的Softmax损失函数的一般形式为:
步骤2.2,在原始Softmax损失函数的基础上引入第二角度裕量,第二角度裕量直接作用于特征夹角,并归一化特征和权重向量。归一化特征可以将光照因素建模到神经网络中,从而减小数据预处理部分的压力。归一化权重向量可以减小除特征本身外的因素对高维向量分类的影响。第二角度裕量的引入可以使得不同物体之间的类内距离更加紧凑,类间距离更加远离。经过上述操作后的Softmax损失函数的一般形式为:
步骤3,为步骤2得到的损失函数分别引入Sigmoid非线性变换。Sigmoid函数是一种典型的非线性函数,其一般形式为:
其一阶导数的一般形式为:
对步骤2得到的损失函数引入Sigmoid非线性变换后,得到的损失函数分别为:
可以发现,Sigmoid函数在实数域0处具有较大的一阶导数,在实数域正负无穷处导数为0。Sigmoid函数可以为以Softmax损失函数为基础的分类层监督引入更强的非线性表达能力。图1给出了步骤2所得到的损失函数的决策边界,可以发现引入第一角度裕量得到的损失函数在向量的夹角较小时的分辨能力较弱,引入第二角度裕量得到的损失函数也只是在向量夹角的余弦域具有线性区分能力。图2给出了Sigmoid非线性变换后的步骤2中的损失函数的决策边界,可以发现,Sigmoid非线性变换的引入增强了损失函数在向量夹角为0处的区分能力。
步骤4,将已经引入了Sigmoid非线性变换后的步骤3得到的损失函数进行加权组合,得到本发明的基于Sigmoid函数的分类层监督。所述基于Sigmoid函数的分类层监督最终的一般形式为:
其中,λ为加权系数,m1和m2为裕量,在本发明中取m1=4。
步骤5,根据步骤4得到的基于Sigmoid函数的分类层监督,在训练数据集上训练不同的人脸识别网络,直到网络收敛,形成训练好的人脸识别网络。使用MegaFace人脸识别数据集对以本发明为损失函数的人脸识别网络进行训练,并且在训练时关注损失函数的变化和不同训练轮数时训练集和验证集上的准确率,在网络刚达到收敛时停止训练,防止欠拟合和过拟合。
步骤6,将收敛的网络在测试数据集上进行测试。使用训练好的本发明在MegaFace、LFW、YTF、CFP、AgeDB人脸识别数据集上进行测试,测试流程需要符合上述人脸识别数据集的标准测试协议。
步骤7,将训练好的人脸识别网络用于人脸识别。
本实施例中还根据人脸识别准确率这一指标,分析比较本发明相较于其他人脸识别分类层监督的优势。图3给出了本发明中测试准确率和裕量之间的关系,可以发现,当第二裕量m2为0.35时,使用本发明作为损失函数训练得到的人脸识别网络具有最高的人脸识别准确率。为了探究本发明与其他分类层监督的性能差异,使用ResNet50为特征提取网络,在MegaFace,LFW和YTF人脸识别数据集上测试使用本发明和其他不同分类层监督训练得到的人脸识别网络的人脸识别准确率,实验结果如表1所示,可以发现本发明在上述三种数据集上较其他的分类层监督有着最高的人脸识别准确率。为了探究本发明在侧脸拍摄、强弱光照射等极端场景下的性能,使用ResNet101作为特征提取网络,在CFP和AgeDB人脸识别数据集上测试使用本发明和其他不同分类层监督训练得到的人脸识别网络的人脸识别准确率,实验结果如表2所示,可以发现本发明在上述两种数据集上较其他的分类层监督有着最高的人脸识别准确率。
表1不同监督下人脸识别准确率(%)
表2不同监督下CFP和AgeDB数据集上人脸识别准确率(%)
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。
Claims (6)
1.一种基于Sigmoid函数的分类层监督用于人脸识别的方法,其特征在于,包括如下步骤:
步骤1,以原始的Softmax损失函数作为分类层监督的基础;
原始的Softmax损失函数的一般形式为:
其中,N表示batchsize的大小,n表示总共的类别数目;
步骤2,在原始Softmax损失函数的基础上引入角度裕量,角度裕量直接作用于特征夹角,并归一化特征;
步骤3,为步骤2得到的损失函数引入Sigmoid非线性变换,得到基于Sigmoid函数的分类层监督;
步骤4,根据步骤3得到的基于Sigmoid函数的分类层监督,在训练数据集上训练人脸识别网络,直到网络收敛,形成训练好的人脸识别网络;
步骤5,将训练好的人脸识别网络用于人脸识别。
5.根据权利要求2所述一种基于Sigmoid函数的分类层监督用于人脸识别的方法,其特征在于,第一角裕量m1=4。
6.根据权利要求3所述一种基于Sigmoid函数的分类层监督用于人脸识别的方法,其特征在于,第二角裕量m2=0.35。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110397616.7A CN113111781A (zh) | 2021-04-14 | 2021-04-14 | 一种基于Sigmoid函数的分类层监督用于人脸识别的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110397616.7A CN113111781A (zh) | 2021-04-14 | 2021-04-14 | 一种基于Sigmoid函数的分类层监督用于人脸识别的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113111781A true CN113111781A (zh) | 2021-07-13 |
Family
ID=76716850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110397616.7A Pending CN113111781A (zh) | 2021-04-14 | 2021-04-14 | 一种基于Sigmoid函数的分类层监督用于人脸识别的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113111781A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033994A (zh) * | 2018-07-03 | 2018-12-18 | 辽宁工程技术大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN111339810A (zh) * | 2019-04-25 | 2020-06-26 | 南京特沃斯高科技有限公司 | 一种基于高斯分布的低分辨率大角度人脸识别方法 |
CN112232184A (zh) * | 2020-10-14 | 2021-01-15 | 南京邮电大学 | 一种基于深度学习和空间转换网络的多角度人脸识别方法 |
CN112381178A (zh) * | 2020-12-07 | 2021-02-19 | 西安交通大学 | 一种基于多损失特征学习的医学影像分类方法 |
CN112597867A (zh) * | 2020-12-17 | 2021-04-02 | 佛山科学技术学院 | 戴口罩人脸识别方法、系统、计算机设备及存储介质 |
-
2021
- 2021-04-14 CN CN202110397616.7A patent/CN113111781A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109033994A (zh) * | 2018-07-03 | 2018-12-18 | 辽宁工程技术大学 | 一种基于卷积神经网络的人脸表情识别方法 |
CN111339810A (zh) * | 2019-04-25 | 2020-06-26 | 南京特沃斯高科技有限公司 | 一种基于高斯分布的低分辨率大角度人脸识别方法 |
CN112232184A (zh) * | 2020-10-14 | 2021-01-15 | 南京邮电大学 | 一种基于深度学习和空间转换网络的多角度人脸识别方法 |
CN112381178A (zh) * | 2020-12-07 | 2021-02-19 | 西安交通大学 | 一种基于多损失特征学习的医学影像分类方法 |
CN112597867A (zh) * | 2020-12-17 | 2021-04-02 | 佛山科学技术学院 | 戴口罩人脸识别方法、系统、计算机设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108764207B (zh) | 一种基于多任务卷积神经网络的人脸表情识别方法 | |
KR100543707B1 (ko) | 서브그룹별 pca 학습을 이용한 얼굴인식방법 및 장치 | |
CN110084610B (zh) | 一种基于孪生神经网络的网络交易欺诈检测系统 | |
US7362892B2 (en) | Self-optimizing classifier | |
CN107392241B (zh) | 一种基于加权列抽样XGBoost的图像目标分类方法 | |
CN108985268B (zh) | 基于深度迁移学习的归纳式雷达高分辨距离像识别方法 | |
Khalil-Hani et al. | A convolutional neural network approach for face verification | |
Zois et al. | A comprehensive study of sparse representation techniques for offline signature verification | |
CN105760821A (zh) | 基于核空间的分类聚集稀疏表示的人脸识别方法 | |
CN109344856B (zh) | 一种基于多层判别式特征学习的脱机签名鉴别方法 | |
CN113489685B (zh) | 一种基于核主成分分析的二次特征提取及恶意攻击识别方法 | |
CN110459225A (zh) | 一种基于cnn融合特征的说话人辨认系统 | |
CN112183659B (zh) | 一种基于卷积神经网络的未知信号辐射源识别方法 | |
CN111783534A (zh) | 一种基于深度学习的睡眠分期方法 | |
CN106971180A (zh) | 一种基于语音字典稀疏迁移学习的微表情识别方法 | |
CN112364197B (zh) | 一种基于文本描述的行人图像检索方法 | |
CN110765285A (zh) | 基于视觉特征的多媒体信息内容管控方法及系统 | |
Huang et al. | Design and Application of Face Recognition Algorithm Based on Improved Backpropagation Neural Network. | |
CN105631478A (zh) | 基于稀疏表示字典学习的植物分类方法 | |
CN114612968A (zh) | 一种基于卷积神经网络的唇纹识别方法 | |
Wu et al. | Siamese network-based open set identification of communications emitters with comprehensive features | |
CN113179250B (zh) | web未知威胁检测方法及系统 | |
CN110110673B (zh) | 一种基于双向2dpca和级联前向神经网络的人脸识别方法 | |
Zeng et al. | Term-based pooling in convolutional neural networks for text classification | |
CN113111781A (zh) | 一种基于Sigmoid函数的分类层监督用于人脸识别的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |