CN107679501B - 一种基于标签自提纯的深度学习方法 - Google Patents

一种基于标签自提纯的深度学习方法 Download PDF

Info

Publication number
CN107679501B
CN107679501B CN201710947264.1A CN201710947264A CN107679501B CN 107679501 B CN107679501 B CN 107679501B CN 201710947264 A CN201710947264 A CN 201710947264A CN 107679501 B CN107679501 B CN 107679501B
Authority
CN
China
Prior art keywords
data set
purification
deep
scale
purified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710947264.1A
Other languages
English (en)
Other versions
CN107679501A (zh
Inventor
马文亚
刘昕
袁基睿
朱鹏飞
山世光
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seetatech Beijing Technology Co ltd
Original Assignee
Seetatech Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seetatech Beijing Technology Co ltd filed Critical Seetatech Beijing Technology Co ltd
Priority to CN201710947264.1A priority Critical patent/CN107679501B/zh
Publication of CN107679501A publication Critical patent/CN107679501A/zh
Application granted granted Critical
Publication of CN107679501B publication Critical patent/CN107679501B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation

Abstract

本发明公开了一种基于标签自提纯的深度学习方法,其整体步骤为:构建大规模的带有标签噪声的真实条件下的人脸数据集;使用小规模的干净数据集训练深度神经网络得到深度人脸识别模型;使用训练得到的深度人脸识别模型对数据集进行提取特征操作;利用提纯算法迭代地对数据集进行提纯操作;根据提纯后的数据集的测试结果获得最终的提纯后的研究用数据集。本发明可以利用大规模带有标签噪声的人脸数据集,进而利用无监督的提纯方法迭代地进行数据的自提纯,然后将提纯后的数据用于构建大规模的数据集,从而在构建了一个大规模数据集的基础上可以训练得到具有理想精度的深度人脸识别模型进行相关的任务或应用。

Description

一种基于标签自提纯的深度学习方法
技术领域
本发明涉及一种学习方法,尤其涉及一种基于标签自提纯的深度学习方法。
背景技术
基于卷积神经网络的深度人脸识别方法已经成为人脸识别领域的最有效的方法。但是这种方法严重依赖于大规模且标签精确的人脸数据集,而大规模的干净数据是很难获取的;同时,带有标签噪声的大规模数据集是比较方便获取的,但是直接使用这种带有标签噪声的数据进行模型的训练并不能得到性能满意的深度模型。因此,如何有效利用大规模的标签噪声数据进行模型的训练是一个亟待解决的问题。
目前,基于深度学习的标签噪声数据学习方法主要有:
1)标签噪声鲁棒算法:设计新型损失函数来对标签噪声数据进行直接训练,从而直接利用大规模标签噪声数据训练相关模型。该方法仍然会受到标签噪声数据的影响,并且这种方法只是在防止噪声标签过拟合时作用明显,另外当标签噪声数据在整个训练集中所占比例较高时,算法的性能并不能达到理想要求。
2)基于半监督的标签传播算法:利用正确的标签去分类未标注或者标注错误的样本以此来进行标签噪声样本的处理,进而将处理后的数据进行模型的训练。但是这种方法在实际应用中需要计算成对样本间的距离,因为算法具有平方复杂度所以无法将其用于处理大规模数据;同时这种方法前期需要人工的标注或者挑选,需要耗费一定的时间等资源,不具有快捷性和自动性。
发明内容
为了解决上述技术所存在的不足之处,本发明提供了一种基于标签自提纯的深度学习方法。
为了解决以上技术问题,本发明采用的技术方案是:一种基于标签自提纯的深度学习方法,其整体步骤为:
步骤一、构建大规模的带有标签噪声的真实条件下的人脸数据集;
步骤二、使用小规模的干净数据集训练深度神经网络得到深度人脸识别模型;
步骤三、使用训练得到的深度人脸识别模型对数据集进行提取特征操作;
步骤四、利用提纯算法迭代地对数据集进行提纯操作;
步骤五、根据提纯后的数据集的测试结果获得最终的提纯后的研究用数据集。
进一步的,步骤一中构建人脸数据集的方法至少包括以下一种:
Ⅰ、使用爬取手段直接从互联网上爬取数据;
Ⅱ、利用相机或者其他拍摄设备获取数据;
Ⅲ、使用上述两个方法直接或者间接获取数据。
进一步的,步骤二中得到深度人脸识别模型的具体方法为:
a、对小规模的具有精确标签的人脸数据集进行五点对齐预处理,并且要保证数据的规模;
b、使用深度卷积神经网络进行模型的训练;
c、将训练得到的深度人脸识别模型在一些经典测试集上进行测试,观察测试所得正确率。
进一步的,步骤三中对数据集进行提取特征操作的具体方法为:
a、通过深度学习平台或另外实现的方式提供提取特征时的前向算法;
b、对完整的数据集进行标准的五点对齐预处理;
c、提取完整的人脸数据集的深度特征;
d、将提取到的深度特征按类别进行分类。
进一步的,步骤四中利用提纯算法迭代地对数据集进行提纯操作的具体方法为:
a、使用提纯算法利用数据集的深度特征对数据集进行提纯操作;
b、利用提纯后的数据集使用深度卷积神经网络训练模型;
c、对提纯后的数据集再次提取深度特征,进行再次提纯;
d、对数据集进行迭代提纯直到提纯后的数据集足够干净,以训练出精度高的深度模型。
进一步的,步骤五中获得最终的提纯后的研究用数据集的具体方法为:
a、对于每次的提纯后的数据集进行测试;
b、选取模型性能最高的对应的提纯结果为最终的数据集;
c、最终提纯后的数据集适用于人脸研究工作。
本发明将深度学习技术与数据提纯方法配合使用,形成了标签自提纯的深度学习方法。该方法利用深度模型提取大规模标签噪声数据集的深度特征,进而利用单类分类算法进行数据的迭代式的自提纯,可以明显降低提纯后数据中标签噪声数据所占的比例,使提纯后的数据集训练出的模型性能极大的提升,从而满足实际应用或研究需要。
本发明相比其他方法实现了大规模标签噪声数据集的提纯,可以获得较为纯净的大规模数据集进行相关的实验研究。该方法自动的实现数据提纯,不需要人工配合,同时该方法的计算复杂度远小于半监督策略,并且利用提纯后的数据集训练的深度模型的性能相比标签噪声鲁棒算法精度更高。本发明可以应用于人脸识别、物体识别等多个领域。
附图说明
图1为本发明的详细流程图。
图2为本发明的简略流程图。
图3为本发明的迭代提纯模块流程图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1-3所示,本发明的具体步骤为:
(1)数据准备阶段
首先寻找小规模的标签精确的人脸数据集CASIA-WebFace和大规模的标签噪声人脸数据集MS-Celeb-1M(相关文献中已公示),然后对数据集中的所有人脸图像进行5点位置的对齐,将人脸图像归一化为256*256像素。
(2)深度模型的训练
利用预处理后的小规模的标签精确的人脸数据集CASIA-WebFace,使用深度神经网络VIPLFaceNet进行模型的训练,总的迭代次数是120000,bach_size设置为128,基础学习率为0.06,学习率依多项式形式下降,训练得到一个精度足够高的深度模型,记为Modelpre
(3)深度特征提取
利用训练得到的深度模型Modelpre对带有大比例标签噪声的大规模人脸数据集MS-Celeb-1M进行深度特征的提取,深度特征维度为2048,并将提取后的特征按类别进行划分,方便后续数据提纯。
(4)数据自提纯
利用无监督的单类分类算法对深度特征进行无监督单类分类提纯操作,该算法联合学习了标签噪声人脸数据集中样本的类别标签和基于最大间隔准则的单类分类。可以对标签噪声数据进行有效提纯,获得较为干净的大规模人脸数据集。记录提纯后的数据集中间结果。
提纯算法原理:
对于标签噪声数据集
Figure BDA0001432008960000041
目标是找到一个类似于OC-SVM的分类函数
Figure BDA0001432008960000042
借助一个核函数
Figure BDA0001432008960000043
来优化再生核希尔伯特空间,最终的目标分类函数就变成了:
Figure BDA0001432008960000051
其中,αi是基于κ(·,xi)的扩张系数。同时对于输入数据
Figure BDA0001432008960000052
定义标签
Figure BDA0001432008960000053
c+是一个正值,分配给类内干净数据,c-是一个负值,分配给类内标签噪声样本。那么y=[y1,…,yn]T是Y的向量表示形式。
模型的目标是最小化下面的公式二:
Figure BDA0001432008960000054
其中γ12>0是控制模型的两个参数。
Figure BDA0001432008960000055
是流形正则化。为了构建
Figure BDA0001432008960000056
使用相邻图G,其亲和力矩阵的定义为:
Figure BDA0001432008960000057
D(,)是
Figure BDA0001432008960000058
上的距离,
Figure BDA0001432008960000059
集合包含了
Figure BDA00014320089600000510
中xi的k个最近邻的索引。然后定义对角矩阵D,其对角线元素
Figure BDA00014320089600000511
计算拉普拉斯矩阵L=D-W[2]。可得流形正则化等式可写作:
Figure BDA00014320089600000512
向量
Figure BDA00014320089600000513
是公式一中函数f的实现形式。为了方便表示,定义系数向量
Figure BDA00014320089600000514
核矩阵
Figure BDA00014320089600000515
向量化的核映射
Figure BDA0001432008960000061
那么目标函数f可以写作f(x)=κ(x)和f(x)=Kα。
公式二中最后一部分
Figure BDA0001432008960000062
是为了最大化正样本间的平均间隔。因为缺少精确标签,所以本方法采用了平均间隔而不是像SVM或者OC-SVM那样考虑独立的间隔。最大化正样本间的平均间隔的策略是为了抑制负样本引起的偏差影响。为了防止无边界优化,通过||α||=1来限制
Figure BDA0001432008960000063
的范围。因此,sup{f(x)|1≤i≤n}=max1≤i≤n‖k(xi)‖。
结合公式四并且忽略常量||y||2,可以把公式二重写为:
Figure BDA0001432008960000064
||a||+代表向量||a||中正样本的数量。分配的新标签向量
Figure BDA0001432008960000065
和y的标签类型一样。函数Q是一个凸函数,可行解不是一个凸集,所以公式五需要对不同的部分分别优化。不同于其他的噪声清洗和单类学习方法,该模型没有过度强调正样本和负样本。此方法公平的处理正样本和负样本,通过标签(c+,c-)来优化标签分配
Figure BDA0001432008960000066
从而互相对比进行分类。
(5)中间结果测试
中间结果即使用提纯算法提纯后的数据集,将提纯后的数据集作为训练集,利用深度神经网络进行模型的训练,并将训练得到的模型Modeli在测试集LFW上进行测试,记录模型精度。
(6)重复步骤(3)至步骤(5)的操作,直到中间结果的模型精度不再提升,最终模型精度最高的中间结果即为提纯结果。
(7)得到提纯后的数据集MS和相对应的深度模型Modelfinal
(8)标签自提纯算法结束,提纯后的数据集可用于相关任务。
本发明所使用的算法伪代码如表1所示:
表1
Figure BDA0001432008960000071
本发明采用的实验数据集如表2所示:
表2
Figure BDA0001432008960000072
模型精度是结果比较如表3所示:
表3
训练集 LFW十折平均精度
MS-Celeb-1M 99.25%
MS 99.40%
本发明具有以下三个关键创造点:
一、利用深度模型提取图片深度特征;1)首先利用小规模的标签精确的人脸数据集训练深度神经网络,得到合适的深度人脸识别模型;2)利用训练好的深度模型对大规模标签噪声人脸数据集进行提取深度特征。技术效果:深度模型具有很理想的性能,深度特征相比人工特征能更好的表示人脸图像的特征。
二、利用单类分类算法对标签噪声数据进行无监督自动提纯,算法可以对数据集的每个类别进行单类分类以达到数据提纯目的;技术效果:利用提取的深度特征进行无监督单类分类,实现自动的标签噪声数据的提纯,标签噪声数据比例明显降低;
三、迭代提纯策略;1)将提纯后的数据集利用深度神经网络进行模型的训练,并在测试集上进行性能测试;2)假如模型性能有提升,则将提纯后的数据集作为待提纯的数据再次进行提纯操作,如此进行迭代提纯;技术效果:该策略对大规模标签噪声人脸数据进行迭代的提纯,使得标签噪声可以很好的被清除,实现标签噪声数据的提纯。
本发明与现有技术相比,其有益效果为:
(1)通过使用小规模的具有精确标签的干净数据集训练深度模型,方便获取更具有表示能力的待提纯数据集的深度特征,深度特征可以用于计算图片相似度等,方便数据提纯;
(2)使用无监督的单类分类算法对带有标签噪声的大规模人脸数据集进行提纯操作,这种标签自提纯的方法不需要人工标注等操作,而且简单快速,可以有效清除标签噪声数据,构建大规模的可以实际应用的数据集;
(3)通过使用迭代提纯的方法,不断对数据集进行提纯操作,保证提纯后的数据集尽可能的干净,标签噪声数据的比例尽可能的少,迭代式的提纯策略保证了比起标签自提纯的深度学习方法的有效性和高效性。
综上所述,本发明可以有效利用大规模带有标签噪声的人脸数据集,利用无监督的提纯方法迭代地进行数据的自提纯,然后将提纯后的数据用于构建大规模的数据集,此数据集可用于模型的训练或者其他方面的研究工作,从而在构建了一个大规模数据集的基础上可以训练得到具有理想精度的深度人脸识别模型进行相关的任务或应用。
上述实施方式并非是对本发明的限制,本发明也并不仅限于上述举例,本技术领域的技术人员在本发明的技术方案范围内所做出的变化、改型、添加或替换,也均属于本发明的保护范围。

Claims (3)

1.一种基于标签自提纯的深度学习方法,其特征在于:所述方法的整体步骤为:
步骤一、构建大规模的带有标签噪声的真实条件下的人脸数据集;
步骤二、使用小规模的干净数据集训练深度神经网络得到深度人脸识别模型;其中,小规模的干净数据集为人脸数据集CASIA-WebFace;
得到深度人脸识别模型的具体方法为:
a、对小规模的具有精确标签的人脸数据集进行五点对齐预处理,并且要保证数据的规模;
b、使用深度卷积神经网络进行模型的训练;
c、将训练得到的深度人脸识别模型在一些经典测试集上进行测试,观察测试所得正确率;
步骤三、使用训练得到的深度人脸识别模型对数据集进行提取特征操作;
对数据集进行提取特征操作的具体方法为:
a、通过深度学习平台或另外实现的方式提供提取特征时的前向算法;
b、对完整的数据集进行标准的五点对齐预处理;
c、提取完整的人脸数据集的深度特征;
d、将提取到的深度特征按类别进行分类;
步骤四、利用提纯算法迭代地对数据集进行提纯操作;
利用提纯算法迭代地对数据集进行提纯操作的具体方法为:
a、使用提纯算法利用数据集的深度特征对数据集进行提纯操作;
b、利用提纯后的数据集使用深度卷积神经网络训练模型;
c、对提纯后的数据集再次提取深度特征,进行再次提纯;
d、对数据集进行迭代提纯直到提纯后的数据集足够干净,以训练出精度高的深度模型;
步骤五、根据提纯后的数据集的测试结果获得最终的提纯后的研究用数据集。
2.根据权利要求1所述的基于标签自提纯的深度学习方法,其特征在于:所述步骤一中构建人脸数据集的方法至少包括以下一种:
Ⅰ、使用爬取手段直接从互联网上爬取数据;
Ⅱ、利用相机或者其他拍摄设备获取数据;
Ⅲ、使用上述两个方法直接或者间接获取数据。
3.根据权利要求1所述的基于标签自提纯的深度学习方法,其特征在于:所述步骤五中获得最终的提纯后的研究用数据集的具体方法为:
a、对于每次的提纯后的数据集进行测试;
b、选取模型性能最高的对应的提纯结果为最终的数据集;
c、最终提纯后的数据集适用于人脸研究工作。
CN201710947264.1A 2017-10-12 2017-10-12 一种基于标签自提纯的深度学习方法 Active CN107679501B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710947264.1A CN107679501B (zh) 2017-10-12 2017-10-12 一种基于标签自提纯的深度学习方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710947264.1A CN107679501B (zh) 2017-10-12 2017-10-12 一种基于标签自提纯的深度学习方法

Publications (2)

Publication Number Publication Date
CN107679501A CN107679501A (zh) 2018-02-09
CN107679501B true CN107679501B (zh) 2021-04-30

Family

ID=61140524

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710947264.1A Active CN107679501B (zh) 2017-10-12 2017-10-12 一种基于标签自提纯的深度学习方法

Country Status (1)

Country Link
CN (1) CN107679501B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190521B (zh) * 2018-08-17 2022-03-04 北京亮亮视野科技有限公司 一种基于知识提纯的人脸识别模型的构建方法及应用
CN109711252A (zh) * 2018-11-16 2019-05-03 天津大学 一种多人种的人脸识别方法
WO2021038298A2 (en) 2019-08-29 2021-03-04 PXL Vision AG Id verification with a mobile device
CN112101328A (zh) * 2020-11-19 2020-12-18 四川新网银行股份有限公司 一种深度学习中识别并处理标签噪声的方法
CN112257855B (zh) * 2020-11-26 2022-08-16 Oppo(重庆)智能科技有限公司 一种神经网络的训练方法及装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104463172A (zh) * 2014-12-09 2015-03-25 中国科学院重庆绿色智能技术研究院 基于人脸特征点形状驱动深度模型的人脸特征提取方法
CN104504405A (zh) * 2014-12-02 2015-04-08 苏州福丰科技有限公司 一种三维人脸的识别方法
CN106557743A (zh) * 2016-10-26 2017-04-05 桂林电子科技大学 一种基于fecnn的人脸特征提取系统及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015180042A1 (en) * 2014-05-27 2015-12-03 Beijing Kuangshi Technology Co., Ltd. Learning deep face representation
JP6754619B2 (ja) * 2015-06-24 2020-09-16 三星電子株式会社Samsung Electronics Co.,Ltd. 顔認識方法及び装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104504405A (zh) * 2014-12-02 2015-04-08 苏州福丰科技有限公司 一种三维人脸的识别方法
CN104463172A (zh) * 2014-12-09 2015-03-25 中国科学院重庆绿色智能技术研究院 基于人脸特征点形状驱动深度模型的人脸特征提取方法
CN106557743A (zh) * 2016-10-26 2017-04-05 桂林电子科技大学 一种基于fecnn的人脸特征提取系统及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于LBP和深度学习的人脸特征提取;王芸芸;《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》;20170115;第2017年卷(第1期);第5.4-5.5节 *
基于深度学习的人脸特征提取与匹配;归喆;《万方学位论文库》;20161103;全文 *
部分遮挡目标的稳健局部特征点提取方法;邱鹏等;《现代电子技术》;20131115;第36卷(第22期);76-80 *

Also Published As

Publication number Publication date
CN107679501A (zh) 2018-02-09

Similar Documents

Publication Publication Date Title
CN107679501B (zh) 一种基于标签自提纯的深度学习方法
CN108399406B (zh) 基于深度学习的弱监督显著性物体检测的方法及系统
CN112069921A (zh) 一种基于自监督知识迁移的小样本视觉目标识别方法
CN112036447B (zh) 零样本目标检测系统及可学习语义和固定语义融合方法
CN109543693B (zh) 基于正则化标签传播的弱标注数据降噪方法
CN114038037B (zh) 基于可分离残差注意力网络的表情标签修正和识别方法
CN110675405B (zh) 基于注意力机制的one-shot图像分割方法
CN106601235A (zh) 一种半监督多任务特征选择的语音识别方法
CN113111716A (zh) 一种基于深度学习的遥感影像半自动标注方法和装置
CN112766378A (zh) 一种专注细粒度识别的跨域小样本图像分类模型方法
CN110598022B (zh) 一种基于鲁棒深度哈希网络的图像检索系统与方法
CN115797808A (zh) 一种无人机巡检缺陷图像的识别方法、系统、装置及介质
CN115424288A (zh) 一种基于多维度关系建模的视觉Transformer自监督学习方法及系统
CN114399763A (zh) 一种单样本与小样本微体古生物化石图像识别方法及系统
CN113705215A (zh) 一种基于元学习的大规模多标签文本分类方法
CN114329031A (zh) 一种基于图神经网络和深度哈希的细粒度鸟类图像检索方法
CN115908955B (zh) 基于梯度蒸馏的少样本学习的鸟类分类系统、方法与装置
CN111414863A (zh) 一种增强型集成遥感影像分类方法
CN111368637A (zh) 一种基于多掩模卷积神经网络的搬运机器人识别目标方法
CN116310335A (zh) 一种基于Vision Transformer的翼状胬肉病灶区域的分割方法
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
CN109919200B (zh) 一种基于张量分解和域适应的图像分类方法
CN106203384B (zh) 一种多分辨率的细胞分裂识别方法
CN116824640B (zh) 基于mt与三维残差网络的腿部识别方法、系统、介质和设备
CN116503674B (zh) 一种基于语义指导的小样本图像分类方法、装置及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant