CN112766423A - 人脸识别模型的训练方法、装置、计算机设备及存储介质 - Google Patents
人脸识别模型的训练方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN112766423A CN112766423A CN202110277869.0A CN202110277869A CN112766423A CN 112766423 A CN112766423 A CN 112766423A CN 202110277869 A CN202110277869 A CN 202110277869A CN 112766423 A CN112766423 A CN 112766423A
- Authority
- CN
- China
- Prior art keywords
- samples
- sample set
- training
- label
- labeled
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012549 training Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000004590 computer program Methods 0.000 claims description 17
- 238000007477 logistic regression Methods 0.000 claims description 11
- 238000005516 engineering process Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000013528 artificial neural network Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2155—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及生物识别技术,尤其涉及人脸识别,提供了一种人脸识别模型的训练方法、装置、计算机设备及可读存储介质,通过在带标签样本集上进行监督训练得到预训练模型;根据预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集;对去重无标签样本集的样本分配伪标签得到伪标签样本集;根据带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。本申请通过针对重叠样本的相关处理,降低了标签噪音的影响,提高了得到的训练模型的准确性,可以更有利地利用无标签样本提升得到的训练模型的性能。本申请还涉及区块链技术,得到的预测模型可以存储于区块链中。
Description
技术领域
本申请涉及生物识别技术,尤其涉及人脸识别领域,具体涉及一种人脸识别模型的训练方法、装置、计算机设备及可读存储介质。
背景技术
半监督学习是模式识别和机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。半监督学习的特点是同时使用未标记的无标签样本以及标记的带标签样本来进行模式识别训练。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性,因此,半监督学习正越来越受到人们的重视。
例如,人脸识别应用在大规模标签数据中的应用已经较为成熟,但数据的标签需要人工注释,成本高、效率低。因此,利用无标签样本来进一步提升人脸识别的性能成为当前人脸识别的研究重点。在大规模的人脸识别中,利用无标签样本和带标签样本一起对人脸识别模型进行训练时,往往会遇到部分无标签样本与带标签样本来自同一身份的人情况,从而导致明显的标记噪音,影响学习得到的人脸识别模型的性能。
发明内容
本申请提供了一种人脸识别模型的训练方法、装置、计算机设备及可读存储介质,能够在训练中利用无标签样本集进行训练,且可以降低无标签样本集与带标签样本集之间样本重叠造成的标签噪音,提高了训练的准确性,可提高训练所得的人脸识别模型的性能。
第一方面,本申请提供了一种人脸识别模型的训练方法,其特征在于,所述方法包括:
在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本;
根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本;
对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;
根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
第二方面,提供了一种人脸识别模型的训练装置,其特征在于,所述装置包括:
预训练模块,用于在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本;
样本去重模块,用于根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本;
伪标签分配模块,用于对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;
识别模型训练模块,用于根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
第三方面,本申请提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现上述的人脸识别模型的训练方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,若所述计算机程序被处理器执行,实现上述的人脸识别模型的训练方法。
本申请公开了一种人脸识别模型的训练方法、装置、计算机设备及可读存储介质,通过在带标签样本集上进行监督训练得到预训练模型;根据所述预训练模型从所述无标签样本集中剔除重叠样本得到去重无标签样本集;对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练得到预测模;通过针对重叠样本的相关处理,降低了标签噪音的影响,提高了得到的预测模型的准确性,可以更有利地利用无标签样本提升得到的预测模型的性能。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一实施例提供的一种人脸识别模型的训练方法的流程示意图;
图2是本申请一实施例提供的一种人脸识别模型的训练装置的结构示意框图;
图3是本申请一实施例提供的一种计算机设备的结构示意框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。另外,虽然在装置示意图中进行了功能模块的划分,但是在某些情况下,可以以不同于装置示意图中的模块划分。
本申请的实施例提供了一种人脸识别模型的训练方法、装置、计算机设备及可读存储介质,利用无标签样本进行训练时可降低样本重叠(无标签样本集的某样本与带标签样本集的某样本的对象相同)带来的标签噪音的影响,提高了得到的预测模型的准确性,可以更有利地利用无标签样本提升得到的预测模型的性能。示例性的,在大规模的人脸识别中,利用无标签样本与带标签样本一起训练时,往往会遇到部分无标签样本与带标签样本来自同一身份的人情况,即出现了上述的重叠样本,此时则可以根据本申请实施例的人脸识别模型的训练方法,降低样本重叠带来的标签噪音的影响,提升人脸识别模型的性能。
下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参阅图1,图1是本申请实施例提供的一种人脸识别模型的训练方法的示意流程图。
如图1所示,该人脸识别模型的训练方法可以包括以下步骤S110-步骤S140。
步骤S110、在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本。
已被标记标签的人脸样本可以通过在人脸图像上标记标签得到,例如,黄某的一张人脸图像,被标记了“黄某”的标签,则可作为带标签样本集中的一个样本。
监督训练中,以带标签样本集中样本的人脸样本作为监督训练模型的输入,对应地,以该人脸样本被标记的标签作为监督训练模型的期望输出,对监督模型进行训练得到预训练模型,预训练模型可用于得到其输入的预测结果,例如在预训练模型中输入人脸图像,在预训练模型的输出得到该人脸图像的预测的标签。例如,以带标签样本集中样本的人脸样本作为人工神经网络的输入,对应地,以该人脸样本被标记的标签作为人工神经网络的期望输出,训练中使用的都是被标记的样本,输入对应的期望输出都是已知的,因此这是一种监督训练,人工神经网络通过训练对人脸样本(输入)和标签(期望输出)之间的关系进行学习,得到预训练模型,预训练模型可根据学习到的人脸样本和标签的关系预测输入的人脸图像的标签。比如,输入人工神经网络中的带标签样本集的样本包括一张标记了“黄某”的标签的人脸样本,将黄某没有标记标签的另一张人脸样本输入预训练模型,在预训练模型的输出可得到预测的标签为“黄某”。当然,预训练模型不限于通过人工神经网络训练得到,也可通过其他监督训练方法进行训练,例如支持向量机、最近邻居法、高斯混合模型等。
步骤S120、根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本。
相同对象,指不同人脸样本所对应的人为同一个。例如,黄某的一幅人脸图像被标记标签后作为带标签样本集中的样本a,黄某的另一幅未被标记任何标签的人脸图像成为无标签样本集中的样本b,则样本b与样本a有相同对象,样本b为重叠样本。
由于重叠样本与带标签样本集的样本有相同对象,重叠样本在预训练模型上有较高的置信度,因此,可以将在预训练模型上有较高置信度的无标签样本集的样本判断为重叠样本,从而在无标签样本集中剔除重叠样本。
在一些实施方式中,步骤S120具体包括步骤S121-步骤S123:
S121、基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,所述重叠置信度用于指示所述样本与所述带标签样本集的人脸样本有相同对象的置信度。
可以理解的,由于重叠样本与带标签样本集的样本有相同对象,重叠样本具有很高的概率能被预训练模型准确预测,因此,可以根据所述预训练模型的预测结果得到所述重叠置信度,示例性的,步骤121具体包括步骤S121a及步骤S121b:
S121 a、将所述无标签样本集的样本输入所述预训练模型,得到所述预训练模型对应所述样本的预测结果,所述预测结果包括所述带标签样本集中人脸样本的不同标签对应的置信度;
S121b、根据所述不同标签对应的置信度,确定所述无标签样本集的样本的重叠置信度。
示例性的,将所述不同标签对应的置信度中最高的置信度确定为所述无标签样本集的样本的重叠置信度。
示例性的,所述预训练模型包括逻辑回归分类器,所述逻辑回归分类器用于通过逻辑回归计算所述带标签样本集中人脸样本的不同标签被匹配至所述预训练模型的输入的置信度,将置信度最高的标签确定为预测的标签。所述预测的标签对应的置信度为所述无标签样本集的样本的重叠置信度。
归一化指数函数(softmax)分类器是机器学习模型中常用的分类器之一,但在大规模的人脸识别中往往会面对海量标签,面对海量标签时归一化指数函数的归一化过程会导致最终得到的标签对应的置信度为较小的值。因此,预训练模型采用逻辑回归分类器,通过逻辑回归计算以多个二分类解决多分类问题,从而避免在面对海量标签时得到的标签对应的置信度为较小的值。具体应用中,逻辑回归计算可以通过利用tensorflow中的logit函数实现。
S122、根据所述重叠置信度与预设的置信度阈值的比较结果判别所述无标签样本集的样本是否为重叠样本。
示例性的,将所述重叠置信度超过置信度阈值的无标签样本集的样本判断为重叠样本。置信度阈值可以根据经验设置一个较高的值,根据实际效果对置信度阈值进行调整。
S123、剔除所述无标签样本集中的所述重叠样本,得到去重无标签样本集。
同时使用带标签样本和无标签样本进行训练时,所述重叠样本会导致明显的标记噪音,影响学习得到的模型的准确性。通过本步骤将所述重叠样本剔除,降低了标记噪音,进而提高学习所得的模型的准确性。
步骤S130、对所述去重无标签样本集的样本分配伪标签得到伪标签样本集。
一较佳的实施例中,所述对去重无标签样本集的样本分配伪标签得到伪标签样本集,包括:对去重无标签样本集的样本进行聚类,根据所述聚类的结果,对所述去重无标签样本集的样本分配伪标签。聚类可采用适用于图像的聚类方法,如K均值聚类、图卷积网络(GCN)等,具体包括步骤S131-步骤S132。
步骤S131、对去重无标签样本集的样本进行聚类得到若干样本组,所述样本组包括聚为一类的样本。
由于图卷积网络非常适用于大规模的人脸聚类,优选的,通过图卷积网络实现聚类,步骤S131具体包括步骤S131a至步骤S131d:
步骤S131a、根据所述预训练模型对所述去重无标签样本集的所有样本分别提取样本特征。
示例性的,所述预训练模型包括用于提取其输入的特征的特征层。例如,通过人工神经网络进行训练得到的预训练模型,包括输入层、特征层及分类器层,输入层用于获取输入,特征层用于提取输入的特征并将提取的特征传送至分类器层,分类器层根据特征层提取的特征进行分类计算得到预测结果,则在该模型的特征层可以获取对该模型的输入提取的特征。将所述去重无标签样本集的样本作为所述预训练模型的输入,通过所述预训练模型的特征层获取样本特征。
步骤S131b、根据去重无标签样本集中所有样本的样本特征,通过图卷积网络在无标签样本集的所有样本上构建最近邻图(nearest-neighbor graph)。
步骤S131c、根据边缘权重阈值和所述最近邻图的边缘权重,确定所述最近邻图的若干连通分支(connected components),所述边缘权重阈值根据威布尔分布设置。
示例性的,通过在所述最近邻图的边缘权重上根据威布尔分布设置边缘权重阈值,得到所述最近邻图的若干所述连通分支。威布尔分布的公式为:
其中,k为形状参数,λ为比例参数,zi为初始阈值。初始阈值zi例如可以通过大津法获得。大津法是一种确定图像二值化分割阈值的方法,该方法中,假定最近邻图根据双模直方图包含两类像素(前景像素和背景像素),计算能将两类分开的最佳阈值,使得两类的类内方差最小;由于两两平方距离恒定,所以即两类的类间方差最大。
步骤S131d、根据所述连通分支将所述去重无标签样本集的样本分成若干组,得到所述若干样本组。
由于样本特征是通过预训练模型获取的,而预训练模型是通过带标签样本集的样本监督训练得到,因此,所述样本组是根据带标签样本得到的,图卷积网络实际上是以完全监督的方式进行训练的。
步骤S132、确定不同样本组各自不同的伪标签,得到伪标签样本集;所述样本组的伪标签与所述带标签样本集中样本的所有标签都不同。
示例性的,所述样本组的伪标签可以根据预设的伪标签分配规则确定,例如,所述预设的伪标签分配规则包括:所述样本组的伪标签由伪标签前缀及递增的数字构成,所述伪标签前缀与所述带标签样本集中样本的所有标签都不相同,比如,伪标签前缀为“无名”,第一个确定的所述样本组的伪标签为“无名1”,第二个确定的所述样本组的伪标签为“无名2”.....
步骤S140、根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
步骤S140中所述的人脸识别模型可以是已经训练过的模型,例如所述预训练模型;也可以是未训练过的原始模型,例如未经训练过的前馈神经网络。
一实施例中,人脸识别模型为未经训练过的前馈神经网络,前馈人工神经网络包括输入层、隐藏层及输出层,将所述带标签样本集及所述伪标签样本集中样本的人脸样本输入前馈神经网络的输入层,将人脸样本对应的标签或伪标作为前馈神经网络的期望输出,对前馈神经网络进行训练。训练过程中,前馈人工神经网络包括信号的前向传播和误差的反向传播两个过程。正向传播时,输入的人脸样本信号通过隐含层作用于输出层的节点,经过非线性变换,产生输出信号,若实际输出与期望输出不相符,则转入误差的反向传播过程,即将输出误差通过隐藏层向输入层逐层反传,并将误差分摊给各层所有单元,以从各层获得的误差信号作为调整各单元权值的依据。通过调整输入层节点与隐层节点的联接强度和隐层节点与输出节点的联接强度以及阈值,使误差沿梯度方向下降,经过反复学习训练,确定与最小误差相对应的网络参数(权值和阈值),完成对一个训练样本的学习。将所述带标签样本集及所述伪标签样本集的所有样本依次输入前馈神经网络中训练,经过训练的前馈神经网络即能对类似所带标签样本集及所述伪标签样本集的样本的输入自行处理输出误差最小的经过非线形转换的人脸识别结果。
所述预测模型,并不一定是最终输出的模型,若所述预测模型未达到理想性能,可在所述预测模型的基础上进一步进行训练,例如利用更多的样本对所述预测模型进行训练迭代,以得到性能理想的模型,当然,若所述预测模型已达到理想性能,也可以将所述预测模型作为最终输出的模型,用于人脸识别。
该人脸识别模型的训练方法同时根据标记过的样本(带标签样本集的样本)和未标记的样本(无标签样本集的样本)进行训练得到用于人脸识别的预测模型,因此该人脸识别模型的训练方法是一种半监督的训练方法。该人脸识别模型的训练方法中,通过针对重叠样本的相关处理,降低了标签噪音的影响,提高了得到的预测模型的准确性,可以更有利地利用未标记的样本提升得到的预测模型的性能。
需要强调的是,为进一步保证上述带标签样本集、无标签样本集以及所述预测模型的私密和安全性,上述带标签样本集、无标签样本集以及所述预测模型还可以存储于一区块链的节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
请参阅图2,图2是本申请一实施例提供的一种人脸识别模型的训练装置的示意图,该人脸识别模型的训练装置可以配置于服务器或终端中,用于执行前述的人脸识别模型的训练方法。
如图2所示,该人脸识别模型的训练装置,包括:预训练模块110、样本去重模块120、伪标签分配模块130、识别模型训练模型模块140。
预训练模块110,用于在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本。
样本去重模块120,用于根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本。
伪标签分配模块130,用于对所述去重无标签样本集的样本分配伪标签得到伪标签样本集。
识别模型训练模块,用于根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
示例性的,样本去重模块120包括置信度模块、重叠样本判别模块及重叠样本剔除模块:
置信度模块,用于基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,所述重叠置信度用于指示所述样本与所述带标签样本集的人脸样本有相同对象的置信度:
将所述无标签样本集的样本输入所述预训练模型,得到所述预训练模型对应所述样本的预测结果,所述预测结果包括所述带标签样本集中人脸样本的不同标签对应的置信度;
根据所述不同标签对应的置信度,确定所述无标签样本集的样本的重叠置信度;具体的,将所述不同标签对应的置信度中最高的置信度确定为所述无标签样本集的样本的重叠置信度。
重叠样本判别模块,用于根据所述重叠置信度与预设的置信度阈值的比较结果判别所述无标签样本集的样本是否为重叠样本。
重叠样本剔除模块,用于剔除所述无标签样本集中的所述重叠样本,得到去重无标签样本集。
示例性的,伪标签分配模块包括聚类模块及伪标签模块:
聚类模块,用于对去重无标签样本集的样本进行聚类得到若干样本组,所述样本组包括聚为一类的样本;
伪标签模块,用于确定不同样本组各自不同的伪标签,得到伪标签样本集;所述样本组的伪标签与所述带标签样本集中样本的所有标签都不同。
示例性的,聚类模块包括特征提取模块、构建邻图模块及分组模块:
特征提取模块、用于根据预训练模型对去重无标签样本集的所有样本分别提取样本特征;
构建邻图模块,用于根据去重无标签样本集中所有样本的样本特征,通过图卷积网络在合并样本集的所有样本上构建最近邻图;
分组模块,根据边缘权重阈值和所述最近邻图的边缘权重,确定所述最近邻图的若干连通分支,所述边缘权重阈值根据威布尔分布设置;根据所述连通分支将所述去重无标签样本集的样本分成若干组,得到所述若干样本组。
需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块、单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请的方法、装置可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
示例性地,上述的方法、装置可以实现为一种计算机程序的形式,该计算机程序可以在如图3所示的计算机设备上运行。
请参阅图3,图3是本申请实施例提供的一种计算机设备的示意图。该计算机设备可以是服务器或终端。
如图3所示,该计算机设备包括通过系统总线连接的处理器、存储器和网络接口,其中,存储器可以包括非易失性存储介质和内存储器。
非易失性存储介质可存储操作系统和计算机程序。该计算机程序包括程序指令,该程序指令被执行时,可使得处理器执行任意一种人脸识别模型的训练方法。
处理器用于提供计算和控制能力,支撑整个计算机设备的运行。
内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种人脸识别模型的训练方法方法。
该网络接口用于进行网络通信,如发送分配的任务等。本领域技术人员可以理解,该计算机设备的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
应当理解的是,处理器可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在一些实施方式中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本;根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本;对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
示例性的,处理器用于实现根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集时,实现:基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,所述重叠置信度用于指示所述样本与所述带标签样本集的人脸样本有相同对象的置信度;根据所述重叠置信度与预设的置信度阈值的比较结果判别所述无标签样本集的样本是否为重叠样本;剔除所述无标签样本集中的所述重叠样本,得到去重无标签样本集。
示例性的,处理器用于实现基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,所述重叠置信度用于指示所述样本与所述带标签样本集的样本有相同对象的置信度时,实现:将所述无标签样本集的样本输入所述预训练模型,得到所述预训练模型对应所述样本的预测结果,所述预测结果包括所述带标签样本集中人脸样本的不同标签对应的置信度;根据所述不同标签对应的置信度中最大的置信度,确定所述无标签样本集的样本的重叠置信度,具体的,将所述不同标签对应的置信度中最高的置信度确定为所述无标签样本集的样本的重叠置信度;所述预训练模型包括逻辑回归分类器,所述逻辑回归分类器用于通过逻辑回归计算所述带标签样本集中人脸样本的不同标签被匹配至所述预训练模型的输入的置信度,将置信度最高的标签确定为预测的标签。
示例性的,处理器用于实现对所述去重无标签样本集的样本分配伪标签得到伪标签样本集时,实现:对去重无标签样本集的样本进行聚类,根据所述聚类的结果,对所述去重无标签样本集的样本分配伪标签,具体包括:对去重无标签样本集的样本进行聚类得到若干样本组,所述样本组包括聚为一类的样本;确定不同样本组各自不同的伪标签,得到伪标签样本集;所述样本组的伪标签与所述带标签样本集中样本的所有标签都不同。
示例性的,处理器用于实现对去重无标签样本集的样本进行聚类得到若干样本组,所述样本组包括聚为一类的样本时,实现:根据预训练模型对去重无标签样本集的所有样本分别提取样本特征;根据所述去重无标签样本集中所有样本的样本特征,通过图卷积网络在合并样本集的所有样本上构建最近邻图;根据边缘权重阈值和所述最近邻图的边缘权重,确定所述最近邻图的若干连通分支,所述边缘权重阈值根据威布尔分布设置;根据所述连通分支将所述去重无标签样本集的样本分成若干组,得到所述若干样本组。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法,如:
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项人脸识别模型的训练方法。
其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种人脸识别模型的训练方法,其特征在于,所述方法包括:
在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本;
根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本;
对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;
根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
2.根据权利要求1所述的人脸识别模型的训练方法,其特征在于,所述根据所述预训练模型从所述无标签样本集中剔除重叠样本得到去重无标签样本集包括:
基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,所述重叠置信度用于指示所述样本与所述带标签样本集的人脸样本有相同对象的置信度;
根据所述重叠置信度与预设的置信度阈值的比较结果判别所述无标签样本集的样本是否为重叠样本;
剔除所述无标签样本集中的所述重叠样本,得到去重无标签样本集。
3.根据权利要求2所述的人脸识别模型的训练方法,其特征在于:所述基于所述预训练模型,确定所述无标签样本集的样本的重叠置信度,包括:
将所述无标签样本集的样本输入所述预训练模型,得到所述预训练模型对应所述样本的预测结果,所述预测结果包括所述带标签样本集中人脸样本的不同标签对应的置信度;
根据所述不同标签对应的置信度,确定所述无标签样本集的样本的重叠置信度。
4.根据权利要求3所述的人脸识别模型的训练方法,其特征在于,所述预训练模型包括逻辑回归分类器,所述逻辑回归分类器用于通过逻辑回归计算所述带标签样本集中人脸样本的不同标签被匹配至所述预训练模型的输入的置信度,将置信度最高的标签确定为预测的标签。
5.根据权利要求1-4中任一项所述的人脸识别模型的训练方法,其特征在于,所述对所述去重无标签样本集的样本分配伪标签得到伪标签样本集,包括:
对去重无标签样本集的样本进行聚类,根据所述聚类的结果,对所述去重无标签样本集的样本分配伪标签。
6.根据权利要求5所述的人脸识别模型的训练方法,其特征在于:
所述对去重无标签样本集的样本进行聚类,包括:对去重无标签样本集的样本进行聚类得到若干样本组,所述样本组包括聚为一类的样本;
所述根据聚类结果,对所述去重无标签样本集的样本分配伪标签得到伪标签样本集,包括:确定不同样本组各自不同的伪标签,得到伪标签样本集;所述样本组的伪标签与所述带标签样本集中样本的所有标签都不同。
7.根据权利要求6所述的人脸识别模型的训练方法,其特征在于,
所述对去重无标签样本集的样本进行聚类得到与所述若干样本组,包括:
根据所述预训练模型对所述去重无标签样本集的所有样本分别提取样本特征;
根据所述去重无标签样本集中所有样本的样本特征,通过图卷积网络在所述合并样本集的所有样本上构建最近邻图;
根据边缘权重阈值和所述最近邻图的边缘权重,确定所述最近邻图的若干连通分支,所述边缘权重阈值根据威布尔分布设置;
根据所述连通分支将所述去重无标签样本集的样本分成若干组,得到所述若干样本组。
8.一种人脸识别模型的训练装置,其特征在于,所述装置包括:
预训练模块,用于在带标签样本集上进行监督训练得到预训练模型,所述带标签样本集包括已被标记标签的人脸样本;
样本去重模块,用于根据所述预训练模型从无标签样本集中剔除重叠样本得到去重无标签样本集,所述无标签样本集包括未被标记标签的人脸样本,所述重叠样本为所述无标签样本集中与所述带标签样本集的样本有相同对象的样本;
伪标签分配模块,用于对所述去重无标签样本集的样本分配伪标签得到伪标签样本集;
预测模型模块,用于根据所述带标签样本集的样本及所述伪标签样本集的样本对人脸识别模型进行训练,得到预测模型。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述的计算机程序并在执行所述的计算机程序时实现如权利要求1-7任一项所述的人脸识别模型的训练方法。
10.一种计算机可读存储介质,所述计算机的可读存储介质存储有计算机程序,其特征在于,若所述计算机程序被处理器执行,实现如权利要求1-7任一项所述的人脸识别模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110277869.0A CN112766423B (zh) | 2021-03-15 | 2021-03-15 | 人脸识别模型的训练方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110277869.0A CN112766423B (zh) | 2021-03-15 | 2021-03-15 | 人脸识别模型的训练方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112766423A true CN112766423A (zh) | 2021-05-07 |
CN112766423B CN112766423B (zh) | 2023-12-19 |
Family
ID=75691336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110277869.0A Active CN112766423B (zh) | 2021-03-15 | 2021-03-15 | 人脸识别模型的训练方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112766423B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450764A (zh) * | 2021-07-08 | 2021-09-28 | 平安科技(深圳)有限公司 | 文本语音识别方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200125897A1 (en) * | 2018-10-18 | 2020-04-23 | Deepnorth Inc. | Semi-Supervised Person Re-Identification Using Multi-View Clustering |
CN111695462A (zh) * | 2020-05-29 | 2020-09-22 | 平安科技(深圳)有限公司 | 一种人脸识别方法、装置、存储介质和服务器 |
CN111898696A (zh) * | 2020-08-10 | 2020-11-06 | 腾讯云计算(长沙)有限责任公司 | 伪标签及标签预测模型的生成方法、装置、介质及设备 |
US20200410388A1 (en) * | 2019-06-25 | 2020-12-31 | International Business Machines Corporation | Model training using a teacher-student learning paradigm |
CN112232416A (zh) * | 2020-10-16 | 2021-01-15 | 浙江大学 | 一种基于伪标签加权的半监督学习方法 |
-
2021
- 2021-03-15 CN CN202110277869.0A patent/CN112766423B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200125897A1 (en) * | 2018-10-18 | 2020-04-23 | Deepnorth Inc. | Semi-Supervised Person Re-Identification Using Multi-View Clustering |
US20200410388A1 (en) * | 2019-06-25 | 2020-12-31 | International Business Machines Corporation | Model training using a teacher-student learning paradigm |
CN111695462A (zh) * | 2020-05-29 | 2020-09-22 | 平安科技(深圳)有限公司 | 一种人脸识别方法、装置、存储介质和服务器 |
CN111898696A (zh) * | 2020-08-10 | 2020-11-06 | 腾讯云计算(长沙)有限责任公司 | 伪标签及标签预测模型的生成方法、装置、介质及设备 |
CN112232416A (zh) * | 2020-10-16 | 2021-01-15 | 浙江大学 | 一种基于伪标签加权的半监督学习方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113450764A (zh) * | 2021-07-08 | 2021-09-28 | 平安科技(深圳)有限公司 | 文本语音识别方法、装置、设备及存储介质 |
CN113450764B (zh) * | 2021-07-08 | 2024-02-06 | 平安科技(深圳)有限公司 | 文本语音识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN112766423B (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fernández et al. | SMOTE for learning from imbalanced data: progress and challenges, marking the 15-year anniversary | |
Zhang et al. | l1-regularized neural networks are improperly learnable in polynomial time | |
CN111079639B (zh) | 垃圾图像分类模型构建的方法、装置、设备及存储介质 | |
Sankaran et al. | Group sparse autoencoder | |
Alzate et al. | Multiway spectral clustering with out-of-sample extensions through weighted kernel PCA | |
Tuba et al. | Handwritten digit recognition by support vector machine optimized by bat algorithm | |
WO2022035942A1 (en) | Systems and methods for machine learning-based document classification | |
CN110602120B (zh) | 一种面向网络的入侵数据检测方法 | |
US20200143209A1 (en) | Task dependent adaptive metric for classifying pieces of data | |
Chatterjee et al. | A clustering‐based feature selection framework for handwritten Indic script classification | |
CN112784918A (zh) | 基于无监督图表示学习的节点识别方法、系统、装置 | |
CN117242456A (zh) | 用于改进的深度学习模型的方法和系统 | |
CN112163114B (zh) | 一种基于特征融合的图像检索方法 | |
Kolli | A novel granularity optimal feature selection based on multi-variant clustering for high dimensional data | |
Sokolova et al. | Computation-efficient face recognition algorithm using a sequential analysis of high dimensional neural-net features | |
Mahmoud et al. | An automatic deep neural network model for fingerprint classification | |
Liu et al. | Tread pattern image classification using convolutional neural network based on transfer learning | |
CN112766423B (zh) | 人脸识别模型的训练方法、装置、计算机设备及存储介质 | |
Nader et al. | Kinship verification and recognition based on handcrafted and deep learning feature-based techniques | |
Tomar et al. | Feature selection using autoencoders | |
CN108595568A (zh) | 一种基于极大无关多元逻辑回归的文本情感分类方法 | |
Ma et al. | Shiss: Supervised hashing with informative set selection | |
Dey et al. | An efficient feature representation strategy for offline computer synthesized font characters using multivariate filter based feature selection technique | |
Jain et al. | Multi-label classification for images with labels for image annotation | |
Assiroj et al. | Measuring memetic algorithm performance on image fingerprints dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |