CN115393925A - 一种人脸吸引力分类方法、系统、设备及介质 - Google Patents

一种人脸吸引力分类方法、系统、设备及介质 Download PDF

Info

Publication number
CN115393925A
CN115393925A CN202210926265.9A CN202210926265A CN115393925A CN 115393925 A CN115393925 A CN 115393925A CN 202210926265 A CN202210926265 A CN 202210926265A CN 115393925 A CN115393925 A CN 115393925A
Authority
CN
China
Prior art keywords
classification
score
pseudo label
label
pseudo
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210926265.9A
Other languages
English (en)
Inventor
甘俊英
郑泽鑫
何国辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuyi University
Original Assignee
Wuyi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuyi University filed Critical Wuyi University
Priority to CN202210926265.9A priority Critical patent/CN115393925A/zh
Publication of CN115393925A publication Critical patent/CN115393925A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种人脸吸引力分类方法、系统、设备及介质,其方法包括:通过人脸图像输入到两个网络,通过采样标签猜测函数得到具有排序得分的第一分类结果和第二分类结果,缓解伪标签不平衡问题,使神经网络对伪标签进行合理分类,提高了人脸吸引力分类的泛化能力;然后将第一分类结果和第二分类结果输入至argmax函数得到对应的第一伪标签和第二伪标签,伪标签扩展了训练数据,使人脸吸引力分类更加准确;伪标签通过交叉熵损失互相进行监督,确保了伪标签的质量;最后根据伪标签的交叉熵损失是否低于阈值判断分类结果能否输出,使用伪标签辅助人脸吸引力分类,既节省了标记标签的大量人力物力,也使人脸吸引力分类更加精确。

Description

一种人脸吸引力分类方法、系统、设备及介质
技术领域
本发明涉及图像分类技术领域,尤其是涉及一种人脸吸引力分类方法、系统、设备及介质。
背景技术
随着深度学习与计算机视觉的发展,现有的网络大多结构很深、模型很大,且需要海量数据来进行训练。实际应用中存在着数据库标签数据量不足,用于标记未标记图像的标签需要大量的人工费用,通过半监督学习的方法能够避免需要大量标记图像。但是半监督学习方法受到伪标签不平衡的影响,具有平均吸引力的面孔数量非常高,会使得模型在训练样本数量多的类别表现较好而样本少的类别效果较差。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明提出人脸吸引力分类方法、系统、设备及介质,能够有效解决半监督学习中伪标签样本不平衡的问题,提高人脸吸引力分类的泛化性和准确性。
第一方面,本发明的实施例提供了一种人脸吸引力分类方法,包括:
获取人脸图像;
将所述人脸图像输入至具有采样标签猜测函数的第一分类网络,得到具有第一排序得分的第一分类结果;将所述人脸图像输入至具有采样标签猜测函数的第二分类网络,得到具有第二排序得分的第二分类结果;将所述具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签;将所述具有第二排序得分的第二分类结果进行argmax操作,得到第二伪标签;
通过所述第一伪标签和所述第二伪标签计算第一交叉熵损失,若所述第一交叉熵损失低于阈值,将具有所述第一伪标签的所述人脸图像输入所述第一分类网络,得到具有第三排序得分的第三分类结果;将具有所述第二伪标签的所述人脸图像输入所述第二分类网络,得到具有第四排序得分的第四分类结果;将所述具有第三排序得分的第三分类结果进行argmax操作,得到第三伪标签;将所述具有第四排序得分的第四分类结果进行argmax操作,得到第四伪标签;通过所述第三伪标签和所述第四伪标签计算第二交叉熵损失,依此类推,直到得到第2N-1伪标签和第2N伪标签,通过所述第2N-1伪标签和所述第2N伪标签计算第N交叉熵损失,所述第N交叉熵损失不低于所述阈值,结束迭代;所述N为正整数;
将所述第2N-1伪标签对应的第2N-1分类结果或所述第2N伪标签对应的第2N分类结果输出,得到所述人脸图像的分类结果。
根据本发明实施例的方法,至少具有如下有益效果:
本方法将人脸图像分别输入到两个网络,通过采样标签猜测函数得到具有排序得分的第一分类结果和第二分类结果,缓解伪标签不平衡问题,使神经网络对伪标签进行合理分类,提高了人脸吸引力分类方法的泛化能力;然后将第一分类结果和第二分类结果输入至argmax函数得到对应的第一伪标签和第二伪标签,伪标签扩展了训练数据,使人脸吸引力分类更加准确;伪标签通过交叉熵损失互相进行监督,在不断迭代计算交叉熵损失的过程中,确保了伪标签的质量;最后根据伪标签的交叉熵损失是否低于阈值判断分类结果能否输出。本方法在有限数量的已标注标签的情况下,使用伪标签共同辅助人脸吸引力分类,既节省了标记标签的大量人力物力,也使人脸吸引力分类更加准确。
根据本发明的一些实施例,所述采样标签猜测函数的公式包括:
Figure BDA0003779736060000021
其中,Y表示猜测的伪标签,RankS()表示用于得到所述排序得分采样标签猜测函数,f(θ)表示前一次训练的分类网络,u表示未标记人脸图像的个数,j表示随机采样未标记人脸图像的个数,
Figure BDA0003779736060000022
表示未标记人脸图像,α和β表示预设的阈值,K表示未标记人脸图像的采样个体数。
根据本发明的一些实施例,所述第一分类网络和所述第二分类网络的网络结构相同,所述第一分类网络和所述第二分类网络设置不同的初始化权重。
根据本发明的一些实施例,所述将所述具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签,包括:
将伪标签分为最有吸引力、最少吸引力和平均吸引力;
若所述排序得分高于阈值α,对应的所述第一伪标签为最有吸引力;若所述排序得分低于阈值β,对应的所述第一伪标签为最少吸引力;若所述排序得分不高于阈值α且不低于阈值β,对应的所述第一伪标签为平均吸引力。
根据本发明的一些实施例,所述交叉熵损失的计算还包括:对所述交叉熵损失进行加权平衡;所述加权平衡通过引入所述人脸图像的吸引力得分权重实现。
根据本发明的一些实施例,通过如下方式计算所述吸引力得分权重:
计算所述人脸图像的吸引力得分;
通过所述吸引力得分,计算吸引力得分向量;
将所述吸引力得分向量作为归一化函数的输入参数,并通过所述归一化函数计算得到吸引力得分权重。
根据本发明的一些实施例,所述对所述交叉熵损失进行加权平衡的公式包括:
Figure BDA0003779736060000031
其中,Lu表示损失函数的计算结果,
Figure BDA0003779736060000032
表示随机采样的第i组所述人脸图像,wj表示所述吸引力得分权重,lu()表示所述交叉熵损失函数,
Figure BDA0003779736060000033
表示
Figure BDA0003779736060000034
的预测值,zj表示所述吸引力得分。
第二方面,本发明的实施例提供了一种人脸吸引力分类系统,包括:
获取模块,用于获取人脸图像;
伪标签生成模块,用于将所述人脸图像输入至具有采样标签猜测函数的第一分类网络,得到具有第一排序得分的第一分类结果;将所述人脸图像输入至具有采样标签猜测函数的第二分类网络,得到具有第二排序得分的第二分类结果;将所述具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签;将所述具有第二排序得分的第二分类结果进行argmax操作,得到第二伪标签;
交叉监督模块,用于通过所述第一伪标签和所述第二伪标签计算第一交叉熵损失,若所述第一交叉熵损失低于阈值,将具有所述第一伪标签的所述人脸图像输入所述第一分类网络,得到具有第三排序得分的第三分类结果;将具有所述第二伪标签的所述人脸图像输入所述第二分类网络,得到具有第四排序得分的第四分类结果;将所述具有第三排序得分的第三分类结果进行argmax操作,得到第三伪标签;将所述具有第四排序得分的第四分类结果进行argmax操作,得到第四伪标签;通过所述第三伪标签和所述第四伪标签计算第二交叉熵损失,依此类推,直到得到第2N-1伪标签和第2N伪标签,通过所述第2N-1伪标签和所述第2N伪标签计算第N交叉熵损失,所述第N交叉熵损失不低于所述阈值,结束迭代;所述N为正整数;
输出模块,用于将所述第2N-1伪标签对应的第2N-1分类结果或所述第2N伪标签对应的第2N分类结果输出,得到所述人脸图像的分类结果。
第三方面,本发明的实施例提供了一种电子设备,包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如第一方面所述的人脸吸引力分类方法。
第四方面,本发明的实施例提供了一种计算机存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如第一方面所述的人脸吸引力分类方法。
需要注意的是,本发明的第二方面至第四方面与现有技术之间的有益效果与第一方面的人脸吸引力分类方法的有益效果相同,此处不再细述。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明一实施例提供的一种人脸吸引力分类方法的流程图;
图2是本发明一实施例提供的根据排序的分得到伪标签的流程图;
图3是本发明一实施例提供的计算吸引力得分权重的流程图;
图4是本发明一实施例提供的一种人脸吸引力分类方法的示意图;
图5是本发明一实施例提供的一种人脸吸引力分类系统的结构图;
图6是本发明一实施例提供的一种电子设备的结构图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
本发明的描述中,需要说明的是,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
参照图1,在本发明的一些实施例中,提供了一种人脸吸引力分类方法,包括:
步骤S100、获取人脸图像;
步骤S200、将人脸图像输入至具有采样标签猜测函数的第一分类网络,得到具有第一排序得分的第一分类结果;将人脸图像输入至具有采样标签猜测函数的第二分类网络,得到具有第二排序得分的第二分类结果;将具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签;将具有第二排序得分的第二分类结果进行argmax操作,得到第二伪标签;
步骤S300、通过第一伪标签和第二伪标签计算第一交叉熵损失,若第一交叉熵损失低于阈值,将具有第一伪标签的人脸图像输入第一分类网络,得到具有第三排序得分的第三分类结果;将具有第二伪标签的人脸图像输入第二分类网络,得到具有第四排序得分的第四分类结果;将具有第三排序得分的第三分类结果进行argmax操作,得到第三伪标签;将具有第四排序得分的第四分类结果进行argmax操作,得到第四伪标签;通过第三伪标签和第四伪标签计算第二交叉熵损失,依此类推,直到得到第2N-1伪标签和第2N伪标签,通过第2N-1伪标签和第2N伪标签计算第N交叉熵损失,第N交叉熵损失不低于阈值,结束迭代;N为正整数;
步骤S400、将第2N-1伪标签对应的第2N-1分类结果或第2N伪标签对应的第2N分类结果输出,得到人脸图像的分类结果。
在本方法实施例的步骤S200中,首先,通过人脸图像输入到两个网络,通过采样标签猜测函数得到具有排序得分的第一分类结果和第二分类结果,缓解伪标签不平衡问题,使神经网络对伪标签进行合理分类,提高了人脸吸引力分类方法的泛化能力;然后将分类结果和第二分类结果输入至argmax函数得到对应的第一伪标签和第二伪标签,伪标签扩展了训练数据,使人脸吸引力分类更加准确;在本方法实施例的步骤S300中,伪标签通过交叉熵损失互相进行监督,在不断迭代计算交叉熵损失的过程中,确保了伪标签的质量;最后根据伪标签的交叉熵损失是否低于阈值判断分类结果能否输出,在有限数量的已标注标签的情况下,使用伪标签共同辅助人脸吸引力分类,既节省了标记标签的大量人力物力,也使人脸吸引力分类更加准确。
在本发明的一些实施例中,采样标签猜测函数的公式包括:
Figure BDA0003779736060000061
其中,Y表示猜测的伪标签,RankS()表示用于得到排序得分采样标签猜测函数,f(θ)表示前一次训练的分类网络,u表示未标记人脸图像的个数,j表示随机采样未标记人脸图像的个数,
Figure BDA0003779736060000062
表示未标记人脸图像,α和β表示预设的阈值,K表示未标记人脸图像的采样个体数。
采样标签猜测函数通过采样未标记的人脸图像部分,通过分类网络得到排序得分,并设定两个阈值作为一个猜测的伪标签的分类标准,采样标签猜测函数能够自动通过输入的人脸图像得到排序得分,并制定了一个分类区间,能够自动利用未标记的人脸图像部分进行伪标签的使用,节省了人力物理资源。
在本发明的一些实施例中,第一分类网络和第二分类网络的网络结构相同,第一分类网络和第二分类网络设置不同的初始化权重。
两个网络通过互相监督,确保了伪标签的质量,使尽量减少预测伪标签过程中存在的误差,使分类结果更加准确;
参照图2,在本发明的一些实施例中,将具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签,包括:
步骤S201、将伪标签分为最有吸引力、最少吸引力和平均吸引力;
步骤S202、若排序得分高于阈值α,对应的第一伪标签为最有吸引力;若排序得分低于阈值β,对应的第一伪标签为最少吸引力;若排序得分不高于阈值α且不低于阈值β,对应的第一伪标签为平均吸引力。
具体的,首先用在前一次迭代中训练的模型和softmax算子来计算分类类别的概率作为得分依据得到吸引力分数,通过缩放吸引力分数,按照吸引力分数的降序对未标记图像进行排序,从而产生排序得分。然后,我们将“最有吸引力”伪标签分配给那些排名分数高于阈值α的图像,并将“最少吸引力”伪标签分配给那些排名分数低于阈值β的图像,其余的则被分配为“平均吸引力”图像。也就是说,我们强制一个约束,即基于排名采样选择的图像子集为图像吸引力进行评估,接近从图像中标记到的所有图像估计的吸引力。一定程度上,这些伪标签解决了标签不平衡的问题。
在本发明的一些实施例中,交叉熵损失的计算还包括:对交叉熵损失进行加权平衡;加权平衡通过引入人脸图像的吸引力得分权重实现。
未标记图像中“平均吸引力”图像比“最少吸引力的脸和最有吸引力”图像多得多,伪标记不平衡问题仍然无法避免,为了进一步缓解伪标记不平衡问题,引入了一个特定于图像的权重,称为吸引力得分权重,在交叉熵损失函数上进行加权平衡,使“最有吸引力和最少吸引力”的图像贡献得到加强,“平均吸引力”的图像贡献将被削弱,使分类器对人脸图像可以进行较好的预测。
参照图3,在本发明的一些实施例中,通过如下方式计算吸引力得分权重:
步骤S301、计算人脸图像的吸引力得分;
步骤S302、通过吸引力得分,计算吸引力得分向量;
步骤S303、将吸引力得分向量作为归一化函数的输入参数,并通过归一化函数计算得到吸引力得分权重。
吸引力得分的计算和前述排序得分获取过程中的吸引力分数是同样的方式,吸引力分数加权在很大程度上缓解了伪标签不平衡问题,使用softmax来获得吸引力得分权重,对计算吸引力分数的偏差有更好的容忍度。
在本发明的一些实施例中,对交叉熵损失进行加权平衡的公式包括:
Figure BDA0003779736060000071
其中,Lu表示损失函数的计算结果,
Figure BDA0003779736060000072
表示随机采样的第i组人脸图像,wj表示吸引力得分权重,lu()表示交叉熵损失函数,
Figure BDA0003779736060000073
表示
Figure BDA0003779736060000074
的预测值,zj表示吸引力得分。
交叉熵损失进行加权平衡能够进一步解决伪标签可能存在不平衡的问题,使分类结果更加准确。
参照图4,为了方便本领域技术人员理解,本发明的一个具体实施例,提供一种人脸吸引力分类方法,包括如下步骤:
第一步、构建交叉为监督框架使用两个网络f(θ1)和f(θ2),这两个网络具有相同的结构,它们具有不同的初始化权重θ1和θ2,输入同一张人脸图像X,softmax归一化后得到两个不同的输出P1和P2,然后通过argmax操作得到标签Y1和Y2,同时标签Y2作为输出P1的监督,标签Y1作为输出P2的监督,使用交叉熵损失来进行约束;
第二步、在网络f(θ1)和f(θ2)中引入一种基于排序的抽样策略,包括:
引入采样标签猜测函数,包括:
Figure BDA0003779736060000081
其中,Y表示猜测的伪标签,RankS()表示基于采样标签猜测函数的采样程序用于得到排序得分,f(θ)表示前一次训练的分类网络,u表示未标记人脸图像的个数,j表示随机采样未标记人脸图像的个数,
Figure BDA0003779736060000082
表示未标记人脸图像,α和β表示预设的阈值,K表示未标记人脸图像的采样个体数;
用在前一次迭代中训练的模型和softmax算子来计算“吸引力”类别的概率作为得分依据,通过缩放吸引力分数,按照吸引力分数的降序对未标记图像进行排序,从而产生排序得分。然后,我们将“最有吸引力”伪标签分配给那些排名分数高于阈值α的图像,并将“最少吸引力”伪标签分配给那些排名分数低于阈值β的图像,其余的则被分配为“平均吸引力”图像。也就是说,我们强制一个约束,即基于排名采样选择的图像子集为图像吸引力进行评估,接近从图像中标记到的所有图像估计的吸引力。
第三步、通过吸引力加权平衡损失;引入了一个特定于图像的权重w,称为吸引力得分权重,在交叉熵损失函数上进行加权平衡,使“最有吸引力和最少吸引力”的图像贡献得到加强,“平均吸引力”的图像贡献将被削弱,使分类器对人脸图像可以进行较好的预测。对交叉熵损失进行加权平衡的公式包括:
Figure BDA0003779736060000083
其中,Lu表示损失函数的计算结果,
Figure BDA0003779736060000084
表示随机采样的第i组人脸图像,wj表示吸引力得分权重,lu()表示交叉熵损失函数,
Figure BDA0003779736060000085
表示
Figure BDA0003779736060000086
的预测值,zj表示吸引力得分。
为了估计人脸图像的权重,首先考虑人脸图像的“吸引力”类别的概率,并将“吸引力”类别的概率视为吸引力分数;在所有人脸图像中,对未标记图像部分进行采样,他们的吸引力分数形成一个吸引力得分向量。然后将归一化函数应用于吸引力得分向量,得到归一化的吸引力得分权重。
第四步、将待分类的人脸图像输入训练完成的分类网络,得到分类网络输出的分类结果。
参照图5,本发明的一个实施例,还提供了一种人脸吸引力分类系统,包括获取模块1001、伪标签生成模块1002、交叉监督模块1003和输出模块1004,其中:
获取模块1001,用于获取人脸图像;
伪标签生成模块1002,用于将人脸图像输入至具有采样标签猜测函数的第一分类网络,得到具有第一排序得分的第一分类结果;将人脸图像输入至具有采样标签猜测函数的第二分类网络,得到具有第二排序得分的第二分类结果;将具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签;将具有第二排序得分的第二分类结果进行argmax操作,得到第二伪标签;
交叉监督模块1003,用于通过第一伪标签和第二伪标签计算第一交叉熵损失,若第一交叉熵损失低于阈值,将具有第一伪标签的人脸图像输入第一分类网络,得到具有第三排序得分的第三分类结果;将具有第二伪标签的人脸图像输入第二分类网络,得到具有第四排序得分的第四分类结果;将具有第三排序得分的第三分类结果进行argmax操作,得到第三伪标签;将具有第四排序得分的第四分类结果进行argmax操作,得到第四伪标签;通过第三伪标签和第四伪标签计算第二交叉熵损失,依此类推,直到得到第2N-1伪标签和第2N伪标签,通过第2N-1伪标签和第2N伪标签计算第N交叉熵损失,第N交叉熵损失不低于阈值,结束迭代;N为正整数;
输出模块1004,用于将第2N-1伪标签对应的第2N-1分类结果或第2N伪标签对应的第2N分类结果输出,得到人脸图像的分类结果。
需要说明的是,由于本实施例中的一种人脸吸引力分类系统与上述的一种人脸吸引力分类方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本装置实施例,此处不再详述。
参考图6,本发明的另一个实施例,还提供了一种电子设备,该电子设备6000可以是任意类型的智能终端,例如手机、平板电脑、个人计算机等。
具体的,电子设备6000包括:一个或多个控制处理器6001和存储器6002,图6中以一个控制处理器6001与一个存储器6002为例,控制处理器6001和存储器6002可以通过总线或者其他方式连接,图6中以通过总线连接为例。
存储器6002作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态性计算机可执行程序以及模块,如本发明实施例中的一种电子设备对应的程序指令/模块;
控制处理器6001通过运行存储在存储器6002中的非暂态软件程序、指令以及模块,从而执行一种人脸吸引力分类方法的各种功能应用以及数据处理,即实现上述方法实施例的一种人脸吸引力分类方法。
存储器6002可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储一种人脸吸引力分类方法的使用所创建的数据等。此外,存储器6002可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器6002可选包括相对于控制处理器6001远程设置的存储器,这些远程存储器可以通过网络连接至该电子设备6000。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
在一个或者多个模块存储在存储器6002中,当被该一个或者多个控制处理器6001执行时,执行上述方法实施例中的一种人脸吸引力分类方法,例如执行以上描述的图1至图3的方法步骤。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
需要说明的是,由于本实施例中的一种电子设备与上述的一种人脸吸引力分类方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本装置实施例,此处不再详述。
本发明的一个实施例,还提供一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行:如上述实施例的人脸吸引力分类方法。
需要说明的是,由于本实施例中的一种计算机可读存储介质与上述的一种人脸吸引力分类方法基于相同的发明构思,因此,方法实施例中的相应内容同样适用于本装置实施例,此处不再详述。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储数据(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的数据并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何数据递送介质。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示意性实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种人脸吸引力分类方法,其特征在于,所述人脸吸引力分类方法包括:
获取人脸图像;
将所述人脸图像输入至具有采样标签猜测函数的第一分类网络,得到具有第一排序得分的第一分类结果;将所述人脸图像输入至具有采样标签猜测函数的第二分类网络,得到具有第二排序得分的第二分类结果;将所述具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签;将所述具有第二排序得分的第二分类结果进行argmax操作,得到第二伪标签;
通过所述第一伪标签和所述第二伪标签计算第一交叉熵损失,若所述第一交叉熵损失低于阈值,将具有所述第一伪标签的所述人脸图像输入所述第一分类网络,得到具有第三排序得分的第三分类结果;将具有所述第二伪标签的所述人脸图像输入所述第二分类网络,得到具有第四排序得分的第四分类结果;将所述具有第三排序得分的第三分类结果进行argmax操作,得到第三伪标签;将所述具有第四排序得分的第四分类结果进行argmax操作,得到第四伪标签;通过所述第三伪标签和所述第四伪标签计算第二交叉熵损失,依此类推,直到得到第2N-1伪标签和第2N伪标签,通过所述第2N-1伪标签和所述第2N伪标签计算第N交叉熵损失,所述第N交叉熵损失不低于所述阈值,结束迭代;所述N为正整数;
将所述第2N-1伪标签对应的第2N-1分类结果或所述第2N伪标签对应的第2N分类结果输出,得到所述人脸图像的分类结果。
2.根据权利要求1所述的人脸吸引力分类方法,其特征在于,所述采样标签猜测函数的公式包括:
Figure FDA0003779736050000011
其中,Y表示猜测的伪标签,RankS()表示用于得到所述排序得分采样标签猜测函数,f(θ)表示前一次训练的分类网络,u表示未标记人脸图像的个数,j表示随机采样未标记人脸图像的个数,
Figure FDA0003779736050000012
表示未标记人脸图像,α和β表示预设的阈值,K表示未标记人脸图像的采样个体数。
3.根据权利要求1所述的人脸吸引力分类方法,其特征在于,所述第一分类网络和所述第二分类网络的网络结构相同,所述第一分类网络和所述第二分类网络设置不同的初始化权重。
4.根据权利要求2所述的人脸吸引力分类方法,其特征在于,所述将所述具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签,包括:
将伪标签分为最有吸引力、最少吸引力和平均吸引力;
若所述排序得分高于阈值α,对应的所述第一伪标签为最有吸引力;若所述排序得分低于阈值β,对应的所述第一伪标签为最少吸引力;若所述排序得分不高于阈值α且不低于阈值β,对应的所述第一伪标签为平均吸引力。
5.根据权利要求4所述的人脸吸引力分类方法,其特征在于,所述交叉熵损失的计算还包括:对所述交叉熵损失进行加权平衡;所述加权平衡通过引入所述人脸图像的吸引力得分权重实现。
6.根据权利要求5所述的人脸吸引力分类方法,其特征在于,通过如下方式计算所述吸引力得分权重:
计算所述人脸图像的吸引力得分;
通过所述吸引力得分,计算吸引力得分向量;
将所述吸引力得分向量作为归一化函数的输入参数,并通过所述归一化函数计算得到吸引力得分权重。
7.根据权利要求6所述的人脸吸引力分类方法,其特征在于,所述对所述交叉熵损失进行加权平衡的公式包括:
Figure FDA0003779736050000021
其中,Lu表示损失函数的计算结果,
Figure FDA0003779736050000022
表示随机采样的第i组所述人脸图像,wj表示所述吸引力得分权重,lu()表示所述交叉熵损失函数,
Figure FDA0003779736050000023
表示
Figure FDA0003779736050000024
的预测值,zj表示所述吸引力得分。
8.一种人脸吸引力分类系统,其特征在于,包括:
获取模块,用于获取人脸图像;
伪标签生成模块,用于将所述人脸图像输入至具有采样标签猜测函数的第一分类网络,得到具有第一排序得分的第一分类结果;将所述人脸图像输入至具有采样标签猜测函数的第二分类网络,得到具有第二排序得分的第二分类结果;将所述具有第一排序得分的第一分类结果进行argmax操作,得到第一伪标签;将所述具有第二排序得分的第二分类结果进行argmax操作,得到第二伪标签;
交叉监督模块,用于通过所述第一伪标签和所述第二伪标签计算第一交叉熵损失,若所述第一交叉熵损失低于阈值,将具有所述第一伪标签的所述人脸图像输入所述第一分类网络,得到具有第三排序得分的第三分类结果;将具有所述第二伪标签的所述人脸图像输入所述第二分类网络,得到具有第四排序得分的第四分类结果;将所述具有第三排序得分的第三分类结果进行argmax操作,得到第三伪标签;将所述具有第四排序得分的第四分类结果进行argmax操作,得到第四伪标签;通过所述第三伪标签和所述第四伪标签计算第二交叉熵损失,依此类推,直到得到第2N-1伪标签和第2N伪标签,通过所述第2N-1伪标签和所述第2N伪标签计算第N交叉熵损失,所述第N交叉熵损失不低于所述阈值,结束迭代;所述N为正整数;
输出模块,用于将所述第2N-1伪标签对应的第2N-1分类结果或所述第2N伪标签对应的第2N分类结果输出,得到所述人脸图像的分类结果。
9.一种电子设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行如权利要求1至7任一项所述的人脸吸引力分类方法。
10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至7任一项所述的人脸吸引力分类方法。
CN202210926265.9A 2022-08-03 2022-08-03 一种人脸吸引力分类方法、系统、设备及介质 Pending CN115393925A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210926265.9A CN115393925A (zh) 2022-08-03 2022-08-03 一种人脸吸引力分类方法、系统、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210926265.9A CN115393925A (zh) 2022-08-03 2022-08-03 一种人脸吸引力分类方法、系统、设备及介质

Publications (1)

Publication Number Publication Date
CN115393925A true CN115393925A (zh) 2022-11-25

Family

ID=84118101

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210926265.9A Pending CN115393925A (zh) 2022-08-03 2022-08-03 一种人脸吸引力分类方法、系统、设备及介质

Country Status (1)

Country Link
CN (1) CN115393925A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574258A (zh) * 2024-01-15 2024-02-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于文本噪声标签和协同训练策略的文本分类方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117574258A (zh) * 2024-01-15 2024-02-20 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于文本噪声标签和协同训练策略的文本分类方法
CN117574258B (zh) * 2024-01-15 2024-04-26 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种基于文本噪声标签和协同训练策略的文本分类方法

Similar Documents

Publication Publication Date Title
CN111310808B (zh) 图片识别模型的训练方法、装置、计算机系统及存储介质
WO2020073951A1 (zh) 用于图像识别的模型的训练方法、装置、网络设备和存储介质
CN109344884B (zh) 媒体信息分类方法、训练图片分类模型的方法及装置
CN112632385A (zh) 课程推荐方法、装置、计算机设备及介质
CN108960073A (zh) 面向生物医学文献的跨模态图像模式识别方法
CN113807399A (zh) 一种神经网络训练方法、检测方法以及装置
CN112732871B (zh) 一种机器人催收获取客户意向标签的多标签分类方法
CN112183672A (zh) 图像分类方法、特征提取网络的训练方法和装置
CN110489545A (zh) 文本分类方法及装置、存储介质、计算机设备
CN110717023A (zh) 面试回答文本的分类方法及装置、电子设备、存储介质
CN110598869B (zh) 基于序列模型的分类方法、装置、电子设备
US20220101624A1 (en) Neural network training using the soft nearest neighbor loss
CN110175657B (zh) 一种图像多标签标记方法、装置、设备及可读存储介质
CN111831826A (zh) 跨领域的文本分类模型的训练方法、分类方法以及装置
CN111694954B (zh) 图像分类方法、装置和电子设备
EP4343616A1 (en) Image classification method, model training method, device, storage medium, and computer program
CN111104831A (zh) 一种视觉追踪方法、装置、计算机设备以及介质
CN115393925A (zh) 一种人脸吸引力分类方法、系统、设备及介质
CN113283388B (zh) 活体人脸检测模型的训练方法、装置、设备及存储介质
CN109978058A (zh) 确定图像分类的方法、装置、终端及存储介质
CN109101984B (zh) 一种基于卷积神经网络的图像识别方法及装置
CN113052217A (zh) 预测结果标识及其模型训练方法、装置及计算机存储介质
CN115129902B (zh) 媒体数据处理方法、装置、设备及存储介质
CN116563604A (zh) 端到端目标检测模型训练、图像目标检测方法及相关设备
CN115205606A (zh) 一种图像的多标签分类的方法、装置及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination