CN115830692A - 人脸识别模型的训练方法及装置 - Google Patents

人脸识别模型的训练方法及装置 Download PDF

Info

Publication number
CN115830692A
CN115830692A CN202211696114.5A CN202211696114A CN115830692A CN 115830692 A CN115830692 A CN 115830692A CN 202211696114 A CN202211696114 A CN 202211696114A CN 115830692 A CN115830692 A CN 115830692A
Authority
CN
China
Prior art keywords
sample
module
class
cosine similarity
class center
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211696114.5A
Other languages
English (en)
Inventor
蒋召
黄泽元
杨战波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Longzhi Digital Technology Service Co Ltd
Original Assignee
Beijing Longzhi Digital Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Longzhi Digital Technology Service Co Ltd filed Critical Beijing Longzhi Digital Technology Service Co Ltd
Priority to CN202211696114.5A priority Critical patent/CN115830692A/zh
Publication of CN115830692A publication Critical patent/CN115830692A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本公开涉及人脸识别技术领域,提供了一种人脸识别模型的训练方法及装置。该方法包括:利用人脸识别模型提取每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。

Description

人脸识别模型的训练方法及装置
技术领域
本公开涉及人脸识别技术领域,尤其涉及一种人脸识别模型的训练方法及装置。
背景技术
现有的人脸识别模型包含基于比对的方式和基于分类的方式,基于比对的方式,需要构造大量的正负样本对,训练的目标是拉近正样本对的距离,拉远负样本对的距离,从而学习到有区分性的特征,这种称为样本对之间的比对;基于分类的方式是将每一类别用一个权重表示,该权重可以称作该类的原型或者类中心,训练目标为样本与该原型的比较过程。这两种方法均在训练阶段和推理阶段存在差异。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:人脸识别模型在训练阶段和推理阶段存在差异的问题。
发明内容
有鉴于此,本公开实施例提供了一种人脸识别模型的训练方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题。
本公开实施例的第一方面,提供了一种人脸识别模型的训练方法,包括:利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
本公开实施例的第二方面,提供了一种人脸识别模型的训练装置,包括:第一构建模块,被配置为利用全局平均池化层、全连接层和激活层构建注意力模块;第二构建模块,被配置为利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取模块,被配置为获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;提取模块,被配置为利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;第一计算模块,被配置为计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;第二计算模块,被配置为根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;训练模块,被配置为基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题,进而避免人脸识别模型在训练阶段和推理阶段存在的差异,从而提高人脸识别模型的精度。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本公开实施例的应用场景的场景示意图;
图2是本公开实施例提供的一种人脸识别模型的训练方法的流程示意图;
图3是本公开实施例提供的一种人脸识别模型的训练装置的结构示意图;
图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
下面将结合附图详细说明根据本公开实施例的一种人脸识别模型的训练方法和装置。
图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104以及网络105。
终端设备101、102和103可以是硬件,也可以是软件。当终端设备101、102和103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备101、102和103为软件时,其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备101、102和103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器104可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本公开实施例对此不作限制。
需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,其可以是为终端设备101、102和103提供各种服务的各种电子设备。当服务器104为软件时,其可以是为终端设备101、102和103提供各种服务的多个软件或软件模块,也可以是为终端设备101、102和103提供各种服务的单个软件或软件模块,本公开实施例对此不作限制。
网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near FieldCommunication,NFC)、红外(Infrared)等,本公开实施例对此不作限制。
用户可以通过终端设备101、102和103经由网络105与服务器104建立通信连接,以接收或发送信息等。需要说明的是,终端设备101、102和103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本公开实施例对此不作限制。
图2是本公开实施例提供的一种人脸识别模型的训练方法的流程示意图。图2的人脸识别模型的训练方法可以由图1的计算机或服务器,或者计算机或服务器上的软件执行。如图2所示,该人脸识别模型的训练方法包括:
S201,利用全局平均池化层、全连接层和激活层构建注意力模块;
S202,利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;
S203,获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;
S204,利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;
S205,计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;
S206,根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;
S207,基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
每个类中心对应一个人,该类中心下属的多个第一样本是属于此人的多张图像。
本公开实施例的发明点主要有两点,一是将残差网络模型中的每个残差模块后构建注意力分支,将该改进后的残差网络模型作为人脸识别模型;二是针对该人脸识别模型的结构提出了一种新的模型训练方法。需要说明的是,残差网络模型内有很多残差模块。基于所有第一样本和所有类中心对应的梯度,利用梯度反向传播算法完成对人脸识别模型的训练。
根据本公开实施例提供的技术方案,利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题,进而避免人脸识别模型在训练阶段和推理阶段存在的差异,从而提高人脸识别模型的精度。
利用全局平均池化层、全连接层和激活层构建注意力模块,包括:依次连接全局平均池化层、全连接层、激活层、全连接层和激活层,得到注意力模块。
激活层可以是使用sigmoid函数。
利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,包括:将每个残差模块的输入记作第一特征,输出记作第二特征;将每个残差模块输出的第二特征输入该残差模块后的注意力分支,输出第三特征;将每个残差模块输出的第二特征与该残差模块后的注意力分支输出的第三特征相乘,得到第四特征;将输入每个残差模块的第一特征与其对应的第四特征相加,得到第五特征。
本公开实施例是在残差模块后用注意力模块开辟一个注意力分支,可以将该注意力分支就看做是注意力模块,之所以写每个残差模块后构建注意力分支,不写每个残差模块后接注意力模块,是因为注意力分支包含和残差模块的连接关系,该连接关系为:将残差模块输出的第二特征输入注意力分支,输出第三特征;将第二特征和第三特征相乘,得到第四特征;将输入残差模块的第一特征与第四特征相加,得到第五特征。
获取训练数据集,为训练数据集生成历史样本队列,包括:从训练数据集中每个类中心下属的多个第一样本中确定出一个第一样本作为该类中心下属的第二样本;将所有类中心下属的第二样本组成历史样本队列。
根据每个第一样本对应的第一余弦相似度和第二余弦相似度,计算所有第一样本和所有类中心对应的梯度,包括:对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和,得到该每个第一样本对应的第三余弦相似度;根据每个第一样本对应的第三余弦相似度,利用样本梯度公式计算所有第一样本对应的梯度;根据每个第一样本对应的第三余弦相似度,利用类中心梯度公式计算所有类中心对应的梯度。
对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和,其中权值可以提前设置。
样本梯度公式:
Gx=(cos(θ)-1(t=y))Δx
Figure BDA0004022424180000081
cos(θ)为第一样本对应的第三余弦相似度,t为第一样本所属类中心,y为第一样本的标签,x为第一样本的第一样本特征,“1(t=y)”表示当t等于y,取1,当t不等于y,取0。
每个第一样本均会对应一个cos(θ)-1(t=y))Δx的值,∑(cos(θ)-1(t=y))Δx是对所有第一样本对应的cos(θ)-1(t=y))Δx的值求和。
当t等于y,Gx=∑(cos(θ)-1)Δx
当t不等于y,Gx=∑(cos(θ)-0)Δx
类中心梯度公式:
Gw=(cos(θ)-1(t=y))Δw
Figure BDA0004022424180000082
cos(θ)为第一样本对应的第三余弦相似度,t为第一样本所属类中心,y为第一样本的标签,w为第一样本所属类中心的类中心特征,“1(t=y)”表示当t等于y,取1,当t不等于y,取0。
上述对人脸识别模型的训练可以看做是整体的训练过程或者一个批次的训练过程,实际上需要对人脸识别模型进行的多个批次的训练。
在对人脸识别模型进行的每个批次的训练中:
利用人脸识别模型提取当前批次中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取当前批次对应的历史样本队列中每个第二样本的第二样本特征,其中,每个批次均包括从训练数据集选出的多个类中心以及每个类中心下属的多个第一样本,原始的历史样本队列(第一批次对应的历史样本队列)是对人脸识别模型进行第一批次的训练时根据训练数据集生成的,每个批次对应的历史样本队列包括每个类中心下属的一个第二样本;计算当前批次中每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算当前批次中每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算当前批次中所有第一样本和所有类中心对应的梯度;基于当前批次中所有第一样本和所有类中心对应的梯度,完成当前批次对人脸识别模型的训练,更新历史样本队列。
其中,在完成当前批次对人脸识别模型的训练后,更新历史样本队列,包括:从当前批次中的多个类中心以及每个类中心下属的多个第一样本确定出一个第一样本作为该类中心下属的第二样本;使用确定出的所有类中心下属的第二样本更新历史样本队列,更新后的历史样本队列是当前批次的下一个批次对应的历史样本队列,或者说,当前批次对应的历史样本队列是当前批次的上一个批次对人脸识别模型的训练后,更新得到的。
需要说明的是,在每个批次对人脸识别模型的训练中,样本的类中心也是不断更新的,这都是现有方法,在此不在赘述。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图3是本公开实施例提供的一种人脸识别模型的训练装置的示意图。如图3所示,该人脸识别模型的训练装置包括:
第一构建模块301,被配置为利用全局平均池化层、全连接层和激活层构建注意力模块;
第二构建模块302,被配置为利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;
获取模块303,被配置为获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;
提取模块304,被配置为利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;
第一计算模块305,被配置为计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;
第二计算模块306,被配置为根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;
训练模块307,被配置为基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练。
每个类中心对应一个人,该类中心下属的多个第一样本是属于此人的多张图像。
本公开实施例的发明点主要有两点,一是将残差网络模型中的每个残差模块后构建注意力分支,将该改进后的残差网络模型作为人脸识别模型;二是针对该人脸识别模型的结构提出了一种新的模型训练方法。需要说明的是,残差网络模型内有很多残差模块。基于所有第一样本和所有类中心对应的梯度,利用梯度反向传播算法完成对人脸识别模型的训练。
根据本公开实施例提供的技术方案,利用全局平均池化层、全连接层和激活层构建注意力模块;利用注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;获取训练数据集,为训练数据集生成历史样本队列,其中,训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,历史样本队列包括每个类中心下属的一个第二样本;利用人脸识别模型提取训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取历史样本队列中每个第二样本的第二样本特征;计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;基于所有第一样本和所有类中心对应的梯度,完成对人脸识别模型的训练,因此,采用上述技术手段,可以解决现有技术中,人脸识别模型在训练阶段和推理阶段存在差异的问题,进而避免人脸识别模型在训练阶段和推理阶段存在的差异,从而提高人脸识别模型的精度。
可选地,第一构建模块301还被配置为依次连接全局平均池化层、全连接层、激活层、全连接层和激活层,得到注意力模块。
激活层可以是使用sigmoid函数。
可选地,第二构建模块302还被配置为将每个残差模块的输入记作第一特征,输出记作第二特征;将每个残差模块输出的第二特征输入该残差模块后的注意力分支,输出第三特征;将每个残差模块输出的第二特征与该残差模块后的注意力分支输出的第三特征相乘,得到第四特征;将输入每个残差模块的第一特征与其对应的第四特征相加,得到第五特征。
本公开实施例是在残差模块后用注意力模块开辟一个注意力分支,可以将该注意力分支就看做是注意力模块,之所以写每个残差模块后构建注意力分支,不写每个残差模块后接注意力模块,是因为注意力分支包含和残差模块的连接关系,该连接关系为:将残差模块输出的第二特征输入注意力分支,输出第三特征;将第二特征和第三特征相乘,得到第四特征;将输入残差模块的第一特征与第四特征相加,得到第五特征。
可选地,获取模块303还被配置为从训练数据集中每个类中心下属的多个第一样本中确定出一个第一样本作为该类中心下属的第二样本;将所有类中心下属的第二样本组成历史样本队列。
可选地,第一计算模块305还被配置为对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和,得到该每个第一样本对应的第三余弦相似度;根据每个第一样本对应的第三余弦相似度,利用样本梯度公式计算所有第一样本对应的梯度;根据每个第一样本对应的第三余弦相似度,利用类中心梯度公式计算所有类中心对应的梯度。
对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和,其中权值可以提前设置。
样本梯度公式:
Gx=(cos(θ)-1(t=y))Δx
Figure BDA0004022424180000121
cos(θ)为第一样本对应的第三余弦相似度,t为第一样本所属类中心,y为第一样本的标签,x为第一样本的第一样本特征,“1(t=y)”表示当t等于y,取1,当t不等于y,取0。
每个第一样本均会对应一个cos(θ)-1(t=y))Δx的值,∑(cos(θ)-1(t=y))Δx是对所有第一样本对应的cos(θ)-1(t=y))Δx的值求和。
当t等于y,Gx=∑(cos(θ)-1)Δx
当t不等于y,Gx=∑(cos(θ)-0)Δx
类中心梯度公式:
Gw=∑(cos(θ)-1(t=y))Δw
Figure BDA0004022424180000131
cos(θ)为第一样本对应的第三余弦相似度,t为第一样本所属类中心,y为第一样本的标签,w为第一样本所属类中心的类中心特征,“1(t=y)”表示当t等于y,取1,当t不等于y,取0。
上述对人脸识别模型的训练可以看做是整体的训练过程或者一个批次的训练过程,实际上需要对人脸识别模型进行的多个批次的训练。
可选地,训练模块307还被配置为利用人脸识别模型提取当前批次中每个类中心的类中心特征和每个第一样本的第一样本特征,利用人脸识别模型提取当前批次对应的历史样本队列中每个第二样本的第二样本特征,其中,每个批次均包括从训练数据集选出的多个类中心以及每个类中心下属的多个第一样本,原始的历史样本队列(第一批次对应的历史样本队列)是对人脸识别模型进行第一批次的训练时根据训练数据集生成的,每个批次对应的历史样本队列包括每个类中心下属的一个第二样本;计算当前批次中每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算当前批次中每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算当前批次中所有第一样本和所有类中心对应的梯度;基于当前批次中所有第一样本和所有类中心对应的梯度,完成当前批次对人脸识别模型的训练,更新历史样本队列。
其中,在完成当前批次对人脸识别模型的训练后,更新历史样本队列,包括:从当前批次中的多个类中心以及每个类中心下属的多个第一样本确定出一个第一样本作为该类中心下属的第二样本;使用确定出的所有类中心下属的第二样本更新历史样本队列,更新后的历史样本队列是当前批次的下一个批次对应的历史样本队列,或者说,当前批次对应的历史样本队列是当前批次的上一个批次对人脸识别模型的训练后,更新得到的。
需要说明的是,在每个批次对人脸识别模型的训练中,样本的类中心也是不断更新的,这都是现有方法,在此不在赘述。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
图4是本公开实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。

Claims (10)

1.一种人脸识别模型的训练方法,其特征在于,包括:
利用全局平均池化层、全连接层和激活层构建注意力模块;
利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;
获取训练数据集,为所述训练数据集生成历史样本队列,其中,所述训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,所述历史样本队列包括每个类中心下属的一个第二样本;
利用所述人脸识别模型提取所述训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用所述人脸识别模型提取所述历史样本队列中每个第二样本的第二样本特征;
计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;
根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;
基于所有第一样本和所有类中心对应的梯度,完成对所述人脸识别模型的训练。
2.根据权利要求1所述的方法,其特征在于,利用全局平均池化层、全连接层和激活层构建注意力模块,包括:
依次连接所述全局平均池化层、所述全连接层、所述激活层、所述全连接层和所述激活层,得到所述注意力模块。
3.根据权利要求1所述的方法,其特征在于,利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支,包括:
将每个残差模块的输入记作第一特征,输出记作第二特征;
将每个残差模块输出的第二特征输入该残差模块后的注意力分支,输出第三特征;
将每个残差模块输出的第二特征与该残差模块后的注意力分支输出的第三特征相乘,得到第四特征;
将输入每个残差模块的第一特征与其对应的第四特征相加,得到第五特征。
4.根据权利要求1所述的方法,其特征在于,获取训练数据集,为所述训练数据集生成历史样本队列,包括:
从所述训练数据集中每个类中心下属的多个第一样本中确定出一个第一样本作为该类中心下属的第二样本;
将所有类中心下属的第二样本组成所述历史样本队列。
5.根据权利要求1所述的方法,其特征在于,根据每个第一样本对应的第一余弦相似度和第二余弦相似度,计算所有第一样本和所有类中心对应的梯度,包括:
对每个第一样本对应的第一余弦相似度和第二余弦相似度加权求和,得到该每个第一样本对应的第三余弦相似度;
根据每个第一样本对应的第三余弦相似度,利用样本梯度公式计算所有第一样本对应的梯度;
根据每个第一样本对应的第三余弦相似度,利用类中心梯度公式计算所有类中心对应的梯度。
6.根据权利要求5所述的方法,其特征在于,样本梯度公式:
Gx=(cos(θ)-1(t=y))Δx
Figure FDA0004022424170000021
cos(θ)为第一样本对应的第三余弦相似度,t为第一样本所属类中心,y为第一样本的标签,x为第一样本的第一样本特征,“1(t=y)”表示当t等于y,取1,当t不等于y,取0。
7.根据权利要求5所述的方法,其特征在于,类中心梯度公式:
Gw=(cos(θ)-1(t=y))Δw
Figure FDA0004022424170000031
cos(θ)为第一样本对应的第三余弦相似度,t为第一样本所属类中心,y为第一样本的标签,w为第一样本所属类中心的类中心特征,“1(t=y)”表示当t等于y,取1,当t不等于y,取0。
8.一种人脸识别模型的训练装置,其特征在于,包括:
第一构建模块,被配置为利用全局平均池化层、全连接层和激活层构建注意力模块;
第二构建模块,被配置为利用所述注意力模块在残差网络模型中的每个残差模块后构建注意力分支,得到人脸识别模型;
获取模块,被配置为获取训练数据集,为所述训练数据集生成历史样本队列,其中,所述训练数据集,包括:多个类中心以及每个类中心下属的多个第一样本,所述历史样本队列包括每个类中心下属的一个第二样本;
提取模块,被配置为利用所述人脸识别模型提取所述训练数据集中每个类中心的类中心特征和每个第一样本的第一样本特征,利用所述人脸识别模型提取所述历史样本队列中每个第二样本的第二样本特征;
第一计算模块,被配置为计算每个第一样本所属类中心的类中心特征与该第一样本的第一样本特征之间的第一余弦相似度,计算每个第一样本的第一样本特征与该第一样本所属类中心的第二样本的第二样本特征之间的第二余弦相似度;
第二计算模块,被配置为根据每个第一样本对应的第一余弦相似度和第二余弦相似度,分别计算所有第一样本和所有类中心对应的梯度;
训练模块,被配置为基于所有第一样本和所有类中心对应的梯度,完成对所述人脸识别模型的训练。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202211696114.5A 2022-12-28 2022-12-28 人脸识别模型的训练方法及装置 Pending CN115830692A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211696114.5A CN115830692A (zh) 2022-12-28 2022-12-28 人脸识别模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211696114.5A CN115830692A (zh) 2022-12-28 2022-12-28 人脸识别模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN115830692A true CN115830692A (zh) 2023-03-21

Family

ID=85518926

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211696114.5A Pending CN115830692A (zh) 2022-12-28 2022-12-28 人脸识别模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN115830692A (zh)

Similar Documents

Publication Publication Date Title
CN113221183B (zh) 实现隐私保护的多方协同更新模型的方法、装置及系统
US11651198B2 (en) Data processing method and apparatus for neural network
CN116403250A (zh) 存在遮挡的人脸识别方法及装置
CN112948885A (zh) 实现隐私保护的多方协同更新模型的方法、装置及系统
CN117392260A (zh) 一种图像生成方法及装置
CN116935083B (zh) 一种图像聚类方法和装置
CN116612500B (zh) 行人重识别模型训练方法及装置
CN113778078A (zh) 定位信息生成方法、装置、电子设备和计算机可读介质
CN115953803A (zh) 人体识别模型的训练方法及装置
CN111915689A (zh) 用于生成目标函数的方法、装置、电子设备和计算机可读介质
CN115830692A (zh) 人脸识别模型的训练方法及装置
CN111709784B (zh) 用于生成用户留存时间的方法、装置、设备和介质
CN115830691A (zh) 人脸识别模型的训练方法及装置
CN116912633B (zh) 目标追踪模型的训练方法及装置
CN115937929A (zh) 针对难例样本的人脸识别模型的训练方法及装置
CN115862117A (zh) 存在遮挡的人脸识别方法及装置
CN115661899A (zh) 针对难例样本的人脸识别模型的训练方法及装置
CN117392731B (zh) 表情识别模型的训练方法和装置
CN116912631B (zh) 目标识别方法、装置、电子设备及存储介质
CN115186757A (zh) 自注意力模型的训练方法及装置
CN114298320A (zh) 联合学习的贡献值计算方法、装置、电子设备及存储介质
CN115062630B (zh) 机器人昵称的确认方法及装置
CN115731623A (zh) 人体与人脸联合检测方法及装置
CN115953802A (zh) 人体识别模型的训练方法及装置
CN115760791A (zh) 图片质量评估方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination