CN115661891A - 避免数据长尾问题的人脸识别模型的训练方法及装置 - Google Patents

避免数据长尾问题的人脸识别模型的训练方法及装置 Download PDF

Info

Publication number
CN115661891A
CN115661891A CN202211226979.5A CN202211226979A CN115661891A CN 115661891 A CN115661891 A CN 115661891A CN 202211226979 A CN202211226979 A CN 202211226979A CN 115661891 A CN115661891 A CN 115661891A
Authority
CN
China
Prior art keywords
training
network
sample
vector set
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211226979.5A
Other languages
English (en)
Inventor
请求不公布姓名
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xumi Yuntu Space Technology Co Ltd
Original Assignee
Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xumi Yuntu Space Technology Co Ltd filed Critical Shenzhen Xumi Yuntu Space Technology Co Ltd
Priority to CN202211226979.5A priority Critical patent/CN115661891A/zh
Publication of CN115661891A publication Critical patent/CN115661891A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本公开涉及人脸识别技术领域,提供了一种避免数据长尾问题的人脸识别模型的训练方法及装置。该方法包括:构建人脸识别模型;获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;将样本集输入特征提取网络,得到样本集对应的特征向量集;将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环。

Description

避免数据长尾问题的人脸识别模型的训练方法及装置
技术领域
本公开涉及人脸识别技术领域,尤其涉及一种避免数据长尾问题的人脸识别模型的训练方法及装置。
背景技术
人脸识别在实际应用场景下,通常会存在长尾效应,长尾效应又可以称之为数据长尾问题。长尾效应是指,训练数据集中的一少部分类别(头部类别)占据了绝大多数样本量,大多数的类别(尾部类别)仅有非常少的样本量。由于数据分布的严重不均衡,导致训练后的人脸识别模型会出现模型退化或过拟合的问题。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:由于数据长尾问题,训练后的人脸识别模型存在模型退化或过拟合的问题。
发明内容
有鉴于此,本公开实施例提供了一种避免数据长尾问题的人脸识别模型的训练方法、、装置、电子设备及计算机可读存储介质,以解决现有技术中,由于数据长尾问题,训练后的人脸识别模型存在模型退化或过拟合的问题。
本公开实施例的第一方面,提供了一种避免数据长尾问题的人脸识别模型的训练方法,包括:构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环。
本公开实施例的第二方面,提供了一种避免数据长尾问题的人脸识别模型的训练装置,包括:构建模块,被配置为构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;获取模块,被配置为获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:采样模块,被配置为利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;特征提取模块,被配置为将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;归一化模块,被配置为将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;损失计算模块,被配置为根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;更新模块,被配置为根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环。
本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环,因此,采用上述技术手段,可以解决现有技术中,由于数据长尾问题,训练后的人脸识别模型存在模型退化或过拟合的问题,进而避免数据长尾问题造成的模型退化或过拟合。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本公开实施例的应用场景的场景示意图;
图2是本公开实施例提供的一种避免数据长尾问题的人脸识别模型的训练方法的流程示意图;
图3是本公开实施例提供的一种避免数据长尾问题的人脸识别模型的训练装置的结构示意图;
图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
下面将结合附图详细说明根据本公开实施例的一种避免数据长尾问题的人脸识别模型的训练方法和装置。
图1是本公开实施例的应用场景的场景示意图。该应用场景可以包括终端设备101、102和103、服务器104以及网络105。
终端设备101、102和103可以是硬件,也可以是软件。当终端设备101、102和103为硬件时,其可以是具有显示屏且支持与服务器104通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备101、102和103为软件时,其可以安装在如上的电子设备中。终端设备101、102和103可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备101、102和103上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
服务器104可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器104可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本公开实施例对此不作限制。
需要说明的是,服务器104可以是硬件,也可以是软件。当服务器104为硬件时,其可以是为终端设备101、102和103提供各种服务的各种电子设备。当服务器104为软件时,其可以是为终端设备101、102和103提供各种服务的多个软件或软件模块,也可以是为终端设备101、102和103提供各种服务的单个软件或软件模块,本公开实施例对此不作限制。
网络105可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near FieldCommunication,NFC)、红外(Infrared)等,本公开实施例对此不作限制。
用户可以通过终端设备101、102和103经由网络105与服务器104建立通信连接,以接收或发送信息等。需要说明的是,终端设备101、102和103、服务器104以及网络105的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本公开实施例对此不作限制。
图2是本公开实施例提供的一种避免数据长尾问题的人脸识别模型的训练方法的流程示意图。图2的避免数据长尾问题的人脸识别模型的训练方法可以由图1的计算机或服务器,或者计算机或服务器上的软件执行。如图2所示,该避免数据长尾问题的人脸识别模型的训练方法包括:
S201,构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;
S202,获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:
S203,利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;
S204,将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;
S205,将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;
S206,根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;
S207,根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环。
特征提取网络可以为resnet50,分类网络可以是全连接层网络,对比网络是本公开以对比学习为原理,自行构建的网络。
根据本公开实施例提供的技术方案,构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环,因此,采用上述技术手段,可以解决现有技术中,由于数据长尾问题,训练后的人脸识别模型存在模型退化或过拟合的问题,进而避免数据长尾问题造成的模型退化或过拟合。
目前解决长尾效应的有效方法主要是类别重平衡策略,旨在缓解训练数据的极端不平衡。总体上,类别重平衡可以划分为两大类,重采样(re-sampling)和重赋值(re-weighting)。这些方法通过在一个批处理中进行样本重采样,对损失重新赋权重调整网络的训练,使得训练中的样本分布与测试中的样本分布更加接近。尽管重平衡策略取得了准确率的提升,但是仍不能忽略因此带来的副作用。这类方法将会在一定程度上损害被习得的深层特征的表示能力。具体来说,当数据不平衡非常严重时,重采样有过拟合尾部数据的风险(过采样),也有欠拟合整个数据分布的风险。对重赋值来说,它会通过直接改变甚至反转数据呈现频率来扭曲原始分布。这些都对特征表示造成了损害。本公开实施例通过动态采样以及综合利用分类损失和对比损失训练模型,所以可以极好避免的数据长尾问题。
利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集,包括:基于当前轮训练对应的训练轮数和预设轮数,计算动态调节函数的函数值;基于函数值,分别计算出训练数据集中每种类别的样本的采样概率;基于每种类别的样本的采样概率,完成当前轮训练的采样,得到当前轮训练所用的样本集。
因为每轮训练对应的训练轮数是不一样的,所以每轮训练对应的函数值不一样,所以每轮训练在训练数据集中每种类别的样本的采样概率不一样,进而实现动态采样,避免数据长尾问题中部分尾部数据被使用的次数少的问题。
动态采样器,包括:
Figure BDA0003880191130000071
Figure BDA0003880191130000072
其中,j和i均为样本的类别,C为训练数据集中样本的所有类别的数量,l为当前轮训练对应的训练轮数,L为预设轮数,π为圆周率,g(l)为函数值,nj是第j类别的所有样本的数量,ni是第i类别的所有样本的数量,pj为第j类别的样本的采样概率。
本公开实施例是人脸识别领域下的训练数据集,每个人脸图像为一个样本,样本的特征向量间的距离小于预设距离的为一个类别(判断两个或多个样本是不是一个类别可以是用最近邻规则判断的)。sin()为正弦函数,
Figure BDA0003880191130000073
为所有
Figure BDA0003880191130000074
和。
根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,包括:特征向量集,包括:第一向量集和第二向量集,其中,第一向量集中的每条特征向量均在第二向量集中存在对应的特征向量,第一向量集和第二向量集中两条对应的特征向量为同一标识号下的两个不同的样本所对应的特征向量;根据经过归一化网络处理后的第一向量集,利用分类网络计算第一分类损失,根据经过归一化网络处理后的第二向量集,利用分类网络计算第二分类损失,其中,分类损失,包括:第一分类损失和第二分类损失。
同理,样本集,包括:第一样本集和第二样本集;第一样本集中的一个样本对应第一向量集中的一条特征向量,第二样本集中的一个样本对应第二向量集中的一条特征向量。实际上,在进行当前轮训练的采样,采样得到第一样本集,然后根据第一样本集中样本的标识号,采样得到第二样本集,同一个人的人脸图像具有相同的标识号。本公开实施例不同于现有技术的是,实际计算的是两个分类损失:第一分类损失和第二分类损失,这也会是为了避免数据长尾问题中部分尾部数据被使用的次数少的问题。
分类网络,包括:
Figure BDA0003880191130000081
Figure BDA0003880191130000082
其中,Lcls为当前批次的分类损失,N为当前批次中样本的数量,当前轮训练包括多个批次,h为样本的序号,yh为第h个样本的类别,j为当前批次中除第h个样本的类别之外的任意一种类别,n为当前批次中样本的所有类别的数量,
Figure BDA0003880191130000083
为第h个样本与正样本类中心的夹角,θj为第h个样本与负样本类中心的夹角,s与M为预设超参数,c是调节系数,Ki是类别i的所有样本的数量,min()为取最小值函数。
当前轮训练中多个批次的训练,是类似于多轮训练的。本公开实施例的创造性的点在于将现有技术中设为预设超参数的m,调整为了一个动态变化的函数。当然分类损失包括第一分类损失和第二分类损失也是本公开实施例具有创造性的发明点。实际上,无论是分类损失还是对比损失,都是按照批次计算的,在进行当前轮训练中多个批次的训练后,再进行下一轮训练中多个批次的训练。
根据经过归一化网络处理后的第一向量集,利用分类网络计算得到的第一分类损失;根据经过归一化网络处理后的第二向量集,利用分类网络计算得到的第二分类损失。
对比网络,包括:
Figure BDA0003880191130000091
其中,Lcon为当前批次的对比损失,N为第一向量集和第二向量集中任意一个集合的当前批次中样本的数量,2N为第一向量集和第二向量集中两个集合的当前批次中样本的数量,i为当前批次中样本的序号,当前轮训练包括多个批次,P(i)为在当前批次内第i个样本所对应的所有正样本,A(i)为在当前批次内第i个样本所对应的所有负样本,τ是调节系数,zi是第i个样本的特征向量,zp是P(i)对应的所有特征向量,za是A(i)对应的所有特征向量,p为P(i)中样本的序号,a为A(i)中样本的序号,特征向量集,包括:第一向量集和第二向量集,第一向量集中的每条特征向量均在第二向量集中存在对应的特征向量,第一向量集和第二向量集中两条对应的特征向量为同一标识号下的两个不同的样本所对应的特征向量。
exp为以自然常数e为底的指数函数。
根据分类损失和对比损失更新人脸识别模型的模型参数,包括:通过如下公式确定总损失,利用总损失更新人脸识别模型的模型参数:
Lzon=f(l)*(Lcls1+Lcls2)+Lcon
Figure BDA0003880191130000092
其中,l为当前轮训练对应的训练轮数,L为预设轮数,Lzon为当前批次的总损失,Lcon为当前批次的分类损失,Lcls1为当前批次的第一分类损失,Lcls2为当前批次的第二分类损失,当前轮训练包括多个批次。如上述公式,本公开实施例是结合分类损失、第一分类损失和第二分类损失,得到总损失。
在一个可选实施例中,执行如下循环以进行当前轮训练中多个批次的训练,包括:根据批处理条数从经过所述归一化网络处理后的第一向量集中确定出当前批次训练所用的第三向量集,根据批处理条数从经过所述归一化网络处理后的第二向量集中,确定出当前批次训练所用的第四向量集;利用分类网络计算第三向量集对应的第一分类损失,利用分类网络计算第四向量集对应的第二分类损失;利用对比网络计算第三向量集和第四向量集对应的对比损失;根据分类损失、第一分类损失和第二分类损失,确定总损失,根据总损失更新所述人脸识别模型的模型参数,将当前批次训练对应的训练批次加一,并在训练批次等于预设次数时,结束循环。
此外,还可以将当前轮训练中所有批次训练中的第一分类损失的和,作为根据经过归一化网络处理后的第一向量集,利用分类网络计算得到的第一分类损失;将当前轮训练中所有批次训练中的第二分类损失的和,作为根据经过归一化网络处理后的第二向量集,利用分类网络计算得到的第二分类损失;将当前轮训练中所有批次训练中的对比损失的和,作为根据经过归一化网络处理后的特征向量集,利用分类网络计算得到的对比损失。
上述所有可选技术方案,可以采用任意结合形成本申请的可选实施例,在此不再一一赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图3是本公开实施例提供的一种避免数据长尾问题的人脸识别模型的训练装置的示意图。如图3所示,该避免数据长尾问题的人脸识别模型的训练装置包括:
构建模块301,被配置为构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;
获取模块302,被配置为获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:
采样模块303,被配置为利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;
特征提取模块304,被配置为将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;
归一化模块305,被配置为将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;
损失计算模块306,被配置为根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;
更新模块307,被配置为根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环。
特征提取网络可以为resnet50,分类网络可以是全连接层网络,对比网络是本公开以对比学习为原理,自行构建的网络。
根据本公开实施例提供的技术方案,构建人脸识别模型,其中,人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;获取训练数据集,执行如下循环以对人脸识别模型进行多轮训练:利用动态采样器从训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;将样本集输入特征提取网络,得到样本集对应的特征向量集,其中,样本集中的一个样本对应特征向量集中的一条特征向量;将特征向量集输入归一化网络,以对特征向量集中的特征向量进行归一化处理;根据经过归一化网络处理后的特征向量集,利用分类网络计算分类损失,利用对比网络计算对比损失;根据分类损失和对比损失更新人脸识别模型的模型参数,将当前轮训练对应的训练轮数加一,并在训练轮数等于预设轮数时,结束循环,因此,采用上述技术手段,可以解决现有技术中,由于数据长尾问题,训练后的人脸识别模型存在模型退化或过拟合的问题,进而避免数据长尾问题造成的模型退化或过拟合。
目前解决长尾效应的有效方法主要是类别重平衡策略,旨在缓解训练数据的极端不平衡。总体上,类别重平衡可以划分为两大类,重采样(re-sampling)和重赋值(re-weighting)。这些方法通过在一个批处理中进行样本重采样,对损失重新赋权重调整网络的训练,使得训练中的样本分布与测试中的样本分布更加接近。尽管重平衡策略取得了准确率的提升,但是仍不能忽略因此带来的副作用。这类方法将会在一定程度上损害被习得的深层特征的表示能力。具体来说,当数据不平衡非常严重时,重采样有过拟合尾部数据的风险(过采样),也有欠拟合整个数据分布的风险。对重赋值来说,它会通过直接改变甚至反转数据呈现频率来扭曲原始分布。这些都对特征表示造成了损害。本公开实施例通过动态采样以及综合利用分类损失和对比损失训练模型,所以可以极好避免的数据长尾问题。
可选地,采样模块303还被配置为基于当前轮训练对应的训练轮数和预设轮数,计算动态调节函数的函数值;基于函数值,分别计算出训练数据集中每种类别的样本的采样概率;基于每种类别的样本的采样概率,完成当前轮训练的采样,得到当前轮训练所用的样本集。
因为每轮训练对应的训练轮数是不一样的,所以每轮训练对应的函数值不一样,所以每轮训练在训练数据集中每种类别的样本的采样概率不一样,进而实现动态采样,避免数据长尾问题中部分尾部数据被使用的次数少的问题。
动态采样器,包括:
Figure BDA0003880191130000121
Figure BDA0003880191130000122
其中,j和i均为样本的类别,C为训练数据集中样本的所有类别的数量,l为当前轮训练对应的训练轮数,L为预设轮数,π为圆周率,g(l)为函数值,nj是第j类别的所有样本的数量,ni是第i类别的所有样本的数量,pj为第j类别的样本的采样概率。
本公开实施例是人脸识别领域下的训练数据集,每个人脸图像为一个样本,样本的特征向量间的距离小于预设距离的为一个类别(判断两个或多个样本是不是一个类别可以是用最近邻规则判断的)。sin()为正弦函数,
Figure BDA0003880191130000131
为所有
Figure BDA0003880191130000132
和。
可选地,损失计算模块306还被配置为特征向量集,包括:第一向量集和第二向量集,其中,第一向量集中的每条特征向量均在第二向量集中存在对应的特征向量,第一向量集和第二向量集中两条对应的特征向量为同一标识号下的两个不同的样本所对应的特征向量;根据经过归一化网络处理后的第一向量集,利用分类网络计算第一分类损失,根据经过归一化网络处理后的第二向量集,利用分类网络计算第二分类损失,其中,分类损失,包括:第一分类损失和第二分类损失。
同理,样本集,包括:第一样本集和第二样本集;第一样本集中的一个样本对应第一向量集中的一条特征向量,第二样本集中的一个样本对应第二向量集中的一条特征向量。实际上,在进行当前轮训练的采样,采样得到第一样本集,然后根据第一样本集中样本的标识号,采样得到第二样本集,同一个人的人脸图像具有相同的标识号。本公开实施例不同于现有技术的是,实际计算的是两个分类损失:第一分类损失和第二分类损失,这也会是为了避免数据长尾问题中部分尾部数据被使用的次数少的问题。
分类网络,包括:
Figure BDA0003880191130000133
Figure BDA0003880191130000134
其中,Lcls为当前批次的分类损失,N为当前批次中样本的数量,当前轮训练包括多个批次,h为样本的序号,yh为第h个样本的类别,j为当前批次中除第h个样本的类别之外的任意一种类别,n为当前批次中样本的所有类别的数量,
Figure BDA0003880191130000141
为第h个样本与正样本类中心的夹角,θj为第h个样本与负样本类中心的夹角,s与M为预设超参数,c是调节系数,Ki是类别i的所有样本的数量,min()为取最小值函数。
当前轮训练中多个批次的训练,是类似于多轮训练的,多个批次的训练是和现有技术一样的,在此不在赘述。本公开实施例的创造性的点在于将现有技术中设为预设超参数的m,调整为了一个动态变化的函数。当然分类损失包括第一分类损失和第二分类损失也是本公开实施例具有创造性的发明点。实际上,无论是分类损失还是对比损失,都是按照批次计算的,在进行当前轮训练中多个批次的训练后,再进行下一轮训练中多个批次的训练。
对比网络,包括:
Figure BDA0003880191130000142
其中,Lcon为当前批次的对比损失,N为第一向量集和第二向量集中任意一个集合的当前批次中样本的数量,2N为第一向量集和第二向量集中两个集合的当前批次中样本的数量,i为当前批次中样本的序号,当前轮训练包括多个批次,P(i)为在当前批次内第i个样本所对应的所有正样本,A(i)为在当前批次内第i个样本所对应的所有负样本,τ是调节系数,zi是第i个样本的特征向量,zp是P(i)对应的所有特征向量,za是A(i)对应的所有特征向量,p为P(i)中样本的序号,a为A(i)中样本的序号,特征向量集,包括:第一向量集和第二向量集,第一向量集中的每条特征向量均在第二向量集中存在对应的特征向量,第一向量集和第二向量集中两条对应的特征向量为同一标识号下的两个不同的样本所对应的特征向量。
可选地,更新模块307还被配置为通过如下公式确定总损失,利用总损失更新人脸识别模型的模型参数:
Lzon=f(l)*(Lcls1+Lcls2)+Lcon
Figure BDA0003880191130000151
其中,l为当前轮训练对应的训练轮数,L为预设轮数,Lzon为当前批次的总损失,Lcon为当前批次的分类损失,Lcls1为当前批次的第一分类损失,Lcls2为当前批次的第二分类损失,当前轮训练包括多个批次。如上述公式,本公开实施例是结合分类损失、第一分类损失和第二分类损失,得到总损失。
可选地,更新模块307还被配置为根据批处理条数从经过所述归一化网络处理后的第一向量集中确定出当前批次训练所用的第三向量集,根据批处理条数从经过所述归一化网络处理后的第二向量集中,确定出当前批次训练所用的第四向量集;利用分类网络计算第三向量集对应的第一分类损失,利用分类网络计算第四向量集对应的第二分类损失;利用对比网络计算第三向量集和第四向量集对应的对比损失;根据分类损失、第一分类损失和第二分类损失,确定总损失,根据总损失更新所述人脸识别模型的模型参数,将当前批次训练对应的训练批次加一,并在训练批次等于预设次数时,结束循环。
此外,还可以将当前轮训练中所有批次训练中的第一分类损失的和,作为根据经过归一化网络处理后的第一向量集,利用分类网络计算得到的第一分类损失;将当前轮训练中所有批次训练中的第二分类损失的和,作为根据经过归一化网络处理后的第二向量集,利用分类网络计算得到的第二分类损失;将当前轮训练中所有批次训练中的对比损失的和,作为根据经过归一化网络处理后的特征向量集,利用分类网络计算得到的对比损失。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
图4是本公开实施例提供的电子设备4的示意图。如图4所示,该实施例的电子设备4包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
电子设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备4可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备4的示例,并不构成对电子设备4的限定,可以包括比图示更多或更少的部件,或者不同的部件。
处理器401可以是中央处理单元(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
存储器402可以是电子设备4的内部存储单元,例如,电子设备4的硬盘或内存。存储器402也可以是电子设备4的外部存储设备,例如,电子设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。存储器402还可以既包括电子设备4的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。

Claims (10)

1.一种避免数据长尾问题的人脸识别模型的训练方法,其特征在于,包括:
构建人脸识别模型,其中,所述人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;
获取训练数据集,执行如下循环以对所述人脸识别模型进行多轮训练:
利用动态采样器从所述训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;
将所述样本集输入所述特征提取网络,得到所述样本集对应的特征向量集,其中,所述样本集中的一个样本对应所述特征向量集中的一条特征向量;
将所述特征向量集输入所述归一化网络,以对所述特征向量集中的特征向量进行归一化处理;
根据经过所述归一化网络处理后的特征向量集,利用所述分类网络计算分类损失,利用所述对比网络计算对比损失;
根据所述分类损失和所述对比损失更新所述人脸识别模型的模型参数,将所述当前轮训练对应的训练轮数加一,并在所述训练轮数等于预设轮数时,结束循环。
2.根据权利要求1所述的方法,其特征在于,所述利用动态采样器从所述训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集,包括:
基于所述当前轮训练对应的训练轮数和所述预设轮数,计算动态调节函数的函数值;
基于所述函数值,分别计算出所述训练数据集中每种类别的样本的采样概率;
基于每种类别的样本的采样概率,完成当前轮训练的采样,得到当前轮训练所用的样本集。
3.根据权利要求2所述的方法,其特征在于,所述动态采样器,包括:
Figure FDA0003880191120000021
Figure FDA0003880191120000022
其中,j和i均为样本的类别,C为所述训练数据集中样本的所有类别的数量,l为所述当前轮训练对应的训练轮数,L为所述预设轮数,π为圆周率,g(l)为所述函数值,nj是第j类别的所有样本的数量,ni是第i类别的所有样本的数量,pj为第j类别的样本的采样概率。
4.根据权利要求1所述的方法,其特征在于,所述根据经过所述归一化网络处理后的特征向量集,利用所述分类网络计算分类损失,包括:
所述特征向量集,包括:第一向量集和第二向量集,其中,所述第一向量集中的每条特征向量均在所述第二向量集中存在对应的特征向量,所述第一向量集和所述第二向量集中两条对应的特征向量为同一标识号下的两个不同的样本所对应的特征向量;
根据经过所述归一化网络处理后的第一向量集,利用所述分类网络计算第一分类损失,根据经过所述归一化网络处理后的第二向量集,利用所述分类网络计算第二分类损失,其中,所述分类损失,包括:所述第一分类损失和所述第二分类损失。
5.根据权利要求1所述的方法,其特征在于,所述分类网络,包括:
Figure FDA0003880191120000023
Figure FDA0003880191120000024
其中,Lcls为当前批次的分类损失,N为当前批次中样本的数量,当前轮训练包括多个批次,h为样本的序号,yh为第h个样本的类别,j为当前批次中除第h个样本的类别之外的任意一种类别,n为当前批次中样本的所有类别的数量,
Figure FDA0003880191120000031
为第h个样本与正样本类中心的夹角,θj为第h个样本与负样本类中心的夹角,s与M为预设超参数,c是调节系数,Ki是类别i的所有样本的数量,min()为取最小值函数。
6.根据权利要求1所述的方法,其特征在于,所述对比网络,包括:
Figure FDA0003880191120000032
其中,Lcon为当前批次的对比损失,N为第一向量集和第二向量集中任意一个集合的当前批次中样本的数量,2N为第一向量集和第二向量集中两个集合的当前批次中样本的数量,i为当前批次中样本的序号,当前轮训练包括多个批次,P(i)为在当前批次内第i个样本所对应的所有正样本,A(i)为在当前批次内第i个样本所对应的所有负样本,τ是调节系数,zi是第i个样本的特征向量,zp是P(i)对应的所有特征向量,za是A(i)对应的所有特征向量,p为P(i)中样本的序号,a为A(i)中样本的序号,所述特征向量集,包括:所述第一向量集和所述第二向量集,所述第一向量集中的每条特征向量均在所述第二向量集中存在对应的特征向量,所述第一向量集和所述第二向量集中两条对应的特征向量为同一标识号下的两个不同的样本所对应的特征向量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述分类损失和所述对比损失更新所述人脸识别模型的模型参数,包括:
通过如下公式确定总损失,利用所述总损失更新所述人脸识别模型的模型参数:
Lzon=f(l)*(Lcls1+Lcls2)+Lcon
Figure FDA0003880191120000033
其中,l为所述当前轮训练对应的训练轮数,L为所述预设轮数,Lzon为当前批次的总损失,Lcon为当前批次的分类损失,Lcls1为当前批次的第一分类损失,Lcls2为当前批次的第二分类损失,当前轮训练包括多个批次。
8.一种避免数据长尾问题的人脸识别模型的训练装置,其特征在于,包括:
构建模块,被配置为构建人脸识别模型,其中,所述人脸识别模型,包括:特征提取网络、归一化网络、分类网络和对比网络;
获取模块,被配置为获取训练数据集,执行如下循环以对所述人脸识别模型进行多轮训练:
采样模块,被配置为利用动态采样器从所述训练数据集中进行当前轮训练的采样,得到当前轮训练所用的样本集;
特征提取模块,被配置为将所述样本集输入所述特征提取网络,得到所述样本集对应的特征向量集,其中,所述样本集中的一个样本对应所述特征向量集中的一条特征向量;
归一化模块,被配置为将所述特征向量集输入所述归一化网络,以对所述特征向量集中的特征向量进行归一化处理;
损失计算模块,被配置为根据经过所述归一化网络处理后的特征向量集,利用所述分类网络计算分类损失,利用所述对比网络计算对比损失;
更新模块,被配置为根据所述分类损失和所述对比损失更新所述人脸识别模型的模型参数,将所述当前轮训练对应的训练轮数加一,并在所述训练轮数等于预设轮数时,结束循环。
9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
CN202211226979.5A 2022-10-09 2022-10-09 避免数据长尾问题的人脸识别模型的训练方法及装置 Pending CN115661891A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211226979.5A CN115661891A (zh) 2022-10-09 2022-10-09 避免数据长尾问题的人脸识别模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211226979.5A CN115661891A (zh) 2022-10-09 2022-10-09 避免数据长尾问题的人脸识别模型的训练方法及装置

Publications (1)

Publication Number Publication Date
CN115661891A true CN115661891A (zh) 2023-01-31

Family

ID=84984658

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211226979.5A Pending CN115661891A (zh) 2022-10-09 2022-10-09 避免数据长尾问题的人脸识别模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN115661891A (zh)

Similar Documents

Publication Publication Date Title
CN108197652B (zh) 用于生成信息的方法和装置
WO2022161357A1 (zh) 基于数据增强的训练样本获取方法、装置和电子设备
CN112650841A (zh) 信息处理方法、装置和电子设备
WO2023020214A1 (zh) 检索模型的训练和检索方法、装置、设备及介质
CN114139013A (zh) 图像搜索方法、装置、电子设备及计算机可读存储介质
CN116403250A (zh) 存在遮挡的人脸识别方法及装置
CN116935083B (zh) 一种图像聚类方法和装置
CN112241761A (zh) 模型训练方法、装置和电子设备
CN115953803A (zh) 人体识别模型的训练方法及装置
CN115661891A (zh) 避免数据长尾问题的人脸识别模型的训练方法及装置
CN115841144A (zh) 一种文本检索模型的训练方法及装置
CN114861064A (zh) 基于双塔模型的对象推荐方法及装置
CN115147870A (zh) 行人再识别方法及装置
CN113779346A (zh) 用于识别一人多账号的方法及装置
CN110163761B (zh) 基于图像处理的可疑项目成员识别方法及装置
CN113486749A (zh) 图像数据收集方法、装置、电子设备和计算机可读介质
CN116912631B (zh) 目标识别方法、装置、电子设备及存储介质
CN116911313B (zh) 一种语义漂移文本的识别方法及装置
CN111753111A (zh) 图片搜索方法和装置
CN115830692A (zh) 人脸识别模型的训练方法及装置
CN115661899A (zh) 针对难例样本的人脸识别模型的训练方法及装置
CN114332991A (zh) 考勤结果的确认方法及装置
CN117893275A (zh) 基于推荐模型的商品推荐方法、装置及电子设备
CN115731623A (zh) 人体与人脸联合检测方法及装置
CN115830691A (zh) 人脸识别模型的训练方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination