CN108985135A

CN108985135A - 一种人脸检测器训练方法、装置及电子设备

Info

Publication number: CN108985135A
Application number: CN201710406726.9A
Authority: CN
Inventors: 王浩; 李志锋; 季兴; 王同; 王一同
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2017-06-02
Filing date: 2017-06-02
Publication date: 2018-12-11
Also published as: US10929644B2; CN110490177A; WO2018219016A1; KR102236046B1; JP6855098B2; EP3633549A4; TWI665613B; US20210089752A1; JP2020501238A; US20190251333A1; KR20190116397A; EP3633549A1; US11594070B2; TW201832134A; MA48806A

Abstract

本发明实施例提供一种人脸检测器训练方法、装置及电子设备，该方法包括：获取当前次迭代的批数据训练样本；确定各训练样本对应的中心损失值；根据各训练样本对应的中心损失值，确定批数据训练样本对应的中心损失值；至少根据批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值；若人脸检测器的目标损失值未达到收敛条件，根据人脸检测器的目标损失值，更新CNN模型中的网络参数，并进入下一次迭代；若人脸检测器的目标损失值达到收敛条件，输出人脸检测器。本发明实施例能够使得人脸检测器在保证对人脸和非人脸具有较高的类间检测性能的同时，对于人脸的类内差异具有不变性，提升人脸检测的鲁棒性。

Description

一种人脸检测器训练方法、装置及电子设备

技术领域

本发明涉及图像处理技术领域，具体涉及一种人脸检测器训练方法、装置及电子设备。

背景技术

人脸检测是通过人脸检测器从图像中检测出人脸的技术，人脸检测器的训练好坏，直接影响到人脸的检测效果，因此如何优化人脸检测器的训练过程一直是本领域技术人员研究的重点。

随着深度学习的发展，基于CNN(Convolutional Neural Network，卷积神经网络)的人脸检测器训练已成为人脸检测器的一种主流训练方式，例如使用Faster RCNN(FasterRegion-based Convolutional Neural Network)的卷积神经网络进行人脸检测器的训练等；基于CNN的人脸检测器的训练过程主要是：构建CNN模型，通过训练样本进行迭代的训练，以在每次迭代时更新CNN模型的网络参数，实现人脸检测器的训练优化；其中，每次迭代时更新CNN模型的网络参数的过程，可以认为是人脸检测器的优化过程。

本发明的发明人发现，目前的人脸检测器的优化目标主要是最大化人脸和非人脸的差异(即最大化类间差异)，然而对于人脸和人脸之间的差异则没有太多的关注，这使得人脸检测器在应对不同场景下的人脸变化时，人脸检测的判别能力较弱，鲁棒性较差。

发明内容

有鉴于此，本发明实施例提供一种人脸检测器训练方法、装置及电子设备，以提升人脸检测器的人脸检测判别能力，提升人脸检测器的鲁棒性。

为实现上述目的，本发明实施例提供如下技术方案：

一种人脸检测器训练方法，包括：

获取当前次迭代的批数据训练样本，所述批数据训练样本包括多个训练样本，所述多个训练样本的样本类包括：正类和负类；

分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值；

根据所述各训练样本对应的中心损失值，确定所述批数据训练样本对应的中心损失值；

至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值；

若所述人脸检测器的目标损失值未达到设定的训练收敛条件，根据所述人脸检测器的目标损失值，更新卷积神经网络CNN模型的网络参数，并进入下一次迭代；

若所述人脸检测器的目标损失值达到设定的训练收敛条件，输出人脸检测器。

本发明实施例还提供一种人脸检测器训练装置，包括：

样本获取模块，用于获取当前次迭代的批数据训练样本，所述批数据训练样本包括多个训练样本，所述多个训练样本的样本类包括：正类和负类；

样本中心损失值确定模块，用于分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值；

批样本中心损失值确定模块，用于根据所述各训练样本对应的中心损失值，确定所述批数据训练样本对应的中心损失值；

检测器目标损失值确定模块，用于至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值；

参数更新模块，用于若所述人脸检测器的目标损失值未达到设定的训练收敛条件，根据所述人脸检测器的目标损失值，更新卷积神经网络CNN模型的网络参数，并进入下一次迭代；

检测器输出模块，用于若所述人脸检测器的目标损失值达到设定的训练收敛条件，输出人脸检测器。

本发明实施例还提供一种电子设备，包括：存储器和处理器；

所述存储器存储有程序，所述处理器调用所述程序，所述程序用于：

基于上述技术方案，本发明实施例提供的人脸检测器训练流程可以包括：获取当前次迭代的批数据训练样本，所述批数据训练样本包括多个训练样本，所述多个训练样本的样本类包括：正类和负类；分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值；根据所述各训练样本对应的中心损失值，确定所述批数据训练样本对应的中心损失值；至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值；如果所述人脸检测器的目标损失值未达到设定的训练收敛条件，则根据所述人脸检测器的目标损失值，更新CNN模型中的网络参数，并进入下一次迭代，直至人脸检测器的目标损失值达到设定的训练收敛条件；如果所述人脸检测器的目标损失值达到设定的训练收敛条件，则可输出人脸检测器，完成人脸检测器的训练。

本发明实施例中，人脸检测器的训练优化目标结合了批数据训练样本对应的中心损失值，可使得人脸检测器对于人脸和人脸之间的类内差异具有不变性，因此结合批数据训练样本对应的中心损失值进行人脸检测器的优化的训练，可使优化训练后的人脸检测器能够在保证对人脸和非人脸具有较高的类间检测性能的同时，对于人脸的类内差异具有不变性，提升人脸检测的鲁棒性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为CNN模型的结构；

图2为CNN模型的另一结构；

图3为电子设备的硬件结构框图；

图4为本发明实施例提供的人脸检测器训练方法的流程图；

图5为基于CNN模型的人脸检测器训练示意图；

图6为人脸框坐标回归损失值的确定方法流程图；

图7为批数据训练样本的获取方法流程图；

图8为本发明实施例提供的人脸检测器训练装置的结构框图；

图9为本发明实施例提供的人脸检测器训练装置的另一结构框图；

图10为本发明实施例提供的人脸检测器训练装置的再一结构框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例基于CNN所构建的一种可选的CNN模型可以如图1所示，包括：基础网络层，候选框预测层，人脸检测层；

其中，基础网络层可以是由一系列的卷积层(Convolution)和池化层(Pooling)依次连接构成的子网络，基础网络层可以通过一系列的卷积层对每一训练样本(训练样本可以是图像形式的样本)进行逐层的卷积处理，其中下一卷积层卷积处理上一卷积层输出的卷积处理结果；这里面，多层卷积层处理的图像特征中，浅层特征能够表示丰富的边缘角点、纹理结构等特征，深层特征是基于浅层特征的进一步抽象映射，通过多层卷积层的逐层卷积处理，可以实现不同层次的图像特征的提取；而针对每一训练样本，基础网络层输出的是最后一层的卷积层卷积处理后的特征图(Feature map)，特征图可以是图像特征的一种表示；

候选框预测层可以是全卷积结构的子网络，建立在基础网络层输出的图像特征之上，候选框预测层可以通过卷积层对每一训练样本的特征进行映射，从而通过映射的结点建立候选框分类器和候选框回归器，形成候选框检测器；候选框分类器可用于进行候选框(Proposals)的概率预测，候选框回归器可用于进行候选框的坐标预测，从而输出候选框(Proposals)，候选框预测层输出的候选框可以输入到人脸检测层；

人脸检测层可以是包含关注区域池化层(RoI Pooling)的子网络，建立在基础网络层输出的图像特征，和候选框预测层输出的候选框的基础上；针对每一训练样本，人脸检测层可以基于候选框(Proposals)对基础网络层的输出的训练样本的图像特征做降维的采样，得到固定尺寸的特征图，将特征图中所有的结点连接映射到固定长度的特征向量，从而得到每一训练样本的特征向量，基于每一训练样本的特征向量建立人脸分类器和人脸回归器，人脸分类器和人脸回归器联合构成了人脸检测器，其中，人脸分类器能够预测人脸和非人脸的概率，人脸回归器可基于候选框进行更为准确的人脸框的坐标回归。

进一步，图1所示CNN模型的进一步可选细化可通过基于Faster RCNN的CNN模型实现，Faster RCNN是一种人脸检测的经典算法，分为RPN(Region Proposal Networks)层和Fast RCNN层，RPN层生成候选框，Fast RCNN层可基于候选框得到最终的检测结果；

如图2所示，基于Faster RCNN的CNN模型可以包括：基础网络层，RPN层，Fast RCNN层；其中，RPN层可以认为是候选框预测层的一种可选实现，Fast RCNN层可以认为是人脸检测层的一种可选实现；

在本发明实施例中，RPN层的目标是基于基础网络层输出的图像特征产生候选框，在这个过程中，本发明实施例可预先定义多个锚框，该多个锚框覆盖不同尺度与长宽比，通过该预先定义的多个锚框可确定训练样本中的子框，通过该子框预测候选框(如利用该子框可以训练候选框检测器，从而通过候选框检测器进行候选框的预测)；

可选的，锚框是用来定义和建立候选框(Proposal)的分类器和回归器的，是RPN层里面的。RPN可以看出是候选框检测器。具体来说，每个锚框都关联一个检测器(分类加回归)，分类和回归有预测值和目标值才能进行训练和学习。RPN里面，分类目标值的确定(也就是如何定义这个输出是正类还是负类)是根据锚框和真实框的重叠率。类似，Fast RCNN里面，分类目标值的确定是根据候选框与真实框的重叠率。因此，RPN用到的锚框与FastRCNN用到的候选框在建立分类器时有相似的作用，锚框可看成候选框的候选框。RPN可对图像特征经过卷积处理后的每个结点都建立多个候选框检测器(每个候选框检测器关联一个锚框)。

Fast RCNN层的目标是基于候选框和基础网络层输出的图像特征，生成训练样本的特征向量，从而以训练样本的特征向量建立人脸分类器和人脸回归器，人脸分类器和人脸回归器联合构成人脸检测器。

为使得人脸检测器具有更好的检测效果，可通过随机梯度下降算法(StochasticGradient Descent，SGD)等模型优化算法，进行迭代训练，在每一次迭代时，通过从训练样本集合中选取批数据训练样本进行训练，然后在每一次迭代中视人脸检测器的优化目标是否达成，来更新CNN模型的网络参数；

目前主要是以最大化人脸和非人脸的差异作为人脸检测器的优化目标，而忽视了人脸和人脸之间在不同场景下的人脸变化差异，例如忽视了人脸在不同的拍摄角度、分辨率、光照条件、表情变化、遮挡等场景下的变化差异，导致训练出的人脸检测器的判别能力较弱，鲁棒性较差；例如，类内人脸和人脸(例如有光照和无光照)的差异太大，就会被判别为不同类，而实际上应该是同类，因此本发明实施例需要使得类内差异尽可能小，保证人脸检测器对类内差异具有不变性；

基于此，本发明实施例对人脸检测器的迭代训练优化过程进行了改进，提出新的人脸检测器训练方法，以保证人脸检测器在对人脸和非人脸具有较高检测性能的同时，减小人脸和人脸之间的类内差异，提升人脸检测器的判别能力。

本发明实施例提供的人脸检测器训练方法可通过程序形式装载在用于实施人脸检测器训练的电子设备上，该电子设备可以是网络侧的服务器，也可能是用户侧的PC(个人计算机)等终端设备，该电子设备的形式可视人脸检测器的实际训练需求而定；

可选的，用于实施人脸检测器训练的电子设备的硬件结构可以如图3所示，包括：至少一个处理器1，至少一个通信接口2，至少一个存储器3和至少一个通信总线4；

在本发明实施例中，处理器1、通信接口2、存储器3、通信总线4的数量为至少一个，且处理器1、通信接口2、存储器3通过通信总线4完成相互间的通信；显然，图3所示的处理器1、通信接口2、存储器3和通信总线4的通信连接示意仅是可选的；

可选的，通信接口2可以为通信模块的接口，如GSM模块的接口；

处理器1可能是一个中央处理器CPU，或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit)，或者是被配置成实施本发明实施例的一个或多个集成电路。

存储器3可能包含高速RAM存储器，也可能还包括非易失性存储器(non-volatilememory)，例如至少一个磁盘存储器。

其中，存储器3存储有程序，处理器1调用存储器3所存储的程序，该程序可用于执行本发明实施例提供的人脸检测器训练方法。

本发明实施例可通过随机梯度下降算法(Stochastic Gradient Descent，SGD)等模型优化算法进行人脸检测器的迭代训练，SGD是常用的卷积神经网络优化算法，对解决大规模机器学习问题有效，SGD在每次迭代时，会使用从训练样本集合中随机抽取的批数据训练样本(Minibatch)进行梯度下降优化。

以一次迭代涉及的人脸检测器训练为例，本发明实施例提供的人脸检测器训练方法的流程可以如图4所示，每次迭代涉及的人脸检测器训练流程均可参照图4所示，参照图4，本发明实施例提供的人脸检测器训练方法可以包括：

步骤S100、获取当前次迭代的批数据训练样本，所述批数据训练样本包括多个训练样本，所述多个训练样本的样本类包括：正类和负类。

可选的，批数据训练样本(Minibatch)为从包含所有训练样本的训练样本集合中选取的；

人脸检测器可以认为是实现二分类任务(人脸和非人脸)，在每次迭代时，可以从训练样本集合中获取多个人脸图像作为正类的训练样本，获取多个非人脸图像作为负类的训练样本，将获取的正类的训练样本和负类的训练样本构成每次迭代的批数据训练样本；

相应的，当前次迭代使用的批数据训练样本可以包括：多个训练样本，该多个训练样本的样本类可以分为正类(即对应以人脸图像作为的正类的训练样本)和负类(即对应以非人脸图像作为的负类的训练样本)。

步骤S110、分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值。

对于所述批数据训练样本中的一训练样本，本发明实施例可确定该训练样本的特征向量，及该训练样本所属的样本类在所述批数据训练样本中对应的中心特征向量，从而确定出该训练样本对应的中心损失值，对于所述批数据训练样本中的每一训练样本均进行此处理，可得到所述批数据训练样本中各训练样本对应的中心损失值；

可选的，所述批数据训练样本中一样本类的中心特征向量可以通过，当前次迭代中所述批数据训练样本中属于该样本类的训练样本的特征向量的均值对应的更新；

可选的，对于一样本类，本发明实施例可确定所述批数据训练样本中属于该样本类的各训练样本；根据所述批数据训练样本中属于该样本类的各训练样本的特征向量，确定属于该样本类的各训练样本的特征向量的均值，得到所述批数据训练样本中该样本类的中心特征向量的更新变量；根据所述更新变量和设定学习率，得到所述批数据训练样本中该样本类的中心特征向量，以实现根据所述批数据训练样本中一样本类的各训练样本的特征向量的均值，更新该样本类的中心特征向量；

可选的，本发明实施例可根据如下公式确定批数据训练样本中一样本类的中心特征向量：

其中，α表示设定学习率，表示更新变量，表示第j样本类在第t次迭代中所使用的批数据训练样本对应的中心特征向量，表示第j样本类在第t+1次迭代中所使用的批数据训练样本对应的中心特征向量；

即可选的，对于一样本类，本发明实施例可将上一次迭代时批数据训练样本在该样本类对应的中心特征向量，减去，所述更新变量和设定学习率的乘积，得到当前次迭代时批数据训练样本在该样本类对应的中心特征向量。

可选的，对于所述批数据训练样本中正类的样本类，本发明实施例可确定所述批数据训练样本中属于正类的各训练样本的特征向量，确定属于正类的各训练样本的特征向量的均值，从而更新正类的样本类的中心特征向量；相应的，对于所述批数据训练样本中负类的样本类，本发明实施例可确定所述批数据训练样本中属于负类的各训练样本的特征向量，确定属于负类的各训练样本的特征向量的均值，从而更新负类的样本类的中心特征向量；

可选的，进一步，对于所述批数据训练样本中正类的各训练样本，本发明实施例可分别根据正类的各训练样本的特征向量，与正类的样本类的中心特征向量，确定出正类的各训练样本对应的中心损失值；对于所述批数据训练样本中负类的各训练样本，本发明实施例可分别根据负类的各训练样本的特征向量，与负类的样本类的中心特征向量，确定出负类的各训练样本对应的中心损失值。

可选的，一训练样本的中心损失值可以通过该训练样本的特征向量，与该训练样本所属的样本类的中心特征向量的距离表示；假设x_i表示批数据训练样本中的第i个训练样本，y_i表示x_i所属于样本类(可设y_i＝1表示正类，y_i＝0表示负类，当然，也可设置y_i＝0表示负类，y_i＝1表示正类，只要正类和负类对应的y_i值不同即可)，c_yi表示x_i所属于样本类y_i的中心特征向量，则x_i样本的中心损失值可以定义为：

需要说明的是，一训练样本的特征向量的确定过程可以是：基础网络层输出训练样本的图像特征后，人脸检测层根据候选框(Proposals)确定训练样本中的关注区域，从而人脸检测层对训练样本的关注区域的图像特征做降维的采样，得到固定尺寸的特征图，将特征图中所有的结点连接映射到固定长度的特征向量，得到训练样本的特征向量。

步骤S120、根据所述各训练样本对应的中心损失值，确定所述批数据训练样本对应的中心损失值。

可选的，本发明实施例可根据各训练样本对应的中心损失值，确定各训练样本对应的中心损失值的均值，根据各训练样本对应的中心损失值的均值确定出所述批数据训练样本对应的中心损失值；

可选的，本发明实施例可直接将各训练样本对应的中心损失值的均值作为所述批数据训练样本对应的中心损失值，也可以将各训练样本对应的中心损失值的均值乘以设定数值(如乘以1/2)，得到所述批数据训练样本对应的中心损失值。

假设批数据训练样本有共m个训练样本，则批数据训练样本对应的中心损失值可以表示为

步骤S130、至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值。

人脸检测器的目标损失值是人脸检测器迭代训练过程中的优化目标的表示，目标损失值达到设定的训练收敛条件(如最小)，则可结束迭代训练，输出人脸检测器；在每一次迭代中，本发明实施例可将现有的人脸检测器的优化目标，与所使用的批数据训练样本对应的中心损失值相结合，作为本发明实施例人脸检测器的优化目标，得到人脸检测器的目标损失值。

可选的，本发明实施例可根据所述批数据训练样本对应的中心损失值，所述批数据训练样本对应的分类损失值，以及所述批数据训练样本对应的人脸框坐标回归损失值确定人脸检测器的目标损失值；

其中，批数据训练样本对应的分类损失值可以根据批数据训练样本中各训练样本的分类预测概率和分类目标概率(分类真实概率)的差值确定；

如对于批数据训练样本的每一训练样本，在获取到训练样本的特征向量后，本发明实施例可通过Softmax函数等预测该训练样本所属的样本类，得到该训练样本的分类预测概率，从而可根据该训练样本的分类预测概率和该训练样本真实的分类目标概率，确定出该训练样本对应的分类损失值(如取该训练样本的分类预测概率和分类目标概率的差值)，进而可根据批数据训练样本中各训练样本对应的分类损失值，确定出批数据训练样本对应的分类损失值(如取各训练样本的分类损失值的均值等)。

可见，批数据训练样本对应的分类损失值是人脸检测器对于人脸和非人脸的类间分类的指标，批数据训练样本对应的分类损失值，可以对人脸和非人脸的差异(类间差异)进行表示，将批数据训练样本对应的分类损失值作为人脸检测器的优化目标的部分，可使得优化后的人脸检测器对于人脸和非人脸的类间区分具有较高的性能；

在此基础上，批数据训练样本对应的中心损失值对训练样本的特征向量和训练样本所属的样本类的中心特征向量的距离进行了表示，因此批数据训练样本对应的中心损失值，可以说明训练样本的特征向量与其所属的样本类的中心特征向量的差异，可以对每一样本类中的训练样本的类内的特征向量差异进行表示，因此将批数据训练样本对应的中心损失值作为人脸检测器的优化目标的部分，可使得优化后的人脸检测器对于人脸的类内差异具有不变性(如不同场景下的人脸和人脸之间的类内差异)，提升人脸检测的鲁棒性。

可选的，人脸检测器的训练可以包含分类训练和回归训练，是联合训练的过程；一次迭代中批数据训练样本对应的中心损失值和分类损失值构成的损失值，可以认为是分类训练的优化目标，如使批数据训练样本对应的中心损失值和分类损失值构成的损失值最小，来作为人脸检测器训练中分类训练的优化目标；

而每一次迭代中，人脸检测器训练中回归训练的优化目标可以由批数据训练样本对应的人脸框坐标回归损失值构成；

通过联合一次迭代中批数据训练样本对应的中心损失值，分类损失值和人脸框坐标回归损失值，可形成人脸检测器的目标损失值，来表示人脸检测器训练的优化目标。

可选的，本发明实施例可将所述批数据训练样本对应的中心损失值和第一设定权重的乘积，所述批数据训练样本对应的人脸框坐标回归损失值和第二设定权重的乘积，及，所述批数据训练样本对应的分类损失值进行求和，得到人脸检测器的目标损失值；

设L_cls表示批数据训练样本对应的分类损失值，L_c表示批数据训练样本对应的中心损失值，则人脸检测器的目标损失值可以表示为：L_cls+μL_c+λL_reg；μ和λ表示设定权重系数，其中μ为第一设定权重，λ为第二设定权重。

可选的，本发明实施例也可直接将所述批数据训练样本对应的中心损失值，分类损失值和人脸框坐标回归损失值进行求和，得到人脸检测器的目标损失值。

步骤S140、判断所述人脸检测器的目标损失值是否达到设定的训练收敛条件，若否，执行步骤S150，若是，执行步骤S160。

可选的，设定的训练收敛条件可以认为是人脸检测器的目标损失值最小；

具体的，批数据训练样本对应的分类损失值越小，说明人脸检测器对于人脸和非人脸分类的效果越好，人脸检测器可实现最大化的人脸和非人脸的差异区分(即最大化类间差异)；而批数据训练样本对应的中心损失值越小，说明每一样本类中的训练样本的类内的特征向量差异越小，可使得同一样本类的训练样本的差异减小，进而降低样本类中人脸和人脸之间的差异，即通过迭代训练，使得批数据训练样本的每个训练样本的特征向量与该训练样本所归属的样本类的中心特征向量的距离最小。

可见，通过结合批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值，从而以人脸检测器的目标损失值判断训练收敛条件，可使得人脸检测器在最小化的批数据训练样本对应的中心损失值的情况下，保证人脸检测器对于人脸的类内差异具有不变性(如不同场景下的人脸和人脸之间的类内差异)，提升人脸检测的鲁棒性。

步骤S150、根据所述人脸检测器的目标损失值，更新CNN模型中与人脸检测器相关的网络参数，并进入下一次迭代，返回步骤S100。

可选的，如果人脸检测器的目标损失值未达到设定的训练收敛条件(如人脸检测器的目标损失值未达到最小)，则本发明实施例可根据所述人脸检测器的目标损失值，对CNN模型中的网络参数进行更新；同时，按照迭代训练流程进行下一次迭代，返回步骤S100，以更新网络参数后的CNN模型循环执行步骤S100至步骤S140，直至步骤S140的判断结果为人脸检测器的目标损失值达到设定的训练收敛条件；

可选的，本发明实施例可根据随机梯度下降方法进入下一次迭代，返回步骤S100。

步骤S160、输出人脸检测器。

可选的，如果人脸检测器的目标损失值达到设定的训练收敛条件(如人脸检测器的目标损失值达到最小)，则可输出通过CNN模型训练得到的人脸检测器，完成人脸检测器的迭代训练优化过程。

本发明实施例提供的人脸检测器训练流程可以包括：获取当前次迭代的批数据训练样本，所述批数据训练样本包括多个训练样本，所述多个训练样本的样本类包括：正类和负类；分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值；根据所述各训练样本对应的中心损失值，确定所述批数据训练样本对应的中心损失值；至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值；如果所述人脸检测器的目标损失值未达到设定的训练收敛条件，则根据所述人脸检测器的目标损失值，更新CNN模型中的网络参数，并进入下一次迭代，直至人脸检测器的目标损失值达到设定的训练收敛条件；如果所述人脸检测器的目标损失值达到设定的训练收敛条件，则可输出人脸检测器，完成人脸检测器的训练。

可选的，在根据人脸检测器的目标损失值，更新CNN模型中的网络参数时，本发明实施例可根据人脸检测器的目标损失值通过反向传播方式，更新CNN模型中的网络参数；

可选的，本发明实施例可根据所述人脸检测器的目标损失值，以及上一次迭代的CNN模型中的网络参数，确定人脸检测器的参数更新值，从而根据该人脸检测器的参数更新值对上一次迭代的CNN模型中的网络参数进行更新；

可选的，假设人脸检测器的目标损失值为Loss，Loss＝L_ls+μL_c+λL_reg，上一次迭代后的CNN模型中的网络参数为W1，则人脸检测器的参数更新值可以表示为：

根据人脸检测器的参数更新值对上一次迭代后的CNN模型中的网络参数进行更新可通过如下公式实现：

W2＝kW1-α(ΔW+sW1)

其中，W2为更新后的CNN模型的网络参数，k为动量，α为学习率，s为权重衰减系数。

可选的，如图5所示，本发明实施例可在人脸检测层(如Fast RCNN层)设置中心损失函数(Center Loss)，该中心损失函数可作用于人脸检测层的全连接特征表示层，该全连接特征表示层可通过全连接形式将特征图中所有的结点连接映射到固定长度的特征向量，得到各训练样本的特征向量；从而在每一次迭代训练中，中心损失函数可根据当前次迭代使用的批数据训练样本的各训练样本的特征向量，确定出批数据训练样本的各训练样本对应的中心损失值，并相应确定出批数据训练样本对应的中心损失值L_c；

同时，可在人脸检测层(如Fast RCNN层)设置Softmax函数，Softmax函数可作用于人脸检测层的全连接特征表示层，在迭代训练的每一次训练中，Softmax函数可对各训练样本的特征向量进行处理，确定出各训练样本的分类预测概率；进而通过Softmax Loss(分类损失函数)表示出训练样本的分类预测概率和分类目标概率(分类真实概率)的差值，且确定出批数据训练样本对应的分类损失值L_cls；

即Softmax函数的输入是训练样本的特征向量，输出是训练样本属于每个样本类的预测概率；而Softmax Loss(分类损失函数)是输入训练样本的p(分类预测概率)和p*(分类目标概率)，输出是损失值(Loss)，Loss越小表示分类越准确；本发明实施例中，CenterLoss与Softmax Loss作用在同一层之上(即输入的特征向量是相同的)，Center Loss作为人脸检测器优化的辅助监督信号，Center Loss越小表示人脸检测器所检测的类内的特征的差异越小，Softmax Loss则驱使人脸检测器所检测的类间的特征相互分离，保证类间具有可分辨差异；

可选的，进一步，本发明实施例可在人脸检测层(如Fast RCNN层)设置人脸框回归预测函数SmoothL1(平滑一范数函数)，通过SmoothL1基于候选框，确定批数据训练样本中各训练样本对应的人脸框预测坐标；进而通过SmoothL1Loss确定各训练样本对应的人脸框坐标回归损失值，其输入是训练样本对应的人脸框预测坐标和人脸框目标坐标，输出是损失值(Loss)，进而以此确定出批数据训练样本对应的人脸框坐标回归损失值L_reg；

可选的，本发明实施例可确定出人脸检测器的目标损失值Loss＝L_ls+μL_c+λL_reg，通过每次迭代得到的目标损失值Loss，更新CNN模型中的网络参数，直至目标损失值Loss达到最小。

可选的，一次迭代中批数据训练样本对应的分类损失值的确定过程可以如下：

分别根据批数据训练样本中各训练样本对应的分类预测概率和分类目标概率，确定所述批数据训练样本中各训练样本对应的分类损失值；

根据所述批数据训练样本中各训练样本对应的分类损失值，确定所述批数据训练样本对应的分类损失值。

可选的，一次迭代中批数据训练样本对应的人脸框坐标回归损失值的确定过程，可以如图6所示，包括：

步骤S200、根据候选框确定批数据训练样本中各训练样本对应的人脸框预测坐标。

可选的，本发明实施例可根据候选框预测层输出的候选框，确定当前次迭代中批数据训练样本的各训练样本的关注区域，得到各训练样本对应的人脸框预测坐标；一训练样本的人脸框预测坐标可以通过左上顶点横坐标、左上顶点纵坐标，右下顶点横坐标、右下顶点纵坐标等表示；

可选的，本发明实施例可在人脸检测层(如Fast RCNN层)设置人脸框回归预测函数SmoothL1(平滑一范数函数)，通过SmoothL1基于候选框，确定出各训练样本对应的人脸框预测坐标。

步骤S210、分别根据各训练样本对应的人脸框预测坐标，以及各训练样本对应的人脸框目标坐标，确定各训练样本对应的人脸框坐标回归损失值。

可选的，训练样本对应的人脸框目标坐标可以是训练样本中人脸框真实对应的坐标；对于每一训练样本，本发明实施例可通过该训练样本对应的人脸框预测坐标以及人脸框目标坐标的差值，确定出该训练样本对应的人脸框坐标回归损失值，从而对于每一训练样本均作此处理，可得到各训练样本对应的人脸框坐标回归损失值。

可选的，本发明实施例可通过SmoothL1Loss表示人脸框坐标回归损失值，其输入是训练样本对应的人脸框预测坐标和人脸框目标坐标，输出是损失值(Loss)，Loss越小表示人脸框的回归越准确。

步骤S220、根据各训练样本对应的人脸框坐标回归损失值，确定所述批数据训练样本对应的人脸框坐标回归损失值。

可选的，本发明实施例可根据批数据训练样本中各训练样本对应的人脸框坐标回归损失值，确定各训练样本对应的人脸框坐标回归损失值的均值，根据该均值确定批数据训练样本对应的人脸框坐标回归损失值(SmoothL1Loss)。

可选的，本发明实施例进行人脸检测器迭代训练的过程使用了多损失函数联合训练，包括人脸分类和回归两个联合任务，分类训练使用Center Loss和Softmax Loss联合优化，回归训练使用SmoothL1Loss优化；人脸检测器最终优化目标是批数据训练样本对应的Center Loss，Softmax Loss和SmoothL1Loss的三损失值的加权和最小；

可选的，本发明实施例可以对通用大规模人脸识别任务(ImageNet)上预训练好的模型进行微调(Finetuning)；通过引入中心损失值作为人脸检测器的辅助优化目标，引导CNN模型的优化、训练，提升人脸检测器对于人脸与人脸之间的类内差异的判别能力。

可选的，在迭代训练的过程中，本发明实施例可基于上一次迭代的CNN模型，确定训练样本集合中人脸检测器较难检测的训练样本，来确定下一次迭代所使用的批数据训练样本，以加强人脸检测器对这些较难检测的训练样本的检测能力；训练样本是否较难检测可通过测量训练样本对应的目标损失值确定，目标损失值越高则说明训练样本距离优化目标越远，检测的难度也就越大；

相应的，图7示出了本发明实施例提供的获取当前次迭代的批数据训练样本的方法流程图，参照图7，该方法可以包括：

步骤S300、固定上一次迭代的CNN模型，以上一次迭代的CNN模型获取训练样本集合中各训练样本对应的中心损失值，分类损失值和人脸框坐标回归损失值。

步骤S310、分别根据训练样本集合中各训练样本对应的中心损失值，分类损失值和人脸框坐标回归损失值，确定训练样本集合中各训练样本的目标损失值。

可选的，对于一训练样本，本发明实施例可对该训练样本的中心损失值，分类损失值和人脸框坐标回归损失值进行加权求和，得到该训练样本的目标损失值；对于每一训练样本均进行如此处理，则可得到各训练样本的目标损失值；

可选的，对于一训练样本，其目标损失值可以表示为：分类损失值+μ中心损失值+λ人脸框坐标回归损失值。

可选的，对于一训练样本，本发明实施例也可将该训练样本的中心损失值，分类损失值和人脸框坐标回归损失值进行求和，得到该训练样本的目标损失值。

步骤S320、根据训练样本集合中正类的样本类中各训练样本的目标损失值，选取正类的样本类中目标损失值最大的第一数量的训练样本；及根据训练样本集合中负类的样本类中各训练样本的目标损失值，选取负类的样本类中目标损失值最大的第二数量的训练样本，所述第一数量和所述第二数量的比值与设定比例相应。

可选的，在得到训练样本集合中各训练样本的目标损失值后，本发明实施例可将训练样本集合中各训练样本按照正类和负类的样本类进行分类，从而可确定出训练样本集合中属于正类的样本类中各训练样本的目标损失值，以及训练样本集合中属于负类的样本类中各训练样本的目标损失值；同时，可根据正类的样本类中各训练样本的目标损失值，对属于正类的训练样本进行排序(可以是按照目标损失值从大到小排序，也可以是按照目标损失值从小到大排序)，及根据负类的样本类中各训练样本的目标损失值，对属于负类的训练样本进行排序；

进而根据批数据训练样本中正类的训练样本和负类的训练样本的设定比例，根据训练样本集合中正类的样本类中各训练样本的目标损失值，选取正类的样本类中目标损失值最大的第一数量的训练样本，根据训练样本集合中负类的样本类中各训练样本的目标损失值，选取负类的样本类中目标损失值最大的第二数量的训练样本，使得第一数量和所述第二数量的比值与批数据训练样本中要求的正、负类样本数量的设定比例相应。

可选的，基于Center Loss对正样本(人脸)和负样本(非人脸)的数据平衡要求的考虑，本发明实施例可以使得设定比例为1:1，即第一数量和第二数量相同。

步骤S330、根据从正类的样本类中选取的训练样本，和从负类的样本类中选取的训练样本，构成当前次迭代的批数据训练样本。

可见，本发明实施例提供的人脸检测器训练方法中，在将上一次迭代的批数据训练样本送入CNN模型中进行训练后，可根据上一次迭代的批数据训练样本的Center Loss和Softmax Loss，更新优化人脸检测器，根据上一次迭代的批数据训练样本的SmoothL1Loss更新优化人脸回归器，使得人脸检测器往Center Loss、Softmax Loss和SmoothL1Loss的加权和最小的方向优化；

而上一次迭代可决定下一次迭代所使用的批数据训练样本，通过上一次迭代后的CNN模型，可确定训练样本集合中的各训练样本的Center Loss、Softmax Loss和SmoothL1Loss的目标损失值，从而从训练样本集合中选取出目标损失值最大的第一数量的正类的训练样本，和目标损失值最大的第二数量的负类的训练样本，构建出下一次迭代的Minibatch(即批数据训练样本)；

从而进入下一次的迭代，在下一次的迭代中，将该Minibatch送入CNN模型中进行训练，以此循环迭代的进行训练，直至在某一次的迭代中，批数据训练样本的SmoothL1Loss、Softmax Loss和SmoothL1Loss的加权和达到最小。

采用上述描述的训练样本集合中，上一次迭代训练后的人脸检测器较难检测的训练样本作为下一次迭代所使用的Minibatch，可使得每一次迭代能够更好的进行centerloss的估计，从而更好的监督学习训练样本中具有类内差异辨识力的特征。

这里需要说明的是，与常规的利用随机梯度下降算法进行人脸检测器的迭代训练不同的是，本发明实施例并不是单纯使用随机抽取的批数据训练样本(Minibatch)进行梯度下降优化，而是结合上一次迭代时，训练样本集合中较难检测的训练样本来确定下一次迭代所使用的Minibatch。

可见，本发明实施例提出了一种鲁棒的人脸检测器训练方法。该方法基于神经网络实现，在迭代训练的每一次训练过程中，引入批数据训练样本对应的Center Loss(中心损失值)作为人脸和非人脸的二分类任务的辅助损失函数，与批数据训练样本对应的Softmax Loss(分类损失值)联合监督人脸检测器的优化训练；可引导人脸检测器的学习过程，使得人脸检测器保持人脸与非分类的类间差异可区分的同时，减小人脸和人脸之间的类内差异，提升人脸检测器对于人脸的判别能力。

并且利用困难样本在线挖掘算法(OHEM)，根据训练样本的总损失值，对上一次训练时，较难检测的正类训练样本和负类训练样本进行挖掘，并保持正负样本的比例是1:1，从而增强人脸检测器对于较难检测的训练样本的分类能力，提升人脸检测的整体性能。

此外，本发明采用更适合人脸目标的锚框(覆盖多个尺寸、多个长宽比)以及多尺度训练的策略，提升对于不同分辨率人脸目标的判别性，可使得候选框的生成适用于不同的人脸，而使用本发明实施例提供的人脸检测器训练方法训练的人脸检测器能够有效提升准确率，增强鲁棒性。本发明实施例的人脸检测器与采用其他方式训练的人脸检测器的性能比对可如下表1所示：

表1

可见，本发明实施例能够提升人脸检测器的人脸检测判别能力，提升人脸检测器的鲁棒性。

下面对本发明实施例提供的人脸检测器训练装置进行介绍，下文描述的人脸检测器训练装置内容，可以认为是实施人脸检测器训练的电子设备为实现本发明实施例提供的人脸检测器训练方法，所需设置的程序模块；下文描述的人脸检测器训练装置内容可与上文描述的人脸检测器训练方法内容相互对应参照。

图8为本发明实施例提供的人脸检测器训练装置的结构框图，参照图8，该人脸检测器训练装置可以包括：

样本获取模块100，用于获取当前次迭代的批数据训练样本，所述批数据训练样本包括多个训练样本，所述多个训练样本的样本类包括：正类和负类；

样本中心损失值确定模块200，用于分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值；

批样本中心损失值确定模块300，用于根据所述各训练样本对应的中心损失值，确定所述批数据训练样本对应的中心损失值；

检测器目标损失值确定模块400，用于至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值；

参数更新模块500，用于若所述人脸检测器的目标损失值未达到设定的训练收敛条件，根据所述人脸检测器的目标损失值，更新CNN模型的网络参数，并进入下一次迭代；

检测器输出模块600，用于若所述人脸检测器的目标损失值达到设定的训练收敛条件，输出人脸检测器。

可选的，检测器目标损失值确定模块400，用于至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值，具体包括：

根据所述批数据训练样本对应的中心损失值，所述批数据训练样本对应的分类损失值，以及所述批数据训练样本对应的人脸框坐标回归损失值确定人脸检测器的目标损失值。

可选的，检测器目标损失值确定模块400，用于根据所述批数据训练样本对应的中心损失值，所述批数据训练样本对应的分类损失值，以及所述批数据训练样本对应的人脸框坐标回归损失值确定人脸检测器的目标损失值，具体包括：

将所述批数据训练样本对应的中心损失值和第一设定权重的乘积，所述批数据训练样本对应的人脸框坐标回归损失值和第二设定权重的乘积，及，所述批数据训练样本对应的分类损失值进行求和，得到人脸检测器的目标损失值。

可选的，样本获取模块100，用于获取当前次迭代的批数据训练样本，具体包括：

以上一次迭代的CNN模型确定训练样本集合中各训练样本对应的目标损失值；

根据训练样本集合中正类的样本类中各训练样本的目标损失值，选取正类的样本类中目标损失值最大的第一数量的训练样本；及根据训练样本集合中负类的样本类中各训练样本的目标损失值，选取负类的样本类中目标损失值最大的第二数量的训练样本，所述第一数量和所述第二数量的比值与设定比例相应；

根据从正类的样本类中选取的训练样本，和从负类的样本类中选取的训练样本，构成当前次迭代的批数据训练样本。

可选的，样本获取模块100，用于以上一次迭代的CNN模型确定训练样本集合中各训练样本对应的目标损失值，具体包括：

以上一次迭代的CNN模型，获取训练样本集合中各训练样本对应的中心损失值，分类损失值和人脸框坐标回归损失值；其中，一训练样本对应的分类损失值根据该训练样本对应的分类预测概率和分类目标概率确定，一训练样本对应的人脸框坐标回归损失值根据该训练样本对应的人脸框预测坐标和人脸框目标坐标确定；

分别根据训练样本集合中各训练样本对应的中心损失值，分类损失值和人脸框坐标回归损失值，确定训练样本集合中各训练样本的目标损失值。

可选的，图9示出了本发明实施例提供的人脸检测器训练装置的另一结构，结合图8和图9所示，该人脸检测器训练装置还可以包括：

批样本分类损失值确定模块700，用于分别根据所述批数据训练样本中各训练样本对应的分类预测概率和分类目标概率，确定所述批数据训练样本中各训练样本对应的分类损失值；根据所述批数据训练样本中各训练样本对应的分类损失值，确定所述批数据训练样本对应的分类损失值。

可选的，样本中心损失值确定模块200，用于分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值，具体包括：

确定所述批数据训练样本中各训练样本的特征向量，及所述批数据训练样本中各样本类的中心特征向量；

对于所述批数据训练样本中的一训练样本，确定该训练样本的特征向量，与所述批数据训练样本中该训练样本所属的样本类的中心特征向量的距离，得到该训练样本对应的中心损失值。

可选的，样本中心损失值确定模块200，用于确定所述批数据训练样本中各样本类的中心特征向量，具体包括：

对于一样本类，确定所述批数据训练样本中属于该样本类的各训练样本；

根据所述批数据训练样本中属于该样本类的各训练样本的特征向量，确定属于该样本类的各训练样本的特征向量的均值，得到所述批数据训练样本中该样本类的中心特征向量的更新变量；

根据所述更新变量和设定学习率，得到所述批数据训练样本中该样本类的中心特征向量。

可选的，图10示出了本发明实施例提供的人脸检测器训练装置的再一结构，结合图9和图10所示，该人脸检测器训练装置还可以包括：

批样本人脸框坐标回归损失值确定模块800，用于根据候选框回归器确定各所述批数据训练样本中各训练样本对应的人脸框预测坐标；分别根据各训练样本对应的人脸框预测坐标，以及各训练样本对应的人脸框目标坐标，确定各训练样本对应的人脸框坐标回归损失值；根据各训练样本对应的人脸框坐标回归损失值，确定所述批数据训练样本对应的人脸框坐标回归损失值。

可选的，参数更新模块500，用于根据所述人脸检测器的目标损失值，更新CNN模型的网络参数，具体包括：

根据人脸检测器的目标损失值通过反向传播方式，更新CNN模型中的网络参数。

可选的，参数更新模块500，用于根据人脸检测器的目标损失值通过反向传播方式，更新CNN模型中的网络参数，具体包括：

根据所述人脸检测器的目标损失值，以及上一次迭代的CNN模型中的网络参数，确定人脸检测器的参数更新值；

根据该人脸检测器的参数更新值，对上一次迭代的CNN模型中的网络参数进行更新。

可选的，本发明实施例提供的人脸检测器训练装置还可用于：

预先定义多个锚框，该多个锚框覆盖不同尺度与长宽比；

通过该预先定义的多个锚框确定训练样本中的子框，通过该子框预测候选框。

本发明实施例还提供一种电子设备，该电子设备的硬件结构可以如图3所示，包括：至少一个存储器和至少一个处理器；

本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

专业人员还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的核心思想或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人脸检测器训练方法，其特征在于，包括：

2.根据权利要求1所述的人脸检测器训练方法，其特征在于，所述至少根据所述批数据训练样本对应的中心损失值，确定人脸检测器的目标损失值包括：

3.根据权利要求2所述的人脸检测器训练方法，其特征在于，所述根据所述批数据训练样本对应的中心损失值，所述批数据训练样本对应的分类损失值，以及所述批数据训练样本对应的人脸框坐标回归损失值确定人脸检测器的目标损失值包括：

4.根据权利要求1所述的人脸检测器训练方法，其特征在于，所述获取当前次迭代的批数据训练样本包括：

5.根据权利要求4所述的人脸检测器训练方法，其特征在于，所述以上一次迭代的CNN模型确定训练样本集合中各训练样本对应的目标损失值包括：

6.根据权利要求2所述的人脸检测器训练方法，其特征在于，所述批数据训练样本对应的分类损失值的确定过程包括：

分别根据所述批数据训练样本中各训练样本对应的分类预测概率和分类目标概率，确定所述批数据训练样本中各训练样本对应的分类损失值；

7.根据权利要求2所述的人脸检测器训练方法，其特征在于，所述批数据训练样本对应的人脸框坐标回归损失值的确定过程包括：

确定所述批数据训练样本中各训练样本对应的人脸框预测坐标；

分别根据各训练样本对应的人脸框预测坐标，以及各训练样本对应的人脸框目标坐标，确定各训练样本对应的人脸框坐标回归损失值；

根据各训练样本对应的人脸框坐标回归损失值，确定所述批数据训练样本对应的人脸框坐标回归损失值。

8.根据权利要求1所述的人脸检测器训练方法，其特征在于，所述分别根据各训练样本的特征向量，及各训练样本所属的样本类的中心特征向量，确定各训练样本对应的中心损失值包括：

9.根据权利要求8所述的人脸检测器训练方法，其特征在于，所述确定所述批数据训练样本中各样本类的中心特征向量包括：

根据所述更新变量与设定学习率，得到所述批数据训练样本中该样本类的中心特征向量。

10.根据权利要求1-3任一项所述的人脸检测器训练方法，其特征在于，所述根据所述人脸检测器的目标损失值，更新CNN模型中的网络参数包括：

11.根据权利要求10所述的人脸检测器训练方法，其特征在于，所述根据人脸检测器的目标损失值通过反向传播方式，更新CNN模型中的网络参数包括：

12.根据权利要求1所述的人脸检测器训练方法，其特征在于，所述方法还包括：

预先定义多个锚框，该多个锚框覆盖不同尺度与长宽比；

13.一种人脸检测器训练装置，其特征在于，包括：

14.根据权利要求13所述的人脸检测器训练装置，其特征在于，所述样本获取模块，用于获取当前次迭代的批数据训练样本，具体包括：

15.一种电子设备，其特征在于，包括：存储器和处理器；