CN108520220A

CN108520220A - 模型生成方法和装置

Info

Publication number: CN108520220A
Application number: CN201810277834.5A
Authority: CN
Inventors: 罗远庆
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-03-30
Filing date: 2018-03-30
Publication date: 2018-09-11
Anticipated expiration: 2038-03-30
Also published as: CN108520220B

Abstract

本申请实施例公开了模型生成方法和装置。该方法的一具体实施方式包括：获取可见光样本人脸图像集和红外样本人脸图像集；基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。该实施方式提升了生成的红外人脸识别模型的可靠性和准确性。

Description

模型生成方法和装置

技术领域

本申请实施例涉及计算机技术领域，具体涉及人工智能技术领域，尤其涉及模型生成方法和装置。

背景技术

人脸识别在公共安全、智能监控、数字身份认证、电子商务、多媒体和数字娱乐等多领域都具有巨大的应用价值和广泛的应用市场。经过长时间的研究，人脸识别已经取得了长足的发展与进步，以“人脸”为对象的计算机视觉研究已经成为一个及其重要、研究方向众多并有着广泛应用于前景的学术和科技领域。

常用的人脸识别技术中，需要采集可见光环境下的人脸图像，而可见光人脸图像容易受到环境光变化的影响，在识别之前需要采用一些预处理算法对光照的影响进行处理。红外人脸图像由于不受光线变化影响，可以保留图像的全部有效信息而被应用于识别人脸。然而，由于红外人脸图像通常需要红外光源的配合，相较于可见光人脸图像来说，红外人脸图像的采集难度较大。目前红外人人脸图像的数据量有限，可作为红外人脸识别模型的训练样本的红外人脸图像较少，难以训练出可靠的红外人脸识别模型。

发明内容

本申请实施例提出了模型生成方法和装置。

第一方面，本申请实施例提供了一种模型生成方法，包括：获取可见光样本人脸图像集和红外样本人脸图像集；基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件；其中，损失函数为第一代价函数和第二代价函数的加权和，第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

在一些实施例中，上述对当前损失函数中的权重进行调整，包括：利用已获取的权重步长调整当前损失函数中第二代价函数的权重。

在一些实施例中，上述对当前损失函数在中的权重进行调整，还包括：利用已获取的权重步长的相反数调整当前损失函数中第一代价函数的权重。

在一些实施例中，上述训练操作还包括：记录迭代次数；上述对当前损失函数在中的权重进行调整，还包括：根据迭代次数确定权重步长。

在一些实施例中，上述基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件，包括：执行预测操作，预测操作包括：将可见光样本人脸图像集输入待训练的可见光人脸识别模型，将红外样本人脸图像集输入待训练的红外人脸识别模型，得到可见光样本人脸图像集的人脸识别预测结果以及红外样本人脸图像集的人脸识别预测结果，判断基于当前损失函数的训练操作结果是否满足与当前损失函数对应的收敛条件；若基于当前损失函数的训练操作结果不满足与当前损失函数对应的收敛条件，基于当前损失函数，采用梯度下降法更新待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，执行预测操作；若基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件，输出待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，作为当前损失函数下的训练结果。其中，与当前损失函数对应的收敛条件包括：当前损失函数的值小于预设的损失阈值，和/或基于当前损失函数的模型参数更新次数达到预设的与当前损失函数对应的次数阈值。

第二方面，本申请实施例提供了一种模型生成装置，包括：获取单元，用于获取可见光样本人脸图像集和红外样本人脸图像集；训练单元，用于基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件；其中，损失函数为第一代价函数和第二代价函数的加权和，第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；判断单元，用于执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；更新单元，用于响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；生成单元，用于响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

在一些实施例中，上述更新单元用于按照如下方式对当前损失函数中的权重进行调整：利用已获取的权重步长调整当前损失函数中第二代价函数的权重。

在一些实施例中，上述更新单元还用于按照如下方式对当前损失函数中的权重进行调整：利用已获取的权重步长的相反数调整当前损失函数中第一代价函数的权重。

在一些实施例中，上述训练单元还用于记录迭代次数；更新单元还用于按照如下方式对当前损失函数中的权重：根据迭代次数确定权重步长。

在一些实施例中，上述训练单元进一步用于按照如下方式执行训练操作：执行预测操作，预测操作包括：将可见光样本人脸图像集输入待训练的可见光人脸识别模型，将红外样本人脸图像集输入待训练的红外人脸识别模型，得到可见光样本人脸图像集的人脸识别预测结果以及红外样本人脸图像集的人脸识别预测结果，判断基于当前损失函数的训练操作结果是否满足与当前损失函数对应的收敛条件；若基于当前损失函数的训练操作结果不满足与当前损失函数对应的收敛条件，基于当前损失函数，采用梯度下降法更新待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，执行预测操作；若基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件，输出待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，作为当前损失函数下的训练结果；其中，与当前损失函数对应的收敛条件包括：当前损失函数的值小于预设的损失阈值，和/或基于当前损失函数的模型参数更新次数达到预设的与当前损失函数对应的次数阈值。

第三方面，本申请实施例提供了一种电子设备，包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如第一方面提供的模型生成方法。

第四方面，本申请实施例提供了一种计算机可读介质，其上存储有计算机程序，其中，程序被处理器执行时实现第一方面提供的模型生成方法。

本申请上述实施例的模型生成方法和装置，通过获取可见光样本人脸图像集和红外样本人脸图像集；基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件；其中，损失函数为第一代价函数和第二代价函数的加权和，第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数在中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数，实现了由可见光人脸识别模型到红外人脸识别模型的迁移学习，从而有效利用了可见光人脸图像来训练红外人脸识别模型，有助于提升红外人脸识别模型的准确性和可靠性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1是本申请可以应用于其中的示例性系统架构图；

图2是根据本申请的模型生成方法的一个实施例的流程图；

图3是根据本申请的模型生成方法中训练操作的一种具体实现方式的流程示意图；

图4是根据本申请的模型生成方法的一种实现方式的原理示意图；

图5是根据本申请的模型生成装置的一个结构示意图；

图6是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请的模型生成方法或模型生成装置的示例性系统架构100。

如图1所示，系统架构100可以包括终端设备101、102、103，网络104、以及服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。

终端设备101、102、103可以通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103可以为运行红外人脸识别模型的电子设备，终端设备上可以安装有各种交互应用。

终端设备101、102、103可以是具有图像采集装置并支持互联网访问的各种电子设备，包括但不限于人脸识别闸机、智能手机、平板电脑、智能手表、笔记本电脑等。

服务器105可以是提供人脸识别服务的人脸识别服务器，人脸识别服务器可以接收终端设备101、102、103发出的人脸识别请求，并对人脸识别请求进行解析得到人脸图像，并对人脸图像中的人脸进行识别，将识别结果返回给终端设备101、102、103。

需要说明的是，本申请实施例所提供的模型生成方法可以由终端设备101、102、103或服务器105执行，相应地，模型生成装置可以设置于终端设备101、102、103或服务器105中。

需要说明的是，服务器可以是硬件，也可以是软件。当服务器为硬件时，可以实现成多个服务器组成的分布式服务器集群，也可以实现成单个服务器。当服务器为软件时，可以实现成多个软件或软件模块(例如用来提供分布式服务的多个软件模块)，也可以实现成单个软件或软件模块。在此不做具体限定。

应该理解，图1中的终端设备、网络、服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络、服务器。

继续参考图2，其示出了根据本申请的模型生成方法的一个实施例的流程200。该模型生成方法，包括以下步骤：

步骤201，获取可见光样本人脸图像集和红外样本人脸图像集。

在本实施例中，上述模型生成方法的执行主体可以获取已构建的可见光样本人脸图像集和红外样本人脸图像集。在可见光样本人脸图像集和红外样本人脸图像集中，可以标注每幅人脸图像对应的用户的身份标识，作为对可见光样本人脸图像集和红外样本人脸图像集中的人脸图像进行人脸识别的标注结果。

上述执行主体可以预先收集可见光人脸图像和红外样本人脸图像来构建可见光样本人脸图像集和红外样本人脸图像集。其中，可见光人脸图像可以是自然光下采集的包含红色、蓝色、绿色三通道图像信息的人脸图像，红外人脸图像可以是在红外光源下采集到的人脸图像。在这里，可见光样本人脸图像集的数据规模大于红外样本人脸图像集的数据规模。

步骤202，基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练。

在这里，当前损失函数可以是预先构建的，可以是第一代价函数和第二代价函数的加权和。第一代价函数可以基于待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果来构建，第一代价函数的值可以用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差。第二代价函数可以基于待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果来构建，第二代价函数的值可以用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差。损失函数中第一代价函数和第二代价函数的权重可以是预先设定的。

假设第一代价函数L₁的权重为λ₁，第二代价函数L₂的权重为λ₂，则损失函数L为：

L＝λ₁L₁+λ₂L₂ (1)

可选地，λ₁+λ₂＝1。

可以看出，损失函数L可以表征待训练的可见光人脸识别模型和待训练的红外人脸识别模型的联合预测误差。

上述训练操作可以包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件。

具体来说，首先可以获取当前损失函数中第一代价函数和第二代价函数的权重，随后可以构建待训练的可见光人脸识别模型和待训练的红外人脸识别模型，确定待训练的可见光人脸识别模型和待训练的红外人脸识别模型的初始参数。例如可以基于卷积神经网络构建待训练的可见光人脸识别模型和待训练的红外人脸识别模型，并随机地选择卷积神经网络中参数的参数值作为初始参数。随后，可以将可见光人脸图像输入待训练的可见光人脸识别模型进行预测，将红外人脸图像输入待训练的红外人脸识别模型进行预测，得到预测结果，之后比对预测结果和样本可见光样本人脸图像集以及红外样本人脸图像集中对用户身份的标注结果，得出待训练的可见光人脸识别模型和待训练的红外人脸识别模型的预测误差，计算得出当前损失函数的值。之后通过反向传播将预测误差传回至模型的预测过程中，具体可以根据预测误差调整待训练的可见光人脸识别模型和待训练的红外人脸识别模型中参数的参数值，然后重新预测，并比对预测结果与样本集的标注结果，如此往复，重复执行上述利用模型预测、比对预测结果与标注结果、反向传播调整参数的步骤，直至训练操作的结果满足与当前损失函数对应的收敛条件时，停止反向传播调整参数，这时得到的待训练的可见光人脸图像模型的参数和待训练的红外人脸图像模型的参数为基于当前损失函数的模型参数。

步骤203，执行判断步骤，判断步骤包括判断当前损失函数中第二代价函数的权重是否达到预设阈值。

在基于当前损失函数的训练操作完成之后，可以对当前损失函数中第二代价函数的权重是否达到预设阈值进行判断。

在本实施例中，开始训练可见光人脸识别模型和红外人脸识别模型之前，可以设定第一代价函数和第二代价函数的权重的初始值，并设定第二代价函数的权重的预设阈值。例如可以设定λ₁的初始值和λ₂的初始值均为0.5，设定第二代价函数的权重的预设阈值为0.9。然后将λ₁的初始值和λ₂的初始值代入损失函数中生成开始训练时的当前损失函数。在基于当前损失函数完成模型训练之后，判断当前损失函数中第二代价函数的权重λ₂是否达到预设阈值。

步骤204，响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作。

在确定第二代价函数的权重λ₂未达到预设阈值之后，可以按照预设的权重调整策略调整损失函数中第二代价函数的权重λ₂。在这里，预设的权重调整策略可以是增大λ₂的值。可选地，还可以同时调整第一代价函数的权重λ₁和第二代价函数的权重λ₂，例如可以在增大λ₂的同时减小λ₁，调整之后可以得到更新后的损失函数。

然后可以将更新后的损失函数作为当前损失函数执行上述步骤202的训练操作和步骤203的判断操作。具体可以基于调整权重后的损失函数来训练待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，并在基于调整权重后的损失函数对调整权重后的损失函数的训练操作完成之后，判断第二代价函数的权重是否达到预设阈值，如果未达到则调整损失函数中的权重并返回执行训练操作和判断操作。

步骤205，响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

在第二代价函数的权重达到预设阈值时，可以停止更新损失函数，将当前待训练的红外人脸识别模型的参数作为训练完成的红外人脸识别模型的参数，即得到红外人脸识别模型。

从图2可以看出，本实施例的模型生成方法通过重复调整第二代价函数的权重来更新损失函数，并基于损失函数对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行参数的迭代优化，在参数的迭代优化过程中红外人脸识别模型可以学习到可见光人脸识别模型对可见光人脸图像进行识别时的逻辑，能够实现由可见光人脸识别模型到红外人脸识别模型的迁移学习，从而有效利用了可见光人脸图像来训练红外人脸识别模型，有助于提升红外人脸识别模型的准确性和可靠性。

在一些实施例中，上述对当前损失函数中的权重进行调整的步骤可以包括：利用已获取的权重步长调整当前损失函数中第二代价函数的权重。也就是说，可以预先获取权重步长Δλ，Δλ可以大于0，在每次调整第二代价函数的权重时，可以将λ₂+Δλ作为调整后的第二代价函数的权重。这样，可以固定第二代价函数的权重的调整方向，在训练过程中向同一个方向调整第二代价函数的权重，有利于提升迁移学习的速度，提升模型生成效率。

在本实施例的一些可选的实现方式中，上述对当前损失函数中的权重进行调整可以包括：在利用权重步长调整第二代价函数的权重的同时，利用该权重步长调整当前损失函数中第一代价函数的权重。也就是说，将λ₁-Δλ和λ₂+Δλ分别作为调整后的第一代价函数的权重和调整后的第二代价函数的权重，这时，损失函数更新为L’：

L'＝(λ₁-Δλ)L₁+(λ₂+Δλ)L₂ (2)

进一步可选地，上述训练操作还可以包括：记录迭代次数。这里的迭代次数是待训练的可见光人脸识别模型和待训练的人脸识别模型中的参数更新次数。这时，可以根据迭代次数确定权重步长，并利用该权重步长调整当前损失函数中第二代价函数的权重。具体来说，可以根据基于当前损失函数的训练操作完成后的总迭代次数t₂与基于上一个损失函数的训练操作完成后的总迭代次数t₁之间的差异确定权重步长，例如可以确定权重步长为exp(-αt₁)-exp(-αt₂)，其中α为预设系数。则第二代价函数的权重可以例如设定为λ₂＝1-exp(-αt)，其中，t为迭代次数。可选地，第一代价函数的权重可例如设定为λ₁＝exp(-αt)。这样，第二代价函数的权重随着迭代次数t的增加而增大，使得红外人脸识别模型的预测误差在损失函数中的比重随着迭代次数增加而逐渐增大，由此可以进一步提升迁移学习的速度，提升模型生成的效率。

请参考图3，其示出了根据本申请的模型生成方法中训练操作的一种具体实现方式的流程示意图。如图3所示，在上述模型生成方法的实施例的一些可选的实现方式中，上述训练操作的流程300具体可以包括以下步骤：

步骤301，执行预测操作。

在本实施例中，步骤301具体包括步骤3011和步骤3012，其中，在步骤3011，将可见光样本人脸图像集输入待训练的可见光人脸识别模型，将红外样本人脸图像集输入待训练的红外人脸识别模型，得到可见光样本人脸图像集的人脸识别预测结果以及红外样本人脸图像集的人脸识别预测结果。

在首次执行预测操作时，可以首先构建待训练的可见光人脸识别模型和待训练的红外人脸识别模型，确定可见光人脸识别模型和红外人脸识别模型的初始结构以及模型中的参数的初始值。例如可以采用卷积神经网络架构来构建待训练的可见光人脸识别模型和待训练的红外人脸识别模型，并确定卷积神经网络的参数的初始值。之后可以将可见光样本人脸图像集和红外样本人脸图像集分别输入待训练的可见光人脸识别模型和待训练的红外人脸识别模型。待训练的可见光人脸识别模型可以输出对可见光样本人脸图像集中的每幅可见光样本人脸图像的人脸识别预测结果，待训练的红外人脸识别模型可以输出对红外样本人脸图像集中的每幅红外样本人脸图像的人脸识别预测结果。在这里，红外样本人脸图像集中的红外样本人脸图像的数量小于可见光样本人脸图像集中的可见光样本人脸图像的数量。

接着，在步骤3012中，判断基于当前损失函数的训练操作的结果是否满足与当前损失函数对应的收敛条件。

在待训练的可见光人脸识别模型和待训练的红外人脸识别模型输出对应的人脸识别预测结果之后，可以判断基于当前损失函数的训练操作的结果是否满足与当前损失函数对应的收敛条件。具体地，基于当前损失函数的训练操作的结果可以包括基于当前损失函数的预测操作的执行次数(即基于当前损失函数的参数更新次数)，和/或基于预测结果与标注结果的比对结果计算得出的当前损失函数的值。与当前损失函数对应的收敛条件可以包括：当前损失函数的值小于预设的损失阈值，和/或基于当前损失函数的模型参数更新次数达到预设的与当前损失函数对应的次数阈值。也就是说，在预测误差足够小或者参数更新次数足够多的情况下，可以确定基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件。

步骤302，若基于当前损失函数的训练操作结果不满足与当前损失函数对应的收敛条件，基于当前损失函数，采用梯度下降法更新待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数。

如果基于当前损失函数的训练操作结果不满足与当前损失函数对应的收敛条件，可以确定当前模型不能准确地实现人脸识别，需要调整模型参数。具体地，可以计算当前损失函数相对于待训练的可见光人脸识别模型和红外人脸识别模型的各参数的梯度，基于该梯度来调整更新参数。

如图3所示，在步骤302得到更新后的待训练的可见光人脸识别模型和红外人脸识别模型之后，返回执行步骤301，继续下一次的预测操作。在基于当前损失函数的训练操作结果不满足与当前损失函数对应的收敛条件时，可以重复执行上述步骤301和步骤302，直到基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件。

步骤303，若基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件，输出待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，作为当前损失函数下的训练结果。

在基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件时，可以确定训练出的上述可见光人脸识别模型和红外人脸识别模型在当前损失函数下已达到可接受的人脸识别精度。可以停止基于当前损失函数的训练操作。这时，可以输出基于当前损失函数的可见光人脸识别模型的参数和红外人脸识别模型的参数。

从图3可以看出，通过基于当前损失函数对待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数不断更新调整，使得可见光人脸识别模型和红外人脸识别模型的预测精度不断提升，能够保证可见光人脸识别模型和红外人脸识别模型的精度。

需要说明的是，在上述模型生成方法的实施例中，不同损失函数对应的收敛条件可以相同，例如均可以为模型的参数更新次数达到一万次，不同损失函数对应的收敛条件也可以不相同。各损失函数对应的收敛条件可以是预先设定的。各损失函数对应的收敛条件也可以是基于损失函数中的权重确定的，例如作为收敛条件的上述损失阈值可以与第二代价函数的权重成反比，第二代价函数的权重越大，损失阈值越小。则在模型生成过程中，当红外人脸识别模型的预测误差在总体误差中的比重越大时，预测的精度越高，从而可以进一步提升红外人脸识别模型的准确度。

请参考图4，其示出了根据本申请的模型生成方法的一种实现方式的原理示意图。

如图4所示，在获取到可见光样本人脸图像集和红外样本人脸图像集之后，可以分别将可见光样本人脸图像集输入可见光人脸识别模型对应的卷积神经网络CNN1，将红外样本人脸图像集输入红外人脸图像识别模型对应的卷积神经网络CNN2。CNN1和CNN2在经过对输入的图像的卷积、池化处理之后分别得到相应的识别结果y_p1和y_p2。之后可以计算卷积神经网络CNN1的第一代价函数L₁和CNN2的第二代价函数L₂，其中，

y_m1和y_m2分别表示可见光样本人脸图像对应的用户身份的标注结果，和红外样本人脸图像对应的用户身份的标注结果。之后，可以计算当前损失函数L＝λ₁L₁+λ₂L₂，然后判断当前损失函数的值是否小于预设损失阈值L_域，若否，则可以采用反向传播算法，基于当前损失函数更新模型参数，得到更新后的卷积神经网络CNN1和CNN2，之后循环执行利用更新后的卷积神经网络CNN1和CNN2重新预测人脸识别结果，并判断当前损失函数的值是否小于L_域，若否，采用反向传播算法更新模型参数步骤。当损失函数的值小于L_域时，可以停止基于当前损失函数的参数更新。进一步判断第二代价函数的权重λ₂是否大于预设的权重阈值λ_域，若当前的损失函数中第二代价函数的权重不大于预设的权重阈值λ_域，则可以调整第二代价函数的权重λ₂，更新损失函数L，并基于更新后的损失函数执行上述将可见光样本人脸图像集输入可见光人脸识别模型对应的卷积神经网络CNN1，将红外样本人脸图像集输入红外人脸图像识别模型对应的卷积神经网络CNN2进行预测，计算损失函数的值是否小于预设损失阈值L_域，若否则采用反向传播算法，基于损失函数更新模型参数的操作。当第二代价函数的权重达到预设的权重阈值λ_域时，停止模型参数的调整和第二代价函数的权重的调整，固定此时可见光人脸识别模型对应的卷积神经网络CNN1的参数和红外人脸识别模型对应的卷积神经网络CNN2的参数，由此得到训练好的红外人脸识别模型。

进一步参考图5，作为对上述各图所示方法的实现，本申请提供了一种模型生成装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。

如图5所示，本实施例的模型生成装置500包括：获取单元501、训练单元502、判断单元503、更新单元504以及生成单元505。其中，获取单元501用于获取可见光样本人脸图像集和红外样本人脸图像集；训练单元502用于基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件；其中，损失函数为第一代价函数和第二代价函数的加权和，第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；判断单元503用于执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；更新单元504用于响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；生成单元505用于响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

在本实施例中，获取单元501可以通过收集可见光人脸图像和红外人脸图像来构建可见光样本人脸图像集和红外样本人脸图像集。在可见光样本人脸图像集和红外样本人脸图像集中，可以标记每幅人脸图像对应的用户的身份标识，作为可见光样本人脸图像集和红外样本人脸图像集的人脸识别的标注结果。

训练单元502可以基于可见光人脸识别模型的预测误差构建第一代价函数，基于红外人脸识别模型的预测误差构建第二代价函数，将第一代价函数和第二代价函数的加权和作为损失函数。基于损失函数来迭代调整可见光人脸识别模型的参数和红外人脸识别模型的参数。

判断单元503可以判断第二代价函数的权重是否达到预设阈值，从而确定由可见光人脸识别模型到红外人脸识别模型的迁移学习是否完成。

在判断单元503的判断结果为第二代价函数的权重未达到预设阈值时，更新单元504可以调整第二代价函数的权重，得到更新后的损失函数。

在判断单元503的判断结果为第二代价函数的权重达到预设阈值时，可以停止对第二代价函数的权重的更新，固定当前的红外人脸识别模型的参数，作为生成的红外人脸识别模型的参数。

在一些实施例中，上述更新单元504可以进一步用于按照如下方式对当前损失函数中的权重进行调整：利用已获取的权重步长调整当前损失函数中第二代价函数的权重。

在进一步的实施例中，上述更新单元504还可以用于按照如下方式对当前损失函数中的权重进行调整：利用已获取的权重步长的相反数调整当前损失函数中第一代价函数的权重。

在一些实施例中，上述训练单元还用于记录迭代次数。这时，上述更新单元504还可以用于按照如下方式对当前损失函数中的权重：根据迭代次数确定权重步长。

在一些实施例中，上述训练单元502可以进一步用于按照如下方式执行训练操作：执行预测操作，预测操作包括：将可见光样本人脸图像集输入待训练的可见光人脸识别模型，将红外样本人脸图像集输入待训练的红外人脸识别模型，得到可见光样本人脸图像集的人脸识别预测结果以及红外样本人脸图像集的人脸识别预测结果，判断基于当前损失函数的训练操作结果是否满足与当前损失函数对应的收敛条件；若基于当前损失函数的训练操作结果不满足与当前损失函数对应的收敛条件，基于当前损失函数，采用梯度下降法更新待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，执行预测操作；若基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件，输出待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，作为当前损失函数下的训练结果。其中，与当前损失函数对应的收敛条件包括：当前损失函数的值小于预设的损失阈值，和/或基于当前损失函数的模型参数更新次数达到预设的与当前损失函数对应的次数阈值。

装置500中记载的诸单元与参考图2描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作和特征同样适用于装置500及其中包含的单元，在此不再赘述。

本申请上述实施例的模型生成装置，获取单元获取可见光样本人脸图像集和红外样本人脸图像集；训练单元基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件；其中，损失函数为第一代价函数和第二代价函数的加权和，第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；判断单元执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；更新单元响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数在中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；生成单元响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数，实现了由可见光人脸识别模型到红外人脸识别模型的迁移学习，从而有效利用了可见光人脸图像来训练红外人脸识别模型，有助于提升红外人脸识别模型的准确性和可靠性。

下面参考图6，其示出了适于用来实现本申请实施例的电子设备的计算机系统600的结构示意图。图6示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

如图6所示，计算机系统600包括中央生成单元(CPU)601，其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中，还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。

以下部件连接至I/O接口605：包括键盘、鼠标等的输入部分606；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607；包括硬盘等的存储部分608；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器610上，以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分609从网络上被下载和安装，和/或从可拆卸介质611被安装。在该计算机程序被中央生成单元(CPU)601执行时，执行本申请的方法中限定的上述功能。需要说明的是，本申请的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中，计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本申请的操作的计算机程序代码，程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括获取单元、训练单元、判断单元、更新单元和生成单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，获取单元还可以被描述为“获取可见光样本人脸图像集和红外样本人脸图像集的单元”。

作为另一方面，本申请还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的装置中所包含的；也可以是单独存在，而未装配入该装置中。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该装置执行时，使得该装置：获取可见光样本人脸图像集和红外样本人脸图像集；基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与当前损失函数对应的收敛条件；其中，损失函数为第一代价函数和第二代价函数的加权和，第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；执行判断操作，判断操作包括判断当前损失函数中第二代价函数的权重是否达到预设阈值；响应于确定第二代价函数的权重未达到预设阈值，对当前损失函数中的权重进行调整，得到更新后的损失函数，执行训练操作和判断操作；响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离上述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种模型生成方法，包括：

获取可见光样本人脸图像集和红外样本人脸图像集；

基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；

所述训练操作包括：基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与所述当前损失函数对应的收敛条件；其中，所述损失函数为第一代价函数和第二代价函数的加权和，所述第一代价函数的值用于表征待训练的可见光人脸识别模型对可见光人脸图像集的人脸识别结果的预测误差，所述第二代价函数的值用于表征待训练的红外人脸识别模型对红外人脸图像集的人脸识别结果的预测误差；

执行判断操作，所述判断操作包括判断所述当前损失函数中第二代价函数的权重是否达到预设阈值；

响应于确定第二代价函数的权重未达到预设阈值，对所述当前损失函数中的权重进行调整，得到更新后的损失函数，执行所述训练操作和所述判断操作；

响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

2.根据权利要求1所述的方法，其中，所述对所述当前损失函数中的权重进行调整，包括：

利用已获取的权重步长调整所述当前损失函数中第二代价函数的权重。

3.根据权利要求2所述的方法，其中，所述对所述当前损失函数在中的权重进行调整，还包括：

利用已获取的权重步长的相反数调整所述当前损失函数中第一代价函数的权重。

4.根据权利要求2或3所述的方法，其中，所述训练操作还包括：

记录迭代次数；

所述对所述当前损失函数在中的权重进行调整，还包括：

根据迭代次数确定所述权重步长。

5.根据权利要求1所述的方法，其中，所述基于当前损失函数，采用反向传播算法迭代调整待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，以使基于当前损失函数的训练操作结果满足与所述当前损失函数对应的收敛条件，包括：

执行预测操作，所述预测操作包括：将所述可见光样本人脸图像集输入待训练的可见光人脸识别模型，将所述红外样本人脸图像集输入待训练的红外人脸识别模型，得到可见光样本人脸图像集的人脸识别预测结果以及红外样本人脸图像集的人脸识别预测结果，判断基于当前损失函数的训练操作结果是否满足与所述当前损失函数对应的收敛条件；

若基于当前损失函数的训练操作结果不满足与所述当前损失函数对应的收敛条件，基于当前损失函数，采用梯度下降法更新所述待训练的可见光人脸识别模型的参数和所述待训练的红外人脸识别模型的参数，执行所述预测操作；

若基于当前损失函数的训练操作结果满足与所述当前损失函数对应的收敛条件，输出待训练的可见光人脸识别模型的参数和待训练的红外人脸识别模型的参数，作为当前损失函数下的训练结果；

其中，所述与所述当前损失函数对应的收敛条件包括：

所述当前损失函数的值小于预设的损失阈值，和/或

基于所述当前损失函数的模型参数更新次数达到预设的与当前损失函数对应的次数阈值。

6.一种模型生成装置，包括：

获取单元，用于获取可见光样本人脸图像集和红外样本人脸图像集；

训练单元，用于基于当前损失函数，通过训练操作对待训练的可见光人脸识别模型和待训练的红外人脸识别模型进行训练；

判断单元，用于执行判断操作，所述判断操作包括判断所述当前损失函数中第二代价函数的权重是否达到预设阈值；

更新单元，用于响应于确定第二代价函数的权重未达到预设阈值，对所述当前损失函数中的权重进行调整，得到更新后的损失函数，执行所述训练操作和所述判断操作；

生成单元，用于响应于确定第二代价函数的权重达到预设阈值，输出待训练的红外人脸识别模型的参数。

7.根据权利要求6所述的装置，其中，所述更新单元用于按照如下方式对所述当前损失函数中的权重进行调整：

8.根据权利要求7所述的装置，其中，所述更新单元还用于按照如下方式对所述当前损失函数中的权重进行调整：

9.根据权利要求7或8所述的装置，其中，所述训练单元还用于记录迭代次数；

所述更新单元还用于按照如下方式对所述当前损失函数中的权重：

根据迭代次数确定所述权重步长。

10.根据权利要求6所述的装置，其中，所述训练单元进一步用于按照如下方式执行所述训练操作：

其中，所述与所述当前损失函数对应的收敛条件包括：

所述当前损失函数的值小于预设的损失阈值，和/或

11.一种电子设备，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。

12.一种计算机可读介质，其上存储有计算机程序，其中，所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。