CN110619315B

CN110619315B - 人脸识别模型的训练方法、装置及电子设备

Info

Publication number: CN110619315B
Application number: CN201910906112.6A
Authority: CN
Inventors: 刘铂涵
Original assignee: Chongqing Unisinsight Technology Co Ltd
Current assignee: Chongqing Unisinsight Technology Co Ltd
Priority date: 2019-09-24
Filing date: 2019-09-24
Publication date: 2020-10-30
Anticipated expiration: 2039-09-24
Also published as: CN110619315A

Abstract

本发明实施例提出一种人脸识别模型的训练方法、装置及电子设备，涉及监控技术领域。其中，人脸识别模型的训练方法通过利用第一模型处理具有人物标签的第一图像，得到第一特征编码；利用第二模型处理所述第一特征编码得到监控风格的第二图像；利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到人脸识别模型。通过将第一图像的风格转为监控风格，从而能够快速得到具有人物标签的监控风格图像。基于第二图像训练得到的人脸识别模型能够准确地识别监控图像中的人脸，从而，提高该人脸识别模型用于人脸动态布控时的召回率。

Description

人脸识别模型的训练方法、装置及电子设备

技术领域

本发明涉及监控技术领域，具体而言，涉及一种人脸识别模型的训练方法、装置及电子设备。

背景技术

随着人脸识别技术的进步，人脸识别技术已经应用于各个领域，给人们的生活带来便利。其中，在监控领域进行人脸动态布控是人脸识别技术目前比较重要的应用场景之一。

相关技术中，通过生活照(比如证件照)训练得到的人脸识别模型，并基于该人脸识别模型对监控图像进行识别。然而，即便是同一人，其证件照与其监控图像之间的相似度并不高。也就意味着，利用生活照训练得到的人脸识别模型对监控图像进行人脸动态布控时，得到的召回率(即，实际报警次数与应该报警次数之间的比例)不够高。

发明内容

有鉴于此，本发明的目的在于提供一种人脸识别模型的训练方法、装置及电子设备。

为了实现上述目的，本发明实施例采用的技术方案如下：

第一方面，本发明实施例提供一种人脸识别模型的训练方法，所述人脸识别模型用于识别监控图像中的人脸；所述人脸识别模型的训练方法包括：利用第一模型处理具有人物标签的第一图像，得到第一特征编码；其中，所述第一图像为包含人脸的生活照；所述第一模型为通过训练得到的用于提取生活风格特征编码的模型；利用第二模型处理所述第一特征编码得到监控风格的第二图像；其中，所述第二模型处理为通过训练得到的用于解码生成监控风格图像的模型；利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到所述人脸识别模型。

第二方面，本发明实施例提供一种人脸识别模型的训练装置，所述人脸识别模型用于识别监控图像中的人脸；所述人脸识别模型的训练装置包括：编码模块，用于利用第一模型处理具有人物标签的第一图像，得到第一特征编码；其中，所述第一图像为包含人脸的生活照；所述第一模型为通过训练得到的用于提取生活风格特征编码的模型；解码模块，用于利用第二模型处理所述第一特征编码得到监控风格的第二图像；其中，所述第二模型处理为通过训练得到的用于解码生成监控风格图像的模型；训练模块，用于利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到所述人脸识别模型。

第三方面，本发明实施例提供一种电子设备，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器可执行所述机器可执行指令以实现前述实施方式任一所述的方法。

第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如前述实施方式中任一项所述的方法。

与现有技术相比，本发明实施例提供的人脸识别模型的训练方法：首先，利用第一模型处理具有人物标签的第一图像，得到第一特征编码，并采用第二模型处理第一特征编码得到监控风格的第二图像。也就是，将具有人物标签的生活照转换为监控风格的图像，从而得到训练所需的样本图像。再利用第二图像及对应的人物标签，训练预设的深度学习模型，得到人脸识别模型。第二图像为监控风格图像，也就意味着第二图像与真实的监控图像之间的相似度较高。因此，基于第二图像训练得到的人脸识别模型能够准确地识别监控图像中的人脸，从而，提高该人脸识别模型用于人脸动态布控时的召回率。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例提供的电子设备的示意图。

图2示出了本发明实施例提供的人脸识别模型的训练方法的步骤流程图之一。

图3示出了本发明实施例提供的人脸识别模型的训练方法的步骤流程图之二。

图4为图3中步骤S202的子步骤流程图。

图5为图3中子步骤S2022对应的数据流向图。

图6为图3中步骤S202的子步骤流程图的另一部分。

图7为图6中子步骤S2025对应的数据流向图。

图8示出了本发明实施例提供的人脸识别模型的训练装置的示意图。

图标：100-电子设备；110-存储器；120-处理器；130-通信模块；300-人脸识别模型的训练装置；301-编码模块；302-解码模块；303-训练模块；304-获取模块；305-迭代模块。

具体实施方式

下面将结合本发明实施例中附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此，以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围，而是仅仅表示本发明的选定实施例。基于本发明的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明实施例中提到的监控照可以是由监控设备(比如，监控摄像头)采集到的图像数据；本发明实施例中提到的监控风格图像可以是通过处理得到的类似于监控照的图像数据；本发明实施例中提到的生活照可以是专业设备(比如，专业相机)在标准环境下采集到的图像数据，比如，职业照、证件照。本发明实施例中提到的生活风格图像可以是通过处理得到的类似于生活照的图像数据。

可以理解地，由于采集设备、采集环境等之间的差异，即便是同一用户，其生活照与监控照之间的相似度并不高，因此，利用生活照训练得到的人脸识别模型对监控图像进行人脸识别的准确性不高，从而，使上述模型用于监控领域的人脸动态布控时召回率(即，实际报警次数与应该报警次数之间的比例)不够高。

然而，目前的人脸识别模型依然是采用生活照进行训练得到的。究其原因在于，具有人物标签的生活照数量大且容易获得，适合用于进行模型训练。虽然监控照也容易大量获取，但监控照不具有人物标签。故，若是利用监控照进行人脸识别模型训练，需要一一对监控照进行人物标注，耗费大量的人力物力，且容易出错。

因此，本发明提供了一种人脸识别模型的训练方法、装置及电子设备，以解决上述问题。

请参照图1，是电子设备100的方框示意图。所述电子设备100包括存储器110、处理器120及通信模块130。所述存储器110、处理器120以及通信模块130各元件相互之间直接或间接地电性连接，以实现数据的传输或交互。例如，这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。

其中，存储器110用于存储程序或者数据。比如，预选的多个卷积神经网络、利用生活照训练得到的常规人脸识别模型。上述卷积神经网络包括第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络、第六卷积神经网络及预选的深度学习模型。所述存储器110可以是，但不限于，随机存取存储器110(RandomAccess Memory，RAM)，只读存储器110(Read Only Memory，ROM)，可编程只读存储器110(Programmable Read-Only Memory，PROM)，可擦除只读存储器110(ErasableProgrammable Read-Only Memory，EPROM)，电可擦除只读存储器110(Electric ErasableProgrammable Read-Only Memory，EEPROM)等。

处理器120用于读/写存储器110中存储的数据或程序，并执行相应地功能。

通信模块130用于通过所述网络建立所述电子设备100与其它通信终端之间的通信连接，并用于通过所述网络收发数据。

应当理解的是，图1所示的结构仅为电子设备100的结构示意图，所述电子设备100还可包括比图1中所示更多或者更少的组件，或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。

第一实施例

请参考图2，图2示出了本发明实施例提供的一种人脸识别模型的训练方法，上述人脸识别模型的训练方法应用于电子设备100。可以理解的，该人脸识别模型用于识别监控图像中的人脸。如图2所示，上述人脸识别模型的训练方法包括以下步骤：

步骤S101，利用第一模型处理具有人物标签的第一图像，得到第一特征编码。

在本发明实施例中，首先，获取生活照样本图像集。上述生活照样本图像集包括多张样本图像，该样本图像为具有人物标签的生活照。可选地，具有人物标签的生活照比较容易收集，且目前已掌握足够多的具有人物标签的生活照。可选地，上述生活照中人脸图像区域的占比大于背景图像区域。上述生活照可以属于不同人，且每张生活照具有对应的人物标签。上述人物标签可以是该生活照中显示的人物的身份信息，比如，人物标签可以是人物ID。

其次，从上述生活照样本图像集中确定多张样本图像作为第一图像。比如，可以依次将生活照样本图像集中每一张样本图像作为第一图像。再比如，可以将生活照样本图像集中多张样本图像作为第一图像。可以理解的，上述第一图像为包含人脸图像区域。可选地，生活照样本图像集中的样本图像均预先经过相似变换对齐，使得每张样本图像中人脸显示位置相同，使人脸上的双眼、鼻尖、嘴巴在样本图像中位置基本一致。

然后，将第一图像输入第一模型，以便由第一模型对第一图像处理后输出第一特征编码。可以理解地，上述第一模型是卷积神经网络模型。该第一模型可接受的输入数据为图片，该第一模型输出的数据为多个属于(-∞,+∞)区间的数字组成的字符串。上述第一模型为通过训练得到的、能够提取生活风格特征编码的模型。上述生活风格特征编码是与生活照的风格相关的特征编码数据。可以理解地，上述第一特征编码为从第一图像中提取到的生活风格特征编码。

步骤S102，利用第二模型处理第一特征编码得到监控风格的第二图像。

在本发明实施例中，上述第二模型是卷积神经网络模型，该第二模型可接受的输入数据是由多个属于(-∞,+∞)区间的数字组成的字符串。该第二模型输出的数据为图片。上述第二模型处理为通过训练得到的、能够基于输入该第二模型的数据进行解码，从而生成监控风格图像的模型。

通过步骤S101和步骤S102的配合，可以将第一图像从生活照转换为具有监控照风格的第二图像。也就是，通过生活照与监控照之间的风格转换，快速获得大量具有人物标签的监控风格的图像。

步骤S103，利用第二图像及对应的人物标签，训练预设的深度学习模型，得到人脸识别模型。

在本发明实施例中，上述第二图像为由第一图像转化得到的监控风格图像，故，其对应的人物标签为第一图像携带的人物标签。将第二图像输入深度学习模型，基于深度学习模型的输出及对应的人物标签，对深度学习模型的模型参数进行迭代。可以理解地，上述第二图像可以包括多张，在深度学习模型的模型参数经过多次迭代后得到人脸识别模型。

可以理解地，由于监控风格图像与真实的监控照之间的相似度极高。因此，将基于第二图像训练得到的人脸识别模型用于识别监控图像时，其准确性相较于基于生活照训练得到的人脸识别模型能够有效地提高。

另外，虽然容易掌握大量的监控照，但是监控照均没有人物标签。因此，直接采用监控照训练人脸识别模型是不可行的。若要使用监控照训练人脸识别模型，需要逐一对监控照进行人物标签标注。然而，逐一标注的监控照，工作量特别大。本发明实施例中，充分利用具有人物标签的生活照容易大量获得的这一优势，通过将生活照进行风格转换得到监控风格图像，使用大量具有人物标签的监控风格图像进行人脸识别模型训练。从而，在提高得到人脸识别模型对监控图像的识别准确性的同时，节约大量的人力成本。

正如前所述，上述第一模型和第二模型均为通过大量训练得到。如图3所示，上述人脸识别模型的训练方法还包括：

步骤S201，获取生活照样本图像集和监控照样本图像集。

在本发明实施例中，上述监控照样本图像集可以包括多张样本图像。监控照样本图像集中的样本图像可以从监控设备采集的媒体流中截取的具有人脸的图像帧。可选地，监控照样本图像集中的样本图像均预先经过相似变换对齐，使得每张样本图像中人脸显示位置相同，使人脸上的双眼、鼻尖、嘴巴在样本图像中位置基本一致。需要说明的是，监控照样本图像集中的样本图像与生活照样本图像集中的样本图像之间可以没有必然的对应关系，同时不限定监控照样本图像集中样本图像显示的人的身份。从而降低获取到生活照样本图像集和监控照样本图像集的难度，从而减少不必要的工作量。当然，可选地，两个训练集的图片尺寸可以一致。

可以理解地，上述生活照样本图像集和监控照样本图像集均容易得到。比如，生活照样本图像集可以根据目前人脸识别的公开训练集和公司自己搜集的训练集能够很轻易地达到数十万人物标签和数百万张图片数。上述监控照样本图像集可以是从普通的监控视频流中以每秒1张的频率抓取得到，然后运用普通的人脸检测模型从中截取人脸作为样本图像，从而构建监控照样本图像集。

步骤S202，利用生活照样本图像集和监控照样本图像集，结合第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络、第六卷积神经网络、预选的常规人脸识别模型，对第一卷积神经网络的模型参数进行迭代得到所述第一模型和对所述第四卷积神经网络的模型参数进行迭代得到所述第二模型。

上述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络和第六卷积神经网络均为预先选择的初始网络模型。

可选地，上述第一卷积神经网络为提取生活风格特征编码的初始网络模型，上述第一卷积神经网络可接受的输入数据为图片，该第一卷积神经网络输出的数据为多个属于(-∞,+∞)区间的数字组成的字符串。

可选地，上述第二卷积神经网络为基于输入的特征编码解码出生活风格图像的初始网络模型。上述第二卷积神经网络可接受的输入数据是由多个属于(-∞,+∞)区间的数字组成的字符串。该第二卷积神经网络输出的数据为图片。

可选地，上述第三卷积神经网络为提取监控风格特征编码的初始网络模型。上述第三卷积神经网络可接受的输入数据为图片，该第三卷积神经网络输出的数据为多个属于(-∞,+∞)区间的数字组成的字符串。

可选地，上述第四卷积神经网络为基于输入的特征编码解码出监控风格图像的初始网络模型。上述第四卷积神经网络可接受的输入数据是由多个属于(-∞,+∞)区间的数字组成的字符串，该第四卷积神经网络输出的数据为图片。

可选地，上述第五卷积神经网络为识别所述输入图像的监控风格程度的初始网络模型。

可选地，上述第六卷积神经网络为识别输入图像的生活风格程度的初始网络模型。

可选地，上述预选的常规人脸识别模型可接受的输入数据为图片，输出数据为多个(-∞,+∞)上的数字组成的数组。这个网络是直接利用生活照训练好的对人脸进行特征提取的网络。该常规人脸识别模型能把一张人脸图片转化成一个若干维的特征向量。可以理解地，利用常规人脸识别模型可以帮助第二卷积神经网络和第四卷积神经网络输出的图像中人物不失真，也就是，确保经过风格转换后，图像中的人脸依然能与人物标签对应。

在本发明实施例中，常规人脸识别模型的模型参数在此步骤之前已经确定。上述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络在训练过程中彼此配合，四个模型同时进行模型参数迭代。

可选地，如图4所示，上述步骤S202包括如下子步骤：

子步骤S2021，从生活照样本图像集中随机获取第一样本图及从监控照样本图像集中随机获取第二样本图。

子步骤S2022，利用所述第一样本图和所述第二样本图，结合所述第一卷积神经网络、所述第二卷积神经网络、所述第三卷积神经网络、所述第四卷积神经网络、第五卷积神经网络及第六卷积神经网络，对所述第五卷积神经网络的模型参数进行迭代得到第三模型和对所述第六卷积神经网络的模型参数进行迭代得到第四模型。

可选地，上述第三模型为用于识别输入图像的监控风格程度的模型。上述第三模型可接受的输入数据为图片，该第三模型输出的数据为属于(0,1)之间的一个数字，即作为表征上述监控风格程度的数值，以下称之为监控风格值。可以理解地，若输入第三模型的图像为监控照，则输出的值尽量接近1，若输入第三模型的图像为经过第二模型处理后得到的监控风格图像时，输出的值尽量接近0。可以理解地，利用第三模型可以帮助第四卷积神经网络输出的监控风格图像接近真实的监控照。

可选地，上述第四模型为用于识别输入图像的生活风格程度的模型。上述第四模型可接受的输入数据为图片，该第四模型输出的数据为属于(0,1)之间的一个数字，即作为表征上述生活风格程度的数值，以下称之为生活风格值。可以理解地，若输入第四模型的图像为生活照，则输出的值尽量接近1，若输入第四模型的图像为经过处理后得到的生活风格图像时，输出的值尽量接近0。可以理解地，利用第四模型可以帮助第二卷积神经网络输出的生活风格图像接近真实的生活照。

作为一种实施方式，上述子步骤S2022中对所述第五卷积神经网络的模型参数进行迭代得到第三模型的步骤包括：首先，从生活照样本图像集中随机获取第一样本图及从监控照样本图像集中随机获取第二样本图。其次，将第一样本图输入第一卷积神经网络得到第一输出编码特征；将所述第一输出编码特征输入所述第四卷积神经网络得到第二输出图像；将所述第二输出图像输入所述第五卷积神经网络得到第二监控风格值；将所述第二样本图输入所述第五卷积神经网络得到第三监控风格值。最后，根据第二监控风格值及所述第三监控风格值，利用损失函数：

对所述第五卷积神经网络的模型参数进行迭代得到所述第三模型，

代表第二监控风格值；

代表第三监控风格。

作为一种实施方式，上述子步骤S2022中对第六卷积神经网络的模型参数进行迭代得到第四模型的步骤包括：从所述生活照样本图像集中随机获取第一样本图及从所述监控照样本图像集中随机获取第二样本图；将所述第二样本图输入所述第三卷积神经网络得到第三输出编码特征；将所述第三输出编码特征输入所述第二卷积神经网络得到第五输出图像；将所述第五输出图像输入所述第六卷积神经网络得到第二生活风格值；将所述第一样本图输入所述第六卷积神经网络得到第三生活风格值；根据所述第二生活风格值及所述第三生活风格值，利用损失函数：

对所述第六卷积神经网络的模型参数进行迭代得到所述第四模型；

代表第二生活风格值；

代表第三生活风格值。

子步骤S2023，将第一样本图输入彼此配合的上述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、上述第三模型、第四模型及常规人脸识别模型，得到对应的输出数据。

在本发明实施例中，结合图5参考，上述子步骤S2023可以是：将所述第一样本图X_b输入第一卷积神经网络E_b0得到第一输出编码特征h_b；将所述第一输出编码特征h_b输入所述第二卷积神经网络DE_b0得到第一输出图像X_bb；将所述第一输出编码特征h_b输入所述第四卷积神经网络DE_a0得到第二输出图像X_ba；将所述第二输出图像X_ba输入第三模型DISa得到第一监控风格值

将所述第二输出图像X_ba输入所述第三卷积神经网络E_a0得到第二输出编码特征h_ba；将所述第二输出编码特征h_ba输入所述第二卷积神经网络DE_b0得到第三输出图像X_bab；将所述第二输出图像X_ba输入所述常规人脸识别模型F得到第一人脸特征f_ba；将所述第一样本图X_b输入所述常规人脸识别模型F得到第二人脸特征f_b。

子步骤S2024，根据第一输出图像、第一样本图、第一输出编码特征、第三输出图像、第二输出编码特征、第一监控风格值、第一人脸特征和第二人脸特征，利用以下损失函数之一或者多个之间的组合：

L₁＝MAE(x_bb-x_b)，

L₃＝MAE(x_bab-x_b)，

及

对第一卷积神经网络、第二卷积神经网络、第三卷积神经网络及第四卷积神经网络的模型参数进行同步迭代，以得到所述第一模型及所述第二模型。

可以理解地，虽然第一模型是由第一卷积神经网络训练得到、第二模型是由第四卷积神经网络训练得到，但是第一卷积神经网络、第二卷积神经网络、第三卷积神经网络及第四卷积神经网络在每一轮实际训练过程中，四个模型的模型参数会同步迭代。

在本发明实施例中，依据第一输出图像、第一样本图、第一输出编码特征、第三输出图像、第二输出编码特征、第一监控风格值、第一人脸特征和第二人脸特征，依次结合上述损失函数对第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络的模型参数执行一次同步迭代，以便于损失函数逐次收敛。可以理解地，L₁代表定义的第一损失函数，x_bb代表所述第一输出图像，x_b代表所述第一样本图，MAE代表计算平均绝对误差；L₂代表定义的第二损失函数，h_b代表所述第一输出编码特征，n₁代表所述第一输出编码特征的维度；L₃代表定义的第三损失函数，x_bab代表所述第三输出图像；L₄代表定义的第四损失函数，h_ba代表所述第二输出编码特征，n₂代表所述第二输出编码特征的维度；L₅代表定义的第五损失函数，

代表所述第一监控风格值；L₆代表定义的第六损失函数，f_ba代表所述第一人脸特征；f_b代表所述第二人脸特征，n₃代表所述第一人脸特征的维度。

在其他实施例中，如图6所示，上述步骤S202还可以包括如下子步骤：

子步骤S2025，将第二样本图输入彼此配合的上述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、上述第三模型、第四模型及常规人脸识别模型，得到对应的输出数据。

在本发明实施例中，结合图7参考，上述子步骤S2025可以是：将所述第二样本图X_a输入所述第三卷积神经网络E_a0得到第三输出编码特征h_a；将所述第三输出编码特征h_a输入所述第四卷积神经网络DE_a0得到第四输出图像X_aa；将所述第三输出编码特征h_a输入所述第二卷积神经网络DE_b0得到第五输出图像X_ab；将所述第五输出图像X_ab输入所述第四模型DIS_b得到第一生活风格值

将所述第五输出图像X_ab输入所述第一卷积神经网络E_b0得到第四输出编码特征h_ab；将所述第四输出编码特征h_ab输入第四卷积神经网络DE_a0得到第六输出图像X_aba；将第五输出图像X_ab输入常规人脸识别模型F得到第三人脸特征f_ab；将第二样本图输入所述常规人脸识别模型F得到第四人脸特征f_a。

子步骤S2026，根据第四输出图像、第二样本图、第三输出编码特征、第六输出图像、第四输出编码特征、第一生活风格值、第三人脸特征和第四人脸特征，利用以下损失函数之一或者多个之间的组合：

L₇＝MAE(x_aa-x_a)，

L₉＝MAE(x_aba-x_a)，

及

在本发明实施例中，依据第四输出图像、第二样本图、第三输出编码特征、第六输出图像、第四输出编码特征、第一生活风格值、第三人脸特征和第四人脸特征，依次结合上述损失函数对第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络的模型参数执行一次同步迭代，以便于损失函数逐次收敛。可以理解地，L₇代表定义的第七损失函数，x_aa代表所述第四输出图像，x_a代表所述第二样本图，MAE代表计算平均绝对误差；L₈代表定义的第八损失函数，h_a代表所述第三输出编码特征，m₁代表所述第三输出编码特征的维度；L₉代表定义的第九损失函数，x_aba代表所述第六输出图像；L₁₀代表定义的第十损失函数，h_ab代表所述第四输出编码特征，m₂代表所述第四输出编码特征的维度；L₁₁代表定义的第十一损失函数，

代表所述第一生活风格值；L₁₂代表定义的第十二损失函数，f_ab代表所述第三人脸特征；f_a代表所述第四人脸特征；m₃代表所述第三人脸特征的维度。

经过多个第一样本图和第二样本图对第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络的模型参数进行多次迭代直到模型收敛。之后，在一些实施例中，还可将得到的第一模型和第二模型组成的复合网络，将第一图像输入该复合网络后，得到第二图像。

为了执行上述实施例及各个可能的方式中的相应步骤，下面给出一种人脸识别模型的训练装置300的实现方式，可选地，该人脸识别模型的训练装置300可以采用上述图1所示的电子设备100的器件结构。进一步地，请参阅图8，图8为本发明实施例提供的一种人脸识别模型的训练装置300的功能模块图。需要说明的是，本实施例所提供的人脸识别模型的训练装置300，其基本原理及产生的技术效果和上述实施例相同，为简要描述，本实施例部分未提及之处，可参考上述的实施例中相应内容。该人脸识别模型的训练装置300包括：编码模块301、解码模块302、训练模块303、获取模块304及迭代模块305。

上述编码模块301，用于利用第一模型处理具有人物标签的第一图像，得到第一特征编码；其中，所述第一图像为包含人脸的生活照；所述第一模型为通过训练得到的用于提取生活风格特征编码的模型。

上述解码模块302，用于利用第二模型处理所述第一特征编码得到监控风格的第二图像；其中，所述第二模型处理为通过训练得到的用于解码生成监控风格图像的模型。

上述训练模块303，用于利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到所述人脸识别模型。

上述获取模块304，用于获取生活照样本图像集和监控照样本图像集。

上述迭代模块305，用于利用所述生活照样本图像集和监控照样本图像集，结合第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络、第六卷积神经网络、预选的常规人脸识别模型，对所述第一卷积神经网络的模型参数进行迭代得到所述第一模型和对所述第四卷积神经网络的模型参数进行迭代得到所述第二模型。

可选地，上述模块可以软件或固件(Firmware)的形式存储于图1所示的存储器中或固化于该电子设备的操作系统(Operating System，OS)中，并可由图1中的处理器执行。同时，执行上述模块所需的数据、程序的代码等可以存储在存储器中。

综上所述，本发明实施例提供了一种人脸识别模型的训练方法、装置及电子设备，其中，上述人脸识别模型的训练方法通过利用第一模型处理具有人物标签的第一图像，得到第一特征编码；其中，所述第一图像为包含人脸的生活照；所述第一模型为通过训练得到的用于提取生活风格特征编码的模型；利用第二模型处理所述第一特征编码得到监控风格的第二图像；其中，所述第二模型处理为通过训练得到的用于解码生成监控风格图像的模型；利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到所述人脸识别模型。通过将第一图像进行风格转换为第二图像，从而得到大量的具有人物标签的监控风格图像。利用大量监控风格图像训练得到的人脸识别模型在识别监控图像时准确性高，从而提高该人脸识别模型用于人脸动态布控时的召回率。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现方式中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或动作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

另外，在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人脸识别模型的训练方法，其特征在于，所述人脸识别模型用于识别监控图像中的人脸；所述人脸识别模型的训练方法包括：

利用第一模型处理具有人物标签的第一图像，得到第一特征编码；其中，所述第一图像为包含人脸的生活照；所述第一模型为通过训练得到的用于提取生活风格特征编码的模型；

利用第二模型处理所述第一特征编码得到监控风格的第二图像；其中，所述第二模型处理为通过训练得到的用于解码生成监控风格图像的模型；

利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到所述人脸识别模型；

其中，所述第一模型和第二模型的生成过程如下：分别通过从获得的生活照样本图像集中随机获取第一样本图及从获得的监控照样本图像集中随机获取第二样本图；利用所述第一样本图和所述第二样本图，结合第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络及第六卷积神经网络，对所述第五卷积神经网络的模型参数进行迭代得到第三模型和对所述第六卷积神经网络的模型参数进行迭代得到第四模型；其中，所述第三模型为用于识别输入图像的监控风格程度的模型；所述第四模型为用于识别输入图像的生活风格程度的模型；将所述第一样本图输入所述第一卷积神经网络得到第一输出编码特征；将所述第一输出编码特征输入所述第二卷积神经网络得到第一输出图像；将所述第一输出编码特征输入所述第四卷积神经网络得到第二输出图像；将所述第二输出图像输入所述第三模型得到第一监控风格值；将所述第二输出图像输入所述第三卷积神经网络得到第二输出编码特征；将所述第二输出编码特征输入所述第二卷积神经网络得到第三输出图像；将所述第二输出图像输入常规人脸识别模型得到第一人脸特征；将所述第一样本图输入所述常规人脸识别模型得到第二人脸特征；根据所述第一输出图像、所述第一样本图、所述第一输出编码特征、所述第三输出图像、所述第二输出编码特征、所述第一监控风格值、所述第一人脸特征和第二人脸特征，对所述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络及第四卷积神经网络的模型参数进行同步迭代，以得到所述第一模型和第二模型。

2.根据权利要求1所述的人脸识别模型的训练方法，其特征在于，所述人脸识别模型的训练方法还包括：

获取生活照样本图像集和监控照样本图像集；

利用所述生活照样本图像集和监控照样本图像集，结合第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络、第六卷积神经网络、预选的常规人脸识别模型，对所述第一卷积神经网络的模型参数进行迭代得到所述第一模型和对所述第四卷积神经网络的模型参数进行迭代得到所述第二模型；

其中，所述第一卷积神经网络为提取生活风格特征编码的初始网络模型；所述第二卷积神经网络为基于输入的特征编码解码出生活风格图像的初始网络模型；所述第三卷积神经网络为提取监控风格特征编码的初始网络模型；所述第四卷积神经网络为基于输入的特征编码解码出监控风格图像的初始网络模型；所述第五卷积神经网络为识别输入图像的监控风格程度的初始网络模型；所述第六卷积神经网络为识别所述输入图像的生活风格程度的初始网络模型。

3.根据权利要求2所述的人脸识别模型的训练方法，其特征在于，

根据所述第一输出图像、所述第一样本图、所述第一输出编码特征、所述第三输出图像、所述第二输出编码特征、所述第一监控风格值、所述第一人脸特征和第二人脸特征，利用以下损失函数之一或者多个之间的组合：

L₁＝MAE(x_bb-x_b)，

L₃＝MAE(x_bab-x_b)，

及

对所述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络及第四卷积神经网络的模型参数进行同步迭代，以得到所述第一模型和第二模型；其中，L₁代表定义的第一损失函数，x_bb代表所述第一输出图像，x_b代表所述第一样本图，MAE代表计算平均绝对误差；L₂代表定义的第二损失函数，h_b代表所述第一输出编码特征，n₁代表所述第一输出编码特征的维度；L₃代表定义的第三损失函数，x_bab代表所述第三输出图像；L₄代表定义的第四损失函数，h_ba代表所述第二输出编码特征，n₂代表所述第二输出编码特征的维度；L₅代表定义的第五损失函数，

4.根据权利要求3所述的人脸识别模型的训练方法，其特征在于，所述对所述第一卷积神经网络的模型参数进行迭代得到所述第一模型和对所述第四卷积神经网络的模型参数进行迭代得到所述第二模型的步骤还包括：

将所述第二样本图输入所述第三卷积神经网络得到第三输出编码特征；将所述第三输出编码特征输入所述第四卷积神经网络得到第四输出图像；将所述第三输出编码特征输入所述第二卷积神经网络得到第五输出图像；将所述第五输出图像输入所述第四模型得到第一生活风格值；将所述第五输出图像输入所述第一卷积神经网络得到第四输出编码特征；将所述第四输出编码特征输入所述第四卷积神经网络得到第六输出图像；将所述第五输出图像输入所述常规人脸识别模型得到第三人脸特征；将所述第二样本图输入所述常规人脸识别模型得到第四人脸特征；

根据所述第四输出图像、所述第二样本图、所述第三输出编码特征、所述第六输出图像、所述第四输出编码特征、所述第一生活风格值、所述第三人脸特征和第四人脸特征，利用以下损失函数之一或者多个之间的组合：

L₇＝MAE(x_aa-x_a)，

L₉＝MAE(x_aba-x_a)，

及

对所述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络及第四卷积神经网络的模型参数进行同步迭代，以得到所述第一模型及所述第二模型；其中，L₇代表定义的第七损失函数，x_aa代表所述第四输出图像，x_a代表所述第二样本图，MAE代表计算平均绝对误差；L₈代表定义的第八损失函数，h_a代表所述第三输出编码特征，m₁代表所述第三输出编码特征的维度；L₉代表定义的第九损失函数，x_aba代表所述第六输出图像；L₁₀代表定义的第十损失函数，h_ab代表所述第四输出编码特征，m₂代表所述第四输出编码特征的维度；L₁₁代表定义的第十一损失函数，

5.根据权利要求3所述的人脸识别模型的训练方法，其特征在于，所述对所述第五卷积神经网络的模型参数进行迭代得到所述第三模型的步骤包括：

将所述第一样本图输入所述第一卷积神经网络得到第一输出编码特征；将所述第一输出编码特征输入所述第四卷积神经网络得到第二输出图像；将所述第二输出图像输入所述第五卷积神经网络得到第二监控风格值；将所述第二样本图输入所述第五卷积神经网络得到第三监控风格值；

根据所述第二监控风格值及所述第三监控风格值，利用损失函数：

对所述第五卷积神经网络的模型参数进行迭代得到所述第三模型；其中，L代表所述损失函数；

代表第二监控风格值；

代表第三监控风格。

6.根据权利要求3所述的人脸识别模型的训练方法，其特征在于，所述对所述第六卷积神经网络的模型参数进行迭代得到所述第四模型的步骤包括：

将所述第二样本图输入所述第三卷积神经网络得到第三输出编码特征；将所述第三输出编码特征输入所述第二卷积神经网络得到第五输出图像；将所述第五输出图像输入所述第六卷积神经网络得到第二生活风格值；将所述第一样本图输入所述第六卷积神经网络得到第三生活风格值；

根据所述第二生活风格值及所述第三生活风格值，利用损失函数：

代表第二生活风格值；

代表第三生活风格值。

7.一种人脸识别模型的训练装置，其特征在于，所述人脸识别模型用于识别监控图像中的人脸；所述人脸识别模型的训练装置包括：

编码模块，用于利用第一模型处理具有人物标签的第一图像，得到第一特征编码；其中，所述第一图像为包含人脸的生活照；所述第一模型为通过训练得到的用于提取生活风格特征编码的模型；

解码模块，用于利用第二模型处理所述第一特征编码得到监控风格的第二图像；其中，所述第二模型处理为通过训练得到的用于解码生成监控风格图像的模型；

训练模块，用于利用所述第二图像及对应的人物标签，训练预设的深度学习模型，得到所述人脸识别模型；

其中，所述第一模型和第二模块的生成过程如下：分别通过从获得的生活照样本图像集中随机获取第一样本图及从获得的监控照样本图像集中随机获取第二样本图；利用所述第一样本图和所述第二样本图，结合第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络及第六卷积神经网络，对所述第五卷积神经网络的模型参数进行迭代得到第三模型和对所述第六卷积神经网络的模型参数进行迭代得到第四模型；其中，所述第三模型为用于识别输入图像的监控风格程度的模型；所述第四模型为用于识别输入图像的生活风格程度的模型；将所述第一样本图输入所述第一卷积神经网络得到第一输出编码特征；将所述第一输出编码特征输入所述第二卷积神经网络得到第一输出图像；将所述第一输出编码特征输入所述第四卷积神经网络得到第二输出图像；将所述第二输出图像输入所述第三模型得到第一监控风格值；将所述第二输出图像输入所述第三卷积神经网络得到第二输出编码特征；将所述第二输出编码特征输入所述第二卷积神经网络得到第三输出图像；将所述第二输出图像输入常规人脸识别模型得到第一人脸特征；将所述第一样本图输入所述常规人脸识别模型得到第二人脸特征；根据所述第一输出图像、所述第一样本图、所述第一输出编码特征、所述第三输出图像、所述第二输出编码特征、所述第一监控风格值、所述第一人脸特征和第二人脸特征，对所述第一卷积神经网络、第二卷积神经网络、第三卷积神经网络及第四卷积神经网络的模型参数进行同步迭代，以得到所述第一模型和第二模型。

8.根据权利要求7所述的人脸识别模型的训练装置，其特征在于，所述人脸识别模型的训练装置还包括：

获取模块，用于获取生活照样本图像集和监控照样本图像集；

迭代模块，用于利用所述生活照样本图像集和监控照样本图像集，结合第一卷积神经网络、第二卷积神经网络、第三卷积神经网络、第四卷积神经网络、第五卷积神经网络、第六卷积神经网络、预选的常规人脸识别模型，对所述第一卷积神经网络的模型参数进行迭代得到所述第一模型和对所述第四卷积神经网络的模型参数进行迭代得到所述第二模型；

9.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的机器可执行指令，所述处理器可执行所述机器可执行指令以实现权利要求1-6任一所述的方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1-6中任一项所述的方法。