CN105868678B

CN105868678B - 人脸识别模型的训练方法及装置

Info

Publication number: CN105868678B
Application number: CN201510026163.1A
Authority: CN
Inventors: 李亮
Original assignee: Alibaba Group Holding Ltd
Current assignee: Advanced New Technologies Co Ltd; Advantageous New Technologies Co Ltd
Priority date: 2015-01-19
Filing date: 2015-01-19
Publication date: 2019-09-17
Anticipated expiration: 2035-01-19
Also published as: CN110826420B; CN110874571B; CN110826420A; CN105868678A; CN110874571A

Abstract

本申请提供一种人脸识别模型的训练方法及装置，其中的方法包括：基于公开人脸数据集进行多层神经网络训练，并训练出至少一个基层；从所述至少一个基层中提取图像变换参数；根据提取到的图像变换参数对非公开人脸数据集进行不可逆的模糊化处理；将模糊化处理后的非公开人脸数据集上传到服务端，由所述服务端完成所述多层神经网络剩余基层的训练。本申请可以排除在对非公开人脸数据进行上传的过程中泄密风险。

Description

人脸识别模型的训练方法及装置

技术领域

本申请涉及通讯领域，尤其涉及一种人脸识别模型的训练方法及装置。

背景技术

人脸识别是图像识别领域的一个热门领域，为了训练更高精度的人脸识别模型，现有的训练系统都需要大量的人脸图像作为训练样本，并且采用分布式计算以提高训练速度，因此越来越多的模型训练任务已经放在云计算平台上来运行。

然而由于模型训练之前需要将人脸图像上传到云计算平台，因此在将人脸图像上传到云计算平台的过程中，则会存在人脸图像被窃取从而泄漏用户隐私的问题。

发明内容

有鉴于此，本申请提出一种人脸识别模型的训练方法，该方法包括：

基于公开人脸数据集进行多层神经网络训练，并训练出至少一个基层；

从所述至少一个基层中提取图像变换参数；

根据提取到的图像变换参数对非公开人脸数据集进行不可逆的模糊化处理；

将模糊化处理后的非公开人脸数据集上传到服务端，由所述服务端完成所述多层神经网络剩余基层的训练。

可选的，所述多层神经网络包括多层卷积神经网络。

可选的，所述服务端包括云计算平台。

可选的，所述从所述至少一个网络层中提取图像变换参数包括：

提取所述至少一个网络层中的特征映射图；

将提取出的特征映射图作为图像变换参数进行输出。

可选的，所述根据提取到的图像变换参数对非公开人脸数据集进行不可逆的模糊化处理包括：

将所述图像变换参数作为卷积核与所述非公开人脸数据集进行卷积计算，以对所述非公开人脸数据集进行不可逆的模糊化处理。

本申请还提出一种人脸识别模型的训练装置，该装置包括：

训练模块，用于基于公开人脸数据集进行多层神经网络训练，并训练出至少一个基层；

提取模块，用于从所述至少一个基层中提取图像变换参数；

处理模块，用于根据提取到的图像变换参数对非公开人脸数据集进行不可逆的模糊化处理；

上传模块，用于将模糊化处理后的非公开人脸数据集上传到服务端，由所述服务端完成所述多层神经网络剩余基层的训练。

可选的，所述多层神经网络包括多层卷积神经网络；所述服务端包括云计算平台。

可选的，所述提取模块具体用于：

提取所述至少一个网络层中的特征映射图；

将提取出的特征映射图作为图像变换参数进行输出。

可选的，所述处理模块具体用于：

本申请还提出一种人脸识别模型的训练装置，包括：

处理器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为：

从所述至少一个基层中提取图像变换参数；

本申请通过基于公开人脸数据集进行多层神经网络训练，并训练出至少一个基层，然后从训练出的所述至少一个基层中提取图像变换参数对非公开人脸数据集进行不可逆的模糊化处理，并将模糊化处理后的非公开人脸数据集上传给服务端，由服务端完成剩余基层的训练。由于对非公开人脸数据进行的模糊化处理为不可逆的，而且模糊化处理后的人脸数据用户肉眼无法进行分辨，因此在对非公开人脸数据进行上传的过程中，排除了泄密风险。

附图说明

图1是本申请一实施例提供的一种人脸识别模型的训练方法的流程图；

图2是本申请一实施例提供的一种4个基层的多层卷积神经网络的基本架构图；

图3是本申请一实施例提供的一种人脸识别模型的训练装置的逻辑框图；

图4是本申请一实施例提供的承载所述人脸识别模型的训练装置的服务器的硬件结构图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在现有技术中，针对图像在传输过程中可能会存在隐私泄露的问题，目前的解决方案主要基于以下两种：

第一，使用密钥对需要上传的人脸图像进行加密，然后对加密后的人脸图像作为公开信息传输；云计算平台在收到上传的加密图像后，进行解密获取原始的人脸图像进行人脸识别模型的训练。

在以上方案中，对人脸图像进行加密时所使用的密钥一旦被破解或者泄露，仍然会造成隐私泄露的问题。

第二，在需要上传的人脸图像上划定隐私区域，并对隐私区域进行部分模糊化，然后用隐私区域减去模糊化后的隐私区域得到差值隐私图像，并使用密钥对差值隐私区域进行加密。

在以上方案中，对差值隐私区域进行加密时所使用的密钥一旦被破解或者泄露，未授权的用户就可以获取到差值隐私图像，仍然会造成隐私泄露。

有鉴于此，本申请提出一种人脸识别模型的训练方法，通过针对公开人脸数据集进行多层神经网络训练，并训练出至少一个基层，然后从训练出的所述至少一个基层中提取图像变换参数对非公开人脸数据集进行不可逆的模糊化处理，并将模糊化处理后的非公开人脸数据集上传给云计算平台，由云计算平台完成剩余基层的训练。由于对非公开人脸数据进行的模糊化处理为不可逆的，而且模糊化处理后的人脸数据用户肉眼无法进行分辨，因此在对非公开人脸数据进行上传的过程中，排除了泄密风险。

下面通过具体实施例并结合具体的应用场景对本申请进行描述。

请参考图1，图1是本申请一实施例提供的一种人脸识别模型的训练方法，该方法的执行主体可以为第一服务器；当然在实现时该方法的执行主体也可以是各种提供计算资源的计算机；所述方法包括以下步骤：

步骤101，基于公开人脸数据集进行多层神经网络训练，并训练出至少一个基层；

步骤102，从所述至少一个基层中提取图像变换参数；

步骤103，根据提取到的图像变换参数对非公开人脸数据集进行不可逆的模糊化处理；

步骤104，将模糊化处理后的非公开人脸数据集上传到服务端，由所述服务端完成所述多层神经网络剩余基层的训练。

在本实施例中，所述第一服务器可以是一个存储了用户的非公开人脸数据集的服务器，所述服务端可以是具有强大计算能力的云计算平台，或者所述服务端也可以是一个在处理能力上优于所述第一服务器，与所述第一服务器在物理上相互独立的用于进行人脸识别模型训练的第二服务器。

以下以所述服务端为云计算平台为例对本申请的技术方案进行详细描述。

在实际应用中，为了利用云计算平台的强大计算能力，人脸识别模型的训练通常可以由云计算平台来进行。云计算平台可以将所述第一服务器上传的人脸数据集作为训练样本，然后基于大量训练样本进行多层神经网络训练后输出人脸识别模型。然而，云计算平台在进行多层神经网络训练时所采用的大量训练样本，通常会包括大量的由所述第一服务器上传的非公开人脸数据集；由于非公开人脸数据集通常涉及用户隐私，因此，为了尽可能的规避在上传过程中可能面临的隐私泄露的风险，所述第一服务器在将非公开人脸数据集上传给云计算平台时，可以在本地针对非公开人脸数据集进行不可逆的模糊化处理。

第一服务器在对非公开人脸数据集进行模糊化处理时，可以在在本地基于预先采集的大量公开人脸数据集进行多层神经网络训练，并训练出至少一个基层，然后从该基层中提取图像变换参数对需要上传的非公开人脸数据集进行模糊化处理。其中，所述公开人脸数据集，是指能够从互联网或者其他公共资源上免费获得的人脸图像数据集，这些数据集通常已经获得了本人的公开授权，因为不存在泄漏隐私的风险。

在本实施例中，所述多层神经网络可以是多层卷积神经网络，在多层卷积神经网络的基本架构中，通常包括多个4-5个基层，每一个基层包括多个Feature Map(特征映射图)，每个Feature Map通过一个卷积滤波器提取输入的人脸图像的一种特征。在多层卷积神经网络的所有基层中，通常包括特征提取层C层和特征映射层S层，例如，请参见图2，图2为本实施例中示出的一种4个基层的多层卷积神经网络的基本架构，包括C1、S1、C2和S2等4个基层。C1和C2层为特征提取层，S1和S2层为特征映射层。特征提取层也可以称之为卷积层，用于对输入的图像数据进行卷积计算；每一个特征提取层紧跟一个特征映射层，用于对特征提取层中卷积计算后生成的Feature Map进行抽样计算。

第一服务器在对非公开人脸数据集进行模糊化处理时，可以按照图2所示出的架构对预先采集的大量公开人脸数据集进行多层卷积神经网络训练，并且训练出至少一个基层，然后提取该基层中的Feature Map作为图像变换参数对非公开人脸数据集进行模糊化处理。

其中，第一服务器在本地针对所述公开人脸数据训练出的基层数，应该小于多层卷积神经网络训练的最大基层数，对于剩余的基层数将由云计算平台继续进行训练后完成。

请继续参见图2，在本实施例示出的一个示例中，第一服务器可以在本地基于公开人脸数据集训练出多层卷积神经网络的前两层，即C1层和S2层。当然，在实际应用中，第一服务器也可以只在本地训练出多层卷积神经网络的C1层，由云计算平台完成S1、C2和S2层的训练；或者第一服务器可以在本地训练出多层卷积神经网络的C1、S1和C2，由云计算平台完成S2层的训练，在本实施例中不进行特别限定。

具体地，第一服务器首先可以将输入的公开人脸数据集和3个卷积滤波器进行卷积计算后，在C1层产生3个Feature Map；S2层对C1层中的Feature Map经过抽样计算后也得到3个S2层Feature Map。其中，所述卷积滤波器的数量可以根据实际需求进行设置，在本实施例中不进行特别限定；C1层和S2的详细训练过程，本领域技术人员可以参考现有技术中的介绍，本实施例中不再进行详述。

当C1层和S2层训练完成后，可以将C1层和S2层中的Feature Map提取出来，并作为图像变换参数进行输出，后续可以根据该图像变换参数对非公开人脸数据集进行模糊化处理。

当第一服务器训练出多层卷积神经网络的前两层后，成功输出所述图像变换参数后，可以根据输出的图像变换参数对非公开人脸数据集进行模糊化处理。

第一服务器在对所述非公开人脸数据集进行模糊化处理时，可以通过将输出的所述图像变换参数作为卷积核，与非公开人脸数据集进行卷积计算，来完成针对非公开人脸数据集的模糊化操作。由于卷积操作是一个不可逆的过程，因此通过卷积计算模糊化处理后的人脸图像不可恢复，而且无法通过肉眼进行分辨。

对于模糊化操作后的非公开人脸数据，第一服务器可以上传给云计算平台，由于上传的非公开人脸数据已经被模糊化处理，而且该模糊化处理为不可逆的，因此在上传过程中不会存在隐私泄露的风险。

云计算平台在收到由第一服务器上传的非公开人脸数据后，虽然此时非公开人脸数据已经被第一服务器进行了模糊化处理，然而第一服务器在对非公开人脸数据进行模糊化处理时所采用的图像变换参数，是从第一服务器训练出的多层卷积神经网络的前两个基层中提取出来的，因此云计算平台仍然可以将接收到的经过模糊化处理后的非公开人脸数据作为一个基层继续进行训练，完成剩余的C2和S2层的训练，并最终训练出人脸识别模型。其中，C2和S2层的训练过程与C1和S1层的训练过程相同，详细训练过程本领域技术人员也可以参考现有技术中的介绍，本实施例中不再进行详述

当然，云计算平台在进行多层卷积神经网络时，也可以将接收到的经过模糊化处理的非公开人脸数据作为输入数据，在本地重新进行多层卷积神经网络的训练。例如，云计算平台可以将接收到的所述非公开人脸数据作为输入数据，在本地重新训练出多层卷积神经网络的训练C1、S1、C2和S2层，在本实施例中不进行特别限定。

在以上描述中，以所述多层神经网络为多层卷积神经网络为例对本申请的技术方案进行了详细描述，当然在具体实现时，所述多层神经网络也可以为其它类型的多层神经网络，例如BP(Back Propagation，反向传播)神经网络，在本实施例中仅以所述多层神经网络为多层卷积神经网络为示例性描述，并不用于限定本发明。

通过以上描述可知，本申请通过针对公开人脸数据集进行多层神经网络训练，并训练出至少一个基层，然后从训练出的所述至少一个基层中提取图像变换参数对非公开人脸数据集进行不可逆的模糊化处理，并将模糊化处理后的非公开人脸数据集上传给服务端，由服务端完成剩余基层的训练。由于对非公开人脸数据进行的模糊化处理为不可逆的，而且模糊化处理后的人脸数据用户肉眼无法进行分辨，因此在对非公开人脸数据进行上传的过程中，排除了泄密风险。

另外，由于对非公开人脸数据集进行模糊化处理时所采用的图像变换参数是从训练出的多层神经网络训练的至少一个基层中提取出来的，因此对于模糊化处理后的非公开人脸数据集，仍然可以作为多层神经网络训练时的一个基层由服务端继续进行训练。

与上述方法实施例相对应，本申请还提供了装置的实施例。

请参见图3，本申请提出一种人脸识别模型的训练装置30，应用于服务器。其中，请参见图4，作为承载所述人脸识别模型的训练装置30的服务器所涉及的硬件架构中，通常包括CPU、内存、非易失性存储器、网络接口以及内部总线等；以软件实现为例，所述人脸识别模型的训练装置30通常可以理解为加载在内存中的计算机程序，通过CPU运行之后形成的软硬件相结合的逻辑装置，所述装置30包括：

训练模块301，用于基于公开人脸数据集进行多层神经网络训练，并训练出至少一个基层；

提取模块302，用于从所述至少一个基层中提取图像变换参数；

处理模块303，用于根据提取到的图像变换参数对非公开人脸数据集进行不可逆的模糊化处理；

上传模块304，用于将模糊化处理后的非公开人脸数据集上传到服务端，由所述服务端完成所述多层神经网络剩余基层的训练。

在本实施例中，所述多层神经网络为多层卷积神经网络；所述服务端为云计算平台。

在本实施例中，所述提取模块302具体用于：

提取所述至少一个网络层中的特征映射图；

将提取出的特征映射图作为图像变换参数进行输出。

在本实施例中，所述处理模块303具体用于：

本申请还提供了一种人脸识别模型的训练装置的实施例。

该装置包括：

处理器；用于存储所述处理器可执行指令的存储器；

进一步，该装置还可以包括输入/输出接口，网络接口，各种硬件等。

其中，所述处理器被配置为：

从所述至少一个基层中提取图像变换参数；

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本申请的真正范围和精神由下面的权利要求指出。

应当理解的是，本申请并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

以上所述仅为本申请的较佳实施例而已，并不用以限制本申请，凡在本申请的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本申请保护的范围之内。

Claims

1.一种人脸识别模型的训练方法，其特征在于，该方法包括：

基于公开人脸数据集进行多层卷积神经网络训练，并训练出至少一个基层；

从所述至少一个基层中提取图像变换参数；

将所述图像变换参数作为卷积核与非公开人脸数据集进行卷积计算，以对所述非公开人脸数据集进行不可逆的模糊化处理；

2.根据权利要求1所述的方法，其特征在于，所述服务端包括云计算平台。

3.根据权利要求1所述的方法，其特征在于，所述从所述至少一个基层中提取图像变换参数包括：

提取所述至少一个基层中的特征映射图；

将提取出的特征映射图作为图像变换参数进行输出。

4.一种人脸识别模型的训练装置，其特征在于，该装置包括：

训练模块，用于基于公开人脸数据集进行多层卷积神经网络训练，并训练出至少一个基层；

提取模块，用于从所述至少一个基层中提取图像变换参数；

处理模块，将所述图像变换参数作为卷积核与非公开人脸数据集进行卷积计算，以对所述非公开人脸数据集进行不可逆的模糊化处理；

5.根据权利要求4所述的装置，其特征在于，所述服务端包括云计算平台。

6.根据权利要求4所述的装置，其特征在于，所述提取模块具体用于：

提取所述至少一个基层中的特征映射图；

将提取出的特征映射图作为图像变换参数进行输出。

7.一种人脸识别模型的训练装置，其特征在于，包括：

处理器；用于存储所述处理器可执行指令的存储器；

其中，所述处理器被配置为：

从所述至少一个基层中提取图像变换参数；