CN109993026B

CN109993026B - 亲属识别网络模型的训练方法及装置

Info

Publication number: CN109993026B
Application number: CN201711479738.0A
Authority: CN
Inventors: 廖继平; 李勇; 曾加贝; 张�杰; 阚美娜; 山世光
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2017-12-29
Filing date: 2017-12-29
Publication date: 2021-08-20
Anticipated expiration: 2037-12-29
Also published as: CN109993026A

Abstract

本申请公开了一种亲属识别网络模型的训练方法及装置，属于图像识别技术领域。所述方法包括：获取人脸识别网络模型；将多个预设人脸图像集包括的预设人脸图像输入人脸识别网络模型；通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，对人脸识别网络模型中的参数进行调整，指定三重损失函数为光滑的凸函数，第一特征距离为具有亲属关系的预设人脸图像的人脸图像特征之间的距离，第二特征距离为具有非亲属关系的预设人脸图像的人脸图像特征之间的距离；将参数调整完成后的人脸识别网络模型确定为亲属识别网络模型。本申请中亲属识别网络模型可以更加深入地挖掘出人脸图像的遗传特征，从而使得亲属识别网络模型的识别准确度较高。

Description

亲属识别网络模型的训练方法及装置

技术领域

本申请涉及图像识别技术领域，特别涉及一种亲属识别网络模型的训练方法及装置。

背景技术

两个人的人脸图像之间的相似度是判断两个人是否具有亲属关系的重要依据，由于基于人脸图像的自动化亲属关系识别可广泛应用于快速亲子鉴定、失踪儿童查找、手机相册管理、海量社交图像理解等领域，因此其已经引起了人们越来越多的关注。

相关技术中，一般通过卷积神经网络模型进行人脸亲属关系识别，具体地，先使用多个训练图像集和二分类损失函数训练得到卷积神经网络模型，然后向该卷积神经网络模型输入两个人脸图像，该卷积神经网络模型即可输出这两个人脸图像是亲属关系还是非亲属关系。

然而，由于该卷积神经网络模型仅仅是使用二分类损失函数训练得到，所以该卷积神经网络模型的训练过程的监督信号较弱，从而造成最终学习到的人脸图像特征所处的特征空间不具有代表性，导致该卷积神经网络模型的识别准确度较低。

发明内容

本申请提供了一种亲属识别网络模型的训练方法、装置、计算机可读存储介质和计算机程序产品，可以解决相关技术中亲属关系的识别准确度较低的问题。所述技术方案如下：

第一方面，提供了一种方法，所述方法包括：

获取人脸识别网络模型，所述人脸识别网络模型用于对人脸图像进行身份识别；

将多个预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型，所述多个预设人脸图像集包括具有亲属关系的预设人脸图像集和具有非亲属关系的预设人脸图像集；

通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，对所述人脸识别网络模型中的参数进行调整，所述指定三重损失函数为光滑的凸函数，所述第一特征距离为具有亲属关系的预设人脸图像的人脸图像特征之间的距离，所述第二特征距离为具有非亲属关系的预设人脸图像的人脸图像特征之间的距离；

将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型，所述亲属识别网络模型用于对人脸图像进行亲属关系识别。

在本申请实施例中，指定三重损失函数是通过不断比较具有亲属关系的预设人脸图像的人脸图像特征之间的距离和具有非亲属关系的预设人脸图像的人脸图像特征之间的距离这两个距离之间的差异，来给该人脸识别网络模型反馈差异信号，因而据此训练得到的该亲属识别网络模型可以更加深入地挖掘出人脸图像的遗传特征，从而使得该亲属识别网络模型的识别准确度较高。

进一步地，所述将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型之后，还包括：

获取待识别亲属关系的两个目标人脸图像；

通过所述亲属识别网络模型识别所述两个目标人脸图像之间的亲属关系。

在本申请实施例中，由于亲属识别网络模型可以更加深入地挖掘出人脸图像的遗传特征，识别准确度较高，因此获取到待识别亲属关系的两个目标人脸图像时，可以通过该亲属识别网络模型来对该两个目标人脸图像之间的亲属关系进行准确识别。

其中，所述将多个预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型，包括：

对于所述多个预设人脸图像集中的任一预设人脸图像集A，从所述预设人脸图像集A中选择出一个预设人脸图像，对选择出的预设人脸图像执行以下处理，直至处理完所述预设人脸图像集A包括的每个预设人脸图像为止：

从所述多个预设人脸图像集中确定与所述预设人脸图像集A具有亲属关系的第一预设人脸图像集，并从所述多个预设人脸图像集中确定与所述预设人脸图像集A具有非亲属关系的第二预设人脸图像集；

将选择出的预设人脸图像、所述第一预设人脸图像集包括的预设人脸图像和所述第二预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型。

在本申请实施例中，无需遍历该多个预设人脸图像集包括的所有亲属图像对和所有非亲属图像对，而是可以将选择出的预设人脸图像与第一预设人脸图像集和第二预设人脸图像集同批输入该人脸识别网络模型，从而可以加快网络模型的收敛速度，且可以提高网络模型的泛化能力。

其中，所述通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，对所述人脸识别网络模型中的参数进行调整，包括：

通过所述指定三重损失函数根据所述人脸识别网络模型提取的人脸图像特征，确定所述第一特征距离与所述第二特征距离之间的差异值，并通过反向传播逐层到达所述人脸识别网络模型的第一层，在所述反向传播结束时，使用梯度下降法对所述人脸识别网络模型中的参数进行更新。

在本申请实施例中，该人脸识别网络模型在该多个预设人脸图像集上得到了充分的微调，最终学习到的人脸图像特征处在一个较为理想的流型空间，该流型空间中具有亲属关系的人脸图像的人脸图像特征之间的距离较小，而具有非亲属关系的人脸图像的人脸图像特征之间的距离较大，因而此时由该人脸识别网络模型微调后得到的该亲属识别网络模型将可以由浅到深逐渐准确提取出人脸图像的遗传特征，从而使得该亲属识别网络模型的识别准确度较高。

进一步地，所述将多个预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型之前，还包括：

获取多个人脸图像集，所述多个人脸图像集中的每个人脸图像集包括的所有人脸图像的身份相同；

从所述多个人脸图像集中确定人脸图像数量最多的第一人脸图像集；

根据所述第一人脸图像集的人脸图像数量，确定目标数量，所述目标数量大于或等于所述第一人脸图像集的人脸图像数量；

对所述多个人脸图像集中的每个人脸图像集进行增广处理，直至所述每个人脸图像集的人脸图像数量达到所述目标数量；

将增广处理后的所述多个人脸图像集确定为所述多个预设人脸图像集。

在本申请实施例中，可以对多个人脸图像集进行增广处理，从而得到较多的具有亲属关系或非亲属关系的人脸图像，且可以保证具有亲属关系的人脸图像的数量与具有非亲属关系的人脸图像的数量较为均衡，从而在后续使用这些人脸图像对该人脸识别网络模型进行训练时，可以获得较好的训练效果。

其中，所述对所述多个人脸图像集中的每个人脸图像集进行增广处理，包括：

从所述多个人脸图像集中选择出一个人脸图像集，对选择出的人脸图像集执行以下处理，直至处理完所述多个人脸图像集中的每个人脸图像集为止：

对于所述第一人脸图像集中的任一人脸图像B，增加或过滤所述人脸图像B的噪声，得到所述人脸图像B的增广图像；或者重建所述人脸图像B的分辨率，得到所述人脸图像B的增广图像；或者矫正所述人脸图像B的伽玛值，得到所述人脸图像B的增广图像；或者通过生成对抗网络(Generative Adversarial Networks，GAN)生成所述人脸图像B的增广图像；

将所述人脸图像B的增广图像添加到选择出的人脸图像集中。

在本申请实施例中，可以通过基于噪声调整、伽马值矫正、重建分辨率、GAN等多种方式来生成人脸图像的增广图像，从而在保证所生成的增广图像与该人脸图像为同一身份的同时，还可以提高所生成的增广图像的多样性。

其中，所述指定三重损失函数为：l＝Ex_iψ_β(φ_i ⁺·φ_i ^_·e^c)；

其中，

其中，所述l为所述指定三重损失函数，所述x_i、所述x_j、所述x_k均为人脸图像，所述x_j～x_i代表所述x_j与所述x_i之间具有亲属关系，所述x_k^x_i代表所述x_k与所述x_i之间具有非亲属关系，所述E为期望，所述e为自然常数，所述c为预设参数，所述d为人脸图像特征之间的距离，所述N_i ⁺为与所述x_i具有亲属关系的所述x_j的数量，N_i ^-为与所述x_i具有非亲属关系的所述x_k的数量，所述ψ_β()为单调递增的凸函数且函数值在预设区间内。

通过如下两种方式中的至少一种方式对所述亲属识别网络模型进行更新：

当终端中存储的多个第二人脸图像集的人脸图像总数和存储的多个第三人脸图像集的人脸图像总数均大于或等于第一预设数量时，使用所述指定三重损失函数、所述多个第二人脸图像集和所述多个第三人脸图像集对所述亲属识别网络模型进行更新，所述多个第二人脸图像集之间具有亲属关系，所述多个第三人脸图像集之间具有非亲属关系；

当终端中存储的多个第二人脸图像集的人脸图像总数和存储的多个第三人脸图像集的人脸图像总数均大于或等于第二预设数量且均小于或等于第一预设数量时，对所述多个第二人脸图像集和所述多个第三人脸图像集进行增广处理，直至所述多个第二人脸图像集的人脸图像总数和所述多个第三人脸图像集的人脸图像总数均达到所述第一预设数量，使用所述指定三重损失函数、所述多个第二人脸图像集和所述多个第三人脸图像集对所述亲属识别网络模型进行更新，所述第一预设数量大于所述第二预设数量。

在本申请实施例中，在得到亲属识别网络模型之后，还可以使用终端存储的人脸图像来对该亲属识别网络模型进行更新，也即是，可以通过该终端的用户自身的亲属关系来不断调整该亲属识别网络模型，根据该终端的使用场景来不断完善该亲属识别网络模型，从而使得该亲属识别网络模型可以更为准确地挖掘出人脸图像的遗传特征，提高亲属关系的识别精度的同时也提高了用户的识别体验。

第二方面，提供了一种亲属识别网络模型的训练装置，所述亲属识别网络模型的训练装置具有实现上述第一方面中亲属识别网络模型的训练方法行为的功能。所述亲属识别网络模型的训练装置包括至少一个模块，所述至少一个模块用于实现上述第一方面所提供的亲属识别网络模型的训练方法。

第三方面，提供了一种亲属识别网络模型的训练装置，所述亲属识别网络模型的训练装置的结构中包括处理器和存储器，所述存储器用于存储支持亲属识别网络模型的训练装置执行上述第一方面所提供的亲属识别网络模型的训练方法的程序，以及存储用于实现上述第一方面所述的亲属识别网络模型的训练方法所涉及的数据。所述处理器被配置为用于执行所述存储器中存储的程序。所述亲属识别网络模型的训练装置还可以包括通信总线，所述通信总线用于在所述处理器与所述存储器之间建立连接。

第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的亲属识别网络模型的训练方法。

第五方面，提供了一种包含指令的计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面所述的亲属识别网络模型的训练方法。

上述第二方面、第三方面、第四方面和第五方面所获得的技术效果与上述第一方面中对应的技术手段获得的技术效果近似，在这里不再赘述。

本申请提供的技术方案带来的有益效果是：获取用于对人脸图像进行身份识别的人脸识别网络模型，之后，对该人脸识别网络模型进行微调来得到亲属识别网络模型。具体可以先将多个预设人脸图像集包括的预设人脸图像输入该人脸识别网络模型，再通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，来对该人脸识别网络模型中的参数进行调整，最后将参数调整完成后的该人脸识别网络模型确定为亲属识别网络模型。由于指定三重损失函数是通过不断比较具有亲属关系的预设人脸图像的人脸图像特征之间的距离和具有非亲属关系的预设人脸图像的人脸图像特征之间的距离这两个距离之间的差异，来给该人脸识别网络模型反馈差异信号，所以据此训练得到的该亲属识别网络模型可以更加深入地挖掘出人脸图像的遗传特征，从而使得该亲属识别网络模型的识别准确度较高。

附图说明

图1是本申请实施例提供的一种人脸亲属关系识别过程的示意图；

图2是本申请实施例提供的一种计算机设备的结构示意图；

图3A是本申请实施例提供的一种亲属识别网络模型的训练方法的流程图；

图3B是本申请实施例提供的一种人脸识别网络模型的示意图；

图3C是本申请实施例提供的另一种亲属识别网络模型的训练方法的流程图；

图4是本申请实施例提供的一种亲属识别网络模型的训练装置的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请的实施方式作进一步地详细描述。

在对本申请实施例进行详细地解释说明之前，对本申请实施例涉及的应用场景予以说明。

本申请实施例提供的亲属识别网络模型的训练方法可以应用于人脸图像的自动化亲属关系识别场景，具体可以应用于诸如快速亲子鉴定、失踪儿童查找、手机相册管理、海量社交图像理解等领域中用于识别亲属关系的模型的训练。

例如，如图1所示，人脸图像1和人脸图像2为需要进行亲属关系识别的两个人脸图像，则可以通过本申请实施例提供的亲属识别网络模型的训练方法来训练得到亲属识别网络模型，之后，将人脸图像1和人脸图像2输入该亲属识别网络模型，该亲属识别网络模型即可输出人脸图像1和人脸图像2的亲属关系识别结果，该亲属关系识别结果可以为具有亲属关系，或可以为具有非亲属关系。

图2是本申请实施例提供的一种计算机设备的结构示意图，本申请实施例提供的亲属识别网络模型的训练方法可以应用于该计算机设备。参见图2，该计算机设备包括至少一个处理器201，通信总线202，存储器203以及至少一个通信接口204。

处理器201可以是一个通用中央处理器(Central Processing Unit，CPU)，微处理器，特定应用集成电路(application-specific integrated circuit，ASIC)，或一个或多个用于控制本申请方案程序执行的集成电路。

通信总线202可包括一通路，在上述组件之间传送信息。

存储器203可以是只读存储器(read-only memory，ROM)或可存储静态信息和指令的其它类型的静态存储设备，随机存取存储器(random access memory，RAM)或者可存储信息和指令的其它类型的动态存储设备，也可以是电可擦可编程只读存储器(ElectricallyErasable Programmable Read-Only Memory，EEPROM)、只读光盘(Compact Disc Read-Only Memory，CD-ROM)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。存储器203可以是独立存在，通过通信总线202与处理器201相连接。存储器203也可以和处理器201集成在一起。

通信接口204，使用任何收发器一类的装置，用于与其它设备或通信网络通信，如以太网，无线接入网(Radio Access Network，RAN)，无线局域网(Wireless Local AreaNetworks，WLAN)等。

在具体实现中，作为一种实施例，处理器201可以包括一个或多个CPU，例如图2中所示的CPU0和CPU1。

在具体实现中，作为一种实施例，计算机设备可以包括多个处理器，例如图2中所示的处理器201和处理器205。这些处理器中的每一个可以是一个单核处理器(single-CPU)，也可以是一个多核处理器(multi-CPU)。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。

在具体实现中，作为一种实施例，计算机设备还可以包括输出设备206和输入设备207。输出设备206和处理器201通信，可以以多种方式来显示信息。例如，输出设备206可以是液晶显示器(liquid crystal display，LCD)，发光二级管(light emitting diode，LED)显示设备，阴极射线管(cathode ray tube，CRT)显示设备，或投影仪(projector)等。输入设备207和处理器201通信，可以以多种方式接收用户的输入。例如，输入设备207可以是鼠标、键盘、触摸屏设备或传感设备等。

上述的计算机设备可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中，计算机设备可以是台式机、便携式电脑、网络服务器、掌上电脑(PersonalDigital Assistant，PDA)、移动手机、平板电脑、无线终端设备、通信设备或者嵌入式设备，本申请实施例不限定计算机设备的类型。

其中，存储器203用于存储执行本申请方案的程序代码210，处理器201用于执行存储器203中存储的程序代码210。该计算机设备可以通过处理器201以及存储器203中的程序代码210，来实现下文图3A实施例提供的亲属识别网络模型的训练方法。

图3A是本申请实施例提供的一种亲属识别网络模型的训练方法的流程图。参见图3A，该方法包括：

步骤301：获取人脸识别网络模型。

需要说明的是，人脸识别网络模型用于对人脸图像进行身份识别，也即是，该人脸识别网络模型能够提取出所输入的人脸图像的人脸识别特征，所提取的人脸识别特征能够代表所输入的人脸图像对应的一个特定的人，并与其他人的人脸图像的人脸识别特征具有明显的区分性。实际应用中，该人脸识别网络模型可以为深度卷积神经网络模型，如可以为深度残差网络模型等，当然，该人脸识别网络模型也可以为其它的神经网络模型，本申请实施例对此不作限定。

例如，该人脸识别网络模型为深度残差网络模型，其可以由级联的残差块(residual block)组成，如图3B所示，该人脸识别网络模型可以包括4种类型的残差块，分别为残差块0(residual_block_0)、残差块1(residual_block_1)、残差块2(residual_block_2)、残差块3(residual_block_3)，且这4种类型的残差块的重复次数可以分别为3、8、36、3，此时该人脸识别网络模型总共可以包括152层，其中，图3B中所示的conv指卷积，maxpool指最大池化，fc指全连接。

具体地，步骤301的操作可以为：获取多个预设训练图像集，使用预设损失函数和该多个预设训练图像集对待训练的神经网络模型进行训练，得到该人脸识别网络模型。

需要说明的是，多个预设训练图像集可以预先进行设置，且该多个预设训练图像集中的每个预设训练图像集包括的所有人脸图像属于同一人脸类别，即每个预设训练图像集包括的所有人脸图像的身份相同。该多个预设训练图像集可以根据人脸图像数据库获取得到，具体地，可以先对人脸图像数据库中包括的人脸图像统一进行人脸检测、人脸特征点定位和归一化，再将其都裁剪为相同的尺寸，来得到该多个预设训练图像集。例如，人脸图像数据库为MS-Celeb-1M，MS-Celeb-1M中包括3百万个人脸图像，含有41856个人脸类别，则可以将MS-Celeb-1M包括的人脸图像统一进行人脸检测、人脸特征点定位和归一化，再将其都裁剪为256x256尺寸，来得到该多个预设训练图像集。

另外，预设损失函数可以预先进行设置，如预设损失函数可以为欧式距离损失函数(Euclidean Loss)、Sigmoid交叉熵损失函数(Sigmoid Cross Entropy Loss)、Softmax损失函数(Softmax With Loss)等，本申请实施例对此不作限定。

其中，使用预设损失函数和该多个预设训练图像集对待训练的神经网络模型进行训练，得到该人脸识别网络模型时，可以先将该多个预设训练图像集中包括的预设训练图像输入待训练的神经网络模型，然后通过预设损失函数对该神经网络模型中的参数进行调整，最后将参数调整完成后的该神经网络模型确定为该人脸识别网络模型。

其中，通过预设损失函数对该神经网络模型中的参数进行调整时，可以通过预设损失函数计算该神经网络模型的误差更新值，并通过反向传播逐层到达该神经网络模型的第一层，在反向传播结束时，使用梯度下降法对该神经网络模型中的参数进行更新。

实际应用中，每批输入到待训练的神经网络模型中的预设训练图像的数量可以预先进行设置，如可以设置为64等，之后，通过预设损失函数对该神经网络模型中的参数进行调整时，该神经网络模型将会进行较多次迭代，如可能会进行300000次迭代，最终该神经网络模型在该多个预设训练图像集上得到了充分的训练后得到该人脸识别网络模型，此时该人脸识别网络模型可以由浅到深逐渐准确提取出人脸图像的人脸识别特征。

需要说明的是，在通过上述步骤301获取到人脸识别网络模型之后，可以对该人脸识别网络模型进行微调来得到用于对人脸图像进行亲属关系识别的亲属识别网络模型。亲属识别网络模型用于对两个人脸图像之间的亲属关系进行识别，也即是，该亲属识别网络模型能够提取出所输入的两个人脸图像各自的遗传特征，所提取的两个遗传特征之间的距离(如余弦距离等)能够反映所输入的两个人脸图像之间是亲属关系还是非亲属关系，如当所提取的两个遗传特征之间的距离小于预设的阈值时，所输入的两个人脸图像之间可以是亲属关系，当所提取的两个遗传特征之间的距离大于预设的阈值时，所输入的两个人脸图像之间可以是非亲属关系。

另外，对该人脸识别网络模型进行微调来得到亲属识别网络模型时，可以使用指定三重损失函数和多个预设人脸图像集对该人脸识别网络模型进行训练，来得到亲属识别网络模型，具体可以通过如下步骤302-步骤304实现。

步骤302：将多个预设人脸图像集包括的预设人脸图像输入该人脸识别网络模型。

需要说明的是，该多个预设人脸图像集可以预先进行设置，且该多个预设人脸图像集包括具有亲属关系的预设人脸图像集和具有非亲属关系的预设人脸图像集，也即是，该多个预设人脸图像集中的任意两个预设人脸图像集之间具有亲属关系或非亲属关系，且对于该多个预设人脸图像集中具有亲属关系的两个预设人脸图像集，这两个预设人脸图像集各自包括的人脸图像之间具有亲属关系，对于该多个预设人脸图像集中具有非亲属关系的两个预设人脸图像集，这两个预设人脸图像集各自包括的人脸图像之间具有非亲属关系。

具体地，步骤302的操作可以为：对于该多个预设人脸图像集中的任一预设人脸图像集A，从该预设人脸图像集A中选择出一个预设人脸图像，对选择出的预设人脸图像执行以下处理，直至处理完该预设人脸图像集A包括的每个预设人脸图像为止：从该多个预设人脸图像集中确定与该预设人脸图像集A具有亲属关系的第一预设人脸图像集，并从该多个预设人脸图像集中确定与该预设人脸图像集A具有非亲属关系的第二预设人脸图像集，将选择出的预设人脸图像、第一预设人脸图像集包括的预设人脸图像和第二预设人脸图像集包括的预设人脸图像输入该人脸识别网络模型。

值得说明的是，本申请实施例中无需遍历该多个预设人脸图像集包括的所有亲属图像对和所有非亲属图像对，而是可以将选择出的预设人脸图像与第一预设人脸图像集和第二预设人脸图像集同批输入该人脸识别网络模型，从而可以加快网络模型的收敛速度，且可以提高网络模型的泛化能力。

进一步地，在步骤302之前还可以生成该多个预设人脸图像集，具体地，可以获取多个人脸图像集，该多个人脸图像集中的每个人脸图像集包括的所有人脸图像的身份相同，之后，可以将该多个人脸图像集直接确定为该多个预设人脸图像集，或者可以对该多个人脸图像集进行处理，得到该多个预设人脸图像集。

其中，获取该多个人脸图像集时，可以先通过互联网知识图谱和搜索引擎，搜集多个家庭中每个家庭成员的人物图像，并对每个家庭成员的人物图像之间的亲属关系进行标注，之后，对于已标注了亲属关系的多个人物图像，对该多个人物图像统一进行人脸检测、人脸特征点定位和归一化，然后将其都裁剪为相同的尺寸，来得到该多个人脸图像集。

其中，对该多个人脸图像集进行处理，得到该多个预设人脸图像集时，可以先从该多个人脸图像集中确定人脸图像数量最多的第一人脸图像集，再根据第一人脸图像集的人脸图像数量确定目标数量，然后对该多个人脸图像集中的每个人脸图像集进行增广处理，直至每个人脸图像集的人脸图像数量达到目标数量，最后将增广处理后的该多个人脸图像集确定为该多个预设人脸图像集。

需要说明的是，目标数量大于或等于第一人脸图像集的人脸图像数量，如目标数量可以为第一人脸图像集的人脸图像数量的2倍、3倍等。

另外，增广处理是指根据人脸图像集包括的人脸图像，生成与该人脸图像的身份相同的增广图像，并将生成的增广图像添加到该人脸图像集中。

其中，对该多个人脸图像集中的每个人脸图像集进行增广处理时，可以从该多个人脸图像集中选择出一个人脸图像集，对选择出的人脸图像集执行以下处理，直至处理完该多个人脸图像集中的每个人脸图像集为止：对于选择出的人脸图像集中的任一人脸图像B，增加或过滤该人脸图像B的噪声，得到该人脸图像B的增广图像，或者重建该人脸图像B的分辨率，得到该人脸图像B的增广图像，或者矫正该人脸图像B的伽玛值，得到该人脸图像B的增广图像，或者通过GAN生成该人脸图像B的增广图像；将该人脸图像B的增广图像添加到选择出的人脸图像集中。

例如，可以增加该人脸图像B的高斯噪声，得到该人脸图像B的增广图像。或者，可以将人脸图像B的分辨率先缩小为原来的三分之一，再放大为原来的分辨率，得到该人脸图像B的增广图像。或者，可以将该人脸图像B输入到GAN，将GAN输出的图像确定为该人脸图像B的增广图像。

步骤303：通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，对该人脸识别网络模型中的参数进行调整。

需要说明的是，第一特征距离为具有亲属关系的预设人脸图像的人脸图像特征之间的距离，第二特征距离为具有非亲属关系的预设人脸图像的人脸图像特征之间的距离，第一特征距离与第二特征距离之间的差异值可以由第一特征距离减去第二特征距离得到，或者可以由第二特征距离减去第一特征距离得到，本申请实施例对此不作限定。

另外，指定三重损失函数可以称为soft triplet loss，且指定三重损失函数为光滑的凸函数，以保证后续可以使用梯度下降法对其进行优化。指定三重损失函数在训练网络模型时，是通过不断比较具有亲属关系的人脸图像的人脸图像特征之间的距离和具有非亲属关系的人脸图像的人脸图像特征之间的距离这两个距离之间的差异，来给网络模型反馈差异信号，从而得以更加深入地挖掘出人脸图像的遗传特征，提高亲属关系识别的准确度。

具体地，步骤303的操作可以为：通过指定三重损失函数根据该人脸识别网络模型提取的人脸图像特征，确定第一特征距离与第二特征距离之间的差异值，并通过反向传播逐层到达该人脸识别网络模型的第一层，在反向传播结束时，使用梯度下降法对该人脸识别网络模型中的参数进行更新。

需要说明的是，指定三重损失函数可以预先进行设置，例如，指定三重损失函数可以为：l＝Ex_iψ_β(φ_i ⁺·φ_i ^_·e^c)；其中，

其中，l为指定三重损失函数，x_i、x_j、x_k均为人脸图像，x_j～x_i代表x_j与x_i之间具有亲属关系，x_k^x_i代表x_k与x_i之间具有非亲属关系，E为期望，e为自然常数，c为预设参数，d为人脸图像特征之间的距离，N_i ⁺为与x_i具有亲属关系的x_j的数量，N_i ^-为与x_i具有非亲属关系的x_k的数量，ψ_β()为单调递增的凸函数且函数值在预设区间内。

其中，预设参数和预设区间均可以预先进行设置，如预设参数可以为0.3等，预设区间可以为(0，1)等，本申请实施例对此不作限定。

进一步地，在步骤303之前，可以生成指定三重损失函数，具体地，可以根据普通的三重损失函数(triplet loss)来生成指定三重损失函数。

例如，普通的三重损失函数

则先使用代理函数ψ_β(e^z)＝In(1+βe^z)/In(1+β)替换普通的三重损失函数l1中的1，得到损失函数

再基于Jensen不等式放缩损失函数l2，此时

从而得到了指定三重损失函数l。

步骤304：将参数调整完成后的该人脸识别网络模型确定为亲属识别网络模型。

实际应用中，每批输入到该人脸识别网络模型中的预设人脸图像的数量可以预先进行设置，如可以设置为64等，之后，通过指定三重损失函数对该人脸识别网络模型中的参数进行调整时，该人脸识别网络模型将会进行较多次迭代，如可能会进行20000次迭代，该人脸识别网络模型在该多个预设人脸图像集上得到了充分的微调，最终学习到的人脸图像特征处在一个较为理想的流型空间，该流型空间中具有亲属关系的人脸图像的人脸图像特征之间的距离较小，而具有非亲属关系的人脸图像的人脸图像特征之间的距离较大，因而此时由该人脸识别网络模型微调后得到的该亲属识别网络模型将可以由浅到深逐渐准确提取出人脸图像的遗传特征，从而使得该亲属识别网络模型的识别准确度较高。

在本申请实施例中，获取用于对人脸图像进行身份识别的人脸识别网络模型，之后，对该人脸识别网络模型进行微调来得到亲属识别网络模型。具体可以先将多个预设人脸图像集包括的预设人脸图像输入该人脸识别网络模型，再通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，来对该人脸识别网络模型中的参数进行调整，最后将参数调整完成后的该人脸识别网络模型确定为亲属识别网络模型。由于指定三重损失函数是通过不断比较具有亲属关系的预设人脸图像的人脸图像特征之间的距离和具有非亲属关系的预设人脸图像的人脸图像特征之间的距离这两个距离之间的差异，来给该人脸识别网络模型反馈差异信号，所以据此训练得到的该亲属识别网络模型可以更加深入地挖掘出人脸图像的遗传特征，从而使得该亲属识别网络模型的识别准确度较高。

进一步地，通过上述步骤301-步骤304得到了可用于对人脸图像进行亲属关系识别的亲属识别网络模型之后，参见图3C，还可以通过下述步骤305-步骤306来使用该亲属识别网络模型对有亲属关系识别需求的人脸图像之间的亲属关系进行识别。

步骤305：获取待识别亲属关系的两个目标人脸图像。

需要说明的是，该两个目标人脸图像为有亲属关系识别需求的两个人脸图像，该两个目标人脸图像可以是由用户手动输入得到，或者是从其它设备中获取得到，当然，也可以是预先存储的两个人脸图像，本申请实施例对此不作限定。

步骤306：通过该亲属识别网络模型识别该两个目标人脸图像之间的亲属关系。

具体地，步骤306的操作可以为：将该两个目标人脸图像输入该亲属识别网络模型，当该亲属识别网络模型输出的亲属关系识别结果为亲属关系时，确定该两个目标人脸图像之间具有亲属关系，当该亲属识别网络模型输出的亲属关系识别结果为非亲属关系时，确定该两个目标人脸图像之间具有非亲属关系。

进一步地，通过上述步骤301-步骤304得到了可用于对人脸图像进行亲属关系识别的亲属识别网络模型之后，还可以对该亲属识别网络模型进行在线更新，具体地，可以通过如下两种方式中的至少一种方式对该亲属识别网络模型进行更新。

第一种方式：当终端中存储的多个第二人脸图像集的人脸图像总数和存储的多个第三人脸图像集的人脸图像总数均大于或等于第一预设数量时，使用指定三重损失函数、该多个第二人脸图像集和该多个第三人脸图像集对该亲属识别网络模型进行更新。

需要说明的是，该终端可以为有亲属关系识别需求的终端，如可以为应用本申请实施例提供的亲属识别网络模型的训练方法的终端、存储有本申请实施例训练得到的亲属识别网络模型的终端等，本申请实施例对此不作限定。

另外，第一预设数量可以预先进行设置，且第一预设数量可以设置的较大，如第一预设数量可以为200、300等，本申请实施例对此不作限定。

再者，该多个第二人脸图像集之间具有亲属关系，该多个第三人脸图像集之间具有非亲属关系。

其中，使用指定三重损失函数、该多个第二人脸图像集和该多个第三人脸图像集对该亲属识别网络模型进行更新的操作与上述实施例中使用指定三重损失函数和该多个预设人脸图像集对该人脸识别网络模型进行训练的操作类似，本申请实施例对此不再进行详细阐述。

第二种方式：当终端中存储的多个第二人脸图像集的人脸图像总数和存储的多个第三人脸图像集的人脸图像总数均大于或等于第二预设数量且均小于或等于第一预设数量时，对该多个第二人脸图像集和该多个第三人脸图像集进行增广处理，直至该多个第二人脸图像集的人脸图像总数和该多个第三人脸图像集的人脸图像总数均达到第一预设数量，使用指定三重损失函数、该多个第二人脸图像集和该多个第三人脸图像集对该亲属识别网络模型进行更新。

需要说明的是，第一预设数量大于第二预设数量，第二预设数量可以预先进行设置，且第二预设数量可以设置的较小，如第二预设数量可以为50、60等，本申请实施例对此不作限定。

其中，对该多个第二人脸图像集和该多个第三人脸图像集进行增广处理的操作与上述步骤302中对该多个人脸图像集中的每个人脸图像集进行增广处理的操作类似，本申请实施例对此不再进行详细阐述。

值得说明的是，实际应用中，不仅可以通过如上两种方式中的至少一种方式对该亲属识别网络模型进行更新，也可以通过其它方式对该亲属识别网络模型进行更新，例如，可以当终端中存储的多个第二人脸图像集的人脸图像总数大于或等于第一预设数量，且存储的多个第三人脸图像集的人脸图像总数大于或等于第二预设数量且小于或等于第一预设数量时，对该多个第三人脸图像集进行增广处理，直至该多个第三人脸图像集的人脸图像总数达到第一预设数量，使用指定三重损失函数、该多个第二人脸图像集和该多个第三人脸图像集对该亲属识别网络模型进行更新。

图4是本申请实施例提供的一种亲属识别网络模型的训练装置的结构示意图，该亲属识别网络模型的训练装置可以由软件、硬件或者两者的结合实现成为计算机设备的部分或者全部，该计算机设备可以为图2所示的计算机设备。

参见图4，该装置包括第一获取模块401，输入模块402，调整模块403和第一确定模块404。

第一获取模块401，用于执行图3A实施例中的步骤301；

输入模块402，用于执行图3A实施例中的步骤302；

调整模块403，用于执行图3A实施例中的步骤303；

第一确定模块404，用于执行图3A实施例中的步骤304。

可选地，该装置还包括：

第二获取模块，用于执行图3A实施例中的步骤305；

识别模块，用于执行图3A实施例中的步骤306。

可选地，输入模块402用于：

对于多个预设人脸图像集中的任一预设人脸图像集A，从预设人脸图像集A中选择出一个预设人脸图像，对选择出的预设人脸图像执行以下处理，直至处理完预设人脸图像集A包括的每个预设人脸图像为止：

从多个预设人脸图像集中确定与预设人脸图像集A具有亲属关系的第一预设人脸图像集，并从多个预设人脸图像集中确定与预设人脸图像集A具有非亲属关系的第二预设人脸图像集；

将选择出的预设人脸图像、第一预设人脸图像集包括的预设人脸图像和第二预设人脸图像集包括的预设人脸图像输入人脸识别网络模型。

可选地，该装置还包括：

第三获取模块，用于获取多个人脸图像集，多个人脸图像集中的每个人脸图像集包括的所有人脸图像的身份相同；

第二确定模块，用于从多个人脸图像集中确定人脸图像数量最多的第一人脸图像集；

第三确定模块，用于根据第一人脸图像集的人脸图像数量，确定目标数量，目标数量大于或等于第一人脸图像集的人脸图像数量；

增广处理模块，用于对多个人脸图像集中的每个人脸图像集进行增广处理，直至每个人脸图像集的人脸图像数量达到目标数量；

第四确定模块，用于将增广处理后的多个人脸图像集确定为多个预设人脸图像集。

可选地，增广处理模块用于：

从多个人脸图像集中选择出一个人脸图像集，对选择出的人脸图像集执行以下处理，直至处理完多个人脸图像集中的每个人脸图像集为止：

对于第一人脸图像集中的任一人脸图像B，增加或过滤人脸图像B的噪声，得到人脸图像B的增广图像；或者重建人脸图像B的分辨率，得到人脸图像B的增广图像；或者矫正人脸图像B的伽玛值，得到人脸图像B的增广图像；或者通过生成对抗网络GAN生成人脸图像B的增广图像；

将人脸图像B的增广图像添加到选择出的人脸图像集中。

可选地，指定三重损失函数为：

l＝Ex_iψ_β(φ_i ⁺·φ_i ^_·e^c)；

其中，

可选地，该装置还包括：

更新模块，用于通过如下两种方式中的至少一种方式对亲属识别网络模型进行更新：

当终端中存储的多个第二人脸图像集的人脸图像总数和存储的多个第三人脸图像集的人脸图像总数均大于或等于第一预设数量时，使用指定三重损失函数、多个第二人脸图像集和多个第三人脸图像集对亲属识别网络模型进行更新，多个第二人脸图像集之间具有亲属关系，多个第三人脸图像集之间具有非亲属关系；

当终端中存储的多个第二人脸图像集的人脸图像总数和存储的多个第三人脸图像集的人脸图像总数均大于或等于第二预设数量且均小于或等于第一预设数量时，对多个第二人脸图像集和多个第三人脸图像集进行增广处理，直至多个第二人脸图像集的人脸图像总数和多个第三人脸图像集的人脸图像总数均达到第一预设数量，使用指定三重损失函数、多个第二人脸图像集和多个第三人脸图像集对亲属识别网络模型进行更新，第一预设数量大于第二预设数量。

需要说明的是：上述实施例提供的亲属识别网络模型的训练装置在亲属识别网络模型的训练时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的亲属识别网络模型的训练装置与亲属识别网络模型的训练方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意结合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机指令时，全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如：同轴电缆、光纤、数据用户线(Digital Subscriber Line，DSL))或无线(例如：红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如：软盘、硬盘、磁带)、光介质(例如：数字通用光盘(Digital Versatile Disc，DVD))、或者半导体介质(例如：固态硬盘(Solid State Disk，SSD))等。

以上所述为本申请提供的实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种亲属识别网络模型的训练方法，其特征在于，所述方法包括：

将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型，所述亲属识别网络模型用于对人脸图像进行亲属关系识别；

其中，所述指定三重损失函数为：

l＝Ex_iψ_β(φ_i ⁺·φ_i ^_·e^c)；

其中，

2.如权利要求1所述的方法，其特征在于，所述将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型之后，还包括：

获取待识别亲属关系的两个目标人脸图像；

3.如权利要求1所述的方法，其特征在于，所述将多个预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型，包括：

4.如权利要求1-3任一所述的方法，其特征在于，所述将多个预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型之前，还包括：

5.如权利要求4所述的方法，其特征在于，所述对所述多个人脸图像集中的每个人脸图像集进行增广处理，包括：

对于所述第一人脸图像集中的任一人脸图像B，增加或过滤所述人脸图像B的噪声，得到所述人脸图像B的增广图像；或者重建所述人脸图像B的分辨率，得到所述人脸图像B的增广图像；或者矫正所述人脸图像B的伽玛值，得到所述人脸图像B的增广图像；或者通过生成对抗网络GAN生成所述人脸图像B的增广图像；

将所述人脸图像B的增广图像添加到选择出的人脸图像集中。

6.如权利要求1、2、3或5所述的方法，其特征在于，所述将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型之后，还包括：

7.如权利要求4所述的方法，其特征在于，所述将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型之后，还包括：

8.一种亲属识别网络模型的训练装置，其特征在于，所述装置包括：

第一获取模块，用于获取人脸识别网络模型，所述人脸识别网络模型用于对人脸图像进行身份识别；

输入模块，用于将多个预设人脸图像集包括的预设人脸图像输入所述人脸识别网络模型，所述多个预设人脸图像集包括具有亲属关系的预设人脸图像集和具有非亲属关系的预设人脸图像集；

调整模块，用于通过指定三重损失函数根据第一特征距离与第二特征距离之间的差异值，对所述人脸识别网络模型中的参数进行调整，所述指定三重损失函数为光滑的凸函数，所述第一特征距离为具有亲属关系的预设人脸图像的人脸图像特征之间的距离，所述第二特征距离为具有非亲属关系的预设人脸图像的人脸图像特征之间的距离；

第一确定模块，用于将参数调整完成后的所述人脸识别网络模型确定为亲属识别网络模型，所述亲属识别网络模型用于对人脸图像进行亲属关系识别；

其中，所述指定三重损失函数为：

l＝Ex_iψ_β(φ_i ⁺·φ_i ^_·e^c)；

其中，

9.如权利要求8所述的装置，其特征在于，所述装置还包括：

第二获取模块，用于获取待识别亲属关系的两个目标人脸图像；

识别模块，用于通过所述亲属识别网络模型识别所述两个目标人脸图像之间的亲属关系。

10.如权利要求8所述的装置，其特征在于，所述输入模块用于：

11.如权利要求8-10任一所述的装置，其特征在于，所述装置还包括：

第三获取模块，用于获取多个人脸图像集，所述多个人脸图像集中的每个人脸图像集包括的所有人脸图像的身份相同；

第二确定模块，用于从所述多个人脸图像集中确定人脸图像数量最多的第一人脸图像集；

第三确定模块，用于根据所述第一人脸图像集的人脸图像数量，确定目标数量，所述目标数量大于或等于所述第一人脸图像集的人脸图像数量；

增广处理模块，用于对所述多个人脸图像集中的每个人脸图像集进行增广处理，直至所述每个人脸图像集的人脸图像数量达到所述目标数量；

第四确定模块，用于将增广处理后的所述多个人脸图像集确定为所述多个预设人脸图像集。

12.如权利要求11所述的装置，其特征在于，所述增广处理模块用于：

将所述人脸图像B的增广图像添加到选择出的人脸图像集中。

13.如权利要求8、9、10或12所述的装置，其特征在于，所述装置还包括：

更新模块，用于通过如下两种方式中的至少一种方式对所述亲属识别网络模型进行更新：

14.如权利要求11所述的装置，其特征在于，所述装置还包括：

15.一种亲属识别网络模型的训练装置，所述亲属识别网络模型的训练装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器被配置为执行权利要求1-7所述的任一项方法的步骤。