CN117011907A

CN117011907A - 一种跨年龄的人脸识别方法及相关装置

Info

Publication number: CN117011907A
Application number: CN202211372123.9A
Authority: CN
Inventors: 许剑清
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-11-03
Filing date: 2022-11-03
Publication date: 2023-11-07

Abstract

本申请提供了一种跨年龄的人脸识别方法以及相关装置。本申请实施例可应用于计算机视觉领域以及云技术、人工智能、智慧交通、辅助驾驶等各种场景中。本申请实施例提供的方法，通过第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行初步训练，使得跨年龄人脸识别模型具有对通用文本语义的泛化性，实现理解图像的文本语义信息，接着通过人脸训练图像及人脸训练图像对应的年龄信息及身份信息及部分第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行联合优化，在测试时将需要进行人脸信息比对的两张图像输入至跨年龄人脸识别模型即可完成人脸信息比对，提升跨年龄人脸识别的比对准确性。

Description

一种跨年龄的人脸识别方法及相关装置

技术领域

本申请涉及计算机视觉技术领域，尤其涉及一种跨年龄的人脸识别方法及装置。

背景技术

随着计算机视觉技术的不断发展，基于计算机视觉的人脸识别应用场景越来越多。在含有跨年龄的人脸图片比对的场景中，要求对同一身份不同年龄段之间的人脸图片进行比对。

在目前的人脸识别模型中，因其注册的底库图片为近期所采集到的，识别的模式一般为同一年龄段人脸之间的比对，因而其对跨年龄人脸之间的比对模式无法正常适应，目前的人脸识别模型对跨年龄的人脸图片比对的需求中识别准确性较低。

发明内容

本申请实施例提供了一种跨年龄的人脸识别方法以及相关装置，通过文本监督损失对人脸特征提取模型进行辅助监督，提高跨年龄的人脸图片比对的准确率。

本申请的一方面提供一种跨年龄的人脸识别方法，包括：

获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，其中，第一文本信息用于表征第一训练图像的语义信息，第二文本信息用于表征人脸训练图像对应的属性信息，身份标签用于表征人脸训练图像对应的身份信息，属性信息包括身份信息及年龄信息，M与N均为大于1的整数；

根据M个第一训练图像及M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；

从M个第一训练图像及M个第一文本信息中获取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息，其中，K为大于1且小于M的整数；

根据K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元；

获取第一人脸目标图像及第二人脸目标图像，其中，第一人脸目标图像携带第一目标对象，第二人脸目标图像携带第二目标对象；

将第一人脸目标图像及第二人脸目标图像作为跨年龄人脸识别模型中的图像网络第二优化单元的输入，通过图像网络第二优化单元输出第一目标对象与第二目标对象的相似度。

本申请的另一方面提供了一种跨年龄的人脸识别装置，包括：

训练数据获取模块，用于获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，其中，第一文本信息用于表征第一训练图像的语义信息，第二文本信息用于表征人脸训练图像对应的属性信息，身份标签用于表征人脸训练图像对应的身份信息，属性信息包括身份信息及年龄信息，M与N均为大于1的整数；

初次优化模块，用于根据M个第一训练图像及M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；

数据筛选模块，用于从M个第一训练图像及M个第一文本信息中获取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息，其中，K为大于1且小于M的整数；

二次优化模块，用于根据K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元；

测试数据获取模块，用于获取第一人脸目标图像及第二人脸目标图像，其中，第一人脸目标图像携带第一目标对象，第二人脸目标图像携带第二目标对象；

跨年龄人脸识别模块，用于将第一人脸目标图像及第二人脸目标图像作为跨年龄人脸识别模型中的图像网络第二优化单元的输入，通过图像网络第二优化单元输出第一目标对象与第二目标对象的相似度。

在本申请实施例的另一种实现方式中，二次优化模块，还用于：

根据K个第一文本信息、N个第二文本信息、K个第一训练图像及N个人脸训练图像，生成第一比对目标函数；

根据N个人脸训练图像及N个身份标签，生成人脸识别目标函数；

根据第一比对目标函数及人脸识别目标函数对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元。

将K个第一文本信息作为文本网络第一优化单元的输入，通过文本网络第一优化单元生成K个第一文本特征；

将N个第二文本信息作为文本网络第一优化单元的输入，通过文本网络第一优化单元生成N个第二文本特征；

根据K个第一文本特征及N个第二文本特征，生成级联文本特征；

将K个第一训练图像作为图像网络第一优化单元的输入，通过图像网络第一优化单元生成K个第一图像特征；

将N个人脸训练图像作为图像网络第一优化单元的输入，通过图像网络第一优化单元生成N个人脸图像特征；

根据K个第一图像特征及N个人脸图像特征，生成级联图像特征；

根据级联文本特征及级联图像特征，生成第一比对目标函数。

根据N个人脸图像特征及N个身份标签，生成人脸识别目标函数。

根据第一比对目标函数及人脸识别目标函数，生成联合目标函数；

根据联合目标函数计算第一损失结果；

当第一损失结果小于第一预设损失值时，停止图像网络第一优化单元及文本网络第一优化单元的优化过程，得到图像网络第二优化单元及文本网络第二优化单元。

在本申请实施例的另一种实现方式中，初次优化模块，还用于：

将M个第一训练图像作为图像网络单元的输入，通过图像网络单元生成M个第二图像特征；

将M个第一文本信息作为文本网络单元的输入，通过文本网络单元生成M个第三文本特征；

根据M个第二图像特征及M个第三文本特征，生成第二比对目标函数；

根据第二比对目标函数计算第二损失结果；

当第二损失结果小于第二预设损失值时，停止图像网络单元及文本网络单元的优化过程，得到图像网络第一优化单元及文本网络第一优化单元。

本申请的另一方面提供了一种计算机设备，包括：

存储器、收发器、处理器以及总线系统；

其中，存储器用于存储程序；

处理器用于执行存储器中的程序，包括执行上述各方面的方法；

总线系统用于连接存储器以及处理器，以使存储器以及处理器进行通信。

本申请的另一方面提供了一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述各方面的方法。

本申请的另一方面提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方面所提供的方法。

从以上技术方案可以看出，本申请实施例具有以下优点：

本申请提供了一种跨年龄的人脸识别方法以及相关装置，其方法包括：首先，获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，其中，第一文本信息用于表征第一训练图像的语义信息，第二文本信息用于表征人脸训练图像对应的属性信息，身份标签用于表征人脸训练图像对应的身份信息，属性信息包括身份信息及年龄信息；其次，根据M个第一训练图像及M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；再次，从M个第一训练图像及M个第一文本信息中获取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息；接着，根据K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元；然后，获取第一人脸目标图像及第二人脸目标图像，其中，第一人脸目标图像携带第一目标对象，第二人脸目标图像携带第二目标对象；最后，将第一人脸目标图像及第二人脸目标图像作为跨年龄人脸识别模型中的图像网络第二优化单元的输入，通过图像网络第二优化单元输出第一目标对象与第二目标对象的相似度。本申请实施例提供的方法，通过第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行初步训练，使得跨年龄人脸识别模型具有对通用文本语义的泛化性，实现理解图像的文本语义信息，接着通过人脸训练图像及人脸训练图像对应的年龄信息及身份信息及部分第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行联合优化，在测试时将需要进行人脸信息比对的两张图像输入至跨年龄人脸识别模型即可完成人脸信息比对，提升跨年龄人脸识别的比对准确性。

附图说明

图1为本申请某一实施例提供的跨年龄的人脸识别系统的一个架构示意图；

图2为本申请某一实施例提供的跨年龄的人脸识别方法的流程图；

图3为本申请另一实施例提供的跨年龄的人脸识别方法的流程图；

图4为本申请另一实施例提供的跨年龄的人脸识别方法的流程图；

图5为本申请另一实施例提供的跨年龄的人脸识别方法的流程图；

图6为本申请另一实施例提供的跨年龄的人脸识别方法的流程图；

图7为本申请又一实施例提供的跨年龄的人脸识别方法的流程图；

图8为本申请某一实施例提供的跨年龄的人脸识别方法的示意图；

图9为本申请某一实施例提供的通过图文配对数据训练跨年龄人脸识别模型的示意图；

图10为本申请某一实施例提供的通过部分图文配对数据和人脸训练图像数据训练跨年龄人脸识别模型的示意图；

图11为本申请某一实施例提供的第一训练数据与人脸训练数据数据流向的示意图；

图12为本申请某一实施例提供的跨年龄人脸识别模型的部署阶段的示意图；

图13为本申请某一实施例提供的跨年龄的人脸识别装置的结构示意图；

图14为本申请某一实施例提供的服务器结构示意图。

具体实施方式

本申请实施例提供了一种跨年龄的人脸识别方法以及相关装置，通过第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行初步训练，使得跨年龄人脸识别模型具有对通用文本语义的泛化性，实现理解图像的文本语义信息，接着通过人脸训练图像及人脸训练图像对应的年龄信息及身份信息及部分第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行联合优化，在测试时将需要进行人脸信息比对的两张图像输入至年龄人脸识别模型即可完成人脸信息比对，提升跨年龄人脸识别的比对准确性。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“对应于”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

随着人脸识别应用场景的普及化，要求人脸识别模型对各个特定的场景具有鲁棒性。在含有跨年龄图片比对的场景中(如跨年龄人脸图片比对、身份证比对等)，要求对同一身份不同年龄段之间的图片进行比对。在普通的人脸识别模型中，因其注册的底库图片为近期所采集到的，识别的模式一般为同一年龄段人脸之间的比对，因而其对跨年龄人脸之间的比对模式无法正常适应。在人脸识别模型训练时，不同年龄段之间的人脸图片之间分布的不一致，导致了其比对在特征空间中无法对齐。若采用人脸损失直接约束不同年龄段的图片，则会由于不同年龄段特征不一致而导致的模型训练崩塌。

本申请实施例采用文本监督损失对不同年龄段的人脸图片进行监督训练。将人脸图片的特征映射至文本语义所对应的空间中，缓解直接约束不同年龄段图片特征导致的过拟合风险，帮助人脸识别模型提升跨年龄图片比对的准确性。

本申请实施例从识别网络提取的特征出发，通过将识别模型所提取的特征映射至同一个文本语义所对应的特征空间中，保证各个年龄段的特征之间具有可比性，而非通过重新加权或几何变换来实现对不同年龄段图片的特征空间分布进行匹配。

本申请实施例使用了一种不同于传统度量的方法来约束不同年龄段特征之间的分布差异，利用文本语义间接对图片特征进行监督约束。不同年龄段的特征均在同一个文本空间中，可保持特征之间的可比性。同时由于文本监督损失约束为软性约束，保证模型训练不发生崩溃，提升跨年龄人脸识别的比对准确性。

为了便于理解，请参阅图1，图1为本申请实施例中跨年龄的人脸识别方法的应用环境图，如图1所示，本申请实施例中跨年龄的人脸识别方法应用于跨年龄的人脸识别系统。跨年龄的人脸识别系统包括：服务器和终端设备；其中，服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。终端和服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例在此不做限制。

服务器首先获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，其中，第一文本信息用于表征第一训练图像的语义信息，第二文本信息用于表征人脸训练图像对应的属性信息，身份标签用于表征人脸训练图像对应的身份信息，属性信息包括身份信息及年龄信息；其次，服务器根据M个第一训练图像及M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；再次，服务器从M个第一训练图像及M个第一文本信息中获取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息；接着，服务器根据K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元；然后，服务器获取第一人脸目标图像及第二人脸目标图像，其中，第一人脸目标图像携带第一目标对象，第二人脸目标图像携带第二目标对象；最后，服务器将第一人脸目标图像及第二人脸目标图像作为跨年龄人脸识别模型中的图像网络第二优化单元的输入，通过图像网络第二优化单元输出第一目标对象与第二目标对象的相似度。

下面将从服务器的角度，对本申请中跨年龄的人脸识别方法进行介绍。请参阅图2，本申请实施例提供的跨年龄的人脸识别方法包括：步骤S110至步骤S220。需要说明的是，步骤S110至步骤S140为模型的训练过程，步骤S210至步骤S220为模型的测试步骤。具体的：

S110、获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签。

其中，第一文本信息用于表征第一训练图像的语义信息，第二文本信息用于表征人脸训练图像对应的属性信息，身份标签用于表征人脸训练图像对应的身份信息，属性信息包括身份信息及年龄信息，M与N均为大于1的整数。

可以理解的是，本申请实施例提供的对跨年龄人脸识别模型的训练主要分为两步，第一步为通过互联网中存有的海量图文配对数据，使得跨年龄人脸识别模型具有对通用文本语义的泛化性，实现理解文本语义；第二步为通过人脸训练图像及对应的身份信息及年龄信息优化跨年龄人脸识别模型，使得跨年龄人脸识别模型保持通用语义的泛化能力的基础上增加对人脸识别的能力。

跨年龄人脸识别模型的训练数据包括第一训练样本集及第二训练样本集。其中，第一训练样本集中包括M组第一训练样本数据，每组第一训练样本数据包括一个第一训练图像，以及第一训练图像对应的第一文本信息，每个第一文本信息用于表征对应的第一训练图像的语义信息；第一训练图像不包括人脸图像。例如，第一训练图像为“狗”的图像，则其对应的第一文本信息为“狗”。

第二训练样本集中包括N组第二训练样本数据，每组训练样本数据包括一个人脸训练图像、人脸训练图像中对象对应的第二文本信息及人脸训练图像对应的身份标签。第二文本信息用于表征人脸训练图像中对象的属性信息，其属性信息包括身份信息及年龄信息，身份信息可以是对象的唯一识别码，年龄信息可以是年龄段，也可以是具体的年龄值，关于年龄段的划分包括：童年(小于5周岁)、幼年(5-9周岁)、少年(10-19周岁)、青年(20-34周岁)、壮年(35-49周岁)、中年(50-64周岁)、老年(65-79周岁)、福年(80-94周岁)、寿年(大于等于95周岁)。身份标签用于将身份信息相同的人脸训练图像进行对应。

N个人脸训练图像中至少存在身份标签对应相同的两张人脸训练图像。例如，至少存在两张身份信息均为001的对象的人脸训练图像，优选的，两张身份信息均为001的对象的人脸训练图像其年龄信息不同，即，N个人脸训练图像中包括一张身份信息均为001且年龄信息为幼年的人脸训练图像和一张身份信息均为001且年龄信息为青年的人脸训练图像。当N个人脸训练图像中包括的身份信息相同的对象的多个年龄信息对应的多个训练图像时，可提升跨年龄人脸识别模型的训练效果。

S120、根据M个第一训练图像及M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元。

可以理解的是，将一个第一训练图像及其对应的第一文本信息作为一组训练数据，即将一组训练数据合成一个batch(批处理单元)，根据M个第一训练图像及M个第一文本信息，生成M组训练数据，将M组训练数据依次作为跨年龄人脸识别模型的输入，具体的，将每组训练数据中的第一训练图像输入至图像网络单元，以及将每组训练数据中的第一文本信息输入至文本网络单元，生成跨年龄人脸识别模型中的图像网络第一优化单元及文本网络第一优化单元。训练停止的条件可以是设置训练次数，当训练次数达到预设训练次数时，停止训练；训练停止的条件还可以是计算目标函数的损失结果，当目标函数的损失结果小于预设损失值时，停止训练。本申请实施例对训练停止的条件不进行限制。

S130、从M个第一训练图像及M个第一文本信息中获取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息。

其中，K为大于1且小于M的整数。

可以理解的是，从第一训练样本集(M组第一训练样本数据)中获取K组第一训练样本数据，将获取到的K组第一训练样本数据与N组第二训练样本数据一起对跨年龄人脸识别模型进行优化。获取方式可以是随机获取，也可以是是基于设定规则的获取方式，本身请在此不做限制。

S140、根据K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元。

可以理解的是，通过K组第一训练样本数据(包括K个第一训练图像及与K个第一训练图像对应的K个第一文本信息)与N组第二训练样本数据(包括N个人脸训练图像、N个第二文本信息及N个身份标签)对跨年龄人脸识别模型进行优化，具体的，将K个第一训练图像及N个人脸训练图像作为跨年龄人脸识别模型中的图像网络第一优化单元的输入，以及，将K个第一文本信息及N个第二文本信息作为跨年龄人脸识别模型中的文本网络第一优化单元的输入，生成跨年龄人脸识别模型中的图像网络第二优化单元及文本网络第二优化单元。训练停止的条件可以是设置训练次数，当训练次数达到预设训练次数时，停止训练；训练停止的条件还可以是计算目标函数的损失结果，当目标函数的损失结果小于预设损失值时，停止训练。本申请实施例对训练停止的条件不进行限制。

S210、获取第一人脸目标图像及第二人脸目标图像。

其中，第一人脸目标图像携带第一目标对象，第二人脸目标图像携带第二目标对象。

可以理解的是，通过步骤S110至步骤S140完成跨年龄人脸识别模型的训练，训练后的跨年龄人脸识别模型对人脸图像比对具有良好的识别能力。获取需要进行人脸比对的两张图像(第一人脸目标图像及第二人脸目标图像)，需要进行人脸比对的两张图像可以是不同对象的人脸图像，也可以是同一对象不同年龄信息的人脸图像，还可以是同一对象相同年龄信息的人脸图像，本申请实施例在此不作限制。

S220、将第一人脸目标图像及第二人脸目标图像作为跨年龄人脸识别模型中的图像网络第二优化单元的输入，通过图像网络第二优化单元输出第一目标对象与第二目标对象的相似度。

可以理解的是，跨年龄人脸识别模型中的图像网络第二优化单元对第一人脸目标图像及第二人脸目标图像进行处理，可以得到第一人脸目标图像中第一目标对象及第二人脸目标图像中第二目标对象的相似度。

本申请实施例提供的方法，通过第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行初步训练，使得跨年龄人脸识别模型具有对通用文本语义的泛化性，实现理解图像的文本语义信息，接着通过人脸训练图像及人脸训练图像对应的年龄信息及身份信息及部分第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行联合优化，在测试时将需要进行人脸信息比对的两张图像输入至跨年龄人脸识别模型即可完成人脸信息比对，提升跨年龄人脸识别的比对准确性。

在本申请的图2对应的实施例提供的跨年龄的人脸识别方法的一个可选实施例中，请参阅图3，步骤S140进一步包括子步骤S141至子步骤S143。

具体的：

S141、根据K个第一文本信息、N个第二文本信息、K个第一训练图像及N个人脸训练图像，生成第一比对目标函数。

可以理解的是，根据K个第一文本信息及N个第二文本信息，生成级联文本特征，根据K个第一训练图像及N个人脸训练图像，生成级联图像特征。根据级联文本特征及级联图像特征生成第一比对目标函数。优选的，K：N为1:4。通过第二文本信息对人脸训练图像进行约束，既保证同一个身份的人脸特征具有可比性，又保证不对跨年龄特征进行过度约束。第一比对目标函数通过以下公式表示：

L_c＝α₁L₁+β₁L₂；

其中，L_c为第一比对目标函数，L₁为级联文本特征，级联文本特征通过K个第一文本信息及N个第二文本信息得到，L₂为级联图像特征，级联图像特征通过K个第一训练图像及N个人脸训练图像得到，α₁为级联文本特征L₁的经验值，β₁为级联图像特征L₂的经验值。

S142、根据N个人脸训练图像及N个身份标签，生成人脸识别目标函数。

可以理解的是，根据N个人脸训练图像及N个人脸训练图像对应的N个身份标签，计算人脸识别目标函数。人脸识别目标函数可选用分类函数，如softmax(可以激活特征图注意力的计算)、各类加margin(边缘)类型的softmax，也可采用其他类型的目标函数，本申请实施例在此不作限制。人脸识别目标函数通过以下公式表示：

其中，L_m为人脸识别目标函数，N为一次迭代过程中的人脸训练图像的数量，x_i为第i张人脸训练图像，为x_i的转置矩阵，y_i为第i张人脸训练图像对应的身份标签。

S143、根据第一比对目标函数及人脸识别目标函数对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元。

可以理解的是，根据第一比对目标函数及人脸识别目标函数对图像网络第一优化单元及文本网络第一优化单元进行优化，具体通过第一比对目标函数及人脸识别目标函数进行损失求和，生成联合目标函数，根据联合目标函数对图像网络第一优化单元及文本网络第一优化单元进行优化，生成图像网络第二优化单元及文本网络第二优化单元。联合目标函数通过以下公式表示：

L_total＝α₂L_c+β₂L_m；

其中，L_c为第一比对目标函数，L_m为人脸识别目标函数，α₂为第一比对目标函数L_c的经验值，β₂为人脸识别目标函数L_m的经验值，优选的α₂＝0.2，β₂＝0.8。

本申请实施例提供的方法，通过K个第一文本信息、N个第二文本信息、K个第一训练图像及N个人脸训练图像，生成第一比对目标函数，以及根据N个人脸训练图像及N个身份标签，生成人脸识别目标函数，根据第一比对目标函数及人脸识别目标函数对图像网络第一优化单元及文本网络第一优化单元进行优化，通过K个第一文本信息及K个第一训练图像保持跨年龄人脸识别模型对通用语义的泛化能力，通过N个人脸训练图像、N个第二文本信息及N个身份标签使得跨年龄人脸识别模型识别不同年龄信息对应的人脸图像，提升跨年龄人脸识别的比对准确性。

在本申请的图3对应的实施例提供的跨年龄的人脸识别方法的一个可选实施例中，请参阅图4，子步骤S141进一步包括子步骤S1411至子步骤S1417。

具体的：

S1411、将K个第一文本信息作为文本网络第一优化单元的输入，通过文本网络第一优化单元生成K个第一文本特征。

可以理解的是，文本网络第一优化单元根据文本网络单元优化得到，文本网络第一优化单元为特征提取网络。文本网络第一优化单元对第一文本信息进行特征提取，输出的第一文本特征表示该网络对第一训练图像中所包含的信息的表达。

文本网络第一优化单元的结构为带有transformer类型的网络结构，包含有全连接计算、非线性激活函数(Relu)计算、池化(Pooling)计算等操作。

S1412、将N个第二文本信息作为文本网络第一优化单元的输入，通过文本网络第一优化单元生成N个第二文本特征。

可以理解的是，文本网络第一优化单元对第二文本信息进行特征提取，输出的第二文本特征表示该网络对人脸训练图像中所包含的信息的表达。

S1413、根据K个第一文本特征及N个第二文本特征，生成级联文本特征。

可以理解的是，通过K个第一文本特征及N个第二文本特征，生成级联文本特征，级联文本特征通过以下公式表示：

L₁＝α₃f₁+β₃f₂；

其中，L₁为级联文本特征，f₁为第一文本特征，f₂为第二文本特征，α₃为第一文本特征f₁的经验值，β₃为第二文本特征f₂的经验值。

S1414、将K个第一训练图像作为图像网络第一优化单元的输入，通过图像网络第一优化单元生成K个第一图像特征。

可以理解的是，图像网络第一优化单元根据图像网络单元优化得到，图像网络第一优化单元为特征提取网络。图像网络第一优化单元对第一训练图像进行特征提取，输出的第一图像特征表示该网络对第一训练图像所包含信息的表达。

图像网络第一优化单元通常具有的结构为卷积神经网络(CNN)或者带有transformer类型的网络结构，包含有卷积(convolution)计算、非线性激活函数(Relu)计算、池化(Pooling)计算等操作。

S1415、将N个人脸训练图像作为图像网络第一优化单元的输入，通过图像网络第一优化单元生成N个人脸图像特征。

可以理解的是，图像网络第一优化单元对人脸训练图像进行特征提取，输出的人脸图像特征表示该网络对人脸训练图像所包含信息的表达。

S1416、根据K个第一图像特征及N个人脸图像特征，生成级联图像特征。

可以理解的是，通过K个第一图像特征及N个人脸图像特征，生成级联图像特征，级联图像特征通过以下公式表示：

L₂＝α₄p₁+β₄p₂；

其中，L₂为级联图像特征，p₁为第一图像特征，p₂为人脸图像特征，α₄为第一图像特征p₁的经验值，β₄为人脸图像特征p₂的经验值。

S1417、根据级联文本特征及级联图像特征，生成第一比对目标函数。

可以理解的是，第一比对目标函数通过以下公式表示：

L_c＝α₁L₁+β₁L₂；

其中，L_c为第一比对目标函数，L₁为级联文本特征，L₂为级联图像特征，α₁为级联文本特征L₁的经验值，β₁为级联图像特征L₂的经验值。

本申请实施例提供的方法，通过文本网络第一优化单元，由第一文本信息特征提取得到的第一文本特征，以及由第二文本信息特征提取得到的第二文本特征，生成级联文本特征；通过图像网络第一优化单元，由第一训练图像特征提取得到的第一图像特征，以及由人脸训练图像特征提取得到的人脸图像特征，生成级联图像特征，进而通过级联文本特征及级联图像特征生成第一比对目标函数，提升跨年龄人脸识别模型的比对准确性。

在本申请的图3对应的实施例提供的跨年龄的人脸识别方法的一个可选实施例中，请参阅图5，子步骤S142进一步包括子步骤S1421至子步骤S1422。

具体的：

S1421、将N个人脸训练图像作为图像网络第一优化单元的输入，通过图像网络第一优化单元生成N个人脸图像特征。

S1422、根据N个人脸图像特征及N个身份标签，生成人脸识别目标函数。

可以理解的是，图像网络第一优化单元根据图像网络单元优化得到，图像网络第一优化单元为特征提取网络。可以理解的是，图像网络第一优化单元对人脸训练图像进行特征提取，输出的人脸图像特征表示该网络对人脸训练图像所包含信息的表达。

根据N个人脸图像特征及N个身份标签，计算人脸识别目标函数。人脸识别目标函数可选用分类函数(如softmax、各类加margin类型的softmax)，也可采用其他类型的目标函数。人脸识别目标函数通过以下公式表示：

本申请实施例提供的方法，通过图像网络第一优化单元，由人脸训练图像特征提取得到的人脸图像特征，进而通过人脸图像特征及身份标签生成人脸识别目标函数，提升跨年龄人脸识别模型的比对准确性。

在本申请的图3对应的实施例提供的跨年龄的人脸识别方法的一个可选实施例中，请参阅图6，子步骤S143进一步包括子步骤S1431至子步骤S1433。

具体的：

S1431、根据第一比对目标函数及人脸识别目标函数，生成联合目标函数。

L_total＝αL_c+βL_m；

其中，α及β为经验值，优选的α＝0.2，β＝0.8，L_c为第一比对目标函数，L_m为人脸识别目标函数。

S1432、根据联合目标函数计算第一损失结果。

S1433、当第一损失结果小于第一预设损失值时，停止图像网络第一优化单元及文本网络第一优化单元的优化过程，得到图像网络第二优化单元及文本网络第二优化单元。

可以理解的是，通过对比联合目标函数计算得到的第一损失结果与第一预设损失值进行对比，当第一损失结果小于第一预设损失值时，停止图像网络第一优化单元及文本网络第一优化单元的优化过程，生成图像网络第二优化单元及文本网络第二优化单元。当第一损失结果大于第一预设损失值时，继续对图像网络第一优化单元及文本网络第一优化单元进行优化，直至满足停止循环条件。

本申请实施例提供的方法，通过联合目标函数计算第一损失结果，进而根据第一损失结果作为判断迭代循环的停止循环的条件，通过多次训练使得第一损失结果小于第一预设损失值，以提升跨年龄人脸识别的比对准确性。

在本申请的图2对应的实施例提供的跨年龄的人脸识别方法的一个可选实施例中，请参阅图7，子步骤S120进一步包括子步骤S121至子步骤S125。

具体的：

S121、将M个第一训练图像作为图像网络单元的输入，通过图像网络单元生成M个第二图像特征。

可以理解的是，图像网络单元为特征提取网络。图像网络单元对第一训练图像进行特征提取，输出的第二图像特征表示该网络对第一训练图像所包含信息的表达。

S122、将M个第一文本信息作为文本网络单元的输入，通过文本网络单元生成M个第三文本特征。

可以理解的是，文本网络单元为特征提取网络。文本网络单元对第一文本信息进行特征提取，输出的第三文本特征表示该网络对第一训练图像中所包含的信息的表达。

S123、根据M个第二图像特征、M个第三文本特征，生成第二比对目标函数。

可以理解的是，第二比对目标函数包括由M个第二图像特征计算得到的损失及由M个第三文本特征计算得到的损失。第二比对目标函数通过以下公式表示：

L＝L_p2t+L_t2p；

其中，L为第二比对目标函数，L_p2t为由M个第二图像特征计算得到的损失，L_t2p为由M个第三文本特征计算得到的损失；

其中，L_p2t为由M个第二图像特征计算得到的损失，即图像网络单元的损失结果，N为一次迭代过程中的人脸训练图像的数量，x_j为第j张第一训练图像的特征值(第二图像特征)，为x_j的转置矩阵，y_j为第j张第一训练图像对应的第一文本信息的特征值(第三文本特征)。

其中，L_t2p为由M个第三文本特征计算得到的损失，即文本网络单元的损失结果，N为一次迭代过程中的人脸训练图像的数量，x_j为第j张第一训练图像的特征值(第二图像特征)，y_j为第j张第一训练图像对应的第一文本信息的特征值(第三文本特征)，为y_j的转置矩阵。

S124、根据第二比对目标函数计算第二损失结果。

S125、当第二损失结果小于第二预设损失值时，停止图像网络单元及文本网络单元的优化过程，得到图像网络第一优化单元及文本网络第一优化单元。

可以理解的是，通过第二比对目标函数计算得到第二损失结果与第二预设损失值进行对比，当第二损失结果小于第二预设损失值时，停止图像网络单元及文本网络单元的优化过程，生成图像网络第一优化单元及文本网络第一优化单元。当第二损失结果大于第二预设损失值时，继续对图像网络单元及文本网络单元进行优化过程，直至满足停止循环条件。

本申请实施例提供的方法，通过图像网络单元对第一训练图像进行特征提取，生成第二图像特征，通过文本网络单元对第一文本信息进行特征提取，生成第三文本特征，根据第二图像特征及第三文本特征生成目标函数，通过目标函数计算第二损失结果，进而根据第二损失结果作为判断迭代循环的停止循环的条件，通过多次训练使得第二损失结果小于第二预设损失值，以提升跨年龄人脸识别的比对准确性。

为了便于理解，下面将结合图8至图11介绍一种跨年龄的人脸识别方法，本申请实施例提供的方法可以有效提高跨年龄人脸识别的准确性，本申请实施例提供方法可应用于1：1和1：N的跨年龄人脸识别业务中。本申请实施例提供方法在各个不同的测试中均有相应的性能提升。

本申请实施例采用文本监督损失对人脸特征提取模型进行辅助监督，利用文本信息将不同年龄段的图片约束至同一个空间，得到不同年龄段人脸图片共同的特征分布，从而提升跨年龄人脸比对的准确率。文本监督提供额外的年龄信息监督，避免将不同年龄段特征强行约束导致模型崩塌。请参阅图8，图8为本申请实施例提供的跨年龄的人脸识别方法的示意图，主要分为两个阶段，跨年龄人脸识别模型的训练阶段、跨年龄人脸识别模型的部署阶段。在跨年龄人脸识别模型的训练阶段首先是利用开源文本-图片数据对文本图片模型进行训练，该步骤保证了文本图片模型对通用语义具有泛化性。然后联合人脸图片，采用文本信息、人脸标签信息对图片模型进行联合优化。在跨年龄人脸识别模型的部署阶段，只需要导出识别网络进行部署即可。该方法无需对原有的识别网络进行改动，只需要对训练流程进行改进即可提升跨年龄人脸比对的准确率。

跨年龄人脸识别模型的训练阶段包括两个阶段，第一阶段采用互联网中存有的海量图文配对数据(M个第一训练图像以及用于表征M个第一训练图像的语义信息的M个第一文本信息)对跨年龄人脸识别模型进行初次训练。使得跨年龄人脸识别模型具有对通用文本语义的泛化性，用于理解第一文本信息的语义信息。第二阶段采用部分图文配对数据(K个第一训练图像以及K个第一训练图像对应的K个第一文本信息)和人脸训练图像数据(N个人脸训练图像、N个第二文本信息及N个身份标签)对跨年龄人脸识别模型进行优化训练。使得跨年龄人脸识别模型具有对人脸训练图像与年龄信息进行识别的能力。

请参阅图9，图9为通过图文配对数据训练跨年龄人脸识别模型的示意图。

首先，获取M个第一训练图像以及用于表征M个第一训练图像的语义信息的M个第一文本信息，对M个第一训练图像以及用于表征M个第一训练图像的语义信息的M个第一文本信息进行读取，将每个第一训练图像及对应的第一文本信息作为一组训练数据(一个batch分布)输入至跨年龄人脸识别模型中的图像网络单元和文本网络单元，具体包括：

1)将第一训练图像作为图像网络单元的输入，图像网络单元用于对第一训练图像进行特征提取，通过图像网络单元输出第二图像特征。输出的第二图像特征表示图像网络单元对第一训练图像所包含信息的表达。

图像网络单元通常具有的结构为卷积神经网络(CNN)或者带有transformer类型的网络结构，包含有卷积(convolution)计算、非线性激活函数(Relu)计算、池化(Pooling)计算等操作。

2)将第一文本信息作为文本网络单元的输入，文本网络单元用于对第一文本信息进行特征提取，通过文本网络单元输出第三文本特征。输出的第三文本特征表示文本网络单元对第一训练图像所包含信息的表达。

文本网络单元通常具有的结构为带有transformer类型的网络结构，包含有全连接计算、非线性激活函数(Relu)计算、池化(Pooling)计算等操作。

然后，根据M次迭代中所有的第二图像特征x_j及第三文本特征y_j计算第二比对目标函数。第二比对目标函数通过以下公式表示：

L＝L_p2t+L_t2p；

最后，基于梯度下降的方式(如随机梯度下降，带动量项的随机梯度下降，adam，adagard)，对跨年龄人脸识别模型进行训练优化，直至训练的结果满足训练终止条件。终止模型训练的条件一般设置迭代次数满足设定的值，或者目标函数计算的loss小于设定的值即可完成模型的训练。即，根据第二比对目标函数计算第二损失结果；当第二损失结果小于第二预设损失值时，停止图像网络单元及文本网络单元的优化过程，得到图像网络第一优化单元及文本网络第一优化单元。

请参阅图10，图10是本申请实施例提供的通过部分图文配对数据和人脸训练图像数据训练跨年龄人脸识别模型的示意图。

首先，从M个第一训练图像以及用于表征M个第一训练图像的语义信息的M个第一文本信息中抽取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息。获取N个人脸训练图像、N个第二文本信息及N个身份标签。

同时读取第一训练数据与人脸训练数据。第一训练数据包括第一训练图像及对应的第一文本信息；人脸训练数据包括人脸训练图像、人脸训练图像中对象的第二文本信息及身份标签，第二文本信息用于表征人脸训练图像中对象的属性信息，属性信息至少包含两个信息，年龄与身份，如：一张A的少年照片。在本申请实施例中采用的是对年龄段进行描述区分，主要分为：幼儿、儿童、少年、青少年、青年、中年、老年。对于年龄的描述也可用具体的年龄信息。第一训练数据为第一训练阶段中的部分数据，在本训练阶段中的作用为保持跨年龄人脸识别模型对通用语义的泛化能力。第一训练数据与人脸训练数据在同一次迭代训练中数量比经验值一般取1:4。

请参阅图11，图11是本申请实施例提供的第一训练数据与人脸训练数据数据流向的示意图。对K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签进行读取，将每个第一训练图像及对应的第一文本信息以及每个人脸训练图像及对应的第二文本信息作为一组训练数据(一个batch分布)输入至跨年龄人脸识别模型中的完成初次训练后的图像网络单元和完成初次训练后的文本网络单元，具体包括：

1)将第一训练图像作为图像网络第一优化单元的输入，图像网络第一优化单元用于对第一训练图像进行特征提取，通过图像网络第一优化单元输出第一图像特征。输出的第一图像特征表示图像网络第一优化单元对第一训练图像所包含信息的表达。

将人脸训练图像作为图像网络第一优化单元的输入，图像网络第一优化单元用于对人脸训练图像进行特征提取，通过图像网络第一优化单元输出人脸图像特征。输出的人脸图像特征表示图像网络第一优化单元对人脸训练图像所包含信息的表达。

2)将第一文本信息作为文本网络第一优化单元的输入，文本网络第一优化单元用于对第一文本信息进行特征提取，通过文本网络第一优化单元输出第一文本特征。输出的第一文本特征表示文本网络第一优化单元对第一训练图像所包含信息的表达。

将第二文本信息作为文本网络第一优化单元的输入，文本网络第一优化单元用于对第二文本信息进行特征提取，通过文本网络第一优化单元输出第二文本特征。输出的第二文本特征表示文本网络第一优化单元对人脸训练图像所包含信息的表达。

文本网络第一优化单元通常具有的结构为带有transformer类型的网络结构，包含有全连接计算、非线性激活函数(Relu)计算、池化(Pooling)计算等操作。

其次，根据K个第一文本特征及N个第二文本特征，生成级联文本特征，以及根据K个第一图像特征及N个人脸图像特征，生成级联图像特征；根据级联图像特征x_i及级联文本特征y_i生成第一比对目标函数，根据第一比对目标函数计算第一损失结果。第一比对目标函数通过以下公式表示：

L_c＝α₁L₁+β₁L₂；

在本比第一损失结果中，第二文本信息对人脸训练图像进行约束，既保证同一个身份的人脸特征具有可比性，又保证不对跨年龄特征进行过度约束。

接着，将N个人脸训练图像作为图像网络第一优化单元的输入，通过图像网络第一优化单元生成N个人脸图像特征；根据N个人脸图像特征及N个身份标签，生成人脸识别目标函数。人脸识别目标函数可选用分类函数(如softmax、各类加margin类型的softmax)，也可采用其他类型的目标函数。人脸识别目标函数通过以下公式表示：

然后，根据第一比对目标函数及人脸识别目标函数，生成联合目标函数。联合目标函数通过以下公式表示：

L_total＝αL_c+βL_m；

最后，基于梯度下降的方式(如随机梯度下降，带动量项的随机梯度下降，adam，adagard)，对跨年龄人脸识别模型进行训练优化，直至训练的结果满足训练终止条件。终止模型训练的条件一般设置迭代次数满足设定的值，或者目标函数计算的loss小于设定的值即可完成模型的训练。即，根据第一比对目标函数计算第一损失结果；当第一损失结果小于第一预设损失值时，停止图像网络第一优化单元及文本网络第一优化单元的优化过程，得到图像网络第二优化单元及文本网络第二优化单元。

请参阅图12，图12是本申请实施例提供跨年龄人脸识别模型的部署阶段的示意图。在跨年龄人脸识别模型的部署阶段，是将训练完成所得到的跨年龄人脸识别模型进行部署。具体的，只需要将训练得到的图像网络第二优化单元合入常规的人脸识别系统中即可。文本网络第二优化单元不参与部署阶段的流程。故本申请实施例可以在不额外增加部署模块的条件下提升跨年龄人脸比对的准确率。

本申请实施例所提出的跨年龄的人脸识别方法，通过添加一个文本特征提取网络，该网络提取与图片相符的描述文本作为图片的监督信号。文本描述至少需包括图片的ID信息与年龄信息。采用文本监督损失对同一身份不同年龄段之间的图片进行软性约束，既可以保证不同年龄段之间的图片具有共同的分布，同时又保证不同id之间的图片具有区分度。在本申请实施例中无需调整不同年龄段人脸图片之间的比例配置，只需要其各个年龄段保持一致，且在训练完成之后文本特征提取网络无需参与部署。保证了该方法的既可以在大型模型中运用也可以在小型模型中运用，均不会影响其原始的部署结果。在训练过程中，本申请实施例只需要额外添加一个文本特征监督模型，保证该方法应用的便捷性。

下面对本申请中的跨年龄的人脸识别装置进行详细描述，请参阅图13。图13为本申请实施例中跨年龄的人脸识别装置10的一个实施例示意图，跨年龄的人脸识别装置10包括：

训练数据获取模块110，用于获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签。

初次优化模块120，用于根据M个第一训练图像及M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；

数据筛选模块130，用于从M个第一训练图像及M个第一文本信息中获取K个第一训练图像及与K个第一训练图像对应的K个第一文本信息。

其中，K为大于1且小于M的整数。

二次优化模块140，用于根据K个第一训练图像、K个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，对图像网络第一优化单元及文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元。

测试数据获取模块210，用于获取第一人脸目标图像及第二人脸目标图像。

跨年龄人脸识别模块220，用于将第一人脸目标图像及第二人脸目标图像作为跨年龄人脸识别模型中的图像网络第二优化单元的输入，通过图像网络第二优化单元输出第一目标对象与第二目标对象的相似度。

本申请实施例提供的装置，通过第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行初步训练，使得跨年龄人脸识别模型具有对通用文本语义的泛化性，实现理解图像的文本语义信息，接着通过人脸训练图像及人脸训练图像对应的年龄信息及身份信息及部分第一训练图像及第一训练图像对应的语义信息对跨年龄人脸识别模型进行联合优化，在测试时将需要进行人脸信息比对的两张图像输入至跨年龄人脸识别模型即可完成人脸信息比对，提升跨年龄人脸识别的比对准确性。

在本申请的图13对应的实施例提供的跨年龄的人脸识别装置的一个可选实施例中，二次优化模块140，还用于：

本申请实施例提供的装置，通过K个第一文本信息、N个第二文本信息、K个第一训练图像及N个人脸训练图像，生成第一比对目标函数，以及根据N个人脸训练图像及N个身份标签，生成人脸识别目标函数，根据第一比对目标函数及人脸识别目标函数对图像网络第一优化单元及文本网络第一优化单元进行优化，通过K个第一文本信息及K个第一训练图像保持跨年龄人脸识别模型对通用语义的泛化能力，通过N个人脸训练图像、N个第二文本信息及N个身份标签使得跨年龄人脸识别模型识别不同年龄信息对应的人脸图像，提升跨年龄人脸识别的比对准确性。

本申请实施例提供的装置，通过文本网络第一优化单元，由第一文本信息特征提取得到的第一文本特征，以及由第二文本信息特征提取得到的第二文本特征，生成级联文本特征；通过图像网络第一优化单元，由第一训练图像特征提取得到的第一图像特征，以及由人脸训练图像特征提取得到的人脸图像特征，生成级联图像特征，进而通过级联文本特征及级联图像特征生成第一比对目标函数，提升跨年龄人脸识别模型的比对准确性。

本申请实施例提供的装置，通过图像网络第一优化单元，由人脸训练图像特征提取得到的人脸图像特征，进而通过人脸图像特征及身份标签生成人脸识别目标函数，提升跨年龄人脸识别模型的比对准确性。

根据联合目标函数计算第一损失结果；

本申请实施例提供的装置，通过联合目标函数计算第一损失结果，进而根据第一损失结果作为判断迭代循环的停止循环的条件，通过多次训练使得第一损失结果小于第一预设损失值，以提升跨年龄人脸识别的比对准确性。

在本申请的图13对应的实施例提供的跨年龄的人脸识别装置的一个可选实施例中，初次优化模块120，还用于：

根据M个第二图像特征、M个第三文本特征，生成第二比对目标函数；

根据第二比对目标函数计算第二损失结果；

本申请实施例提供的装置，通过图像网络单元对第一训练图像进行特征提取，生成第二图像特征，通过文本网络单元对第一文本信息进行特征提取，生成第三文本特征，根据第二图像特征及第三文本特征生成目标函数，通过目标函数计算第二损失结果，进而根据第二损失结果作为判断迭代循环的停止循环的条件，通过多次训练使得第二损失结果小于第二预设损失值，以提升跨年龄人脸识别的比对准确性。

图14是本申请实施例提供的一种服务器结构示意图，该服务器300可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processingunits，CPU)322(例如，一个或一个以上处理器)和存储器332，一个或一个以上存储应用程序342或数据344的存储介质330(例如一个或一个以上海量存储设备)。其中，存储器332和存储介质330可以是短暂存储或持久存储。存储在存储介质330的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器322可以设置为与存储介质330通信，在服务器300上执行存储介质330中的一系列指令操作。

服务器300还可以包括一个或一个以上电源326，一个或一个以上有线或无线网络接口350，一个或一个以上输入输出接口358，和/或，一个或一个以上操作系统341，例如Windows Server^TM，Mac OS X^TM，Unix^TM,Linux^TM，FreeBSD^TM等等。

上述实施例中由服务器所执行的步骤可以基于该图14所示的服务器结构。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(read-only memory，ROM)、随机存取存储器(random access memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上，以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种跨年龄的人脸识别方法，其特征在于，包括：

获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，其中，所述第一文本信息用于表征所述第一训练图像的语义信息，所述第二文本信息用于表征所述人脸训练图像对应的属性信息，所述身份标签用于表征所述人脸训练图像对应的身份信息，所述属性信息包括身份信息及年龄信息，M与N均为大于1的整数；

根据所述M个第一训练图像及所述M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；

从所述M个第一训练图像及所述M个第一文本信息中获取K个所述第一训练图像及与K个所述第一训练图像对应的K个所述第一文本信息，其中，K为大于1且小于M的整数；

根据所述K个第一训练图像、所述K个第一文本信息、所述N个人脸训练图像、所述N个第二文本信息及所述N个身份标签，对所述图像网络第一优化单元及所述文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元；

获取第一人脸目标图像及第二人脸目标图像，其中，所述第一人脸目标图像携带第一目标对象，所述第二人脸目标图像携带第二目标对象；

将所述第一人脸目标图像及所述第二人脸目标图像作为所述跨年龄人脸识别模型中的所述图像网络第二优化单元的输入，通过所述图像网络第二优化单元输出所述第一目标对象与所述第二目标对象的相似度。

2.如权利要求1的跨年龄的人脸识别方法，其特征在于，所述根据所述K个第一训练图像、所述K个第一文本信息、所述N个人脸训练图像、所述N个第二文本信息及所述N个身份标签，对所述图像网络第一优化单元及所述文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元，包括：

根据所述K个第一文本信息、所述N个第二文本信息、所述K个第一训练图像及所述N个人脸训练图像，生成第一比对目标函数；

根据所述N个人脸训练图像及所述N个身份标签，生成人脸识别目标函数；

根据所述第一比对目标函数及所述人脸识别目标函数对所述图像网络第一优化单元及所述文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元。

3.如权利要求2的跨年龄的人脸识别方法，其特征在于，所述根据所述K个第一文本信息、所述N个第二文本信息、所述K个第一训练图像及所述N个人脸训练图像，生成第一比对目标函数，包括：

将所述K个第一文本信息作为所述文本网络第一优化单元的输入，通过所述文本网络第一优化单元生成K个第一文本特征；

将所述N个第二文本信息作为所述文本网络第一优化单元的输入，通过所述文本网络第一优化单元生成N个第二文本特征；

根据所述K个第一文本特征及所述N个第二文本特征，生成级联文本特征；

将所述K个第一训练图像作为所述图像网络第一优化单元的输入，通过所述图像网络第一优化单元生成K个第一图像特征；

将所述N个人脸训练图像作为所述图像网络第一优化单元的输入，通过所述图像网络第一优化单元生成N个人脸图像特征；

根据所述K个第一图像特征及所述N个人脸图像特征，生成级联图像特征；

根据所述级联文本特征及所述级联图像特征，生成第一比对目标函数。

4.如权利要求2的跨年龄的人脸识别方法，其特征在于，所述根据所述N个人脸训练图像及所述N个身份标签，生成人脸识别目标函数，包括：

根据所述N个人脸图像特征及所述N个身份标签，生成人脸识别目标函数。

5.如权利要求2的跨年龄的人脸识别方法，其特征在于，所述根据所述第一比对目标函数及所述人脸识别目标函数对所述图像网络第一优化单元及所述文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元，包括：

根据所述第一比对目标函数及所述人脸识别目标函数，生成联合目标函数；

根据所述联合目标函数计算第一损失结果；

当所述第一损失结果小于第一预设损失值时，停止所述图像网络第一优化单元及所述文本网络第一优化单元的优化过程，得到图像网络第二优化单元及文本网络第二优化单元。

6.如权利要求1的跨年龄的人脸识别方法，其特征在于，所述根据所述M个第一训练图像及所述M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元，包括：

将所述M个第一训练图像作为所述图像网络单元的输入，通过所述图像网络单元生成M个第二图像特征；

将所述M个第一文本信息作为所述文本网络单元的输入，通过所述文本网络单元生成M个第三文本特征；

根据所述M个第二图像特征及所述M个第三文本特征，生成第二比对目标函数；

根据所述第二比对目标函数计算第二损失结果；

当所述第二损失结果小于第二预设损失值时，停止所述图像网络单元及所述文本网络单元的优化过程，得到图像网络第一优化单元及文本网络第一优化单元。

7.一种跨年龄的人脸识别装置，其特征在于，包括：

训练数据获取模块，用于获取M个第一训练图像、M个第一文本信息、N个人脸训练图像、N个第二文本信息及N个身份标签，其中，所述第一文本信息用于表征所述第一训练图像的语义信息，所述第二文本信息用于表征所述人脸训练图像对应的属性信息，所述身份标签用于表征所述人脸训练图像对应的身份信息，所述属性信息包括身份信息及年龄信息，M与N均为大于1的整数；

初次优化模块，用于根据所述M个第一训练图像及所述M个第一文本信息对跨年龄人脸识别模型中的图像网络单元及文本网络单元进行优化，得到图像网络第一优化单元及文本网络第一优化单元；

数据筛选模块，用于从所述M个第一训练图像及所述M个第一文本信息中获取K个所述第一训练图像及与K个所述第一训练图像对应的K个所述第一文本信息，其中，K为大于1且小于M的整数；

二次优化模块，根据所述K个第一训练图像、所述K个第一文本信息、所述N个人脸训练图像、所述N个第二文本信息及所述N个身份标签，对所述图像网络第一优化单元及所述文本网络第一优化单元进行优化，得到图像网络第二优化单元及文本网络第二优化单元；

测试数据获取模块，用于获取第一人脸目标图像及第二人脸目标图像，其中，所述第一人脸目标图像携带第一目标对象，所述第二人脸目标图像携带第二目标对象；

跨年龄人脸识别模块，用于将所述第一人脸目标图像及所述第二人脸目标图像作为所述跨年龄人脸识别模型中的所述图像网络第二优化单元的输入，通过所述图像网络第二优化单元输出所述第一目标对象与所述第二目标对象的相似度。

8.一种计算机设备，其特征在于，包括：存储器、收发器、处理器以及总线系统；

其中，存储器用于存储程序；

处理器用于执行存储器中的程序，包括执行如权利要求1至6中任一项的跨年龄的人脸识别方法；

9.一种计算机可读存储介质，包括指令，当其在计算机上运行时，使得计算机执行如权利要求1至6中任一项的跨年龄的人脸识别方法。

10.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行如权利要求1至6中任一项的跨年龄的人脸识别方法。