CN114020951A

CN114020951A - 一种人脸质量增强模型的训练方法、图片搜索方法及装置

Info

Publication number: CN114020951A
Application number: CN202010692159.XA
Authority: CN
Inventors: 李天鹏; 林明安; 刘慧慧; 周泽南; 许静芳
Original assignee: Beijing Sogou Technology Development Co Ltd
Current assignee: Beijing Sogou Technology Development Co Ltd
Priority date: 2020-07-17
Filing date: 2020-07-17
Publication date: 2022-02-08
Anticipated expiration: 2040-07-17
Also published as: CN114020951B

Abstract

本发明公开了一种人脸质量增强模型的训练方法，包括：构建训练数据，训练数据中包含多个人脸图片对，每个人脸图片对中包含第一人脸图片和第二人脸图片，第二人脸图片的分辨率等级高于第一人脸图片；构建初始训练模型，初始训练模型共有N个输入端和N个输出端；对于训练数据中的每个人脸图片对，选出与第一人脸图片的分辨率等级对应的目标输入端，选出与第二人脸图片的分辨率等级对应的目标输出端；将第一人脸图片作为目标输入端的输入并将第二人脸图片作为目标输出端的输出，以对初始训练模型进行训练，获得人脸质量增强模型。本发明可以对小人脸图片进行质量增强，在对其进行图片搜索时，可以显著提升搜索结果的准确性。

Description

一种人脸质量增强模型的训练方法、图片搜索方法及装置

技术领域

本发明涉及图片搜索技术领域，尤其涉及一种人脸质量增强模型的训练方法、图片搜索方法及装置。

背景技术

在对人脸图片进行搜索时，一般由用户上传包含人脸图像的搜索图片，并发起搜索请求(即：Query)，图片搜索引擎基于该搜索图片在互联网上搜索相关的图片，同时，图片搜索引擎还可以识别出该搜索图片中的人物身份(例如：姓名)。

若搜索图片中的人脸图像尺寸太小(称作“小人脸”)，则图片搜索引擎难以从搜索图片中提取到足够的特征，图片搜索引擎的性能将受到影响，无法获得准确的搜索结果。此时，则需要对搜索图片进行人脸质量增强，

但是，目前的人脸质量增强方法，难以拟合真实场景，在对小人脸图片进行搜索时，搜索效果依然不好，搜索结果的准确性不高。

发明内容

本发明实施例通过提供及一种人脸质量增强模型的训练方法、图片搜索方法及装置，解决了现有技术中在对小人脸图片进行图片搜索时，难以获得准确的搜索结果的技术问题，实现了对小人脸图片进行质量增强，在对其进行图片搜索时，可以显著提升搜索结果的准确性技术效果。

第一方面，本发明通过本发明的一实施例提供如下技术方案：

一种人脸质量增强模型的训练方法，包括：

构建训练数据，所述训练数据中包含多个人脸图片对，每个所述人脸图片对中均包含第一人脸图片和第二人脸图片，所述第一人脸图片和所述第二人脸图片中包含同一人物的人脸图像，所述第一人脸图片和第二人脸图片均为预设尺寸，所述第二人脸图片的分辨率等级高于所述第一人脸图片的分辨率等级，所述训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数；

构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同；

对于所述训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端；

将所述第一人脸图片作为所述目标输入端的输入，并将所述第二人脸图片作为所述目标输出端的输出，以对所述初始训练模型进行训练，获得人脸质量增强模型。

优选地，所述构建训练数据，包括：

获得M个人脸图片集合，每个人脸图片集合中均包含多张人脸图片，所述多张人脸图片的分辨率等级各不相同，同一人脸图片集合中的人脸图片均包含同一人物的人脸图像，所述多张人脸图片均为所述预设尺寸；

针对每个所述人脸图片集合进行多次人脸图片提取，每次随机提出两张人脸图片，获得多个人脸图片对；并基于所述多个人脸图片对，构建所述训练数据。

优选地，所述获得M个人脸图片集合，包括：

获取P张原始图片，P为正整数；

从所述P张原始图片中筛选出M张原始图片，所述M张原始图片中均包含小于所述预设尺寸的人脸图像；

对所述M张原始图片分别进行图片搜索，获得所述M个图片集合；其中，所述M个图片集合与所述M张原始图片一一对应。

优选地，所述对所述M张原始图片分别进行图片搜索，获得所述M个人脸图片集合，包括：

对第一原始图片进行图片搜索，获得S张搜索结果图片；其中，所述第一原始图片是所述M张原始图片中的任一图片，所述S张搜索结果图片的尺寸各不相同，S为大于等于2的整数；

对所述S张搜索结果图片分别进行人脸区域裁剪，获得W张人脸图片，W大于等于S；

基于所述W张人脸图片，获得第一人脸图片集合；其中，所述第一人脸图片集合属于所述M个人脸图片集合，所述第一图片集合与所述第一原始图片对应。

优选地，所述基于所述W张人脸图像，获得第一人脸图片集合，包括：

计算所述W张人脸图片中的每张人脸图片与所述第一原始图片的结构相似度，获得所述W张人脸图片中的每张人脸图片的相似度得分；

过滤掉所述W张人脸图片中相似度得分低于预设得分的人脸图片，获得所述第一人脸图片集合。

优选地，所述计算所述W张校准图片中的每张校准图片与所述第一原始图片的结构相似度之前，包括：

对所述W张人脸图片中的每张人脸图片分别进行人脸校准，具体包括：将所述W张人脸图片中的每张人脸图片均缩放到所述预设尺寸；基于所述第一原始图片，对所述W张人脸中的每张人脸图片中的人脸图像进行姿态调整。

基于同一发明构思，第二方面，本发明通过本发明的一实施例，提供如下技术方案：

一种图片搜索方法，包括：

获取用户上传的第一搜索图片；

确定所述第一搜索图片的分辨率等级；

基于所述分辨率等级，从人脸质量增强模型中选择与所述分辨率等级对应的输入端作为目标输入端；其中，所述人脸质量增强模型由权利要求1～6任一所述的方法训练获得；

将所述第一搜索图片从所述目标输入端输入到所述人脸质量增强模型中，以通过所述人脸质量增强模型对所述第一搜索图片进行人脸质量增强，获得第二搜索图片；

对所述第二搜索图片进行图片搜索，获得搜索结果。

基于同一发明构思，第三方面，本发明通过本发明的一实施例，提供如下技术方案：

一种人脸质量增强模型的训练装置，包括：

第一构建单元，用于构建训练数据，所述训练数据中包含多个人脸图片对，每个所述人脸图片对中均包含第一人脸图片和第二人脸图片，所述第一人脸图片和所述第二人脸图片中包含同一人物的人脸图像，所述第一人脸图片和第二人脸图片均为预设尺寸，所述第二人脸图片的分辨率等级高于所述第一人脸图片的分辨率等级，所述训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数；

第二构建单元，用于构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同；

第一选择单元，用于对于所述训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端；

训练单元，用于将所述第一人脸图片作为所述目标输入端的输入，并将所述第二人脸图片作为所述目标输出端的输出，以对所述初始训练模型进行训练，获得人脸质量增强模型。

优选地，所述第一构建单元，包括：

获得子单元，用于获得M个人脸图片集合，每个人脸图片集合中均包含多张人脸图片，所述多张人脸图片的分辨率等级各不相同，同一人脸图片集合中的人脸图片均包含同一人物的人脸图像，所述多张人脸图片均为所述预设尺寸；

提取子单元，用于针对每个所述人脸图片集合进行多次人脸图片提取，每次随机提出两张人脸图片，获得多个人脸图片对；并基于所述多个人脸图片对，构建所述训练数据。

优选地，所述获得子单元，具体用于：

获取P张原始图片，P为正整数；从所述P张原始图片中筛选出M张原始图片，所述M张原始图片中均包含小于所述预设尺寸的人脸图像；对所述M张原始图片分别进行图片搜索，获得所述M个图片集合，所述M个图片集合与所述M张原始图片一一对应。

优选地，所述获得子单元，具体用于：

对第一原始图片进行图片搜索，获得S张搜索结果图片；其中，所述第一原始图片是所述M张原始图片中的任一图片，所述S张搜索结果图片的尺寸各不相同，S为大于等于2的整数；对所述S张搜索结果图片分别进行人脸区域裁剪，获得W张人脸图片，W大于等于S；基于所述W张人脸图片，获得第一人脸图片集合；其中，所述第一人脸图片集合属于所述M个人脸图片集合，所述第一图片集合与所述第一原始图片对应。

优选地，所述获得子单元，具体用于：

计算所述W张人脸图片中的每张人脸图片与所述第一原始图片的结构相似度，获得所述W张人脸图片中的每张人脸图片的相似度得分；过滤掉所述W张人脸图片中相似度得分低于预设得分的人脸图片，获得所述第一人脸图片集合。

优选地，所述获得子单元，具体用于：

基于同一发明构思，第四方面，本发明通过本发明的一实施例，提供如下技术方案：

一种图片搜索装置，包括：

获取单元，用于获取用户上传的第一搜索图片；

确定单元，用于确定所述第一搜索图片的分辨率等级；

第二选择单元，用于基于所述分辨率等级，从人脸质量增强模型中选择与所述分辨率等级对应的输入端作为目标输入端；其中，所述人脸质量增强模型由权利要求1～6任一所述的方法训练获得；

输入单元，用于将所述第一搜索图片从所述目标输入端输入到所述人脸质量增强模型中，以通过所述人脸质量增强模型对所述第一搜索图片进行人脸质量增强，获得第二搜索图片；

搜索单元，用于对所述第二搜索图片进行图片搜索，获得搜索结果。

基于同一发明构思，第五方面，本发明通过本发明的一实施例，提供如下技术方案：

一种人脸质量增强模型的训练装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时可以实现上述第一方面中任一实施方式所述的方法步骤。

基于同一发明构思，第六方面，本发明通过本发明的一实施例，提供如下技术方案：

一种图片搜索装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时可以实现上述第二方面中任一实施方式所述的方法步骤。

基于同一发明构思，第七方面，本发明通过本发明的一实施例，提供如下技术方案：

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时可以实现上述第一方面中任一实施方式所述的方法步骤。

基于同一发明构思，第八方面，本发明通过本发明的一实施例，提供如下技术方案：

一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时可以实现上述第二方面中任一实施方式所述的方法步骤。

本发明实施例中提供的一个或多个技术方案，至少具有如下技术效果或优点：

在本发明实施例中，公开了一种人脸质量增强模型的训练方法，包括：构建训练数据，所述训练数据中包含多个人脸图片对，每个所述人脸图片对中均包含第一人脸图片和第二人脸图片，所述第一人脸图片和所述第二人脸图片中包含同一人物的人脸图像，所述第一人脸图片和第二人脸图片均为预设尺寸，所述第二人脸图片的分辨率等级高于所述第一人脸图片的分辨率等级，所述训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数；构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同；对于所述训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端；将所述第一人脸图片作为所述目标输入端的输入，并将所述第二人脸图片作为所述目标输出端的输出，以对所述初始训练模型进行训练，获得人脸质量增强模型。采用该训练方法训练出的人脸质量增强模型，可以对小人脸图片进行质量增强，且效果明显，如此，解决了现有技术中在对小人脸图片进行图片搜索时，难以获得准确的搜索结果的技术问题，实现了对小人脸图片进行质量增强，在对其进行图片搜索时，可以显著提升搜索结果准确性的技术效果。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种人脸质量增强模型的训练方法的流程图；

图2为本发明实施例中人脸质量增强模型的结构图；

图3为本发明实施例中一种图片搜索方法的流程图；

图4为本发明实施例中一种人脸质量增强模型的训练装置的结构图；

图5为本发明实施例中一种图片搜索装置的结构图；

图6为本发明实施例中一种人脸质量增强模型的训练装置(以及图片搜索装置)的结构图；

图7为本发明实施例中一种人脸质量增强模型的训练装置(以及图片搜索装置)作为服务器时的结构图。

具体实施方式

本发明实施例的技术方案为解决上述技术问题，总体思路如下：

一种人脸质量增强模型的训练方法，包括：构建训练数据，所述训练数据中包含多个人脸图片对，每个所述人脸图片对中均包含第一人脸图片和第二人脸图片，所述第一人脸图片和所述第二人脸图片中包含同一人物的人脸图像，所述第一人脸图片和第二人脸图片均为预设尺寸，所述第二人脸图片的分辨率等级高于所述第一人脸图片的分辨率等级，所述训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数；构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同；对于所述训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端；将所述第一人脸图片作为所述目标输入端的输入，并将所述第二人脸图片作为所述目标输出端的输出，以对所述初始训练模型进行训练，获得人脸质量增强模型。采用该训练方法训练出的人脸质量增强模型，可以对小人脸图片进行质量增强，且效果明显，如此，解决了现有技术中在对小人脸图片进行图片搜索时，难以获得准确的搜索结果的技术问题，实现了对小人脸图片进行质量增强，在对其进行图片搜索时，可以显著提升搜索结果准确性的技术效果。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

首先说明，本文中出现的术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。

实施例一

如图1所示，本实施例提供了一种人脸质量增强模型的训练方法，包括：

步骤S101：构建训练数据，训练数据中包含多个人脸图片对，每个人脸图片对中均包含第一人脸图片和第二人脸图片，第一人脸图片和第二人脸图片中包含同一人物的人脸图像，第一人脸图片和第二人脸图片均为预设尺寸，第二人脸图片的分辨率等级高于第一人脸图片的分辨率等级，训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数。

在具体实施过程中，首先需要构建模型训练所需的训练数据(即：训练样本)，训练数据中的全部人脸图片均为预设尺寸，该预设尺寸即为模型所需的输入数据(即：图片)的尺寸，该预设尺寸也是图片搜索引擎所需的搜索图片的尺寸。该预设尺寸通常为112*112(单位：像素)。当时，该预设尺寸也可以为其他尺寸，例如，120*120、或240*240、等等。此处，对于该预设尺寸不做具体限定。

在具体实施过程中，训练数据中的全部图片共对应有N+1个分辨率等级，而人脸质量增强模型中一共有N个模块，也就是说，训练数据中的人脸图片的分辨率等级的数量比人脸质量增强模型中模块的数量多一个。

举例来讲，人脸质量增强模型中一共有4个模块，则训练数据中的人脸图片一共有5个分辨率等级。

其中，图片的分别率等级越高，则代表图片的质量越高，其包含的信息越多，越有利于进行人脸识别。

在具体实施过程中，训练数据中包含大量的人脸图片对，每个人脸图片对中包含两张人脸图片(即：第一人脸图片和第二人脸图片)，且这两张人脸图片中具有同一个人物的人脸图像，其区别在于，这两张人脸图片的分辨率等级不同，其中，第二人脸图片的分辨率等级高于第一人脸图片的分辨率等级，也就是说，第二人脸图片为高质量图片，第一人脸图片为低质量图片。

作为一种可选的实施例，步骤S101，包括：

获得M个人脸图片集合，每个人脸图片集合中均包含多张人脸图片，所述多张人脸图片的分辨率等级各不相同，同一人脸图片集合中的人脸图片均包含同一人物的人脸图像，所述多张人脸图片均为预设尺寸；针对每个人脸图片集合进行多次人脸图片提取，每次随机提出两张人脸图片，获得多个人脸图片对；基于多个人脸图片对构建训练数据。

在具体实施过程中，可以获取第一数据集，其中，第一数据集中包含M个人脸图片集合；针对一个人脸图片集合而言，可以任意提取(例如：随机提取)出两张人脸图片构成一个人脸图片对，如此，对于每个人脸图片集合而言，都可以进行多次图片提取，可以获得大量的人脸图片对，并以此构成训练数据。

举例来讲，若某一人脸图片集合中包含5张人脸图片，分别为L1、L2、L3、L4、L5，这些张人脸图片都包含人物A的人脸图像，且这些张人脸图片都为预设尺寸(例如：112*112)，这些人脸图片的分辨率等级也各不相同(例如：L1是第1等级，L2是第2等级，L3是第3等级，L4是第4等级，L5是第5等级)。在该图片集合中，可以提取到的人脸图片对有：(L1、L2)、(L1、L3)、(L1、L4)、(L1、L5)、(L2、L3)、(L2、L4)、(L2、L5)、(L3、L4)、(L3、L5)、(L4，L5)，共10个人脸图片对。

以上仅是针对一个人脸图片集，在具体实施时，在第一数据集中包含大量的人脸图片集合，针对每个人脸数据集都进行类似的人脸图片对的提取，则可以获得大量的人脸图片对，如此，即可构建训练数据。

作为一种可选的实施例，所述获得M个人脸图片集合，包括：

在具体实施过程中，在获得所述M个人脸数据集合时，可以先获取第二数据集，在第二数据集中包含大量的原始图片；然后，对这些原始图片进行人脸检测，并从中选出人脸尺寸小于预设尺寸(例如：112*112)的图片，共获得M张图片。进一步，再利用图片搜索引擎对这些图片分别进行图片搜索，获得所述M个图片集合。

作为一种可选的实施例，所述对所述M张原始图片分别进行图片搜索，获得所述M个人脸图片集合，包括：

首先，对第一原始图片进行图片搜索，获得S张搜索结果图片；其中，第一原始图片是所述M张原始图片中的任一图片，所述S张搜索结果图片的尺寸各不相同，S为大于等于2的整数；这样就可以获得同一人脸在不同尺寸下的图片。其次，对所述S张搜索结果图片中的每张搜索结果图片进行人脸区域裁剪，去掉非人脸区域的图像，获得W张人脸图像，W大于等于S。再次，基于所述W张人脸图像获得第一人脸图片集合；其中，第一人脸图片集合属于所述M个人脸图片集合，第一图片集合与第一原始图片对应。这样就获得了第一原始图片对应的图像集合。以此类推，对于所述M张原始图片中的每张原始图片，都进行类似的操作，则获得所述M个人脸图片集合。

更详细地，所述基于所述W张人脸图像获得第一人脸图片集合，包括：

对所述W张人脸图片中的每张人脸图片分别进行人脸校准；计算所述W张人脸图片中的每张人脸图片与第一原始图片的结构相似度，获得所述W张人脸图片中的每张人脸图片的相似度得分；过滤掉所述W张人脸图片中相似度得分低于预设得分的人脸图片，获得第一人脸图片集合。

举例来件，针对第二数据集中的任意一张原始图片p1，将该原始图片p1输入到图片搜索引擎中进行图片搜索，获得多张不同尺寸的搜索结果图片；然后，对每张搜索结果图片中进行人脸检测，并将检测到的人脸区域进行裁剪下来，获得多张人脸图片；最后，对这些人脸图片进行人脸校准和过滤；过滤后的人脸图片则构成原始图片p1的人脸图片集合。

此处，采用图片搜索引擎获得第一原始图片对应的多张不同尺寸的搜索结果图片，并基于这些不同尺寸的搜索结果图片，构造不同分辨率等级的人脸图片对，这样更加符合真实场景，使得训练数据可以与真实场景高度拟合，有利于提升模型训练的效果。

在具体实施过程中，所述对所述W张人脸中的每张人脸图片进行人脸校准，包括：

将所述W张人脸图片中的每张人脸图片均缩放到预设尺寸；基于第一原始图片，对所述W张人脸中的每张人脸图片中的人脸图像进行姿态调整。

此处，将每张人脸图片都缩放到了预设尺寸，若原人脸图片的尺寸越大，则缩放到预设尺寸后，其分辨率等级越高，图片质量越高；若原人脸图盘的尺寸越小，则缩放到预设尺寸后，其分辨率等级越低，图片质量越低。

此处，校准的目的是将剪裁后的人脸图片通过仿射变换缩放到预设尺寸，且将人脸关键点尽可能靠近预设的正脸姿态的标准人脸(即：摆正人脸)，并将人脸图像置于图片中央，这样可以减小后续比的计算压力，在计算校准图片与第一原始图片的结构相似度时，计算速度更快，计算精度更高。

在具体实施过程中，在计算每张人脸图片与第一原始图片的结构相似度时，可以计算每张人脸图片与第一原始图片的SSIM(Structural Similarity IndexMeasure，结构相似度)得分，保留得分较高的人脸图片，滤掉得分较低的人脸图片。由于在搜索结果图片中可能包含多个人物的人脸图像，导致后面裁剪获得的人脸图片中可能包含其他人物的人脸图像(即：与第一原始图片中不是同一个人物)，所以此处对这些人脸图片进行人脸过滤，滤掉得分较低的人脸图，如此，可以保证过滤后的人脸图片与第一原始图片是同一个人物的人脸图片。

至此，即完成了构建训练数据的步骤。

步骤S102：构建初始训练模型，初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同。

在具体实施过程中，步骤S101和步骤S102的执行顺序不分先后，哪个先执行都可以。

在具体实施过程中，在所述N+1个分辨率等级由低到高排序时，所述N个输入端与所述N+1个分辨率等级中排序靠前的N个分辨率等级一一对应，所述N个输出端与所述N+1个分辨率等级中排序靠后的N个分辨率等级一一对应。

举例来讲，如图2所示，初始训练模型一共有4个模块，其中，每个模块都有一个输入端和一个输出端，模块1具有输入端Input1和输出端Output1，模块2具有输入端Input2和输出端Output2，模块3具有输入端Input3和输出端Output3，模块4具有输入端Input4和输出端Output4。其中，模块1的输出端Output1与模块2的输入端Input2连接，模块2的输出端Output2与模块3的输入端Input3连接，模块3的输出端Output3与模块4的输入端Input4连接。

其中，训练数据中的人脸图片一共分为5个分辨率等级，从高到低依次为：第1级、第2级、第3级、第4级、第5级；Input1与第1级的人脸图片对应，Input2与第2级的人脸图片对应，Input3与第3级的人脸图片对应，Input4与第4级的人脸图片对应；Output1与第2级的人脸图片对应，Output2与第3级的人脸图片对应，Output3与第4级的人脸图片对应，Output4与第5级的人脸图片对应。

在具体实施过程中，在执行完步骤S102之后，即可执行步骤S103。

步骤S103：对于训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端。

举例来讲，对于人脸图片对(L1、L2)，则人脸图片L1对应模块1输入端Input1，人脸图片L2对应模块1的输出端Output1。

举例来讲，对于人脸图片对(L1、L3)，则人脸图片L1对应模块1输入端Input1，人脸图片L3对应模块2的输出端Output2。

举例来讲，对于人脸图片对(L1、L4)，则人脸图片L1对应模块1输入端Input1，人脸图片L4对应模块3的输出端Output3。

举例来讲，对于人脸图片对(L1、L5)，则人脸图片L1对应模块1输入端Input1，人脸图片L5对应模块4的输出端Output4。

举例来讲，对于人脸图片对(L2、L3)，则人脸图片L2对应模块2输入端Input2，人脸图片L3对应模块2的输出端Output2。

举例来讲，对于人脸图片对(L2、L4)，则人脸图片L2对应模块2输入端Input2，人脸图片L4对应模块3的输出端Output3。

举例来讲，对于人脸图片对(L2、L5)，则人脸图片L2对应模块2输入端Input2，人脸图片L5对应模块4的输出端Output4。

举例来讲，对于人脸图片对(L3、L4)，则人脸图片L3对应模块3输入端Input3，人脸图片L4对应模块3的输出端Output3。

举例来讲，对于人脸图片对(L3、L5)，则人脸图片L3对应模块3输入端Input3，人脸图片L5对应模块4的输出端Output4。

举例来讲，对于人脸图片对(L4、L5)，则人脸图片L4对应模块4输入端Input4，人脸图片L5对应模块4的输出端Output4。

在具体实施过程中，在执行完步骤S103之后，即可执行步骤S104。

步骤S104：将第一人脸图片作为目标输入端的输入，并将第二人脸图片作为目标输出端的输出，以对初始训练模型进行训练，获得人脸质量增强模型。

举例来讲，对于人脸图片对(L1、L2)，则人脸图片L1作为模块1输入端Input1的输入数据，人脸图片L2作为模块1的输出端Output1的输出数据，以此对模块1进行训练，使其能够实现将第1级分辨率的人脸图片质量增强，以输出第2级分辨率的人脸图片。

举例来讲，对于人脸图片对(L1、L3)，则人脸图片L1作为模块1输入端Input1的输入数据，人脸图片L3作为模块2的输出端Output2的输出数据，以此对模块1和模块2一起进行训练，使其能够实现将第1级分辨率的人脸图片质量增强，以输出第3级分辨率的人脸图片。

举例来讲，对于人脸图片对(L1、L4)，则人脸图片L1作为模块1输入端Input1的输入数据，人脸图片L4作为模块3的输出端Output3的输出数据，以此对模块1、模块2和模块3一起进行训练，使其能够实现将第1级分辨率的人脸图片质量增强，以输出第4级分辨率的人脸图片。

举例来讲，对于人脸图片对(L1、L5)，则人脸图片L1作为模块1输入端Input1的输入数据，人脸图片L5作为模块4的输出端Output4的输出数据，以此对模块1、模块2、模块3和模块4一起进行训练，使其能够实现将第1级分辨率的人脸图片质量增强，以输出第5级分辨率的人脸图片。

举例来讲，对于人脸图片对(L2、L3)，则人脸图片L2作为模块2输入端Input2的输入数据，人脸图片L3作为模块2的输出端Output2的输出数据，以此对模块2进行训练，使其能够实现将第2级分辨率的人脸图片质量增强，以输出第3级分辨率的人脸图片。

举例来讲，对于人脸图片对(L2、L4)，则人脸图片L2作为模块2输入端Input2的输入数据，人脸图片L4作为模块3的输出端Output3的输出数据，以此对模块2和模块3一起进行训练，使其能够实现将第2级分辨率的人脸图片质量增强，以输出第4级分辨率的人脸图片。

举例来讲，对于人脸图片对(L2、L5)，则人脸图片L2作为模块2输入端Input2的输入数据，人脸图片L5作为模块4的输出端Output4的输出数据，以此对模块2、模块3和模块4一起进行训练，使其能够实现将第2级分辨率的人脸图片质量增强，以输出第5级分辨率的人脸图片。

举例来讲，对于人脸图片对(L3、L4)，则人脸图片L3作为模块3输入端Input3的输入数据，人脸图片L4作为模块3的输出端Output3的输出数据，以此对模块3进行训练，使其能够实现将第3级分辨率的人脸图片质量增强，以输出第4级分辨率的人脸图片。

举例来讲，对于人脸图片对(L3、L5)，则人脸图片L3作为模块3输入端Input3的输入数据，人脸图片L5作为模块4的输出端Output4的输出数据，以此对模块3和模块4一起进行训练，使其能够实现将第3级分辨率的人脸图片质量增强，以输出第5级分辨率的人脸图片。

举例来讲，对于人脸图片对(L4、L5)，则人脸图片L4作为模块4输入端Input4的输入数据，人脸图片L5作为模块4的输出端Output4的输出数据，以此对模块4进行训练，使其能够实现将第4级分辨率的人脸图片质量增强，以输出第5级分辨率的人脸图片。

以上举例，仅是对所述M个人脸图片集合某一个集合的的情况，在具体实施过程中，针对全部人脸图片集合，会有更多的人脸图片对作为训练数据来对初始模型进行训练，最终获得人脸质量增强模型。

由于采用大量分辨率等级不同的人脸图片对作为训练数据，对初始模型中的每个模块进行逐级的训练，如此训练出来的人脸质量增强模型，不但可以显著提升小人脸图片的质量，同时还可以减少人脸图片中其他特征信息(例如：身份信息)的损失。

上述本发明实施例中的技术方案，至少具有如下的技术效果或优点：

实施例二

基于同一发明构思，如图3所示，本实施例提供了一种图片搜索方法，包括：

步骤S201：获取用户上传的第一搜索图片。

在具体实施过程中，第一搜索图片中包含小人脸图像(即：人脸尺寸小于一预设尺寸)。并且，若用户上传的第一搜索图片不是预设尺寸，则需要将第一搜索图片搜索至预设尺寸。

步骤S202：确定第一搜索图片的分辨率等级。

步骤S203：基于第一搜索图片的分辨率等级，从人脸质量增强模型中选择与该分辨率等级对应的目标输入端；其中，人脸质量增强模型由上述实施例一中的任一实施方式训练获得。

举例来讲，该人脸质量增强模型的结构如图2所示，其中，在人脸质量增强模型投入使用过程中，其包含4个输入端(即：Input1、Input2、Input3和Input4)和1个输出端(即：Output4)。

举例来讲，若第一搜索图片的分辨率等级为第1级，则其对应的目标输入端为模型1的输入端Input1；若第一搜索图片的分辨率等级为第2级，则其对应的目标输入端为模型2的输入端Input2；若第一搜索图片的分辨率等级为第3级，则其对应的目标输入端为模型3的输入端Input3；若第一搜索图片的分辨率等级为第4级，则其对应的目标输入端为模型4的输入端Input4。

步骤S204：将第一搜索图片从目标按输入端输入到人脸质量增强模型中，以通过人脸质量增强模型对第一搜索图片进行人脸质量增强，获得第二搜索图片。

举例来讲，若第一搜索图片的分辨率等级为第1级，则将第一搜索图片从模型1的输入端Input1输入到人脸质量增强模型中，经过人脸质量增强模型的人脸质量增强，从而从输出端Output4获得分辨率等级为第5级的第二搜索图片。

举例来讲，若第一搜索图片为的分辨率等级第2级，则将第一搜索图片从模型2的输入端Input2输入到人脸质量增强模型中，经过人脸质量增强模型的人脸质量增强，从而从输出端Output4获得分辨率等级为第5级的第二搜索图片。

举例来讲，若第一搜索图片为的分辨率等级第3级，则将第一搜索图片从模型3的输入端Input3输入到人脸质量增强模型中，经过人脸质量增强模型的人脸质量增强，从而从输出端Output4获得分辨率等级为第5级的第二搜索图片。

举例来讲，若第一搜索图片为的分辨率等级第4等级，则将第一搜索图片从模型4的输入端Input4输入到人脸质量增强模型中，经过人脸质量增强模型的人脸质量增强，从而从输出端Output4获得分辨率等级为第5级的第二搜索图片。

步骤S205：对第二搜索图片进行图片搜索，获得搜索结果。

举例来讲，可以将质量增强后的第二搜索图片输入到图片搜搜引擎中，进行图片搜索，由于其图片质量得到了显著提升，其搜索结果更准确。并且，由于人脸质量增强模型是对第一搜索图片进行了逐级的质量提升，这降低了人物身份信息的流失，有助于获得更准确的人物身份信息。

在本发明实施例中，由于在对第一搜索图片进行图片搜索时，采用人脸质量增强模型对其进行了质量增强，其可以增加图片的分辨率等级，提升图片质量，同时降低人物的身份信息的损失，如此，图片搜索引擎可以提取到更多的特征信息，有助于提高搜索结果的准确性。

实施例三

基于同一发明构思，如图4所示，本实施例提供了一种人脸质量增强模型的训练装置300，包括：

第一构建单元301，用于构建训练数据，所述训练数据中包含多个人脸图片对，每个所述人脸图片对中均包含第一人脸图片和第二人脸图片，所述第一人脸图片和所述第二人脸图片中包含同一人物的人脸图像，所述第一人脸图片和第二人脸图片均为预设尺寸，所述第二人脸图片的分辨率等级高于所述第一人脸图片的分辨率等级，所述训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数；

第二构建单元302，用于构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同；

第一选择单元303，用于对于所述训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端；

训练单元304，用于将所述第一人脸图片作为所述目标输入端的输入，并将所述第二人脸图片作为所述目标输出端的输出，以对所述初始训练模型进行训练，获得人脸质量增强模型。

作为一种可选的实施例，所述第一构建单元301，包括：

作为一种可选的实施例，所述获得子单元，具体用于：

获取P张原始图片，P为正整数；从所述P张原始图片中筛选出M张原始图片，所述M张原始图片中均包含小于所述预设尺寸的人脸图像；对所述M张原始图片分别进行图片搜索，获得所述M个图片集合；其中，所述M个图片集合与所述M张原始图片一一对应。

作为一种可选的实施例，所述获得子单元，具体用于：

在所述计算所述W张校准图片中的每张校准图片与所述第一原始图片的结构相似度之前，对所述W张人脸图片中的每张人脸图片分别进行人脸校准；

具体校准过程，包括：将所述W张人脸图片中的每张人脸图片均缩放到所述预设尺寸；基于所述第一原始图片，对所述W张人脸中的每张人脸图片中的人脸图像进行姿态调整。

由于本实施例所介绍的人脸质量增强模型的训练装置为实施本发明实施例中人脸质量增强模型的训练方法所采用的装置，故而基于本发明实施例中所介绍的人脸质量增强模型的训练方法，本领域所属技术人员能够了解本实施例的人脸质量增强模型的训练装置的具体实施方式以及其各种变化形式，所以在此对于该装置如何实现本发明实施例中的方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中人脸质量增强模型的训练方法所采用的装置，都属于本发明所欲保护的范围。

实施例四

基于同一发明构思，如图5所示，本实施例提供了一种图片搜索装置400，包括：

获取单元401，用于获取用户上传的第一搜索图片；

确定单元402，用于确定所述第一搜索图片的分辨率等级；

第二选择单元403，用于基于第一搜索图片的分辨率等级，从人脸质量增强模型中选择与该分辨率等级对应的模块作为输入模块；其中，所述人脸质量增强模型上述实施例一中任一实施方法训练获得；

输入单元404，用于将第一搜索图片从所述输入模块输入到人脸质量增强模型中，以通过人脸质量增强模型对第一搜索图片进行人脸质量增强，获得第二搜索图片405；

搜索单元406，用于对所述第二搜索图片进行图片搜索，获得搜索结果。

由于本实施例所介绍的图片搜索装置为实施本发明实施例中图片搜索方法所采用的装置，故而基于本发明实施例中所介绍的图片搜索方法，本领域所属技术人员能够了解本实施例的图片搜索装置的具体实施方式以及其各种变化形式，所以在此对于该图片搜索装置如何实现本发明实施例中的方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中图片搜索方法所采用的装置，都属于本发明所欲保护的范围。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图6是根据一示例性实施例示出的一种人脸质量增强模型的训练装置(以及一种图片搜索装置)的结构图。例如，装置800可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图6，装置800可以包括以下一个或多个组件：处理组件802，存储器804，电源组件806，多媒体组件808，音频组件810，输入/输出(I/O)的接口812，传感器组件814，以及通信组件816。

处理组件802通常控制装置800的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理元件802可以包括一个或多个处理器820来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件802可以包括一个或多个模块，便于处理组件802和其他组件之间的交互。例如，处理部件802可以包括多媒体模块，以方便多媒体组件808和处理组件802之间的交互。

存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统，一个或多个电源，及其他与为装置800生成、管理和分配电力相关联的组件。

多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件810被配置为输出和/或输入音频信号。例如，音频组件810包括一个麦克风(MIC)，当装置800处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中，音频组件810还包括一个扬声器，用于输出音频信号。

I/O接口812为处理组件802和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件814包括一个或多个传感器，用于为装置800提供各个方面的状态评估。例如，传感器组件814可以检测到设备800的打开/关闭状态，组件的相对定位，例如所述组件为装置800的显示器和小键盘，传感器组件814还可以检测装置800或装置800一个组件的位置改变，用户与装置800接触的存在或不存在，装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件814还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信部件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信部件816还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器804，上述指令可由装置800的处理器820执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置800的处理器执行时，使得装置800能够执行一种人脸质量增强模型的训练方法，包括：构建训练数据，所述训练数据中包含多个人脸图片对，每个所述人脸图片对中均包含第一人脸图片和第二人脸图片，所述第一人脸图片和所述第二人脸图片中包含同一人物的人脸图像，所述第一人脸图片和第二人脸图片均为预设尺寸，所述第二人脸图片的分辨率等级高于所述第一人脸图片的分辨率等级，所述训练数据中的全部图片共对应有N+1个分辨率等级，N为正整数；构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N个输出端各自对应的分辨率等级不同；对于所述训练数据中的每个人脸图片对，从所述N个输入端中选出与所述第一人脸图片的分辨率等级对应的目标输入端，以及从所述N个输出端中选出与所述第二人脸图片的分辨率等级对应的目标输出端；将所述第一人脸图片作为所述目标输入端的输入，并将所述第二人脸图片作为所述目标输出端的输出，以对所述初始训练模型进行训练，获得人脸质量增强模型。

以及，一种非临时性计算机可读存储介质，当所述存储介质中的指令由装置800的处理器执行时，使得装置800能够执行一种图片搜索方法，包括：获取用户上传的第一搜索图片；确定所述第一搜索图片的分辨率等级；基于所述分辨率等级，从人脸质量增强模型中选择与所述分辨率等级对应的输入端作为目标输入端；将所述第一搜索图片从所述目标输入端输入到所述人脸质量增强模型中，以通过所述人脸质量增强模型对所述第一搜索图片进行人脸质量增强，获得第二搜索图片；对所述第二搜索图片进行图片搜索，获得搜索结果。

图7是本发明实施例中一种人脸质量增强模型的训练装置(以及一种图片搜索装置)作为服务器时的结构图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM等等。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种人脸质量增强模型的训练方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述构建训练数据，包括：

3.如权利要求2所述的方法，其特征在于，所述获得M个人脸图片集合，包括：

获取P张原始图片，P为正整数；

4.一种图片搜索方法，其特征在于，包括：

获取用户上传的第一搜索图片；

确定所述第一搜索图片的分辨率等级；

对所述第二搜索图片进行图片搜索，获得搜索结果。

5.一种人脸质量增强模型的训练装置，其特征在于，包括：

第二构建单元，用于构建初始训练模型，所述初始训练模型中包含N个模块，所述N个模块依次级联，每个模块均具有一输入端和一输出端，共有N个输入端和N个输出端，所述N个输入端各自对应的分辨率等级不同，所述N 个输出端各自对应的分辨率等级不同；

6.一种图片搜索装置，其特征在于，包括：

获取单元，用于获取用户上传的第一搜索图片；

确定单元，用于确定所述第一搜索图片的分辨率等级；

7.一种人脸质量增强模型的训练装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时可以实现如权利要求1～3任一权项所述的方法步骤。

8.一种图片搜索装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时可以实现如权利要求4所述的方法步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时可以实现如权利要求1～3任一权项所述的方法步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时可以实现如权利要求4所述的方法步骤。