CN112084936A

CN112084936A - 一种人脸图像预处理方法、装置、设备及存储介质

Info

Publication number: CN112084936A
Application number: CN202010934923.XA
Authority: CN
Inventors: 韩泽; 王薷泉; 梁潇; 谢会斌; 李聪廷
Original assignee: Jinan Boguan Intelligent Technology Co Ltd
Current assignee: Jinan Boguan Intelligent Technology Co Ltd
Priority date: 2020-09-08
Filing date: 2020-09-08
Publication date: 2020-12-15
Anticipated expiration: 2040-09-08
Also published as: CN112084936B

Abstract

本发明公开了一种人脸图像预处理方法、装置、设备及存储介质，该方法包括：确定当前需要进行预处理的人脸图像为目标图像；将所述目标图像输入至强化学习模型中，得到该强化学习模型输出的与各图像增强方法对应的图像增强参数；其中，所述强化学习模型为预先利用训练集训练得到的，所述训练集包括多个抓拍人脸图像及对应标准人脸图像；利用相应的图像增强方法，按照所述强化学习模型输出的与所述目标图像对应的各图像增强参数，对所述目标图像进行图像增强处理。可见，本申请利用强化学习解决人脸识别系统在使用过程中因光线和环境问题造成输入的人脸图像亮度、对比度及色彩失衡等问题，从而实现人脸图像质量的有效提高。

Description

一种人脸图像预处理方法、装置、设备及存储介质

技术领域

本发明涉及图像处理技术领域，更具体地说，涉及一种人脸图像预处理方法、装置、设备及存储介质。

背景技术

人脸识别在公共安全、金融等多个领域已得到广泛利用，人脸识别系统的主要流程是先通过前端相机采集数据，然后进行图像预处理，最后进行人脸识别。受环境天气以及光线变化的影响，前端相机采集到的图像可能会出现亮度对比度、过高或过低等问题，影响后续人脸识别。为降低环境对识别的影响，在数据预处理阶段往往会根据环境条件对图像进行一系列的增强，提高图像质量，从而减少环境对识别系统的影响。通常图像增强的方法和参数需要提前给定，参数设置的合适与否会影响识别的精度，但由于前端相机设备安装环境多种多样，很难制定出一套可以适合所有场景的参数，因此导致无法有效提高图像质量。

发明内容

本发明的目的是提供一种人脸图像预处理方法、装置、设备及存储介质，能够有效提高人脸图像的质量。

为了实现上述目的，本发明提供如下技术方案：

一种人脸图像预处理方法，包括：

确定当前需要进行预处理的人脸图像为目标图像；

将所述目标图像输入至强化学习模型中，得到该强化学习模型输出的与各图像增强方法对应的图像增强参数；其中，所述强化学习模型为预先利用训练集训练得到的，所述训练集包括多个抓拍人脸图像及对应标准人脸图像；

利用相应的图像增强方法，按照所述强化学习模型输出的与所述目标图像对应的各图像增强参数，对所述目标图像进行图像增强处理。

优选的，预先利用所述训练集训练得到所述强化学习模型，包括：

依次确定所述训练集中每个所述抓拍人脸图像为当前图像；

在确定出任一当前图像后，将当前图像输入至所述强化学习模型中，得到所述强化学习模型输出的各图像增强方法对应的图像增强参数，并利用相应的图像增强方法，按照所述强化学习模型输出的与当前图像对应的各图像增强参数，对当前图像进行图像增强处理；

确定当前图像进行图像增强处理后与对应标准人脸图像之间的相似度为第一相似度，当前图像进行图像增强处理前与对应标准人脸图像之间的相似度为第二相似度，以所述第一相似度及所述第二相似度的差值作为奖励，实现对所述强化学习模型的训练。

优选的，将当前图像输入至所述强化学习模型中之前，还包括：

对当前图像进行降质处理。

优选的，所述强化学习模型采用DDPG算法实现。

优选的，实现对所述强化学习模型的训练之前，还包括：

在所述DDPG算法所用损失函数的基础上添加额外的损失函数，以基于添加后得到的函数实现对所述强化学习模型的训练。

优选的，利用所述训练集训练得到所述强化学习模型之后，还包括：

利用测试集对所述强化学习模型进行测试，如果测试所得精度达到精度阈值，则确定所述强化学习模型训练完成，否则，则利用所述训练集重新对所述强化学习模型进行训练，直到所述强化学习模型测试所得精度达到精度阈值、或者对所述强化学习模型进行测试的次数达到次数阈值为止；所述测试集包括多个抓拍人脸图像及对应标准人脸图像。

优选的，对所述目标图像进行图像增强处理之后，还包括：

将进行图像增强处理之后的目标图像输出至人脸识别模型，得到所述人脸识别模型输出的所述目标图像的人脸识别结果。

一种人脸图像预处理装置，包括：

确定模块，用于：确定当前需要进行预处理的人脸图像为目标图像；

学习模块，用于：将所述目标图像输入至强化学习模型中，得到该强化学习模型输出的与各图像增强方法对应的图像增强参数；其中，所述强化学习模型为预先利用训练集训练得到的，所述训练集包括多个抓拍人脸图像及对应标准人脸图像；

处理模块，用于：利用相应的图像增强方法，按照所述强化学习模型输出的与所述目标图像对应的各图像增强参数，对所述目标图像进行图像增强处理。

一种人脸图像预处理设备，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如上任一项所述人脸图像预处理方法的步骤。

一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项所述人脸图像预处理方法的步骤。

本发明提供了一种人脸图像预处理方法、装置、设备及存储介质，该方法包括：确定当前需要进行预处理的人脸图像为目标图像；将所述目标图像输入至强化学习模型中，得到该强化学习模型输出的与各图像增强方法对应的图像增强参数；其中，所述强化学习模型为预先利用训练集训练得到的，所述训练集包括多个抓拍人脸图像及对应标准人脸图像；利用相应的图像增强方法，按照所述强化学习模型输出的与所述目标图像对应的各图像增强参数，对所述目标图像进行图像增强处理。本申请在确定出需要进行预处理的人脸图像后，将人脸图像输入至预先训练得到的强化学习模型中，得到强化学习模型输出的各图像增强参数，即为按照相应图像增强方法对人脸图像进行图像增强处理时所需使用的参数，从而实现对人脸图像的图像增强处理，而强化学习模型则是基于抓拍人脸图像及对应标准人脸图像训练得到的；可见，本申请基于强化学习动态生成可以提高人脸图像的人脸识别指标的图像增强参数，利用该图像增强参数对人脸图像进行图像增强处理，也即利用强化学习解决人脸识别系统在使用过程中因光线和环境问题造成输入的人脸图像亮度、对比度及色彩失衡等问题，从而实现人脸图像质量的有效提高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明实施例提供的一种人脸图像预处理方法的流程图；

图2为本发明实施例提供的一种人脸图像预处理方法中强化学习模型的训练及测试示意图；

图3为本发明实施例提供的一种人脸图像预处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，其示出了本发明实施例提供的一种人脸图像预处理方法的流程图，可以包括：

S11：确定当前需要进行预处理的人脸图像为目标图像。

本发明实施例提供的一种人脸图像预处理方法的执行主体可以为对应的人脸图像预处理装置、设备等。人脸识别是深度学习领域的一个重要分支，它通过神经网络提取人脸图像的特征来进行身份验证，同一个人的人脸图像特征相似度高，不同人的图像特征相似度低；由于前端相机设备使用场景、相机型号参数等不同，人脸识别系统往往面临光线、对比度、色调等多种不确定因素的影响，为了减小这种影响，通常在人脸识别系统中会有数据预处理环节，对图像亮度、对比度、色调等进行校正，从而保证人脸识别系统鲁棒性。本申请实施例中对于需要进行预处理的任意人脸图像，均可以确定其为目标图像，进而对目标图像进行预处理。

S12：将目标图像输入至强化学习模型中，得到该强化学习模型输出的与各图像增强方法对应的图像增强参数；其中，强化学习模型为预先利用训练集训练得到的，训练集包括多个抓拍人脸图像及对应标准人脸图像。

其中，强化学习是深度学习的一个分支，它主要思想是智能体在与环境的交互中尝试不同策略得到不同奖励，根据奖励的多少训练智能体，从而让智能体在不同的环境中做出可产生最大期望奖励的决策。在人脸识别系统中，前端相机所处的环境可看作强化学习中的环境，不同的预处理方法(也即图像增强方法)和参数(图像增强参数)可看作不同决策，而人脸识别指标的提高和降低可以看作决策产生的奖励，通过训练得到一个良好的智能体，让其根据环境自动选择合适的预处理方法和参数，则可以解决复杂环境下图像预处理困难的问题，从而提高人脸识别系统的稳定性。基于此，本申请预先获取包括多个抓拍得到的人脸图像及每个抓拍人脸图像所对应的标准人脸图像的训练集(抓拍人脸图像及对应的标准人脸图像中包含相同的人脸)，其中，抓拍人脸图像包括在不同环境中抓拍所得人脸图像，而标准人脸图像则为在较好的环境下拍摄的能够顺利实现人脸图像识别的人脸图像；利用训练集对预先设置的强化学习模型进行训练，则可以得到能够根据输入的人脸图像自动生成合适的与各个预处理方法对应的参数的强化学习模型，具体来说，预处理方法可以包括对人脸图像的图像亮度、对比度及色调等进行校正，而参数则是在按照预处理方法对人脸图像进行预处理时所用的参数。

S13：利用相应的图像增强方法，按照强化学习模型输出的与目标图像对应的各图像增强参数，对目标图像进行图像增强处理。

在利用强化学习模型得到目标图像对应的各图像增强方法的图像增强参数后，则可以使用这些图像增强方法、按照相应的图像增强参数对目标图像进行图像增强处理，从而使得目标图像在后续进行人脸识别时能够达到较好的识别效果。

本申请在确定出需要进行预处理的人脸图像后，将人脸图像输入至预先训练得到的强化学习模型中，得到强化学习模型输出的各图像增强参数，即为按照相应图像增强方法对人脸图像进行图像增强处理时所需使用的参数，从而实现对人脸图像的图像增强处理，而强化学习模型则是基于抓拍人脸图像及对应标准人脸图像训练得到的；可见，本申请基于强化学习动态生成可以提高人脸图像的人脸识别指标的图像增强参数，利用该图像增强参数对人脸图像进行图像增强处理，也即利用强化学习解决人脸识别系统在使用过程中因光线和环境问题造成输入的人脸图像亮度、对比度及色彩失衡等问题，从而实现人脸图像质量的有效提高。

本发明实施例提供的一种人脸图像预处理方法，预先利用训练集训练得到强化学习模型，可以包括：

依次确定训练集中每个抓拍人脸图像为当前图像；

在确定出任一当前图像后，将当前图像输入至强化学习模型中，得到强化学习模型输出的各图像增强方法对应的图像增强参数，并利用相应的图像增强方法，按照强化学习模型输出的与当前图像对应的各图像增强参数，对当前图像进行图像增强处理；

确定当前图像进行图像增强处理后与对应标准人脸图像之间的相似度为第一相似度，当前图像进行图像增强处理前与对应标准人脸图像之间的相似度为第二相似度，以第一相似度及第二相似度的差值作为奖励，实现对强化学习模型的训练。

本申请实施例利用强化学习去自适应生成图像增强参数，在强化学习中，奖励直接影响强化学习模型的学习方向，对于图像预处理，增强后图像质量的好坏并不容易判断，因此无法直接用图像质量去作为奖励信号，考虑到在人脸识别系统中，通常会事先录入每人一张的标准照片(标准人脸图像)作为底库，在使用相机采集到的人脸图像的特征和底库对应照片的特征(人脸的特征是人脸识别系统的输出，输入是人脸图像，输出是特征向量，该特征向量是人脸图像在高维空间的表征，包含人脸图像的关键信息)计算相似度(人脸之间的相似度是两张人脸图像是否为同一人的一种表征，通常用人脸特征的欧式距离或者余弦距离来表示，欧式距离或者余弦距离越小，两张人脸为同一人的概率越大，相似度越高)来实现人脸识别，判断人脸图像中的人员身份，因此本发明利用进行图像增强处理前后相似度的变化来间接代表图像质量作为奖励，具体来说，先通过强化学习模型生成当前图像的图像增强参数，按照该图像增强参数对当前图像进行图像增强处理，用当前图像进行图像增强处理后与对应标注人脸图像相似度，以及图像进行图像增强处理前与对应标注人脸图像相似度的差值作为奖励来训练强化学习模型，从而让强化学习模型可以学习到有利于识别的图像增强参数。

本发明实施例提供的一种人脸图像预处理方法，将当前图像输入至强化学习模型中之前，还可以包括：

对当前图像进行降质处理；其中，降质处理包括但不限于随机改变当前图像的图像亮度、对比度及色调。

需要进行说明的是，预先利用训练集训练得到强化学习模型的过程中，在利用强化学习模型对当前图像进行图像增强处理之前还可以对当前图像进行一系列的降质处理(包括随机改变图像亮度、对比度、色调等)，从而通过这种方式模拟不同的光线及环境下采集的人脸图像，能够使得强化学习模型充分学习到不同光线及环境下采集的人脸图像的图像增强参数，进而保证利用强化学习模型实现图像增强处理的有效性。需要指出的是，本申请对需要输入至强化学习模型中的当前图像进行降质处理，是在强化学习模型的训练过程中需要实现的，而在利用强化学习模型获取目标图像的图像增强参数时，由于无需利用目标图像模拟不同光线及环境下采集的人脸图像，因此无需对目标图像进行降质处理。

本发明实施例提供的一种人脸图像预处理方法，强化学习模型可以采用DDPG算法实现。

本申请实施例中的强化学习模型可以采用经典的DDPG算法实现，具体来说，它由动作网络及价值网络构成，动作网络包括动作当前网络及动作目标网络，价值网络包括价值当前网络及价值目标网络，动作网络的输入为一幅人脸图像，经过其中的卷积神经网络，输出为n维动作向量，n表示规定的图像增强方法的种类；价值网络输入为一幅人脸图像和动作向量，经过其中的卷积神经网络最终输出为一个数字，表示当前输入下可产生的最大奖励，它的主要思想是让价值网络学会预测当前动作和环境所能产生的最大奖励，让动作网络学会在当前环境下如何让奖励最大化。由于DDPG算法具有较优的强化学习能力，因此本申请中采用DDPG算法实现强化学习模型，能够使得利用强化学习模型学习人脸图像的图像增强参数具有较优的效果。

其中，实现对强化学习模型的训练之前，还包括：

在DDPG算法所用损失函数的基础上添加额外的损失函数，以基于添加后得到的函数实现对强化学习模型的训练。

本发明在DDPG算法原loss(损失函数)基础上中添加额外的loss(损失函数)，该额外的loss是样本的softmax分类loss，加入该额外的loss可以约束增强让其不会影响图像的分类信息，从而提高稳定性。

本发明实施例提供的一种人脸图像预处理方法，利用训练集训练得到强化学习模型之后，还可以包括：

利用测试集对强化学习模型进行测试，如果测试所得精度达到精度阈值，则确定强化学习模型训练完成，否则，则利用训练集重新对强化学习模型进行训练，直到强化学习模型测试所得精度达到精度阈值、或者对强化学习模型进行测试的次数达到次数阈值为止；测试集包括多个抓拍人脸图像及对应标准人脸图像。

测试集中包含的人脸图像与训练集中包含的人脸图像并不相同，以保证测试的有效性；利用强化学习模型得到测试集中每个抓拍人脸图像的图像增强参数，利用该图像增强参数对相应的抓拍人脸图像进行图像增强处理，进而计算进行图像增强处理后的抓拍人脸图像与对应标准人脸图像的相似度，如果测试集中各抓拍人脸图像进行图像增强处理后与对应标准人脸图像的相似度，比进行图像增强处理前与对应标准人脸图像的相似度要高，或者两者之间的差值大于根据实际需要设定的一定阈值，则说明测试所得精度达到精度阈值，因此无需再对强化训练模型进行训练，否则，则需要继续利用训练集对强化学习模型进行训练，从而保证强化学习模型能够学习到较为精确的图像增强参数；另外，为了避免对由于其他原因导致无法训练得到测试精度达到精度阈值的强化学习模型，而过多次进行强化学习模型训练造成的资源浪费，对强化学习模型进行测试的次数达到根据实际需要设定的次数阈值时则停止对强化学习模型进行训练，如果此时强化学习模型的测试精度仍然无法达到精度阈值，则可以输出相应的提示信息。

本发明实施例提供的一种人脸图像预处理方法，对目标图像进行图像增强处理之后，还可以包括：

将进行图像增强处理之后的目标图像输出至人脸识别模型，得到人脸识别模型输出的目标图像的人脸识别结果。

在对人脸图像进行图像增强处理之后可以自动将人脸图像输入至人脸识别系统中的人脸识别模型，对人脸图像进行人脸识别，无需人工参与，增强了人脸识别的自动化。

在一种具体应用场景中，本申请得到强化训练模型的过程可以包括两个阶段，分别为训练阶段和测试阶段；如图2所示，具体可以如下：

一、训练阶段

本发明利用强化学习去自适应生成图像增强参数，考虑到在人脸识别系统中，通常会事先录入每人一张的标准人脸图像作为底库，再使用相机采集到的人脸图像和底库的标准人脸图像的特征计算余弦相似度，基于余弦相似度来实现人脸识别，本发明利用进行图像增强处理前后相似度的变化作为奖励，先对训练集中的抓拍人脸图像进行一系列降质处理(如随机改变图像亮度、对比度、色调等)，然后通过强化学习模型生成图像增强参数对降质处理后的抓拍人脸图像进行图像增强处理，用图像增强处理后抓拍人脸图像与对应标准人脸图像的相似度，以及降质处理后且图像增强处理前抓拍人脸图像与对应标准人脸图像的相似度的差值，将该差值作为奖励来训练强化学习模型，从而让强化学习模型可以学习到有利于人脸图像识别的图像增强参数。

具体的，强化学习方法可以采用经典的DDPG算法，算法步骤如下：

(1)准备训练集，训练集中包含每个人一张标准照(标准人脸图像)和若干张抓拍照(抓拍人脸图像)。

(2)随机初始化DDPG算法的价值网络Q(s,α|θ^Q)和动作网络μ(s|θ^μ)，其中，θ^Q和θ^μ分别是价值网络和动作网络的参数，α和s分别是图像增强参数和输入的人脸图像，网络Q的输入为当前图像s和动作网络的输出α，网络Q的输出为奖赏(与奖励的含义相同)r，网络μ的输入为当前图像s，输出为当前图像下图像增强参数α。

(3)初始化目标网络Q′和μ′通过θ^Q′←θ^Q和θ^μ′←θ^μ，初始化缓存空间R：

For episode＝1，M do

a)随机挑选多对标准照和抓拍照，对每张抓拍照I进行降质处理得到s₁。

For t＝1,T do(t表示当前对输入的人脸图像进行图像增强处理的次数，T表示在强化学习模型的训练过程中能够对一张人脸图像进行图像增强处理的最多的次数)

①利用动作网络生成动作α_t＝μ(s_t|θ^μ′)+N_t，其中，N_t为随机噪声。

②执行动作α_t，生成图像增强处理后图像s_t+1。

③用人脸识别模型提取s_t和s_t+1的特征f_t和f_t+1，分别与标准照计算相似度c_t和c_t+1，计算奖励r_t＝c_t+1-c_t。

④将(s_t,α_t,r_t,s_t+1)存到R中。

If R里样本(样本即为(s_t,α_t,r_t,s_t+1))个数>B

⑤从R中随机采样B个样本，让y_i＝r_i+γQ′(s_i+1,μ′(s_i+1|θ^μ′)|θ^Q′)，其中γ表示更新速度。

更新价值网络通过：

更新动作策略用通过：

其中，L_s为价值网络的loss(损失函数)，L_a为动作网络的loss(损失函数)，L_id是本发明在DDPG算法原loss基础上中添加的额外loss，它是样本的softmax分类loss，加入该loss可以约束增强让其不会影响图像的分类信息，从而提高稳定性，n为训练时样本分类数(在本申请中为标准人脸照片的个数，相同的标准人脸照片为同一个标准人脸照片)，x_i为第i个样本(抓拍人脸图像)的特征向量，x_j为第j个样本(抓拍人脸图像)的特征向量，W_i为x_i对应分类层(在本申请中为确认抓拍人脸照片对应的标准人脸照片的层)的权重矩阵，W_j为x_j对应分类层的权重矩阵，λ为权重。

⑥更新目标网络：

θ^Q′←τθ^Q+(1-τ)θ^Q′

θ^μ’←τθ^μ+(1-τ)θ^μ’

Else

继续循环

End for

其中，

用来控制当前网络更新目标网络的速度。

二、测试阶段

在测试阶段，相机采集到的人脸图像直接输入到动作网络μ，得到图像增强参数进行图像增强处理，图像增强处理后的人脸图像通过人脸识别系统后续流程即可得到人脸识别结果。

为验证本方法的有效性，本申请中做了以下对比试验；A组未经过自动增强，B组为本申请所用的增强方法包括改变图像亮度、对比度、色调。B组强化学习模型训练集包括2w人，平均每人8张照片(包括标准照)；A、B组训练人脸识别模型的数据集相同。测试集有1900张，包括各种场景，另包括5w张不在底库的照片。在1％误识情况下识别率如下。

因此，本申请可以提高暗场景、曝光过度等环境下人脸识别系统的识别率，并且稳定性高，更适合应用于人脸识别系统。

本发明实施例还提供了一种人脸图像预处理装置，如图3所示，具体可以包括：

确定模块11，用于：确定当前需要进行预处理的人脸图像为目标图像；

学习模块12，用于：将目标图像输入至强化学习模型中，得到该强化学习模型输出的与各图像增强方法对应的图像增强参数；其中，强化学习模型为预先利用训练集训练得到的，训练集包括多个抓拍人脸图像及对应标准人脸图像；

处理模块13，用于：利用相应的图像增强方法，按照强化学习模型输出的与目标图像对应的各图像增强参数，对目标图像进行图像增强处理。

本发明实施例提供的一种人脸图像预处理装置，还可以包括：

训练模块，用于：依次确定训练集中每个抓拍人脸图像为当前图像；在确定出任一当前图像后，将当前图像输入至强化学习模型中，得到强化学习模型输出的各图像增强方法对应的图像增强参数，并利用相应的图像增强方法，按照强化学习模型输出的与当前图像对应的各图像增强参数，对当前图像进行图像增强处理；确定当前图像进行图像增强处理后与对应标准人脸图像之间的相似度为第一相似度，当前图像进行图像增强处理前与对应标准人脸图像之间的相似度为第二相似度，以第一相似度及第二相似度的差值作为奖励，实现对强化学习模型的训练。

降质模块，用于：将当前图像输入至强化学习模型中之前，对当前图像进行降质处理。

本发明实施例提供的一种人脸图像预处理装置，强化学习模型采用DDPG算法实现。

本发明实施例提供的一种人脸图像预处理装置，，还可以包括：

添加模块，用于：实现对强化学习模型的训练之前在DDPG算法所用损失函数的基础上添加额外的损失函数，以基于添加后得到的函数实现对强化学习模型的训练。

测试模块，用于：利用训练集训练得到强化学习模型之后，利用测试集对强化学习模型进行测试，如果测试所得精度达到精度阈值，则确定强化学习模型训练完成，否则，则利用训练集重新对强化学习模型进行训练，直到强化学习模型测试所得精度达到精度阈值、或者对强化学习模型进行测试的次数达到次数阈值为止；测试集包括多个抓拍人脸图像及对应标准人脸图像。

人脸识别模块，用于：对目标图像进行图像增强处理之后，将进行图像增强处理之后的目标图像输出至人脸识别模型，得到人脸识别模型输出的目标图像的人脸识别结果。

本发明实施例还提供了一种人脸图像预处理设备，可以包括：

存储器，用于存储计算机程序；

处理器，用于执行计算机程序时实现如上任一项人脸图像预处理方法的步骤。

本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现如上任一项人脸图像预处理方法的步骤。

需要说明的是，本发明实施例提供的一种人脸图像预处理装置、设备及存储介质中相关部分的说明请参见本发明实施例提供的一种人脸图像预处理方法中对应部分的详细说明，在此不再赘述。另外本发明实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明，以免过多赘述。

对所公开的实施例的上述说明，使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种人脸图像预处理方法，其特征在于，包括：

确定当前需要进行预处理的人脸图像为目标图像；

2.根据权利要求1所述的方法，其特征在于，预先利用所述训练集训练得到所述强化学习模型，包括：

依次确定所述训练集中每个所述抓拍人脸图像为当前图像；

3.根据权利要求2所述的方法，其特征在于，将当前图像输入至所述强化学习模型中之前，还包括：

对当前图像进行降质处理。

4.根据权利要求3所述的方法，其特征在于，所述强化学习模型采用DDPG算法实现。

5.根据权利要求4所述的方法，其特征在于，实现对所述强化学习模型的训练之前，还包括：

6.根据权利要求5所述的方法，其特征在于，利用所述训练集训练得到所述强化学习模型之后，还包括：

7.根据权利要求6所述的方法，其特征在于，对所述目标图像进行图像增强处理之后，还包括：

8.一种人脸图像预处理装置，其特征在于，包括：

9.一种人脸图像预处理设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述计算机程序时实现如权利要求1至7任一项所述人脸图像预处理方法的步骤。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述人脸图像预处理方法的步骤。