CN109360197B

CN109360197B - 图像的处理方法、装置、电子设备及存储介质

Info

Publication number: CN109360197B
Application number: CN201811163073.7A
Authority: CN
Inventors: 杨帆; 张超
Original assignee: Beijing Dajia Internet Information Technology Co Ltd
Current assignee: Beijing Dajia Internet Information Technology Co Ltd
Priority date: 2018-09-30
Filing date: 2018-09-30
Publication date: 2021-07-09
Anticipated expiration: 2038-09-30
Also published as: CN109360197A

Abstract

本发明实施例提供了一种图像的处理方法、装置、电子设备及存储介质，该方案具体用于利用经过预先标注的训练样本集对搭建的深度回归模型进行训练，得到初始模型；利用随机梯度下降算法对初始模型进行优化处理，得到图像识别模型；当接收到待识别图像时，利用图像识别模型对待识别图像进行识别，得到待识别图像的图像质量得分；当图像质量得分高于或等于预设分数阈值时，判定该待识别图像为高质量图像，当图像质量得分低于预设分数阈值时，判定该待识别图像为低质量图像。这里所判定的图像质量高低是基于数据驱动的，属于客观的评价，能够使用户根据对图像质量的客观评价结果决定取舍，避免了利用低质量图像进行识别发生。

Description

图像的处理方法、装置、电子设备及存储介质

技术领域

本公开涉及身份认证技术领域，尤其涉及一种图像的处理方法、装置、电子设备及存储介质。

背景技术

随着深度学习技术的发展，人脸识别的准确率得到越来越高的提升，在很多场景中都应用到了人脸识别技术。但对质量较低的图像来说，人脸识别的准确度仍然不尽如人意，比如模糊、光照过强或过弱、大角度的人脸图像，有可能造成错误的识别结果，因此需要对图像的质量进行确定，以避免使用低质量的图像进行识别。

发明内容

为克服相关技术中存在的问题，本公开提供一种图像的处理方法、装置、电子设备及存储介质。

第一方面，提供了一种图像的处理方法，包括：

利用经过预先标注的训练样本集对搭建的深度回归模型进行训练，得到初始模型；

利用随机梯度下降算法对所述初始模型进行优化处理，得到图像识别模型；

当接收到待识别图像时，利用所述图像识别模型对所述待识别图像进行识别，得到所述待识别图像的图像质量得分；

当所述图像质量得分高于或等于预设分数阈值时，判定所述待识别图像为高质量图像，当所述图像质量得分低于所述预设分数阈值时，判定所述待识别图像为低质量图像。

可选的，还包括：

利用预先训练得到的特征提取器对第一图像样本集中的每个样本进行特征提取，得到每个样本的特征值；

根据所述特征值计算每个样本的质量系数；

构建所述训练样本集，所述训练样本集包括所述第一图像样本集中所有样本或部分样本，还包括与所述所有样本或所述部分样本中每个样本相对应的质量系数。

可选的，根据所述特征值计算每个样本的质量系数，包括：

基于每个样本的特征值，求取所有特征值的平均值；

计算每个样本的特征值与平均值的余弦距离，得到每个样本的质量系数。

可选的，还包括：

利用第二图像样本集对预设图像识别模型进行训练，得到所述特征提取器。

可选的，所述深度回归模型的输出层为L2损失函数。

可选的，所述随机梯度下降算法的学习率为0.05至0.5、动量为0.01至0.1、权值衰减为0.0001至0.001。

可选的，所述学习率为0.01，所述动量为0.09，所述权值衰减为0.0005。

第二方面，提供了一种图像的处理装置，包括：

第一训练模块，被配置为利用经过预先标注的训练样本集对搭建的深度回归模型进行训练，得到初始模型；

模型优化模块，被配置为利用随机梯度下降算法对所述初始模型进行优化处理，得到图像识别模型；

图像识别模块，被配置为当接收到待识别图像时，利用所述图像识别模型对所述待识别图像进行识别，得到所述待识别图像的图像质量得分；

质量判断模块，被配置为当所述图像质量得分高于或等于预设分数阈值时，判定所述待识别图像为高质量图像，当所述图像质量得分低于所述预设分数阈值时，判定所述待识别图像为低质量图像。

可选的，还包括：

特征提取模块，被配置为利用预先训练得到的特征提取器对第一图像样本集中的每个样本进行特征提取，得到每个样本的特征值；

质量系数计算模块，被配置为根据所述特征值计算每个样本的质量系数；

样本集构建模块，被配置为构建所述训练样本集，所述训练样本集包括所述第一图像样本集中所有样本或部分样本，还包括与所述所有样本或所述部分样本中每个样本相对应的质量系数。

可选的，根据质量系数计算模块包括：

第一计算单元，被配置为基于每个样本的特征值，求取所有特征值的平均值；

第二计算单元，被配置为计算每个样本的特征值与平均值的余弦距离，得到每个样本的质量系数。

可选的，还包括：

第二训练模块，被配置为利用第二图像样本集对预设图像识别模型进行训练，得到所述特征提取器。

可选的，所述深度回归模型的输出层为L2损失函数。

第三方面，提供了一种计算机程序产品，该产品用于执行第一方面描述的图像的处理方法处理。

第四方面，提供了一种电子设备，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行第一方面描述的图像的处理方法。

第五方面，提供了一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种图像的处理方法，所述方法包括如第一方面描述的图像的处理方法。

本公开的实施例提供的技术方案可以包括以下有益效果：通过利用经过预先标注的训练样本集对搭建的深度回归模型进行训练，得到初始模型；利用随机梯度下降算法对初始模型进行优化处理，得到图像识别模型；当接收到待识别图像时，利用图像识别模型对待识别图像进行识别，得到待识别图像的图像质量得分；当图像质量得分高于或等于预设分数阈值时，判定该待识别图像为高质量图像，当图像质量得分低于预设分数阈值时，判定该待识别图像为低质量图像。这里所判定的图像质量高低是基于数据驱动的，属于客观的评价，能够使用户根据对图像质量的客观评价结果决定取舍，避免利用低质量图像进行识别。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种图像的处理方法的流程图；

图2是根据一示例性实施例示出的另一种图像的处理方法的流程图；

图3是根据一示例性实施例示出的又一种图像的处理方法的流程图；

图4是根据一示例性实施例示出的一种图像的处理装置的框图；

图5是根据一示例性实施例示出的另一种图像的处理装置的框图；

图6是根据一示例性实施例示出的又一种图像的处理装置的框图；

图7是根据一示例性实施例示出的一种电子设备的框图；

图8是根据一示例性实施例示出的另一种电子设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种图像的处理方法的流程图。

如图1所示，本实施例提供的图像的处理方法应用于图像处理系统中，该图像根据图像处理系统的特点而定，例如对于认证系统来说该图像为人脸图像、指纹图像或视网膜图像，该处理方法具体包括以下步骤。

S11：利用训练样本集对深度回归模型进行训练。

该训练样本集为提取对相应的图像样本集中的样本进行标注所得，当图像为人脸图像时，该训练样本集中包括有数十万张人脸图像，对于每一张人脸图像均标记有相应的质量系数。在取得训练样本集后，通过搭建的深度回归模型进行训练，从而得到相应的初始模型。

其中该深度回归模型优选vgg模型，并将最后一层的交叉熵损失函数替换为L2损失函数。

S12：利用随机梯度下降算法对初始模型进行优化。

在得到初始函数后，利用随机梯度下降算法对该初始模型进行优化，得到最终的图像识别模型，该图像识别模型用于识别输入的图像、如人脸图像的得分，该得分反映人脸图像的质量。

该随机梯度算法中的学习率为0.05至0.5、动量为0.01至0.1、权值衰减为50.0001至0.001，在具体实施时，可以选学习率为0.01、动量为0.09、权值衰减为0.0005。

S13：对接收到的待识别图像进行识别。

在得到上述最终的图像识别模型后，当接收到输入的待识别图像，例如一个人脸图像后，利用该图像识别模型对该人脸图像进行识别，得到该待识别图像的图像质量得分，该得分反映对该人脸图像进行识别的识别结果的置信度。

S14：根据图像质量得分对待识别图像进行判定。

当对于的待识别图像进行识别后，如果该待识别图像的图像质量得分高于或等于一个预设的分数阈值，则判定该待识别图像为高质量图像；反之，如果其图像质量得分低于该分数阈值，则判定该待识别图像为低质量图像。

低质量图像意味着对其进行图像识别所得的识别结果的置信度偏低，相反，高质量图像意味着对其进行图像识别所得识别结果的置信度较高，可以作为令人信服的识别结果。

上述的分数阈值作为判定待识别图像的质量高低的分界线，一般可以通过经验进行判定，并在实际应用中进行调整，以适应真实应用场景的需求。

从上述技术方案可以看出，本申请提供了一种图像的处理方法，该方法具体用于利用经过预先标注的训练样本集对搭建的深度回归模型进行训练，得到初始模型；利用随机梯度下降算法对初始模型进行优化处理，得到图像识别模型；当接收到待识别图像时，利用图像识别模型对待识别图像进行识别，得到待识别图像的图像质量得分；当图像质量得分高于或等于预设分数阈值时，判定该待识别图像为高质量图像，当图像质量得分低于预设分数阈值时，判定该待识别图像为低质量图像。这里所判定的图像质量高低是基于数据驱动的，属于客观的评价，能够使用户根据对图像质量的客观评价结果决定取舍，避免利用低质量图像进行识别。

另外，本实施例中所应用的训练样本集中包括若干个样本和对每个样本的标记。为了得到该训练样本集，如图2所示，本实施例中还包括如下步骤：

S21：利用特征提取器对第一图像样本集中的每个样本进行特征提取。

这里的特征提取器为提前训练所得，并根据该特征提取器对预先获取的第一图像样本集中每个样本进行特征提取，得到每个样本的特征值。对于人脸图像来说，可以采用开源的webface，其中包含有1万多个FaceID，50万多张人脸图像。

对于全部的50万张人脸图像来说，我们选取部分人脸图像、如30万张人脸图像构成该第一图像样本集进行特征提取，即提取到30万个特征值。

S22：根据特征值计算每个样本的质量系数。

我们这里将每个样本的特征值与所有特征值的平均值的余弦距离作为该质量系数。具体的计算过程如下：

首先，计算所有样本的平均特征值，具体计算公式如下所示：

其中，feature_m为平均特征值，feature_i为其中编号为i的人脸图像的特征值，N为样本的总数，i指样本的序号。

然后，通过计算每一个样本的特征值与平均特征值的余弦距离来得到质量系数；

q_i＝cos＜feature_i,feature_m＞

其中q_i为第i个样本的质量系数。

S23：构建训练样本集。

这里的训练样本集中样本的数量与第一图像样本集的数量相同，即将第一图像样本集中每个样本加上其质量系数作为标记，从而得到标记过的训练样本集。

还有，为了得到上述特征提取器，如图3所示，本实施例中还包括如下步骤：

S33：利用第二图像样本集训练特征提取器。

为了训练该特征提取器，我们还准备了第二图像样本集，该第二图像样本集为前述webface中另一部分人脸图像，例如可选取50万张人脸图像中的另外20万张人脸图像。

然后将该20万张人脸图像输入到开源的vgg-face模型中进行训练，从而得到高特征提取器。

图4是根据一示例性实施例示出的一种图像的处理装置的框图。

如图4所示，本实施例提供的图像的处理装置应用于图像处理系统中，该图像根据图像处理系统的特点而定，例如对于认证系统来说该图像为人脸图像、指纹图像或视网膜图像，该处理装置具体包括第一训练模块10、模型优化模块20、图像识别模块30和质量判断模块40。

第一训练模块被配置为利用训练样本集对深度回归模型进行训练。

模型优化模块被配置为利用随机梯度下降算法对初始模型进行优化。

图像识别模块被配置为对接收到的待识别图像进行识别。

质量判断模块被配置为根据图像质量得分对待识别图像进行判定。

从上述技术方案可以看出，本申请提供了一种图像的处理装置，该装置具体用于利用经过预先标注的训练样本集对搭建的深度回归模型进行训练，得到初始模型；利用随机梯度下降算法对初始模型进行优化处理，得到图像识别模型；当接收到待识别图像时，利用图像识别模型对待识别图像进行识别，得到待识别图像的图像质量得分；当图像质量得分高于或等于预设分数阈值时，判定该待识别图像为高质量图像，当图像质量得分低于预设分数阈值时，判定该待识别图像为低质量图像。这里所判定的图像质量高低是基于数据驱动的，属于客观的评价，能够使用户根据对图像质量的客观评价结果决定取舍，避免利用低质量图像进行识别。

另外，本实施例中所应用的训练样本集中包括若干个样本和对每个样本的标记。为了得到该训练样本集，如图2所示，本实施例中的装置还包括特征提取模块50、质量系数计算模块60和样本构建模块70。

特征提取模块被配置为利用特征提取器对第一图像样本集中的每个样本进行特征提取。

质量系数计算模块被配置为根据特征值计算每个样本的质量系数。

我们这里将每个样本的特征值与所有特征值的平均值的余弦距离作为该质量系数。该模块具体包括第一计算单元和第二计算单元。

第一计算单元用于计算所有样本的平均特征值，具体计算公式如下所示：

第二计算单元用于通过计算每一个样本的特征值与平均特征值的余弦距离来得到质量系数；

q_i＝cos＜feature_i,feature_m＞

其中q_i为第i个样本的质量系数。

模型构建模块被配置为构建训练样本集。

还有，为了得到上述特征提取器，如图3所示，本实施例中装置还包括第二训练模块80。

第二训练模块被配置为利用第二图像样本集训练特征提取器。

本申请提供了一种计算机程序，该计算机程序具体包括如图1、图2或图3所示的图像的处理方法。

图7是根据一示例性实施例示出的一种电子设备的框图。例如，电子设备700可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等移动终端。

参照图7，移动终端700可以包括以下一个或多个组件：处理组件702，存储器704，电力组件706，多媒体组件708，音频组件710，输入/输出(I/O)的接口712，传感器组件714，以及通信组件716。

处理组件702通常控制电子设备700的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件702可以包括一个或多个模块，便于处理组件702和其他组件之间的交互。例如，处理组件702可以包括多媒体模块，以方便多媒体组件708和处理组件702之间的交互。

存储器704被配置为存储各种类型的数据以支持在电子设备700的操作。这些数据的示例包括用于在电子设备部700上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件706为电子设备700的各种组件提供电力。电源组件706可以包括电源管理系统，一个或多个电源，及其他与为电子设备700生成、管理和分配电力相关联的组件。

多媒体组件708包括在所述电子设备700和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件708包括一个前置摄像头和/或后置摄像头。当电子设备700处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件710被配置为输出和/或输入音频信号。例如，音频组件710包括一个麦克风(MIC)，当电子设备700处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中，音频组件710还包括一个扬声器，用于输出音频信号。

I/O接口712为处理组件702和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件714包括一个或多个传感器，用于为电子设备700提供各个方面的状态评估。例如，传感器组件714可以检测到电子设备700的打开/关闭状态，组件的相对定位，例如所述组件为电子设备700的显示器和小键盘，传感器组件714还可以检测电子设备700或电子设备700一个组件的位置改变，用户与电子设备700接触的存在或不存在，电子设备700方位或加速/减速和电子设备700的温度变化。传感器组件714可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件714还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件716被配置为便于电子设备700和其他设备之间有线或无线方式的通信。电子设备700可以接入基于通信标准的无线网络，如WiFi，运营商网络(如2G、3G、4G或5G)，或它们的组合。在一个示例性实施例中，通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件716还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行如图1、图2或图3所示的图像的处理方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器704，上述指令可由电子设备700的处理器720执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

图8是根据一示例性实施例示出的另一种电子设备的框图。

例如，该电子设备800可以被提供为一服务器。电子设备800包括处理组件822，其进一步包括一个或多个处理器，以及由存储器832所代表的存储器资源，用于存储可由处理组件822的执行的指令，例如应用程序。存储器832中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件822被配置为执行指令，以执行图1、图2或图3所示的处理通信的处理方法。

电子设备800还可以包括一个电源组件826被配置为执行电子设备800的电源管理，一个有线或无线网络接口1950被配置为将电子设备1900连接到网络，和一个输入输出(I/O)接口858。电子设备800可以操作基于存储在存储器832的操作系统，例如WindowsServerTM，Mac OS XTM，UnixTM,LinuxTM，FreeBSDTM或类似。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种图像的处理方法，其特征在于，包括：

利用训练样本集对搭建的深度回归模型进行训练，得到初始模型；其中，所述训练样本集预先标注有相应的质量系数；

当所述图像质量得分高于或等于预设分数阈值时，判定所述待识别图像为高质量图像，当所述图像质量得分低于所述预设分数阈值时，判定所述待识别图像为低质量图像；

其中，所述质量系数的确定包括：

基于每个样本的特征值，求取所有特征值的平均值；

2.如权利要求1所述的处理方法，其特征在于，还包括：

3.如权利要求2所述的处理方法，其特征在于，还包括：

4.如权利要求1至3中任一项所述的处理方法，其特征在于，所述深度回归模型的输出层为L2损失函数。

5.如权利要求4所述的处理方法，其特征在于，所述随机梯度下降算法的学习率为0.05至0.5、动量为0.01至0.1、权值衰减为0.0001至0.001。

6.如权利要求5所述的处理方法，其特征在于，所述学习率为0.01，所述动量为0.09，所述权值衰减为0.0005。

7.一种图像的处理装置，其特征在于，包括：

第一训练模块，被配置为利用训练样本集对搭建的深度回归模型进行训练，得到初始模型；其中，所述训练样本集预先标注有相应的质量系数；

质量判断模块，被配置为当所述图像质量得分高于或等于预设分数阈值时，判定所述待识别图像为高质量图像，当所述图像质量得分低于所述预设分数阈值时，判定所述待识别图像为低质量图像；

其中，所述质量系数的确定包括：利用预先训练得到的特征提取器对第一图像样本集中的每个样本进行特征提取，得到每个样本的特征值；

基于每个样本的特征值，求取所有特征值的平均值；

8.如权利要求7所述的处理装置，其特征在于，还包括：

9.如权利要求8所述的处理装置，其特征在于，还包括：

10.如权利要求7至9任一项所述的处理装置，其特征在于，所述深度回归模型的输出层为L2损失函数。

11.如权利要求7所述的处理装置，其特征在于，所述随机梯度下降算法的学习率为0.05至0.5、动量为0.01至0.1、权值衰减为0.0001至0.001。

12.如权利要求11所述的处理装置，其特征在于，所述学习率为0.01，所述动量为0.09，所述权值衰减为0.0005。

13.一种电子设备，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为执行如权利要求1至6任一项所述的处理图像的处理方法。

14.一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行一种图像的处理方法，所述方法包括如权利要求1至6任一项所述的图像的处理方法。