CN106951825B - 一种人脸图像质量评估系统以及实现方法 - Google Patents

一种人脸图像质量评估系统以及实现方法 Download PDF

Info

Publication number
CN106951825B
CN106951825B CN201710076464.4A CN201710076464A CN106951825B CN 106951825 B CN106951825 B CN 106951825B CN 201710076464 A CN201710076464 A CN 201710076464A CN 106951825 B CN106951825 B CN 106951825B
Authority
CN
China
Prior art keywords
layer
attribute
neural network
classifier
convolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710076464.4A
Other languages
English (en)
Other versions
CN106951825A (zh
Inventor
于志鹏
白洪亮
董远
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SUZHOU FEISOU TECHNOLOGY Co.,Ltd.
Original Assignee
Suzhou Feisou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Feisou Technology Co ltd filed Critical Suzhou Feisou Technology Co ltd
Priority to CN201710076464.4A priority Critical patent/CN106951825B/zh
Publication of CN106951825A publication Critical patent/CN106951825A/zh
Application granted granted Critical
Publication of CN106951825B publication Critical patent/CN106951825B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种人脸图像质量评估系统以及实现方法,方法包括:训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,采用Boosting算法将所述多维特征训练得到预测评估分类器,在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值。本发明人脸图像质量评估方法,结合多种人脸属性,灵活组合,准确度高,速度快。

Description

一种人脸图像质量评估系统以及实现方法
技术领域
本发明涉及神经网络、图像处理领域,特别涉及一种人脸图像质量评估系统以及实现方法。
背景技术
人脸图像质量可以在不同的层次上进行评估,有低等级的质量评估,比如对图像全局特性如光照、对比度等的评估,也可以通过对人脸图像匹配分数分析评估。关于哪些因素或者哪种图像属性会引起质量问题现在还没有一个共识,对于质量评估算法,其最终目标是最大化跟匹配分数的相关性,因此,所有会影响匹配分数的应该都需要被考虑作为质量评估算法的输入。对人脸图像质量评估算法而言,输入是一幅人脸图像I,输出是相应的质量分数Q(I),质量分数可以是一个标量或者向量,例如,标量可以是最终的人脸质量分数Q(I),向量可以是由各个方面的质量分数组成.人脸图像质量分数必须能够对匹配时的性能有一定的预测性,匹配分数表征了两个人脸图像I1、I2之间的相似性,它可能可以通过两幅图像的质量Q(I1)和Q(I2)来表征MS=P(I1,I2;q1,q2)。在现有技术中进行人脸图像质量评估时的识别技术,一种方法是通过灰度直方图、图像色彩、边缘检测等传统方法进行判别,但缺点在于:模型复杂,速度较慢,容易被极端情况误导。
另一种方法:直接使用单个神经网络判别,但缺点在于:预测结果受数据集影响严重,难以适应真实情况。
发明内容
本发明要解决的技术问题是,提供具有灵活判断模式、较快判别速度和稳健准确识别精度的人脸图像质量评估系统。
解决上述技术问题,本发明提供了一种人脸图像质量评估方法,包括如下步骤:
训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,其中,所述人脸特征为人脸属性特征,人脸预测值为人脸属性预测值,
分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,
采用Boosting算法将所述多维特征训练得到预测评估分类器,
在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值。
更进一步,在所述多类预测器中使用的人脸属性类别包括:胡子、眉毛形状、发型、滤镜、、眼镜、帽子、性别、表情、年龄的9种人脸属性。
更进一步,所述神经网络按照如下方法部署:四层卷积层和两个全连接层,
第一层:首先将人脸图像调整到预置的大小,作为神经网络多类预测器的输入,
第二层:输入为第一层卷积,
第三层:输入为第二层卷积,
第四层:输入为第三层卷积,
第一个全连接层:输入为第四层卷积,经过全连接运算,输出为多维特征,
第二个全连接层:输入为多维特征输出,经过全连接运算,输出为属性预测值。
更进一步,所述神经网络包括如下的前馈过程:
图像经过上述相同的包含四层卷积层和两个全连接层的卷积神经网络结构获得特征图,通过不同的全连接操作,输出不同的属性特征,属性特征在通过全连接操作就可以输出预测的属性值:
Figure GDA0002385665000000021
其中,k表示神经网络的卷积算法,K表示层数为S的卷积,xf表示经过卷积算法处理后的图像特征图,I是输入的图像,φ表示神经网络算法的处理过程,通过第一层全连接层连接输出属性的属性特征x,第二层全连接层获得属性预测值y’:
Figure GDA0002385665000000022
Figure GDA0002385665000000023
其中,
Figure GDA0002385665000000024
表示第一层全连接的参数矩阵,
Figure GDA0002385665000000025
表示第二层全连接的参数矩阵,T表示转置,bx表示第一层全连接常量,by表示第二层全连接常量。
更进一步,所述神经网络还包括如下的后馈过程:
预测的属性值与实际的属性标签构造相关的代价函数:
Figure GDA0002385665000000031
其中,yi是真实属性标签,yi′是系统预测的人脸属性标签,n是一种属性的类别数,m是所有属性的个数,通过对上述参数进行更新参数进行更新,训练至模型收敛。
更进一步,分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征的具体步骤如下:
Figure GDA0002385665000000032
Figure GDA0002385665000000033
其中,X是各个属性的特征向量连接形成,xi表示神经网络提取的特征,Y’是属性的预测值连接形成,y’1表示输出的属性预测值,xboost作为Boosting算法的输入数据。
更进一步,所述预测评估分类器包括:Boosting训练过程,
7-1)训练得到单层树状分类器,
7-2)通过树状分类器的错误率,设定分类器的权重
Figure GDA0002385665000000034
其中,ε是分类器的错误率,再根据分类器的权重α对每个训练样本的权重D进行更新,
Figure GDA0002385665000000035
7-3)按照更新的权重继续训练新的单层分类器,直到分类错误率ε为0,或者继续训练直到训练所得的分类器的数目满足指定数目。
更进一步,所述预测评估分类器还包括:Boosting预测过程,
将各分类器的预测结果按照树状分类器的权值加权相加,获得一个最后的图像质量分数。
更进一步,方法还包括:通过一图像质量的测试集选定使用准确率最高的阈值,若超过阈值的判定为高质量,若低于阈值则判定为质量不过关。
基于上述本发明还提供了一种人脸图像质量评估系统,包括:多类预测单元、特征融合单元、Boosting单元,
所述多类预测单元,用以训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,
所述特征融合单元,用以分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,
所述Boosting单元,用以采用Boosting算法将所述多维特征训练得到预测评估分类器,
以及,在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值。
本发明的有益效果:
本发明中由于首先训练能够预测人脸性别,发型,模糊程度,姿势等属性的神经网络分类器即多类预测器。然后使用多类预测器对现有人脸质量的训练数据进行前馈预测,得到多类的输出特征与多类属性的预测结果,将输出的人脸特征和预测结果连接形成新的用于判断人脸质量的特征。再使用Boosting分类器对人脸质量的训练数据进行训练,获得人脸质量的预测评估分类器。采用本发明中的方法,相比与直接使用网络较差的训练效果,本发明的准确度更高。相比与难以适应多种情况传统图像处理方式,本发明鲁棒性更好。
本发明通过训练能够预测多种属性的神经网络多类分类器,首先11种人脸属性数据是具有确定标准和相应的标准数据库,易于训练。使用卷积神经网络能够充分将图像的属性特征学习出来,并且以特征的形式表现出来。
本发明通过将神经网络特征和多类分类器预测值相结合,由于图像特征是经过神经网络的提取出来,对图片具有一定表达意义的数组。图片属性预测值也是与质量相关的信息。将两者连接起来作为分类器的输入,能够提升性能。
本发明通过深度学习结合Boosting算法预测人脸质量,由于boosting在处理特征到属性预测具有较好的性能,通过多分类器的融合相比于简单的神经网络全连接层,具有更好的鲁棒性和准确率。
附图说明
图1是本发明一实施例中的方法流程示意图;
图2是本发明一实施例中的系统结构示意图;
图3是本发明中的多类预测器的示意图;
图4是本发明中通过Boosting算法输出人脸预测值的示意图。
具体实施方式
现在将参考一些示例实施例描述本公开的原理。可以理解,这些实施例仅出于说明并且帮助本领域的技术人员理解和实施例本公开的目的而描述,而非建议对本公开的范围的任何限制。在此描述的本公开的内容可以以下文描述的方式之外的各种方式实施。
如本文中所述,术语“包括”及其各种变体可以被理解为开放式术语,其意味着“包括但不限于”。术语“基于”可以被理解为“至少部分地基于”。术语“一个实施例”可以被理解为“至少一个实施例”。术语“另一实施例”可以被理解为“至少一个其它实施例”。
可以理解,在本申请中的所述特征具体是指:一组浮点数。
所述卷积神经网络是一种深度学习算法,卷积神经网络(Convolutional NeuralNetwork,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。它包括卷积层(alternating convolutional layer)和池层(pooling layer)。
所述Boosting是一种用来提高弱分类算法准确度的方法,Boosting算法是一种把若干个分类器整合为一个分类器的方法,在boosting算法产生之前,还出现过两种比较重要的将多个分类器整合为一个分类器的方法,即boostrapping方法和bagging方法。
所述Relu是神经网络的一种激活方式。
所述LRN是神经网络的一种归一化方式。
所述树状分类器是一种弱分类器。
图1是本发明一实施例中的方法流程示意图,本实施例中的一种人脸图像质量评估方法,包括如下步骤:
步骤S100训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,
步骤S101分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,
步骤S102采用Boosting算法将所述多维特征训练得到预测评估分类器,
步骤S103在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值。
在所述步骤S100中,本实施例通过训练能够预测多种属性的神经网络多类分类器,首先9种人脸属性数据是具有确定标准和相应的标准数据库,易于训练。使用卷积神经网络能够充分将图像的属性特征学习出来,并且以特征的形式表现出来。
在所述步骤S101中,本实施例通过将神经网络特征和多类分类器预测值相结合,由于图像特征是经过神经网络的提取出来,对图片具有一定表达意义的数组。图片属性预测值也是与质量相关的信息。将两者连接起来作为分类器的输入,能够提升性能。
在所述步骤S103中,本实施例通过深度学习结合Boosting算法预测人脸质量,由于boosting在处理特征到属性预测具有较好的性能,通过多分类器的融合相比于简单的神经网络全连接层,具有更好的鲁棒性和准确率。
作为本实施例中的优选,在所述多类预测器中使用的人脸属性类别包括:胡子、眉毛形状、发型、滤镜、眼镜、帽子、性别、表情、年龄的9种人脸属性。
在所述步骤S100中,通过训练神经网络构成的多类预测器,主要分为前馈过程和后馈更新模型两个部分。其中,使用的人脸属性类别包括:胡子、眉毛类型、发型、滤镜、眼镜、帽子、性别、表情、年龄共9种人脸属性。
前馈部分包括:首先将人脸图像调整到128*128的大小,作为神经网络多类预测器的输入,不同数据集图像Ii,经过相同的神经网络结构φ,获得特征图,通过不同的全连接操作,输出不同的属性特征,属性特征在通过全连接操作就可以输出预测的属性值。
后馈过程包括:通过梯度下降算法对系统的参数进行更新,训练至模型收敛之后就可以使用训练好的模型进行特征提取和属性预测。
在所述步骤S101中,主要包括了特征融合过程,使用多类预测器的前馈过程提取人脸质量数据集的人脸特征和人脸预测值。每种属性可以提供一个128维的属性特征xi和n维的属性预测值y’1,将他们各自级联头尾相互连接构成特征向量集合与预测值集合,再将这两个集合级联构成1419维的特征。
在所述步骤S102、步骤S103中采用Boosting算法通过不断的特征挖掘和分析能够有效的增强预测的准确度。计算量低,效果好,训练速度快,可以有效地针对有限的人脸图像质量数据进行学习。
Boosting也分训练和判决两个部分
训练部分:输入人脸质量的特征xboost。按照贪心算法训练单层的属性分类器,获得目前分类效果最好的维数和相关阈值。并且通过当前的分类准确度计算当前分类器的权重和并且增加判断错误训练样本的权值,减少判断正确样本的权重。使用更新之后的权重继续训练新的分类器。直到在错误率为0或者达到指定分类器
判决部分:采用分类器联合投票的方式,分类器的判决结果结合他自身的权重,最终给出图像的最终质量得分。
作为本实施例中的优选,所述神经网络按照如下方法部署:四层卷积层和两个全连接层,
第一层:首先将人脸图像调整到预置的大小,作为神经网络多类预测器的输入,
第二层:输入为第一层卷积,
第三层:输入为第二层卷积,
第四层:输入为第三层卷积,
第一个全连接层:输入为第四层卷积,经过全连接运算,输出为多维特征,
第二个全连接层:输入为多维特征输出,经过全连接运算,输出为属性预测值。
如图3所示,具体地,通过设计一个四层卷积接两个全连接层的的神经网络:
第一层:首先将人脸图像调整到128*128的大小,作为神经网络多类预测器的输入。滑动窗大小为5*5,滑动间隔为1的卷积,经过relu激活函数和采样窗为2*2,采样间隔为2,采样方式为最大值采样的下采样窗并将输出值进行归一化。
第二层:输入为第一层卷积,滑动窗大小为3*3,滑动间隔为1的卷积,经过relu激活函数和采样窗为2*2,采样间隔为2,采样方式为最大值采样的的下采样窗,并将输出值进行归一化。
第三层:输入为第二层卷积,滑动窗大小为3*3,滑动间隔为1的卷积,经过relu激活函数和采样窗为2*2,采样间隔为2,采样方式为最大值采样的的下采样窗,不做归一化输出
第四层:输入为第三层卷积,滑动窗大小为3*3,滑动间隔为1的卷积,经过relu激活函数和采样窗为2*2,采样间隔为2,采样方式为平均值采样的的下采样窗,不做归一化输出。
第一个全连接层:输入为第四层卷积,经过全连接运算,输出为128维特征。
第二个全连接层:输入为128维输出,经过全连接运算,输出为属性预测值。
作为本实施例中的优选,所述神经网络包括如下的前馈过程:
图像经过上述相同的卷积神经网络结构获得特征图,通过不同的全连接操作,输出不同的属性特征,属性特征在通过全连接操作就可以输出预测的属性值:
Figure GDA0002385665000000081
其中,k表示神经网络的卷积算法,K表示层数为S的卷积,xf表示经过卷积算法处理后的图像特征图,I是输入的图像,φ表示神经网络算法的处理过程,通过第一层全连接层连接输出属性的属性特征x,第二层全连接层获得属性预测值y’:
Figure GDA0002385665000000082
Figure GDA0002385665000000083
作为本实施例中的优选,所述神经网络还包括如下的后馈过程:
预测的属性值与实际的属性标签构造相关的代价函数:
Figure GDA0002385665000000084
其中,yi是真实属性标签,yi′是系统预测的人脸属性标签,n是一种属性的类别数,m是所有属性的个数,通过对上述参数进行更新,训练至模型收敛。
具体地,上述过程包括的前馈过程如下:
四层卷积神经网络结构简称φ,图像经过相同的卷积神经网络结构获得特征图,通过不同的全连接操作,输出不同的属性特征,属性特征在通过全连接操作就可以输出预测的属性值。神经网络的卷积算法不是本专利的发明和重点,将其用k表示,K表示层数为S的卷积,xf表示经过卷积算法处理后的图像特征图,I是输入的图像,φ表示神经网络算法的处理过程。
如公式表示:
Figure GDA0002385665000000085
通过第一层全连接层连接输出属性的属性特征x,第二层全连接层获得属性预测值y’:
Figure GDA0002385665000000086
Figure GDA0002385665000000087
其中,
Figure GDA0002385665000000088
表示第一层全连接的参数矩阵,
Figure GDA0002385665000000089
表示第二层全连接的参数矩阵,T表示转置,bx表示第一层全连接常量,by表示第二层全连接常量。
后馈过程:
在获得系统前馈的输出预测属性值之后,就可以构造系统代价函数,预测的属性值与实际的属性标签构造相关的代价函数:
Figure GDA00023856650000000810
其中yi是真实属性标签,yi′是系统预测的人脸属性标签,n是一种属性的类别数(如说性别属性的个数就是2,男女)。m是所有属性的个数。
通过梯度下降算法对系统的参数进行更新,训练至模型收敛之后就可以使用训练好的模型进行特征提取和属性预测。
作为本实施例中的优选,分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征的具体步骤如下:
Figure GDA0002385665000000091
Figure GDA0002385665000000092
其中,X是各个属性的特征向量连接形成,xi表示神经网络提取的特征,Y’是属性的预测值连接形成,y’1表示输出的属性预测值,xboost作为Boosting算法的输入数据。
具体地,上述特征融合过程为:
在训练好多类预测器后,应当提取人脸质量数据集的人脸特征和人脸预测值,也就是使用多类预测器的前馈过程。再将获取的特征和预测值做如下操作:
Figure GDA0002385665000000093
Figure GDA0002385665000000094
X:是各个属性的特征向量连接形成的,xi表示神经网络提取的特征,Y’:是属性的预测值连接形成,y’1表示输出的属性预测值,xboost作为Boosting算法的输入数据。
每种属性可以提供一个128维的属性特征xi和n维的属性预测值y’1,将他们各自级联头尾相互连接构成特征向量集合x与预测值集合y’,再将x与y’级联构成1419维的特征。
作为本实施例中的优选,所述预测评估分类器包括:Boosting训练过程,
7-1)训练得到单层树状分类器,
7-2)通过树状分类器的错误率,设定分类器的权重
Figure GDA0002385665000000095
其中,ε是分类器的错误率,再根据分类器的权重α对每个训练样本的权重D进行更新,
Figure GDA0002385665000000096
7-3)按照更新的权重继续训练新的单层分类器,直到分类错误率ε为0,或者训够指定数目的分类器。
作为本实施例中的优选,所述预测评估分类器还包括:Boosting预测过程,
将各分类器的预测结果按照树状分类器的权值加权相加,获得一个最后的图像质量分数。
作为本实施例中的优选,方法还包括:通过一图像质量的测试集选定使用准确率最高的阈值,若超过阈值的判定为高质量,若低于阈值则判定为质量不过关。
请参考图4,是Boosting人脸质量预测器的具体流程。
经过Boosting算法会输出人脸质量的预测值。
Boosting(训练过程):
训练100个弱分类器,采用单层树状弱分类器。
训练数据共有15299个样本,每个样本经过前一层神经网络输出1419维特征,每个训练样本的权重(D)为1/n.
第一步:首先选出1419维特征每一维特征的最大值max和最小值min,在每一维特征中,阈值从min每次增长(max-min)/100,一直增长到max。在这个过程中,选出对于训练数据分类效果最好的对应维度和阈值,从而可以获得一个针对其中某一维的单层树状分类器。
分类效果通过分类错误样本的权重相加大小判定,越小越好。
第二步:通过分类器的错误率,设定分类器的权重α,
Figure GDA0002385665000000101
其中ε是分类器的错误率,再根据分类器的权重α对每个训练样本的权重D进行更新,
Figure GDA0002385665000000111
分类样本如果被正确分类则减少权重,被错误分类则增加权值。
第三步:按照更新的权重继续训练新的单层分类器,直到分类错误率ε为0,或者训够指定数目的分类器
Boosting(预测过程):
预测过程将一张图片的1419维特征通过100个弱分类器,获得100个结果,再将100个结果按照分类器的权值加权相加。获得一个最后的图像质量分数。通过图片质量的测试集,选定使准确率最高的阈值,超过阈值的判定为高质量。低于阈值的就可以判定为质量不过关。在不同环境下可以灵活调整阈值请参考图2是本发明一实施例中的系统结构示意图,本实施例中的一种人脸图像质量评估系统,包括:多类预测单元1、特征融合单元2、Boosting单元3,
所述多类预测单元1,用以训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,本实施例中的多类预测单元1,通过训练能够预测多种属性的神经网络多类分类器,首先9种人脸属性数据是具有确定标准和相应的标准数据库,易于训练。使用卷积神经网络能够充分将图像的属性特征学习出来,并且以特征的形式表现出来。
所述特征融合单元2,用以分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,本实施例中的特征融合单元2,通过将神经网络特征和多类分类器预测值相结合,由于图像特征是经过神经网络的提取出来,对图片具有一定表达意义的数组。图片属性预测值也是与质量相关的信息。将两者连接起来作为分类器的输入,能够提升性能。
所述Boosting单元3,用以采用Boosting算法将所述多维特征训练得到预测评估分类器,以及,在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值。本实施例中的Boosting单元3,通过深度学习结合Boosting算法预测人脸质量,由于boosting在处理特征到属性预测具有较好的性能,通过多分类器的融合相比于简单的神经网络全连接层,具有更好的鲁棒性和准确率。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
总体而言,本公开的各种实施例可以以硬件或专用电路、软件、逻辑或其任意组合实施。一些方面可以以硬件实施,而其它一些方面可以以固件或软件实施,该固件或软件可以由控制器、微处理器或其它计算设备执行。虽然本公开的各种方面被示出和描述为框图、流程图或使用其它一些绘图表示,但是可以理解本文描述的框、设备、系统、技术或方法可以以非限制性的方式以硬件、软件、固件、专用电路或逻辑、通用硬件或控制器或其它计算设备或其一些组合实施。
此外,虽然操作以特定顺序描述,但是这不应被理解为要求这类操作以所示的顺序执行或是以顺序序列执行,或是要求所有所示的操作被执行以实现期望结果。在一些情形下,多任务或并行处理可以是有利的。类似地,虽然若干具体实现方式的细节在上面的讨论中被包含,但是这些不应被解释为对本公开的范围的任何限制,而是特征的描述仅是针对具体实施例。在分离的一些实施例中描述的某些特征也可以在单个实施例中组合地执行。相反对,在单个实施例中描述的各种特征也可以在多个实施例中分离地实施或是以任何合适的子组合的方式实施。

Claims (8)

1.一种人脸图像质量评估方法,其特征在于包括如下步骤:
训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,其中,所述人脸特征为人脸属性特征,人脸预测值为人脸属性预测值,
分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,
采用Boosting算法将所述多维特征训练得到预测评估分类器,
在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值;
所述神经网络按照如下方法部署:四层卷积层和两个全连接层,
第一层:首先将人脸图像调整到预置的大小,作为神经网络多类预测器的输入,
第二层:输入为第一层卷积,
第三层:输入为第二层卷积,
第四层:输入为第三层卷积,
第一个全连接层:输入为第四层卷积,经过全连接运算,输出为多维特征,
第二个全连接层:输入为多维特征输出,经过全连接运算,输出为属性预测值;
所述神经网络包括如下的前馈过程:
图像经过包含四层卷积层和两个全连接层的卷积神经网络结构获得特征图,通过不同的全连接操作,输出不同的属性特征,属性特征在通过全连接操作就可以输出预测的属性值:
Figure FDA0002986617980000011
其中,k表示神经网络的卷积算法,K表示层数为S的卷积,xf表示经过卷积算法处理后的图像特征图,I是输入的图像,φ表示神经网络算法的处理过程,通过第一层全连接层连接输出属性的属性特征x,第二层全连接层获得属性预测值y’:
Figure FDA0002986617980000012
Figure FDA0002986617980000013
其中,
Figure FDA0002986617980000014
表示第一层全连接的参数矩阵,
Figure FDA0002986617980000015
表示第二层全连接的参数矩阵,T表示转置,bx表示第一层全连接常量,by表示第二层全连接常量。
2.根据权利要求1所述的人脸图像质量评估方法,其特征在于,在所述多类预测器中使用的人脸属性类别包括:胡子、眉毛形状、发型、滤镜、眼镜、帽子、性别、表情、年龄的9种人脸属性。
3.根据权利要求1所述的人脸图像质量评估方法,其特征在于,所述神经网络还包括如下的后馈过程:
预测的属性值与实际的属性标签构造相关的代价函数:
Figure FDA0002986617980000021
其中,yi是真实属性标签,yi′是系统预测的人脸属性标签,n是一种属性的类别数,m是所有属性的个数,通过对上述参数m和n进行更新,训练至模型收敛。
4.根据权利要求1所述的人脸图像质量评估方法,其特征在于,分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征的具体步骤如下:
X={x1,x2...x11},Y’={y’1,y’2...y’11}
xboost={x1,x2...x11,y’1,y’2...y’11}={X,Y’}
其中,X是各个属性的特征向量连接形成,xi表示神经网络提取的特征,xi∈X,Y’是属性的预测值连接形成,y’i表示输出的属性预测值,y’i∈Y’,xboost作为Boosting算法的输入数据。
5.根据权利要求1所述的人脸图像质量评估方法,其特征在于,所述预测评估分类器包括:Boosting训练过程,
7-1)训练得到单层树状分类器,
7-2)通过树状分类器的错误率,设定分类器的权重
Figure FDA0002986617980000022
其中,ε是分类器的错误率,再根据分类器的权重α对每个训练样本的权重D进行更新,
Figure FDA0002986617980000023
7-3)按照更新的权重继续训练新的单层分类器,直到分类错误率ε为0,或者继续训练直到训练所得的分类器的数目满足指定数目。
6.根据权利要求5所述的人脸图像质量评估方法,其特征在于,所述预测评估分类器还包括:Boosting预测过程,
将各分类器的预测结果按照树状分类器的权值加权相加,获得一个最后的图像质量分数。
7.根据权利要求1所述的人脸图像质量评估方法,其特征在于,还包括:通过一图像质量的测试集选定使用准确率最高的阈值,若超过阈值的判定为高质量,若低于阈值则判定为质量不过关。
8.一种人脸图像质量评估系统,其特征在于,包括:多类预测单元、特征融合单元、Boosting单元,
所述多类预测单元,用以训练得到带有神经网络的多类预测器,使用所述多类预测器提取得到人脸特征和人脸预测值,
所述特征融合单元,用以分别将所述人脸特征和所述人脸预测值连接形成新的用于判断人脸图像质量的多维特征,
所述Boosting单元,用以采用Boosting算法将所述多维特征训练得到预测评估分类器,
以及,在所述预测评估分类器中采用分类器联合投票方式,得到图像质量预测值;
所述神经网络按照如下方法部署:四层卷积层和两个全连接层,
第一层:首先将人脸图像调整到预置的大小,作为神经网络多类预测器的输入,
第二层:输入为第一层卷积,
第三层:输入为第二层卷积,
第四层:输入为第三层卷积,
第一个全连接层:输入为第四层卷积,经过全连接运算,输出为多维特征,
第二个全连接层:输入为多维特征输出,经过全连接运算,输出为属性预测值;
所述神经网络包括如下的前馈过程:
图像经过包含四层卷积层和两个全连接层的卷积神经网络结构获得特征图,通过不同的全连接操作,输出不同的属性特征,属性特征在通过全连接操作就可以输出预测的属性值:
Figure FDA0002986617980000041
其中,k表示神经网络的卷积算法,K表示层数为S的卷积,xf表示经过卷积算法处理后的图像特征图,I是输入的图像,φ表示神经网络算法的处理过程,通过第一层全连接层连接输出属性的属性特征x,第二层全连接层获得属性预测值y’:
Figure FDA0002986617980000042
Figure FDA0002986617980000043
其中,
Figure FDA0002986617980000044
表示第一层全连接的参数矩阵,
Figure FDA0002986617980000045
表示第二层全连接的参数矩阵,T表示转置,bx表示第一层全连接常量,by表示第二层全连接常量。
CN201710076464.4A 2017-02-13 2017-02-13 一种人脸图像质量评估系统以及实现方法 Active CN106951825B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710076464.4A CN106951825B (zh) 2017-02-13 2017-02-13 一种人脸图像质量评估系统以及实现方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710076464.4A CN106951825B (zh) 2017-02-13 2017-02-13 一种人脸图像质量评估系统以及实现方法

Publications (2)

Publication Number Publication Date
CN106951825A CN106951825A (zh) 2017-07-14
CN106951825B true CN106951825B (zh) 2021-06-29

Family

ID=59465447

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710076464.4A Active CN106951825B (zh) 2017-02-13 2017-02-13 一种人脸图像质量评估系统以及实现方法

Country Status (1)

Country Link
CN (1) CN106951825B (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107609464B (zh) * 2017-07-24 2019-10-29 南京邮电大学 一种实时人脸快速检测方法
CN107704806A (zh) * 2017-09-01 2018-02-16 深圳市唯特视科技有限公司 一种基于深度卷积神经网络进行人脸图像质量预测的方法
CN107958257A (zh) * 2017-10-11 2018-04-24 华南理工大学 一种基于深度神经网络的中药材识别方法
CN107844766A (zh) * 2017-10-31 2018-03-27 北京小米移动软件有限公司 人脸图像模糊度的获取方法、装置和设备
CN108052862B (zh) * 2017-11-09 2019-12-06 北京达佳互联信息技术有限公司 年龄预估方法和装置
CN108171796A (zh) * 2017-12-25 2018-06-15 燕山大学 一种基于三维点云的巡检机器人视觉系统及控制方法
CN108269254B (zh) * 2018-01-17 2020-12-01 百度在线网络技术(北京)有限公司 图像质量评估方法和装置
CN108427963B (zh) * 2018-03-02 2020-10-30 浙江工业大学 一种基于深度学习的黑色素瘤皮肤病的分类识别方法
CN108389172B (zh) * 2018-03-21 2020-12-18 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN108537787B (zh) * 2018-03-30 2020-12-15 中国科学院半导体研究所 一种人脸图像的质量判定方法
CN108509959A (zh) * 2018-04-13 2018-09-07 广州优视网络科技有限公司 色情应用识别方法、装置、计算机可读存储介质和服务器
CN108960047B (zh) * 2018-05-22 2021-09-14 中国计量大学 基于深度二次树的视频监控中人脸去重方法
CN108958474A (zh) * 2018-05-29 2018-12-07 西北工业大学 一种基于误差权重的动作识别多传感信息融合方法
CN110688875B (zh) * 2018-07-05 2022-11-04 杭州海康威视数字技术股份有限公司 人脸质量评估网络训练方法、人脸质量评估方法及装置
CN109214298B (zh) * 2018-08-09 2021-06-08 盈盈(杭州)网络技术有限公司 一种基于深度卷积网络的亚洲女性颜值评分模型方法
CN112889061A (zh) * 2018-12-07 2021-06-01 北京比特大陆科技有限公司 人脸图像质量评估方法、装置、设备及存储介质
CN109886072B (zh) * 2018-12-25 2021-02-26 中国科学院自动化研究所 基于双向Ladder结构的人脸属性分类系统
CN109711358B (zh) * 2018-12-28 2020-09-04 北京远鉴信息技术有限公司 神经网络训练方法、人脸识别方法及系统和存储介质
CN109977754A (zh) * 2019-01-17 2019-07-05 公安部户政管理研究中心 一种户籍相片质量的检测方法及系统
CN110378235B (zh) * 2019-06-20 2024-05-28 平安科技(深圳)有限公司 一种模糊人脸图像识别方法、装置及终端设备
CN111445433B (zh) * 2019-10-14 2021-07-06 北京华宇信息技术有限公司 一种电子卷宗的空白页和模糊页的检测方法及装置
CN110866471A (zh) * 2019-10-31 2020-03-06 Oppo广东移动通信有限公司 人脸图像质量评价方法及装置、计算机可读介质、通信终端
CN111382693A (zh) * 2020-03-05 2020-07-07 北京迈格威科技有限公司 图像质量的确定方法、装置、电子设备和计算机可读介质
CN113158777A (zh) * 2021-03-08 2021-07-23 佳都新太科技股份有限公司 质量评分方法、质量评分模型的训练方法及相关装置
CN113343429B (zh) * 2021-05-17 2022-10-25 同济大学 一种工业加工过程中内胆附着力质量预测方法和系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106400A (zh) * 2013-02-06 2013-05-15 浙江宇视科技有限公司 一种人脸检测方法与装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4434236B2 (ja) * 2007-06-11 2010-03-17 ソニー株式会社 画像処理装置、画像表示装置、撮像装置、これらの処理方法およびプログラム
BR112013019907A2 (pt) * 2011-02-03 2016-10-11 Facebook Inc sistemas e métodos para associação de imagem a texto e texto a imagem
JP5320443B2 (ja) * 2011-07-19 2013-10-23 富士フイルム株式会社 高速判別装置および高速判別装置を高速化する方法、並びに高速判別装置プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106400A (zh) * 2013-02-06 2013-05-15 浙江宇视科技有限公司 一种人脸检测方法与装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
融合二级评价指标的人脸图像质量评价方法;邹国锋等;《山东大学学报》;20160430;第46卷(第2期);6-13 *

Also Published As

Publication number Publication date
CN106951825A (zh) 2017-07-14

Similar Documents

Publication Publication Date Title
CN106951825B (zh) 一种人脸图像质量评估系统以及实现方法
CN108647583B (zh) 一种基于多目标学习的人脸识别算法训练方法
US20190228268A1 (en) Method and system for cell image segmentation using multi-stage convolutional neural networks
CN111126482B (zh) 一种基于多分类器级联模型的遥感影像自动分类方法
CN110097060B (zh) 一种面向树干图像的开集识别方法
CN105631398A (zh) 识别对象的方法和设备以及训练识别器的方法和设备
Tscherepanow TopoART: A topology learning hierarchical ART network
CN112434732A (zh) 一种基于特征筛选的深度学习分类方法
Kaluri et al. An enhanced framework for sign gesture recognition using hidden Markov model and adaptive histogram technique.
CN110097096B (zh) 一种基于tf-idf矩阵和胶囊网络的文本分类方法
CN110880010A (zh) 基于卷积神经网络的视觉slam闭环检测算法
CN113111968A (zh) 图像识别模型训练方法、装置、电子设备和可读存储介质
KR20210067815A (ko) 사용자의 건강 상태를 측정하기 위한 방법 및 이를 위한 장치
CN116110089A (zh) 一种基于深度自适应度量学习的面部表情识别方法
CN109948662B (zh) 一种基于K-means和MMD的人脸图像深度聚类方法
KR102469679B1 (ko) 인공지능 기반의 맞춤형 음식 추천 방법 및 장치
Al Zorgani et al. Comparative study of image classification using machine learning algorithms
Tsiligkaridis Failure prediction by confidence estimation of uncertainty-aware Dirichlet networks
US11908053B2 (en) Method, non-transitory computer-readable storage medium, and apparatus for searching an image database
CN112307894A (zh) 一种社区监控场景下基于皱纹特征和姿态特征的行人年龄识别方法
CN111401440A (zh) 目标分类识别方法、装置、计算机设备及存储介质
CN113887509B (zh) 一种基于图像集合的快速多模态视频人脸识别方法
Masilamani et al. Art classification with pytorch using transfer learning
CN113837062A (zh) 一种分类方法、装置、存储介质及电子设备
CN112465054A (zh) 一种基于fcn的多变量时间序列数据分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210601

Address after: 215123 unit 2-b702, creative industry park, 328 Xinghu street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Applicant after: SUZHOU FEISOU TECHNOLOGY Co.,Ltd.

Address before: Floor 17, building 7, No.15 Xueyuan South Road, Haidian District, Beijing

Applicant before: BEIJING FEISOU TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant