CN106599883A - 一种基于cnn的多层次图像语义的人脸识别方法 - Google Patents
一种基于cnn的多层次图像语义的人脸识别方法 Download PDFInfo
- Publication number
- CN106599883A CN106599883A CN201710134068.2A CN201710134068A CN106599883A CN 106599883 A CN106599883 A CN 106599883A CN 201710134068 A CN201710134068 A CN 201710134068A CN 106599883 A CN106599883 A CN 106599883A
- Authority
- CN
- China
- Prior art keywords
- image
- feature
- cnn
- features
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于CNN的多层次图像语义的人脸识别方法,该方法在VGGNet基础上做了进一步优化,提出了一种新的网络结构,对多层特征进行跨层拼接,使得最终提取的图像特征具有多层次图像语义。同时在卷积神经网络的训练中,加入提取到的传统特征作为附加特征,使得CNN特征信息更加完备。然后通过对浅层卷积层进行结构优化,减少冗余计算,使得模型的计算量大幅度减少。最后使用改进的矩阵分解算法对卷积层进行加速,可以在1秒的时间内对网络进行加速,在加速比达到4倍的情况下不降低模型准确率。本发明实现的人脸比对算法具有高准确率高实时性的特点,与现有算法对比,具有更高的准确率,同时计算效率也更高。
Description
技术领域
本发明提供了一种基于CNN的多层次图像语义的人脸识别方法,涉及深度学习、计算机视觉技术领域。
背景技术
基于生物特征的身份识别技术已经被广泛应用到诸如门禁、视频安防监控、人机交互等场景中。我国生物识别技术市场规模增长迅速,预计将在2020年达到300亿左右的市场规模。常用的生物识别技术主要有:人脸、视网膜、指纹、步态等方式。在众多生物识别技术中,人脸识别技术具有非侵犯性,非接触式,易操作性等优势。而且,人脸图像数据的采集也相对容易,采集交互方式更友好,可直接采用摄像头进行捕获,这使得人脸识别应用场景更加广泛。但同时人脸识别又是一个复杂和困难的技术,其原因主要有:人脸具有多样的变化性,人的脸上分布着五十多块面部肌肉,这些肌肉的运动导致不同面部表情的出现,会造成人脸特征的显著改变;随着年龄的增长,皱纹的出现和面部肌肉的松弛使得人脸的结构和纹理都将发生改变;由于光照、视角、摄取角度不同,可能会造成图像的灰度畸变、角度旋转等,降低了图像质量,增大了识别难度。因此需要一种快速、简洁、高效的人脸识别算法。
常见的人脸识别方法主要有:基于几何特征的人脸识别方法、基于模板匹配的人脸识别方法、基于模型的人脸识别方法、基于深度学习的人脸识别方法。
基于几何特征的方法:这是人脸识别技术发展中,应用最早的方法。该方法通过提取人脸的几何特征,包括人脸部件的归一化的点间距离、比率以及人脸的一些特征点,如眼角、嘴角、鼻尖等部位所构成的二维拓扑结构进行识别的方法。所构造的几何特征既要清晰区分不同对象人脸的差异,又要对光照背景条件不敏感,常规的几何特征量很难满足这些要求。因此该方法识别效果不理想。
基于模板匹配的人脸识别方法:该方法主要是利用计算模板和图像灰度的自相关性来实现识别功能。模板匹配的关键点在于得到标准的人脸模板,所以模板的标准性以及图片中的有效干扰都会对检测结果造成不可忽略的影响,模板匹配的计算结果以及阈值选取的影响问题,也会使人脸识别效果大幅下降。
基于模型的人脸识别方法:该方法通过统计分析和匹配学习找出人脸和非人脸,以及不同人脸之间的联系。和模板匹配的方法相比,基于模型方法的模板是通过样本学习获得,而非人为设定。但是这种方法提取的特征大多是图像的局部低级特征,没有考虑图像的全局信息及高级语义,因此泛化能力比较差。
基于深度学习的人脸识别方法:该类方法使用大量的训练样本进行人脸特征的自动学习,能够提取到优秀的具有区分度的人脸特征。但是,也同样存在一些不足,例如:卷积神经网络能够提取到高层次的图像语义,但是往往也会忽略到一些局部的面部关键特征;由于网络模型复杂,计算量巨大,通常无法满足实时性的要求。
为了解决上述问题,本发明提供了一种基于CNN的多层次图像语义的人脸识别方法,该方法能够提取高层次的图像语义,准确高效快速的实现人脸识别任务。
发明内容
本发明要解决的技术问题是:克服了现有人脸识别方法中特征提取不充分、语义不丰富、鲁棒性不足、实时性差等问题。提供了一种基于CNN的多层次图像语义的人脸识别方法。
本发明采用的技术方案为:一种基于CNN的多层次图像语义的人脸识别方法,包括以下四个步骤:
步骤(1)、首先采用自适应中值滤波算法对输入图像进行去噪处理,然后截取检测到的人脸区域图像,再使用双线性插值算法对人脸图像进行归一化处理,提高人脸识别准确率,归一化后的图像尺寸为256*224。
步骤(2)、然后将步骤(1)归一化后的图像的每个通道都进行直方图均衡化操作,再把均衡化后的人脸图像切分成若干个区域,把每个区域对应的直方图向量拼接成一个大向量,与八采样点的LBP算子进行计算,得到图像的高维LBP特征。
步骤(3)、把提取到的LBP特征作为图像的附加特征,加入到卷积神经网络的训练中。设计网络结构时,保持conv4_3层的特征图尺寸,并将conv4_3与conv5_3层的特征图尺寸统一到与conv4_3相同的尺寸。在conv3_3层特征图中使用平均池化采样,对conv5_3层特征图中使用反卷积操作对特征图进行上采样。然后将conv3_3,conv4_3,conv5_3三层计算得到的特征进行拼接,再经过一层全连接层,将全连接层的输出作为最终的图像特征。
步骤(4)、两张人脸图像均经过步骤(3)后,得到两个1024维的特征向量,需要通过特征相似度计算去评判两张人脸的相似程度。利用自适应距离计算方法来计算两组特征的欧氏距离相似度。最后与先验的阈值进行比对,若结果高于阈值则判定为同一个人,否则不属于同一个人。
进一步地,步骤(1)中所述的自适应中值滤波器的好处在于,当图像中某个区域内噪声干扰程度很高的时候,使用较大的滤波窗口进行去噪,能够更加有效地消除噪声;当区域内噪声干扰小的时候,使用窗口小的滤波窗口进行去噪,能够保留更好的图像细节。
进一步地,步骤(2)中所述的LBP特征在计算时采用八采样点的LBP算子进行计算,那么LBP特征值的取值范围为0~255,对切分后每个区域的的每个特征值进行统计,可以得到一个包含256个二进制数的直方图,最后拼接每一个区域的直方图向量。
进一步地,步骤(3)中所述的跨层拼接是在VGGNet网络的基础上做的优化,在Conv5_3之前保持VGGNet原始结构,把conv3_3、conv4_3、conv5_3这三个卷积层拼接成一个新的卷积层,让特征能够包含多层语义信息,使得特征的信息完备性更强。最后在两个全连接层之后接一个Softmax作为分类器,对图像进行分类。
进一步地,步骤(4)中所述的自适应特征相似度是在欧式距离的基础上做出的改进,在计算时加入特征每个维度的重要性权重w,采用梯度下降法来计算欧式距离的特征权重w。
本发明的原理在于:
本发明提供了一种基于CNN的多层次图像语义的人脸识别方法,克服了现有人脸识别方法中特征提取不充分、语义不丰富、鲁棒性不足、实时性差等问题。本方法适用于多种场景下的人脸识别任务,具有准确率高,泛化能力强,实时性好的特点。本方法包含四个步骤:首先采用自适应中值滤波算法对输入图像进行去噪处理,然后截取检测到的人脸区域图像进行归一化处理,提高人脸识别准确率,归一化后的图像尺寸为256*224。最后将图像的每个通道都进行直方图均衡化操作。再把均衡化后的人脸图像切分成若干个区域,把每个区域对应的直方图向量拼接成一个大向量,与八采样点的LBP算子进行计算,得到图像的高维LBP特征。然后把提取到的LBP特征作为图像的附加特征,加入到卷积神经网络的训练中。将conv3_3,conv4_3,conv5_3三层计算得到的特征进行拼接,再经过一层全连接层,将全连接层的输出作为最终的图像特征向量。最后利用自适应距离计算方法来计算两组特征的欧氏距离相似度。与先验的阈值进行比对,若结果高于阈值则判定为同一个人,否则不属于同一个人。
本发明的内容主要包括以下四个方面:
人脸图像的预处理。实际应用中,由于检测对象存在运动情况、光照条件不稳定等因素,导致输入的人脸图像质量较差,给识别任务带来极大困难。因此,需要一种有效的方法来对图像进行预处理以提高算法预测的准确率。本方法在检测前首先通过自适应中值滤波器算法对输入图像进行去噪处理,更加有效地消除图像噪声同时保留原始人脸的图像细节。接着截取检测到的人脸区域图像进行归一化处理,调整到统一尺寸。再使用直方图均衡化来增加图像的局部对比度。
多层特征跨层拼接。目前常用的卷积神经网络通常都是采用卷积-下采样-卷积这样递进式的网络结构,随着网络层次的增加,提取到的特征所表示的图像语义会越来越复杂,然而也会使得一些在低层次网络结构中提取到的局部信息随着网络层次的增加而消失。为了避免这样的情况发生,以及保留更多层次语义的信息,本发明在设计网络结构时保留VGGNet Conv5_3层之前的原始结构,把conv3_3、conv4_3、conv5_3这三个卷积层拼接成一个新的卷积层,让特征能够包含多层语义信息,使得特征的信息完备性更强。最后在两个全连接层之后接一个Softmax作为分类器,对图像进行分类。。
融合传统特征与CNN特征。不同类别的特征之间可能存在信息冗余或者信息互斥,使得最终的融合特征优势不明显;而且不同类别的特征,特征值的值域范围差距很大,卷积神经网络的特征值往往在-1~1之间,而传统特征的值域可能在几百甚至几千,特征值差异过大也会造成特征相似度计算时候的困难。为了解决上述的问题,本发明首先对不同类别的特征值进行归一化操作,使其尽可能一致。所使用的方式是离差标准化,即对数据进行线性变换,使其值域能够映射到[-1,1]之间。然后在卷积神经网络的训练中,加入传统特征作为附加特征,再经过一层全连接层,将全连接的输出作为最终的融合特征。这样得到的特征能够充分利用局部信息与全局信息的优势,同时能够避免一些信息冗余以及互斥的情况。
基于矩阵分解的卷积层加速算法。卷积神经网络能够提取得到非常丰富、高层语义的图像特征,但是其训练却非常耗时,一个卷积神经网络有千万数量级的参数需要训练,大量的待训练的参数必然导致较长的训练时间;而且卷积神经网络通常拥有几十层的网络结构,在反向传播的过程中,梯度会随着网络层数的增加而递减(梯度弥散问题),这使得越深的网络模型,收敛速度越慢。卷积神经网络中卷积层通常有几百个卷积核,这就可能导致跨通道之间存在信息冗余,信息的冗余往往意味着利用的矩阵的秩会比较低。因此可以利用低秩滤波器对卷积层进行加速,本发明在Jaderberg方法的基础上进行改进,不仅大大提升网络结构加速的效率,可以在1秒的时间内对网络进行加速,并且不依赖于数据集。而且对于层数深的网络结构同样表现很好。
本发明与现有技术相比的优点在于:
1、本发明提出的多层特征跨层拼接方法,对不同卷积层采用不同的采样策略,首先保持conv4_3层的特征图尺寸,并将conv4_3与conv5_3层的特征图尺寸统一到与conv4_3相同的尺寸。在conv3_3层特征图中使用平均池化采样,对conv5_3层特征图中使用反卷积操作对特征图进行上采样。最后把conv3_3、conv4_3、conv5_3这三个卷积层拼接成一个新的卷积层,让特征能够包含多层语义信息,使得特征的信息完备性更强。同时使用一个分辨率的输入,即可得到多种分辨率的特征,大大减少计算量。
2、本发明提出的融合传统特征与CNN特征的训练方法,首先对不同类别的特征值进行归一化操作,使其尽可能一致。所使用的方式是离差标准化,即对数据进行线性变换,使其值域能够映射到[-1,1]之间。然后在卷积神经网络的训练中,就加入传统特征作为附加特征,再经过一层全连接层,将全连接的输出作为最终的融合特征。这样得到的特征能够充分利用局部信息与全局信息的优势,同时能够避免一些信息冗余以及互斥的情况。
3、本发明提出的基于矩阵分解的卷积层加速算法,利用了多个卷积核在空间维度以及跨通道之间存在的冗余信息。通过剔除这些信息冗余来减少计算操作,把卷积核近似为两个低秩的卷积核,即水平卷积核与垂直卷积核的叠加,以此来减少矩阵的计算量。
附图说明
图1为本发明的基于CNN的多层次图像语义的人脸识别方法流程图。
图2为图像归一化示意图。
图3为多层次特征跨层拼接示意图。
图4为减少层内冗余卷积滤波器示意图。
图5为融合传统特征与CNN特征示意图。
图6为基于矩阵分解的卷积层加速示意图。
具体实施方式
图1给出了本发明的总体处理流程,下面结合其他附图及具体实施方式进一步说明本发明。
本发明提供一种基于CNN的多层次图像语义的人脸识别方法,主要步骤介绍如下:
1、人脸图像预处理模块
实际应用中,由于检测对象存在运动情况、光照条件不稳定等因素,导致输入的人脸图像质量较差,给识别任务带来极大困难。因此人脸图像的预处理是非常重要的一个环节,关系着最终人脸识别算法的准确度,因而需要一种行之有效的方法对图像进行预处理。
1)、本方法首先通过自适应中值滤波算法对图像进行去噪,当图像中某个区域内噪声干扰程度很高的时候,使用较大的滤波窗口进行去噪,能够更加有效地消除噪声;当区域内噪声干扰小的时候,使用窗口小的滤波窗口进行去噪,能够保留更好的图像细节。
2)、如图2所示,使用人脸检测算法从输入图像中截取出人脸区域,经过人脸检测截取之后的图像,尺寸大小不一,而卷积神经网络的输入需要统一的图像尺寸,有必要将所有图像尺寸调整到统一的尺寸。因此,会涉及到图像的放大、缩小操作,本发明使用双线性插值算法进行图像尺寸的调整,经过图像归一化之后,不仅可以保留原始人脸图像的特征,同时使其结构和大小能够更加适合人脸识别的要求,能够有效提高人脸识别准确率。归一化后的人脸尺寸为256*224。
3)、得到归一化操作的人脸图像之后,再使用直方图均衡化操作,以此来增强图像的局部对比度,使图像对比度更加清晰。
2、多层特征跨层拼接的新的卷积神经网络结构
目前常用的卷积神经网络通常都是采用卷积-下采样-卷积这样递进式的网络结构,随着网络层次的增加,提取到的特征所表示的图像语义会越来越复杂,然而也会使得一些在低层次网络结构中提取到的局部信息随着网络层次的增加而消失。为了避免这样的情况发生,以及保留更多层次语义的信息,本发明提出了一种新的网络结构,对多层特征进行跨层拼接,使得最终提取的特征信息更加丰富。
1)、多层特征跨层拼接
本发明在VGGNet的基础上做了进一步的优化,Conv5_3之前保持VGGNet原始结构,把conv3_3、conv4_3、conv5_3这三个卷积层拼接成一个新的卷积层,让特征能够包含多层语义信息,使得特征的信息完备性更强。最后在两个全连接层之后接一个Softmax作为分类器,对图像进行分类。如图3所示,该网络使用的图像输入尺寸为224*224,将全图通过正常卷积层生成特征图,将conv3_3,conv4_3,conv5_3三层计算得到的特征图转换到统一尺度进行拼接。各个特征图的尺度不一致,越往后特征图的尺寸越小,因此需要对不同层采用不同的采样策略,保持conv4_3层的特征图尺寸,并将conv4_3与conv5_3层的特征图尺寸统一到与conv4_3相同的尺寸。在conv3_3层特征图中使用平均池化采样,对conv5_3层特征图中使用反卷积操作对特征图进行上采样。
2)、减少卷积层内冗余参数
如图4所示,原始卷积层有96个卷积核,卷积操作计算完成之后,会进行特征的归一化,然后再使用ReLU激活函数,作为下一个卷积层的输入。由于浅层的卷积层多通道之间存在冗余,卷积滤波器都是成对出现,因此可以只计算48个卷积核,并且直接将这48个卷积核的结果直接乘-1来进行取反操作,然后将这2个48个卷积结果进行拼接,得到与原始的96个卷积核计算得到尺寸相同的特征图,后续操作不变。通过对浅层卷积层进行结构优化,减少了冗余计算,使得网络模型的计算量大幅减少,实验表明,浅层的卷积层操作速度能够提升2倍。
3、融合传统特征与CNN特征
传统的特征融合方式,是在传统特征与卷积神经网络分别独立提取完之后,使用特征选择与特征变换方法进行融合。从效果上看,略有提升,但是提升得很少。主要是因为:
●不同类别的特征之间可能存在信息冗余或者信息互斥,使得最终的融合特征优势不明显;
●不同类别的特征,特征值的值域范围差距很大,卷积神经网络的特征值往往在-1~1之间,而传统特征的值域可能在几百甚至几千,特征值差异过大也会造成特征相似度计算时候的困难;
为了解决上述的问题,本文首先对不同类别的特征值进行归一化操作,使其尽可能一致。所使用的方式是离差标准化,即对数据进行线性变换,使其值域能够映射到[-1,1]之间,映射函数如下:
其中,x代表原始数据,x*是处理后的数据,min代表数据集中的最小值,max代表数据集中的最大值。
为了解决特征存在信息冗余以及信息互斥的问题,本文又提出了一种新的特征融合方式,如图5所示,在卷积神经网络的训练中,就加入传统特征作为附加特征,再经过一层全连接层,将全连接的输出作为最终的融合特征。这样得到的特征能够充分利用局部信息与全局信息的优势,同时能够避免一些信息冗余以及互斥的情况。
4、基于矩阵分解的卷积层加速算法
卷积神经网络中卷积层通常有几百个卷积核,这就可能导致跨通道之间存在信息冗余,信息的冗余往往意味着利用的矩阵的秩会比较低。因此可以利用低秩滤波器对卷积层进行加速,经典的方法是Jaderberg针对卷积神经网络的加速做的相应研究,它将卷积层的大矩阵拆分成两个小矩阵相乘,以此来减少矩阵的计算量。
在CNN中,卷积核是一个4维的张量W∈RN×d×d×C,其中C是特征图的输入通道数,N是相应的输出通道数,d是卷积核的大小,同样可以用一个3维的向量Wi∈Rd×d×C来表示第i个卷积核。令(x,y)为特征图中的坐标,Z∈RN×d×d×C为输入特征图,那么,输出的特征图F=(F1,...,FN)就可以定义如下了:
其中x′,y′是求和中的循环变量。现在要优化的目标就是找到最近似W的W′,同时需要保证高效率以及不牺牲太多的精度。本文提出下面的机制来进行W的近似,主要是利用了在空间维度以及跨通道之间存在的冗余信息。通过剔除这些信息冗余来减少计算操作,把卷积核近似为两个低秩的卷积核,即水平卷积核与垂直卷积核的叠加,如图6所示。
使用两个低秩的卷积核(水平、垂直卷积核)进行近似之后,W可以表示为W′,即:
其中,K是用来控制秩的参数,H∈RN×1×d×K是水平卷积核,V∈RK×1×d×C是垂直卷积核,T代表矩阵的转置。这两个卷积核都是可以通过训练进行学习得到的参数。将上式代入得到:
原始的卷积操作计算复杂度为O(d2NCXY),经过上述优化之后,复杂度得到降低,其中水平卷积核计算复杂度为:O(dKCXY),垂直卷积核计算复杂度为:O(dNKXY),总计算复杂度为:O(dK(N+C)XY)。可以通过K的大小调整加速比α:
本发明提出了两步优化策略进行水平卷积核H和垂直卷积核V参数的学习,从而得到近似于W的W′:
1)通过优化目标函数||W′-W||来学习原始卷积核W的近似卷积核W′;
2)通过对整个CNN网络的微调进一步减少精度的损失;
本发明提出的基于矩阵分解的卷积层加速算法,可以在1秒的时间内对网络进行加速,并且不依赖于数据集。同时,对于层数较深的网络结构同样表现很好。
本发明未详细阐述的技术内容属于本领域技术人员的公知技术。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
Claims (5)
1.一种基于CNN的多层次图像语义的人脸识别方法,其特征在于包括以下四个步骤:
步骤(1)、首先采用自适应中值滤波算法对输入图像进行去噪处理,然后截取检测到的人脸区域图像,再使用双线性插值算法对人脸图像进行归一化处理,提高人脸识别准确率,归一化后的图像尺寸为256*224;
步骤(2)、然后将步骤(1)归一化后的图像的每个通道都进行直方图均衡化操作,再把均衡化后的人脸图像切分成若干个区域,把每个区域对应的直方图向量拼接成一个大向量,与八采样点的LBP算子进行计算,得到图像的高维LBP特征;
步骤(3)、把提取到的LBP特征作为图像的附加特征,加入到卷积神经网络的训练中;设计网络结构时,保持conv4_3层的特征图尺寸,并将conv4_3与conv5_3层的特征图尺寸统一到与conv4_3相同的尺寸,在conv3_3层特征图中使用平均池化采样,对conv5_3层特征图中使用反卷积操作对特征图进行上采样,然后将conv3_3,conv4_3,conv5_3三层计算得到的特征进行拼接,再经过一层全连接层,将全连接层的输出作为最终的图像特征;
步骤(4)、两张人脸图像均经过步骤(3)后,得到两个1024维的特征向量,需要通过特征相似度计算去评判两张人脸的相似程度,利用自适应距离计算方法来计算两组特征的欧氏距离相似度,最后与先验的阈值进行比对,若结果高于阈值则判定为同一个人,否则不属于同一个人。
2.根据权利要求1所述的基于CNN的多层次图像语义的人脸识别方法,其特征在于:步骤(1)中所述的自适应中值滤波器的好处在于,当图像中某个区域内噪声干扰程度很高的时候,使用较大的滤波窗口进行去噪,能够更加有效地消除噪声;当区域内噪声干扰小的时候,使用窗口小的滤波窗口进行去噪,能够保留更好的图像细节。
3.根据权利要求1所述的基于CNN的多层次图像语义的人脸识别方法,其特征在于:步骤(2)中所述的LBP特征在计算时采用八采样点的LBP算子进行计算,那么LBP特征值的取值范围为0~255,对切分后每个区域的的每个特征值进行统计,可以得到一个包含256个二进制数的直方图,最后拼接每一个区域的直方图向量。
4.根据权利要求1所述的基于CNN的多层次图像语义的人脸识别方法,其特征在于:步骤(3)中所述的跨层拼接是在VGGNet网络的基础上做的优化,在Conv5_3之前保持VGGNet原始结构,把conv3_3、conv4_3、conv5_3这三个卷积层拼接成一个新的卷积层,让特征能够包含多层语义信息,使得特征的信息完备性更强,最后在两个全连接层之后接一个Softmax作为分类器,对图像进行分类。
5.根据权利要求1所述的基于CNN的多层次图像语义的人脸识别方法,其特征在于:步骤(4)中所述的自适应特征相似度是在欧式距离的基础上做出的改进,在计算时加入特征每个维度的重要性权重w,采用梯度下降法来计算欧式距离的特征权重w。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710134068.2A CN106599883B (zh) | 2017-03-08 | 2017-03-08 | 一种基于cnn的多层次图像语义的人脸识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710134068.2A CN106599883B (zh) | 2017-03-08 | 2017-03-08 | 一种基于cnn的多层次图像语义的人脸识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106599883A true CN106599883A (zh) | 2017-04-26 |
CN106599883B CN106599883B (zh) | 2020-03-17 |
Family
ID=58588155
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710134068.2A Active CN106599883B (zh) | 2017-03-08 | 2017-03-08 | 一种基于cnn的多层次图像语义的人脸识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106599883B (zh) |
Cited By (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145857A (zh) * | 2017-04-29 | 2017-09-08 | 深圳市深网视界科技有限公司 | 人脸属性识别方法、装置和模型建立方法 |
CN107506726A (zh) * | 2017-08-22 | 2017-12-22 | 武汉大学 | 基于二次型基元多层网络的sar图像分类方法 |
CN107578060A (zh) * | 2017-08-14 | 2018-01-12 | 电子科技大学 | 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 |
CN107657257A (zh) * | 2017-08-14 | 2018-02-02 | 中国矿业大学 | 一种基于多通道卷积神经网络的语义图像分割方法 |
CN107862378A (zh) * | 2017-12-06 | 2018-03-30 | 芯原微电子(上海)有限公司 | 基于多核的卷积神经网络加速方法及系统、存储介质及终端 |
CN107886117A (zh) * | 2017-10-30 | 2018-04-06 | 国家新闻出版广电总局广播科学研究院 | 基于多特征提取和多任务融合的目标检测算法 |
CN107895345A (zh) * | 2017-11-29 | 2018-04-10 | 浙江大华技术股份有限公司 | 一种提高人脸图像分辨率的方法和装置 |
CN107909093A (zh) * | 2017-10-27 | 2018-04-13 | 浙江大华技术股份有限公司 | 一种物品检测的方法及设备 |
CN107977609A (zh) * | 2017-11-20 | 2018-05-01 | 华南理工大学 | 一种基于cnn的指静脉身份验证方法 |
CN108090433A (zh) * | 2017-12-12 | 2018-05-29 | 厦门集微科技有限公司 | 人脸识别方法及装置、存储介质、处理器 |
CN108629789A (zh) * | 2018-05-14 | 2018-10-09 | 华南理工大学 | 一种基于VggNet的显著目标检测方法 |
CN108764459A (zh) * | 2018-05-16 | 2018-11-06 | 西安电子科技大学 | 基于语义定义的目标识别网络设计方法 |
CN108898160A (zh) * | 2018-06-01 | 2018-11-27 | 中国人民解放军战略支援部队信息工程大学 | 基于cnn和影像组学特征融合的乳腺癌组织病理学分级方法 |
CN109508654A (zh) * | 2018-10-26 | 2019-03-22 | 中国地质大学(武汉) | 融合多任务和多尺度卷积神经网络的人脸分析方法及系统 |
CN109583357A (zh) * | 2018-11-23 | 2019-04-05 | 厦门大学 | 一种改进lbp和轻量卷积神经网络级联的人脸识别方法 |
CN109754006A (zh) * | 2018-12-26 | 2019-05-14 | 清华大学 | 一种视图及点云融合的立体视觉内容分类方法与系统 |
WO2019091443A1 (zh) * | 2017-11-13 | 2019-05-16 | 杭州海康威视数字技术股份有限公司 | 一种基于神经网络的调整方法、装置及设备 |
CN109784415A (zh) * | 2019-01-25 | 2019-05-21 | 北京地平线机器人技术研发有限公司 | 图像识别方法及装置、训练卷积神经网络的方法及装置 |
WO2019100436A1 (en) * | 2017-11-22 | 2019-05-31 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for face recognition |
CN109902581A (zh) * | 2019-01-28 | 2019-06-18 | 重庆邮电大学 | 一种基于多步加权的单样本部分遮挡人脸识别方法 |
JP2019125340A (ja) * | 2018-01-15 | 2019-07-25 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | 時空間画像の変化を自動推論するためのシステムおよび方法 |
CN110163042A (zh) * | 2018-04-13 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 图像识别方法及装置 |
CN110472732A (zh) * | 2019-08-19 | 2019-11-19 | 杭州凝眸智能科技有限公司 | 优化特征提取方法及其神经网络结构 |
CN110731096A (zh) * | 2017-11-15 | 2020-01-24 | 华为技术有限公司 | 使用深度神经网络预测电信网络中的接收信号强度 |
CN110880032A (zh) * | 2018-09-06 | 2020-03-13 | 黑芝麻智能科技(上海)有限公司 | 使用自适应3d阵列的卷积神经网络 |
CN110991161A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 相似文本确定方法、神经网络模型获得方法及相关装置 |
CN111033520A (zh) * | 2017-08-21 | 2020-04-17 | 诺基亚技术有限公司 | 用于模式识别的方法、系统及装置 |
CN111079643A (zh) * | 2019-12-13 | 2020-04-28 | 三一重工股份有限公司 | 基于神经网络的人脸检测方法、装置和电子设备 |
CN111241309A (zh) * | 2020-01-07 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 多媒体资源搜索方法、装置及存储介质 |
CN111353515A (zh) * | 2018-12-21 | 2020-06-30 | 湖南工业大学 | 一种基于多尺度分级的列车轮对踏面损伤分类识别方法 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
WO2021008023A1 (zh) * | 2019-07-18 | 2021-01-21 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN112446267A (zh) * | 2019-09-04 | 2021-03-05 | 北京君正集成电路股份有限公司 | 一种适合前端的人脸识别网络的设置方法 |
CN112949599A (zh) * | 2021-04-07 | 2021-06-11 | 广州弘晟计算机系统有限公司 | 基于大数据的候选内容推送方法 |
CN113011332A (zh) * | 2021-03-19 | 2021-06-22 | 中国科学技术大学 | 基于多区域注意力机制的人脸伪造检测方法 |
US20220253708A1 (en) * | 2021-02-11 | 2022-08-11 | GE Precision Healthcare LLC | Deep neural network compression based on filter importance |
US11763159B2 (en) | 2018-01-29 | 2023-09-19 | International Business Machines Corporation | Mitigating false recognition of altered inputs in convolutional neural networks |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426827A (zh) * | 2015-11-09 | 2016-03-23 | 北京市商汤科技开发有限公司 | 活体验证方法、装置和系统 |
CN105512638A (zh) * | 2015-12-24 | 2016-04-20 | 黄江 | 一种基于融合特征的人脸检测与对齐方法 |
CN105550658A (zh) * | 2015-12-24 | 2016-05-04 | 蔡叶荷 | 一种基于高维lbp与卷积神经网络特征融合的人脸比对方法 |
CN105718868A (zh) * | 2016-01-18 | 2016-06-29 | 中国科学院计算技术研究所 | 一种针对多姿态人脸的人脸检测系统及方法 |
CN106339702A (zh) * | 2016-11-03 | 2017-01-18 | 北京星宇联合投资管理有限公司 | 一种基于多特征融合的人脸识别方法 |
-
2017
- 2017-03-08 CN CN201710134068.2A patent/CN106599883B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105426827A (zh) * | 2015-11-09 | 2016-03-23 | 北京市商汤科技开发有限公司 | 活体验证方法、装置和系统 |
CN105512638A (zh) * | 2015-12-24 | 2016-04-20 | 黄江 | 一种基于融合特征的人脸检测与对齐方法 |
CN105550658A (zh) * | 2015-12-24 | 2016-05-04 | 蔡叶荷 | 一种基于高维lbp与卷积神经网络特征融合的人脸比对方法 |
CN105718868A (zh) * | 2016-01-18 | 2016-06-29 | 中国科学院计算技术研究所 | 一种针对多姿态人脸的人脸检测系统及方法 |
CN106339702A (zh) * | 2016-11-03 | 2017-01-18 | 北京星宇联合投资管理有限公司 | 一种基于多特征融合的人脸识别方法 |
Non-Patent Citations (2)
Title |
---|
ZHENG ZHANG等: ""Multi-oriented Text Detection with Fully Convolutional Networks"", 《2016 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN(CVPR)》 * |
周毅: ""低分辨率人脸图像识别关键技术研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Cited By (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107145857A (zh) * | 2017-04-29 | 2017-09-08 | 深圳市深网视界科技有限公司 | 人脸属性识别方法、装置和模型建立方法 |
CN107145857B (zh) * | 2017-04-29 | 2021-05-04 | 深圳市深网视界科技有限公司 | 人脸属性识别方法、装置和模型建立方法 |
CN107578060A (zh) * | 2017-08-14 | 2018-01-12 | 电子科技大学 | 一种基于可判别区域的深度神经网络用于菜品图像分类的方法 |
CN107657257A (zh) * | 2017-08-14 | 2018-02-02 | 中国矿业大学 | 一种基于多通道卷积神经网络的语义图像分割方法 |
CN111033520A (zh) * | 2017-08-21 | 2020-04-17 | 诺基亚技术有限公司 | 用于模式识别的方法、系统及装置 |
CN111033520B (zh) * | 2017-08-21 | 2024-03-19 | 诺基亚技术有限公司 | 用于模式识别的方法、系统及装置 |
CN107506726A (zh) * | 2017-08-22 | 2017-12-22 | 武汉大学 | 基于二次型基元多层网络的sar图像分类方法 |
CN107506726B (zh) * | 2017-08-22 | 2019-09-10 | 武汉大学 | 基于二次型基元多层网络的sar图像分类方法 |
CN107909093A (zh) * | 2017-10-27 | 2018-04-13 | 浙江大华技术股份有限公司 | 一种物品检测的方法及设备 |
CN107886117A (zh) * | 2017-10-30 | 2018-04-06 | 国家新闻出版广电总局广播科学研究院 | 基于多特征提取和多任务融合的目标检测算法 |
WO2019091443A1 (zh) * | 2017-11-13 | 2019-05-16 | 杭州海康威视数字技术股份有限公司 | 一种基于神经网络的调整方法、装置及设备 |
CN110731096A (zh) * | 2017-11-15 | 2020-01-24 | 华为技术有限公司 | 使用深度神经网络预测电信网络中的接收信号强度 |
CN110731096B (zh) * | 2017-11-15 | 2021-06-01 | 华为技术有限公司 | 使用深度神经网络预测电信网络中的接收信号强度 |
CN107977609A (zh) * | 2017-11-20 | 2018-05-01 | 华南理工大学 | 一种基于cnn的指静脉身份验证方法 |
US11651229B2 (en) | 2017-11-22 | 2023-05-16 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for face recognition |
WO2019100436A1 (en) * | 2017-11-22 | 2019-05-31 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for face recognition |
CN107895345B (zh) * | 2017-11-29 | 2020-05-26 | 浙江大华技术股份有限公司 | 一种提高人脸图像分辨率的方法和装置 |
US11436702B2 (en) | 2017-11-29 | 2022-09-06 | Zhejiang Dahua Technology Co., Ltd. | Systems and methods for super-resolusion image reconstruction |
CN107895345A (zh) * | 2017-11-29 | 2018-04-10 | 浙江大华技术股份有限公司 | 一种提高人脸图像分辨率的方法和装置 |
CN107862378A (zh) * | 2017-12-06 | 2018-03-30 | 芯原微电子(上海)有限公司 | 基于多核的卷积神经网络加速方法及系统、存储介质及终端 |
CN107862378B (zh) * | 2017-12-06 | 2020-04-24 | 芯原微电子(上海)股份有限公司 | 基于多核的卷积神经网络加速方法及系统、存储介质及终端 |
CN108090433A (zh) * | 2017-12-12 | 2018-05-29 | 厦门集微科技有限公司 | 人脸识别方法及装置、存储介质、处理器 |
JP2019125340A (ja) * | 2018-01-15 | 2019-07-25 | タタ コンサルタンシー サービシズ リミテッドTATA Consultancy Services Limited | 時空間画像の変化を自動推論するためのシステムおよび方法 |
US11763159B2 (en) | 2018-01-29 | 2023-09-19 | International Business Machines Corporation | Mitigating false recognition of altered inputs in convolutional neural networks |
CN110163042A (zh) * | 2018-04-13 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 图像识别方法及装置 |
CN110163042B (zh) * | 2018-04-13 | 2023-05-30 | 腾讯科技(深圳)有限公司 | 图像识别方法及装置 |
CN108629789A (zh) * | 2018-05-14 | 2018-10-09 | 华南理工大学 | 一种基于VggNet的显著目标检测方法 |
CN108764459A (zh) * | 2018-05-16 | 2018-11-06 | 西安电子科技大学 | 基于语义定义的目标识别网络设计方法 |
CN108898160A (zh) * | 2018-06-01 | 2018-11-27 | 中国人民解放军战略支援部队信息工程大学 | 基于cnn和影像组学特征融合的乳腺癌组织病理学分级方法 |
CN108898160B (zh) * | 2018-06-01 | 2022-04-08 | 中国人民解放军战略支援部队信息工程大学 | 基于cnn和影像组学特征融合的乳腺癌组织病理学分级方法 |
CN110880032A (zh) * | 2018-09-06 | 2020-03-13 | 黑芝麻智能科技(上海)有限公司 | 使用自适应3d阵列的卷积神经网络 |
US11954573B2 (en) | 2018-09-06 | 2024-04-09 | Black Sesame Technologies Inc. | Convolutional neural network using adaptive 3D array |
CN110880032B (zh) * | 2018-09-06 | 2022-07-19 | 黑芝麻智能科技(上海)有限公司 | 使用自适应3d阵列的卷积神经网络 |
CN110991161A (zh) * | 2018-09-30 | 2020-04-10 | 北京国双科技有限公司 | 相似文本确定方法、神经网络模型获得方法及相关装置 |
CN109508654A (zh) * | 2018-10-26 | 2019-03-22 | 中国地质大学(武汉) | 融合多任务和多尺度卷积神经网络的人脸分析方法及系统 |
CN109583357A (zh) * | 2018-11-23 | 2019-04-05 | 厦门大学 | 一种改进lbp和轻量卷积神经网络级联的人脸识别方法 |
CN109583357B (zh) * | 2018-11-23 | 2022-07-08 | 厦门大学 | 一种改进lbp和轻量卷积神经网络级联的人脸识别方法 |
CN111353515A (zh) * | 2018-12-21 | 2020-06-30 | 湖南工业大学 | 一种基于多尺度分级的列车轮对踏面损伤分类识别方法 |
CN111353515B (zh) * | 2018-12-21 | 2024-01-26 | 湖南工业大学 | 一种基于多尺度分级的列车轮对踏面损伤分类识别方法 |
CN109754006A (zh) * | 2018-12-26 | 2019-05-14 | 清华大学 | 一种视图及点云融合的立体视觉内容分类方法与系统 |
CN109784415A (zh) * | 2019-01-25 | 2019-05-21 | 北京地平线机器人技术研发有限公司 | 图像识别方法及装置、训练卷积神经网络的方法及装置 |
CN109902581B (zh) * | 2019-01-28 | 2020-11-10 | 重庆邮电大学 | 一种基于多步加权的单样本部分遮挡人脸识别方法 |
CN109902581A (zh) * | 2019-01-28 | 2019-06-18 | 重庆邮电大学 | 一种基于多步加权的单样本部分遮挡人脸识别方法 |
WO2021008023A1 (zh) * | 2019-07-18 | 2021-01-21 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
US11481574B2 (en) | 2019-07-18 | 2022-10-25 | Beijing Sensetime Technology Development Co., Ltd. | Image processing method and device, and storage medium |
CN110472732A (zh) * | 2019-08-19 | 2019-11-19 | 杭州凝眸智能科技有限公司 | 优化特征提取方法及其神经网络结构 |
CN112446267B (zh) * | 2019-09-04 | 2023-05-05 | 北京君正集成电路股份有限公司 | 一种适合前端的人脸识别网络的设置方法 |
CN112446267A (zh) * | 2019-09-04 | 2021-03-05 | 北京君正集成电路股份有限公司 | 一种适合前端的人脸识别网络的设置方法 |
CN111079643A (zh) * | 2019-12-13 | 2020-04-28 | 三一重工股份有限公司 | 基于神经网络的人脸检测方法、装置和电子设备 |
CN111079643B (zh) * | 2019-12-13 | 2023-04-07 | 三一重工股份有限公司 | 基于神经网络的人脸检测方法、装置和电子设备 |
CN111241309A (zh) * | 2020-01-07 | 2020-06-05 | 腾讯科技(深圳)有限公司 | 多媒体资源搜索方法、装置及存储介质 |
CN112069895A (zh) * | 2020-08-03 | 2020-12-11 | 广州杰赛科技股份有限公司 | 一种小目标的人脸识别方法及装置 |
US20220253708A1 (en) * | 2021-02-11 | 2022-08-11 | GE Precision Healthcare LLC | Deep neural network compression based on filter importance |
CN113011332A (zh) * | 2021-03-19 | 2021-06-22 | 中国科学技术大学 | 基于多区域注意力机制的人脸伪造检测方法 |
CN112949599A (zh) * | 2021-04-07 | 2021-06-11 | 广州弘晟计算机系统有限公司 | 基于大数据的候选内容推送方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106599883B (zh) | 2020-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106599883A (zh) | 一种基于cnn的多层次图像语义的人脸识别方法 | |
US10776470B2 (en) | Verifying identity based on facial dynamics | |
Thai et al. | Image classification using support vector machine and artificial neural network | |
KR20230021043A (ko) | 객체 인식 방법 및 장치, 및 인식기 학습 방법 및 장치 | |
CN109815867A (zh) | 一种人群密度估计和人流量统计方法 | |
CN108268859A (zh) | 一种基于深度学习的人脸表情识别方法 | |
CN107590432A (zh) | 一种基于循环三维卷积神经网络的手势识别方法 | |
CN110020681A (zh) | 基于空间注意力机制的点云特征提取方法 | |
CN112818862A (zh) | 基于多源线索与混合注意力的人脸篡改检测方法与系统 | |
CN106022343A (zh) | 一种基于傅里叶描述子和bp神经网络的服装款式识别方法 | |
CN104834941A (zh) | 基于计算机输入下的稀疏自编码的脱机手写体识别方法 | |
CN112232184B (zh) | 一种基于深度学习和空间转换网络的多角度人脸识别方法 | |
CN105095867A (zh) | 基于深度学习的快速动态人脸提取、识别方法 | |
KR20190126857A (ko) | 이미지에서 오브젝트 검출 및 표현 | |
Radha et al. | Neural network based face recognition using RBFN classifier | |
CN111931908A (zh) | 一种基于人脸轮廓的人脸图像自动生成方法 | |
Lakshmi et al. | Off-line signature verification using Neural Networks | |
Saboo et al. | Dynamic hand gesture recognition using combination of two-level tracker and trajectory-guided features | |
CN111126155B (zh) | 一种基于语义约束生成对抗网络的行人再识别方法 | |
CN106611156A (zh) | 一种自适应深度空间特征的行人识别方法和系统 | |
Zhang et al. | Facial component-landmark detection with weakly-supervised lr-cnn | |
Ye et al. | Facial expression features extraction based on gabor wavelet transformation | |
Sakthimohan et al. | Detection and Recognition of Face Using Deep Learning | |
CN114492634A (zh) | 一种细粒度装备图片分类识别方法及系统 | |
CN103942545A (zh) | 一种基于双向压缩数据空间维度缩减的人脸识别方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210813 Address after: 310052 room 1202, block a, No. 66, Yueming Road, Xixing street, Binjiang District, Hangzhou City, Zhejiang Province Patentee after: Ruishi netcloud (Hangzhou) Technology Co.,Ltd. Address before: 100083 College International Building, No. 1, Zhichun Road, Haidian District, Beijing Patentee before: Wang Huafeng |