CN109034119A - 一种基于优化的全卷积神经网络的人脸检测方法 - Google Patents
一种基于优化的全卷积神经网络的人脸检测方法 Download PDFInfo
- Publication number
- CN109034119A CN109034119A CN201810980287.7A CN201810980287A CN109034119A CN 109034119 A CN109034119 A CN 109034119A CN 201810980287 A CN201810980287 A CN 201810980287A CN 109034119 A CN109034119 A CN 109034119A
- Authority
- CN
- China
- Prior art keywords
- net
- network layer
- face
- layer
- neural networks
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种基于优化的全卷积神经网络的人脸检测方法,通过对现有MTCNN模型中的全连接层全部替换为卷积层,并利用级联分解卷积运算代替原有的标准卷积运算,相较于现有MTCNN模型,本发明的运算速度大大提高;此外,通过迭代贪心压缩运算,对模型的参数进行有效的压缩,在保证精度的前提下,降低了参数的规模,减少了模型参数占用的存储空间,增大了模型的通用性和使用范围。
Description
技术领域
本发明涉及人脸识别技术领域,尤其是涉及一种基于优化的全卷积神经网络的人脸识别方法。
背景技术
人脸检测这一任务在计算机视觉相关的研究领域中是一个十分具有代表性的物体检测任务,历经几十年的发展,整体的检测效果也日趋成熟。以深度学习技术的出现为分界点,人脸检测算法可以大致分为基于传统机器学习方法的人脸检测算法和基于深度学习模型的人脸检测方法。基于传统机器学习方法的人脸检测算法在速度上已经可以满足大部分应用的实际要求,然而其检测精度还不能很好地满足工业界的需要,应用的场景和最终的分类效果也不够好。深度学习的出现,在一定程度上很好地弥补了上述传统机器学习方法中的缺陷。
MTCNN(多任务级联卷积网络)模型是目前在精度和速度上表现最好的深度模型之一,采用了级联网络的设计,同时配合了多任务学习的方式进行网络训练,由于采用多个小型网络的设计也使得整体的运算速度比较快,经过测试,目前算法在普通的个人计算机上运行,对一张大小为640*480的图片进行人脸检测,耗时约为90ms。
但在当下实际的应用中,对于人脸检测算法的需求越来越多的是来自于前端,包括嵌入式设备、移动手机等等,这就意味着算法的运行环境会更加苛刻,运算资源和存储资源也会更加有限。在这些实际的应用环境限制之下,目前深度学习的人脸检测方法都显得不太实用,需要更进一步的改进,主要的问题总结如下:
(1)深度模型的运算过程仍然显得有些复杂,在运算环境较差的前端上,算法的运算速度难以达到实时或可以满足应用需要的速度。因此,需要在不降低检测精度的同时,对已有的深度学习人脸检测算法进行速度上的优化;
(2)深度学习模型的参数较多,使得模型的参数文件需要占用较多的存储空间,这对于前端设备而言也会带来更高的应用门槛,从实用性的角度出发,需要对目前的深度模型进行参数压缩,降低模型带来的存储压力。
发明内容
为解决以上问题,本发明提出了一种基于优化的全卷积神经网络的人脸检测方法。
本发明的主要内容包括:
一种基于优化的全卷积神经网络的人脸检测方法,包括如下步骤:
S1.建立全卷积神经网络模型;
S2.准备训练数据;
S3.对所述全卷积神经网络模型进行训练;
S4.使用训练完成后的全卷积神经网络模型对待测图像进行人脸检测;
其中,所述全卷积神经网络模型为改进的MTCNN模型,所述全卷积神经网络模型包括P-Net网络层,R-Net改进网络层以及O-Net改进网络层;且所述P-Net网络层通过三层卷积层运算后得到人脸区域的候选窗口和边界框的回归向量;所述R-Net改进网络层是指将R-Net网络层中的全连接层替换为卷积层;所述O-Net改进网络层是指将O-Net网络层中的全连接层替换为卷积层;所述P-Net网络层,R-Net改进网络层以及O-Net改进网络层中各卷积层的卷积运算采用级联分解卷积运算,所述级联分解卷积运算包括逐通道卷积运算和逐点卷积运算。
优选的,所述级联分解卷积运算是指依次进行逐通道卷积和逐点卷积运算是指对各网络层的各卷积层进行平面和通道上的分解计算,依次进行卷积计算。
优选的,步骤3中具体包括如下步骤:
S31.利用步骤S2中准备的训练数据,对步骤S1建立的全卷积神经网络模型中P-Net网络层的参数依次进行迭代训练;
S32.利用迭代贪心压缩算法分别对步骤S31迭代训练完成的参数进行压缩修剪,得到实用的P-Net网络层;
S33.按照步骤S31,S32的训练方法,利用实用的P-Net网络层对后续的R-Net改进网络层和O-Net改进网络层进行级联训练,得到训练好的全卷积神经网络模型。
优选的,步骤S31的迭代训练采用TensorFlow框架,包括:
S311.确定全卷积神经网络模型的目标函数;
S312.使用反向传播和随机梯度下降的方式对模型参数进行迭代训练;
其中,所述全卷积神经网络模型的目标函数为:
ai为P-Net网络层,R-Net改进网络层以及O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测对应的权重值;Lossi为P-Net网络层,R-Net改进网络层以及O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测对应的损失函数;
Loss1为人脸分类预测的损失参数,可以表示为Loss1=-(log(p)+(1-X)(1-log(p)));
Loss2为人脸框的位置预测的损失函数,可以表示为:
Loss3为人脸关键点的位置预测的损失函数,可以表示为:其中,p表示P-Net网络层,R-Net改进网络层以及O-Net改进网络层的输出;X为训练样本的标注信息;1表示是人脸,0表示不是人脸;Y0为四维数值向量,表示各网络层对于人脸位置的实际预测值;Y为四维数值向量,表示训练样本对应的标注人脸位置信息;Z0为十维数值变量,表示各网络层对于人脸五个关键点位置的实际预测值;Z为十维数值变量,表示训练样本对应的标注人脸关键点信息。
优选的,所述P-Net网络层和R-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测的权重系数ai均分别为1.0,0.5,0.5;所述O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测的权重系数ai分别为0.5,1.0,1.0。
优选的,步骤S32中的迭代贪心压缩算法的流程如下:
S321.从单个网络层的第一个特征图开始压缩;
S322.通过置0的方式,得到当前卷积层的各各个特征图对应的测试精度损失;
S323.将精度损失最小的特征图对应的卷积核删除;
S324.对应修改当前卷积层的前后层的大小,并对该网络层进行重新训练至收敛;
S325.判断是否达到终止条件,若是则对本网络层的压缩结束;若否,则转到下一步;
S326.判断是否达到最后一个卷积层,若是,则重新开始步骤S322;若否,则将后一卷积层设置为当前层,转至S322。
优选的,步骤S325中的终止条件为:所述全卷积神经网络模型的精度损失达到设定的不可接受的阈值,或者压缩比例达到设定的期望值。
优选的,步骤S4包括如下具体步骤:
S41.构建图像金字塔;
S42.级联的人脸检测,将图像金字塔内的图片依次输入到训练后的全卷积神经网络模型中的P-Net网络层中,并汇总不同尺度图片对应的人脸候选框;
S43.将P-Net网络层的输出作为R-Net改进网络层的输入,得到优化后的人脸候选框;
S44.将R-Net改进网络层的输出作为O-Net改进网络层的输入,得到最终的人脸检测结果。
优选的,步骤S41的具体步骤包括:
S411.确定图像金字塔的基础缩放尺度,所述基础缩放尺度为M/12;其中M为图片中需要检测到的最小人脸大小M*M;
S412.构建图像尺度金字塔:将所述基础缩放尺度作为初始值,按照缩放后的图片的面积是前一层的1/2的迭代策略,直到缩放后的图片的较短边的长度小于12停止迭代;
S423.使用构建好的图像尺度金字塔作为缩放比例,将待测图片缩放到不同的大小,已建立该待测图片的图像金字塔。
优选的,步骤S42,S43和S44中,采用NMS算法实现去重。
与现有技术相比,本发明的有益效果在于:
(1)通过卷积运算优化的方式,利用级联分解卷积代替原有的标准卷积,以及对原有模型的全卷积结构改造,模型的运算速度得到了有效的提升。相比于原来的MTCNN模型,在同样的计算环境下,算法运算速度达到了原有模型的3倍,目前可以支持在普通的智能手机上实时进行人脸检测。
(2)通过提出的迭代贪心压缩算法,对原有的模型进行了有效地参数压缩。相比于原来的MTCNN模型,在精度损失不超过5%的情况下,参数规模为原有参数规模的1/3,在精度损失不超过10%的情况下,参数规模为原有规模的1/5,在确保检测精度的情况下,目前在智能手机端运行的模型参数大小可以控制在500KB以内。
附图说明
图1为本发明全卷积神经网络的结构示意图;
图2为现有标准卷积示意图;
图3为本发明逐通道卷积示意图;
图4为本发明逐点卷积示意图;
图5为迭代贪心压缩算法的流程图。
具体实施方式
以下结合附图对本发明所保护的技术方案做具体说明。
请参阅图1至图5。本发明提出了一种基于优化的全卷积神经网络的人脸检测方法,是对现有MTCNN模型的改进,主要包括训练阶段和使用阶段两个部分;主要包括如下步骤:
S1.建立全卷积神经网络模型;
本发明的全卷积神经网络模型是在现有MTCNN模型的基础上的改进,具体地,将MTCNN模型中的全连接层全部替换为卷积层,即将现有MTCNN模型中的R-Net网络层的全连接层替换为卷积层,构成R-Net改进网络层,将现有MTCNN模型中的O-Net网络层的全连接层替换为卷积层,构成O-Net改进网络层,而P-Net网络层与MTCNN模型中的P-Net相同。
S2.准备训练数据;
同其他的人脸检测模型一样,首先需要准备大量的训练图片用于训练网络参数,训练图片中都必须包含至少一个人脸,同时需要获取到这些人脸在图片中的位置信息,同时考虑到模型多任务学习设计中的人脸关键点检测任务,因此还需要知道这些人脸对应的关键点位置信息,需要包含5个关键点:左眼、右眼、鼻子、左嘴角、右嘴角。由于在实际场景中,人脸所出现的场景是十分多样的,人脸本身的表情等变化也十分丰富,因此在准备训练数据时,需要尽可能地包含多种不同场景下、不同人脸变化的图片,通过对这些复杂多变的训练数据进行拟合学习,训练出的模型才能在更加复杂的真实场景中表现得更加鲁棒。准备好足够的训练数据之后,就可以按照后续的步骤进行模型的训练。
在其中一个实施例中,训练数据可以来源于Wider_face,CelebA等数据库。
S3.对所述全卷积神经网络模型进行训练;
在本实施例中,对本发明的全卷积神经网络模型进行训练采用TensorFlow框架,为加快模型各网络层的运算速度,对各网络层的卷积运算采用级联分解卷积运算,所述级联分解卷积运算包括逐通道卷积运算和逐点卷积运算,在本实施例中,参照MobileNet模型(请参阅Howard AG,Zhu M,Chen B,et al.Mobilenets:Efficient Convolutional NeuralNetworks for Mobile Vision Applications[J].arXiv preprint arXiv:1704.04861,2017.)中深度可分解卷积的设计,将现有MTCNN模型中的标准卷积进行平面和通道上的分解计算,依次进行卷积计算。
在标准的卷积运算中,面对多个特征图的输入,对应的卷积核会有多个多通道的卷积核,如图2所示,一次卷积层的前馈计算需要的计算量是S*S*L*K*T*T;计算量加大,如图3和图4可知,分解后的逐通道卷积运算和逐点卷积运算的计算量分别为S*S*L*T*T和S*S*L*K,故采用级联分解卷积运算的计算量为(S*S*L*T*T+S*S*L*K),通过比较本发明的级联分解卷积运算和现有的标准卷积运算的计算量可知,两者的比值为(1/K+1/T2),而通常卷积核的个数K值较大,故现有的标准卷积的计算量约为本发明级联分解卷积运算计算量的T2,由此可知,采用本发明的级联分解卷积运算能够有效的降低卷积部分的计算量。
由图1可知,本发明的模型的网络结构,其中,P-Net网络层的第一层卷积层的逐通道卷积运算采用1个3*3的卷积核,而逐点卷积运算采用3个1*1卷积核;第二层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和10个1*1卷积核;第三层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和16个1*1卷积核;而R-Net改进网络层的第一层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和3个1*1卷积核;第二层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和28个1*1卷积核;第三层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和48个1*1卷积核;所述O-Net改进网络层的第一层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和3个1*1卷积核;第二层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和32个1*1卷积核;第三层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和64个1*1卷积核;第四层卷积层的逐通道卷积运算和逐点卷积运算分别采用1个3*3的卷积核和64个1*1卷积核。
由以上可知,虽然各网络层的结构略有不同,但三者的预测任务均由人脸的分类预测、人脸的位置预测以及人脸关键点的位置预测三个子任务组合而成;其中,所述人脸的分类预测是指判断对应区域中是否含有人脸;所述人脸的位置预测是指若含有人脸的话,则预测对应人脸在图像中的具体位置;所述人脸关键点的位置预测是指若含有人脸的话,则预测人脸中的五个关键点在图像中的具体位置;故将以上三个子任务作为本网络的预测目标。
具体地,本步骤包括如下具体步骤:
S31.利用步骤S2中准备的训练数据,对步骤S1建立的全卷积神经网络模型中P-Net网络层的参数依次进行迭代训练;
S32.利用迭代贪心压缩算法分别对步骤S31迭代训练完成的参数进行压缩修剪,得到实用的P-Net网络层;
S33.按照步骤S31,S32的训练方法,利用实用的P-Net网络层对后续的R-Net改进网络层和O-Net改进网络层进行级联训练,得到训练好的全卷积神经网络模型。
由于本发明提出的全卷积神经网络模型的三个网络层为级联结构,即P-Net网络层的输出作为R-Net改进网络层的输入,而R-Net改进网络层的输出作为O-Net网络层的输入;故在对本发明的模型进行训练时,训练过程也采用级联的方式进行,即先完成P-Net网络层的训练,得到实用的P-Net网络层,然后再对后续的R-Net改进网络层进行训练,即需要使用训练好的P-Net网络层对训练数据进行计算,并将输出结果整理好,作为R-Net的训练样本;对于O-Net改进网络层的训练亦如此。
对于步骤S31,包括如下更具体的步骤:
S311.确定全卷积神经网络模型的目标函数;
S312.使用反向传播和随机梯度下降的方式对模型参数进行迭代训练;
其中,所述全卷积神经网络模型的目标函数为:
ai为P-Net网络层,R-Net改进网络层以及O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测对应的权重值;Lossi为P-Net网络层,R-Net改进网络层以及O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测对应的损失函数;
Loss1为人脸分类预测的损失参数,可以表示为Loss1=-(log(p)+(1-X)(1-log(p)));
Loss2为人脸框的位置预测的损失函数,可以表示为:
Loss3为人脸关键点的位置预测的损失函数,可以表示为:其中,p表示P-Net网络层,R-Net改进网络层以及O-Net改进网络层的输出;X为训练样本的标注信息;1表示是人脸,0表示不是人脸;Y0为四维数值向量,表示各网络层对于人脸位置的实际预测值;Y为四维数值向量,表示训练样本对应的标注人脸位置信息;Z0为十维数值变量,表示各网络层对于人脸五个关键点位置的实际预测值;Z为十维数值变量,表示训练样本对应的标注人脸关键点信息。
由于各个网络层的训练侧重点不同,故各个网络层训练时的权重值的偏重不同,如P-Net网络层和R-Net改进网络层的更需要有效地甄别出非人脸的区域,故其权重值更偏向于人脸分类预测任务,在其中一个实施例中,其在三个子任务的权重值ai均分别为1.0,0.5,0.5;而O-Net改进网络层的作为最终的输出网络层,对于检测位置的精度要求更高,故其更偏向于人脸框的位置预测以及人脸关键点的位置预测,在其中一个实施例中,其在三个子任务的权重值ai分别为0.5,1.0,1.0。
步骤32用于完成对各网络层中参数的修剪,采用迭代贪心压缩算法进行运算,如图5所示,具体包括如下步骤:
S321.从单个网络层的第一个特征图开始压缩;
S322.通过置0的方式,得到当前卷积层的各各个特征图对应的测试精度损失;
S323.将精度损失最小的特征图对应的卷积核删除;
S324.对应修改当前卷积层的前后层的大小,并对该网络层进行重新训练至收敛;
S325.判断是否达到终止条件,若是则对本网络层的压缩结束;若否,则转到下一步;
S326.判断是否达到最后一个卷积层,若是,则重新开始步骤S322;若否,则将后一卷积层设置为当前层,转至S322。
优选的,步骤S325中的终止条件为:所述全卷积神经网络模型的精度损失达到设定的不可接受的阈值,或者压缩比例达到设定的期望值。具体的阈值数值可以根据实际应用的需要来自由设定,但一般要考虑客观的情况,需要遵循压缩比例过大会导致模型精度出现明显下降这一实际的规律。
以上,首先通过对P-Net网络层进行训练,并对其参数进行修剪,已建立实用的P-Net网络层,随后,利用实用的P-Net网络层的输出作为R-Net改进网络层的输入,重复步骤S31,和S32,对R-Net改进网络层进行训练,并完成其参数的修剪;最后将R-Net改进网络层的输出作为O-Net改进网络层的输入,对其进行训练,并完成其参数的修剪,从而实现对整个模型的训练;且经过以上训练后,三个网络层的训练都顺利收敛。
S4.使用训练完成后的全卷积神经网络模型对待测图像进行人脸检测;
当完成对模型的全部训练,建立实用的全卷积神经网络模型后,即进入本模型的使用阶段,具体包括如下步骤:
S41.构建图像金字塔;
为了尽可能地提升检测的召回率,在将图片输入到网络之前,需要对图片进行不同尺度上的伸缩变换,本发明采用建立图像金字塔的方式,以使得网络可以对不同大小的人脸都能有效检出,构建图像金字塔的步骤包括如下步骤:
S411.确定图像金字塔的基础缩放尺度,所述基础缩放尺度为M/12;其中M为图片中需要检测到的最小人脸大小M*M;由于P-Net网络层的输入大小为12*12,故将基础缩放尺度设定为M/12。
S412.构建图像尺度金字塔:将所述基础缩放尺度作为初始值,按照缩放后的图片的面积是前一层的1/2的迭代策略,直到缩放后的图片的较短边的长度小于12停止迭代;
S423.使用构建好的图像尺度金字塔作为缩放比例,将待测图片缩放到不同的大小,已建立该待测图片的图像金字塔。
S42.级联的人脸检测,将图像金字塔内的图片依次输入到训练后的全卷积神经网络模型中的P-Net网络层中,并汇总不同尺度图片对应的人脸候选框,由于不同尺度的图片突出了不同尺度的人脸,因此需要将每个尺度图片得到的输出人脸候选框进行汇总,在其中一个实施例中,同时使用NMS算法消除所有候选框中的重复框。
S43.将P-Net网络层的输出作为R-Net改进网络层的输入,得到优化后的人脸候选框;
R-Net改进网络层的主要作用是进一步甄别出P-Net网络层的输出结果中并不包含人脸的候选框,以及尽可能对P-Net网络层中的输出的比较粗糙的人脸框位置进行更精细的调整,缩小人脸框的范围,同样需要对输出结果进行汇总,在其中一个实施例中,同样采用NMS算法实现去重,以得到一些相对比较可能的人脸候选框的结果,作为后续O-Net改进网络层的输入。
S44.将R-Net改进网络层的输出作为O-Net改进网络层的输入,得到最终的人脸检测结果;本步骤是对R-Net改进网络层的输出进行最终的分类判断,以及最终的人脸位置的精细化测定,同时还需要对每个输出的人脸框给出对应的五个人脸关键点的位置信息,在其中一个实施例中,同样采用NMS算法实现去重,从而得到最终的人脸检测结果。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,包括如下步骤:
S1.建立全卷积神经网络模型;
S2.准备训练数据;
S3.对所述全卷积神经网络模型进行训练;
S4.使用训练完成后的全卷积神经网络模型对待测图像进行人脸检测;
其中,所述全卷积神经网络模型为改进的MTCNN模型,所述全卷积神经网络模型包括P-Net网络层,R-Net改进网络层以及O-Net改进网络层;且所述P-Net网络层通过三层卷积层运算后得到人脸区域的候选窗口和边界框的回归向量;所述R-Net改进网络层是指将R-Net网络层中的全连接层替换为卷积层;所述O-Net改进网络层是指将O-Net网络层中的全连接层替换为卷积层;所述P-Net网络层,R-Net改进网络层以及O-Net改进网络层中各卷积层的卷积运算采用级联分解卷积运算,所述级联分解卷积运算包括逐通道卷积运算和逐点卷积运算。
2.根据权利要求1所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,所述级联分解卷积运算是指对各网络层的各卷积层进行平面和通道上的分解计算,依次进行卷积计算。
3.根据权利要求1所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤3中具体包括如下步骤:
S31.利用步骤S2中准备的训练数据,对步骤S1建立的全卷积神经网络模型中P-Net网络层的参数依次进行迭代训练;
S32.利用迭代贪心压缩算法分别对步骤S31迭代训练完成的参数进行压缩修剪,得到实用的P-Net网络层;
S33.按照步骤S31,S32的训练方法,利用实用的P-Net网络层对后续的R-Net改进网络层和O-Net改进网络层进行级联训练,得到训练好的全卷积神经网络模型。
4.根据权利要求3所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤S31的迭代训练采用TensorFlow框架,包括:
S311.确定全卷积神经网络模型的目标函数;
S312.使用反向传播和随机梯度下降的方式对模型参数进行迭代训练;
其中,所述全卷积神经网络模型的目标函数为:
ai为P-Net网络层,R-Net改进网络层以及O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测对应的权重值;Lossi为P-Net网络层,R-Net改进网络层以及O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测对应的损失函数;
Loss1为人脸分类预测的损失参数,可以表示为Loss1=-(log(p)+(1-X)(1-log(p)));
Loss2为人脸框的位置预测的损失函数,可以表示为:
Loss3为人脸关键点的位置预测的损失函数,可以表示为:其中,p表示P-Net网络层,R-Net改进网络层以及O-Net改进网络层的输出;X为训练样本的标注信息;1表示是人脸,0表示不是人脸;Y0为四维数值向量,表示各网络层对于人脸位置的实际预测值;Y为四维数值向量,表示训练样本对应的标注人脸位置信息;Z0为十维数值变量,表示各网络层对于人脸五个关键点位置的实际预测值;Z为十维数值变量,表示训练样本对应的标注人脸关键点信息。
5.根据权利要求4所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,所述P-Net网络层和R-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测的权重系数ai均分别为1.0,0.5,0.5;所述O-Net改进网络层的人脸分类检测、人脸框的位置预测以及人脸关键点的位置预测的权重系数ai分别为0.5,1.0,1.0。
6.根据权利要求3所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤S32中的迭代贪心压缩算法的流程如下:
S321.从单个网络层的第一个特征图开始压缩;
S322.通过置0的方式,得到当前卷积层的各各个特征图对应的测试精度损失;
S323.将精度损失最小的特征图对应的卷积核删除;
S324.对应修改当前卷积层的前后层的大小,并对该网络层进行重新训练至收敛;
S325.判断是否达到终止条件,若是则对本网络层的压缩结束;若否,则转到下一步;
S326.判断是否达到最后一个卷积层,若是,则重新开始步骤S322;若否,则将后一卷积层设置为当前层,转至S322。
7.根据权利要求6所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤S325中的终止条件为:所述全卷积神经网络模型的精度损失达到设定的不可接受的阈值,或者压缩比例达到设定的期望值。
8.根据权利要求1所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤S4包括如下具体步骤:
S41.构建图像金字塔;
S42.级联的人脸检测,将图像金字塔内的图片依次输入到训练后的全卷积神经网络模型中的P-Net网络层中,并汇总不同尺度图片对应的人脸候选框;
S43.将P-Net网络层的输出作为R-Net改进网络层的输入,得到优化后的人脸候选框;
S44.将R-Net改进网络层的输出作为O-Net改进网络层的输入,得到最终的人脸检测结果。
9.根据权利要求8所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤S41的具体步骤包括:
S411.确定图像金字塔的基础缩放尺度,所述基础缩放尺度为M/12;其中M为图片中需要检测到的最小人脸大小M*M;
S412.构建图像尺度金字塔:将所述基础缩放尺度作为初始值,按照缩放后的图片的面积是前一层的1/2的迭代策略,直到缩放后的图片的较短边的长度小于12停止迭代;
S423.使用构建好的图像尺度金字塔作为缩放比例,将待测图片缩放到不同的大小,已建立该待测图片的图像金字塔。
10.根据权利要求8所述的一种基于优化的全卷积神经网络的人脸检测方法,其特征在于,步骤S42,S43和S44中,采用NMS算法实现去重。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810980287.7A CN109034119A (zh) | 2018-08-27 | 2018-08-27 | 一种基于优化的全卷积神经网络的人脸检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810980287.7A CN109034119A (zh) | 2018-08-27 | 2018-08-27 | 一种基于优化的全卷积神经网络的人脸检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109034119A true CN109034119A (zh) | 2018-12-18 |
Family
ID=64625124
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810980287.7A Pending CN109034119A (zh) | 2018-08-27 | 2018-08-27 | 一种基于优化的全卷积神经网络的人脸检测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109034119A (zh) |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109919048A (zh) * | 2019-02-21 | 2019-06-21 | 北京以萨技术股份有限公司 | 一种基于级联MobileNet-V2实现人脸关键点检测的方法 |
CN109977771A (zh) * | 2019-02-22 | 2019-07-05 | 杭州飞步科技有限公司 | 司机身份的验证方法、装置、设备及计算机可读存储介质 |
CN110287857A (zh) * | 2019-06-20 | 2019-09-27 | 厦门美图之家科技有限公司 | 一种特征点检测模型的训练方法 |
CN110321841A (zh) * | 2019-07-03 | 2019-10-11 | 成都汇纳智能科技有限公司 | 一种人脸检测方法及系统 |
CN110619309A (zh) * | 2019-09-19 | 2019-12-27 | 天津天地基业科技有限公司 | 一种基于八度卷积和YOLOv3的嵌入式平台人脸检测方法 |
CN110619319A (zh) * | 2019-09-27 | 2019-12-27 | 北京紫睛科技有限公司 | 一种基于改进的mtcnn模型人脸检测方法和系统 |
CN110866459A (zh) * | 2019-10-28 | 2020-03-06 | 北京影谱科技股份有限公司 | 基于改进卷积网络的人脸检测方法及装置、及计算设备 |
CN111340124A (zh) * | 2020-03-03 | 2020-06-26 | Oppo广东移动通信有限公司 | 图像中实体类别的识别方法和装置 |
CN111353577A (zh) * | 2018-12-24 | 2020-06-30 | Tcl集团股份有限公司 | 基于多任务的级联组合模型的优化方法、装置及终端设备 |
CN111429415A (zh) * | 2020-03-18 | 2020-07-17 | 东华大学 | 基于网络协同剪枝的产品表面缺陷高效模型构建方法 |
CN111476211A (zh) * | 2020-05-15 | 2020-07-31 | 深圳市英威诺科技有限公司 | 基于Tensorflow框架的人脸定位方法及系统 |
CN112200008A (zh) * | 2020-09-15 | 2021-01-08 | 青岛邃智信息科技有限公司 | 一种社区监控场景下人脸属性识别方法 |
CN112487855A (zh) * | 2019-09-12 | 2021-03-12 | 上海齐感电子信息科技有限公司 | 基于mtcnn网络模型的人脸检测方法及装置、终端 |
CN112767389A (zh) * | 2021-02-03 | 2021-05-07 | 紫东信息科技(苏州)有限公司 | 基于fcos算法的胃镜图片病灶识别方法及装置 |
CN112944611A (zh) * | 2021-03-19 | 2021-06-11 | 珠海格力电器股份有限公司 | 空调器的控制方法、装置、存储介质及处理器 |
CN112989354A (zh) * | 2021-01-27 | 2021-06-18 | 中标软件有限公司 | 基于神经网络和焦点损失的攻击检测方法 |
CN113034457A (zh) * | 2021-03-18 | 2021-06-25 | 广州市索图智能电子有限公司 | 基于fpga的人脸检测装置 |
CN113472552A (zh) * | 2020-03-30 | 2021-10-01 | 中国移动通信集团浙江有限公司 | 基于深度学习的vim选择方法、装置、计算设备及存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354565A (zh) * | 2015-12-23 | 2016-02-24 | 北京市商汤科技开发有限公司 | 基于全卷积网络人脸五官定位与判别的方法及系统 |
CN106339695A (zh) * | 2016-09-20 | 2017-01-18 | 北京小米移动软件有限公司 | 人脸相似检测方法、装置及终端 |
CN107358223A (zh) * | 2017-08-16 | 2017-11-17 | 上海荷福人工智能科技(集团)有限公司 | 一种基于yolo的人脸检测与人脸对齐方法 |
CN107506707A (zh) * | 2016-11-30 | 2017-12-22 | 奥瞳系统科技有限公司 | 采用嵌入式系统中的小规模卷积神经网络模块的人脸检测 |
CN107577990A (zh) * | 2017-08-09 | 2018-01-12 | 武汉世纪金桥安全技术有限公司 | 一种基于gpu加速检索的大规模人脸识别方法 |
CN107748858A (zh) * | 2017-06-15 | 2018-03-02 | 华南理工大学 | 一种基于级联卷积神经网络的多姿态眼睛定位方法 |
CN107895160A (zh) * | 2017-12-21 | 2018-04-10 | 曙光信息产业(北京)有限公司 | 人脸检测与识别装置及方法 |
CN108229442A (zh) * | 2018-02-07 | 2018-06-29 | 西南科技大学 | 基于ms-kcf的图像序列中人脸快速稳定检测方法 |
CN108416187A (zh) * | 2018-05-21 | 2018-08-17 | 济南浪潮高新科技投资发展有限公司 | 一种确定剪枝阈值的方法及装置、模型剪枝方法及装置 |
-
2018
- 2018-08-27 CN CN201810980287.7A patent/CN109034119A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105354565A (zh) * | 2015-12-23 | 2016-02-24 | 北京市商汤科技开发有限公司 | 基于全卷积网络人脸五官定位与判别的方法及系统 |
CN106339695A (zh) * | 2016-09-20 | 2017-01-18 | 北京小米移动软件有限公司 | 人脸相似检测方法、装置及终端 |
CN107506707A (zh) * | 2016-11-30 | 2017-12-22 | 奥瞳系统科技有限公司 | 采用嵌入式系统中的小规模卷积神经网络模块的人脸检测 |
CN107748858A (zh) * | 2017-06-15 | 2018-03-02 | 华南理工大学 | 一种基于级联卷积神经网络的多姿态眼睛定位方法 |
CN107577990A (zh) * | 2017-08-09 | 2018-01-12 | 武汉世纪金桥安全技术有限公司 | 一种基于gpu加速检索的大规模人脸识别方法 |
CN107358223A (zh) * | 2017-08-16 | 2017-11-17 | 上海荷福人工智能科技(集团)有限公司 | 一种基于yolo的人脸检测与人脸对齐方法 |
CN107895160A (zh) * | 2017-12-21 | 2018-04-10 | 曙光信息产业(北京)有限公司 | 人脸检测与识别装置及方法 |
CN108229442A (zh) * | 2018-02-07 | 2018-06-29 | 西南科技大学 | 基于ms-kcf的图像序列中人脸快速稳定检测方法 |
CN108416187A (zh) * | 2018-05-21 | 2018-08-17 | 济南浪潮高新科技投资发展有限公司 | 一种确定剪枝阈值的方法及装置、模型剪枝方法及装置 |
Non-Patent Citations (4)
Title |
---|
PAVLO MOLCHANOV等: ""Pruning Convolutional Neural Networks for Resource Efficient Transfer Learning"", 《ARXIV.ORG》 * |
ZHENHENG YANG等: ""A Multi-Scale Cascade Fully Convolutional Network Face Detector"", 《INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION》 * |
于宏志等: ""基于卷积神经网络的级联人脸检测"", 《中国安防》 * |
雷杰等: ""深度网络模型压缩综述"", 《软件学报》 * |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353577A (zh) * | 2018-12-24 | 2020-06-30 | Tcl集团股份有限公司 | 基于多任务的级联组合模型的优化方法、装置及终端设备 |
CN109919048A (zh) * | 2019-02-21 | 2019-06-21 | 北京以萨技术股份有限公司 | 一种基于级联MobileNet-V2实现人脸关键点检测的方法 |
CN109977771A (zh) * | 2019-02-22 | 2019-07-05 | 杭州飞步科技有限公司 | 司机身份的验证方法、装置、设备及计算机可读存储介质 |
CN110287857A (zh) * | 2019-06-20 | 2019-09-27 | 厦门美图之家科技有限公司 | 一种特征点检测模型的训练方法 |
CN110321841A (zh) * | 2019-07-03 | 2019-10-11 | 成都汇纳智能科技有限公司 | 一种人脸检测方法及系统 |
CN112487855A (zh) * | 2019-09-12 | 2021-03-12 | 上海齐感电子信息科技有限公司 | 基于mtcnn网络模型的人脸检测方法及装置、终端 |
CN110619309A (zh) * | 2019-09-19 | 2019-12-27 | 天津天地基业科技有限公司 | 一种基于八度卷积和YOLOv3的嵌入式平台人脸检测方法 |
CN110619309B (zh) * | 2019-09-19 | 2023-07-18 | 天地伟业技术有限公司 | 一种基于八度卷积和YOLOv3的嵌入式平台人脸检测方法 |
CN110619319A (zh) * | 2019-09-27 | 2019-12-27 | 北京紫睛科技有限公司 | 一种基于改进的mtcnn模型人脸检测方法和系统 |
CN110866459A (zh) * | 2019-10-28 | 2020-03-06 | 北京影谱科技股份有限公司 | 基于改进卷积网络的人脸检测方法及装置、及计算设备 |
CN111340124A (zh) * | 2020-03-03 | 2020-06-26 | Oppo广东移动通信有限公司 | 图像中实体类别的识别方法和装置 |
CN111429415A (zh) * | 2020-03-18 | 2020-07-17 | 东华大学 | 基于网络协同剪枝的产品表面缺陷高效模型构建方法 |
CN113472552A (zh) * | 2020-03-30 | 2021-10-01 | 中国移动通信集团浙江有限公司 | 基于深度学习的vim选择方法、装置、计算设备及存储介质 |
CN111476211A (zh) * | 2020-05-15 | 2020-07-31 | 深圳市英威诺科技有限公司 | 基于Tensorflow框架的人脸定位方法及系统 |
CN111476211B (zh) * | 2020-05-15 | 2023-05-26 | 深圳市英威诺科技有限公司 | 基于Tensorflow框架的人脸定位方法及系统 |
CN112200008A (zh) * | 2020-09-15 | 2021-01-08 | 青岛邃智信息科技有限公司 | 一种社区监控场景下人脸属性识别方法 |
CN112989354A (zh) * | 2021-01-27 | 2021-06-18 | 中标软件有限公司 | 基于神经网络和焦点损失的攻击检测方法 |
CN112767389A (zh) * | 2021-02-03 | 2021-05-07 | 紫东信息科技(苏州)有限公司 | 基于fcos算法的胃镜图片病灶识别方法及装置 |
CN112767389B (zh) * | 2021-02-03 | 2024-10-18 | 紫东信息科技(苏州)有限公司 | 基于fcos算法的胃镜图片病灶识别方法及装置 |
CN113034457A (zh) * | 2021-03-18 | 2021-06-25 | 广州市索图智能电子有限公司 | 基于fpga的人脸检测装置 |
CN112944611A (zh) * | 2021-03-19 | 2021-06-11 | 珠海格力电器股份有限公司 | 空调器的控制方法、装置、存储介质及处理器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109034119A (zh) | 一种基于优化的全卷积神经网络的人脸检测方法 | |
CN106875373B (zh) | 基于卷积神经网络剪枝算法的手机屏幕mura缺陷检测方法 | |
CN101236608B (zh) | 基于图片几何结构的人脸检测方法 | |
CN109583340A (zh) | 一种基于深度学习的视频目标检测方法 | |
CN107529650A (zh) | 网络模型的构建和闭环检测方法、相应装置及计算机设备 | |
CN109767422A (zh) | 基于深度学习的管道检测识别方法、存储介质及机器人 | |
CN108765506A (zh) | 基于逐层网络二值化的压缩方法 | |
CN110532925B (zh) | 基于时空图卷积网络的驾驶员疲劳检测方法 | |
CN111401374A (zh) | 基于多任务的模型训练方法、字符识别方法及装置 | |
CN107959848A (zh) | 基于三维卷积神经网络的通用型无参考视频质量评价算法 | |
CN112528913A (zh) | 一种基于图像的砂石颗粒物粒径检测分析系统 | |
CN106650615A (zh) | 一种图像处理方法及终端 | |
CN114463759A (zh) | 一种基于无锚框算法的轻量化文字检测方法及装置 | |
CN109886342A (zh) | 基于机器学习的模型训练方法和装置 | |
CN109949264A (zh) | 一种图像质量评价方法、设备及存储设备 | |
CN112418032A (zh) | 一种人体行为识别方法、装置、电子设备及存储介质 | |
CN117237279A (zh) | 一种非均匀失真全景图像盲质量评价方法及系统 | |
CN111274895A (zh) | 基于空洞卷积的cnn微表情识别方法 | |
CN111582654B (zh) | 基于深度循环神经网络的服务质量评价方法及其装置 | |
CN115240119A (zh) | 一种基于深度学习的视频监控中行人小目标检测方法 | |
CN116402769A (zh) | 一种兼顾大小目标的高精度纺织品瑕疵智能检测方法 | |
CN113486857B (zh) | 一种基于YOLOv4的登高安全检测方法及系统 | |
CN111723742A (zh) | 一种人群密度分析方法、系统、装置及计算机可读存储介质 | |
CN113065379A (zh) | 融合图像质量的图像检测方法、装置、电子设备 | |
CN113239866B (zh) | 一种时空特征融合与样本注意增强的人脸识别方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220129 Address after: 215100 No. 6, Guandu Road, Yuexi south, Wuzhong Economic Development Zone, Suzhou, Jiangsu Province Applicant after: Jiangsu Jinding Sijia industrial equipment installation engineering Co.,Ltd. Address before: 215155 No. 666 Yuting Road, Yinghu Village, Wangting Town, Xiangcheng District, Suzhou City, Jiangsu Province Applicant before: SUZHOU GUANGMU INFORMATION TECHNOLOGY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |