CN106096551B - 人脸部位识别的方法和装置 - Google Patents
人脸部位识别的方法和装置 Download PDFInfo
- Publication number
- CN106096551B CN106096551B CN201610414560.0A CN201610414560A CN106096551B CN 106096551 B CN106096551 B CN 106096551B CN 201610414560 A CN201610414560 A CN 201610414560A CN 106096551 B CN106096551 B CN 106096551B
- Authority
- CN
- China
- Prior art keywords
- depth
- face
- deep learning
- pixel
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000013136 deep learning model Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 18
- 239000000284 extract Substances 0.000 claims abstract description 8
- 239000013598 vector Substances 0.000 claims description 26
- 238000013135 deep learning Methods 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 14
- 244000287680 Garcinia dulcis Species 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 240000006409 Acacia auriculiformis Species 0.000 description 1
- 241000208340 Araliaceae Species 0.000 description 1
- XCWPUUGSGHNIDZ-UHFFFAOYSA-N Oxypertine Chemical compound C1=2C=C(OC)C(OC)=CC=2NC(C)=C1CCN(CC1)CCN1C1=CC=CC=C1 XCWPUUGSGHNIDZ-UHFFFAOYSA-N 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 210000001061 forehead Anatomy 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明提供的一种人脸部位识别的方法和装置,所述方法包括:获得深度图像;提取所述深度图像中的图像像素特征;将所述图像像素特征输入人脸深度学习模型中进行识别分类;判断所述图像像素特征的分类与所述人脸深度学习模型中已有的人脸部位标签是否匹配;若所述图像像素特征的分类与所述人脸深度学习模型中的已有标签匹配,则输出与该像素特征对应的标签。本发明采用提取深度图像像素特征的方法保证了特征提取的精确性,并采用深度学习模型识别图像像素特征,可以一次性对多个人脸部位进行识别分类。
Description
技术领域
本发明涉及人脸识别技术领域,具体而言,涉及一种人脸部位识别的方法和装置。
背景技术
人脸部位识别是人脸识别分析技术的一个重要组成部分,它可广泛应用于人脸检测和定位、人脸识别、姿态识别、3D人脸重构、脸部动画、人脸肖像生成、头部追踪和残疾人实现免持鼠标的人机交互等领域。处理人脸图像,进行人脸部位识别成为本领域研究的热点。
传统的人脸部位识别方案主要针对二维可见光图像,二维可见光图像容易受到图像分辨率、光照、拍摄角度等因素的影响,导致识别效果不佳,识别精准度低。并且,传统人脸部位识别方法仅仅针对一个部位人脸部位进行识别,在进行表情识别、脸部重建、脸部姿态识别时不能一次性有效获得多个人脸部位,无法有效满足于实时分析的需求。如何建立一套不易受拍摄环境影响且能一次性对多个人脸部位同时进行识别方法成为本领域技术人员亟待解决的问题。
发明内容
为了克服现有技术中的上述不足,本发明所要解决的技术问题是提供一种人脸部位识别的方法和装置,其能够通过人脸深度学习模型识别深度图像的图像像素特征,准确地同时完成多个人脸部位的识别。
就方法而言,本发明提供一种人脸部位识别的方法,所述方法包括:
获得深度图像;
提取所述深度图像中的图像像素特征;
将所述图像像素特征输入人脸深度学习模型中进行识别分类;
判断所述图像像素特征的分类与所述人脸深度学习模型中已有的人脸部位标签是否匹配;
若所述图像像素特征的分类与所述人脸深度学习模型中的已有标签匹配,则输出与该图像像素特征对应的标签。
进一步地,在所述人脸部位识别的方法中,所述图像像素特征为像素点邻域内其他像素点深度值之差的集合,所述提取所述深度图像中的图像像素特征的步骤包括:
由选定像素点的深度值及一空间不变系数得到该选定像素点在真实空间的空间分辨率;
由该选定像素点的所述空间分辨率、预设真实空间偏移量及预设多个偏移角中任意的两个不同的偏移角得到多个偏移向量对,其中每个所述偏移向量对包含两个偏移向量;
由所述两个偏移向量得到该选定像素点的两个偏移点,由一深度差值函数获得两个偏移点之间的深度值之差;
将多个所述深度值之差的集合作为该选定像素点的特征向量,以此表征该选定像素点的图像像素特征。
进一步地,在所述人脸部位识别的方法中,在所述由一深度差值函数获得两个偏移点之间的深度值之差的步骤中,
当所述两个偏移点相对于所述选定像素点的深度值之差均小于等于一预设深度阈值时,所述深度差值函数等于所述两个偏移点之间的深度值的差,
当所述两个偏移点中的至少一个相对于所述选定像素点的深度值之差大于所述深度阈值时,所述深度差值函数等于一设定值,所述设定值大于所述深度图像上所有像素点的深度值。
进一步地,在所述人脸部位识别的方法中,所述人脸深度学习模型包括深度置信网络模型,所述深度置信网络模型将所述图像像素特征作为其底层的输入,在网络最顶层进行回归分类,并匹配相应的标签,其中,所述标签包括各人脸部位标签。
进一步地,在所述人脸部位识别的方法中,所述人脸部位识别的方法还包括预先对所述人脸深度学习模型进行深度学习训练,所述深度学习训练的步骤包括,
获得深度图像库中的训练图像;
提取所述训练图像的图像像素特征;
利用所述训练图像的图像像素特征训练所述人脸深度学习模型,并对训练完成的分类赋予相应标签;
所述人脸深度学习模型根据所述标签对其参数进行调整。
进一步地,在所述人脸部位识别的方法中,所述人脸部位识别的方法还包括:
将识别完成后的带标签的图像像素特征及图像像素特征的正确识别率输入到所述人脸深度学习模型;所述人脸深度学习模型以此进行深度学习训练,并对其参数进行调整。
就装置而言,本发明提供一种人脸部位识别的装置,所述人脸部位识别的装置包括:
第一获取模块,用于获得深度图像;
第一特征提取模块,用于提取所述深度图像中的图像像素特征;
人脸深度学习模块,用于将所述图像像素特征输入人脸深度学习模型中进行识别分类;
判断模块,用于判断所述图像像素特征的分类与所述人脸深度学习模型中已有的人脸部位标签是否匹配;
输出模块,用于当所述图像像素特征的分类与所述人脸深度学习模型中的已有标签匹配时,输出与该像素特征对应的标签。
进一步地,在所述人脸部位识别的方法中,所述人脸深度学习模型用于将所述图像像素特征作为其底部输入层的输入,在网络最顶层进行回归分类,并匹配相应的标签,其中,所述标签包括人脸各部位标签及非人脸部位标签。
进一步地,在所述人脸部位识别的方法中,所述装置还包括:
第二获取模块,用于获得深度图像库中的训练图像;
第二特征提取模块,用于提取所述训练图像的图像像素特征;
训练模块,用于利用所述训练图像的图像像素特征训练所述人脸深度学习模型,并对训练完成的分类赋予相应标签;
参数调整模块,用于根据所述标签对人脸深度学习模型的参数进行调整。
进一步地,在所述人脸部位识别的方法中,,所述参数调整模块还用于根据识别完成后带标签的图像像素特征及图像像素特征的正确识别率对所述人脸深度学习模型的参数进行调整。
相对于现有技术而言,本发明具有以下有益效果:
本发明提供的人脸部位识别的方法和装置,通过采用人脸深度学习模型对提取的深度图像像素特征进行检测识别,一方面以像素深度差值作为图像像素特征,不易受到光线、色彩等环境因素影响,且特征提取过程简单,有较好的唯一性和空间不变性。另一方面,采用人脸深度学习模型同时完成检测与识别,可同时对多个人脸部位进行识别,提高了检测识别效率,拥有更好的实时性。且深度学习算法有较强的分类和学习能力,以及较强的自适应性,能有效准确的检测识别到人脸及相应部位。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的人脸部位识别的方法的流程示意图;
图2为本发明实施例提供的深度图像获得方法的示意图;
图3为本发明实施例提供的提取图像像素特征流程的示意图;
图4为本发明实施例提供的像素空间分辨率获得方法的示意图;
图5为本发明实施例提供的训练人脸深度学习模型流程的示意图;
图6为本发明实施例提供的深度置信网络模型的示意图;
图7为本发明实施例提供的人脸部位识别的装置的一种结构框图;
图8为本发明实施例提供的人脸部位识别的装置的另一种结构框图。
上述附图中,各附图标记对应的名称为:
人脸部位识别装置 | 10 |
第一获取模块 | 110 |
第一特征提取模块 | 120 |
人脸深度学习模块 | 130 |
判断模块 | 140 |
输出模块 | 150 |
第二获取模块 | 210 |
第二特征提取模块 | 220 |
训练模块 | 230 |
参数调整模块 | 240 |
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
第一实施例
请参照图1,图1为本实施例提供人脸部位识别的方法的具体流程图,所述方法包括:
步骤S110,获得深度图像。
在本实施例中,所述深度图像通过深度传感器获得,其中,所述深度图像包括通过所述深度传感器获得的每个像素点的深度值。
请参照图2,假设在本实施例中所述深度传感器视场角为(α,β),获得的深度图像的分辨率为(m,n)。在所述深度图像上以像素点为单位建立坐标,记录像素点p=(x,y)的深度值为D(x,y)。
步骤S120,提取所述深度图像中的图像像素特征。
提取所述图像像素特征可以包括:深度梯度方向直方图特征、局部简化三元模式特征、深度值统计分布特征及邻域内其他像素点间深度差值之差特征等,在本实施例中,优选为采用像素点邻域内其他像素点间深度差值之差的集合作为该像素点的图像像素特征。
请参照图3,所述提取所述图像像素特征的步骤可以包括子步骤S121、S122、S123及S124。
子步骤S121,由选定像素点的深度值及一空间不变系数得到该选定像素点在真实空间的空间分辨率。
具体地,请参照图4,在本实施例中,选取所述深度图像上像素点p=(1,1),其对应视场角为(α1,β1),得到其深度值为D(1,1),由此可得像素点p1在真实空间的横向空间分辨率lx1为:
lx1=2D(1,1)tan(α1)=2D(1,1)tan(α/2m)
同理其纵向空间分辨率ly1为:
ly1=2D(1,1)tan(β/2n)
由此可得任意像素点pi=(xi,yi)的空间分辨率为:
lxi=2D(xi,yi)tan(α/2m)=D(xi,yi)ξx
lyi=2D(xi,yi)tan(β/2n)=D(xi,yi)ξy
其中,ξx=2tan(α/2m),ξy=2tan(β/2n)为空间不变系数。
子步骤S122,由该选定像素点的所述空间分辨率、预设真实空间偏移量及预设多个偏移角中任意的两个不同的偏移角得到多个偏移向量对,其中每个所述偏移向量对包含两个偏移向量。
具体地,预设一真实空间偏移量为ε,并在所述深度图像上预设多个离散化的偏移角(方向)为θ={θ1,θ2,…θn},由任意两个偏移方向的偏移向量构成,即对于对,可构成偏移量对δ=(u,v),其中,
由此得到个所述偏移量对{δ1,δ2,…δs}。
在本实施例中,所述偏移角的取值可以为
子步骤S123,由所述偏移向量对中的两个偏移向量得到该选定像素点的两个偏移点,由一深度差值函数获得两个偏移点之间的深度值之差。
具体地,在深度图像上取任意点p,通过深度差值函数计算该点经其中一个所述偏移量对δ=(u,v)后所得的两个偏移点之间的深度差值为:
f(p,δ)=D(p+u)-D(p+v)
在本实施例中,为保证所述图像像素特征描述为同一人脸部位上的特征,当所述两个偏移点相对于所述选定像素点的深度值之差均小于等于一预设深度阈值时,所述深度差值函数等于所述两个偏移点之间的深度值的差;当所述两个偏移点中的至少一个相对于所述选定像素点的深度值之差大于所述深度阈值时,所述深度差值函数等于一个大于所述深度图像上所有像素点的深度值的κ值。以使得同一目标上点的特征向量值较为接近;即给定一个深度阈值η,两个偏移点之间的深度差值的计算公式如下:
子步骤S124,将多个所述深度值之差的集合作为该选定像素点的特征向量,以此表征该选定像素点的图像像素特征。所述特征向量可以表示如下:
Fp=(f(p,δ1),f(p,δ2),…f(p,δS))
如此,所述提取所述深度图像中的图像像素特征的步骤,不仅利用了深度值,还利用了空间不变系数进行计算,因此该特征具有较好的局部深度以及不同分辨率情况下的特征不变性,可为后续检测识别模型提供有力的判别依据。
步骤S130,将所述图像像素特征输入人脸深度学习模型中进行识别分类。
所述人脸深度学习模型可以为随机森林学习模型、回归自组织神经网络模型、深度置信网络(DBN,Deep Belief Network)模型等,在本实施例中,优选为采用DBN模型。所述DBN模型具有多个隐层神经网络,能更好的处理复杂函数,在处理复杂分类问题时表现出更优的泛化性。
值得说明的是,在本实施例中,所述人脸部位识别的方法还包括预先对所述人脸深度学习模型进行深度学习训练。请参照图5,所述深度学习训练的步骤包括:
步骤S210,预先建立有深度图像库,获得所述深度图像库中的训练图像。
步骤S220,提取所述训练图像的图像像素特征。
在本实施例中,所述图像像素特征为像素点领域内其他像素点的深度差值的集合。所述图像像素特征的提取步骤和S120中提取过程相同,在此不再赘述。
步骤S230,利用所述训练图像的图像像素特征训练所述人脸深度学习模型,并对训练完成的分类赋予相应标签;所述人脸深度学习模型根据所述标签对其参数进行调整。
具体地,请参照图6,所述DBN模型可以包括多层受限玻尔兹曼机(RBM,RestrictedBoltzman Machines)网络和反向传播(BP,Backpropagation Algorithm)网络组成。
将所述图像像素特征输入底层RBM,对该层RBM进行无监督训练,确保特征向量映射到不同特征空间时,都尽可能多地保留特征信息。
每一高层RBM以低一层的RBM输出数据作为输入,并对该层RBM进行无监督训练。每一层RBM网络确保自身层内的权值对该层特征向量映射达到最优。
在所述DBN最后一层设置BP网络,以最上层的RBM输出的特征向量作为其输入。预设分类标签,所述标签可以包括人脸各部分的标签(如鼻子、左眼、右眼、左耳、右耳、嘴、左脸颊、右脸颊、下颌、额头等部位标签),以及一个非人脸部位标签。以所述标签有监督地训练实体关系分类器,根据有监督训练是否分类正确信息,所述BP网络将错误信息自顶向下传播至每一层RBM,微调整个DBN模型中对应的特征向量的权重,以使DBN收敛到全局最优。在本实施例中,所述分类器可以采用Softmax回归分类器。
步骤S140,判断所述像素特征的分类与所述人脸深度学习模型中的已有标签是否匹配。若匹配则进入步骤S150,若不匹配则回到步骤S110。
步骤S150,输出与该像素特征对应的标签。
在本实施例中,所述人脸部位检测识别的方法还包括:将识别完成后的带标签的图像像素特征及图像像素特征的正确识别率输入到所述人脸深度学习模型。所述人脸深度学习模型以此进行深度学习训练,并对其自身参数进行调整。
如此在进行人脸部位识别的同时,不断补充新的训练样本对所述人脸深度学习模型进行在线训练,使得随着识别的进行,所述人脸深度学习模型的识别准确度也不断提高。
第二实施例
请参照图7,本实施例提供的人脸部位识别装置10包括:
第一获取模块110,用于获得深度图像;
第一特征提取模块120,用于提取所述深度图像中的图像像素特征;
人脸深度学习模块130,用于将输入的所述图像像素特征进行识别分类;
判断模块140,用于判断所述图像像素特征的分类与所述人脸深度学习模型中已有的人脸部位标签是否匹配;
输出模块150,用于当所述图像像素特征的分类与所述人脸深度学习模型中的已有标签匹配时,输出与该像素特征对应的标签。
在本实施例中,所述人脸深度学习模型用于将所述图像像素特征作为其底部输入层的输入,在网络最顶层进行回归分类,并匹配相应的标签,其中,所述标签包括人脸各部位标签及非人脸部位标签。在本实施例中,所述人脸深度学习模型可以采用深度置信网络模型。
请参照图8,进一步地,在本实施例中,所述人脸部位识别装置10还可以包括:
第二获取模块210,用于获得深度图像库中的训练图像;
第二特征提取模块220,用于提取所述训练图像的图像像素特征;
训练模块230,用于利用所述训练图像的图像像素特征训练所述人脸深度学习模型,并对训练完成的分类赋予相应标签;
参数调整模块240,用于根据所述标签对人脸深度学习模型的参数进行调整。
应当理解的是,在本实施例中,所述第一特征提取模块120和所述第二特征提取模块220可以为同一模块。
请参照图8,进一步地,在本实施例中,所述参数调整模块240还用于根据识别完成后带标签的图像像素特征及图像像素特征的正确识别率对所述人脸深度学习模型的参数进行调整。
综上所述,本发明提供的人脸部位识别的方法和装置,通过采用人脸深度学习模型对提取的深度图像像素特征进行检测识别,一方面以像素深度差值作为图像像素特征,不易受到光线、色彩等环境因素影响,且特征提取过程简单,有较好的唯一性和空间不变性。另一方面,采用人脸深度学习模型同时完成检测与识别,可同时对多个人脸部位进行识别,提高了检测识别效率,拥有更好的实时性。且深度学习算法有较强的分类和学习能力,以及较强的自适应性,能有效准确的检测识别到人脸及相应部位。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种人脸部位识别的方法,其特征在于,所述方法包括:
获得深度图像;
提取所述深度图像中的图像像素特征;其中,所述图像像素特征为像素点邻域内其他像素点深度值之差的集合,所述提取所述深度图像中的图像像素特征的步骤包括:由选定像素点的深度值及一空间不变系数得到该选定像素点在真实空间的空间分辨率;由该选定像素点的所述空间分辨率、预设真实空间偏移量及预设多个偏移角中任意的两个不同的偏移角得到多个偏移向量对,其中每个所述偏移向量对包含两个偏移向量;由所述两个偏移向量得到该选定像素点的两个偏移点,由一深度差值函数获得两个偏移点之间的深度值之差;将多个所述深度值之差的集合作为该选定像素点的特征向量,以此表征该选定像素点的图像像素特征;
将所述图像像素特征输入人脸深度学习模型中进行识别分类;
判断所述图像像素特征的分类与所述人脸深度学习模型中已有的人脸部位标签是否匹配;
若所述图像像素特征的分类与所述人脸深度学习模型中的已有标签匹配,则输出与该图像像素特征对应的标签。
2.根据权利要求1所述的方法,其特征在于,在所述由一深度差值函数获得两个偏移点之间的深度值之差的步骤中,
当所述两个偏移点相对于所述选定像素点的深度值之差均小于等于一预设深度阈值时,所述深度差值函数等于所述两个偏移点之间的深度值的差,
当所述两个偏移点中的至少一个相对于所述选定像素点的深度值之差大于所述深度阈值时,所述深度差值函数等于一设定值,所述设定值大于所述深度图像上所有像素点的深度值。
3.根据权利要求1所述的方法,其特征在于:所述人脸深度学习模型包括深度置信网络模型,所述深度置信网络模型将所述图像像素特征作为其底层的输入,在网络最顶层进行回归分类,并匹配相应的标签,其中,所述标签包括各人脸部位标签。
4.根据权利要求3所述的方法,其特征在于:所述人脸部位识别的方法还包括预先对所述人脸深度学习模型进行深度学习训练,所述深度学习训练的步骤包括,
获得深度图像库中的训练图像;
提取所述训练图像的图像像素特征;
利用所述训练图像的图像像素特征训练所述人脸深度学习模型,并对训练完成的分类赋予相应标签;
所述人脸深度学习模型根据所述标签对其参数进行调整。
5.根据权利要求1所述的方法,其特征在于,所述人脸部位识别的方法还包括:
将识别完成后的带标签的图像像素特征及图像像素特征的正确识别率输入到所述人脸深度学习模型;所述人脸深度学习模型以此进行深度学习训练,并对其参数进行调整。
6.一种人脸部位识别的装置,其特征在于,所述人脸部位识别的装置包括:
第一获取模块,用于获得深度图像;
第一特征提取模块,用于提取所述深度图像中的图像像素特征;其中,所述图像像素特征为像素点邻域内其他像素点深度值之差的集合,所述第一特征提取模块具体用于由选定像素点的深度值及一空间不变系数得到该选定像素点在真实空间的空间分辨率;由该选定像素点的所述空间分辨率、预设真实空间偏移量及预设多个偏移角中任意的两个不同的偏移角得到多个偏移向量对,其中每个所述偏移向量对包含两个偏移向量;由所述两个偏移向量得到该选定像素点的两个偏移点,由一深度差值函数获得两个偏移点之间的深度值之差;将多个所述深度值之差的集合作为该选定像素点的特征向量,以此表征该选定像素点的图像像素特征;
人脸深度学习模块,用于将所述图像像素特征输入人脸深度学习模型中进行识别分类;
判断模块,用于判断所述图像像素特征的分类与所述人脸深度学习模型中已有的人脸部位标签是否匹配;
输出模块,用于当所述图像像素特征的分类与所述人脸深度学习模型中的已有标签匹配时,输出与该像素特征对应的标签。
7.根据权利要求6所述的装置,其特征在于,所述人脸深度学习模型用于将所述图像像素特征作为其底部输入层的输入,在网络最顶层进行回归分类,并匹配相应的标签,其中,所述标签包括人脸各部位标签及非人脸部位标签。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获得深度图像库中的训练图像;
第二特征提取模块,用于提取所述训练图像的图像像素特征;
训练模块,用于利用所述训练图像的图像像素特征训练所述人脸深度学习模型,并对训练完成的分类赋予相应标签;
参数调整模块,用于根据所述标签对人脸深度学习模型的参数进行调整。
9.根据权利要求8所述的装置,其特征在于:所述参数调整模块还用于根据识别完成后带标签的图像像素特征及图像像素特征的正确识别率对所述人脸深度学习模型的参数进行调整。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610414560.0A CN106096551B (zh) | 2016-06-14 | 2016-06-14 | 人脸部位识别的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610414560.0A CN106096551B (zh) | 2016-06-14 | 2016-06-14 | 人脸部位识别的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106096551A CN106096551A (zh) | 2016-11-09 |
CN106096551B true CN106096551B (zh) | 2019-05-21 |
Family
ID=57846525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610414560.0A Active CN106096551B (zh) | 2016-06-14 | 2016-06-14 | 人脸部位识别的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106096551B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107909065B (zh) * | 2017-12-29 | 2020-06-16 | 百度在线网络技术(北京)有限公司 | 用于检测人脸遮挡的方法及装置 |
CN110008791B (zh) * | 2018-01-05 | 2021-04-27 | 武汉斗鱼网络科技有限公司 | 一种人脸区域确定方法、电子设备及可读存储介质 |
CN108563995B (zh) * | 2018-03-15 | 2019-04-26 | 西安理工大学 | 基于深度学习的人机协作系统手势识别控制方法 |
CN108520204A (zh) * | 2018-03-16 | 2018-09-11 | 西北大学 | 一种人脸识别方法 |
CN110147805B (zh) | 2018-07-23 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 图像处理方法、装置、终端及存储介质 |
CN109086725B (zh) * | 2018-08-10 | 2021-01-05 | 北京华捷艾米科技有限公司 | 手部跟踪方法及机器可读存储介质 |
CN111291780B (zh) * | 2018-12-07 | 2024-07-12 | 深圳光启空间技术有限公司 | 一种跨域网络训练及图像识别方法 |
CN110222623A (zh) * | 2019-05-31 | 2019-09-10 | 深圳市恩钛控股有限公司 | 微表情研判方法和系统 |
CN110263793A (zh) * | 2019-06-25 | 2019-09-20 | 北京百度网讯科技有限公司 | 物品标签识别方法及装置 |
CN111401331B (zh) * | 2020-04-27 | 2022-04-05 | 支付宝(杭州)信息技术有限公司 | 人脸识别方法及装置 |
CN111597933B (zh) * | 2020-04-30 | 2023-07-14 | 合肥的卢深视科技有限公司 | 人脸识别方法和装置 |
CN113837105A (zh) * | 2021-09-26 | 2021-12-24 | 北京的卢深视科技有限公司 | 人脸识别方法、系统、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609680A (zh) * | 2011-12-22 | 2012-07-25 | 中国科学院自动化研究所 | 一种基于三维深度图像信息的并行统计学习人体部位检测方法 |
CN103413145A (zh) * | 2013-08-23 | 2013-11-27 | 南京理工大学 | 基于深度图像的关节点定位方法 |
-
2016
- 2016-06-14 CN CN201610414560.0A patent/CN106096551B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102609680A (zh) * | 2011-12-22 | 2012-07-25 | 中国科学院自动化研究所 | 一种基于三维深度图像信息的并行统计学习人体部位检测方法 |
CN103413145A (zh) * | 2013-08-23 | 2013-11-27 | 南京理工大学 | 基于深度图像的关节点定位方法 |
Non-Patent Citations (2)
Title |
---|
井下人员人脸识别方法研究;杨卓;《工况自动化》;20150930;第41卷(第9期);第53-57页 |
深度图像下基于特征学习的人体检测方法研究;许素萍;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140815(第08期);第I138-1385页 |
Also Published As
Publication number | Publication date |
---|---|
CN106096551A (zh) | 2016-11-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106096551B (zh) | 人脸部位识别的方法和装置 | |
CN104866829B (zh) | 一种基于特征学习的跨年龄人脸验证方法 | |
CN107832672B (zh) | 一种利用姿态信息设计多损失函数的行人重识别方法 | |
CN111325115B (zh) | 带有三重约束损失的对抗跨模态行人重识别方法和系统 | |
CN109800794B (zh) | 一种外观相似目标的跨相机重识别融合方法及系统 | |
CN106127733B (zh) | 人体目标识别的方法和装置 | |
CN110220917A (zh) | 一种基于图像处理的皇冠盖表面缺陷在线检测方法 | |
CN103914680B (zh) | 一种喷印字符图像识别与校验系统及方法 | |
CN104008370A (zh) | 一种视频人脸识别方法 | |
CN105138998B (zh) | 基于视角自适应子空间学习算法的行人重识别方法及系统 | |
CN106529499A (zh) | 基于傅里叶描述子和步态能量图融合特征的步态识别方法 | |
CN105574505A (zh) | 一种多摄像机间人体目标再识别的方法及系统 | |
CN103279768B (zh) | 一种基于增量学习人脸分块视觉表征的视频人脸识别方法 | |
CN105138954A (zh) | 一种图像自动筛选查询识别系统 | |
CN102663411B (zh) | 一种目标人体识别方法 | |
CN112966736B (zh) | 一种基于多视角匹配与局部特征融合的车辆再识别方法 | |
CN102324042B (zh) | 视觉识别系统及视觉识别方法 | |
CN107424161B (zh) | 一种由粗至精的室内场景图像布局估计方法 | |
CN105893947B (zh) | 基于多局部相关特征学习的两视角人脸识别方法 | |
CN107977656A (zh) | 一种行人重识别方法及系统 | |
CN104881639B (zh) | 一种基于层次tdp模型的人脸检测、分割和表情识别方法 | |
CN106778526B (zh) | 一种基于汉明距离的大规模高效人脸识别方法 | |
CN101853397A (zh) | 一种基于人类视觉特性的仿生人脸检测方法 | |
CN111914761A (zh) | 一种热红外人脸识别的方法及系统 | |
CN105574475A (zh) | 一种基于共同向量词典的稀疏表示分类方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231218 Address after: Room 402, 4th Floor, Old Book Office Building, Shandong Vocational College of Science and Technology, No. 1567 Xinhua Road, Kuiwen District, Weifang City, Shandong Province, 261000 Patentee after: Shandong Jiayin Information Technology Co.,Ltd. Address before: 410205 A645, room 39, Changsha central software park headquarters, No. 39, Jian Shan Road, hi tech Development Zone, Hunan. Patentee before: HUNAN VISUALTOURING INFORMATION TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |