CN110647811A - 人脸姿态检测方法、装置及计算机可读存储介质 - Google Patents
人脸姿态检测方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110647811A CN110647811A CN201910763210.9A CN201910763210A CN110647811A CN 110647811 A CN110647811 A CN 110647811A CN 201910763210 A CN201910763210 A CN 201910763210A CN 110647811 A CN110647811 A CN 110647811A
- Authority
- CN
- China
- Prior art keywords
- face image
- angle
- face
- calculation model
- yaw
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 36
- 238000004364 calculation method Methods 0.000 claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 41
- 238000000034 method Methods 0.000 claims abstract description 18
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000010191 image analysis Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 206010034719 Personality change Diseases 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007123 defense Effects 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种生物识别技术,揭露了一种人脸姿态检测方法、装置及计算机可读存储介质,该方法包括:预设训练人脸图像集;根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
Description
技术领域
本发明涉及计算机视觉领域,尤其涉及一种人脸姿态检测方法、装置及计算机可读存储介质。
背景技术
计算机视觉技术始于20世纪60年代,它大致能分成检测、跟踪、识别等方向,最近的几十年,它已经成为十分热门的研究领域。计算机视觉技术广泛地应用于航空航天、自动导航、工业检测、医学研究、临床诊治、安全监控、娱乐、国防、交通、遥感等诸多重要领域中。计算机视觉技术是真正人工智能的一个必要前提。其中,计算机人脸姿态检测技术可用于辅助驾驶、人机交互等智能系统,具有广阔的应用前景。
现有的人脸姿态检测方法是先用2D图像获取若干个人脸关键点,然后初始化一个3D人脸模型,并将若干个关键点拟合3D人脸模型,并用欧拉公式计算出三个代表人脸方向的欧拉角。这种方法流程繁琐,且计算量大。另外,基于若干个人脸关键点的获取方法是通过串行步骤,其精准程度直接影响后续检测方法的性能,所以前面步骤不精准,将严重影响后续操作。
发明内容
本发明提供一种人脸姿态检测方法、装置及计算机可读存储介质,其主要目的在于提高人脸姿态检测的速度和精度,实现任意角度的人脸姿态检测。
为实现上述目的,本发明提供一种人脸姿态检测方法,包括:
预设训练人脸图像集;
根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
可选地,所述训练人脸图像集包括一张二维人脸图像或视频流。
可选地,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤包括:
将所述当前人脸图像进行剪裁和定位后,确定所述当前人脸图像中双眼的位置,计算所述双眼中心之间的连线与roll方向上的夹角即为roll方向上的偏转角度。
可选地,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤进一步包括:
将所述当前人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;
将调整后的当前人脸图像缩放并剪取需要的像素大小;
计算所述人脸图像在pitch方向和yaw方向的偏转角度。
可选地,所述人脸姿态检测方法还包括:
根据所述训练好的人脸方向姿态角度计算模型获取所述当前人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,所述人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,通过如下方式确定:
pitch方向上的期望位姿所对应的期望值=pitch方向上的期望角度/pitch方向上的最大预设仰俯角;
yaw方向上的期望位姿所对应的期望值=yaw方向上的期望角度/yaw方向上的最大预设偏航角。
本发明还提供一种电子装置,所述电子装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的人脸姿态检测程序,所述人脸姿态检测程序被所述处理器执行时实现如下步骤:
预设训练人脸图像集;
根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
可选地,所述训练人脸图像集包括一张二维人脸图像或视频流。
可选地,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤包括:
将所述当前人脸图像进行剪裁和定位后,确定所述当前人脸图像中双眼的位置,计算所述双眼中心之间的连线与roll方向上的夹角即为roll方向上的偏转角度。
可选地,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤进一步包括:
将所述当前人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;
将调整后的当前人脸图像缩放并剪取需要的像素大小;
计算所述人脸图像在pitch方向和yaw方向的偏转角度。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸姿态检测程序,所述人脸姿态检测程序可被一个或者多个处理器执行,以实现上述的人脸姿态检测方法的步骤。
本发明提供的人脸姿态检测方法、装置及计算机可读存储介质不需要依赖获取人脸关键点、初始化人脸3D模型,只需给模型送入一张二维的图像或者视频流,就能迅速获取精准的人脸方向姿态角度;具有高适配性,能有效嵌入寿险的影像分析系统,为人脸识别的输入提供先序筛选。
附图说明
图1为本发明一实施例提供的人脸姿态检测方法的流程示意图;
图2为本发明一实施例提供的电子装置的内部结构示意图;
图3为本发明一实施例提供的电子装置中基于人脸姿态检测程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种人脸姿态检测方法。参照图1所示,为本发明一实施例提供的人脸姿态检测方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现,本实施例中,所述装置为智能终端。
在本实施例中,人脸姿态检测方法应用于智能终端,所述人脸姿态检测方法包括:
S101,预设训练人脸图像集;
S103,根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
S105,将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
S107,根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
S109,根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
所述训练人脸图像集包括一张二维人脸图像或视频流。
其中,所述训练图像集中的图像包括左侧姿态人脸子集、正面姿态人脸子集和右侧姿态人脸子集。
所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤包括:
将所述当前人脸图像进行剪裁和定位后,确定所述当前人脸图像中双眼的位置,计算所述双眼中心之间的连线与roll方向上的夹角即为roll方向上的偏转角度。
其中,本发明实施例中的pitch方向是围绕X轴旋转,pitch方向上的角度叫做俯仰角;yaw方向是围绕Y轴旋转,yaw方向上的角度叫做偏航角;roll方向是围绕Z轴旋转,roll方向上的角度叫做偏转角。
所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤进一步包括:
将所述当前人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;
将调整后的当前人脸图像缩放并剪取需要的像素大小;
计算所述人脸图像在pitch方向和yaw方向的偏转角度。
所述人脸姿态检测方法还包括:
根据所述训练好的人脸方向姿态角度计算模型获取所述当前人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,所述人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,通过如下方式确定:
pitch方向上的期望位姿所对应的期望值=pitch方向上的期望角度/pitch方向上的最大预设仰俯角;
yaw方向上的期望位姿所对应的期望值=yaw方向上的期望角度/yaw方向上的最大预设偏航角。
其中,在进行人脸方向姿态角度计算模型训练时,为了进一步提高精确识别pitch方向和yaw方向上的角度,需要将人脸图像进行定位和剪裁。首先将输入的人脸图像检索出双眼的位置,计算两眼中心连接与roll方向(水平方向)之间的夹角,即偏转角度;然后将人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;最后将调整后的人脸图像岁缩放并剪取至需要的像素大小。例如,可以将人脸图像的像素设置为32×32。
在对人脸方向姿态角度计算模型进行训练时,针对每一张人脸图像,均对应一个pitch方向上的期望位姿所对应的期望值和yaw方向上的期望位姿所对应的期望值;通过将上述两个期望值作为网络监督信号对人脸方向姿态角度计算模型进行监督学习。经过大量的姿态样本训练后,人脸方向姿态角度计算模型具有很强的姿态判别能力。
具体地,在对模型进行训练时,针对每一张输入的人脸图像,均对应一个pitch方向上的期望位姿所对应的期望值P1和yaw方向上的期望位姿所对应的期望值Y1。一般地,在对模型进行训练时,针对每一张输入的人脸图像,均对应一个pitch方向上仰俯角Pitch和一个yaw方向上的偏航角Yaw,为了将pitch方向上仰俯角和一个yaw方向上的偏航角的信息作为模型的监督信号,本发明实施例中,将每一仰俯角转换为[-1,1]内的值,以及将每一偏航角转换为[-1,1]内的值。其中,例如,人脸检测系统可以在仰俯姿态变化范围为±60°、偏航姿态变化范围为±90°的情况下,有效地检测出人脸,则采用下述公式(1)进行转换。
P1=Pitch/60°;Y1=Yaw/90° (1)
其中,P1代表pitch方向上的期望位姿所对应的期望值,Y1代表yaw方向上的期望位姿所对应的期望值,Pitch代表pitch方向上期望仰俯角,Yaw代表yaw方向上的期望偏航角。
因此,本发明实施例中,通过将P1、Y1作为网络的监督信号对模型进行监督学习。经过大量的姿态样本训练后,人脸方向姿态角度计算模型具有很强的姿态判别能力。
本发明实施例的人脸姿态估测可以应用的场景包括身份识别和身份认证。如在身份认证或身份识别时,将采集人脸图像的特征与注册过的人脸图像的特征进行对比,判断即使人脸经过偏转后与注册过的图像是否为同一人或该人是谁。
所述残差网络为深度卷积网络,所述残差网络通过增加相当的深度来提高分类的准确率。
所述残差网络的核心是解决了增加深度带来的副作用,即退化问题,这样能够通过单纯地增加网络深度,来提高网络性能。
本实施例提出的人脸姿态检测方法不需要依赖获取人脸关键点、初始化人脸3D模型,只需给模型送入一张二维的图像或者视频流,就能迅速获取精准的人脸方向姿态角度;具有高适配性,能有效嵌入寿险的影像分析系统,为人脸识别的输入提供先序筛选;大大提高了人脸姿态检测的速度和精度,实现了任意角度的人脸姿态检测。
本发明还提供一种电子装置1。参照图2所示,为本发明一实施例提供的电子装置的内部结构示意图。
在本实施例中,电子装置1可以是电脑、智能终端或服务器。所述电子装置1至少包括存储器11、处理器13,通信总线15,以及网络接口17。在本实施例中,所述电子装置1为智能终端。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是电子装置的内部存储单元,例如所述电子装置的硬盘。存储器11在另一些实施例中也可以是电子装置的外部存储设备,例如电子装置上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。进一步地,存储器11还可以既包括电子装置的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于电子装置1的应用软件及各类数据,例如人脸姿态检测程序111的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器13在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据。
通信总线15用于实现这些组件之间的连接通信。
网络接口17可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在电子装置1与其他电子设备之间建立通信连接。
可选地,电子装置1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子装置中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11~17的电子装置1,本领域技术人员可以理解的是,图2示出的结构并不构成对电子装置的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的电子装置1的实施例中,存储器11中存储有人脸姿态检测程序111;处理器13执行存储器11中存储的人脸姿态检测程序111时实现如下步骤:
预设训练人脸图像集;
根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
所述训练人脸图像集包括一张二维人脸图像或视频流。
其中,所述训练图像集中的图像包括左侧姿态人脸子集、正面姿态人脸子集和右侧姿态人脸子集。
所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤包括:
将所述当前人脸图像进行剪裁和定位后,确定所述当前人脸图像中双眼的位置,计算所述双眼中心之间的连线与roll方向上的夹角即为roll方向上的偏转角度。
其中,本发明实施例中的pitch方向是围绕X轴旋转,pitch方向上的角度叫做俯仰角;yaw方向是围绕Y轴旋转,yaw方向上的角度叫做偏航角;roll方向是围绕Z轴旋转,roll方向上的角度叫做偏转角。
所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤进一步包括:
将所述当前人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;
将调整后的当前人脸图像缩放并剪取需要的像素大小;
计算所述人脸图像在pitch方向和yaw方向的偏转角度。
所述人脸姿态检测方法还包括:
根据所述训练好的人脸方向姿态角度计算模型获取所述当前人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,所述人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,通过如下方式确定:
pitch方向上的期望位姿所对应的期望值=pitch方向上的期望角度/pitch方向上的最大预设仰俯角;
yaw方向上的期望位姿所对应的期望值=yaw方向上的期望角度/yaw方向上的最大预设偏航角。
其中,在进行人脸方向姿态角度计算模型训练时,为了进一步提高精确识别pitch方向和yaw方向上的角度,需要将人脸图像进行定位和剪裁。首先将输入的人脸图像检索出双眼的位置,计算两眼中心连接与roll方向(水平方向)之间的夹角,即偏转角度;然后将人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;最后将调整后的人脸图像岁缩放并剪取至需要的像素大小。例如,可以将人脸图像的像素设置为32×32。
在对人脸方向姿态角度计算模型进行训练时,针对每一张人脸图像,均对应一个pitch方向上的期望位姿所对应的期望值和yaw方向上的期望位姿所对应的期望值;通过将上述两个期望值作为网络监督信号对人脸方向姿态角度计算模型进行监督学习。经过大量的姿态样本训练后,人脸方向姿态角度计算模型具有很强的姿态判别能力。
具体地,在对模型进行训练时,针对每一张输入的人脸图像,均对应一个pitch方向上的期望位姿所对应的期望值P1和yaw方向上的期望位姿所对应的期望值Y1。一般地,在对模型进行训练时,针对每一张输入的人脸图像,均对应一个pitch方向上仰俯角Pitch和一个yaw方向上的偏航角Yaw,为了将pitch方向上仰俯角和一个yaw方向上的偏航角的信息作为模型的监督信号,本发明实施例中,将每一仰俯角转换为[-1,1]内的值,以及将每一偏航角转换为[-1,1]内的值。其中,例如,人脸检测系统可以在仰俯姿态变化范围为±60°、偏航姿态变化范围为±90°的情况下,有效地检测出人脸,则采用下述公式(1)进行转换。
P1=Pitch/60°;Y1=Yaw/90° (1)
其中,P1代表pitch方向上的期望位姿所对应的期望值,Y1代表yaw方向上的期望位姿所对应的期望值,Pitch代表pitch方向上期望仰俯角,Yaw代表yaw方向上的期望偏航角。
因此,本发明实施例中,通过将P1、Y1作为网络的监督信号对模型进行监督学习。经过大量的姿态样本训练后,人脸方向姿态角度计算模型具有很强的姿态判别能力。
本发明实施例的人脸姿态估测可以应用的场景包括身份识别和身份认证。如在身份认证或身份识别时,将采集人脸图像的特征与注册过的人脸图像的特征进行对比,判断即使人脸经过偏转后与注册过的图像是否为同一人或该人是谁。
所述残差网络为深度卷积网络,所述残差网络通过增加相当的深度来提高分类的准确率。
所述残差网络的核心是解决了增加深度带来的副作用,即退化问题,这样能够通过单纯地增加网络深度,来提高网络性能。
本实施例提出的电子装置不需要依赖获取人脸关键点、初始化人脸3D模型,只需给模型送入一张二维的图像或者视频流,就能迅速获取精准的人脸方向姿态角度;具有高适配性,能有效嵌入寿险的影像分析系统,为人脸识别的输入提供先序筛选;大大提高了人脸姿态检测的速度和精度,实现了任意角度的人脸姿态检测。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有人脸姿态检测程序111,所述人脸姿态检测程序111可被一个或多个处理器执行,以实现如下操作:
预设训练人脸图像集;
根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
本发明计算机可读存储介质具体实施方式与上述电子装置和方法各实施例基本相同,在此不作累述。
可选地,在其他实施例中,所述人脸姿态检测程序111还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器13)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述人脸姿态检测程序在电子装置中的执行过程。
例如,参照图3所示,为本发明电子装置一实施例中的人脸姿态检测程序111的程序模块示意图,该实施例中,人脸姿态检测程序111可以被分割为预设模块10、训练模块20、发送模块30、分类模块40、回归模块50,示例性地:
所述预设模块10,用于预设训练人脸图像集;
所述训练模块20,用于根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
所述发送模块30,用于将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
所述分类模块40,用于根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
所述回归模块50,用于根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
所述预设模块10、训练模块20、发送模块30、分类模块40、回归模块50等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种人脸姿态检测方法,其特征在于,所述人脸姿态检测方法包括:
预设训练人脸图像集;
根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
2.如权利要求1所述的人脸姿态检测方法,其特征在于,所述训练人脸图像集包括一张二维人脸图像或视频流。
3.如权利要求2所述的人脸姿态检测方法,其特征在于,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤包括:
将所述当前人脸图像进行剪裁和定位后,确定所述当前人脸图像中双眼的位置,计算所述双眼中心之间的连线与roll方向上的夹角即为roll方向上的偏转角度。
4.如权利要求3所述的人脸姿态检测方法,其特征在于,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤进一步包括:
将所述当前人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;
将调整后的当前人脸图像缩放并剪取需要的像素大小;
计算所述人脸图像在pitch方向和yaw方向的偏转角度。
5.如权利要求4所述的人脸姿态检测方法,其特征在于,所述人脸姿态检测方法还包括:
根据所述训练好的人脸方向姿态角度计算模型获取所述当前人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,所述人脸图像在pitch方向和yaw方向上的期望位姿所对应的期望值,通过如下方式确定:
pitch方向上的期望位姿所对应的期望值=pitch方向上的期望角度/pitch方向上的最大预设仰俯角;
yaw方向上的期望位姿所对应的期望值=yaw方向上的期望角度/yaw方向上的最大预设偏航角。
6.一种电子装置,其特征在于,所述电子装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的人脸姿态检测程序,所述人脸姿态检测程序被所述处理器执行时实现如下步骤:
预设训练人脸图像集;
根据所述训练人脸图像集训练基于残差网络的人脸方向姿态角度计算模型;
将接收到的当前人脸图像发送至训练好的人脸方向姿态角度计算模型;
根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间;
根据所述训练好的人脸方向姿态角度计算模型回归所述每一偏转角度对应的角度区间的角度值,从而获得所述当前人脸图像的左侧姿态、正面姿态和右侧姿态的三个姿态角。
7.如权利要求6所述的电子装置,其特征在于,所述训练人脸图像集包括一张二维人脸图像或视频流。
8.如权利要求7所述的电子装置,其特征在于,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤包括:
将所述当前人脸图像进行剪裁和定位后,确定所述当前人脸图像中双眼的位置,计算所述双眼中心之间的连线与roll方向上的夹角即为roll方向上的偏转角度。
9.如权利要求8所述的电子装置,其特征在于,所述根据所述训练好的人脸方向姿态角度计算模型将所述当前人脸图像在roll方向、pitch方向和yaw方向的偏转角度分类到对应的角度区间的步骤进一步包括:
将所述当前人脸图像向反方向进行调整,使得双眼中心连线与水平方向对齐;
将调整后的当前人脸图像缩放并剪取需要的像素大小;
计算所述人脸图像在pitch方向和yaw方向的偏转角度。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有人脸姿态检测程序,所述人脸姿态检测程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的人脸姿态检测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910763210.9A CN110647811A (zh) | 2019-08-15 | 2019-08-15 | 人脸姿态检测方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910763210.9A CN110647811A (zh) | 2019-08-15 | 2019-08-15 | 人脸姿态检测方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110647811A true CN110647811A (zh) | 2020-01-03 |
Family
ID=68990169
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910763210.9A Pending CN110647811A (zh) | 2019-08-15 | 2019-08-15 | 人脸姿态检测方法、装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110647811A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111222469A (zh) * | 2020-01-09 | 2020-06-02 | 浙江工业大学 | 一种由粗到精的人脸姿态量化估计方法 |
CN111259739A (zh) * | 2020-01-09 | 2020-06-09 | 浙江工业大学 | 一种基于3d人脸关键点和几何投影的人脸姿态估计方法 |
CN111291655A (zh) * | 2020-01-21 | 2020-06-16 | 杭州微洱网络科技有限公司 | 一种针对电商图像中度量2d图像中的头部姿态匹配方法 |
CN111310617A (zh) * | 2020-02-03 | 2020-06-19 | 杭州飞步科技有限公司 | 分神驾驶检测方法、装置及存储介质 |
CN111860394A (zh) * | 2020-07-28 | 2020-10-30 | 成都新希望金融信息有限公司 | 一种基于姿态估计和动作检测的动作活体识别方法 |
CN112149593A (zh) * | 2020-09-28 | 2020-12-29 | 深圳前海微众银行股份有限公司 | 刷脸纠偏方法、装置、设备与计算机可读存储介质 |
CN112381046A (zh) * | 2020-11-30 | 2021-02-19 | 华南理工大学 | 多任务姿态不变的人脸识别方法、系统、装置及存储介质 |
CN112528903A (zh) * | 2020-12-18 | 2021-03-19 | 平安银行股份有限公司 | 人脸图像获取方法、装置、电子设备及介质 |
CN113379832A (zh) * | 2021-06-23 | 2021-09-10 | 南京领行科技股份有限公司 | 一种摄像头的位姿调整方法、装置、电子设备及存储介质 |
CN113627355A (zh) * | 2021-08-13 | 2021-11-09 | 合众新能源汽车有限公司 | 用于偏航旋转的人脸的测距方法、设备和计算机可读介质 |
CN113627394A (zh) * | 2021-09-17 | 2021-11-09 | 平安银行股份有限公司 | 人脸提取方法、装置、电子设备及可读存储介质 |
CN111401456B (zh) * | 2020-03-20 | 2023-08-22 | 杭州涂鸦信息技术有限公司 | 人脸姿态识别模型的训练方法及其系统和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760836A (zh) * | 2016-02-17 | 2016-07-13 | 厦门美图之家科技有限公司 | 基于深度学习的多角度人脸对齐方法、系统及拍摄终端 |
CN107704812A (zh) * | 2017-09-18 | 2018-02-16 | 维沃移动通信有限公司 | 一种人脸识别方法及移动终端 |
CN108256454A (zh) * | 2018-01-08 | 2018-07-06 | 浙江大华技术股份有限公司 | 一种基于cnn模型的训练方法、人脸姿态估测方法及装置 |
US20180218198A1 (en) * | 2017-01-27 | 2018-08-02 | Banuba Limited | Computer systems and computer-implemented methods specialized in processing electronic image data |
-
2019
- 2019-08-15 CN CN201910763210.9A patent/CN110647811A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105760836A (zh) * | 2016-02-17 | 2016-07-13 | 厦门美图之家科技有限公司 | 基于深度学习的多角度人脸对齐方法、系统及拍摄终端 |
US20180218198A1 (en) * | 2017-01-27 | 2018-08-02 | Banuba Limited | Computer systems and computer-implemented methods specialized in processing electronic image data |
CN107704812A (zh) * | 2017-09-18 | 2018-02-16 | 维沃移动通信有限公司 | 一种人脸识别方法及移动终端 |
CN108256454A (zh) * | 2018-01-08 | 2018-07-06 | 浙江大华技术股份有限公司 | 一种基于cnn模型的训练方法、人脸姿态估测方法及装置 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259739A (zh) * | 2020-01-09 | 2020-06-09 | 浙江工业大学 | 一种基于3d人脸关键点和几何投影的人脸姿态估计方法 |
CN111222469A (zh) * | 2020-01-09 | 2020-06-02 | 浙江工业大学 | 一种由粗到精的人脸姿态量化估计方法 |
CN111291655B (zh) * | 2020-01-21 | 2023-06-06 | 杭州微洱网络科技有限公司 | 一种针对电商图像中度量2d图像中的头部姿态匹配方法 |
CN111291655A (zh) * | 2020-01-21 | 2020-06-16 | 杭州微洱网络科技有限公司 | 一种针对电商图像中度量2d图像中的头部姿态匹配方法 |
CN111310617A (zh) * | 2020-02-03 | 2020-06-19 | 杭州飞步科技有限公司 | 分神驾驶检测方法、装置及存储介质 |
CN111401456B (zh) * | 2020-03-20 | 2023-08-22 | 杭州涂鸦信息技术有限公司 | 人脸姿态识别模型的训练方法及其系统和装置 |
CN111860394A (zh) * | 2020-07-28 | 2020-10-30 | 成都新希望金融信息有限公司 | 一种基于姿态估计和动作检测的动作活体识别方法 |
CN112149593A (zh) * | 2020-09-28 | 2020-12-29 | 深圳前海微众银行股份有限公司 | 刷脸纠偏方法、装置、设备与计算机可读存储介质 |
CN112381046A (zh) * | 2020-11-30 | 2021-02-19 | 华南理工大学 | 多任务姿态不变的人脸识别方法、系统、装置及存储介质 |
CN112528903A (zh) * | 2020-12-18 | 2021-03-19 | 平安银行股份有限公司 | 人脸图像获取方法、装置、电子设备及介质 |
CN112528903B (zh) * | 2020-12-18 | 2023-10-31 | 平安银行股份有限公司 | 人脸图像获取方法、装置、电子设备及介质 |
CN113379832A (zh) * | 2021-06-23 | 2021-09-10 | 南京领行科技股份有限公司 | 一种摄像头的位姿调整方法、装置、电子设备及存储介质 |
CN113379832B (zh) * | 2021-06-23 | 2022-06-07 | 南京领行科技股份有限公司 | 一种摄像头的位姿调整方法、装置、电子设备及存储介质 |
CN113627355A (zh) * | 2021-08-13 | 2021-11-09 | 合众新能源汽车有限公司 | 用于偏航旋转的人脸的测距方法、设备和计算机可读介质 |
CN113627394A (zh) * | 2021-09-17 | 2021-11-09 | 平安银行股份有限公司 | 人脸提取方法、装置、电子设备及可读存储介质 |
CN113627394B (zh) * | 2021-09-17 | 2023-11-17 | 平安银行股份有限公司 | 人脸提取方法、装置、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110647811A (zh) | 人脸姿态检测方法、装置及计算机可读存储介质 | |
CN108764185B (zh) | 一种图像处理方法及装置 | |
EP3471021B1 (en) | Method for determining target intelligently followed by unmanned aerial vehicle, unmanned aerial vehicle and remote controller | |
CN106952303B (zh) | 车距检测方法、装置和系统 | |
US9891716B2 (en) | Gesture recognition in vehicles | |
CN110826370B (zh) | 车内人员的身份识别方法、装置、车辆及存储介质 | |
CN107862270B (zh) | 人脸分类器训练方法、人脸检测方法及装置、电子设备 | |
CN111160434B (zh) | 目标检测模型的训练方法、装置及计算机可读存储介质 | |
US20200226354A1 (en) | Face pose detection method, device and storage medium | |
CN111797657A (zh) | 车辆周边障碍检测方法、装置、存储介质及电子设备 | |
CN107486863B (zh) | 一种基于感知的机器人主动交互方法 | |
EP3611652A1 (en) | Pedestrian identification device and method, and driving assistance device | |
CN106648078B (zh) | 应用于智能机器人的多模态交互方法及系统 | |
CN110490171B (zh) | 一种危险姿态识别方法、装置、计算机设备及存储介质 | |
CN110533699B (zh) | 基于光流法的像素变化的动态多帧测速方法 | |
CN107704890B (zh) | 一种四元组图像的生成方法和装置 | |
Yu et al. | Spatial cognition-driven deep learning for car detection in unmanned aerial vehicle imagery | |
CN103810696A (zh) | 一种目标对象图像检测方法及装置 | |
JP2019159518A (ja) | 視認状態検知装置、視認状態検知方法および視認状態検知プログラム | |
CN111709404B (zh) | 一种机房遗留物识别方法、系统以及设备 | |
WO2018103024A1 (zh) | 智能导盲方法和装置 | |
CN108881846B (zh) | 信息融合方法、装置及计算机可读存储介质 | |
CN111814776A (zh) | 一种图像处理方法、设备、服务器及存储介质 | |
CN110427828B (zh) | 人脸活体检测方法、装置及计算机可读存储介质 | |
CN115440001B (zh) | 儿童跟随看护方法、装置、跟随机器人及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |