CN107169463A - 人脸检测方法、装置、计算机设备及存储介质 - Google Patents
人脸检测方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN107169463A CN107169463A CN201710365520.6A CN201710365520A CN107169463A CN 107169463 A CN107169463 A CN 107169463A CN 201710365520 A CN201710365520 A CN 201710365520A CN 107169463 A CN107169463 A CN 107169463A
- Authority
- CN
- China
- Prior art keywords
- node
- image
- regression tree
- probability
- sample image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000007637 random forest analysis Methods 0.000 claims description 80
- 238000010276 construction Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 15
- 238000004422 calculation algorithm Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 14
- 238000005192 partition Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 9
- 238000011156 evaluation Methods 0.000 claims description 7
- 206010016256 fatigue Diseases 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 15
- 238000001914 filtration Methods 0.000 description 11
- 239000012141 concentrate Substances 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000001815 facial effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000007935 neutral effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 210000000887 face Anatomy 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T17/00—Three dimensional [3D] modelling, e.g. data description of 3D objects
- G06T17/005—Tree description, e.g. octree, quadtree
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/169—Holistic features and representations, i.e. based on the facial image taken as a whole
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Geometry (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Graphics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及一种人脸检测方法、装置、计算机设备及存储介质。上述方法包括:获取待检测图像;获取预先构建的概率回归模型中本次回归树的初始形状;从待检测图像提取图像特征,并根据图像特征分别计算本次回归树各个叶子结点的概率;从本次回归树中提取所述各个叶子结点的误差;根据各个叶子结点的概率及误差确定本次回归树的形状误差;根据初始形状及形状误差计算得到本次回归树的估计形状;将估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至概率回归模型中的最后一棵回归树,得到最后一棵回归树的估计形状,作为检测到的人脸形状。上述人脸检测方法、装置、计算机设备及存储介质,可以有效解决视频图像序列出现的人脸特征点抖动问题。
Description
技术领域
本发明涉及计算机技术领域,特别是涉及一种人脸检测方法、装置、计算机设备及存储介质。
背景技术
伴随着机器视觉研究的兴起,以人脸检测、标记和分析等技术为基础的应用成为当下的热点,包括人脸身份识别,人脸特效,表情分析识别等。所有这些应用依赖的基础就是人脸检测和标记技术。人脸标记就是给定一张人脸图像,在人脸图像的人脸区域找出面部和五官边缘轮廓的位置,通过找到的位置就可以获得面部轮廓形状和五官的位置及形状,从而可以进一步进行特征分析、属性分析等。
进行人脸标记的算法可主要包括形状模型算法、级联回归算法及基于神经网络和深度神经网络的算法等。其中,形状模型算法对人脸特征点构成的形状进行建模,假设前提是任何一张人脸形状都可以由一个相对稳定的平均形状经过旋转,平移和尺度缩放来得到;级联回归算法是非参数的方法,对图像特征和形状建模,通过样本训练过程学习图像特征和形状之间的映射关系,并且学习这个过程是逐级迭代的过程,逐渐逼近真实形状,直到满足误差要求;基于神经网络和深度神经网络的算法,则是通过多层神经网络模型建立起图像特征和特征点形状的映射关系,在训练过程中通过学习得到输入图像特征和形状的确定函数关系。传统的人脸标记的算法都是基于单帧图像的,而对于视频图像序列而言,由于摄像头的和外部光照环境的影响,视频前后帧的图像即使没有运动也会有明显的差异,会导致特征点的抖动,位置不稳定,利用传统的人脸标记算法对视频图像序列进行人脸检测标记准确性较低。
发明内容
本发明实施例提供一种人脸检测方法、装置、计算机设备及存储介质,可以有效解决视频图像序列出现的人脸特征点抖动问题,使检测到的人脸形状更加稳定、准确。
本发明实施例还提供一种用于人脸检测的模型的构建方法、装置、计算机设备及存储介质,可以有效解决视频图像序列出现的人脸特征点抖动问题,使检测到的人脸形状更加稳定、准确。
一种人脸检测方法,包括:
获取待检测图像;
获取预先构建的概率回归模型中本次回归树的初始形状;
从所述待检测图像提取图像特征,并根据所述图像特征分别计算所述本次回归树各个叶子结点的概率;
从所述本次回归树中提取所述各个叶子结点的误差;
根据所述各个叶子结点的概率及误差确定所述本次回归树的形状误差;
根据所述初始形状及所述形状误差计算得到所述本次回归树的估计形状;
将所述估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至所述概率回归模型中的最后一棵回归树,得到所述最后一棵回归树的估计形状,作为检测到的人脸形状。
一种用于人脸检测的模型的构建方法,包括:
根据样本图像集构建级联回归的概率回归模型,所述概率回归模型包括多级随机森林,每级随机森林包括多棵回归树;
所述根据样本图像集构建级联回归的概率回归模型,包括:
构建每级随机森林时,从所述样本图像集中随机选取第一像素对集合;
根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并根据分配到所述各个叶子结点的样本图像的真实形状与所述生成的回归树的初始预测形状确定所述各个叶子结点的误差;
根据所述生成的回归树的初始预测形状与所述各个叶子结点的误差计算所述生成的回归树的预测形状,并将所述预测形状作为相邻的下一棵回归树的初始预测形状迭代生成所述下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
一种人脸检测装置,包括:
图像获取模块,用于获取待检测图像;
初始形状获取模块,用于获取预先构建的概率回归模型中本次回归树的初始形状;
概率计算模块,用于从所述待检测图像提取图像特征,并根据所述图像特征分别计算所述本次回归树各个叶子结点的概率;
误差提取模块,用于从所述本次回归树中提取所述各个叶子结点的误差;
形状误差确定模块,用于根据所述各个叶子结点的概率及误差确定所述本次回归树的形状误差;
估计形状计算模块,用于根据所述初始形状及所述形状误差计算得到所述本次回归树的估计形状;
迭代计算模块,用于将所述估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至所述概率回归模型中的最后一棵回归树,得到所述最后一棵回归树的估计形状,作为检测到的人脸形状。
一种用于人脸检测的模型的构建装置,包括:
模型构建模块,用于根据样本图像集构建级联回归的概率回归模型,所述概率回归模型包括多级随机森林,每级随机森林包括多棵回归树;
所述模型构建模块,包括:
第一选取单元,用于构建每级随机森林时,从所述样本图像集中随机选取第一像素对集合;
回归树生成单元,用于根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点;
概率配置单元,用于配置生成的回归树各个叶子结点的概率;
误差确定单元,用于根据生成的回归树中分配到各个叶子结点的样本图像的真实形状与所述生成的回归树的初始预测形状确定所述各个叶子结点的误差;
迭代生成单元,用于根据所述生成的回归树的初始预测形状与所述各个叶子结点的误差计算所述生成的回归树的预测形状,并将所述预测形状作为相邻的下一棵回归树的初始预测形状迭代生成所述下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的人脸检测方法。
一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的用于人脸检测的模型的构建方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的人脸检测方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的用于人脸检测的模型的构建方法。
上述人脸检测方法、装置、计算机设备及存储介质,从待检测图像提取图像特征,并计算在概率回归模型的本次回归树各个叶子结点的概率,根据各个叶子结点的概率及误差确定本次回归树的形状误差,从而计算得到本次回归树的估计形状,将该估计形状作为相邻的下一回归树的初始形状进行迭代计算,从而逐步逼近真实误差,得到准确的人脸形状,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
上述用于人脸检测的模型的构建方法、装置、计算机设备及存储介质,根据样本图像集构建级联回归的概率回归模型,通过随机选取的第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并确定各个叶子结点的误差,得到生成的回归树的预测形状,从而将该预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,概率回归模型中的每一级随机森林及每级随机森林下的每一棵回归树都是对真实误差的进一步预测,通过该概率回归模型进行人脸检测时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
附图说明
图1为一个实施例中计算机设备的框图;
图2为一个实施例中人脸检测方法的流程示意图;
图3为一个实施例中用特征点组成的人脸形状示意图;
图4(a)为一个实施例中概率回归模型的示意图;
图4(b)为一个实施例中回归树的示意图;
图5为一个实施例中计算本次回归树各个叶子结点的概率的流程示意图;
图6为另一个实施例中回归树的示意图;
图7为一个实施例中对待检测图像进行中值滤波处理的流程示意图;
图8为一个实施例中构建级联回归的概率回归模型的流程示意图;
图9为一个实施例中对样本图像集的样本图像进行划分,分裂生成回归树的各个结点的流程示意图;
图10为一个实施例中确定各个结点的划分像素对的流程示意图;
图11为一个实施例中计算划分后的样本图像在结点的误差的流程示意图;
图12为一个实施例中人脸检测装置的框图;
图13为一个实施例中概率计算模块的框图;
图14为一个实施例中滤波模块的框图;
图15为一个实施例中模型构建模块的框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中计算机设备的框图。如图1所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器及网络接口。其中,计算机设备的非易失性存储介质存储有操作系统及计算机可执行指令,该计算机可执行指令用于实现本发明实施例中提供的适用于计算机设备的一种人脸检测方法。该处理器用于提供计算和控制能力,支撑整个计算机设备的运行。计算机设备中的内存储器为非易失性存储介质中的操作系统及计算机可执行指令的运行提供环境,网络接口用于与其它的计算机设备进行网络通信。该计算机设备可以是手机、平板电脑、PC(personal computer)等终端,也可以是服务器等。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体地计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在另一个实施例中,图1所示的计算机设备的非易失性存储介质存储有操作系统及计算机可执行指令,该计算机可执行指令还用于实现本发明实施例中提供的适用于计算机设备的一种用于人脸检测的模型的构建方法。
如图2所示,在一个实施例中,提供一种人脸检测方法,包括以下步骤:
步骤S210,获取待检测图像。
待检测图像指的是需要检测人脸形状的图像,其中,人脸形状可包括面部轮廓形状和五官的位置及形状等。人脸形状可由在人脸标记的各个特征点所在的位置进行表示,如图3所示,图3为一个实施例中用特征点组成的人脸形状示意图,图3中各个带有标号的点即为特征点,根据各个特征点的位置即可组成人脸形状,其中,标号1至17的特征点表示面部轮廓形状,标号18至27的特征点表示眉毛位置及形状,标号28至37的特征点表示鼻子位置及形状,标号37至46的特征点表示眼睛位置及形状,标号49至68的特征点表示嘴巴位置及形状。
在一个实施例中,计算机设备获取待检测图像,若该待检测图像为彩色图像,可将彩色图像按照对应的转化矩阵转化为灰度图像,其中,灰度图像指的是每个像素只有一个采样颜色的图像。计算机设备可先根据灰度图像的图像特征粗略检测待检测图像中是否包含人脸,若包含,可从灰度图像中提取检测到的人脸,并将提取的人脸放入预设的单位矩形区域内。若待检测图像中包含多个人脸,可分别将人脸提取放入预设的单位矩形区域内,再逐一进行检测人脸形状。
进一步地,计算机设备可通过摄像头等实时采集待检测图像,也可以获取预先存储的待检测图像,待检测图像可以是视频流中的帧图像,也可以是静态图像等。
步骤S220,获取预先构建的概率回归模型中本次回归树的初始形状。
概率回归模型包含级联的随机森林,概率回归模型中可包括多级随机森林,每级随机森林下可包括多棵回归树,每级随机森林及每级随机森林下的每棵回归树具备级联关系,上一级随机森林输出的估计形状是相邻的下一级随机森林的初始形状,同级随机森林中上一棵回归树输出的估计形状是相邻的下一棵回归树的初始形状。回归树使用了二叉树将预测空间划分为若干子集,回归树中的每个叶子结点对应划分的不同区域,每个进入回归树的图像最终均会被分配到唯一的叶子结点上。
计算机设备可获取预先生成的模型文件,并对模型文件进行解析,根据模型文件中包含的信息重新构建级联的概率回归模型,并根据该概率回归模型检测待检测人脸图像中的人脸形状,其中,模型文件包含的信息可包括随机森林的级数、每级随机森林的回归树数量、每棵回归树的深度、回归树中每个结点的结点信息等。
针对于概率回归模型中的每一级随机森林,每级随机森林下的每棵回归树进行迭代计算,最后得到检测到的人脸形状。计算机设备进行迭代计算时,需获取概率回归模型中本次回归树的初始形状,其中,本次回归树指的是正在进行估计形状计算的回归树。进一步地,计算机设备解析模型文件,还可获取在根据样本图像集构建概率回归模型时,该样本图像集中各个样本图像的平均形状,并将样本图像集中各个样本图像的平均形状作为概率回归模型第一级随机森林的第一棵回归树的初始形状。
步骤S230,从待检测图像提取图像特征,并根据图像特征分别计算本次回归树各个叶子结点的概率。
计算机设备可根据本次回归树中各个结点包含的对应的结点信息,从待检测图像中提取图像特征,其中,结点信息用于表示对应结点的划分规则。进一步地,结点信息可包括划分像素对的坐标信息,计算机设备可根据划分像素对的坐标信息,从放有提取的人脸的预设单位矩形区域内对应的位置处提取图像特征。计算机设备可根据从待检测图像提取的与本次回归树各个结点对应的图像特征,分别计算各个叶子结点的概率,其中,叶子结点指的是度为0的结点,叶子结点没有子结点,也可称为终端结点。
步骤S240,从本次回归树中提取各个叶子结点的误差。
计算机设备可从模型文件中读取本次回归树中各个叶子结点的误差,其中,各个叶子结点的误差指的是对应叶子结点计算得到的估计形状与待检测图像的真实形状之间的差异值,各个叶子结点的误差可为建立概率回归模型时根据样本图像集中大量的样本图像计算得到。
步骤S250,根据各个叶子结点的概率及误差确定本次回归树的形状误差。
计算机设备可根据本次回归树各个叶子结点的概率及对应的误差进行加权和计算,分别计算各个叶子结点的概率及对应的误差的乘积,并将计算得到的乘积进行累加,得到本次回归树的形状误差。本次回归树的形状误差即为本次回归树计算的估计形状与待检测图像的真实形状之间的差异值。
步骤S260,根据初始形状及形状误差计算得到本次回归树的估计形状。
计算机设备可将本次回归树的初始形状与形状误差进行累加,即可得到本次回归树的估计形状,假设本次回归树的估计形状为sk,初始形状为sk-1,计算得到的形状误差为△sk,则sk=sk-1+△sk,其中,sk-1可为本次回归树相邻的上一棵回归树计算得到的估计形状。
步骤S270,将估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至概率回归模型中的最后一棵回归树,得到最后一棵回归树的估计形状,作为检测到的人脸形状。
计算得到本次回归树的估计形状后,可将本次回归树的估计形状作为相邻的下一回归树的初始形状,并重复执行步骤S320至步骤S360,得到该下一回归树的估计形状,再将该下一回归树的估计形状作为相邻的再下一棵回归树的初始形状……以此类推,在概率回归模型中进行迭代计算,直至概率回归模型的最后一级随机森林的最后一棵回归树,计算得到最后一级随机森林的最后一棵回归树的估计形状,即为检测到的人脸形状。概率回归模型中的每级随机森林,每级随机森林下的每棵回归树,均是对待检测图像的真实形状的逼近。在概率模型中按照上述方式进行迭代计算,可逐步从最初样本图像集中各个样本图像的平均形状逐步逼近待检测图像的真实形状,从而得到检测到的人脸形状。
图4(a)为一个实施例中概率回归模型的示意图。如图4(a)所示,该概率回归模型中包括T级随机森林410,上一级随机森林Rt-1输出的估计形状为St-1,作为相邻的下一级随机森林Rt输入的初始形状。每一级随机森林410下还包括K棵回归树420,上一棵回归树rk-1输出的估计形状为sk-1,作为相邻的下一棵回归树rk输入的初始形状。其中,S0表示从模型文件中获取的样本图像集中各个样本图像的平均形状,通过多次的迭代计算,逐步逼近待检测图像的真实形状,最后一级随机森林RT计算得到的估计形状ST,作为检测到的人脸形状。
图4(b)为一个实施例中回归树的示意图。如图4(b)所示,回归树rk包括多个结点422,可根据各个结点422包含的对应的结点信息从待检测图像中提取图像特征,并根据提取的图像特征分别计算回归树rk各个叶子结点424的概率,从回归树rk中提取各个叶子结点424的误差,根据各个叶子结点424的概率及对应的误差计算回归树rk的形状误差,再根据回归树rk的初始形状sk-1及计算得到的形状误差得到回归树rk的估计形状sk。
上述人脸检测方法,从待检测图像提取图像特征,并计算在概率回归模型的本次回归树各个叶子结点的概率,根据各个叶子结点的概率及误差确定本次回归树的形状误差,从而计算得到本次回归树的估计形状,将该估计形状作为相邻的下一回归树的初始形状进行迭代计算,从而逐步逼近真实误差,得到准确的人脸形状,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
如图5所示,在一个实施例中,步骤S330从待检测图像提取图像特征,并根据图像特征分别计算本次回归树各个叶子结点的概率,包括以下步骤:
步骤S502,从本次回归树的根结点开始,根据各个结点的结点信息从待检测图像提取图像特征。
回归树中可包括有多个结点,各个结点包含有对应的结点信息,其中,结点信息可包括划分像素对的坐标信息,其中,划分像素对指的是结点用于划分样本图像的像素对,划分像素对的坐标信息包括有像素对的第一像素坐标及第二像素坐标。计算机设备可从本次回归树的根结点开始,根据各个结点包含的划分像素对的坐标信息从待检测图像中提取对应位置的第一灰度值及第二灰度值,并根据第一灰度值及第二灰度值计算灰度差值,作为待检测图像与对应结点匹配的图像特征。
进一步地,计算机设备可根据各个结点包含的划分像素对的坐标信息,从放有提取的人脸的预设单位矩形区域内,提取对应位置的第一灰度值及第二灰度值,根据第一灰度值及第二灰度值计算灰度差值,作为待检测图像与对应结点匹配的图像特征。可以理解地,图像特征也可以是其它的特征信息,例如像素的梯度特征、纹理特征等,并不仅限于灰度差值。
步骤S504,根据各个结点提取的图像特征计算对应结点的分支概率,分支概率包括左分支概率及右分支概率,右分支概率与对应结点提取的图像特征成正相关关系,左分支概率与右分支概率之和为1。
各个结点包含的结点信息还可包括对应的划分阈值及分支概率,其中,划分阈值指的是结点用于划分样本图像的图像特征阈值;回归树除叶子结点外的各个结点,均可分裂生成左分支结点及右分支结点,分支概率指的是结点上样本图像被分配到该结点的左分支结点及右分支结点的概率,分支概率可包括左分支概率及右分支概率,左分支概率用于表示分配到结点的样本图像被划分到该结点的左分支结点的概率,右分支概率用于表示分配到结点的样本图像被划分到该结点的右分支结点的概率。
在本实施例中,可根据下列公式(1)计算得到各个结点的右分支概率:
其中,pr表示结点的右分支概率,α为常量,取值一般可在(0.05,0.3]之间,g为待检测图像中与该结点对应的灰度差值,th为与该结点对应的划分阈值。结点的右分支概率pr与提取的与该结点对应灰度差值g成正相关关系。结点的左分支概率与右分支概率之和为1,左分支概率pl=1-pr。
计算机设备可计算本次回归树中除叶子结点外的各个结点的右分支概率及左分支概率,从根结点开始,先计算根结点的左分支概率及右分支概率,然后计算由根结点分裂生成的左分支结点的左分支概率及右分支概率,计算由根结点分裂生成的右分支结点的左分支概率及右分支概率……以此类推,按顺序逐级计算回归树每个层级上各个结点的分支概率,直至最后一级深度则停止计算。
步骤S506,确定各个叶子结点所经历过的分支对应的分支概率,并确定对应的分支概率计算得到各个叶子结点的概率。
可分别确定本次回归树中各个叶子结点所经历过的分支对应的分支概率,并将叶子结点所经历过的分支对应的分支概率进行相乘,得到对应叶子结点的概率。
举例对上述计算回归树各个叶子结点的步骤进行说明。图6为另一个实施例中回归树的示意图。如图6所示,回归树rk包括7个结点,其中,结点1为根结点,结点1分裂生成结点2及结点3,结点2又分裂生成结点4与结点5,结点3分裂生成结点6与结点7,结点4至结点7为叶子结点。计算机设备可根据公式(1)分别计算回归树rk除叶子结点外各个结点的分支概率,从根结点1开始,计算根结点1的右分支概率pr1及左分支概率pl1=1-pr1,再计算由根结点1分裂生成的左分支结点2的右分支概率pr2及左分支概率pl2=1-pr2,计算由根结点1分裂生成的分支结点3的右分支概率pr3及左分支概率pl3=1-pr3。叶子结点4所经历过的分支对应的分支概率包括结点1的左分支概率pl1及结点2的左分支概率pl2,因此叶子结点4的概率为pl1*pl2;叶子结点5所经历过的分支对应的分支概率包括结点1的左分支概率pl1及结点2的右分支概率pr2,因此叶子结点5的概率为pl1*pr2;叶子结点6所经历过的分支对应的分支概率包括结点1的右分支概率pr1及结点3的左分支概率pl3,因此叶子结点6的概率为pr1*pl3;叶子结点7所经历过的分支对应的分支概率包括结点1的右分支概率pr1及结点3的右分支概率pr3,因此叶子结点7的概率为pr1*pr3。
在本实施例中,可根据待检测图像的图像特征计算回归树各个叶子结点的概率,使得根据概率回归模型检测待检测图像的人脸形状时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
在一个实施例中,在步骤S310获取待检测图像之后,还包括:对待检测图像进行中值滤波处理。
计算机设备获取待检测图像,可对待检测图像进行去噪滤波处理。在本实施例中,计算机设备将待检测图像转化为灰度图像,可对该灰度图像进行中值滤波处理,中值滤波是一种非线性平滑技术,可将该灰度图像中任意一点的像素值用该点的一个区域内各点的像素值的中值代替,让该点周围的像素值接近真实值,从而可消除待检测图像中孤立的噪声点。可以理解地,除了采用中值滤波对待检测图像进行去噪外,还可采用均值滤波、小波变换滤波等其它滤波方法进行降噪处理。
如图7所示,在一个实施例中,对待检测图像进行中值滤波处理,包括以下步骤:
步骤S702,在待检测图像中定义预设大小的窗口。
计算机设备可在待检测图像转化的灰度图像中定义预设大小的窗口,预设大小可为N*N大小,其中,N为奇数,例如,N可为5、7等,N不宜过大或过小,当N太大时,会导致灰度图像中丢失一些细节,造成图像失真,当N太小时,会导致去噪效果不明显。
步骤S704,计算窗口包含的各个像素点的灰度值的中值。
可提取灰度图像中定义的预设大小的窗口中的各个像素点的灰度值,并将各个像素点的灰度值按大小顺序进行排列,生成一个数列,并获取位于该数列中间位置的灰度值,即为窗口包含的各个像素点的灰度值的中值。
步骤S706,将位于窗口中心的像素点的灰度值替换为中值。
计算机设备可将灰度图像中,位于定义的预设大小的窗口中心的像素点的灰度值替换为计算得到的该窗口的中值,完成中值滤波。可重复多次在灰度图像中定义不同位置的窗口进行中值滤波处理。进一步地,可对包含有提取的人脸的预设的单位矩形区域进行中值滤值处理,在该单位矩形区域内定义预设大小的窗口,并将位于该窗口中心的像素点的灰度值替换为该窗口包含的各个像素点的灰度值的中值。
在本实施例中,获取待检测图像后,可对待检测图像进行滤波处理,降低待检测图像中的噪声,减弱视频图像序列中由于硬件和环境光照的变化导致的前后帧图像的噪声影响,使最终检测到的人脸形状更为稳定、准确。
在一个实施例中,在步骤S310获取待检测图像之前,还包括:根据样本图像集构建级联回归的概率回归模型。
样本图像集中包含大量的样本图像,每个样本图像均是对人脸区域进行过特征点标记的图像,样本图像的人脸形状用对应特征点的坐标信息进行表示。由于不同的样本图像的分辨率及姿态等存在差异,需对样本图像集中的各个样本图像进行归一化处理,通过将各个样本图像的特征点进行同构尺度的缩放、平移等操作,将各个样本图像的人脸形状都映射到统一的标准矩阵内,并得到各个样本图像在标准矩阵内对应的形状信息,包括对应各个特征点的坐标信息等。统一的标准矩阵可以为1*1的单位矩阵,也可为其它大小的矩阵。对样本图像集中各个样本图像进行归一化处理,可保证各个样本图像上的特征点所在的矩阵是一致的,方便进行训练,构建得到概率回归模型。
在一个实施例中,为了防止样本图像集中的样本图像过拟合,可重新计算样本图像集中各个样本图像的人脸形状,其中,为了得到一致假设而使假设变得过度严格称为过拟合,当样本图像过拟合时,将导致构建的概率回归模型检测人脸形状的准确性差。计算机设备可将样本图像集中的样本图像进行分组,例如,将所有样本图像分成多个组,每个组中包含的M个样本图像,其中,M可为大于2的整数。
计算机设备可对分组后的样本图像循环进行如下处理:选取任一样本图像,从选取的样本图像所属的组别中随机选择预设数量的样本图像,将预设数量的样本图像进行加权和计算得到新样本图像,并将选取的样本图像替换为该新样本图像。例如,选取任一样本图像Ii,该样本图像Ii属于第3组别,则从第3组别中随机选取2个样本图像Ik及Ij,按照预设的权值,对样本图像Ik及Ij的人脸形状进行加权和计算,得到新的人脸形状,并将样本图像Ii的人脸形状替换为新的人脸形状。可以理解地,预设数量还可以是3、4等,并不限于此,预设的权值也可根据实际需求进行计算,也可对预设数量的样本图像进行均值计算得到新样本图像的人脸形状,并进行替换。计算机设备可进行第二预设次数的样本替换,其中,第二预设次数可根据实际需求及样本图像的数量进行设定,例如,计算机设备对分组后的样本图像循环进行100次、150次的样本替换等。
如图8所示,在一个实施例中,根据样本图像集构建级联回归的概率回归模型,包括以下步骤:
步骤S802,构建每级随机森林时,从样本图像集中随机选取第一像素对集合。
概率回归模型中包含级联的随机森林,概率回归模型中可包括多级随机森林,每级随机森林下可包括多棵回归树。生成概率回归模型是一个迭代生成的过程,逐级生成随机森林,并逐棵生成每级随机森林下的回归树。当构建每级随机森林时,计算机设备均需从样本图像集随机选取第一像素对集合,第一像素对集合中可包含N对像素点,每对像素对中包括随机选取的两个像素点的坐标信息,其中,N可为较大的整数,例如300、400、500等。
进一步地,计算机设备可按照下述公式(2)从样本图像集中随机选取第一像素对集合。
P=e-λ||u-v|| (2);
其中,P为获取分布在人脸五官边缘或人脸轮廓附近的像素点的因子,λ为通用系数,u和v分别表示随机选取的两个像素点的坐标信息,可通过公式(2)对从样本图像集中随机选取的像素对进行筛选,当根据随机选取的像素对计算得到的P小于预设阈值Tp时,则将该像素对放在第一像素对集合中。通过公式(2)随机选取第一像素对,无须计算选取的像素对的梯度差值,即可选择分布在人脸五官边缘或人脸轮廓附近的像素点,计算方式简单快速,且构建的概率回归模型更加准确。
步骤S804,根据第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并根据分配到各个叶子结点的样本图像的真实形状与生成的回归树的初始预测形状确定各个叶子结点的误差。
计算机设备构建每级随机森林时,可根据随机选取的第一像素对集合构建生成对应随机森林下的多棵回归树。构建生成每棵回归树时,从回归树的根结点开始,对样本图像集中的样本图像进行划分,分裂生成该回归树的各个结点,样本图像集中的每个样本图像最终均会被划分到唯一的叶子结点上。
对样本图像集的样本图像进行划分,生成回归树时,可对生成的回归树的叶子结点的概率进行配置。在分裂生成回归树的各个结点时,对进行样本图像划分的结点配置对应的分支概率,进行样本图像划分的结点可分裂生成左分支结点及右分结点,分支概率可包括左分支概率及右分支概率,分别对应进行样本图像划分的结点的左分支及右分支。可按照公式(1)配置各个进行样本图像划分的结点的右分支概率pr,右分支概率与样本图像在对应结点提取的图像特征成正相关关系,并配置各个结点的左分支概率pl=1-pr,进行样本图像划分的结点的左分支概率与右分支概率之和为1。计算机设备对生成的回归树除叶子结点外的各个结点配置对应的分支概率后,可配置各个叶子结点的概率为叶子结点所经历过的分支对应的分支概率的乘积。
计算机设备可迭代生成每级随机森林,以及每级随机森林下的每棵回归树,最终构建得到级联的概率回归模型。进行迭代生成回归树时,需获取生成的回归树的初始预测形状,计算机设备可求取样本图像集中所有样本图像的平均形状,并将平均形状作为生成的第一级随机森林中的第一棵回归树的初始预测形状。样本图像集中的每个样本图像最终均会被分配到生成的回归树上唯一的叶子结点,可根据分配到各个叶子结点的样本图像的真实形状与生成的回归树的初始预测形状确定对应叶子结点的误差,其中,样本图像的真实形状即为样本图像通过特征点表示的人脸形状。
进一步地,分别计算分配到各个叶子结点的样本图像的真实形状与初始预测形状的差值,并求取对应叶子结点上样本图像的真实形状与初始预测形状的差值的均值,即为该叶子结点的误差。例如,回归树的叶子结点4中分配有2个样本图像,分别计算2个样本图像与该回归树的初始预测形状的差值为x1及x2,则叶子结点4的误差为(x1+x2)/2。
步骤S806,根据生成的回归树的初始预测形状与各个叶子结点的误差计算生成的回归树的预测形状,并将预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
生成的回归树的各个叶子结点的误差的累加,即为该生成的回归树的误差,将该生成的回归树的误差与初始预测形状进行累加,即可得到该生成的回归树的预测形状,并将该预测形状作为相邻的下一棵回归树的初始预测形状,重复执行步骤S804生成下一棵回归树,并重复执行步骤S802及步骤S804生成下一级随机森林,直至完成概率回归模型最后一级随机森林的回归树生成。生成的概率模型中的每级随机森林下的每棵回归树的误差的累加逼近样本图像集中各个样本图像的真实形状与平均形状的真实误差,每级随机森林,以及每级随机森林下的每棵树都是对各个样本图像的真实形状与平均形状的真实误差的进一步预测。
在本实施例中,根据样本图像集的各个样本图像构建生成级联的概率回归模型,概率回归模型中的每一级随机森林及每级随机森林下的每一棵回归树都是对真实误差的进一步预测,通过该概率回归模型进行人脸检测时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
如图9所示,在一个实施例中,根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,包括:
从回归树的根结点开始,对根结点及分裂生成的各个结点进行如下处理:
步骤S902,从第一像素对集合中随机选取第二像素对集合。
从回归树的根结点开始,对每个结点进行分裂时,均需从第一像素对集合中随机选取K对像素对,生成第二像素对集合,其中,K为整数,K是相对第一像素对集合的数量N较小的值,例如N为400时,K可为15、20、30等。
步骤S904,根据第二像素对集合对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
计算机设备每一次将回归数据结点分裂生成新的分支结点,均是对分配到进行分裂的结点的样本图像的再次划分。可根据实际需求预先设定回归树的深度,回归树的深度指的是回归树中最深结点所在的层数,例如,根结点所在的层数为1,根结点分裂生成的分支结点所在的层数为2,根结点分裂生成的分支结点再分裂生成的分支结点所在的层数为3等,依此类推。
计算机设备可根据从第一像素对集合中随机选取的第二像素对集合,对分配到各个结点的样本图像进行划分,将对应结点分裂生成新的分支结点,同时,确定结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
如图10所示,在一个实施例中,步骤S904包括以下步骤:
步骤S1002,循环第一预设次数从第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在结点的误差。
结点的划分像素对,指的是根据该划分像素对对分配到该结点的样本图像进行划分后,样本图像在该结点的误差最小。计算机设备可从第二像素对集合中随机选取一对像素对,并根据该像素对从各个样本图像对应的位置提取图像特征,将提取的图像特征与预设阈值进行比对,并根据比对结果将样本图像分配到该结点的左分支结点或右分支结点。样本划分完成后,可根据分配到左分支结点的样本图像计算左分支误差,根据分配到右分支结点的样本图像计算右分支误差,从而确定该结点在选取的像素对下的误差。计算机设备可循环第一预设次数,例如10次、15次或20次等从第二像素对集合中随机选取像素对进行划分,第一预设次数可根据第二像素对集合中包含的像素对数量。
步骤S1004,从第二像素对集合中选取划分后的样本图像在结点的误差最小的像素对作为结点的划分像素对。
计算机设备可循环多次从第二像素对集合中随机选取像素对,对分配到结点的样本图像进行划分,并计算结点在该选取的像素对下的误差,从而可从中选取划分后的样本图像在该结点的误差最小的像素对作为该结点的划分像素对。
现根据图6对上述生成回归树的过程进行说明。如图6所示,假设样本图像集中共有1000个样本图像,从根结点1开始,从第一像素对集合中随机选取20个像素对生成第二像素对集合,循环多次从该20对像素对中随机选取一对像素对,对1000个样本图像进行划分,并计算划分后的样本图像在根结点1的误差,从中选取误差最小的像素对作为根结点1的划分像素对(u1,v1)。根据该划分像素对(u1,v1)将第1-500个样本图像分配至根结点1的左分支结点2,将第501-1000个样本图像分配至根结点1的右分支结点3。再对分配到结点2的第1-500个样本图像进行划分,确定结点2的划分像素对(u2,v2),并将第1-250个样本图像分配到结点2的左分支结点4,将第251-500个样本图像分配到结点2的右分支结点5。对分配到结点3的第501-1000个样本图像进行划分,确定结点3的划分像素对(u3,v3),并将第501-750个样本图像分配到结点3的左分支结点6,将第751-1000个样本图像分配到结点3的右分支结点7,到达预设深度3,则不进行再次划分。可以理解地,本实施例仅是用于对生成回归树的过程的说明,实际生成回归树时,对样本图像进行划分时,落在结点的左分支结点与右分支结点的样本图像数量不一定相等,划分到左、右分支结点的样本图像也不具备任何顺序关系,完全由该结点的划分像素对决定各样本图像的划分。
在本实施例中,确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
如图11所示,在一个实施例中,步骤S1002循环第一预设次数从第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在结点的误差,包括以下步骤:
步骤S1102,获取从第二像素对集合中随机选取的一对像素对的坐标信息。
步骤S1104,根据坐标信息从分配到结点的样本图像的对应位置提取图像特征。
计算机设备从回归树的根结点开始,当对各个结点进行分裂时,可从第二像素对中随机选取一对像素对,并获取选取的像素对包含的两个像素点的坐标信息,根据该坐标信息从分配到进行分裂的结点的各个样本图像的对应位置,提取对应的图像特征。在本实施例中,可分别在分配到结点的样本图像的对应位置提取第三灰度值及第四灰度值,并计算第三灰度值及第四灰度值的灰度差值,作为样本图像在该结点的图像特征。
步骤S1106,将从样本图像中提取的图像特征与预设的划分阈值进行比较,并将图像特征小于划分阈值的样本图像划分至左分支结点,将图像特征大于或等于划分阈值的样本图像划分至右分支结点。
划分阈值可为预先设定好的固定的图像特征阈值,也可是从预设的图像特征数值范围内随机选取的划分阈值。计算机设备可将分配到结点的样本图像的对应图像特征与划分阈值进行比较,并将图像特征小于划分阈值的样本图像划分至左分支结点,将图像特征大于或等于划分阈值的样本图像划分至右分支结点。可以理解地,也可将图像特征小于划分阈值的样本图像划分至右分支结点,将图像特征大于或等于划分阈值的样本图像划分至左分支结点。
步骤S1108,计算处于左分支结点的样本图像的第一平均形状,并根据处于左分支结点的样本图像的真实形状与第一平均形状确定左分支误差。
根据分配到结点的左分支结点的各个样本图像的真实形状求取均值,得到第一平均形状,并分别计算分配到左分支结点的各个样本图像的真实形状与第一平均形状的差值,将分配到左分支结点的各个样本图像的真实形状与第一平均形状的差值进行累加,即可得到结点的左分支误差。
步骤S1110,计算处于所述右分支结点的样本图像的第二平均形状,并根据所述处于右分支结点的样本图像的真实形状与第二平均形状确定右分支误差。
根据分配到结点的右分支结点的各个样本图像的真实形状求取均值,得到第二平均形状,并分别计算分配到右分支结点的各个样本图像的真实形状与第二平均形状的差值,将分配到右分支结点的各个样本图像的真实形状与第二平均形状的差值进行累加,即可得到结点的右分支误差。
步骤S1112,根据左分支误差与右分支误差之和及分配到结点的样本图像的数量求取均值,得到结点的误差。
计算机设备可计算随机选取的像素对下,正在进行分裂的结点的左分支误差及右分支误差,并求取左分支误差及右分支误差之和,将该左分支误差及右分支误差之和除以分配到该结点样本图像的数量,得到该结点的误差。针对回归树的各个结点,从第一像素对集合中随机选取第二像素对集合,循环多次从第二像素对集合中随机选取一对像素对,并按照步骤S1102至步骤S1112计算该选取的像素对下,对应结点的误差,再从中选取误差最小的像素对作为该结点的划分像素对。
在一个实施例中,根据样本图像集中的样本图像构建生成级联的概率回归模型后,可生成对应的模型文件,模型文件中存储有概率回归模型包含的随机森林级数,每级随机森林下的回归树数量,每棵回归树的深度,每棵回归树中各个结点的划分像素对、划分阈值及配置的分支概率,以及各个叶子结点配置的概率、误差等信息。
在本实施例中,可计算随机选取的像素对下结点的误差,从而确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
在一个实施例中,提供一种用于人脸检测的模型的构建方法,该方法包括:
根据样本图像集构建级联回归的概率回归模型,概率回归模型包括多级随机森林,每级随机森林包括多棵回归树。
在一个实施例中,根据样本图像集构建级联回归的概率回归模型,包括以下步骤:
构建每级随机森林时,从样本图像集中随机选取第一像素对集合。
根据第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并根据分配到各个叶子结点的样本图像的真实形状与生成的回归树的初始预测形状确定各个叶子结点的误差。
根据生成的回归树的初始预测形状与各个叶子结点的误差计算生成的回归树的预测形状,并将预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
在一个实施例中,配置生成的回归树各个叶子结点的概率,包括以下步骤:
在分裂生成回归树的各个结点时,对进行样本图像划分的结点配置对应的分支概率,分支概率包括左分支概率及右分支概率,右分支概率与样本图像的图像特征成正相关关系,左分支概率与右分支概率之和为1。
配置生成的回归树的各个叶子结点的概率为叶子结点所经历过的分支对应的分支概率的乘积。
上述用于人脸检测的模型的构建方法,根据样本图像集构建级联回归的概率回归模型,通过随机选取的第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并确定各个叶子结点的误差,得到生成的回归树的预测形状,从而将该预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,概率回归模型中的每一级随机森林及每级随机森林下的每一棵回归树都是对真实误差的进一步预测,通过该概率回归模型进行人脸检测时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
在一个实施例中,根据第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,包括:
从回归树的根结点开始,对根结点及分裂生成的各个结点进行如下处理:
从第一像素对集合中随机选取第二像素对集合;
根据第二像素对集合对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
在一个实施例中,根据第二像素对集合对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点,包括以下步骤:
循环第一预设次数从第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在结点的误差。
从第二像素对集合中选取划分后的样本图像在结点的误差最小的像素对作为结点的划分像素对。
在本实施例中,确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
在一个实施例中,循环第一预设次数从第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在结点的误差,包括以下步骤:
获取从第二像素对集合中随机选取的一对像素对的坐标信息。
根据坐标信息从分配到结点的样本图像的对应位置提取图像特征。
将从样本图像中提取的图像特征与预设的划分阈值进行比较,并将图像特征小于划分阈值的样本图像划分至左分支结点,将图像特征大于或等于划分阈值的样本图像划分至右分支结点。
计算处于左分支结点的样本图像的第一平均形状,并根据处于左分支结点的样本图像的真实形状与第一平均形状确定左分支误差。
计算处于右分支结点的样本图像的第二平均形状,并根据处于右分支结点的样本图像的真实形状与第二平均形状确定右分支误差。
根据左分支误差与右分支误差之和及分配到结点的样本图像的数量求取均值,得到结点的误差。
在本实施例中,可计算随机选取的像素对下结点的误差,从而确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
如图12所示,在一个实施例中,提供一种人脸检测装置1200,包括图像获取模块1210、初始形状获取模块1220、概率计算模块1230、误差提取模块1240、形状误差确定模块1250、估计形状计算模块1260及迭代计算模块1270。
图像获取模块1210,用于获取待检测图像。
初始形状获取模块1220,用于获取预先构建的概率回归模型中本次回归树的初始形状。
概率计算模块1230,用于从待检测图像提取图像特征,并根据图像特征分别计算本次回归树各个叶子结点的概率。
误差提取模块1240,用于从本次回归树中提取各个叶子结点的误差。
形状误差确定模块1250,用于根据各个叶子结点的概率及误差确定本次回归树的形状误差。
在一个实施例中,形状误差确定模块1250还用于分别计算各个叶子结点的概率及对应的误差的乘积,并将计算得到的乘积进行累加,得到本次回归树的形状误差。
估计形状计算模块1260,用于根据初始形状及形状误差计算得到本次回归树的估计形状。
迭代计算模块1270,用于将估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至概率回归模型中的最后一棵回归树,得到最后一棵回归树的估计形状,作为检测到的人脸形状。
上述人脸检测装置,从待检测图像提取图像特征,并计算在概率回归模型的本次回归树各个叶子结点的概率,根据各个叶子结点的概率及误差确定本次回归树的形状误差,从而计算得到本次回归树的估计形状,将该估计形状作为相邻的下一回归树的初始形状进行迭代计算,从而逐步逼近真实误差,得到准确的人脸形状,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
如图13所示,在一个实施例中,概率计算模块1230,包括提取单元1232、第一计算单元1234及第二计算单元1236。
提取单元1232,用于从本次回归树的根结点开始,根据各个结点的结点信息从待检测图像提取图像特征。
第一计算单元1234,用于根据各个结点提取的图像特征计算对应结点的分支概率,分支概率包括左分支概率及右分支概率,右分支概率与对应结点提取的图像特征成正相关关系,左分支概率与右分支概率之和为1。
第二计算单元1236,用于确定各个叶子结点所经历过的分支对应的分支概率,并根据对应的分支概率计算得到各个叶子结点的概率。
在本实施例中,可根据待检测图像的图像特征计算回归树各个叶子结点的概率,使得根据概率回归模型检测待检测图像的人脸形状时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
在一个实施例中,上述人脸检测装置1200,除了包括图像获取模块1210、初始形状获取模块1220、概率计算模块1230、误差提取模块1240、形状误差确定模块1250、估计形状计算模块1260及迭代计算模块1270,还包括滤波模块。
滤波模块,用于对待检测图像进行中值滤波处理。
如图14所示,滤波模块,包括定义单元1402、中值计算单元1404及替换单元1406。
定义单元1402,用于在待检测图像中定义预设大小的窗口。
中值计算单元1404,用于计算窗口包含的各个像素点的灰度值的中值。
替换单元1406,用于将位于窗口中心的像素点的灰度值替换为中值。
在本实施例中,获取待检测图像后,可对待检测图像进行滤波处理,降低待检测图像中的噪声,减弱视频图像序列中由于硬件和环境光照的变化导致的前后帧图像的噪声影响,使最终检测到的人脸形状更为稳定、准确。
在一个实施例中,上述人脸检测装置1200,还包括模型构建模块。
模型构建模块,用于根据样本图像集构建级联回归的概率回归模型,概率回归模型包括多级随机森林,每级随机森林包括多棵回归树。
如图15所示,模型构建模块,包括第一选取单元1502、回归树生成单元1504、概率配置单元1506、误差确定单元1508及迭代生成单元1510。
第一选取单元1502,用于构建每级随机森林时,从样本图像集中随机选取第一像素对集合。
回归树生成单元1504,用于根据第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点。
概率配置单元1506,用于配置生成的回归树各个叶子结点的概率。
在一个实施例中,概率配置单元1506包括第一配置子单元及第二配置子单元。
第一配置子单元,用于在分裂生成回归树的各个结点时,对进行样本图像划分的结点配置对应的分支概率,分支概率包括左分支概率及右分支概率,右分支概率与样本图像的图像特征成正相关关系,左分支概率与右分支概率之和为1。
第二配置子单元,用于配置生成的回归树的各个叶子结点的概率为叶子结点所经历过的分支对应的分支概率的乘积。
误差确定单元1508,用于根据生成的回归树中分配到各个叶子结点的样本图像的真实形状与生成的回归树的初始预测形状确定各个叶子结点的误差。
迭代生成单元1510,用于根据生成的回归树的初始预测形状与各个叶子结点的误差计算生成的回归树的预测形状,并将预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
在一个实施例中,上述模型构建模块,还包括分组单元,用于将样本图像集中的样本图像进行分组,并对分组后的样本图像循环第二预设次数进行如下处理:选取任一样本图像,从选取的样本图像所属的组别中随机选择预设数量的样本图像,将预设数量的样本图像进行加权和计算得到新样本图像,并将选取的样本图像替换为新样本图像。
在本实施例中,根据样本图像集的各个样本图像构建生成级联的概率回归模型,概率回归模型中的每一级随机森林及每级随机森林下的每一棵回归树都是对真实误差的进一步预测,通过该概率回归模型进行人脸检测时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
在一个实施例中,回归树生成单元1504,还用于从回归树的根结点开始,对根结点及分裂生成的各个结点进行如下处理:从第一像素对集合中随机选取第二像素对集合;根据第二像素对集合对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
在一个实施例中,回归树生成单元1504,包括计算子单元及选取子单元。
计算子单元,用于循环第一预设次数从第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在结点的误差。
选取子单元,用于从第二像素对集合中选取划分后的样本图像在结点的误差最小的像素对作为结点的划分像素对。
在本实施例中,确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
在一个实施例中,计算子单元还用于获取从第二像素对集合中随机选取的一对像素对的坐标信息;根据坐标信息从分配到结点的样本图像的对应位置提取图像特征;将从样本图像中提取的图像特征与预设的划分阈值进行比较,并将图像特征小于划分阈值的样本图像划分至左分支结点,将图像特征大于或等于划分阈值的样本图像划分至右分支结点;计算处于左分支结点的样本图像的第一平均形状,并根据处于左分支结点的样本图像的真实形状与第一平均形状确定左分支误差;计算处于右分支结点的样本图像的第二平均形状,并根据处于右分支结点的样本图像的真实形状与第二平均形状确定右分支误差;根据左分支误差与右分支误差之和及分配到结点的样本图像的数量求取均值,得到结点的误差。
在本实施例中,可计算随机选取的像素对下结点的误差,从而确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
在一个实施例中,提供一种用于人脸检测的模型的构建装置,包括模型构建模块,用于根据样本图像集构建级联回归的概率回归模型,概率回归模型包括多级随机森林,每级随机森林包括多棵回归树。
模型构建模块,包括第一选取单元、回归树生成单元、概率配置单元、误差确定单元及迭代生成单元。
第一选取单元,用于构建每级随机森林时,从样本图像集中随机选取第一像素对集合。
回归树生成单元,用于根据第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点。
概率配置单元,用于配置生成的回归树各个叶子结点的概率。
在一个实施例中,概率配置单元包括第一配置子单元及第二配置子单元。
第一配置子单元,用于在分裂生成回归树的各个结点时,对进行样本图像划分的结点配置对应的分支概率,分支概率包括左分支概率及右分支概率,右分支概率与样本图像的图像特征成正相关关系,左分支概率与右分支概率之和为1。
第二配置子单元,用于配置生成的回归树的各个叶子结点的概率为叶子结点所经历过的分支对应的分支概率的乘积。
误差确定单元,用于根据生成的回归树中分配到各个叶子结点的样本图像的真实形状与生成的回归树的初始预测形状确定各个叶子结点的误差。
迭代生成单元,用于根据生成的回归树的初始预测形状与各个叶子结点的误差计算生成的回归树的预测形状,并将预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
在一个实施例中,上述模型构建模块,还包括分组单元,用于将样本图像集中的样本图像进行分组,并对分组后的样本图像循环第二预设次数进行如下处理:选取任一样本图像,从选取的样本图像所属的组别中随机选择预设数量的样本图像,将预设数量的样本图像进行加权和计算得到新样本图像,并将选取的样本图像替换为新样本图像。
上述用于人脸检测的模型的构建装置,根据样本图像集构建级联回归的概率回归模型,通过随机选取的第一像素对集合对样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并确定各个叶子结点的误差,得到生成的回归树的预测形状,从而将该预测形状作为相邻的下一棵回归树的初始预测形状迭代生成下一棵回归树,概率回归模型中的每一级随机森林及每级随机森林下的每一棵回归树都是对真实误差的进一步预测,通过该概率回归模型进行人脸检测时,每棵回归树的形状误差由该回归树所有叶子结点的误差及概率来确定,可使得估计形状更为稳定、准确,可以有效解决视频图像序列出现的人脸特征点抖动问题。
在一个实施例中,回归树生成单元,还用于从回归树的根结点开始,对根结点及分裂生成的各个结点进行如下处理:从第一像素对集合中随机选取第二像素对集合;根据第二像素对集合对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
在一个实施例中,回归树生成单元,包括计算子单元及选取子单元。
计算子单元,用于循环第一预设次数从第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在结点的误差。
选取子单元,用于从第二像素对集合中选取划分后的样本图像在结点的误差最小的像素对作为结点的划分像素对。
在本实施例中,确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
在一个实施例中,计算子单元还用于获取从第二像素对集合中随机选取的一对像素对的坐标信息;根据坐标信息从分配到结点的样本图像的对应位置提取图像特征;将从样本图像中提取的图像特征与预设的划分阈值进行比较,并将图像特征小于划分阈值的样本图像划分至左分支结点,将图像特征大于或等于划分阈值的样本图像划分至右分支结点;计算处于左分支结点的样本图像的第一平均形状,并根据处于左分支结点的样本图像的真实形状与第一平均形状确定左分支误差;计算处于右分支结点的样本图像的第二平均形状,并根据处于右分支结点的样本图像的真实形状与第二平均形状确定右分支误差;根据左分支误差与右分支误差之和及分配到结点的样本图像的数量求取均值,得到结点的误差。
在本实施例中,可计算随机选取的像素对下结点的误差,从而确定回归树中每个结点的划分像素对,并根据划分像素对对样本图像进行划分,可保证每个结点的误差均为最小,使构建的概率回归模型更加准确。
本发明实施例还提供了一种计算机设备。一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该程序时实现如上所述的人脸检测方法。
本发明实施例还提供了一种计算机设备。一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行该程序时实现如上所述的用于人脸检测的模型的构建方法。
本发明实施例还提供了一种可读存储介质。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上所述的人脸检测方法。
本发明实施例还提供了一种可读存储介质。一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如上所述的用于人脸检测的模型的构建方法。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (20)
1.一种人脸检测方法,包括:
获取待检测图像;
获取预先构建的概率回归模型中本次回归树的初始形状;
从所述待检测图像提取图像特征,并根据所述图像特征分别计算所述本次回归树各个叶子结点的概率;
从所述本次回归树中提取所述各个叶子结点的误差;
根据所述各个叶子结点的概率及误差确定所述本次回归树的形状误差;
根据所述初始形状及所述形状误差计算得到所述本次回归树的估计形状;
将所述估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至所述概率回归模型中的最后一棵回归树,得到所述最后一棵回归树的估计形状,作为检测到的人脸形状。
2.根据权利要求1所述的方法,其特征在于,所述从所述待检测图像提取图像特征,并根据所述图像特征分别计算所述本次回归树各个叶子结点的概率,包括:
从所述本次回归树的根结点开始,根据各个结点的结点信息从所述待检测图像提取图像特征;
根据所述各个结点提取的图像特征计算对应结点的分支概率,所述分支概率包括左分支概率及右分支概率,所述右分支概率与对应结点提取的图像特征成正相关关系,所述左分支概率与所述右分支概率之和为1;
确定各个叶子结点所经历过的分支对应的分支概率,并根据所述对应的分支概率计算得到所述各个叶子结点的概率。
3.根据权利要求1所述的方法,其特征在于,所述根据所述各个叶子结点的概率及误差确定所述本次回归树的形状误差,包括:
分别计算所述各个叶子结点的概率及对应的误差的乘积,并将计算得到的乘积进行累加,得到所述本次回归树的形状误差。
4.根据权利要求1所述的方法,其特征在于,在所述获取待检测图像之后,所述方法还包括:
对所述待检测图像进行中值滤波处理,包括:
在所述待检测图像中定义预设大小的窗口;
计算所述窗口包含的各个像素点的灰度值的中值;
将位于所述窗口中心的像素点的灰度值替换为所述中值。
5.根据权利要求1所述的方法,其特征在于,在所述获取待检测图像之前,所述方法还包括:
根据样本图像集构建级联回归的概率回归模型,所述概率回归模型包括多级随机森林,每级随机森林包括多棵回归树;
所述根据样本图像集构建级联回归的概率回归模型,包括:
构建每级随机森林时,从所述样本图像集中随机选取第一像素对集合;
根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并根据分配到所述各个叶子结点的样本图像的真实形状与所述生成的回归树的初始预测形状确定所述各个叶子结点的误差;
根据所述生成的回归树的初始预测形状与所述各个叶子结点的误差计算所述生成的回归树的预测形状,并将所述预测形状作为相邻的下一棵回归树的初始预测形状迭代生成所述下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,包括:
从回归树的根结点开始,对所述根结点及分裂生成的各个结点进行如下处理:
从所述第一像素对集合中随机选取第二像素对集合;
根据所述第二像素对集合对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定所述结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二像素对集合对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定所述结点的划分像素对,包括:
循环第一预设次数从所述第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在所述结点的误差;
从所述第二像素对集合中选取划分后的样本图像在所述结点的误差最小的像素对作为所述结点的划分像素对。
8.根据权利要求7所述的方法,其特征在于,所述循环第一预设次数从所述第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在所述结点的误差,包括:
获取从所述第二像素对集合中随机选取的一对像素对的坐标信息;
根据所述坐标信息从分配到结点的样本图像的对应位置提取图像特征;
将从样本图像中提取的图像特征与预设的划分阈值进行比较,并将所述图像特征小于所述划分阈值的样本图像划分至左分支结点,将所述图像特征大于或等于所述划分阈值的样本图像划分至右分支结点;
计算处于所述左分支结点的样本图像的第一平均形状,并根据所述处于左分支结点的样本图像的真实形状与所述第一平均形状确定左分支误差;
计算处于所述右分支结点的样本图像的第二平均形状,并根据所述处于右分支结点的样本图像的真实形状与所述第二平均形状确定右分支误差;
根据所述左分支误差与所述右分支误差之和及分配到所述结点的样本图像的数量求取均值,得到所述结点的误差。
9.根据权利要求5所述的方法,其特征在于,所述配置生成的回归树各个叶子结点的概率,包括:
在分裂生成回归树的各个结点时,对进行样本图像划分的结点配置对应的分支概率,所述分支概率包括左分支概率及右分支概率,所述右分支概率与样本图像的图像特征成正相关关系,所述左分支概率与所述右分支概率之和为1;
配置生成的回归树的各个叶子结点的概率为叶子结点所经历过的分支对应的分支概率的乘积。
10.根据权利要求6所述的方法,其特征在于,在所述构建每级随机森林时,从样本图像中随机选取第一像素对集合之前,所述方法还包括:
将所述样本图像集中的样本图像进行分组,并对分组后的样本图像循环第二预设次数进行如下处理:
选取任一样本图像,从选取的样本图像所属的组别中随机选择预设数量的样本图像,将所述预设数量的样本图像进行加权和计算得到新样本图像,并将所述选取的样本图像替换为所述新样本图像。
11.一种用于人脸检测的模型的构建方法,包括:
根据样本图像集构建级联回归的概率回归模型,所述概率回归模型包括多级随机森林,每级随机森林包括多棵回归树;
所述根据样本图像集构建级联回归的概率回归模型,包括:
构建每级随机森林时,从所述样本图像集中随机选取第一像素对集合;
根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,配置生成的回归树各个叶子结点的概率,并根据分配到所述各个叶子结点的样本图像的真实形状与所述生成的回归树的初始预测形状确定所述各个叶子结点的误差;
根据所述生成的回归树的初始预测形状与所述各个叶子结点的误差计算所述生成的回归树的预测形状,并将所述预测形状作为相邻的下一棵回归树的初始预测形状迭代生成所述下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
12.根据权利要求11所述的方法,其特征在于,所述配置生成的回归树各个叶子结点的概率,包括:
在分裂生成回归树的各个结点时,对进行样本图像划分的结点配置对应的分支概率,所述分支概率包括左分支概率及右分支概率,所述右分支概率与样本图像的图像特征成正相关关系,所述左分支概率与所述右分支概率之和为1;
配置生成的回归树的各个叶子结点的概率为叶子结点所经历过的分支对应的分支概率的乘积。
13.根据权利要求11所述的方法,其特征在于,所述根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点,包括:
从回归树的根结点开始,对所述根结点及分裂生成的各个结点进行如下处理:
从所述第一像素对集合中随机选取第二像素对集合;
根据所述第二像素对集合对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定所述结点的划分像素对,直至生成的回归树的深度满足预设深度则停止分裂生成新的分支结点。
14.根据权利要求13所述的方法,其特征在于,所述根据所述第二像素对集合对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定所述结点的划分像素对,包括:
循环第一预设次数从所述第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在所述结点的误差;
从所述第二像素对集合中选取划分后的样本图像在所述结点的误差最小的像素对作为所述结点的划分像素对。
15.根据权利要求14所述的方法,其特征在于,所述循环第一预设次数从所述第二像素对集合中随机选取一对像素对对分配到结点的样本图像进行划分,将所述结点分裂生成新的分支结点,并确定划分后的样本图像所处的分支结点,计算划分后的样本图像在所述结点的误差,包括:
获取从所述第二像素对集合中随机选取的一对像素对的坐标信息;
根据所述坐标信息从分配到结点的样本图像的对应位置提取图像特征;
将从样本图像中提取的图像特征与预设的划分阈值进行比较,并将所述图像特征小于所述划分阈值的样本图像划分至左分支结点,将所述图像特征大于或等于所述划分阈值的样本图像划分至右分支结点;
计算处于所述左分支结点的样本图像的第一平均形状,并根据所述处于左分支结点的样本图像的真实形状与所述第一平均形状确定左分支误差;
计算处于所述右分支结点的样本图像的第二平均形状,并根据所述处于右分支结点的样本图像的真实形状与所述第二平均形状确定右分支误差;
根据所述左分支误差与所述右分支误差之和及分配到所述结点的样本图像的数量求取均值,得到所述结点的误差。
16.根据权利要求11所述的方法,其特征在于,在所述构建每级随机森林时,从样本图像中随机选取第一像素对集合之前,所述方法还包括:
将所述样本图像集中的样本图像进行分组,并对分组后的样本图像循环第二预设次数进行如下处理:
选取任一样本图像,从选取的样本图像所属的组别中随机选择预设数量的样本图像,将所述预设数量的样本图像进行加权和计算得到新样本图像,并将所述选取的样本图像替换为所述新样本图像。
17.一种人脸检测装置,其特征在于,包括:
图像获取模块,用于获取待检测图像;
初始形状获取模块,用于获取预先构建的概率回归模型中本次回归树的初始形状;
概率计算模块,用于从所述待检测图像提取图像特征,并根据所述图像特征分别计算所述本次回归树各个叶子结点的概率;
误差提取模块,用于从所述本次回归树中提取所述各个叶子结点的误差;
形状误差确定模块,用于根据所述各个叶子结点的概率及误差确定所述本次回归树的形状误差;
估计形状计算模块,用于根据所述初始形状及所述形状误差计算得到所述本次回归树的估计形状;
迭代计算模块,用于将所述估计形状作为相邻的下一回归树的初始形状进行迭代计算,直至所述概率回归模型中的最后一棵回归树,得到所述最后一棵回归树的估计形状,作为检测到的人脸形状。
18.一种用于人脸检测的模型的构建装置,其特征在于,包括:
模型构建模块,用于根据样本图像集构建级联回归的概率回归模型,所述概率回归模型包括多级随机森林,每级随机森林包括多棵回归树;
所述模型构建模块,包括:
第一选取单元,用于构建每级随机森林时,从所述样本图像集中随机选取第一像素对集合;
回归树生成单元,用于根据所述第一像素对集合对所述样本图像集的样本图像进行划分,分裂生成回归树的各个结点;
概率配置单元,用于配置生成的回归树各个叶子结点的概率;
误差确定单元,用于根据生成的回归树中分配到各个叶子结点的样本图像的真实形状与所述生成的回归树的初始预测形状确定所述各个叶子结点的误差;
迭代生成单元,用于根据所述生成的回归树的初始预测形状与所述各个叶子结点的误差计算所述生成的回归树的预测形状,并将所述预测形状作为相邻的下一棵回归树的初始预测形状迭代生成所述下一棵回归树,直至完成概率回归模型最后一级随机森林的回归树生成。
19.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至16任一所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至16任一所述的方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710365520.6A CN107169463B (zh) | 2017-05-22 | 2017-05-22 | 人脸检测方法、装置、计算机设备及存储介质 |
PCT/CN2018/085475 WO2018214713A1 (zh) | 2017-05-22 | 2018-05-03 | 人脸检测方法、装置、计算机设备及存储介质 |
EP18805735.0A EP3605388B1 (en) | 2017-05-22 | 2018-05-03 | Face detection method and apparatus, computer device, and storage medium |
US16/521,089 US11080565B2 (en) | 2017-05-22 | 2019-07-24 | Face detection method and apparatus, computer device, and storage medium |
US17/320,196 US11816925B2 (en) | 2017-05-22 | 2021-05-13 | Face detection method and apparatus, computer device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710365520.6A CN107169463B (zh) | 2017-05-22 | 2017-05-22 | 人脸检测方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107169463A true CN107169463A (zh) | 2017-09-15 |
CN107169463B CN107169463B (zh) | 2018-09-14 |
Family
ID=59815694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710365520.6A Active CN107169463B (zh) | 2017-05-22 | 2017-05-22 | 人脸检测方法、装置、计算机设备及存储介质 |
Country Status (4)
Country | Link |
---|---|
US (2) | US11080565B2 (zh) |
EP (1) | EP3605388B1 (zh) |
CN (1) | CN107169463B (zh) |
WO (1) | WO2018214713A1 (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108205677A (zh) * | 2017-09-21 | 2018-06-26 | 北京市商汤科技开发有限公司 | 对象检测方法、装置、计算机程序、存储介质和电子设备 |
CN108875528A (zh) * | 2018-01-08 | 2018-11-23 | 北京旷视科技有限公司 | 一种人脸形状点定位方法及装置、存储介质 |
WO2018214713A1 (zh) * | 2017-05-22 | 2018-11-29 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
CN109063597A (zh) * | 2018-07-13 | 2018-12-21 | 北京科莱普云技术有限公司 | 人脸检测方法、装置、计算机设备和存储介质 |
CN109062769A (zh) * | 2018-08-21 | 2018-12-21 | 南京星邺汇捷网络科技有限公司 | It系统性能风险趋势预测的方法、装置和设备 |
CN109963072A (zh) * | 2017-12-26 | 2019-07-02 | 广东欧珀移动通信有限公司 | 对焦方法、装置、存储介质及电子设备 |
CN110263663A (zh) * | 2019-05-29 | 2019-09-20 | 南京师范大学 | 一种基于多维面部特征的驾驶员多级疲劳度识别方法 |
CN111881972A (zh) * | 2020-07-24 | 2020-11-03 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种黑产用户识别方法及装置、服务器、存储介质 |
CN112017146A (zh) * | 2019-05-31 | 2020-12-01 | 杭州三坛医疗科技有限公司 | 一种骨骼分节方法及装置 |
CN112668385A (zh) * | 2020-08-17 | 2021-04-16 | 紫光云技术有限公司 | 一种人脸标记的方法 |
CN112863024A (zh) * | 2021-01-26 | 2021-05-28 | 江西中科瓦力科技有限公司 | 一种人脸识别自动解锁系统 |
CN112930427A (zh) * | 2018-09-28 | 2021-06-08 | 斯伦贝谢技术有限公司 | 弹性自适应井下采集系统 |
US11947069B2 (en) | 2018-05-15 | 2024-04-02 | Schlumberger Technology Corporation | Adaptive downhole acquisition system |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108075959B (zh) * | 2016-11-14 | 2021-03-12 | 腾讯科技(深圳)有限公司 | 一种会话消息处理方法和装置 |
US10936178B2 (en) * | 2019-01-07 | 2021-03-02 | MemoryWeb, LLC | Systems and methods for analyzing and organizing digital photos and videos |
CN111309848A (zh) * | 2020-01-19 | 2020-06-19 | 苏宁云计算有限公司 | 一种梯度提升树模型的生成方法及系统 |
US11120523B1 (en) | 2020-03-12 | 2021-09-14 | Conduent Business Services, Llc | Vehicle passenger detection system and method |
US11636280B2 (en) * | 2021-01-27 | 2023-04-25 | International Business Machines Corporation | Updating of statistical sets for decentralized distributed training of a machine learning model |
CN115661147B (zh) * | 2022-12-26 | 2023-03-28 | 济宁市质量计量检验检测研究院(济宁半导体及显示产品质量监督检验中心、济宁市纤维质量监测中心) | 基于机器视觉的计量检测数据识别方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419671A (zh) * | 2008-11-10 | 2009-04-29 | 北方工业大学 | 基于模糊支持向量机的人脸性别识别方法 |
CN104392250A (zh) * | 2014-11-21 | 2015-03-04 | 浪潮电子信息产业股份有限公司 | 一种基于MapReduce的图像分类方法 |
CN106529397A (zh) * | 2016-09-21 | 2017-03-22 | 中国地质大学(武汉) | 一种非约束环境中的人脸特征点定位方法及系统 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9747527B2 (en) * | 2013-03-15 | 2017-08-29 | Nvidia Corporation | Performing object detection operations via random forest classifier |
CN104182718B (zh) * | 2013-05-21 | 2019-02-12 | 深圳市腾讯计算机系统有限公司 | 一种人脸特征点定位方法及装置 |
KR20160033800A (ko) * | 2014-09-17 | 2016-03-29 | 삼성전자주식회사 | 카운팅 방법 및 카운팅 장치 |
US10394779B2 (en) * | 2015-09-14 | 2019-08-27 | International Business Machines Corporation | Detecting interesting decision rules in tree ensembles |
CN105469081B (zh) * | 2016-01-15 | 2019-03-22 | 成都品果科技有限公司 | 一种用于美颜的人脸关键点定位方法及系统 |
CN105718913B (zh) * | 2016-01-26 | 2018-11-02 | 浙江捷尚视觉科技股份有限公司 | 一种鲁棒的人脸特征点定位方法 |
US10846610B2 (en) * | 2016-02-05 | 2020-11-24 | Nec Corporation | Scalable system and method for real-time predictions and anomaly detection |
US10281902B2 (en) * | 2016-11-01 | 2019-05-07 | Xometry, Inc. | Methods and apparatus for machine learning predictions of manufacture processes |
CN108229252B (zh) * | 2016-12-15 | 2020-12-15 | 腾讯科技(深圳)有限公司 | 一种瞳孔定位方法及系统 |
US10019651B1 (en) * | 2016-12-25 | 2018-07-10 | Facebook, Inc. | Robust shape prediction for face alignment |
US10332312B2 (en) * | 2016-12-25 | 2019-06-25 | Facebook, Inc. | Shape prediction model compression for face alignment |
CN107169463B (zh) * | 2017-05-22 | 2018-09-14 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
CN108304758B (zh) * | 2017-06-21 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 人脸特征点跟踪方法及装置 |
-
2017
- 2017-05-22 CN CN201710365520.6A patent/CN107169463B/zh active Active
-
2018
- 2018-05-03 EP EP18805735.0A patent/EP3605388B1/en active Active
- 2018-05-03 WO PCT/CN2018/085475 patent/WO2018214713A1/zh unknown
-
2019
- 2019-07-24 US US16/521,089 patent/US11080565B2/en active Active
-
2021
- 2021-05-13 US US17/320,196 patent/US11816925B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101419671A (zh) * | 2008-11-10 | 2009-04-29 | 北方工业大学 | 基于模糊支持向量机的人脸性别识别方法 |
CN104392250A (zh) * | 2014-11-21 | 2015-03-04 | 浪潮电子信息产业股份有限公司 | 一种基于MapReduce的图像分类方法 |
CN106529397A (zh) * | 2016-09-21 | 2017-03-22 | 中国地质大学(武汉) | 一种非约束环境中的人脸特征点定位方法及系统 |
Cited By (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11816925B2 (en) | 2017-05-22 | 2023-11-14 | Tencent Technology (Shenzhen) Company Limited | Face detection method and apparatus, computer device, and storage medium |
WO2018214713A1 (zh) * | 2017-05-22 | 2018-11-29 | 腾讯科技(深圳)有限公司 | 人脸检测方法、装置、计算机设备及存储介质 |
US11080565B2 (en) | 2017-05-22 | 2021-08-03 | Tencent Technology (Shenzhen) Company Limited | Face detection method and apparatus, computer device, and storage medium |
CN108205677A (zh) * | 2017-09-21 | 2018-06-26 | 北京市商汤科技开发有限公司 | 对象检测方法、装置、计算机程序、存储介质和电子设备 |
CN109963072B (zh) * | 2017-12-26 | 2021-03-02 | Oppo广东移动通信有限公司 | 对焦方法、装置、存储介质及电子设备 |
CN109963072A (zh) * | 2017-12-26 | 2019-07-02 | 广东欧珀移动通信有限公司 | 对焦方法、装置、存储介质及电子设备 |
CN108875528A (zh) * | 2018-01-08 | 2018-11-23 | 北京旷视科技有限公司 | 一种人脸形状点定位方法及装置、存储介质 |
CN108875528B (zh) * | 2018-01-08 | 2021-01-29 | 北京旷视科技有限公司 | 一种人脸形状点定位方法及装置、存储介质 |
US11947069B2 (en) | 2018-05-15 | 2024-04-02 | Schlumberger Technology Corporation | Adaptive downhole acquisition system |
CN109063597A (zh) * | 2018-07-13 | 2018-12-21 | 北京科莱普云技术有限公司 | 人脸检测方法、装置、计算机设备和存储介质 |
CN109062769A (zh) * | 2018-08-21 | 2018-12-21 | 南京星邺汇捷网络科技有限公司 | It系统性能风险趋势预测的方法、装置和设备 |
CN109062769B (zh) * | 2018-08-21 | 2021-09-24 | 南京星邺汇捷网络科技有限公司 | It系统性能风险趋势预测的方法、装置和设备 |
US11828900B2 (en) | 2018-09-28 | 2023-11-28 | Schlumberger Technology Corporation | Elastic adaptive downhole acquisition system |
CN112930427B (zh) * | 2018-09-28 | 2024-03-19 | 斯伦贝谢技术有限公司 | 弹性自适应井下采集系统 |
CN112930427A (zh) * | 2018-09-28 | 2021-06-08 | 斯伦贝谢技术有限公司 | 弹性自适应井下采集系统 |
CN110263663A (zh) * | 2019-05-29 | 2019-09-20 | 南京师范大学 | 一种基于多维面部特征的驾驶员多级疲劳度识别方法 |
CN112017146A (zh) * | 2019-05-31 | 2020-12-01 | 杭州三坛医疗科技有限公司 | 一种骨骼分节方法及装置 |
CN112017146B (zh) * | 2019-05-31 | 2024-03-22 | 杭州三坛医疗科技有限公司 | 一种骨骼分节方法及装置 |
CN111881972B (zh) * | 2020-07-24 | 2023-11-07 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种黑产用户识别方法及装置、服务器、存储介质 |
CN111881972A (zh) * | 2020-07-24 | 2020-11-03 | 腾讯音乐娱乐科技(深圳)有限公司 | 一种黑产用户识别方法及装置、服务器、存储介质 |
CN112668385A (zh) * | 2020-08-17 | 2021-04-16 | 紫光云技术有限公司 | 一种人脸标记的方法 |
CN112863024A (zh) * | 2021-01-26 | 2021-05-28 | 江西中科瓦力科技有限公司 | 一种人脸识别自动解锁系统 |
Also Published As
Publication number | Publication date |
---|---|
US11080565B2 (en) | 2021-08-03 |
US20210271935A1 (en) | 2021-09-02 |
EP3605388A4 (en) | 2020-06-10 |
US20190392264A1 (en) | 2019-12-26 |
US11816925B2 (en) | 2023-11-14 |
EP3605388A1 (en) | 2020-02-05 |
WO2018214713A1 (zh) | 2018-11-29 |
EP3605388B1 (en) | 2023-08-16 |
CN107169463B (zh) | 2018-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169463B (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN109697434B (zh) | 一种行为识别方法、装置和存储介质 | |
CN109871781B (zh) | 基于多模态3d卷积神经网络的动态手势识别方法及系统 | |
CN111161311A (zh) | 一种基于深度学习的视觉多目标跟踪方法及装置 | |
CN105243395B (zh) | 一种人体图像比对方法和装置 | |
CN108062562B (zh) | 一种物体重识别方法及装置 | |
CN109816009A (zh) | 基于图卷积的多标签图像分类方法、装置及设备 | |
CN110276406B (zh) | 表情分类方法、装置、计算机设备及存储介质 | |
CN104915972A (zh) | 图像处理装置、图像处理方法以及程序 | |
CN109377445A (zh) | 模型训练方法、替换图像背景的方法、装置和电子系统 | |
KR102042168B1 (ko) | 시계열 적대적인 신경망 기반의 텍스트-비디오 생성 방법 및 장치 | |
CN106127775A (zh) | 图像清晰度评价方法及装置 | |
CN111401521B (zh) | 神经网络模型训练方法及装置、图像识别方法及装置 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
CN108198172B (zh) | 图像显著性检测方法和装置 | |
CN110096617B (zh) | 视频分类方法、装置、电子设备及计算机可读存储介质 | |
CN111008631B (zh) | 图像的关联方法及装置、存储介质和电子装置 | |
CN107463906A (zh) | 人脸检测的方法及装置 | |
CN112613349B (zh) | 基于深度混合卷积神经网络的时序动作检测方法及装置 | |
CN110033424A (zh) | 图像处理的方法、装置、电子设备及计算机可读存储介质 | |
CN110737730A (zh) | 基于无监督学习的用户分类方法、装置、设备及存储介质 | |
CN115187772A (zh) | 目标检测网络的训练及目标检测方法、装置及设备 | |
CN108764248B (zh) | 图像特征点的提取方法和装置 | |
CN114241587A (zh) | 人脸活体检测对抗鲁棒性的评估方法及装置 | |
KR102208688B1 (ko) | 데이터 증강 기반 사물 분석 모델 학습 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240102 Address after: 518057 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 floors Patentee after: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. Patentee after: TENCENT CLOUD COMPUTING (BEIJING) Co.,Ltd. Address before: 518000 Tencent Building, No. 1 High-tech Zone, Nanshan District, Shenzhen City, Guangdong Province, 35 Floors Patentee before: TENCENT TECHNOLOGY (SHENZHEN) Co.,Ltd. |