CN104680118A - 一种人脸属性检测模型生成方法及系统 - Google Patents

一种人脸属性检测模型生成方法及系统 Download PDF

Info

Publication number
CN104680118A
CN104680118A CN201310628991.3A CN201310628991A CN104680118A CN 104680118 A CN104680118 A CN 104680118A CN 201310628991 A CN201310628991 A CN 201310628991A CN 104680118 A CN104680118 A CN 104680118A
Authority
CN
China
Prior art keywords
attribute
long
network structure
parameter
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310628991.3A
Other languages
English (en)
Other versions
CN104680118B (zh
Inventor
罗平
王晓刚
梁炎
刘健庄
汤晓鸥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310628991.3A priority Critical patent/CN104680118B/zh
Priority to PCT/CN2014/080033 priority patent/WO2015078168A1/zh
Publication of CN104680118A publication Critical patent/CN104680118A/zh
Application granted granted Critical
Publication of CN104680118B publication Critical patent/CN104680118B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明实施例提供一种人脸属性检测模型生成方法及系统,所述方法包括:针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构;以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构,并为母和积网络结构的边配置权重值,得到检测模型;所述属性参量为判断属性是否存在的参量;所述和积网络结构的边用于连接所述结点。

Description

一种人脸属性检测模型生成方法及系统
技术领域
本发明涉及图像分析技术领域,特别涉及一种人脸属性检测模型生成方法及系统。
背景技术
人脸属性检测技术是图像分析领域当中,近年来非常活跃的一个分支。在安防、娱乐或智能设备等诸多范畴当中,人脸属性检测技术都有着广阔的前景和重要的实用价值。
所谓人脸属性检测的主要思想就是,利用人脸图像上显示的某些细节特征(如局部区域的颜色、边缘形状或纹理),来确定人脸图像上的诸多属性(如年龄、种族、性别或表情);以实现人像的筛选、分类、检索乃至身份识别等目的。
目前阶段,最常见的人脸属性检测技术一般都基于支持向量机(SupportVector Machine,简称SVM)。基于SVM的人脸属性检测,就是利用贪婪算法选择人脸图像中能最能代表特定属性的特征,联合所选取的若干特征并通过SVM模型进行计算,进而实现特定属性的判断。
基于SVM的人脸属性检测,整体方案相对简洁,在常规的人脸属性检测过程中,其准确率也能够满足使用需求。不过该方案的缺陷在于:只能在人脸图像清晰完整的情况下保障准确率,但不具备延伸和推演的性质;一旦人脸图像的某些部分模糊或者存在遮挡,即存在未知的特征时,SVM模型便会失效,无法实现正确的人脸属性检测。
发明内容
有鉴于此,本发明的目的在于提供一种人脸属性检测模型生成方法和系统,将人脸图像的多个属性乃至各属性下层的特征关联在检测模型中,使得该模型再检测过程中,可以利用待测人脸图像已知的特征参量计算全部属性的属性参量,实现在部分特征参量未知的情况下,准确的完成人脸属性检测。
为实现上述目的,本发明有如下技术方案:
第一方面,本发明提供了一种人脸属性检测模型生成方法,所述方法包括:
针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构;
以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构,并为母和积网络结构的边配置权重值,得到检测模型;
所述属性参量为判断属性是否存在的参量;所述和积网络结构的边用于连接所述结点。
在第一方面的第一种可能的实现方式中,所述分别从人脸样本图像中选定与属性对应的特征决策树结构具体为:
利用人脸样本图像,针对属性进行特征训练,得到支持该属性的特征决策树结构,并得到特征决策树结构中每个特征对应的特征检测器和特征定位器。
在第一方面的第二种可能的实现方式中,所述方法还包括:
从待测人脸图像中提取已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值;所述特征参量为代表相应特征判断结果的参量。
在第一方面的第三种可能的实现方式中,所述从待测人脸图像中提取已知特征参量具体为:
利用所述特征定位器在待测图像中找到该特征所在的区域,在区域内利用所述特征检测器得到已知特征参量。
在第一方面的第四种可能的实现方式中,所述计算得到待测人脸图像中的属性参量的值具体为:
在所述检测模型中利用最大概率指派算法计算得到待测人脸图像中的属性参量的值。
在第一方面的第五种可能的实现方式中,所述以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构具体为:
预先设置母和积网络结构模板;
以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,将所述结点按照母和积网络结构模板组合,得到母和积网络结构。
在第一方面的第六种可能的实现方式中,所述为母和积网络结构的边配置权重值具体为:
随机设定母和积网络结构的各边的参考权重,并利用人脸样本图像对母和积网络结构各边的参考权重进行训练;
所述参考权重的训练具体为,根据人脸样本图像反复重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
在第一方面的第七种可能的实现方式中,所述对母和积网络结构各边的参考权重进行训练具体为:
利用最大概率指派算法对母和积网络结构各边的参考权重进行训练。
第二方面,本发明提供了一种人脸属性检测模型生成系统,所述系统具体包括:
子建模模块,用于针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构;
母建模模块,用于以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构,并为母和积网络结构的边配置权重值,得到检测模型;
所述属性参量为判断属性是否存在的参量;所述和积网络结构的边用于连接所述结点。
在第二方面的第一种可能的实现方式中,所述子建模模块具体包括:
特征训练单元,用于利用人脸样本图像,针对属性进行特征训练,得到支持该属性的特征决策树结构,并得到特征决策树结构中每个特征对应的特征检测器和特征定位器;
子结构单元,用于将所述特征决策树结构转换为子和积网络结构。
在第二方面的第二种可能的实现方式中,所述系统还包括:
图像检测模块,用于从待测人脸图像中提取已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值;
所述特征参量为代表相应特征判断结果的参量。
在第二方面的第三种可能的实现方式中,所述图像检测模块具体包括:
提取单元,用于利用所述特征定位器在待测图像中找到该特征所在的区域,在区域内利用所述特征检测器得到已知特征参量;
计算单元,用于将已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值。
在第二方面的第四种可能的实现方式中,所述母建模模块具体包括:
模板单元,用于预先设置母和积网络结构模板;
母结构单元,用于以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,将所述结点按照母和积网络结构模板组合,得到母和积网络结构;
权重单元,用于为母和积网络结构的各边配置权重值。
在第二方面的第五种可能的实现方式中,所述权重单元具体包括:
随机设定子单元,用于随机设定母和积网络结构的各边的参考权重;
权重训练子单元,用于所述参考权重的训练具体为,根据人脸样本图像反复重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
通过以上技术方案可知,本发明存在的有益效果是:本发明利用SPN结构的检测模型,使不同特征或者属性相互关联起来,所以即使存在某些未知特征参量,检测模型也能够通过上述的关联关系,由已知的特征参量计算出未知的属性参量和特征参量,进而准确的对属性进行判断;本发明中的人脸属性检测更具有延伸性,实现了对于局部模糊或遮挡的待测图像的属性检测。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述方法流程图;
图2为本发明实施例所述决策树结构示意图;
图3为本发明实施例所述子和积网络结构示意图;
图4为本发明实施例所述母和积网络结构示意图;
图5~11为本发明实施例所述和积网络结构示意图;
图12为本发明实施例所述系统结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
一般来说,在人脸属性检测技术当中,以特征作为最基本分析单位。所谓的特征,往往是人脸图像的局部区域中描绘的具体细节。结合一个或者若干个特征,即可断定人脸图像中的属性。所谓属性代表着人脸图像中更宏观的特点,而且与所述的特征具有着逻辑上的联系。一个属性可谓是对应的一个或多个特征的上层单位。
具体来说,一个人脸图像中,能够显示出人脸局部区域的颜色、边缘和纹理等变化细节,这些细节即所谓的特征;同时一个人脸图像中,也能够显示出该人物的五官形态、种族、表情、性别等更为宏观特点,这些宏观特点便被认为是所谓的属性。
特征与属性是具有逻辑联系的;或者说属性的显示和识别并非是独立的,其必然需要一个或几个特征的支持。例如,利用某一个人脸图像下巴位置的颜色和纹理两种特征能够断定该人物是否具有胡须的属性。另外,不同的属性之间也是具有逻辑联系的。例如,如果某一人脸图像显示的人物具有胡须和秃头的属性,则能够断定该人物为男性;换言之如果将“胡须”、“秃头”两个属性相关联,则能够进一步的得到“男性”这一属性。或者,当一个人脸图像中存在“弯眉毛”、“嘴角上翘”、“眯眼睛”的属性,就可以进一步的得到“微笑”这一属性。
在实际的检测过程中,还需要进一步为“特征对属性的判断”赋予“非是即否”的二分类特性,以便进行数字化的处理。所谓二分类特性,实际上也就喻意根据该特征断定其上层的属性的“存在”和“不存在”。例如,针对“弯眉毛”这一属性,将眉毛区域的边缘形状作为所述特征,也就意味根据眉毛区域的边缘形状对“弯眉毛”进行判断,,包括“存在弯眉毛”和“不存在弯眉毛”两种具体的判断结果,即体现出二分类特性。
进一步可以将该二分类特征进行如下的数字化处理:一个属性的判断可以基于一个或多个特征,以Rk代表用于检测“弯眉毛”这一属性的第k个特征。则Rk可以用一组对应的特征参量rk表示。当Rk的判断结果为“存在弯眉毛”,则rk=1,反之若Rk的判断结果为“不存在弯眉毛”,则rk=0,由此,特征就以具体的数值化的特征参量作为载体来表达。
在人脸属性检测技术当中,都是将特征参量对应的代入到一系列的数学模型,由此对相应的属性进行判断;实现人像的筛选、分类、检索乃至身份识别等目的。不过,不同的方案当中由于模型的结构、算法和运算流程均存在着显著的差异,所以性能和效果也是有着本质区别的。
现有的基于SVM的人脸属性检测,能够实现对于属性的判断。不过在该方案中,各个的属性乃至属性下层的特征彼此独立,并没有在数学模型中建立诸多特征以及属性之间的联系。所以该方案不具有延伸和推演的性能。也就是说,当人脸图像中某些区域模糊或者存在遮挡,无法提取到该区域对应的特征参量时,那么上层的属性便失去支持,无法确定;而其他已知的特征和属性,与未知的属性之间不存在联系,也就难以通过已知部分延伸推演出未确定的部分;导致检测功能即失效。
在本发明中检测模型具备以和积网络(sum-product network,简称SPN)结构,在和积网络结构中,若干属性彼此关联,检测每种属性的特征也彼此关联,使得各个属性之间乃至各个特征之间具有的概率上的联系关系;即使存在某些属性得不到下层特征直接的支持,依然可以通过另一部分已知的特征推演出所有的属性。
参见图1所示,为本发明所述人脸属性检测模型生成方法的一个具体实施例,本实施例中,所述方法包括以下步骤:
步骤101、针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构。
在用于人脸属性检测的模型建立的过程中,往往需要利用大量的样本图像进行反复的训练。而本实施例中,特征作为模型建立最基本的单位,其选定过程也是最先进行的。
所述特征的选定过程,本质上同样是利用大量的图像样本进行训练和分析。并且,选定特征的直接目的是为了支持和判断其上层的属性,所以特征的训练必然是针对特定的属性进行,也就是针对人脸不同的属性,分别从人脸样本图像中选定。
在本实施例中所建立的模型均具备SPN结构,为此所述特征的训练和选定,将采用以下的具体方式:利用人脸样本图像,针对属性进行特征训练,得到支持该属性的特征决策树结构,并得到特征决策树结构中每个特征对应的特征检测器和特征定位器。可以说其关键就在于,为了后续SPN结构的模型建立,本步骤中训练得到的支持某一属性的特征,不再是独立的若干特征,而是生成的同时便组合成了决策树结构。
例如,针对“微笑”这一个属性,以A1代表该属性;预选定其下层的特征,则有以下案例:
从大量的样本图像中随机的选取不同矩形区域,所述样本图像包括A1的正样本(即微笑的人脸图像,具备A1)和负样本(即没有微笑的人脸图像,不具备A1)。利用上述随机选择的矩形区域特征训练隐式支持向量机以分类正负样本,并对照各矩形区域的分类准确度,将分类结果最准确的隐式支持向量机的分类依据作为决策树结构最上层的特征。
在训练中发现,某一矩形区域的隐式支持向量机对正负样本分类的准确率最高,例如,“嘴”位置的矩形区域。由此,将此矩形区域代表的特征作为最有利于判断“微笑”的特征选定,并以R1表示。
另外,还将该隐式支持向量机作为R1的特征检测器,用以通过R1来检测待测图像中“微笑”这一属性是否存在。
进一步的,还可以利用R1的大量正负样本训练线性支持向量机,并将所述线性支持向量机作为R1的定位器,用以在待测图像中找到R1的位置(也就是找到待测图像中“嘴”的位置,以便判断“微笑”。
由于R1对正负样本分类的准确率最高,也就说明R1与A1的关系最为紧密,是最能够支持A1的特征,于是将R1置于决策树结构的最上层。
在R1选定之后,将重新选择样本,继续按照上述原理训练对A1的正样本和负样本进行分类。所谓重新选择样本,就是用R1的特征检测器将原样本分成两部分,分别训练。
用R1的特征检测器判定为“微笑”的样本作为第一部分,因为特征检测器的结果不可能百分百正确,所以第一部分中仍然包括正样本(“微笑”的图像)和负样本(不存在“微笑”的图像)。分类之后,同理在第一部分样本中训练对A1的正样本和负样本进行分类,得到准确率最高的特征R2及R2对应的特征检测器和特征定位器。R2的具体含义是双眼区域特征。
用R1的特征检测器判定为不存在“微笑”的样本作为第二部分,其中同样包括正样本(“微笑”的图像)和负样本(不存在“微笑”的图像),同理在第二部分样本中训练对A1的正样本和负样本进行分类,得到准确率最高的特征R3及R3对应的特征检测器和特征定位器。R3的具体含义是法令纹区域特征。
在得到R2与R3之后,将二者置于决策树结构的第二层。参照图2即R1、R2和R3组成的特征决策树结构。
如果按照上述方式继续训练,还可以进一步的得到更多的特征,组成包括更多层的决策树结构,不过在本实施例中,仅取图2所示的二层特征决策树结构,即停止针对的A1特征训练。
需要说明的是,训练隐式支持向量机和线性支持向量机的过程属于本领域内常用的技术手段,在此不对其原理做出赘述。不过,本实施例中依据决策树结构上层的特征进行样本划分,并分别训练下层的特征,最终得到以决策树结构组合的若干特征的思路,并非是现有技术中已经存在的。本实施例中,之所以训练得到特征决策树结构,在接下来完成特征决策树结构到子和积网络结构的转变。
在确定了特征决策树结构之后,就可以利用所述特征决策树结构得到一个相应的SPN结构。本实施例中,将该SPN结构作为子SPN结构,也就是仅针对一个属性而构建的SPN结构。所述子SPN结构由支持A1的三个特征组成的特征决策树结构转换而来,可以说三个特征将共同判断属性A1。不过在本步骤中没有为子SPN结构配置各边的权重,所以至此所述子SPN结构依然不是完整的。配置权重的过程将在后文具体说明。
此处需要说明的是,特征决策树结构向SPN结构转换的过程,是基于SPN原理进行的,该原理属于本领域所公知,此处不再详述。在特征决策树结构明确的情况下,其演变得到的SPN结构也将是固定的。图2所示决策树结构演变得到的SPN结构如图3所示。
图3中ri为Ri对应的两个特征参量(i=1或2或3);所述特征参量为代表相应特征判断结果的参量。当利用Ri对A1进行时,判断结果为“存在微笑”,则ri=1,反之若Ri的判断结果为“不存在微笑”,则ri=0,wn(1≤n≤10,且n为整数)为所在边的权重值,在本步骤中依然为未知量。
步骤102、以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构。
SPN结构实际上可以认为是一种开放的结构,诸多类似于图3所示的SPN结构,按照SPN的原理可以进一步的扩展和组合,得到更为庞大的SPN结构。另外,在SPN扩展的过程中,还需要针对每个属性引入一组属性参量,所述属性参量为判断属性是否存在的参量。
需解释说明的是,前述的特征参量表示的是单一的一个特征对属性的判断结果,仅仅凭借一个特征对属性进行判断是存在很大局限性的;那么所谓属性参量实际上就是对于属性更为全面的判断结果。属性参量可以是该属性下层所有特征对属性联合判断的结果,甚至可以是依据客观事实对属性判断的结果,总之本实施例中将认为所述属性参量便示出了该属性究竟存在与否。属性参量的具体形式依然仿照特征参量,也具备二分类特性。
本实施例中,不同的子SPN结构,即可以按照上述的思路继续进行扩展和组合,便能够形成所谓的母SPN结构;每个子SPN结构均嵌置在母SPN结构中,各种属性之间也正是通过这种方式建立了关联。
不过,不同于特征决策树结构向SPN结构的转换,本步骤中不同的子SPN结构之间原本并没有组成决策树结构,所以母SPN结构并不唯一,或者说母SPN的具体结构是可以根据使用需求来设计的。所以本实施例中,预先的设置母SPN结构模板。子SPN结构和额外引入的属性参量均相当于母SPN结构的结点,将所述结点按照母SPN结构模板组合,搭建成母SPN结构。在本实施例的整体方案之下,母SPN结构并不唯一,所以此处不作具体限定;不过为便于说明,以下将给出一个由两个子SPN结构组成的母SPN结构的简单实例:
本步骤中,将以属性A1的子SPN结构X1作为一个结点,另取一个属性A2的子SPN结构X2作为另一个结点。在模型建立的过程中,还将依照客观事实判断A1和A2两个属性是否存在,并将客观判断结果以属性参量的形式表示出来。x1为A1对应的属性参量,A1存在时x1=1,反之x1=0,x2为A2对应的属性参量,同理的A2存在时x2=1,反之x2=0,进一步利用X1、x1和X2、x2组合的母SPN结构如图4所示。其中S(X1)表示X1输出层的值,S(X2)表示X2输出层的值。此处需要说明的是,所谓输出层的值,指的是子SPN结构本身计算得到的数值。因为X1和X2中各包括10个权重,所以母SPN结构的其它权重标记为w21…w26
步骤103、为母和积网络结构的边配置权重值,得到检测模型。
前述已知,子SPN结构嵌置在母SPN结构中,是母SPN结构的一部分,或者说在检测模型中,子SPN结构和母SPN结构属于一体,由此检测过程中直接从待测人脸图像提取的特征参量不再受到其上层属性的局限。检测模型在实际检测过程中,最底层被代入的数据是全部已知的特征参量,由此计算得到待测人脸图像中全部的属性参量的值,便明确了检测模型涉及的全部属性存在与否。甚至还可以通过检测模型得到未知的特征参量。
到步骤102结束为止,检测模型的SPN结构均已经确定,不过SPN结构各边的权重依然没有配置,所以步骤102中得到的母SPN结构终究不是真正意义上的检测模型。本步骤便描述了为母SPN结构乃至嵌置其中的子SPN结构统一配置权重值的过程,最终得到检测模型。
本步骤中从模型性能优化的角度来讲,所述配置权重依然需要通过利用样本图像反复的训练得到。具体为,随机设定母和积网络结构的各边的参考权重,并利用人脸样本图像对母和积网络结构各边的参考权重进行训练;所述参考权重的训练为,根据人脸样本图像反复重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
由于在实际使用过程中,母SPN结构极为繁琐,对参考权重进行训练的过程也十分的复杂。所以本实施例中为便于说明,将借助图4所示的简易SPN结构阐述其原理;不过实际的检测模型的训练原理与图4中SPN结构不存在区别,具体如下:
首先对于图4所示的SPN结构各边随机的设定参考权重,满足SPN一个加法结点的两项权重和为1的特性,得到如图5所示的SPN结构;需要说明的是,由于将所述SPN结构全部展现过于庞大,所以为了便于说明,图4及图5中X1和X2仅以结点的形式表现出来,并未体现其内部的结构和参考权重。训练过程中,将依据客观事实针对样本图像采集x1和x2两组属性参量,代入该SPN结构中进行计算。
不过采集过程中将存在采集成功和采集失败两种情况。如果在样本中显示属性的相关区域均清晰而不存在遮挡,则依据客观事实的属性参量采集过程必然能够成功,得到属性参量的具体数值;如果相关区域模糊或存在遮挡,无法进行识别和判断,便不能够采集成功,该属性的属性参量即成为未知。
假设某样本图像中,图5中两个属性的属性参量均为已知:属性A1存在(本实施例中即识别到样本图像中存在“微笑”),则x1=1,X1中各个特征参量均已知,可得到其输出层的值为S(X1);同样,属性A2存在,则x2=1,X2输出层的值为S(X2)。本实施例中,假设直接计算得到S(X1)=0.12,S(X2)=0.34。
SPN中,单一的参量及参量之间的计算公式均可以成为SPN的结点,加法运算的公式即加法结点,乘法运算的公式即乘法结点,加法结点与乘法结点层层交叠;所述和积网络结构的边用于连接所述结点。而根据SPN特性,只有加法结点之下的两个边设有权重,即加法结点中相加的两项在相加之前将分别乘以其权重值。
为了权重训练的需要,可以将图5所示的SPN结构中,所有加法结点上的加法运算,一律变化为取最大值运算,便得到图6所示模型结构,按照图6所示的模型结构逐步计算,输出最顶层结果,如图7。
再根据图7所示模型结构的输出结果反向计数,对每个边的参考权重进行重置。重置参考权重从最上层的最大值结点开始,选取最大值结点两项中,数值较大的一项,将该相对应的边计数加1(各边初始计数均为0)。
图7中最上层的最大值结点为max(0.00672,0.02856),所以取较大的第二项0.02856,将该项对应的边计数由初始计数开始加1,得到0+1=1,在通过该边找到该边下层的乘法结点0.34*0.2*0.7。而同时另一边的计数仍然为初始计数0。
根据SPN原理乘法结点中不设权重,即直接根据乘法结点0.34*0.2*0.7找到在该乘法结点下层的三个加法结点:max(0.2,0)、max(0.7,0)和X2。同理,再将上述三个结点中较大的一项对应边的计数由初始计数加1。最终该过程如图8所示。需要说明的是,图8中X2作为一个结点,其内部结构没有示出;实质上X2本身即SPN结构,所以还需要继续在X2的SPN结构中进行反向计数的过程,训练X2内部各边的权重。
反向计数的过程从最上层开始,直到最下层结束之后,再将各边的计数归一化,作为重置的参考权重,未被计数的边则参考权重不变。所谓归一化就是使每个加法结点两项的权重比例满足对应的两边上计数的比例,同时权重和为1。
本例中由于SPN结构非常简单,被计数的两边的计数都是1和0,已经符合了归一化的要求。不过在复杂的SPN结构中,按照上述过程完成反向计数之后,往往两边计数均是大于1的整数。假设某一加法结点之下的两边计数分别为4和1;则归一化重置参考权重之后,计数为4的边参考权重设为0.8,计数为1的边参考权重设为0.2;二者依然满足4:1的比例,且和为1。
参见图9所示,为重置参考权重之后的SPN结构。按照上述过程反复训练并反复的重置参考权重,直到各边的参考权重呈现收敛现象,则将收敛的参考权重作为各边的权重值。所谓收敛现象,就是说再重置权重前后,权重值不发生改变或者改变数值很小,已经趋于稳定。本实施例中可以预先设置一个收敛阈值,在训练过程中反复的重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
需要说明的是,图5中所体现的,仅仅所有属性参量均已知的情况;不过在实际情况下,很可能存在某些区域被遮挡,导致无法客观判断出一部分属性参量未知的情况。
本实施例中利用所述SPN结构,使得不同特征或者属性相互关联起来。所以即使存在某些未知特征参量或属性参量,SPN结构也具备通过上述的关联关系,由已知参量计算未知参量的功能。不过,上述计算的过程,需将SPN结构结合最大概率指派算法(Most Probable Explanation,简称MPE)来完成。这一点既体现在参考权重训练的过程中,又体现在实际检测的过程中。所述的推演过程具体如下:
当存在未知属性参量时,依然将图5所示的SPN结构中,加法结点上的加法运算,一律变化为取最大值运算,便得到图6所示模型结构。再将所有未知的属性参量的数值均设置为1,也就是设x2=1,S(X2)=0.34保持不变。将已知参量和设为1的未知参量代入图6所示的模型结构中逐步计算,最顶层输出结果等于0.02856。如图10所示。
接下来仿照图8所示的反向计数原理,对于图10中模型结构进行反向计数,将取到图10右下角的最大值结点max(0.7,0.3),取二者中较大的一项为0.7=0.7*x2,预测x2=1,相应的必然可见当X2的属性参量为x2=1,说明属性A2存在。如图11所示。
由此,通过SPN结构结合MPE算法,实现了对于未知属性参量的计算和对于被遮挡的属性的预测。另外从参考权重训练的方面来讲,依然可以随着图10所示的反向计数过程同时进行参考权重的重置;具体方式与图8所示的归一化过程一致。
至此,步骤103结束,母SPN结构既确定,其中各边权重值也已经配置成功,便得到了本实施例中所述检测模型。
在此基础之上,本实施例中还可以优选的包括一个,利用所述检测模型实际进行人脸属性检测的步骤,具体如下:
步骤104、从待测人脸图像中提取已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值。
本实施例中,步骤101~步骤103为检测模型生成的过程,本步骤中将开始利用所生成的检测模型对待测图像进行人脸属性检测。在实际的检测过程中,不再依据客观事实对属性进行判断,属性参量将来自于检测模型的计算;而特征参量是直接从待测人脸图像中提取的数据,将直接被代入到检测模型中。不过根据所述检测模型的性质,需要得到所有的属性参量,并不需要所有的特征参量均为已知,所以即使待检测图片中某些特征被遮挡,无法提取特征参量,检测过程依然能够顺利的进行。例如,如果所述待测图像中人物戴有口罩,那么必将无法对嘴附近的特征进行检测识别,得到特征参量,但利用所述检测模型就能够通过其他已知的参量计算与嘴相关的属性参量,等同于变相的获悉了被遮挡部分的内容。
属性参量为判断属性是否存在的参量,所以只要得到属性参量,便等同于获悉了该属性。假设计算得到属性A1的属性参量x1=1,那么就等于判断出属性A1存在,也就是待检测图片中存在“微笑”。
本实施例中,同样在所述检测模型中利用MPE计算得到待测人脸图像中的属性参量的值。在检测模型中利用MPE算法进行计算和推演的过程原理如图10所示,在此不再重复的叙述。
还需要说明的是,从待测图像中提取特征参量,可以利用前述特征的特征检测器和特征定位器。所述特征检测器和特征定位器都是对应固定特征的,利用所述特征定位器找到待测图像中对应的特征所在区域,当图像的该区域内显示清晰,不存在遮挡,则利用所述特征检测器得到已知特征参量;否则所述特征检测器无法对模糊或遮挡的部分进行识别,该特征对应的特征参量就是未知特征参量。
通过以上技术方案可知,本实施例存在的有益效果是:所述方法利用SPN结构的检测模型,使不同特征或者属性相互关联起来,所以即使存在某些未知特征参量,检测模型也能够通过上述的关联关系,由已知的特征参量计算出未知的属性参量和特征参量,进而准确的对属性进行判断;所述方法中的人脸属性检测更具有延伸性,实现了对于局部模糊或遮挡的待测图像的属性检测。
参见图12所示,为本发明所述人脸属性检测模型生成系统的具体实施例。本实施例中所述系统支持图1所示实施例所述方法,二者技术方案本质上相同,前述实施例中相应的描述同样适用于本实施例所述系统中。所述系统具体包括:
子建模模块,用于针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构。
所述子建模模块包括:
特征训练单元,用于利用人脸样本图像,针对属性进行特征训练,得到支持该属性的特征决策树结构,并得到特征决策树结构中每个特征对应的特征检测器和特征定位器。
子结构单元,用于将所述特征决策树结构转换为子和积网络结构。
母建模模块,用于以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构,并为母和积网络结构的边配置权重值,得到检测模型;所述属性参量为判断属性是否存在的参量;所述和积网络结构的边用于连接所述结点。
所述母建模模块包括:
模板单元,用于预先设置母和积网络结构模板。
母结构单元,用于以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,将所述结点按照母和积网络结构模板组合,得到母和积网络结构。
权重单元,用于为母和积网络结构的各边配置权重值。
所述权重单元包括:
随机设定子单元,用于随机设定母和积网络结构的各边的参考权重。
权重训练子单元,用于所述参考权重的训练具体为,根据人脸样本图像反复重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
所述系统还包括:
图像检测模块,用于从待测人脸图像中提取已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值;所述特征参量为代表相应特征判断结果的参量。
所述图像检测模块具体包括:
提取单元,用于利用所述特征定位器在待测图像中找到该特征所在的区域,在区域内利用所述特征检测器得到已知特征参量。
计算单元,用于将已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值。
通过以上技术方案可知,本实施例所述系统存在的有益效果是:所述系统利用SPN结构的检测模型,使不同特征或者属性相互关联起来,所以即使存在某些未知特征参量,检测模型也能够通过上述的关联关系,由已知的特征参量计算出未知的属性参量和特征参量,进而准确的对属性进行判断;所述系统中的人脸属性检测更具有延伸性,实现了对于局部模糊或遮挡的待测图像的属性检测。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者诸如媒体网关等网络通信设备,等等)执行本发明各个实施例或者实施例的某些部分所述的方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种人脸属性检测模型生成方法,其特征在于,所述方法包括:
针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构;
以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构,并为母和积网络结构的边配置权重值,得到检测模型;
所述属性参量为判断属性是否存在的参量;所述和积网络结构的边用于连接所述结点。
2.根据权利要求1所述方法,其特征在于,所述分别从人脸样本图像中选定与属性对应的特征决策树结构具体为:
利用人脸样本图像,针对属性进行特征训练,得到支持该属性的特征决策树结构,并得到特征决策树结构中每个特征对应的特征检测器和特征定位器。
3.根据权利要求2所述方法,其特征在于,所述方法还包括:
从待测人脸图像中提取已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值;所述特征参量为代表相应特征判断结果的参量。
4.根据权利要求3所述方法,其特征在于,所述从待测人脸图像中提取已知特征参量具体为:
利用所述特征定位器在待测图像中找到该特征所在的区域,在区域内利用所述特征检测器得到已知特征参量。
5.根据权利要求4所述方法,其特征在于,所述计算得到待测人脸图像中的属性参量的值具体为:
在所述检测模型中利用最大概率指派算法计算得到待测人脸图像中的属性参量的值。
6.根据权利要求1所述方法,其特征在于,所述以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构具体为:
预先设置母和积网络结构模板;
以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,将所述结点按照母和积网络结构模板组合,得到母和积网络结构。
7.根据权利要求1所述方法,其特征在于,所述为母和积网络结构的边配置权重值具体为:
随机设定母和积网络结构的各边的参考权重,并利用人脸样本图像对母和积网络结构各边的参考权重进行训练;
所述参考权重的训练具体为,根据人脸样本图像反复重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
8.根据权利要求7所述方法,其特征在于,所述对母和积网络结构各边的参考权重进行训练具体为:
利用最大概率指派算法对母和积网络结构各边的参考权重进行训练。
9.一种人脸属性检测模型生成系统,其特征在于,所述系统具体包括:
子建模模块,用于针对人脸不同的属性,分别从人脸样本图像中选定与属性对应的特征决策树结构,所述特征决策树结构包括一个或多个特征;将所述特征决策树结构转换为子和积网络结构;
母建模模块,用于以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,组合为母和积网络结构,并为母和积网络结构的边配置权重值,得到检测模型;
所述属性参量为判断属性是否存在的参量;所述和积网络结构的边用于连接所述结点。
10.根据权利要求9所述系统,其特征在于,所述子建模模块具体包括:
特征训练单元,用于利用人脸样本图像,针对属性进行特征训练,得到支持该属性的特征决策树结构,并得到特征决策树结构中每个特征对应的特征检测器和特征定位器;
子结构单元,用于将所述特征决策树结构转换为子和积网络结构。
11.根据权利要求10所述系统,其特征在于,所述系统还包括:
图像检测模块,用于从待测人脸图像中提取已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值;
所述特征参量为代表相应特征判断结果的参量。
12.根据权利要求11所述系统,其特征在于,所述图像检测模块具体包括:
提取单元,用于利用所述特征定位器在待测图像中找到该特征所在的区域,在区域内利用所述特征检测器得到已知特征参量;
计算单元,用于将已知特征参量代入检测模型,计算得到待测人脸图像中的属性参量的值。
13.根据权利要求9所述系统,其特征在于,所述母建模模块具体包括:
模板单元,用于预先设置母和积网络结构模板;
母结构单元,用于以多个对应属性的子和积网络结构和所述属性的属性参量作为结点,将所述结点按照母和积网络结构模板组合,得到母和积网络结构;
权重单元,用于为母和积网络结构的各边配置权重值。
14.根据权利要求13所述系统,其特征在于,所述权重单元具体包括:
随机设定子单元,用于随机设定母和积网络结构的各边的参考权重;
权重训练子单元,用于所述参考权重的训练具体为,根据人脸样本图像反复重置参考权重,直到重置后的参考权重与重置前参考权重的差值小于预设的收敛阈值,则将所述重置后的参考权重作为各边的权重值。
CN201310628991.3A 2013-11-29 2013-11-29 一种人脸属性检测模型生成方法及系统 Active CN104680118B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201310628991.3A CN104680118B (zh) 2013-11-29 2013-11-29 一种人脸属性检测模型生成方法及系统
PCT/CN2014/080033 WO2015078168A1 (zh) 2013-11-29 2014-06-17 一种人脸属性检测模型生成方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310628991.3A CN104680118B (zh) 2013-11-29 2013-11-29 一种人脸属性检测模型生成方法及系统

Publications (2)

Publication Number Publication Date
CN104680118A true CN104680118A (zh) 2015-06-03
CN104680118B CN104680118B (zh) 2018-06-15

Family

ID=53198294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310628991.3A Active CN104680118B (zh) 2013-11-29 2013-11-29 一种人脸属性检测模型生成方法及系统

Country Status (2)

Country Link
CN (1) CN104680118B (zh)
WO (1) WO2015078168A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017000118A1 (en) * 2015-06-29 2017-01-05 Xiaoou Tang Method and apparatus for predicting attribute for image sample
CN107766806A (zh) * 2017-09-30 2018-03-06 北京飞搜科技有限公司 一种基于尺度变换的人脸检测方法及系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110009018B (zh) * 2019-03-25 2023-04-18 腾讯科技(深圳)有限公司 一种图像生成方法、装置以及相关设备
CN112052050B (zh) * 2020-08-20 2021-06-08 腾讯科技(深圳)有限公司 一种分享图片生成方法、系统及存储介质和终端设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120233159A1 (en) * 2011-03-10 2012-09-13 International Business Machines Corporation Hierarchical ranking of facial attributes
CN103034840A (zh) * 2012-12-05 2013-04-10 山东神思电子技术股份有限公司 一种性别识别方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101419671B (zh) * 2008-11-10 2011-05-18 北方工业大学 基于模糊支持向量机的人脸性别识别方法
CN102567719B (zh) * 2011-12-26 2014-07-02 东南大学 基于后验概率神经网络的人类年龄自动估计方法
CN102945361B (zh) * 2012-10-17 2016-10-05 北京航空航天大学 基于特征点矢量与纹理形变能量参数的人脸表情识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120233159A1 (en) * 2011-03-10 2012-09-13 International Business Machines Corporation Hierarchical ranking of facial attributes
CN103034840A (zh) * 2012-12-05 2013-04-10 山东神思电子技术股份有限公司 一种性别识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
BANGPENG YAO 等: "Combining Randomization and Discrimination for Fine-Grained Image Categorization", 《IEEE》 *
HOIFUNG POON 等: "Sum-Product Networks: A New Deep Architecture", 《IEEE》 *
张建明 等: "改进KNN-SVM的性别识别", 《计算机工程与应用》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017000118A1 (en) * 2015-06-29 2017-01-05 Xiaoou Tang Method and apparatus for predicting attribute for image sample
CN107766806A (zh) * 2017-09-30 2018-03-06 北京飞搜科技有限公司 一种基于尺度变换的人脸检测方法及系统

Also Published As

Publication number Publication date
WO2015078168A1 (zh) 2015-06-04
CN104680118B (zh) 2018-06-15

Similar Documents

Publication Publication Date Title
US11594070B2 (en) Face detection training method and apparatus, and electronic device
CN110425005B (zh) 矿井下皮带运输人员人机交互行为安全监控与预警方法
CN108920765B (zh) 一种基于建筑物三维线段模型的假设平面拟合方法
CN111008337B (zh) 一种基于三元特征的深度注意力谣言鉴别方法及装置
CN103473786A (zh) 基于多目标模糊聚类的灰度图像分割方法
CN109389185B (zh) 使用三维卷积神经网络的视频烟雾识别方法
CN116166960B (zh) 用于神经网络训练的大数据特征清洗方法及系统
CN109039503A (zh) 一种频谱感知方法、装置、设备及计算机可读存储介质
CN108171119B (zh) 基于残差网络的sar图像变化检测方法
CN110224771B (zh) 基于bp神经网络与信息几何的频谱感知方法及装置
CN104680118A (zh) 一种人脸属性检测模型生成方法及系统
CN105243356A (zh) 一种建立行人检测模型的方法及装置及行人检测方法
CN107067022B (zh) 图像分类模型的建立方法、建立装置和设备
CN111539422A (zh) 基于Faster RCNN的飞行目标协同识别方法
CN116030538B (zh) 弱监督动作检测方法、系统、设备及存储介质
CN103136540A (zh) 一种基于隐结构推理的行为识别方法
CN113989291A (zh) 一种基于PointNet与RANSAC算法的建筑物屋顶平面分割方法
CN117351409A (zh) 混凝土坝面作业风险智能识别方法
CN111931551A (zh) 一种基于轻量级级联网络的人脸检测方法
CN104050665B (zh) 一种视频图像中前景停留时间的估计方法及装置
CN107066943B (zh) 一种人脸检测方法及装置
CN113362286B (zh) 一种基于深度学习的自然资源要素变化检测方法
CN112597699B (zh) 一种融入客观赋权法的社交网络谣言源识别方法
CN101807260B (zh) 变化场景下行人检测的方法
CN114067360A (zh) 一种行人属性检测方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant