CN104657709B - 人脸图像识别方法、装置及服务器 - Google Patents

人脸图像识别方法、装置及服务器 Download PDF

Info

Publication number
CN104657709B
CN104657709B CN201510062185.3A CN201510062185A CN104657709B CN 104657709 B CN104657709 B CN 104657709B CN 201510062185 A CN201510062185 A CN 201510062185A CN 104657709 B CN104657709 B CN 104657709B
Authority
CN
China
Prior art keywords
lbp feature
sample
vector
preset quantity
feature vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510062185.3A
Other languages
English (en)
Other versions
CN104657709A (zh
Inventor
张涛
陈志军
龙飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510062185.3A priority Critical patent/CN104657709B/zh
Publication of CN104657709A publication Critical patent/CN104657709A/zh
Application granted granted Critical
Publication of CN104657709B publication Critical patent/CN104657709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本公开是关于一种人脸图像识别方法、装置及服务器,属于图像处理技术领域。所述方法包括:根据人脸训练样本筛选出来的第一预设数量的局部二值模式LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;计算第一向量与第二向量之间的距离度量;若距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。由于能通过多维度的特征向量来对人脸图像进行识别,从而使得人脸图像识别时参考数据来源较多,而非通过单一的LBP特征值。因此,人脸图像识别的准确率较高。

Description

人脸图像识别方法、装置及服务器
技术领域
本公开涉及图像处理技术领域,特别涉及一种人脸图像识别方法、装置及服务器。
背景技术
随着科技的发展,为了满足对身份进行鉴别的需求,越来越多的场合开始使用人脸图像识别技术。目前的人脸图像识别方法主要是采用人工定义几个LBP(Local BinaryPatterns,局部二值模式)特征,计算待识别的两张人脸图像在每个人工定义的LBP特征下,对应的LBP特征值,根据计算得到的LBP特征值,来进行识别。例如,以人工定义了一个LBP特征为例,可计算第一张待识别的人脸图像对应该LBP特征的第一个LBP特征值,计算第二张待识别的人脸图像对应该LBP特征的第二个LBP特征值。若判断第一个LBP特征值与第二个LBP特征值比较接近,则确定两张人脸图像为同一人的人脸图像。
发明内容
为克服相关技术中存在的问题,本公开提供了一种人脸图像识别方法、装置及服务器。
根据本公开实施例的第一方面,提供了一种人脸图像识别方法,该方法包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;
对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;
计算所述第一向量与所述第二向量之间的距离度量;
若所述距离度量不大于预设阈值,则确定所述两张尺寸相同的人脸图像为同一人对应的人脸图像。
结合第一方面,在第一方面的第一种可能的实现方式中,所述根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量之前,还包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,所述投影矩阵的行数为所述第一预设数量,所述投影矩阵的列数为第二预设数量,或者所述投影矩阵的行数为所述第二预设数量,所述投影矩阵的列数为所述第一预设数量;
所述对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,包括:
根据所述投影矩阵,对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式中,所述根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算所述人脸训练样本中每个样本对应的LBP特征向量;
根据所述人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
结合第一方面的第一种可能的实现方式,在第一方面的第三种可能的实现方式中,所述根据所述投影矩阵,对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,包括:
将所述投影矩阵与所述第一预设数量的第一LBP特征向量相乘,得到第一向量;
将所述投影矩阵与所述第一预设数量的第二LBP特征向量相乘,得到第二向量。
结合第一方面至第一方面的第三种可能的实现方式中任一种可能的实现方式,在第一方面的第四种可能的实现方式中,所述根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量之前,还包括:
获取人脸训练样本,所述人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,所述人脸训练样本中人脸图像的尺寸为预设图像尺寸;
按照预设的选取方式,选取所述预设图像尺寸大小范围内所有的LBP特征;
根据所述人脸训练样本,获取类内样本及类间样本;
根据所述类内样本及所述类间样本,对所述所有的LBP特征进行筛选,得到第一预设数量的LBP特征。
结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述根据所述人脸训练样本,获取类内样本,包括:
对于所述人脸训练样本中任意一个人,任意组合所述任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
结合第一方面的第五种可能的实现方式,在第一方面的第六种可能的实现方式中,所述根据所述人脸训练样本,获取类间样本,包括:
对于所述人脸训练样本中任意两个人,从所述任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本;
或者,任意组合所述人脸训练样本中任两张人脸图像,得到总样本,从所述总样本中除去所述类内样本,得到类间样本。
根据本公开实施例的第二方面,提供了一种人脸图像识别装置,该装置包括:
第一计算模块,用于根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;
第二计算模块,用于对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;
第三计算模块,用于计算所述第一向量与所述第二向量之间的距离度量;
确定模块,用于当所述距离度量不大于预设阈值时,则确定所述两张尺寸相同的人脸图像为同一人对应的人脸图像。
结合第二方面,在第二方面的第一种可能的实现方式中,该装置还包括:
第一获取模块,用于根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,所述投影矩阵的行数为所述第一预设数量,所述投影矩阵的列数为第二预设数量,或者所述投影矩阵的行数为所述第二预设数量,所述投影矩阵的列数为所述第一预设数量;
所述第二计算模块,用于根据所述投影矩阵,对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式中,所述第一获取模块,用于根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算所述人脸训练样本中每个样本对应的LBP特征向量;根据所述人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
结合第二方面的第一种可能的实现方式,在第二方面的第三种可能的实现方式中,所述第二计算模块,用于将所述投影矩阵与所述第一预设数量的第一LBP特征向量相乘,得到第一向量;将所述投影矩阵与所述第一预设数量的第二LBP特征向量相乘,得到第二向量。
结合第二方面至第二方面的第三种可能的实现方式中任一种能的实现方式,在第二方面的第四种可能的实现方式中,所述装置还包括:
第二获取模块,用于获取人脸训练样本,所述人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,所述人脸训练样本中人脸图像的尺寸为预设图像尺寸;
选取模块,用于按照预设的选取方式,选取所述预设图像尺寸大小范围内所有的LBP特征;
第三获取模块,用于根据所述人脸训练样本,获取类内样本及类间样本;
筛选模块,用于根据所述类内样本及所述类间样本,对所述所有的LBP特征进行筛选,得到第一预设数量的LBP特征。
结合第二方面的第四种可能的实现方式,在第二方面的第五种可能的实现方式中,所述第三获取模块,用于对于所述人脸训练样本中任意一个人,任意组合所述任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
结合第二方面的第五种可能的实现方式,在第二方面的第六种可能的实现方式中,所述第三获取模块,用于对于所述人脸训练样本中任意两个人,从所述任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本;或者,任意组合所述人脸训练样本中任两张人脸图像,得到总样本,从所述总样本中除去所述类内样本,得到类间样本。
根据本公开实施例的第三方面,提供了一种服务器,该服务器包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
根据人脸训练样本筛选出来的第一预设数量的局部二值模式LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;
对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;
计算所述第一向量与所述第二向量之间的距离度量;
若所述距离度量不大于预设阈值,则确定所述两张尺寸相同的人脸图像为同一人对应的人脸图像。
本发明实施例提供的技术方案带来的有益效果是:
通过根据第一预设数量的LBP特征,分别计算人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量,对第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,若第一向量与第二向量之间的距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。由于能通过多维度的特征向量来对人脸图像进行识别,从而使得人脸图像识别时参考数据来源较多。因此,人脸图像识别的准确率较高。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种人脸图像识别方法的流程图。
图2是根据一示例性实施例示出的一种人脸图像识别方法的流程图。
图3是根据一示例性实施例示出的一种人脸图像识别装置的示意图。
图4是根据一示例性实施例示出的一种人脸图像识别装置的示意图。
图5是根据一示例性实施例示出的一种人脸图像识别装置的示意图。
图6是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种人脸图像识别方法的流程图,该人脸图像识别方法应用于服务器。如图1所示,该人脸图像识别方法包括以下步骤。
在步骤101中,根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量。
在步骤102中,对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
在步骤103中,计算第一向量与第二向量之间的距离度量。
在步骤104中,若距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。
本公开实施例提供的方法,通过根据第一预设数量的LBP特征,分别计算人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量,对第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,若第一向量与第二向量之间的距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。由于能通过多维度的特征向量来对人脸图像进行识别,从而使得人脸图像识别时参考数据来源较多。因此,人脸图像识别的准确率较高。
作为一种可选实施例,根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量之前,还包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,投影矩阵的行数为第一预设数量,投影矩阵的列数为第二预设数量,或者投影矩阵的行数为第二预设数量,投影矩阵的列数为第一预设数量;
对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,包括:
根据投影矩阵,对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
作为一种可选实施例,根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算人脸训练样本中每个样本对应的LBP特征向量;
根据人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
作为一种可选实施例,根据投影矩阵,对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,包括:
将投影矩阵与第一预设数量的第一LBP特征向量相乘,得到第一向量;
将投影矩阵与第一预设数量的第二LBP特征向量相乘,得到第二向量。
作为一种可选实施例,根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量之前,还包括:
获取人脸训练样本,人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,人脸训练样本中人脸图像的尺寸为预设图像尺寸;
按照预设的选取方式,选取预设图像尺寸大小范围内所有的LBP特征;
根据人脸训练样本,获取类内样本及类间样本;
根据类内样本及类间样本,对所有的LBP特征进行筛选,得到第一预设数量的LBP特征。
作为一种可选实施例,根据人脸训练样本,获取类内样本,包括:
对于人脸训练样本中任意一个人,任意组合任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
作为一种可选实施例,根据人脸训练样本,获取类间样本,包括:
对于人脸训练样本中任意两个人,从任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本;
或者,任意组合人脸训练样本中任两张人脸图像,得到总样本,从总样本中除去类内样本,得到类间样本。
图2是根据一示例性实施例示出的一种人脸图像识别方法的流程图,如图2所示,该人脸图像识别方法应用于服务器中,包括以下步骤。
步骤201、获取人脸训练样本,人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,人脸训练样本中人脸图像的尺寸为预设图像尺寸。
本实施例不对获取人脸训练样本的方式作具体限定,包括但不限于:收集预定数量的人对应的人脸图像。例如,以一共有10000人为例,可收集该10000人对应的人脸图像。若每个人都对应100张人脸图像,则人脸训练样本一共10000×100=1000000张人脸图像。
其中,人脸训练样本中人脸图像的尺寸为预设图像尺寸,预设图像尺寸可根据需求进行设置,本实施例对此不作具体限定。例如,为了便于处理,可将预设图像尺寸设置为长和宽均为128像素。
步骤202、按照预设的选取方式,选取预设图像尺寸大小范围内所有的LBP特征。
其中,预设的选取方式可以为根据预设图像尺寸大小,确定LBP特征所有可能的位置及所有可能的尺寸,按照不同的位置或尺寸对LBP特征进行选取,本实施例对此不作具体限定。相应地,在选取预设图像尺寸大小范围内所有的LBP特征时,可将所有可能的位置与所有可能的尺寸进行任意组合,得到所有的LBP特征,本实施例对此不作具体限定。
例如,以预设图像尺寸为128×128,尺寸的长宽单位均为像素为例。根据预设图像尺寸的大小范围,从而可确定LBP特征所有可能的尺寸大小为1×1至128×128。其中,LBP特征的尺寸大小可以取2×2、3×3或4×4等。若根据预设图像尺寸建立坐标轴,则坐标(0,0)与坐标(128,128)所围成的正方形即对应预设图像尺寸的大小。此时,LBP特征可能的位置为坐标(0,0)与坐标(128,128)所围成的正方形中的坐标点。综上所述,LBP特征的大小可以为1×1至128×128中的任一尺寸大小,LBP特征所处的位置可以为坐标(0,0)与坐标(128,128)所围成的正方形中的任一位置。按照上述LBP特征的取值范围及所处位置范围,对取值范围中的值及所处位置范围中的值进行任意组合,即可得到所有的LBP特征。
步骤203、根据人脸训练样本,获取类内样本及类间样本。
本实施例不对根据人脸训练样本,获取类内样本的方式作具体限定,包括但不限于:对于人脸训练样本中任意一个人,任意组合任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
例如,以人脸训练样本中有100人对应的图像,每个人对应100张人脸图像为例。对于人脸训练样本中任意一个人,任意组合该人对应的人脸图像中的任两张图像,可得到种可能的组合。将人脸训练样本中每个人的人脸图像都按照上述方式进行组合,则可得到种组合,即类内样本。其中,类内样本中每一个样本均为同一人对应的两张不同人脸图像所构成的组合。
本实施例不对根据人脸训练样本,获取类间样本的方式作具体限定,包括但不限于如下两种获取方式:
第一种获取方式,对于人脸训练样本中任意两个人,从任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本。
例如,以人脸训练样本中有100人对应的图像,每个人对应100张人脸图像为例。对于人脸训练样本中任意两个人,任意组合该人对应的人脸图像中的任两张图像,可得到种可能的组合。由于人脸训练样本中一共有100人对应的图像,因此,从100人中任意选取两个人一共有种组合。结合上述两个部分数值,可确定类间样本中组合的数量为 其中,类间样本中每个样本均为不同的两个人分别对应的一张人脸图像所构成的组合。
第二种获取方式,任意组合人脸训练样本中任两张人脸图像,得到总样本,从总样本中除去类内样本,得到类间样本。
例如,以人脸训练样本中有100人对应的图像,每个人对应100张人脸图像为例。由于人脸训练样本中一共有100×100=10000张人脸图像,因此,任意组合人脸训练样本中任两张人脸图像,可得到种组合,即总样本中组合的数量。由于总样本中还包含了同一人对应的两张不同人脸图像所构成的组合,因此,需从总样本中除去类内样本,得到类间样本。根据上述内容可知,类内样本中组合的个数为495000。因此,类间样本中组合的数量为49995000-495000=49500000。需要说明的是,通过第一种获取方式与第二种获取方式最终均能得到类间样本,且两种获取方式得到的类间样本内容是相同的。
步骤204、根据类内样本及类间样本,对所有的LBP特征进行筛选,得到第一预设数量的LBP特征。
本实施例不对根据类内样本及类间样本,对所有的LBP特征进行筛选,得到第一预设数量的LBP特征的方式作具体限定,包括但不限于:将每个LBP特征作为一个基本分类器,为每个基本分类器设置相同的权重;根据每个类内样本及类间样本,对每个基本分类器对应的权重进行逐步修改;按照每个基本分类器对应的权重大小,从大到小进行排列;将前第一预设数量个基本分类器对应的LBP特征作为筛选得到的LBP特征。需要说明的是,上述筛选LBP特征的算法主要为adaboost迭代算法。当然,除了采用adaboost迭代算法之外,还可以采用其它机器自学习的算法,如SVM(Support Vector Machine,支持向量机)算法,本实施例对此不作具体限定。
步骤205、根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量。
其中,每一种LBP特征与LBP特征向量中每一维度的值相对应。根据每一种LBP特征,能够计算LBP特征向量中每一维度的值。例如,以LBP特征为3×3矩阵为例,矩阵中每一块都为一个像素,每一块中间的值均为像素对应的灰度值,矩阵可表示为如下形式:
44 118 192
32 83 204
61 174 250
将矩阵中每一块像素的灰度值与中间像素的灰度值进行比较,如果像素的灰度值大于中间像素的灰度值,则该像素位置会被标志为1,如果像素的灰度值不大于中间像素的灰度值,则该像素位置会被标志为0。根据上述原理,从而能将上述矩阵转化为下面的矩阵:
0 1 1
0 1
0 1 1
将上述矩阵中二进制标志从左上角第一个标志开始,按照顺时针进行排列,从而得到二进制数值01111100,将二进制数值转化为十进制数值,可得到124。则数值124即为3×3的LBP特征对应在LBP特征向量中某一维度的值。按照上述方法,能够计算出待识别的两张尺寸相同的人脸图像每一维度的LBP特征值,从而能得到第一LBP特征向量及第二LBP特征向量。
步骤206、对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
在执行本步骤206之前,还可以根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵。其中,投影矩阵的行数可以为第一预设数量,投影矩阵的列数为第二预设数量,或者投影矩阵的行数为第二预设数量,投影矩阵的列数为第一预设数量。
本实施例不对根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵的方式作具体限定,包括但不限于:根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算人脸训练样本中每个样本对应的LBP特征向量;根据人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
其中,计算人脸训练样本中每个样本对应的LBP特征向量的方式可参考上述步骤205中的过程,此处不再赘述。在根据人脸训练样本中每个样本对应的LBP特征向量,训练投影矩阵时,可通过LDA(Linear Discriminant Analysis,线性判别式分析)的方式,本实施例对不作具体限定。
关于对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量的方式,本实施例对此不作具体限定,包括但不限于:将投影矩阵与第一预设数量的第一LBP特征向量相乘,得到第一向量;将投影矩阵与第一预设数量的第二LBP特征向量相乘,得到第二向量。
例如,以第一LBP特征向量为5000维的横向量,投影矩阵为5000×800的矩阵为例。将第一LBP特征向量与投影矩阵相乘,可得到800维的第一向量。同理,将投影矩阵与第二LBP特征向量相乘,可得到800维的第二向量。
步骤207、计算第一向量与第二向量之间的距离度量。
本实施例不对计算第一向量与第二向量之间的距离度量的方式作具体限定,包括但不限于:计算第一向量与第二向量之间的余弦距离,将计算得到的余弦距离作为距离度量。当然,除了计算余弦距离之外,还可以计算欧式距离,杰卡德距离等,本实施例对此不作具体限定。
例如,以计算余弦距离为例。若第一向量为A(3,5),第二向量为B(6,8),则在计算向量A与向量B之间的余弦距离时,可按照如下公式(1)进行表示:
其中,<A,B>为向量A与向量B之间的内积,|A|与|B|分别为向量A与向量B的长度,cos a为向量A与向量B之间的余弦距离。按照上述公式(1),可计算出向量A与向量B之间的余弦距离为0.99。
步骤208、若距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。
其中,预设阈值可根据实际情况进行设置,本实施例不对预设阈值的大小作具体限定。例如,以预设阈值为0.8为例。通过上述步骤207,由于计算得到第一向量与第二向量之间的距离度量0.99大于0.8。因此,可确定两张尺寸相同的人脸图像为同一人对应的人脸图像。反之,若计算得到第一向量与第二向量之间的距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像不为同一人对应的人脸图像。
本公开实施例提供的方法,通过根据第一预设数量的LBP特征,分别计算人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量,对第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,若第一向量与第二向量之间的距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。由于能通过多维度的特征向量来对人脸图像进行识别,从而使得人脸图像识别时参考数据来源较多。因此,人脸图像识别的准确率较高。
图3是根据一示例性实施例示出的一种人脸图像识别装置的结构示意图,该装置用于执行上述图1或图2所对应的实施例中任一实施例所提供的人脸图像识别方法,该人脸图像识别装置应用于服务器。参照图3,该装置包括第一计算模块301、第二计算模块302、第三计算模块303及确定模块304。
该第一计算模块301被配置为根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;
该第二计算模块302被配置为对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;
该第三计算模块303被配置为计算第一向量与第二向量之间的距离度量;
该确定模块304被配置为当距离度量不大于预设阈值时,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。
在一个实施例中,参见图4,该装置还包括第一获取模块305。
该第一获取模块305被配置为根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,投影矩阵的行数为第一预设数量,投影矩阵的列数为第二预设数量,或者投影矩阵的行数为第二预设数量,投影矩阵的列数为第一预设数量;
该第二计算模块302被配置为根据投影矩阵,对第一预设数量的第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
在一个实施例中,第一获取模块305被配置为根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算人脸训练样本中每个样本对应的LBP特征向量;根据人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
在一个实施例中,第二计算模块302被配置为将投影矩阵与第一预设数量的第一LBP特征向量相乘,得到第一向量;将投影矩阵与第一预设数量的第二LBP特征向量相乘,得到第二向量。
在一个实施例中,参见图5,该装置还包括第二获取模块306、选取模块307、第三获取模块308及筛选模块309。
该第二获取模块306被配置为获取人脸训练样本,人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,人脸训练样本中人脸图像的尺寸为预设图像尺寸;
该选取模块307被配置为按照预设的选取方式,选取预设图像尺寸大小范围内所有的LBP特征;
该第三获取模块308被配置为根据人脸训练样本,获取类内样本及类间样本;
该筛选模块309被配置为根据类内样本及类间样本,对所有的LBP特征进行筛选,得到第一预设数量的LBP特征。
在一个实施例中,第三获取模块308被配置为对于人脸训练样本中任意一个人,任意组合任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
在一个实施例中,第三获取模块308被配置为对于人脸训练样本中任意两个人,从任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本;或者,任意组合人脸训练样本中任两张人脸图像,得到总样本,从总样本中除去类内样本,得到类间样本。
本公开实施例提供的装置,通过根据第一预设数量的LBP特征,分别计算人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量,对第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,若第一向量与第二向量之间的距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。由于能通过多维度的特征向量来对人脸图像进行识别,从而使得人脸图像识别时参考数据来源较多。因此,人脸图像识别的准确率较高。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种服务器600的框图。参照图6,服务器600包括处理组件622,其进一步包括一个或多个处理器,以及由存储器632所代表的存储器资源,用于存储可由处理组件622的执行的指令,例如应用程序。存储器632中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件622被配置为执行指令,以执行上述人脸图像识别方法。
服务器600还可以包括一个电源组件626被配置为执行服务器600的电源管理,一个有线或无线网络接口650被配置为将服务器600连接到网络,和一个输入输出(I/O)接口658。服务器600可以操作基于存储在存储器632的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开实施例提供的服务器,通过根据第一预设数量的LBP特征,分别计算人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量,对第一LBP特征向量及第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,若第一向量与第二向量之间的距离度量不大于预设阈值,则确定两张尺寸相同的人脸图像为同一人对应的人脸图像。由于能通过多维度的特征向量来对人脸图像进行识别,从而使得人脸图像识别时参考数据来源较多。因此,人脸图像识别的准确率较高。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (12)

1.一种人脸图像识别方法,其特征在于,所述方法包括:
根据人脸训练样本筛选出来的第一预设数量的局部二值模式LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;
对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;
计算所述第一向量与所述第二向量之间的距离度量;
若所述距离度量不大于预设阈值,则确定所述两张尺寸相同的人脸图像为同一人对应的人脸图像,
所述计算所述第一向量与所述第二向量之间的距离度量,包括:
计算第一向量与第二向量之间的余弦距离,将计算得到的余弦距离作为距离度量,
所述根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量之前,还包括:
获取人脸训练样本,所述人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,所述人脸训练样本中人脸图像的尺寸为预设图像尺寸;
按照预设的选取方式,选取所述预设图像尺寸大小范围内所有的LBP特征;
根据所述人脸训练样本,获取类内样本及类间样本;
根据所述类内样本及所述类间样本,对所述所有的LBP特征进行筛选,得到第一预设数量的LBP特征,
所述根据所述类内样本及所述类间样本,对所述所有的LBP特征进行筛选,得到第一预设数量的LBP特征,包括:
将每个LBP特征作为一个基本分类器,为每个所述基本分类器设置相同的权重;根据每个所述类内样本及所述类间样本,对每个所述基本分类器对应的权重进行逐步修改;按照每个所述基本分类器对应的权重大小,从大到小进行排列;将前第一预设数量个所述基本分类器对应的LBP特征作为筛选得到的LBP特征。
2.根据权利要求1所述的方法,其特征在于,所述根据人脸训练样本筛选出来的第一预设数量的LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量之前,所述将前第一预设数量个所述基本分类器对应的LBP特征作为筛选得到的LBP特征之后,所述方法还包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,所述投影矩阵的行数为所述第一预设数量,所述投影矩阵的列数为第二预设数量,或者所述投影矩阵的行数为所述第二预设数量,所述投影矩阵的列数为所述第一预设数量;
所述对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,包括:
根据所述投影矩阵,对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
3.根据权利要求2所述的方法,其特征在于,所述根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,包括:
根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算所述人脸训练样本中每个样本对应的LBP特征向量;
根据所述人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
4.根据权利要求2所述的方法,其特征在于,所述根据所述投影矩阵,对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量,包括:
将所述投影矩阵与所述第一预设数量的第一LBP特征向量相乘,得到第一向量;
将所述投影矩阵与所述第一预设数量的第二LBP特征向量相乘,得到第二向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述人脸训练样本,获取类内样本,包括:
对于所述人脸训练样本中任意一个人,任意组合所述任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
6.根据权利要求5所述的方法,其特征在于,所述根据所述人脸训练样本,获取类间样本,包括:
对于所述人脸训练样本中任意两个人,从所述任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本;
或者,任意组合所述人脸训练样本中任两张人脸图像,得到总样本,从所述总样本中除去所述类内样本,得到类间样本。
7.一种人脸图像识别装置,其特征在于,所述装置包括:
第一计算模块,用于根据人脸训练样本筛选出来的第一预设数量的局部二值模式LBP特征,分别计算待识别的两张尺寸相同的人脸图像对应的LBP特征向量,得到第一预设数量的第一LBP特征向量及第二LBP特征向量;
第二计算模块,用于对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量;
第三计算模块,用于计算所述第一向量与所述第二向量之间的距离度量;
确定模块,用于当所述距离度量不大于预设阈值时,则确定所述两张尺寸相同的人脸图像为同一人对应的人脸图像,
所述第三计算模块,具体用于计算第一向量与第二向量之间的余弦距离,将计算得到的余弦距离作为距离度量,
所述装置还包括:
第二获取模块,用于获取人脸训练样本,所述人脸训练样本由至少两人对应的人脸图像所构成,每个人对应至少两张人脸图像,所述人脸训练样本中人脸图像的尺寸为预设图像尺寸;
选取模块,用于按照预设的选取方式,选取所述预设图像尺寸大小范围内所有的LBP特征;
第三获取模块,用于根据所述人脸训练样本,获取类内样本及类间样本;
筛选模块,用于根据所述类内样本及所述类间样本,对所述所有的LBP特征进行筛选,得到第一预设数量的LBP特征,
所述根据所述类内样本及所述类间样本,对所述所有的LBP特征进行筛选,得到第一预设数量的LBP特征,包括:
将每个LBP特征作为一个基本分类器,为每个所述基本分类器设置相同的权重;根据每个所述类内样本及所述类间样本,对每个所述基本分类器对应的权重进行逐步修改;按照每个所述基本分类器对应的权重大小,从大到小进行排列;将前第一预设数量个所述基本分类器对应的LBP特征作为筛选得到的LBP特征。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一获取模块,用于根据人脸训练样本筛选出来的第一预设数量的LBP特征,获取投影矩阵,所述投影矩阵的行数为所述第一预设数量,所述投影矩阵的列数为第二预设数量,或者所述投影矩阵的行数为所述第二预设数量,所述投影矩阵的列数为所述第一预设数量;
所述第二计算模块,用于根据所述投影矩阵,对所述第一预设数量的第一LBP特征向量及所述第二LBP特征向量进行降维计算,得到第二预设数量的第一向量及第二向量。
9.根据权利要求8所述的装置,其特征在于,所述第一获取模块,用于根据人脸训练样本筛选出来的第一预设数量的LBP特征,计算所述人脸训练样本中每个样本对应的LBP特征向量;根据所述人脸训练样本中每个样本对应的LBP特征向量,训练得到投影矩阵。
10.根据权利要求8所述的装置,其特征在于,所述第二计算模块,用于将所述投影矩阵与所述第一预设数量的第一LBP特征向量相乘,得到第一向量;将所述投影矩阵与所述第一预设数量的第二LBP特征向量相乘,得到第二向量。
11.根据权利要求7所述的装置,其特征在于,所述第三获取模块,用于对于所述人脸训练样本中任意一个人,任意组合所述任意一个人对应的人脸图像中的任两张人脸图像,得到类内样本。
12.根据权利要求11所述的装置,其特征在于,所述第三获取模块,用于对于所述人脸训练样本中任意两个人,从所述任意两个人对应的人脸图像中各选取任意一张人脸图像,将挑选出来的两张人脸图像进行组合,得到类间样本;或者,任意组合所述人脸训练样本中任两张人脸图像,得到总样本,从所述总样本中除去所述类内样本,得到类间样本。
CN201510062185.3A 2015-02-05 2015-02-05 人脸图像识别方法、装置及服务器 Active CN104657709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510062185.3A CN104657709B (zh) 2015-02-05 2015-02-05 人脸图像识别方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510062185.3A CN104657709B (zh) 2015-02-05 2015-02-05 人脸图像识别方法、装置及服务器

Publications (2)

Publication Number Publication Date
CN104657709A CN104657709A (zh) 2015-05-27
CN104657709B true CN104657709B (zh) 2019-03-15

Family

ID=53248810

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510062185.3A Active CN104657709B (zh) 2015-02-05 2015-02-05 人脸图像识别方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN104657709B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106257495A (zh) * 2015-06-19 2016-12-28 阿里巴巴集团控股有限公司 一种数字识别方法及装置
CN104899579A (zh) * 2015-06-29 2015-09-09 小米科技有限责任公司 人脸识别方法和装置
CN106169072B (zh) * 2016-07-07 2019-03-19 中国科学院上海微系统与信息技术研究所 一种基于泰勒展开的人脸识别方法及系统
CN107403370B (zh) * 2016-08-31 2018-06-29 浙江易网科技股份有限公司 金融借贷风险控制系统以及运行方法
CN106934922A (zh) * 2017-03-15 2017-07-07 深圳怡化电脑股份有限公司 一种纸币检测方法及装置
CN107966944B (zh) * 2017-11-30 2020-12-08 贵州财经大学 智慧大棚分区控制系统及分区采摘方法
CN108564067B (zh) * 2018-04-28 2021-07-20 深圳卡安兴科技有限公司 人脸比对的阈值确定方法及系统
CN112884040B (zh) * 2021-02-19 2024-04-30 北京小米松果电子有限公司 训练样本数据的优化方法、系统、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101004791A (zh) * 2007-01-19 2007-07-25 赵力 一种基于二维偏最小二乘法的面部表情识别方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8218880B2 (en) * 2008-05-29 2012-07-10 Microsoft Corporation Linear laplacian discrimination for feature extraction

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101004791A (zh) * 2007-01-19 2007-07-25 赵力 一种基于二维偏最小二乘法的面部表情识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
智能环境下基于视听信息多层级融合的身份识别;吴迪;《中国博士学位论文全文数据库信息科技辑》;20140915(第09期);第1-114页

Also Published As

Publication number Publication date
CN104657709A (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
CN104657709B (zh) 人脸图像识别方法、装置及服务器
Kobler et al. Variational networks: connecting variational methods and deep learning
US10936911B2 (en) Logo detection
CN108875511B (zh) 图像生成的方法、装置、系统及计算机存储介质
CN108875523B (zh) 人体关节点检测方法、装置、系统和存储介质
CN108876804B (zh) 抠像模型训练和图像抠像方法、装置和系统及存储介质
CN103983334B (zh) 一种信息处理的方法及电子设备
US10832034B2 (en) Facial image generating method, facial image generating apparatus, and facial image generating device
KR20180107085A (ko) 증강 현실의 가상 객체들에 영향을 미치는 방법
CN109522790A (zh) 人体属性识别方法、装置、存储介质及电子设备
CN109815843A (zh) 目标检测方法及相关产品
US20180137665A1 (en) Facial feature adding method, facial feature adding apparatus, and facial feature adding device
CN111008935B (zh) 一种人脸图像增强方法、装置、系统及存储介质
CN111881804B (zh) 基于联合训练的姿态估计模型训练方法、系统、介质及终端
CN109348731A (zh) 一种图像匹配的方法及装置
CN110490115B (zh) 人脸检测模型的训练方法、装置、电子设备及存储介质
Liu et al. Extended RGB2Gray conversion model for efficient contrast preserving decolorization
CN112132812B (zh) 证件校验方法、装置、电子设备及介质
KR102239588B1 (ko) 이미지 처리 방법 및 장치
US20230394871A1 (en) Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image
CN111062279A (zh) 照片处理方法及照片处理装置
Liu et al. Color-to-gray conversion with perceptual preservation and dark channel prior
Deng et al. An additive convolution model for fast restoration of nonuniform blurred images
JP6686890B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
Matsuhira et al. Pointedness of an image: Measuring how pointy an image is perceived

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant