CN105426878B - 人脸聚类方法及装置 - Google Patents

人脸聚类方法及装置 Download PDF

Info

Publication number
CN105426878B
CN105426878B CN201510971798.9A CN201510971798A CN105426878B CN 105426878 B CN105426878 B CN 105426878B CN 201510971798 A CN201510971798 A CN 201510971798A CN 105426878 B CN105426878 B CN 105426878B
Authority
CN
China
Prior art keywords
photo
class
subclass
face
human face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510971798.9A
Other languages
English (en)
Other versions
CN105426878A (zh
Inventor
陈志军
李明浩
侯文迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510971798.9A priority Critical patent/CN105426878B/zh
Publication of CN105426878A publication Critical patent/CN105426878A/zh
Application granted granted Critical
Publication of CN105426878B publication Critical patent/CN105426878B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本公开揭示了一种人脸聚类方法及装置,属于人脸识别领域。该人脸聚类方法包括:获取第一照片类和第二照片类;对第一照片类中的人脸照片进行聚类得到至少一个照片子类;将至少一个照片子类中的一个照片子类确定为正确人脸子类;计算正确人脸子类与第二照片类之间的距离;若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类;解决了在人脸聚类时,若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片,则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题;达到了在聚类时避免出现一个照片类因为少数错误人脸照片时,引入更多错误人脸照片的聚类错误,提高人脸聚类的准确度的效果。

Description

人脸聚类方法及装置
技术领域
本公开涉及人脸识别领域,特别涉及一种人脸聚类方法及装置。
背景技术
人脸聚类方法是一种基于人脸特征将相似人脸进行聚类的方法。在照片管理程序中,可以通过人脸聚类方法将对应于不同人脸的照片进行聚类,从而形成不同的相册。
相关技术中的一种人脸聚类方法,包括:第一,将每一张照片初始化为一个照片类;第二,根据每张照片的特征向量,计算任意两个照片类之间的距离;第三,若两个照片类之间的距离小于阈值,则将两个照片类聚类至同一个照片类中;迭代上述第二步骤和第三步骤。但是在聚类过程中,若照片类A中存在几张错误人脸照片,照片类B中存在多张与该错误人脸照片对应的其它人脸照片,则在不断迭代过程中,有可能会错误地将照片类A和照片类B聚类至同一个照片类中。
发明内容
为了解决在人脸聚类时,若照片类B中存在与照片类A中错误人脸相对应的其他人脸照片,则有可能会错误地将照片类A与照片类B聚类至同一个照片类中的问题,本公开提供一种人脸聚类方法及装置。所述技术方案如下:
根据本公开实施例的第一方面,提供一种人脸聚类方法,该方法包括:
获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片;
对第一照片类中的人脸照片进行聚类,得到至少一个照片子类;
将至少一个照片子类中的一个照片子类确定为正确人脸子类;
计算正确人脸子类与第二照片类之间的距离;
若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类。
可选的,对第一照片类中的人脸照片进行聚类,得到至少一个照片子类,包括:
对第一照片类中的每个人脸照片进行密度聚类,得到至少一个照片子类。
可选的,对第一照片类中的每个人脸照片进行密度聚类,得到至少一个照片子类,包括:
获取第一照片类中每个人脸照片的特征向量;
通过预设的密度聚类算法计算每个人脸照片的特征向量在高维空间中的密度分布;
根据密度分布,得到将人脸照片分别聚类至至少一个照片子类中。
可选的,密度聚类算法包括基于高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法OPTICS、基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法LSNCCP中的至少一种。
可选的,将至少一个照片子类中的一个照片子类确定为正确人脸子类,包括:
计算每个照片子类中的人脸照片的数量;
将数量最大的照片子类确定为正确人脸子类。
根据本公开实施例的第二方面,提供一种人脸聚类装置,该装置包括:
类获取模块,被配置为获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片;
第一聚类模块,被配置为对第一照片类中的人脸照片进行聚类,得到至少一个照片子类;
确定模块,被配置为将至少一个照片子类中的一个照片子类确定为正确人脸子类;
距离计算模块,被配置为计算正确人脸子类与第二照片类之间的距离;
第二聚类模块,被配置为当距离大于阈值时,将第一照片类和第二照片类分别聚类至不同的照片类。
可选的,第一聚类模块,包括:
密度聚类子模块,被配置为对第一照片类中的每个人脸照片进行密度聚类,得到至少一个照片子类。
可选的,对密度聚类子模块,包括:
获取子模块,被配置为获取第一照片类中每个人脸照片的特征向量;
密度计算子模块,被配置为通过预设的密度聚类算法计算每个人脸照片的特征向量在高维空间中的密度分布;
聚类子模块,被配置为根据密度分布,得到将人脸照片分别聚类至至少一个照片子类中。
可选的,密度聚类算法包括基于高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法OPTICS、基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法LSNCCP中的至少一种。
可选的,确定模块,包括:
数量计算子模块,被配置为计算每个照片子类中的人脸照片的数量;
确定子模块,被配置为将数量最大的照片子类确定为正确人脸子类。
根据本公开实施例的第三方面,提供一种人脸聚类装置,该装置包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片;
对第一照片类中的人脸照片进行聚类,得到至少一个照片子类;
将至少一个照片子类中的一个照片子类确定为正确人脸子类;
计算正确人脸子类与第二照片类之间的距离;
若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类。
本公开的实施例提供的技术方案可以包括以下有益效果:
通过获取第一照片类和第二照片类,对第一照片类中人脸照片进行聚类,得到至少一个照片子类,将至少一个照片子类中的一个照片子类确定为正确人脸子类,计算正确人脸子类与第二照片类之间的距离,若距离小于阈值,则将第一照片类和第二照片类聚类至同一个照片类;解决了在人脸聚类时,若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片,则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题;达到了在聚类时避免出现一个照片类因为存在少数错误人脸照片时,引入更多错误人脸照片的聚类错误,提高人脸聚类的准确度的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并于说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种人脸聚类方法的方法流程图;
图2A是根据另一示例性实施例示出的一种人脸聚类方法的方法流程图;
图2B是根据另一示例性实施例示出的一种人脸聚类方法的实施示意图;
图2C是根据另一示例性实施例示出的一种人脸聚类方法的方法流程图;
图2D是根据另一示例性实施例示出的DBSCAN算法的实施示意图;
图2E是根据另一示例性实施例示出的一种人脸聚类方法的实施示意图;
图2F是根据另一示例性实施例示出的一种人脸聚类方法的实施示意图;
图3是根据一示例性实施例示出的一种人脸聚类装置的框图;
图4是根据另一示例性实施例示出的一种人脸聚类装置的框图;
图5是根据另一示例性实施例示出的一种人脸聚类装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
人脸聚类方法存在多种,比如:划分聚类方法、层次聚类方法、密度聚类方法、网格聚类方法、模型聚类方法。其中,密度聚类方法的主要指导思想是指当某一区域中的点的密度大于某个阈值时,就将该点添加到与该点相近的聚类中去,点的密度由该点特定半径之内的点计数(包括该点本身)来估计。
密度聚类算法包括:DBSCAN(Gensity-based Spatial Cluetering ofApplication with Noise,基于高密度连接区域密度聚类算法)、OPTICS(Order Points toIdentify the Cluetering Structure,对象排序识别聚类结构算法)、IGDCA(IncrementalGrid Density-Based Cluetering Algorithm,基于密度的增量算法)、LSNCCP(theLargest set of Nov-Cored Core Points,基于最大不相含核心点集的聚类算法)等。
在对人脸照片进行聚类时,可以采用全量聚类或者增量聚类的方法进行聚类。
全量聚类的过程如下:
第一步、对所有需要聚类的人脸照片进行初始化处理,获取人脸照片中的m个人脸信息,将获取到的m个人脸信息作为m个照片类;
第二步、计算m个照片类中任意两个照片类之间的距离;
第三步、将距离小于预定阈值的两个照片类合并成一个照片类;
第四步、重新执行第二步,直到所有照片类之间的距离都大于预定阈值,也即到照片类的数量不再发生变化。
举例来说,假设手机中存储有人脸照片,获取人脸照片中的30个人脸信息,将30个人脸信息作为30个照片类,计算30个照片类中任意两个照片类之间的距离,将距离小于预定阈值的照片类聚类至同一个照片类中,当照片类的数量有变化时,再重新计算照片类之间的距离,将照片类聚类至同一个类中,直到照片类的数量不再变化,得到4个照片类,也即得到4个相册,每个相册对应于一个人脸。
除第一次人脸聚类以外的人脸聚类,一般采用增量聚类的方法,增量聚类的过程如下:
第一步、获取上一次聚类的结果,将新增的p个人脸信息作为p个照片类,若上一次聚类后得到k个照片类,则共有k+p个照片类;
第二步、计算k+p个照片类中任意两个照片类之间的距离;
第三步、将距离小于预定阈值的两个照片类合并成一个照片类;
第四步、重新执行第二步,直到所有照片类之间的距离都大于预定阈值,也即到照片类的数量不再发生变化。
在需要进行人脸聚类的人脸照片完成初始化处理后,对得到的所有的照片类进行一次人脸聚类,得到聚类后的若干个照片类,经过一次聚类后,照片类的数量小于初始化处理得到的照片类的数量,部分照片类中包含至少两张人脸照片;不断对聚类得到的照片类进行再次聚类,直到照片类的数量不再发生变化,即得到对应于不同人脸的相册。
请参考图1,其示出了本公开一个示例性实施例提供的人脸聚类方法的方法流程图。该人脸聚类方法可由智能手机、平板电脑、个人电脑等电子设备的处理器执行。该人脸聚类方法可以用于上述聚类过程中除经过全量聚类初始化处理后的第一次迭代过程以外的任意一次迭代过程。如图1所示,该人脸聚类方法可以包括如下步骤:
在步骤101中,获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片。
在步骤102中,对第一照片类中的人脸照片进行聚类,得到至少一个照片子类。
在步骤103中,将至少一个照片子类中的一个照片子类确定为正确人脸子类。
在步骤104中,计算正确人脸子类与第二照片类之间的距离。
在步骤105中,若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类。
综上所述,本公开实施例所提供的人脸聚类方法,通过获取第一照片类和第二照片类,对第一照片类中人脸照片进行聚类,得到至少一个照片子类,将至少一个照片子类中的一个照片子类确定为正确人脸子类,计算正确人脸子类与第二照片类之间的距离,若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类;解决了在人脸聚类时,若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片,则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题;达到了在聚类时避免出现一个照片类因为存在少数错误人脸照片时,引入更多错误人脸照片的聚类错误,提高人脸聚类的准确度的效果。
请参考图2A,其示出了本公开一个示例性实施例提供的人脸聚类方法的方法流程图。该人脸聚类方法可由智能手机、平板电脑、个人电脑等电子设备的处理器执行。该人脸聚类方法可以用于上述聚类过程中除全量聚类初始化处理后的第一次迭代过程以外的任意一次迭代过程。如图2A所示,该人脸聚类方法可以包括如下步骤:
在步骤201中,获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片。
第一照片类和第二照片类是初始化后经过至少一次聚类得到的若干个照片类中的任意两个照片类,第一照片类中包括聚类得到的至少两张人脸照片。
如图2B所示,从经过至少一次人脸聚类得到的若干个照片类中,获取两个照片类,第一照片类21中包括聚类得到的七张人脸照片25、26、27、28、29、30、31,第二照片类22中包括聚类得到的三张人脸照片,图2B中采用卡通人脸照片来示意性地表示人脸照片。
在步骤202中,对第一照片类中的每个人脸照片进行密度聚类,得到至少一个照片子类。
由于第一照片类中包括聚类得到的至少两张人脸照片,可以对第一照片类中的人脸照片再次进行聚类。对第一照片类中的每个人脸照片进行密度聚类,得到至少一个照片类。
该步骤由如下几个步骤实现,如图2C所示:
在步骤2021中,获取第一照片类中每个人脸照片的特征向量。
可选的,人脸照片的特征向量是高维特征向量,每个特征向量的维度都相同,维度是指每个人脸照片的特征向量中的独立参数的数目,也即用于表征人脸照片的特征的独立参数的数量相同。
在步骤2022中,通过预设的密度聚类算法计算每个人脸照片的特征向量在高维空间中的密度分布。
可选的,高维空间是由至少三个独立的参数构成的空间;密度分布能够直观地表现出人脸照片之间的相似程度,密度分布相同的特征向量一般属于同一个照片类。
可选的,密度聚类算法是DBSCAN算法、OPTICS算法、IGDCA算法、LSNCCP算法中的至少一种。
可选的,以密度算法是DBSCAN算法为例,将高维空间中的特征向量转化为在二维平面上分布的对象,如图2D所示,从任意对象p开始,根据预定的半径e,在以对象p为圆心,半径为e的区域内查找其他对象,如果对象p在预定半径e的区域内找到的对象的数量大于密度阈值M,则称对象p为核心对象;如果对象p是一个核心对象,对象q在以p为圆心,半径为e的区域内,则称p直接密度可达q;从任意一个对象开始,确定核心对象,并找出每个核心对象的直接密度可达对象。
在步骤2023中,根据密度分布,将人脸照片分别聚类至至少一个照片子类中。
根据密度分布,将密度相同的人脸照片聚类至同一个人脸照片子类中,最终聚类出至少一个照片子类。
可选的,若使用的密度聚类算法是DBSCAN算法,则提取每个核心对象,及每个核心对象对应的直接密度可达对象,并将每个核心对象及其直接密度可达对象作为一个类。
如图2E所示,第一照片类聚类出两个照片子类,第一照片类中的人脸照片中的人脸照片25、26、27、28、29聚类至照片子类23,第一照片类中的人脸照片30、31聚类至照片子类24。
在步骤203中,计算每个照片子类中的人脸照片的数量。
以图2E为例,照片子类23中人脸照片的数量为5,照片子类24中人脸照片的数量为2。
在步骤204中,将数量最大的照片子类确定为正确人脸子类。
可选的,包含的人脸照片的数量最大的照片子类中的人脸照片的特征能够最大程度地代表第一照片类中的大部分人脸照片的特征,因此将数量最大的照片子类确定为正确人脸子类。
以图2E为例,照片子类23中人脸照片的数量最大,因此将照片子类23作为正确人脸子类。
在步骤205中,计算正确人脸子类与第二照片类之间的距离。
可选的,用正确人脸子类代表第一照片类,计算与第二照片类之间的距离,两个照片类之间的距离表示两个照片类中人脸照片的相似程度。
可选的,两个类之间的距离代表两个类中人脸照片的差异程度,距离越小代表两个类中人脸照片的相似度越大,距离越大代表两个类中人脸照片的相似度越小。
在步骤206中,若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同照片类。
可选的,阈值是根据实际需求预先设定的值,或者是经验值。
当正确人脸子类和第二照片类之间的距离大于阈值时,表示正确人脸子类中的人脸照片和第二照片类中的人脸照片的相似程度不大,照片之间存在较大的差异,正确人脸子类中的人脸照片属于一个照片类,第二照片类中的人脸照片属于另一个照片类,正确人脸子类所属的照片类中的人脸照片和第二照片类所属的照片类中的人脸照片分别对应于不同的人脸。
可选的,若距离小于阈值,则将第一照片类和第二照片类聚类至同一个照片类。当正确人脸子类与第二照片类之间的距离小于阈值时,表示正确人脸子类中的人脸照片与第二照片类中的人脸照片相似程度大,可将正确人脸子类中的人脸照片和第二照片类中的人脸照片作为对应于同一个人脸的照片,由于正确人脸子类是第一照片类中的照片子类,因此将第一照片类与第二照片类聚类至同一个照片类中;当任意两个特征点之间的距离大于阈值时,表示正确人脸子类中的人脸照片与第二照片类中的人脸照片相似程度不大,认为正确人脸子类中的人脸照片和第二照片类中的人脸照片不是对应于同一个人脸的照片,因此不将第一照片类与第二照片类聚类至同一个照片类中。
以图2F为例,计算正确人脸子类23与第二照片类22之间的距离,并将距离与阈值比较,得到正确人脸子类23与第二照片类22之间的距离d小于阈值,表示正确人脸子类中人脸照片与第二照片类中的人脸照片相似程度较大,认为是对应于同一个人脸的人脸照片,因此,将第一照片类21和第二照片类22聚类至同一个照片类31。
综上所述,本公开实施例所提供的人脸聚类方法,通过获取第一照片类和第二照片类,对第一照片类中人脸照片进行聚类,得到至少一个照片子类,将至少一个照片子类中的一个照片子类确定为正确人脸子类,计算正确人脸子类与第二照片类之间的距离,若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类;解决了在人脸聚类时,若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片,则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题;达到了在聚类时避免出现一个照片类因为存在少数错误人脸照片时,引入更多错误人脸照片的聚类错误,提高人脸聚类的准确度的效果。
此外,本公开实施例所提供的人脸聚类方法,还通过对第一照片类中的每个人脸照片进行密度聚类得到至少一个照片子类,将不同特征的人脸照片区分开。
此外,本公开实施例所提供的人脸聚类方法,还通过将照片子类中人脸数量最大的照片子类确定为正确人脸子类,选出最能代表第一照片类中的人脸照片的特征的照片子类,使得后续人脸聚类的准确度提高。
需要说明的是,上述人脸聚类方法可重复执行,也即在每完成一次人脸聚类,照片类中包含的人脸照片出现变动时,就可执行上述人脸聚类方法,确定出正确人脸子类,利用正确人脸子类参与后续人脸聚类,最终得到聚类结果是分别属于不同人脸的若干个照片类。
在一个示例性的例子中,采用全量聚类的方法对若干张人脸照片进行初始化,得到n个照片类,计算n个照片类中任意两个照片类之间的距离,对该n个照片类进行再次聚类后得到m个照片类,某些照片类中包含至少两张人脸照片;获取第一照片类和第二照片类,第一照片类中包含至少两张人脸照片,采用DBSCAN算法对第一照片类中的人脸照片进行密度聚类,得到三个照片子类,将包含人脸照片数量最大的照片子类作为正确人脸子类A,将得到的正确人脸子类A与第二照片类之间距离与阈值比较,小于阈值,将第一照片类与第二照片类聚类至同一个照片类,当m个照片类都完成本次聚类后,得到k个照片类,在次取出第一照片类和第二照片类,确定出第一照片类中的正确人脸子类,并使用正确人脸子类完成聚类;如此迭代计算直到n张人脸照片被聚类成若干个照片类,每个照片类都不能与任意一个照片类聚类至同一个照片类。形成的若干个照片类即为分别对应不同人脸的若干个相册。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
请参考图3,其示出了本发明一个实施例提供的人脸聚类装置的结构方框图。该人脸聚类装置可以通过软件、硬件或者两者的结合实现成为上述可提供人脸聚类方法的电子设备的全部或者一部分。如图3所示,该装置包括:
类获取模块310,被配置为获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片。
第一聚类模块320,被配置为对第一照片类中的人脸照片进行聚类,得到至少一个照片子类。
确定模块330,被配置为将至少一个照片子类中的一个照片子类确定为正确人脸子类。
距离计算模块340,被配置为计算正确人脸子类与第二照片类之间的距离。
第二聚类模块350,被配置为当距离大于阈值时,将第一照片类和第二照片类分别聚类至不同的照片类。
综上所述,本公开实施例所提供的人脸聚类装置,通过获取第一照片类和第二照片类,对第一照片类中人脸照片进行聚类,得到至少一个照片子类,将至少一个照片子类中的一个照片子类确定为正确人脸子类,计算正确人脸子类与第二照片类之间的距离,若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类;解决了在人脸聚类时,若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片,则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题;达到了在聚类时避免出现一个照片类因为少数错误人脸照片时,引入更多错误人脸照片的聚类错误,提高人脸聚类的准确度的效果。
请参考图4,其示出了本发明一个实施例提供的人脸聚类装置的结构方框图。该人脸聚类装置可以通过软件、硬件或者两者的结合实现成为上述可提供人脸聚类方法的电子设备的全部或者一部分。如图4所示,该装置包括:
类获取模块410,被配置为获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片;
第一聚类模块420,被配置为对第一照片类中的人脸照片进行聚类,得到至少一个照片子类;
确定模块430,被配置为将至少一个照片子类中的一个照片子类确定为正确人脸子类;
距离计算模块440,被配置为计算正确人脸子类与第二照片类之间的距离;
第二聚类模块450,被配置为当距离大于阈值时,将第一照片类和第二照片类分别聚类至不同的照片类。
可选的,第一聚类模块420,包括:
密度聚类子模块421,被配置为对第一照片类中的每个人脸照片进行密度聚类,得到至少一个照片子类。
可选的,对密度聚类子模块421,包括:
获取子模块4211,被配置为获取第一照片类中每个人脸照片的特征向量;
密度计算子模块4212,被配置为通过预设的密度聚类算法计算每个人脸照片的特征向量在高维空间中的密度分布;
聚类子模块4213,被配置为根据密度分布,将人脸照片分别聚类至至少一个照片子类中。
可选的,密度聚类算法包括基于高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法OPTICS、基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法LSNCCP中的至少一种。
可选的,确定模块430,包括:
数量计算子模块431,被配置为计算每个照片子类中的人脸照片的数量;
确定子模块432,被配置为将数量最大的照片子类确定为正确人脸子类。
综上所述,本公开实施例所提供的人脸聚类装置,通过获取第一照片类和第二照片类,对第一照片类中人脸照片进行聚类,得到至少一个照片子类,将至少一个照片子类中的一个照片子类确定为正确人脸子类,计算正确人脸子类与第二照片类之间的距离,若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类;解决了在人脸聚类时,若第二照片类中存在与第一照片类中错误人脸相对应的其他人脸照片,则有可能错误地将第一照片类与第二照片类聚类至同一个照片类的问题;达到了在聚类时避免出现一个照片类因为存在少数错误人脸照片时,引入更多错误人脸照片的聚类错误,提高人脸聚类的准确度的效果。
此外,本公开实施例所提供的人脸聚类装置,还通过对第一照片类中的每个人脸照片进行密度聚类得到至少一个照片子类,将不同特征的人脸照片区分开。
此外,本公开实施例所提供的人脸聚类装置,还通过将照片子类中人脸数量最大的照片子类确定为正确人脸子类,选出最能代表第一照片类中的人脸照片的特征的照片子类,使得后续人脸聚类的准确度提高。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开一示例性实施例提供了一种人脸聚类装置,能够实现本公开提供的人脸聚类方法,该人脸聚类装置包括:处理器、用于存储处理器可执行指令的存储器;
其中,处理器被配置为:
获取第一照片类和第二照片类,第一照片类包括聚类得到的至少两张人脸照片;
对第一照片类中的人脸照片进行聚类,得到至少一个照片子类;
将至少一个照片子类中的一个照片子类确定为正确人脸子类;
计算正确人脸子类与第二照片类之间的距离;
若距离大于阈值,则将第一照片类和第二照片类分别聚类至不同的照片类。
图5是根据一示例性实施例示出的一种人脸装置的框图。例如,装置500可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图5,装置500可以包括以下一个或多个组件:处理组件502,存储器504,电源组件506,多媒体组件508,音频组件510,输入/输出(I/O)接口512,传感器组件514,以及通信组件516,图像识别组件515。
处理组件502通常控制装置500的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件502可以包括一个或多个处理器518来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件502可以包括一个或多个模块,便于处理组件502和其他组件之间的交互。例如,处理组件502可以包括多媒体模块,以方便多媒体组件508和处理组件502之间的交互。
存储器504被配置为存储各种类型的数据以支持在装置500的操作。这些数据的示例包括用于在装置500上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器504可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件506为装置500的各种组件提供电力。电源组件506可以包括电源管理系统,一个或多个电源,及其他与为装置500生成、管理和分配电力相关联的组件。
多媒体组件508包括在装置500和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件508包括一个前置摄像头和/或后置摄像头。当装置500处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件510被配置为输出和/或输入音频信号。例如,音频组件510包括一个麦克风(MIC),当装置500处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器504或经由通信组件516发送。在一些实施例中,音频组件510还包括一个扬声器,用于输出音频信号。
I/O接口512为处理组件502和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件514包括一个或多个传感器,用于为装置500提供各个方面的状态评估。例如,传感器组件514可以检测到装置500的打开/关闭状态,组件的相对定位,例如组件为装置500的显示器和小键盘,传感器组件514还可以检测装置500或装置500一个组件的位置改变,用户与装置500接触的存在或不存在,装置500方位或加速/减速和装置500的温度变化。传感器组件514可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件514还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件514还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件516被配置为便于装置500和其他设备之间有线或无线方式的通信。装置500可以接入基于通信标准的无线网络,如Wi-Fi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件516经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件516还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置500可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述字体添加方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器504,上述指令可由装置500的处理器518执行以完成上述字体添加方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (5)

1.一种人脸聚类方法,其特征在于,所述方法包括:
获取第一照片类和第二照片类,所述第一照片类包括聚类得到的至少两张人脸照片;
获取所述第一照片类中每个所述人脸照片的特征向量;
通过预设的密度聚类算法计算每个所述人脸照片的特征向量在高维空间中的密度分布;
根据所述密度分布,将所述人脸照片分别聚类至至少一个照片子类中;
计算每个所述照片子类中的人脸照片的数量;
将数量最大的所述照片子类确定为正确人脸子类;
计算所述正确人脸子类与所述第二照片类之间的距离;
若所述距离大于阈值,则将所述第一照片类和所述第二照片类分别聚类至不同的照片类。
2.根据权利要求1所述的方法,其特征在于,所述密度聚类算法包括:基于高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法OPTICS、基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法LSNCCP中的至少一种。
3.一种人脸聚类装置,其特征在于,所述装置包括:
类获取模块,被配置为获取第一照片类和第二照片类,所述第一照片类包括聚类得到的至少两张人脸照片;
第一聚类模块,被配置为对所述第一照片类中的所述人脸照片进行聚类,得到至少一个照片子类;
确定模块,被配置为将所述至少一个照片子类中的一个照片子类确定为正确人脸子类;
距离计算模块,被配置为计算所述正确人脸子类与所述第二照片类之间的距离;
第二聚类模块,被配置为当所述距离大于阈值时,将所述第一照片类和所述第二照片类分别聚类至不同的照片类;
其中,所述第一聚类模块,包括:
密度聚类子模块,被配置为对所述第一照片类中的每个所述人脸照片进行密度聚类,得到至少一个照片子类;
其中,所述密度聚类子模块,包括:
获取子模块,被配置为获取所述第一照片类中每个所述人脸照片的特征向量;
密度计算子模块,被配置为通过预设的密度聚类算法计算每个所述人脸照片的特征向量在高维空间中的密度分布;
聚类子模块,被配置为根据所述密度分布,将所述人脸照片分别聚类至至少一个照片子类中;
其中,所述确定模块,包括:
数量计算子模块,被配置为计算每个所述照片子类中的人脸照片的数量;
确定子模块,被配置为将数量最大的所述照片子类确定为正确人脸子类。
4.根据权利要求3所述的装置,其特征在于,所述密度聚类算法包括基于高密度连接区域密度聚类算法DBSCAN、对象排序识别聚类结构算法OPTICS、基于密度的增量算法IGDCA、基于最大不相含核心点集的聚类算法LSNCCP中的至少一种。
5.一种人脸聚类装置,其特征在于,所述装置包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取第一照片类和第二照片类,所述第一照片类包括聚类得到的至少两张人脸照片;
获取所述第一照片类中每个所述人脸照片的特征向量;
通过预设的密度聚类算法计算每个所述人脸照片的特征向量在高维空间中的密度分布;
根据所述密度分布,将所述人脸照片分别聚类至至少一个照片子类中;
计算每个所述照片子类中的人脸照片的数量;
将数量最大的所述照片子类确定为正确人脸子类;
计算所述正确人脸子类与所述第二照片类之间的距离;
若所述距离大于阈值,则将所述第一照片类和所述第二照片类分别聚类至不同的照片类。
CN201510971798.9A 2015-12-22 2015-12-22 人脸聚类方法及装置 Active CN105426878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510971798.9A CN105426878B (zh) 2015-12-22 2015-12-22 人脸聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510971798.9A CN105426878B (zh) 2015-12-22 2015-12-22 人脸聚类方法及装置

Publications (2)

Publication Number Publication Date
CN105426878A CN105426878A (zh) 2016-03-23
CN105426878B true CN105426878B (zh) 2019-05-21

Family

ID=55505077

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510971798.9A Active CN105426878B (zh) 2015-12-22 2015-12-22 人脸聚类方法及装置

Country Status (1)

Country Link
CN (1) CN105426878B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503656A (zh) * 2016-10-24 2017-03-15 厦门美图之家科技有限公司 一种图像分类方法、装置和计算设备
CN108875455B (zh) * 2017-05-11 2022-01-18 Tcl科技集团股份有限公司 一种无监督的人脸智能精确识别方法及系统
CN108229384A (zh) * 2017-12-29 2018-06-29 广州图语信息科技有限公司 一种利用连续性结构的人脸聚类方法、装置及用户终端
CN109034109B (zh) * 2018-08-16 2021-03-23 新智数字科技有限公司 一种基于聚类算法的行人重识别方法和装置
CN109886311B (zh) * 2019-01-25 2021-08-20 北京奇艺世纪科技有限公司 增量聚类方法、装置、电子设备和计算机可读介质
CN110705614A (zh) * 2019-09-20 2020-01-17 北京三快在线科技有限公司 模型训练方法、装置、电子设备及存储介质
CN114612967B (zh) * 2022-03-03 2023-06-20 北京百度网讯科技有限公司 一种人脸聚类的方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902689A (zh) * 2014-03-26 2014-07-02 小米科技有限责任公司 聚类方法、增量聚类方法及相关装置
CN104268149A (zh) * 2014-08-28 2015-01-07 小米科技有限责任公司 聚类方法及装置
CN104537380A (zh) * 2014-12-30 2015-04-22 小米科技有限责任公司 聚类方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7783135B2 (en) * 2005-05-09 2010-08-24 Like.Com System and method for providing objectified image renderings using recognition information from images

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103902689A (zh) * 2014-03-26 2014-07-02 小米科技有限责任公司 聚类方法、增量聚类方法及相关装置
CN104268149A (zh) * 2014-08-28 2015-01-07 小米科技有限责任公司 聚类方法及装置
CN104537380A (zh) * 2014-12-30 2015-04-22 小米科技有限责任公司 聚类方法和装置

Also Published As

Publication number Publication date
CN105426878A (zh) 2016-03-23

Similar Documents

Publication Publication Date Title
CN105426878B (zh) 人脸聚类方法及装置
TWI781359B (zh) 人臉和人手關聯檢測方法及裝置、電子設備和電腦可讀儲存媒體
CN109697734B (zh) 位姿估计方法及装置、电子设备和存储介质
CN104700353B (zh) 图像滤镜生成方法及装置
CN107239535A (zh) 相似图片检索方法及装置
WO2017128767A1 (zh) 指纹模板录入方法及装置
CN105447462A (zh) 人脸姿态估计方法及装置
CN107832741A (zh) 人脸特征点定位的方法、装置及计算机可读存储介质
CN105608430B (zh) 人脸聚类方法及装置
CN104301610B (zh) 图像拍摄控制方法及装置
CN107688781A (zh) 人脸识别方法及装置
CN106648063B (zh) 手势识别方法及装置
CN107944367A (zh) 人脸关键点检测方法及装置
CN109242045B (zh) 图像聚类处理方法、装置、电子设备及存储介质
CN108108671A (zh) 产品说明信息获取方法及装置
CN111259967A (zh) 图像分类及神经网络训练方法、装置、设备及存储介质
CN107993192A (zh) 证件图像校正方法、装置和设备
CN104899588B (zh) 识别图像中的字符的方法及装置
CN104573642A (zh) 人脸识别方法及装置
CN105957011B (zh) 图片处理方法及装置
CN107844766A (zh) 人脸图像模糊度的获取方法、装置和设备
CN105426904B (zh) 照片处理方法、装置和设备
CN104850592B (zh) 生成模型文件的方法和装置
CN106289161A (zh) 高度测量方法及装置
CN108154090A (zh) 人脸识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant