CN111507240B - 人脸聚类方法、装置、电子设备和计算机可读存储介质 - Google Patents

人脸聚类方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN111507240B
CN111507240B CN202010288271.7A CN202010288271A CN111507240B CN 111507240 B CN111507240 B CN 111507240B CN 202010288271 A CN202010288271 A CN 202010288271A CN 111507240 B CN111507240 B CN 111507240B
Authority
CN
China
Prior art keywords
node
face data
similarity
face
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010288271.7A
Other languages
English (en)
Other versions
CN111507240A (zh
Inventor
唐振
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shengjing Intelligent Technology Jiaxing Co ltd
Original Assignee
Shengjing Intelligent Technology Jiaxing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shengjing Intelligent Technology Jiaxing Co ltd filed Critical Shengjing Intelligent Technology Jiaxing Co ltd
Priority to CN202010288271.7A priority Critical patent/CN111507240B/zh
Publication of CN111507240A publication Critical patent/CN111507240A/zh
Application granted granted Critical
Publication of CN111507240B publication Critical patent/CN111507240B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种人脸聚类方法、装置、电子设备和计算机可读存储介质,涉及计算机视觉领域,包括获取人脸数据集,并将人脸数据集中的每个人脸数据确定为一个节点(包括初始类别标识);两两计算节点之间的相似度,并在相似度大于指定阈值的两个节点之间构建边;如果存在单类节点,判断是否存在与单类节点的相似度大于辅助阈值的节点;如果存在,在相似度大于辅助阈值的节点与单类节点之间构建边;基于边和每个边的初始权重构建成的数据图;基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,以对人脸数据集中的人脸数据完成聚类。本发明有效缓解了单类异常的问题,提高了聚类的精度。

Description

人脸聚类方法、装置、电子设备和计算机可读存储介质
技术领域
本发明涉及计算机视觉领域,尤其是涉及一种人脸聚类方法、装置、电子设备和计算机可读存储介质。
背景技术
目前,人员分析的应用场景日益增多,诸如商场的客流分析,可以针对客户制定专属营销方案,提高公司、商场的营销量;对于社会、公司的异常人员分析,可以起到危险示警作用,有效的保障社会、公司的公共财产和人员安全。而人脸聚类算法在人员分析中起到至关重要的作用,是进行客流和异常人员分析的基石。除此之外,人脸聚类算法也是无监督人脸识别训练、人脸数据清洗和自动标注的基础。然而现有的聚类方法存在以下缺陷:
(1)一些聚类方法,诸如K均值聚类算法K-means、基于密度的空间聚类算法DBSCAN、最邻近关系进行聚类的方法FINCH,由于方法自身的限制不适用于人脸聚类;
(2)Chinese Whispers聚类算法对每个节点的初始节点赋予的初始权重均相同,节点临边存在多个最大值得情况下,无法进行较为准确的区分;
(3)对于质量较差的人脸数据对存在单独成类的问题。
发明内容
本发明的目的在于提供一种人脸聚类方法、装置、电子设备和计算机可读存储介质,缓解了在人脸聚类中存在的单类异常的问题,提高了聚类的精度。
第一方面,实施例提供一种人脸聚类方法,包括:获取人脸数据集,并将所述人脸数据集中的每个人脸数据确定为一个节点;其中,每个所述节点均包括初始类别标识;两两计算所述节点之间的相似度,并在所述相似度大于指定阈值的两个所述节点之间构建边;如果存在单类节点,判断是否存在与所述单类节点的所述相似度大于辅助阈值的节点;如果存在,在所述相似度大于辅助阈值的节点与所述单类节点之间构建所述边;基于所述边和每个所述边的初始权重构建成的数据图;其中,所述初始权重为每个所述边的所述相似度;基于所述初始权重和所述初始类别标识,按照预设的迭代次数确定所述数据图的每个所述节点的目标类别,以对所述人脸数据集中的人脸数据完成聚类。
在可选的实施方式中,所述辅助阈值小于所述指定阈值。
在可选的实施方式中,在所述获取人脸数据集,并将所述人脸数据集中的每个人脸数据确定为一个节点的步骤之后,还包括:当所述人脸数据集的数据量大于预先设置的数据量阈值时,将所述人脸数据集进行分块。
在可选的实施方式中,所述在所述相似度大于辅助阈值的所述节点与所述单类节点之间构建所述边的步骤,包括:选择所述相似度大于辅助阈值的节点中与所述单类节点的所述相似度最大的所述节点,与所述单类节点之间构建所述边。
在可选的实施方式中,所述基于所述初始权重和所述初始类别标识,按照预设的迭代次数确定所述数据图的每个所述节点的目标类别,以便对所述人脸数据集中的人脸数据完成聚类的步骤,包括:对于所述数据图中的当前节点,将与所述当前节点连接的所述边中所述初始权重最大的所述节点确定为目标节点;基于所述目标节点的所述初始类别标识确定所述当前节点的所述目标类别,并按照所述预设的迭代次数进行迭代,以对所述人脸数据集中的所述人脸数据完成聚类。
在可选的实施方式中,所述方法还包括:如果与所述当前节点连接成所述边的所述节点的所述初始类别标识均相同,则将所述当前节点的所述目标类别更新为所述初始类别;将与所述当前节点的所述初始类别标识相同的每个所述节点的相似度进行相加,得到所述目标类别的目标权重。
第二方面,实施例提供一种人脸聚类装置,所述装置包括:第一确定模块,用于获取人脸数据集,并将所述人脸数据集中的每个人脸数据确定为一个节点;其中,每个所述节点均包括初始类别标识;第一边构建模块,用于两两计算所述节点之间的相似度,并在所述相似度大于指定阈值的两个所述节点之间构建边;判断模块,用于如果存在单类节点,判断是否存在与所述单类节点的所述相似度大于辅助阈值的节点;第二边构建模块,用于如果存在,在所述相似度大于辅助阈值的节点与所述单类节点之间构建所述边;第二确定模块,用于基于所述边构建成的数据图和每个所述边的相似度,确定所述数据图中每个所述边的初始权重;聚类模块,用于基于所述初始权重和所述初始类别标识,按照预设的迭代次数确定所述数据图的每个所述节点的目标类别,以对所述人脸数据集中的人脸数据完成聚类。
在可选的实施方式中,所述装置还包括:所述辅助阈值小于所述指定阈值。
第三方面,实施例提供一种电子设备,包括处理器和存储器;所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现前述实施方式任一项所述的方法的步骤。
第四方面,实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述前述实施方式任一项所述的方法的步骤。
本发明提供的人脸聚类方法、装置、电子设备和计算机可读存储介质,通过将获取的人脸数据集中的每个人脸数据确定为一个节点,两两计算节点之间的相似度,并在相似度大于指定阈值的两个节点之间构建边,其中,每个节点均包括初始类别标识。如果存在单类节点,在相似度大于辅助阈值的节点与单类节点之间构建边。基于边和每个边的初始权重构建成的数据图,其中,初始权重为每个边的相似度,基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,以对人脸数据集中的人脸数据完成聚类。通过将每个边的相似度确定数据图中每个边的初始权重,可以解决初始权重相同情况,提高了聚类的精度,通过对单类节点设置辅助阈值,缓解了单类异常的问题。因此本发明实施例有效缓解了单类异常的问题,提高了聚类的精度。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种人脸聚类方法的流程示意图;
图2为本发明实施例提供的一种具体的人脸聚类方法的流程示意图;
图3为本发明实施例提供的一种人脸聚类装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
考虑到一些常用的聚类算法对于人脸聚类并不适用,诸如K-means需要事先知道聚类中心的数量,而人脸聚类之前一般并不清楚参与聚类的人数,因此需要提前获取聚类个数的聚类算法并不适用于人脸聚类;对于基于密度的空间聚类算法DBSCAN,通过检查数据集中每个点的邻域内点的个数,来判断该点是否为核心点,然后对于直接密度可达的核心点进行合簇,从而完成聚类,该算法依赖于邻域半径和邻域内点的个数两个参数,而且对于高维数据和密度变化较大的数据聚类效果较差,对于不同场景下的人脸聚类效果较差;最邻近关系进行聚类的方法FINCH,依赖于每个点最邻近点的关系进行聚类,在普通聚类数据集上,这种策略可以快速准确的进行聚类,但是在不同场景获取的人脸数据,质量较差的情况和相似人脸进行聚类时,每个人脸的最相似的人脸并不一定是本人,所以这些算法并不适用于人脸聚类。另外Chinese Whispers聚类算法对每个节点的初始节点赋予的初始权重均相同,节点临边存在多个最大值得情况下,无法进行较为准确的区分,导致聚类结果不准确,聚类精度较低。同时当人脸数据质量较差时,会存在单独成类的问题。本发明实施例提供了一种人脸聚类方法、装置、电子设备和计算机可读存储介质,有效缓解了单类异常的问题,提高了聚类的精度。
为便于理解,首先对本发明实施例提供的人脸聚类方法进行详细介绍,参见如图1所示的一种人脸聚类方法的流程示意图,该方法主要包括如下步骤S102至步骤S112:
步骤S102:获取人脸数据集,并将人脸数据集中的每个人脸数据确定为一个节点。
在一种实施方式中,人脸数据为通过人脸识别算法进行识别得到的人脸特征数据,节点为数据结构中的顶点vertex,将人脸数据集中的每个人脸特征数据确定为数据结构中的一个节点,且每个节点均包括人脸特征数据的初始类别标识,初始类别标识用于对人脸数据集中的人脸特征数据进行区分表征。
步骤S104:两两计算节点之间的相似度,并在相似度大于指定阈值的两个节点之间构建边。
在一种实施方式中,对人脸数据集中的每个人脸数据,两两计算除自身以外的其他人脸数据的相似度,人脸特征的相似度可以采用诸如欧氏距离或余弦距离等方法进行计算。计算得到的相似度越高则说明两个人脸数据越接近,指定阈值可以根据人脸特征数据进行设置。在相似度大于指定阈值的两个节点之间构建边也即将计算得到的相似度大于指定阈值的两个人脸数据之间进行关联,以便将较为相似的两幅人脸图像进行聚类。
步骤S106:如果存在单类节点,判断是否存在与单类节点的相似度大于辅助阈值的节点。
在一种实施方式中,由于图像质量等问题可能会造成存在与人脸数据集中其他任一个的人脸数据的相似度均小于指定阈值的人脸数据,也即存在单类节点的情况。此时,设置一个小于指定阈值的辅助阈值,辅助阈值是一个经验值,通常略小于指定阈值,通过设置辅助阈值可以在指定阈值限制较严的情况下,放宽人脸特征数据相似度的界限。与单类节点的相似度大于辅助阈值的节点也即与单类节点较为相似的节点,通过进行判断,可以得到与单类节点相似度较大的节点。
步骤S108:如果存在,在相似度大于辅助阈值的节点与单类节点之间构建边。
在一种实施方式中,如果存在与单类节点的相似度大于辅助阈值的节点,则可以确定存在与单类节点较为相似的节点,为了能够选取出与单类节点最为相似的节点,可以通过选择相似度大于辅助阈值的节点中与单类节点的相似度最大的节点,与单类节点之间构建边。
步骤S110:基于边和每个边的初始权重构建成的数据图。
在一种实施方式中,初始权重为每个边的相似度,通过设置指定阈值和辅助阈值,选择出与每个节点最相似的节点构建边,也即选择每个人脸数据最相似的人脸数据进行关联,基于每个边和每个边对应的初始权重,完成数据图的构建。
步骤S112:基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,以对人脸数据集中的人脸数据完成聚类。
在一种实施方式中,为了可以得到准确的聚类效果,预设的迭代次数可以设置为10次,当数据量较小时,预设的迭代次数也可以设置小于10次,诸如6次或7次,当数据量较大时,也可以设置多于10次的迭代次数。构建成的数据可能存在一个节点相连多个边的情况,在进行聚类时,基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,具体的,对于每个节点,取其相连边中初始权重最大对应节点的初始类别标识,确定该节点的目标类别,当按照预设的迭代次数进行更新,直至完成聚类。
另外,如果与当前节点连接成边的节点的初始类别标识均相同,则将当前节点的目标类别更新为初始类别,将与当前节点的初始类别标识相同的每个节点的相似度进行相加,得到目标类别的权重。
本发明提供的人脸聚类方法,通过将获取的人脸数据集中的每个人脸数据确定为一个节点,两两计算节点之间的相似度,并在相似度大于指定阈值的两个节点之间构建边,其中,每个节点均包括初始类别标识。如果存在单类节点,在相似度大于辅助阈值的节点与单类节点之间构建边。基于边和每个边的初始权重构建成的数据图,其中,初始权重为每个边的相似度,基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,以对人脸数据集中的人脸数据完成聚类。通过将每个边的相似度确定数据图中每个边的初始权重,可以解决初始权重相同情况,提高了聚类的精度,通过对单类节点设置辅助阈值,缓解了单类异常的问题。因此本发明实施例有效缓解了单类异常的问题,提高了聚类的精度。
在一种实施方案中,随着获取人脸图像方式的便捷化以及网络的快速发展,人脸数据不断增长,对快速准确的大规模人脸聚类算法的需求也与日俱增。因此,当数据量较大时,本发明实施例解决了大规模数据占用内存大的问题。为便于理解,参见本发明实施例提供的一种具体的人脸聚类方法,参见图2所示的一种具体的人脸聚类方法的流程示意图,该方法主要包括如下步骤S202至步骤S216:
步骤S202:获取数据集。
将人脸数据集中的每个人脸看作一个节点,并对每个节点赋予一个类别。
步骤S204:判断数据量是否大于数据量阈值。如果是,执行步骤S208,如果否,执行步骤S206。
步骤S206:直接计算相似度。
对于人脸数据集中的每个人脸数据,分别计算与其他人脸数据之间的相似度,具体的,可以采用欧式距离或余弦距离等方式进行相似度的计算。通过计算得到的相似度,在节点之间构建边。具体可以参照上述步骤S104和步骤S108。
步骤S208:分块计算相似度。
当数据量较大时,诸如百万级的数据,可以在将人脸数据集中的每个人脸数据确定为一个节点后,如果人脸数据集的数据量大于预先设置的数据量阈值时,将人脸数据集中的人脸数据进行分块,进而计算相似度,通过对人脸数据集进行分块,可以解决硬件内存消耗极大,导致内存泄漏的问题,对于百万级的别的数据聚类,解决对内存依赖的问题。同样根据计算得到的相似度在节点之间构建边。
步骤S210:构建数据图。
通过计算相似度并在节点之间构建边,可以根据每个边的相似度(也即权重)构建数据图。
步骤S212:获取节点类别。
在一种实施方式中,在构建的数据图中,对每个节点,取其相连边中最大权重对应节点的类,作为该节点的目标类别。若临边中存在多个节点属于同一个类别,则将多个节点的权重进行相加,取权重最大的类别,作为该节点的新类。
步骤S214:判断是否达到预设的迭代次数。基于目标节点的初始类别标识确定当前节点的目标类别,按照预设的迭代次数进行迭代,以对人脸数据集中的人脸数据完成聚类。
步骤S216:结束聚类。
本发明实施例提供的人脸聚类方法,通过获取人脸数据集,并判断数据量是否大于数据量阈值,如果否,则直接计算相似度,如果是,将数据集进行分块计算相似度。在计算相似度后构建数据图,并获取数据图中的节点类别,在达到预设的迭代次数后,结束聚类。通过判断数据集中数据量的大小,并在数据量较大时进行分块计算相似度,可以减小计算对内存的依赖,支持百万级别的数据量进行聚类。通过这种方法可以缓解硬件内存消耗极大,导致内存泄漏的问题。
在一种实施方式中,本发明实施例提供的人脸聚类方法,可以应用于客流分析、异常人员监测以及人脸识别数据自动清洗与标注场景。
对于上述人脸聚类方法,本发明实施例提供了一种人脸聚类装置,参见如图3所示的一种人脸聚类装置的结构示意图,该装置主要包括以下部分:
第一确定模块302,用于获取人脸数据集,并将人脸数据集中的每个人脸数据确定为一个节点;其中,每个节点均包括初始类别标识;
第一边构建模块304,用于两两计算节点之间的相似度,并在相似度大于指定阈值的两个节点之间构建边;
判断模块306,用于如果存在单类节点,判断是否存在与单类节点的相似度大于辅助阈值的节点;
第二边构建模块308,用于如果存在,在相似度大于辅助阈值的节点与单类节点之间构建边;
第二确定模块310,用于基于边和每个边的初始权重构建成的数据图;其中,初始权重为每个边的相似度;
聚类模块312,用于基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,以对人脸数据集中的人脸数据完成聚类。
本发明实施例提供的人脸聚类装置,通过将获取的人脸数据集中的每个人脸数据确定为一个节点,两两计算节点之间的相似度,并在相似度大于指定阈值的两个节点之间构建边,其中,每个节点均包括初始类别标识。如果存在单类节点,在相似度大于辅助阈值的节点与单类节点之间构建边。基于边和每个边的初始权重构建成的数据图,其中,初始权重为每个边的相似度,基于初始权重和初始类别标识,按照预设的迭代次数确定数据图的每个节点的目标类别,以对人脸数据集中的人脸数据完成聚类。通过将每个边的相似度确定数据图中每个边的初始权重,可以解决初始权重相同情况,提高了聚类的精度,通过对单类节点设置辅助阈值,缓解了单类异常的问题。因此本发明实施例有效缓解了单类异常的问题,提高了聚类的精度。
在一种实施方式中,上述装置还包括:数据分块模块,用于在获取人脸数据集,并将人脸数据集中的每个人脸数据确定为一个节点的步骤之后,当人脸数据集的数据量大于预先设置的数据量阈值时,将人脸数据集进行分块。
在一种实施方式中,第一边构建模块304,进一步用于选择相似度大于辅助阈值的节点中与单类节点的相似度最大的节点,与单类节点之间构建边。
在一种实施方式中,聚类模块312,进一步用于对于数据图中的当前节点,将与当前节点连接的边中初始权重最大的节点确定为目标节点;基于目标节点的初始类别标识确定当前节点的目标类别,并按照预设的迭代次数进行迭代,以对人脸数据集中的人脸数据完成聚类。
在一种实施方式中,上述装置还包括:权重确定模块,用于如果与当前节点连接成边的节点的初始类别标识均相同,则将当前节点的目标类别更新为初始类别;将与当前节点的初始类别标识相同的每个节点的相似度进行相加,得到目标类别的目标权重。
本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
本发明实施例还提供了一种电子设备,具体的,该电子设备包括处理器和存储装置;存储装置上存储有计算机程序,计算机程序在被所述处理器运行时执行如上所述实施方式的任一项所述的方法。
图4为本发明实施例提供的一种电子设备的结构示意图,该电子设备100包括:处理器40,存储器41,总线42和通信接口43,所述处理器40、通信接口43和存储器41通过总线42连接;处理器40用于执行存储器41中存储的可执行模块,例如计算机程序。
其中,存储器41可能包含高速随机存取存储器(RAM,RandomAccessMemory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口43(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
总线42可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
其中,存储器41用于存储程序,所述处理器40在接收到执行指令后,执行所述程序,前述本发明实施例任一实施例揭示的流过程定义的装置所执行的方法可以应用于处理器40中,或者由处理器40实现。
处理器40可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器40中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器40可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital SignalProcessing,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器41,处理器40读取存储器41中的信息,结合其硬件完成上述方法的步骤。
本发明实施例所提供的人脸聚类方法、装置、电子设备和计算机可读存储介质的计算机程序产品,包括存储了处理器可执行的非易失的程序代码的计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统具体工作过程,可以参考前述实施例中的对应过程,在此不再赘述。
本发明实施例所提供的可读存储介质的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (9)

1.一种人脸聚类方法,其特征在于,包括:
获取人脸数据集,并将所述人脸数据集中的每个人脸数据确定为一个节点;其中,每个所述节点均包括初始类别标识;
两两计算所述节点之间的相似度,并在所述相似度大于指定阈值的两个所述节点之间构建边;
如果存在单类节点,判断是否存在与所述单类节点的所述相似度大于辅助阈值的节点;
如果存在,在所述相似度大于辅助阈值的节点与所述单类节点之间构建所述边;
基于所述边和每个所述边的初始权重构建成的数据图;其中,所述初始权重为每个所述边的所述相似度;
基于所述初始权重和所述初始类别标识,按照预设的迭代次数确定所述数据图中的每个所述节点的目标类别,以对所述人脸数据集中的人脸数据完成聚类,包括:对于所述数据图中的当前节点,将与所述当前节点连接的所述边中所述初始权重最大的所述节点确定为目标节点;基于所述目标节点的所述初始类别标识确定所述当前节点的所述目标类别,并按照所述预设的迭代次数进行迭代,以对所述人脸数据集中的所述人脸数据完成聚类。
2.根据权利要求1所述的方法,其特征在于,所述辅助阈值小于所述指定阈值。
3.根据权利要求1所述的方法,其特征在于,在所述获取人脸数据集,并将所述人脸数据集中的每个人脸数据确定为一个节点的步骤之后,还包括:
当所述人脸数据集的数据量大于预先设置的数据量阈值时,将所述人脸数据集进行分块。
4.根据权利要求1所述的方法,其特征在于,所述在所述相似度大于辅助阈值的所述节点与所述单类节点之间构建所述边的步骤,包括:
选择所述相似度大于辅助阈值的节点中与所述单类节点的所述相似度最大的所述节点,与所述单类节点之间构建所述边。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果与所述当前节点连接成所述边的所述节点的所述初始类别标识均相同,则将所述当前节点的所述目标类别更新为所述初始类别;
将与所述当前节点的所述初始类别标识相同的每个所述节点的相似度进行相加,得到所述目标类别的目标权重。
6.一种人脸聚类装置,其特征在于,所述装置包括:
第一确定模块,用于获取人脸数据集,并将所述人脸数据集中的每个人脸数据确定为一个节点;其中,每个所述节点均包括初始类别标识;
第一边构建模块,用于两两计算所述节点之间的相似度,并在所述相似度大于指定阈值的两个所述节点之间构建边;
判断模块,用于如果存在单类节点,判断是否存在与所述单类节点的所述相似度大于辅助阈值的节点;
第二边构建模块,用于如果存在,在所述相似度大于辅助阈值的节点与所述单类节点之间构建所述边;
第二确定模块,用于基于所述边构建成的数据图和每个所述边的相似度,确定所述数据图中每个所述边的初始权重;
聚类模块,用于基于所述初始权重和所述初始类别标识,按照预设的迭代次数确定所述数据图中的每个所述节点的目标类别,以对所述人脸数据集中的人脸数据完成聚类;所述聚类模块,进一步用于对于所述数据图中的当前节点,将与所述当前节点连接的所述边中所述初始权重最大的所述节点确定为目标节点;基于所述目标节点的所述初始类别标识确定所述当前节点的所述目标类别,并按照所述预设的迭代次数进行迭代,以对所述人脸数据集中的所述人脸数据完成聚类。
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
所述辅助阈值小于所述指定阈值。
8.一种电子设备,其特征在于,包括处理器和存储器;
所述存储器存储有能够被所述处理器执行的计算机可执行指令,所述处理器执行所述计算机可执行指令以实现权利要求1至5任一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1至5任一项所述的方法的步骤。
CN202010288271.7A 2020-04-13 2020-04-13 人脸聚类方法、装置、电子设备和计算机可读存储介质 Active CN111507240B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010288271.7A CN111507240B (zh) 2020-04-13 2020-04-13 人脸聚类方法、装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010288271.7A CN111507240B (zh) 2020-04-13 2020-04-13 人脸聚类方法、装置、电子设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN111507240A CN111507240A (zh) 2020-08-07
CN111507240B true CN111507240B (zh) 2023-08-04

Family

ID=71874255

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010288271.7A Active CN111507240B (zh) 2020-04-13 2020-04-13 人脸聚类方法、装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111507240B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347842B (zh) * 2020-09-11 2024-05-24 博云视觉(北京)科技有限公司 一种基于关联图的离线人脸聚类方法
CN112766299B (zh) * 2020-12-09 2024-01-09 江苏师范大学 一种人脸图像的迭代式双向连接聚类算法
CN113034471B (zh) * 2021-03-25 2022-08-02 重庆大学 一种基于finch聚类的sar图像变化检测方法
CN113191405B (zh) * 2021-04-16 2023-04-18 上海思尔芯技术股份有限公司 一种基于集成电路的带权超图的多级聚类方法及存储介质
CN113313053B (zh) * 2021-06-15 2024-04-12 北京百度网讯科技有限公司 图像处理方法、装置、设备、介质及程序产品

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955923A (zh) * 2014-04-18 2014-07-30 南京理工大学 一种快速的基于图像的路面病害检测方法
CN105046214A (zh) * 2015-07-06 2015-11-11 南京理工大学 基于聚类的在线式多人脸图像处理的方法
CN105608425A (zh) * 2015-12-17 2016-05-25 小米科技有限责任公司 对照片进行分类存储的方法及装置
CN109086720A (zh) * 2018-08-03 2018-12-25 腾讯科技(深圳)有限公司 一种人脸聚类方法、装置和存储介质
CN109784270A (zh) * 2019-01-11 2019-05-21 厦门大学嘉庚学院 一种提升人脸图片识别完整性的处理方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8150169B2 (en) * 2008-09-16 2012-04-03 Viewdle Inc. System and method for object clustering and identification in video

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955923A (zh) * 2014-04-18 2014-07-30 南京理工大学 一种快速的基于图像的路面病害检测方法
CN105046214A (zh) * 2015-07-06 2015-11-11 南京理工大学 基于聚类的在线式多人脸图像处理的方法
CN105608425A (zh) * 2015-12-17 2016-05-25 小米科技有限责任公司 对照片进行分类存储的方法及装置
CN109086720A (zh) * 2018-08-03 2018-12-25 腾讯科技(深圳)有限公司 一种人脸聚类方法、装置和存储介质
CN109784270A (zh) * 2019-01-11 2019-05-21 厦门大学嘉庚学院 一种提升人脸图片识别完整性的处理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张陈欢等.基于Chinese Whispers 的人脸动态聚类.《计算机技术与发展》.2019,第29卷(第11期),92-96. *

Also Published As

Publication number Publication date
CN111507240A (zh) 2020-08-07

Similar Documents

Publication Publication Date Title
CN111507240B (zh) 人脸聚类方法、装置、电子设备和计算机可读存储介质
Jiang et al. Distance measures for image segmentation evaluation
CN107169768B (zh) 异常交易数据的获取方法和装置
CN110209660B (zh) 欺诈团伙挖掘方法、装置及电子设备
CN110991474A (zh) 一种机器学习建模平台
CN111353549B (zh) 图像标签的核验方法及装置、电子设备、存储介质
CN104239553A (zh) 一种基于Map-Reduce框架的实体识别方法
CN111262730B (zh) 一种告警信息的处理方法及装置
CN113254255B (zh) 一种云平台日志的分析方法、系统、设备及介质
CN112308345A (zh) 通信网络负荷预测方法、装置及服务器
CN108229473A (zh) 车辆年检标签检测方法及装置
CN108664605B (zh) 一种模型评估方法及系统
CN115879017A (zh) 一种电力敏感数据自动化分类分级方法、装置及存储介质
CN111291824A (zh) 时间序列的处理方法、装置、电子设备和计算机可读介质
CN115795285A (zh) 基于cusum型变点统计量的异常数据检测与监控方法
CN113642310A (zh) 一种终端数据相似度度量方法
CN112990080A (zh) 基于大数据和人工智能的规则确定方法
CN116132263A (zh) 告警解决方案推荐方法、装置、电子设备及存储介质
CN117095230A (zh) 基于图像大数据智能分析的空气质量低耗评估方法及系统
CN117786656A (zh) 一种api识别方法、装置、电子设备及存储介质
CN111210634B (zh) 智能交通信息处理方法、装置、智能交通系统及服务器
CN117272145A (zh) 转辙机的健康状态评估方法、装置和电子设备
CN114511409B (zh) 用户样本处理方法、装置及电子设备
CN114726570B (zh) 一种基于图模型的主机流量异常检测方法及装置
CN116385007A (zh) 数据检测方法、装置、计算机设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230529

Address after: 314506 room 116, building 4, No. 288, development avenue, Tongxiang Economic Development Zone, Tongxiang City, Jiaxing City, Zhejiang Province

Applicant after: Shengjing Intelligent Technology (Jiaxing) Co.,Ltd.

Address before: 102200 5th floor, building 6, No.8 Beiqing Road, Changping District, Beijing

Applicant before: SANY HEAVY INDUSTRY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant