CN109447112B - 一种人像聚类方法、电子设备和存储介质 - Google Patents

一种人像聚类方法、电子设备和存储介质 Download PDF

Info

Publication number
CN109447112B
CN109447112B CN201811107055.7A CN201811107055A CN109447112B CN 109447112 B CN109447112 B CN 109447112B CN 201811107055 A CN201811107055 A CN 201811107055A CN 109447112 B CN109447112 B CN 109447112B
Authority
CN
China
Prior art keywords
clustering
feature
data
clustered
undetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811107055.7A
Other languages
English (en)
Other versions
CN109447112A (zh
Inventor
周维斯
陈芳林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sensenets Technology Ltd
Original Assignee
Sensenets Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sensenets Technology Ltd filed Critical Sensenets Technology Ltd
Priority to CN201811107055.7A priority Critical patent/CN109447112B/zh
Publication of CN109447112A publication Critical patent/CN109447112A/zh
Application granted granted Critical
Publication of CN109447112B publication Critical patent/CN109447112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种人像聚类方法、电子设备和存储介质,方法包括获取待聚类数据,待聚类数据包括特征向量和对应于特征向量的拍摄时间和拍摄地点;从聚类库获取特征向量的待定聚类特征,待定聚类特征为聚类库中与特征向量的特征距离满足预设条件的聚类特征,待定聚类特征对应于待定聚类特征的拍摄时间和拍摄地点;根据对应于待聚类数据中特征向量的拍摄时间和拍摄地点,以及对应于待定聚类特征的拍摄时间和拍摄地点计算待聚类数据的移动速率;若待聚类数据的移动速率不大于移动阈值,将待聚类数据中的特征向量与待定聚类特征聚类。充分利用人脸图像数据对应的时间信息和空间信息,既能提高了聚类的准确率又能降低聚类的计算量,提高聚类的速度。

Description

一种人像聚类方法、电子设备和存储介质
技术领域
本发明涉及监控领域,尤其涉及一种人像聚类方法、电子设备和存储介质。
背景技术
人脸作为一种身份标识,在各类安防监控系统上都是作为一种重点关注的对象。伴随着人脸识别技术不断革新和发展,其性能水平也得到极大的提升,人脸识别技术的实用价值越来越高,相关部门也已经或者将要去建设基于人脸识别技术的监控系统。
目前基于人脸识别技术的人像监控系统,主要做的是人像识别,从人像图片里面提取出人像的特征向量和人像的属性信息,比如年龄、性别等,而对人像聚类并不关注。
通过人工将海量人像数据规划划分实现聚类,完全不可能,难度和工作都极其庞大。现有技术通常基于人像监控系统,通过设定阈值对人像大库进行N:N对比,即遍历检索,来实现人像聚类的功能;但是对于海量监控数据的碰撞聚类,无论是准确度还速度都难以保证;也有现有技术利用各种聚类算法,比如说k-means、dbscan、GMM等,对人像特征库进行离线的聚类分析,以此来实现人像聚类的功能;但是这些常规的聚类方法仅仅只利用人像的特征信息进行聚类,没有把时间和空间的信息也考虑进来,聚类的准确率较低。
发明内容
本发明实施例提供一种人像聚类方法、电子设备和存储介质,可以充分利用人脸图像数据对应的时间信息和空间信息,提高了聚类的准确率,降低聚类的计算量,提高聚类的速度。
本发明实施例第一方面提供了一种人像聚类方法,包括:
获取待聚类数据,所述待聚类数据包括特征向量和对应于所述特征向量的拍摄时间和拍摄地点;
从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离满足预设条件的聚类特征,所述待定聚类特征对应于所述待定聚类特征的拍摄时间和拍摄地点;
根据对应于所述待聚类数据中特征向量的拍摄时间和拍摄地点,以及对应于所述待定聚类特征的拍摄时间和拍摄地点计算所述待聚类数据的移动速率;
若所述待聚类数据的移动速率不大于移动阈值,将所述待聚类数据中的特征向量与所述待定聚类特征聚类。
在一些实施例中,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离满足预设条件的聚类特征,具体为:
所述待定聚类特征为所述聚类库中与所述特征向量的特征距离最小的聚类特征;或者
所述待定聚类特征为所述聚类库中与所述特征向量的特征距离小于预设阈值的聚类特征。
在一些实施例中,所述将所述待聚类数据中的特征向量与所述待定聚类特征聚类,具体包括:
根据所述待定聚类特征对应的人物信息生成所述待聚类数据的聚类结果;和/或
根据所述特征向量更新所述待定聚类特征。
在一些实施例中,所述人像聚类方法还包括:
若所述待聚类数据的移动速率大于所述移动阈值,根据所述特征向量新建聚类特征,以及生成与新建的聚类特征对应的人物信息。
在一些实施例中,所述从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离最小的聚类特征,具体包括:
计算所述特征向量与所述聚类库中各聚类特征的特征距离;
查找最小的特征距离;
获取所述最小的特征距离对应的聚类特征为所述待定聚类特征。
在一些实施例中,所述从聚类库获取所述特征向量的待定聚类特征之后,还包括:
若所述待定聚类特征与所述特征向量的特征距离大于特征阈值,根据所述特征向量新建聚类特征,所述待聚类数据的聚类结果为新建的聚类特征对应的人物信息。
在一些实施例中,所述获取待聚类数据,具体为:从人像数据集中获取所述待聚类数据;
所述人像数据集包括若干所述待聚类数据,各所述待聚类数据均包括一特征向量以及对应于所述特征向量的拍摄时间和拍摄地点。
在一些实施例中,所述从人像数据集中获取所述待聚类数据之前,还包括:
根据各待聚类数据的拍摄地点将所述若干待聚类数据划分至若干个子数据集,所述若干个子数据集与若干个点位一一对应,同一子数据集中待聚类数据的拍摄地点对应于同一点位;
将所述若干个子数据集根据各子数据集对应点位与区域中心的距离由小到大排序。
在一些实施例中,所述将所述若干个子数据集根据各子数据集对应的点位与区域中心的距离由小到大排序之前或之后,还包括:
分别将各子数据集中的待聚类数据根据所述待聚类数据的拍摄时间先后排序。
本发明实施例第二方面提供了一种电子设备,包括存储器和处理器,所述存储器用于存储程序指令;若所述处理器执行所述程序指令,实现上述人像聚类方法的步骤。
本发明实施例第三方面提供了一种存储介质,所述存储介质存储有计算机程序,若所述计算机程序被处理器执行,实现上述人像聚类方法的步骤。
相比现有技术,本发明实施例的有益效果在于:通过首先在聚类库中找到与待聚类数据中特征向量距离最近的聚类特征作为待定聚类特征,然后综合待聚类数据的拍摄时间、地点,以及待定聚类特征的拍摄时间、地点计算待聚类数据对应的移动速率,当移动速率不大于移动阈值时将该待聚类数据中的特征向量与所述待定聚类特征聚类;充分利用了人脸图像数据对应的时间信息和空间信息,既能提高了聚类的准确率又能降低聚类的计算量,提高聚类的速度;当有新的数据需要聚类,无需牵一发而动全身,只做增量的计算便可实现,为动态聚类的方法。
附图说明
一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
图1为本发明实施例一的人像聚类方法的流程示意图;
图2为本发明实施例二的人像聚类方法的流程示意图;
图3为本发明实施例三的电子设备的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,如果不冲突,本发明实施例中的各个特征可以相互组合,均在本发明的保护范围之内。另外,虽然在装置示意图中进行了功能模块的划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置示意图中的模块划分,或流程图中的顺序执行所示出或描述的步骤。
实施例一
如图1为一种人像聚类方法的流程示意图。人像聚类可以为对一批人像图像数据作为归类划分,即对人像数据进行按人划分,属于同一个的人像图像集合作为一个类簇。
人像聚类方法用于对人脸图像数据进行归类,例如将同一个人在不同时刻、不同地方的人脸图像归为一类,并进行身份编码;又例如,某聚类库包括若干个人的人脸图像数据,对于新采集到的一个人脸数据,判断该人脸数据与聚类库中的人脸图像数据是否同属于某一个人。
如图1所示,人像聚类方法包括:
步骤S110、获取待聚类数据,所述待聚类数据包括特征向量和对应于所述特征向量的拍摄时间和拍摄地点。
对于某一需要聚类的人脸数据,如各种人像抓拍系统在某时刻某地点获取的人像抓拍图像,然后提取人脸数据的特征向量;例如可以利用预训练好的深度神经网络提取出人像抓拍图像的特征向量,从而得到包括特征向量和对应于所述特征向量的拍摄时间和拍摄地点的待聚类数据。
人脸的特征向量可以为通过各种机器学习模型将人像图片转换成的一组固定维数的向量,用这个向量去刻画表达这个人像,这个向量便称为人像的特征向量。
在本实施例中,以待聚类数据Q j为例,其包括特征向量F j和对应于所述特征向量F j的拍摄时间T j和拍摄地点P j。
步骤S120、从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离满足预设条件的聚类特征。
在一些可行的实施例中,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离最小的聚类特征。
在另一些可行的实施例中,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离小于预设阈值的聚类特征,该预设阈值为经验值或根据有限次试验可以得到。
聚类库用于存放人脸数据聚类后的特征向量,即聚类特征。聚类库在某时刻被初始化为空,随着人脸数据的聚类,聚类库中包括若干人的聚类特征;例如聚类库G包括p个人的聚类特征,某个人的聚类特征为该人人脸数据的特征向量,每个人的聚类特征对应于其聚类特征的拍摄时间和拍摄地点。
示例性的,若聚类库G中第t个人的聚类特征F′t与待聚类数据Q j中特征向量F j之间的特征距离最小或者小于预设阈值,则相对于聚类库G中其他人的聚类特征,待聚类数据Q j有较大概率与该聚类特征F′t来自于同一个人的人脸数据;因此第t个人的聚类特征F′t为特征向量F j的待定聚类特征F′t;其中,0≤t≤p。待定聚类特征F′t对应于该待定聚类特征F′t的拍摄时间T′t和拍摄地点P′t。
在一些可行的实施例中,步骤S120从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离最小的聚类特征,具体包括:
步骤S121、计算所述特征向量与所述聚类库中各聚类特征的特征距离。
示例性的,聚类库G包括p个人的聚类特征,分别为F′1、F′2…F′t…F′p,则计算各聚类特征与待聚类数据Q j中特征向量F j之间的特征距离,例如分别为D1、D2…Dt…Dp。
在一些可行的实施例中,特征距离可以采用欧式距离、余弦距离、马氏距离等。
步骤S122、查找最小的特征距离。
示例性的,特征距离D1、D2…Dt…Dp中第t个特征距离,为最小的特征距离为Dt。
步骤S123、获取所述最小的特征距离对应的聚类特征为所述待定聚类特征。
最小的特征距离Dt对应的聚类特征为第t个人的聚类特征F′t,因此,聚类特征F′t为特征向量F j的待定聚类特征F′t。
步骤S130、根据对应于所述待聚类数据中特征向量的拍摄时间和拍摄地点,以及对应于所述待定聚类特征的拍摄时间和拍摄地点计算所述待聚类数据的移动速率。
在一些可行的实施例中,待聚类数据Q j的移动速率V根据以下算式计算:
V=(P j-P′t)÷(T j-T′t)。
步骤S140、若所述待聚类数据的移动速率不大于移动阈值,将所述待聚类数据中的特征向量与所述待定聚类特征聚类。
由于步骤S120从聚类库G中获取到了与待聚类数据Q j中特征向量F j特征距离最小的聚类特征F′t为待定聚类特征F′t;相对于聚类库G中其他人的聚类特征,待聚类数据Qj有较大概率与该待定聚类特征F′t来自于同一个人的人脸数据。
步骤S140根据所获取人脸数据的时空信息进一步验证待聚类数据是否与该待定聚类特征来自于同一个人的人脸数据。
示例性的,一个人不会瞬间移动,假设某一时刻一个人在A处出现并被人像抓拍系统抓拍到,那么接下来的一个小时内,这个人不太会在50公里以外的B处出现并被人像抓拍系统抓拍到。
如果步骤S130计算得到的待聚类数据Q j相对于待定聚类特征F′t的移动速率V不大于移动阈值K,则在时间为T j时于地点P j获取的待聚类数据Q j对应的人相对于在时间为T′t时于地点P′t获取的待定聚类特征F′t对应的人的移动速率V符合常理或者预设的条件;可以判断该待聚类数据Q j与该待定聚类特征F′t为来自于同一个人的人脸数据。移动阈值K可根据经验或者有限次的试验设置。
在一些可行的实施例中,步骤S140中将所述待聚类数据中的特征向量F j与所述待定聚类特征聚类,具体包括步骤S141和/或步骤S142。
步骤S141、根据所述待定聚类特征对应的人物信息生成所述待聚类数据的聚类结果。
在判断处该待聚类数据Q j与该待定聚类特征F′t为来自于同一个人的人脸数据后,可以认为该待聚类数据Q j的聚类结果为所述待定聚类特征F′t对应的人物信息。
待聚类数据Q j的聚类结果为所述待定聚类特征F′t对应的人物信息,例如可以输出待定聚类特征F′t对应的身份编码,或待定聚类特征F′t对应的人脸图像;例如输出待聚类数据Q j对应的人为聚类库中的第t号人物。
步骤S142、根据所述特征向量更新所述待定聚类特征。
在判断处待聚类数据Q j与待定聚类特征F′t为来自于同一个人的人脸数据后,将聚类库G中该人的聚类特征F′t更新为待聚类数据Q j中的特征向量F j。
由于人像抓拍系统、监控识别系统等获取的人脸图像具有时效性,因此,根据新获取的来自于某个人,刚完成聚类的特征向量F j及时更新聚类库G中相应人的聚类特征,可以提高人像聚类的有效性和准确性。
需要注意的是,由于不是每一抓拍的人脸都需要生成聚类结果,例如输出某待定聚类特征对应的身份编码,因此在一些实施例中只需要实施步骤S142,以便于提高人像聚类的有效性和准确性。而对于待聚类数据的聚类任务,如输出某待定聚类特征对应的身份编码,步骤S142与并非是必要的,而是为了提高人像聚类的有效性和准确性。
在一些可行的实施例中,人像聚类方法还包括:
步骤S150、若所述待聚类数据的移动速率大于所述移动阈值,根据所述特征向量新建聚类特征,以及生成与新建的聚类特征对应的人物信息。
如果步骤S130计算得到的待聚类数据Q j相对于待定聚类特征F′t的移动速率V大于移动阈值K,则在时间为T j时于地点P j获取的待聚类数据Q j对应的人相对于在时间为T′t时于地点P′t获取的待定聚类特征F′t对应的人的移动速率V不符合常理或者不符合预设的条件;因此可以认为待聚类数据Q j与该待定聚类特征F′t不是来自于同一个人的人脸数据。
当特征库G允许新增人物时,将该待聚类数据Q j的特征向量F j加入到特征库G,即将所述特征向量F j追加至在已包含p个人的聚类特征的特征库G中作为第p+1个人的聚类特征F′p+1,以及生成与该新建的聚类特征F′p+1对应的人物信息,如聚类库中的第p+1号人物。从而实现了特征库G随着人脸数据的聚类,聚类库中包括更多人的聚类特征。
作为本发明实施例的进一步改进,步骤S120从聚类库G获取所述特征向量F j的待定聚类特征F′t之后,还包括:
步骤S101、若所述待定聚类特征与所述特征向量的特征距离大于特征阈值,根据所述特征向量新建聚类特征,所述待聚类数据的聚类结果为新建的聚类特征对应的人物信息。
如果待定聚类特征F′t与特征向量F j的特征距离D t大于特征阈值T,则聚类库G中的各聚类特征与待聚类数据Q j中特征向量F j之间的特征距离均大于特征阈值T,可以认为待聚类数据Q j有较大概率不与该聚类特征F′t来自于同一个人的人脸数据,而且有更大概率不与聚类库G中的其他聚类特征F′t来自于同一个人的人脸数据。可以判断待聚类数据Q j对应的人的信息没有处于特征库G中。
当特征库G允许新增人物时,将该待聚类数据Q j的特征向量F j加入到特征库G,即将所述特征向量F j追加至在已包含p个人的聚类特征的特征库G中作为第p+1个人的聚类特征F′p+1,以及生成与该新建的聚类特征F′p+1对应的人物信息,如聚类库中的第p+1号人物。同时也实现了特征库G随着人脸数据的聚类,聚类库中包括更多人的聚类特征。
可以理解的,在一些实施例中,步骤S120从聚类库G获取所述特征向量F j的待定聚类特征F′t之后,判断待定聚类特征F′t与所述特征向量F j的特征距离D t是否大于所述特征阈值T,以实现待聚类数据Q j中特征向量F j的初步聚类判断,避免后续不必要的计算。当所述待定聚类特征F′t与所述特征向量F j的特征距离D t不大于所述特征阈值时,才继续对当前的待定聚类特征F′t执行步骤S130、步骤S140,以及步骤S150、步骤S160。
本发明实施例提供的人像聚类方法,通过首先在聚类库中找到与待聚类数据中特征向量距离最近的聚类特征作为待定聚类特征,然后综合待聚类数据的拍摄时间、地点,以及待定聚类特征的拍摄时间、地点计算待聚类数据对应的移动速率,当移动速率不大于移动阈值时将该待聚类数据中的特征向量与所述待定聚类特征聚类;充分利用了人脸图像数据对应的时间信息和空间信息,既能提高了聚类的准确率又能降低聚类的计算量,提高聚类的速度;当有新的数据需要聚类,无需牵一发而动全身,只做增量的计算便可实现,为动态聚类的方法。
实施例二
如图2所示的人像聚类方法,包括:
步骤S210、获取待聚类数据,所述待聚类数据包括特征向量和对应于所述特征向量的拍摄时间和拍摄地点。
相较于实施例一,在本实施例中步骤S210获取待聚类数据,具体为:从人像数据集中获取所述待聚类数据。
人像抓拍系统通常会覆盖多个地点,在某一段时间内会获取到多个拍摄地点的多个拍摄时间的人脸图像,根据人脸图像得到对应于某拍摄时间和拍摄地点的特征向量,从而可以得到初始的人像数据集,该初始的人像数据集S包括若干待聚类数据,各待聚类获取所述待聚类数据均包括一特征向量和对应于所述特征向量的拍摄时间和拍摄地点。
例如,初始的人像数据集S包括n个待聚类数据,分别为Q 1、Q 2…Q j…Q n;其中,第j个待聚类数据Q j包括特征向量F j以及对应于该特征向量F j的拍摄时间T j和拍摄地点P j。
在一些可行的实施例中,可以从该初始的人像数据集中获取所述待聚类数据;实现对初始的人像数据集中各待聚类数据的聚类。
在另一些可行的实施例中,人像数据集中的若干待聚类数据依照预设规则排序,然后依次从人像数据集中获取各待聚类数据。
示例性的,初始的人像数据集S中的若干待聚类数据,例如Q 1、Q 2…Q j…Q n依照预设规则排序后得到人像数据集S′,人像数据集S′包括若干,例如n个待聚类数据;各待聚类数据均包括一特征向量以及对应于该特征向量的拍摄时间和拍摄地点。例如,n个待聚类数据中包括一待聚类数据Q j,待聚类数据Q j包括一特征向量F j以及对应于该特征向量F j的拍摄时间T j和拍摄地点P j。
在一些可行的实施例中,步骤S210从人像数据集中获取所述待聚类数据之前,人像聚类方法还包括:将初始的人像数据集S中的若干待聚类数据依照预设规则排序,得到人像数据集S′。
在一些可行的实施例中,排序包括以下步骤:
步骤S201、根据初始的人像数据集中的各待聚类数据的拍摄地点将所述若干待聚类数据划分至若干个子数据集,所述若干个子数据集与若干个点位一一对应,同一子数据集中待聚类数据的拍摄地点对应于同一点位。
初始的人像数据集S包括不同时刻不同地点获取的待聚类数据Q 1、Q 2…Q j…Qn。可以根据各待聚类数据的拍摄地点将该n个待聚类数据划分至若干个子数据集,例如m个子数据集。该若干个子数据集与若干个点位一一对应,同一子数据集中待聚类数据的拍摄地点对应于同一点位。示例性的,第一个子数据集中的各待聚类数据对应的拍摄地点为第一个房间,第m个子数据集中的各待聚类数据对应的拍摄地点为第m个房间;又例如,第一个子数据集S1中的各待聚类数据,如Q 1、Q 3、Q 5均为设置在第一位置的摄像头111获取,第二个子数据集S2中的各待聚类数据,如Q 2、Q 4均为设置在第二位置的摄像头112获取,第m个子数据集Sm中的各待聚类数据,如Q 6均为设置在第m位置的摄像头113获取。
步骤S202、将所述若干个子数据集根据各子数据集对应点位与区域中心的距离由小到大排序。
在一些可行的实施例中,对于若干个子数据集对应的若干,如个若干,获取可以覆盖该若干个点位的最小圆的圆心,将该圆心作为区域中心。然后根据子数据集对应点位与该区域中心的距离由小到大,将所述若干个子数据集进行排序。
示例性的,第一个子数据集S1对应的点位与区域中心的距离为L1,第二个子数据集S2对应的点位与区域中心的距离为L2,第m个子数据集Sm对应的点位与区域中心的距离为Lm。
若m=3,L2<L1<Lm,则这3个子数据集进行排序为S2、S1、Sm。将初始的人像数据集S中的若干待聚类数据依照预设规则排序,得到人像数据集S′为{Q 2,Q 4,Q 1,Q 3,Q 5,Q 6}。
假设某人在靠近区域中心的位置被抓拍了,那么这个人有很大概率会在附近的某地再次出现被抓拍;而假设某人在远离区域中心的位置,如在人像抓拍系统覆盖区域的边缘被抓拍,则有较大可能一定时间内这个人不会再被抓拍。通过将人像数据集中的不同时刻不同地点获取的待聚类数据根据拍摄地点至若干个子数据集,以及根据各子数据集对应点位与区域中心的距离由小到大排序,在对人像数据集中的待聚类数据进行聚类时,先对靠近区域中心的待聚类数据进行聚类,再对与区域中心距离较远的待聚类数据进行聚类;从而可以利用空间的局部相关性提高人像抓拍系统获取的人像数据集中待聚类数据的聚类准确率。
作为本发明实施例的进一步改进,步骤S202将所述若干个子数据集根据各子数据集对应的点位与区域中心的距离由小到大排序之前或之后,人像聚类方法还包括:
步骤S203、分别将各子数据集中的待聚类数据根据所述待聚类数据的拍摄时间先后排序。
例如,第一个子数据集S1中的各待聚类数据,如Q 1、Q 3、Q 5的拍摄时间分别为T1、T 3、T 5,当T 3<T 1<T 5时,第一个子数据集S1排序后为{Q3,Q 1,Q 5};第二个子数据集S2中待聚类数据Q 2、Q 4的拍摄时间分别为T2、T 4,当T4<T 2时,第二个子数据集S2排序后为{Q 4,Q 2};因此,初始的人像数据集S经过步骤S201、步骤S202、步骤S203后得到的人像数据集S′为{Q 4,Q 2,Q 3,Q 1,Q 5,Q 6}。
假设某人在某地某时被抓拍了,那么这个人在较短时间内有很大概率会在附近的某地再次出现被抓拍。通过各子数据集中的待聚类数据根据拍摄时间先后排序,可以利用时间的局部相关性进一步提高人像数据集中待聚类数据的聚类准确率;从而实现了基于时空切分的人像数据集预处理。
步骤S220、从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离满足预设条件的聚类特征,所述待定聚类特征对应于所述待定聚类特征的拍摄时间和拍摄地点。
步骤S230、根据对应于所述待聚类数据中特征向量的拍摄时间和拍摄地点,以及对应于所述待定聚类特征的拍摄时间和拍摄地点计算所述待聚类数据的移动速率。
步骤S240、若所述待聚类数据的移动速率不大于移动阈值,将所述待聚类数据中的特征向量与所述待定聚类特征聚类。
在另一些可行的实施例中,人像聚类方法还包括:
步骤S250、若所述待聚类数据的移动速率大于所述移动阈值,根据所述特征向量新建聚类特征,以及生成与新建的聚类特征对应的人物信息。
步骤S220、S230、S240和S250,分别对应实施例一中的S120、S130、S140和S150,不再赘述。
本发明实施例提供的人像聚类算法,利用空间和时间的局部相关性进一步提高人像数据集中待聚类数据的聚类准确率;从而实现了基于时空切分的人像数据集预处理;在对人像数据集中的各待聚类数据聚类时,聚类库G中的聚类特征可以及时得到更新;从而可以利用时空关系,通过迭代局部最优从而实现全局最优,可以更全面地利用待聚类数据的时间信息和空间信息。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法,如:
一种存储介质,所述存储介质存储有计算机程序,若所述计算机程序被处理器执行,实现前述人像聚类方法的步骤。
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等,如实施例三。
实施例三
如图3所示一种电子设备,包括存储器200和处理器300,存储器200用于存储程序指令;若处理器300执行该程序指令,实现上述人像聚类方法的步骤。
本实施例中的电子设备与前述实施例中的方法是基于同一发明构思下的两个方面,在前面已经对方法实施过程作了详细的描述,所以本领域技术人员可根据前述描述清楚地了解本实施中的电子设备的结构及实施过程,为了说明书的简洁,在此就不再赘述。
本发明实施例提供的电子设备,通过首先在聚类库中找到与待聚类数据中特征向量距离最近的聚类特征作为待定聚类特征,然后综合待聚类数据的拍摄时间、地点,以及待定聚类特征的拍摄时间、地点计算待聚类数据对应的移动速率,当移动速率不大于移动阈值时将该待聚类数据中的特征向量与所述待定聚类特征聚类;充分利用了人脸图像数据对应的时间信息和空间信息,既能提高了聚类的准确率又能降低聚类的计算量,提高聚类的速度;当有新的数据需要聚类,无需牵一发而动全身,只做增量的计算便可实现,为动态聚类的方法。
上述实施方式仅为本发明的优选实施方式,不能以此来限定本发明保护的范围,本领域的技术人员在本发明的基础上所做的任何非实质性的变化及替换均属于本发明所要求保护的范围。

Claims (6)

1.一种人像聚类方法,其特征在于,包括:
获取待聚类数据,所述待聚类数据包括特征向量和对应于所述特征向量的拍摄时间和拍摄地点;
从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离满足预设条件的聚类特征,所述待定聚类特征对应于所述待定聚类特征的拍摄时间和拍摄地点;
根据对应于所述待聚类数据中特征向量的拍摄时间和拍摄地点,以及对应于所述待定聚类特征的拍摄时间和拍摄地点计算所述待聚类数据的移动速率;
若所述待聚类数据的移动速率不大于移动阈值,将所述待聚类数据中的特征向量与所述待定聚类特征聚类;
所述待定聚类特征为所述聚类库中与所述特征向量的特征距离满足预设条件的聚类特征,具体为:所述待定聚类特征为所述聚类库中与所述特征向量的特征距离最小的聚类特征;或者所述待定聚类特征为所述聚类库中与所述特征向量的特征距离小于预设阈值的聚类特征;
所述将所述待聚类数据中的特征向量与所述待定聚类特征聚类,具体包括:根据所述待定聚类特征对应的人物信息生成所述待聚类数据的聚类结果;和/或根据所述特征向量更新所述待定聚类特征;
所述人像聚类方法还包括:若所述待聚类数据的移动速率大于所述移动阈值,根据所述特征向量新建聚类特征,以及生成与新建的聚类特征对应的人物信息;
所述从聚类库获取所述特征向量的待定聚类特征,所述待定聚类特征为所述聚类库中与所述特征向量的特征距离最小的聚类特征,具体包括:计算所述特征向量与所述聚类库中各聚类特征的特征距离;查找最小的特征距离;获取所述最小的特征距离对应的聚类特征为所述待定聚类特征;
所述从聚类库获取所述特征向量的待定聚类特征之后,还包括:若所述待定聚类特征与所述特征向量的特征距离大于特征阈值,根据所述特征向量新建聚类特征,所述待聚类数据的聚类结果为新建的聚类特征对应的人物信息。
2.如权利要求1所述的人像聚类方法,其特征在于:所述获取待聚类数据,具体为:从人像数据集中获取所述待聚类数据;
所述人像数据集包括若干所述待聚类数据,各所述待聚类数据均包括一特征向量以及对应于所述特征向量的拍摄时间和拍摄地点。
3.如权利要求2所述的人像聚类方法,其特征在于:所述从人像数据集中获取所述待聚类数据之前,还包括:
根据各待聚类数据的拍摄地点将若干所述待聚类数据划分至若干个子数据集,所述若干个子数据集与若干个点位一一对应,同一子数据集中待聚类数据的拍摄地点对应于同一点位;
将所述若干个子数据集根据各子数据集对应点位与区域中心的距离由小到大排序。
4.如权利要求3所述的人像聚类方法,其特征在于:所述将所述若干个子数据集根据各子数据集对应的点位与区域中心的距离由小到大排序之前或之后,还包括:
分别将各子数据集中的待聚类数据根据所述待聚类数据的拍摄时间先后排序。
5.一种电子设备,其特征在于:包括存储器和处理器,所述存储器用于存储程序指令;若所述处理器执行所述程序指令,实现如权利要求1-4中任一项所述的人像聚类方法的步骤。
6.一种存储介质,所述存储介质存储有计算机程序,其特征在于:若所述计算机程序被处理器执行,实现如权利要求1-4中任一项所述的人像聚类方法的步骤。
CN201811107055.7A 2018-09-21 2018-09-21 一种人像聚类方法、电子设备和存储介质 Active CN109447112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811107055.7A CN109447112B (zh) 2018-09-21 2018-09-21 一种人像聚类方法、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811107055.7A CN109447112B (zh) 2018-09-21 2018-09-21 一种人像聚类方法、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN109447112A CN109447112A (zh) 2019-03-08
CN109447112B true CN109447112B (zh) 2023-12-05

Family

ID=65530660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811107055.7A Active CN109447112B (zh) 2018-09-21 2018-09-21 一种人像聚类方法、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN109447112B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110084267B (zh) * 2019-03-12 2023-05-26 北京旷视科技有限公司 人像聚类方法、装置、电子设备及可读存储介质
CN110232331B (zh) * 2019-05-23 2022-09-27 深圳大学 一种在线人脸聚类的方法及系统
CN113742510A (zh) * 2021-08-26 2021-12-03 浙江大华技术股份有限公司 聚档类簇中心的确定方法、装置、计算机设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654039A (zh) * 2015-12-24 2016-06-08 小米科技有限责任公司 图像处理的方法和装置
CN106446797A (zh) * 2016-08-31 2017-02-22 腾讯科技(深圳)有限公司 图像聚类方法及装置
CN108229674A (zh) * 2017-02-21 2018-06-29 北京市商汤科技开发有限公司 聚类用神经网络的训练方法和装置、聚类方法和装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150029006A (ko) * 2012-06-29 2015-03-17 비헤이버럴 레코그니션 시스템즈, 인코포레이티드 비디오 감시 시스템을 위한 피처 이례들의 무감독 학습

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654039A (zh) * 2015-12-24 2016-06-08 小米科技有限责任公司 图像处理的方法和装置
CN106446797A (zh) * 2016-08-31 2017-02-22 腾讯科技(深圳)有限公司 图像聚类方法及装置
CN108229674A (zh) * 2017-02-21 2018-06-29 北京市商汤科技开发有限公司 聚类用神经网络的训练方法和装置、聚类方法和装置

Also Published As

Publication number Publication date
CN109447112A (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
US20220392234A1 (en) Training neural networks for vehicle re-identification
US10891465B2 (en) Methods and apparatuses for searching for target person, devices, and media
US11074434B2 (en) Detection of near-duplicate images in profiles for detection of fake-profile accounts
CN108229297B (zh) 人脸识别方法和装置、电子设备、计算机存储介质
EP2668618B1 (en) Method for keypoint matching
CN111461637A (zh) 简历筛选方法、装置、计算机设备和存储介质
CN109447112B (zh) 一种人像聚类方法、电子设备和存储介质
US8345932B2 (en) Support vector machine for biometric data processing
KR102592551B1 (ko) Ar장치를 위한 객체 인식 처리 장치 및 방법
CN114638960A (zh) 模型的训练方法、图像描述生成方法和装置、设备、介质
KR20190088087A (ko) 움직임 정보를 이용한 인공지능 학습기반의 이동객체 영상 분류처리 방법
CN112966652A (zh) 轨迹汇聚方法、装置、计算机设备及存储介质
US20160210502A1 (en) Method and apparatus for determining type of movement of object in video
Zhang et al. Dataset-driven unsupervised object discovery for region-based instance image retrieval
Lee et al. Reinforced adaboost learning for object detection with local pattern representations
CN116630888A (zh) 无人机监测方法、无人机监测装置、电子设备及存储介质
Chatterjee et al. Pose4Gun: A pose-based machine learning approach to detect small firearms from visual media
CN114708613A (zh) 行为识别方法、行为识别装置、计算机设备和存储介质
WO2016142293A1 (en) Method and apparatus for image search using sparsifying analysis and synthesis operators
US11803972B2 (en) Information processing apparatus, control method, and program for accurately linking fragmented trajectories of an object
Tian et al. FA-MCADF: Feature affinity based multiple correspondence analysis and decision fusion framework for disaster information management
Park et al. k-fold Subsampling based Sequential Backward Feature Elimination.
US20240096052A1 (en) Image matching apparatus, control method, and non-transitory computer-readable storage medium
US20230222686A1 (en) Information processing apparatus, information processing method, and program
CN113869465A (zh) I-nice算法优化方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant