CN112818149B - 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质 - Google Patents

一种基于时空轨迹数据的人脸聚类方法、装置及存储介质 Download PDF

Info

Publication number
CN112818149B
CN112818149B CN202110084614.2A CN202110084614A CN112818149B CN 112818149 B CN112818149 B CN 112818149B CN 202110084614 A CN202110084614 A CN 202110084614A CN 112818149 B CN112818149 B CN 112818149B
Authority
CN
China
Prior art keywords
time
space
cluster
similarity
face image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110084614.2A
Other languages
English (en)
Other versions
CN112818149A (zh
Inventor
张宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202110084614.2A priority Critical patent/CN112818149B/zh
Publication of CN112818149A publication Critical patent/CN112818149A/zh
Application granted granted Critical
Publication of CN112818149B publication Critical patent/CN112818149B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/5866Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于时空轨迹数据的人脸聚类方法、装置及存储介质。其中,该方法包括:获取目标时间段内待聚类的人脸图像中的特征数据;根据人脸图像的采集设备的时空标签,将特征数据划分为多个时空块;基于多个时空块生成时空块对应的类簇集合;将时空块对应的类簇集合之间进行聚类合并,生成目标时间段对应的类簇集合;将目标时间段之后的参考时间段对应的人脸图像中的特征数据,及目标时间段对应的类簇集合进行聚类合并,得到人脸图像的聚类结果。本发明解决了人脸聚类方法中容易出现人脸重复识别的技术问题。

Description

一种基于时空轨迹数据的人脸聚类方法、装置及存储介质
技术领域
本发明涉及计算机领域,具体而言,涉及一种基于时空轨迹数据的人脸聚类方法、装置及存储介质。
背景技术
随着社会安防建设不断发展,人脸卡口相机的使用越来越多,对抓拍人脸图片的身份落地的需求也越来越强烈。通过人脸识别和人脸聚类技术,进行身份落地,成为安防领域的新热点。在安防领域,传统的人脸聚类,是通过人脸识别技术将采集到的人脸图片与标准底库图片进行特征值比对。如果相似度在某阈值范围以上,则将采集图片的身份标记为标准底库的身份信息,完成采集图片的身份落地。如果相似度在某阈值以下,则采集图片无法识别,身份无法落地。但是,由于图片拍摄环境的差异性,导致图片识别的准确度受一定影响,人脸聚类会出现一档多人、一人多档、漏聚类等情况。因此,存在传统聚类网络容易出现重复识别、重复归档的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于时空轨迹数据的人脸聚类方法、装置及存储介质,以至少解决人脸聚类方法中容易出现人脸重复识别的技术问题。
根据本发明实施例的一个方面,提供一种基于时空轨迹数据的人脸聚类方法,包括:获取目标时间段内待聚类的人脸图像中的特征数据;根据上述人脸图像的采集设备的时空标签,将上述特征数据划分为多个时空块;基于上述多个时空块生成上述时空块对应的类簇集合;将上述时空块对应的类簇集合之间进行聚类合并,生成上述目标时间段对应的类簇集合;将上述目标时间段之后的参考时间段对应的人脸图像中的特征数据,及上述目标时间段对应的类簇集合进行聚类合并,得到上述人脸图像的聚类结果。
作为一种可选的方案,上述根据上述人脸图像的采集设备的时空标签,将上述特征数据划分为多个时空块,包括:获取在上述目标时间段内采集上述人脸图像的上述采集设备的经纬度坐标;根据上述经纬度坐标,将上述采集设备对应的上述人脸图像的特征数据划分为不同的上述时空块,其中,每个上述时空块对应一个经纬度范围和一个拍摄时间范围;根据上述人脸图像拍摄的时间和上述人脸图像对应的特征质量分数,将上述时空块中的特征数据排序生成特征数据集合,其中,上述特征质量分用于表示上述人脸图像拍摄的质量,上述人脸图像拍摄质量与上述人脸图像的特征质量分数正相关。
作为一种可选的方案,上述根据上述时空块,基于上述多个时空块生成类簇,包括:在上述时空块对应的特征数据集合中,选取拍摄时间最早且质量分数最高的人脸图像的上述特征数据生成第一类簇,其中,选取上述拍摄时间最早且质量分数最高的人脸图像的特征数据为上述第一类簇的质心;遍历上述时空块中其余特征数据,并将上述其余特征数据与上述第一类簇的质心进行相似度对比;根据对比结果,生成上述时空块对应的类簇。
作为一种可选的方案,上述遍历上述时空块中其余特征数据,并将上述其余特征数据与上述第一类簇的质心进行相似度对比,包括:按照上述时空块对应的数据集合中的顺序,依次选取特征数据;在上述特征数据符合预设的时空阈值的情况下,将上述满足预设的时空阈值的特征数据与上述第一类簇进行相似度对比。
作为一种可选的方案,在特征数据符合预设的时空阈值的情况下,上述在上述特征数据符合预设的时空阈值的情况下,将上述满足预设的时空阈值的特征数据与上述第一类簇进行相似度对比,包括:获取上述特征数据对应的采集设备与上述第一类簇质心对应的采集设备之间的间隔距离;获取上述特征数据对应的拍摄时间与上述第一类簇质心对应的时间间隔;在上述间隔距离和上述时间间隔不满足上述预设的时空阈值的情形下,上述特征数据单独成一类簇;在上述间隔距离和上述时间间隔满足上述预设的时空阈值的情况下,将上述特征数据与上述第一类簇进行对比。
作为一种可选的方案,上述在上述间隔距离和上述时间间隔满足上述预设的时空阈值的情况下,将上述特征数据与上述第一类簇进行对比,包括:获取上述特征数据与上述第一类簇的质心之间的相似度;获取第一相似度、第二相似度、第三相似度和第四相似度;其中,上述第一相似度对应第一相似度阈值、上述第二相似度对应第二相似度阈值、上述第三相似度对应第三阈值、上述第四相似度对应第四阈值;在上述相似度的范围不满足第四相似度的范围的情况下,上述特征数据单成一类类簇;在上述相似度的范围满足第四相似度的范围的情况下,根据相似度,将上述特征数据按照上述第一相似度、上述第二相似度、上述第三相似度、上述第四相似度进行分类;根据上述相似度对应的上述时空阈值,对分类后的相似度内的数据进行聚类,生成上述时空块对应的类簇。
作为一种可选的方案,上述将上述时空块对应的类簇集合之间进行聚类合并,生成上述目标时间段对应的类簇集合,包括:按照上述时空块对应的上述第一类簇质心拍摄时间,进行排序;选取拍摄时间最早的第一类簇质心对应的时空块作为初始时空块;将上述目标时间段内其余上述初始时空块与上述时空块进行聚类集合;在上述类簇之间符合预设的时空阈值的情况,生成上述指定时间段内的聚类集合。
作为一种可选的方案,上述将上述目标时间段之后的参考时间段对应的人脸图像中的特征数据,及上述目标时间段对应的类簇集合进行聚类合并,得到上述人脸图像的聚类结果,包括:遍历上述目标时间段后的人脸图片的特征数据;将上述人脸图片的特征数据与上述指定时间段内的聚类集合进行聚类合并;在上述特征数据和上述指定时间段内的聚类集合之间符合预设的时空阈值的情况,生成聚类结果。
根据本发明实施例的又一方面,还提供一种人脸聚类装置,包括上述的人脸聚类方法,上述装置包括:采集单元,用于根据待聚类的人脸图像中的特征数据,将上述特征数据在目标时间段内,生成时空块;第一聚类单元,用于根据上述人脸图像的采集设备的时空标签,将上述特征数据划分为多个时空块;第二聚类单元,用于基于上述多个时空块生成上述时空块对应的类簇集合;第三聚类单元,用于将上述目标时间段之后的参考时间段对应的人脸图像中的特征数据,及上述目标时间段对应的类簇集合进行聚类合并,得到上述人脸图像的聚类结果。
根据本发明实施例的又一方面,还提供一种存储介质,存储介质中存储有计算机程序,其中,计算机程序被设置为运行时执行上述的方法。
在本发明实施例中,通过获取目标时间段内待聚类的人脸图像中的特征数据;根据人脸图像的采集设备的时空标签,将特征数据划分为多个时空块;基于多个时空块生成时空块对应的类簇集合;将时空块对应的类簇集合之间进行聚类合并,生成目标时间段对应的类簇集合;将目标时间段之后的参考时间段对应的人脸图像中的特征数据,及目标时间段对应的类簇集合进行聚类合并,得到人脸图像的聚类结果。
本发明通过发明本一种基于时空轨迹数据的人脸聚类方法、装置及存储介质,解决了人脸聚类方法中容易出现人脸重复识别的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的一种可选的基于时空轨迹数据的人脸聚类方法的应用环境的示意图;
图2是根据本发明实施例的一种可选的基于时空轨迹数据的人脸聚类方法的流程示意图;
图3是根据本发明实施例的另一种可选的基于时空轨迹数据的人脸聚类方法的流程示意图;
图4是根据本发明实施例的另一种可选的基于时空轨迹数据的人脸聚类方法的流程示意图;
图5是根据本发明实施例的另一种可选的基于时空轨迹数据的人脸聚类方法的流程示意图;
图6是根据本发明实施例的另一种可选的基于时空轨迹数据的人脸聚类方法的流程示意图;
图7是根据本发明实施例的另一种可选的基于时空轨迹数据的人脸聚类方法的流程示意图;
图8是根据本发明实施例的基于时空轨迹数据的人脸聚类方法的装置示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着社会安防建设的不断发展,人脸卡口相机的使用越来越多,对抓拍人脸图片的身份落地需求也越来越强烈。在安防领域,传统的人脸聚类,是通过人脸识别技术将采集到的人脸图片与标准底库图片进行特征值比对。如果相似度在某阈值范围以上,则将采集图片的身份标记为标准底库的身份信息,完成采集图片的身份落地。如果相似度在某阈值以下,则采集图片无法识别,身份无法落地。但是,由于图片拍摄环境的差异性,导致图片识别的准确度受一定影响,手机的人脸图像不包含时间概念和时空数据,只根据相似度判断人脸图像聚类,聚类结果就会出现一人同时出现在同一个时间内的多个地点的情况。基于此问题,本案提出一种新的提升人脸归档准确率的解决方案。
根据本发明实施例的一个方面,提供了一种基于时空轨迹数据的人脸聚类方法,可选地,作为一种可选的实施方式,上述操作验证方法可以但不限于应用于如图1所示的环境中。其中,可以但不限于包括用户设备102、网络110及服务器112,其中,该用户设备102上可以但不限于包括显示器108、处理器106及存储器104,用户设备102可以但不限于包括人脸采集设备1024,用户设备102还可以但不限于其余与设备102建立通信连接的其他用户设备(图中未表示出)。
具体过程可以如下步骤:
步骤S102,用户设备102通过图像采集设备1024收集待聚类的人脸图像信息的特征数据和采集设备1024的时空标签;
步骤S104-S106,用户102通过网络110将收集的特征数据和时空标签发送给服务器112;
步骤S108,服务器112通过数据库114选取目标时间段和参考时间,将目标时间段内的人脸数据划分为多个时空块;并通过处理引擎116基于多个时空块生成类簇;处理引擎116还将类簇进行合并生成目标时间段内对应的类簇集合;将目标时间段之后的参考时间段对应的类簇集合及目标时间段对应的类簇集合进行聚类合并,得到人脸图像的聚类结果。
步骤S110-S112,服务器112通过网络110将聚类结果发送给用户设备102,用户设备102中的处理器106根据聚类结果发送分类信息。
可选地,人脸图像聚类方法可以但不限于应用在人脸识别的场景下,还可以应用在识别人的活动轨迹场景中,例如在追捕嫌疑人的活动中,也可以根据人脸聚类结果,获取嫌疑人在不同时空中的图像,形成活动轨迹。
需要说明的是,采集人脸图像中的特征数据,其中,特征数据包括但不限于身高、体重、服饰、五官等信息,人脸图像拍摄的图片越清晰,人脸图像的特征分越高。
可选地,在本实施例中,上述终端设备可以是配置有目标客户端的终端设备,可以包括但不限于以下至少之一:手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices,移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是视频客户端、即时通信客户端、浏览器客户端、教育客户端等。上述网络可以包括但不限于:有线网络,无线网络,其中,该有线网络包括:局域网、城域网和广域网,该无线网络包括:蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器,也可以是由多个服务器组成的服务器集群,或者是云服务器。上述仅是一种示例,本实施例中对此不作任何限定。
可选地,作为一种可选的实施方式,如图2所示,基于时空轨迹数据的人脸聚类方法包括:
S202,获取目标时间段内待聚类的人脸图像中的特征数据;
S204,根据人脸图像的采集设备的时空标签,将特征数据划分为多个时空块;
S206,基于多个时空块生成时空块对应的类簇集合;
S208,将时空块对应的类簇集合之间进行聚类合并,生成目标时间段对应的类簇集合;
S210,将目标时间段之后的参考时间段对应的人脸图像中的特征数据,及目标时间段对应的类簇集合进行聚类合并,得到人脸图像的聚类结果。
进一步举例说明,如图3所示,步骤S204,根据人脸图像的采集设备的时空标签,将特征数据划分为多个时空块,包括:
S302:获取在目标时间段内采集人脸图像的采集设备的经纬度坐标;
S304:根据经纬度坐标,将采集设备对应的人脸图像的特征数据划分为不同的时空块,其中,每个时空块对应一个经纬度范围和一个拍摄时间范围;
S306:根据人脸图像拍摄的时间和人脸图像对应的特征质量分数,将时空块中的特征数据排序生成特征数据集合,其中,特征质量分用于表示人脸图像拍摄的质量,人脸图像拍摄质量与人脸图像的特征质量分数正相关。
具体地,在步骤S302中,获取人脸图像的采集设备的经纬度坐标。在步骤S304中,以选取某个城市,首先,将某个地市,将该城市划分为不同的区域,获取区域内的经纬度坐标,将此区域内的采集设备打上时空标签,将同一个时空标签内的采集设备在目标时间段内采集的人脸图像作为时空块。在步骤S306中,对时空块进行排序,按照抓拍时间和人脸图片特征值质量分排序,其中,特征数据包括但不限于身高、体重、服饰、五官等信息,人脸图像拍摄的图片越清晰,人脸图像的特征分越高。采集的时间最早,质量分数最高的数据拍在时空块对应的特征数据集合中靠前的位置。
进一步举例说明,如图4所示,步骤S206,基于多个时空块生成时空块对应的类簇集合,包括:
S402,在时空块对应的特征数据集合中,选取拍摄时间最早且质量分数最高的人脸图像的特征数据生成第一类簇,其中,选取拍摄时间最早且质量分数最高的人脸图像的特征数据为第一类簇的质心;
S404,遍历时空块中其余特征数据,并将其余特征数据与第一类簇的质心进行相似度对比;
S406根据对比结果,生成时空块对应的类簇。
具体地,如图5所示,步骤S206包括:
S502:按照时空块对应的数据集合中的顺序,依次选取特征数据;
S504:在特征数据符合预设的时空阈值的情况下,将满足预设的时空阈值的特征数据与第一类簇进行相似度对比。
具体地,在步骤S504中,比较两条抓拍数据的时间以及抓拍设备的间隔距离,与设定的阈值进行比对,排除一些时空矛盾的数据。例如,图片A和图片B在很短的时间内,出现在相对较远的地方,按正常的情况,出现的可能性极低,那么可假定这类数据是时空矛盾,不应该聚成一类。
具体地,步骤S504,包括;
S602获取所述特征数据对应的采集设备与所述第一类簇质心对应的采集设备之间的间隔距离;
S604:获取特征数据对应的拍摄时间与第一类簇质心对应的时间间隔;
S606:在间隔距离和时间间隔不满足预设的时空阈值的情形下,特征数据单独成一类簇;
S608:在所述间隔距离和所述时间间隔满足所述预设的时空阈值的情况下,将所述特征数据与所述第一类簇进行对比。
具体地S608包括,获取特征数据与第一类簇的质心之间的相似度;获取第一相似度、第二相似度、第三相似度和第四相似度;其中,第一相似度对应第一相似度阈值、第二相似度对应第二相似度阈值、第三相似度对应第三阈值、第四相似度对应第四阈值;在相似度范围不满足第四相似度范围的情况下,数据单成一类类簇;在相似度满足第四相似度范围的情况下,根据相似度,将特征数据按照第一相似度、第二相似度、第三相似度、第四相似度进行分类;根据相似度对应的时空阈值,对分类后的相似度内的数据进行聚类,生成时空块对应的类簇。
具体地,采用不同相似度和时间空间范围的对应关系,主要考虑在指定时间和空间范围内,相似度的范围满足第一类阈值与第四类阈值的范围,可能是同一类的概率很高。如果只考虑第一类阈值,则会漏聚一些图片。如果满足第一类与第四类阈值的范围,可通过后续进一步聚类来细分。例如,在很短时间和很短距离范围内,只存在图片A和图片B相似度达到90%,图片A和图片B极有可能属于同一类簇。但如果直接剔除,则会单独成一类簇,对后续进一步聚类产生干扰。
具体地,步骤S208包括:按照时空块对应的第一类簇质心拍摄时间,进行排序;选取拍摄时间最早的第一类簇质心对应的时空块作为初始时空块;将目标时间段内其余初始时空块与时空块进行聚类集合;在类簇之间符合预设的时空阈值的情况,生成指定时间段内的聚类集合。
在本实施例中,对不同时空块中类簇集合的类簇进行交叉比对,按更大的时空块进行合并,例如,时空块向上合并为更大时空块,交叉比对同一更大时空块内的时空块的类簇。判断两两比对类簇的质心以及类簇最后一个元素是否存在时空矛盾。主要考虑到时空矛盾问题。如果将两个类簇直接合并,出现一档多人的概率也会提高。比对两两类簇的质心以及最后一个元素的相似度。比对质心以及类簇最后一个元素,主要考虑到数据漂移的问题。例如,类簇A的质心和类簇B的质心,相似度达到了第一类阈值,但类簇中的最后一个元素相似度达不到第四类阈值要求;如果将两个类簇直接合并,出现一档多人的概率就会提高。存储到类簇未合并的类簇集合,是用于存储存在时间空间矛盾的类簇,用于后续类簇合并。类似同一时空块的类簇合并逻辑,采用不同相似度和时间空间范围的对应关系,减少漏聚类的概率。
具体地,在图7中,步骤S210包括:
S702:遍历目标时间段后的人脸图片的特征数据;
S704:将人脸图片的特征数据与指定时间段内的聚类集合进行聚类合并;
S706:在特征数据和指定时间段内的聚类集合之间符合预设的时空阈值的情况,生成聚类结果。
在步骤S702-S706中,逐条读取初始聚类时间段后的人脸图片数据,按抓拍时间进行排序,与已经聚类好的类簇集合进行聚类合并。判断当前数据与类簇集合中的每个类簇的质心以及类簇最后一条数据是否存在时空矛盾。主要考虑到时空矛盾问题。如果将当前数据与类簇直接合并,出现一档多人的概率也会提高。将当前数据作为单独的类簇,质心为其自身,添加到类簇集合。如果当前数据与类簇集合的类簇都存在时空矛盾,则考虑将其作为独立的类簇存储。否则,继续后续步骤。将当前数据与满足时空阈值的类簇质心进行两两相似度比对。类似同一时空块的类簇合并逻辑,采用不同相似度和时间空间范围的对应关系,减少漏聚类的概率。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
根据本发明实施例的又一个方面,如图8还提供了一种人脸聚类装置用于实施上述人脸聚类装置包括:
采集单元802,用于根据待聚类的人脸图像中的特征数据,将特征数据在目标时间段内,生成时空块;
第一聚类单元804,用于根据人脸图像的采集设备的时空标签,将特征数据划分为多个时空块;
第二聚类单元806,用于基于多个时空块生成时空块对应的类簇集合;
第三聚类单元808,用于将目标时间段之后的参考时间段对应的人脸图像中的特征数据,及目标时间段对应的类簇集合进行聚类合并,得到人脸图像的聚类结果。
根据本发明实施例的又一个方面,根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述人脸识别方面或者人脸聚类各种可选实现方式中提供的方法。其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤其中,计算机程序被设置为执行上述人脸聚类方法,具体包括:
S1,获取目标时间段内待聚类的人脸图像中的特征数据;
S2,根据人脸图像的采集设备的时空标签,将特征数据划分为多个时空块;
S3,基于多个时空块生成时空块对应的类簇集合;
S4,将时空块对应的类簇集合之间进行聚类合并,生成目标时间段对应的类簇集合;
S5,将目标时间段之后的参考时间段对应的人脸图像中的特征数据,及目标时间段对应的类簇集合进行聚类合并,得到人脸图像的聚类结果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个采集单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (4)

1.一种基于时空轨迹数据的人脸聚类方法,其特征在于,包括:
获取目标时间段内待聚类的人脸图像中的特征数据;
根据所述人脸图像的采集设备的时空标签,将所述特征数据划分为多个时空块;
在所述时空块对应的特征数据集合中,选取拍摄时间最早且质量分数最高的人脸图像的所述特征数据生成第一类簇,其中,选取所述拍摄时间最早且质量分数最高的人脸图像的特征数据为所述第一类簇的质心;
按照所述时空块对应的数据集合中的顺序,依次选取特征数据;
在所述特征数据符合预设的时空阈值的情况下,获取所述特征数据对应的采集设备与所述第一类簇质心对应的采集设备之间的间隔距离;
获取所述特征数据对应的拍摄时间与所述第一类簇质心对应的时间间隔;
在所述间隔距离和所述时间间隔不满足所述预设的时空阈值的情形下,所述特征数据单独成一类簇;
在所述间隔距离和所述时间间隔满足所述预设的时空阈值的情况下,获取所述特征数据与所述第一类簇的质心之间的相似度;获取第一相似度阈值、第二相似度阈值、第三相似度阈值和第四相似度阈值;在所述相似度的范围不满足所述第四相似度阈值的范围的情况下,所述特征数据单成一类类簇;在所述相似度的范围满足所述第四相似度阈值的范围的情况下,根据相似度,将所述特征数据按照所述第一相似度阈值、所述第二相似度阈值、所述第三相似度阈值、所述第四相似度阈值进行分类;根据所述相似度对应的所述时空阈值,对分类后的相似度内的数据进行聚类,生成所述时空块对应的类簇集合;
按照所述时空块对应的所述第一类簇质心拍摄时间,进行排序;
选取拍摄时间最早的第一类簇质心对应的时空块作为初始时空块;
将所述目标时间段内其余所述时空块与所述初始时空块进行聚类合并,对不同时空块中类簇集合的类簇进行交叉比对;
在所述聚类合并之后的类簇之间符合预设的时空阈值的情况,生成所述目标时间段内的聚类集合;
遍历所述目标时间段之后的参考时间段对应的人脸图像中的特征数据,在所述人脸图像中的特征数据和所述目标时间段对应的类簇集合之间符合预设的时空阈值的情况下,将所述人脸图像中的特征数据与所述目标时间段对应的类簇集合进行聚类合并,得到所述人脸图像的聚类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述人脸图像的采集设备的时空标签,将所述特征数据划分为多个时空块,包括:
获取在所述目标时间段内采集所述人脸图像的所述采集设备的经纬度坐标;
根据所述经纬度坐标,将所述采集设备对应的所述人脸图像的特征数据划分为不同的所述时空块,其中,每个所述时空块对应一个经纬度范围和一个拍摄时间范围;
根据所述人脸图像拍摄的时间和所述人脸图像对应的特征质量分数,将所述时空块中的特征数据排序生成特征数据集合,其中,所述特征质量分用于表示所述人脸图像拍摄的质量,所述人脸图像拍摄质量与所述人脸图像的特征质量分数正相关。
3.一种人脸聚类装置,其特征在于,所述装置包括:
采集单元,用于根据待聚类的人脸图像中的特征数据,将所述特征数据在目标时间段内,生成时空块;
第一聚类单元,用于根据所述人脸图像的采集设备的时空标签,将所述特征数据划分为多个时空块;
所述装置,还用于在所述时空块对应的特征数据集合中,选取拍摄时间最早且质量分数最高的人脸图像的所述特征数据生成第一类簇,其中,选取所述拍摄时间最早且质量分数最高的人脸图像的特征数据为所述第一类簇的质心;按照所述时空块对应的数据集合中的顺序,依次选取特征数据;在所述特征数据符合预设的时空阈值的情况下,获取所述特征数据对应的采集设备与所述第一类簇质心对应的采集设备之间的间隔距离;获取所述特征数据对应的拍摄时间与所述第一类簇质心对应的时间间隔;在所述间隔距离和所述时间间隔不满足所述预设的时空阈值的情形下,所述特征数据单独成一类簇;在所述间隔距离和所述时间间隔满足所述预设的时空阈值的情况下,获取所述特征数据与所述第一类簇的质心之间的相似度;获取第一相似度阈值、第二相似度阈值、第三相似度阈值和第四相似度阈值;在所述相似度的范围不满足所述第四相似度阈值的范围的情况下,所述特征数据单成一类类簇;在所述相似度的范围满足所述第四相似度阈值的范围的情况下,根据相似度,将所述特征数据按照所述第一相似度阈值、所述第二相似度阈值、所述第三相似度阈值、所述第四相似度阈值进行分类;根据所述相似度对应的所述时空阈值,对分类后的相似度内的数据进行聚类,生成所述时空块对应的类簇集合;
所述装置,还用于按照所述时空块对应的所述第一类簇质心拍摄时间,进行排序;选取拍摄时间最早的第一类簇质心对应的时空块作为初始时空块;将所述目标时间段内其余所述时空块与所述初始时空块进行聚类合并,对不同时空块中类簇集合的类簇进行交叉比对;在所述聚类合并之后的类簇之间符合预设的时空阈值的情况,生成所述目标时间段内的聚类集合;
所述装置,还用于遍历所述目标时间段之后的参考时间段对应的人脸图像中的特征数据,在所述人脸图像中的特征数据和所述目标时间段对应的类簇集合之间符合预设的时空阈值的情况下,将所述人脸图像中的特征数据与所述目标时间段对应的类簇集合进行聚类合并,得到所述人脸图像的聚类结果。
4.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求1至2任一项中所述的方法。
CN202110084614.2A 2021-01-21 2021-01-21 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质 Active CN112818149B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110084614.2A CN112818149B (zh) 2021-01-21 2021-01-21 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110084614.2A CN112818149B (zh) 2021-01-21 2021-01-21 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN112818149A CN112818149A (zh) 2021-05-18
CN112818149B true CN112818149B (zh) 2023-07-14

Family

ID=75858659

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110084614.2A Active CN112818149B (zh) 2021-01-21 2021-01-21 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN112818149B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113570635A (zh) * 2021-06-03 2021-10-29 浙江大华技术股份有限公司 目标运动轨迹还原方法、装置、电子设备、存储介质
CN113673550A (zh) * 2021-06-30 2021-11-19 浙江大华技术股份有限公司 聚类方法、装置、电子设备、计算机可读存储介质
CN113807223B (zh) * 2021-09-07 2024-04-09 南京中兴力维软件有限公司 人脸聚类子类合并方法、装置及设备
CN113656625B (zh) * 2021-10-19 2022-02-15 浙江大华技术股份有限公司 一种确定人体空间域的方法、装置及电子设备
CN113779292B (zh) * 2021-11-11 2022-04-22 北京达佳互联信息技术有限公司 图像分类的方法、装置、服务器及计算机可读存储介质
CN115953650B (zh) * 2023-03-01 2023-06-27 杭州海康威视数字技术股份有限公司 特征融合模型的训练方法和装置
CN116719962B (zh) * 2023-08-11 2023-10-27 世优(北京)科技有限公司 图像的聚类方法、装置及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015197029A1 (zh) * 2014-06-27 2015-12-30 北京奇虎科技有限公司 一种人脸相似度识别方法和系统
CN109800674A (zh) * 2018-12-28 2019-05-24 上海依图网络科技有限公司 一种归档方法及装置
CN110263703A (zh) * 2019-06-18 2019-09-20 腾讯科技(深圳)有限公司 人员流量统计方法、装置和计算机设备
CN110516586B (zh) * 2019-08-23 2023-07-28 深圳力维智联技术有限公司 一种人脸图像聚类方法、系统、产品及介质
CN111814629A (zh) * 2020-06-29 2020-10-23 深圳市商汤科技有限公司 人员检测方法及装置、电子设备和存储介质
CN112232148A (zh) * 2020-09-28 2021-01-15 浙江大华技术股份有限公司 图像聚类、目标轨迹追踪方法、电子设备及存储介质
CN112101483B (zh) * 2020-11-02 2023-11-28 浙江大华技术股份有限公司 图像聚类方法、装置电子设备、计算机可读存储介质

Also Published As

Publication number Publication date
CN112818149A (zh) 2021-05-18

Similar Documents

Publication Publication Date Title
CN112818149B (zh) 一种基于时空轨迹数据的人脸聚类方法、装置及存储介质
CN108733819B (zh) 一种人员档案建立方法和装置
CN109858371B (zh) 人脸识别的方法及装置
US10242250B2 (en) Picture ranking method, and terminal
US20150332087A1 (en) Systems and Methods for Identifying a User's Demographic Characteristics Based on the User's Social Media Photographs
CN106575280B (zh) 用于分析用户关联图像以产生非用户生成标签以及利用该生成标签的系统和方法
US8805123B2 (en) System and method for video recognition based on visual image matching
JP2022518469A (ja) 情報処理方法および装置、記憶媒体
CN109783685A (zh) 一种查询方法及装置
CN110889314B (zh) 图像处理方法、装置、电子设备、服务器及系统
JP2022518459A (ja) 情報処理方法および装置、記憶媒体
CN104254859A (zh) 建立社交网络组
CN109426785A (zh) 一种人体目标身份识别方法及装置
CN105956051A (zh) 信息查找的方法、装置及系统
US11347739B2 (en) Performing a chained search function
CN112084812A (zh) 图像处理方法、装置、计算机设备及存储介质
US8897484B1 (en) Image theft detector
WO2021211226A1 (en) Face clustering in video streams
EP3035225B1 (en) Information processing device, authentication system, authentication method, and program
CN111738059A (zh) 一种面向无感场景的人脸识别方法
CN111553327A (zh) 一种服饰识别方法、装置、设备和介质
US20220414393A1 (en) Methods and Systems for Generating Composite Image Descriptors
CN112333182B (zh) 档案处理方法、装置、服务器及存储介质
CN105989063A (zh) 视频检索方法和装置
CN114359957A (zh) 一种人体图像的归类方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant