CN111368115B - 数据聚类方法、装置、聚类服务器及存储介质 - Google Patents

数据聚类方法、装置、聚类服务器及存储介质 Download PDF

Info

Publication number
CN111368115B
CN111368115B CN202010138344.4A CN202010138344A CN111368115B CN 111368115 B CN111368115 B CN 111368115B CN 202010138344 A CN202010138344 A CN 202010138344A CN 111368115 B CN111368115 B CN 111368115B
Authority
CN
China
Prior art keywords
identity
snapshot
record
area
real
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010138344.4A
Other languages
English (en)
Other versions
CN111368115A (zh
Inventor
聂道鑫
梁钦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision System Technology Co Ltd
Original Assignee
Hangzhou Hikvision System Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision System Technology Co Ltd filed Critical Hangzhou Hikvision System Technology Co Ltd
Priority to CN202010138344.4A priority Critical patent/CN111368115B/zh
Publication of CN111368115A publication Critical patent/CN111368115A/zh
Application granted granted Critical
Publication of CN111368115B publication Critical patent/CN111368115B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

本申请提供一种数据聚类方法、装置、聚类服务器及存储介质。该方法包括:获取下级区域的抓拍记录,其中,所述抓拍记录包括抓拍图像和相应的第一身份标识;所述第一身份标识为所述下级区域识别出的所述抓拍图像的身份标识;确定所述第一身份标识是否为实名认证的身份标识;在所述第一身份标识不是实名认证的身份标识时,将所述第一身份标识转换为第二身份标识,并将所述抓拍图像和所述第二身份标识存储到第一数据库中;其中,所述第二身份标识为所述本级区域识别出的所述抓拍图像的身份标识。本申请能够降低人员数据聚类所需的计算量,提高聚类效率。

Description

数据聚类方法、装置、聚类服务器及存储介质
技术领域
本申请涉及数据级联技术领域,具体涉及一种数据聚类方法、装置、聚类服务器及存储介质。
背景技术
人员数据聚类的目的是将同一人员的数据聚类到一起,通过唯一标识将该人员的所有数据关联起来。在安防领域中,抓拍设备分布于不同的区域,某人员在不同区域出现时可能被不同区域的抓拍设备采集到抓拍图像。为便于对抓拍设备及抓拍数据的管理,通常将区域划分为多级区域。例如,区域可以分为省级区域、市级区域,其中,省级区域包含多个市级区域。省级区域是每个市级区域的上级区域,每个市级区域是省级区域的一个下级区域。另外,根据安防需求,还可以进一步进行区域划分,如市级区域还可以进一步划分为多个区级区域,省级区域还可以设置其上级区域等。
一般地,对于抓拍图像的人员数据聚类,通常是每个下级区域对其区域内的抓拍图像进行身份识别,每个下级区域的聚类服务器根据身份识别结果进行人员数据聚类,每个上级区域对其所包含的所有下级区域的抓拍图像进行身份识别,将识别结果提供给每个上级区域的聚类服务器用于人员数据聚类。由于在下级区域实名认证的人员在上级区域中同样为实名认证的人员,因此对于在下级区域身份识别为实名认证的抓拍图像,上级区域的聚类服务器可以直接将该抓拍图像聚类到该实名认证的人员数据中。而对于在下级区域身份识别为非实名认证的抓拍图像,上级区域需要对该抓拍图像进一步进行身份识别,再确定该抓拍图像所需聚类到的人员数据,以实现聚类。
然而,对于在下级区域身份识别为非实名认证的每张抓拍图像,上级区域都要对其进行身份识别才能进行聚类,而身份识别需要将该抓拍图像与上级区域的数据库中的人员数据进行比对,所需计算的数据量大,聚类效率低。
发明内容
本申请实施例提供一种数据聚类方法、装置、聚类服务器及存储介质,以解决人员数据聚类时聚类效率低的问题。
第一方面,本申请实施例提供一种数据聚类方法,应用于本级区域的聚类服务器中,包括:
获取下级区域的抓拍记录,其中,所述抓拍记录包括抓拍图像和相应的第一身份标识,所述第一身份标识为所述下级区域识别出的所述抓拍图像的身份标识;
确定所述第一身份标识是否为实名认证的身份标识;
在所述第一身份标识不是实名认证的身份标识时,将所述第一身份标识转换为第二身份标识,并将所述抓拍图像和所述第二身份标识存储到第一数据库中;其中,所述第二身份标识为所述本级区域识别出的所述抓拍图像的身份标识。
在一种可能的实施方式中,将所述第一身份标识转换为第二身份标识,包括:
若存在所述第一身份标识与其对应的第二身份标识的映射关系,则根据所述映射关系将所述第一身份标识转换为第二身份标识;
若不存在所述第一身份标识与其对应的第二身份标识的映射关系,则获得所述本级区域对所述抓拍图像进行身份识别的身份识别结果,根据所述身份识别结果,确定所述抓拍图像的第二身份标识,建立所述第一身份标识与所述第二身份标识的映射关系,并将所述第一身份标识转换为所述第二身份标识。
在一种可能的实施方式中,所述方法还包括:
确定所述第一身份标识转换为所述第二身份标识的频繁度指标的取值;
在所述频繁度指标的取值符合预设条件时,执行如下至少一个步骤:
将转换前的抓拍记录下发至所述下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域;
对转换后的抓拍记录作标记。
在一种可能的实施方式中,所述抓拍记录中还包括产生所述抓拍记录的下级区域的区域标识,
将转换前的抓拍记录下发至所述下级区域的第二数据库中,包括:
根据转换前的抓拍记录中的区域标识,将所述转换前的抓拍记录下发至所述区域标识对应的下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域,包括:
对转换前的抓拍记录作标记,并下发至所述区域标识对应的下级区域。
在一种可能的实施方式中,所述抓拍记录还包括识别标签,所述识别标签用于表征所述第一身份标识是否为实名认证的身份标识;
确定所述第一身份标识是否为实名认证的身份标识,包括:
根据所述识别标签,确定所述第一身份标识是否为实名认证的身份标识。
第二方面,本申请实施例提供一种数据聚类装置,包括:
获取模块,用于获取下级区域的抓拍记录,其中,所述抓拍记录包括抓拍图像和相应的第一身份标识,所述第一身份标识为所述下级区域识别出的所述抓拍图像的身份标识;
处理模块,用于确定所述第一身份标识是否为实名认证的身份标识;
转换模块,用于在所述第一身份标识不是实名认证的身份标识时,将所述第一身份标识转换为第二身份标识,并将所述抓拍图像和所述第二身份标识存储到第一数据库中;其中,所述第二身份标识为所述本级区域识别出的所述抓拍图像的身份标识。
在一种可能的实施方式中,所述转换模块,具体用于:
若存在所述第一身份标识与其对应的第二身份标识的映射关系,则根据所述映射关系将所述第一身份标识转换为第二身份标识;
若不存在所述第一身份标识与其对应的第二身份标识的映射关系,则获得所述本级区域对所述抓拍图像进行身份识别的身份识别结果,根据所述身份识别结果,确定所述抓拍图像的第二身份标识,建立所述第一身份标识与所述第二身份标识的映射关系,并将所述第一身份标识转换为所述第二身份标识。
在一种可能的实施方式中,所述处理模块,还用于:
确定所述第一身份标识转换为所述第二身份标识的频繁度指标的取值;
在所述频繁度指标的取值符合预设条件时,执行如下至少一个步骤:
将转换前的抓拍记录下发至所述下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域;
对转换后的抓拍记录作标记。
在一种可能的实施方式中,所述抓拍记录中还包括产生所述抓拍记录的下级区域的区域标识,
所述处理模块,具体用于:
根据转换前的抓拍记录中的区域标识,将所述转换前的抓拍记录下发至所述区域标识对应的下级区域的第二数据库中;或者,
对转换前的抓拍记录作标记,并下发至所述区域标识对应的下级区域。
在一种可能的实施方式中,所述抓拍记录还包括识别标签,所述识别标签用于表征所述第一身份标识是否为实名认证的身份标识;
所述处理模块,具体用于:
根据所述识别标签,确定所述第一身份标识是否为实名认证的身份标识。
第三方面,本申请实施例提供一种聚类服务器,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的实施方式所述的数据聚类方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的实施方式所述的数据聚类方法。
本申请实施例提供的数据聚类方法、装置、聚类服务器及存储介质,获取下级区域的抓拍记录,其中,抓拍记录包括抓拍图像和相应的第一身份标识,第一身份标识为下级区域识别出的抓拍图像的身份标识;确定第一身份标识是否为实名认证的身份标识;在第一身份标识不是实名认证的身份标识时,将第一身份标识转换为第二身份标识,并将抓拍图像和第二身份标识存储到第一数据库中;其中,第二身份标识为本级区域识别出的抓拍图像的身份标识。通过在抓拍记录中的第一身份标识不是实名认证的身份标识时,对抓拍记录进行身份标识的转换,将第一身份标识转换为第二身份标识,从而将下级区域的抓拍记录聚类到其上级区域的第一数据库中,能够减少聚类过程中对非实名认证的抓拍数据的身份识别的运算,从而降低人员数据聚类所需的计算量,提高聚类效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请一实施例提供的数据聚类方法的场景示意图;
图2为本申请一实施例提供的数据聚类方法的流程示意图;
图3为本申请又一实施例提供的数据聚类方法的流程示意图;
图4为本申请另一实施例提供的数据聚类方法的流程示意图;
图5为本申请再一实施例提供的数据聚类方法的流程示意图;
图6为本申请一实施例提供的数据聚类装置的结构示意图;
图7为本申请一实施例提供的数据聚类服务器的硬件结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请一实施例提供的数据聚类方法的场景示意图。如图1所示,区域A包括两个下级区域,分别为区域B,C。区域A是区域B,C的上级区域。例如,区域A为某省的区域,区域B,C分别为该省下属的两个市的区域。区域B,C中的聚类服务器分别对其区域内各抓拍设备采集的抓拍图像例如人脸抓拍图像、人体抓拍图像进行聚类,生成抓拍记录保存到各自的抓拍库中。其中,抓拍记录可以分为两类,一类是该区域能够识别出抓拍图像的真实身份的记录,该类抓拍记录中的身份标识为实名认证的标识,如身份证号等,该类抓拍记录所记录的人员为该区域内实名认证的实名库中的人员;另一类是本区域无法识别出抓拍图像的真实身份的记录,该类抓拍记录中的身份标识为本区域按照一定规则生成的非实名认证的标识,该类抓拍记录所记录的人员不是该区域实名库中的人员,属于该区域的陌生人。需要注意的是,对区域内的抓拍图像的预处理、身份识别、聚类等可以由多个服务器实现,也可以集成于单个服务器实现,不作限定。例如,对于一个区域,可以由该区域的建模服务器对抓拍设备采集的抓拍图像进行预处理,比对服务器对抓拍图像进行身份识别,聚类服务器对身份识别后的抓拍图像进行聚类;也可以将建模服务器、比对服务器、聚类服务器的功能都集成于聚类服务器,由聚类服务器实现对区域内的抓拍图像的预处理、身份识别、聚类等。
区域A的聚类服务器需要对区域B,C的抓拍库中的抓拍记录进行聚类,以便对抓拍记录进行管理。由于区域A的实名认证的实名库包含了区域B,C中实名认证的实名库,如省级的实名库包含该省所有实名认证的人员,而市级的实名库包含该市所有实名认证的人员,所以对于区域B,C抓拍库中实名认证的抓拍记录可以直接添加到区域A的抓拍库中。而对于区域B,C抓拍库中非实名认证的抓拍记录,需要区域A的聚类服务器对其进行身份标识的转换,在转换后才能加入到区域A的抓拍库中。需要注意的是,此处仅是以区域A包括两个下级区域B,C为例进行场景说明,并不作为限定,本申请实施例中本级区域可以包括一个或多个下级区域。
相关技术中,本级区域的聚类服务器通过身份识别算法,对下级区域抓拍库中非实名认证的抓拍记录中的抓拍图像进行身份识别获得身份识别结果,或者从比对服务器中接收身份识别结果,然后聚类服务器根据识别结果重新确定每个非实名认证的抓拍记录的身份标识,从而实现聚类。然而,对于在下级区域非实名认证的每张抓拍图像,都要对其进行身份识别才能进行聚类,而身份识别需要将该抓拍图像与上级区域的数据库中的人员数据进行比对,所需计算的数据量大,聚类效率低。
本申请实施例通过在抓拍记录中的第一身份标识不是实名认证的身份标识时,对抓拍记录进行身份标识的转换,将第一身份标识转换为第二身份标识,从而将下级区域的抓拍记录聚类到其上级区域的第一数据库中,能够减少聚类过程中对非实名认证的抓拍数据的身份识别的运算,从而降低人员数据聚类所需的计算量,提高聚类效率。
图2为本申请一实施例提供的数据聚类方法的流程示意图。该方法应用于本级区域的聚类服务器中。如图2所示,该方法包括:
S201、获取下级区域的抓拍记录,其中,抓拍记录包括抓拍图像和相应的第一身份标识,第一身份标识为下级区域识别出的抓拍图像的身份标识。
本实施例中,本级区域包括一个或多个下级区域,本级区域的聚类服务器可以获取下级区域的抓拍记录。一条抓拍记录,可以包括属于同一人员的至少一张抓拍图像和下级区域识别出的该至少一张抓拍图像所属人员的身份标识,为便于描述,在此称为第一身份标识。该第一身份标识为下级区域的聚类服务器根据下级区域的实名库和陌生人库,对抓拍图像进行身份识别,确定出的身份标识。其中,每个下级区域可以对应有各自的实名库和陌生人库。
例如,聚类服务器可以从下级区域的抓拍库中获取抓拍记录。下级区域的抓拍库用于保存该下级区域聚类后的抓拍记录。下级区域的聚类方式在此不作限定。或者,聚类服务器可以从级联抓拍库中获取下级区域的抓拍记录,其中,下级区域的抓拍库中的抓拍记录会上传到级联抓拍库中。
如果该抓拍记录中的抓拍图像在下级区域识别为某实名认证人员,则第一身份标识为该实名认证的人员的标识,如该人员的证件号、由该人员的证件号生成的哈希值等。如果该抓拍记录中的抓拍图像在下级区域识别为非实名认证的人员,则第一身份标识为下级区域为该抓拍图像分配的非实名的标识,用于标识该陌生人,例如可以为通用唯一识别码(Universally Unique Identifier,UUID)等,具体身份标识的设置方式在此不作限定。
S202、确定第一身份标识是否为实名认证的身份标识。
本实施例中,聚类服务器确定第一身份标识是否为实名认证的身份标识的方式可以根据实际情况设置,在此不作限定。例如,可以有以下三种实施方式中的至少一种来实现:
在第一种可能的实施方式中,聚类服务器查找本级区域的实名库中是否存在该第一身份标识;若本级区域的实名库中不存在第一身份标识,则确定第一身份标识不是实名认证的身份标识。其中,本级区域的实名库包括该区域内(包括下属的所有下级区域)所有实名认证的人员数据。实名库中的人员数据的数据结构可以为:
{证件照,身份证号,性别,年龄,库ID,身份证号hash值},其中,身份证号hash值作为该数据结构的主键。
通过在本区域的实名库中查找第一身份标识,可以确定其是否为实名认证。若实名库中存在第一身份标识,则第一身份标识为实名认证;若实名库中不存在第一身份标识,则第一身份标识不是实名认证,是由下级区域所生成的非实名的身份标识。
在第二种可能的实施方式中,识别第一身份标识的命名规则是否与实名认证的身份标识的命名规则一致;若不一致,则确定第一身份标识不是实名认证的身份标识。
本实施例中,实名认证的身份标识的命名规则与下级区域所生成的非实名的身份标识的命名规则不同,可以通过命名规则来判断第一身份标识是不是实名认证的身份标识。例如,实名认证的身份标识为身份证号,其命名规则就是身份证号的命名规则;非实名认证的身份标识是由其他命名规则生成的,与身份证号的位数或者排列不同的字符,如全是由字母构成的字符串。因此,可以通过命名规则确定第一身份标识是否为实名认证的标识。若第一身份标识的命名规则与实名认证的身份标识的命名规则一致,则第一身份标识为实名认证的身份标识;若不一致,则第一身份标识不是实名认证的身份标识。
在第三种可能的实施方式中,抓拍记录还包括识别标签,识别标签用于表征第一身份标识是否为实名认证的身份标识;S202可以包括:
根据识别标签,确定第一身份标识是否为实名认证的身份标识。
在本实施例中,抓拍记录中可以包括识别标签,该识别标签表明第一身份标识是否为实名认证的身份标识。例如,识别标签为M1,表征第一身份标识为实名认证的身份标识;识别标签为M2,表征第一身份标识不是实名认证的身份标识。聚类服务器可以根据抓拍记录中的识别标签,确定第一身份标识是否为实名认证的身份标识。
例如,本级区域的聚类服务器可以实时获取下级区域的抓拍库中的抓拍记录,将下级区域的抓拍数据级联到本级区域的级联抓拍库中,每条抓拍记录都添加一个识别标签。后续需要进行人员数据聚类时,聚类服务器从级联抓拍库中获取抓拍记录,依据其中的识别标签确定是否为实名认证的身份标识。
可选地,S202之后,上述方法还可以包括:
在第一身份标识为实名认证的身份标识时,将人脸抓拍记录存储到第一数据库中。
本实施例中,第一数据库可以为本级区域的实名库。本级区域的实名库中包含所有下属的下级区域的实名库中的所有实名认证的人员数据,所以在第一身份标识为实名认证的身份标识时,可以直接将抓拍记录存储到本级区域的实名库中,以便本级区域通过对实名库的统一管理来管理本级区域和下级区域中身份标识为实名认证的抓拍记录。另外,第一数据库也可以是本级区域为存储从下级区域聚类上来的抓拍记录所单独设置的一个数据库,便于单独对下级区域聚类上来的抓拍记录进行管理。第一数据库还可以为其他数据库,可以根据实际需求确定,在此不作限定。
S203、在第一身份标识不是实名认证的身份标识时,将第一身份标识转换为第二身份标识,并将抓拍图像和第二身份标识存储到第一数据库中;其中,第二身份标识为本级区域识别出的抓拍图像的身份标识。
可选的,在第一身份标识不是实名认证的身份标识时,聚类服务器可以根据映射关系将第一身份标识转换为第二身份标识,并将抓拍图像和第二身份标识存储到第一数据库中。
本申请实施例提供的数据聚类方法、装置、聚类服务器及存储介质,获取下级区域的人脸抓拍记录,其中,抓拍记录包括抓拍图像和相应的第一身份标识,第一身份标识为下级区域识别出的抓拍图像的身份标识;确定第一身份标识是否为实名认证的身份标识;在第一身份标识不是实名认证的身份标识时,将第一身份标识转换为第二身份标识,并将抓拍图像和第二身份标识存储到第一数据库中;其中,第二身份标识为本级区域识别出的抓拍图像的身份标识。通过在抓拍记录中的第一身份标识不是实名认证的身份标识时,对抓拍记录进行身份标识的转换,将第一身份标识转换为第二身份标识,从而将下级区域的抓拍记录聚类到其上级区域的第一数据库中,能够减少聚类过程中对非实名认证的抓拍数据的身份识别的运算,从而降低人员数据聚类所需的计算量,提高聚类效率。
可选地,S203可以包括:
若存在第一身份标识与其对应的第二身份标识的映射关系,则根据映射关系将第一身份标识转换为第二身份标识;
若不存在第一身份标识与其对应的第二身份标识的映射关系,则获取本级区域对抓拍图像进行身份识别的身份识别结果,根据身份识别结果,确定抓拍图像的第二身份标识,建立第一身份标识与第二身份标识的映射关系,并将第一身份标识转换为第二身份标识。
本实施例中,本级区域的聚类服务器中存储有已经建立的第一身份标识和第二身份标识的映射关系,针对当前要处理的抓拍记录的第一身份标识,可以查找是否存在该第一身份标识与其对应的第二身份标识的映射关系,若存在,则根据映射关系将第一身份标识转换为相应的第二身份标识。
例如,已经建立的映射关系可以存储于映射关系记录表中。在第一身份标识不是实名认证的身份标识时,聚类服务器在映射关系记录表中查找是否存在第一身份标识与其对应的第二身份标识的映射关系。若存在,则表征包含第一身份标识的其他抓拍记录已经发生过转换,因此,不需要对当前的抓拍记录中的抓拍图像再次进行身份识别,可以直接按照该映射关系将第一身份标识转换为相应的身份标识,然后将生成的抓拍记录存储到本级区域的第一数据库中。
例如,第一身份标识为555,如果在映射关系记录表中查找到存在555对应的映射关系为{555->111},其中,111即为本级区域的身份标识,则将抓拍记录中的555转换为111,生成新的抓拍记录,保存到本级区域的第一数据库中。
本申请实施例通过在抓拍记录中的第一身份标识不是实名认证的身份标识时,利用第一身份标识对应的映射关系,对抓拍记录进行身份标识的转换,利用映射关系将下级区域的抓拍记录聚类到其上级区域的第一数据库中,能够减少聚类过程中对非实名认证的抓拍数据的身份识别的运算,从而降低人员数据聚类所需的计算量,提高聚类效率。
针对当前要处理的抓拍记录的第一身份标识,可以查找是否存在该第一身份标识与其对应的第二身份标识的映射关系,若不存在,则聚类服务器可以获取本级区域对抓拍图像进行身份识别的身份识别结果,然后根据身份识别结果确定抓拍图像的第二身份标识,建立第一身份标识与第二身份标识的映射关系,并将第一身份标识转换为第二身份标识。
例如,已经建立的映射关系可以存储于映射关系记录表中。若在映射关系记录表中没有查找到第一身份标识对应的映射关系,则表示在当前的抓拍记录之前,没有包含第一身份标识的抓拍记录发生过转换,因此映射关系记录表中不存在第一身份标识对应的映射关系。此时,本级区域可以对抓拍记录中的抓拍图像进行身份识别,确定该抓拍图像在本级区域中的第二身份标识。以便后续将抓拍记录中的第一身份标识转换为第二身份标识,实现对该抓拍图像的聚类。在确定第二身份标识后,一方面将创建第一身份标识和第二身份标识的映射关系,并将该映射关系添加到映射关系数据表中,以便之后对包含第一身份标识的抓拍记录直接按照该映射关系进行身份标识的转换,避免对抓拍图像的身份识别过程。另一方面将当前处理的抓拍记录中的第一身份标识转换为第二身份标识,将转换后的抓拍记录存储到第一数据库中。
其中,聚类服务器获取本级区域对抓拍图像进行身份识别的身份识别结果,可以是聚类服务器自身执行身份识别算法对抓拍图像进行身份识别从而得到身份识别结果,也可以是聚类服务器获得本级区域的比对服务器对抓拍图像进行身份识别的身份识别结果,在此不作限定。例如,聚类服务器可以将要识别的抓拍图像发送给比对服务器,由比对服务器对抓拍图像进行身份识别,然后接收比对服务器返回的身份识别结果。
本实施例在映射关系记录表中没有查找到第一身份标识对应的映射关系时,通过对抓拍图像进行身份识别,确定抓拍图像的第二身份标识,然后在映射关系记录中创建第一身份标识和第二身份标识的映射关系,能够通过创建的映射关系对之后包含第一身份标识的抓拍记录直接进行标识转换,避免每次对抓拍图像的身份识别过程,提高聚类效率。
可选地,在不存在第一身份标识与其对应的第二身份标识的映射关系时,本级区域对抓拍图像进行身份识别,聚类服务器根据身份识别结果,确定该抓拍图像的第二身份标识,具体识别过程可以包括:
根据本级区域的本级实名库和本级陌生人库,对抓拍图像进行身份识别,其中,本级实名库中包含本级区域内实名认证的第一人员数据,每条第一人员数据包括一个实名认证的身份标识和相应的用于比对的底库图像,本级陌生人库包含本级区域内没有实名认证的第二人员数据,每条第二人员数据包括一个非实名的身份标识和相应的抓拍图像。
若该抓拍图像与本级实名库中的某个第一人员数据的底库图像匹配,则将该第一人员数据的实名认证的身份标识作为该抓拍图像的第二身份标识;
若该抓拍图像与本级陌生人库中的某个第二人员数据的图像匹配,则将该第二人员数据的身份标识作为该抓拍图像的第二身份标识;
若该抓拍图像与本级实名库、本级陌生人库中的图像均不匹配,则生成新的非实名的身份标识,将该新的非实名的身份标识作为该抓拍图像的第二身份标识,将该新的非实名认证的身份标识和抓拍图像,生成新的第二人员数据,并将新的第二人员数据添加到本级陌生人库。
可选地,上述方法还包括:
删除映射关系记录表中超过预设时长没有被调用的映射关系。
本实施例中,超过预设时长没有被调用的映射关系,表示通过该映射关系进行身份标识转换的抓拍记录较少,此时可以从映射关系记录表中删除该映射关系,从而防止使用频率低的映射关系占用映射关系记录表的资源。例如,将映射关系记录表中超过1个月没有被调用的映射关系删除。此外,当某下级区域不再隶属于本级区域,或者超过一定时长都没对某下级区域进行聚类,则将该下级区域的所有身份标识进行删除。例如,区域关系发生变更,某下级区域不再将抓拍数据向本级区域进行人员数据聚类。
可选地,S203之后,上述方法还可以包括:
向终端发送提示消息,以使终端显示该提示信息,该提示消息用于指示第一数据库中新增一条通过映射关系进行转换得到的抓拍记录。
本实施例中,如果发生一次通过映射关系进行转换的抓拍记录,则聚类服务器向终端发送提示消息,以便终端在显示屏上进行显示,向用户提示第一数据库中新增一条通过映射关系进行转换得到的抓拍记录,以便于用户对第一数据库或者映射关系进行管理。
图3为本申请又一实施例提供的数据聚类方法的流程示意图。本实施例中在对下级区域的人员数据进行聚类时,还利用聚类过程中的身份识别结果对本级区域的本级陌生人库中的人员数据进行去重处理。如图3所示,该方法包括:
S301、获取下级区域的抓拍记录,其中,抓拍记录包括抓拍图像和相应的第一身份标识,第一身份标识为下级区域识别出的所述抓拍图像的身份标识。
本实施例中,S301与图2实施例中的S201类似,此处不再赘述。
S302、确定第一身份标识是否为实名认证的身份标识。
本实施例中,S302与图2实施例中的S202类似,此处不再赘述。
S303、在第一身份标识不是实名认证的身份标识时,若存在第一身份标识与其对应的第二身份标识的映射关系,则根据映射关系将第一身份标识转换为第二身份标识。
可选地,S303之后,还可以包括:
步骤一、获取第一身份标识对应的映射关系的识别记录,其中,一个映射关系的识别记录中记录了至少一个预设人脸角度以及相应的标签,标签表征是否有该映射关系对应人员的该预设人脸角度的抓拍图像已经进行身份识别。
步骤二、识别当前处理的抓拍记录中的抓拍图像的人脸角度,在该抓拍图像的人脸角度为该识别记录中表征未进行身份识别的标签所对应的预设人脸角度时,则根据本级区域的本级陌生人库,对该抓拍图像进行身份识别;
步骤三、根据识别结果判断本级区域的本级陌生人库中是否存在至少两个人员数据中的人脸图像均与该抓拍图像匹配;在本级区域的本级陌生人库中存在至少两个人员数据中的人脸图像均与该抓拍图像匹配时,将该至少两个人员数据进行合并。
本实施例中,每个映射关系都对应有一个识别记录,识别记录用于记录该映射关系对应的人员的哪些人脸角度的抓拍图像已经进行身份识别,哪些人脸角度的抓拍图像还没有进行身份识别。例如,识别记录可以包括多个预设人脸角度以及相应的标签,标签用于表征该预设人脸角度的抓拍图像是否被身份识别过。标签可以有两种含义:已识别和未识别。聚类服务器可以在创建一个映射关系时为其生成一个相应的识别记录,所创建的识别记录中各标签均为“未识别”,之后每次执行上述步骤三后,根据所处理的抓拍图像的人脸角度对该识别记录进行更新。例如,当前执行步骤三所处理的抓拍图像中的人脸角度为正脸,则将该抓拍图像对应的映射关系的识别记录中的正脸所对应的标签,由“未识别”更新为“已识别”。聚类服务器可以通过查询一个映射关系的识别记录,来判断是否对当前依据该映射关系发生转换的抓拍图像进行身份识别,从而控制是否依据该抓拍图像进行陌生人库的去重处理,使得仅利用同一人员每种人脸角度的一张抓拍图像进行去重,提高去重效率。
可选地,预设人脸角度包括以下中的至少一种:抬头、低头、左侧脸、右侧脸、正脸。以预设人脸角度包括以上五种角度为例,识别记录可以表示为{7天,{抬头->未识别},{低头->未识别},{左侧脸->已识别},{右侧脸->已识别},{正脸->已识别}},其中,“->”表示对应关系,在“->”之前的“抬头”、“低头”等表示一个预设人脸角度,在“->”之后的“未识别”、“已识别”表示一个预设人脸角度相应的标签。在本示例中,识别记录还包括一个预设的识别周期,其中,7天是用户设置的识别周期,还可以设为其他值,在此不作限定。每当超过该识别周期时,聚类服务器对识别记录进行一次重置,将识别记录中各预设人脸角度对应的标签均重置为“未识别”。通过识别周期的设置使用户可以根据需求灵活调整对陌生人库进行去重处理的频次。识别周期设置的越长,则对陌生人库进行去重处理的频次越低。
上述示例表示,在7天内,依据该映射关系进行身份标识转换的抓拍图像中有左侧脸、右侧脸、正脸三个人脸角度的抓拍图像进行了身份识别,有抬头、低头两个角度的抓拍图像未进行身份识别。如果当前要处理的包含第一身份标识的识别记录中,抓拍图像的人脸角度是左侧脸、右侧脸、正脸中的一个,则不对该抓拍图像进行身份识别,不利用该抓拍图像对本级陌生人库中的同一人员的重复数据进行去重。如果当前要处理的包含第一身份标识的识别记录中,抓拍图像的人脸角度是抬头、低头中的一个,则通过本级陌生人库的人员数据对该人脸识别记录中的抓拍图像进行身份识别,从而利用该抓拍图像来对本级陌生人库中的同一人员的重复数据进行去重。
通过设置识别记录中的预设人脸角度和识别周期,能够防止过多的身份识别运算,一段时间内仅对一个人员的不同人脸角度分别进行一次的识别和去重处理,能够保证不会对同一人员的同一人脸角度的抓拍图像进行多次的身份识别,从而不仅能实现对本级区域的陌生人库的去重处理,还能保证聚类的效率。
S304、在第一身份标识不是实名认证的身份标识时,若不存在第一身份标识与其对应的第二身份标识的映射关系,则获取本级区域对抓拍图像进行身份识别的身份识别结果,根据身份识别结果,确定抓拍图像的第二身份标识,建立第一身份标识与第二身份标识的映射关系,并将第一身份标识转换为第二身份标识。
本实施例中,S304与图2实施例中的S203类似,此处不再赘述。
S305、在本级区域的本级陌生人库中存在至少两个人员数据中的人脸图像均与抓拍图像匹配时,将至少两个人员数据进行合并。
本实施例中,在映射关系记录表中没有查找到第一身份标识对应的映射关系,根据本级区域的本级实名库和本级陌生人库,对抓拍图像进行身份识别后,一方面确定出该抓拍图像的第二身份标识,另一方面利用对抓拍图像的身份识别过程,对本级陌生人库中的数据进行去重,将与该抓拍图像匹配的至少两张图像的人员数据进行合并。
当存在多个下级区域时,上级区域存储的映射关系中存在下级区域的身份标识不同,但是实际上属于同一个人员的情况,例如陌生人X既在区域B出现,又在区域C出现,则区域B对抓拍到X的图像分配的身份标识为B1,区域C对抓拍到X的图像分配的身份标识为C1。此外还有其他的情况导致上级区域的陌生人库中的两个或多个人员数据为同一人。其本质是同一个在不同的抓拍设备中抓拍角度、质量、形状都不完全相同,会导致在上级区域的陌生人库生成多个陌生人数据,并且在聚类过程中依据映射关系中进行映射,导致上级区域的陌生人库中的两个陌生人数据无法合并。
本实施例在聚类过程中可以将陌生人库中重复的人员数据进行去重,相对于单独为去重而进行的身份识别,将去重过程结合到聚类过程中,能够提高处理效率。
图4为本申请另一实施例提供的数据聚类方法的流程示意图。本实施例中在对人脸抓拍记录进行转换后,通过频繁度指标确定在下级区域频繁出现的人员,并将其相应的抓拍记录进行标记或下发到对应的下级区域。如图4所示,上述方法还可以包括:
S401、确定第一身份标识转换为第二身份标识的频繁度指标的取值;
S402、在频繁度指标的取值符合预设条件时,执行如下至少一个步骤:
将转换前的抓拍记录下发至下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域;
对转换后的抓拍记录作标记。
本实施例中,在一种可能的实现方式中,聚类服务器可以确定第一身份标识转换为第二身份标识的频繁度指标的取值,如果频繁度指标的取值符合预设条件,则将转换前的抓拍记录下发至下级区域的第二数据库中,第二数据库用于存储频繁度指标的取值符合预设条件的抓拍记录,便于后续在下级区域中按需查询。在一种可能的实现方式中,聚类服务器可以确定第一身份标识转换为第二身份标识的频繁度指标的取值,如果频繁度指标的取值符合预设条件,则对转换前的抓拍记录作标记,并将该标记下发至下级区域,以便下级区域后续通过标记进行查询与管理。在一种可能的实现方式中,聚类服务器可以确定第一身份标识转换为第二身份标识的频繁度指标的取值,如果频繁度指标的取值符合预设条件,则对转换后的抓拍记录作标记,便于后续在本级区域中通过标记按需查询。
其中,频繁度指标可以包括但不限于以下的至少一种:连续发生转换的天数、每天发生转换的次数、预设时段内发生转换的总天数、预设时段内平均每天发生转换的次数等。
其中,在此不对预设条件作限定,用户可以根据需求设定具体的预设条件。例如,预设条件包括以下中的至少一个:
连续第一预设天数均发生转换;
连续第二预设天数均发生转换,且每天发生的转换次数均超过第一预设次数;
第一预设时段内发生转换的总天数超过第三预设天数;
第二预设时段内发生转换的总次数超过第二预设次数;
第三预设时段内平均每天发生转换的次数超过第三预设次数。
其中,第一预设天数、第二预设天数、第三预设天数、第一预设次数、第二预设次数、第三预设次数、第一预设时段、第二预设时段、第三预设时段的具体取值,用户可以根据实际需求设定,在此不做限定。例如,预设条件可以包括以下中至少一个:连续7天均发生转换;连续3天均发生转换,且每天发生的转换次数均超过5次;在30天内发生转换的总天数超过15天;在15天内发生转换的总次数超过30次;在60天内平均每天发生转换的次数超过2次。
本实施例中,对于一个映射关系,聚类服务器中可以记录依据该映射关系每次发生转换的时刻。聚类服务器可以根据该映射关系的每次发生转换的时刻,确定该映射关系所对应的第一身份标识转换为第二身份标识的频繁度指标的取值,然后判断该频繁度指标的取值是否符合预设条件。
例如,记录依据上级区域中的映射关系{B,555->111}在聚类过程中转换的每次发生转换的时刻,确定频繁度指标的取值,如果频繁度指标的取值符合预设条件:在30天内每天发生转换的次数超过2次,则给上级区域中的人员111打上一个表征“下级区域B中频繁出现的人员”的标记。并且将转换前身份标识555的抓拍记录通过数据级联系统,下发到下级区域B中的存储频繁出现人员的数据库中。
本实施例通过预设条件和频繁度指标,可以识别出下级区域频繁出现的人员,然后对频繁出现的人员的身份标识进行标记,和/或将其抓拍记录下发到下级区域用于存储频繁出现人员的第二数据库中,能够利用频繁度指标识别出频繁出现的人员,以便于对频繁出现人员的抓拍记录的查询和管理。
可选地,抓拍记录中还包括产生抓拍记录的下级区域的区域标识,上述的将转换前的抓拍记录下发至下级区域的第二数据库中,可以包括:
根据转换前的抓拍记录中的区域标识,将转换前的抓拍记录下发至区域标识对应的下级区域的第二数据库中。
上述的对转换前的抓拍记录作标记,并下发至下级区域,可以包括:
对转换前的抓拍记录作标记,并下发至区域标识对应的下级区域。
本实施例中,抓拍记录中带有产生抓拍记录的下级区域的区域标识,通过下级区域的区域标识表征该抓拍记录来自于哪个下级区域,并且下级区域的区域标识还可以用于本级区域在需要向下级区域下发转换前的抓拍记录或下发对转换前的抓拍记录所作的标记时,确定对应的下级区域。例如,某抓拍记录中带有的区域标识为B,则本级区域的聚类服务器在确定频繁度指标的取值符合预设条件时,可以根据该抓拍记录的区域标识B,确定该抓拍记录来自于下级区域B,将转换前的抓拍记录下发至下级区域B的第二数据库中,或将对转换前的抓拍记录所作的标记下发至下级区域B。
图5为本申请再一实施例提供的数据聚类方法的流程示意图。本实施例中在对抓拍记录进行转换后,还将转换后的身份标识所对应的人员数据下发至下级区域,以便于下级区域对抓拍记录的管理。如图5所示,该方法包括:
S501、获取下级区域的抓拍记录,其中,抓拍记录包括抓拍图像和相应的第一身份标识,第一身份标识为下级区域识别出的抓拍图像的身份标识。
本实施例中,S501与图2实施例中的S201类似,此处不再赘述。
S502、确定第一身份标识是否为实名认证的身份标识。
本实施例中,S502与图2实施例中的S202类似,此处不再赘述。
S503、在第一身份标识不是实名认证的身份标识时,将第一身份标识转换为第二身份标识,并将抓拍图像和第二身份标识存储到第一数据库中;其中,第二身份标识为本级区域识别出的抓拍图像的身份标识。
本实施例中,S503与图2实施例中的S203类似,此处不再赘述。
S504、将转换后的抓拍记录中的身份标识所对应的人员数据下发至下级区域的第三数据库中。
例如,映射关系为{555->111},则将上级区域中111所对应的人员数据下发至下级区域的第三数据库中,以便下级区域能够确定该抓拍数据在上级区域的身份标识,从而对该抓拍数据进行相关的管理。例如,下级区域C中实名认证的某人在下级区域B中出现,被下级区域B抓拍得到抓拍记录,则该抓拍记录在下级区域B中为非实名的身份标识,但在本级区域A中为实名认证的身份标识(即下级区域C的实名认证的身份标识),此时本级区域A可以将该人的人员数据发送到下级区域B,以便下级区域B标记该人的真实标识,或者以使下级区域B将该人对应的抓拍记录发送到下级区域C,以便下级区域C对该人的人员数据进行全面管理。
可选地,S504可以包括:
获取第一身份标识对应的映射关系的转换记录,一个映射关系的转换记录用于记录按照该映射关系每次进行转换的时刻;
在第一身份标识对应的映射关系的转换记录符合指定条件时,将转换后的抓拍记录中的身份标识所对应的人员数据下发至第三数据库中。
本实施例中,每个映射关系对应于一个转换记录,转换记录用于记录聚类服务器每次通过该映射关系进行抓拍记录的身份标识转换的时刻。例如,转换记录中记录了第一次转换发生于2月3日12点,第二次转换发生于2月4日9点等。转换记录中的时刻可以精度到天、小时、分钟等,在此不作限定。在判断转换记录符合指定条件时,则将该转换记录对应的人员数据下发至下级区域的第三数据库中。其中,指定条件为用于判断是否频繁发生转换的条件,具体的条件可以由可以根据实际需求进行设定,在此不做限定。第三数据库用于存储该区域内非实名但常出现的人员,其中,指定条件和转换记录用于筛选出该区域内非实名但常出现的人员。
可选地,指定条件包括以下中的至少一个:
连续第四预设天数均发生转换;
连续第五预设天数均发生转换,且每天发生的转换次数均超过第四预设次数;
第四预设时段内发生转换的总天数超过第六预设天数;
第五预设时段内发生转换的总次数超过第五预设次数;
第六预设时段内平均每天发生转换的次数超过第六预设次数。
其中,第四预设天数、第五预设天数、第六预设天数、第四预设次数、第五预设次数、第六预设次数、第四预设时段、第五预设时段、第六预设时段的具体取值,用户可以根据实际需求设定,在此不做限定。例如,指定条件可以包括以下中至少一个:连续7天均发生转换;连续3天均发生转换,且每天发生的转换次数均超过5次;在30天内发生转换的总天数超过15天;在15天内发生转换的总次数超过30次;在60天内平均每天发生转换的次数超过2次。
由于通过映射关系进行转换的都是下级区域非实名的人员,如果该人员又频繁在该下级区域出现,则可以确定为该人员为该下级区域内非实名但常出现的人员,可以将转换后的该人员的人员数据下发到该下级区域的第三数据库中进行保存,以便对该类人员进行管理。
例如,记录上级区域中的映射关系{B,555->111}在聚类过程中被转换的时刻,如果下级区域的身份标识555在上级区域的映射关系中的转换记录符合指定条件:在30天内每天发生转换的次数超过2次,则给上级区域中的人员111打上一个表征“下级区域B中频繁出现的人员”的标记。同时将转换后的该人员数据通过数据级联系统,下发到下级区域B中的存储非实名且频繁出现人员的数据库中。
本申请实施例在多级区域的人员数据聚类场景中,不同的下级区域的聚类系统对于数据处理的逻辑与方式可以不相同,本申请实施例中不限制下级区域的聚类方式,只需要遵循指定的数据协议即可,从而使下级区域中的抓拍记录在上级不需要重复进行身份识别,极大的减少了身份识别的处理数量。由于上级区域会通过设置预设的规则计算上级区域抓拍记录与下级区域抓拍记录的关系,当设计的规则比较合理时,可以将人员数据添加各种标记,同时下发到指定的下级区域中。这样通过本方案上下级区域的设计,可以实现人员数据的自动管理,如下级区域中原本为陌生人的数据实名化等。
图6为本申请一实施例提供的数据聚类装置的结构示意图。如图6所示,该数据聚类装置60包括:获取模块601、处理模块602、转换模块603。
获取模块601,用于获取下级区域的抓拍记录,其中,抓拍记录包括抓拍图像和相应的第一身份标识,第一身份标识为下级区域识别出的抓拍图像的身份标识。
处理模块602,用于确定第一身份标识是否为实名认证的身份标识。转换模块603,用于在第一身份标识不是实名认证的身份标识时,将第一身份标识转换为第二身份标识,并将抓拍图像和第二身份标识存储到第一数据库中;其中,第二身份标识为本级区域识别出的抓拍图像的身份标识。
可选地,转换模块603,具体用于:
若存在第一身份标识与其对应的第二身份标识的映射关系,则根据映射关系将第一身份标识转换为第二身份标识;
若不存在第一身份标识与其对应的第二身份标识的映射关系,则获得本级区域对抓拍图像进行身份识别的身份识别结果,根据身份识别结果,确定抓拍图像的第二身份标识,建立第一身份标识与第二身份标识的映射关系,并将第一身份标识转换为第二身份标识。
可选地,处理模块602,还用于:
确定第一身份标识转换为第二身份标识的频繁度指标的取值;
在频繁度指标的取值符合预设条件时,执行如下至少一个步骤:
将转换前的抓拍记录下发至下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至下级区域;
对转换后的抓拍记录作标记。
可选地,抓拍记录中还包括产生抓拍记录的下级区域的区域标识,
处理模块602,具体用于:
根据转换前的抓拍记录中的区域标识,将转换前的抓拍记录下发至区域标识对应的下级区域的第二数据库中;或者,
对转换前的抓拍记录作标记,并下发至区域标识对应的下级区域。
可选地,抓拍记录还包括识别标签,识别标签用于表征第一身份标识是否为实名认证的身份标识;
处理模块602,具体用于:
根据识别标签,确定第一身份标识是否为实名认证的身份标识。
本申请实施例提供的数据聚类装置,可用于执行上述的方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
图7为本申请一实施例提供的聚类服务器的硬件结构示意图。如图7所示,本实施例提供的聚类服务器70包括:至少一个处理器701和存储器702。该聚类服务器70还包括通信部件703。其中,处理器701、存储器702以及通信部件703通过总线704连接。
在具体实现过程中,至少一个处理器701执行存储器702存储的计算机执行指令,使得至少一个处理器701执行如上的数据聚类方法。
处理器701的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
在上述的图7所示的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application SpecificIntegrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合申请所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器。
总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准体系结构(Extended Industry Standard Architecture,EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
本申请还提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机执行指令,当处理器执行该计算机执行指令时,实现如上的数据聚类方法。
上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。
一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific IntegratedCircuits,简称:ASIC)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims (8)

1.一种数据聚类方法,其特征在于,应用于本级区域的聚类服务器中,包括:
获取下级区域的抓拍记录,其中,所述抓拍记录包括抓拍图像和相应的第一身份标识,所述第一身份标识为所述下级区域识别出的所述抓拍图像的身份标识;
确定所述第一身份标识是否为实名认证的身份标识;
在所述第一身份标识不是实名认证的身份标识时,将所述第一身份标识转换为第二身份标识,并将所述抓拍图像和所述第二身份标识存储到第一数据库中;其中,所述第二身份标识为所述本级区域识别出的所述抓拍图像的身份标识;
将所述第一身份标识转换为第二身份标识,包括:
若存在所述第一身份标识与其对应的第二身份标识的映射关系,则根据所述映射关系将所述第一身份标识转换为第二身份标识;
若不存在所述第一身份标识与其对应的第二身份标识的映射关系,则获得所述本级区域对所述抓拍图像进行身份识别的身份识别结果,根据所述身份识别结果,确定所述抓拍图像的第二身份标识,建立所述第一身份标识与所述第二身份标识的映射关系,并将所述第一身份标识转换为所述第二身份标识。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述第一身份标识转换为所述第二身份标识的频繁度指标的取值;
在所述频繁度指标的取值符合预设条件时,执行如下至少一个步骤:
将转换前的抓拍记录下发至所述下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域;
对转换后的抓拍记录作标记。
3.根据权利要求2所述的方法,其特征在于,所述抓拍记录中还包括产生所述抓拍记录的下级区域的区域标识;
将转换前的抓拍记录下发至所述下级区域的第二数据库中,包括:
根据转换前的抓拍记录中的区域标识,将所述转换前的抓拍记录下发至所述区域标识对应的下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域,包括:
对转换前的抓拍记录作标记,并下发至所述区域标识对应的下级区域。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述抓拍记录还包括识别标签,所述识别标签用于表征所述第一身份标识是否为实名认证的身份标识;
确定所述第一身份标识是否为实名认证的身份标识,包括:
根据所述识别标签,确定所述第一身份标识是否为实名认证的身份标识。
5.一种数据聚类装置,其特征在于,应用于本级区域的聚类服务器中,包括:
获取模块,用于获取下级区域的抓拍记录,其中,所述抓拍记录包括抓拍图像和相应的第一身份标识,所述第一身份标识为所述下级区域识别出的所述抓拍图像的身份标识;
处理模块,用于确定所述第一身份标识是否为实名认证的身份标识;
转换模块,用于在所述第一身份标识不是实名认证的身份标识时,将所述第一身份标识转换为第二身份标识,并将所述抓拍图像和所述第二身份标识存储到第一数据库中;其中,所述第二身份标识为所述本级区域识别出的所述抓拍图像的身份标识;
所述转换模块,具体用于:
若存在所述第一身份标识与其对应的第二身份标识的映射关系,则根据所述映射关系将所述第一身份标识转换为第二身份标识;
若不存在所述第一身份标识与其对应的第二身份标识的映射关系,则获得所述本级区域对所述抓拍图像进行身份识别的身份识别结果,根据所述身份识别结果,确定所述抓拍图像的第二身份标识,建立所述第一身份标识与所述第二身份标识的映射关系,并将所述第一身份标识转换为所述第二身份标识。
6.根据权利要求5所述的装置,其特征在于,所述处理模块,还用于:
确定所述第一身份标识转换为所述第二身份标识的频繁度指标的取值;
在所述频繁度指标的取值符合预设条件时,执行如下至少一个步骤:
将转换前的抓拍记录下发至所述下级区域的第二数据库中;
对转换前的抓拍记录作标记,并下发至所述下级区域;
对转换后的抓拍记录作标记。
7.一种聚类服务器,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机执行指令;
所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如权利要求1-4任一项所述的数据聚类方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如权利要求1-4任一项所述的数据聚类方法。
CN202010138344.4A 2020-03-03 2020-03-03 数据聚类方法、装置、聚类服务器及存储介质 Active CN111368115B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010138344.4A CN111368115B (zh) 2020-03-03 2020-03-03 数据聚类方法、装置、聚类服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010138344.4A CN111368115B (zh) 2020-03-03 2020-03-03 数据聚类方法、装置、聚类服务器及存储介质

Publications (2)

Publication Number Publication Date
CN111368115A CN111368115A (zh) 2020-07-03
CN111368115B true CN111368115B (zh) 2023-09-29

Family

ID=71206648

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010138344.4A Active CN111368115B (zh) 2020-03-03 2020-03-03 数据聚类方法、装置、聚类服务器及存储介质

Country Status (1)

Country Link
CN (1) CN111368115B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112333182B (zh) * 2020-10-30 2023-04-07 深圳市商汤科技有限公司 档案处理方法、装置、服务器及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719223A (zh) * 2009-12-29 2010-06-02 西北工业大学 静态图像中陌生人面部表情的识别方法
CN108200110A (zh) * 2016-12-08 2018-06-22 杭州海康威视系统技术有限公司 一种数据处理方法、装置及系统
CN109858365A (zh) * 2018-12-28 2019-06-07 深圳云天励飞技术有限公司 一种特殊人群聚集行为分析方法、装置及电子设备
CN109919583A (zh) * 2019-03-20 2019-06-21 苏州科达科技股份有限公司 抓拍数据统计方法、装置及存储介质
CN109948318A (zh) * 2019-03-07 2019-06-28 阿里巴巴集团控股有限公司 一种用户认证方法、装置及设备
WO2019134246A1 (zh) * 2018-01-03 2019-07-11 平安科技(深圳)有限公司 基于人脸识别的安全监控方法、装置及存储介质
CN110414294A (zh) * 2018-04-26 2019-11-05 北京京东尚科信息技术有限公司 行人重识别方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101719223A (zh) * 2009-12-29 2010-06-02 西北工业大学 静态图像中陌生人面部表情的识别方法
CN108200110A (zh) * 2016-12-08 2018-06-22 杭州海康威视系统技术有限公司 一种数据处理方法、装置及系统
WO2019134246A1 (zh) * 2018-01-03 2019-07-11 平安科技(深圳)有限公司 基于人脸识别的安全监控方法、装置及存储介质
CN110414294A (zh) * 2018-04-26 2019-11-05 北京京东尚科信息技术有限公司 行人重识别方法和装置
CN109858365A (zh) * 2018-12-28 2019-06-07 深圳云天励飞技术有限公司 一种特殊人群聚集行为分析方法、装置及电子设备
CN109948318A (zh) * 2019-03-07 2019-06-28 阿里巴巴集团控股有限公司 一种用户认证方法、装置及设备
CN109919583A (zh) * 2019-03-20 2019-06-21 苏州科达科技股份有限公司 抓拍数据统计方法、装置及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵毅 ; .一一对应人脸自动识别身份验证的方法与应用.计算机与现代化.2010,(第07期),全文. *

Also Published As

Publication number Publication date
CN111368115A (zh) 2020-07-03

Similar Documents

Publication Publication Date Title
WO2022095351A1 (zh) 目标区域划分方法、装置、电子设备及存储介质
WO2015151155A1 (ja) 安否確認システム及び秘匿化データの類似検索方法
US7809747B2 (en) Fuzzy database matching
CN111563098A (zh) 结构化与非结构化数据查询方法、设备、存储介质及装置
CN111368115B (zh) 数据聚类方法、装置、聚类服务器及存储介质
CN113901037A (zh) 数据管理方法、装置及存储介质
CN116319815B (zh) 引入SaaS特征的云数据放置策略管理系统
CN109271564B (zh) 保单查询方法及设备
CN112417195A (zh) 基于移动端的商标查询系统、方法及存储介质
CN111796931A (zh) 信息处理方法、装置、计算设备和介质
CN115185939B (zh) 多源数据的数据处理方法
CN112579539B (zh) 企业集群大数据的管理方法及系统
CN108170838B (zh) 话题演变的可视化展现方法、应用服务器及计算机可读存储介质
CN112183161A (zh) 人脸数据库的处理方法、装置及设备
CN113283677B (zh) 指标数据处理方法、装置、设备及存储介质
CN114373209A (zh) 基于视频的人脸识别方法、装置、电子设备及存储介质
CN111241103B (zh) 数据存储方法、数据查询方法及相关装置
CN112528100A (zh) 一种标签策略推荐和打标方法、终端设备及存储介质
CN111680483A (zh) 单证模板更新方法、装置、电子设备及介质
CN111597453A (zh) 用户画像方法、装置、计算机设备及计算机可读存储介质
CN113032610B (zh) 档案管理方法、装置、设备及计算机可读存储介质
CN115037799B (zh) 限流方法、装置、设备及介质
CN113139167B (zh) 用于自助领证机的居民身份证领取方法、系统及存储介质
CN113127572B (zh) 档案合并方法、装置、设备及计算机可读存储介质
CN116992070A (zh) 目标聚档方法、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant