CN115019360A - 匹配方法、装置、非易失性存储介质及计算机设备 - Google Patents

匹配方法、装置、非易失性存储介质及计算机设备 Download PDF

Info

Publication number
CN115019360A
CN115019360A CN202210468889.0A CN202210468889A CN115019360A CN 115019360 A CN115019360 A CN 115019360A CN 202210468889 A CN202210468889 A CN 202210468889A CN 115019360 A CN115019360 A CN 115019360A
Authority
CN
China
Prior art keywords
feature
cluster
determining
similarity
feature similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210468889.0A
Other languages
English (en)
Inventor
盛校粼
李凡平
石柱国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ISSA Technology Co Ltd
Original Assignee
ISSA Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ISSA Technology Co Ltd filed Critical ISSA Technology Co Ltd
Priority to CN202210468889.0A priority Critical patent/CN115019360A/zh
Publication of CN115019360A publication Critical patent/CN115019360A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种匹配方法、装置、非易失性存储介质及计算机设备。其中,该方法包括:获取多个第一聚类集合,其中,第一聚类集合包括多张第一图像,每张第一图像对应一组标注信息;根据标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到第一聚类子集合对应的第一特征向量;确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,并根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合。本发明解决了聚类后的图片组与人的身份信息关联不准确的技术问题。

Description

匹配方法、装置、非易失性存储介质及计算机设备
技术领域
本发明涉及大数据领域,具体而言,涉及一种匹配方法、装置、非易失性存储介质及计算机设备。
背景技术
聚类指的是将给定对象的集合划分为不同子集的过程,目标是使得子集内部的元素尽量相似,不同子集间的元素尽量不相似。这些子集又被称为簇(cluster)。由上述概念可知人脸聚类即是在给定的人脸图片中使不同的人的人脸图片划分为不同子集的过程,聚类组内为同一人,不同聚类组为不同人。而实名关联是将人脸聚类产生的聚类组与人员身份信息关联的技术。现有实名关联技术一般采用单一关联逻辑与阈值进行聚类组与身份信息的关联,一般处理流程为:(1)选择某一人员身份信息,例如人员证件照特征(通过人脸识别技术提取的人脸特征),证件照号码等;(2)该人员身份信息与聚类产生的所有人脸聚类组的中心点循环进行相似度比较,聚类组中心点为该聚类组所有人脸特征的平均值,相似度计算方式为余弦相似度;(3)若某一人员身份信息与某聚类组中心点的相似度超过一定阈值,则判定该聚类组与该人员身份信息为实名关联的一对组合,该聚类组的相关身份信息即可确认,若没有中心点与之相似度超过阈值,则跳转至步骤(1)选择下一个人员身份信息进行上述计算,直至所有人员身份信息计算完毕。
然而,上述匹配该过程所需计算资源较多,算法效率低下,无法应用于海量人脸数据,并且容易造成关联率低(应被关联的聚类组没有关联到实名信息),关联错误率高(聚类组关联到错误的实名信息)的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种匹配方法、装置、非易失性存储介质及计算机设备,以至少解决聚类后的图片组与人的身份信息关联不准确的技术问题。
根据本发明实施例的一个方面,提供了一种匹配方法,包括:获取多个第一聚类集合,其中,所述第一聚类集合包括多张第一图像,每张所述第一图像对应一组标注信息;根据所述标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到所述第一聚类子集合对应的第一特征向量;确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,并根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合。
可选地,所述根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合,包括:基于所述第一特征相似度,确定所述第二特征向量分别与所述多个第一聚类集合之间的第二特征相似度;确定所述第二特征相似度中的最大值对应的第一聚类集合为所述目标聚类集合。
可选地,所述基于所述第一特征相似度,确定所述第二特征向量分别与所述多个第一聚类集合之间的第二特征相似度,包括:根据所述第一特征相似度与所述第二特征向量的对应关系,确定所述第一特征相似度与所述第一聚类集合之间的对应关系;依据所述第一特征相似度与所述第一聚类集合之间的对应关系,确定所述第一聚类集合对应的所述第二特征相似度。
可选地,所述依据所述第一特征相似度与所述第一聚类集合之间的对应关系,确定所述第一聚类集合对应的所述第二特征相似度,包括:将所述第一特征相似度进行排序,得到排序结果;根据所述排序结果以及预定过滤条件,将所述第一特征相似度中不满足所述预定过滤条件的特征相似度过滤掉,得到第三特征相似度,其中,所述第三特征相似度属于所述第一特征相似度且满足所述预定过滤条件;依据所述第三特征相似度与所述第一聚类集合之间的对应关系,确定所述第一聚类集合对应的所述第二特征相似度。
可选地,所述确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,包括:构建与所述第一特征向量对应的第一索引,以及构建与所述第二特征向量对应的第二索引;基于所述第一索引和所述第二索引,确定所述第二特征向量分别与所述多个第一特征向量之间的所述第一特征相似度。
可选地,所述获取多个第一聚类集合,包括:获取所述多张第一图像以及与所述第一图像对应的标注信息;对所述多张第一图像进行聚类,得到所述多个第一聚类集合。
可选地,所述获取所述多张第一图像以及与所述第一图像对应的标注信息,包括:获取包括第一对象的所述第一图像,其中,所述第一图像对应的所述标注信息包括以下至少之一:所述第一图像的拍摄地点,所述第一图像的拍摄时间,所述第一图像的环境信息。
根据本发明实施例的另一方面,还提供了一种匹配装置,包括:获取模块,用于获取多个第一聚类集合,其中,所述第一聚类集合包括多张第一图像,每张所述第一图像对应一组标注信息;划分模块,用于根据所述标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到所述第一聚类子集合对应的第一特征向量;确定模块,用于确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,并根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合。
根据本发明实施例的又一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行上述任意一项所述匹配方法。
根据本发明实施例的再一方面,还提供了一种计算机设备,所述计算机设备包括处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述匹配方法。
在本发明实施例中,采用二次分组的方式,通过获取多个第一聚类集合,其中,所述第一聚类集合包括多张第一图像,每张所述第一图像对应一组标注信息;根据所述标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到所述第一聚类子集合对应的第一特征向量;确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,并根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合,达到了将多个第一聚类集合与多个目标图像一一匹配的目的,从而实现了准确地将聚类后的图片组与人的身份信息相关联的技术效果,进而解决了聚类后的图片组与人的身份信息关联不准确的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了一种用于实现匹配方法的计算机终端的硬件结构框图;
图2是根据本发明实施例提供的匹配方法的流程示意图;
图3是根据本发明可选实施例提供的人脸图像实名关联方法的流程示意图;
图4是根据本发明实施例提供的匹配装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明实施例,提供了一种匹配方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现匹配方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的匹配方法对应的程序指令/数据存储装置,处理器通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的匹配方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10的用户界面进行交互。
图2是根据本发明实施例提供的匹配方法的流程示意图,如图2所示,该方法包括如下步骤:
步骤S202,获取多个第一聚类集合,其中,第一聚类集合包括多张第一图像,每张第一图像对应一组标注信息。
本步骤中,第一图像可以是人脸图像,例如,可以是用户证件照,每张第一图像对应的标注信息可以是人工标注的信息,也可以是由计算机算法自动识别的标注信息。其中,标注信息可以反映与第一图像中的用户人脸的一些物理特征,也可以是反映第一图像作为一张拍摄得到的图像本身的特征信息。多个第一聚类集合可以为多个图像集,每个第一聚类集合中可以包括至少一张第一图像。
作为一种可选的实施例,可以先获取多张第一图像以及与第一图像对应的标注信息;对多张第一图像进行聚类,得到多个第一聚类集合。本可选的实施例中,第一聚类集合可以是将大量的原始图像进行初步聚类后得到的集合,每一个第一聚类集合可以看做一个图像组,图像组中包括至少一张第一图像。每一个第一聚类集合中的图像可以认为是来拍摄同一个人得到的图像,但是不清楚这个人的身份信息,因此后续需要将该第一聚类集合与目标对象的身份信息关联起来。
作为一种可选的实施例,获取多张第一图像以及与第一图像对应的标注信息,可以首取包括第一对象的第一图像,其中,第一图像对应的标注信息包括以下至少之一:第一图像的拍摄地点,第一图像的拍摄时间,第一图像的环境信息。
本可选的实施例中,通过引入多维度的外部信息,可以更全面的对聚类组信息进行描述从而提升关联精度。第一图像的拍摄条件不同,例如有的图像是在昏暗场景下拍摄,有的图像是在光亮环境下拍摄,有的是在同一个办公室拍摄,有的是在其他办公室拍摄,因此哪怕是同一个聚类组例如同一个第一聚类集合中的图像,其在实名关联这一动作中的发挥的效果不同,因此,通过标注信息将同一个第一聚类集合中的第一图像划分为多个聚类子集合,并由多个聚类子集合分别就行相似度匹配的身份信息关联动作,可以解决图像实名关联过程中存在的关联率低(应被关联的聚类组没有关联到实名信息),关联错误率高(聚类组关联到错误的实名信息)的技术问题。
步骤S204,根据标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到第一聚类子集合对应的第一特征向量。
本步骤中,多个第一聚类子集合可以各自包括若干第一图像,这些第一图像均属于原第一聚类集合。可选的,第一特征向量可以为第一聚类子集合中的所有第一图像的特征向量的平均值。
步骤S206,确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,并根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合。
可选的,第一特征向量为第一聚类子集合中所有第一图像中的人脸特征的平均值,第二特征向量可以为目标图像中的人脸特征的值,二者之间的相似度计算方式可以为余弦相似度。
通过上述步骤,采用二次分组的方式,通过获取多个第一聚类集合,其中,第一聚类集合包括多张第一图像,每张第一图像对应一组标注信息;根据标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到第一聚类子集合对应的第一特征向量;确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,并根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合,达到了将多个第一聚类集合与多个目标图像一一匹配的目的,从而实现了准确地将聚类后的图片组与人的身份信息相关联的技术效果,进而解决了聚类后的图片组与人的身份信息关联不准确的技术问题。
作为一种可选的实施例,根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合,可以采用如下方式:基于第一特征相似度,确定第二特征向量分别与多个第一聚类集合之间的第二特征相似度;确定第二特征相似度中的最大值对应的第一聚类集合为目标聚类集合。
本可选的实施例中,通过统计计算可以得到第二特征相似度,第二特征相似度可以用于表示目标图像与第一聚类集合的匹配程度。进一步地,通过比较多个第二特征相似度的值的大小,可以将相似度最大的第一聚类集合确定为目标聚类集合,即该目标聚类集合与目标图像匹配,可以认为目标聚类集合中的人脸图像与目标图像中的人脸图像来自于同样一个人,因此可以将该目标聚类集合与该目标图像对应的人的身份信息进行关联,以实现图像聚类组的实名认证关联动作。
作为一种可选的实施例,基于第一特征相似度,确定第二特征向量分别与多个第一聚类集合之间的第二特征相似度,可以包括如下步骤:根据第一特征相似度与第二特征向量的对应关系,确定第一特征相似度与第一聚类集合之间的对应关系;依据第一特征相似度与第一聚类集合之间的对应关系,确定第一聚类集合对应的第二特征相似度。由于第一特征相似度是目标图像与第一聚类子集合之间的特征相似度,而第一聚类子集合属于第一聚类集合,因此第一特征相似度也可以用于评价第一聚类集合与目标对象之间的相似程度;进一步地,可以根据第一聚类集合中的每一个第一聚类子集合与目标对象之间的第一特征相似度,计算出第一聚类集合整体与目标对象之间的第二特征相似度。
作为一种可选的实施例,依据第一特征相似度与第一聚类集合之间的对应关系,确定第一聚类集合对应的第二特征相似度,可以采用如下方式:将第一特征相似度进行排序,得到排序结果;根据排序结果以及预定过滤条件,将第一特征相似度中不满足预定过滤条件的特征相似度过滤掉,得到第三特征相似度,其中,第三特征相似度属于第一特征相似度且满足预定过滤条件;依据第三特征相似度与第一聚类集合之间的对应关系,确定第一聚类集合对应的第二特征相似度。
本可选的实施例中,可以通过引入相似度阈值的方式,将第一聚类子集合中与目标图像特征相似度很低的子集合过滤掉,避免第一聚类集合中的每一个第一聚类子集合与目标图像的特征相似度都不高,但是加和之后得到一个较高的相似度导致第一聚类集合与目标图像之间的关联关系判断错误。可选的,预定过滤条件可以为阈值条件,不满足预定过滤条件的特征相似度可以为数值低于阈值条件的特征相似度,而将第一特征相似度进行排序可以按照数值大小从大到小进行排序。
作为一种可选的实施例,确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,可以构建与第一特征向量对应的第一索引,以及构建与第二特征向量对应的第二索引;基于第一索引和第二索引,确定第二特征向量分别与多个第一特征向量之间的第一特征相似度。需要说明的是,索引是一种海量向量的相似度检索技术,可以理解为一种经过优化的元数据存储结构,通过对海量向量数据构建索引可以加速对向量的相似度检索。本方案引入特征索引相似度搜索方案,能够极大提高计算效率。
图3是根据本发明可选实施例提供的人脸图像实名关联方法的流程示意图,如图3所示,对人脸图像进行实名关联是可以按照如下步骤进行:
步骤S301,启动图像聚类匹配,获取海量的人脸图像,对人脸图像进行聚类,得到多个聚类组(即第一聚类集合);
步骤S302,将实名人员特征信息(实名人员即目标图像对应的人员),聚类组的特征向量存入数据库(例如mysql)的不同表中,例如,将实名人员的特征信息存入id_feature表,主要字段为id_number(存储证件号)和feature(存储证件照人脸特征),将聚类组的特征向量信息存入group_feature表,主要字段为group_id(聚类组的组号),center_features(该聚类组的特征向量值,数据类型为数组,因为每个聚类组需要存储多个子聚类组的特征向量值,其中每个子聚类组即上述第一聚类子集合)。
步骤S303,从数据库拉取聚类组特征向量数据构建第二索引,并根据实名人员的证件照片的图像特征向量索引即第一索引。在从数据库拉取人员证件照特征向量构建目标索引时,可以分批次拉取,保证运算效率与存储空间的性能平衡。
步骤S304,在第二索引中对第一索引中进行向量相似度搜索,生成向量最近邻信息。最近邻信息表示在给定的向量集合中与某一向量最近的n个向量与相似度,例如,可以用如下表格表示:
Figure BDA0003625711070000081
表格中,第一列feature 1~feature n表示构建第一索引的特征向量,即人员证件照特征信息。Id 1:sim 1~id n:sim n,为第二索引中的特征向量的ID以及其与对应的人员证件照特征信息的特征相似度。例如第一行第二列表示id为1的聚类组特征向量与id为feature1的证件照特征向量的特征相似度为sim 1。可选的,表格中每一行的特征相似度可以按照降序排列。
步骤S305,确定与某证件照最近邻的n个第二索引的特征向量(例如,可以在本方案中将n设置为16),在此过程中可以根据预定的过滤条件过滤掉特征相似度小于某一阈值的特征以排除掉异常特征向量的影响。
步骤S306,根据聚类组的聚类子组的相似度信息,我们可以得出对应聚类组的相似度信息,假设上述表格中第一行的id1,id3属于聚类组G0,id2,id4属于聚类组G1,此时可以计算出人员证件照特征向量feature 1与聚类组G0的特征相似度为:sim_G0=mean(sim1+sim3),特征向量feature 1与聚类组G1的相似度为sim_G1=mean(sim2+sim4),可选的,在计算时还可以去掉特征相似度的最高值与最低值,减少异常特征影响。最后选取与人员证件照特征向量feature 1的特征相似度最大的聚类组,判定该聚类组与人员证件照特征向量feature1的特征相似度是否大于阈值,若大于,则判定该聚类组即上述目标聚类集合,该聚类组为与该人员身份信息的关联组,由此完成本次聚类组实名信息关联。
根据本发明实施例,还提供了一种用于实施上述匹配方法的匹配装置,图4是根据本发明实施例提供的匹配装置的结构框图,如图4所示,该匹配装置包括:获取模块42,划分模块44和确定模块46,下面对该匹配装置进行说明。
获取模块42,用于获取多个第一聚类集合,其中,第一聚类集合包括多张第一图像,每张第一图像对应一组标注信息;
划分模块44,用于根据标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到第一聚类子集合对应的第一特征向量;
确定模块46,用于确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,并根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合。
此处需要说明的是,上述获取模块42,划分模块44和确定模块46对应于实施例中的步骤S202至步骤S206,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例提供的计算机终端10中。
本发明的实施例可以提供一种计算机设备,可选地,在本实施例中,上述计算机设备可以位于计算机网络的多个网络设备中的至少一个网络设备。该计算机设备包括存储器和处理器。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的匹配方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的匹配方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取多个第一聚类集合,其中,第一聚类集合包括多张第一图像,每张第一图像对应一组标注信息;根据标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到第一聚类子集合对应的第一特征向量;确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,并根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一非易失性存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
本发明的实施例还提供了一种非易失性存储介质。可选地,在本实施例中,上述非易失性存储介质可以用于保存上述实施例所提供的匹配方法所执行的程序代码。
可选地,在本实施例中,上述非易失性存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:获取多个第一聚类集合,其中,第一聚类集合包括多张第一图像,每张第一图像对应一组标注信息;根据标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到第一聚类子集合对应的第一特征向量;确定目标图像的第二特征向量分别与多个第一特征向量之间的第一特征相似度,并根据第一特征相似度,确定多个第一聚类集合中与目标图像匹配的目标聚类集合。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非易失性取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种匹配方法,其特征在于,包括:
获取多个第一聚类集合,其中,所述第一聚类集合包括多张第一图像,每张所述第一图像对应一组标注信息;
根据所述标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到所述第一聚类子集合对应的第一特征向量;
确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,并根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合,包括:
基于所述第一特征相似度,确定所述第二特征向量分别与所述多个第一聚类集合之间的第二特征相似度;
确定所述第二特征相似度中的最大值对应的第一聚类集合为所述目标聚类集合。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一特征相似度,确定所述第二特征向量分别与所述多个第一聚类集合之间的第二特征相似度,包括:
根据所述第一特征相似度与所述第二特征向量的对应关系,确定所述第一特征相似度与所述第一聚类集合之间的对应关系;
依据所述第一特征相似度与所述第一聚类集合之间的对应关系,确定所述第一聚类集合对应的所述第二特征相似度。
4.根据权利要求3所述的方法,其特征在于,所述依据所述第一特征相似度与所述第一聚类集合之间的对应关系,确定所述第一聚类集合对应的所述第二特征相似度,包括:
将所述第一特征相似度进行排序,得到排序结果;
根据所述排序结果以及预定过滤条件,将所述第一特征相似度中不满足所述预定过滤条件的特征相似度过滤掉,得到第三特征相似度,其中,所述第三特征相似度属于所述第一特征相似度且满足所述预定过滤条件;
依据所述第三特征相似度与所述第一聚类集合之间的对应关系,确定所述第一聚类集合对应的所述第二特征相似度。
5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,包括:
构建与所述第一特征向量对应的第一索引,以及构建与所述第二特征向量对应的第二索引;
基于所述第一索引和所述第二索引,确定所述第二特征向量分别与所述多个第一特征向量之间的所述第一特征相似度。
6.根据权利要求5所述的方法,其特征在于,所述获取多个第一聚类集合,包括:
获取所述多张第一图像以及与所述第一图像对应的标注信息;
对所述多张第一图像进行聚类,得到所述多个第一聚类集合。
7.根据权利要求6所述的方法,其特征在于,所述获取所述多张第一图像以及与所述第一图像对应的标注信息,包括:
获取包括第一对象的所述第一图像,其中,所述第一图像对应的所述标注信息包括以下至少之一:所述第一图像的拍摄地点,所述第一图像的拍摄时间,所述第一图像的环境信息。
8.一种匹配装置,其特征在于,包括:
获取模块,用于获取多个第一聚类集合,其中,所述第一聚类集合包括多张第一图像,每张所述第一图像对应一组标注信息;
划分模块,用于根据所述标注信息,将第一聚类集合划分为多个第一聚类子集合,并计算得到所述第一聚类子集合对应的第一特征向量;
确定模块,用于确定目标图像的第二特征向量分别与所述多个第一特征向量之间的第一特征相似度,并根据所述第一特征相似度,确定所述多个第一聚类集合中与所述目标图像匹配的目标聚类集合。
9.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至7中任意一项所述匹配方法。
10.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述匹配方法。
CN202210468889.0A 2022-04-29 2022-04-29 匹配方法、装置、非易失性存储介质及计算机设备 Pending CN115019360A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210468889.0A CN115019360A (zh) 2022-04-29 2022-04-29 匹配方法、装置、非易失性存储介质及计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210468889.0A CN115019360A (zh) 2022-04-29 2022-04-29 匹配方法、装置、非易失性存储介质及计算机设备

Publications (1)

Publication Number Publication Date
CN115019360A true CN115019360A (zh) 2022-09-06

Family

ID=83066540

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210468889.0A Pending CN115019360A (zh) 2022-04-29 2022-04-29 匹配方法、装置、非易失性存储介质及计算机设备

Country Status (1)

Country Link
CN (1) CN115019360A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880745A (zh) * 2022-09-07 2023-03-31 以萨技术股份有限公司 一种获取人脸图像特征的数据处理系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115880745A (zh) * 2022-09-07 2023-03-31 以萨技术股份有限公司 一种获取人脸图像特征的数据处理系统

Similar Documents

Publication Publication Date Title
CN109284729B (zh) 基于视频获取人脸识别模型训练数据的方法、装置和介质
EP2443589B1 (en) Method and system for near-duplicate image searching
US8724910B1 (en) Selection of representative images
CN110019876B (zh) 数据查询方法、电子设备及存储介质
CN105574045B (zh) 一种视频推荐方法和服务器
CN111177436B (zh) 一种人脸特征检索方法、装置及设备
CN111091106B (zh) 图像聚类方法及装置、存储介质、电子装置
CN111783743A (zh) 一种图像聚类方法及装置
CN111309946B (zh) 一种已建立档案优化方法及装置
CN115019360A (zh) 匹配方法、装置、非易失性存储介质及计算机设备
JP2011524583A (ja) 改良された画像認識用の支援装置
CN111310834A (zh) 数据处理方法及装置、处理器、电子设备、存储介质
CN113157962B (zh) 图像检索方法、电子装置和存储介质
CN112052251B (zh) 目标数据更新方法和相关装置、设备及存储介质
CN114329027A (zh) 一种网络模型的训练方法、图像识别的方法以及相关装置
CN111708906B (zh) 基于人脸识别的来访检索方法、装置、设备及存储介质
CN111767419B (zh) 图片搜索方法、装置、设备及计算机可读存储介质
CN112883213A (zh) 一种图片归档方法、装置及电子设备
CN110278565A (zh) 一种基站设计方法及装置
CN115082999A (zh) 合影图像人物分析方法、装置、计算机设备和存储介质
CN114780780A (zh) 图像检索方法、装置、电子设备及存储介质
CN117097789A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN113032610B (zh) 档案管理方法、装置、设备及计算机可读存储介质
WO2021047305A1 (zh) 人脸搜索方法、装置、设备及计算机可读存储介质
CN114416786A (zh) 流数据的处理方法、装置、存储介质及计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination