CN113536020A - 数据查询的方法、存储介质和计算机程序产品 - Google Patents

数据查询的方法、存储介质和计算机程序产品 Download PDF

Info

Publication number
CN113536020A
CN113536020A CN202110840942.0A CN202110840942A CN113536020A CN 113536020 A CN113536020 A CN 113536020A CN 202110840942 A CN202110840942 A CN 202110840942A CN 113536020 A CN113536020 A CN 113536020A
Authority
CN
China
Prior art keywords
information
cluster
sub
image
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110840942.0A
Other languages
English (en)
Other versions
CN113536020B (zh
Inventor
时晓斐
马英楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seashell Housing Beijing Technology Co Ltd
Original Assignee
Beijing Fangjianghu Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Fangjianghu Technology Co Ltd filed Critical Beijing Fangjianghu Technology Co Ltd
Priority to CN202110840942.0A priority Critical patent/CN113536020B/zh
Publication of CN113536020A publication Critical patent/CN113536020A/zh
Application granted granted Critical
Publication of CN113536020B publication Critical patent/CN113536020B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Library & Information Science (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种数据查询的方法、存储介质和计算机程序产品,具体为获取待检索图像中的第一特征信息,基于第一特征信息在已完成第一聚类的存储图像中筛选出与待检索图像的第一距离小于预设阈值的第一类中心所在的第一聚类簇,遍历第一聚类簇中的存储图像,获取其编码信息,编码信息包含存储图像对应的第二特征信息与第一类中心之间的残差向量在完成第二聚类后所在的第二聚类簇对应的第二类中心的第一簇标识,基于编码信息在映射关系中筛选出第二距离,对同属于同一编码信息的第二距离求和并排序,按照排序顺序输出编码信息对应的存储图像。本申请实施例通过对待检索数据进行聚类和量化编码的方式实现图像检索,提升检索的效率和准确率。

Description

数据查询的方法、存储介质和计算机程序产品
技术领域
本申请实施例涉及一种数据查询的方法、存储介质和计算机程序产品。
背景技术
在需要人脸对比的场合,进行快速人脸检索的方式一般是通过将待检索的人脸图片与数据库中的图片进行一一比对。
但在对图片数据的空间存储和检索计算量上都消耗较大,只能在较小的数据集上进行检索,无法满足大规模人脸检索的需求。
发明内容
本申请实施例提供了一种数据查询的方法,克服了数据查询过程中计算量大导致的查询效率和准确率较低的问题。
该方法包括:
获取至少一个待检索图像;
提取所述待检索图像中的第一特征信息,并基于所述第一特征信息在已完成第一聚类的存储图像中筛选出至少一个第一聚类簇,其中每个所述第一聚类簇的第一类中心与所述待检索图像的第一距离小于预设阈值;
获取筛选出的所述第一聚类簇中所述存储图像对应的编码信息,其中,所述编码信息包含各所述存储图像的第二特征信息与该存储图像所在的所述第一聚类簇的所述第一类中心之间生成的至少一个残差向量,在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识;
基于所述编码信息获取至少一个第二距离,其中,所述第二距离为所述第一特征信息与各个所述第二类中心之间的距离信息;
对同属于同一所述编码信息的所述第二距离求和并排序,按照排序顺序输出所述编码信息对应的所述存储图像。
可选地,所述方法还包括对所述存储图像进行所述第一聚类的步骤:
获取至少一个所述存储图像对应的所述第二特征信息;
对所述第二特征信息进行所述第一聚类,生成至少一个第一聚类簇,其中,所述第一聚类簇中包含与相应的所述第一类中心距离最近的包含所述第二特征信息的所述存储图像。
可选地,所述方法进一步包括所述生成所述存储图像的所述编码信息的步骤:
计算至少一个所述存储图像对应的第二特征信息与该第二特征信息所在的所述第一聚类簇的所述第一类中心之间的第三距离信息作为该所述存储图像对应的所述残差向量;
将至少一个所述残差向量划分为预设数量段子残差向量,并依次标记所述预设数量段所述子残差向量的划分序号;
对标记有同一所述划分序号的所述子残差向量进行所述第二聚类,并将生成的所述第二聚类簇对应的第二类中心的第一簇标识作为所述子残差向量的子编码信息;
将所述残差向量包含的所述预设数量段所述子残差向量对应的所述子编码信息的集合作为与该所述残差向量对应的所述存储图像的所述编码信息,并将所述编码信息与所述存储图像对应存储。
可选地,所述方法进一步包括计算所述第一特征信息与各个所述第二类中心之间的所述第二距离:
将所述第一特征信息划分为所述预设数量段子特征信息,并按照所述划分序号依次对所述预设数量段所述子特征信息进行标记;
计算各个所述子特征信息与同属于同一所述划分序号的所述第二聚类中的所述第二类中心之间的所述第二距离。
可选地,基于至少一个存储图像的编码信息,在与各所述子特征信息同属于同一所述划分序号的所述第二聚类中,筛选出与各所述子编码信息对应的第二类中心,并计算所述子特征信息和所述第二类中心之间的所述第二距离。
可选地,将各个所述子特征信息对应的所述第二距离与所述子特征信息所在的所述待检索图像对应存储,以及,将各个所述子特征信息与对应的所述第一簇标识对应存储,建立所述第二距离和所述第一簇标识之间的所述映射关系;
在所述映射关系中查找与所述存储图像对应的所述编码信息中的至少一个所述子编码信息对应的所述第一簇标识,并提取与查找到的所述第一簇标识对应的所述第二距离。
可选地,对至少一个同一所述编码信息对应的各个所述第二距离进行求和,并将各个所述编码信息按照求和后的数值大小进行排序。
可选地,所述第一聚类的方法为DBSCAN密度聚类方法,所述第二聚类的方案为K-means聚类方法。
在本发明的另一个实施例中,提供了一种数据查询的装置,该装置包括:
第一获取模块,用于获取至少一个待检索图像;
第一筛选模块,用于提取所述待检索图像中的第一特征信息,并基于所述第一特征信息在已完成第一聚类的存储图像中筛选出至少一个第一聚类簇,其中每个所述第一聚类簇的第一类中心与所述待检索图像的第一距离小于预设阈值;
第二获取模块,用于获取筛选出的所述第一聚类簇中所述存储图像对应的编码信息,其中,所述编码信息包含各所述存储图像的第二特征信息与该存储图像所在的所述第一聚类簇的所述第一类中心之间生成的至少一个残差向量,在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识;
第二筛选模块,用于基于所述编码信息获取至少一个第二距离,其中,所述第二距离为所述第一特征信息与各个所述第二类中心之间的距离信息;
输出模块,用于对同属于同一所述编码信息的所述第二距离求和并排序,按照排序顺序输出所述编码信息对应的所述存储图像。
可选地,所述装置还包括第一聚类模块,所述第一聚类模块用于:
获取至少一个所述存储图像对应的所述第二特征信息;
对所述第二特征信息进行所述第一聚类,生成至少一个第一聚类簇,其中,所述第一聚类簇中包含与相应的所述第一类中心距离最近的包含所述第二特征信息的所述存储图像。
可选地,所述装置还包括编码模块,所述编码模块用于:
计算至少一个所述存储图像对应的第二特征信息与该第二特征信息所在的所述第一聚类簇的所述第一类中心之间的第三距离信息作为该所述存储图像对应的所述残差向量;
将至少一个所述残差向量划分为预设数量段子残差向量,并依次标记所述预设数量段所述子残差向量的划分序号;
对标记有同一所述划分序号的所述子残差向量进行所述第二聚类,并将生成的所述第二聚类簇对应的第二类中心的第一簇标识作为所述子残差向量的子编码信息;
将所述残差向量包含的所述预设数量段所述子残差向量对应的所述子编码信息的集合作为与该所述残差向量对应的所述存储图像的所述编码信息,并将所述编码信息与所述存储图像对应存储。
可选地,所述装置还包括计算模块,所述计算模块用于:
将所述第一特征信息划分为所述预设数量段子特征信息,并按照所述划分序号依次对所述预设数量段所述子特征信息进行标记;
计算各个所述子特征信息与同属于同一所述划分序号的所述第二聚类中的所述第二类中心之间的所述第二距离。
可选地,所述计算模块还用于:
基于至少一个存储图像的编码信息,在与各所述子特征信息同属于同一所述划分序号的所述第二聚类中,筛选出与各所述子编码信息对应的第二类中心,并计算所述子特征信息和所述第二类中心之间的所述第二距离。
可选地,所述第二筛选模块还用于:
将各个所述子特征信息对应的所述第二距离与所述子特征信息所在的所述待检索图像对应存储,以及,将各个所述子特征信息与对应的所述第一簇标识对应存储,建立所述第二距离和所述第一簇标识之间的所述映射关系;
在所述映射关系中查找与所述存储图像对应的所述编码信息中的至少一个所述子编码信息对应的所述第一簇标识,并提取与查找到的所述第一簇标识对应的所述第二距离。
可选地,所述输出模块还用于:
对至少一个同一所述编码信息对应的各个所述第二距离进行求和,并将各个所述编码信息按照求和后的数值大小进行排序。
可选地,所述装置中的所述第一聚类的方法为DBSCAN密度聚类方法,所述第二聚类的方法为K-means聚类方法。
在本发明的另一个实施例中,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行上述一种数据查询的方法中的各个步骤。
在本发明的另一个实施例中,提供了一种终端设备,包括处理器,所述处理器用于执行上述一种数据查询的方法中的各个步骤。
在本发明的另一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述一种数据查询的方法中的各个步骤。
基于上述实施例,首先获取至少一个待检索图像,其次,提取待检索图像中的第一特征信息,并基于第一特征信息在已完成第一聚类的存储图像中筛选出与待检索图像的第一距离小于预设阈值的至少一个第一类中心所在的第一聚类簇,进一步地,遍历筛选出的第一聚类簇中的存储图像,并获取存储图像对应的编码信息,其中,编码信息包含存储图像对应的第二特征信息与第一类中心之间的残差向量在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识,然后,基于编码信息在预先建立的映射关系中筛选出至少一个第二距离,其中,在第二距离和第二类中心对应的第一簇标识之间建立映射关系,第二距离为第一特征信息与各个第二类中心之间的距离信息,最后,对同属于同一编码信息的第二距离求和并排序,按照排序顺序输出编码信息对应的存储图像。本申请实施例通过对待检索数据进行聚类和量化编码的方式实现图像检索,提升检索的效率和准确率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了为本申请实施例100所提供的一种数据查询的方法的流程示意图;
图2示出了本申请实施例200提供的对数据库中的存储图像进行编码并生成对应的编码信息的示意图;
图3示出了本申请实施例300提供的生成存储图像的编码信息的示意图;
图4示出了本申请实施例400提供的在第二距离和第一簇标识之间建立映射关系的示意图;
图5示出了本申请实施例500提供为存储图像查询存储图像的示意图;
图6示出了本申请实施例600还提供一种数据查询的装置的示意图;
图7示出了本申请实施例700所提供的一种终端设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其他步骤或单元。
本申请实施例提供了一种数据查询的方法,主要适用于计算机技术领域。通过对数据库中的待检索数据进行两次聚类并量化编码,使得在后续的检索中缩小检索范围,在保证检索精确度的条件下提升了检索速度。以下几个具体实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。如图1所示,为本申请实施例100提供的一种数据查询的方法的流程示意图。其中,详细步骤如下:
步骤S11,获取至少一个待检索图像。
本步骤中,本申请实施例中获取的待检索图像可以为人脸图像等。
步骤S12,提取待检索图像中的第一特征信息,并基于第一特征信息在已完成第一聚类的存储图像中筛选出至少一个第一聚类簇,其中每个第一聚类簇的第一类中心与待检索图像的第一距离小于预设阈值。
本步骤中,第一特征信息为待检索图像对应的图像特征,可利用预先训练的卷积神经网络进行特征提取,获取各个待检索图像中的第一特征信息。
存储图像为已存储在数据库中以被后续检索的图像。这里,存储图像在数据库中完成第一聚类,在不提供聚类类别参数的情况下,实现相似的存储图像聚类。其中,第一聚类的结果是生成至少一个第一聚类簇,每个第一聚类簇中包含至少一个基于第二特征信息表征的存储图像,以及每个第一聚类簇对应一个第一类中心。
进一步地,计算待检索图像对应的第一特征信息与各个第一聚类簇对应的第一类中心之间的第一距离,第一距离表示第一特征信息与第一聚类簇的相似度。基于预设阈值与第一距离进行筛选,选取与第一特征信息相似度较高的至少一个第一聚类簇。
步骤S13,获取筛选出的第一聚类簇中存储图像对应的编码信息,其中,编码信息包含各存储图像的第二特征信息与该存储图像所在的第一聚类簇的第一类中心之间生成的至少一个残差向量,在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识。
本步骤中,在对筛选出的第一聚类簇中的各个存储图像进行遍历之前,先对各个存储图像进行编码生成各个存储图像对应的编码信息。具体地,对存储图像进行编码的方式主要基于第二聚类的方式。其中,在第一聚类的基础上,计算各个第二特征信息与其所在的第一聚类簇中的第一类中心之间的残差向量。将每个第二特征信息对应的残差向量分成预设数量段子残差向量,将每个残差向量的在同一划分序号的子残差向量作为一个子空间,在每个子空间内进行第二聚类,生成至少一个第二聚类簇。其中,为每个第二聚类簇对应的第二类中心设置第一簇标识。
进一步地,用第一簇标识作为子编码信息对子残差向量进行标记,则每个残差向量对应预设数量个子编码信息。因此,由预设数量个子编码信息的集合作为存储图像对应的编码信息并存储。
这里,在遍历筛选出的存储图像时,获取每个存储图像对应的编码信息。
步骤S14,基于编码信息获取至少一个第二距离,其中,第二距离为第一特征信息与各个第二类中心之间的距离信息。
本步骤中,在获取到待检索图像时,计算待检索图像与前述第二聚类后的各个第二类中心之间的第二距离。具体地,第二距离的计算方式为将待检索图像的第一特征信息划分为预设数量段子特征信息,计算每段子特征信息与同一划分序号的子空间中的各个第二聚类簇的第二类中心之间的第二距离。
进一步地,将第二距离与对应的第二类中心的第一簇标识对应存储,并建立对应的映射关系。存储图像的编码信息由相关的第一簇标识组成,因此可以通过存储图像的编码信息获取映射关系中相应的第二距离。
步骤S15,对同属于同一编码信息的第二距离求和并排序,按照排序顺序输出编码信息对应的存储图像。
本步骤中,在映射关系中通过编码信息作为索引,获取与编码信息对应的至少一个第二距离,将每个存储图像对应的至少一个第二距离相加求和,作为存储图像与待检索图像之间的非对称距离。进一步地,通过对遍历的各个存储图像与待检索图像之间的非对称距离进行排序,按照排序顺序输出编码信息对应的存储图像。
如上所述,基于上述实施例,首先获取至少一个待检索图像,其次,提取待检索图像中的第一特征信息,并基于第一特征信息在已完成第一聚类的存储图像中筛选出与待检索图像的第一距离小于预设阈值的至少一个第一类中心所在的第一聚类簇,进一步地,遍历筛选出的第一聚类簇中的存储图像,并获取存储图像对应的编码信息,其中,编码信息包含存储图像对应的第二特征信息与第一类中心之间的残差向量在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识,然后,基于编码信息在预先建立的映射关系中筛选出至少一个第二距离,其中,在第二距离和第二类中心对应的第一簇标识之间建立映射关系,第二距离为第一特征信息与各个第二类中心之间的距离信息,最后,对同属于同一编码信息的第二距离求和并排序,按照排序顺序输出编码信息对应的存储图像。本申请实施例通过对待检索数据进行聚类和量化编码的方式实现图像检索,提升检索的效率和准确率。
如图2所示,为本申请实施例200示出的对数据库中的存储图像进行编码并生成对应的编码信息的示意图。其中,该具体流程的详细过程如下:
S201,获取至少一个存储图像对应的第二特征信息。
这里,本申请实施例主要通过利用预先训练的卷积神经网络对存储图像进行特征提取。其中,基于不同特征的存储图像可以训练不同的卷积神经网络。如当存储图像为人脸图像时,可以使用卷积神经网络FaceNet对N张人脸图像进行第二特征信息的提取。进一步地,如图3所示,为本申请实施例300示出的生成存储图像的编码信息的示意图。其中,获取各个存储图像对应的第二特征信息的集合V={(pi,vi)|i=1,2,...,N},其中pi表示第i张存储图像的身份对应的图像标识,vi表示第i张存储图像的第二特征信息;vi={vij|j=1,2,...,d},其中vij表示vi中第j个特征值。d为第二特征信息的维度数量。
如对100张存储图像进行8维特征提取,获得第二特征信息的集合V={(pi,vi)|i=1,2,...,100},其中p1表示第1张存储图像的图像标识,如‘张三’,v1表示第1张存储图像的第二特征信息;v1={v1j|j=1,2,...,8},其中v1j表示第二特征信息v1中第j个特征值,(‘张三’,v1)=(‘张三’,{0.23,0.34,0.56,0.89,0.11,0.1,0.67,0.98}),v12=0.34。
S202,对第二特征信息进行第一聚类,生成至少一个第一聚类簇。
本步骤中,针对第二特征信息进行的第一聚类主要为DBSCAN密度聚类,该聚类方法和其他的聚类方式相比不需要提供合适的聚类类别参数,可以发现任意形状的聚类簇,不仅仅适用于凸的样本集聚类,同时它在聚类的同时还可以找出异常点,便于数据集的优化更新。同时,聚类结果没有偏倚,不会受初始点的影响。
通过第一聚类的方式对检索数据库进行空间划分,在划分后的空间内进行检索,缩小检索范围,提升检索效率。具体地,如图3所示,对第二特征信息的集合V进行DBSCAN密度聚类,把每一个第二特征信息归类到距离它最近的第一类中心所属的第一聚类簇中,并令所有的第一类中心的集合为Hcluster={hi|i=1,2,...,k},其中hi是第i个第一类中心的特征向量,hi={hij|j=1,2,...,d},hij是第一类中心i的第j个特征值。本申请实施例将hi作为每个第一聚类簇的第一类中心的第二簇标识。
在对第二特征信息进行第一聚类后,聚类为至少一个第一聚类簇,每个第一聚类簇中包含与相应的第一类中心距离最近的包含第二特征信息的存储图像。
S203,将各个第二簇标识与包含于第二簇标识对应的第一聚类簇中的存储图像对应存储。
这里,将所有第二特征信息的聚类结果保存为集合C={Ci|i=1,2,...,k},其中Ci={(pj,j)|j∈[1,N]},表示第j张存储图像属于第i个第一聚类簇,记录下属于每个第一聚类簇的存储图像的图片信息。将第二簇标识hi与对应的第一聚类簇Ci对应存储。
如对集合V进行第一聚类的密度聚类后,将100张存储图像聚类为两类,则有两个第一类中心,如第10张存储图像和第77张存储图像,则第一类中心的集合为Hcluster={h1,h2}={v10,v77},C={C1,C2}为分类结果,其中C1={(pj,j)|j=1,4,6,7}表示第一个第一聚类簇中包含第1,4,6,7张存储图像,剩余的存储图像属于第二个第一聚类簇。
S204,获取残差向量。
这里,计算至少一个存储图像对应的第二特征信息与该第二特征信息所在的第一聚类簇的第一类中心之间的第三距离信息作为该存储图像对应的残差向量。具体的,如图3所示,残差向量是每个第二特征信息与所在的第一聚类簇的第一类中心的差值。利用所有的核心Hcluster计算人脸特征向量集合V的残差向量集合R={(pi,ri)|i=1,2,...,N},其中pi表示第i张存储图像的图像标识。ri=vi-hi,表示第i张存储图像的残差向量ri等于第i张人脸图片的第二特征信息vi和所属的第一聚类簇的第一类中心hi的差值。
S205,对残差向量进行第二聚类。
本步骤中,将至少一个残差向量划分为预设数量段子残差向量,并依次标记预设数量段子残差向量的划分序号。对为同一划分序号的子残差向量进行第二聚类,并将生成的第二聚类簇对应的第二类中心的第一簇标识作为子残差向量的子编码信息。具体地,如图3所示,将N个d维残差向量划分为预设数量段子残差向量,即将其切分为M个子残差向量,则每个子残差向量的维度为d/M。预设数量M可基于业务需要进行设置,且M必须整除d。
进一步地,将同一划分序号的子残差向量置于同一子空间内,并在每个子空间中,对N个d/M维子残差向量进行第二聚类,聚成W类。本申请实施例中的第二聚类主要为K-means聚类。如图3所示,对每个残差向量的每个子残差向量,在各个子空间里逐一找到距离它们最近的第二聚类簇的第二类中心,然后用第二类中心的第一簇标识作为子残差向量的子编码信息。通过这样的编码方式,d维残差向量可以通过M个编码表示,得到存储图像的量化编码集合E={(pi,ei)|i=1,2,...,N},其中pi表示第i张存储图像的图像标识,ei表示第i张存储图像的编码信息;ei={eij|j=1,2,...,M},其中eij表示存储图像的量化编码信息ei中第j个子编码信息,从而达到量化的目的。
如计算100张存储头像的残差向量的集合R={(pi,ri)|i=1,2,3,...100},其中对第一张存储图像属于某个第一聚类簇,对应的第一类中心hi为v10,则(pi,ri)=(‘张三’,v1-v10)=(‘张三’,(v1,1-v10,1,v1,2-v10,2,...v1,8-v10,8)),若v10=(0.1,0.2,0.2,0.1,0,0.1,0.2,0.1),则r1=(0.13,0.14,0.36,0.79,0.11,0,0.47,0.88)。进一步地,对100个8维残差向量r1,r2,...,r100,将其切分为4个子空间,即将每个残差向量切分为四个子残差向量,每个子残差向量的维度为2维。同时,同一划分序号的子残差向量形成一个子空间,共形成四个子空间。如r1在第一个子空间的子残差向量为
Figure BDA0003176819270000101
(0.13,0.14),第二个子空间的子残差向量为
Figure BDA0003176819270000102
(0.36,0.79),第三个子空间的子残差向量为
Figure BDA0003176819270000103
(0.11,0),第四个子空间的子残差向量为
Figure BDA0003176819270000104
(0.47,0.88)。进一步地,对每个子空间中的100个二维的子残差向量进行第二聚类如K-means聚类,聚成8类,则有8个第二类中心。对第一个子空间来说,是对
Figure BDA0003176819270000105
进行聚类,聚成8类,第二类中心为
Figure BDA0003176819270000106
等8个中心,可编码为1,2,3,4,5,6,7,8,1代表
Figure BDA0003176819270000107
2代表
Figure BDA0003176819270000108
等。
S206,生成存储图像的编码信息并存储。
这里,将残差向量包含的预设数量段子残差向量对应的子编码信息的集合作为与该残差向量对应的存储图像的编码信息,并将编码信息与存储图像对应存储。
对每个残差向量的每个子残差向量,在各个子空间里逐一找到距离它们最近的第二类中心,然后用第二类中心的第一簇标识作为子残差向量的子编码信息并形成残差向量的编码信息,如对残差向量r1的编码信息为e1=(2,2,5,7)。
上述步骤为对存储图像进行编码的过程。
如图4所示,为本申请实施例400示出的在第二距离和第一簇标识之间建立映射关系的示意图。其中,该具体流程的详细过程如下:
S401,获取至少一个待检索图像并提取待检索图像中的第一特征信息。
这里,利用预先训练的卷积神经网络对待检索图像进行第一特征信息的提取。如利用训练好的卷积神经网络FaceNet对M张人脸图像进行d维特征提取。获得第一特征信息的集合Q={(p′i,qi)|i=1,2,...,M},其中p′i表示第i张待检索图像的图像标识,qi表示第i张待检索图像的第一特征信息:qi={qij|j=1,2,...,d},其中qij表示人脸图片特征向量qi中第j个特征值。如对第三张待检索图像(p′3,q3)=(‘李四’,(0.1,0.11,0.2,0.22,0.3,0.31,0.34,0.5))。
S402,计算第二距离。
本步骤中,将第一特征信息划分为预设数量段子特征信息,并按照划分序号依次对预设数量段子特征信息进行标记;计算各个子特征信息与同属于同一划分序号的第二聚类中的第二类中心之间的第二距离。
具体地,第二距离为各个待检索图像中包含的各个子特征信息与同属于同一划分序号的第二聚类中的第二类中心的距离。其中,把待检索图像的第一特征信息划分为预设数量如M段子特征信息并按照划分序号依次进行标记。计算各个子特征信息到同属于同一划分序号的子空间中的所有第二聚类中对应的第二类中心的距离,则可以得到W*M个第二距离。保存为集合D={(p′i,di)|i=1,2,...,M},其中di={dimn|m=1,2,...M,n=1,2,...,W}表示第i张待检索图像的距离集合,dimn为第i张待检索图像的第m个子特征信息到对应的子空间中第n个第二类中心的第二距离。第二距离为相似度信息,可以使用欧氏距离或余弦距离等相似度计算方式进行计算。
S403,建立待检索图像与第二距离之间的映射关系。
这里,将各个子特征信息对应的第二距离与子特征信息所在的待检索图像对应存储,以及,将各个子特征信息与对应的第一簇标识对应存储,建立第二距离和第一簇标识之间的映射关系。具体地,如对第三张待检索图像的第一特征信息q3,首先将q3划分为四个子特征信息
Figure BDA0003176819270000111
Figure BDA0003176819270000112
其次在对应的子空间中,计算每个子特征信息到该子空间中每个第二类中心的欧式距离,建立第二距离和第一簇标识之间的映射关系。如Dist11是
Figure BDA0003176819270000113
到对应的第一个子空间的第二类中心
Figure BDA0003176819270000114
的第二距离,Dist12是
Figure BDA0003176819270000115
到第一个子空间的第二类中心
Figure BDA0003176819270000116
的第二距离,以此类推。如D集合为(‘李四’,d3),d3={d3mn|m=1,2,3,4,n=1,2,3,4,5,6,7,8},如d3,1,2=Dist12。
通过上述步骤建立待检索图像与第二距离之间的映射关系。
如图5所示,为本申请实施例500示出的为存储图像查询存储图像的示意图。其中,该具体流程的详细过程如下:
S501,获取至少一个待检索图像并提取待检索图像中的第一特征信息。
S502,筛选出需要遍历的存储图像。
这里,基于第一特征信息在已完成第一聚类的存储图像中筛选出与待检索图像的第一距离小于预设阈值的至少一个第一类中心所在的第一聚类簇。具体地,对每一张待检索的待检索图像的第一特征信息qi,在第一聚类后的集合C中找到第一距离小于预设阈值即与第一特征信息距离较近的至少一个第一类中心,并获取第一类中心对应的第一聚类簇中的存储图像。如对待检索图像的第一特征信息q3,如有两个第一聚类簇,其第一类中心分别为v10,v77。则首先计算q3和两个第一类中心的第一距离,若与v10的第一距离小于预设阈值,则在v10对应的第一聚类簇C1中进行检索,即在C1包含的图像标识为1,4,6,7的存储图像中进行筛选。
S503,遍历筛选出的第一聚类簇中的存储图像,并获取存储图像对应的编码信息。
这里,基于前述实施例200中的编码信息,获取需要遍历的存储图像的编码信息。如获取存储图像对应的编码信息为e1=(2,2,5,7)。
S504,筛选出至少一个第二距离。
这里,在映射关系中查找与存储图像对应的编码信息中的至少一个子编码信息对应的第一簇标识,并提取与查找到的第一簇标识对应的第二距离。这里,基于映射关系,计算待检索图像与编码信息为e1=(2,2,5,7)的存储图像之间的第二距离,则筛选出的第二距离为Dist12、Dist22、Dist35和Dist47。
另外,在获取到第一聚类簇中的存储图像的编码信息后,基于存储图像的编码信息和待检索图像,计算各个存储图像与待检索图像之间的距离。具体地,将第一特征信息划分为预设数量段子特征信息,并按照划分序号依次对预设数量段所述子特征信息进行标记。如对第三张待检索图像的第一特征信息q3,首先将q3划分为四个子特征信息
Figure BDA0003176819270000121
进一步地,基于至少一个存储图像的编码信息,在与各子特征信息同属于同一划分序号的第二聚类中,筛选出与各子编码信息对应的第二类中心,并计算子特征信息和第二类中心之间的第二距离。可选地,基于各存储图像的编码信息中包含的各子编码信息,获取与子编码信息对应的同一划分序号的第二类中心。如获取存储图像对应的编码信息为e1=(2,2,5,7),则其中子编码信息2与子特征信息
Figure BDA0003176819270000122
对应,则子编码信息2对应在与子编码信息对应的同一划分序号的第二类中心
Figure BDA0003176819270000123
与子特征信息
Figure BDA0003176819270000124
计算两个向量之间的第二距离。相似地,计算每个子特征信息到该子空间中每个第二类中心的欧式距离,作为第二距离。
S505,计算非对称距离作为相似度。
这里,对至少一个同一所述编码信息对应的各个第二距离进行求和,并将各个编码信息按照求和后的数值大小进行排序。具体地,将各个第二距离相加的和作为该存储图像与待检索图像之间的相似度。如相似度D=Dist12+Dist22+Dist35+Dist47。
S506,按照排序顺序输出编码信息对应的存储图像。
这里,按照相似度的大小排序,并输出相似度最大的或者前几个存储图像输出,作为待检图像的查询结果。
通过上述步骤进行一种数据查询的方法。
本申请实施例通过两次不同的聚类方法对待检索的数据进行压缩,在保证检索准确率的同时缩小检索时的范围。首先计算查询向量x即待检索图像的第一特征信息到第一聚类各个类第一中心的第一距离,筛选出距离最近的至少一个第一聚类簇,后续只计算这些第一聚类簇中的数据库向量y即存储图像和x之间的距离,可大幅度减少计算量。进一步地,计算残差向量:计算x的残差r(x)=x-q(x)(最近第一类中心),并在后续的距离计算中使用查询向量的残差r(x)。对r(x)进行M分组,在计算查询向量的残差到数据库数据残差的距离时,提前计算好r(x)的每个小组到第二个阶段所有子空间聚类中心的距离(欧式距离),保存为表格dist_table。进一步地,计算x和y之间的距离时,只需要计算r(x)和y的量化编码后的量化中心的距离,通过量化编码,在dist_table中查找具体的距离,然后把距离相加即可。
其中,暴力搜索的方式是在全空间进行搜索,为了加快查找的速度,通过密度聚类方法实现对全空间的分割,将其分割成很多小的子空间。在搜索的时候,通过计算待检索图像和类中心的距离,快速锁定在某一(几)个子空间,然后只在该一(几)个子空间里做数据遍历检索。这样可以有效提高检索的效率,特别地,当检索子空间数量越少,检索速度越快。优选地,第一聚类采用DBSCAN密度聚类的方式,和K-means聚类相比表现更好,一方面不需要聚类类别参数,可以发现任意形状的聚类簇,不仅仅使用于凸的样本集聚类,同时它在聚类的同时还可以找出异常点,便于数据集的优化更新。另一方面,聚类结果没有偏倚,不会受初始点的影响。
另外,一般地欧式距离计算需要计算待检索图像和数据库中所有图像的距离,假设有N个d维数据库图像特征向量,则需要进行N*d次计算。对数据库中图像特征向量进行量化编码后为N个M维向量。采用近似的计算距离方法,只需要进行(W*M+N*M)次计算,其中N>>(W,M),相比传统方法,计算大幅度降低,而且特征向量进行编码后维度降低,减少了所占的存储空间。其中,多次通过与类中心的距离计算,不在特征向量之间直接进行计算,减少计算量。
基于同一发明构思,本申请实施例600还提供一种数据查询的装置,其中,如图6所示,该装置包括:
第一获取模块61,用于获取至少一个待检索图像;
第一筛选模块62,用于提取待检索图像中的第一特征信息,并基于第一特征信息在已完成第一聚类的存储图像中筛选出至少一个第一聚类簇,其中每个第一聚类簇的第一类中心与待检索图像的第一距离小于预设阈值;
第二获取模块63,用于获取筛选出的所述第一聚类簇中存储图像对应的编码信息,其中,编码信息包含各存储图像的第二特征信息与该存储图像所在的所述第一聚类簇的第一类中心之间生成的至少一个残差向量,在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识;
第二筛选模块64,用于基于编码信息获取至少一个第二距离,其中,第二距离为第一特征信息与各个第二类中心之间的距离信息;
输出模块65,用于对同属于同一编码信息的第二距离求和并排序,按照排序顺序输出编码信息对应的所述存储图像。
本实施例中,第一获取模块61、第一筛选模块62、第二获取模块63、第二筛选模块64和输出模块65的具体功能和交互方式,可参见图1对应的实施例的记载,在此不再赘述。
可选地,装置还包括第一聚类模块66,所述第一聚类模块用于:
获取至少一个所述存储图像对应的所述第二特征信息;
对第二特征信息进行第一聚类,生成至少一个第一聚类簇,其中,第一聚类簇中包含与相应的第一类中心距离最近的包含第二特征信息的存储图像。
可选地,装置还包括编码模块67,编码模块67用于:
计算至少一个存储图像对应的第二特征信息与该第二特征信息所在的第一聚类簇的所述第一类中心之间的第三距离信息作为该存储图像对应的残差向量;
将至少一个残差向量划分为预设数量段子残差向量,并依次标记预设数量段子残差向量的划分序号;
对标记有同一划分序号的子残差向量进行所述第二聚类,并将生成的第二聚类簇对应的第二类中心的第一簇标识作为子残差向量的子编码信息;
将残差向量包含的预设数量段所述子残差向量对应的子编码信息的集合作为与该残差向量对应的存储图像的所述编码信息,并将编码信息与存储图像对应存储。
可选地,装置还包括计算模块68,计算模块68用于:
将第一特征信息划分为预设数量段子特征信息,并按照划分序号依次对预设数量段所述子特征信息进行标记;
计算各个子特征信息与同属于同一划分序号的第二聚类中的第二类中心之间的第二距离。
可选地,计算模块68还用于:
基于至少一个存储图像的编码信息,在与各子特征信息同属于同一划分序号的第二聚类中,筛选出与各子编码信息对应的第二类中心,并计算子特征信息和第二类中心之间的所述第二距离。
可选地,第二筛选模块64还用于:
将各个子特征信息对应的所述第二距离与子特征信息所在的待检索图像对应存储,以及,将各个子特征信息与对应的第一簇标识对应存储,建立第二距离和第一簇标识之间的映射关系;
在映射关系中查找与存储图像对应的编码信息中的至少一个子编码信息对应的第一簇标识,并提取与查找到的第一簇标识对应的第二距离。
可选地,输出模块65还用于:
对至少一个同一所述编码信息对应的各个第二距离进行求和,并将各个编码信息按照求和后的数值大小进行排序。
可选地,该装置中的第一聚类的方法为DBSCAN密度聚类方法,第二聚类的方法为K-means聚类方法。
在本发明的另一个实施例中,提供了一种非瞬时计算机可读存储介质,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行上述一种数据查询的方法中的各个步骤。
如图7所示,本申请的又一实施例700还提供一种终端设备,包括处理器701,其中,处理器701用于执行上述一种数据查询的方法的步骤。从图7中还可以看出,上述实施例提供的终端设备还包括非瞬时计算机可读存储介质702,该非瞬时计算机可读存储介质702上存储有计算机程序,该计算机程序被处理器701运行时执行上述一种数据查询的方法的步骤。实际应用中,该终端设备可以是一台或多台计算机,只要包括上述计算机可读介质和处理器即可。
具体地,该存储介质能够为通用的存储介质,如移动磁盘、硬盘和FLASH等,该存储介质上的计算机程序被运行时,能够执行上述的一种数据查询的方法中的各个步骤。实际应用中,所述的计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的,也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或多个程序被执行时,能够执行上述的一种数据查询的方法中的各个步骤。
根据本申请公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件,或者上述的任意合适的组合,但不用于限制本申请保护的范围。在本申请公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
本申请附图中的流程图和框图,示出了按照本申请公开的各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或者代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应该注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同附图中所标注的顺序发生。例如,两个连接地表示的方框实际上可以基本并行地执行,它们有时也可以按照相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或者流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本申请中。特别地,在不脱离本申请精神和教导的情况下,本申请的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,所有这些组合和/或结合均落入本申请公开的范围。
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行变更或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些变更、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种数据查询的方法,其特征在于,包括:
获取至少一个待检索图像;
提取所述待检索图像中的第一特征信息,并基于所述第一特征信息在已完成第一聚类的存储图像中筛选出至少一个第一聚类簇,其中每个所述第一聚类簇的第一类中心与所述待检索图像的第一距离小于预设阈值;
获取筛选出的所述第一聚类簇中所述存储图像对应的编码信息,其中,所述编码信息包含各所述存储图像的第二特征信息与该存储图像所在的所述第一聚类簇的所述第一类中心之间生成的至少一个残差向量,在完成第二聚类后所在的至少一个第二聚类簇对应的第二类中心的第一簇标识;
基于所述编码信息获取至少一个第二距离,其中,所述第二距离为所述第一特征信息与各个所述第二类中心之间的距离信息;
对同属于同一所述编码信息的所述第二距离求和并排序,按照排序顺序输出所述编码信息对应的所述存储图像。
2.根据权利要求1所述的方法,其特征在于,在所述获取至少一个待检索图像的步骤之前,所述方法还包括对所述存储图像进行所述第一聚类的步骤:
获取至少一个所述存储图像对应的所述第二特征信息;
对所述第二特征信息进行所述第一聚类,生成至少一个第一聚类簇,其中,所述第一聚类簇中包含与相应的所述第一类中心距离最近的包含所述第二特征信息的所述存储图像。
3.根据权利要求2所述的方法,其特征在于,在所述对所述存储图像进行所述第一聚类的步骤之后,所述方法进一步包括生成所述存储图像的所述编码信息的步骤:
计算至少一个所述存储图像对应的第二特征信息与该第二特征信息所在的所述第一聚类簇的所述第一类中心之间的第三距离信息作为该所述存储图像对应的所述残差向量;
将至少一个所述残差向量划分为预设数量段子残差向量,并依次标记所述预设数量段所述子残差向量的划分序号;
对标记有同一所述划分序号的所述子残差向量进行所述第二聚类,并将生成的所述第二聚类簇对应的第二类中心的第一簇标识作为所述子残差向量的子编码信息;
将所述残差向量包含的所述预设数量段所述子残差向量对应的所述子编码信息的集合作为与该所述残差向量对应的所述存储图像的所述编码信息。
4.根据权利要求3所述的方法,其特征在于,在所述获取至少一个待检索图像的步骤之后,所述方法进一步包括计算所述第一特征信息与各个所述第二类中心之间的所述第二距离:
将所述第一特征信息划分为所述预设数量段子特征信息,并按照所述划分序号依次对所述预设数量段所述子特征信息进行标记;
计算各个所述子特征信息与同属于同一所述划分序号的所述第二聚类中的所述第二类中心之间的所述第二距离。
5.根据权利要求4所述的方法,其特征在于,在所述将所述第一特征信息划分为所述预设数量段子特征信息,并按照所述划分序号依次对所述预设数量段所述子特征信息进行标记的步骤之后,所述方法进一步包括:
基于至少一个存储图像的编码信息,在与各所述子特征信息同属于同一所述划分序号的所述第二聚类中,筛选出与各所述子编码信息对应的第二类中心,并计算所述子特征信息和所述第二类中心之间的所述第二距离。
6.根据权利要求4所述的方法,其特征在于,所述基于所述编码信息获取至少一个第二距离的步骤包括:
将各个所述子特征信息对应的所述第二距离与所述子特征信息所在的所述待检索图像对应存储,以及,将各个所述子特征信息与对应的所述第一簇标识对应存储,建立所述第二距离和所述第一簇标识之间的所述映射关系;
在所述映射关系中查找与所述存储图像对应的所述编码信息中的至少一个所述子编码信息对应的所述第一簇标识,并提取与查找到的所述第一簇标识对应的所述第二距离。
7.根据权利要求5或6所述的方法,其特征在于,所述对同属于同一所述编码信息的所述第二距离求和并排序的步骤包括:
对至少一个同一所述编码信息对应的各个所述第二距离进行求和,并将各个所述编码信息按照求和后的数值大小进行排序。
8.根据权利要求1所述的方法,其特征在于,所述第一聚类的方法为DBSCAN密度聚类方法,所述第二聚类的方法为K-means聚类方法。
9.一种非瞬时计算机可读存储介质,其特征在于,所述非瞬时计算机可读存储介质存储指令,所述指令在由处理器执行时使得所述处理器执行如权利要求1至8任一项所述的一种数据查询的方法中的各个步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-8任一项所述的方法。
CN202110840942.0A 2021-07-23 2021-07-23 数据查询的方法、存储介质和计算机程序产品 Active CN113536020B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110840942.0A CN113536020B (zh) 2021-07-23 2021-07-23 数据查询的方法、存储介质和计算机程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110840942.0A CN113536020B (zh) 2021-07-23 2021-07-23 数据查询的方法、存储介质和计算机程序产品

Publications (2)

Publication Number Publication Date
CN113536020A true CN113536020A (zh) 2021-10-22
CN113536020B CN113536020B (zh) 2022-05-24

Family

ID=78088895

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110840942.0A Active CN113536020B (zh) 2021-07-23 2021-07-23 数据查询的方法、存储介质和计算机程序产品

Country Status (1)

Country Link
CN (1) CN113536020B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780781A (zh) * 2022-06-17 2022-07-22 中船重工(武汉)凌久高科有限公司 一种基于模糊聚类和非对称距离计算的乘积量化方法
CN117194737A (zh) * 2023-09-14 2023-12-08 上海交通大学 基于距离阈值的近似近邻搜索方法、系统、介质及设备

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016745A (zh) * 2008-01-23 2011-04-13 加州大学评议会 用于行为监测及校正的系统和方法
US20120154633A1 (en) * 2009-12-04 2012-06-21 Rodriguez Tony F Linked Data Methods and Systems
US20120284012A1 (en) * 2010-11-04 2012-11-08 Rodriguez Tony F Smartphone-Based Methods and Systems
US20130228629A1 (en) * 2012-03-01 2013-09-05 Xerox Corporation System and method for embedding machine-readable codes in combination with other images such as logos
CN104008174A (zh) * 2014-06-04 2014-08-27 北京工业大学 一种海量图像检索的隐私保护索引生成方法
CN104021234A (zh) * 2014-06-30 2014-09-03 中国科学院自动化研究所 一种基于自适应位分配哈希算法的大规模图像库检索方法
US20160187199A1 (en) * 2014-08-26 2016-06-30 Digimarc Corporation Sensor-synchronized spectrally-structured-light imaging
US20160314567A1 (en) * 2015-03-26 2016-10-27 The Board Of Regents Of The University Of Texas System Systems and methods for image/video recoloring, color standardization, and multimedia analytics
CN107341151A (zh) * 2016-04-29 2017-11-10 成都理想境界科技有限公司 图像检索数据库生成方法、增强现实的方法及装置
EP3343394A1 (en) * 2016-12-27 2018-07-04 Fundacion Centro de Tecnologias de Interaccion Visual y comunicaciones Vicomtech Method for and system for creating global thematic maps based on extraction of image descriptors
US20180284743A1 (en) * 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for industrial internet of things data collection for vibration sensitive equipment
CN109800317A (zh) * 2018-03-19 2019-05-24 中山大学 一种基于图像场景图谱对齐的图像查询回答方法
CN109947904A (zh) * 2019-03-22 2019-06-28 东北大学 一种基于Spark环境的偏好空间Skyline查询处理方法
CN110134804A (zh) * 2019-05-20 2019-08-16 北京达佳互联信息技术有限公司 图像检索方法、装置及存储介质
CN110222218A (zh) * 2019-04-18 2019-09-10 杭州电子科技大学 基于多尺度NetVLAD和深度哈希的图像检索方法
CN111143597A (zh) * 2019-12-13 2020-05-12 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111368133A (zh) * 2020-04-16 2020-07-03 腾讯科技(深圳)有限公司 一种视频库的索引表建立方法、装置、服务器及存储介质
CN111444363A (zh) * 2020-03-02 2020-07-24 高新兴科技集团股份有限公司 一种图片检索方法、装置、终端设备及存储介质
CN111783805A (zh) * 2019-04-04 2020-10-16 京东方科技集团股份有限公司 图像检索方法及装置、电子设备、可读存储介质
CN112949710A (zh) * 2021-02-26 2021-06-11 北京百度网讯科技有限公司 一种图像的聚类方法和装置

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102016745A (zh) * 2008-01-23 2011-04-13 加州大学评议会 用于行为监测及校正的系统和方法
US20120154633A1 (en) * 2009-12-04 2012-06-21 Rodriguez Tony F Linked Data Methods and Systems
US20120284012A1 (en) * 2010-11-04 2012-11-08 Rodriguez Tony F Smartphone-Based Methods and Systems
US20130228629A1 (en) * 2012-03-01 2013-09-05 Xerox Corporation System and method for embedding machine-readable codes in combination with other images such as logos
CN104008174A (zh) * 2014-06-04 2014-08-27 北京工业大学 一种海量图像检索的隐私保护索引生成方法
CN104021234A (zh) * 2014-06-30 2014-09-03 中国科学院自动化研究所 一种基于自适应位分配哈希算法的大规模图像库检索方法
US20160187199A1 (en) * 2014-08-26 2016-06-30 Digimarc Corporation Sensor-synchronized spectrally-structured-light imaging
US20160314567A1 (en) * 2015-03-26 2016-10-27 The Board Of Regents Of The University Of Texas System Systems and methods for image/video recoloring, color standardization, and multimedia analytics
CN107341151A (zh) * 2016-04-29 2017-11-10 成都理想境界科技有限公司 图像检索数据库生成方法、增强现实的方法及装置
US20180284743A1 (en) * 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for industrial internet of things data collection for vibration sensitive equipment
EP3343394A1 (en) * 2016-12-27 2018-07-04 Fundacion Centro de Tecnologias de Interaccion Visual y comunicaciones Vicomtech Method for and system for creating global thematic maps based on extraction of image descriptors
CN109800317A (zh) * 2018-03-19 2019-05-24 中山大学 一种基于图像场景图谱对齐的图像查询回答方法
CN109947904A (zh) * 2019-03-22 2019-06-28 东北大学 一种基于Spark环境的偏好空间Skyline查询处理方法
CN111783805A (zh) * 2019-04-04 2020-10-16 京东方科技集团股份有限公司 图像检索方法及装置、电子设备、可读存储介质
CN110222218A (zh) * 2019-04-18 2019-09-10 杭州电子科技大学 基于多尺度NetVLAD和深度哈希的图像检索方法
CN110134804A (zh) * 2019-05-20 2019-08-16 北京达佳互联信息技术有限公司 图像检索方法、装置及存储介质
CN111143597A (zh) * 2019-12-13 2020-05-12 浙江大华技术股份有限公司 图像检索方法、终端及存储装置
CN111444363A (zh) * 2020-03-02 2020-07-24 高新兴科技集团股份有限公司 一种图片检索方法、装置、终端设备及存储介质
CN111368133A (zh) * 2020-04-16 2020-07-03 腾讯科技(深圳)有限公司 一种视频库的索引表建立方法、装置、服务器及存储介质
CN112949710A (zh) * 2021-02-26 2021-06-11 北京百度网讯科技有限公司 一种图像的聚类方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
M. SINGH 等: ""An improved xie-beni index for cluster validity measure"", 《2017 FOURTH INTERNATIONAL CONFERENCE ON IMAGE INFORMATION PROCESSING 》 *
顾广华 等: ""基于多层次特征表示的图像场景分类算法"", 《高技术通讯》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114780781A (zh) * 2022-06-17 2022-07-22 中船重工(武汉)凌久高科有限公司 一种基于模糊聚类和非对称距离计算的乘积量化方法
CN117194737A (zh) * 2023-09-14 2023-12-08 上海交通大学 基于距离阈值的近似近邻搜索方法、系统、介质及设备

Also Published As

Publication number Publication date
CN113536020B (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN105912611B (zh) 一种基于cnn的快速图像检索方法
JP5660078B2 (ja) 多クラス識別器、方法、およびプログラム
CN111444363B (zh) 一种图片检索方法、装置、终端设备及存储介质
CN113536020B (zh) 数据查询的方法、存储介质和计算机程序产品
CN110502664B (zh) 视频标签索引库创建方法、视频标签生成方法及装置
CN113850281B (zh) 一种基于meanshift优化的数据处理方法和装置
GB2592076A (en) Method of training an image classification model
CN110674328A (zh) 一种商标图像检索方法、系统、介质及设备
CN112036476A (zh) 基于二分类业务的数据特征选择方法、装置及计算机设备
CN108229358B (zh) 索引建立方法和装置、电子设备、计算机存储介质
CN114238329A (zh) 向量相似度计算方法、装置、设备及存储介质
CN111353062A (zh) 一种图像检索方法、装置以及设备
CN115965058A (zh) 神经网络训练方法、实体信息分类方法、装置及存储介质
CN110442749B (zh) 视频帧处理方法及装置
CN114547365A (zh) 一种图像检索方法和设备
JP2014115920A (ja) 多クラス識別器、方法、及びプログラム
Wu et al. Codebook-free compact descriptor for scalable visual search
CN113157962A (zh) 图像检索方法、电子装置和存储介质
JP5892275B2 (ja) 多クラス識別器生成装置、データ識別装置、多クラス識別器生成方法、データ識別方法、及びプログラム
Dhoot et al. Efficient Dimensionality Reduction for Big Data Using Clustering Technique
CN115082999A (zh) 合影图像人物分析方法、装置、计算机设备和存储介质
CN114742155A (zh) 基于随机采样聚类的带噪音数据分类方法及用户分类方法
CN115908882A (zh) 图片聚类方法及装置
JP6317715B2 (ja) 画像認識装置、方法、及びプログラム
JP2017215784A (ja) 物体検出装置、方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20220114

Address after: 100085 Floor 101 102-1, No. 35 Building, No. 2 Hospital, Xierqi West Road, Haidian District, Beijing

Applicant after: Seashell Housing (Beijing) Technology Co.,Ltd.

Address before: 101399 room 24, 62 Farm Road, Erjie village, Yangzhen, Shunyi District, Beijing

Applicant before: Beijing fangjianghu Technology Co.,Ltd.

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant