CN113792172A - 基于三角不等式的图像检索方法、系统、设备及存储介质 - Google Patents

基于三角不等式的图像检索方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN113792172A
CN113792172A CN202111353379.0A CN202111353379A CN113792172A CN 113792172 A CN113792172 A CN 113792172A CN 202111353379 A CN202111353379 A CN 202111353379A CN 113792172 A CN113792172 A CN 113792172A
Authority
CN
China
Prior art keywords
visual feature
distance
feature vectors
clue
clustering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111353379.0A
Other languages
English (en)
Other versions
CN113792172B (zh
Inventor
樊启祥
王鑫
许世森
黄斌
蒋敏华
赵贺
冯震震
张涵超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Huaneng Group Co Ltd
Xian Thermal Power Research Institute Co Ltd
Original Assignee
China Huaneng Group Co Ltd
Xian Thermal Power Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Huaneng Group Co Ltd, Xian Thermal Power Research Institute Co Ltd filed Critical China Huaneng Group Co Ltd
Priority to CN202111353379.0A priority Critical patent/CN113792172B/zh
Publication of CN113792172A publication Critical patent/CN113792172A/zh
Application granted granted Critical
Publication of CN113792172B publication Critical patent/CN113792172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/535Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明属于电力系统自动化领域,公开了一种基于三角不等式的图像检索方法、系统、设备及存储介质,包括:获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集;通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量;获取各相似视觉特征向量对应的图像,得到检索结果。本发明基于三角不等式的图像检索方法,解决了电力设备图像检索时,检索效率较低的缺点,极大的减少检索耗时。

Description

基于三角不等式的图像检索方法、系统、设备及存储介质
技术领域
本发明属于电力系统自动化领域,涉及一种基于三角不等式的图像检索方法、系统、设备及存储介质。
背景技术
就多种信息载体而言,图像能够起到一目了然的效果。近年来电力部门在电力设备管理方面,采用了对设备拍摄数字图像以记录设备信息的管理方式,对于设备图像的使用主要有:1、从数字图像中分辨出设备类型;2、前后对比使用,管理者往往要将同一设备的历史图像同当前图像进行对比,观察漆面变化情况。3、从图像的附加信息中得知设备型号,设备所在地点及设备使用年限等参数。
最初这些图像以文件形式存储在电脑硬盘中,管理者只能逐个浏览,随着图像数量的增多,从中寻找目标图像非常困难。于是将设备图像作为图像数据库进行组织,继而依照线索图像从数量巨大,品种繁多的电力设备图像数据库中快速检索出目标设备图像,则可以大大提高电力部门的工作效率。
但是,现有检索方法在面对数量巨大,品种繁多的电力设备图像时,所需要的检索时间较长,导致检索效率较低。
发明内容
本发明的目的在于克服上述现有技术中,电力设备图像检索时,检索效率较低的缺点,提供一种基于三角不等式的图像检索方法、系统、设备及存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种基于三角不等式的图像检索方法,包括以下步骤:
获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集;
通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量;
获取各相似视觉特征向量对应的图像,得到检索结果。
本发明基于三角不等式的图像检索方法进一步的改进在于:
所述提取线索图像的视觉特征向量的具体方法为:采用在ImageNet图像数据集上预训练过的Inception模型,提取线索图像的视觉特征向量。
所述获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集的具体方法为:
获取预设的若干聚类集中各聚类集的聚类中心;计算各聚类集的聚类中心与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离前第一预设数量近的聚类中心所属的聚类集,得到与线索视觉特征向量相似度前第一预设数量高的聚类集。
所述预设的若干聚类集通过如下方式得到:
获取图像数据库中的图像,并提取各图像的视觉特征向量;
将各图像的视觉特征向量采用k-means聚类方法聚类,得到若干聚类集。
所述预设的距离计算方法为欧式距离计算方法或者余弦夹角距离计算方法。
所述通过基于三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量的具体方法为:
遍历各聚类集中各视觉特征向量:
通过预设的距离计算方法,得到线索视觉特征向量与当前聚类集的聚类中心之间的距离,得到第一距离;
获取当前聚类集中当前视觉特征向量与聚类中心之间的距离,得到第二距离;
计算第一距离与第二距离之间差值的绝对值,得到第三距离;
获取当前最小距离,当第三距离大于当前最小距离时,跳过当前视觉特征向量;
否则,通过预设的距离计算方法,获取当前视觉特征向量与线索视觉特征向量之间的距离,得到第四距离;
记录当前第四距离,并通过第四距离更新当前最小距离;
遍历完成后,从记录的所有当前第四距离中选取第二预设数量小的当前第四距离,得到第二预设数量的目标第四距离;获取各目标第四距离对应的视觉特征向量,得到第二预设数量的相似视觉特征向量。
所述第一预设数量为1~3。
本发明第二方面,一种基于三角不等式的图像检索系统,包括:
第一获取模块,用于获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
相似聚类集确定模块,用于获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集;
相似向量确定模块,用于通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量;
第二获取模块,用于获取各相似视觉特征向量对应的图像,得到检索结果。
本发明第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于三角不等式的图像检索方法的步骤。
本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于三角不等式的图像检索方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明基于三角不等式的图像检索方法,通过线索视觉特征向量与聚类中心的相似性确定出第一预设数量的相似聚类集,后续的图像检索只需要将线索视觉特征向量与这第一预设数量的相似聚类集中的视觉特征向量进行相似性比较即可,检索的耗时将会得到大幅减少。同时,线索视觉特征向量与筛选出的第一预设数量的相似聚类集中的视觉特征向量进行相似性比较时,借助三角不等式判定法,极大的减少线索视觉特征向量与视觉特征向量之间的距离计算次数,进一步减少检索的耗时。
附图说明
图1为本发明的基于三角不等式的图像检索方法流程框图;
图2为本发明的三角不等式判定法原理示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
参见图1,本发明一实施例中,提供一种基于三角不等式的图像检索方法,解决现有检索方法在面对数量巨大,品种繁多的电力设备图像时,所需要的检索时间较长,检索效率较低的问题。
具体的,该基于三角不等式的图像检索方法包括以下步骤:
S1:获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量。
其中,提取线索图像的视觉特征向量的具体方法为:采用在ImageNet图像数据集上预训练过的Inception模型,提取线索图像的视觉特征向量。
具体的,采用图像特征提取模型对线索图像提取视觉特征向量,图像特征提取模型可以选择在ImageNet图像数据集上预训练过的Inception模型,一张线索图像可以对应一个2048维的视觉特征向量。
同样的,在进行检索前,将电力系统图像数据库中的所有图像,采用上述的图像特征提取模型提取视觉特征向量,使用电力系统图像数据库中所有图像对应的视觉特征向量构建一个视觉特征向量库,进而将图像检索工作转换为视觉特征向量的检索工作,相比于直接对图像进行检索极大的减少了使用时的计算量。
S2:获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集。
其中,预设的若干聚类集通过如下方式得到:获取图像数据库中的图像,并提取各图像的视觉特征向量;将各图像的视觉特征向量采用k-means聚类方法聚类,得到若干聚类集。
具体的,在进行检索前,将视觉特征向量库中的所有视觉特征向量,采用k-means聚类方法进行聚类,得到若干聚类集。具体的,随机初始化K个聚类中心,每个聚类中心的维度与视觉特征向量的维度一致,本实施例中均为2048维,将视觉特征向量库的视觉特征向量,根据K个聚类中心分为K个聚类集,可以使用C++中的向量容器记录K个聚类中心,向量的每个元素均是聚类中心自身,且聚类中心在向量中的位置与聚类中心的类别编号一致,另外,构建一个二维向量容器分别记录每个大类的视觉特征向量。其中,K可以根据实际图像数据库的大小进行调整优化。
获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集的具体方法为:获取预设的若干聚类集中各聚类集的聚类中心;计算各聚类集的聚类中心与线索视觉特征向量之间的距离,可以采用欧式距离或者余弦夹角距离,获取与线索视觉特征向量之间的距离前第一预设数量近的聚类中心所属的聚类集,得到与线索视觉特征向量相似度前第一预设数量高的聚类集。
具体的,通过对线索视觉特征向量与K个聚类中心依次进行距离计算,从K个聚类中心中选择距离线索视觉向量最近的D个聚类中心,进而确定这D个聚类中心对应的聚类集,D的大小可以根据实际需求进行调整,用来平衡检索的时间性能和检索结果与线索图像的相似度。其中,第一预设数量为1~3,如果对时间性能要求严格D可以取1,如果非常看重检索结果与线索图像的相似度,则D可以放大到3。D个聚类中心分属于D个聚类集,接下来线索视觉特征向量只需要在这D个聚类集中检索相似视觉特征向量即可。
S3:通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量。
其中,预设的距离计算方法为欧式距离计算方法或者余弦夹角距离计算方法,分别用于计算两向量间的欧式距离和余弦夹角距离。
其中,通过基于三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量的具体方法为:遍历各聚类集中各视觉特征向量:通过预设的距离计算方法,得到线索视觉特征向量与当前聚类集的聚类中心之间的距离,得到第一距离;获取当前聚类集中当前视觉特征向量与聚类中心之间的距离,得到第二距离;计算第一距离与第二距离之间差值的绝对值,得到第三距离;获取当前最小距离,当第三距离大于当前最小距离时,跳过当前视觉特征向量;否则,通过预设的距离计算方法,获取当前视觉特征向量与线索视觉特征向量之间的距离,得到第四距离;记录当前第四距离,并通过第四距离更新当前最小距离;遍历完成后,从记录的所有当前第四距离中选取第二预设数量小的当前第四距离,得到第二预设数量的目标第四距离;获取各目标第四距离对应的视觉特征向量,得到第二预设数量的相似视觉特征向量。
具体的,对D个聚类集根据类别编号从小到大的顺序依次进行检索,对任意一个聚类集进行检索时,由线索视觉特征向量按照顺序与该聚类集中每条视觉特征向量进行相似性比较,相似性比较原则是距离计算与三角不等式判定法二选一,优先使用三角不等式判定法进行相似性比较,如果三角不等式判定法不满足则使用距离计算的方式。
参见图2,具体通过以下策略实现:
由于在采用k-means聚类方法聚类时,已经计算出了各聚类集中的各视觉特征向量到其聚类中心的距离,另外S2中已经计算过了线索视觉特征向量和各聚类中心的距离,所以目前已经有了三角形的两条边了。图2中,a表示线索视觉特征向量,b表示聚类中心,c表示当前视觉特征向量,d表示当前和线索视觉特征向量之间的距离为阈值距离的视觉向量。
a到d的距离是当前的阈值距离,现在知道a到b的距离,即线索视觉特征向量与聚类中心的距离,和b到c的距离,即聚类中心与当前视觉特征向量的距离,计算出a到b的距离与b到c的距离之差绝对值,如果其大于a到d的距离,那么a到c的距离,即线索视觉向量与当前视觉特征向量的距离肯定大于a到d的距离。这样一来就不用计算a到c的距离,而直接将c排除掉,能够节省视觉向量距离计算所需的时间。如果a到b的距离与b到c的距离之差绝对值小于等于a到d的距离,则三角不等式判定法无法直接将c排除掉,需要实际计算a与c的距离,此时可以采用欧式距离或者余弦夹角距离,并通过计算出来的距离更新阈值距离。
这里,一开始当前最小距离设置为无穷大,以便先获得一个具体的当前最小距离,然后基于逐个遍历的形式,更新当前最小距离,最终从记录的所有当前第四距离中选取第二预设数量小的当前第四距离,作为目标第四距离,获取各目标第四距离对应的视觉特征向量,作为相似视觉特征向量,第二预设数量可根据相似度阈值设置,第二预设数量的数值越大表示相似度阈值越低,相似度阈值为线索视觉特征向量与检索出的视觉特征向量之间相似度的最小值。
本实施例中,通过比较三角不等式判定法和预设的距离计算方法结合的方式,以及仅使用距离计算方法的方式,得到如表1所示的结果,可见,本发明基于三角不等式的图像检索方法,在检索准确率大致相同的情况下,检索时间得到了极大的下降,有效提升了检索效率。
表1 检索方法结果对比表
Figure 919232DEST_PATH_IMAGE001
S4:获取各相似视觉特征向量对应的图像,得到检索结果。
最后,在获得了第二预设数量的相似视觉特征向量的基础上,根据视觉特征向量与电力系统图像数据库中图像的对应关系,获取各相似视觉特征向量对应的图像,得到和线索图像内容相似的图像,输出检索结果。
综上所述,本发明基于三角不等式的图像检索方法,通过聚类算法根据视觉特征向量的相似性将视觉特征向量库分为多个聚类集,图像检索时只需要根据线索视觉特征向量与聚类中心的相似性确定出D个聚类集,即第一预设数量的相似聚类集,后续的图像检索只需要将线索视觉特征向量与这第一预设数量的相似聚类集中的视觉特征向量进行相似性比较即可,假设K个相似聚类集中的视觉向量数目一致,通过聚类的方法,检索时的计算量将会仅是原来的D/K,检索的耗时将会得到大幅减少。线索视觉特征向量与筛选出的第一预设数量的相似聚类集中的视觉特征向量进行相似性比较时,借助三角不等式判定法,极大的减少线索视觉特征向量与视觉特征向量之间的距离计算次数,进一步减少检索的耗时。
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未披露的细节,请参照本发明方法实施例。
本发明再一实施例中,提供一种基于三角不等式的图像检索系统,能够用于实现上述的基于基于三角不等式的图像检索方法,具体的,该基于三角不等式的图像检索系统包括第一获取模块、相似聚类集确定模块、相似向量确定模块以及第二获取模块。
其中,第一获取模块用于获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;相似聚类集确定模块用于获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集;相似向量确定模块用于通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量;第二获取模块用于获取各相似视觉特征向量对应的图像,得到检索结果。
本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于基于三角不等式的图像检索方法的操作。
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关基于三角不等式的图像检索方法的相应步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于三角不等式的图像检索方法,其特征在于,包括以下步骤:
获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集;
通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量;
获取各相似视觉特征向量对应的图像,得到检索结果。
2.根据权利要求1所述的基于三角不等式的图像检索方法,其特征在于,所述提取线索图像的视觉特征向量的具体方法为:采用在ImageNet图像数据集上预训练过的Inception模型,提取线索图像的视觉特征向量。
3.根据权利要求1所述的基于三角不等式的图像检索方法,其特征在于,所述获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集的具体方法为:
获取预设的若干聚类集中各聚类集的聚类中心;计算各聚类集的聚类中心与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离前第一预设数量近的聚类中心所属的聚类集,得到与线索视觉特征向量相似度前第一预设数量高的聚类集。
4.根据权利要求1所述的基于三角不等式的图像检索方法,其特征在于,所述预设的若干聚类集通过如下方式得到:
获取图像数据库中的图像,并提取各图像的视觉特征向量;
将各图像的视觉特征向量采用k-means聚类方法聚类,得到若干聚类集。
5.根据权利要求1所述的基于三角不等式的图像检索方法,其特征在于,所述预设的距离计算方法为欧式距离计算方法或者余弦夹角距离计算方法。
6.根据权利要求1所述的基于三角不等式的图像检索方法,其特征在于,所述通过基于三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量的具体方法为:
遍历各聚类集中各视觉特征向量:
通过预设的距离计算方法,得到线索视觉特征向量与当前聚类集的聚类中心之间的距离,得到第一距离;
获取当前聚类集中当前视觉特征向量与聚类中心之间的距离,得到第二距离;
计算第一距离与第二距离之间差值的绝对值,得到第三距离;
获取当前最小距离,当第三距离大于当前最小距离时,跳过当前视觉特征向量;
否则,通过预设的距离计算方法,获取当前视觉特征向量与线索视觉特征向量之间的距离,得到第四距离;
记录当前第四距离,并通过第四距离更新当前最小距离;
遍历完成后,从记录的所有当前第四距离中选取第二预设数量小的当前第四距离,得到第二预设数量的目标第四距离;获取各目标第四距离对应的视觉特征向量,得到第二预设数量的相似视觉特征向量。
7.根据权利要求1所述的基于三角不等式的图像检索方法,其特征在于,所述第一预设数量为1~3。
8.一种基于三角不等式的图像检索系统,其特征在于,包括:
第一获取模块,用于获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
相似聚类集确定模块,用于获取预设的若干聚类集中与线索视觉特征向量相似度前第一预设数量高的聚类集,得到第一预设数量的相似聚类集;
相似向量确定模块,用于通过三角不等式判定法和预设的距离计算方法,获取所有相似聚类集中的所有视觉特征向量中,与线索视觉特征向量之间的相似度前第二预设数量高的视觉特征向量,得到第二预设数量的相似视觉特征向量;
第二获取模块,用于获取各相似视觉特征向量对应的图像,得到检索结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述基于三角不等式的图像检索方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于三角不等式的图像检索方法的步骤。
CN202111353379.0A 2021-11-15 2021-11-15 基于三角不等式的图像检索方法、系统、设备及存储介质 Active CN113792172B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111353379.0A CN113792172B (zh) 2021-11-15 2021-11-15 基于三角不等式的图像检索方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111353379.0A CN113792172B (zh) 2021-11-15 2021-11-15 基于三角不等式的图像检索方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113792172A true CN113792172A (zh) 2021-12-14
CN113792172B CN113792172B (zh) 2022-02-11

Family

ID=78955332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111353379.0A Active CN113792172B (zh) 2021-11-15 2021-11-15 基于三角不等式的图像检索方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113792172B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020002550A1 (en) * 2000-02-10 2002-01-03 Berman Andrew P. Process for enabling flexible and fast content-based retrieval
US6636849B1 (en) * 1999-11-23 2003-10-21 Genmetrics, Inc. Data search employing metric spaces, multigrid indexes, and B-grid trees
CN102096800A (zh) * 2009-12-14 2011-06-15 北京中星微电子有限公司 一种图像信息获取方法及装置
CN103049514A (zh) * 2012-12-14 2013-04-17 杭州淘淘搜科技有限公司 一种基于分层聚类的均衡图像聚类方法
CN104679887A (zh) * 2015-03-17 2015-06-03 广西大学 基于emd距离的大规模图像数据相似性搜索方法
CN104820718A (zh) * 2015-05-22 2015-08-05 哈尔滨工业大学 基于地理位置特征与全局视觉特征的图像分类和检索方法
CN106096065A (zh) * 2016-07-29 2016-11-09 贵州大学 一种多媒体对象的相似检索方法及装置
CN109241327A (zh) * 2017-07-03 2019-01-18 北大方正集团有限公司 图像检索方法及装置
CN109388727A (zh) * 2018-09-12 2019-02-26 中国人民解放军国防科技大学 一种基于聚类的bgp人脸快速检索方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6636849B1 (en) * 1999-11-23 2003-10-21 Genmetrics, Inc. Data search employing metric spaces, multigrid indexes, and B-grid trees
US20020002550A1 (en) * 2000-02-10 2002-01-03 Berman Andrew P. Process for enabling flexible and fast content-based retrieval
CN102096800A (zh) * 2009-12-14 2011-06-15 北京中星微电子有限公司 一种图像信息获取方法及装置
CN103049514A (zh) * 2012-12-14 2013-04-17 杭州淘淘搜科技有限公司 一种基于分层聚类的均衡图像聚类方法
CN104679887A (zh) * 2015-03-17 2015-06-03 广西大学 基于emd距离的大规模图像数据相似性搜索方法
CN104820718A (zh) * 2015-05-22 2015-08-05 哈尔滨工业大学 基于地理位置特征与全局视觉特征的图像分类和检索方法
CN106096065A (zh) * 2016-07-29 2016-11-09 贵州大学 一种多媒体对象的相似检索方法及装置
CN109241327A (zh) * 2017-07-03 2019-01-18 北大方正集团有限公司 图像检索方法及装置
CN109388727A (zh) * 2018-09-12 2019-02-26 中国人民解放军国防科技大学 一种基于聚类的bgp人脸快速检索方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ANDREW P.BERMAN等: "A flexible image database system for content-based retrieval", 《COMPUTER VISION AND IMAGE UNDERSTANDING》 *
周文昭等: "基于内容的图像检索系统的最新进展", 《计算机工程与应用》 *

Also Published As

Publication number Publication date
CN113792172B (zh) 2022-02-11

Similar Documents

Publication Publication Date Title
EP2284791B1 (en) Method of creating three-dimensional object identifying image database, processing apparatus and processing program
Du et al. Computer-aided plant species identification (CAPSI) based on leaf shape matching technique
CN110263659B (zh) 一种基于三元组损失和轻量级网络的指静脉识别方法及系统
Lai et al. Recognizing complex events in videos by learning key static-dynamic evidences
CN110019891B (zh) 图像存储方法、图像检索方法及装置
JP2006508446A5 (zh)
CN107223242B (zh) 用于在多个已存储图像中搜索相似图像的方法
CN113779303B (zh) 视频集合的索引方法、装置和存储介质及电子设备
CA2922296A1 (en) System and method for clustering data
CN110569390B (zh) 基于区分存储介质的海量案件数据高效检索方法
Andrade et al. Fusion of local and global descriptors for content-based image and video retrieval
Jenni et al. Pre-processing image database for efficient Content Based Image Retrieval
JP5518856B2 (ja) 改良された画像認識用の支援装置
Dagli et al. A framework for grid-based image retrieval
CN113792171B (zh) 基于内存管理的图像检索方法、系统、设备及存储介质
CN113792172B (zh) 基于三角不等式的图像检索方法、系统、设备及存储介质
CN106886783B (zh) 一种基于区域特征的图像检索方法及系统
CN110209895B (zh) 向量检索方法、装置和设备
Besiris et al. Key frame extraction in video sequences: a vantage points approach
US10268912B2 (en) Offline, hybrid and hybrid with offline image recognition
Wu et al. Automatic leaf recognition from a big hierarchical image database
CN113536020B (zh) 数据查询的方法、存储介质和计算机程序产品
KR101992631B1 (ko) 비동기 방식을 사용하는 파일 색인장치 및 그 방법
CN115757896A (zh) 向量检索方法、装置、设备及可读存储介质
CN104463627A (zh) 数据处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant