CN113792171B - 基于内存管理的图像检索方法、系统、设备及存储介质 - Google Patents
基于内存管理的图像检索方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN113792171B CN113792171B CN202111351063.8A CN202111351063A CN113792171B CN 113792171 B CN113792171 B CN 113792171B CN 202111351063 A CN202111351063 A CN 202111351063A CN 113792171 B CN113792171 B CN 113792171B
- Authority
- CN
- China
- Prior art keywords
- memory
- cluster set
- visual feature
- acquiring
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/55—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Library & Information Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于电力系统领域,公开了一种基于内存管理的图像检索方法、系统、设备及存储介质,通过获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1;获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间;当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤。降低了电力系统图像数据检索的时间,提高了检索速度。
Description
技术领域
本发明属于电力系统自动化领域,涉及一种基于内存管理的图像检索方法、系统、设备及存储介质。
背景技术
随着电力系统的规模越来越大,结构越来越复杂,对电力设备的管理也日趋重要,电力系统设备众多,且设备分布具有跨地域性的特点,因此如何管理这些设备,维护这些设备的参数信息,并随时可以查看这些设备的信息成为了一个急需解决的问题。就多种信息载体而言,图像能够起到一目了然的效果,近年来有些电力部门在电力设备管理方面也采用了对设备拍摄数字图像记录设备信息的管理方式,对于设备图像的使用主要有:1、从数字图像中分辨出设备类型;2、前后对比使用,管理者往往要将同一设备的历史图像同当前图像进行对比,观察漆面变化情况;3、从图像的附加信息中得知设备型号,设备所在地点,设备使用年限等参数。
最初这些图像以文件形式存储在电脑硬盘中,管理者只能逐个浏览,随着图像数量的增多,从中寻找目标图像非常困难,于是将设备图像作为图像数据库进行组织,如能依照线索图像从数量巨大,品种繁多的电力设备图像数据库中快速检索出目标设备图像,则可以大大提高电力部门的工作效率。目前,常用的检索方法为暴力匹配方案。
但是,对于暴力匹配的方案,一般使用图像视觉特征提取模型对一张图像提取特征,通常会得到2048维的视觉向量,对特征向量每一维使用4个字节存储,则每条特征向量需要8KB,100万张图像构建的数据库则需要7.63GB的内存存储。如果内存中无法放下库中所有的特征向量,则对于任意一个待匹配的特征向量,程序需要先将库中一部分特征向量加载进内存,等他们与待匹配特征向量计算距离之后,又要从内存中删除。之后再加载一部分特征向量进内存,在与待匹配特征向量计算距离,这样一直进行,直到当前这条待匹配的特征向量与库中特征向量都计算过距离之后,才能确定距离当前这条待匹配特征向量距离最近的特征向量。然后对于下一条待匹配的特征向量又要进行相同的操作,这样一来对于每一条特征向量其花费的时间都是很长的,所以暴力匹配在特征向量无法一次性加载进内存的情况下时间消耗巨大,完全不可行。
发明内容
本发明的目的在于克服上述现有技术中,现有基于内存管理的图像检索方法的时间消耗巨大的缺点,提供一种基于内存管理的图像检索方法、系统、设备及存储介质。
为达到上述目的,本发明采用以下技术方案予以实现:
本发明第一方面,一种基于内存管理的图像检索方法,包括以下步骤:
获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1;
获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间;
当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤;
其中,读取步骤:将相似聚类集从视觉特征向量库中读入内存中,进行结果获取步骤;结果获取步骤:获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。
本发明基于内存管理的图像检索方法进一步的改进在于:
所述获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集的具体方法为:
获取预设的若干聚类集中各聚类集的聚类中心;计算各聚类集的聚类中心与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离最近的聚类中心所属的聚类集,得到与线索视觉特征向量相似度最高的聚类集。
所述获取相似聚类集的位置信息的具体方法为:
获取相似聚类集的编号;根据相似聚类集的编号以及预设的聚类中心表,得到相似聚类集内第一个视觉特征向量的位置信息;当相似聚类集内第一个视觉特征向量的位置信息为在内存中时,相似聚类集的位置信息为在内存中;否则,相似聚类集的位置信息为不在内存中。
所述获取内存的当前可用空间的具体方法为:
获取内存中预设的内存特征向量表的实际长度与最大长度的差值,得到内存的当前可用空间。
所述按照访问次数从小到大的顺序删除内存中的聚类集的具体方法为:
通过预设的访问次数表,获取位于内存中预设的内存特征向量表中的各聚类集,并按照访问次数从大到小的顺序排列;
获取排列在最后的聚类集的编号,并根据排列在最后的聚类集的编号通过预设的聚类中心表,得到排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量;
根据排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量,将排列在最后的聚类集从内存特征向量表中删除。
所述获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量的具体方法为:
计算相似聚类集内各视觉特征向量与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离前预设数量近的视觉特征向量,得到相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量。
所述距离为欧式距离或余弦夹角距离。
本发明第三方面,一种基于内存管理的图像检索系统,包括:
获取模块,用于获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
相似聚类集确定模块,用于获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1;
位置确定模块,用于获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间;
读取模块,用于当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤;
其中,读取步骤:将相似聚类集从视觉特征向量库中读入内存中,进行结果获取步骤;结果获取步骤:获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。
本发明第三方面,一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述基于内存管理的图像检索方法的步骤。
本发明第四方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述基于内存管理的图像检索方法的步骤。
与现有技术相比,本发明具有以下有益效果:
本发明基于内存管理的图像检索方法,通过聚类集和访问次数的设计,实现对视觉特征向量库中的视觉特征向量进出内存进行高效的管理,能够最大程度上保证经常被匹配到的聚类集长时间位于内存中,避免了暴力匹配中每次检索视觉特征向量时,都需要将视觉特征向量库中所有的视觉特征向量都进出一次内存的问题,极大的降低了检索时间,提高了检索速度。
附图说明
图1为本发明的基于内存管理的图像检索方法流程框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
下面结合附图对本发明做进一步详细描述:
参见图1,本发明一实施例中,提供一种基于内存管理的图像检索方法,有效解决了现有电力系统图像数据检索时的时间消耗巨大的问题,具体包括以下步骤。
S1:获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量。
具体的,采用图像特征提取模型对线索图像提取视觉特征向量,图像特征提取模型可以选择在ImageNet数据集上预训练过的Inception模型,一张线索图像可以对应一个2048维的视觉特征向量。
同样的,在进行检索前,将电力系统图像数据库中的所有图像,采用上述的图像特征提取模型提取视觉特征向量,使用电力系统图像数据库中所有图像对应的视觉特征向量构建一个视觉特征向量库,进而将图像检索工作转换为视觉特征向量的检索工作,相比于直接对图像进行检索极大的减少了使用时的计算量。
S2:获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1。
具体的,在进行检索前,将视觉特征向量库中的所有视觉特征向量,采用k-means聚类方法进行聚类,得到若干聚类集。具体的,随机初始化K个聚类中心,每个聚类中心的维度与视觉特征向量的维度一致,本实施例中,均为2048维,将视觉特征向量库的视觉特征向量根据K个聚类中心分为K个聚类集,构建一个聚类中心表记录K个聚类中心,另外构建K个表分别记录每个聚类集的视觉特征向量。其中,K可以根据实际图像数据库进行调整优化。
所述获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集的具体方法为:获取预设的若干聚类集中各聚类集的聚类中心;计算各聚类集的聚类中心与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离最近的聚类中心所属的聚类集,得到与线索视觉特征向量相似度最高的聚类集。
其中,距离为欧式距离或余弦夹角距离。
S3:获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间。
具体的,本实施例中,在进行检索前,构建三张常驻内存的表用于管理位于内存中的视觉特征向量,这三张表可以采用C++语言中的向量容器来实现。第一张表是聚类中心表,用于记录K个聚类中心的相关信息。第二张表是访问次数统计表,用来统计K个聚类集累计被作为相似聚类集的次数。第三张表是内存特征向量表,用于记录位于内存中的视觉向量相关信息。
其中,参见表1,聚类中心表有四个字段,第一个字段是聚类类别,表示聚类中心所属的聚类集的编号;第二个字段是数量,表示该聚类集中的视觉特征向量数目;第三个字段是聚类中心,存储聚类中心自身,聚类中心自身就是一个2048维的特征向量;第四个字段是位置,表示该聚类集第一个视觉特征向量在内存特征向量表中的位置,具体的,取值为-1表示该聚类集的视觉特征向量不在内存特征向量表中,聚类中心表的排序规则是按照聚类集的编号从小到大排列。
表1聚类中心表
参见表2,访问次数统计表有三个字段,第一个字段是聚类类别,表示聚类集的编码;第二个字段是存储位置,表示该聚类集的视觉特征向量是否位于内存特征向量表中,如果是则取值为1,如果否则取值为0;第三个字段是访问次数,表示该聚类集被线索视觉向量作为相似聚类集的累计次数。另外,访问次数统计表根据存储位置字段取1还是取0分为第一部分和第二部分,第一部分的存储位置字段值取1,对应的聚类集需要保持排序状态,排序的标准是访问次数字段的值从大到小排列。另外,设置全局变量指针last_mem_tuple指向存储位置取值为1,且排在最后的聚类集,便于直接获取该聚类集。
表2 访问次数统计表
参见表3,内存特征向量表有三个字段,第一个字段是位置,表示该视觉特征向量在内存特征向量表中的位置,从0开始递增编号;第二个字段是聚类类别,表示该视觉特征向量所属聚类集;第三个字段是特征向量,存储的是视觉特征向量自身,内存特征向量表的排序规则是:同一个聚类集的视觉特征向量相邻存储,另外内存特征向量表设置最大长度max_length,用来保证内存特征向量表不会将计算机内存占满,max_length可以根据实际使用设备进行调整,取值越大越好。
表3 内存特征向量表
基于此,本实施例中,获取相似聚类集的位置信息的方法为:获取相似聚类集的编号;根据相似聚类集的编号以及预设的聚类中心表,得到相似聚类集内第一个视觉特征向量的位置信息;当相似聚类集内第一个视觉特征向量的位置信息为在内存中时,相似聚类集的位置信息为在内存中;否则,相似聚类集的位置信息为不在内存中。
接着,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;结果获取步骤具体为:获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。具体的,获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量的具体方法为:计算相似聚类集内各视觉特征向量与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离前预设数量近的视觉特征向量,得到相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量。
否则,即相似聚类集的位置信息为不在内存中时,获取内存的当前可用空间。其中,获取内存的当前可用空间的方法为:获取内存中预设的内存特征向量表的实际长度与最大长度的差值,得到内存的当前可用空间。每个视觉特征向量所需的存储空间为内存特征向量表的一个单位长度。
S4:当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤。
其中,读取步骤具体为:将相似聚类集从视觉特征向量库中读入内存中,进行结果获取步骤。
具体的,当线索视觉向量最相似的聚类集不在内存特征向量表中时,需要判断内存特征向量表实际长度与其最大长度max_length的差值,是否大于等于相似聚类集的视觉特征向量数量,如果差值大于等于相似聚类集的视觉特征向量数量,则直接将相似聚类集的视觉特征向量从视觉特征向量库中读入到内存的内存特征向量表中,并修改内存特征向量表中的相似聚类集的位置字段取值以及访问次数统计表中相似聚类集的存储位置字段取值,对访问次数统计表重新进行排序,last_mem_tuple指向存储位置字段取值为1且访问次数最小的聚类集。
如果差值小于相似聚类集的视觉特征向量数量,按照访问次数从小到大的顺序删除内存中的聚类集,至大于等于相似聚类集的视觉特征向量数量。其中,所述按照访问次数从小到大的顺序删除内存中的聚类集的具体方法为:通过预设的访问次数表,获取位于内存中预设的内存特征向量表中的各聚类集,并按照访问次数从大到小的顺序排列;获取排列在最后的聚类集的编号,并根据排列在最后的聚类集的编号通过预设的聚类中心表,得到排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量;根据排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量,将排列在最后的聚类集从内存特征向量表中删除。
具体的,如果差值小于相似聚类集的视觉特征向量数量,需要对访问次数统计表进行检索,由于访问次数统计表存储位置字段值取1的元组按照访问次数字段的取值处于排序状态,所以直接由last_mem_tuple指针获取到被替换的聚类集,根据被替换聚类集的编号从聚类中心表中获取到其在内存特征向量表中的位置,以及其包含视觉特征向量的数量,然后将被替换聚类集的视觉特征向量从内存特征向量表中删除,这样一来内存特征向量表的实际长度则减小了。修改聚类中心表中被替换聚类集的位置字段的值,以及访问次数统计表中被替换聚类集的存储位置字段的值,并见last_mem_tuple指针向前移动一位,指向当前存储位置字段取值为1且访问次数最小的聚类集。
综上所述,本发明基于内存管理的图像检索方法,通过获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,实现线索视觉特征向量与视觉特征向量库中的视觉特征向量的初步匹配,并将相似聚类集的访问次数+1。在此基础上,获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤,获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。否则,获取内存的当前可用空间,当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤,将相似聚类集从视觉特征向量库中读入内存中,否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,然后将相似聚类集从视觉特征向量库中读入内存中。基于访问次数,通过对视觉特征向量库中的视觉特征向量进出内存进行管理,能够最大程度上保证经常被匹配到的聚类集长时间位于内存中,避免了暴力匹配时每次检索视觉特征向量时,都需要将视觉特征向量库中所有的视觉特征向量进出一次内存的问题,极大的提高了检索速度。
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未纰漏的细节,请参照本发明方法实施例。
本发明再一实施例中,提供一种基于内存管理的图像检索系统,能够用于实现上述的基于内存管理的图像检索方法,具体的,该基于内存管理的图像检索系统包括获取模块、相似聚类集确定模块、位置确定模块以及读取模块。
获取模块用于获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;相似聚类集确定模块用于获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1;位置确定模块用于获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间;读取模块用于当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤;其中,读取步骤:将相似聚类集从图像数据库中读入内存中,进行结果获取步骤;结果获取步骤:获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。
本发明再一个实施例中,提供了一种计算机设备,该计算机设备包括处理器以及存储器,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器用于执行所述计算机存储介质存储的程序指令。处理器可能是中央处理单元(CentralProcessing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital SignalProcessor、DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其是终端的计算核心以及控制核心,其适于实现一条或一条以上指令,具体适于加载并执行计算机存储介质内一条或一条以上指令从而实现相应方法流程或相应功能;本发明实施例所述的处理器可以用于基于内存管理的图像检索方法的操作。
本发明再一个实施例中,本发明还提供了一种存储介质,具体为计算机可读存储介质(Memory),所述计算机可读存储介质是计算机设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机可读存储介质既可以包括计算机设备中的内置存储介质,当然也可以包括计算机设备所支持的扩展存储介质。计算机可读存储介质提供存储空间,该存储空间存储了终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机可读存储介质可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。可由处理器加载并执行计算机可读存储介质中存放的一条或一条以上指令,以实现上述实施例中有关基于内存管理的图像检索方法的相应步骤。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (8)
1.一种基于内存管理的图像检索方法,其特征在于,包括以下步骤:
获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1;
获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间;
所述获取相似聚类集的位置信息的具体方法为:
获取相似聚类集的编号;根据相似聚类集的编号以及预设的聚类中心表,得到相似聚类集内第一个视觉特征向量的位置信息;当相似聚类集内第一个视觉特征向量的位置信息为在内存中时,相似聚类集的位置信息为在内存中;否则,相似聚类集的位置信息为不在内存中;
当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤;
所述按照访问次数从小到大的顺序删除内存中的聚类集的具体方法为:
通过预设的访问次数表,获取位于内存中预设的内存特征向量表中的各聚类集,并按照访问次数从大到小的顺序排列;
获取排列在最后的聚类集的编号,并根据排列在最后的聚类集的编号通过预设的聚类中心表,得到排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量;
根据排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量,将排列在最后的聚类集从内存特征向量表中删除;
其中,读取步骤:将相似聚类集从视觉特征向量库中读入内存中,进行结果获取步骤;结果获取步骤:获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。
2.根据权利要求1所述的基于内存管理的图像检索方法,其特征在于,所述获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集的具体方法为:
获取预设的若干聚类集中各聚类集的聚类中心;计算各聚类集的聚类中心与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离最近的聚类中心所属的聚类集,得到与线索视觉特征向量相似度最高的聚类集。
3.根据权利要求1所述的基于内存管理的图像检索方法,其特征在于,所述获取内存的当前可用空间的具体方法为:
获取内存中预设的内存特征向量表的实际长度与最大长度的差值,得到内存的当前可用空间。
4.根据权利要求1所述的基于内存管理的图像检索方法,其特征在于,所述获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量的具体方法为:
计算相似聚类集内各视觉特征向量与线索视觉特征向量之间的距离,获取与线索视觉特征向量之间的距离前预设数量近的视觉特征向量,得到相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量。
5.根据权利要求2或4所述的基于内存管理的图像检索方法,其特征在于,所述距离为欧式距离或余弦夹角距离。
6.一种基于内存管理的图像检索系统,其特征在于,包括:
获取模块,用于获取线索图像,并提取线索图像的视觉特征向量,得到线索视觉特征向量;
相似聚类集确定模块,用于获取预设的若干聚类集中与线索视觉特征向量相似度最高的聚类集,得到相似聚类集,并将相似聚类集的访问次数+1;
位置确定模块,用于获取相似聚类集的位置信息,当相似聚类集的位置信息为在内存中时,进行结果获取步骤;否则,获取内存的当前可用空间;所述获取相似聚类集的位置信息的具体方法为:
获取相似聚类集的编号;根据相似聚类集的编号以及预设的聚类中心表,得到相似聚类集内第一个视觉特征向量的位置信息;当相似聚类集内第一个视觉特征向量的位置信息为在内存中时,相似聚类集的位置信息为在内存中;否则,相似聚类集的位置信息为不在内存中;
读取模块,用于当内存的当前可用空间>相似聚类集所需的存储空间时,进行读取步骤;否则,按照访问次数从小到大的顺序删除内存中的聚类集,至内存的当前可用空间>相似聚类集所需的存储空间,进行读取步骤;所述按照访问次数从小到大的顺序删除内存中的聚类集的具体方法为:
通过预设的访问次数表,获取位于内存中预设的内存特征向量表中的各聚类集,并按照访问次数从大到小的顺序排列;
获取排列在最后的聚类集的编号,并根据排列在最后的聚类集的编号通过预设的聚类中心表,得到排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量;
根据排列在最后的聚类集内第一个视觉特征向量在内存特征向量表中的位置以及排列在最后的聚类集内的视觉特征向量的数量,将排列在最后的聚类集从内存特征向量表中删除;
其中,读取步骤:将相似聚类集从视觉特征向量库中读入内存中,进行结果获取步骤;结果获取步骤:获取相似聚类集内与线索视觉特征向量相似度前预设数量高的视觉特征向量对应的图像,得到检索结果。
7.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5 任一项所述基于内存管理的图像检索方法的步骤。
8.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5 任一项所述基于内存管理的图像检索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111351063.8A CN113792171B (zh) | 2021-11-15 | 2021-11-15 | 基于内存管理的图像检索方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111351063.8A CN113792171B (zh) | 2021-11-15 | 2021-11-15 | 基于内存管理的图像检索方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113792171A CN113792171A (zh) | 2021-12-14 |
CN113792171B true CN113792171B (zh) | 2022-02-18 |
Family
ID=78955348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111351063.8A Active CN113792171B (zh) | 2021-11-15 | 2021-11-15 | 基于内存管理的图像检索方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113792171B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114140696A (zh) * | 2022-01-27 | 2022-03-04 | 深圳市慧为智能科技股份有限公司 | 商品识别系统优化方法、装置、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0817118A2 (en) * | 1996-06-27 | 1998-01-07 | Cirrus Logic, Inc. | Memory management of texture maps |
CN106776361A (zh) * | 2017-03-10 | 2017-05-31 | 安徽大学 | 一种面向大规模非易失性存储介质的缓存方法和系统 |
CN110647502A (zh) * | 2018-06-26 | 2020-01-03 | 中兴通讯股份有限公司 | 一种文件加载方法、设备、装置和计算机存储介质 |
CN112948613A (zh) * | 2020-12-01 | 2021-06-11 | 上海云从企业发展有限公司 | 图像增量聚类方法、系统、介质及装置 |
CN113068074A (zh) * | 2021-03-24 | 2021-07-02 | 浙江大华技术股份有限公司 | 缓存方法和装置、计算机可读的存储介质及电子装置 |
CN113297409A (zh) * | 2021-06-30 | 2021-08-24 | 杭州海康威视数字技术股份有限公司 | 一种图像搜索方法、装置、电子设备及存储介质 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101493821A (zh) * | 2008-01-25 | 2009-07-29 | 中兴通讯股份有限公司 | 数据缓存方法和装置 |
CN106776849B (zh) * | 2016-11-28 | 2020-01-10 | 西安交通大学 | 一种以图快速检索景点的方法及导游系统 |
CN108280229B (zh) * | 2018-02-26 | 2022-01-25 | 腾讯科技(深圳)有限公司 | 内存数据读写方法和装置 |
CN108875828B (zh) * | 2018-06-19 | 2022-01-28 | 太原学院 | 一种相似图像的快速匹配方法和系统 |
CN109685044B (zh) * | 2019-02-18 | 2023-06-06 | 上海德拓信息技术股份有限公司 | 基于k均值聚类算法的人脸识别检索方法 |
CN111783805A (zh) * | 2019-04-04 | 2020-10-16 | 京东方科技集团股份有限公司 | 图像检索方法及装置、电子设备、可读存储介质 |
CN111651625A (zh) * | 2020-04-29 | 2020-09-11 | 中国平安财产保险股份有限公司 | 图像检索方法、装置、电子设备及存储介质 |
CN111651624B (zh) * | 2020-06-11 | 2023-09-19 | 浙江大华技术股份有限公司 | 一种图像检索方法及装置 |
CN112084366B (zh) * | 2020-09-11 | 2024-04-09 | 北京百度网讯科技有限公司 | 用于检索图像的方法、装置、设备以及存储介质 |
CN113377984B (zh) * | 2021-06-08 | 2023-09-15 | 中山大学 | 一种基于数据库的人脸搜索方法 |
-
2021
- 2021-11-15 CN CN202111351063.8A patent/CN113792171B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0817118A2 (en) * | 1996-06-27 | 1998-01-07 | Cirrus Logic, Inc. | Memory management of texture maps |
CN106776361A (zh) * | 2017-03-10 | 2017-05-31 | 安徽大学 | 一种面向大规模非易失性存储介质的缓存方法和系统 |
CN110647502A (zh) * | 2018-06-26 | 2020-01-03 | 中兴通讯股份有限公司 | 一种文件加载方法、设备、装置和计算机存储介质 |
CN112948613A (zh) * | 2020-12-01 | 2021-06-11 | 上海云从企业发展有限公司 | 图像增量聚类方法、系统、介质及装置 |
CN113068074A (zh) * | 2021-03-24 | 2021-07-02 | 浙江大华技术股份有限公司 | 缓存方法和装置、计算机可读的存储介质及电子装置 |
CN113297409A (zh) * | 2021-06-30 | 2021-08-24 | 杭州海康威视数字技术股份有限公司 | 一种图像搜索方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
NUMA架构下数据热度的内存数据库日志恢复技术;吴刚;《计算机科学与探索》;20200117;第941-949页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113792171A (zh) | 2021-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11288314B2 (en) | Method and apparatus for multi-dimensional content search and video identification | |
Norouzi et al. | Fast exact search in hamming space with multi-index hashing | |
CN110162695B (zh) | 一种信息推送的方法及设备 | |
CN110321344B (zh) | 关联数据的信息查询方法、装置、计算机设备及存储介质 | |
EP2284791B1 (en) | Method of creating three-dimensional object identifying image database, processing apparatus and processing program | |
Kashyap et al. | Scalable knn search on vertically stored time series | |
CN110888981B (zh) | 基于标题的文档聚类方法、装置、终端设备及介质 | |
JP2005011042A (ja) | データ検索方法、データ検索装置、データ検索プログラムおよびコンピュータで読み取り可能な記録媒体 | |
JPH07105239A (ja) | データ・ベース管理方法およびデータ・ベース検索方法 | |
CN113792171B (zh) | 基于内存管理的图像检索方法、系统、设备及存储介质 | |
CN112286961B (zh) | Sql优化查询方法及装置 | |
CN110083731B (zh) | 图像检索方法、装置、计算机设备及存储介质 | |
CN111367956B (zh) | 数据统计方法及装置 | |
Bøgh et al. | Hashcube: A Data Structure for Space-and Query-Efficient Skycube Compression. | |
CN111143587B (zh) | 一种数据检索方法、装置及电子设备 | |
US10268912B2 (en) | Offline, hybrid and hybrid with offline image recognition | |
CN113792172B (zh) | 基于三角不等式的图像检索方法、系统、设备及存储介质 | |
CN110888909A (zh) | 一种评估内容的数据统计处理方法及装置 | |
CN114610960A (zh) | 基于item2vec和向量聚类的实时推荐方法 | |
Smelyakov et al. | Object-Based Image Comparison Algorithm Development for Data Storage Management Systems. | |
CN111460088A (zh) | 相似文本的检索方法、装置和系统 | |
KR100446639B1 (ko) | 셀 기반의 고차원 데이터 색인 장치 및 그 방법 | |
CN111339082B (zh) | 一种基于检索式的指标数据图表解读方法 | |
CN108052554A (zh) | 多维度拓展关键词的方法和装置 | |
CN117555993A (zh) | Erp系统中多维数据的检索方法、装置和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |