CN113159211B - 用于相似图像检索的方法、计算设备和计算机存储介质 - Google Patents

用于相似图像检索的方法、计算设备和计算机存储介质 Download PDF

Info

Publication number
CN113159211B
CN113159211B CN202110480491.4A CN202110480491A CN113159211B CN 113159211 B CN113159211 B CN 113159211B CN 202110480491 A CN202110480491 A CN 202110480491A CN 113159211 B CN113159211 B CN 113159211B
Authority
CN
China
Prior art keywords
image
retrieved
matrix
data set
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110480491.4A
Other languages
English (en)
Other versions
CN113159211A (zh
Inventor
张万军
甄选军
袁玉波
张智燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Haoan Supply Chain Management Co ltd
Original Assignee
Hangzhou Haoan Supply Chain Management Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Haoan Supply Chain Management Co ltd filed Critical Hangzhou Haoan Supply Chain Management Co ltd
Priority to CN202110480491.4A priority Critical patent/CN113159211B/zh
Publication of CN113159211A publication Critical patent/CN113159211A/zh
Application granted granted Critical
Publication of CN113159211B publication Critical patent/CN113159211B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本发明公开一种用于相似图像检索的方法,包括:获取待检索图像和图像数据集;提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵;根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵;针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序;以及基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。本发明解决了海量图像检索运行效率低的技术问题,不但提高了计算速度,缩减了存储空间的占用;尤其是对不规则形状的耗材图像的相似性检索同样有效。

Description

用于相似图像检索的方法、计算设备和计算机存储介质
技术领域
本发明涉及图像处理技术领域,尤其涉及一种用于相似图像检索的方法、计算设备和计算机存储介质。
背景技术
现有技术中,图像检索的方式主要分为两种:一种是文本层面的图像检索,另一种是内容层面的图像检索。文本层面的的图像检索依赖于文字表述,若图像的描述关键词错误会导致检索结果发生偏差,当面对大量的网络图像时,具有人工标注的工作量巨大、描述片面的缺点。而内容图像检索将重点放在图像内容的提取上,具有直观、方便的优点。但由于图像特征多且样本量大,内容图像检索过程往往被设计的复杂繁琐,以至于目前主流的图像搜索仍然将文本检索方法作为其系统的主要部分。
但是在某些特定的环境中,用户希望在数据集中寻找相似耗材图像总结信息,获得某条耗材图像的相似数据量,以进行数据分析。比如,超市决策者希望在某个数据集中获得与某个用户具有相似特征的用户,进而观察这些用户的购买行为,制定销售策略。
目前,对于相似耗材图像的发现工作,还没有一个自动化且快速的相似耗材图像发现方法。
发明内容
鉴于现有技术存在用于相似图像检索的复杂度较大的技术问题,本发明实施例提供了一种用于相似图像检索的方法、计算设备和计算机存储介质。
第一方面,本发明实施例提供一种用于相似图像检索的方法,包括:
获取待检索图像和图像数据集;
提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵;
根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵;
针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序;以及
基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。
结合第一方面,在第一方面的第一种可能的实现方式中,所述获取待检索图像和图像数据集,包括:
用户输入待检索图像和图像数据集;或者
通过预设数据传输接口接收待检索图像和图像数据集;或者
用户输入待检索图像和图像数据集中的一个,另一个通过预设数据传输接口接收获得。
结合第一方面,在第一方面的第二种可能的实现方式中,所述提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵,包括:
提取所述待检索图像的特征,生成所述待检索图像的特征向量;以及
分别以特征属性为列,以图像标识为行生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵。
结合第一方面的第二种可能的实现方式,在第一方面的第三种可能的实现方式中,所述提取方法,包括:
颜色直方图、颜色矩、纹理滤波特征和关键点特征。
结合第一方面,在第一方面的第四种可能的实现方式中,所述根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵,具体包括:
如果所述图像特征矩阵满秩,则按所述待检索图像的特征的重要程度生成所述图像信息矩阵的主子空间矩阵;
如果所述图像特征矩阵不满秩,则对所述图像信息矩阵进行奇异值分解,获得降维后的主子空间矩阵。
结合第一方面的第四种可能的实现方式,在第一方面的第五种可能的实现方式中,所述针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序,包括:
根据主子空间矩阵秩的大小,确定最大的一个为主子空间;
响应于确定的主子空间,将根据所述图像特征矩阵中特征的重要程度,从高到低对所述图像信息矩阵进行排序。
结合第一方面,在第一方面的第六种可能的实现方式中,所述基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果,包括:
响应于相似度计算结果和预设相似度阈值,对所述图像特征矩阵的特征的重要程度进行排序,优先级高的将优先进行相似性比对和筛选,以便逐步缩小图像检索范围。
结合第一方面,在第一方面的第七种可能的实现方式中,在所述获取待检索图像和图像数据集之后,所述提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵之前,还包括:
识别所述待检索图像是否具有类别标识;
如果是,则对所述图像数据集中不具有该类别标识的相似图像,进行删除处理;
否则,则对在所述图像数据集中具有类标识的相似图像的类标识,进行删除处理。
第二方面,本发明实施例提供一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现第一方面至第一方面的第七种可能的实现方式中任一项所述的方法的步骤。
第三方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面至第一方面的第六种可能的实现方式中任一项所述的方法。
本发明实施例提供的一种或者多种技术方案,至少实现了如下技术效果或者优点:
(1)由于本发明首先获取待检索图像和图像数据集;然后提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵;再根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵;然后针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序;以及基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。因此,不需要像神经元网络和采用哈希算法那样进行多层次迭代而增加运算的复杂度,由此解决了海量图像检索运行效率低的技术问题,不但提高了计算速度,还大大缩减了存储空间的占用;
(2)由于本发明是基于主子空间的采用主子成分分析方法的相似图像检索方法,从而避免了现有技术中运用哈希值和图像标识只能对规则图像进行检索的技术局限,本发明技术方案对不规则形状的耗材图像的相似性检索同样有效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的用于相似图像检索的方法流程图;
图2为本发明实施例提供的相似图像检索系统的程序模块图;
图3为本发明实施例提供的计算机可读存储介质的结构示意图;
图4为本发明实施例提供的计算机设备的结构示意图。
具体实施方式
鉴于现有技术存在针对海量图像检索的复杂度较大以及无法针对具有不规则形状的耗材图像进行检索的技术问题,本发明实施例提供了一种基于主子空间的用于相似图像检索的方法,总体思路如下:
用户提供一个待检索图像F和图像数据集I,该图像数据集I中可能存在与该待检索图像F的图像特征相似的图像;首先利用颜色直方图、颜色矩、纹理滤波特征(Gabor特征)和关键点特征(SIFT特征)等特征提取方法提取该待检索图像F的图像特征,获得待检索图像F的耗材特征数据集M和供检索的图像数据集I的目标特征数据集N;如果耗材特征数据集M矩阵满秩,则按特征的重要程度构成待检索图像F搜寻的主子空间并确定相似性阈值;如果耗材特征数据矩阵不满秩,对数据集进行奇异值分解(Singular Value Decomposition,SVD)降维,得到正交分解后的主子空间矩阵;(5)在主子空间上的执行度量相似性搜索,按照阈值,得到距离最小的耗材图像集。本方法的特点在于基于主子空间构造了新的方法,实现了相似耗材图像发现,帮助用户自动化筛选相似耗材图像。目的是选取有意义的少量耗材图像做为训练集,在不降低分类正确率的情况下,通过减少耗材图像量来提升分类模型的速度。在耗材图像选择的过程中,会过滤到冗余耗材图像、噪声耗材图像及无用耗材图像。对于耗材图像选择中和分类模型构建过程中,冗余耗材图像不但没有任何益处反而会加大运算开销。
通过上述技术方案,可见,本发明用于相似图像检索的方法,只需要用户提供一个所需寻找的相似耗材图像及一个寻找范围(数据集),即可自动化确定相似阈值并发现相似耗材图像,并在寻找范围过大时可快速发现相似耗材图像,加快了检索速度。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种用于相似图像检索的方法,请参考图1所示,包括如下步骤:
首先,执行步骤S101:获取待检索图像和图像数据集。
具体的,待检索图像和图像数据集可以采用如下的实施方式:
A1、用户输入待检索图像和图像数据集;或者
A2、通过预设数据传输接口接收待检索图像和图像数据集;或者
A3、用户输入待检索图像和图像数据集中的一个,另一个通过预设数据传输接口接收获得。
在步骤S101之后,接着执行步骤S102:提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵。
需要说明的是,图像特征的种类较多,例如全局特征、颜色特征和纹理特征,其中全局特征是对图像的整体量化表示,颜色特征是人眼可直接观察到的不受图像形变影响的数据,纹理特征是由图像像素点按照一定排列规律组成的信息,选取不同的特征会直接导致检索结果发生变化。在实际应用中,只选择单一的图像特征得到的检索效果不理想,因此使用特征融合方法对图像检索具有重要意义。提取所述待检索图像的特征,以便获得待检索图像F的耗材特征数据集M(即对应图像特征矩阵)和供检索的图像数据集I的目标特征数据集N(即对应图像信息矩阵)。
具体来讲,在步骤S102具体包括如下步骤S1021~S1022:
执行步骤S1021:提取所述待检索图像的特征,生成所述待检索图像的特征向量。
本实施例中,所述待检索图像的特征所述提取方法,包括颜色直方图、颜色矩、纹理滤波特征(Gabor)、关键点特征(SIFT)等。在实际应用中,只选择单一的图像特征得到的检索效果不理想,因此使用采用不同的特征提取方法分别对所述待检索图像的特征进行提取,所提取的特征越多,检索结果的相似度越高。
在步骤S1021之后,继续执行步骤S1022:分别以特征属性为列,以图像标识为行生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵。
需要说明的是,此处的图像标识仅是为了形成矩阵而设,与图像的类别标识无关。
在步骤S102之后,接着执行步骤S103:根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵。
需要说明的是,在本发明中,主子空间是要进行相似耗材图像发现的一个搜索子空间。首先,介绍子空间的定义:若V1是域P上线性空间V的一个非空子集,V1中任意两个向量α和β,α+β∈V,且域P上任一数k与V1中任一向量α的乘积kα∈V,那么V1是V的一个子空间。
在一实施方式中,步骤S103)根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵,具体包括如下步骤:
如果所述图像特征矩阵满秩,则按所述待检索图像的特征的重要程度生成所述图像信息矩阵的主子空间矩阵;
如果所述图像特征矩阵不满秩,则对所述图像信息矩阵进行奇异值分解,获得降维后的主子空间矩阵。
需要说明的是,对于该步骤中图像特征矩阵的满秩计算,是为了判断是否需要对图像信息矩阵进行降维。一般,图像数据集中的耗材图像数都大于维数,对图像特征矩阵计算秩的大小,就是判断特征之间是否存在线性相关,即两个线性相关的特征提供的信息是重复的,其中一个为冗余特征。为了加快相似耗材图像发现过程的速度,应将冗余的特征去除,即进行降维处理。
对于该步骤中对所述图像信息矩阵进行降维的处理使用奇异值分解方法,通过奇异值分解得到的一个投影矩阵,将数据集投影到一个新的低维空间中。投影矩阵可先由python的numpy.linalg.svd()函数进行奇异值分解,得到Um×n、Σn×n、Vn×n三个矩阵,其中Σ中得到的是奇异值,按从大到小排列,其中值>0的个数就是降维后的维数r。因此在V矩阵中选取前r个行向量构成矩阵Vr×n,将其转置后即为投影矩阵,右乘于图像特征矩阵。同样对待检索图像也进行相同的投影映射。
在步骤S103之后,接着执行步骤S104:针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序。
需要说明的是,主成分分析,或称为PCA,是一种被广泛使用的技术,应用的领域包括维度降低、有损数据压缩、特征抽取、数据可视化。也被称为Karhunen-Loeve变换。PCA可以被定义为数据在低维线性空间上的正交投影,这个线性空间被称为主子空间(principalsubspace),使得投影数据的方差被最大化。
在本发明中,对于相似耗材图像的搜索空间可以存在多个子空间,根据子空间秩的大小,最大的一个则称为主子空间。在主子空间中,将根据处理后的耗材特征数据集M中特征的重要程度,从大到小进行相似耗材图像的搜索过程。
D=[X1,X2,…,Xn]
其中,n是特征维度的个数。对D中的特征按照特征距离为优先级,从高到低排序后,得到特征序列F_sort[],因此主子空间为:
D'=[XF_sort[1],XF_sort[2],…,XF_sort[n]]
即在主子空间中,对特征的重要顺序进行了排序,优先级高的将优先进行相似比对和筛选。
在一实施方式中,步骤S104具体包括如下步骤S1041~S1042:
首先,执行步骤S1041、根据主子空间矩阵秩的大小,确定最大的一个为主子空间。
执行步骤S1041后,接着执行步骤S1042、响应于确定的主子空间,将根据所述图像特征矩阵中特征的重要程度,从高到低对所述图像信息矩阵进行排序。
在步骤S104之后,接着执行步骤S105、基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。
为了逐步缩小图像检索范围,在一实施方式中,步骤S105,具体包括如下步骤:响应于相似度计算结果和预设相似度阈值,对所述图像特征矩阵的特征的重要程度进行排序,优先级高的将优先进行相似性比对和筛选,以便逐步缩小图像检索范围。
需要说明的是,本步骤中将对图像数据集中每个特征进行一次相似比对过程,并在每次比对过程中逐步缩小搜寻范围。因此,需要确定图像数据集中的哪些特征更为重要,即在主子空间内搜寻待检索图像F,因为本方法中相似阈值的设定会随着搜索空间的不断变化而改变。耗材图像搜寻的范围每经过一次搜索都会缩小,因此,将一个特征作为前一次相似对比时的阈值与作为下一次相似对比的阈值是不一样的,最终筛选得到的耗材图像也将不尽相同。因此在每个特征上进行的对比顺序是至关重要的。每次搜索都将使用PCA选出当前数据集中最重要的一个特征进行相似度比对,如果这个最重要的特征已经相似比对过,则选次重要特征,依次类推。特征重要性可由PCA中贡献度最大的特征,对应的原特征的线性相关系数决定。某个特征的相似阈值的设定,由当前搜索范围的数据集的此特征中的最大值与最小值之差的值乘0.1作为此特征上的相似阈值。具体的相似耗材图像发现过程参见后面的算法2。
在一实施方式中,在步骤S101)获取待检索图像和图像数据集之后,在步骤S102)提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵之前,执行步骤B、对所述图像数据集进行预处理,具体包括如下步骤:
识别所述待检索图像是否具有类别标识;
如果是,则对所述图像数据集中不具有该类别标识的相似图像,进行删除处理;
否则,则对在所述图像数据集中具有类标识的相似图像的类标识,进行删除处理。
在具体实施过程中,本发明实施例提供的用于相似图像检索的方法可以应用于针对具有不规则图像的相似耗材图像的检索,下面,以在耗材图像数据集D(相当于前述图像数据集I)中检索相似耗材图像S(相当于前述待检索图像F)为例,将具体的该步骤B的伪代码展示如下:
Figure BDA0003049038220000101
Figure BDA0003049038220000111
由上述步骤可知,本方法可以对多种搜寻情况进行分别处理。对于用户的输入将出现以下几种情况:(1)分类数据库中搜寻具有类别标识的相似耗材图像S,即根据搜寻耗材图像S的类标识提取D中与之类别对应的耗材图像集合,初步缩小搜寻范围。(2)分类数据集中搜索不具有类标识的相似耗材图像S,即未规定相似耗材图像S的类别,因此在数据集D中先删除耗材图像的类标识后,不考虑耗材图像类标识进行相似搜索。(3)不带类别的数据集中搜索不具有类标识的相似耗材图像S,即不加类别限制的耗材图像搜索。
对于上述算法1中获得的处理后的搜寻耗材图像集D’和搜寻相似耗材图像S’,将步骤S105中相似耗材图像发现过程的伪代码展示如下:
Figure BDA0003049038220000121
基于同一发明构思,本发明实施例提供一种相似图像检索系统,参考图2所示,具体包括:
获取单元201,用于获取待检索图像和图像数据集;
提取单元202,用于提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵;
调用单元203,用于根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵;
排序单元204,用于针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序;以及
检索单元205,用于基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。
在一实施方式中,所述提取单元202,具体包括:
特征提取单元,用于提取所述待检索图像的特征,生成所述待检索图像的特征向量;以及
矩阵提取单元,用于分别以特征属性为列,以图像标识为行生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵。
在一实施方式中,所述排序单元204,包括:
确定单元,用于根据主子空间矩阵秩的大小,确定最大的一个为主子空间;
排序响应单元,用于响应于确定的主子空间,将根据所述图像特征矩阵中特征的重要程度,从高到低对所述图像信息矩阵进行排序。
基于同一发明构思,本发明实施例提供一种计算机可读存储介质301,参考图3所示,其上存储有计算机程序302,该程序302被处理器执行时实现前述用于相似图像检索的方法实施例中所述的步骤。
基于同一发明构思,本发明实施例提供一种计算设备1900,参考图4所示,该计算设备1900可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)1922(例如,一个或一个以上处理器)和存储器1932,一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中,存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对计算机设备中的一系列指令操作。更进一步地,中央处理器1922可以设置为与存储介质1930通信,在移动智能终端1900上执行存储介质1930中的一系列指令操作。所述处理器执行所述程序时实现前述用于相似图像检索的方法实施例中任一种实施方式所述的步骤。
计算设备1900还可以包括一个或一个以上电源1926,一个或一个以上有线或无线网络接口1950,一个或一个以上输入输出接口1958,一个或一个以上键盘1956,和/或,一个或一个以上操作系统1941,例如有Android、iOS、Firefox OS、YunOS、BlackBerry、Windowsphone、symbian、Palm、BADA、Windows Mobile、ubuntu,SailfishOS等等。
由于本实施例所介绍的计算设备为实施本申请实施例中用于相似图像检索的方法所采用的计算设备,故而基于本申请实施例中所介绍的用于相似图像检索的方法,本领域所属技术人员能够了解本实施例的计算设备的具体实施方式以及其各种变化形式,所以在此对于该计算设备如何实现本申请实施例中的方法不再详细介绍。只要本领域所属技术人员实施本申请实施例中用于相似图像检索的方法所采用的计算设备,都属于本申请所欲保护的范围。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
1、由于本发明首先获取待检索图像和图像数据集;然后提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵;再根据所述图像特征矩阵和所述图像信息矩阵,生成所述图像信息矩阵的主子空间矩阵;然后针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度,并根据相似度计算结果对所述图像信息矩阵进行排序;以及基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。因此,不需要像神经元网络和采用哈希算法那样进行多层次迭代而增加运算的复杂度,由此解决了海量图像检索运行效率低的技术问题,不但提高了计算速度,还大大缩减了存储空间的占用;
2、由于本发明是基于主子空间的采用主子成分分析方法的相似图像检索方法,从而避免了现有技术中运用哈希值和图像标识只能对规则图像进行检索的技术局限,本发明技术方案对不规则形状的耗材图像的相似性检索同样有效。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的实现用于相似图像检索系统中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

Claims (8)

1.一种用于相似图像检索的方法,其特征在于,包括:
获取待检索图像和图像数据集;
提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵;
判断所述图像特征矩阵是否满秩;
如果所述图像特征矩阵满秩,则按所述待检索图像的特征的重要程度生成所述图像信息矩阵的主子空间矩阵;
否则,对所述图像信息矩阵进行奇异值分解,获得降维后的主子空间矩阵;
针对所述主子空间矩阵进行主成分分析处理,分别计算所述主子空间矩阵与所述图像特征矩阵的相似度;
根据所述主子空间矩阵秩的大小,确定最大的一个为主子空间;
响应于确定的主子空间,根据所述图像特征矩阵中特征的重要程度,从高到低对所述图像信息矩阵进行排序;以及
基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果。
2.如权利要求1所述的方法,其特征在于,所述获取待检索图像和图像数据集,包括:
用户输入待检索图像和图像数据集;或者
通过预设数据传输接口接收待检索图像和图像数据集;或者
用户输入待检索图像和图像数据集中的一个,另一个通过预设数据传输接口接收获得。
3.如权利要求1所述的方法,其特征在于,所述提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵,包括:
提取所述待检索图像的特征,生成所述待检索图像的特征向量;以及
分别以特征属性为列,以图像标识为行生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵。
4.如权利要求3所述的方法,其特征在于,包括:
颜色直方图、颜色矩、纹理滤波特征和关键点特征。
5.如权利要求1所述的方法,其特征在于,所述基于相似度计算结果和预设相似度阈值,确定与所述待检索图像最接近的图像检索结果,包括:
响应于相似度计算结果和预设相似度阈值,对所述图像特征矩阵的特征的重要程度进行排序,优先级高的将优先进行相似性比对和筛选,以便逐步缩小图像检索范围。
6.如权利要求1所述的方法,其特征在于,在所述获取待检索图像和图像数据集之后,所述提取所述待检索图像的特征,并生成所述待检索图像的图像特征矩阵和所述图像数据集的图像信息矩阵之前,还包括:
识别所述待检索图像是否具有类别标识;
如果是,则对所述图像数据集中不具有该类别标识的相似图像,进行删除处理;
否则,则对在所述图像数据集中具有类标识的相似图像的类标识,进行删除处理。
7.一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-6中任一项所述的方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-6中任一项所述的方法。
CN202110480491.4A 2021-04-30 2021-04-30 用于相似图像检索的方法、计算设备和计算机存储介质 Active CN113159211B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110480491.4A CN113159211B (zh) 2021-04-30 2021-04-30 用于相似图像检索的方法、计算设备和计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110480491.4A CN113159211B (zh) 2021-04-30 2021-04-30 用于相似图像检索的方法、计算设备和计算机存储介质

Publications (2)

Publication Number Publication Date
CN113159211A CN113159211A (zh) 2021-07-23
CN113159211B true CN113159211B (zh) 2022-11-08

Family

ID=76872634

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110480491.4A Active CN113159211B (zh) 2021-04-30 2021-04-30 用于相似图像检索的方法、计算设备和计算机存储介质

Country Status (1)

Country Link
CN (1) CN113159211B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116596381A (zh) * 2023-05-18 2023-08-15 中国自然资源航空物探遥感中心 一种基于遥感影像的地下开采矿山环境评价系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229278A1 (en) * 2002-06-06 2003-12-11 Usha Sinha Method and system for knowledge extraction from image data
CN100483445C (zh) * 2007-04-19 2009-04-29 上海交通大学 基于几何保存的人脸子空间识别方法
CN100520807C (zh) * 2007-12-28 2009-07-29 北京交通大学 基于多尺度总体变分商图像的独立分量分析人脸识别方法
CN102270241A (zh) * 2011-08-16 2011-12-07 浙江大学 基于稀疏非负矩阵分解的图像检索方法
CN102521623B (zh) * 2011-12-09 2014-01-15 南京大学 一种基于子空间的增量学习人脸识别方法
CN102521368B (zh) * 2011-12-16 2013-08-21 武汉科技大学 基于相似度矩阵迭代的跨媒体语义理解和优化方法
US9075824B2 (en) * 2012-04-27 2015-07-07 Xerox Corporation Retrieval system and method leveraging category-level labels
CN102722732B (zh) * 2012-05-30 2015-01-14 清华大学 一种基于数据二阶统计量建模的图像集合匹配方法
CN102982322A (zh) * 2012-12-07 2013-03-20 大连大学 基于pca图像重构和lda的人脸识别方法
CN102982165B (zh) * 2012-12-10 2015-05-13 南京大学 一种大规模人脸图像检索方法
CN103902997B (zh) * 2012-12-26 2017-02-22 西交利物浦大学 用于生物细胞显微镜图像分类的特征子空间集成方法
CN103425768A (zh) * 2013-08-07 2013-12-04 浙江商业职业技术学院 一种视觉与语义相似性约束的图像检索方法
CN104199923B (zh) * 2014-09-01 2017-09-12 中国科学院自动化研究所 基于最优k均值哈希算法的大规模图像库检索方法
CN106023268B (zh) * 2016-05-30 2019-01-11 南昌大学 一种基于两步参数子空间优化的彩色图像灰度化方法
CN106199550B (zh) * 2016-07-12 2018-10-09 北京理工大学 一种波离角和二维波达角自动配对联合估计方法
US10719509B2 (en) * 2016-10-11 2020-07-21 Google Llc Hierarchical quantization for fast inner product search
CN106886601B (zh) * 2017-03-02 2018-09-04 大连理工大学 一种基于子空间混合超图学习的交叉模态检索方法
CN107798093B (zh) * 2017-10-25 2022-05-03 成都尽知致远科技有限公司 图像检索方法
CN108494463A (zh) * 2017-12-29 2018-09-04 西安电子科技大学 基于星座旋转的准正交空时分组码的物理层安全传输方法
CN108595555B (zh) * 2018-04-11 2020-12-08 西安电子科技大学 基于半监督张量子空间回归的图像检索方法
CN109145143A (zh) * 2018-08-03 2019-01-04 厦门大学 图像检索中的序列约束哈希算法
CN110414560B (zh) * 2019-06-26 2022-06-07 武汉大学 一种用于高维图像数据的自主子空间聚类方法
CN111859004A (zh) * 2020-07-29 2020-10-30 书行科技(北京)有限公司 检索图像的获取方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN113159211A (zh) 2021-07-23

Similar Documents

Publication Publication Date Title
US11526799B2 (en) Identification and application of hyperparameters for machine learning
CN109189991B (zh) 重复视频识别方法、装置、终端及计算机可读存储介质
TWI677852B (zh) 一種圖像特徵獲取方法及裝置、電子設備、電腦可讀存儲介質
CN113255370B (zh) 基于语义相似度的行业类型推荐方法、装置、设备及介质
JP2014029732A (ja) 画像の検索および読み出しに関する基準を用いて画像内容の描写を生成する方法
CN109829302B (zh) Android恶意应用家族分类方法、装置与电子设备
CN111768457B (zh) 图像数据压缩方法、装置、电子设备和存储介质
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN111260220B (zh) 群控设备识别方法、装置、电子设备和存储介质
CN105808581B (zh) 一种数据聚类的方法、装置及Spark大数据平台
CN111859004A (zh) 检索图像的获取方法、装置、设备及可读存储介质
CN113159211B (zh) 用于相似图像检索的方法、计算设备和计算机存储介质
CN110442749B (zh) 视频帧处理方法及装置
CN110083731B (zh) 图像检索方法、装置、计算机设备及存储介质
CN113592030B (zh) 基于复值奇异谱分析的图像检索方法和系统
CN110209895B (zh) 向量检索方法、装置和设备
CN110472659B (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备
JP2001101227A (ja) 文書分類装置および文書分類方法
CN113971224A (zh) 图像检索系统、方法和相关设备
CN112182264A (zh) 地标信息的确定方法、装置、设备及可读存储介质
CN111797395A (zh) 恶意代码可视化及变种检测方法、装置、设备及存储介质
CN110990834A (zh) 一种android恶意软件的静态检测方法、系统及介质
CN110765291A (zh) 检索方法、装置及电子设备
WO2016053343A1 (en) Intent based clustering
Amelio Approximate matching in ACSM dissimilarity measure

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant