CN109033308A - 一种图像检索方法及装置 - Google Patents
一种图像检索方法及装置 Download PDFInfo
- Publication number
- CN109033308A CN109033308A CN201810783110.8A CN201810783110A CN109033308A CN 109033308 A CN109033308 A CN 109033308A CN 201810783110 A CN201810783110 A CN 201810783110A CN 109033308 A CN109033308 A CN 109033308A
- Authority
- CN
- China
- Prior art keywords
- image
- feature vector
- target
- color
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供一种图像检索方法及装置,该图像检索方法包括:获取待检索的目标图像,并对目标图像进行预处理;提取目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量;将目标特征向量输入至预先建立的图像检索模型中,以便图像检索模型:计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像。应用本发明实施例提供的方法进行图像检索时,并未涉及类似于传统图像检索方式中以“人工标识方式”添加关键字的主观性问题,因而,能够避免进行特征匹配时出错的概率,大大提高了图像检索结果的准确性。
Description
技术领域
本发明涉及图像检索技术领域,特别涉及一种图像检索方法及装置。
背景技术
如今是信息大发展的时代,各种信息不断冲击着人们的眼球,信息量越来越大,信息数据种类也越来越多,比如视频、音频和图像等多媒体信息。如何在浩如烟海的数据库中检索出人们所期望的多媒体信息如图像,已成为一个值得关注的问题。
传统的图像检索,是基于图像的文本描述而实现的检索技术。具体而言,在进行图像检索前需要预先建立图像索引库,首先为图像数据库中的每一幅候选图像添加文本描述,这里的文本描述为候选图像的图像属性,例如,图像格式、图像名称、图像尺寸、创建时间、修改时间、图像内容描述等;然后,针对每一候选图像,以人工标识的方式为文本描述添加关键字并建立关键字索引,从而完成图像索引库的建立。这样,在进行图像检索时,人们可以先确定所要检索出的期望图像的目标关键字,再根据所确定的目标关键字进行关键字匹配,最终从预先建立好的图像索引库中确定出与目标关键字相匹配的期望图像,完成图像检索。
由以上可知,利用上述方案能够实现对期望图像的检索,但是,在建立图像索引库的过程中,每一候选图像的文字描述对应的关键字是以人工标识方式添加的,而不同的人对不同图像内容的理解往往存在差异,可见,这种以人工标识方式添加的关键字是具有主观性的,也就是说所建立的图像索引库具有主观性,显然,利用具有主观性的图像索引库进行期望图像的检索时,很容易在关键字匹配时出现错误,降低图像检索结果的准确性。
发明内容
本发明实施例的目的在于提供一种图像检索方法及装置,以解决利用具有主观性的图像索引库进行期望图像的检索时,容易在关键字匹配时出现错误,降低图像检索结果的准确性的问题。
为达到上述目的,本发明实施例公开了一种图像检索方法,所述图像检索方法包括:
获取待检索的目标图像,并对所述目标图像进行预处理;
提取所述目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量;
将所述目标特征向量输入至预先建立的图像检索模型中,以便所述图像检索模型:
计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像;其中,所述图像检索模型为基于预设的训练图像样本的颜色特征、纹理特征和图像名称构成的综合特征,且利用支持向量机机器学习算法而训练得到的用于进行图像检索的分类器。
优选地,所述对所述目标图像进行预处理的步骤,包括:
将所述目标图像从RGB颜色空间变换至HSV颜色空间;
按照预设图像尺寸,对进行颜色空间变换后的所述目标图像进行图像尺寸调整。
优选地,所述目标图像的颜色特征至少包括:
利用颜色直方图提取得到的第一颜色特征;和/或,
利用颜色相关图提取得到的第二颜色特征;和/或,
利用颜色矩提取得到的第三颜色特征。
优选地,所述目标图像的纹理特征至少包括:
利用Gabor滤波器提取得到的纹理特征。
优选地,所述图像检索模型按照以下方式确定期望图像:
将各个候选图像的特征向量按照相似度数值由高到低的顺序排列;
确定相似度数值最高的前N个特征向量对应的候选图像为期望图像。
优选地,所述图像检索模型按照以下方式计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度:
基于预设特征向量的距离算法,计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的距离;
将计算得到的距离确定为针对每一候选图像的特征向量的相似度。
优选地,按照以下方式建立所述图像检索模型:
获取预设的训练图像样本;
对所述训练图像样本中的每一训练图像进行预处理;其中,所述预处理至少包括从RGB颜色空间至HSV颜色空间的变换和图像尺寸调整;
提取每一训练图像的颜色特征、纹理特征和图像名称,并生成针对每一训练图像的综合特征向量;
利用支持向量机机器学习算法,对每一综合特征向量所对应的训练图像进行分类;
基于召回率和准确率对分类结果进行优化,并确定出用于对所述训练图像样本进行分类的最优分类超平面,完成所述图像检索模型的建立;其中,所述召回率是指从预设图像数据库中检索出的实际期望图像的数量与该预设图像数据库中全部期望图像的数量之比,所述准确率是指从预设图像数据库中检索出的实际期望图像的数量与所检索出的全部图像的数量之比。
为达到上述目的,本发明实施例公开了一种图像检索装置,所述图像检索装置包括:
图像获取模块,用于获取待检索的目标图像,并对所述目标图像进行预处理;
特征提取模块,用于提取所述目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量;
图像检索模块,用于将所述目标特征向量输入至预先建立的图像检索模型中,以便所述图像检索模型:
计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像;其中,所述图像检索模型为基于预设的训练图像样本的颜色特征、纹理特征和图像名称构成的综合特征,且利用支持向量机机器学习算法而训练得到的用于进行图像检索的分类器。
优选地,所述图像获取模块,具体用于:
将所述目标图像从RGB颜色空间变换至HSV颜色空间;
按照预设图像尺寸,对进行颜色空间变换后的所述目标图像进行图像尺寸调整。
优选地,所述图像检索模型,具体用于:
将各个候选图像的特征向量按照相似度数值由高到低的顺序排列;
确定相似度数值最高的前N个特征向量对应的候选图像为期望图像。
本发明实施例提供的一种图像检索方法及装置,首先获取待检索的目标图像并进行预处理,然后提取该目标图像相应的颜色和纹理特征,并生成包含该二维特征向量的综合的目标特征向量,并将该目标特征向量输入至预先建立的图像检索模型中,该图像检索模型通过计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,并基于该相似度进行特征匹配,从而获得相匹配的特征向量,并将所获得的特征向量对应的各个候选图像确定为期望图像并输出。
需要说明的是,这里的颜色特征、纹理特征和图像名称是基于目标图像的图像内容、并利用图像处理技术从目标图像中提取得到的,而生成综合的目标特征向量中是利用数学方式进行的整合,并未涉及类似于传统图像检索方式中以“人工标识方式”添加关键字的主观性问题,因而,能够避免进行特征匹配时出错的概率,大大提高了图像检索结果的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种图像检索方法的流程示意图;
图2为本发明实施例提供的一种图像检索装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为解决利用具有主观性的图像索引库进行期望图像的检索时,容易在关键字匹配时出现错误,降低图像检索结果的准确性的问题,本发明实施例提供了一种图像检索方法及装置,下面首先对本发明实施例提供的一种图像检索方法进行说明。
如图1所示,为本发明实施例提供的一种图像检索方法的流程示意图,该图像检索方法可以包括以下步骤:
S101:获取待检索的目标图像,并对所述目标图像进行预处理。
在进行图像检索之前,首先需要获得一幅用于检索的目标图像,具体地,该目标图像可以是利用图像采集设备在线采集、通过数据传输并存储于存储设备中的在线图像,还可以是以数据拷贝方式直接存储于存储设备中的离线图像,本发明实施例无需对目标图像的获取方式进行限定。
需要说明的是,通常对于目标图像的预处理方式可以包括多种,例如灰度化、图像分割、二值化处理等等。而在本发明的一种具体实现方式中,可以按照以下方式对所述目标图像进行预处理:
(1)将所述目标图像从RGB颜色空间变换至HSV颜色空间。
(2)按照预设图像尺寸,对进行颜色空间变换后的所述目标图像进行图像尺寸调整。
需要说明的是,RGB色彩模式是工业界的一种颜色标准,其中R、G、B分别代表Red红、Green绿、Blue蓝三个颜色通道,是通过对R、G、B三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的。HSV是根据颜色的直观特性由A.R.Smith在1978年创建的一种颜色空间,也称六角锥体模型(Hexcone Model),其中H、S、V分别代表Hue色调、Saturation饱和度和Value明度,与RGB颜色空间相比,HSV颜色空间能更好地反映人眼对颜色的感知。因此,这里将目标图像从RGB颜色空间变换至HSV颜色空间。
具体地,可以按照以下方式将RGB颜色空间变换至HSV颜色空间,其中,以目标图像在RGB颜色空间的颜色值(r,g,b)为例进行说明其中,r、g、b的颜色值∈(0,255):
设R、G、B三个颜色通道中的最大颜色值构成的颜色矢量v′=max(r,g,b),且满足表达式(1)所示的关系:
则,根据表达式(1)推导得到变换后的HSV颜色空间中的v、s、h值如表达式(2)所示:
其中,转换后h∈[0,360],s、v∈[0,1]。
具体地,除了对目标图像的颜色空间转换之外,还可以对目标图像进行尺寸调整,以使得该目标图像在后续提取特征后能够很好地与预先建立的图像检索模型中的特征进行匹配,同时还能够降低图像数据量,可以大大提高图像检索的效率。
S102:提取所述目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量。
可以理解的是,对于目标图像而言,可以提取多种颜色特征,例如,一种实现方式中,所述目标图像的颜色特征至少包括:利用颜色直方图提取得到的第一颜色特征;和/或,利用颜色相关图提取得到的第二颜色特征;和/或,利用颜色矩提取得到的第三颜色特征。
需要说明的是,对于不同的颜色特征而言,所反映的颜色特性也是有区别的,因此,当选用多种颜色特征能够从颜色方面提高图像检索的准确性。
下面对颜色特征提取方式进行介绍。
第一种:将目标图像分离为H、S、V三个分量图像并分别进行量化,具体地,将HSV颜色空间划分为若干个小的颜色区间,从各个颜色区间中选出一组具有代表性的颜色值来对整个颜色空间进行表示,以实现从颜色空间到选定颜色的映射,例如将H分量量化为8级,S分量和V分量分别量化为2级,这样最终可以将一个8×2×2的特征向量转化为一个1×32的特征向量,也就是说,得到针对HSV颜色空间下的颜色直方图的第一颜色特征的特征向量,记为HsvColorHistogram。
第二种:对目标图像直接在RGB颜色空间中量化为4×4×4的64个颜色区间,假设,候选图像包含有C1,C2,C3……Cn共计n种颜色,设置两种颜色之间的距离是d,这样,可以得到一个bin的个数为n2的直方图,并且每个bin的大小如表达式(3)所示:
Bin(Ci,Cj)=∑||(x,y){I(x,y,Cj)-I(x,y,Ci)||=d} (3)
其中,||*||表示像素点i和像素点j两像素点之间的空间距离。
需要说明的是,这里可以将距离d设置为1,3,5,7……,从而可以以此反映不同颜色对之间的空间位置关系。
具体地,通过检查像素点是否为有效像素点,可以剔除目标图像中的无效像素点,例如可以对目标图像以网格方式进行量化,并对量化后的目标图像加偏置,从而可以筛选出指针不在目标图像内的点。然后,使用预定距离d来寻找目标图像中某一像素点的八相邻像素点,并重新构建相关图,最后将4×4×4特征向量转换成1×64的特征向量,也就是说,得到针对颜色相关图的第二颜色特征的特征向量,记为ColorAutoCorrelogram。
第三种:对目标图像分别提取出R、G、B三个颜色通道的两个颜色一阶矩,即计算各个颜色通道图像的均值和标准差,从而得到了共计6个特征值,并将这6个特征值构建成针对颜色矩的第三颜色特征的特征向量,记为ColorMoments。
需要指出的是,颜色矩是一种简单有效的颜色特征表示方法,颜色矩可以包括一阶矩(Mean,均值)、二阶矩(Variance,方差)和三阶矩(Skewness,斜度)。由于图像的颜色信息主要分布于低阶矩中,所以用一阶矩、二阶矩和三阶矩足以表达图像的颜色分布,相关数据已经表明利用图像的颜色矩可有效地表示图像中的颜色分布。
需要说明的是,上述分别介绍了3种提取颜色特征的具体方式,实际应用中,可以选择其中的一种作为颜色特征,还可以选择其中的任意两种或3种,这都是可行的,上述仅用于对每种颜色特征的提取方式进行说明,不用于对本发明实施例的限定。
还需要指出的是,对于仅采用第二种方式进行颜色特征提取的情况而言,可以先进行目标图像尺寸的调整,然后直接按照第二种方式进行第二颜色特征的提取,无需进行从RGB颜色空间到HSV颜色空间的空间转换。
可以理解的是,对于图像的纹理特征提取也可以有多种方式。而本发明的一种实现方式中,所提取的目标图像的纹理特征至少包括:利用Gabor滤波器提取得到的纹理特征。
可以理解的是,对于图像的处理方法主要可以分成空域分析法和频域分析法两大部分。通常,傅里叶变换是一种信号处理中的有力工具,可以将图像从空域转换到频域,并提取到空域上不易提取的特征。但是经过傅里叶变换后,图像在不同位置的频度特征往往混合在一起,而Gabor滤波器却可以抽取空间局部频度特征,是一种有效的纹理检测工具。
具体地,利用Gabor函数形成的二维Gabor滤波器具有在空域和频域同时取得局部最优化的特点,因此能够很好地描述空间频率(即尺度)、空间位置(即方向选择性)相对应的局部结构信息。空域中的一个2维Gabor滤波器是一个正弦平面波和高斯核函数的乘积。Gabor滤波器实际上是一种利用高斯函数调制的正弦波,并且Gabor滤波器是自相似的,也就是说,所有Gabor滤波器都可以从同一个母函数经过伸缩旋转变换得到。据此,Gabor滤波器可以在频域的不同尺度、不同方向上提取相关特征。
具体地,Gabor滤波器的计算公式如下:
下面对利用Gabor滤波器提取纹理特征的方式进行介绍。
首先,以小波函数g(x,y)为母函数进行伸缩旋转变换得到一组旋转方程,如下:
接着,通过对Gabor滤波器进行尺度和尺寸的变换,例如设置尺度为4、方向为6,可以得到一个包含24个互不相同的子滤波器的滤波器组,可以理解的是,不同频率不同方向的滤波器组对于目标图像的纹理特征提取非常有效,这样,在得到Oxy平面内的坐标对构成的采样点后可以根据采样点绘制图像,分别计算归一化半径和角度后进行象限变换;根据象限变换后的坐标对计算角度的正弦值和余弦值,再计算正弦差和余弦差;Gabor滤波器组与每个图像块在空域卷积,计算偶数和奇数滤波器响应幅度并得到响应幅度和,得到两个1×24的纹理特征向量,分别记为GaborSquareEnergy和GaborMeanAmplitude。
然后,在处理目标图像的二维图像数据时,可以使用二维离散小波变换分析方法,去除横向以及纵向两个方向上干扰信息的影响,因此得到一系列的近似系数和细节系数。将二维图像数据进行单层分解,例如可以先通过四次迭代分解再进一步计算均值和标准差,再将均值和标准差相结合后,得到目标图像的纹理特征的特征向量,记为WaveletMoments。
需要说明的是,这里利用Gabor滤波器提取得到的纹理特征,可以包括两个1×24的纹理特征向量和一个基于离散小波分析方法得到的纹理特征向量。
一种具体实施例中,将以下提取到所有的特征向量构建成目标图像的综合特征向量QueryImageFeature,如下:
“HsvColorHistogram+ColorAutoCorrelogram+ColorMoments+GaborSquareEnergy+GaborMeanAmplitude+WaveletMoments+ImageNameString”。
其中,ImageNameString表示由图像名称转化而成的字符串。
需要说明的是,这里仅仅是列举了本发明实施例中的一种具体方式而已,当然还可以有其他可行的实现方式,例如,在对图像检索结果准确性要求不高的场景下,可以适当选择其中的一种或几种特征进行检索,以提高图像检索的效率。
S103:将所述目标特征向量输入至预先建立的图像检索模型中,以便所述图像检索模型:
计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像;其中,所述图像检索模型为基于预设的训练图像样本的颜色特征、纹理特征和图像名称构成的综合特征,且利用支持向量机机器学习算法而训练得到的用于进行图像检索的分类器。
一种实现方式中,所述图像检索模型按照以下方式确定期望图像:
(1)将各个候选图像的特征向量按照相似度数值由高到低的顺序排列;
(2)确定相似度数值最高的前N个特征向量对应的候选图像为期望图像。
需要说明的是,这里仅仅示出了确定期望图像的一种优选实现方式,当然还可以有其他可行的实现方式,本领域内的技术人员可以根据实际应用中的具体情况进行合理的设置。
具体地,可以按照以下方式计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度:
(1)基于预设特征向量的距离算法,计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的距离;
(2)将计算得到的距离确定为针对每一候选图像的特征向量的相似度。
下面对预设特征向量的距离算法进行下介绍。
(i)欧式距离:
欧式距离用于二维平面或者三维空间中两个像素点之间的空间距离。其中,两个k维向量A(X11,X12……X1k)和B(X21,X22,……X2k)之间的欧氏距离为:
(ii)曼哈顿距离:
曼哈顿距离在欧氏空间的固定直角坐标系上两点所形成的线段对轴产生的投影的距离总和。其中,两个k维向量A(X11,X12……X1k)和B(X21,X22,……X2k)之间的曼哈顿距离为:
DAB=|X11-X21|+|X12-X22|+......+|X1k-X2k|
(iii)切比雪夫距离:
切比雪夫距离是各坐标数值差的最大值。其中,两个k维向量A(X11,X12……X1k)和B(X21,X22,……X2k)之间的切比雪夫距离为:
DAB=max(|X11-X21|+|X12-X22|+......+|X1k-X2k|)
(iv)明可夫斯基距离:
明可夫斯基距离,是曼哈顿距离和欧式距离的一种测度定义的推广。其中,两个k维向量A(X11,X12……X1k)和B(X21,X22,……X2k)之间的明可夫斯基距离为:
显然,当p=1时,可以得到上述列举的曼哈顿距离,当p=2时,可以得到上述列举的欧氏距离,而当p趋近于无穷大时,可以得到上述列举的切比雪夫距离。
(v)标准化欧式距离:
标准化欧式距离,是一种对欧式距离的改进方案,它将各特征分量都标准化到均值和方差。其中,两个k维向量A(X11,X12……X1k)和B(X21,X22,……X2k)之间的标准化欧式距离为:
(vi)马氏距离,是指两个向量的协方差距离。
(vii)汉明距离:指两个字符串对应位置的不同字符的个数。
另外,本发明实施例还提供了一种利用夹角余弦算法和杰卡德相似系数算法来计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度的方式。
(viii)夹角余弦:
(ix)夹角余弦,将空间向量的夹角余弦值来作为度量标准。需要说明的是,当余弦值越接近1表明夹角越小,代表两个向量越相似。其中,两个k维向量两个k维向量A(X11,X12……X1k)和B(X21,X22,……X2k)之间的夹角余弦值为:
(x)卡德相似系数:
杰卡德相似系数,表示集合A和集合B的交集元素占并集元素的比例,公式如下。
由以上可见,本发明实施例提供了基于距离、向量夹角余弦和杰卡德相似系数的方式来计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,并且,在基于距离计算相似度的方式中还提供了多种不同算法。需要说明的是,本领域内的技术人员可以根据实际应用中的具体情况进行合理的设置,以适应不同检索场景下的图像检索需要。
一种具体实现方式中,可以按照以下方式建立所述图像检索模型:
(1)获取预设的训练图像样本。
在建立图像检索模型之前,需要预先获取多幅图像作为训练图像样本,可以理解的是,训练图像样本的样本容量越大,所训练得到的图像检索模型的识别准确率越高,当然,随着训练图像样本容量的增大,模型建立的过程也会随之增长。
具体地,可以对每一训练图像添加用于分类的标签,假设总共有10类标签,以便后续根据每一训练图像的综合特征向量对其进行分类。需要说明的是,当将训练图像分至其标签所对应的类别时,表明分类正确,而将训练图像未分至其标签所对应的类别时,表明分类错误。相应地,当对训练图像样本中的全部训练图像都分类完成之后,需要对所有训练图像样本的整体分类情况进行评估,通常利用召回率和准确率进行评估。
(2)对所述训练图像样本中的每一训练图像进行预处理。
其中,所述预处理至少包括从RGB颜色空间至HSV颜色空间的变换和图像尺寸调整。
(3)提取每一训练图像的颜色特征、纹理特征和图像名称,并生成针对每一训练图像的综合特征向量。
需要说明的是,这里步骤(2)中对每一训练图像进行预处理的方式,与步骤S101中对目标图像进行预处理的方式一致,这里步骤(3)中对每一训练图像提取综合特征向量的方式,与步骤S102中提取目标特征向量的方式类似,相关之处可以参见前述步骤S101或S102的相关内容,此处不再赘述。
(4)利用支持向量机机器学习算法,对每一综合特征向量所对应的训练图像进行分类。
(5)基于召回率和准确率对分类结果进行优化,并确定出用于对所述训练图像样本进行分类的最优分类超平面,完成所述图像检索模型的建立。
其中,所述召回率是指从预设图像数据库中检索出的实际期望图像的数量与该预设图像数据库中全部期望图像的数量之比,所述准确率是指从预设图像数据库中检索出的实际期望图像的数量与所检索出的全部图像的数量之比。
本发明实施例提供的一种图像检索方法,首先获取待检索的目标图像并进行预处理,然后提取该目标图像相应的颜色和纹理特征,并生成包含该二维特征向量的综合的目标特征向量,并将该目标特征向量输入至预先建立的图像检索模型中,该图像检索模型通过计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,并基于该相似度进行特征匹配,从而获得相匹配的特征向量,并将所获得的特征向量对应的各个候选图像确定为期望图像并输出。
需要说明的是,这里的颜色特征、纹理特征和图像名称是基于目标图像的图像内容、并利用图像处理技术从目标图像中提取得到的,而生成综合的目标特征向量中是利用数学方式进行的整合,并未涉及类似于传统图像检索方式中以“人工标识方式”添加关键字的主观性问题,因而,能够避免进行特征匹配时出错的概率,大大提高了图像检索结果的准确性。
下面再对本发明实施例提供的一种图像检索装置进行说明。
如图2所示,为本发明实施例提供的一所述图像检索装置的结构示意图,该图像检索装置可以包括以下模块:
图像获取模块210,用于获取待检索的目标图像,并对所述目标图像进行预处理;
特征提取模块220,用于提取所述目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量;
图像检索模块230,用于将所述目标特征向量输入至预先建立的图像检索模型中,以便所述图像检索模型:
计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像;其中,所述图像检索模型为基于预设的训练图像样本的颜色特征、纹理特征和图像名称构成的综合特征,且利用支持向量机机器学习算法而训练得到的用于进行图像检索的分类器。
一种实现方式中,所述图像获取模块210,具体用于:
将所述目标图像从RGB颜色空间变换至HSV颜色空间;
按照预设图像尺寸,对进行颜色空间变换后的所述目标图像进行图像尺寸调整。
一种实现方式中,所述目标图像的颜色特征至少包括:
利用颜色直方图提取得到的第一颜色特征;和/或,
利用颜色相关图提取得到的第二颜色特征;和/或,
利用颜色矩提取得到的第三颜色特征。
一种实现方式中,所述目标图像的纹理特征至少包括:利用Gabor滤波器提取得到的纹理特征。
一种实现方式中,所述图像检索模型按照以下方式确定期望图像:
将各个候选图像的特征向量按照相似度数值由高到低的顺序排列;
确定相似度数值最高的前N个特征向量对应的候选图像为期望图像。
一种实现方式中,所述图像检索模型按照以下方式计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度:基于预设特征向量的距离算法,计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的距离;将计算得到的距离确定为针对每一候选图像的特征向量的相似度。
一种实现方式中,可以按照以下方式建立所述图像检索模型:
获取预设的训练图像样本;
对所述训练图像样本中的每一训练图像进行预处理;其中,所述预处理至少包括从RGB颜色空间至HSV颜色空间的变换和图像尺寸调整;
提取每一训练图像的颜色特征、纹理特征和图像名称,并生成针对每一训练图像的综合特征向量;
利用支持向量机机器学习算法,对每一综合特征向量所对应的训练图像进行分类;
基于召回率和准确率对分类结果进行优化,并确定出用于对所述训练图像样本进行分类的最优分类超平面,完成所述图像检索模型的建立;其中,所述召回率是指从预设图像数据库中检索出的实际期望图像的数量与该预设图像数据库中全部期望图像的数量之比,所述准确率是指从预设图像数据库中检索出的实际期望图像的数量与所检索出的全部图像的数量之比。
本发明实施例提供的一种图像检索方法及装置,首先获取待检索的目标图像并进行预处理,然后提取该目标图像相应的颜色和纹理特征,并生成包含该二维特征向量的综合的目标特征向量,并将该目标特征向量输入至预先建立的图像检索模型中,该图像检索模型通过计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,并基于该相似度进行特征匹配,从而获得相匹配的特征向量,并将所获得的特征向量对应的各个候选图像确定为期望图像并输出。
需要说明的是,这里的颜色特征、纹理特征和图像名称是基于目标图像的图像内容、并利用图像处理技术从目标图像中提取得到的,而生成综合的目标特征向量中是利用数学方式进行的整合,并未涉及类似于传统图像检索方式中以“人工标识方式”添加关键字的主观性问题,因而,能够避免进行特征匹配时出错的概率,大大提高了图像检索结果的准确性。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称的存储介质,如:ROM/RAM、磁碟、光盘等。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (10)
1.一种图像检索方法,其特征在于,所述图像检索方法包括:
获取待检索的目标图像,并对所述目标图像进行预处理;
提取所述目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量;
将所述目标特征向量输入至预先建立的图像检索模型中,以便所述图像检索模型:
计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像;其中,所述图像检索模型为基于预设的训练图像样本的颜色特征、纹理特征和图像名称构成的综合特征,且利用支持向量机机器学习算法而训练得到的用于进行图像检索的分类器。
2.根据权利要求1所述的图像检索方法,其特征在于,所述对所述目标图像进行预处理的步骤,包括:
将所述目标图像从RGB颜色空间变换至HSV颜色空间;
按照预设图像尺寸,对进行颜色空间变换后的所述目标图像进行图像尺寸调整。
3.根据权利要求1所述的图像检索方法,其特征在于,所述目标图像的颜色特征至少包括:
利用颜色直方图提取得到的第一颜色特征;和/或,
利用颜色相关图提取得到的第二颜色特征;和/或,
利用颜色矩提取得到的第三颜色特征。
4.根据权利要求1所述的图像检索方法,其特征在于,所述目标图像的纹理特征至少包括:
利用Gabor滤波器提取得到的纹理特征。
5.根据权利要求1-4任一项所述的图像检索方法,其特征在于,所述图像检索模型按照以下方式确定期望图像:
将各个候选图像的特征向量按照相似度数值由高到低的顺序排列;
确定相似度数值最高的前N个特征向量对应的候选图像为期望图像。
6.根据权利要求1-4任一项所述的图像检索方法,其特征在于,所述图像检索模型按照以下方式计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度:
基于预设特征向量的距离算法,计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的距离;
将计算得到的距离确定为针对每一候选图像的特征向量的相似度。
7.根据权利要求1-4任一项所述的图像检索方法,其特征在于,按照以下方式建立所述图像检索模型:
获取预设的训练图像样本;
对所述训练图像样本中的每一训练图像进行预处理;其中,所述预处理至少包括从RGB颜色空间至HSV颜色空间的变换和图像尺寸调整;
提取每一训练图像的颜色特征、纹理特征和图像名称,并生成针对每一训练图像的综合特征向量;
利用支持向量机机器学习算法,对每一综合特征向量所对应的训练图像进行分类;
基于召回率和准确率对分类结果进行优化,并确定出用于对所述训练图像样本进行分类的最优分类超平面,完成所述图像检索模型的建立;其中,所述召回率是指从预设图像数据库中检索出的实际期望图像的数量与该预设图像数据库中全部期望图像的数量之比,所述准确率是指从预设图像数据库中检索出的实际期望图像的数量与所检索出的全部图像的数量之比。
8.一种图像检索装置,其特征在于,所述图像检索装置包括:
图像获取模块,用于获取待检索的目标图像,并对所述目标图像进行预处理;
特征提取模块,用于提取所述目标图像的颜色特征、纹理特征和图像名称,生成目标特征向量;
图像检索模块,用于将所述目标特征向量输入至预先建立的图像检索模型中,以便所述图像检索模型:
计算目标特征向量与预设图像特征库中针对每一候选图像的特征向量的相似度,将符合相似度判断条件的特征向量对应的各个候选图像确定为期望图像,并从预设图像数据库中输出所确定的期望图像;其中,所述图像检索模型为基于预设的训练图像样本的颜色特征、纹理特征和图像特征构成的综合特征,且利用支持向量机机器学习算法而训练得到的用于进行图像检索的分类器。
9.根据权利要求8所述的图像检索装置,其特征在于,所述图像获取模块,具体用于:
将所述目标图像从RGB颜色空间变换至HSV颜色空间;
按照预设图像尺寸,对进行颜色空间变换后的所述目标图像进行图像尺寸调整。
10.根据权利要求8或9所述的图像检索装置,其特征在于,所述图像检索模型,具体用于:
将各个候选图像的特征向量按照相似度数值由高到低的顺序排列;
确定相似度数值最高的前N个特征向量对应的候选图像为期望图像。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810783110.8A CN109033308A (zh) | 2018-07-16 | 2018-07-16 | 一种图像检索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810783110.8A CN109033308A (zh) | 2018-07-16 | 2018-07-16 | 一种图像检索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109033308A true CN109033308A (zh) | 2018-12-18 |
Family
ID=64642910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810783110.8A Pending CN109033308A (zh) | 2018-07-16 | 2018-07-16 | 一种图像检索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109033308A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871455A (zh) * | 2019-01-28 | 2019-06-11 | 厦门理工学院 | 碳化竹片分色方法及系统 |
CN110084827A (zh) * | 2019-04-17 | 2019-08-02 | 江阴芗菲服饰有限公司 | 一种基于频域特征的织物纹理分类方法 |
CN110083724A (zh) * | 2019-05-16 | 2019-08-02 | 上海联隐电子科技合伙企业(有限合伙) | 一种相似图像检索方法、装置及系统 |
CN110879849A (zh) * | 2019-11-09 | 2020-03-13 | 广东智媒云图科技股份有限公司 | 一种基于图像转文字的相似度比较方法及装置 |
CN111178292A (zh) * | 2019-12-31 | 2020-05-19 | 东软集团(北京)有限公司 | 一种车型识别方法、装置及设备 |
CN111339344A (zh) * | 2020-02-25 | 2020-06-26 | 北京百度网讯科技有限公司 | 室内图像检索方法、装置及电子设备 |
CN111428063A (zh) * | 2020-03-31 | 2020-07-17 | 杭州博雅鸿图视频技术有限公司 | 基于地理空间位置划分的图像特征关联处理方法及系统 |
CN111581423A (zh) * | 2020-05-29 | 2020-08-25 | 上海依图网络科技有限公司 | 一种目标检索方法及装置 |
CN112307243A (zh) * | 2019-07-23 | 2021-02-02 | 北京京东振世信息技术有限公司 | 用于检索图像的方法和装置 |
CN112765382A (zh) * | 2021-01-20 | 2021-05-07 | 上海依图网络科技有限公司 | 图像搜索方法及其装置、介质和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101539930A (zh) * | 2009-04-21 | 2009-09-23 | 武汉大学 | 一种相关反馈图像检索方法 |
CN102402621A (zh) * | 2011-12-27 | 2012-04-04 | 浙江大学 | 一种基于图像分类的图像检索方法 |
CN102467564A (zh) * | 2010-11-12 | 2012-05-23 | 中国科学院烟台海岸带研究所 | 一种基于改进支持向量机相关反馈的遥感图像检索方法 |
CN102508917A (zh) * | 2011-11-21 | 2012-06-20 | 洪涛 | 部分特征图像的多维度目标快速鲁棒检索定位方法 |
-
2018
- 2018-07-16 CN CN201810783110.8A patent/CN109033308A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101539930A (zh) * | 2009-04-21 | 2009-09-23 | 武汉大学 | 一种相关反馈图像检索方法 |
CN102467564A (zh) * | 2010-11-12 | 2012-05-23 | 中国科学院烟台海岸带研究所 | 一种基于改进支持向量机相关反馈的遥感图像检索方法 |
CN102508917A (zh) * | 2011-11-21 | 2012-06-20 | 洪涛 | 部分特征图像的多维度目标快速鲁棒检索定位方法 |
CN102402621A (zh) * | 2011-12-27 | 2012-04-04 | 浙江大学 | 一种基于图像分类的图像检索方法 |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109871455B (zh) * | 2019-01-28 | 2020-11-10 | 厦门理工学院 | 碳化竹片分色方法及系统 |
CN109871455A (zh) * | 2019-01-28 | 2019-06-11 | 厦门理工学院 | 碳化竹片分色方法及系统 |
CN110084827A (zh) * | 2019-04-17 | 2019-08-02 | 江阴芗菲服饰有限公司 | 一种基于频域特征的织物纹理分类方法 |
CN110083724A (zh) * | 2019-05-16 | 2019-08-02 | 上海联隐电子科技合伙企业(有限合伙) | 一种相似图像检索方法、装置及系统 |
CN112307243B (zh) * | 2019-07-23 | 2023-11-03 | 北京京东振世信息技术有限公司 | 用于检索图像的方法和装置 |
CN112307243A (zh) * | 2019-07-23 | 2021-02-02 | 北京京东振世信息技术有限公司 | 用于检索图像的方法和装置 |
CN110879849A (zh) * | 2019-11-09 | 2020-03-13 | 广东智媒云图科技股份有限公司 | 一种基于图像转文字的相似度比较方法及装置 |
CN111178292A (zh) * | 2019-12-31 | 2020-05-19 | 东软集团(北京)有限公司 | 一种车型识别方法、装置及设备 |
CN111339344A (zh) * | 2020-02-25 | 2020-06-26 | 北京百度网讯科技有限公司 | 室内图像检索方法、装置及电子设备 |
CN111339344B (zh) * | 2020-02-25 | 2023-04-07 | 北京百度网讯科技有限公司 | 室内图像检索方法、装置及电子设备 |
CN111428063A (zh) * | 2020-03-31 | 2020-07-17 | 杭州博雅鸿图视频技术有限公司 | 基于地理空间位置划分的图像特征关联处理方法及系统 |
CN111428063B (zh) * | 2020-03-31 | 2023-06-30 | 杭州博雅鸿图视频技术有限公司 | 基于地理空间位置划分的图像特征关联处理方法及系统 |
CN111581423A (zh) * | 2020-05-29 | 2020-08-25 | 上海依图网络科技有限公司 | 一种目标检索方法及装置 |
CN112765382A (zh) * | 2021-01-20 | 2021-05-07 | 上海依图网络科技有限公司 | 图像搜索方法及其装置、介质和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109033308A (zh) | 一种图像检索方法及装置 | |
CN105518668A (zh) | 基于内容的图像检索 | |
Casanova et al. | Texture analysis using fractal descriptors estimated by the mutual interference of color channels | |
Obulesu et al. | Content based image retrieval using multi motif co-occurrence matrix | |
Varish | A modified similarity measurement for image retrieval scheme using fusion of color, texture and shape moments | |
Chen et al. | Instance retrieval using region of interest based CNN features | |
Reta et al. | Color uniformity descriptor: An efficient contextual color representation for image indexing and retrieval | |
Wei et al. | Color image retrieval based on quaternion and deep features | |
Asadi Amiri et al. | A novel content-based image retrieval system using fusing color and texture features | |
Aljahdali et al. | Classification of image database using SVM with Gabor Magnitude | |
Janu et al. | Query-based image retrieval using SVM | |
Singh et al. | Ensemble visual content based search and retrieval for natural scene images | |
Özyurt et al. | A new method for classification of images using convolutional neural network based on Dwt-Svd perceptual hash function | |
Jiang et al. | Texture image retrieval using DTCWT-SVD and local binary pattern features | |
Abraham | Digital image forgery detection approaches: A review and analysis | |
Varish et al. | A content based image retrieval using color and texture features | |
Yang et al. | Color image representation using invariant exponent moments | |
Dixit et al. | Copy-move image forgery detection using frequency-based techniques: a review | |
Jayanthi et al. | Efficient fuzzy color and texture feature extraction technique for content based image retrieval system | |
Suresh et al. | A novel scheme for extracting shape and texture features using CBIR approach | |
Rudrawar | Content based remote-sensing image retrieval with bag of visual words representation | |
van der Maaten et al. | Identifying the real van gogh with brushstroke textons | |
Lu et al. | Content-based identifying and classifying traditional chinese painting images | |
Malviya et al. | Region duplication detection using color histogram and moments in digital image | |
Mynepalli et al. | Recognizing Tiny Faces. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 230601 No. 99 Ziyun Road, Hefei Economic and Technological Development Zone, Anhui Province Applicant after: Anhui Jianghuai Automobile Group Limited by Share Ltd Address before: 230601 No. 669 Shixin Road, Taohua Industrial Park, Hefei City, Anhui Province Applicant before: Anhui Jianghuai Automobile Group Limited by Share Ltd |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181218 |