CN108897746B - 一种图像检索方法 - Google Patents

一种图像检索方法 Download PDF

Info

Publication number
CN108897746B
CN108897746B CN201810291389.8A CN201810291389A CN108897746B CN 108897746 B CN108897746 B CN 108897746B CN 201810291389 A CN201810291389 A CN 201810291389A CN 108897746 B CN108897746 B CN 108897746B
Authority
CN
China
Prior art keywords
window
image
retrieval
matching
similar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810291389.8A
Other languages
English (en)
Other versions
CN108897746A (zh
Inventor
李建圃
樊晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanchang Qimou Technology Co ltd
Original Assignee
Nanchang Qimou Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Qimou Technology Co ltd filed Critical Nanchang Qimou Technology Co ltd
Priority to CN201810291389.8A priority Critical patent/CN108897746B/zh
Publication of CN108897746A publication Critical patent/CN108897746A/zh
Application granted granted Critical
Publication of CN108897746B publication Critical patent/CN108897746B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种图像检索方法,通过检索系统对检索结果再次做检索,结果显示,查全率和查准率比现有技术都得到了很大的提高,本发明对商标检索领域的应用具有非常大的潜力。

Description

一种图像检索方法
技术领域
本发明涉及图像检索方法,特别涉及一种应用于商标领域的图像检索方法。
背景技术
在现代信息社会,多媒体技术迅速发展,视频和图片等数据爆炸式增长,图像语言作为一种包含大量信息的信息体成为传播交流信息的重要载体。然而面对海量的图像数据,如何快速有效地组织和检索图像信息,成为人们越来越关心的问题,图像检索就是信息时代催生的新兴领域。为此,人们一直在研究各种图像的检索方法,如何提取图像特征到如何匹配图像,多种算法也出现了。
在图像检索的现有技术中,例如单纯地应用角点匹配法,查全率和查准率还不是特别高;哈希算法是指将任意内容映射为一个固定长度字符串的算法,一般用在快速查找中,也是在图像检索领域应用十分广泛的,因为它的速度相对比较快,但是因为此算法对位置十分敏感,因此带来的误差非常大,导致结果不是很理想;梯度方向直方图(Hog)是一种基于边缘梯度方向的统计特征,常用于行人检测,它经常用于多尺度区域统计特征,优点是稳定性高,且也有对位置敏感的缺点。
所以需要研究一种稳定性高、对位置敏感度不高且兼顾查全率和查准率的检索方法。
发明内容
本发明的目的在于提供一种图像检索方法,具有很高的稳定性、对位置不敏感且相比现有技术查全率及查准率提高了很多。
为实现上述目的,本发明提供如下技术方案:一种图像检索方法,包括以下步骤:
一种图像检索方法,包括以下步骤:
S1用户输入检索对象给检索系统;
S2对检索对象进行分块;所述检索系统对检索对象进行分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;分块包括窗口大小及滑动步长两个参数;
S3对检索库中的所有对象进行分块;检索系统按照同步骤S1和步骤S2中的分块对检索库中的所有对象进行同样的操作,分块形成第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;将第一图像特征文件与第二图像特征文件进行比对,得到相似结果;
S5检索系统将所述相似结果作为第二检索对象,按照S2-S4再次检索,得到第二相似结果;
S6检索系统将第二相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一图像窗口与第二图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,偏移范围u的取值范围为0.4~0.6。满足关系如下:
Figure GDA0001724404590000021
Figure GDA0001724404590000022
Figure GDA0001724404590000023
Figure GDA0001724404590000024
(2)设Ai的长宽比
Figure GDA0001724404590000025
Bi-j的长宽比
Figure GDA0001724404590000026
则有
Figure GDA0001724404590000027
Figure GDA0001724404590000028
进一步地,在步骤S4中,对匹配结果执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的汉明距离,得到最小汉明距离;
S511定义相似阈值,最小汉明距离小于相似阈值时,标记为相似窗口;
进一步地,在步骤S5之前执行如下步骤:
S710检索系统将相似结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模
Figure GDA0001724404590000031
使得
Figure GDA0001724404590000032
可求解出L;
S711采用RANSAC算法排除错误的相似窗口,保留在尺度上和空间位置上都具有一致性的相似结果。
进一步地,在步骤S711后,执行如下步骤:
S810分割出相似区域;检索系统定义一个自适应性阈值,根据自适应性阈值分割出相似区域;
S811统计相似结果中匹配窗口的数目;检索系统定义匹配权重,将相似结果中的匹配窗口进行加权叠加,统计覆盖每个匹配窗口中心点(anchor point)的匹配窗口的数目。
进一步地,所述匹配权重的范围为0.5到1.5。
进一步地,所述匹配权重的取值由匹配窗口的汉明距离决定,即汉明距离越小,匹配权重越大。
进一步地,本发明还提供了所述的图像检索方法在商标检索中的应用。
本发明的有益效果:采用分块的方式,使得检索系统能在分块的基础上对检索图像进行分块分割,使得特征提取更加精准;通过相似条件地判断缩小了计算量;通过设置权重,使得结果更加精准;通过将第一次检索结果再次检索,得到的查全查准率更高。
附图说明
图1图示了本发明实施例5的流程步骤图。
图2图示了本发明实施例5的图像梯度方向量化示意图;
图3图示了本发明实施例5的相似窗口加权叠加示意图;
图4图示了本发明实施例5中区域相似性计算的示意图;
图5图示了本发明实施例5中的检索结果排列图。
具体实施方式
下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
一种图像检索方法,包括以下步骤:
S1用户输入检索对象给检索系统;
S2对检索对象进行分块;所述检索系统对检索对象进行分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;分块包括细窗口大小及细滑动步长两个参数;
S3对检索库中的所有对象进行分块;检索系统按照同步骤S1和步骤S2中的分块对检索库中的所有对象进行同样的操作,分块形成第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;将第一图像特征文件与第二图像特征文件进行比对,得到相似结果;
S5检索系统将所述相似结果作为第二检索对象,按照S2-S4再次检索,得到第二相似结果;
S6检索系统将第二相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,在执行步骤S4之前,先对第一图像窗口与第二图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
Figure GDA0001724404590000041
Figure GDA0001724404590000042
Figure GDA0001724404590000043
(2)设Ai的长宽比
Figure GDA0001724404590000044
Bi-j的长宽比
Figure GDA0001724404590000045
则有
Figure GDA0001724404590000046
Figure GDA0001724404590000047
本实施例的实施方式不仅具有提取图像特征更加准确,查全查准率更高,且通过增加对第一图像窗口与第二图像窗口进行相似性判断,有效地缩小了计算量,使得对图像检索的效率大大提高。
实施例2
一种图像检索方法,包括以下步骤:
S1用户输入检索对象给检索系统;
S2对检索对象进行分块;所述检索系统对检索对象进行分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;分块包括细窗口大小及细滑动步长两个参数;
S3对检索库中的所有对象进行分块;检索系统按照同步骤S1和步骤S2中的分块对检索库中的所有对象进行同样的操作,分块形成第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;将第一图像特征文件与第二图像特征文件进行比对,得到相似结果;
S5检索系统将所述相似结果作为第二检索对象,按照S2-S4再次检索,得到第二相似结果;
S6检索系统将第二相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一图像窗口与第二图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
Figure GDA0001724404590000051
Figure GDA0001724404590000052
Figure GDA0001724404590000053
(2)设Ai的长宽比
Figure GDA0001724404590000054
Bi-j的长宽比
Figure GDA0001724404590000055
则有
Figure GDA0001724404590000056
Figure GDA0001724404590000057
进一步地,在步骤S4中,对匹配结果执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的汉明距离,得到最小汉明距离;
S511定义相似阈值,最小汉明距离小于相似阈值时,标记为相似窗口;
与实施例1不同的是,本实施例通过增加计算汉明距离,从而判断匹配的第二图像窗口是否真的算有效相似窗口,不仅进一步缩小了计算量,且提高了查准率。
实施例3
一种图像检索方法,包括以下步骤:
S1用户输入检索对象给检索系统;
S2对检索对象进行分块;所述检索系统对检索对象进行分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;分块包括细窗口大小及细滑动步长两个参数;
S3对检索库中的所有对象进行分块;检索系统按照同步骤S1和步骤S2中的分块对检索库中的所有对象进行同样的操作,分块形成第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;将第一图像特征文件与第二图像特征文件进行比对,得到相似结果;
S5检索系统将所述相似结果作为第二检索对象,按照S2-S4再次检索,得到第二相似结果;
S6检索系统将第二相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一图像窗口与第二图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
Figure GDA0001724404590000061
Figure GDA0001724404590000062
Figure GDA0001724404590000063
(2)设Ai的长宽比
Figure GDA0001724404590000064
Bi-j的长宽比
Figure GDA0001724404590000065
则有
Figure GDA0001724404590000066
Figure GDA0001724404590000067
进一步地,在步骤S4中,对匹配结果执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的汉明距离,得到最小汉明距离;
S511定义相似阈值,最小汉明距离小于相似阈值时,标记为相似窗口;
进一步地,在步骤S5之前执行如下步骤:
S710检索系统将相似结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模
Figure GDA0001724404590000071
使得
Figure GDA0001724404590000072
可求解出L;
S711采用RANSAC算法排除错误的相似窗口,保留在尺度上和空间位置上都具有一致性的相似结果。
与实施例2不同的是,本实施例增加分析尺度-空间一致性的算法,使得相似窗口的判断进一步地精准,进一步地提高了查准率。
实施例4
一种图像检索方法,包括以下步骤:
S1用户输入检索对象给检索系统;
S2对检索对象进行分块;所述检索系统对检索对象进行分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;分块包括细窗口大小及细滑动步长两个参数;
S3对检索库中的所有对象进行分块;检索系统按照同步骤S1和步骤S2中的分块对检索库中的所有对象进行同样的操作,分块形成第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;将第一图像特征文件与第二图像特征文件进行比对,得到相似结果;
S5检索系统将所述相似结果作为第二检索对象,按照S2-S4再次检索,得到第二相似结果;
S6检索系统将第二相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一图像窗口与第二图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
Figure GDA0001724404590000081
Figure GDA0001724404590000082
Figure GDA0001724404590000083
(2)设Ai的长宽比
Figure GDA0001724404590000084
Bi-j的长宽比
Figure GDA0001724404590000085
则有
Figure GDA0001724404590000086
Figure GDA0001724404590000087
进一步地,在步骤S4中,对匹配结果执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的汉明距离,得到最小汉明距离;
S511定义相似阈值,最小汉明距离小于相似阈值时,标记为相似窗口;
进一步地,在步骤S5之前执行如下步骤:
S710检索系统将相似结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模
Figure GDA0001724404590000088
使得
Figure GDA0001724404590000089
可求解出L;
S711采用RANSAC算法排除错误的相似窗口,保留在尺度上和空间位置上都具有一致性的相似结果。
进一步地,在步骤S711后,执行如下步骤:
S810分割出相似区域;检索系统定义一个自适应性阈值,根据自适应性阈值分割出相似区域;
S811统计相似结果中匹配窗口的数目;检索系统定义匹配权重,将相似结果中的匹配窗口进行加权叠加,统计覆盖每个匹配窗口中心点的匹配窗口的数目。
进一步地,所述匹配权重的范围为0.5到1.5。
进一步地,所述匹配权重的取值由匹配窗口的汉明距离决定,即汉明距离越小,匹配权重越大。
与实施例3不同的是,本实施例增加了分割相似区域的算法,进一步提高了查准率。
实施例5
用户输入检索对象Iw×h给检索系统,检索系统操作如下:
定义窗口的尺寸和滑动步长如表1(σ1=0.8,σ2=0.6,σ3=0.4),滑动步长参数μ(取0.1或0.2),窗口水平方向步长stepx=wμ,垂直方向步长stepy=hμ。
表1:
Figure GDA0001724404590000091
将每个窗口以图像Iw×h左上角为起点,按照滑动步长stepx、stepy依次从左到右从上到下滑动,取得一系列第一窗口图像(共计t个)集合R={Ri},i=0,1,…,t.
提取第一窗口图像Ri提取区域图像特征fi
①对于任一图像窗口Ri,计算水平和垂直方向的梯度。
计算方法:[Gh,Gv]=gradient(Ri),采用方向模板[-1,0,1],计算Ri中任一像素点(x,y)的水平梯度Gh(x,y)和垂直梯度Gv(x,y)。
Figure GDA0001724404590000101
Figure GDA0001724404590000102
则(x,y)点的方向角度θ=arctan(Gv/Gh),取值0~360度。
②量化梯度方向,得到梯度方向直方图。将①中得到的梯度方向根据附图2示意的8方向进行量化,统计所有像素点的梯度方向得到梯度方向直方图。传统的量化方法如图2所示,采用就近方向量化的原则,将实际的梯度方向量化至最近的量化方向上。
传统的方向量化方法过于严苛,导致梯度方向量化后的特征鲁棒性较差,对方向较为敏感,为此,本发明提出一种模糊量化方法,将一个梯度方向量化至其相邻的两个bin中,即将一个方向用投影至相邻两个方向的分量表示,如某像素点(x,y)的梯度方向为θ(x,y),其相邻的两个Bin分别为θk、θk+1,则该梯度方向点量化至θk的分量为
Figure GDA0001724404590000103
量化至θk+1的分量为
Figure GDA0001724404590000104
将①中得到的梯度方向根据上述模糊量化方法进行量化,统计所有像素点的模糊梯度方向得到梯度方向直方图。
最后,Ri的梯度方向直方图为
Figure GDA0001724404590000105
③计算归一化梯度方向直方图。
方法一:基于目标像素点总数的归一化方法。
Ri梯度方向直方图
Figure GDA0001724404590000106
归一化直方图为
Figure GDA0001724404590000107
该直方图归一化方法使特征具有良好的尺度一致性,同时体现出各个梯度方向相对统计分布信息。缺点是某个bin梯度点数目的变化将影响整体直方图的相对统计分布。
方法二:基于区域面积参数的归一化方法。
Ri的大小为wi×hi,梯度方向直方图
Figure GDA0001724404590000108
面积参数
Figure GDA0001724404590000109
基于面积参数的归一化直方图为
Figure GDA0001724404590000111
面积参数通过面积开方来计算将使特征具有相对较好的尺度一致性。基于面积参数的直方图归一化方法,既包含了特征窗口中边缘信息的丰富程度,又可反映各个梯度方向统计分布信息,单个bin的变化不会影响其他bin的值。缺点是各个bin之间的差异性可能缩小,对于边缘丰富的窗口,每个bin的取值相对较大,存在多个较大值;而对于边缘比较稀疏的窗口,每个bin的取值都较小,存在多个较小值。
方法三:基于目标像素点总数及区域面积参数二者结合的归一化方法。
基于以上分析,将两种归一化方法相结合,既保证各个bin之间的相对独立性,又兼顾各个bin统计分布的差异性。
Ri的大小为wi×hi,梯度方向直方图
Figure GDA0001724404590000112
基于目标像素总数的归一化直方图为
Figure GDA0001724404590000113
基于面积参数
Figure GDA0001724404590000114
的归一化直方图为
Figure GDA0001724404590000115
则结合二者的归一化直方图定义为:
Figure GDA0001724404590000116
0<w1,w2<1;w1+w2=1
其中α=0.125为8方向归一化直方图的均值。
④直方图特征编码。经过步骤③(方法一)得到Ri的归一化直方图
Figure GDA0001724404590000117
其中0<huj<1,j=0,1,…,7。为了节约计算机计算资源,将上述浮点数据进行编码。
直方图归一化之后按照各个区间梯度点均匀概率分布的原则计算量化区间(0,0.098),(0.098,0.134),(0.134,0.18),(0.18,0.24),(0.24,1),该量化区间的计算由当前样本集合进行统计计算实验得到。对落在这5个区间的数据进行编码分别为:0000,0001,0011,0111,1111.
Figure GDA0001724404590000121
编码之后将各个bin的码字级联得到为一段长度为4×8=32位的二进制串
Figure GDA0001724404590000122
即fi
以检索图像
Figure GDA0001724404590000123
和数据库中任意图像
Figure GDA0001724404590000124
为例:对检索图像
Figure GDA0001724404590000125
中的任意窗口Ai,遍历数据库中图像
Figure GDA0001724404590000126
中所有符合相似可能性条件的窗口Bj,j=k1,k2,...,计算得到的相似距离为
Figure GDA0001724404590000127
查找出最相似的窗口
Figure GDA0001724404590000128
如果相似距离在相似阈值范围内则标记这一对相似窗口,即dmin-i<Tsim,Tsim为经验值,在本实施例中取值约为0.4~0.6。
这里相似距离计算如下:设窗口Ai特征向量经过编码后的二值特征串为fi,滑窗Bj特征向量经过编码后的二值特征串为gj,则Ai和Bi-j之间的相似性距离dij通过汉明距离进行计算:
Figure GDA0001724404590000129
其中fi k表示二进制串fi的第k位,
Figure GDA00017244045900001210
表示二进制串gj的第k位,⊕表示异或操作,α的取值等于fi及gj长度的倒数。
这里的相似判断条件如下:
(1)窗口Bj的中心位置在Ai中心位置附近的一定范围内,允许偏移范围为u=0.5(偏移范围,窗口中心位置按照图形长宽的比例计算,偏移也按照长宽的比例计算,这里,允许偏移范围为长或宽的二分之一,建议取值范围0.4~0.6),即
Figure GDA00017244045900001211
Figure GDA00017244045900001212
同理
Figure GDA00017244045900001213
Figure GDA00017244045900001214
(2)设Ai的长宽比
Figure GDA00017244045900001215
Bj的长宽比
Figure GDA00017244045900001216
则有
Figure GDA00017244045900001217
Figure GDA00017244045900001218
即相似的窗口必须有相近的长宽比。
通过上述操作得到A和B相似窗口的匹配集合{Ai:Bj},由于是全局尺度间的查找模式,其中可能存在不符合空间一致性的匹配对。下面将从所有这些结果中筛选正确的匹配结果。
经过全局范围内的尺度间搜索匹配,能查找到一些正确的匹配窗口,也包含了一些错误的匹配,一种是尺度匹配错误,另一种是位置匹配错误,采用尺度-空间一致性的方法消除错误匹配。
采用改进的RANSAC(随机抽样一致性)算法排除错误的匹配对,保留在尺度上和空间位置上都具有一致性的匹配对,步骤如下:
(1).对匹配数据集合{Ai:Bj}中的任意一对匹配窗口,计算出变换矩阵L,记为模型M,模型的定义如下:
变换模型:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口Ai的左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口Bj左上角和右下角坐标),则存在空间变换模型
Figure GDA0001724404590000131
使得
Figure GDA0001724404590000132
其中a1、a2为特定匹配窗口相关的缩放参数,tx、ty是与特定匹配窗口相关的平移参数,可求解出L。
(2).计算数据集中所有数据与模型M的投影误差,若误差小于阈值,加入内点集I;
(3).如果当前内点集I中元素个数大于最优内点集I_best,则更新I_best=I;
(4).遍历数据集合中的所有数据,重复上述步骤。
(5).最优内点集I_best中的样本即为正确的匹配样本,最终得到正确匹配样本集合I_best={Ai:Bj}。
见附图3所示:对于
Figure GDA0001724404590000133
分别定义矩阵
Figure GDA0001724404590000134
Figure GDA0001724404590000135
(1)对于I_best={Ai:Bj}的任意一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口Ai的左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口Bj左上角和右下角坐标),其相似性距离为dij,定义加权系数ωij=min(2,2.67-3.33dij),则有
Figure GDA0001724404590000136
Figure GDA0001724404590000137
(2)遍历I_best={Ai:Bj}中的所有匹配样本重复(1),更新
Figure GDA0001724404590000141
Figure GDA0001724404590000142
(3)将
Figure GDA0001724404590000143
Figure GDA0001724404590000144
通过采样缩小为CA10×10和CB10×10.
(4)定义初始阈值矩阵
Figure GDA0001724404590000145
T0的设定和具体滑窗的规格有关。设在集合I_best={Ai:Bj}所有属于
Figure GDA0001724404590000146
的所有窗口的总面积为sA,则自适应的阈值矩阵为TA=κT0(sA/(100w1h1))α,在集合I_best={Ai:Bj}所有属于
Figure GDA0001724404590000147
的所有窗口的总面积为sB,则自适应的阈值矩阵为TB=κT0(SB/(100w2h2))α,这里κ=0.2,α=0.7为经验值,随着滑动窗口规格的变化参数应进行适应性的调整。
则有相似区域分割矩阵
Figure GDA0001724404590000148
矩阵中不为0的部分表示图像中的候选相似区域。
对于上述得到的CA10×10和CB10×10中表示的相似区域,分割出A图的相似区域ROIA及B图的相似区域ROIB,按照上述的方法进行区域内相似窗口匹配,查找方法为局部邻域查找。步骤如下:
对ROIA中的任意滑动窗口Ai,遍历数据库中图像ROIB中所有符合相似可能性条件的窗口Bj,j=k1,k2,...,计算得到的相似距离为
Figure GDA0001724404590000149
查找出最相似的窗口
Figure GDA00017244045900001410
如果相似距离在相似阈值范围内则标记这一对相似窗口,即dmin-i<Tsim,T4im为经验值,在本例中取值约为0.4~0.6.
这里相似距离计算如下:设滑窗Ai特征向量经过编码后的二值特征串为fi,滑窗Bj特征向量经过编码后的二值特征串为gj,则Ai和Bi-j之间的相似性距离dij通过汉明距离进行计算:
Figure GDA0001724404590000151
其中fi k表示二进制串fi的第k位,
Figure GDA0001724404590000152
表示二进制串gj的第k位,⊕表示异或操作,α的取值等于fi及gj长度的倒数。
这里的相似可能性条件如下:
(1)窗口Bj的中心位置在Ai中心位置附近的一定范围内,允许变换范围为u=0.2(偏移范围,建议取值范围0.1~0.3),即
Figure GDA0001724404590000153
Figure GDA0001724404590000154
同理
Figure GDA0001724404590000155
Figure GDA0001724404590000156
这里Ai和Bi-j的位置均为在ROI区域中的相对位置。
(2)设Ai的长宽比
Figure GDA0001724404590000157
Bj的长宽比
Figure GDA0001724404590000158
则有
Figure GDA0001724404590000159
Figure GDA00017244045900001510
即相似的窗口必须有相近的长宽比。
通过上述操作得到ROIA和ROIB相似窗口的匹配集合{Ai:Bj}。
ROI区域中滑窗的相似性以滑窗中心点的相似性来代替,如图4中pA(u,v)为图A中的一个包含窗口的中心点,则该点的相似性由所有以该点为中心的窗口的对应相似性的均值来计算:
Figure GDA00017244045900001511
则AB中两个ROI区域的相似距离为:
Figure GDA00017244045900001512
Figure GDA00017244045900001513
其中,nA、nB分别为ROIA、ROIB中包含窗口中心点的数目,λ为相似面积参数,和nA、nB成反比,相似区域总面积越大,λ越小。
相似性排序返回结果
对检索图像Q,及数据库中图像D={D1,D2,…,DN}中的任意图像Di(i=1,2,…,N)计算得到相似性距离di,根据相似性距离从小到大进行排序返回最终的排序结果。
一幅检索图Q0经过一次检索返回的相似图形的排序序列为{S0}=[I01,I02,…,I0k,…],取相似性最高的TOP k个图形作为检索图形依此进行检索分别得到检索序列{Sm}=[Im1,Im2,…,Imk,…],m=1,…,k,最终的综合检索结果集合S={S0∪S1∪…∪Sm∪…}={st}。定义相关排序的权值矩阵w0=[wij],其中wij=max(2-(i+j)/L,1),L≥2k,L为权值参数,集合S中相同元素的权值叠加
Figure GDA0001724404590000161
其中
Figure GDA0001724404590000162
最终S按照
Figure GDA0001724404590000163
从大到小进行排序。
该方法融合了相关图像的多次检索的排序结果,出现次数较多的图像具有较高的权重,排序靠前的图像具有较高的权重,充分挖掘了图像之间的相关性。
最终检索效果图排序如图5所示,其中检索对象标示为00000,横向排列的均为由输入检索对象00000后出现的相似结果排列,结果显示(见附图5及表2),本实施例的图像检索方法不仅查全率和查准率都优于现有技术。
表2:
Figure GDA0001724404590000164
其中,表2中,r-measure与p-measure的意义如下:检索图像q经过查询得到的有序的查询结果中,有n幅图像和q相似,r1,r2,…,rn为这n幅图像在全部检索结果排序位置,
Figure GDA0001724404590000171
Figure GDA0001724404590000172
其中,r-measure表示目标图像在查询结果中的平均位置,该指标跟相关图像的数目有关,在同样数目的相关图像的情况下,r-measure越小说明相关图像越靠前,系统的检索准确度越高,当相关图像全部排在前面的时候,r-measure的取值为相关图像数目的中值。p-measure反映了相关图像靠前排列的程度,该指标数值越接近于1表示检索准确度越高。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种图像检索方法,其特征在于,包括以下步骤:
S1用户输入检索对象给检索系统;
S2对检索对象进行分块;所述检索系统对检索对象进行分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;分块包括细窗口大小及细滑动步长两个参数;
S3对检索库中的所有对象进行分块;检索系统按照同步骤S1和步骤S2中的分块对检索库中的所有对象进行同样的操作,分块形成第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;将第一图像特征文件与第二图像特征文件进行比对,得到相似结果;
S5检索系统将所述相似结果作为第二检索对象,按照S2-S4再次检索,得到第二相似结果;
S6检索系统将第二相似结果进行排序展示;
其中在步骤S5之前执行如下步骤:
S710检索系统将相似结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模型
Figure FDA0003175268940000011
使得
Figure FDA0003175268940000012
其中a1、a2为特定匹配窗口相关的缩放参数,tx、ty是与特定匹配窗口相关的平移参数,可求解出L;
S711采用RANSAC算法排除错误的相似窗口,保留在尺度上和空间位置上都具有一致性的相似结果。
2.根据权利要求1所述的图像检索方法,其特征在于:所述提取出第一图像窗口的第一图像特征文件采用的是梯度方向直方图方法。
3.根据权利要求1所述的图像检索方法,其特征在于:所述提取出第一图像窗口的第一图像特征文件采用的是哈希算法。
4.根据权利要求1所述的图像检索方法,其特征在于:在执行步骤S4之前,先对第一图像窗口与第二图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4。
5.根据权利要求4所述的图像检索方法,其特征在于:相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
Figure FDA0003175268940000021
Figure FDA0003175268940000022
Figure FDA0003175268940000023
(2)设Ai的长宽比
Figure FDA0003175268940000024
Bi-j的长宽比
Figure FDA0003175268940000025
则有
Figure FDA0003175268940000026
Figure FDA0003175268940000027
6.根据权利要求5所述的图像检索方法,其特征在于:在步骤S4中,对匹配结果执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的汉明距离,得到最小汉明距离;
S511定义相似阈值,最小汉明距离小于相似阈值时,标记为相似窗口。
7.根据权利要求1所述的图像检索方法,其特征在于:在步骤S711后,执行如下步骤:
S810分割出相似区域;检索系统定义一个自适应性阈值,根据自适应性阈值分割出相似区域;
S811统计相似结果中匹配窗口的数目;检索系统定义匹配权重,将相似结果中的匹配窗口进行加权叠加,统计覆盖每个匹配窗口中心点的匹配窗口的数目。
8.根据权利要求7所述的图像检索方法,其特征在于:所述匹配权重的范围为0.5到1.5。
9.权利要求1-8任一项所述的图像检索方法在商标图形检索中的应用。
CN201810291389.8A 2018-04-03 2018-04-03 一种图像检索方法 Active CN108897746B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810291389.8A CN108897746B (zh) 2018-04-03 2018-04-03 一种图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810291389.8A CN108897746B (zh) 2018-04-03 2018-04-03 一种图像检索方法

Publications (2)

Publication Number Publication Date
CN108897746A CN108897746A (zh) 2018-11-27
CN108897746B true CN108897746B (zh) 2022-02-08

Family

ID=64342458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810291389.8A Active CN108897746B (zh) 2018-04-03 2018-04-03 一种图像检索方法

Country Status (1)

Country Link
CN (1) CN108897746B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819582A (zh) * 2012-07-26 2012-12-12 华数传媒网络有限公司 一种海量图片快速检索方法
CN103970769A (zh) * 2013-01-29 2014-08-06 华为技术有限公司 图像检索方法及装置
CN104200240A (zh) * 2014-09-24 2014-12-10 梁爽 一种基于内容自适应哈希编码的草图检索方法
CN105260412A (zh) * 2015-09-24 2016-01-20 东方网力科技股份有限公司 一种图像存储方法、图像检索方法和装置
CN107145487A (zh) * 2016-03-01 2017-09-08 深圳中兴力维技术有限公司 图像搜索方法和装置
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000163576A (ja) * 1998-11-25 2000-06-16 Hitachi Ltd 画像検索方法及びその実施装置並びにその処理プログラムを記録した媒体
US8582802B2 (en) * 2009-10-09 2013-11-12 Edgenet, Inc. Automatic method to generate product attributes based solely on product images
CN103970775A (zh) * 2013-01-31 2014-08-06 山东财经大学 一种基于对象空间位置关系的医学图像检索方法
CN103839258A (zh) * 2014-02-13 2014-06-04 西安交通大学 一种二值化激光散斑图像的深度感知方法
CN104199931B (zh) * 2014-09-04 2018-11-20 厦门大学 一种商标图像一致语义提取方法及商标检索方法
CN105574063B (zh) * 2015-08-24 2019-02-22 西安电子科技大学 基于视觉显著性的图像检索方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819582A (zh) * 2012-07-26 2012-12-12 华数传媒网络有限公司 一种海量图片快速检索方法
CN103970769A (zh) * 2013-01-29 2014-08-06 华为技术有限公司 图像检索方法及装置
CN104200240A (zh) * 2014-09-24 2014-12-10 梁爽 一种基于内容自适应哈希编码的草图检索方法
CN105260412A (zh) * 2015-09-24 2016-01-20 东方网力科技股份有限公司 一种图像存储方法、图像检索方法和装置
CN107145487A (zh) * 2016-03-01 2017-09-08 深圳中兴力维技术有限公司 图像搜索方法和装置
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《Content based image retrieval using Dither Block Truncation coding with similarity comparison algorithm》;Pradeep Yadav等;《IEEE Xplore》;20170818;全文 *
《融合多特征和哈希算法的图像检索研究》;孙奇平;《淮海工学院学报(自然科学版)》;20180331;第38-42页 *

Also Published As

Publication number Publication date
CN108897746A (zh) 2018-11-27

Similar Documents

Publication Publication Date Title
CN107256262B (zh) 一种基于物体检测的图像检索方法
CN107679250B (zh) 一种基于深度自编码卷积神经网络的多任务分层图像检索方法
CN107145829B (zh) 一种融合纹理特征和尺度不变特征的掌静脉识别方法
CN110413816B (zh) 彩色草图图像搜索
Wahlberg et al. Large scale style based dating of medieval manuscripts
CN104850822B (zh) 基于多特征融合的简单背景下的叶片识别方法
CN108694411B (zh) 一种识别相似图像的方法
CN108830279A (zh) 一种图像特征提取与匹配方法
CN108763262A (zh) 一种商标图形检索方法
CN110334628B (zh) 一种基于结构化随机森林的室外单目图像深度估计方法
CN108763265B (zh) 一种基于分块检索的图像识别方法
CN108845998B (zh) 一种商标图像检索匹配方法
CN112926592B (zh) 一种基于改进Fast算法的商标检索方法及装置
CN108764245B (zh) 一种提高商标图形相似度判定准确性的方法
CN108763261B (zh) 一种图形检索方法
CN105224619B (zh) 一种适用于视频/图像局部特征的空间关系匹配方法及系统
CN108845999B (zh) 一种基于多尺度区域特征比对的商标图像检索方法
Ahmad et al. SSH: Salient structures histogram for content based image retrieval
Singh et al. Ensemble visual content based search and retrieval for natural scene images
CN108897746B (zh) 一种图像检索方法
CN110705569A (zh) 一种基于纹理特征的图像局部特征描述子提取方法
JP2002183732A (ja) パターン認識方法及びパターン認識を行わせるプログラムを記憶したコンピュータ読み取り可能な記憶媒体
CN115203408A (zh) 一种多模态试验数据智能标注方法
Wu et al. Similar image retrieval in large-scale trademark databases based on regional and boundary fusion feature
CN107092875B (zh) 一种新的场景识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant