CN102779157A - 搜索图像的方法和装置 - Google Patents

搜索图像的方法和装置 Download PDF

Info

Publication number
CN102779157A
CN102779157A CN2012101831840A CN201210183184A CN102779157A CN 102779157 A CN102779157 A CN 102779157A CN 2012101831840 A CN2012101831840 A CN 2012101831840A CN 201210183184 A CN201210183184 A CN 201210183184A CN 102779157 A CN102779157 A CN 102779157A
Authority
CN
China
Prior art keywords
image
picture library
histogram
proper vector
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101831840A
Other languages
English (en)
Other versions
CN102779157B (zh
Inventor
甘永洲
井振刚
邓正平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201210183184.0A priority Critical patent/CN102779157B/zh
Publication of CN102779157A publication Critical patent/CN102779157A/zh
Application granted granted Critical
Publication of CN102779157B publication Critical patent/CN102779157B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明提供一种搜索图像的方法和装置,能够提高从图库中搜索与被比图像相似的图库图像的准确性。该方法包括:计算被比图像和图库图像的梯度直方图特征向量、角度直方图特征向量,根据被比图像和图库图像的梯度直方图特征向量的欧氏距离以及被比图像和图库图像的角度直方图特征向量的欧氏距离确定被比图像与图库图像的相似度,根据该相似度从图库中选择与被比图像具有相似性的图库图像。

Description

搜索图像的方法和装置
技术领域
本发明涉及计算机图像处理技术,特别地涉及一种搜索图像的方法和装置。
背景技术
当今社会,随着电子计算机和互联网的飞速发展,计算机视觉逐渐被人们所重视,其应用在人们生活的各个领域,涉及电子商务,安防监控,工业检测,人工智能等诸多方面,而其展现的惊人能力也为人赞叹。其中,计算机数字图像处理是其极为重要和基础的一个方面,通过对图像进行计算机分析,能够解决诸多凭借人眼,人脑不能解决或不能迅速解决的问题。
图像搜索通常是指在图库中选择与被比图像具有较高相似性的图库图像。该相似性越高,说明搜索图像的准确性越高。当计算机图像处理出现以前,传统的图像搜索还停留在由人眼进行比对,在图库图像数量巨大的情况下,人工的方式难以查到在图库中与被比图像最为接近的一幅或多幅图像。随着计算机视觉及计算机图像处理的出现,方法由传统的人工方式改变为计算机搜索图像,其中通过计算机对图像进行分析,得到图像的各种特征,同时与图像库中的图像进行比对,最终搜索到一样或者相似的目标图像信息。但是由于受图像拍摄环境复杂度以及图像库的丰富程度的影响,目前计算机搜索图像的准确性也比较低。
发明内容
有鉴于此,本发明提供一种搜索图像的方法和装置,能够提高从图库中搜索与被比图像相似的图库图像的准确性。
为实现上述目的,根据本发明的一个方面,提供了一种搜索图像的方法。
本发明的搜索图像的方法包括:针对具有预设的统一尺寸并且灰度化之后的图库图像,进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量,并且进行SIFT密度特征分布计算得到多个特征点,以及将该图库图像分成多个子图像,对于包含的所述特征点的密度大于密度预设值的子图像,对该子图像内的特征点进行SIFT角度特征计算并按预设的角度步长统计得到该图库图像的角度直方图特征向量;针对具有所述预设的统一尺寸并且灰度化之后的被比图像,同样进行上述计算以得到该被比图像的梯度直方图特征向量和角度直方图特征向量;根据所述被比图像的梯度直方图特征向量和角度直方图特征向量分别与所述图库图像的梯度直方图特征向量和角度直方图特征向量之间在赋范线性空间的距离确定所述被比图像与所述图库图像的相似度,根据该相似度从所述图库中选择与所述被比图像具有相似性的图库图像。
可选地,进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量包括:将图库图像分成A行B列图块,A、B表示自然数,其中各行的各个图块与相邻图块有重叠;计算每个图块内每个像素的梯度;按预设的梯度方向角度步长统计每个图块内的像素的梯度得到该图块的梯度直方图特征向量;将所述图库图像中的每个图块的梯度直方图特征向量级联得到该图库图像的梯度直方图特征向量。
可选地,进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量包括:将图库图像分成A行B列图块,A、B表示自然数,其中各行的各个图块与相邻图块有重叠;将每个图块分成C行D列子图块,C、D表示自然数;计算每个子图块内每个像素的梯度;按预设的梯度方向角度步长统计每个子图块内的像素的梯度得到该子图块的梯度直方图特征向量;针对各个所述图块,将该图块的每个子图块的梯度直方图特征向量级联得到该图块的梯度直方图特征向量;将所述图库图像中的每个图块的梯度直方图特征向量级联得到该图库图像的梯度直方图特征向量。
可选地,C=D=2。
可选地,所述预设的梯度方向角度步长为40°。
可选地,A=B=3。
可选地,所述将该图库图像分成多个子图像包括将该图库图像分成E行F列子图像;所述子图像包含的所述特征点的密度,是该子图像包含的特征点的个数与该子图像所在图库图像包含的特征点的个数的比值;所述密度预设值为1/(E×F)。
可选地,所述预设的角度步长为20°。
可选地,所述赋范线性空间为欧氏空间。
可选地,在对所述图库图像进行灰度化之前,所述方法还包括对所述图库图像进行等比缩放的步骤,其中,判断若所述图库图像的宽度和高度都大于预设长度,则将二者缩小并保持图像的宽高比不变,而且二者中的较小者缩小至预设长度。
可选地,所述预设长度属于区间[500,800],单位为像素。
可选地,在进行所述HOG特征分布计算以及所述SIFT密度特征分布计算之前,所述方法还包括:对经过所述等比缩放的步骤之后的图库图像进行双边滤波处理。
根据本发明的另一方面,提供了一种搜索图像的装置。
本发明的搜索图像的装置用于在图库中选择与被比图像具有相似性的图库图像,该装置包括:保存模块,用于保存图库图像的梯度直方图特征向量和角度直方图特征向量;所述图库图像是灰度化之后的图像,并且具有预设的统一尺寸;预处理模块,用于针对具有所述预设的统一尺寸的被比图像,进行灰度化得到被比图像的灰度图;特征计算模块,用于针对被比图像的灰度图,进行HOG特征分布计算并统计得到该被比图像的梯度直方图特征向量,并且进行SIFT密度特征分布计算得到多个特征点,以及将该被比图像分成多个子图像,对于包含的所述特征点的密度大于密度预设值的子图像,对该子图像内的特征点进行SIFT角度特征计算并按预设的角度步长统计得到该被比图像的角度直方图特征向量;匹配模块,用于根据所述被比图像的梯度直方图特征向量和角度直方图特征向量分别与所述图库图像的梯度直方图特征向量和角度直方图特征向量之间在赋范线性空间的距离确定所述被比图像与所述图库图像的相似度,根据该相似度从所述图库中选择与所述被比图像具有相似性的图库图像。
进一步地,所述预处理模块还用于:判断若图像的宽度和高度都大于预设长度,则将二者缩小并保持图像的宽高比不变,而且二者中的较小者缩小至预设长度;对所述等比缩放模块处理之后的图像进行双边滤波处理。
根据本发明的技术方案,通过提取SIFT密度特征较大的图像区域来计算该区域的SIFT角度特征,排除了噪声对图像SIFT特征提取的影响,同时增强了图像可用特征的权重和SIFT特征提取的鲁棒性。而通过HOG特征分布计算,能够获得图像的全局特征。本实施例中,在计算SIFT特征时对图像进行了划分并且进行了按区间的统计,这些划分方式和步长都具有较好的搜索效果并且不至于计算量过大。所以总体来说采用本发明实施例的技术方案能够比较快地在图库中找到与被比图像尽可能相似的图库图像,从而提高了从图库中搜索与被比图像相似的图库图像的准确性。
附图说明
附图用于更好地理解本发明,并不构成对本发明的不当限定。其中:
图1是根据本发明实施例的搜索图像的方法的主要步骤的示意图;
图2A和图2B是根据本发明实施例的SIFT密度特征较大的图像区域的示意图;
图3是根据本发明实施例的确定图像缩放后的高度和宽度的逻辑流程的示意图;
图4是根据本发明实施例的一种得出图库图像的梯度直方图特征向量的步骤的示意图;
图5是根据本发明实施例的计算HOG特征的过程中对图像进行有重合的分块的示意图;
图6是根据本发明实施例的另一种得出图库图像的梯度直方图特征向量的步骤的示意图;
图7是根据本发明实施例的得出图库图像的角度直方图特征向量的步骤的示意图;以及
图8是根据本发明实施例的搜索图像的装置的主要模块的示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1是根据本发明实施例的搜索图像的方法的主要步骤的示意图。如图1所示,本发明实施例的搜索图像的方法主要包括步骤S11至步骤S14。
步骤S11:建立图库数据库。
在本步骤中,对于具有预设的统一尺寸的图库图像,先将它们灰度化,然后进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量,并且进行SIFT密度特征分布计算得到多个特征点,以及将该图库图像分成多个子图像,对于包含的特征点的密度大于密度预设值的子图像,对该子图像内的特征点进行SIFT角度特征计算并按预设的角度步长统计得到该图库图像的角度直方图特征向量。
这样,图库数据库中包含了每张图库图像的梯度直方图特征向量和角度直方图特征向量。这里的SIFT是指尺度不变特征转换(Scale-invariant feature transform),HOG是指方向梯度直方图(Histograms of Oriented Gradients)。HOG特征分布计算、SIFT密度特征分布计算、SIFT角度特征计算都可采用现有的算法来完成,这里不再赘述。
步骤S12:计算被比图像的梯度直方图特征向量和角度直方图特征向量。该计算方式与步骤S11中计算每张图库图像的梯度直方图特征向量和角度直方图特征向量的方式相同。在计算之前同样要将被比图像调整为图库图像的尺寸并且灰度化。
步骤S13:确定被比图像与图库图像的相似度。在本步骤中,计算被比图像的梯度直方图特征向量、角度直方图特征向量与每一图库图像的梯度直方图特征向量、角度直方图特征向量之间的欧氏距离,以该欧氏距离作为被比图像与图库图像的相似度。可以看出,该欧氏距离越小,相似度越高。
步骤S14:选择与被比图像具有相似性的图库图像。本步骤的选择依据即为步骤S13中计算得到的相似度,可以对该相似度进行排序,然后选择一个或多个相似度最高的图库图像。
从图1所示的步骤可以看出,通过选取SIFT密度特征较大的图像区域(即子图像)计算该区域的SIFT角度特征,能够获得图像中最能够体现该图像特点的数据。以下结合图2加以说明。图2A和图2B是根据本发明实施例的SIFT密度特征较大的图像区域的示意图。例如图2A所示,左边杯子中的区域21、区域22,右边杯子中的区域23、24都是SIFT密度特征较大的图像区域,说明杯子上面的图案和把手的形状最能体现该杯子的特点。又如图2B所示,瓶贴部位25是SIFT密度特征较大的图像区域,说明瓶贴部位最能体现该瓶子的特点。通过提取SIFT密度特征较大的图像区域来计算该区域的SIFT角度特征,排除了噪声对图像SIFT特征提取的影响,同时增强了图像可用特征的权重和SIFT特征提取的鲁棒性。而通过HOG特征分布计算,能够获得图像的全局特征。因此综合起来能够在图库中找到与被比图像尽可能相似的图库图像,从而提高了从图库中搜索与被比图像相似的图库图像的准确性。
对于图库来说,新加入的图像应当被调整得与图库原有图像具有统一的尺寸。对于被比图像也是如此。此时需要对图像进行等比缩放操作,这样可以将图像缩放到合适的大小从而有助于提高计算的效率。在确定图像缩放后的高度和宽度时,具体可以按图3所示的逻辑流程进行。图3是根据本发明实施例的确定图像缩放后的高度和宽度的逻辑流程的示意图。
如图3所示,先取图像的高度(以H表示)和宽度(以W表示)中的较小者(步骤S30)然后判断该较小者是否大于预设阈值(步骤S31)。该阈值优选地可采用[500,800],单位是像素。若是,进入步骤S32,否则不作缩放处理,直接进行步骤S11中的HOG特征分布计算和SIFT密度特征分布计算。
在步骤S32中,判断图像的高度和宽度哪个较小。若宽度较小则进入步骤S33,即作如下计算:scale=W/T,W`=T,H`=H/scale;若高度较小则进入步骤S34,即作如下计算:scale=H/T,H`=T,W`=W/scale。其中W`和H`分别表示缩放之后的宽度和高度,T表示步骤S31中的预设的阈值。
在确定了图像缩放后的高度和宽度之后,可以采用线性插值的方式来进行图像的缩放。例如先进行X方向的线性插值,然后进行Y方向的线性插值。可按如下公式计算:
f ( R 1 ) ≈ x 2 - x x 2 - x 1 f ( Q 11 ) + x - x 1 x 2 - x 1 f ( Q 21 ) ; f ( R 2 ) ≈ x 2 - x x 2 - x 1 f ( Q 12 ) + x - x 1 x 2 - x 1 f ( Q 22 ) ;
f ( P ) ≈ y 2 - y y 2 - y 1 f ( R 1 ) + y - y 1 y 2 - y 1 f ( R 2 ) .
其中,R1、R2表示进行X方向线性插值后的像素点,x、y、x1、y1、x2、y2都表示图像中的像素点的坐标,f(*,*)表示像素的颜色值,Q11=(x1,y1),Q12=(x1,y2),Q21=(x2,y1),Q22=(x2,y2),它们表示参与缩放计算的原图像中的四个点,P表示经过Y方向线性插值后的点。在本实施例中,经过Y方向的线性插值之后即得到等比缩放后的图像。
在本实施例中,还可以对等比缩放后的图像进行双边滤波处理。可按现有技术中的各种双边滤波处理方式来完成,例如可按如下公式计算:
h ( x ) = k - 1 ( x ) ∫ - ∞ ∞ ∫ - ∞ ∞ f ( ξ ) c ( ξ , x ) s ( f ( ξ ) , f ( x ) ) dξ
其中f(x)表示输入图像,h(x)为输出图像,c(ξ,x)度量邻域中心x与其相邻点ξ的几何临近程度,s(f(ξ),f(x))度量了邻域中心x与其相邻点ξ像素的光度相似性,k为归一化参数,在平滑的区域,双边滤波器表现为标准的网域滤波器,通过平均过滤掉噪声。然后根据如下公式对彩色输入图像进行灰度化操作:Y=0.299R+0.587G+0.114B。
其中Y表示当前像素在转换后的像素值,R表示当前像素的红色值,G表示当前像素的绿色值,B表示当前像素的蓝色值。
以下对于图1中的各步骤的优选方式再加以说明。
在步骤S11中,在进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量的过程中,具体可以根据图4所示的步骤进行。图4是根据本发明实施例的一种得出图库图像的梯度直方图特征向量的步骤的示意图。
步骤S41:将图库图像分成A行B列图块,其中各行的各个图块与相邻图块有重叠。这里的A、B表示自然数。图5是根据本发明实施例的计算HOG特征的过程中对图像进行有重合的分块的示意图。如图5所示,图像50被分为3行3列,为了示意清晰起见,图中只示出了第一行的3块,并且图块51、52、53和图像50的边缘没有完全重合。其中图块52分别与两边的图块51、53重合。同样为了示意清晰,图块51、52和53的边缘没有完全对齐。图5是以划分为3行3列为例,也可以进行其他行数和列数的划分。
步骤S42:计算每个图块内每个像素的梯度。
步骤S43:按预设的梯度方向角度步长统计每个图块内的像素的梯度得到该图块的梯度直方图特征向量。角度步长例如取40°。
步骤S44:将图库图像中的每个图块的梯度直方图特征向量级联得到该图库图像的梯度直方图特征向量。这里的级联即向量首尾相连。
在进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量的过程中,也可以根据图6所示的步骤进行。图6是根据本发明实施例的另一种得出图库图像的梯度直方图特征向量的步骤的示意图。
步骤S61:将图库图像分成A行B列图块,其中各行的各个图块与相邻图块有重叠。这里的A、B表示自然数。
步骤S62:将每个图块分成C行D列子图块。这里C、D表示自然数。
步骤S63:计算每个子图块内每个像素的梯度。
步骤S64:按预设的梯度方向角度步长统计每个子图块内的像素的梯度得到该子图块的梯度直方图特征向量。
步骤S65:针对各个图块,将该图块的每个子图块的梯度直方图特征向量级联得到该图块的梯度直方图特征向量。
步骤S66:将图库图像中的每个图块的梯度直方图特征向量级联得到该图库图像的梯度直方图特征向量。
步骤S61中可以分成3行3列。步骤S42中的分成子图块的做法有助于提高HOG特征计算的鲁棒性,具体可以分成2行2列,这样不至于运算量太大。
在步骤S11中,得出图库图像的角度直方图特征向量的过程中,具体可以按照图7所示的步骤进行。图7是根据本发明实施例的得出图库图像的角度直方图特征向量的步骤的示意图。
步骤S71:计算图库图像的SIFT特征并统计特征点数目N。
步骤S72:将图库图像分成3行3列的子图像。当然也可以选择其他行、列数。
步骤S73:统计图库图像中每个子图像的SIFT特征点数目ni(i=0,1,2,……,8)。
步骤S74:计算每个子图像的SIFT特征点密度di=ni/N,(i=0,1,2,……,8)。
步骤S75:选择特征点的密度大于密度预设值的子图像。这里的密度预设值可以是1/9。这里的分母9是根据上述的3行3列相乘得出。如果是其他行列数同样可采用行数乘以列数作为密度预设值。
对于密度大于密度预设值的子图像,可以认为该子图像包含了整幅图像中有特点的内容,可参考图2A和图2B以及前文中的说明。因此对于选择出的子图像,又可以称作是该图库图像的置信区域。
步骤S76:对各个置信区域进行SIFT角度特征计算。
步骤S77:按步长为20°将0至360°划分为18个区间,统计各个置信区域中的SIFT角度特征点落入每个区间的个数,从而针对每个置信区域各统计得到一个18维的直方图。当然在本步骤中也可以按其他角度步长进行统计。
步骤S78:将各个直方图归一化形成各个置信区域对应的18维特征向量。
步骤S79:级联所有置信区域对应的特征向量,从而得到该图库图像的角度直方图特征向量。
以上的角度直方图特征向量的具体计算方式仅为举例,还可以采用其他具体计算方式来得到图库图像的角度直方图特征向量。
对于被比图像,同样对其进行与图库图像类似的上述计算,这样就可以根据图库图像和被比图像得到相同维数的两个向量从而可以得到二者的相似程度,该相似程度一般地可以用这两个向量在赋范线性空间的距离来表征。本实施例中的赋范线性空间上的范数为L2范数,即该空间为欧氏空间,也就是说在计算步骤S13中的欧氏距离时,具体可以按下式进行计算:
dis = W 1 Σ 1 n ( F H - F H ′ ) 2 + ( 1 - W 1 ) Σ 1 n ′ ( F θ - F θ ′ ) 2
其中:dis表示上述欧氏距离;W1表示预设的权重值;n和n′表示参与欧氏距离计算的向量的维数;FH表示被比图像的梯度直方图特征向量;F′H表示图库图像的梯度直方图特征向量;Fθ表示被比图像的角度直方图特征向量;F′θ表示图库图像的角度直方图特征向量。
以下对于本发明实施例中的搜索图像的装置的基本结构做出说明。图8是根据本发明实施例的搜索图像的装置的主要模块的示意图,该搜索图像的装置用于在图库中选择与被比图像具有相似性的图库图像,可以设置在电子商务系统的服务器中。如图8所示,搜索图像的装置80主要包括保存模块81、预处理模块82、特征计算模块83。
保存模块81用于保存图库图像的梯度直方图特征向量和角度直方图特征向量。这里的图库图像是灰度化之后的图像,并且具有预设的统一尺寸。预处理模块82用于针对具有所述预设的统一尺寸的被比图像,进行灰度化得到被比图像的灰度图。
特征计算模块83用于针对灰度化之后的被比图像,进行HOG特征分布计算并统计得到该被比图像的梯度直方图特征向量,并且进行SIFT密度特征分布计算得到多个特征点,以及将该被比图像分成多个子图像,对于包含的所述特征点的密度大于密度预设值的子图像,对该子图像内的特征点进行SIFT角度特征计算并按预设的角度步长统计得到该被比图像的角度直方图特征向量。
匹配模块83用于根据被比图像的梯度直方图特征向量和角度直方图特征向量分别与图库图像的梯度直方图特征向量和角度直方图特征向量之间的欧氏距离确定被比图像与所述图库图像的相似度,根据该相似度从图库中选择与被比图像具有相似性的图库图像。
预处理模块82还可用于:判断若图像的宽度和高度都大于预设长度,则将二者缩小并保持图像的宽高比不变,而且二者中的较小者缩小至预设长度;对所述等比缩放模块处理之后的图像进行双边滤波处理。
根据本发明实施例的技术方案,通过提取SIFT密度特征较大的图像区域来计算该区域的SIFT角度特征,排除了噪声对图像SIFT特征提取的影响,同时增强了图像可用特征的权重和SIFT特征提取的鲁棒性。而通过HOG特征分布计算,能够获得图像的全局特征。本实施例中,在计算SIFT特征时对图像进行了划分并且进行了按区间的统计,这些划分方式和步长都具有较好的搜索效果并且不至于计算量过大。所以总体来说采用本发明实施例的技术方案能够比较快地在图库中找到与被比图像尽可能相似的图库图像,从而提高了从图库中搜索与被比图像相似的图库图像的准确性。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,对本领域的普通技术人员而言,能够理解本发明的方法和设备的全部或者任何步骤或者部件,可以在任何计算装置(包括处理器、存储介质等)或者计算装置的网络中,以硬件、固件、软件或者它们的组合加以实现,这是本领域普通技术人员在阅读了本发明的说明的情况下运用他们的基本编程技能就能实现的。
因此,本发明的目的还可以通过在任何计算装置上运行一个程序或者一组程序来实现。所述计算装置可以是公知的通用装置。因此,本发明的目的也可以仅仅通过提供包含实现所述方法或者装置的程序代码的程序产品来实现。也就是说,这样的程序产品也构成本发明,并且存储有这样的程序产品的存储介质也构成本发明。所述存储介质可以是任何公知的存储介质或者将来所开发出来的任何存储介质。
还需要指出的是,在本发明的装置和方法中,显然,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。并且,执行上述系列处理的步骤可以自然地按照说明的顺序按时间顺序执行,但是并不需要一定按照时间顺序执行。某些步骤可以并行或彼此独立地执行。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (14)

1.一种搜索图像的方法,用于在图库中选择与被比图像具有相似性的图库图像,其特征在于,该方法包括:
针对具有预设的统一尺寸并且灰度化之后的图库图像,进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量,并且进行SIFT密度特征分布计算得到多个特征点,以及将该图库图像分成多个子图像,对于包含的所述特征点的密度大于密度预设值的子图像,对该子图像内的特征点进行SIFT角度特征计算并按预设的角度步长统计得到该图库图像的角度直方图特征向量;
针对具有所述统一尺寸并且灰度化之后的被比图像,同样进行上述计算以得到该被比图像的梯度直方图特征向量和角度直方图特征向量;
根据所述被比图像的梯度直方图特征向量和角度直方图特征向量分别与所述图库图像的梯度直方图特征向量和角度直方图特征向量之间的在赋范线性空间的距离确定所述被比图像与所述图库图像的相似度,根据该相似度从所述图库中选择与所述被比图像具有相似性的图库图像。
2.根据权利要求1所述的方法,其特征在于,进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量包括:
将图库图像分成A行B列图块,A、B表示自然数,其中各行的各个图块与相邻图块有重叠;
计算每个图块内每个像素的梯度;
按预设的梯度方向角度步长统计每个图块内的像素的梯度得到该图块的梯度直方图特征向量;
将所述图库图像中的每个图块的梯度直方图特征向量级联得到该图库图像的梯度直方图特征向量。
3.根据权利要求1所述的方法,其特征在于,进行HOG特征分布计算并统计得到该图库图像的梯度直方图特征向量包括:
将图库图像分成A行B列图块,A、B表示自然数,其中各行的各个图块与相邻图块有重叠;
将每个图块分成C行D列子图块,C、D表示自然数;
计算每个子图块内每个像素的梯度;
按预设的梯度方向角度步长统计每个子图块内的像素的梯度得到该子图块的梯度直方图特征向量;
针对各个所述图块,将该图块的每个子图块的梯度直方图特征向量级联得到该图块的梯度直方图特征向量;
将所述图库图像中的每个图块的梯度直方图特征向量级联得到该图库图像的梯度直方图特征向量。
4.根据权利要求3所述的方法,其特征在于,C=D=2。
5.根据权利要求3所述的方法,其特征在于,所述预设的梯度方向角度步长为40°。
6.根据权利要求2至5中任一项所述的方法,其特征在于,A=B=3。
7.根据权利要求1、2或3所述的方法,其特征在于,
所述将该图库图像分成多个子图像包括将该图库图像分成E行F列子图像;
所述子图像包含的所述特征点的密度,是该子图像包含的特征点的个数与该子图像所在图库图像包含的特征点的个数的比值;
所述密度预设值为1/(E×F)。
8.根据权利要求7所述的方法,其特征在于,所述预设的角度步长为20°。
9.根据权利要求1所述的方法,其特征在于,所述赋范线性空间为欧氏空间。
10.根据权利要求1所述的方法,其特征在于,在对所述图库图像和被比图像进行灰度化之前,所述方法还包括对所述图库图像和所述被比图像进行等比缩放至所述统一尺寸的步骤。
11.根据权利要求10所述的方法,其特征在于,在所述统一尺寸中,图像的高度和宽度中的较小者的长度属于区间[500,800],单位为像素。
12.根据权利要求10或11所述的方法,其特征在于,在进行所述HOG特征分布计算以及所述SIFT密度特征分布计算之前,所述方法还包括:
对经过所述等比缩放的步骤之后的图库图像或被比图像进行双边滤波处理。
13.一种搜索图像的装置,用于在图库中选择与被比图像具有相似性的图库图像,其特征在于,该装置包括:
保存模块,用于保存图库图像的梯度直方图特征向量和角度直方图特征向量;所述图库图像是灰度化之后的图像,并且具有预设的统一尺寸;
预处理模块,用于针对具有所述预设的统一尺寸的被比图像,进行灰度化得到被比图像的灰度图;
特征计算模块,用于针对被比图像的灰度图,进行HOG特征分布计算并统计得到该被比图像的梯度直方图特征向量,并且进行SIFT密度特征分布计算得到多个特征点,以及将该被比图像分成多个子图像,对于包含的所述特征点的密度大于密度预设值的子图像,对该子图像内的特征点进行SIFT角度特征计算并按预设的角度步长统计得到该被比图像的角度直方图特征向量;
匹配模块,用于根据所述被比图像的梯度直方图特征向量和角度直方图特征向量分别与所述图库图像的梯度直方图特征向量和角度直方图特征向量之间在赋范线性空间的距离确定所述被比图像与所述图库图像的相似度,根据该相似度从所述图库中选择与所述被比图像具有相似性的图库图像。
14.根据权利要求13所述的装置,其特征在于,所述预处理模块还用于:判断若图像的宽度和高度都大于预设长度,则将二者缩小并保持图像的宽高比不变,而且二者中的较小者缩小至预设长度;对所述等比缩放模块处理之后的图像进行双边滤波处理。
CN201210183184.0A 2012-06-06 2012-06-06 搜索图像的方法和装置 Active CN102779157B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210183184.0A CN102779157B (zh) 2012-06-06 2012-06-06 搜索图像的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210183184.0A CN102779157B (zh) 2012-06-06 2012-06-06 搜索图像的方法和装置

Publications (2)

Publication Number Publication Date
CN102779157A true CN102779157A (zh) 2012-11-14
CN102779157B CN102779157B (zh) 2015-05-06

Family

ID=47124069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210183184.0A Active CN102779157B (zh) 2012-06-06 2012-06-06 搜索图像的方法和装置

Country Status (1)

Country Link
CN (1) CN102779157B (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020613A (zh) * 2013-01-07 2013-04-03 信帧电子技术(北京)有限公司 一种基于视频的信号灯识别方法及装置
CN104252473A (zh) * 2013-06-27 2014-12-31 镇江睿泰信息科技有限公司 一种图像识别方法
CN104346796A (zh) * 2013-07-30 2015-02-11 比亚迪股份有限公司 图像相似度的计算方法
CN104462481A (zh) * 2014-12-18 2015-03-25 浪潮(北京)电子信息产业有限公司 一种基于颜色和形状的综合图像检索方法
CN105551044A (zh) * 2015-12-16 2016-05-04 北京京东尚科信息技术有限公司 一种图片对比方法和装置
CN106296580A (zh) * 2015-06-03 2017-01-04 无锡天脉聚源传媒科技有限公司 一种图像拼接的方法及装置
CN110245670A (zh) * 2019-06-11 2019-09-17 观博云标(北京)文化科技有限公司 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置
CN110694942A (zh) * 2019-10-21 2020-01-17 武汉纺织大学 一种太阳能电池片的色差分选方法
CN111104867A (zh) * 2019-11-25 2020-05-05 北京迈格威科技有限公司 基于部件分割的识别模型训练、车辆重识别方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101526944A (zh) * 2008-12-23 2009-09-09 广州乐庚信息科技有限公司 图像检索比对方法
CN101957919A (zh) * 2010-09-22 2011-01-26 上海交通大学 基于图像局部特征检索的文字识别方法
CN102063472A (zh) * 2010-12-10 2011-05-18 北京大学 图片搜索方法、图片搜索系统、客户端和服务器
CN102184186A (zh) * 2011-04-12 2011-09-14 宋金龙 基于多特征自适应融合的图像检索方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101526944A (zh) * 2008-12-23 2009-09-09 广州乐庚信息科技有限公司 图像检索比对方法
CN101957919A (zh) * 2010-09-22 2011-01-26 上海交通大学 基于图像局部特征检索的文字识别方法
CN102063472A (zh) * 2010-12-10 2011-05-18 北京大学 图片搜索方法、图片搜索系统、客户端和服务器
CN102184186A (zh) * 2011-04-12 2011-09-14 宋金龙 基于多特征自适应融合的图像检索方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020613A (zh) * 2013-01-07 2013-04-03 信帧电子技术(北京)有限公司 一种基于视频的信号灯识别方法及装置
CN104252473A (zh) * 2013-06-27 2014-12-31 镇江睿泰信息科技有限公司 一种图像识别方法
CN104346796A (zh) * 2013-07-30 2015-02-11 比亚迪股份有限公司 图像相似度的计算方法
CN104462481A (zh) * 2014-12-18 2015-03-25 浪潮(北京)电子信息产业有限公司 一种基于颜色和形状的综合图像检索方法
CN106296580A (zh) * 2015-06-03 2017-01-04 无锡天脉聚源传媒科技有限公司 一种图像拼接的方法及装置
CN105551044A (zh) * 2015-12-16 2016-05-04 北京京东尚科信息技术有限公司 一种图片对比方法和装置
CN105551044B (zh) * 2015-12-16 2018-10-19 北京京东尚科信息技术有限公司 一种图片对比方法和装置
CN110245670A (zh) * 2019-06-11 2019-09-17 观博云标(北京)文化科技有限公司 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置
CN110245670B (zh) * 2019-06-11 2021-08-20 观博云标(北京)文化科技有限公司 基于图像金字塔梯度直方图特征的天珠身份辨识方法及装置
CN110694942A (zh) * 2019-10-21 2020-01-17 武汉纺织大学 一种太阳能电池片的色差分选方法
CN111104867A (zh) * 2019-11-25 2020-05-05 北京迈格威科技有限公司 基于部件分割的识别模型训练、车辆重识别方法及装置
CN111104867B (zh) * 2019-11-25 2023-08-25 北京迈格威科技有限公司 基于部件分割的识别模型训练、车辆重识别方法及装置

Also Published As

Publication number Publication date
CN102779157B (zh) 2015-05-06

Similar Documents

Publication Publication Date Title
CN102779157A (zh) 搜索图像的方法和装置
US11830246B2 (en) Systems and methods for extracting and vectorizing features of satellite imagery
CN110738207B (zh) 一种融合文字图像中文字区域边缘信息的文字检测方法
Jia et al. A fast ellipse detector using projective invariant pruning
Li et al. Building-a-nets: Robust building extraction from high-resolution remote sensing images with adversarial networks
CN109753885B (zh) 一种目标检测方法、装置以及行人检测方法、系统
Timofte et al. Multi-view traffic sign detection, recognition, and 3D localisation
CN111259936B (zh) 一种基于单一像素标注的图像语义分割方法及系统
CN111079674B (zh) 一种基于全局和局部信息融合的目标检测方法
Xu et al. Hierarchical segmentation using tree-based shape spaces
CN102722712A (zh) 基于连续度的多尺度高分辨图像目标检测方法
CN105069774B (zh) 基于多示例学习与图割优化的目标分割方法
CN112862849B (zh) 一种基于图像分割和全卷积神经网络的田间稻穗计数方法
CN103353881B (zh) 一种应用程序搜索方法及装置
CN110991444A (zh) 面向复杂场景的车牌识别方法及装置
CN111311702B (zh) 一种基于BlockGAN的图像生成和识别模块及方法
CN104751463B (zh) 一种基于草图轮廓特征的三维模型最佳视角选取方法
CN108564111A (zh) 一种基于邻域粗糙集特征选择的图像分类方法
CN108733749A (zh) 一种基于草图的图像检索方法
CN116091946A (zh) 一种基于YOLOv5的无人机航拍图像目标检测方法
Jahangiri et al. Information pursuit: A Bayesian framework for sequential scene parsing
CN111738310B (zh) 物料分类方法、装置、电子设备和存储介质
CN109087344A (zh) 三维重建中的图像选择方法及装置
CN103258211A (zh) 一种手写体数字识别方法和系统
CN106056575A (zh) 一种基于似物性推荐算法的图像匹配方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant