CN108763265A - 一种基于分块检索的图像识别方法 - Google Patents

一种基于分块检索的图像识别方法 Download PDF

Info

Publication number
CN108763265A
CN108763265A CN201810298649.4A CN201810298649A CN108763265A CN 108763265 A CN108763265 A CN 108763265A CN 201810298649 A CN201810298649 A CN 201810298649A CN 108763265 A CN108763265 A CN 108763265A
Authority
CN
China
Prior art keywords
window
image
block
matching
hamming distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810298649.4A
Other languages
English (en)
Other versions
CN108763265B (zh
Inventor
李建圃
樊晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Communication Information System Co Ltd
Original Assignee
Nanchang Qi Mou Science And Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanchang Qi Mou Science And Technology Co Ltd filed Critical Nanchang Qi Mou Science And Technology Co Ltd
Priority to CN201810298649.4A priority Critical patent/CN108763265B/zh
Publication of CN108763265A publication Critical patent/CN108763265A/zh
Application granted granted Critical
Publication of CN108763265B publication Critical patent/CN108763265B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/50Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分块检索的图像识别方法,通过检索系统按照粗分块及细分块的方式进行滑窗分割图像后再进行匹配,结果显示,查全率和查准率比现有技术都得到了很大的提高,本发明对商标检索领域的应用具有非常大的潜力。

Description

一种基于分块检索的图像识别方法
技术领域
本发明涉及图像识别方法,特别涉及一种基于分块检索的图像识别方法。
背景技术
在现代信息社会,多媒体技术迅速发展,视频和图片等数据爆炸式增长,图像语言作 为一种包含大量信息的信息体成为传播交流信息的重要载体。然而面对海量的图像数据, 如何快速有效地组织和检索图像信息,成为人们越来越关心的问题,图像检索就是信息时 代催生的新兴领域。为此,人们一直在研究各种图像的检索方法,如何提取图像特征到如 何匹配图像,多种算法也出现了。
在图像检索的现有技术中,例如单纯地应用角点匹配法,查全率和查准率还不是特别 高;哈希算法是指将任意内容映射为一个固定长度字符串的算法,一般用在快速查找中, 也是在图像检索领域应用十分广泛的,因为它的速度相对比较快,但是因为此算法对位置 十分敏感,因此带来的误差非常大,导致结果不是很理想;梯度方向直方图(Hog)是一种基 于边缘梯度方向的统计特征,常用于行人检测,它经常用于多尺度区域统计特征,优点是 稳定性高,且也有对位置敏感的缺点。
所以需要研究一种稳定性高、对位置敏感度不高且兼顾查全率和查准率的检索方法。
发明内容
本发明的目的在于提供一种基于分块检索的图像识别方法,具有很高的稳定性、对位 置不敏感且相比现有技术查全率及查准率提高了很多。
为实现上述目的,本发明提供如下技术方案:一种基于分块检索的图像识别方法,包 括以下步骤:
S1对检索对象进行初步分析;用户输入检索对象给检索系统,利用边缘检测及滤波方法, 把检索对象的边缘轮廓进行粗检测;根据所述边缘轮廓分割成至少1个边缘块,根据所述 边缘块对检索图像进行粗分块,粗分块后形成第一层图像窗口,提取第一层图像窗口的第 一层图像特征文件;粗分块包括粗窗口大小及粗滑动步长两个参数;
S2对检索对象进行细分块;所述检索系统对检索对象进行细分块,形成不同的第一图像 窗口,提取出第一图像窗口的第一图像特征文件;细分块包括细窗口大小及细滑动步长两 个参数;
S3对检索库中的所有对象进行粗分块及细分块;检索系统按照同步骤S1和步骤S2中的 粗分块和细分块对检索库中的所有对象进行同样的操作,分块形成第二层图像窗口及对应 的第二层图像特征文件、第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;先对第一层图像特征文件与第二层图像特征文件进行粗比对,得 到粗匹配结果;再将第一图像特征文件与第二图像特征文件进行细比对,得到细匹配结果; 设定粗权重和细权重,这里的粗权重的取值范围0~1.0,细权重范围的取值范围为0~1.0, 粗权重+细权重=1.0,进行权重叠加后,得到相似结果;
S5检索系统将最后相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一层图像窗口与第二层图像窗口进行相似性 判断,筛选出具有相似可能性的结果后再执行S4;不满足相似性条件的窗口不执行S4。
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,偏移范围u的取值范围为0.4~0.6,满足关系如下:
(2)设Ai的长宽比Bi-j的长宽比则有
进一步地,在步骤S4中,对粗匹配结果和细匹配结果均执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二层图像窗口的第一汉明距离,通 过比较各第一汉明距离的大小得到最小第一汉明距离;
S511对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的第二汉明距离,通过 比较各第二汉明距离的大小得到最小第二汉明距离;
S512定义相似阈值,最小第一汉明距离小于相似阈值时,标记为粗匹配相似窗口,最小第 二汉明距离小于相似阈值时,标记为细匹配相似窗口;
S513设定粗权重和细权重,进行权重叠加后,得到相似结果;
进一步地,在步骤S5之前执行如下步骤:
S710检索系统将最后匹配结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口 {(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角 坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模使得其中a1、a2为特定匹配窗口相关的缩放参数,tx、ty是 与特定匹配窗口相关的平移参数,可求解出L;
S711采用RANSAC算法排除错误的相似结果,保留在尺度上和空间位置上都具有一致性 的相似结果。
进一步地,在步骤S711后,执行如下步骤:
S810分割出相似区域;检索系统定义一个自适应性阈值,根据自适应性阈值分割出相似 区域;
S811统计相似结果中匹配窗口的数目;检索系统定义匹配权重,将相似结果中的匹配窗 口进行加权叠加,统计覆盖每个匹配窗口中心点(anchor point)的匹配窗口的数目。
进一步地,所述匹配权重的范围为0.5到1.5。
进一步地,所述匹配权重的取值由匹配窗口的汉明距离决定,即汉明距离越小,匹配 权重越大。
进一步地,本发明还提供了所述的基于分块检索的图像识别方法在商标检索中的应用。
本发明的有益效果:采用粗分块和细分块的方式,使得检索系统能在粗分块的基础上 对检索图像进行细分块分割,使得特征提取更加精准;同时比对也采取两步式,通过相似 条件地判断缩小了计算量;通过设置权重,使得结果更加精准。
附图说明
图1图示了本发明实施例5的流程步骤图;
图2图示了本发明实施例5的经过边缘检测及滤波后的图像示意图;
图3图示了本发明实施例5的图像梯度方向量化示意图;
图4图示了本发明实施例5的相似窗口加权叠加示意图;
图5图示了本发明实施例5中区域相似性计算的示意图;
图6图示了本发明实施例5中的检索结果排列图。
具体实施方式
下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基 于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其 他实施例,都属于本发明保护的范围。
实施例1
一种基于分块检索的图像识别方法,包括以下步骤:
S1对检索对象进行初步分析;用户输入检索对象给检索系统,利用边缘检测及滤波方法, 把检索对象的边缘轮廓进行粗检测;根据所述边缘轮廓分割成至少1个边缘块,根据所述 边缘块对检索图像进行粗分块,粗分块后形成第一层图像窗口,提取第一层图像窗口的第 一层图像特征文件;粗分块包括粗窗口大小及粗滑动步长两个参数;
S2对检索对象进行细分块;所述检索系统对检索对象进行细分块,形成不同的第一图像 窗口,提取出第一图像窗口的第一图像特征文件;细分块包括细窗口大小及细滑动步长两 个参数;
S3对检索库中的所有对象进行粗分块及细分块;检索系统按照同步骤S1和步骤S2中的粗分块和细分块对检索库中的所有对象进行同样的操作,分块形成第二层图像窗口及对应的第二层图像特征文件、第二图像窗口及对应的第二图像特征文件;先对第一层图像窗口与第二层图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
(3)设Ai的长宽比Bi-j的长宽比则有
S4检索系统进行比对;先对第一层图像特征文件与第二层图像特征文件进行粗比对,得 到粗匹配结果;再将第一图像特征文件与第二图像特征文件进行细比对,得到细匹配结果; 设定粗权重和细权重,进行权重叠加后,得到相似结果;
S5检索系统将最后相似结果进行排序展示。
本实施例的实施方式不仅具有提取图像特征更加准确,查全查准率更高,且通过增加对第一图像窗口与第二图像窗口进行相似性判断,有效地缩小了计算量,使得对图像检索的效率大大提高。
实施例2
一种基于分块检索的图像识别方法,包括以下步骤:
S1对检索对象进行初步分析;用户输入检索对象给检索系统,利用边缘检测及滤波方法, 把检索对象的边缘轮廓进行粗检测;根据所述边缘轮廓分割成至少1个边缘块,根据所述 边缘块对检索图像进行粗分块,粗分块后形成第一层图像窗口,提取第一层图像窗口的第 一层图像特征文件;粗分块包括粗窗口大小及粗滑动步长两个参数;
S2对检索对象进行细分块;所述检索系统对检索对象进行细分块,形成不同的第一图像 窗口,提取出第一图像窗口的第一图像特征文件;细分块包括细窗口大小及细滑动步长两 个参数;
S3对检索库中的所有对象进行粗分块及细分块;检索系统按照同步骤S1和步骤S2中的 粗分块和细分块对检索库中的所有对象进行同样的操作,分块形成第二层图像窗口及对应 的第二层图像特征文件、第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;先对第一层图像特征文件与第二层图像特征文件进行粗比对,得 到粗匹配结果;再将第一图像特征文件与第二图像特征文件进行细比对,得到细匹配结果; 设定粗权重和细权重,进行权重叠加后,得到相似结果;
S5检索系统将最后相似结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一层图像窗口与第二层图像窗口进行相似性 判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
(4)设Ai的长宽比Bi-j的长宽比则有
进一步地,在步骤S4中,对粗匹配结果和细匹配结果均执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二层图像窗口的第一汉明距离,得 到最小第一汉明距离;
S511对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的第二汉明距离,得到 最小第二汉明距离;
S512定义相似阈值,最小第一汉明距离小于相似阈值时,标记为粗匹配相似窗口,最小第 二汉明距离小于相似阈值时,标记为细匹配相似窗口;
S513设定粗权重和细权重,进行权重叠加后,得到相似结果;
与实施例1不同的是,本实施例通过增加计算汉明距离,从而判断匹配的第二层图像 窗口与第二图像窗口是否真的算有效相似窗口,不仅进一步缩小了计算量,且提高了查准 率。
实施例3
一种基于分块检索的图像识别方法,包括以下步骤:
S1对检索对象进行初步分析;用户输入检索对象给检索系统,利用边缘检测及滤波方法, 把检索对象的边缘轮廓进行粗检测;根据所述边缘轮廓分割成至少1个边缘块,根据所述 边缘块对检索图像进行粗分块,粗分块后形成第一层图像窗口,提取第一层图像窗口的第 一层图像特征文件;粗分块包括粗窗口大小及粗滑动步长两个参数;
S2对检索对象进行细分块;所述检索系统对检索对象进行细分块,形成不同的第一图像 窗口,提取出第一图像窗口的第一图像特征文件;细分块包括细窗口大小及细滑动步长两 个参数;
S3对检索库中的所有对象进行粗分块及细分块;检索系统按照同步骤S1和步骤S2中的 粗分块和细分块对检索库中的所有对象进行同样的操作,分块形成第二层图像窗口及对应 的第二层图像特征文件、第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;先对第一层图像特征文件与第二层图像特征文件进行粗比对,得 到粗匹配结果;再将第一图像特征文件与第二图像特征文件进行细比对,得到细匹配结果; 设定粗权重和细权重,进行权重叠加后,得到相似结果;
S5检索系统将最后匹配结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一层图像窗口与第二层图像窗口进行相似性 判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
(5)设Ai的长宽比Bi-j的长宽比则有
进一步地,在步骤S4中,对粗匹配结果和细匹配结果均执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二层图像窗口的第一汉明距离,得 到最小第一汉明距离;
S511对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的第二汉明距离,得到 最小第二汉明距离;
S512定义相似阈值,最小第一汉明距离小于相似阈值时,标记为粗匹配相似窗口,最小第 二汉明距离小于相似阈值时,标记为细匹配相似窗口;
S513设定粗权重和细权重,进行权重叠加后,得到相似结果;
进一步地,在步骤S5之前执行如下步骤:
S710检索系统将最后匹配结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口 {(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角 坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模使得可求解出L;
S711采用RANSAC算法排除错误的相似结果,保留在尺度上和空间位置上都具有一致性 的相似结果。
与实施例2不同的是,本实施例增加分析尺度-空间一致性的算法,使得相似窗口的 判断进一步地精准,进一步地提高了查准率。
实施例4
一种基于分块检索的图像识别方法,包括以下步骤:
S1对检索对象进行初步分析;用户输入检索对象给检索系统,利用边缘检测及滤波方法, 把检索对象的边缘轮廓进行粗检测;根据所述边缘轮廓分割成至少1个边缘块,根据所述 边缘块对检索图像进行粗分块,粗分块后形成第一层图像窗口,提取第一层图像窗口的第 一层图像特征文件;粗分块包括粗窗口大小及粗滑动步长两个参数;
S2对检索对象进行细分块;所述检索系统对检索对象进行细分块,形成不同的第一图像 窗口,提取出第一图像窗口的第一图像特征文件;细分块包括细窗口大小及细滑动步长两 个参数;
S3对检索库中的所有对象进行粗分块及细分块;检索系统按照同步骤S1和步骤S2中的 粗分块和细分块对检索库中的所有对象进行同样的操作,分块形成第二层图像窗口及对应 的第二层图像特征文件、第二图像窗口及对应的第二图像特征文件;
S4检索系统进行比对;先对第一层图像特征文件与第二层图像特征文件进行粗比对,得 到粗匹配结果;再将第一图像特征文件与第二图像特征文件进行细比对,得到细匹配结果; 设定粗权重和细权重,进行权重叠加后,得到相似结果;
S5检索系统将最后匹配结果进行排序展示。
进一步地,所述提取特征采用的是梯度方向直方图方法。
进一步地,所述提取特征采用的是哈希算法。
进一步地,在执行步骤S4之前,先对第一层图像窗口与第二层图像窗口进行相似性 判断,筛选出具有相似可能性的结果后再执行S4;
进一步地,相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,满足关系如下:
(6)设Ai的长宽比Bi-j的长宽比则有
进一步地,在步骤S4中,对粗匹配结果和细匹配结果均执行如下步骤:
S510对于检索对象中的任意窗口,计算与之相匹配的第二层图像窗口的第一汉明距离,得 到最小第一汉明距离;
S511对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的第二汉明距离,得到 最小第二汉明距离;
S512定义相似阈值,最小第一汉明距离小于相似阈值时,标记为粗匹配相似窗口,最小第 二汉明距离小于相似阈值时,标记为细匹配相似窗口;
S513设定粗权重和细权重,进行权重叠加后,得到相似结果;
进一步地,在步骤S5之前执行如下步骤:
S710检索系统将最后匹配结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口 {(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角 坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模使得可求解出L;
S711采用RANSAC算法排除错误的相似结果,保留在尺度上和空间位置上都具有一致性 的相似结果。
进一步地,在步骤S711后,执行如下步骤:
S810分割出相似区域;检索系统定义一个自适应性阈值,根据自适应性阈值分割出相似 区域;
S811统计相似结果中匹配窗口的数目;检索系统定义匹配权重,将相似结果中的匹配窗 口进行加权叠加,统计覆盖每个匹配窗口中心点的匹配窗口的数目。
进一步地,所述匹配权重的范围为0.5到1.5。
进一步地,所述匹配权重的取值由匹配窗口的汉明距离决定,即汉明距离越小,匹配 权重越大。
与实施例3不同的是,本实施例增加了分割相似区域的算法,进一步提高了查准率。
实施例5
用户输入检索对象Iw×h给检索系统,检索系统操作如下:
如图2所示,通过利用边缘检测及滤波方法,把检索对象的边缘轮廓进行粗检测;根据所 述边缘轮廓分割成2个边缘块,分别包括上半部分的o型和下半部分的w型,根据所述边 缘块对检索图像进行先粗分块,定义窗口尺寸和滑动步长:窗口可以选取多种尺寸(实验 中,σ1=0.8,σ2=0.6,σ3=0.4),滑动步长参数μ(实验中μ取0.1或0.2),滑窗水平方向步长stepx=wμ,垂直方向步长stepy=hμ。如表1所示。
表1
将每个滑动窗口以图像左上角为起点,按照滑动步长stepx、stepy依次从左到右从上 到下滑动,取得第一层窗口图像。
对于前面得到的每个第一层局部窗口图像Ri提取第一层窗口图像特征文件。
对检索对象进行细分块,方法与粗分块一样,这里的窗口尺寸与滑动步长可以与粗分 块时一样,也可以不一样,从而得到第一窗口图像,集合为R={Ri},i=0,1,…,t。通过以 下方法得到第一窗口图像特征文件。
①对于任一图像窗口Ri,计算水平和垂直方向的梯度。
计算方法:[Gh,Gv]=gradient(Ri),采用方向模板[-1,0,1],计算Ri中任一像素点(x,y)的 水平梯度Gh(x,y)和垂直梯度Gv(x,y)。
则(x,y)点的方向角度θ=arctan(Gv/Gh),取值0~360度。
②量化梯度方向,得到梯度方向直方图。将①中得到的梯度方向根据附图3示意的8 方向进行量化,统计所有像素点的梯度方向得到梯度方向直方图。传统的量化方法采用就 近方向量化的原则,将实际的梯度方向量化至最近的量化方向上。
传统的方向量化方法过于严苛,导致梯度方向量化后的特征鲁棒性较差,对方向较为 敏感,为此,本申请提出一种模糊量化方法,将一个梯度方向量化至其相邻的两个bin中, 即将一个方向用投影至相邻两个方向的分量表示,如某像素点(x,y)的梯度方向为θ(x,y), 其相邻的两个Bin分别为θk、θk+1,则该梯度方向点量化至θk的分量为量化至 θk+1的分量为将①中得到的梯度方向根据上述模糊量化方法进行量化,统计所 有像素点的模糊梯度方向得到梯度方向直方图。
最后,Ri的梯度方向直方图为
③计算归一化梯度方向直方图。
方法一:基于目标像素点总数的归一化方法。
Ri梯度方向直方图归一化直方图为该直方图 归一化方法使特征具有良好的尺度一致性,同时体现出各个梯度方向相对统计分布信息。 缺点是某个bin梯度点数目的变化将影响整体直方图的相对统计分布。
方法二:基于区域面积参数的归一化方法。
Ri的大小为wi×hi,梯度方向直方图面积参数基于面积参数的归一化直方图为
面积参数通过面积开方来计算将使特征具有相对较好的尺度一致性。基于面积参数的 直方图归一化方法,既包含了特征窗口中边缘信息的丰富程度,又可反映各个梯度方向统 计分布信息,单个bin的变化不会影响其他bin的值。缺点是各个bin之间的差异性可能缩 小,对于边缘丰富的窗口,每个bin的取值相对较大,存在多个较大值;而对于边缘比较 稀疏的窗口,每个bin的取值都较小,存在多个较小值。
方法三:基于目标像素点总数及区域面积参数二者结合的归一化方法。
基于以上分析,将两种归一化方法相结合, 既保证各个bin之间的相对独立性,又兼 顾各个bin统计分布的差异性。
Ri的大小为wi×hi,梯度方向直方图基于目标像素总数的归一 化直方图为基于面积参数的归一化直方图为
则结合二者的归一化直方图定义为:
其中α=0.125为8方向归一化直方图的均值。
④直方图特征编码。经过步骤③(方法一)得到Ri的归一化直方图 其中0<huj<1,j=0,1,…,7。为了节约计算机计算资源,将上述 浮点数据进行编码。
直方图归一化之后按照各个区间梯度点均匀概率分布的原则计算量化区间2该4量化区间的计算由当前样本集 合进行统计计算实验得到。对落在这5个区间的数据进行编码分别为: 0000,0001,0011,0111,1111.编码之后将各个bin的码字级联得到为 一段长度为4×8=32位的二进制串即fi。
以检索图像和数据库中任意图像为例:对检索图像中的任意滑动 窗口Ai,遍历数据库中图像中所有符合相似可能性条件的窗口Bj,j=k1,k2,...,计算 得到的相似距离为查找出最相似的窗口如果相似距离 在相似阈值范围内则标记这一对相似窗口,即dmin-i<Tsim,Tsim为经验值,在本例中取值约 为0.4~0.6。
这里相似距离计算如下:设滑窗Ai特征向量经过编码后的二值特征串为fi,滑窗Bj特 征向量经过编码后的二值特征串为gj,则Ai和Bi-j之间的相似性距离dij通过汉明距离进行 计算:其中fi k表示二进制串fi的第k位,表示二进制串gj的第k位,表示异或操作,α的取值等于fi及gj长度的倒数。
这里的相似判断条件如下:
(1)窗口Bj的中心位置在Ai中心位置附近的一定范围内,允许变换范围为u=0.5(偏 移范围,窗口中心位置按照图形长宽的比例计算,偏移也按照长宽的比例计算,这里,允 许偏移范围为长或宽的二分之一,建议取值范围0.4~0.6),即同理
(2)设Ai的长宽比Bj的长宽比则有即相似的窗口必须有相近的长宽比。
通过上述操作得到A和B相似窗口的匹配集合{Ai:Bj},由于是全局尺度间的查找模式, 其中可能存在不符合空间一致性的匹配对。下面将从所有这些结果中筛选正确的匹配结果。
经过全局范围内的尺度间搜索匹配,能查找到一些正确的匹配窗口,也包含了一些错 误的匹配,一种是尺度匹配错误,另一种是位置匹配错误,采用尺度-空间一致性的方法消 除错误匹配。
采用改进的RANSAC(随机抽样一致性)算法排除错误的匹配对,保留在尺度上和空间位置上都具有一致性的匹配对,步骤如下:
(1).对匹配数据集合{Ai:Bj}中的任意一对匹配窗口,计算出变换矩阵L,记为模型M, 模型的定义如下:
变换模型:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′) 分别表示窗口Ai的左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口Bj左上角和右下角坐 标),则存在空间变换模型使得其中a1、a2为 特定匹配窗口相关的缩放参数,tx、ty是与特定匹配窗口相关的平移参数,可求解出L。
(2).计算数据集中所有数据与模型M的投影误差,若误差小于阈值,加入内点集I;
(3).如果当前内点集I中元素个数大于最优内点集I_best,则更新I_best=I;
(4).遍历数据集合中的所有数据,重复上述步骤。
(5).最优内点集I_best中的样本即为正确的匹配样本,最终得到正确匹配样本集合 I_best={Ai:Bj}。
如图4所示:对于分别定义矩阵
(1)对于I_best={Ai:Bj}的任意一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中 (x1,y1)、(x1′,y1′)分别表示窗口Ai的左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口Bj左 上角和右下角坐标),其相似性距离为dij,定义加权系数ωij=min(2,2.67-3.33dij),则有
(2)遍历I_best={Ai:Bj}中的所有匹配样本重复(1),更新
(3)将通过采样缩小为CA10×10和CB10×10.
(4)定义初始阈值矩阵:
T0的设定和具体滑窗的规格有关。设在集合I_best={Ai:Bj}所有属于的所有窗 口的总面积为sA,则自适应的阈值矩阵为TA=κT0(sA/(100w1h1))α,在集合I_best={Ai:Bj}所有属于的所有窗口的总面积为sB,则自适应的阈值矩阵为TA=κT0(sA/(100w1h1))α,这里κ=0.2,α=0.7为经验值,随着滑动窗口规格的变化参数应进行适应性的调整。
则有相似区域分割矩阵矩阵中不为0 的部分表示图像中的候选相似区域。
对于上述得到的CA10×10和CB10×10中表示的相似区域,分割出A图的相似区域ROIA及B图的相似区域ROIB,如图5所示,按照上述的方法进行区域内相似窗口匹配,查找方法 为局部邻域查找。步骤如下:
对ROIA中的任意滑动窗口Ai,遍历数据库中图像ROIB中所有符合相似可能性条件的 窗口Bj,j=k1,k2,...,计算得到的相似距离为查找出最相似的窗口如果相似距离在相似阈值范围内则标记这一对相似窗口,即 dmin-i<Tsim,Tsim为经验值,在本例中取值约为0.4~0.6.
这里相似距离计算如下:设滑窗Ai特征向量经过编码后的二值特征串为fi,滑窗Bj特 征向量经过编码后的二值特征串为gj,则Ai和Bi-j之间的相似性距离dij通过汉明距离进行 计算:其中fi k表示二进制串fi的第k位,表示二进制串gj的第k位,表示异或操作,α的取值等于fi及gj长度的倒数。
这里的相似可能性条件如下:
(1)窗口Bj的中心位置在Ai中心位置附近的一定范围内,允许变换范围为u=0.2(偏 移范围,建议取值范围0.1~0.3),即同理这里Ai和Bi-j的位置均为在roi区域中的相对位置。
(2)设Ai的长宽比Bj的长宽比则有即相似的窗口必须有相近的长宽比。
通过上述操作得到ROIA和ROIB相似窗口的匹配集合{Ai:Bj}。
ROI区域中滑窗的相似性以滑窗中心点的相似性来代替,如图5中pA(u,v)为图A中的一个包含窗口的中心点,则该点的相似性由所有以该点为中心的窗口的对应相似性的均值来计算:
则AB中两个ROI区域的相似距离为:
其中,nA、nB分别为ROIA、ROIB中包含包含窗口中心点的数目,λ为相似面积参数,和nA、nB成反比,相似区域总面积越大,λ越小。
相似结果排序:
对检索图像Q,及数据库中图像D={D1,D2,...,DN}中的任意图像Di(i=1,2,…,N)计算 得到相似性距离di,根据相似性距离从小到大进行排序返回最终的排序结果。
最终检索效果图排序如图6所示,其中检索对象标示为00000,横向排列的均为由输 入检索对象00000后出现的相似结果排列。
表2:
其中,表2中,r-measure与p-measure的意义如下:检索图像q经过查询得到的有序的查询结果中,有n幅图像和q相似,r1,r2,…,rn为这n幅图像在全部检索结果排序位置,
其中,r-measure表示目标图像在查询结果中的平均位置,该指标跟相关图像的数目 有关,在同样数目的相关图像的情况下,r-measure越小说明相关图像越靠前,系统的检索准确度越高,当相关图像全部排在前面的时候,r-measure的取值为相关图像数目的中值。p-measure反映了相关图像靠前排列的程度,该指标数值越接近于1表示检索准确度 越高。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽 管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以 对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在 本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保 护范围之内。

Claims (10)

1.一种基于分块检索的图像识别方法,其特征在于,包括以下步骤:
S1 对检索对象进行初步分析;用户输入检索对象给检索系统,利用边缘检测及滤波方法,把检索对象的边缘轮廓进行粗检测;根据所述边缘轮廓分割成至少1个边缘块,根据所述边缘块对检索图像进行粗分块,粗分块后形成第一层图像窗口,提取第一层图像窗口的第一层图像特征文件;粗分块包括粗窗口大小及粗滑动步长两个参数;
S2 对检索对象进行细分块;所述检索系统对检索对象进行细分块,形成不同的第一图像窗口,提取出第一图像窗口的第一图像特征文件;细分块包括细窗口大小及细滑动步长两个参数;
S3 对检索库中的所有对象进行粗分块及细分块;检索系统按照同步骤S1和步骤S2中的粗分块和细分块对检索库中的所有对象进行同样的操作,分块形成第二层图像窗口及对应的第二层图像特征文件、第二图像窗口及对应的第二图像特征文件;
S4 检索系统进行比对;先对第一层图像特征文件与第二层图像特征文件进行粗比对,得到粗匹配结果;再将第一图像特征文件与第二图像特征文件进行细比对,得到细匹配结果;设定粗权重和细权重,这里的粗权重的取值范围0~1.0,细权重范围的取值范围为0~1.0,粗权重+细权重=1.0,进行权重叠加后,得到相似结果;
S5 检索系统将最后相似结果进行排序展示。
2.根据权利要求1所述的基于分块检索的图像识别方法,其特征在于:所述提取特征采用的是梯度方向直方图方法。
3.根据权利要求1所述的基于分块检索的图像识别方法,其特征在于:所述提取特征采用的是哈希算法。
4.根据权利要求1所述的基于分块检索的图像识别方法,其特征在于:在执行步骤S4之前,先对第一层图像窗口与第二层图像窗口进行相似性判断,筛选出具有相似可能性的结果后再执行S4。
5.根据权利要求4所述的基于分块检索的图像识别方法,其特征在于:相似性条件的判断如下:
(1)待比较窗口的中心位置Bi-j,目标窗口中心位置Ai,偏移范围为u,偏移范围为u取值范围为0.4~0.6,满足关系如下:
(2)设Ai的长宽比Bi-j的长宽比则有
6.根据权利要求5所述的基于分块检索的图像识别方法,其特征在于:在步骤S4中,对粗匹配结果和细匹配结果均执行如下步骤:
S510 对于检索对象中的任意窗口,计算与之相匹配的第二层图像窗口的第一汉明距离,通过比较各第一汉明距离的大小得到最小第一汉明距离;
S511 对于检索对象中的任意窗口,计算与之相匹配的第二图像窗口的第二汉明距离,通过比较各第二汉明距离的大小得到最小第二汉明距离;
S512 定义相似阈值,最小第一汉明距离小于相似阈值时,标记为粗匹配相似窗口,最小第二汉明距离小于相似阈值时,标记为细匹配相似窗口;
S513 设定粗权重和细权重,进行权重叠加后,得到相似结果。
7.根据权利要求6所述的基于分块检索的图像识别方法,其特征在于:在步骤S5之前执行如下步骤:
S710 检索系统将最后匹配结果采用尺度-空间一致法做进一步分析如下:设一对匹配窗口{(x1,y1),(x1′,y1′)}:{(x2,y2),(x2′,y2′)}(其中(x1,y1)、(x1′,y1′)分别表示窗口1左上角和右下角坐标,(x2,y2)、(x2′,y2′)表示窗口2左上角和右下角坐标,则存在空间变换模使得可求解出L;
S711 采用RANSAC算法排除错误的相似结果,保留在尺度上和空间位置上都具有一致性的相似结果。
8.根据权利要求7所述的基于分块检索的图像识别方法,其特征在于:在步骤S711后,执行如下步骤:
S810 分割出相似区域;检索系统定义一个自适应性阈值,根据自适应性阈值分割出相似区域;
S811 统计相似结果中匹配窗口的数目;检索系统定义匹配权重,将相似结果中的匹配窗口进行加权叠加,统计覆盖每个匹配窗口中心点的匹配窗口的数目。
9.根据权利要求8所述的基于分块检索的图像识别方法,其特征在于:所述匹配权重的范围为0.5到1.5,所述匹配权重的取值由匹配窗口的汉明距离决定,汉明距离与匹配权重呈反比关系。
10.权利要求1-9任一项所述的图像检索方法在商标图形检索中的应用。
CN201810298649.4A 2018-04-03 2018-04-03 一种基于分块检索的图像识别方法 Active CN108763265B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810298649.4A CN108763265B (zh) 2018-04-03 2018-04-03 一种基于分块检索的图像识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810298649.4A CN108763265B (zh) 2018-04-03 2018-04-03 一种基于分块检索的图像识别方法

Publications (2)

Publication Number Publication Date
CN108763265A true CN108763265A (zh) 2018-11-06
CN108763265B CN108763265B (zh) 2022-02-08

Family

ID=63981347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810298649.4A Active CN108763265B (zh) 2018-04-03 2018-04-03 一种基于分块检索的图像识别方法

Country Status (1)

Country Link
CN (1) CN108763265B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582813A (zh) * 2018-12-04 2019-04-05 广州欧科信息技术股份有限公司 一种文物展品的检索方法、装置、设备和存储介质
CN113362323A (zh) * 2021-07-21 2021-09-07 中国科学院空天信息创新研究院 基于滑窗分块的图像检测方法

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1736928A1 (en) * 2005-06-20 2006-12-27 Mitsubishi Electric Information Technology Centre Europe B.V. Robust image registration
CN101038674A (zh) * 2007-04-30 2007-09-19 北京中星微电子有限公司 一种图像跟踪方法及系统
US20110126122A1 (en) * 2009-11-20 2011-05-26 George Forman Systems and methods for generating profiles for use in customizing a website
CN102819582A (zh) * 2012-07-26 2012-12-12 华数传媒网络有限公司 一种海量图片快速检索方法
CN103714122A (zh) * 2013-12-06 2014-04-09 安徽大学 一种基于局部分块二进制编码特征的图像检索方法
WO2014082464A1 (zh) * 2012-11-27 2014-06-05 炬力集成电路设计有限公司 一种搜索窗的滑动方法及其装置
CN104199931A (zh) * 2014-09-04 2014-12-10 厦门大学 一种商标图像一致语义提取方法及商标检索方法
CN104794451A (zh) * 2015-04-28 2015-07-22 上海交通大学 基于分块匹配结构的行人比对方法
CN105574063A (zh) * 2015-08-24 2016-05-11 西安电子科技大学 基于视觉显著性的图像检索方法
CN106055573A (zh) * 2016-05-20 2016-10-26 西安邮电大学 一种多示例学习框架下的鞋印图像检索方法及系统
CN106295693A (zh) * 2016-08-05 2017-01-04 深圳云天励飞技术有限公司 一种图像识别方法及装置
CN107145487A (zh) * 2016-03-01 2017-09-08 深圳中兴力维技术有限公司 图像搜索方法和装置
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1736928A1 (en) * 2005-06-20 2006-12-27 Mitsubishi Electric Information Technology Centre Europe B.V. Robust image registration
CN101038674A (zh) * 2007-04-30 2007-09-19 北京中星微电子有限公司 一种图像跟踪方法及系统
US20110126122A1 (en) * 2009-11-20 2011-05-26 George Forman Systems and methods for generating profiles for use in customizing a website
CN102819582A (zh) * 2012-07-26 2012-12-12 华数传媒网络有限公司 一种海量图片快速检索方法
WO2014082464A1 (zh) * 2012-11-27 2014-06-05 炬力集成电路设计有限公司 一种搜索窗的滑动方法及其装置
CN103714122A (zh) * 2013-12-06 2014-04-09 安徽大学 一种基于局部分块二进制编码特征的图像检索方法
CN104199931A (zh) * 2014-09-04 2014-12-10 厦门大学 一种商标图像一致语义提取方法及商标检索方法
CN104794451A (zh) * 2015-04-28 2015-07-22 上海交通大学 基于分块匹配结构的行人比对方法
CN105574063A (zh) * 2015-08-24 2016-05-11 西安电子科技大学 基于视觉显著性的图像检索方法
CN107145487A (zh) * 2016-03-01 2017-09-08 深圳中兴力维技术有限公司 图像搜索方法和装置
CN106055573A (zh) * 2016-05-20 2016-10-26 西安邮电大学 一种多示例学习框架下的鞋印图像检索方法及系统
CN107622270A (zh) * 2016-07-13 2018-01-23 中国电信股份有限公司 图像相似度计算方法和装置、相似图像检索方法和系统
CN106295693A (zh) * 2016-08-05 2017-01-04 深圳云天励飞技术有限公司 一种图像识别方法及装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
PRADEEP YADAV等: "《Content based image retrieval using Dither Block Truncation coding with similarity comparison algorithm》", 《IEEE》 *
TIANQI WANG 等: "《Sketch-Based Image Retrieval with Multiple Binary HoG Descriptor》", 《INTERNET MULTIMEDIA COMPTUING AND SERVICE》 *
段昕: "《基于视觉特征中文网页分类方法的研究》", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
黄嘉恒: "《基于哈希的图像相似度算法比较研究》", 《大理大学学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109582813A (zh) * 2018-12-04 2019-04-05 广州欧科信息技术股份有限公司 一种文物展品的检索方法、装置、设备和存储介质
CN109582813B (zh) * 2018-12-04 2021-10-01 广州欧科信息技术股份有限公司 一种文物展品的检索方法、装置、设备和存储介质
CN113362323A (zh) * 2021-07-21 2021-09-07 中国科学院空天信息创新研究院 基于滑窗分块的图像检测方法
CN113362323B (zh) * 2021-07-21 2022-09-16 中国科学院空天信息创新研究院 基于滑窗分块的图像检测方法

Also Published As

Publication number Publication date
CN108763265B (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
WO2020156361A1 (zh) 一种训练样本获得方法、装置、电子设备和存储介质
CN107679250B (zh) 一种基于深度自编码卷积神经网络的多任务分层图像检索方法
CN107256262B (zh) 一种基于物体检测的图像检索方法
CN104866616B (zh) 监控视频目标搜索方法
Srivastava et al. A review: color feature extraction methods for content based image retrieval
CN103336957B (zh) 一种基于时空特征的网络同源视频检测方法
CN111125416A (zh) 一种基于多特征融合的图像检索方法
CN108830279B (zh) 一种图像特征提取与匹配方法
CN102176208A (zh) 基于三维空时特征的鲁棒视频指纹方法
CN112749673A (zh) 一种基于遥感影像智能提取储油罐库存的方法及装置
CN112926592B (zh) 一种基于改进Fast算法的商标检索方法及装置
CN104850822A (zh) 基于多特征融合的简单背景下的叶片识别方法
CN108845998B (zh) 一种商标图像检索匹配方法
CN108694411B (zh) 一种识别相似图像的方法
CN110334628B (zh) 一种基于结构化随机森林的室外单目图像深度估计方法
CN108763265A (zh) 一种基于分块检索的图像识别方法
CN108764245B (zh) 一种提高商标图形相似度判定准确性的方法
Ahmad et al. SSH: Salient structures histogram for content based image retrieval
Fu et al. Medical image retrieval and classification based on morphological shape feature
CN108763261B (zh) 一种图形检索方法
CN106886783A (zh) 一种基于区域特征的图像检索方法及系统
Yuk et al. Object-based surveillance video retrieval system with real-time indexing methodology
CN108804499B (zh) 一种商标图像检索方法
CN108897746A (zh) 一种图像检索方法
Wu et al. Similar image retrieval in large-scale trademark databases based on regional and boundary fusion feature

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240606

Address after: Building S06, Langchao Science Park, 1036 Langchao Road, high tech Zone, Jinan City, Shandong Province

Patentee after: INSPUR COMMUNICATION AND INFORMATION SYSTEM Co.,Ltd.

Country or region after: China

Address before: 330000 room 219, Zhongchuang space office, second floor, building 1, Nanchang University Science Park, No. 589, Gaoxin Avenue, Nanchang high tech Industrial Development Zone, Nanchang City, Jiangxi Province

Patentee before: NANCHANG QIMOU TECHNOLOGY Co.,Ltd.

Country or region before: China