CN104361096A - 一种基于特征富集区域集合的图像检索方法 - Google Patents

一种基于特征富集区域集合的图像检索方法 Download PDF

Info

Publication number
CN104361096A
CN104361096A CN201410670157.5A CN201410670157A CN104361096A CN 104361096 A CN104361096 A CN 104361096A CN 201410670157 A CN201410670157 A CN 201410670157A CN 104361096 A CN104361096 A CN 104361096A
Authority
CN
China
Prior art keywords
rich region
feature
image
feature rich
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410670157.5A
Other languages
English (en)
Other versions
CN104361096B (zh
Inventor
薛峰
顾靖
董浩
贾伟
罗月童
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HEFEI HUIZHONG INTELLECTUAL PROPERTY MANAGEMENT Co.,Ltd.
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201410670157.5A priority Critical patent/CN104361096B/zh
Publication of CN104361096A publication Critical patent/CN104361096A/zh
Application granted granted Critical
Publication of CN104361096B publication Critical patent/CN104361096B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Abstract

本发明公开了一种基于特征富集区域的图像检索方法,首先通过计算Hessian矩阵及非极大值抑制获得候选特征点集合,利用三维线性插值法得到亚像素级的特征点集合。根据得到图像特征点的坐标位置,计算特征点的分布矩阵和适应矩阵,利用最大子矩阵和算法求出适应矩阵的子矩阵,即特征点分布最密集的区域,作为图像的特征富集区域。对特征富集区域选择形状、纹理和颜色三个底层特征,最后根据高斯非线性距离函数进行相似性度量,按照相似度升序排列,实现图像的快速检索。本发明能有效降低图像检索计算复杂度,提高图像检索的运算效率和准确率。

Description

一种基于特征富集区域集合的图像检索方法
技术领域
本发明属于图像检索技术领域,主要涉及一种基于特征富集区域的图像检索方法。
背景技术
图像检索的研究最早可以追溯到二十世纪七十年代。早期的图像检索技术是基于图像的文本标注,即基于文本的图像检索(Text-based Image Retrieval,TBIR)。到了上个世纪90年代,大型图像数据库逐步成为主流,如果仍然沿用传统的方法,就会给图像检索工作带来巨大的工作量。为了对大量的图像做出高效的处理,基于内容的图像检索技术(Content BasedImage Retrieval,CBIR)被研究者关注。区别于原有系统中TBIR对图像进行人工标注的做法,基于内容的检索技术自动提取每幅图像的视觉内容特征作为其索引,如色彩、纹理、形状等。这样,除了文本标注外,用户还可以利用图像的视觉特征来实现查询。由于利用图像本身的物理内容描述对象,而且特征的提取和索引的建立都可以使用计算机自动实现,避免了人工标注的主观性,大大减少了工作量,很好地解决了基于文本检索中存在的问题。
传统的图像检索系统一般是对整幅图像进行特征提取,与图像内容无关,通常人们在判别图像的相似性时并非建立在图像低层视觉特征的相似上,而是建立在对图像所描述的对象或事件的语义理解的基础上,正是由于人对图像相似性的判别依据与计算机对相似性的判别依据之间的不同,所以会导致由于计算机获取图像的视觉信息与用户对图像理解的语义信息的不一致性而产生的低层和高层检索需求间的鸿沟。
此外,图像中的不同区域的重要程度不同,而除图像主题内容之外的背景信息往往占据图像的很大一部分,在提取特征的过程中对主要对象的特征造成影响,不仅会使得图像检索算法计算复杂度高,运算效率低下,而且会导致检索结果准确性差等问题。
发明内容
本发明是为避免现技术所存在的不足之处,提出一种基于特征富集区域集合的图像检索方法,以期能有效降低图像检索计算复杂度,提高图像检索的运算效率和准确率。
本发明为解决技术问题采用如下技术方案:
本发明一种基于特征富集区域集合的图像检索方法,是利用检索图像E对存储在数据库中的候选图像集{Tt|t=1,2,…,M}进行相似性匹配,并返回与所述检索图像E最相似的J个候选图像作为图像检索结果;M表示所述候选图像的总数;其特点是:所述方法按如下步骤进行:
步骤1、以所述检索图像E的任一顶点作为原点O,以与所述原点O相邻的两条边分别作为X轴和Y轴,建立坐标系XOY;在所述坐标系XOY中,将所述检索图像E转换为灰度图像G,并利用式(1)获得所述灰度图像G的积分图像I:
( x , y ) = Σ 0 ≤ i ′ ≤ x , 0 ≤ j ′ ≤ y G ( i ′ , j ′ ) - - - ( 1 )
式(1)中,I(x,y)表示所述积分图像I中任一像素点p(x,y)的值,G(i',j')表示所述灰度图像G中位于坐标(i',j')上的像素值;式(1)表示所述积分图像I中像素点p(x,y)的值是从所述灰度图像G的原点O到像素点p(x,y)所构成的矩形区域内所有像素点的灰度值之和:
步骤2、计算所述积分图像I的Hessian矩阵,获取所述积分图像I的特征点集合Fp
步骤2.1、利用高斯滤波器获得所述灰度图像G在不同尺度下的图像集合1≤τ≤n;στ表示第τ层的尺度值,从而构建n层图像金字塔;表示所述图像金字塔中尺度值为στ的第τ层图像;
步骤2.2、利用式(2)计算所述第τ层图像中像素点p(x,y)的Hessian矩阵H(p,στ):
H ( p , σ τ ) = L xx ( p , σ τ ) L xy ( p , σ τ ) L xy ( p , σ τ ) L yy ( p , σ τ ) - - - ( 2 )
式(2)中,Lxx(p,στ)、Lxy(p,στ)和Lyy(p,στ)分别表示所述第τ层图像与高斯二阶滤波器的卷积;并有: g ( x , y , σ τ ) = 1 2 π σ τ e - ( x 2 + y 2 ) 2 σ τ ;
步骤2.3、并利用式(3)所示的Hessian矩阵H(p,στ)的判别式Det(H(p,στ))判断所述第τ层图像的像素点p(x,y)是否为极值点,将Det(H(p,στ))>0时的像素点作为候选特征点Ak
Det(H(p,στ))=Lxx(p,στ)Lyy(p,στ)-Lxy(p,στ)2     (3)
步骤2.4、遍历所述图像金字塔中的每一层图像中的每个像素点,并利用式(3)进行判断,从而获得候选特征点集合A={A1,A2,…,Ak,…,AK};1≤k≤K,K表示所述候选特征点的个数;
步骤2.5、定义所述第σ层图像中像素点p(x,y)的三维N阶邻域集合为U(p,τ)={Uτ-1,Uτ,Uτ+1};Uτ-1表示在第τ-1层图像中,与像素点p(x,y)对应的像素点p'(x,y)及其相邻的N2-1个像素点的集合;Uτ+1表示在第τ+1层图像中,与像素点p(x,y)对应的像素点p″(x,y)及其相邻的N2-1个像素点的集合;Uτ表示在第τ层图像中与像素点p(x,y)相邻的N2-1个像素点的集合;
步骤2.6、遍历所述候选特征点集合A中每个候选特征点,若任一候选特征点Ak的灰度值大于其三维N阶邻域集合中所有的3N2-1像素点的灰度值或是小于其三维N阶邻域集合中所有的3N2-1像素点的灰度值,则将候选特征点Ak作为特征点,从而获得特征点集合;
步骤3、依据所述特征点集合,计算特征点分布矩阵C和适应矩阵B,从而获得所述检索图像E的特征富集区域集合1≤z≤Z,Z表示所述检索图像E的特征富集区域个数;
步骤3.1、对所述检索图像E进行分块,获得W×H个子块构成的子块集合SUB={s11,s12,…,swh,…,sWH};1≤w≤W;1≤h≤H;
步骤3.2、定义特征点分布矩阵为C;所述特征点分布矩阵C中的元素C[w][h]为任一子块swh内包含的特征点的数量;
步骤3.3、定义所述特征点分布矩阵C的适应因子d为所述特征点分布矩阵C中所有元素的平均值;将所述特征点分布矩阵C中的每一个元素减去所述适应因子d,从而获得适应矩阵B;
步骤3.4、利用最大子矩阵和算法计算所述适应矩阵B的最大子矩阵,从而获得所述检索图像E的特征富集区域
步骤3.5、判断所述特征富集区域中所包含的特征点的数量是否大于所述特征点分布矩阵C中所有特征点数量的50%;若大于,则获得所述检索图像E的特征富集区域集合否则,将所述特征富集区域加入所述特征富集区域集合FSRE,并将所述特征富集区域包含的特征点的数量置为0,并重复步骤3.4执行;
步骤4、构建所述特征富集区域集合FSRE的特征向量集合F,所述特征向量集合F为所述特征富集区域集合FSRE的形状特征集合、纹理特征集合和颜色特征集合;
步骤4.1、通过二阶和三阶归一化中心矩构造七个Hu不变矩M1,M2…M7,以所述七个Hu不变矩M1,M2…M7作为所述形状特征集合;
步骤4.2、利用局部算子LBP对所述特征富集区域集合FSRE进行纹理特征提取,从而获得直方图特征向量,以所述直方图特征向量作为所述纹理特征集合;
步骤4.3、将所述检索图像E从RGB通道转换到HSV通道,从而获得色调分量H、亮度分量V和饱和度分量S;
统计所述色调分量H、亮度分量V和饱和度分量S的像素个数占所述特征富集区域集合FSR中像素总数的比重,分别获得所述色调分量H、亮度分量V和饱和度分量S的直方图,以所述直方图作为所述颜色特征集合;
步骤5、对存储在数据库中的候选图像集{Tt|t=1,2,…,M}中的每一幅候选图像按照步骤1至步骤4进行计算,从而获得候选图像集的特征富集区域集合的特征向量并保存至数据库;
步骤6、采用高斯非线性距离度量所述检索图像E和候选图像集{Tt|t=1,2,…,M}中每个候选图像的相似度:
步骤6.1、将所述检索图像E的特征富集区域集合FSRE中特征富集区域的特征向量表示为并计算所述特征向量值的均值和标准差q;
步骤6.2、利用式(4)对所述特征向量进行归一化处理,获得归一化后的特征向量
F z ′ E = F z E - m ‾ q - - - ( 4 )
步骤6.3、对所述特征富集区域集合FSRE中的每个特征富集区域以及所述候选图像集的特征富集区域集合中的每个特征富集区域按照步骤6.1和步骤6.2执行,从而分别获得所述特征富集区域集合FSRE的特征向量集合F'E和所述特征富集区域集合的特征向量集合
步骤6.4、利用式(5)获得所述检索图像E的特征富集区域集合FSRE中第i个特征富集区域和候选图像集的特征富集区域集合中第j个特征富集区域之间的非线性高斯距离
D ( R i E , R j T t ) = Σ μ = 1 g [ - ( f i μ E - f j μ T t ) 2 2 σ μ 2 ] - - - ( 5 )
式(5)中,表示所述检索图像E的特征富集区域集合FSRE中第i个特征富集区域的第μ维特征向量;表示所述特征富集区域集合中第j个特征富集区域的第μ维特征向量;1≤i≤Z,g为特征向量的维数;1≤j≤m;m表示所述候选图像Tt的特征富集区域总数;
步骤6.5、利用式(6)获得所述第i个特征富集区域的最小特征距离从而获得所述检索图像E的最小特征距离集合
dis i E = min 1 ≤ j ≤ m D ( R i E , R j T t ) - - - ( 6 )
式(6)表示所述第i个特征富集区域与所述特征富集区域集合中的每个特征富集区域之间的非线性高斯距离的最小值;
步骤6.6、利用式(7)获得所述第j个特征富集区域的最小特征距离从而获得所述候选图像Tt的最小特征距离集合
dis j T t = min 1 ≤ i ≤ n D ( r j T t , r i E ) - - - ( 7 )
式(7)表示所述第j个特征富集区域与检索图像E中所有的特征富集区域之间的非线性高斯距离的最小值;
步骤6.7、利用式(8)获得所述检索图像E与候选图像Tt的相似度D(E,Tt),从而获得所述检索图像E与所述候选图像集中每个候选图像的相似度构成的相似度集合:
D ( E , T t ) = 1 Z Σ i = 1 Z dis i E + 1 m Σ j = 1 m dis j T t - - - ( 8 )
步骤6.8、对所述相似度集合进行升序排序,选取前J个相似度所对应的候选图像作为图像检索结果。
本发明所述的基于特征富集区域集合的图像检索方法的特点也在于,所述步骤4.2是按如下步骤进行:
步骤4.2.1、判断所述特征富集区域内任一像素点v的灰度值是否大于与其邻域内的其他像素点的灰度值,若大于,则将邻域内的像素点标记为0,否则标记为1,从而获得由邻域内的像素点构成的一组二进制序列;
步骤4.2.2、将所述二进制序列转换为十进制值并作为所述像素点v的灰度值;
步骤4.2.3、遍历所述特征富集区域集合FSRE中的每一个特征富集区域中的每个像素点,并按照步骤4.2.1和步骤4.2.2更新所述特征富集区域集合FSRE中的每个像素点的灰度值,从而获得LBP特征富集区域集合
步骤4.2.4、计算所述LBP特征富集区域集合中的每一个LBP特征富集区域的直方图并进行量化,从而获得直方图特征向量集合。
与现有技术相比,本发明的有益效果在于:
1、本发明充分利用了图像特征富集区域的图像特征丰富,可有效表征图像内容的特点,提取图像的主要内容是通过诸多特征表现的先验信息,确定图像特征的富集区域,与传统基于ROI的图像检索方法相比更贴近人类视觉对图像所描述对象的语义理解,缩小语义鸿沟,提高检索准确程度。
2、本发明通过针对先验的特征富集区域进行形状、纹理及颜色的底层特征提取,避免了对整幅图像中其余背景图像及非主体内容的冗余处理,在降低了计算复杂度的同时提高了检索效率,排除了冗余信息对检索过程所带来的干扰,使得检索的结果更符合人类感官。
3、本发明利用Hessian矩阵提取图像的特征点,并通过最大子矩阵和算法来计算特征点分布矩阵中特征点最密集的区域,通过多次迭代计算得到多个特征富集区域,将特征富集区域集合作为后续检索的显著性区域,该方法能完整地提取特征富集区域及主体目标内容,且计算效率高。
附图说明
图1为本发明方法总体流程图;
图2为本发明特征富集区域检索设计方法流程图;
图3a为本发明特征富集区域计算输入示例图;
图3b为本发明特征富集区域计算结果示意图。
具体实施方式
本实施例中,一种基于特征富集区域集合的图像检索方法,是利用检索图像E对存储在数据库中的候选图像集{Tt|t=1,2,…,M}进行相似性匹配,并返回与检索图像E最相似的J个候选图像作为图像检索结果;M表示候选图像的总数;如图1所示,一种基于特征富集区域集合的图像检索方法是首先通过计算Hessian矩阵及非极大值抑制获得候选特征点集合,利用三维线性插值法得到亚像素级的特征点集合。根据得到图像特征点的坐标位置,计算特征点的分布矩阵和适应矩阵,利用最大子矩阵和算法求出适应矩阵的子矩阵,即特征点分布最密集的区域,作为图像的特征富集区域。对特征富集区域选择形状、纹理和颜色三个常用的底层特征,最后根据高斯非线性距离函数进行相似性度量,按照相似度升序排列,实现图像的快速检索。具体地,是按照如下步骤进行:
步骤1、如图2所示,以检索图像E的左上角顶点作为原点O,以与原点O相邻的两条边分别作为X轴和Y轴,建立坐标系XOY;在坐标系XOY中,将检索图像E转换为灰度图像G,并利用式(1)获得灰度图像G的积分图像I:
( x , y ) = Σ 0 ≤ i ′ ≤ x , 0 ≤ j ′ ≤ y G ( i ′ , j ′ ) - - - ( 1 )
式(1)中,I(x,y)表示积分图像I中任一像素点p(x,y)的值,G(i',j')表示灰度图像G中位于坐标(i',j')上的像素值;式(1)表示积分图像I中像素点p(x,y)的值是从灰度图像G的原点O到像素点p(x,y)所构成的矩形区域内所有像素点的灰度值之和:
步骤2、计算积分图像I的Hessian矩阵,获取积分图像I的特征点集合Fp
步骤2.1、利用高斯滤波器即二阶标准高斯函数,获得灰度图像G在不同尺度下的图像集合1≤τ≤n;στ表示第τ层的尺度值,从而构建n层图像金字塔;表示图像金字塔中尺度值为στ的第τ层图像;本实施例中,不通过降采样改变图像大小,而是利用改变高斯模糊的尺寸获得图像金字塔不同层的图像,从而提高处理速度与效率;
步骤2.2、利用式(2)计算第τ层图像中像素点p(x,y)的Hessian矩阵H(p,στ):
H ( p , σ τ ) = L xx ( p , σ τ ) L xy ( p , σ τ ) L xy ( p , σ τ ) L yy ( p , σ τ ) - - - ( 2 )
式(2)中,Lxx(p,στ)、Lxy(p,στ)和Lyy(p,στ)分别表示第τ层图像与高斯二阶滤波器的卷积;并有: g ( x , y , σ τ ) = 1 2 π σ τ e - ( x 2 + y 2 ) 2 σ τ ; 对于离散的像素点采用模板卷积完成高斯平滑及二阶求导的过程;
步骤2.3、并利用式(3)所示的Hessian矩阵H(p,στ)的判别式Det(H(p,στ))判断第τ层图像的像素点p(x,y)是否为极值点,若判别式Det(H(p,στ))>0,则为极值点,否则为非极值点,将Det(H(p,στ))>0时的像素点作为候选特征点Ak
Det(H(p,στ))=Lxx(p,στ)Lyy(p,στ)-Lxy(p,στ)2    (3)
步骤2.4、遍历图像金字塔中的每一层图像中的每个像素点,并利用式(3)进行判断,从而获得候选特征点集合A={A1,A2,…,Ak,…,AK};1≤k≤K,K表示候选特征点的个数;
步骤2.5、定义第σ层图像中像素点p(x,y)的三维N阶邻域集合为U(p,τ)={Uτ-1,Uτ,Uτ+1};本实施例中,N=3,Uτ-1表示在第τ-1层图像中,与像素点p(x,y)对应的像素点p'(x,y)及其相邻的N2-1个像素点的集合;Uτ+1表示在第τ+1层图像中,与像素点p(x,y)对应的像素点p″(x,y)及其相邻的N2-1个像素点的集合;Uτ表示在第τ层图像中与像素点p(x,y)相邻的N2-1个像素点的集合,本实施例中,三维三阶邻域集合中共有包括第τ层中8个点和在第τ-1层及第τ+1层中各9个点,共26个像素点;
步骤2.6、遍历候选特征点集合A中每个候选特征点,若任一候选特征点Ak的灰度值大于其三维N阶邻域集合中所有的3N2-1,本实施例中为26个像素点的灰度值或是小于其三维N阶邻域集合中所有的3N2-1,即为26个像素点的灰度值,则将候选特征点Ak作为特征点,再通过三维线性插值法得到亚像素级的特征点,利用已设置的过滤阈值,过滤部分相对较弱的特征点,从而获得特征点集合,利用积分图像I能快速获得特征点在检索图像E中的对应位置;
步骤3、依据特征点集合,计算特征点分布矩阵C和适应矩阵B,从而获得检索图像E的特征富集区域集合1≤z≤Z,Z表示检索图像E的特征富集区域个数;如图3a所示为检索示例图像,图3b为特征点集合及特征富集区域计算结果示意图,黑色小圈表示检测到的特征点,黑色矩形框表示特征富集区域;从图3b中可以看出,示例图中有2个特征富集区域;
步骤3.1、对检索图像E进行分块,区域子块大小视实际情况而定,获得W×H个子块构成的子块集合SUB={s11,s12,…,swh,…,sWH};1≤w≤W;1≤h≤H;
步骤3.2、定义特征点分布矩阵为C;特征点分布矩阵C中的元素C[w][h]为任一子块swh内包含的特征点的数量;
步骤3.3、对于一个元素都是自然数的特征点分布矩阵来讲,最大子矩阵和始终是分布矩阵自身。因此需要对分布矩阵进行特殊的处理,使得到的矩阵元素有正有负,本实施例中采用的方式是将分布矩阵中的每一个元素减去一个常数。定义特征点分布矩阵C的适应因子d为特征点分布矩阵C中所有元素的平均值;将特征点分布矩阵C中的每一个元素减去适应因子d,从而获得适应矩阵B;
步骤3.4、利用最大子矩阵和算法计算适应矩阵B的最大子矩阵,从而获得检索图像E的特征富集区域
步骤3.4.1、遍历适应矩阵B中所有两个行的组合B[i]和B[j]之间的元素,将当前两行B[i]和B[j]之间的各列元素相加后存储在一维数组D[w]中;
步骤3.4.2、遍历一维数组D[w]中的每个元素,并依次进行相加;记录当前值Current和当前最大值Max及其区间[k,l],每加上一个元素,对比当前值Current与Max,若大于Max则将Current赋值给Max,并更新区间[k,l];若Current小于0,则将Current清零重新计算;最终得到以B[i][k]为左上角,B[j][l]为右下角的区域为图像检索的特征富集区域
步骤3.5、判断特征富集区域中所包含的特征点的数量是否大于特征点分布矩阵C中所有特征点数量的50%;若大于,则可以认为当前特征富集区域已经囊括图像的主体内容,无需继续寻找富集区域,并获得检索图像E的特征富集区域集合否则,认为图像依然有特征集中的区域未被包括在特征富集区域集合中,并将特征富集区域加入特征富集区域集合FSRE,并将特征富集区域包含的特征点的数量置为0,并重复步骤3.4执行;
步骤4、构建特征富集区域集合FSRE的特征向量集合F,特征向量集合F为特征富集区域集合FSRE的形状特征集合、纹理特征集合和颜色特征集合;
步骤4.1、通过二阶和三阶归一化中心矩构造七个Hu不变矩M1,M2…M7,以七个Hu不变矩M1,M2…M7作为形状特征集合,七个Hu不变矩的计算由Hu MING-KUEI在Information Theory,IRE Transactions on,1962,8(2):179-187的《Visual pattern recognition bymoment invariants》一文中提出;
步骤4.2、利用局部算子LBP对特征富集区域集合FSRE进行纹理特征提取,从而获得直方图特征向量,以直方图特征向量作为纹理特征集合;
步骤4.2.1、判断特征富集区域内任一像素点v的灰度值是否大于与其邻域内的其他像素点的灰度值,本实施例中,邻域为像素点v周围的8个像素点,若大于,则将邻域内的像素点标记为0,否则标记为1,从而按任一特定顺序获得由邻域内的像素点构成的一组二进制序列;
步骤4.2.2、将二进制序列转换为十进制值并作为像素点v的灰度值;
步骤4.2.3、遍历特征富集区域集合FSRE中的每一个特征富集区域中的每个像素点,并按照步骤4.2.1和步骤4.2.2更新特征富集区域集合FSRE中的每个像素点的灰度值,从而获得LBP特征富集区域集合
步骤4.2.4、计算LBP特征富集区域集合中的每一个LBP特征富集区域的直方图并进行量化,统计各灰度值区间内的像素个数占特征富集区域集合FSR中像素总数的比重,本实施例中将直方图量化降维至64维,从而获得直方图特征向量集合。
步骤4.3、将检索图像E从RGB通道转换到HSV通道,从而获得色调分量H、亮度分量V和饱和度分量S;本实施例中,将色调分量量化为8个等级,亮度和饱和度分量量化为4个等级,从而加速计算,提高效率;
统计色调分量H、亮度分量V和饱和度分量S的像素个数占特征富集区域集合FSR中像素总数的比重,分别获得色调分量H、亮度分量V和饱和度分量S的直方图,以直方图作为颜色特征集合;
步骤5、对存储在数据库中的候选图像集{Tt|t=1,2,…,M}中的每一幅候选图像按照步骤1至步骤4进行计算,从而获得候选图像集的特征富集区域集合的特征向量并保存至数据库;
步骤6、采用高斯非线性距离度量检索图像E和候选图像集{Tt|t=1,2,…,M}中每个候选图像的相似度:
步骤6.1、将检索图像E的特征富集区域集合FSRE中特征富集区域的特征向量表示为g为特征向量的维数,本实施例中,特征向量包括形状特征向量7维,纹理特征向量64维,颜色特征向量128维总数199维,并计算特征向量值的均值和标准差q;
步骤6.2、由于不同特征的物理意义不同,取值范围也常大相径庭,这样不同的特征不直接具有可比性。为此,在综合利用不同特征进行检索时,需要对其进行归一化,利用式(4)对特征向量进行归一化处理,获得归一化后的特征向量
F z ′ E = F z E - m ‾ q - - - ( 4 )
步骤6.3、对特征富集区域集合FSRE中的每个特征富集区域以及候选图像集的特征富集区域集合中的每个特征富集区域按照步骤6.1和步骤6.2执行,从而分别获得特征富集区域集合FSRE的特征向量集合F'E和特征富集区域集合的特征向量集合
步骤6.4、利用式(5)获得检索图像E的特征富集区域集合FSRE中第i个特征富集区域和候选图像集的特征富集区域集合中第j个特征富集区域之间的非线性高斯距离
D ( R i E , R j T t ) = Σ μ = 1 g [ - ( f i μ E - f j μ T t ) 2 2 σ μ 2 ] - - - ( 5 )
式(5)中,表示检索图像E的特征富集区域集合FSRE中第i个特征富集区域的第μ维特征向量;表示特征富集区域集合中第j个特征富集区域的第μ维特征向量;1≤i≤Z,Z表示所述检索图像E的特征富集区域个数;g为特征向量的维数;1≤j≤m;m表示候选图像Tt的特征富集区域总数;
步骤6.5、每一个特征富集区域与最小特征距离一一对应,对于检索图像E而言,存在一个最小特征距离集合,利用式(6)获得第i个特征富集区域的最小特征距离从而获得检索图像E的最小特征距离集合
dis i E = min 1 ≤ j ≤ m D ( R i E , R j T t ) - - - ( 6 )
式(6)表示第i个特征富集区域与特征富集区域集合中的每个特征富集区域之间的非线性高斯距离的最小值;
步骤6.6、对数据库中的候选图像集也进行相同的操作,利用式(7)获得第j个特征富集区域的最小特征距离从而获得候选图像Tt的最小特征距离集合 DIS T t = { dis 1 T t , dis 2 T t , . . . dis m T t } :
dis j T t = min 1 ≤ i ≤ n D ( r j T t , r i E ) - - - ( 7 )
式(7)表示第j个特征富集区域与检索图像E中所有的特征富集区域之间的非线性高斯距离的最小值;
步骤6.7、定义检索图像E的最小特征距离集合DISE与候选图像Tt的最小特征距离集合中最小特征距离的平均值之和作为检索图像E与候选图像Tt的相似度,特征距离越小,相似度的值也越小,说明两幅图片越相似,利用式(8)获得检索图像E与候选图像Tt的相似度D(E,Tt),从而获得检索图像E与候选图像集中每个候选图像的相似度构成的相似度集合:
D ( E , T t ) = 1 Z Σ i = 1 Z dis i E + 1 m Σ j = 1 m dis j T t - - - ( 8 )
步骤6.8、对相似度集合进行升序排序,选取前J个相似度所对应的候选图像作为图像检索结果。

Claims (2)

1.一种基于特征富集区域集合的图像检索方法,是利用检索图像E对存储在数据库中的候选图像集{Tt|t=1,2,…,M}进行相似性匹配,并返回与所述检索图像E最相似的J个候选图像作为图像检索结果;M表示所述候选图像的总数;其特征是:所述方法按如下步骤进行:
步骤1、以所述检索图像E的任一顶点作为原点O,以与所述原点O相邻的两条边分别作为X轴和Y轴,建立坐标系XOY;在所述坐标系XOY中,将所述检索图像E转换为灰度图像G,并利用式(1)获得所述灰度图像G的积分图像I:
I ( x , y ) = Σ 0 ≤ i ′ ≤ x , 0 ≤ j ′ ≤ y G ( i ′ , j ′ ) - - - ( 1 )
式(1)中,I(x,y)表示所述积分图像I中任一像素点p(x,y)的值,G(i',j')表示所述灰度图像G中位于坐标(i',j')上的像素值;式(1)表示所述积分图像I中像素点p(x,y)的值是从所述灰度图像G的原点O到像素点p(x,y)所构成的矩形区域内所有像素点的灰度值之和:
步骤2、计算所述积分图像I的Hessian矩阵,获取所述积分图像I的特征点集合Fp
步骤2.1、利用高斯滤波器获得所述灰度图像G在不同尺度下的图像集合1≤τ≤n;στ表示第τ层的尺度值,从而构建n层图像金字塔;表示所述图像金字塔中尺度值为στ的第τ层图像;
步骤2.2、利用式(2)计算所述第τ层图像中像素点p(x,y)的Hessian矩阵H(p,στ):
H ( p , σ τ ) = L xx ( p , σ τ ) L xy ( p , σ τ ) L xy ( p , σ τ ) L yy ( p , σ τ ) - - - ( 2 )
式(2)中,Lxx(p,στ)、Lxy(p,στ)和Lyy(p,στ)分别表示所述第τ层图像与高斯二阶滤波器的卷积;并有: g ( x , y , σ τ ) = 1 2 π σ τ e - ( x 2 + y 2 ) 2 σ τ ;
步骤2.3、并利用式(3)所示的Hessian矩阵H(p,στ)的判别式Det(H(p,στ))判断所述第τ层图像的像素点p(x,y)是否为极值点,将Det(H(p,στ))>0时的像素点作为候选特征点Ak
Det(H(p,στ))=Lxx(p,στ)Lyy(p,στ)-Lxy(p,στ)2    (3)
步骤2.4、遍历所述图像金字塔中的每一层图像中的每个像素点,并利用式(3)进行判断,从而获得候选特征点集合A={A1,A2,…,Ak,…,AK};1≤k≤K,K表示所述候选特征点的个数;
步骤2.5、定义所述第σ层图像中像素点p(x,y)的三维N阶邻域集合为U(p,τ)={Uτ-1,Uτ,Uτ+1};Uτ-1表示在第τ-1层图像中,与像素点p(x,y)对应的像素点p'(x,y)及其相邻的N2-1个像素点的集合;Uτ+1表示在第τ+1层图像中,与像素点p(x,y)对应的像素点p″(x,y)及其相邻的N2-1个像素点的集合;Uτ表示在第τ层图像中与像素点p(x,y)相邻的N2-1个像素点的集合;
步骤2.6、遍历所述候选特征点集合A中每个候选特征点,若任一候选特征点Ak的灰度值大于其三维N阶邻域集合中所有的3N2-1像素点的灰度值或是小于其三维N阶邻域集合中所有的3N2-1像素点的灰度值,则将候选特征点Ak作为特征点,从而获得特征点集合;
步骤3、依据所述特征点集合,计算特征点分布矩阵C和适应矩阵B,从而获得所述检索图像E的特征富集区域集合1≤z≤Z,Z表示所述检索图像E的特征富集区域个数;
步骤3.1、对所述检索图像E进行分块,获得W×H个子块构成的子块集合SUB={s11,s12,…,swh,…,sWH};1≤w≤W;1≤h≤H;
步骤3.2、定义特征点分布矩阵为C;所述特征点分布矩阵C中的元素C[w][h]为任一子块swh内包含的特征点的数量;
步骤3.3、定义所述特征点分布矩阵C的适应因子d为所述特征点分布矩阵C中所有元素的平均值;将所述特征点分布矩阵C中的每一个元素减去所述适应因子d,从而获得适应矩阵B;
步骤3.4、利用最大子矩阵和算法计算所述适应矩阵B的最大子矩阵,从而获得所述检索图像E的特征富集区域
步骤3.5、判断所述特征富集区域中所包含的特征点的数量是否大于所述特征点分布矩阵C中所有特征点数量的50%;若大于,则获得所述检索图像E的特征富集区域集合否则,将所述特征富集区域加入所述特征富集区域集合FSRE,并将所述特征富集区域包含的特征点的数量置为0,并重复步骤3.4执行;
步骤4、构建所述特征富集区域集合FSRE的特征向量集合F,所述特征向量集合F为所述特征富集区域集合FSRE的形状特征集合、纹理特征集合和颜色特征集合;
步骤4.1、通过二阶和三阶归一化中心矩构造七个Hu不变矩M1,M2…M7,以所述七个Hu不变矩M1,M2…M7作为所述形状特征集合;
步骤4.2、利用局部算子LBP对所述特征富集区域集合FSRE进行纹理特征提取,从而获得直方图特征向量,以所述直方图特征向量作为所述纹理特征集合;
步骤4.3、将所述检索图像E从RGB通道转换到HSV通道,从而获得色调分量H、亮度分量V和饱和度分量S;
统计所述色调分量H、亮度分量V和饱和度分量S的像素个数占所述特征富集区域集合FSR中像素总数的比重,分别获得所述色调分量H、亮度分量V和饱和度分量S的直方图,以所述直方图作为所述颜色特征集合;
步骤5、对存储在数据库中的候选图像集{Tt|t=1,2,…,M}中的每一幅候选图像按照步骤1至步骤4进行计算,从而获得候选图像集的特征富集区域集合的特征向量并保存至数据库;
步骤6、采用高斯非线性距离度量所述检索图像E和候选图像集{Tt|t=1,2,…,M}中每个候选图像的相似度:
步骤6.1、将所述检索图像E的特征富集区域集合FSRE中特征富集区域的特征向量表示为并计算所述特征向量值的均值和标准差q;
步骤6.2、利用式(4)对所述特征向量进行归一化处理,获得归一化后的特征向量
F z ′ E = F z E - m ‾ q - - - ( 4 )
步骤6.3、对所述特征富集区域集合FSRE中的每个特征富集区域以及所述候选图像集的特征富集区域集合中的每个特征富集区域按照步骤6.1和步骤6.2执行,从而分别获得所述特征富集区域集合FSRE的特征向量集合F'E和所述特征富集区域集合的特征向量集合
步骤6.4、利用式(5)获得所述检索图像E的特征富集区域集合FSRE中第i个特征富集区域和候选图像集的特征富集区域集合中第j个特征富集区域之间的非线性高斯距离
D ( R i E , R j T t ) = Σ μ = 1 g [ - ( f i μ E - f j μ T t ) 2 2 σ μ 2 ] - - - ( 5 )
式(5)中,表示所述检索图像E的特征富集区域集合FSRE中第i个特征富集区域的第μ维特征向量;表示所述特征富集区域集合中第j个特征富集区域的第μ维特征向量;1≤i≤Z,g为特征向量的维数;1≤j≤m;m表示所述候选图像Tt的特征富集区域总数;
步骤6.5、利用式(6)获得所述第i个特征富集区域的最小特征距离从而获得所述检索图像E的最小特征距离集合
dis i E = mn 1 ≤ j ≤ m D ( R i E , R j T t ) - - - ( 6 )
式(6)表示所述第i个特征富集区域与所述特征富集区域集合中的每个特征富集区域之间的非线性高斯距离的最小值;
步骤6.6、利用式(7)获得所述第j个特征富集区域的最小特征距离从而获得所述候选图像Tt的最小特征距离集合
dis j T t = min 1 ≤ i ≤ n D ( r j T t , r i E ) - - - ( 7 )
式(7)表示所述第j个特征富集区域与检索图像E中所有的特征富集区域之间的非线性高斯距离的最小值;
步骤6.7、利用式(8)获得所述检索图像E与候选图像Tt的相似度D(E,Tt),从而获得所述检索图像E与所述候选图像集中每个候选图像的相似度构成的相似度集合:
D ( E , T t ) = 1 Z Σ i = 1 Z dis i E + 1 m Σ j = 1 m di s j T t - - - ( 8 )
步骤6.8、对所述相似度集合进行升序排序,选取前J个相似度所对应的候选图像作为图像检索结果。
2.根据权利要求1所述的基于特征富集区域集合的图像检索方法,其特征是,所述步骤4.2是按如下步骤进行:
步骤4.2.1、判断所述特征富集区域内任一像素点v的灰度值是否大于与其邻域内的其他像素点的灰度值,若大于,则将邻域内的像素点标记为0,否则标记为1,从而获得由邻域内的像素点构成的一组二进制序列;
步骤4.2.2、将所述二进制序列转换为十进制值并作为所述像素点v的灰度值;
步骤4.2.3、遍历所述特征富集区域集合FSRE中的每一个特征富集区域中的每个像素点,并按照步骤4.2.1和步骤4.2.2更新所述特征富集区域集合FSRE中的每个像素点的灰度值,从而获得LBP特征富集区域集合
步骤4.2.4、计算所述LBP特征富集区域集合中的每一个LBP特征富集区域的直方图并进行量化,从而获得直方图特征向量集合。
CN201410670157.5A 2014-11-20 2014-11-20 一种基于特征富集区域集合的图像检索方法 Active CN104361096B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410670157.5A CN104361096B (zh) 2014-11-20 2014-11-20 一种基于特征富集区域集合的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410670157.5A CN104361096B (zh) 2014-11-20 2014-11-20 一种基于特征富集区域集合的图像检索方法

Publications (2)

Publication Number Publication Date
CN104361096A true CN104361096A (zh) 2015-02-18
CN104361096B CN104361096B (zh) 2016-02-24

Family

ID=52528356

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410670157.5A Active CN104361096B (zh) 2014-11-20 2014-11-20 一种基于特征富集区域集合的图像检索方法

Country Status (1)

Country Link
CN (1) CN104361096B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503627A (zh) * 2016-09-30 2017-03-15 西安翔迅科技有限责任公司 一种基于视频分析的车辆避让行人检测方法
CN108255858A (zh) * 2016-12-29 2018-07-06 北京优朋普乐科技有限公司 一种图像检索方法和系统
CN110490049A (zh) * 2019-07-02 2019-11-22 西安理工大学 基于多特征和svm区分人体平衡障碍的方法
CN111300987A (zh) * 2020-02-27 2020-06-19 深圳怡化电脑股份有限公司 喷墨间隔时间确定方法、装置、计算机设备及存储介质
WO2020164278A1 (zh) * 2019-02-14 2020-08-20 平安科技(深圳)有限公司 一种图像处理方法、装置、电子设备和可读存储介质
CN113094465A (zh) * 2021-04-27 2021-07-09 中国美术学院 一种设计产品查重方法和系统
CN116612389A (zh) * 2023-07-20 2023-08-18 青建国际集团有限公司 一种建筑施工进度管理方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495843A (zh) * 2011-11-15 2012-06-13 复旦大学 一种基于局部特征的显著区域检测算法
CN103729654A (zh) * 2014-01-22 2014-04-16 青岛新比特电子科技有限公司 基于改进sift算法的图像匹配检索系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102495843A (zh) * 2011-11-15 2012-06-13 复旦大学 一种基于局部特征的显著区域检测算法
CN103729654A (zh) * 2014-01-22 2014-04-16 青岛新比特电子科技有限公司 基于改进sift算法的图像匹配检索系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
EAKINS J,GRAHAM M: "《Content-Based Image Retrieval》", 《LIBRARY AND INFORMATION BRIEFINGS. JOINT INFORMATION SYSTEMS COMMITTEE》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503627A (zh) * 2016-09-30 2017-03-15 西安翔迅科技有限责任公司 一种基于视频分析的车辆避让行人检测方法
CN108255858A (zh) * 2016-12-29 2018-07-06 北京优朋普乐科技有限公司 一种图像检索方法和系统
WO2020164278A1 (zh) * 2019-02-14 2020-08-20 平安科技(深圳)有限公司 一种图像处理方法、装置、电子设备和可读存储介质
CN110490049A (zh) * 2019-07-02 2019-11-22 西安理工大学 基于多特征和svm区分人体平衡障碍的方法
CN111300987A (zh) * 2020-02-27 2020-06-19 深圳怡化电脑股份有限公司 喷墨间隔时间确定方法、装置、计算机设备及存储介质
CN113094465A (zh) * 2021-04-27 2021-07-09 中国美术学院 一种设计产品查重方法和系统
CN116612389A (zh) * 2023-07-20 2023-08-18 青建国际集团有限公司 一种建筑施工进度管理方法及系统
CN116612389B (zh) * 2023-07-20 2023-09-19 青建国际集团有限公司 一种建筑施工进度管理方法及系统

Also Published As

Publication number Publication date
CN104361096B (zh) 2016-02-24

Similar Documents

Publication Publication Date Title
CN104361096B (zh) 一种基于特征富集区域集合的图像检索方法
Deng et al. Learning to predict crisp boundaries
Saavedra et al. Sketch based Image Retrieval using Learned KeyShapes (LKS).
Reddy Mopuri et al. Object level deep feature pooling for compact image representation
CN108062543A (zh) 一种面部识别方法及装置
CN102938065B (zh) 基于大规模图像数据的人脸特征提取方法及人脸识别方法
CN102194114B (zh) 一种基于边缘梯度方向金字塔直方图的虹膜识别方法
Xiaofeng et al. Discriminatively trained sparse code gradients for contour detection
CN106126581A (zh) 基于深度学习的手绘草图图像检索方法
CN107256246A (zh) 基于卷积神经网络的印花织物图像检索方法
CN105956560A (zh) 一种基于池化多尺度深度卷积特征的车型识别方法
CN106815824B (zh) 一种提高大规模三维重建效率的图像近邻优化方法
CN108197644A (zh) 一种图像识别方法和装置
CN104239420A (zh) 一种基于视频指纹的视频相似度匹配方法
CN104008375A (zh) 基于特征融合的集成人脸识别方法
CN105956570B (zh) 基于唇部特征和深度学习的笑脸识别方法
CN103955952A (zh) 一种服装图像颜色特征的提取与描述方法
CN109325507A (zh) 一种结合超像素显著性特征与hog特征的图像分类算法和系统
CN104050460B (zh) 多特征融合的行人检测方法
CN105404657A (zh) 一种基于cedd特征和phog特征的图像检索方法
CN103985130A (zh) 一种针对复杂纹理图像的图像显著性分析方法
CN106845516A (zh) 一种基于多样本联合表示的足迹图像识别方法
CN108154157A (zh) 一种基于集成的快速谱聚类方法
CN106228136A (zh) 基于聚合通道特征的全景街景隐私保护方法
CN106203448A (zh) 一种基于非线性尺度空间的场景分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20201224

Address after: 245000 No.50, Meilin Avenue, Huangshan Economic Development Zone, Huangshan City, Anhui Province

Patentee after: Huangshan Development Investment Group Co.,Ltd.

Address before: Tunxi road in Baohe District of Hefei city of Anhui Province, No. 193 230009

Patentee before: Hefei University of Technology

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220915

Address after: Huangshan Future Science and Technology City, No. 59, Meilin Avenue, Huangshan High-tech Industrial Development Zone, Huangshan City, Anhui Province, 245000

Patentee after: Huangshan Science and Technology Innovation Center Co.,Ltd.

Address before: 245000 No.50, Meilin Avenue, Huangshan Economic Development Zone, Huangshan City, Anhui Province

Patentee before: Huangshan Development Investment Group Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230224

Address after: 230001 Gujing Baihua Building, 156 Chun Road, Hefei, Anhui Province

Patentee after: HEFEI HUIZHONG INTELLECTUAL PROPERTY MANAGEMENT Co.,Ltd.

Address before: Huangshan Future Science and Technology City, No. 59, Meilin Avenue, Huangshan High-tech Industrial Development Zone, Huangshan City, Anhui Province, 245000

Patentee before: Huangshan Science and Technology Innovation Center Co.,Ltd.