CN103810252A - 一种基于群稀疏特征选择的图像检索方法 - Google Patents

一种基于群稀疏特征选择的图像检索方法 Download PDF

Info

Publication number
CN103810252A
CN103810252A CN201410027227.5A CN201410027227A CN103810252A CN 103810252 A CN103810252 A CN 103810252A CN 201410027227 A CN201410027227 A CN 201410027227A CN 103810252 A CN103810252 A CN 103810252A
Authority
CN
China
Prior art keywords
image
feature
group
image retrieval
feature selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410027227.5A
Other languages
English (en)
Other versions
CN103810252B (zh
Inventor
徐军
郑秋中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Information Science and Technology
Original Assignee
Nanjing University of Information Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Information Science and Technology filed Critical Nanjing University of Information Science and Technology
Priority to CN201410027227.5A priority Critical patent/CN103810252B/zh
Publication of CN103810252A publication Critical patent/CN103810252A/zh
Application granted granted Critical
Publication of CN103810252B publication Critical patent/CN103810252B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Library & Information Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于群稀疏特征选择的图像检索方法,包括特征选择与图像检索两部分,其中特征选择步骤包括选取图像对、提取多种特征、形成特征差异矩阵、建立群稀疏逻辑回归模型、运用优化算法求解权重、选择出最优特征;图像检索步骤包括提取图像库所有图像的最优特征、形成图像特征库、提取查询图像最优特征、相似度比较、求出最大相似度图像序号、输出检索图像。本发明运用自适应谱梯度算法有效的求解群稀疏逻辑回归模型,具有更快的收敛速度,更少的运行时间。传统的基于内容的图像检索,特征的选择是特定的,本发明用全部训练特征进行图像检索相比,在相同的实验条件下,图像的查准率明显提高,图像检索的效率增强。

Description

一种基于群稀疏特征选择的图像检索方法
技术领域
本发明涉及图像信息处理技术领域,尤其涉及一种基于群稀疏特征选择的图像检索方法。 
背景技术
随着数据库技术、多媒体技术、网络技术的飞速发展,人们越来越多地接触到拥有大量数字图像的数据库,为了对图像库进行有效管理,人们急切的需要高效的图像检索系统。由于技术原因,目前许多流行的商用Web图像搜索引擎,如Google、百度、360搜索等等都是传统的基于文本的图像检索。基于文本的图像检索采用Web网页中与图像关联的文字信息来完成搜索任务,但是它有如下的缺点:1.描述能力有限,例如对纹理,不规则形状等无法精确描述。2.描述具有主观性,不同人对同一副图像的描述可能不同。3.在现代社会海量的图像面前,每一幅图像皆有详细的文本描述显然这是不现实的。为了克服传统检索方法的局限性,基于内容的图像检索技术应运而生。基于内容的图像检索采用的做法是预先采用某些特征提取算法抽取图像的低层特征(如颜色、纹理和形状等)并形成一个特征库。然后提取查询图像的特征并与特征库进行匹配以寻找相似的图像。由于这些特征都是客观独立地存在于图像中的,因此这种图像检索方法的主要特点是利用图像本身包含的客观视觉特性,不需要人为干预和解释,能够通过计算机自动实现对图像特征的提取和存储。因此基于内容的图像检索技术已迅速成为图像数据库技术中的研究热点之一,并得到了国内外信息领域科技人员的广泛重视和研究。基于内容的图像检索,这个概念是于1992年最先由T.Kato提出的,经过这20年的研究,国内外的许多高校和研究机构投入了大量的资金、人力和物力进行研究,并取得了一定的成果。如IBM公司开发的QBIC系统,Virage公司开发的Virage系统,MIT的多媒体实验室开发的Photobook系统,哥伦比亚大学开发的VisualSEEK和WebSEEK系统,中国科学院计算机技术研究所智能信息处理重点实验室研发的Mires系统等等。 
图像特征的提取是基于内容的图像检索的第一步也是最为关键的一步。图像的特征包括低层视觉特征(包括颜色、纹理、形状等)和高层语义特征(主体对 象、行为特征、情感特征等)。由于目前图像理解、计算机视觉等领域的研究水平还很有限,使得现有的对基于内容的图像检索技术的研究和应用均是基于图像的低层视觉特征来进行的,还无法在真正意义上做到基于高层语义的图像检索。不同的图像低层视觉特征都具有其独特的性质和适合的应用场合,例如颜色特征适用于颜色信息较为丰富,且图像之间颜色分布差异较大的图像数据库;对于富含纹理信息的图像(医学图像、植物图像、岩石图像等)通常采用的方法是基于纹理特征的检索方式;而针对具有明确主体对象且目标边缘清晰的图像使用形状特征进行检索则能取得较好的检索效果。在系统的复杂度和检索时间允许的情况下,将多种低层视觉特征组合起来进行图像检索可以获得更好的检索结果。 
随着计算机视觉的发展,图像的特征越来越丰富,而图像特征的性质千差万别,各不相同。如颜色特征就可以有RGB,HSV,LAB等等,纹理特征有Tamura,SIFT(尺度不变的几何变化),Gabor等等,形状特征有不变矩,边缘方向直方图,霍夫变换直线检测等等。当使用多种特征组合进行图像检索,如果不加选择的使用大量特征进行图像检索,由于多种特征的存在,必然产生数据冗余,计算复杂度上升,检索的效率与性能下降等问题。对于这个问题,目前有两种解决方案,一种是对维数大的特征的进行降维处理,另外一种是对特征进行择优选择。对于降维方法,存在两个问题:1.缩减的维数不是盲目的,因为如果维数被缩减到必要的维数以下,图像特征的信息就有可能丢失。2.而且由于底层属于同类特征的不同特征有强烈的相关性,降维并不能够彻底解决数据冗余的问题。所以特征选择是一个比较好的方法,对于不同图像库,最优的特征一般也不一样,因此选择最优特征非常重要。对于一个图像库来说,所选取的特征好坏直接影响检索性能,如何建立一个可以选择对于特定图像库最为有效的特征组合的通用的模型成为一个非常重要的问题。 
发明内容
本发明所要解决的技术问题在于提出了一种基于群稀疏特征选择解决方案,将其用于基于内容的图像检索上,在提高检索的准确率的同时,有效地提升了检索的效率。 
一种基于群稀疏特征选择的图像检索方法,其特征在于,包括特征选择和图像检索两部分: 
一、特征选择具体包括: 
步骤11、针对图像库中的每一幅图像,比较其图像关键字形成相似与不相似序列,接着比较相似与不相似序列的图像显著区域的欧式距离,获取图像库中每一幅图像的相似对与不相似对,得到该图像的相似性度量向量; 
步骤12、对获得的每一幅图像的相似对与不相似对分别提取训练特征,图像库中所有图像的训练特征形成两个特征矩阵,将前述两个特征矩阵相减形成特征差异矩阵; 
步骤13、设定权重系数,并依据特征差异矩阵与相似性度量向量,建立群稀疏逻辑模型; 
步骤14、利用优化算法求解群稀疏逻辑模型,求解出权重系数; 
步骤15、根据权重系数中非0群对应于特征差异矩阵所占位置,得出最优特征;步骤16、对于图像库中的所有图像提取步骤15得出的最优特征,将提取的特征以矩阵的形式保存,形成图像特征库; 
二、图像检索具体包括: 
步骤21、对查询图像,按照步骤11至步骤15的方式提取出最优特征; 
步骤22、利用相似度度量,将查询图像的最优特征与图像特征库中的每一幅图像的特征进行相似性匹配; 
步骤23、将匹配得出的图像按照相似度的程度从大到小进行排序,得出经过排序的图像序号; 
步骤24、根据步骤23得出的图像序号,从图像特征库中提取出对应图像,并作为查询图像对应的检索图像输出。 
作为本发明的进一步优选方案,所述步骤14中,优化算法为自适应谱梯度算法。 
作为本发明的进一步优选方案,所述步骤23中,相似度度量的计算方法选择L1距离,L2距离,直方图交集,卡方距离,KL-D距离中的一种。 
相比现有技术,本发明方法具有以下有益效果: 
1.运用群稀疏算法构建针对图像库进行特征选择的通用方法; 
2.优化算法中采用的自适应谱梯度算法(ANSPG)相比谱梯度算法(SPG)有效减少了算法的时间复杂度,在处理群稀疏表示问题上性能优越; 
3.运用本文通过基于群稀疏特征选择的算法,提高了基于内容图像检索的性能,并通过实验验证了本文提出基于内容的图像检索方法的性能。 
附图说明
图1为特征选择和特征检索流程图; 
图2(a)、图2(b)分别为图像对选择策略和构建的群稀疏逻辑模型示意图; 
图3(a)、图3(b)、图3(c)Core15K为非别在数据库上使用谱梯度(SPG)算法与自适应谱梯度(ANSPG)算法分别对颜色特征,纹理与方向特征进行选择; 
图4为在Core15K数据库上索查准率比较; 
图5为在IAPRIC12数据库上索查准率比较; 
图6为具体实例中所选用的训练特征; 
图7为不同特征在不同距离度量下的查准率; 
图8为SPG(谱梯度算法)与ANSPG(自适应谱梯度)算法在Core15K上时间花费。 
具体实施方式
下面结合附图对本发明的技术方案进行详细说明: 
本发明所述一种基于群稀疏特征选择图像检索方法,包括特征选择与图像检索两部分,如图1所示。 
特征选择步骤包括: 
步骤1、图像对获取与形成相似性度量向量:在图像库中选择图像对是本文提出算法的一个重要的预备工作。从第一幅图像开始,图像相似对的选择流程如图2(a)所示。由于关键字的比较相对于图像欧氏距离的比较计算的时间复杂度很低,所以本文首先将图像库中第一幅图与其余图像的关键字进行比较,如果有大于三分之二关键字相同的,则生成第一幅图像的一个相似序列,如果有没有关键字相同的,则生成第一幅图像的一个不相似序列。然后将相似列与不相似列中的每一幅图像分别同第一幅图像运用欧氏距离的度量方法进行相似性比较,选n1(n1为选择的相似图像对数目)幅最相似的图像与第一幅图像组成相似对,同时选n2(n2为选择的不相似图像对数目)幅最不相似的图像与第一幅图像组成不相似对,从而可以构建关于第一幅图像的所有相似对和不相似对。依次对图像库 中第二幅图像到最后一幅图像重复运用流程图2(a)中所示图像对的构建方法,最终可以得到图像库中每一幅图像所对应的所有相似与不相似图像对。然后根据构建的相似对和不相似对,将相似对赋予1而不相似对赋予-1,从而得到一个相似性度量向量Y。 
步骤2、提取特征与构建特征差异矩阵:如图1所示将所得图像对首先分为两个图像列L1与L2,然后分别提取训练特征得到特征矩阵A与B,把A和B相减得到特征差异矩阵X∈Rn×p(n为图像对数目,p为所有训练特征的维数),xi∈X可 以看作一对图像的特征差,具体如如图2(b)所示。 
步骤3、建立L2,1范数正则化框架:建立对于特征差异矩阵X∈Rn×p,X中的第i行定义为xi∈R1×p。相似性度量向量定义为Y∈Rn×1,向量Y中的元素分别为对图像对赋予值。权重向量定义为w∈RP×1。因此Y可以用特征的一个稀疏线性组合加上残差项θ∈RP×1来表示: 
Y=Xw+θ               (1) 
这是一个典型的回归问题,通常用最小二乘估计来求取最优权重向量
Figure BDA0000459651360000053
,故上式可以转化为: 
w ~ = arg min | | Xw - Y | | 2 - - - ( 2 )
由稀疏表示原理可知,如果在特征差异矩阵X中p大于n则模型将不再稳定,加上正则化项后,可以解决这个问题,在(2)式中加入正则化项后,可以得到下式: 
w ~ = arg min [ 1 2 | | Xw - Y | | 2 + λ | | w | | q ] - - - ( 3 )
(3)式中权重参数λ是用来平衡损失函数项与正则项之间的大小。若λ比较大求解侧重正则项,λ比较小则侧重损失函数。当q(q为正则化指数)取2时,这个问题就L2范数正则化问题,L2范数正则化可以使模型稳定,但其缺点是无法诱导权重w稀疏。当q为1时,这个问题就是L1正则化问题也就是经典的LASSO回归也叫稀疏表示问题,由稀疏表示的原理可知L1范数在一定的条件下时等价于L0范数,故其具有诱导权重w稀疏的作用,但是当仅仅使用L1正化则是 常常会导致过稀疏的产生。 
由于不同特征之间都是相互独立的,所以特征矩阵差异矩阵X具有群聚的特性,利用这种性质,将其转化为L2,1范数正则化问题来进行特征选择,如图2(b)所示,(3)式变换为如下形式 
w ~ = arg min [ 1 2 | | Xw - Y | | 2 + λ Σ i = 1 m | | w G i | | 2 ] - - - ( 4 )
X可以根据m(m为训练特征选取的总种类数量)个不同的特征分为m个不重叠的群G1,G2,......,Gm。故对应于权重w必然也有m个不重叠的群,
Figure BDA0000459651360000062
是L1范数与L2范数的组合形式即为L2,1范数,L2范数用于描述群内元素间关系而L1范数用于群间元素间的关系,其具体的作用为诱导群稀疏使其群间稀疏而群内不稀疏。 
步骤4、优化算法:这一小结主要阐述如何运用优化算法求解式(4)。如果此问题L2范数正则化,那么这就是一个脊回归问题,很容易解决并有一个闭合解。如果此问题L1范数正则化,那么由稀疏表示原理这也很容易解决,比如基追踪(BP),正交匹配追踪(OMP)等等都可以有效解决L1范数正则化凸优化问题。但是式(4)是一个L2,1范数正则化问题也叫群稀疏表示问题,需要一个比较复杂的算法来解决这个问题,谱梯度算法(SPG)是一个解决这中大数据规模群稀疏问题的有效算法。而且拥有群结构的数据使用群稀疏表示比标准稀疏表示拥有更好的性能。本文提出一种相对于谱梯度(SPG)算法更为灵活的算法-自适应谱梯度(ANSPG)算法。为了可以利用ANSPG求解此问题,首先要将式(4)转化为一个限制优化问题: 
min w f ( w ) s . t ∀ g | | w g | | 2 ≤ α g - - - ( 5 )
其中
Figure BDA0000459651360000064
αg为一个新定义的变量用来替代一个单独的群内2范数即αg=||wg||2。其中wg表示一个群g内对应的权重w中的区域,如图2(b)所示。 
δ为指数参数且δ>0,此处δ取值为10; 
自适应谱梯度算法(ANSPG)具体如下: 
首先定义一个单调性权重参数: a k = | 1 + | min ( f k , f k - 1 ) | 1 + | max ( f k , f k - 1 ) | | δ k > 0 0 k = 0 - - - ( 6 )
第一步:初始化,给定一个初始值x0∈Rp;k=1,k代表迭代步骤;参数M=5;γ∈(0,1);βk表示第k步的指示参数,此处0<βmin<βk<βmax<∞,β0=1,fk,fk-1为第k与 k-1步的函数值; 
第二步:如果▽f(xk)(P(xk-▽f(xk))-xk)<ε,那么停止,xk即为解;其中,xk为第k步的取值,ε为极小的收敛值,此处ε取值0.001,▽f(xk)表示w取xk时的函数导数值,P(x)表示x在可行域内的投影; 
第三步:否则令t=1,ak=1,并且计算下降方向dk=P(xkk▽f(xk))-xk;其中,t为方向权重参数; 
第四步:检测在新x值下的函数值的大小,并比较 
f(xk+tdk)≤akf(xk)+(1-ak){fk,fk-1,…,fj}+γt<▽f(xk),dk>         (7) 
其中,j=max{0,k-M+1}; 
第五步:若式7是不成立的,那么t要进行重新设定; 
t new = - 1 2 t 2 < &dtri; f ( x k ) , d k > f ( x k + d k ) - f ( x k ) - &gamma;t - 1 2 t 2 < &dtri; f ( x k ) , d k >
若tnew∈(0.1t,0.9t)则t=tnew;如果
Figure BDA0000459651360000074
那么t=0.5t,回到第四步; 
第六步:若式7成立,则令tk=t(tk为第K步的方向权重参数),xk+1=xk+tkdk,解差值sk=xk+1-xk。如果正交积<sk,yk>≤0,那么βk+1=βmax,否则设 
&beta; k + 1 = { &beta; max , max { &beta; min , < s k , s k > < s k , y k > } } , k=k+1,回到第二步。 
步骤5、选择出最优特征:群稀疏表示的性质可知,求出的权重w中必有一些群内数值皆为0,而另一些群内数值皆为非0,而权重w中非0群对应为特征差异矩阵X位置上的特征即选择出的最优特征。 
步骤6、提取图像库所有图像的最优特征:由特征选择部分,可以确定对于特定数据库的最优特征,这里利用上面的成果,对数据库中的所有图像提取最优 特征。 
步骤7、形成图像特征库:将步骤6中提取的最优特征以矩阵的形式保存,形成特征库。 
图像检索步骤包括: 
步骤(1)、提取查询图像最优特征:同上述步骤6相同,对查询图像提取最优特征。 
步骤(2)、相似度比较:将查询图像的特征与特征库中的每一幅图像的特征用某一距离度量进行相似性匹配。 
步骤(3)、求出最大相似度图像序号:根据距离的大小,得出相似度的大小,距离越大,相似度越小。然后将其排序,得到前N(需要输出的图像数量)个相似度最大的图像序号。 
步骤(4)、输出与查询图像对应的检索图像。将序号返回图像数据库,由序号提取出对应图像输出。 
为了便于理解本发明技术方案,下面给出一个具体实施例。 
本实施例将本发明所提供的技术方案应用在Core15K数据库与IAPRTC数据库上,本发明的实验主要分为正则化实验与图像检索实验,分别在每个数据库中提取了10个类别的1000幅图片。 
本实施例中,训练特征选取了3种类别的11个特征,如图6所示。 
这需要注意的是距离度量有很多种,对于不同特征选择优异的距离度量是十分重要的。 
a,b代表两个特征向量,ai与bi分别为向量a,b的第i个分量。定义向量a,b之间的距离为D(a,b),u为向量a,b中分量的个数。 
本实施例中,距离度量选取了以下5种: 
1.L1距离,又叫曼哈顿距离 
D ( a , b ) = &Sigma; i = 1 u | a i - b i |
2.L2距离,即为欧几里得距离 
D ( a , b ) = &Sigma; i = 1 u ( a i - b i ) 2
3.直方图交集 
D ( a , b ) = &Sigma; i = 1 u min ( a i , b i ) min ( &Sigma; i = 1 u a i , &Sigma; i = 1 u b i )
4.卡方距离 
D ( a , b ) = &Sigma; i = 1 u ( a i - b i ) 2 a i + b i
5.KL-D距离 
D ( a , b ) = &Sigma; i = 1 u a i log a i b i
本实施例的分类过程具体如下: 
1、图像对获取: 
由于关键字的比较相对于图像欧氏距离的比较计算的时间复杂度很低,所以本文首先将图像库中第一幅图与其余图像的关键字进行比较,如果有大于三分之二关键字相同的,则生成第一幅图像的一个相似序列,如果有没有关键字相同的,则生成第一幅图像的一个不相似序列。然后将相似列与不相似列中的每一幅图像的显著性区域分别同第一幅图像的显著性区域运用欧氏距离的度量方法进行相似性比较,选n1(n1为选择的相似图像对数目)幅最相似的图像与第一幅图像组成相似对,同时选n2(n2为选择的不相似图像对数目)幅最不相似的图像与第一幅图像组成不相似对,从而可以构建关于第一幅图像的所有相似对和不相似对。依次对图像库中第二幅图像显著性区域到最后一幅图像显著性区域重复运用流程图2(a)中所示图像对的构建方法,最终可以得到图像库中每一幅图像所对应的所有相似与不相似图像对。然后根据构建的相似对和不相似对,将相似对赋予1而不相似对赋予-1,从而得到一个相似性度量向量Y。 
2、特征提取: 
如图1所示将所得图像对首先分为两个图像列L1与L2,然后分别提取特征得到特征矩阵A与B,把A和B相减得到特征差异矩阵X∈Rn×p。xi∈X可以看作一对图像的特征差。 
3、建立群稀疏逻辑回归模型: 
用L2,1范数正则化问题来进行特征选择,形成如下形式 
w ~ = arg min [ 1 2 | | Xw - Y | | 2 + &lambda; &Sigma; i = 1 m | | w G i | | 2 ]
X可以根据m个不同的特征分为m个不重叠的群G1,G2,......,Gm。故对应于权重w必然也有m个不重叠的群,
Figure BDA0000459651360000102
是L1范数与L2范数的组合形式即为L2,1范数,L2范数用于描述群内元素间关系而L1范数用于群间元素间的关系,其具体的作用为诱导群稀疏使其群间稀疏而群内不稀疏。 
4、优化算法: 
用自适应谱梯度算法(ANSPG)求解上式中的权重w。 
5、特征选取: 
由群稀疏表示的性质可知,求出的权重w中必有一些群内数值皆为0,而另一些群内数值皆为非0,而权重w中非0群对应为特征差异矩阵X位置上的特征即选择出的最优特征。 
6、库图像特征提取: 
将库中每一幅图像一一提取最优特征,并将各特征进行归一化处理,形成特征库。 
7、距离度量选择: 
本发明通过分别对上述两个数据库中的1000张图片进行测试,选择这些图片中每一个类别的第一幅图像作为测试图像进行检索。然后在每次检索的结果中,根据相关性大小选出前50幅图像,每个数据库总共进行10次检索,再计算总的查准率,得到不同特征在不同距离度量下的查准率。如图7所示,对于LAB颜色特征使用KL-divergence距离度量检索效果最好,对于HOG纹理特征用L1距离与卡方距离都比较好,对于其他的特征卡方距离普遍可以取得最好的检索效果。 
8、查询图像特征提取: 
对查询图像提取最优特征,并将各特征进行归一化处理。 
9、相似性比较 
用7步所得的最优距离度量进行相似性比较,记录距离最近的10幅图像的序号。 
10、输出检索图像 
计算出将序号返回图像库,输出最为相似的10幅图像。 
图3(a),图3(b)与图3(c)是Core15K图像库上分别用SPG(谱梯度算法)与ANSPG(自适应谱梯度算法)分别对颜色特征,纹理与方向特征进行选择。图8是分别用两算法分别对颜色特征,纹理与方向特征进行选择求得权重所耗费时间。 
从图上可以看出相比于传统的SPG(谱梯度算法),ANSPG(自适应谱梯度算法)相有更快的下降速度,且从两曲线的长度对比可知ANSPG(自适应谱梯度算法)有比较快的收敛速度。从表3中的数据从定量上证明了这一点,ANSPG(自适应谱梯度算法)明显减少了计算时间。 
分别在Core15K数据库与IAPRTC12数据库上的实验,使用选择出的特征组合进行检索与使用全部特征进行检索作比较。分别求出选取输出10张,20张,30张,40张,50张图片时的查准率,如图4与图5所示。在Core15K数据库的“汽车”类别与IAPRTC12数据库的“床”类别中分别随机选取一张图片进行检索实验,输出前10张图片,本实验的检索中使用的颜色,纹理,方向特征权重的比例是1:1:1。全部特征检索中也是按照此比例赋予权重,五个颜色特征,四个纹理特征与两个方向特征权重比例为1:1:1。 
可以得出以下结论: 
1.表明由于不同特征之间高度的相关性与特征效用的区别,特征不是取的越多越好,选取特征数量过多反而会诱导出噪声,从而影响检索的性能。 
2.证明了本文提出的正则化特征选择算法的有效性。 
综上可知,先依据不同图像库进行特征选择,而后用最优特征来进行特征检索可以提高检索的准确率与效率,本发明具有明显的优势。 

Claims (3)

1.一种基于群稀疏特征选择的图像检索方法,其特征在于,包括特征选择和图像检索两部分:
一、特征选择具体包括:
步骤11、针对图像库中的每一幅图像,比较其图像关键字形成相似与不相似序列,接着比较相似与不相似序列的图像显著区域的欧式距离,获取图像库中每一幅图像的相似对与不相似对,得到该图像的相似性度量向量;
步骤12、对获得的每一幅图像的相似对与不相似对分别提取训练特征,图像库中所有图像的训练特征形成两个特征矩阵,将前述两个特征矩阵相减形成特征差异矩阵;
步骤13、设定权重系数,并依据特征差异矩阵与相似性度量向量,建立群稀疏逻辑模型;
步骤14、利用优化算法求解群稀疏逻辑模型,求解出权重系数;
步骤15、根据权重系数中非0群对应于特征差异矩阵所占位置,得出最优特征;
步骤16、对于图像库中的所有图像提取步骤15得出的最优特征,将提取的特征以矩阵的形式保存,形成图像特征库;
二、图像检索具体包括:
步骤21、对查询图像,按照步骤11至步骤15的方式提取出最优特征;
步骤22、利用相似度度量,将查询图像的最优特征与图像特征库中的每一幅图像的特征进行相似性匹配;
步骤23、将匹配得出的图像按照相似度的程度从大到小进行排序,得出经过排序的图像序号;
步骤24、根据步骤23得出的图像序号,从图像特征库中提取出对应图像,并作为查询图像对应的检索图像输出。
2.如权利要求1一种基于群稀疏特征选择的图像检索方法,其特征在于:所述步骤14中,优化算法为自适应谱梯度算法。
3.如权利要求1一种基于群稀疏特征选择的图像检索方法,其特征在于:所述步骤22中,相似度度量的计算方法选择L1距离,L2距离,直方图交集,卡方距离或KL-D距离中的一种。
CN201410027227.5A 2014-01-21 2014-01-21 基于群稀疏特征选择的图像检索方法 Expired - Fee Related CN103810252B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410027227.5A CN103810252B (zh) 2014-01-21 2014-01-21 基于群稀疏特征选择的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410027227.5A CN103810252B (zh) 2014-01-21 2014-01-21 基于群稀疏特征选择的图像检索方法

Publications (2)

Publication Number Publication Date
CN103810252A true CN103810252A (zh) 2014-05-21
CN103810252B CN103810252B (zh) 2017-02-08

Family

ID=50707022

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410027227.5A Expired - Fee Related CN103810252B (zh) 2014-01-21 2014-01-21 基于群稀疏特征选择的图像检索方法

Country Status (1)

Country Link
CN (1) CN103810252B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036012A (zh) * 2014-06-24 2014-09-10 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统
CN105718883A (zh) * 2016-01-19 2016-06-29 中国人民解放军国防科学技术大学 一种基于稀疏因子分析的图像视觉属性挖掘方法
CN106557533A (zh) * 2015-09-24 2017-04-05 杭州海康威视数字技术股份有限公司 一种单目标多图像联合检索的方法和装置
CN107330276A (zh) * 2017-07-03 2017-11-07 雷柏英 神经影像图检索方法及装置
CN108182188A (zh) * 2016-12-08 2018-06-19 广东精点数据科技股份有限公司 一种基于稀疏表示的图像检索方法和装置
CN108564677A (zh) * 2018-03-26 2018-09-21 唐天才 一种用于新能源电动汽车的数据智能管理方法
CN108764367A (zh) * 2018-06-07 2018-11-06 深圳大学 一种基于关系正则化的特征图像提取装置及提取方法
CN105260371B (zh) * 2014-07-17 2018-12-07 华为技术有限公司 一种特征选择方法及装置
CN108985190A (zh) * 2018-06-28 2018-12-11 北京市商汤科技开发有限公司 目标识别方法和装置、电子设备、存储介质、程序产品
CN111429481A (zh) * 2020-03-18 2020-07-17 重庆邮电大学 一种基于自适应表达的目标追踪方法、装置及终端
CN113762005A (zh) * 2020-11-09 2021-12-07 北京沃东天骏信息技术有限公司 特征选择模型的训练、对象分类方法、装置、设备及介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894130B (zh) * 2010-06-08 2011-12-21 浙江大学 基于稀疏降维的谱哈希索引方法
CN103226616A (zh) * 2013-05-16 2013-07-31 南京龙渊微电子科技有限公司 一种图像内容检索系统及其图像内容稀疏学习方法

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104036012B (zh) * 2014-06-24 2017-06-30 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统
CN104036012A (zh) * 2014-06-24 2014-09-10 中国科学院计算技术研究所 字典学习、视觉词袋特征提取方法及检索系统
CN105260371B (zh) * 2014-07-17 2018-12-07 华为技术有限公司 一种特征选择方法及装置
CN106557533B (zh) * 2015-09-24 2020-03-06 杭州海康威视数字技术股份有限公司 一种单目标多图像联合检索的方法和装置
CN106557533A (zh) * 2015-09-24 2017-04-05 杭州海康威视数字技术股份有限公司 一种单目标多图像联合检索的方法和装置
CN105718883A (zh) * 2016-01-19 2016-06-29 中国人民解放军国防科学技术大学 一种基于稀疏因子分析的图像视觉属性挖掘方法
CN105718883B (zh) * 2016-01-19 2019-01-15 中国人民解放军国防科技大学 一种基于稀疏因子分析的图像视觉属性挖掘方法
CN108182188A (zh) * 2016-12-08 2018-06-19 广东精点数据科技股份有限公司 一种基于稀疏表示的图像检索方法和装置
CN107330276B (zh) * 2017-07-03 2020-01-10 深圳大学 神经影像图检索方法及装置
CN107330276A (zh) * 2017-07-03 2017-11-07 雷柏英 神经影像图检索方法及装置
CN108564677A (zh) * 2018-03-26 2018-09-21 唐天才 一种用于新能源电动汽车的数据智能管理方法
CN108764367A (zh) * 2018-06-07 2018-11-06 深圳大学 一种基于关系正则化的特征图像提取装置及提取方法
CN108764367B (zh) * 2018-06-07 2023-05-12 深圳大学 一种基于关系正则化的特征图像提取装置及提取方法
CN108985190A (zh) * 2018-06-28 2018-12-11 北京市商汤科技开发有限公司 目标识别方法和装置、电子设备、存储介质、程序产品
CN108985190B (zh) * 2018-06-28 2021-08-27 北京市商汤科技开发有限公司 目标识别方法和装置、电子设备、存储介质
CN111429481A (zh) * 2020-03-18 2020-07-17 重庆邮电大学 一种基于自适应表达的目标追踪方法、装置及终端
CN113762005A (zh) * 2020-11-09 2021-12-07 北京沃东天骏信息技术有限公司 特征选择模型的训练、对象分类方法、装置、设备及介质

Also Published As

Publication number Publication date
CN103810252B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN103810252A (zh) 一种基于群稀疏特征选择的图像检索方法
CN110059198B (zh) 一种基于相似性保持的跨模态数据的离散哈希检索方法
Zheng et al. SIFT meets CNN: A decade survey of instance retrieval
Jain et al. Online metric learning and fast similarity search
Gordoa et al. Leveraging category-level labels for instance-level image retrieval
CN110674407A (zh) 基于图卷积神经网络的混合推荐方法
CN106886601A (zh) 一种基于子空间混合超图学习的交叉模态检索算法
CN104834693A (zh) 基于深度搜索的视觉图像检索方法及系统
Xie et al. Fast and accurate near-duplicate image search with affinity propagation on the ImageWeb
CN103186538A (zh) 一种图像分类方法和装置、图像检索方法和装置
CN104281572B (zh) 一种基于互信息的目标匹配方法及其系统
CN102663447B (zh) 基于判别相关分析的跨媒体检索方法
CN108388639B (zh) 一种基于子空间学习与半监督正则化的跨媒体检索方法
CN105740378B (zh) 一种数字病理全切片图像检索方法
CN103390063A (zh) 一种基于蚁群算法和概率超图的相关反馈图像检索方法
CN106844733A (zh) 基于词汇树信息融合与豪斯多夫距离结合的图像检索方法
Costache et al. Categorization based relevance feedback search engine for earth observation images repositories
Wang et al. A saliency detection based unsupervised commodity object retrieval scheme
CN104111947B (zh) 一种遥感图像的检索方法
CN107423294A (zh) 一种社群图像检索方法及系统
Sarwinda et al. Automatic multi-class classification of indonesian traditional food using convolutional neural networks
Dimitrovski et al. Fast and scalable image retrieval using predictive clustering trees
Kumar et al. Automatic feature weight determination using indexing and pseudo-relevance feedback for multi-feature content-based image retrieval
Lin et al. Object detection in RGB-D images via anchor box with multi-reduced region proposal network and multi-pooling
Haldurai et al. Parallel indexing on color and texture feature extraction using r-tree for content based image retrieval

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170208

Termination date: 20210121