CN103810299B - 基于多特征融合的图像检索方法 - Google Patents

基于多特征融合的图像检索方法 Download PDF

Info

Publication number
CN103810299B
CN103810299B CN201410085211.XA CN201410085211A CN103810299B CN 103810299 B CN103810299 B CN 103810299B CN 201410085211 A CN201410085211 A CN 201410085211A CN 103810299 B CN103810299 B CN 103810299B
Authority
CN
China
Prior art keywords
image
matrix
feature
represent
retrieved
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201410085211.XA
Other languages
English (en)
Other versions
CN103810299A (zh
Inventor
邓成
王嘉龙
杨延华
李洁
彭海燕
高新波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN201410085211.XA priority Critical patent/CN103810299B/zh
Publication of CN103810299A publication Critical patent/CN103810299A/zh
Application granted granted Critical
Publication of CN103810299B publication Critical patent/CN103810299B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5838Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于图像多特征融合的图像检索方法,主要用于解决现有技术检索图像准确率低的问题。其实现步骤为:(1)提取待检索图像集合中所有图像的三种视觉特征和语义属性特征;(2)计算待检索图像集合中所有图像间邻接距离矩阵;(3)对查询图像在每一种特征通道进行粗检索;(4)根据每一种特征通道的粗检索结果,分析粗检索结果中图像的语义属性特征,选定参考图像;(5)根据选定的参考图像,计算每一种特征融合模板矩阵;(6)根据得到的融合模板矩阵,得到融合后的距离测度矩阵;(7)根据得到的距离测度矩阵,返回给用户检索的结果。本发明明显提高了最终图像检索的准确率,可用于图像检索。

Description

基于多特征融合的图像检索方法
技术领域
本发明属于信息检索技术领域,具体的说是一种针对基于图像多特征融合的图像检索方法,可用于互联网图像检索领域。
背景技术
当前互联网背景下,诸如Google、Image Search、必应等大多数的商业网络图像搜索引擎都是采用基于文本的检索技术,主要是利用诸如标题、图像周围描述文本等标注文字,与查询文本做相似性匹配,利用这种相似性对检索的图像进行检索。然而,由于文本和图像内容之间存在语义鸿沟,单单基于文本检索的技术常常达不到好的效果。另外,由于图像标注存在多义噪音数据,由图像元数据分析得出的图像标签的正确性往往也无法保证。
为了提高现存基于文本技术的图像搜索引擎的准确率,近些年来,改善图像检索结果准确率的图像检索技术得到了越来越多的关注。现存的很多图像检索技术大多利用单一类型的图像视觉特征,比如全局特征或是局部特征,通过某些标注样本来度量图像的视觉相似性。这些标注样本可以通过有监督的方法或无监督的方法获得,比如说通过伪相关反馈或者由用户指定来获得。这些标注样本在某些情况下常常被称为查询图像。然而图像间的相似性往往是多角度的,比如说图像间相似的颜色、纹理,彼此出现了相似的物体,反映了相近的视觉语义概念等等。不同的图像视觉特征反映了图像间不同角度的相似性,很多情况下,不同的视觉特征彼此间可以起到互相弥补的作用。这样,通过融合不同的图像视觉特征,就可以根据查询图像特点,综合的描述数据库中待检索的每副图像,从而从图像不同的角度提高在线彼此相似性的测量。
现今检索的大多数方法主要是利用多特征学习,采用前期融合或者后期融合的策略。所谓前期融合是指直接利用多种图像视觉特征获得总的图像间相似性测度,而后期融合是指对多种特征所得的检索结果进行融合。尽管现今基于多特征融合的图像检索方法可以在一定程度上改善图像检索排序结果的准确率,但是本质的问题依然存在。不同的检索情况对应不同的视觉特征重要性,直接以固定系数做多特征融合往往难以取得令人满意的图像检索结果。
发明内容
为了解决上述问题,本发明提供了一种基于多特征融合的图像检索方法,以提高图像的检测准确性。
本发明首先从图像的语义属性特征出发,分析每一种特征通道检索结果中共现的语义属性模式,进而根据分析出的共现语义属性模式,选择若干参考图像,进而根据选择的参考图像动态地学习计算出每一种特征通道的模板权重矩阵,从而通过特征融合更好地编码每一幅待检索图像和需要检索的图像之间的相似性距离,达到提高图像检索精度的目的。其实现步骤包括如下:
1.一种基于多特征融合的图像检索方法,包括如下步骤:
(1)提取图像特征:
(1a)对待检索图像集合中的所有图像提取8192维视觉词袋词频BoW特征;
(1b)对待检索图像集合中的所有图像提取960维GIST特征;
(1c)对待检索图像集合中的所有图像提取512维HSV颜色直方图特征;
(1d)通过离线训练学习,针对2659种基本语义标签,分别训练2659种语义标签的分类器,对待检索图像集合中的每幅图像,分别用这2659种分类器做预测,并将对应每一种分类器得到的预测分数连成向量,作为该图像的语义属性特征。
(2)根据步骤(1a)、(1b)、(1c)得到的三种图像特征,用欧式距离公式分别计算待检索图像集合中所有图像两两之间的相似性距离,分别得到步骤(1a)对应图像特征通道的邻接距离矩阵H1'、步骤(1b)对应图像特征通道的邻接距离矩阵H'2、步骤(1c)对应图像特征通道的邻接距离矩阵H'3,每个矩阵中的每个元素值代表对应图像两两之间用对应特征计算得到的相似性距离;
(3)对图像进行粗检索,并选择参考图像:
(3a)根据步骤(1a)、(1b)、(1c)得到的图像特征,用欧式距离公式分别计算用户指定的查询图像和待检索图像集合中每幅图像之间在每一种特征通道上的相似性距离,构成对应三种特征通道的三组检索相似性距离向量;
(3b)利用上述三种特征通道的三组检索相似性距离向量分别对步骤(2a)得到的图像邻接距离矩阵H1'、H'2、H'3进行扩展,即将对应特征通道的检索相似性距离向量添加到对应矩阵的第一行和第一列,得到分别对应所述三种特征通道的扩展后图像邻接矩阵H1、H2、H3
(3b)按照待检索图像集合中每幅待检索图像和用户给出的查询图像,将每一种特征通道的相似性距离从小到大分别排序,得到分别对应所述三种特征通道的粗检索排序列表l1、l2、l3
(3c)根据步骤(3b)得到的粗检索排序列表l1、l2、l3,选取每一个列表的前k副图像构成目标集合,对于目标集合中的每幅图像按步骤(1d)所述的语义属性特征,将小于0的维度置0,大于0的维度置1,得到目标集合中每幅图像量化后的特征向量,并将所有量化后的特征向量做平均,得到对应的语义属性共现模式向量S;
(3d)利用欧氏距离公式,计算数据库中每幅待检索图像语义属性特征与上所述语义属性共现模式向量S的相似性距离,选取相似性距离最小的10幅图像作为参考图像;
(4)计算特征融合模板权重矩阵:
(4a)定义每一特征通道的检索结构关系函数:
其中,A表示参考图像的个数,表示第i幅参考图像的第m种特征表示,表示第j幅参考图像的第m种特征表示,表示用户指定的查询图像的第m种特征表示,表示第m种特征通道对应的融合模板矩阵wm第i行第j列元素的值,||||2代表矩阵的2-范数;
(4b)定义每一特征通道之间的检索结构关系函数:
其中,N表示数据库中待检索图像的个数,表示第i幅参考图像的第m种特征表示,表示第i幅参考图像的第m'种特征表示,表示第k幅参考图像的第m种特征表示,表示第k幅参考图像的第m'种特征表示,表示第m种特征通道对应的融合模板矩阵wm第i行第k列元素的值,表示第m'种特征通道对应的融合模板矩阵wm'第i行第k列元素的值,||||2代表矩阵的2-范数;
(4c)优化如下目标函数,得到每一图像特征的融合模板矩阵{wm},m=1...3:
其中,λ和γ分别是给定的常数,||||1代表矩阵的1-范数;
(5)图像精检索:
(5a)根据步骤(3a)得到的图像邻接距离矩阵H1、H2、H3及步骤(4c)得到的每一种图像特征的融合模板矩阵{wm},计算融合后的图像邻接矩阵H:
其中,wm表示第m种特征通道对应的融合模板矩阵,代表矩阵的模板点乘运算;
(5b)根据融合后的图像邻接矩阵H,按照其第一行的值从小到大排列,将得到排列结果的前k幅图像作为检索结果返回给用户。
本发明具有以下优点:
1)本发明结合图像的语义内容信息,根据每一种视觉特征通道的检索结果计算语义属性共现模式向量,从而自适应地得到参考图像,有效提高了参考图像选择的准确度。
2)本发明通过构建每一特征通道的检索结构关系函数和每一特征通道之间的检索结构关系函数,自适应地计算出每一种图像特征对应的融合模板权重矩阵,更准确地编码了图像之间的相似度距离,从而有效提高了最终检索的准确度。
附图说明
图1是本发明的实现流程图。
具体实施方案
以下结合附图对本发明的技术内容及效果做进一步详述:
参照图1,本发明提取图像特征、图像粗检索及参考图像选择、特征融合模板矩阵计算和图像精检索四部分,具体步骤如下:
一、提取图像特征
步骤1:对待检索图像集合中的每幅图像,分别提取其8192维的BoW视觉词袋词频特征、960维的GIST频域场景描述特征和512维的HSV颜色直方图特征。
步骤2:计算待检索图像的语义属性特征
2.1)人为定义2659种基本语义标签,例如街道、人物等,通过离线训练学习,针对每一种基本语义标签,分别训练对应2659种语义标签的分类器;
2.2)对待检索图像集合中的每幅图像,分别用上一步得到的2659种分类器做预测,并将对应每一种分类器得到的预测分数连成向量,作为该图像的语义属性特征。
二.图像粗检索及参考图像选择
步骤3:计算图像间邻接距离矩阵。
3.1)根据步骤1得到的三种图像特征,用欧式距离公式分别计算待检索图像集合中所有图像两两之间的相似性距离,分别得到对应图像BoW视觉词袋词频特征通道的邻接距离矩阵H1'、GIST频域场景描述特征通道的邻接距离矩阵H'2和HSV颜色直方图特征通道的邻接距离矩阵H'3,每个矩阵中的每个元素值代表对应图像两两之间用对应特征计算得到的相似性距离。
步骤4:图像粗检索
4.1)根据步骤1得到的三种图像特征,用欧式距离公式分别计算用户指定的查询图像和待检索图像集合中每幅图像之间在每一种特征通道上的相似性距离,构成对应三种特征通道的三组检索相似性距离向量;
4.2)利用上述三种特征通道的三组检索相似性距离向量分别对步骤4.1)得到的图像邻接距离矩阵H1'、H'2、H'3进行扩展,即将对应特征通道的检索相似性距离向量添加到对应矩阵的第一行和第一列,得到分别对应所述三种特征通道的扩展后的图像邻接矩阵H1、H2、H3
4.3)按照待检索图像集合中每幅待检索图像和用户给出的查询图像,将每一种特征通道的相似性距离从小到大分别排序,得到分别对应所述三种特征通道的粗检索排序列表l1、l2、l3
步骤5:选择参考图像。
5.1)根据步骤4.3)得到的粗检索排序列表l1、l2、l3,选取每一个列表的前k副图像构成目标集合,对于目标集合中的每幅图像按步骤2所述的语义属性特征,将小于0的维度置0,大于0的维度置1,得到目标集合中每幅图像量化后的特征向量,并将所有量化后的特征向量做平均,得到对应的语义属性共现模式向量S;
5.2)利用欧氏距离公式,计算待检索图像集合中每幅待检索图像语义属性特征与上述语义属性共现模式向量S的相似性距离,选取相似性距离最小的10幅图像作为参考图像。
三、计算特征融合模板矩阵
步骤6:定义每一特征通道的检索结构关系函数:
其中,A表示参考图像的个数,表示第i幅参考图像的第m种特征表示,表示第j幅参考图像的第m种特征表示,表示用户指定的查询图像的第m种特征表示,表示第m种特征通道对应的融合模板矩阵wm第i行第j列元素的值,||||2代表矩阵的2-范数。
步骤7:定义每一特征通道之间的检索结构关系函数:
其中,A表示参考图像的个数,N表示数据库中待检索图像的个数,表示第i幅参考图像的第m种特征表示,表示第i幅参考图像的第m'种特征表示,表示第k幅参考图像的第m种特征表示,表示第k幅参考图像的第m'种特征表示,表示第m种特征通道对应的融合模板矩阵wm第i行第k列元素的值,表示第m‘种特征通道对应的融合模板矩阵wm'第i行第k列元素的值,||||2代表矩阵的2-范数。
步骤8:结合步骤6和步骤7定义的两种检索结构关系函数,定义目标函数
其中,λ和γ分别是给定的常数,本发明中参数选择λ=0.1,γ=0.005,M代表选取图像特征种类的个数,本发明中M=3,||||1代表矩阵的1-范数。
步骤9:优化步骤8定义的目标函数,得到每一图像特征的融合模板矩阵{wm},m=1...3。
9.1)定义平滑函数H(wm)=Q(wm)+λR(wm),其梯度函数表示为
9.2)定义三种特征通道的融合模板权重矩阵分别为w1、w2、w3,按列将每一特征通道对应的待求融合模板矩阵连接起来,表示为:w=[w1|w2|w3],其中,|表示矩阵列之间的分隔符;
9.3)定义迭代次数变量为t,将w第t次迭代的结果表示为wt,设初始t=0;定义两个中间变量,即第一中间变量θ和第二中间变量矩阵v,其第t次迭代的结果分别表示为θt和vt;分别抽取第二中间变量矩阵vt的第m+t×N到m+(t+1)×N-1列,构成对应子矩阵,m=1...3,N代表数据库中所有待检索图像的数目;令初始θ0=1,v0=w0=IN×N,I表示N×N的单位矩阵;
9.4)计算步骤9.1)所述的梯度函数在第t次迭代变量vt对应子矩阵上的值
9.5)按列将上一步骤得到的矩阵连接起来,得到全局梯度函数矩阵:
其中,|表示矩阵列之间的分隔符;
9.6)根据上一步骤得到的全局梯度函数矩阵,计算第三中间变量L:
其中,λmax代表矩阵最大的特征值;
9.7)利用经典梯度最速下降法求解以下目标函数,得到融合模板矩阵w第t+1次迭代的结果wt+1:
其中,||||2代表矩阵的2-范数,||||1代表矩阵的1-范数,γ是给定的常数;
9.8)计算wt与wt+1的差值,若wt与wt+1的差值小于0.001,则停止迭代,得到最优的特征融合模板矩阵w,抽取w的第m+t×N到m+(t+1)×N-1列,构成子矩阵,得到每一种特征通道对应的融合矩阵{wm},m=1,2,3,否则,执行步骤9.9);
9.9)利用上一步得到的融合模板矩阵w在第t+1次迭代的结果wt+1,计算第一中间变量θ和第二中间变量矩阵v在第t+1次迭代的值:
9.10)令迭代次数变量t=t+1,返回步骤9.4)继续迭代。
四、图像精检索:
步骤10:根据前面步骤得到的图像邻接矩阵H1、H2、H3及每一特征通道的融合模板矩阵wm,计算融合后的图像邻接矩阵H:
其中,代表矩阵的模板点乘运算。
步骤11:根据融合后的图像邻接矩阵H,按照其第一行的值从小到大排列,将得到排列结果的前k幅图像作为检索结果返回给用户。
本发明的优点可通过以下仿真实验进一步说明。
本发明在Intral Holiday、Oxford5k、Paris三个公用图像检索数据库上进行实验,并依据客观评估平均查全率MAP作为检索结果准确率的指标:
其中,APk代表检索排序结果中前k位置处的准确率,precision(i)是得到排序列表中前i副图像中正确图像所占的比例。recall(i)是到检索结果的前i副图像中正确图像占检索结果中所有正确图像个数的比例。
MAP代表所有检索结果APk的平均值,MAP值越高,说明图像检索排序结果中正确图像的个数越多,同时排名越靠前,检索排序的结果越好。
实验分别采用本发明方法和现有的视觉随机游走和伪相关性反馈两种图像检索方法分别在三个数据库上做50次检索,总共用到的检索查询图像有150张,对每一组的检索结果,计算其检索结果中前200副图像的平均查全率MAP,得到在所述三个数据库上检索结果的MAP结果。
表1不同数据库检索平均查准率比较
数据集 Holiday Oxford5k Paris
本方法 0.847 0.843 0.687
视觉随机游走 0.825 0.814 0.654
伪相关性反馈 0.758 0.508 0.639
从表1可以看出,本发明方法对图像检索排序的结果优于现有方法,其原因如下:
1)本发明结合图像的语义内容信息,根据每一种视觉特征通道的检索结果计算语义属性共现模式向量,从而自适应地得到参考图像,有效提高了参考图像选择的准确度。
2)本发明通过构建每一特征通道的检索结构关系函数和每一特征通道之间的检索结构关系函数,自适应地计算出每一种图像特征对应的融合模板权重矩阵,更准确地编码了图像之间的相似度距离,从而有效提高了最终检索的准确度。
综上,本发明提高了最终图像检索结果的准确率。

Claims (2)

1.一种基于多特征融合的图像检索方法,包括如下步骤:
(1)提取图像特征:
(1a)对待检索图像集合中的所有图像提取8192维视觉词袋词频BoW特征;
(1b)对待检索图像集合中的所有图像提取960维GIST特征;
(1c)对待检索图像集合中的所有图像提取512维HSV颜色直方图特征;
(1d)通过离线训练学习,针对2659种基本语义标签,分别训练2659种语义标签的分类器,对待检索图像集合中的每幅图像,分别用这2659种分类器做预测,并将对应每一种分类器得到的预测分数连成向量,作为该图像的语义属性特征;
(2)根据步骤(1a)、(1b)、(1c)得到的三种图像特征,用欧式距离公式分别计算待检索图像集合中所有图像两两之间的相似性距离,分别得到步骤(1a)对应图像特征通道的邻接距离矩阵H1'、步骤(1b)对应图像特征通道的邻接距离矩阵H'2、步骤(1c)对应图像特征通道的邻接距离矩阵H'3,每个矩阵中的每个元素值代表对应图像两两之间用对应特征计算得到的相似性距离;
(3)对图像进行粗检索,并选择参考图像:
(3a)根据步骤(1a)、(1b)、(1c)得到的图像特征,用欧式距离公式分别计算用户指定的查询图像和待检索图像集合中每幅图像之间在每一种特征通道上的相似性距离,构成对应三种特征通道的三组检索相似性距离向量;
(3b)利用上述三种特征通道的三组检索相似性距离向量分别对步骤(2a)得到的图像邻接距离矩阵H1'、H'2、H'3进行扩展,即将对应特征通道的检索相似性距离向量添加到对应矩阵的第一行和第一列,得到分别对应所述三种特征通道的扩展后图像邻接距离矩阵H1、H2、H3
(3d)按照待检索图像集合中每幅待检索图像和用户给出的查询图像,将每一种特征通道的相似性距离从小到大分别排序,得到分别对应所述三种特征通道的粗检索排序列表l1、l2、l3
(3c)根据步骤(3b)得到的粗检索排序列表l1、l2、l3,选取每一个列表的前k副图像构成目标集合,对于目标集合中的每幅图像按步骤(1d)所述的语义属性特征,将小于0的维度置0,大于0的维度置1,得到目标集合中每幅图像量化后的特征向量,并将所有量化后的特征向量做平均,得到对应的语义属性共现模式向量S;
(3d)利用欧氏距离公式,计算数据库中每幅待检索图像语义属性特征与上所述语义属性共现模式向量S的相似性距离,选取相似性距离最小的10幅图像作为参考图像;
(4)计算特征融合模板权重矩阵:
(4a)定义每一特征通道的检索结构关系函数:
Q ( w m ) = Σ i = 1 A 1 2 ( | | x ~ i m - Σ j ≠ i A w i j m x ~ j m | | 2 2 + | | x q m - w 1 i m x ~ i m | | 2 2 ) ,
其中,A表示参考图像的个数,表示第i幅参考图像的第m种特征表示,表示第j幅参考图像的第m种特征表示,表示用户指定的查询图像的第m种特征表示,表示第m种特征通道对应的融合模板矩阵wm第i行第j列元素的值,|| ||2代表矩阵的2-范数;
(4b)定义每一特征通道之间的检索结构关系函数:
R ( w m ) = Σ m ′ = 1 3 Σ i = 1 A Σ k = 1 N - A 1 2 ( | | x ~ i m - w i k m x k m | | 2 2 - | | x ~ i m ′ - w i k m ′ x k m ′ | | 2 2 ) ,
其中,N表示数据库中待检索图像的个数,表示第i幅参考图像的第m种特征表示,表示第i幅参考图像的第m'种特征表示,表示第k幅参考图像的第m种特征表示,表示第k幅参考图像的第m'种特征表示,表示第m种特征通道对应的融合模板矩阵wm第i行第k列元素的值,表示第m'种特征通道对应的融合模板矩阵wm'第i行第k列元素的值,|| ||2代表矩阵的2-范数;
(4c)优化如下目标函数,得到每一图像特征的融合模板矩阵{wm},m=1...3:
J = min w Σ m = 1 M Q ( w m ) + λ Σ m ′ ≠ m M R ( w m ) + γ Σ m = 1 M | | w m | | 1 s . t . Σ j w i j = 1 , w i j ≥ 0 ,
其中,λ和γ分别是给定的常数,|| ||1代表矩阵的1-范数;
(5)图像精检索:
(5a)根据步骤(3b)得到的扩展后图像邻接距离矩阵H1、H2、H3及步骤(4c)得到的每一种图像特征的融合模板矩阵{wm},计算融合后的图像邻接矩阵H:
H = Σ m w m ⊗ H m , m = 1...3 ,
其中,wm表示第m种特征通道对应的融合模板矩阵,代表矩阵的模板点乘运算;
(5b)根据融合后的图像邻接矩阵H,按照其第一行的值从小到大排列,将得到排列结果的前k幅图像作为检索结果返回给用户。
2.根据权利要求1所述的基于多特征融合的图像检索方法,其中所述步骤(4c)中优化目标函数,按如下步骤进行:
(4c1)定义平滑函数H(wm)=Q(wm)+λR(wm),其梯度函数表示为▽H(wm);
(4c2)定义三种特征通道的融合模板权重矩阵分别为w1、w2、w3,按列将每一特征通道对应的待求融合模板矩阵连接起来,表示为:w=[w1|w2|w3],其中,|表示矩阵列之间的分隔符;
(4c3)定义迭代次数变量为t,w第t次迭代的结果表示为wt,设初始t=0,定义两个中间变量,即第一中间变量θ和第二中间变量矩阵v,其第t次迭代的结果分别表示为θt和vt;分别抽取第二中间变量矩阵vt的第m+t×N到m+(t+1)×N-1列,构成对应子矩阵m=1...3,N代表数据库中所有待检索图像的数目;令初始θ0=1,v0=w0=IN×N,I表示N×N的单位矩阵;
(4c4)计算步骤(4c1)所述的梯度函数在第t次迭代变量vt对应子矩阵上的值
(4c5)按列将上一步骤得到的矩阵连接起来,得到全局梯度函数矩阵:
▿ H ( v t ) = [ ▿ H ( v t 1 ) | ▿ H ( v t 2 ) | ▿ H ( v t 3 ) ] ,
其中,|表示矩阵列之间的分隔符;
(4c6)根据上一步骤得到的全局梯度函数矩阵▽H(vt),计算第三中间变量L:
L=λmax(▽H(vt)),
其中,λmax代表▽H(vt)矩阵最大的特征值;
(4c7)利用经典梯度最速下降法求解以下目标函数,得到融合模板矩阵w第t+1次迭代的结果wt+1:
w t + 1 = arg min w 1 2 | | w - ( v t - 1 L ▿ H ( v t ) | | 2 + γ L | | w | | 1 ,
其中,|| ||2代表矩阵的2-范数,|| ||1代表矩阵的1-范数,γ是给定的常数;
(4c8)计算wt与wt+1的差值,若wt与wt+1的差值小于0.001,则停止迭代,得到最优的特征融合模板矩阵w,否则执行步骤(4c9);
(4c9)利用上一步得到的融合模板矩阵w在第t+1次迭代的结果wt+1中,计算第一中间变量θ和第二中间变量矩阵v在第t+1次迭代的值:
θ t + 1 = 2 t + 3 ,
v t + 1 = w t + 1 + 1 - θ t θ t θ ( w t + 1 - w t ) ,
(4c10)令迭代次数变量t=t+1,返回步骤(4c4)继续迭代。
CN201410085211.XA 2014-03-10 2014-03-10 基于多特征融合的图像检索方法 Expired - Fee Related CN103810299B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410085211.XA CN103810299B (zh) 2014-03-10 2014-03-10 基于多特征融合的图像检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410085211.XA CN103810299B (zh) 2014-03-10 2014-03-10 基于多特征融合的图像检索方法

Publications (2)

Publication Number Publication Date
CN103810299A CN103810299A (zh) 2014-05-21
CN103810299B true CN103810299B (zh) 2017-02-15

Family

ID=50707069

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410085211.XA Expired - Fee Related CN103810299B (zh) 2014-03-10 2014-03-10 基于多特征融合的图像检索方法

Country Status (1)

Country Link
CN (1) CN103810299B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104376105B (zh) * 2014-11-26 2017-08-25 北京航空航天大学 一种社会媒体中图像低层视觉特征与文本描述信息的特征融合系统及方法
CN104504368A (zh) * 2014-12-10 2015-04-08 成都品果科技有限公司 一种图像场景识别方法及系统
CN106528552B (zh) * 2015-09-09 2019-10-22 杭州海康威视数字技术股份有限公司 图像搜索方法及系统
US10872114B2 (en) * 2015-12-17 2020-12-22 Hitachi, Ltd. Image processing device, image retrieval interface display device, and method for displaying image retrieval interface
CN105653656B (zh) * 2015-12-28 2019-06-07 成都希盟泰克科技发展有限公司 一种基于改进lsh的多特征文档检索方法
CN105718555A (zh) * 2016-01-19 2016-06-29 中国人民解放军国防科学技术大学 一种基于层次化语义描述的图像检索方法
CN105808757B (zh) * 2016-03-15 2018-12-25 浙江大学 基于多特征融合的bow模型的中草药植物图片检索方法
DE102016212888A1 (de) * 2016-07-14 2018-01-18 Siemens Healthcare Gmbh Bestimmen einer Bildserie abhängig von einer Signaturmenge
TWI581211B (zh) * 2016-11-18 2017-05-01 財團法人工業技術研究院 影像融合裝置及其方法
CN106708943A (zh) * 2016-11-22 2017-05-24 安徽睿极智能科技有限公司 一种基于排列融合的图像检索重排序方法及系统
CN110162654A (zh) * 2018-01-30 2019-08-23 西安邮电大学 一种基于融合特征与检索结果优化的现勘图像检索算法
CN108573020B (zh) * 2018-02-06 2021-07-02 西安工业大学 融合装配信息的三维装配模型检索方法
CN108920643B (zh) * 2018-06-26 2020-10-20 大连理工大学 加权多特征融合的细粒度图像检索方法
CN109740013A (zh) * 2018-12-29 2019-05-10 深圳英飞拓科技股份有限公司 图像数据处理方法及图像检索方法
CN110276406B (zh) * 2019-06-26 2023-09-01 腾讯科技(深圳)有限公司 表情分类方法、装置、计算机设备及存储介质
CN110472079B (zh) * 2019-07-08 2022-04-05 杭州未名信科科技有限公司 目标图像的检索方法、装置、设备及存储介质
CN110751209B (zh) * 2019-10-18 2022-12-13 北京邮电大学 一种融合深度图像分类和检索的智能台风定强方法
CN111339344B (zh) * 2020-02-25 2023-04-07 北京百度网讯科技有限公司 室内图像检索方法、装置及电子设备
CN112528058B (zh) * 2020-11-23 2022-09-02 西北工业大学 基于图像属性主动学习的细粒度图像分类方法
CN114661810B (zh) * 2022-05-24 2022-08-16 国网浙江省电力有限公司杭州供电公司 轻量级多源异构数据融合方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594386B1 (en) * 1999-04-22 2003-07-15 Forouzan Golshani Method for computerized indexing and retrieval of digital images based on spatial color distribution
CN101692224A (zh) * 2009-07-08 2010-04-07 南京师范大学 融合空间关系语义的高分辨率遥感图像检索方法
CN102184186A (zh) * 2011-04-12 2011-09-14 宋金龙 基于多特征自适应融合的图像检索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6594386B1 (en) * 1999-04-22 2003-07-15 Forouzan Golshani Method for computerized indexing and retrieval of digital images based on spatial color distribution
CN101692224A (zh) * 2009-07-08 2010-04-07 南京师范大学 融合空间关系语义的高分辨率遥感图像检索方法
CN102184186A (zh) * 2011-04-12 2011-09-14 宋金龙 基于多特征自适应融合的图像检索方法

Also Published As

Publication number Publication date
CN103810299A (zh) 2014-05-21

Similar Documents

Publication Publication Date Title
CN103810299B (zh) 基于多特征融合的图像检索方法
CN103778227B (zh) 从检索图像中筛选有用图像的方法
CN102799635B (zh) 一种用户驱动的图像集合排序方法
CN105760495B (zh) 一种基于知识图谱针对bug问题进行探索性搜索方法
CN103329126B (zh) 利用联合图像-音频查询的搜索
CN103514304B (zh) 一种项目推荐方法和装置
CN102750347B (zh) 一种用于图像或视频搜索重排序的方法
CN104317834B (zh) 一种基于深度神经网络的跨媒体排序方法
CN102262642B (zh) 一种Web图像搜索引擎及其实现方法
CN107515895A (zh) 一种基于目标检测的视觉目标检索方法与系统
CN103559191B (zh) 基于隐空间学习和双向排序学习的跨媒体排序方法
CN106021364A (zh) 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN107346328A (zh) 一种基于多粒度层级网络的跨模态关联学习方法
CN110717534A (zh) 一种基于网络监督的目标分类和定位方法
CN105095187A (zh) 一种搜索意图识别方法及装置
CN103186538A (zh) 一种图像分类方法和装置、图像检索方法和装置
CN108875076A (zh) 一种基于Attention机制和卷积神经网络的快速商标图像检索方法
CN107168991A (zh) 一种搜索结果展示方法和装置
CN109739844A (zh) 基于衰减权重的数据分类方法
CN108776777A (zh) 一种基于Faster RCNN的遥感影像对象间空间关系的识别方法
CN110689091A (zh) 弱监督细粒度物体分类方法
CN105701225A (zh) 一种基于统一关联超图规约的跨媒体检索方法
CN108595546A (zh) 基于半监督的跨媒体特征学习检索方法
CN110059755B (zh) 一种多特征评价准则融合的地震属性优选方法
CN105787045B (zh) 一种用于可视媒体语义索引的精度增强方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170215

CF01 Termination of patent right due to non-payment of annual fee