CN106951551B

CN106951551B - 联合gist特征的多重索引图像检索方法

Info

Publication number: CN106951551B
Application number: CN201710190761.1A
Authority: CN
Inventors: 廖开阳; 汤梓伟; 郑元林; 赵凡; 曹从军; 蔺广逢; 袁晖
Original assignee: Xian University of Technology
Current assignee: Xian University of Technology
Priority date: 2017-03-28
Filing date: 2017-03-28
Publication date: 2020-03-31
Anticipated expiration: 2037-03-28
Also published as: CN106951551A

Abstract

本发明公开的联合GIST特征的多重索引图像检索方法：对参考图像库中图像提取局部SIFT特征，根据局部SIFT特征中的坐标信息建立GIST特征；用局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型；根据二维BOF特征模型建立基于二维BOF的投票检索模型；根据SIFT特征与GIST特征结合基于BOF特征的二维倒排表索引，对SIFT特征与GIST进行汉明量化处理，将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到基于BOF的投票检索模型中，精确检索近似重复图像。本发明的多重索引图像检索方法实现在大规模数据图像中完成对近似重复图像的检索。

Description

联合GIST特征的多重索引图像检索方法

技术领域

本发明属于图像分析及检索方法技术领域，具体涉及一种联合GIST特征的多重索引图像检索方法。

背景技术

近年来，通信多媒体技术、计算机网络、大容量存储器及数字化图像设备等技术迅速的发展与应用；其中，数字图像的应用涉及国防军事、工业制造、新闻媒体和大众娱乐等各个方面，由此产生了各式各样的图像数据库，信息量呈指数型增长。

如今，每天都有大量的图像在互联网被上传和下载，网络数据库中会保存大量近似重复的图像。为了有序而严谨地运用这些大量近似重复的图像，许多新的理论及运用应运而生，如：图像分类、图像防伪、图像内容分割、图像标注及图像数据库升级维护等等。例如：一个最普遍的情况是，一个网络用户想要搜索一些与某个关键词或图片样本相关的图像，但最终搜索引擎返回了许多重复或无关的图像；另一种情况涉及图像防伪与版权，图像制作者希望版权保护他们的图像，以避免在互联网上共享；这两种情况与需求都需要近似重复图像检索技术来实现。

近年来，近似重复图像检索成为研究的热点。大量的现有方法是使用如下介绍的图像检索框架(J.Sivic，A.Zisserman，“Video Google:a text retrieval approach toobject matching in videos，”Proceedings Ninth IEEE International Conference onComputer Vision，vol.2，pp.1470-1477，Oct，2003.)：首先，通过图像预处理算法对图像进行预处理；其次，对这些图像提取视觉特征，如：尺度不变特征(SIFT)及方向梯度直方图(HOG)等，用若干组视觉特征向量来表示整个图像；最后，系统需要根据视觉特征向量来计算数据库中每幅图像和查询图像之间的相似性，并得到数据库中与查询图像最相似图像名称。在使用这种方法的前提下，通常使用局部特征的描述信息来衡量图像之间的相似程度(Y.W.Wang，H.L.Yu，“Image registration method based on PCA-SIFT featuredetection，”4th International Conference on Manufacturing Science andEngineering，vol.712-715，pp.2395-2398，Mar，2013.)。与之对应，有一些方法是直接对图像整体提取一个全局特征来进行图像检索(H.Jegou，M.Douze，and C.Schmid，“Bag-of-colors for improved image search，”International Conference on Multimedea，pp.1437-1440，Nov，2011.)，但这些方法不能实现对尺度不一且背景复杂图像的有效检索。

在最近出现的一些文献中，出现了通过对BOF检索模型进行改良，以此提高图像检索的精度(L.Zheng，S.Wang，Z.Liu，and Q.Tian，“Lp-Norm IDF for Large Scale ImageSearch，”Computer Vision and Pattern Recognition，pp.1626-1633，Jun，2013.A.Babenko，and V.Lempitsky，“The Inverted Multi-Index，”Pattern Analysisand Machine Intelligence，vol.37，no.6，pp.1247-1260，2013.)。然而，就现有技术而言，许多近似重复图像检索方法都是基于局部特征和BOF检索模型的，但这些方法只利用了单一的局部信息，忽略了特征点的全局分布信息，导致图像检索的精确度不高。

发明内容

本发明的目的在于提供一种联合GIST特征的多重索引图像检索方法，能把局部特征描述信息与区域化图像轮廓信息联合于改进的BOF模型中，实现在大规模数据图像中精确完成对近似重复图像的检索。

本发明所采用的技术方案是，联合GIST特征的多重索引图像检索方法，具体按照以下步骤实施：

步骤1、对参考图像库中图像提取局部SIFT特征，根据获取的局部SIFT特征中的坐标信息建立GIST特征；

步骤2、将一维BOF模型升维成二维BOF模型，利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型；

步骤3、根据步骤2中得到的二维BOF特征模型，建立基于二维BOF的投票检索模型；

步骤4、先根据步骤1得到的SIFT特征与GIST特征，结合步骤2得到的基于BOF特征的二维倒排表索引，对SIFT特征与GIST分别进行汉明量化处理；再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中，在大规模的数据中精确检索近似重复图像。

本发明的特点还在于：

步骤1具体按照以下步骤实施：

步骤1.1、对参考图像库中的图像进行图像标准化处理，将每幅图像的像素总数控制到固定个数；

步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取；

SIFT特征提取是采用基于hessian-affine的仿射不变特征提取方法；

对每幅图像提取SIFT特征，提取的信息包括有：特征点的位置信息、尺度信息、角度信息以及局部描述信息；

步骤1.3、根据获取的局部SIFT特征中特征点的位置信息提取特征点及其周围区域的GIST特征；

GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波，将滤波后得到的图像划分为网格，在每个网格内部取平均值，最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法，对每个SIFT特征点的相邻区域提取GIST特征，提取的信息为特征点相邻区域的描述信息。

步骤1.1中，将大图控制到1024*768个像素，小图控制到640*480个像素。

步骤2具体按照以下方法实施：

用大规模数据分级聚类算法对参考图像库中的SIFT特征与GIST特征中的描述符分别进行训练，生成两个类；

进行量化生成每幅图像的BOF特征，具体方法如下：

量化生成每幅图像的BOF特征是指图像的每个特征点的SIFT特征与GIST特征分别进行量化处理；再判断在各自的量化过程中与哪个类中心最近，则放入该类中心；然后将生成一张频数表，即初步的无权BOF；最后通过tf-idf对频数表加上权重，生成最终的加权BOF特征；

其中，对查询图像的特征进行量化方法，具体按照以下算法实施：

在式(1)中：q:表示量化，R^d表示实数空间中的d维数据，k表示类中心的数量，x_p,p＝1,...,r₂为参考图像库中图像的第p个特征；

计算tf-idf权值方法，具体按照以下算法实施：

W_u,v＝tf_u,v·idf_u,v (4)；

在式(2)～式(4)中：k₁表示SIFT特征类中心的数量，k₂表示GIST特征类中心的数量，f_u,v是每幅图像中的特征点划分到第u个SIFT类中心并且第v个GIST类中心的频数，t_u,v是特征点划分到第u个SIFT类中心并且第v个GIST类中心的参考图像总数，T是总的参考图像数，tf_u,v表示词频率因子，idf_u,v表示逆词频率因子；

对生成的BOF特征建立二维倒排索引，具体方法为：

二维倒排索引通常是由量化表文件和倒排表文件两部分组成；量化表文件记录了文档集中出现的所有词汇；倒排表文件是将每个词汇在记录文件中的位置、频率和逆词频率信息都记录下来，所有词汇的这些信息就构成倒排表；对于量化表文件中的k₁*k₂个词汇

中的一个w_u,v，在x个记录文件，d₁…d_x中的倒排表能表示为如下形式：

式(5)中：g表示频率、方向及尺度信息，并给出了一个完整的用于查询文本词汇的倒排索引结构；k₁*k₂条这样的记录能构成一个完整的倒排表。

步骤3具体按照以下步骤实施：

给定一个查询图像，其中所有特征用y表示，局部SIFT特征用y₁表示、GIST特征用y₂表示，并且图像数据库中图像的特征用x_j表示，局部SIFT特征用x_1j表示、GIST特征用x_2j表示，j＝1,...,n。基于BOF投票检索的步骤具体如下：

步骤3.1、对于查询图像的特征y_l,l＝1,...,r₁和图像数据库中所有图像的特征x_i,j，i＝1,...,r₂，j＝1,...,s，l、i表示各自图像的特征序号，j表示图像库中的图像序号，计算出两个图像之间的相似性分数s_j，其算法具体如下：

式(6)中：f(a,b)是一个匹配函数，它反映了两个特征组a和b之间的相似性程度；

步骤3.2、经步骤3.1后，为了提高运算效率，把特征根据视觉词汇进行量化，并把量化后数据库中图像的特征存储在一个倒排文件中，这个量化过程q采用的是如下算法：

量化后q(x_i,j)的结果是与特征x_i,j最近的类中心的序号；因此，若两个特征x_i,j和y_l量化后满足q(x_i,j)＝q(y_l)，则这两个特征在高维的特征空间中很接近的概率非常高；根据这个原理，考虑到前述的tf-idf加权方法，匹配函数f则定义为如下算法：

这样能根据量化后的结果高效地比较两个不同的特征；

步骤3.3、经步骤3.2后，最终用来排序的图像相似性分数s_f是对s_j进行后处理后得到的，具体按如下算法实施：

由步骤3.2中的式(7)和步骤3.3中的式(8)能看出：同时考虑查询图像和数据库中图像的视觉单词的tf-idf权重，并把它们加入到了基于BOF投票检索方法中，这种加权方法实现了对视觉单词直方图的规一化处理。

步骤4具体按照以下步骤实施：

汉明量化处理采用的是随机生成一个128*128符合高斯分布的矩阵，然后对该矩阵做QR分解，取得到的128*128的正交投影矩阵的前64行，得到64*128的矩阵；

使用大量的属于同一个聚类中心的SIFT向量乘以得到的64*128矩阵，即能得到大量64维的SIFT向量，根据这些向量得到一个中值向量，然后将该聚类中心的每个64维的SIFT向量和对应的64维中值向量的每一维比较：若SIFT在该维比中值向量的对应维大则SIFT的汉明信息该维为1，否则为0，依次比较得到汉明量化信息的方法，得到SIFT特征的汉明量化信息H_s与GIST特征的汉明量化信息H_g；

若两个特征x和y量化到同一个类中心上反映了它们描述符的汉明距离d_h(x,y)是很小的，则汉明量化信息所描述的网络之间的距离也应该是很小的；在这一点上，一个描述符由q(x)和b₁(x)、b₂(x)，q是一个量化器，b₁表示SIFT特征的汉明量化信息H_s、b₂表示GIST特征的汉明量化信息H_g；则把SIFT特征的汉明量化信息H_s、GIST特征的汉明量化信息H_g嵌入到BOF检索模型中，重新定义的匹配函数f的功能，具体算法如下：

式(9)中：d_h表示汉明距离，

与

分别表示阈值，并且

与

最理想的值分别22和40；

在量化时类中心数要取小一些的值，20000为最优，尽量让相近的图像能匹配上，而

与

也相应的要取合适的值，以便于能根据H_s特征与H_g特征的汉明距离去除误匹配的图像且不影响近似图像的匹配结果。

本发明的有益效果在于：

(1)本发明联合GIST特征的多重索引图像检索方法中提出了一种改进的BOF模型，能明显提高图像检索的鲁棒性。

(2)在本发明联合GIST特征的多重索引图像检索方法中，能根据二维BOF模型的特点，将SIFT特征与GIST特征量化运用到二维BOF模型中，增加了BOF模型的特征多样性，从而提高了系统的稳定性。

(3)本发明联合GIST特征的多重索引图像检索方法使用时，能大幅提高近重复图像检索的精度，并能广泛应用于图像检索领域。

(4)本发明联合GIST特征的多重索引图像检索方法也适合于视频检索领域，能大幅提高视频检索的精度。

附图说明

图1是本发明联合GIST特征的多重索引图像检索方法的框架图。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

联合GIST特征的多重索引图像检索方法的框架图，如图1所示的，可将其分为两大系统，分别为：离线系统与在线系统；离线系统是对目标图像库的处理，产生在线体统查询时所需要的二维倒排表数据库；在线系统主要是完成对查询图像在目标图像库中的查询过程。

离线系统的处理对象是参考图像库，对参考图像库中的图像进行SIFT特征提取、GIST特征提取、特征聚类、特征矢量到视觉词汇的量化并生成视觉词汇表、特征汉明量化与关于特征的倒排索引表以供在线部分的使用。

在线系统用于完成对查询图像在参考图像库中的查询；能对查询图像进行SIFT特征提取及GIST特征提取，能根据参考图像库生成的视觉词汇表对在线图像中的特征量化成视觉词汇、特征汉明量化，然后应用信息融合策略把全局几何分布信息融合到BOF模型中，进行候选图像的查找和搜索，得出最终检索结果。

本发明联合GIST特征的多重索引图像检索方法，具体按照以下步骤实施：

步骤1、对参考图像库中图像提取局部SIFT特征，根据获取的局部SIFT特征中的坐标信息建立GIST特征，具体按照以下步骤实施：

将大图控制到1024*768个像素，小图控制到640*480个像素；

步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取；

步骤2、将一维BOF模型升维成二维BOF模型，利用步骤1得到的局部SIFT特征中局部描述信息与GIST特征中局部描述信息建立二维BOF特征模型，具体按照以下方法实施：

进行量化生成每幅图像的BOF特征，具体方法如下：

计算tf-idf权值方法，具体按照以下算法实施：

W_u,v＝tf_u,v·idf_u,v (4)；

对生成的BOF特征建立二维倒排索引，具体方法为：

二维倒排索引通常是由量化表文件和倒排表文件两部分组成；量化表文件记录了文档集(图像、图像帧)中出现的所有词汇；倒排表文件是将每个词汇在记录文件(图像、图像帧)中的位置、频率和逆词频率信息都记录下来，所有词汇的这些信息就构成倒排表；对于量化表文件中的k₁*k₂个词汇(特征)w_1,1…w_m,n中的一个w_u,v，在x个记录文件(图像、图像帧)d₁…d_x中的倒排表能表示为如下形式：

步骤3、根据步骤2中得到的二维BOF特征模型，建立基于二维BOF的投票检索模型，具体按照以下步骤实施：

给定一个查询图像，其中所有特征用y表示(局部SIFT特征用y₁表示、GIST特征用y₂表示)，并且图像数据库中图像的特征用x_j表示(局部SIFT特征用x_1j表示、GIST特征用x_2j表示)，j＝1,...,n。基于BOF投票检索的步骤具体如下：

步骤3.1、对于查询图像的特征y_l,l＝1,...,r₁和图像数据库中所有图像的特征x_i,j，i＝1,...,r₂，j＝1,...,s(l、i表示各自图像的特征序号，j表示图像库中的图像序号)，计算出两个图像之间的相似性分数s_j，其算法具体如下：

量化后q(x_i,j)的结果是与特征x_i,j最近的类中心(视觉词汇)的序号；因此，若两个特征x_i,j和y_l量化后满足q(x_i,j)＝q(y_l)，则这两个特征在高维的特征空间中很接近的概率非常高；根据这个原理，考虑到前述的tf-idf加权方法，匹配函数f则定义为如下算法：

这样能根据量化后的结果高效地比较两个不同的特征；

步骤4、先根据步骤1得到的SIFT特征与GIST特征，结合步骤2得到的基于BOF特征的二维倒排表索引，对SIFT特征与GIST分别进行汉明量化处理；再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中，在大规模的数据中精确检索近似重复图像，具体按照以下方法实施：

式(9)中：d_h表示汉明距离，

与

分别表示阈值，并且

与

最理想的值分别22和40；

在量化时类中心数要取小一些的值(20000为最优)，尽量让相近的图像能匹配上，而

与

本发明联合GIST特征的多重索引图像检索方法，从功能运行上，首先执行对数据库中图像标准化处理，提取局部SIFT特征；其次执行根据获取的局部SIFT特征中的坐标信息建立GIST特征；然后执行利用局部SIFT特征与GIST特征的描述符信息建立二维BOF特征模型；接下来执行根据二维BOF特征模型，建立基于二维BOF的投票检索模型；最后执行应用信息融合策略把汉明量化信息融合到建立的基于二维BOF的投票检索模型中，在大规模的数据库中精确地检索近似重复图像。

本发明联合GIST特征的多重索引图像检索方法，充分利用了局部纹理信息和区域化轮廓信息，并提出了一种特征并行联合的方法，能够把局部纹理信息和区域化轮廓信息联合于二维BOF模型中，并且根据信息融合策略把汉明量化信息融合于二维BOF模型中，实现在大规模的数据中精确地检索近似重复图像。

Claims

1.联合GIST特征的多重索引图像检索方法，其特征在于，具体按照以下步骤实施：

步骤4、先根据步骤1得到的SIFT特征与GIST特征，结合步骤2得到的基于BOF特征的二维倒排表索引，对SIFT特征与GIST分别进行汉明量化处理；再将应用信息融合策略得到的局部SIFT特征汉明量化信息与GIST特征汉明量化信息融合到经步骤3建立的基于BOF的投票检索模型中，在大规模的数据中精确检索近似重复图像，

所述步骤1具体按照以下步骤实施：

步骤1.2、对经步骤1.1处理后的每幅图像均进行SIFT特征提取；

GIST特征提取采用的是图像与不同方向和不同尺度的Gabor滤波器组进行滤波，将滤波后得到的图像划分为网格，在每个网格内部取平均值，最后将滤波后得到的所有图像的每个网格均值级联起来得到GIST特征的方法，对每个SIFT特征点的相邻区域提取GIST特征，提取的信息为特征点相邻区域的描述信息，

所述步骤2具体按照以下方法实施：

进行量化生成每幅图像的BOF特征，具体方法如下：