CN106570183B - 一种彩色图像检索和分类方法 - Google Patents
一种彩色图像检索和分类方法 Download PDFInfo
- Publication number
- CN106570183B CN106570183B CN201610996343.7A CN201610996343A CN106570183B CN 106570183 B CN106570183 B CN 106570183B CN 201610996343 A CN201610996343 A CN 201610996343A CN 106570183 B CN106570183 B CN 106570183B
- Authority
- CN
- China
- Prior art keywords
- subband
- copula
- gabor
- log
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5838—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using colour
Landscapes
- Engineering & Computer Science (AREA)
- Library & Information Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及了一种利用Log‑Gabor滤波器实现图像检索和分类方法。该方法主要内容包括以下几点:1)利用copula模型同时捕获了Log‑Gabor小波子带间的相关性和颜色通道的相关性,提高了检索和分类的准确度;2)本发明对将颜色通道上Log‑Gabor小波子带进行了选择(去掉冗余子带提高算法精度,减少计算时间),而且每个彩色图像只建立一个copula模型,提高了计算效率。与现有方法相比,本发明有本发明抗噪声干扰能力强、具有较好的检索和分类性能、具有较低的计算复杂度。
Description
技术领域
本发明涉及图像检索技术与分类领域,尤其是涉及利用颜色通道相关性的一种图像检索方法。
背景技术
目前大多数图像采集设备获取的图像为彩色图像(其中RGB图像是最常见的一种),然而目前多数图像检索方法是基于灰度图像来设计的,即首先要将彩色图像(如RGB图像)转换为灰度图像。基于灰度图像的纹理信息进行分类与检索的缺点是没有利用图像的颜色特征,降低了算法的识别精度。常用的图像检索与分类方法包括离散小波变换方法(DWT)、对偶树小波变换方法(DT-CWT)、Gabor小波分解方法、局部二进制模式方法(LBP)及其扩展方法。为了利用颜色特征,可以将上述方法在每个颜色通道上分别提取纹理特征,然后将所有的颜色通道纹理特征连接成最终的图像特征。然而这种先在通道独立计算特征再连接的检索与分类方法提高的效果不很明显。对于LBP及其扩展的描述子方法,其最大的特点是抗图像噪声干扰能力差。
近来在该研究领域中,有算法利用了颜色通道的相关性,结合copula模型来提高检索和分类准确率(Kwitt R,Meerwald P,Uhl A.Efficient texture image retrievalusing copulas in a Bayesian framework[J].IEEE transactions on imageprocessing,2011,20(7):2063-2077,文献1)。具体做法是用DWT或DT-CWT分解RGB图像的3个颜色通道上进行分解。对于DT-CWT,一般在3个通道上分别进行3层分解,每层分解有6个方向子带(对于DWT则只有水平、垂直和对角3个方向子带)。将每一层上的18个子带用copula模型进行连接,建立颜色相关的多维统计模型。这样3层分解将产生3个copula多维统计模型,利用统计模型的相似比较(常用的是Kullback–Leibler distance,简称KLD)进行检索和分类(Lasmar N E,Berthoumieu Y.Gaussian copula multivariate modelingfor texture image retrieval using wavelet transforms[J].IEEE Transactions onImage Processing,2014,23(5):2246-2261,文献2)。这种基于传统小波变换的copula模型有两个缺点:1)相比于Gabor小波(或Gabor滤波器),DWT和DTCWT对纹理图像的刻画能力较弱;2)由于受小波正交性影响,DWT不能捕获尺度和方向上的相关性;对于DT-CWT其尺度相关性也很弱,降低了性能。文献1采用了非常耗时的Bayesian框架进行检索;文献2没有利用纹理图像的颜色通道特征,也降低了算法的性能。Li,Chaorong等(论文Li,Chaorong,Guiduo Duan,and Fujin Zhong."Rotation invariant texture retrieval consideringthe scale dependence of Gabor wavelet."IEEE Transactions on Image Processing,2015,24(8):2344-2354.)提出了Gabor小波结合copula图像检索方法,但是与文献2一样针对的是灰度图像的检索,也没有考虑图像颜色通道相关性。
发明内容
本发明方法针对现有图像分类和检索方法的不足,提出一种考虑颜色通道相关性的,利用Log-Gabor滤波器实现图像检索和分类方法。Log-Gabor是Gabor滤波器的提提升版,具有模拟人的视觉感知细胞。利用它能提取具有较好区别能力的图像特征,更适合提取自然图像特征信息。本发明主要创新点在于:1)利用copula模型同时捕获了Log-Gabor小波子带间的相关性和颜色通道的相关性,提高了检索和分类的准确度;2)本发明对将颜色通道上Log-Gabor小波子带进行了选择(去掉冗余子带提高算法精度),而且每个彩色图像只建立一个copula模型,提高了计算效率。本发明方法具体实施步骤是:
步骤1,用二维Log-Gabor滤波器将RGB彩色图像在3个通道上分别进行4尺度和6方向分解,这样一共得到72个Log-Gabor输出图像(4×6×3),称为Log-Gabor子带。二维Log-Gabor滤波器函数的频域响应定义如下:
其中k和θ分别表示频域极坐标上的半径和方向;u∈[1,…,L]是尺度因子,v∈[1,…,S]是方向因子,L和S是分别表示最大分解尺度数和方向数的正整数;σk和σθ分别决定了尺度和方向带宽。
步骤2,分别对每一个Log-Gabor子带进行拉直运算,即将二维Log-Gabor子带从上到下、从左到右拼接形成一维向量(称为子带向量)。对于M行N列的Log-Gabor子带将产生长度为P的向量(P=M×N)。
步骤3,用Weibull分布分别拟合72个向量。Weibull分布的密度函数表示为:其中α和β是Weibull分布的形状和尺度参数。Weibull累积分布函数为:拟合是在每个Log-Gabor子带向量上根据Weibull分布计算出参数α和β,以使曲线f(x|α,β)能最吻合的包络该向量的直方图。这里采用最大似然法拟合Gabor子带,即用下面的公式确定:此步骤将得到72个Weibull分布,包括72个不同的密度函数fi(xi)和累积分布Fi(xi)。
步骤4,建立初步的高斯copula模型。此步骤用高斯copula模型联合这72个Weibull分布,使之成为一个多维统计模型,以获得比独立统计模型更好的检索或分类效果。Copula模型由下面的式子确定:
其中n是边缘分布的个数,这里n取值为72;xi代表了n个向量;c(F1(x1|α1,β1),…,Fn(xn|αn,βn))是copula密度函数;Fi(xi|αi,βi)和fi(xi|αi,βi)是copula模型的边缘分布(这里分别是已经计算出参数的Weibull分布函数和密度函数);Θ是参数集,包括边缘分布参数和copula函数的参数。这里选取高斯copula,其密度函数的表达式为:
其中R是相关矩阵,ξ=[ξ1,…,ξn],ξi=Φ-1(ui),i=1,…,n,Φ是标准正太分布,Φ-1是其逆函数。由上可知Weibull边缘分布和高斯Copula函数确定了copula模型,该模型为多元统计模型。利用已经求得的Fi(xi|αi,βi)和fi(xi|αi,βi),并根据最大似然法求得高斯copula模型参数R的估计:其中ξi=Φ-1(FW(xi|αi,βi)),ξT是ξ的转置,L是Log-Gabor子带向量长度。这样参数Θ(包括copula函数参数和边缘分布参数)已全部确定,即copula模型已确定。
步骤5,Log-Gabor子带选择。上述步骤建立的copula模型联合了Log-Gabor分解的所有72个子带。其中一些子带在检索的时候会产生干扰因素,影响算法精度,而且子带过多也将增大计算量。因而选取一部分效果较好的子带参与最终的检索和分类是有必要的。由于是联合分布模型,主要考察的是子带间组合性能,而不是单独测试某个子带的性能。设所有子带集合为S={s1,…,s72},si是第i个子带,用S-si表示除去第i个子带剩下的71个子带。用h(S-si)表示去除si后的copula模型,其检索或分类正确率用Ri表示,即Ri=h(S-si)。Ri越小,则表示第i个子带重要性越大。按照从小到大进行排序,选择前面m个(m<n)参加重组最终的copula模型,这里m取值为36。在训练时,应在不同类型的图像数据库中进行训练,以确保选取的子带有广泛的适应性。这里用两个高斯copula模型之间的KLD(Kullback-Leibler距离)相似度量来实现检索与分类(具体见步骤7中的公式)。
步骤6,建立最终的copula模型。将选取的m个子带构建出copula模型。表示如下:
步骤7,用最终的copula模型实现检索和分类。这里用两个copula模型之间的KLD进行检索和分类。设需要查询的图像(未知类别)的高斯copula模型为h1,来源于图像数据库中的某一图像(已知类别)的高斯copula模型为hj,则通过计算h1和hj的KLD(h1||hj),选取具有最小的KLD(h1||hj)对应的hj的图像为查询图像h1的类别。两个模型之间的KLD距离表示为:
其中是两个高斯copula函数之间的KLD;表示两个Weibull边缘分布之间的KLD,其表达如下其中Γ是Gamma函数。
本发明中的方法为多元统计模型,能很好捕获颜色相关性和Log-Gabor子带相关性(包括尺度间相关性和方向间相关性),与现有方法相比,本发明有本发明抗噪声干扰能力强、具有较好的检索和分类性能、具有较低的计算复杂度;经试验表明,本发明取得了很好的效果。
附图说明
图1为本发明方法流程图
具体实施方式
下面结合附图对本发明方法作进一步说明,具体实施步骤如下(如图1所示):
步骤1,用二维Log-Gabor滤波器将RGB彩色图像在3个通道上分别进行4尺度和6方向分解,这样一共得到72个Log-Gabor输出图像(4×6×3),称为Log-Gabor子带。
步骤2,分别对每一个Log-Gabor子带进行拉直运算,即将二维Log-Gabor子带从上到下、从左到右拼接形成一维向量(称为子带向量)。对于M行N列的Log-Gabor子带将产生长度为P的子带向量(P=M×N)。
步骤3,用Weibull分布分别拟合72个子带向量。拟合是在每个Log-Gabor子带向量上根据Weibull分布计算出参数α和β,以使曲线f(x|α,β)能最吻合的包络该向量的直方图。这里采用最大似然法拟合Gabor子带,即用下面的公式确定:此步骤将得到72个Weibull分布,包括72个不同的密度函数fi(xi)和累积分布Fi(xi)。
步骤4,建立初步的高斯copula模型。此步骤用高斯copula模型联合这72个Weibull分布,使之成为一个多维统计模型,以获得比独立统计模型更好的检索或分类效果。这里选取高斯copula来建立初步模型。由上可知Weibull边缘分布和高斯Copula函数确定了copula模型。利用已经求得的Fi(xi|αi,βi)和fi(xi|αi,βi),并根据最大似然法求得高斯copula模型参数R的估计:其中ξi=Φ-1(FW(xi|αi,βi)),ξT是ξ的转置,P是Log-Gabor子带向量长度。这样参数Θ(包括copula函数参数和边缘分布参数)已全部确定,即copula模型已确定。
步骤5,Log-Gabor子带选择。上述步骤建立的copula模型联合了Log-Gabor分解的所有72个子带。用Ri表示去除第i个子带后的copula模型在训练数据库中的检索或分类正确率。Ri越小,则表示第i个子带重要性越大。按照从小到大进行排序,选择前面m个(m<n)参加重组最终的copula模型,这里m取值为36。在训练时,应在不同类型的图像数据库中进行训练,以确保选取的子带有广泛的适应性。这里用两个高斯copula模型之间的KLD(Kullback-Leibler距离)相似度量来实现检索与分类(具体见步骤7中的公式)。
步骤6,建立最终的copula模型。将选取的m个子带构建出一个copula模型。表示如下:
步骤7,用最终的copula模型实现检索和分类。设需要查询的图像(未知类别)的高斯copula模型为h1,来源于图像数据库中的某一图像(已知类别)的高斯copula模型为hj,则通过计算h1和hj的KLD(h1||hj),选取具有最小的KLD(h1||hj)对应的hj的图像为查询图像h1的类别。两个模型之间的KLD距离表示为:
Claims (1)
1.一种彩色图像检索和分类方法,其特征在于它包括以下步骤:
步骤1,用二维Log-Gabor滤波器将RGB彩色图像在3个通道上分别进行4尺度和6方向分解,这样一共得到72个Log-Gabor输出图像,称为Log-Gabor子带,二维Log-Gabor滤波器函数的频域响应定义如下:
其中k和θ分别表示频域极坐标上的半径和方向;u∈[1,…,L]是尺度因子,v∈[1,…,S]是方向因子,L和S是分别表示最大分解尺度数和方向数的正整数,σk和σθ分别决定了尺度和方向带宽;
步骤2,分别对每一个Log-Gabor子带进行拉直运算,即将二维Log-Gabor子带从上到下、从左到右拼接形成一维向量,称为子带向量;对于M行N列的Log-Gabor子带将产生长度为P的向量,P=M×N;
步骤3,用Weibull分布分别拟合72个向量,Weibull分布的密度函数表示为:其中α和β是Weibull分布的形状和尺度参数;Weibull累积分布函数为:拟合是在每个Log-Gabor子带向量上根据Weibull分布计算出参数α和β,以使曲线f(x|α,β)能最吻合的包络该向量的直方图;这里采用最大似然法拟合Gabor子带,即用下面的公式确定:此步骤将得到72个Weibull分布,包括72个不同的密度函数fi(xi)和累积分布Fi(xi);
步骤4,建立初步的高斯copula模型:此步骤用高斯copula模型联合这72个Weibull分布,使之成为一个多维统计模型,以获得比独立统计模型更好的检索或分类效果;Copula模型由下面的式子确定:
其中n是边缘分布的个数,这里n取值为72;xi代表了n个向量;c(F1(x1|α1,β1),…,Fn(xn|αn,βn))是copula密度函数;Fi(xi|αi,βi)和fi(xi|αi,βi)是copula模型的边缘分布,这里分别是已经计算出参数的Weibull分布函数和密度函数;Θ是参数集,包括边缘分布参数和copula函数的参数,这里选取高斯copula,其密度函数的表达式为:
其中R是相关矩阵,ξ=[ξ1,…,ξn],ξi=Φ-1(ui),i=1,…,n,Φ是标准正态分布,Φ-1是其逆函数;由上可知Weibull边缘分布和高斯Copula函数确定了copula模型,该模型为多元统计模型;利用已经求得的Fi(xi|αi,βi)和fi(xi|αi,βi),并根据最大似然法求得高斯copula模型参数R的估计:其中ξi=Φ-1(FW(xi|αi,βi)),P是Log-Gabor子带向量长度;这样参数Θ已全部确定,即copula模型已确定;
步骤5,Log-Gabor子带选择:上述步骤建立的copula模型联合了Log-Gabor分解的所有72个子带;其中一些子带在检索的时候会产生干扰因素,影响算法精度,而且子带过多也将增大计算量;因而选取一部分效果较好的子带参与最终的检索和分类是有必要的;由于是联合分布模型,主要考察的是子带间组合性能,而不是单独测试某个子带的性能;设所有子带集合为S={s1,…,s72},si是第i个子带,用S-si表示除去第i个子带剩下的71个子带;用h(S-si)表示去除si后的copula模型,其检索或分类正确率用Ri表示,即Ri=h(S-si),Ri越小,则表示第i个子带重要性越大;按照从小到大进行排序,选择前面m个参加重组最终的copula模型,这里m取值为36;在训练时,应在不同类型的图像数据库中进行训练,以确保选取的子带有广泛的适应性;这里用两个高斯copula模型之间的KLD相似度量来实现检索与分类,具体见步骤7中的公式;
步骤6,建立最终的copula模型:将选取的m个子带构建出copula模型;表示如下:
步骤7,用最终的copula模型实现检索和分类:这里用两个copula模型之间的KLD进行检索和分类;设需要查询的未知类别图像的高斯copula模型为h1,来源于图像数据库中的某一已知类别图像的高斯copula模型为hj,则通过计算h1和hj的KLD(h1||hj),选取具有最小的KLD(h1||hj)对应的hj的图像为查询图像h1的类别;两个模型之间的KLD距离表示为:
其中是两个高斯copula函数之间的KLD;表示两个Weibull边缘分布之间的KLD,其表达如下其中Γ是Gamma函数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610996343.7A CN106570183B (zh) | 2016-11-14 | 2016-11-14 | 一种彩色图像检索和分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610996343.7A CN106570183B (zh) | 2016-11-14 | 2016-11-14 | 一种彩色图像检索和分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106570183A CN106570183A (zh) | 2017-04-19 |
CN106570183B true CN106570183B (zh) | 2019-11-15 |
Family
ID=58542537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610996343.7A Expired - Fee Related CN106570183B (zh) | 2016-11-14 | 2016-11-14 | 一种彩色图像检索和分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106570183B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107578049B (zh) * | 2017-09-01 | 2020-06-05 | 宜宾学院 | 圆对称Gabor小波深度分解图像分类方法 |
CN107688787B (zh) * | 2017-09-01 | 2020-09-29 | 宜宾学院 | 基于Gabor小波的近端指间关节纹路识别方法 |
CN108399614B (zh) * | 2018-01-17 | 2020-12-22 | 华南理工大学 | 一种基于无抽样小波与Gumbel分布的织物缺陷检测方法 |
CN108256581B (zh) * | 2018-01-19 | 2021-06-11 | 宜宾学院 | Gabor小波域copula模型图像分类方法 |
CN108171760A (zh) * | 2018-01-29 | 2018-06-15 | 河南大学 | 一种图像组成复杂度计算方法 |
CN111897925B (zh) * | 2020-08-04 | 2022-08-26 | 广西财经学院 | 关联模式挖掘与词向量学习融合的伪相关反馈扩展方法 |
CN111897928A (zh) * | 2020-08-04 | 2020-11-06 | 广西财经学院 | 查询词嵌入扩展词和统计扩展词并集的中文查询扩展方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336835A (zh) * | 2013-07-12 | 2013-10-02 | 西安电子科技大学 | 基于权值color-sift特征字典的图像检索方法 |
CN105893960A (zh) * | 2016-03-31 | 2016-08-24 | 杭州电子科技大学 | 基于相位对称性的道路交通标志检测方法 |
-
2016
- 2016-11-14 CN CN201610996343.7A patent/CN106570183B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336835A (zh) * | 2013-07-12 | 2013-10-02 | 西安电子科技大学 | 基于权值color-sift特征字典的图像检索方法 |
CN105893960A (zh) * | 2016-03-31 | 2016-08-24 | 杭州电子科技大学 | 基于相位对称性的道路交通标志检测方法 |
Non-Patent Citations (3)
Title |
---|
《Copula驱动的小波域纹理特征提取研究》;李朝荣;《中国博士学位论文全文数据库 信息科技辑》;20140515;第I138-74页 * |
《Gaussian Copula Multivariate Modeling for Texture Image Retrieval Using Wavelet Transforms》;Lasmar Nour Eddineand等;《IEEE Transactions on Image Processing》;20141231;第23卷(第5期);第2246-2261页 * |
《应用log-Gabor韦伯特征的图像质量评价》;卢彦飞等;《光学精密工程》;20151115;第23卷(第11期);第3259-3269页 * |
Also Published As
Publication number | Publication date |
---|---|
CN106570183A (zh) | 2017-04-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106570183B (zh) | 一种彩色图像检索和分类方法 | |
US8515171B2 (en) | Methods for adaptive and progressive gradient-based multi-resolution color image segmentation and systems thereof | |
Chen et al. | Denoising hyperspectral image with non-iid noise structure | |
Ugarriza et al. | Automatic image segmentation by dynamic region growth and multiresolution merging | |
Do et al. | Wavelet-based texture retrieval using generalized Gaussian density and Kullback-Leibler distance | |
CN104268593A (zh) | 一种小样本情况下多稀疏表示的人脸识别方法 | |
Li et al. | Texture classification using refined histogram | |
Singh et al. | Dual-tree wavelet scattering network with parametric log transformation for object classification | |
CN104778457A (zh) | 基于多示例学习的视频人脸识别算法 | |
CN107527023A (zh) | 基于超像素和主题模型的极化sar图像分类方法 | |
CN110110596A (zh) | 高光谱图像特征提取、分类模型构建及分类方法 | |
CN102663686B (zh) | 基于Treelet变换和高斯尺度混合模型的图像去噪方法 | |
Huang et al. | Information-theoretic wavelet packet subband selection for texture classification | |
Vishwakarma et al. | An efficient hybrid DWT-fuzzy filter in DCT domain based illumination normalization for face recognition | |
CN103646256A (zh) | 一种基于图像特征稀疏重构的图像分类方法 | |
Dong et al. | Feature extraction through contourlet subband clustering for texture classification | |
Pallavi et al. | A novel approach for generating composite sketches from mugshot photographs | |
CN112329818B (zh) | 基于图卷积网络嵌入表征的高光谱图像非监督分类方法 | |
CN108734206B (zh) | 一种基于深度参数学习的最大相关主成分分析方法 | |
CN106650678B (zh) | Gabor小波子带相关结构人脸识别方法 | |
Hoti et al. | A semiparametric density estimation approach to pattern classification | |
Han et al. | Grass leaf identification using dbN wavelet and CILBP | |
Abbas et al. | Image classification schemes based on sliced radial energy distribution of DFT and the statistical moments of Haar wavelet | |
Huo et al. | Seafloor segmentation using combined texture features of sidescan sonar images | |
Dang et al. | A patch-based non-local means method for image denoising |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191115 Termination date: 20201114 |
|
CF01 | Termination of patent right due to non-payment of annual fee |