CN105224944A - 基于码书块稀疏的非负稀疏编码的图像特征提取方法 - Google Patents

基于码书块稀疏的非负稀疏编码的图像特征提取方法 Download PDF

Info

Publication number
CN105224944A
CN105224944A CN201510567121.9A CN201510567121A CN105224944A CN 105224944 A CN105224944 A CN 105224944A CN 201510567121 A CN201510567121 A CN 201510567121A CN 105224944 A CN105224944 A CN 105224944A
Authority
CN
China
Prior art keywords
codebook
block
matrix
coding
sparse coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510567121.9A
Other languages
English (en)
Other versions
CN105224944B (zh
Inventor
王进军
石伟伟
龚怡宏
张世周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xian Jiaotong University
Original Assignee
Xian Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xian Jiaotong University filed Critical Xian Jiaotong University
Priority to CN201510567121.9A priority Critical patent/CN105224944B/zh
Publication of CN105224944A publication Critical patent/CN105224944A/zh
Application granted granted Critical
Publication of CN105224944B publication Critical patent/CN105224944B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明基于码书块稀疏的非负稀疏编码的图像特征提取方法,包括步骤:1)对待处理的图像数据集中所有图像分别稠密地提取块级特征;2)随机地选取若干块级特征;3)建立基于码书块稀疏的非负稀疏编码模型;4)用随机选取的块级特征来求解出该图像数据集块级特征的码书;5)固定码书,对所有的块级特征进行基于码书块稀疏的非负稀疏编码;6)对图像数据集每张图像的编码进行空间金字塔最大池化方法整合;7)按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,对空间金字塔最大池化后的初级特征向量再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量。

Description

基于码书块稀疏的非负稀疏编码的图像特征提取方法
技术领域:
本发明涉及计算机视觉图像处理技术领域,具体涉及一种基于码书块稀疏的非负稀疏编码的图像特征提取方法。
背景技术:
稀疏编码已广泛应用于计算机视觉的各个领域(例如,图像分类、图像去噪等等),传统的稀疏编码方法仅仅要求编码是稀疏的(所谓稀疏是指编码中的零元素较多),而对码书的结构没有做任何要求,最近的一些实验结果表明:使用一个精心设计的码书往往能取得更好的编码结果;非负的编码在应用中往往有更好的稳定性。同时,一些研究结果表明,图像是由一些局部的小像素块拼接组成,使用一定数目学习出来的小的局部像素块,可以组合出来所有的自然图像,现有的稀疏编码方法并没有体现出这种局部性。传统的用稀疏编码提取图像特征的方法仅仅对块级特征做一次编码,这样的得到的图像特征在应用中不具有较强的判别性。
发明内容:
本发明的目的在于针对现有技术的不足,提供了一种基于码书块稀疏的非负稀疏编码的图像特征提取方法。
为达到上述目的,本发明采用如下技术方案:
基于码书块稀疏的非负稀疏编码的图像特征提取方法,包括以下步骤:
1)对待处理的图像数据集中所有图像分别稠密地提取块级特征;
2)对待处理的图像数据集中所有图像提取完块级特征后,随机地选取10万至50万的块级特征用于求该待处理的图像数据集块级特征的码书;
3)建立基于码书块稀疏的非负稀疏编码模型;
4)根据步骤2)和步骤3),用随机选取的块级特征来求解出该图像数据集块级特征的码书;
5)该图像数据集块级特征的码书求解出来后,固定码书,对所有的块级特征进行基于码书块稀疏的非负稀疏编码;
6)对图像数据集每张图像的编码进行空间金字塔最大池化方法整合,得到每张图像的初级特征向量;
7)按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,对空间金字塔最大池化后的初级特征向量再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量,用于计算机视觉任务。
本发明进一步的改进在于,步骤1)中,对待处理的图像数据集中所有图像按照16至32的像素块以及6至10的滑动步长,稠密地提取每个图像的块级特征。
本发明进一步的改进在于,步骤3)中,块级特征编码是非负的,码书的每一列是分块稀疏的。
本发明进一步的改进在于,步骤3)中,设码书为D=[d1,d2,…,dk],D∈Rp×k的每一列表示一个基向量,块级特征向量xj在基矩阵下相应的稀疏编码为cj,j=1,2,…,n,n为随机选取的块级特征的数目,X=[x1,x2,…,xn]为随机选取的块级特征形成的矩阵,编码矩阵C=[c1,c2,…,cn],基于码书块稀疏的非负稀疏编码模型的目标函数如下:
min C , D F ( C , D ) = 1 2 | | X - D C | | F 2 + λ | | C | | m 1 + γ Σ i = 1 k Σ g = 1 b | | d i , G g | | 2
s.t.C≥0
其中:‖di2=1,即码书每一列的模长或L-2范数为1;‖·‖F表示矩阵的F-范数,即矩阵中所有元素的平方和的平方根;表示矩阵的m1范数,即矩阵的所有元素的绝对值的和;C≥0表示矩阵C中每一个元素都是非负的;λ和γ均为权重系数;表示码书的第i列的第g个分块。
本发明进一步的改进在于,步骤4)的具体实现方法如下:
401)根据步骤2)中随机地选取10万至50万的块级特征,形成矩阵X;给定权重系数λ和γ的值,其中,0.01≤λ≤0.5,0.001≤γ≤0.5;
402)初始化码书D,并对码书的每一列做归一化:
随机初始化码书D,将码书D中的每一个元素都随机初始为-0.5至0.5之间的一个随机数,由将码书D的每一列的模长归一化成1;
403)随机初始化相应的编码矩阵C,将编码矩阵C中的每一个元素都初始化为0到1之间的一个随机数;
404)固定最新的码书D,优化编码矩阵C;
405)固定最新编码矩阵C,优化码书D;
406)重复步骤404)和405),直到目标函数值前后两次的相对改变量小于10-6
本发明进一步的改进在于,步骤404)的具体实现方法如下:
步骤1:使用编码矩阵C的最新值,执行步骤2的更新式;
步骤2:更新式为
其中,符号←表示赋值符号,即将右边变量的值赋给左边的变量;符号和⊙分别表示Hardmard乘和除,即矩阵的点乘和点除;开方函数sqrt(·)作用于矩阵表示对相应矩阵的每个分量元素都做开方运算;H是与C同阶的元素全为1的矩阵;对于任意一个矩阵M,M+=max(M,0),M-=-min(M,0),同开方函数sqrt(·)一样,max(·)和min(·)表示分别把矩阵的每个元素与0作比较,取相应的最大或最小元素;
步骤3:如果C的前后两次的更新值之差的F-范数小于事先给定的阈值ε则停止迭代,其中,ε=106;否则转步骤1。
本发明进一步的改进在于,步骤405)的具体实现方法如下:
步骤1:输入待编码的特征矩阵X;
步骤2:t=1,初始化辅助变量L0>0,η>1,将码书D的最新值记为D(0),D(t)表示码书的第t次迭代值;
步骤3:记W(t)表示与D同阶的辅助矩阵W的第t次迭代值,W(1)=D(0),βt表示辅助变量β的第t次迭代值,β1=1;
步骤4:令k=0;
步骤5:令L=ηkL0
步骤6:D(t)=PL(W(t));
其中, P L ( W ) = arg m i n D Q L ( D , W ) ,
Q L ( D , W ) = f ( W ) + < D - W , &dtri; D f ( W ) > + L 2 | | D - W | | F 2 + g ( D ) , 这里<A,B>=Tr(ATB)表示矩阵的内积,Tr(·)表示矩阵的迹,ρ>0表示惩罚系数, g ( D ) = &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2 , &dtri; D f ( D ) = - XC T + DCC T + 4 &rho; D ( B - I ) ; B = d i a g ( d 1 T d 1 , d 2 T d 2 , ... , d k T d k ) , 即对角元素分别是 d 1 T d 1 , d 2 T d 2 , ... , d k T d k 的对角矩阵,I是k×k的单位矩阵;
步骤7:如果E(D(t))≤QL(D(t),W(t)),则令L0=L,执行下一步;否则令k=k+1,执行步骤5;
其中E(D(t))=f(D)+g(D);
步骤8:如果‖D(t)-D(t-1)‖<10-6,D=D(t),停止迭代;否则,执行下一步;
步骤9:令 &beta; t + 1 = 1 + 1 + 4 &beta; t 2 2 ;
步骤10:令 W ( t + 1 ) = D ( t ) + &beta; t - 1 &beta; t + 1 ( D ( t ) - D ( t - 1 ) ) ;
步骤11;令t=t+1,执行步骤4。
本发明进一步的改进在于,步骤6的具体实现方法如下:
经过运算可得 P L ( W ) = arg m i n D { g ( D ) + L 2 | | D - ( W - 1 L &dtri; D f ( W ) ) | | F 2 }
V = W - 1 L &dtri; D f ( W ) ) , P L ( W ) = arg m i n D { g ( D ) + L 2 | | D - V | | F 2 }
于是有
其中,是V中与相对应的分块,
本发明进一步的改进在于,步骤5)中,该图像数据集块级特征的码书D求解出来后,固定码书D,对块级特征x按照来计算块级特征x的基于码书块稀疏的非负稀疏编码。
本发明进一步的改进在于,步骤7)中,按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,其实现方法和步骤4)中求解该图像数据集块级特征的码书的方法一样。
相对于现有技术,本发明具有如下的优点:
本发明根据所要编码的特征的特点,将待学习的码书的每一个基(即每一列)设计成分块稀疏的结构,提出了基于码书块稀疏的非负稀疏编码模型;提出了求解块稀疏码书的快速方法。应用中,首先提取图像的块级特征,对块级特征进行基于码书块稀疏的非负稀疏编码,然后对编码进行空间金字塔最大池化整合(SPMpooling),得到图像的初级特征向量。再次,按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征的码书,对空间金字塔最大池化后的初级特征再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量,用于计算机视觉任务。按照本发明所提出来的图像特征提取方法得到的编码特征向量有更好的判别性。
综上所述,相比较于传统的稀疏编码方法,本发明的方法所提取到的图像特征向量有更好的判别性,本发明还对块稀疏码书的求解提出了快速的算法,可操作性强。
附图说明:
图1:块稀疏结构的码书示意图,每一列被分成了若干块;
图2:空间金字塔最大池化的示意图;
图3:本发明基于码书块稀疏的非负稀疏编码的图像特征提取方法的流程图。
具体实施方式:
以下结合附图和实施例对本发明作进一步的详细说明。
如图3所示,本发明基于码书块稀疏的非负稀疏编码的图像特征提取方法,包括以下步骤:
(1):将待处理的图像数据集中所有图像按照一定大小的像素块(例如16×16像素大小的图像块)和事先确定的上下左右滑动步长(例如6像素的滑动步长),分别稠密地提取图像的块级特征(例如,HOG、SIFT、GIST特征)。
(2):从所提取的所有块级特征中,随机地选取n(例如,20万)个块级特征,所选取的全部特征形成一个矩阵,记为X=[x1,x2,…,xn];每一列xi∈Rp×1(i=1,2,…,n)表示一个块级特征向量p表示所提取的图像块级特征的维度,n为随机选取的块级特征的数目,这里所随机选取的全部块级特征用于求该数据集块级特征的码书,块稀疏结构的码书示意图如图1所示。
(3):设码书D=[d1,d2,…,dk],D∈Rp×k的每一列表示一个基向量,块级特征向量xj在基矩阵下相应的稀疏编码为cj,j=1,2,…,n,编码矩阵C=[c1,c2,…,cn],,下面给出基于码书块稀疏的非负稀疏编码模型的目标函数:
m i n C , D F ( C , D ) = 1 2 | | X - D C | | F 2 + &lambda; | | C | | m 1 + &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2
s.t.C≥0,‖di2=1,i=1,2,…,k.
其中,‖di2=1,即码书每一列的模长或L-2范数为1(向量的L-2范数等于其所有元素平方和的平方根),要求码书中的每一个基的模长为1是为了防止出现平凡解。‖·‖F表示矩阵的F-范数,即矩阵中所有元素的平方和的平方根。表示矩阵的m1范数,即矩阵的所有元素的绝对值的和。C≥0表示矩阵C中每一个元素都是非负的。目标函数中,第一项的作用是为了保证重构的特征与原特征尽可能的结构相似,是对重构失真的一种衡量。目标函数中的第二项是为了保证编码的稀疏性。目标函数中的第三项是为了保证码书的块稀疏性。假定码书的每列按照待编码的特征的特点被划分成了b个分块,码书的结构示意图见说明书附图1,表示码书的第i列的第g个分块。λ和γ为调节目标函数中各项的权重系数,在方法实现过程中,可以根据不同的数据集进行调节。我们要寻求最优的码书和相应的非负稀疏编码使得目标函数取得最小值。
(4):根据(2)中所选取的块级特征和(3)中的目标函数,求解块级特征的最优的码书。采用交替优化的策略来优化基于码书块稀疏的非负稀疏编码模型的目标函数,具体方案是:
第一步:给定所选取的块级特征,形成矩阵X;给定权重系数λ和γ的值。
第二步:初始化码书D,并对码书的每一列做归一化,将每列的模长化为1;
随机初始化码书D,将码书D中的每一个元素都随机初始为-0.5至0.5之间的一个随机数,由将码书D的每一列的模长归一化成1;
第三步:随机初始化相应的编码矩阵C,将C中的每一个元素都初始化为0到1之间的一个随机数;
第四步:固定最新的码书D,优化编码矩阵C;
第五步:固定最新编码矩阵C,优化码书D;;
重复执行第四步和第五步,直到目标函数值前后两次的相对改变量小于10-6
具体的分析与求解方案的过程如下:
F ( C , D ) = 1 2 | | X - D C | | F 2 + &lambda; | | C | | m 1 + &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2 可得
&part; F &part; C = &dtri; C F = - D T X + D T D C + &lambda; H
其中,H是与C同阶(即行数和列数都相等)的元素全为1的矩阵。
固定最新的码书D,优化编码矩阵C的优化方法如下:
步骤1:使用C的最新值,执行步骤2的更新式。
步骤2:
其中,符号←表示赋值符号,即将右边变量的值赋给左边的变量;符号和⊙分别表示Hardmard乘和除,即矩阵的点乘和点除;开方函数sqrt(·)作用于矩阵表示对相应矩阵的每个分量元素都做开方运算;H是与C同阶(即行数和列数都相等)的元素全为1的矩阵;对于任意一个矩阵M,M+=max(M,0),M-=-min(M,0),同开方函数sqrt(·)一样,max(·)和min(·)表示分别把矩阵的每个元素与0作比较,取相应的最大或最小元素;
步骤3:如果C的前后两次的更新值之差的F-范数小于事先给定的阈值ε(ε一般取10-6)则停止迭代;否则转步骤1。
当固定最新编码矩阵C时,优化码书D,问题就转化为
D = arg m i n D 1 2 | | X - D C | | F 2 + &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2
s.t.‖di2=1,i=1,2,…,k.
其中,约束条件‖di2=1要求码书的每一列的模长为1,本发明将关于码书的约束问题通过惩罚函数法转化为无约束问题。
D = arg m i n D 1 2 | | X - D C | | F 2 + &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2 + &rho; &Sigma; i = 1 k ( d i T d i - 1 ) 2
其中,ρ>0表示惩罚系数。
f ( D ) = 1 2 | | X - D C | | F 2 + &rho; &Sigma; i = 1 k ( d i T d i - 1 ) 2 , g ( D ) = &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2 ,
E(D)=f(D)+g(D)。
&dtri; D f ( D ) = - XC T + DCC T + 4 &rho; D ( B - I ) ,
其中, B = d i a g ( d 1 T d 1 , d 2 T d 2 , ... , d k T d k ) , 即对角元素分别是 d 1 T d 1 , d 2 T d 2 , ... , d k T d k 的对角矩阵,I是k×k的单位矩阵。
设W是与D同阶的矩阵,在W附近,E(D)可以近似等于
Q L ( D , W ) = f ( W ) + < D - W , &dtri; D f ( W ) > + L 2 | | D - W | | F 2 + g ( D )
其中,<A,B>=Tr(ATB)表示矩阵的内积,Tr(·)表示矩阵的迹(对角元素的和),定义
P L ( W ) = arg m i n D Q L ( D , W )
经过运算可得
P L ( W ) = arg m i n D { g ( D ) + L 2 | | D - ( W - 1 L &dtri; D f ( W ) ) | | F 2 } .
V = W - 1 L &dtri; D f ( W ) ) , P L ( W ) = arg min D { g ( D ) + L 2 | | D - V | | F 2 } , 经过计算可以得到D最优解为
这里,是V中与相对应的分块。
固定C,优化D,的优化方法如下:
步骤1:输入待编码的特征矩阵X;
步骤2:t=1,初始化辅助变量L0>0,η>1,将码书D的最新值记为D(0),D(t)表示码书的第t次迭代值;
步骤3:记W(t)表示与D同阶的辅助矩阵W的第t次迭代值,W(1)=D(0),βt表示辅助变量β的第t次迭代值,β1=1;
步骤4:令k=0;
步骤5:令L=ηkL0
步骤6:D(t)=PL(W(t));
步骤7:如果E(D(t))≤QL(D(t),W(t)),则令L0=L,执行下一步;否则令k=k+1,执行步骤5;
步骤8:如果‖D(t)-D(t-1)‖<10-6,D=D(t),停止迭代;否则,执行下一步;
步骤9:令 &beta; t + 1 = 1 + 1 + 4 &beta; t 2 2 ;
步骤10:令 W ( t + 1 ) = D ( t ) + &beta; t - 1 &beta; t + 1 ( D ( t ) - D ( t - 1 ) ) ;
步骤11;令t=t+1,执行步骤4。
(5):固定码书D,然后对块级特征按照基于码书块稀疏的非负稀疏编码模型计算相应的稀疏编码,即将目标函数中的码书D固定,按照 min c &GreaterEqual; 0 1 2 | | x - D c | | 2 2 + &lambda; | | c | | m 1 来块级特征x的基于码书块稀疏的非负稀疏编码。计算方法同(4)中的固定码书D优化C的方法相同。
(6):对图像数据集每张图像的编码进行空间金字塔最大池化方法整合,得到每张图像的初级特征向量。
如图2所示,空间金字塔最大池化(SPMmaxpooling):空间金字塔就是将原图像分别划分成的网格,一般划分成1×1、2×2、4×4的网格,每个网格可以看成一个较大的图像块。在每个图像块内,对其所有块级特征的稀疏编码在每一维上进行最大池化,即在每一个维上,池化的结果是块内相应的所有稀疏编码相应维上绝对值的最大值。每个网格池化后可以得到相应划分图像块上的特征向量,将所有网格或图像块上池化后的特征向量拼接到一起,所得到的一个高维的特征就是该整幅图片的初级特征向量,这个操作过程就称为空间金字塔最大池化。空间金字塔最大池化的示意图见说明书附图2。
(7)按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,对空间金字塔最大池化后的初级特征向量再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量,用于计算机视觉任务。

Claims (10)

1.基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,包括以下步骤:
1)对待处理的图像数据集中所有图像分别稠密地提取块级特征;
2)对待处理的图像数据集中所有图像提取完块级特征后,随机地选取10万至50万的块级特征用于求该待处理的图像数据集块级特征的码书;
3)建立基于码书块稀疏的非负稀疏编码模型;
4)根据步骤2)和步骤3),用随机选取的块级特征来求解出该图像数据集块级特征的码书;
5)该图像数据集块级特征的码书求解出来后,固定码书,对所有的块级特征进行基于码书块稀疏的非负稀疏编码;
6)对图像数据集每张图像的编码进行空间金字塔最大池化方法整合,得到每张图像的初级特征向量;
7)按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,对空间金字塔最大池化后的初级特征向量再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量,用于计算机视觉任务。
2.根据权利要求1所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤1)中,对待处理的图像数据集中所有图像按照16至32的像素块以及6至10的滑动步长,稠密地提取每个图像的块级特征。
3.根据权利要求1所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤3)中,块级特征编码是非负的,码书的每一列是分块稀疏的。
4.根据权利要求1所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤3)中,设码书为D=[d1,d2,…,dk],D∈Rp×k的每一列表示一个基向量,块级特征向量xj在基矩阵下相应的稀疏编码为cj,j=1,2,…,n,n为随机选取的块级特征的数目,X=[x1,x2,…,xn]为随机选取的块级特征形成的矩阵,编码矩阵C=[c1,c2,…,cn],基于码书块稀疏的非负稀疏编码模型的目标函数如下:
m i n C , D F ( C , D ) = 1 2 | | X - D C | | F 2 + &lambda; | | C | | m 1 + &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2
s.t.C≥0
其中:||di||2=1,即码书每一列的模长或L-2范数为1;||·||F表示矩阵的F-范数,即矩阵中所有元素的平方和的平方根;表示矩阵的m1范数,即矩阵的所有元素的绝对值的和;C≥0表示矩阵C中每一个元素都是非负的;λ和γ均为权重系数;表示码书的第i列的第g个分块。
5.根据权利要求4所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤4)的具体实现方法如下:
401)根据步骤2)中随机地选取10万至50万的块级特征,形成矩阵X;给定权重系数λ和γ的值,其中,0.01≤λ≤0.5,0.001≤γ≤0.5;
402)初始化码书D,并对码书的每一列做归一化:
随机初始化码书D,将码书D中的每一个元素都随机初始为-0.5至0.5之间的一个随机数,由将码书D的每一列的模长归一化成1;
403)随机初始化相应的编码矩阵C,将编码矩阵C中的每一个元素都初始化为0到1之间的一个随机数;
404)固定最新的码书D,优化编码矩阵C;
405)固定最新编码矩阵C,优化码书D;
406)重复步骤404)和405),直到目标函数值前后两次的相对改变量小于10-6
6.根据权利要求5所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤404)的具体实现方法如下:
步骤1:使用编码矩阵C的最新值,执行步骤2的更新式;
步骤2:更新式为
其中,符号←表示赋值符号,即将右边变量的值赋给左边的变量;符号分别表示Hardmard乘和除,即矩阵的点乘和点除;开方函数sqrt(·)作用于矩阵表示对相应矩阵的每个分量元素都做开方运算;H是与C同阶的元素全为1的矩阵;对于任意一个矩阵M,M+=max(M,0),M-=-min(M,0),同开方函数sqrt(·)一样,max(·)和min(·)表示分别把矩阵的每个元素与0作比较,取相应的最大或最小元素;
步骤3:如果C的前后两次的更新值之差的F-范数小于事先给定的阈值ε则停止迭代,其中,ε=106;否则转步骤1。
7.根据权利要求5所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤405)的具体实现方法如下:
步骤1:输入待编码的特征矩阵X;
步骤2:t=1,初始化辅助变量L0>0,η>1,将码书D的最新值记为D(0),D(t)表示码书的第t次迭代值;
步骤3:记W(t)表示与D同阶的辅助矩阵W的第t次迭代值,W(1)=D(0),βt表示辅助变量β的第t次迭代值,β1=1;
步骤4:令k=0;
步骤5:令L=ηkL0
步骤6:D(t)=PL(W(t));
其中, P L ( W ) = arg m i n D Q L ( D , W ) ,
Q L ( D , W ) = f ( W ) + < D - W , &dtri; D f ( W ) > + L 2 | | D - W | | F 2 + g ( D ) , 这里<A,B>=Tr(ATB)表示矩阵的内积,Tr(·)表示矩阵的迹,ρ>0表示惩罚系数, g ( D ) = &gamma; &Sigma; i = 1 k &Sigma; g = 1 b | | d i , G g | | 2 , &dtri; D f ( D ) = - XC T + DCC T + 4 &rho; D ( B - I ) ; 即对角元素分别是的对角矩阵,I是k×k的单位矩阵;
步骤7:如果E(D(t))≤QL(D(t),W(t)),则令L0=L,执行下一步;否则令k=k+1,执行步骤5;
其中E(D(t))=f(D)+g(D);
步骤8:如果D=D(t),停止迭代;否则,执行下一步;
步骤9:令 &beta; t + 1 = 1 + 1 + 4 &beta; t 2 2 ;
步骤10:令 W ( t + 1 ) = D ( t ) + &beta; t - 1 &beta; t + 1 ( D ( t ) - D ( t - 1 ) ) ;
步骤11;令t=t+1,执行步骤4。
8.根据权利要求7所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤6的具体实现方法如下:
经过运算可得 P L ( W ) = arg m i n D { g ( D ) + L 2 | | D - ( W - 1 L &dtri; D f ( W ) ) | | F 2 }
V = W - 1 L &dtri; D f ( W ) ) , P L ( W ) = arg m i n D { g ( D ) + L 2 | | D - V | | F 2 }
于是有
其中,是V中与相对应的分块,
9.根据权利要求8所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤5)中,该图像数据集块级特征的码书D求解出来后,固定码书D,对块级特征x按照来计算块级特征x的基于码书块稀疏的非负稀疏编码。
10.根据权利要求9所述的基于码书块稀疏的非负稀疏编码的图像特征提取方法,其特征在于,步骤7)中,按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,其实现方法和步骤4)中求解该图像数据集块级特征的码书的方法一样。
CN201510567121.9A 2015-09-08 2015-09-08 基于码书块稀疏的非负稀疏编码的图像特征提取方法 Active CN105224944B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510567121.9A CN105224944B (zh) 2015-09-08 2015-09-08 基于码书块稀疏的非负稀疏编码的图像特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510567121.9A CN105224944B (zh) 2015-09-08 2015-09-08 基于码书块稀疏的非负稀疏编码的图像特征提取方法

Publications (2)

Publication Number Publication Date
CN105224944A true CN105224944A (zh) 2016-01-06
CN105224944B CN105224944B (zh) 2018-10-30

Family

ID=54993904

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510567121.9A Active CN105224944B (zh) 2015-09-08 2015-09-08 基于码书块稀疏的非负稀疏编码的图像特征提取方法

Country Status (1)

Country Link
CN (1) CN105224944B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866421A (zh) * 2010-01-08 2010-10-20 苏州市职业大学 基于离散度约束非负稀疏编码的自然图像特征提取方法
US20120219213A1 (en) * 2011-02-28 2012-08-30 Jinjun Wang Embedded Optical Flow Features

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101866421A (zh) * 2010-01-08 2010-10-20 苏州市职业大学 基于离散度约束非负稀疏编码的自然图像特征提取方法
US20120219213A1 (en) * 2011-02-28 2012-08-30 Jinjun Wang Embedded Optical Flow Features

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIANCHAO YANG ET AL: "Linear spatial pyramid matching using sparse coding for image classification", 《2009 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
ZHANG YONGQIN ET AL: "Learning block-structured incoherent dictionaries for sparse representation", 《SCIENCE CHINA INFORMATION SCIENCES》 *
李钱钱: "基于改进的非负稀疏编码图像分类研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *
韩启强: "基于结构化信息和稀疏编码的图像分类研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Also Published As

Publication number Publication date
CN105224944B (zh) 2018-10-30

Similar Documents

Publication Publication Date Title
DE112016004266B4 (de) Verfahren zur Gesichtsausrichtung
CN111369487B (zh) 一种高光谱和多光谱图像融合方法、系统及介质
Ahn et al. Image super-resolution via progressive cascading residual network
CN103150713B (zh) 利用图像块分类稀疏表示与自适应聚合的图像超分辨方法
Wang et al. Exploring linear relationship in feature map subspace for convnets compression
CN103077511B (zh) 基于字典学习和结构相似的图像超分辨率重建方法
CN111523546A (zh) 图像语义分割方法、系统及计算机存储介质
CN113870124B (zh) 基于弱监督的双网络互激励学习阴影去除方法
CN110428424B (zh) 基于深度学习的雷达回波图像高压线分割方法
CN103020912A (zh) 一种结合波段聚类和稀疏表达的遥感影像复原方法
CN105427259A (zh) 多方向加权tv和非局部自相似性正则化图像去模糊方法
CN111161201A (zh) 基于细节增强通道注意力的红外与可见光图像融合方法
CN112699838B (zh) 基于光谱诊断特征加权的高光谱混合像元非线性盲分解方法
CN113111716A (zh) 一种基于深度学习的遥感影像半自动标注方法和装置
Sertoglu et al. Scalable Bayesian nonparametric dictionary learning
Wang et al. Deep global generalized gaussian networks
CN105260736A (zh) 基于归一化非负稀疏编码器的图像快速特征表示方法
CN105224943A (zh) 基于多线索归一化非负稀疏编码器的图像快速特征表示方法
CN106886793A (zh) 基于判别信息和流形信息的高光谱图像波段选择方法
CN111179272B (zh) 一种面向道路场景的快速语义分割方法
CN116258632A (zh) 一种基于文本辅助的文本图像超分辨率重建方法
CN115937693A (zh) 一种基于遥感图像的道路识别方法及系统
CN114331976A (zh) 一种基于多级张量先验约束的高光谱异常检测方法
CN111860356B (zh) 基于非线性投影字典对学习的极化sar图像分类方法
CN105184320B (zh) 基于结构相似度的非负稀疏编码的图像分类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant