CN102968635A - 一种基于稀疏编码的图像视觉特征提取方法 - Google Patents

一种基于稀疏编码的图像视觉特征提取方法 Download PDF

Info

Publication number
CN102968635A
CN102968635A CN2012104855940A CN201210485594A CN102968635A CN 102968635 A CN102968635 A CN 102968635A CN 2012104855940 A CN2012104855940 A CN 2012104855940A CN 201210485594 A CN201210485594 A CN 201210485594A CN 102968635 A CN102968635 A CN 102968635A
Authority
CN
China
Prior art keywords
picture
sparse coding
picture set
matrix
alpha
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104855940A
Other languages
English (en)
Other versions
CN102968635B (zh
Inventor
丁贵广
周继乐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201210485594.0A priority Critical patent/CN102968635B/zh
Publication of CN102968635A publication Critical patent/CN102968635A/zh
Application granted granted Critical
Publication of CN102968635B publication Critical patent/CN102968635B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种基于稀疏编码的图像视觉特征提取方法,属于计算机数字图像处理技术领域。首先提取图片集的底层特征;除去频率过低的标签,生成一个标签向量;生成一个底层特征相似性矩阵W作为流形约束的基础,从本质上结合底层视觉特征和高层文本特征;建立一个目标函数;对目标函数最小化,得到图片集底层特征稀疏编码构成的最优矩阵。本发明方法中,采用稀疏编码,不仅很好地挖掘图像的底层视觉特征以及高层文本的潜藏类别信息,而且使模型具有良好的鲁棒性;本方法采用最大化池方法,得到每一幅图片的唯一图像视觉特征向量;该方法保证了最终图像视觉特征简单有效。

Description

一种基于稀疏编码的图像视觉特征提取方法
技术领域
本发明涉及一种基于稀疏编码的图像视觉特征提取方法,属于计算机数字图像处理技术领域。
背景技术
图像视觉特征是计算机视觉领域为了使机器学习、感知图像而对图像进行的一种编码,视觉特征以分为全局特征和局部特征两种,常用的全局特征有颜色特征、纹理特征等,最常用的局部特征是尺度不变特征(Scale invariant feature transform,以下简称SIFT特征)。
稀疏编码是利用一组超完备的基去尽可能稀疏地表达一个向量的一种编码技术,现已广泛应用于压缩感知、图像修复、人脸识别等机器学习的各个领域,且取得了很好的效果。稀疏编码在图像处理领域的成功主要是由于两个原因:
(1)自然图片具有稀疏结构。基于人类视觉,一幅自然图片一般可以被少数几个基本结构描述——比如,边,线或者其他特征元素。当使用一组log-Gabor滤波器对图片过滤,并统计结果直方图,可以发现陡峭的尖峰,这说明图片具有稀疏结构。
(2)稀疏表达对噪声和其他退化情况具有更鲁棒的性质。这是因为,对于一组过完备的基,编码方式有无数种——而在完备情况下,编码方式只有一种——很难相信,先验知识(即词典)可以完全确定一幅图像。数值实验表明,当图像发生微小的平移或缩放操作时,稀疏编码系数只是在那些非0项附近平滑变动;而在完备编码的情况下,系数会发会很大的变化。
由于在图像处理领域的极大成功,稀疏编码成为广泛使用的技术之一。在学术界,对于图像数据具有稀疏结构已达成共识。
互联网图像一般有三方面的信息:图像的内容信息,图像数据分布的结构信息以及图像周围的短文本信息。图像的内容信息一般可由底层视觉特征(如SIFT特征)表达,图像数据分布的结构信息一般可以由流形技术挖掘,图像周围的短文本信息最常见的就是标签信息。但是目前缺乏一种将三种信息有效融合的技术手段。由于短文本蕴含的信息量非常有限,比如不能使用基于长文本广泛使用的多视觉(MultiView)思想,人们通常的做法是:
人们在考虑图像信息与短文本信息融合的时候,通常只会考虑层次模型。比如在图像检索中,人们通常使用谷歌的检索技术针对图像的标签进行第一次检索,然后基于第一次检索的结果再利用图像的视觉特征进行第二次检索,从而返回更精确的结果;
在图像分类中,人们通常提取出图像的视觉特征,比如SIFT特征,再做一次处理,比如利用概率潜藏语义分析(Probabilistic Latent Semantic Analysis)进行主题挖掘,然后利学支持向量机的多核理论,使用基于图像数据的核和标签的核的凸组合作为分类器的核分类。
这上述模型从本质上都是将两个特征分开讨论,而实际上它们是互相联系的,标签与图像内容必然存在语义的联系。
发明内容
本发明的目的是提出一种基于稀疏编码的互联网图像特征提取方法,将互联网图像的内容信息,图像数据分布的结构信息以及图像周围的文本信息有效融合,使提取出的特征能有效地表达图像语义。
本发明提出的基于稀疏编码的图像视觉特征提取方法,包括以下步骤:
(1)设图片集中共有N幅图片,提取图片集的底层特征,其中第i幅图片的底层特征集为
Figure GDA00002459221400021
Figure GDA00002459221400022
其中
Figure GDA00002459221400023
是第i幅图片的第ki个底层特征,ki=1,2,...,
Figure GDA00002459221400024
Figure GDA00002459221400025
为集合
Figure GDA00002459221400026
中的元素个数,i=1,2,…,N;
(2)设定一个图片集中标签出现频率的阈值,将图片集中出现频率低于设定出现阈值的标签删除,图片集中第i幅图片的所有标签生成一个标签向量wi,i=1,2,…,N;
(3)生成一个底层特征相似性矩阵W,具体过程如下:
(3-1)按下式计算底层特征集中任意两个底层特征之间的欧式距离:
| | f i ( k i ) - f j ( k j ) | | 2 2
其中,ki=1….,
Figure GDA00002459221400028
kj=1….,
Figure GDA00002459221400029
i,j=1….,N,||·||2是向量的2范数;
(3-2)选择与底层特征
Figure GDA000024592214000210
距离最近的前k0个底层特征作为
Figure GDA000024592214000211
的k0近邻,并将k0个近邻底层特征记为集合
Figure GDA000024592214000212
(3-3)设定一个图片集底层特征相似性核函数K(·,·);
(3-4)根据上述设定的核函数,按下式计算相似性矩阵W的每一个元素:
W ij ( k i , k j ) = K ( f i ( k i ) , f j ( k j ) ) if f j ( k j ) ∈ δ k 0 ( f i ( k i ) ) 0 else ;
(4)建立一个目标函数G(θ,B,α,D):
G ( θ , B , α , D ) = Σ i Σ k i ( 1 2 | | f i ( k i ) - Dα i ( k i ) | | 2 2 + λ 1 | | α i ( k i ) | | 1 )
+ λ 2 Σ i Σ j ≠ i Σ k i Σ k j ( θ j T θ i ) | | α i ( k i ) - α j ( k j ) | | 2 2 W ij ( k i , k j )
+ λ 3 Σ i ( 1 2 | | w i - Bθ i | | 2 2 + λ 4 | | θ i | | 1 )
其中,
Figure GDA00002459221400035
是图片集中第i幅图片的第ki个底层特征
Figure GDA00002459221400036
的稀疏编码,D是图片集底层特征的基矩阵;α是图片集底层特征稀疏编码构成的矩阵,
Figure GDA00002459221400037
θi是图片集中第i幅图像的标签向量wi的稀疏编码,
Figure GDA00002459221400038
为向量θj的转置,θ=[θ1,…,θN]是标签向量的稀疏编码构成的矩阵,B是图片集中标签的基矩阵,||·||2是向量的2范数,||·||1是向量的1范数,λ1是图片集底层特征稀疏编码的稀疏性惩罚系数,λ1为大于或等于零的数,λ2是图片集底层特征的流形惩罚系数,λ2为大于或等于零的数,λ3是图片集标签稀疏编码的惩罚系数,λ3为大于或等于零的数,λ4是图片集标签稀疏编码的稀疏性惩罚系数,λ4为大于或等于零的数;
(5)对上述目标函数G(θ,B,α,D)最小化,得到图片集底层特征稀疏编码构成的最优矩阵α*,包括以下步骤:
(5-1)设目标函数G(θ,B,α,D)中的标签向量稀疏编码矩阵和图片集中标签的基矩阵B为常数,采用凸优化方法,分别迭代求解图片集底层特征稀疏编码构成的矩阵α以及图片集底层特征的基矩阵D;
(5-2)设目标函数G(θ,B,α,D)中的图片集底层特征稀疏编码构成的矩阵α和图片集底层特征的基矩阵D为常数,采用凸优化方法,分别迭代求解出标签向量稀疏编码矩阵θ以及图片集中标签的基矩阵B;
(5-3)重复步骤(5-1)和(5-2),直到目标函数G(θ,B,α,D)的相对改变量小于10-6,并从该目标函数G(θ,B,α,D)中得到图片集底层特征稀疏编码构成的最优矩阵
Figure GDA00002459221400041
(6)根据上述图片集底层特征稀疏编码构成的最优矩阵α*,得到子矩阵Ai
Figure GDA00002459221400042
子矩阵Ai为第i幅图片的底层特征集
Figure GDA00002459221400043
的稀疏编码矩阵;
(7)采用最大化池方法,得到第i幅图片的图像视觉特征zi,i=1,…,N,包括以下步骤:
(7-1)设图片集底层特征稀疏编码向量为d维,则第i幅图片的底层特征稀疏编码矩阵Ai的转置为 A i T = [ a i ( 1 ) , . . . , a i ( d ) ] , 其中
(7-2)构造一个函数使用最大化池方法,得到第i幅图片的底层特征稀疏编码矩阵
Figure GDA00002459221400047
的列上最大值的绝对值,并将该绝对值作为函数
Figure GDA00002459221400048
的函数值,
Figure GDA00002459221400049
函数
Figure GDA000024592214000410
Figure GDA000024592214000411
映射成第i幅图片的图像视觉特征zi
Figure GDA000024592214000412
本发明提出的基于稀疏编码的图像视觉特征提取方法,具有以下优点:
1、本方法提取出的特征具有广泛的应用,包括图像检索、场景摘要等等。
2、本方法使用稀疏编码能不仅能很好地挖掘图像的底层视觉特征以及高层文本的潜藏类别信息,而且使模型具有良好的鲁棒性。
3、本方法利用流形约束充分挖掘了图像数据分布的结构信息,而且作为底层视觉特征与高层文本特征的桥梁将两者从根本上结合,更好地表达了图像语义。
4、本方法基于最大化池技术使用一个向量表示一幅图像的高层特征,该特征简单有效,与大部分特征相比存储量大大降低。
5、本方法的模型具有较强的泛化能力,能处理多种情况的图像。
具体实施方式
本发明提出的基于稀疏编码的图像视觉特征提取方法,包括以下步骤:
(1)设图片集中共有N幅图片,提取图片集的底层特征,其中第i幅图片的底层特征集为 其中
Figure GDA000024592214000415
是第i幅图片的第ki个底层特征,ki=1,2,...,
Figure GDA000024592214000416
Figure GDA00002459221400051
为集合
Figure GDA00002459221400052
中的元素个数,i=1,2,…,N;
(2)设定一个图片集中标签出现频率的阈值,将图片集中出现频率低于设定出现阈值的标签删除,图片集中第i幅图片的所有标签生成一个标签向量wi,i=1,2,…,N;
(3)生成一个底层特征相似性矩阵W,具体过程如下:
(3-1)按下式计算底层特征集中任意两个底层特征之间的欧式距离:
| | f i ( k i ) - f j ( k j ) | | 2 2
其中,ki=1,...,kj=1,...,
Figure GDA00002459221400055
i,j=1,...,N,||·||2是向量的2范数;
(3-2)选择与底层特征
Figure GDA00002459221400056
距离最近的前k0个底层特征作为
Figure GDA00002459221400057
的k0近邻,并将k0个近邻底层特征记为集合
Figure GDA00002459221400058
(3-3)设定一个图片集底层特征相似性核函数K(·,·);
(3-4)根据上述设定的核函数,按下式计算相似性矩阵W的每一个元素:
W ij ( k i , k j ) = K ( f i ( k i ) , f j ( k j ) ) if f j ( k j ) ∈ δ k 0 ( f i ( k i ) ) 0 else ;
(4)建立一个目标函数G(θ,B,α,D):
G ( θ , B , α , D ) = Σ i Σ k i ( 1 2 | | f i ( k i ) - Dα i ( k i ) | | 2 2 + λ 1 | | α i ( k i ) | | 1 )
+ λ 2 Σ i Σ j ≠ i Σ k i Σ k j ( θ j T θ i ) | | α i ( k i ) - α j ( k j ) | | 2 2 W ij ( k i , k j )
+ λ 3 Σ i ( 1 2 | | w i - Bθ i | | 2 2 + λ 4 | | θ i | | 1 )
其中,
Figure GDA000024592214000513
是图片集中第i幅图片的第ki个底层特征
Figure GDA000024592214000514
的稀疏编码,D是图片集底层特征的基矩阵;α是图片集底层特征稀疏编码构成的矩阵,
Figure GDA000024592214000515
θi是图片集中第i幅图像的标签向量wi的稀疏编码,
Figure GDA000024592214000516
为向量θj的转置,θ-[θ1,...,θN]是标签向量的稀疏编码构成的矩阵,B是图片集中标签的基矩阵,||·||2是向量的2范数,||·||1是向量的1范数,λ1是图片集底层特征稀疏编码的稀疏性惩罚系数,λ1为大于或等于零的数,λ2是图片集底层特征的流形惩罚系数,λ2为大于或等于零的数,λ3是图片集标签稀疏编码的惩罚系数,λ3为大于或等于零的数,λ4是图片集标签稀疏编码的稀疏性惩罚系数,λ4为大于或等于零的数;
(5)对上述目标函数G(θ,B,α,D)最小化,得到图片集底层特征稀疏编码构成的最优矩阵α*,包括以下步骤:
(5-1)设目标函数G(θ,B,α,D中的标签向量稀疏编码矩阵和图片集中标签的基矩阵B为常数,则目标函数G(θ,B,α,D)变成了一个典型的带流形约束的稀疏编码问题,使用高效稀疏编码算法(Efficient sparse coding algorithms)介绍该算法及其出处,采用凸优化方法,分别迭代求解图片集底层特征稀疏编码构成的矩阵α以及图片集底层特征的基矩阵D;
(5-2)设目标函数G(θ,B,α,D)中的图片集底层特征稀疏编码构成的矩阵和图片集底层特征的基矩阵D为常数,则目标函数G(θ,B,α,D)变成了一个典型的带点积约束的稀疏编码问题,采用凸优化方法,分别迭代求解出标签向量稀疏编码矩阵θ以及图片集中标签的基矩阵B;
(5-3)重复步骤(5-1)和(5-2),直到目标函数G(θ,B,α,D)的相对改变量小于10-6,并从该目标函数G(θ,B,α,D)中得到图片集底层特征稀疏编码构成的最优矩阵
Figure GDA00002459221400061
(6)根据上述图片集底层特征稀疏编码构成的最优矩阵α*,得到子矩阵Ai子矩阵Ai为第i幅图片的底层特征集
Figure GDA00002459221400063
的稀疏编码矩阵;
(7)采用最大化池(Max Pooling)方法,得到第i幅图片的图像视觉特征zi,i=1,…,N,包括以下步骤:
(7-1)设图片集底层特征稀疏编码向量为d维,则第i幅图片的底层特征稀疏编码矩阵Ai的转置为 A i T = [ a i ( 1 ) , . . . , a i ( d ) ] , 其中
Figure GDA00002459221400065
(7-2)构造一个函数
Figure GDA000024592214000611
,使用最大化池方法,得到第i幅图片的底层特征稀疏编码矩阵
Figure GDA00002459221400066
的列上最大值的绝对值,并将该绝对值作为函数的函数值,
Figure GDA00002459221400068
函数
Figure GDA00002459221400069
映射成第i幅图片的图像视觉特征zi
Figure GDA00002459221400071
以下介绍本发明方法的一个实施例:
(1)假设共有两幅图像,分别有3个和2个SIFT特征,即
Figure GDA00002459221400072
尽管SIFT特征是128维的,这里为简单计,用5维代替,设:
f 1 ( 1 ) = ( 0.3,0.15,0.05,0.1,0.4 ) T
f 1 ( 2 ) = ( 0.3,0.2,0.01,0.1,0.39 ) T
f 1 ( 3 ) = ( 0.35,0.1,0.3,0.15,0.1 ) T
f 2 ( 1 ) = ( 0.55,0.09,0.3,0.01,0.05 ) T
f 2 ( 2 ) = ( 0.55,0.1,0.29,0.01,0.05 ) T
(2)设第一幅图片的标签分别为:海滩,狗,蓝天;第二幅图片的标签为蓝天,飞机。那么标签向量是4维的,用有序组(海滩,狗,蓝天,飞机)的指示向量表示:
w1=(1,1,1,0)T
w2=(0,0,1,1)T
(3)计算基于欧式距离的1近邻(也就是最近邻)。计算每两个特征之间的欧式距离。
(3-1)
Figure GDA00002459221400079
的1近邻是
Figure GDA000024592214000710
的1近邻是
Figure GDA000024592214000711
的1近邻是
Figure GDA000024592214000712
的1近邻是的1近邻是
Figure GDA000024592214000714
(3-2)设定核函数 K ( x , y ) = exp ( - | | x - y | | 2 2 ) ;
(3-3)计算相似性矩阵W,其中非0元为:
W 1,1 ( 1,2 ) = 0.99581 ;
W 1,1 ( 2 , 1 ) = 0.99581 ;
W 1,2 ( 3,1 ) = 0.95868 ;
W 2,2 ( 1,2 ) = 0.9998 ;
W 2,2 ( 2,1 ) = 0.9998 ;
其他都是0。
(4)建立目标函数G(θ,B,α,D)
(5)最小化目标函数G(θ,B,α,D),选定图片集底层特征的基矩阵列数为4,则可以解出:
α 1 * ( 1 ) = ( 0,0,0.8,0.2 ) T ;
α 1 * ( 2 ) = ( 0,0,0 . 7 , 0 . 3 ) T ;
α 1 * ( 3 ) = ( 0.4,0,0 , 0 . 6 ) T ;
α 2 * ( 1 ) = ( 0,0.5,0 , 0 . 5 ) T ;
α 2 * ( 1 ) = ( 0,0 . 4 , 0 , 0 . 6 ) T ;
(6)得到每幅图像的子矩阵 A 1 = [ α 1 * ( 1 ) , α 1 * ( 2 ) , α 1 * ( 3 ) ] , A 2 = [ α 2 * ( 1 ) , α 2 * ( 2 ) ]
(7)采用最大化池: A 1 T = [ a 1 ( 1 ) , a 1 ( 2 ) , a 1 ( 3 ) , a 1 ( 4 ) ] = 0 0 0.8 0.2 0 0 0.7 0.3 0.4 0 0 0.6 A 2 T = [ a 2 ( 1 ) , a 2 ( 2 ) , a 2 ( 3 ) , a 2 ( 4 ) ] = 0 0.5 0 0.5 0 0.4 0 0.6 对矩阵
Figure GDA000024592214000810
的每一列的绝对值取最大值,比如
Figure GDA000024592214000813

Claims (1)

1.一种基于稀疏编码的图像视觉特征提取方法,其特征在于该方法包括以下步骤:
(1)设图片集中共有N幅图片,提取图片集的底层特征,其中第i幅图片的底层特征集为
Figure FDA00002459221300011
其中
Figure FDA00002459221300013
是第i幅图片的第ki个底层特征,ki=1,2,...,
Figure FDA00002459221300014
Figure FDA00002459221300015
为集合
Figure FDA00002459221300016
中的元素个数,i=1,2,…,N;
(2)设定一个图片集中标签出现频率的阈值,将图片集中出现频率低于设定出现阈值的标签删除,图片集中第i幅图片的所有标签生成一个标签向量wi,i=1,2,…,N;
(3)生成一个底层特征相似性矩阵W,具体过程如下:
(3-1)按下式计算底层特征集中任意两个底层特征之间的欧式距离:
| | f i ( k i ) - f j ( k j ) | | 2 2
其中,ki=1,...,
Figure FDA00002459221300018
kj=1,...,
Figure FDA00002459221300019
i,j=1,...,N,||·||2是向量的2范数;
(3-2)选择与底层特征
Figure FDA000024592213000110
距离最近的前k0个底层特征作为
Figure FDA000024592213000111
的k0近邻,并将k0个近邻底层特征记为集合
Figure FDA000024592213000112
(3-3)设定一个图片集底层特征相似性核函数K(·,·);
(3-4)根据上述设定的核函数,按下式计算相似性矩阵W的每一个元素:
W ij ( k i , k j ) = K ( f i ( k i ) , f j ( k j ) ) if f j ( k j ) ∈ δ k 0 ( f i ( k i ) ) 0 else ;
(4)建立一个目标函数G(θ,B,α,D):
G ( θ , B , α , D ) = Σ i Σ k i ( 1 2 | | f i ( k i ) - Dα i ( k i ) | | 2 2 + λ 1 | | α i ( k i ) | | 1 )
+ λ 2 Σ i Σ j ≠ i Σ k i Σ k j ( θ j T θ i ) | | α i ( k i ) - α j ( k j ) | | 2 2 W ij ( k i , k j )
+ λ 3 Σ i ( 1 2 | | w i - Bθ i | | 2 2 + λ 4 | | θ i | | 1 )
其中,
Figure FDA000024592213000117
是图片集中第i幅图片的第ki个底层特征
Figure FDA000024592213000118
的稀疏编码,D是图片集底层特征的基矩阵;α是图片集底层特征稀疏编码构成的矩阵,
Figure FDA000024592213000119
θi是图片集中第i幅图像的标签向量wi的稀疏编码,
Figure FDA000024592213000120
为向量θj的转置,θ=[θ1,...,θN]是标签向量的稀疏编码构成的矩阵,B是图片集中标签的基矩阵,||·||2是向量的2范数,||·||1是向量的1范数,λ1是图片集底层特征稀疏编码的稀疏性惩罚系数,λ1为大于或等于零的数,λ2是图片集底层特征的流形惩罚系数,λ2为大于或等于零的数,λ3是图片集标签稀疏编码的惩罚系数,λ3为大于或等于零的数,λ4是图片集标签稀疏编码的稀疏性惩罚系数,λ4为大于或等于零的数;
(5)对上述目标函数G(θ,B,α,D)最小化,得到图片集底层特征稀疏编码构成的最优矩阵α*,包括以下步骤:
(5-1)设目标函数G(θ,B,α,D)中的标签向量稀疏编码矩阵和图片集中标签的基矩阵B为常数,采用凸优化方法,分别迭代求解图片集底层特征稀疏编码构成的矩阵α以及图片集底层特征的基矩阵D;
(5-2)设目标函数G(θ,B,α,D)中的图片集底层特征稀疏编码构成的矩阵和图片集底层特征的基矩阵D为常数,采用凸优化方法,分别迭代求解出标签向量稀疏编码矩阵θ以及图片集中标签的基矩阵B;
(5-3)重复步骤(5-1)和(5-2),直到目标函数G(θ,B,α,D)的相对改变量小于10-6,并从该目标函数G(θ,B,α,D)中得到图片集底层特征稀疏编码构成的最优矩阵
Figure FDA00002459221300021
(6)根据上述图片集底层特征稀疏编码构成的最优矩阵α*,得到子矩阵Ai
Figure FDA00002459221300022
子矩阵Ai为第i幅图片的底层特征集
Figure FDA00002459221300023
的稀疏编码矩阵;
(7)采用最大化池方法,得到第i幅图片的图像视觉特征zi,i=1,…,N,包括以下步骤:
(7-1)设图片集底层特征稀疏编码向量为d维,则第i幅图片的底层特征稀疏编码矩阵Ai的转置为 A i T = [ a i ( 1 ) , . . . , a i ( d ) ] , 其中
Figure FDA00002459221300025
(7-2)构造一个函数
Figure FDA00002459221300026
使用最大化池方法,得到第i幅图片的底层特征稀疏编码矩阵
Figure FDA00002459221300027
的列上最大值的绝对值,并将该绝对值作为函数
Figure FDA00002459221300028
的函数值,
Figure FDA00002459221300029
函数
Figure FDA000024592213000211
映射成第i幅图片的图像视觉特征zi
CN201210485594.0A 2012-11-23 2012-11-23 一种基于稀疏编码的图像视觉特征提取方法 Active CN102968635B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210485594.0A CN102968635B (zh) 2012-11-23 2012-11-23 一种基于稀疏编码的图像视觉特征提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210485594.0A CN102968635B (zh) 2012-11-23 2012-11-23 一种基于稀疏编码的图像视觉特征提取方法

Publications (2)

Publication Number Publication Date
CN102968635A true CN102968635A (zh) 2013-03-13
CN102968635B CN102968635B (zh) 2015-05-20

Family

ID=47798766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210485594.0A Active CN102968635B (zh) 2012-11-23 2012-11-23 一种基于稀疏编码的图像视觉特征提取方法

Country Status (1)

Country Link
CN (1) CN102968635B (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226714A (zh) * 2013-05-09 2013-07-31 山东大学 基于较大编码系数强化的稀疏编码方法
CN103268494A (zh) * 2013-05-15 2013-08-28 江苏大学 基于稀疏表示的寄生虫虫卵识别方法
CN104504406A (zh) * 2014-12-04 2015-04-08 长安通信科技有限责任公司 一种快速高效的近似重复图像匹配方法
CN104765878A (zh) * 2015-04-27 2015-07-08 合肥工业大学 一种适用于多模态信息的稀疏编码算法及其应用
CN105184260A (zh) * 2015-09-10 2015-12-23 北京大学 一种图像特征提取方法及行人检测方法及装置
CN105243400A (zh) * 2015-11-10 2016-01-13 中国矿业大学(北京) 基于极大值池化稀疏编码的煤岩识别方法
CN105354596A (zh) * 2015-11-10 2016-02-24 中国矿业大学(北京) 基于结构化稀疏编码的煤岩识别方法
CN105373797A (zh) * 2015-11-10 2016-03-02 中国矿业大学(北京) 基于平均池化稀疏编码的煤岩识别方法
CN105426857A (zh) * 2015-11-25 2016-03-23 小米科技有限责任公司 人脸识别模型训练方法和装置
CN105718883A (zh) * 2016-01-19 2016-06-29 中国人民解放军国防科学技术大学 一种基于稀疏因子分析的图像视觉属性挖掘方法
CN110363240A (zh) * 2019-07-05 2019-10-22 安徽威奥曼机器人有限公司 一种医学影像分类方法与系统
CN114677379A (zh) * 2022-05-31 2022-06-28 恒泰利康(西安)生物技术有限公司 基于人工智能的头皮脑电图致痫区的定位方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090089723A (ko) * 2008-02-19 2009-08-24 고려대학교 산학협력단 이미지의 크기불변특징 추출에 사용되는 이미지 신호필터링 방법 및 장치와 이를 이용한 이미지 특징 추출방법, 장치 및 기록매체
CN101866421A (zh) * 2010-01-08 2010-10-20 苏州市职业大学 基于离散度约束非负稀疏编码的自然图像特征提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090089723A (ko) * 2008-02-19 2009-08-24 고려대학교 산학협력단 이미지의 크기불변특징 추출에 사용되는 이미지 신호필터링 방법 및 장치와 이를 이용한 이미지 특징 추출방법, 장치 및 기록매체
CN101866421A (zh) * 2010-01-08 2010-10-20 苏州市职业大学 基于离散度约束非负稀疏编码的自然图像特征提取方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
尚丽等: "基于稀疏编码的自然图像特征提取及去噪", 《系统仿真学报》, vol. 17, no. 7, 31 July 2005 (2005-07-31) *
李志清等: "结构相似度稀疏编码及其图像特征提取", 《模式识别与人工智能》, vol. 23, no. 1, 28 February 2010 (2010-02-28), pages 17 - 22 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103226714B (zh) * 2013-05-09 2016-04-06 山东大学 基于较大编码系数强化的稀疏编码方法
CN103226714A (zh) * 2013-05-09 2013-07-31 山东大学 基于较大编码系数强化的稀疏编码方法
CN103268494A (zh) * 2013-05-15 2013-08-28 江苏大学 基于稀疏表示的寄生虫虫卵识别方法
CN103268494B (zh) * 2013-05-15 2016-06-15 江苏大学 基于稀疏表示的寄生虫虫卵识别方法
CN104504406A (zh) * 2014-12-04 2015-04-08 长安通信科技有限责任公司 一种快速高效的近似重复图像匹配方法
CN104504406B (zh) * 2014-12-04 2018-05-11 长安通信科技有限责任公司 一种快速高效的近似重复图像匹配方法
CN104765878A (zh) * 2015-04-27 2015-07-08 合肥工业大学 一种适用于多模态信息的稀疏编码算法及其应用
CN105184260B (zh) * 2015-09-10 2019-03-08 北京大学 一种图像特征提取方法及行人检测方法及装置
CN105184260A (zh) * 2015-09-10 2015-12-23 北京大学 一种图像特征提取方法及行人检测方法及装置
CN105373797A (zh) * 2015-11-10 2016-03-02 中国矿业大学(北京) 基于平均池化稀疏编码的煤岩识别方法
CN105354596A (zh) * 2015-11-10 2016-02-24 中国矿业大学(北京) 基于结构化稀疏编码的煤岩识别方法
CN105243400A (zh) * 2015-11-10 2016-01-13 中国矿业大学(北京) 基于极大值池化稀疏编码的煤岩识别方法
CN105354596B (zh) * 2015-11-10 2018-08-14 中国矿业大学(北京) 基于结构化稀疏编码的煤岩识别方法
CN105426857B (zh) * 2015-11-25 2019-04-12 小米科技有限责任公司 人脸识别模型训练方法和装置
CN105426857A (zh) * 2015-11-25 2016-03-23 小米科技有限责任公司 人脸识别模型训练方法和装置
CN105718883B (zh) * 2016-01-19 2019-01-15 中国人民解放军国防科技大学 一种基于稀疏因子分析的图像视觉属性挖掘方法
CN105718883A (zh) * 2016-01-19 2016-06-29 中国人民解放军国防科学技术大学 一种基于稀疏因子分析的图像视觉属性挖掘方法
CN110363240A (zh) * 2019-07-05 2019-10-22 安徽威奥曼机器人有限公司 一种医学影像分类方法与系统
CN110363240B (zh) * 2019-07-05 2020-09-11 浙江美迪克医疗科技有限公司 一种医学影像分类方法与系统
CN114677379A (zh) * 2022-05-31 2022-06-28 恒泰利康(西安)生物技术有限公司 基于人工智能的头皮脑电图致痫区的定位方法
CN114677379B (zh) * 2022-05-31 2022-08-16 恒泰利康(西安)生物技术有限公司 基于人工智能的头皮脑电图致痫区的定位方法

Also Published As

Publication number Publication date
CN102968635B (zh) 2015-05-20

Similar Documents

Publication Publication Date Title
CN102968635B (zh) 一种基于稀疏编码的图像视觉特征提取方法
Cao et al. Integration of 3-dimensional discrete wavelet transform and Markov random field for hyperspectral image classification
Yu et al. An efficient and lightweight convolutional neural network for remote sensing image scene classification
Hou et al. Change detection based on deep features and low rank
Zhao et al. Dirichlet-derived multiple topic scene classification model for high spatial resolution remote sensing imagery
Wu et al. A scene change detection framework for multi-temporal very high resolution remote sensing images
Masoumi et al. A spectral graph wavelet approach for nonrigid 3D shape retrieval
Zhou et al. High-resolution remote-sensing imagery retrieval using sparse features by auto-encoder
CN101673345B (zh) 基于形状先验的提取目标闭合轮廓的方法
Zhao et al. A 2-D wavelet decomposition-based bag-of-visual-words model for land-use scene classification
Hung et al. Image texture analysis
Bahmanyar et al. A comparative study of bag-of-words and bag-of-topics models of EO image patches
CN106021330B (zh) 一种用于混合轮廓线视图下的三维模型检索方法
Qayyum et al. Scene classification for aerial images based on CNN using sparse coding technique
Xia et al. Exploiting deep features for remote sensing image retrieval: A systematic investigation
CN103020647A (zh) 基于级联的sift特征和稀疏编码的图像分类方法
Liu et al. A deep residual learning serial segmentation network for extracting buildings from remote sensing imagery
CN107967480A (zh) 一种基于标签语义的显著对象提取方法
CN106022351A (zh) 一种基于非负字典对学习的鲁棒多视角聚类方法
Zhang et al. Image classification by search with explicitly and implicitly semantic representations
CN106203448A (zh) 一种基于非线性尺度空间的场景分类方法
Zhang et al. A multiple feature fully convolutional network for road extraction from high-resolution remote sensing image over mountainous areas
Alzu'Bi et al. Compact root bilinear cnns for content-based image retrieval
Shao et al. A Benchmark Dataset for Performance Evaluation of Multi-Label Remote Sensing Image Retrieval.
Johansson A survey on: Contents based search in image databases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant