CN106951873A - 一种遥感图像目标识别方法 - Google Patents
一种遥感图像目标识别方法 Download PDFInfo
- Publication number
- CN106951873A CN106951873A CN201710183174.XA CN201710183174A CN106951873A CN 106951873 A CN106951873 A CN 106951873A CN 201710183174 A CN201710183174 A CN 201710183174A CN 106951873 A CN106951873 A CN 106951873A
- Authority
- CN
- China
- Prior art keywords
- remote sensing
- matrix
- image
- point
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开一种遥感图像目标识别方法。包括以下步骤:首先选取典型类别目标的遥感图像构建训练集;接着从训练集中分别提取目标图像的尺度不变特征转换(简称“SIFT”)特征;然后利用谱聚类算法生成视觉词典;再用局部加权向量化的方法对每个图像的特征进行字典的重构编码;最后选取合适的分类器完成图像的分类任务。本发明能够有效提升图像分类识别的精度,提高遥感目标检测识别的效率。
Description
技术领域
本发明涉及一种基于改进视觉词包模型的遥感图像目标识别方法,属于图像识别技术领域。
背景技术
近年来,遥感技术取得了巨大的进步。伴随着遥感影像获取技术的不断进步和遥感影像数量的不断增长,已有的图像分析处理能力根本无法满足海量遥感影像数据处理的需求。如何从复杂背景干扰、目标特征不稳定且包含海量信息的遥感影像中快速准确地自动获取感兴趣信息的问题,已日渐成为当今遥感影像技术发展的热点与难点之一。再者,借助遥感图像检测识别目标,在军事国防方面和民用方面都有广泛的应用前景。
视觉词包模型起源于词包模型。词包模型起源于文本分类领域,它的主要思想是通过生成样本数据的特征字典,对每个文本样本进行字典的统一向量表达。近年来,视觉词包模型在图像分类领域得到了广泛的应用。现有的视觉词包模型在遥感目标识别方面,在一定程度上,能够提高目标检测识别的效率,但是仍存在很大的局限性。因此对现有视觉词包模型进行改进,从而实现更高效、更快完成目标检测识别具有十分重要的现实意义。
发明内容
发明目的:为了克服上述现有技术的不足,本发明提供了一种基于改进视觉词包模型的遥感图像目标识别方法,以提高目标检测识别的效率。
技术方案:一种基于改进视觉词包模型的遥感图像目标识别方法,包括下述步骤:
选取遥感图像构建训练集。
从训练集中分别提取目标图像的SIFT特征。
利用谱聚类算法生成视觉词典。所述谱聚类算法的步骤主要为:
(1)将每个特征向量视为图中的顶点,选取特征相似度准则,计算各个特征间的相似度值,作为顶点间的权重值,从而生成一个N×N的对称权值矩阵E,计算权值矩阵采用KNN方法,即仅计算每个点与其最近的k个点的权值;
(2)选取相应的图划分准则计算Laplacian矩阵L;根据二分大准则,将矩阵E每列元素相加,即得到该顶点的度。以所有度值为对角元素构成的对角矩阵即为度矩阵D。则Laplacian矩阵L=D-E;
(3)计算矩阵L的前K个特征值与特征向量,构建特征向量空间:将K个特征向量构造成N×K的矩阵M;
(4)把M的每一行作为新样本,对N个新样本进行K-means聚类处理。
用局部加权向量量化的方法对每个图像的特征进行字典的重构编码。所述局部加权向量量化的方法是指基于最近邻架构与向量量化编码方法提出的一种可在一定程度上提高向量的表达力与鉴别性的综合性方法。顶端的实心五边形表示字典中的一个视觉词汇,在两条曲线中间的几何图形代表特定图像提取的所有SIFT特征。不同粗细的直线代表相应特征与该词汇间的权值,只有那些最接近视觉词汇的特征才会被赋予较大的权值,而剩余特征则会分配到较小的权值。同时,这些特征到视觉词汇的距离也被用于计算相应的表示向量。根据上述的方法,通过计算每个视觉词汇到近邻特征的加权相似度,就可以直接得到给定图像的最终表示(向量表示)。
选取合适的分类器完成图像的分类任务。在KD-Tree(K-dimension tree的缩写)查询算法的基础上,基于加权近邻提出一种改进的KD-Tree分类查找算法,即在KD-Tree回溯查找时,记录每个回溯点,分别计算每个点相对于待查询点的权重,最后通过投票的方式,决策出待定点的类别。
本发明采用上述技术方案,具有以下有益效果:本发明对现有的视觉词包模型加以改进,能够精确描述遥感图像的细节部分,减少遥感目标图像块中背景噪声的影响,减少对未知目标图像的误判率,提升图像分类识别的精度,从而提高遥感目标检测识别的效率。
附图说明
图1为加权向量化编码方法的示意图;
图2为飞机目标图像块提取的SIFT特征图形化示例。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
基于改进视觉词包模型的遥感图像目标识别方法,具体步骤如下:
1、选取典型类别的目标的遥感图像构建训练集。
人工选取多种目标物的多幅遥感图像构建训练集。因为遥感影像训练集目标类别的大小尺度不一,所以每类目标图像所能提取的SIFT特征数量也有着巨大的差异。训练集中图像数量越多,能获取的特征信息也就越多。
2、从训练集中分别提取目标图像的SIFT特征。
沿用传统SIFT算法提取图像的SIFT特征。图2展示了飞机遥感影像块提取的SIFT特征。按如下步骤提取SIFT特征:
步骤1,尺度空间极值检测:搜索所有尺度上的图像I(x,y)位置。通过高斯微分函数来识别潜在的对于尺度和旋转不变的兴趣点。一幅图像的尺度空间L(x,y,σ),定义为原始图像I(x,y)与一个尺度可变的二维高斯函数的卷积运算(式3a):
L(x,y,σ)=G(x,y,σ)*I(x,y) (3a)
其中,G(x,y,σ)是尺度可变高斯函数(式3b):
(x,y)是空间地标,σ为高斯正态分布的方差即尺度坐标,m和n为两个常数。将多层高斯差分尺度空间函数(式4)邻接起来,通过两个相邻高斯尺度空间的图像相减,形成差分高斯金字塔(DoG)(式3c):
D(x,y,σ)=(G(x,y,kσ)-G(x,y,σ))*I(x,y)
=L(x,y,kσ)-L(x,y,σ) (3c)
其中k为相邻两个尺度空间的倍数的常数。
步骤2,DoG特征点定位:对尺度空间DoG函数进行曲线的三维二次函数拟合,根据点的稳定程度选择关键点。利用DoG函数在尺度空间的Taylor展开式(拟合函数)为:
其中,D为采样点处的极值,X为极值点相对采样点的偏移量,对X=(x,y,σ)T求导并让方程等于零,可以得到极值点的偏移量位置。采样点的主曲率和该点处的Hessian矩阵H的特征值成正比:
Tr(H)=Dxx+Dyy=α+β (5a)
Det(H)=DxxDyy-(Dxy)2=αβ (5b)
其中α是矩阵H的最大特征值,而β是矩阵H的最小特征值,Tr(H)为矩阵H的际,Det(H)表示矩阵行列式的值。利用矩阵的际及其行列式的值,可求得两个特征值的比值,即为两曲率的比值(式6)。令α=rβ,则
所以为了剔除边缘响应点,需要让该比值小于一定的阈值r。
步骤3,方向确定:基于图像局部的梯度方向,分配给每个关键点位置一个或多个方向。点(x,y)处梯度的模值(式7a)和方向(式7b)如下:
其中L表示每个关键点各自所在的尺度。使用直方图统计邻域内像素的梯度和方向。梯度直方图将0~360°的方向范围分为36个Bin,并以直方图中最大值作为该关键点的主方向。
步骤4,关键点描述:将关键点邻域作为一个处理单元,旋转该单元的梯度空间坐标使得特征描述具备旋转不变性。将该单元内的梯度值分配到8个方向上计算每个种子点八个方向的梯度,生成128(4×4×8)个梯度信息即为该关键点的特征向量。
3、利用谱聚类算法生成视觉词典。
谱聚类的本质是将聚类问题转化为图的最优划分问题,亦可视为将特征数据通过一定准则进行映射降维的过程。对于谱聚类算法,主要选取特征相似度匹配准则与图划分准则。谱聚类算法可以在任意形状的样本空间上聚类,得到收敛于全局的最优解。用谱聚类算法生成视觉词典的步骤如下:
步骤1:将每个特征向量视为图中的顶点,选取特征相似度准则,计算各个特征间的相似度值,作为顶点间的权重值,从而生成一个N×N的对称权值矩阵E,计算权值矩阵采用KNN方法,即仅计算每个点与其最近的k个点的权值;
步骤2:选取相应的图划分准则计算Laplacian矩阵L;根据二分大准则,将矩阵E每列元素相加,即得到该顶点的度。以所有度值为对角元素构成的对角矩阵即为度矩阵D。则Laplacian矩阵L=D-E;
步骤3:计算矩阵L的前K个特征值与特征向量,构建特征向量空间:将K个特征向量构造成N×K的矩阵M;
步骤4:把M的每一行作为新样本,对N个新样本进行K-means聚类处理。
其中,用K-means聚类处理的步骤如下:
步骤1:选择K个特征向量作为初始焦点;
步骤2:(重新)分配所有点到最近的邻点;
步骤3:计算新的汇聚点;
步骤4:重复步骤2和3直到焦点不再改变。
4、用局部加权向量量化的方法对每个图像的特征进行字典的重构编码。
局部加权向量量化编码方法如图1所示,顶端的实心五边形表示字典中的一个视觉词汇,在两条曲线中间的几何图形代表特定图像提取的所有SIFT特征。不同粗细的直线代表相应特征与该词汇间的权值,只有那些最接近视觉词汇的特征(图中为曲线间黑色实心元素)才会被赋予较大的权值,而剩余特征则会分配到较小的权值。同时,这些特征到视觉词汇的距离也被用于计算相应的表示向量。这就表明如果一个给定特征与视觉词汇具有很小的相似性,它对该词汇的最终表示值影响将会很小。如果多个特征都与同一词汇相似,那么他们各自的影响将由他们与这一词汇间的距离来进一步决定。根据上述的方法,通过计算每个视觉词汇到近邻特征的加权相似度,就可以直接得到给定图像的最终表示(向量表示)。
5、选取合适的分类器完成图像的分类任务。
基于加权近邻,在KD-Tree回溯查找时,记录每个回溯点,分别计算每个点相对于待查询点的权重,最后通过投票的方式,决策出待定点的类别。具体操作如下:
假设训练数据集为测试数据集为类标为C={c1,c2,c3,···,cc},训练数据的类别已标定;在近邻算法中,为了预测测试数据的类别需要计算该数据点到所有训练数据的距离则每类的类别值为:
其中kj为属于第cj类的训练数据数量;取val中的最大值记为待测数据的类标;在KD-Tree的加权近邻算法中,定义kj为回溯数据点,那么重新定义为:
其中H是一个常数,函数表示余弦距离;val中最大值的类标记为预测结果。
Claims (4)
1.一种遥感图像目标识别方法,其特征在于,包括下述步骤:
选取遥感图像构建训练集;
从训练集中分别提取目标图像的SIFT特征;
利用谱聚类算法生成视觉词典;再用局部加权向量量化的方法对每个图像的特征进行字典的重构编码;最后选取合适的分类器完成图像的分类任务。
2.如权利要求1所述的基于改进视觉词包模型的遥感图像目标识别方法,其特征在于,所述谱聚类算法的步骤主要为:
(1)将每个特征向量视为图中的顶点,选取特征相似度准则,计算各个特征间的相似度值,作为顶点间的权重值,从而生成一个N×N的对称权值矩阵E,计算权值矩阵采用KNN方法,即仅计算每个点与其最近的k个点的权值;
(2)选取相应的图划分准则计算Laplacian矩阵L;根据二分大准则,将矩阵E每列元素相加,即得到该顶点的度;以所有度值为对角元素构成的对角矩阵即为度矩阵D;则Laplacian矩阵L=D-E;
(3)计算矩阵L的前K个特征值与特征向量,构建特征向量空间:将K个特征向量构造成N×K的矩阵M;
(4)把M的每一行作为新样本,对N个新样本进行K-means聚类处理。
3.如权利要求1所述的基于改进视觉词包模型的遥感图像目标识别方法,其特征在于,局部加权向量量化编码方法中,顶端的实心五边形表示字典中的一个视觉词汇,在两条曲线中间的几何图形代表特定图像提取的所有SIFT特征;不同粗细的直线代表相应特征与该词汇间的权值,这些特征到视觉词汇的距离也被用于计算相应的表示向量;通过计算每个视觉词汇到近邻特征的加权相似度,就可以直接得到给定图像的最终向量表示。
4.如权利要求1所述的基于改进视觉词包模型的遥感图像目标识别方法,其特征在于,选取合适的分类器是指基于加权近邻的KD-Tree分类器;在KD-Tree查询算法的基础上,基于加权近邻提出一种改进的KD-Tree分类查找算法,即在KD-Tree回溯查找时,记录每个回溯点,分别计算每个点相对于待查询点的权重,最后通过投票的方式,决策出待定点的类别;
所述改进的KD-Tree分类查找算法可具体描述为:
假设训练数据集为测试数据集为类标为C={c1,c2,c3,···,cc},训练数据的类别已标定;在近邻算法中,为了预测测试数据的类别需要计算该数据点到所有训练数据的距离则每类的类别值为:
其中kj为属于第cj类的训练数据数量;取val中的最大值记为待测数据的类标;在KD-Tree的加权近邻算法中,定义kj为回溯数据点,那么重新定义为:
其中H是一个常数,函数表示余弦距离;val中最大值的类标记为预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710183174.XA CN106951873B (zh) | 2017-03-24 | 2017-03-24 | 一种遥感图像目标识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710183174.XA CN106951873B (zh) | 2017-03-24 | 2017-03-24 | 一种遥感图像目标识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106951873A true CN106951873A (zh) | 2017-07-14 |
CN106951873B CN106951873B (zh) | 2020-07-14 |
Family
ID=59472917
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710183174.XA Active CN106951873B (zh) | 2017-03-24 | 2017-03-24 | 一种遥感图像目标识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106951873B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108195766A (zh) * | 2017-12-18 | 2018-06-22 | 河海大学 | 一种基于遥感影像的水质监测方法 |
CN108195771A (zh) * | 2017-12-18 | 2018-06-22 | 河海大学 | 一种海洋高光谱遥感影像目标识别方法 |
CN109583307A (zh) * | 2018-10-31 | 2019-04-05 | 东华大学 | 一种基于局部特征与词包模型的羊绒羊毛纤维识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912611A (zh) * | 2016-04-05 | 2016-08-31 | 中国科学技术大学 | 一种基于cnn的快速图像检索方法 |
CN106022286A (zh) * | 2016-05-30 | 2016-10-12 | 中国石油大学(华东) | 一种遥感景象的自动识别方法 |
CN106156374A (zh) * | 2016-09-13 | 2016-11-23 | 华侨大学 | 一种基于视觉词典优化和查询扩展的图像检索方法 |
CN106295613A (zh) * | 2016-08-23 | 2017-01-04 | 哈尔滨理工大学 | 一种无人机目标定位方法及系统 |
-
2017
- 2017-03-24 CN CN201710183174.XA patent/CN106951873B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912611A (zh) * | 2016-04-05 | 2016-08-31 | 中国科学技术大学 | 一种基于cnn的快速图像检索方法 |
CN106022286A (zh) * | 2016-05-30 | 2016-10-12 | 中国石油大学(华东) | 一种遥感景象的自动识别方法 |
CN106295613A (zh) * | 2016-08-23 | 2017-01-04 | 哈尔滨理工大学 | 一种无人机目标定位方法及系统 |
CN106156374A (zh) * | 2016-09-13 | 2016-11-23 | 华侨大学 | 一种基于视觉词典优化和查询扩展的图像检索方法 |
Non-Patent Citations (7)
Title |
---|
XU WANGMING等: "content-based image clustering via multi-view visual vocabularies", 《PROCEEDING OF THE 31ST CHINESE CONTROL CONFERENCE》 * |
唐建鑫: "基于Bag of Features的图像分类和检索研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
徐望明等: "基于改进局部线性特征编码方法的图像分类", 《计算机应用研究》 * |
曹宁等: "基于视觉词袋模型的图像分类改进方法", 《电子设计工程》 * |
胡屹群等: "利用视觉词袋模型和颜色直方图进行遥感影像检索", 《测绘通报》 * |
赵兴东,徐帅编著: "《矿用三维激光数字测量原理及其工程应用》", 31 January 2016, 冶金工业出版社 * |
赵晓永著: "《面向云计算的数字存储关键技术研究》", 31 December 2014, 河北科学技术出版社 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108195766A (zh) * | 2017-12-18 | 2018-06-22 | 河海大学 | 一种基于遥感影像的水质监测方法 |
CN108195771A (zh) * | 2017-12-18 | 2018-06-22 | 河海大学 | 一种海洋高光谱遥感影像目标识别方法 |
CN109583307A (zh) * | 2018-10-31 | 2019-04-05 | 东华大学 | 一种基于局部特征与词包模型的羊绒羊毛纤维识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106951873B (zh) | 2020-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | TransUNetCD: A hybrid transformer network for change detection in optical remote-sensing images | |
CN110321963B (zh) | 基于融合多尺度多维空谱特征的高光谱图像分类方法 | |
CN110276269B (zh) | 一种基于注意力机制的遥感图像目标检测方法 | |
CN102622607B (zh) | 一种基于多特征融合的遥感图像分类方法 | |
Xue et al. | Attention-based second-order pooling network for hyperspectral image classification | |
Wang et al. | Discriminative multiple kernel learning for hyperspectral image classification | |
CN103077512B (zh) | 基于主成分析的数字图像的特征提取与匹配方法 | |
CN107368807B (zh) | 一种基于视觉词袋模型的监控视频车型分类方法 | |
Zhang et al. | Semantic classification of high-resolution remote-sensing images based on mid-level features | |
Zhan et al. | Unsupervised scale-driven change detection with deep spatial–spectral features for VHR images | |
CN104881671B (zh) | 一种基于2D‑Gabor的高分遥感影像局部特征提取方法 | |
CN107392215A (zh) | 一种基于sift算法的重图检测方法 | |
CN113032613B (zh) | 一种基于交互注意力卷积神经网络的三维模型检索方法 | |
CN109034213B (zh) | 基于相关熵原则的高光谱图像分类方法和系统 | |
CN106897722A (zh) | 一种基于区域形状特征的商标图像检索方法 | |
CN109635726A (zh) | 一种基于对称式深度网络结合多尺度池化的滑坡识别方法 | |
CN103854290A (zh) | 一种结合骨架特征点和分布场描述子的扩展目标跟踪方法 | |
CN110276746A (zh) | 一种鲁棒性遥感图像变化检测方法 | |
CN106951873A (zh) | 一种遥感图像目标识别方法 | |
Zhang et al. | Adaptive anchor networks for multi-scale object detection in remote sensing images | |
An et al. | Object-oriented urban dynamic monitoring—A case study of Haidian District of Beijing | |
Chen et al. | The building recognition and analysis of remote sensing image based on depth belief network | |
CN110826575A (zh) | 一种基于机器学习的水下目标识别方法 | |
Ahmad et al. | A fusion of labeled-grid shape descriptors with weighted ranking algorithm for shapes recognition | |
CN113316080B (zh) | 基于Wi-Fi与图像融合指纹的室内定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |