CN102073879B - 基于半监督学习的海岸海洋遥感影像特征地类的识别方法 - Google Patents

基于半监督学习的海岸海洋遥感影像特征地类的识别方法 Download PDF

Info

Publication number
CN102073879B
CN102073879B CN201010568737.5A CN201010568737A CN102073879B CN 102073879 B CN102073879 B CN 102073879B CN 201010568737 A CN201010568737 A CN 201010568737A CN 102073879 B CN102073879 B CN 102073879B
Authority
CN
China
Prior art keywords
sigma
remote sensing
probability
sensing image
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010568737.5A
Other languages
English (en)
Other versions
CN102073879A (zh
Inventor
刘永学
李满春
程亮
陈振杰
江冲亚
陈焱明
李�真
杨康
刘成明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University
Original Assignee
Nanjing University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University filed Critical Nanjing University
Priority to CN201010568737.5A priority Critical patent/CN102073879B/zh
Publication of CN102073879A publication Critical patent/CN102073879A/zh
Application granted granted Critical
Publication of CN102073879B publication Critical patent/CN102073879B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

本发明公开了一种基于半监督学习的海岸海洋遥感影像特征地类的识别方法,属于半自动遥感影像识别领域。其步骤为:为每一类特征地物选取标记样本;构建面向对象的遥感影像的分割结果;计算出所有样本像元隶属于各特征地类的初估概率值,计算出样本数据在归为各个特征地类分量的概率;使用特征空间规则对概率图像进行修正;判定其所属特征地类,实现特征地类的识别,并输出识别结果图。本发明结合了先验知识与数据的统计特性,能够用地学先验知识引导数据挖掘过程,实践证明,该算法够能有效地进行遥感影像分类,得到比较满意的结果,并具有高效率、高精度的特点,能够直接应用于国家各级基础地理信息数据库遥感专题信息的维护与更新。

Description

基于半监督学习的海岸海洋遥感影像特征地类的识别方法
技术领域
本发明涉及一种遥感影像数据的特征地类识别方法,特别是涉及一种基于半监督学习的海岸海洋遥感影像特征地类的识别方法。
背景技术
遥感作为一种非接触式的观测技术具有悠久的历史,其所提供的遥感影像数据具有时效性高、覆盖范围广、信息丰富等优点,己经被广泛地运用于土地利用、资源勘探、生态环境监测,以及海岸海洋特征地类识别等诸多领域,对社会经济的发展发挥着越来越重要的作用。海岸带区域作为社会和经济发展的核心地带,随着海洋经济开发力度的加强,海岸带区域的土地利用、海域使用及环境变化也日新月异。为了更好地保护和开发利用海洋资源,利用遥感技术的快速动态监测优势,能及时获取海岸带环境变化信息,并为海岸带区域的特征地类识别及资源环境监测提供了技术支撑。对一些敏感地区进行的周期性业务化遥感监测,无论在军事上,还是在海岸带环境资源开发利用管理上,都具有十分重要的意义。
随着对地观测技术的飞速发展,一个多层次、全天候、多分辨率互补的全球观测网络正在逐步形成,遥感影像数据源的种类与数量都呈现出几何级的增长,面对如此海量的遥感影像数据,现有的针对单一遥感数据源的人工目视解译与计算机辅助识别相结合的方法已远远不能满足多源、大范围、长时间序列遥感特征地类识别的需求。海岸海洋特征地类应用研究作为遥感应用的一个重要分支,也亟需发展面向多源遥感影像数据的、自动化程度较高的遥感信息识别方法。
遥感影像特征地类识别的主要目的是对基元进行特征分析,结合基元对象所属大区域的环境知识,构造相应的特征地类识别规则,把未知类别的样本映射到所构造的类别中,从而获得遥感影像与实际地物的对应信息。目前,遥感影像的特征地类识别以数据挖掘为技术手段。数据挖掘用于发现大量数据中所蕴含的知识或者是规则,在建立了正确的数据表示以后,利用适用于当前数据来对数据潜在的特征进行挖掘。数据挖掘中常用的模型有概率模型、决策树模型、神经网络模型、聚类分析模型、模糊集模型等。1997年,Huang等在期刊《Photogrammetry Engineering andRemote Sensing》63卷第10期中发表“A Machine—Learning Approach to AutomatedKnowledge Based Building for Remote Sensing Image Analysis with GIS Data”一文,用决策树方法从GIS数据和SPOT遥感影像中提取知识进行湿地分类;1998年,李祚泳在期刊《红外与毫米波学报》17卷第2期发表“用BP神经网络实现多波段遥感图像的监督分类”一文,研究了基于神经网络的多波段遥感影像监督分类方法;2006年,郭小卫等在期刊《遥感信息》第6期中发表“一种多尺度无监督遥感影像分割方法”一文,提出了一种基于聚类的多尺度无监督遥感影像分类方法,并利用该方法对SAR图像进行分类研究。然而在很多时候,单纯利用数据挖掘技术进行特征地类的识别,往往难以取得较好的效果。这是由于具有一定规模的自然区域,物质组成多样,地物在时空上相互交错,相互转换形成结构和形式各具特点的复杂混合体,导致同类地物光谱响应的多样化,使得“同物异谱,异物同谱”现象发生。
在遥感影像特征地物识别过程中,根据是否引入训练样本可分为监督学习、非监督学习和半监督学习方法。在遥感影像监督学习中,学习器通过对大量有标记的训练样本进行学习,从而建立模型用于预测未标记的图像单元地物类别。然而,从遥感影像中采集大量有标记的训练样本非常困难,并且需要耗费大量的人力物力;如果只使用少量的有标记示例,那么利用它们所训练出的学习系统往往很难具有强泛化能力。与之相对应的非监督学习中,学习器不依赖任何有标记的训练样本,直接对全部未标记的图像单元进行统计分析,建立相应的规则模型,并对这些图像单元进行地类识别。然而,由于完全没有先验知识的输入,非监督方法的结果很难直接作为成果数据产品。半监督学习是介于前两者之间的学习方式,,在少量已标记类别样本提供的监督信息的引导下,学习全部样本或只学习未标记类别样本。该方法只需提供少量的标记样本,而通过全部样本的学习又可以获得相对于非监督学习更好的学习效果。
半监督学习的基本设置是给定一个来自某未知分布的有标记示例集L={(x1,y1),(x2,y2),…,(x|L|,y|L|)}以及一个未标记示例集U={x1',x2',…,x|U|'},期望学得函数f:X→Y可以准确地对示例x预测其标记y。这里xi,xj'∈X均为d维向量,yi∈Y为示例xi的标记,|L|和|U|分别为L和U的大小,即它们所包含的示例数。
发明内容
1.发明要解决的技术问题
如前所述,单纯利用数据挖掘技术进行特征地类识别,往往难以取得较好的识别效果;采用监督学习方法根据已标记样本进行建模,则会造成大量未标记样本的浪费,且标记样本少则精度下降,标记样本多则成本上升;而运用非监督学习方法根据未标记样本建模,因为其未使用任何先验知识,故精度偏低,很难直接作为成果数据产品。
为此,本发明将遥感信息地学知识和数据挖掘方法结合起来,基于半监督学习的海岸海洋遥感影像特征地类的识别方法。该基于半监督学习的遥感影像地类识别方法选取少量已标记的样本来引导大量的未标记数据,并构建相应的模型模拟全体样本数据的联合分布概率,最终实现海岸海洋遥感影像特征地类识别,在精度和效率上均得到比较满意的特征地类识别结果,并具备良好的通用性。
2.本发明的技术方案如下:
原理:遥感影像识别是根据遥感影像中像元集的特征构造一个地类特征规则模型把未知类别的样本映射到相应的特征地类中,从而获得遥感影像中与实际地物的对应信息。本发明中采用高斯混合模型(Gaussian Mixture Model,简称GMM)捕捉遥感影像数据的特征,模拟出样本数据所服从的联合概率密度函数。其中,GMM的混合系数πk、μk和Σk是通过运用期望最大化方法(Expectation Maximization,简称EM)求解的极大似然估计值(Maximum Likelihood Estimate,简称MLE)。
基于半监督学习的海岸海洋遥感影像特征地类的识别方法,包括以下步骤(具体的步骤流程图见图1):
步骤1:通过卫星遥感技术手段,获取描述地表物体对电磁波的反射和其自身发射的电磁波的遥感影像,根据不同类型地物在遥感影像中具有特定的光谱显示特征,为每一类特征地物在遥感影像中选取标记样本,构建一个长度为m的一维数组(m=影像行数×影像列数×波段数),依次读取各波段遥感影像数据并存入该数组;
步骤2:利用种子生长方法对经过预处理的遥感影像进行分割处理,得到一系列在光谱信息上表现相近似的像元,通过赋以相同属性值来合并这些表现相近的像元,并求取该对象中各像素光谱均值作为此对象的光谱信息,最终实现遥感影像的分割;
步骤3:初始化各类别密度分布待估计的参数Θ,包括各类别的比例、均值向量μ和协方差矩阵∑;根据步骤1中所选取的已标记样本进行最近邻分类,得到特征空间内的高维距离矩阵,进而计算出所有样本像元隶属于各特征地类的初估概率值;
步骤4:通过EM迭代算法对所有样本像元进行迭代运算,直到算法收敛,估计出高斯混合模型的参数θk={πkk,∑k}的值,并计算出样本数据在归为各个特征地类分量的概率;假设在迭代过程中,当前估计的参数为Θold,则通过一次E步和M步的计算后估计出的参数为Θnew,引入辅助函数Q(Θ,Θold)表示每一次迭代后完整数据集的对数似然的数学期望,则E步和M步的实质分别为:
Q ( Θ , Θ old ) = E [ ln L ( Θ | Y ) ] = E [ ln Π n = 1 N p ( x n , z n | Θ ) ]
Θnew=argmaxQ(Θ,Θold)②
具体E步和M步计算方法为:
1)期望步运算(Expectation Step,简称E步):利用当前的参数估计结果计算所有样本的后验概率;具体通过公式③和④计算出样本数据向量是由第k个混合分量产生的概率,从数据挖掘的角度来看,即为样本x属于类别k的概率;
p ( z = k | x ) = p ( z = k ) p ( x | z = k ) Σ k = 1 K p ( z = k ) p ( x | z = k ) = π k N ( x | μ k , Σ k ) Σ k = 1 K π k N ( x | μ k , Σ k )
N ( x | μ k , Σ k ) = 1 ( 2 π ) D / 2 | Σ k | exp ( - 1 2 ( x - μ k ) T Σ - 1 ( x - μ k ) )
其中,D为样本数据向量x的特征维数(本发明中D=1),k为构成GMM的高斯模型的个数,而πk即为先验概率p(z=k),N(x|μkk)即为条件概率p(x|z=k),概率密度函数为
Figure GDA00002187480100044
2)极大似然步运算(Maximum Likelihood Step,简称M步):利用当前所有样本的后验概率重新进行参数估计,并根据标记样本对参数进行加权叠加修正;具体通过公式⑤、⑥、⑦计算出高斯混合模型的参数θk={πkk,∑k}的值,其中,πk为混合系数,表示一个随机抽取的样本是由第k个混合分量产生的概率,均值向量μk和协方差矩阵Σk为每个独立的高斯模型N(x|μkk)自身的参数(见公式④);
π k = Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) N = Σ n = 1 N p ( z n = k | x n ) N
μ k = Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) x n Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) = Σ n = 1 N p ( z n = k | x n ) x n Σ n = 1 N p ( z n = k | x n )
Σ k = Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) ( x n - μ k ) ( x n - μ k ) T Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) = Σ n = 1 N p ( z n = k | x n ) ( x n - μ k ) ( x n - μ k ) T Σ n = 1 N p ( z n = k | x n )
3)对E步和M步进行迭代计算,直到算法收敛;
步骤5:通过不同地物在遥感影像中的光谱特征,分别计算可见光指数(VisibleLight Index,简称VLI,公式⑧)、归一化植被指数(Normorlized Vegetation Index,简称NDVI,公式⑨)、归一化水体指数(Normorlized Water Index,简称NDWI,公式⑩)来的构建新的光谱空间规律,利用所构建的光谱空间规律对概率图像进行修正;
VLI=BLUE+GREEN+RED    ⑧
NDVI=(NIR-RED)/(NIR+RED)⑨
NDWI=(GREEN-NIR)/(GREEN+NIR)⑩
式中,BLUE表示遥感影像的蓝光波段,GREEN表示遥感影像的绿光波段,RED表示遥感影像的红光波段,NIR表示遥感影像的近红外波段;
步骤6:比对所计算出的每个样本所隶属于各自类别的概率,判定所属概率最大的类别即为其所属特征地类,进行标记和赋值,实现特征地类的识别,输出识别结果图。
步骤1中改进目标识别前的样本选取,与传统的遥感影像目标识别方法(如最大似然法、神经网络法、决策树法等)需要大量样本进行统计分析不同,本算法仅要求为每个地类选取一个样本作为初始聚类中心,来替代标准EM算法中用随机生成法产生的初始聚类中心。
步骤4中改进目标识别中的迭代优化。在每轮迭代的M步中,用各地类的标记样本同模型估计的各聚类中心进行加权叠加,使聚类中心向标记样本漂移。该步骤确保了聚类中心不会与实际情况(依靠先验知识精选的样本)偏离太远,同时在一定程度上增加了算法的随机性,使其陷入局部最优的概率降低。
步骤5中改进目标识别后的结果修正;计算出各地类的概率分布后,通过特征空间中隐含的遥感信息地学知识对结果进行修正,这一步主要依赖于遥感影像特征空间的构建。
3.有益效果
相比现有技术,本发明将遥感信息地学知识和数据挖掘方法结合起来,并合理建立有标记样本和未标记样本之间的联系,提高了目标识别的性能。具体有益效果如下:
第一,改进目标识别前的样本选取。与传统的遥感影像地类识别方法(如最大似然法、神经网络法、决策树法等)需要大量样本进行统计分析不同,本方法仅要求为每个地类选取一个样本作为初始聚类中心,来替代标准EM方法中用随机生成法产生的初始聚类中心,提高识别性能。
第二,改进目标识别中的迭代优化。在每轮迭代的M步中,用各地类的标记样本同模型估计的各聚类中心进行加权叠加,使聚类中心向标记样本漂移。该步骤确保了聚类中心不会与实际情况(依靠先验知识精选的样本)偏离太远,同时在一定程度上增加了方法的随机性,使其陷入局部最优的概率降低。
第三,改进目标识别后的结果修正。计算出各地类的概率分布后,通过特征空间中隐含的遥感信息地学知识对结果进行修正,这一步主要依赖于遥感影像特征空间的构建。
综上,本发明结合了先验知识与数据的统计特性,能够用地学先验知识引导数据挖掘过程,实践证明,该方法够能有效地进行遥感影像目标识别,得到比较满意的结果,并具有高效率、高精度的特点。
附图说明
附图1为半监督遥感图像特征地类识别流程图;
附图2为实施例中所用卫星遥感影像的分割影像;
附图3为水体地类概率图像(白色到黑色渐变,代表概率由高到低)。
附图4为植被地类概率图像(白色到黑色渐变,代表概率由高到低)。
附图5为建筑物地类概率图像(白色到黑色渐变,代表概率由高到低)。
附图6为半监督学习特征地类识别结果图像。
具体实施方式
本实施例采用附图2所示遥感影像作为海岸海洋特征地类识别的初始影像,该遥感影像数据是由Landsat 5号卫星的TM主题成像仪于2007年1月2日所拍摄。实施例区域的图像大小为500×500像元,该区域位于海南岛西北部的新英湾红树林自然保护区。本实例具体实施采用标准C++编程语言在VC 6.0平台下实现,遥感影像数据的读写操作通过开源地理数据格式转换类库GDAL 1.60实现。具体实施步骤如下:
步骤1:以GDAL为影像数据读写工具,利用GDAL.Open方法读取遥感影像。根据海南岛的海洋海岸特征,实施中将地物划分为清洁水体、浑浊水体、植被、滩涂、建设用地、裸地和其他共7类,对应的这7类地物在遥感图像中各自选取相应的一个样本点(卫星遥感图像是对地物的实际探测与显示,每个地物在图像中将会有对应的像素进行描述,为此,可通过实地勘察并在其对应的遥感图像中选取相应的样本点),本实例中所选取的相应的样本点在遥感图像中的(X,Y)空间坐标值分别为(151,248)、(457,208)、(330,274)、(185,55)、(295,266)、(113,189)、(130,437)。构建一个长度为1500000的一维数组(500行×500列×6个波段),依次读取各波段遥感影像数据并存入该数组。
步骤2:①初始化所有像素点的区域对象属性,将整幅图像所有像素点属性初始化为-1(表示像素点还没有进行区域标号);②以遥感影像的所有像素作为种子点标记对象,依次遍历遥感影像各像素,根据该像素点与其邻接的8个像素点的相似度来进行像素点的归类,其相似度的衡量准则以该像素点与其相邻的各像素点是否存在差异为基准,如果没有差别,则标记为同一区域;③对所标记的区域进行赋值,最终将像元组合为4524个区域对象,实现空间相邻且光谱信息相似的像素点合并成为一个对象;④求取各个对象中所有像素的光谱均值,并将该均值作为此对象的光谱数值赋值给所对应的区域对象,实现遥感影像的分割。
步骤3:初始化各类别密度分布待估计的参数Θ,包括各类别的比例、均值向量μ和协方差矩阵∑。根据步骤1中所选取的7个已标记样本作为聚类中心进行最近邻分类,即对数据集里的每个数据点(除了这7个样本点以外),计算其与这7个样本点的欧氏距离,得到特征空间内的高维距离矩阵,进而计算出所有样本像元隶属于各特征地类的初估概率值。其中,初估概率的核心代码为:
步骤4:遍历数据集,获取当前样本的特征向量及初估概率,对已具有初估概率的对象通过期望步(Expectation Step,简称E步)和极大似然步(Maximum LikelihoodStep,简称M步)进行迭代计算(本实例中设置迭代步长为20),在依次E步和M步迭代操作完成后,计算出每个样本隶属于各类别的概率。具体描述如下:
输入:X={x1,x2,…,xN}(存放遥感图像像元样本),K(遥感影像划分的特征地类个数).
过程:
初始化Z={z1,z2,…,zN},当Zn∈{1,2,…,K}
估计 θ k new = { π k , μ k , Σ k } 通过
Nk=n(zn=k)
πk=Nk/N
μ k = Σ n = 1 N k x n / N k
Σ k = Σ n = 1 N k ( x n - μ k ) ( x n - μ k ) T / N k
循环迭代
E步:对于每一个xn∈X,计算p(zn=k|xn)通过以下公式
p ( z = k | x ) = π k N ( x | μ k , Σ k ) Σ k = 1 K π k N ( x | μ k , Σ k )
M步:对于k=1:K,计算
Figure GDA00002187480100095
通过以下公式
π k = Σ n = 1 N p ( z n = k | x n ) N
μ k = Σ n = 1 N p ( z n = k | x n ) x n Σ n = 1 N p ( z n = k | x n )
Σ k = Σ n = 1 N p ( z n = k | x n ) ( x n - μ k ) ( x n - μ k ) T Σ n = 1 N p ( z n = k | x n )
Θold←Θnew
直到ΔlnL(Θ)→0结束循环
1)E步是利用当前初始参数估计结果和遥感像元数据值计算完整样本数据的后验概率,其实质见公式①。首先,遍历数据集,获取当前样本的特征向量及初估概率;计算样本的对数高斯密度函数,并分别对各类特征向量累加对数高斯密度;求得计算样本的分量概率密度,对样本的分量概率密度与先验概率的对数加权相加;对所获得的对数概率转换为正规化的概率。具体的核心代码如下:
Figure GDA00002187480100111
2)M步是利用当前所有样本的后验概率重新进行参数估计,其实质见公式②。首先,遍历训练集,用各地类的标记样本同模型估计的各聚类中心进行加权叠加(各取二分之一相加)实现特征值的均值化操作,使聚类中心向标记样本漂移,通过公式⑤、⑥、⑦计算出高斯混合模型的参数θk={πkk,∑k}的值。具体的核心代码如下:
Figure GDA00002187480100112
Figure GDA00002187480100121
Figure GDA00002187480100131
步骤4:与一般的彩色图像不同,遥感影像的光谱信息中隐含了大量可以利用的光谱特性,如水体的反射主要在蓝绿光波段,其他波段吸收都很强,特别到了近红外波段,吸收就更强,当水中含泥沙时,由于泥沙散射,可见光波段反射率会增加,峰值出现在黄红区,这些知识都可成为遥感影像分类的重要依据。为此,通过光谱特征空间中不同地类在不同指数的知识对其进行修正,通过指数计算实现图像增强,达到识别某些信息或去掉某些不必要信息的目的。本实例中通过计算可见光指数(公式⑧)、归一化植被指数(公式⑨)、归一化水体指数(公式⑩)来的构建新的光谱空间规律。这三个计算指数均反映了地物的亮度信息,VLI通常指向反射率较高的建设用地,NDVI指向植被信息,NDWI指向水体信息。对这三个指数进行拉伸和直方图均衡化操作,分别得出分别反映建设用地、植被和水体的地类概率空间结果图,分别如图3、图4、图5所示。
步骤5:根据比对所计算出的每个样本所隶属于各自类别的概率,判定所属概率最大的类别即为其所属特征地类,进行标记和赋值,利用GDAL的方法对分类结果进行图像输出,结果如图6所示。
为了检测基于半监督学习的遥感影像特征地类识别方法具体的识别效果,将该方法得到的结果同常用的最大似然识别方法及标准EM识别方法得到的结果进行比较,具体采用混淆矩阵的方法对识别结果进行精度评价。混淆矩阵是一个m行、m列的二维矩阵,其中,m代表类别的数量,列通常表示为地面的实值,行表示分类的结果。基于混淆矩阵,可以计算用以评价分类精度的生产者精度、使用者精度和总精度以及Kappa系数。随机选取256个检测点,建立混淆矩阵,计算相关指标进行评价,三种方法相应的精度评价分别见表1、表2和表3。
表1半监督学习分类的精度评价结果
Figure GDA00002187480100141
表2最大似然分类的精度评价结果
Figure GDA00002187480100142
表3标准EM分类的精度评价结果
Figure GDA00002187480100143
精度评价结果表明,半监督学习分类算法有效提高了分类的精度。值得一提的是,最大似然分类算法对训练样本数量的要求较高,而半监督学习分类算法对于每个地类只需要选取一个样本。可见,基于半监督学习的遥感影像分类算法在效果和效率上均优于最大似然分类算法,对标准EM算法的改进效果也较显著,并具备一定的通用性。

Claims (2)

1.一种基于半监督学习的海岸海洋遥感影像特征地类的识别方法,包括以下步骤:
步骤1:通过卫星遥感技术手段,获取描述地表物体对电磁波的反射和其自身发射的电磁波的遥感影像,根据不同类型地物水体、植被或建设用地,在遥感影像中具有特定的光谱显示特征,为每一类特征地物在遥感影像中选取标记样本,构建一个长度为m的一维数组,其中m=影像行数×影像列数×波段数,依次读取各波段遥感影像数据并存入该数组;
步骤2:利用种子生长方法对经过预处理的遥感影像进行分割处理,得到一系列在光谱信息上表现相近似的像元,通过赋以相同属性值来合并这些表现相近的像元,并求取该对象中各像素光谱均值作为此对象的光谱信息,最终实现遥感影像的分割;
步骤3:初始化水体、植被、建设用地等每一类特征地物的密度分布待估计的参数Θ,包括各地物类别的比例、均值向量μ和协方差矩阵∑;根据步骤1中所选取的已标记样本进行最近邻分类,得到所有标记样本的高维距离矩阵,进而计算出所有样本像元隶属于各特征地类的初估概率值;
步骤4:通过EM迭代算法对所有样本像元进行迭代运算,直到算法收敛,估计出高斯混合模型的参数θk={πkk,∑k}的值,并计算出样本数据在归为各个特征地类分量的概率;假设在迭代过程中,当前估计的参数为Θold,则通过一次E步和M步的计算后估计出的参数为Θnew,引入辅助函数Q(Θ,Θold)表示每一次迭代后完整数据集的对数似然的数学期望,则E步和M步的实质分别为:
Q ( Θ , Θ old ) = E [ ln L ( Θ | Y ) ] = E [ ln Π n = 1 N p ( x n , z n | Θ ) ]                                      ①
Θnew=arg maxQ(Θ,Θold)          ②
具体E步和M步计算方法为:
1)期望步运算E步:利用当前的参数估计结果计算所有样本的后验概率;具体通过公式③和④计算出样本数据向量是由第k个混合分量产生的概率,从数据挖掘的角度来看,即为样本x属于类别k的概率;
p ( z = k | x ) = p ( z = k ) p ( x | z = k ) Σ k = 1 K p ( z = k ) p ( x | z = k ) = π k N ( x | μ k , Σ k ) Σ k = 1 K π k N ( x | μ k , Σ k )                                      ③
N ( x | μ k , Σ k ) = 1 ( 2 π ) D / 2 | Σ k | exp ( - 1 2 ( x - μ k ) T Σ - 1 ( x - μ k ) )
其中,D为样本数据向量x的特征维数(本发明中D=1),k为构成GMM的高斯模型的个数,而πk即为先验概率p(z=k),N(x|μkk)即为条件概率p(x|z=k),概率密度函数为
2)极大似然步运算M步:利用当前所有样本的后验概率重新进行参数估计,并根据标记样本对参数进行加权叠加修正;具体通过公式⑤、⑥、⑦计算出高斯混合模型的参数θk={πkk,∑k}的值,其中,πk为混合系数,表示一个随机抽取的样本是由第k个混合分量产生的概率,均值向量μk和协方差矩阵Σk为每个独立的高斯模型N(x|μkk)自身的参数(见公式④);
π k = Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) N = Σ n = 1 N p ( z n = k | x n ) N                         ⑤
μ k = Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) x n Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) = Σ n = 1 N p ( z n = k | x n ) x n Σ n = 1 N p ( z n = k | x n )                         ⑥
Σ k = Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) ( x n - μ k ) ( x n - μ k ) T Σ n = 1 N π k N ( x n | μ k , Σ k ) Σ k = 1 K π k N ( x n | μ k , Σ k ) = Σ n = 1 N p ( z n = k | x n ) ( x n - μ k ) ( x n - μ k ) T Σ n = 1 N p ( z n = k | x n )                         ⑦
3)对E步和M步进行迭代计算,直到算法收敛;
步骤5:通过不同地物在遥感影像中的光谱特征,分别计算可见光指数VLI公式⑧,、归一化植被指数NDVI公式⑨、归一化水体指数NDWI公式⑩来构建新的光谱空间规律,利用所构建的光谱空间规律对概率图像进行修正;
VLI=BLUE+GREEN+RED             ⑧
NDVI=(NIR-RED)/(NIR+RED)       ⑨
NDWI=(GREEN-NIR)/(GREEN+NIR)   ⑩
式中,BLUE表示遥感影像的蓝光波段,GREEN表示遥感影像的绿光波段,RED表示遥感影像的红光波段,NIR表示遥感影像的近红外波段;
步骤6:比对所计算出的每个样本所隶属于各自类别的概率,判定所属概率最大的类别即为其所属特征地类,进行标记和赋值,实现特征地类的识别,输出识别结果图。
2.根据权利要求1中所述的基于半监督学习的海岸海洋遥感影像特征地类的识别方法,其特征在于步骤5中改进目标识别后的结果修正;计算出各地类的概率分布后,通过特征空间中隐含的遥感信息地学知识对结果进行修正,这一步主要依赖于遥感影像特征空间的构建。
CN201010568737.5A 2010-12-02 2010-12-02 基于半监督学习的海岸海洋遥感影像特征地类的识别方法 Expired - Fee Related CN102073879B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010568737.5A CN102073879B (zh) 2010-12-02 2010-12-02 基于半监督学习的海岸海洋遥感影像特征地类的识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010568737.5A CN102073879B (zh) 2010-12-02 2010-12-02 基于半监督学习的海岸海洋遥感影像特征地类的识别方法

Publications (2)

Publication Number Publication Date
CN102073879A CN102073879A (zh) 2011-05-25
CN102073879B true CN102073879B (zh) 2013-01-09

Family

ID=44032413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010568737.5A Expired - Fee Related CN102073879B (zh) 2010-12-02 2010-12-02 基于半监督学习的海岸海洋遥感影像特征地类的识别方法

Country Status (1)

Country Link
CN (1) CN102073879B (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542259B (zh) * 2011-12-29 2013-08-07 宁波工程学院 一种近岸陆上水体的识别方法
CN102930293B (zh) * 2012-10-19 2015-07-15 中国科学院自动化研究所 一种面向对象的高光谱特征处理方法
CN104750707A (zh) * 2013-12-27 2015-07-01 中国科学院深圳先进技术研究院 决策支持单元、土地类型识别及验证系统
CN104881867A (zh) * 2015-05-13 2015-09-02 华中科技大学 一种基于特征分布的遥感图像质量评价方法
CN105303184A (zh) * 2015-11-25 2016-02-03 中国矿业大学(北京) 一种卫星遥感影像中地物精确识别方法
CN105335761A (zh) * 2015-11-27 2016-02-17 郑州航空工业管理学院 一种基于最近邻的遥感影像单类信息提取方法
CN105930820B (zh) * 2016-05-09 2019-04-12 首都师范大学 一种高海拔飞艇高分辨率草畜遥感动态监测平台及方法
CN106067171B (zh) * 2016-05-26 2018-10-19 南京大学 一种高光谱图像本质分解和图像分割方法
CN106127144B (zh) * 2016-06-21 2019-02-01 沈阳航空航天大学 采用时谱空一体化特征模型的点源风险源自动提取方法
CN108242078A (zh) * 2016-12-23 2018-07-03 航天星图科技(北京)有限公司 一种三维可视化的地表环境模型生成方法
CN106778640B (zh) * 2016-12-23 2018-09-25 航天星图科技(北京)有限公司 一种三维可视化环境下地表植被覆盖模型的生成方法
CN107271367B (zh) * 2017-05-05 2019-06-28 北京师范大学 一种水体识别方法及装置
CN107909039B (zh) * 2017-11-16 2020-03-10 武汉大学 基于并行算法的高分辨率遥感影像的地表覆盖分类方法
CN109190497A (zh) * 2018-08-09 2019-01-11 成都天地量子科技有限公司 一种基于时序多光谱卫星影像的耕地识别方法
CN109815880A (zh) * 2019-01-20 2019-05-28 景遥(上海)信息技术有限公司 基于低空遥感影像和深度学习的水葫芦识别系统及方法
CN110008924A (zh) * 2019-04-15 2019-07-12 中国石油大学(华东) 一种面向高光谱影像中地物的半监督自动标记方法与装置
CN110472661B (zh) * 2019-07-10 2023-04-28 北京吉威数源信息技术有限公司 基于历史本底和现时遥感影像的自动变化检测方法和系统
CN111611960B (zh) * 2020-05-29 2022-06-28 长光卫星技术股份有限公司 一种基于多层感知神经网络大区域地表覆盖分类方法
CN112733888B (zh) * 2020-12-25 2022-11-18 河南大学 一种基于多层mrf聚类的深空探测影像形貌分析方法
CN116912202B (zh) * 2023-07-13 2024-01-30 中国中医科学院眼科医院 一种医用高值耗材管理方法和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100446001C (zh) * 2007-04-20 2008-12-24 大连理工大学 一种范例推理与Fuzzy ARTMAP网络相结合的遥感影像分类方法
CN100590402C (zh) * 2008-01-11 2010-02-17 北京航空航天大学 一种光谱和空间信息结合的高光谱数据分类方法
CN101751666A (zh) * 2009-10-16 2010-06-23 西安电子科技大学 基于谱聚类的半监督多光谱遥感图像分割方法
CN101814148A (zh) * 2010-04-30 2010-08-25 霍振国 基于半监督核自适应学习的遥感高光谱图像分类方法

Also Published As

Publication number Publication date
CN102073879A (zh) 2011-05-25

Similar Documents

Publication Publication Date Title
CN102073879B (zh) 基于半监督学习的海岸海洋遥感影像特征地类的识别方法
Maurya et al. Remote sensing techniques: Mapping and monitoring of mangrove ecosystem—A review
CN108038445B (zh) 一种基于多视角深度学习框架的sar自动目标识别方法
Wang et al. Urban impervious surface detection from remote sensing images: A review of the methods and challenges
Sezer et al. Manifestation of an adaptive neuro-fuzzy model on landslide susceptibility mapping: Klang valley, Malaysia
CN101551809B (zh) 基于高斯混合模型分类的sar图像检索方法
Jochem et al. Identifying residential neighbourhood types from settlement points in a machine learning approach
Pandey et al. Multi-task deep learning for predicting poverty from satellite images
Zhang et al. A GANs-based deep learning framework for automatic subsurface object recognition from ground penetrating radar data
CN102938072B (zh) 一种基于分块低秩张量分析的高光谱图像降维和分类方法
Hou et al. SolarNet: a deep learning framework to map solar power plants in China from satellite imagery
CN105069468A (zh) 基于脊波和深度卷积网络的高光谱图像分类方法
CN104376335A (zh) 一种基于信息熵的半监督高光谱遥感影像分类方法
CN103294792A (zh) 基于语义信息和极化分解的极化sar地物分类方法
Wu et al. Spatial-temporal analysis and stability investigation of coastline changes: A case study in Shenzhen, China
CN104298999A (zh) 基于递归自动编码的高光谱特征学习方法
CN105160351A (zh) 基于锚点稀疏图的半监督高光谱分类方法
CN103218614A (zh) 基于流形学习和粗糙集相结合的强对流天气识别方法
Liu et al. Spatial-temporal hidden Markov model for land cover classification using multitemporal satellite images
Alburshaid et al. Palm trees detection using the integration between gis and deep learning
Lou et al. Recognition of thaw slumps based on machine learning and UAVs: A case study in the Qilian Mountains, northeastern Qinghai-Tibet Plateau
Torra et al. Assessment of badland susceptibility and its governing factors using a random forest approach. Application to the Upper Llobregat River Basin and Catalonia (Spain)
Mu et al. Change detection in SAR images based on the salient map guidance and an accelerated genetic algorithm
Wu et al. Projection of land use change patterns using kernel logistic regression
Yamashkin et al. Classification of Metageosystems by Ensembles of Machine Learning Models

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130109

Termination date: 20151202

EXPY Termination of patent right or utility model