一种全自动的区域不透水面遥感信息精确提取方法
技术领域
本发明涉及遥感影像处理技术及遥感影像信息提取方法,具体地说,涉及从中分辨率遥感影像中自动、精确地提取多尺度的区域不透水面(建设用地)信息的实现方法,以及不透水面覆盖率样本库的建立,本发明可适用于土地管理、城市规划、生态环境等有关行业提供相应的信息支撑。
背景技术
伴随着人类改造自然的进程加快,大量人工地物的开发相对地减少了植被、土壤等自然地表覆被面,由水泥混凝土等材料构成的各类型建筑、道路及相关设施等人工覆盖会阻止水(和空气)渗透到地表下层面,称之为不透水面或非渗透表面(Impervious Surface Area,ISA);单位地表面积内的不透水面面积所占的百分比,定义为不透水面覆盖率(Impervious Surfaces Percentage,ISP)。不透水面是区域土地利用变化中最为活跃和重要的类型,对于区域水文系统(径流与非点源污染)及城市气候环境(城市热岛)等生态问题均具有明显的环境效应;此外急速扩张的地表不透水面面积直接反映了建成区扩张情况,对于土地管理与城市建设部门把握土地利用状况意义重大。因此能够满足区域性不透水面遥感信息提取的实用化方法将能极大地弥补我国同发达国家在此方面的技术差距,提升相关部门遥感应用的实用化水平,对于相关业务应用具有重要实用意义与推广价值。相应的不透水面应用研究参考文献包括Slonecker E.T.Remote sensing of impervious surface:a review Remote Sensing Reviews,Remote Sensing of Environment,2001;Bauer M.E.,Impervious surface mapping and change monitoring using Landsat remote sensing.ASPRS annual conference proceedings,2004;George X.,.Updating the 2001 National Land Cover Database Impervious Surface Products to 2006 using Landsat Imagery Change Detection Methods.Remote Sensing of Environment,2010.等。
目前对于利用遥感影像提取不透水面的方法,主要可以分为影像“像元级”的不透水面覆盖范围(impervious surface area,ISA)分类与“亚像元级”的不透水面覆盖率ISP(impervious surface percentage,ISP)计算两个层次。其中ISA分类为在遥感影像上计算出不透水面分布的面积,主要利用监督/非监督的影像分类方法得到;ISP计算为分解出每个像元对于地表范围内包含的不透水面积的定量信息,主要方法是混合像元分解与机器回归模型两大类。相应的不透水面遥感信息提取方法参考文献包括:Yang L.M.An approach for mapping large-area impervious surfaces-synergistic use of Landsat-7 ETM+ and high spatial resolution imagery.Canadian Journal of Remote Sensing,2003;Wu C.Normalized spectral mixture analysis for monitoring urban composition using ETM+imagery.Remote Sensing of Environment.2004;EschT.,Large-area assessment of impervious surface based on integrated analysis of single-date Landsat-7 images and geospatial vector data.Remote Sensing of Environment.2009等。
在区域不透水面遥感信息提取算法方面,目前可见专利/文献中各基础性的研究较多,但尚缺乏关于方法自动化与精细化的关键技术研究。
发明内容
本发明的目标是提供一种不透水面精确提取的自动化实现方法,针对区域不透水面信息ISA划分与ISP计算两个关键的技术环节给出了全新的技术框架,并同时构建了不同尺度的不透水面遥感信息提取之间的层次对应关系。
本发明的思路为:以中分辨率遥感影像为主要数据源,将区域不透水面遥感信息提取划分为“像元级”的ISA划分与“亚像元级”的ISP计算两个技术环节,即先通过多层次遥感信息提取模型的支持在遥感影像上自动提取出可能包含不透水面信息的像元空间范围,再通过样本库与非线性机器模型的支持在ISA的像元内自动定量计算亚像元的ISP值,并从技术方法的角度通过“全局-迭代”思想的融入实现了不透水面遥感信息提取的精确化。
本发明中涉及的模式识别环节均采用了多分类器优选与集成的策略,可以选择不同类型的神经网络、支持向量机等模型的组合协同完成,这种模式具有信息计算准确、算法稳定等优势,再结合本发明的技术框架能够发挥出更大的优势。
本发明的技术方案提供了区域不透水面遥感信息提取的自动化实现及精确化计算的方法,其特征在于包括以下的实施步骤:
1.基于多层次遥感信息提取模型的ISA自动提取:
1)选定遥感影像的聚类方法,对不透水面信息密集区及类间合并段进行分析;
2)通过样本归属度的计算自动采集不透水样本,在影像范围内提取出ISA分布的全局信息;
3)在多层次专题信息模型中逐步融入高层次空间知识,构建特征输入提取上一步计算可能丢失的局部ISA信息;
4)在对象化表达基础上通过计算对象的空间形态特征,并通过迭代计算的方式对ISA分类结果进行细节修正和信息优化,并通过以上2)-4)步整合得到精确的ISA信息;
2.基于样本库的ISP自动计算:
5)ISP样本库的构建,在对具有代表性的ISP样本进行系统采集与组织的基础上,通过数理抽样扩展样本对于全体特征的代表性;
6)对步骤4)得到的ISA信息在步骤5)的样本库中自动匹配与优选最具有代表性的ISP样本集;
7)通过非线性机器学习模型对步骤6)的样本集进行ISP模型训练,然后通过优化的模型应用策略对整个影像进行ISP计算,完成不透水面遥感信息提取流程。
上述实施步骤的特征包括:
步骤1)中需要在影像聚类的基础上通过指定大小的模板对影像进行检测,划定影像内不透水面聚集分布的区域。
步骤2)、3)、4)是多层次不透水面遥感信息提取模型的计算步骤,构建了“全局-局部-细节”的提取流程。其中步骤2)对应“全局”信息的提取,步骤3)对应“局部”信息的提取,步骤4对应“细节”信息的提取。步骤2)需要在步骤1)中划定的ISA密集区域进行样本自动选择再实现整个区域中ISA全局信息的划定;步骤3)中通过引入纹理特征、空间邻近特征及道路目标特征等三类高层次的影像空间知识针对特定类型的影像局部性ISA信息进行进一步提取;步骤4)通过在步骤2)、3)已提取ISA的作用范围内进行多次迭代计算进行细节信息的优化调整。通过整合以上步骤的结果得到最终的ISA信息提取结果。
步骤5)、6)、7)是基于样本库的ISP自动计算的计算步骤,其影像空间输入是以上步骤提取的ISA结果,其计算过程需要在样本库的支持下完成。步骤5)涉及ISP样本的抽样与优化,其目的是保证整体样本的代表性与准确性;步骤6)是根据影像获取时间与区域以及ISA的空间分布模式自动在ISP样本库中挑选适合的样本子集;步骤7)是配合样本优选算法来进行训练与检验以得到高于精度标准的ISP计算模型并对应ISP的高低通过特定的应用策略计算得到整个ISA范围内像元的定量ISP值。
本发明与现有技术相比具有如下特点:串联了整个不透水面遥感信息提取的自动化计算流程,所建立的“ISA提取-ISA计算”的技术框架除了能够实现技术流程的自动化外,在模型空间知识的选择与融入、机器模型的选择与集成等环节也具有灵活性,在本发明构建的样本库支持下对应不同区域的遥感影像均能够达到稳定的提取精度。
附图说明
图1是不透水面遥感信息自动提取方法示意图
图2是不透水面遥感信息自动提取技术流程图
图3是不透水面覆盖范围(ISA)自动提取实现流程图
图4是像元不透水面覆盖率(ISP)自动计算流程图
图5是ISP样本抽样优化方法示意图
图6是ISP模型训练样本优选示意图
图7是区域不透水面遥感信息提取结果示意图(a:ISA;b:ISP)
具体实施方式
以往包括混合光谱分解及机器学习的不透水面信息提取方法,并没有把不透水面范围(ISA)提取作为一个单独的步骤,而是直接在整个影像范围内求解不透水面覆盖率(ISP),这种方法的缺点是在某些不存在不透水面的位置也会出现模型计算的ISP值,而且存在光谱混淆也是这种方法中一直存在的问题。因此,本发明首先在遥感影像上自动提取出ISA范围,、再进行基于样本库的亚像元级的ISP计算,提高了整个提取流程的稳定性和灵活性,并能有效地提高算法的运行效率,方法技术流程如图2。
ISA范围提取实际上是一个影像的二分类问题,如果像元对应的地表范围内包含任何不透水面覆盖即被定义为不透水面类别。本发明采用“全局-局部-细节”的多层次遥感专题信息提取模型,通过知识的逐步融入及多次算法迭代逐步逼近ISA范围而提高整体分类的精度:
①对于输入的遥感影像(主要针对TM和CBERS等中分辨率资源卫星数据)经过前期预处理(如校正、去噪、增强等),通过对影像光谱特征的统计分析来自动选择合适的尺度进行影像聚类;并采用基于Bhattacharyya距离的模糊样本自动采集获得地物隶属样本集合,其数学表达为:对于多元高斯分布pi=N(mi,Pi),B距离定义为:
其中,mi和Pi分别为类型i对应的均值向量和协方差矩阵,且P=(P1+P2)/2。再通过模糊分类器中阈值的自动确定进行不透水面和与背景的分离,得到初步的分类结果;
②全局分类将原始影像划分为三类:不透水面(ISA)、透水面(non-ISA)及未分类像元。在此基础上通过统计“未分类像元”的特征信息并引入下一级分类器,计算其三大类特征:纹理特征、空间临近特征及道路目标特征。其中纹理特征为以每个“未分类”像元为中心且包含“已分类”像元的不同大小邻近矩阵的纹理统计(包括均值、方差、对比度、能量场及同质度等指标):
其中Pd为不同大小邻接范围(3×3,5×5,7×7,9×9,11×11)的共生矩阵;空间关系特征为不同大小邻接范围(同上)内“未分类”像元与其最近ISA和最近non-ISA像元的距离;道路目标特征是以“未分类”像元为中心(5×5,7×7,9×9)进行方向性掩膜检测而得到道路目标形态和方向性特征。再此基础上通过分类器整合形成局部ISA信息提取结果。
③在对象化表达基础上建立ISA和其他地类的最大似然函数,逐步计算作用区域内各个像元点的类别归属,通过计算对象的空间形态特征进行单元搜索、分割以及分类等处理,判断新生成的结果与已有ISA之间的变化关系,如果趋于稳定则停止迭代,实现对ISA分类结果进行细节修正和信息优化。最后整合①②③的ISA提取结果得到整幅遥感影像的ISA提取结果。其中,不透水面覆盖范围(ISA)自动提取实现流程如图3。
ISP是单位地表面积中(对应于遥感影像的一个像元)不透水面的面积百分比,是一种亚像元尺度的计算。本发明在具有代表性的ISP样本库的支持下,通过合理的自动样本优选和计算模型训练策略,可以得到比较准确、稳定的不透水面覆盖范围内各像元对应的ISP计算值。基于样本库的不透水面覆盖率计算方法总体研究方案如图4,主要包括不透水面覆盖率样本库构建和不透水面覆盖率计算模型两个部分。
不透水面信息提取方法均需要首先获得研究区一定数量的不透水面样本,用于不透水面提取模型的构建及提取精度的验证,而样本库的精度将直接决定信息提取的精度。以往方法中主要通过对研究区内的高分辨率遥感影像进行分类后统计得到一定数量的不透水面样本点,这种研究方法对于高分数据的范围与时相均有较高的要求,普遍存在样本代表性不足、适用性不大等问题,一定程度上也阻碍了有关不透水面提取方法的实用性。因此,本发明通过构建一套不透水面覆盖率样本库,从样本类型与样本分布两个方面突破ISP样本构建的瓶颈,重点解决了异地样本适用性、样本自动优选和匹配、计算模型精度评价等问题,针对不同区域、不同季节等特征建立完备的ISP样本集,以支持大区域不透水面覆盖率自动计算。
ISP样本库的构建通过以下4个步骤开展:①依循详尽可行的不透水面样本采集方案,对于样本采集的区域、数据组织体系、样本精度等关键环节制定规范化的标准,保证样本录入的可靠性;②遥感影像上相同的用地类型在空间纹理等方面具有一定的相似度,因此系统地收集了各级建成区中各种具有代表性的用地类型所对应的不透水面像元样本,构建体系合理、类型丰富的ISP样本集;③在样本构建方法上,采用高分辨率影像解译为主,辅以GIS数据同化和GPS实地调查的方法。高分辨率影像解译主要针对建筑物型不透水类型,将收集样本采集区的亚米级高分辨率影像(如QuickBird),采用面对对象分类及人工目标识别算法获得地表的参照信息并重采样为ISP样本;GIS数据同化主要针对道路型不透水面类型,可通过格式转换与空间分析等将路网GIS数据与影像叠合形成ISP样本集;GPS实地调查主要针对示范区重点区域开展,可用于形成部分测试数据及高分数据提取算法的验证。④对于样本的统计抽样:样本集的构成直接影响了最终的模型计算结果,需要引入样本技术(Sampling)对取样确定样本数量来判断样本对总体的代表性,使有限样本能够尽可能准确地代表全体的特征。本发明将采用由Bootstrapping的统计抽样方法来估计样本的先验分布,配合Monte-Carlo抽样法从数理统计的角度进一步优化不透水面样本集的代表性。如图5,其具体数学步骤在于:
i.从未知分布F的总体中抽取容量为n的一个样本(X1,X2,...,Xn),假设样本的每个元素X1,X2,...,Xn被抽取的概率都相等(1/n),获得样本的经验分布函数Fe(Fe是总体分布的极大似然估计);
ii.从经验分布函数Fe中抽取容量为m(m≤n)的一个样本;
iii.计算统计量Γ的一个值;
iv.将步骤ii与步骤iii重复N次,注意N应选取较大的值,实际上N依赖检验需要运行的次数;
v.由上述过程,得到感兴趣的统计量Γ的N个值。假设统计量取每个值的概率相等,为1/N。构建统计量的累计频数分布和相对频数分布图作为统计量分布的估计。由此可以对参数作出统计推断。
最后,将整个ISP样本库划分为相互独立的训练样本库和检验样本库两大类。
ISP样本库的支持下的ISP自动计算模型,主要包括一系列的样本优选、模型训练及模型应用的策略,以及从分类器的优化和整合研究。①样本优选:对于输入的ISA结果影像,从影像获取时间、ISA范围、ISA光谱特征等标准而从ISP样本库中自动匹配与选择相应的样本集进行计算模型训练,由此我们将对样本的组织、管理和检索等方面进行详尽的设计和研究,实现样本与ISA匹配的准确性;②模型训练:引入模型优化策略进行计算模型的训练,将上述匹配的样本集按ISP值划分为n个子集,依次进行训练,每次挑选计算精度均方差误差最小的部分样本(如90%)与下一组样本合并再进行训练,最大程度地优化计算模型的训练精度,如图6;③对于分类器结构和参数的优化也是研究的重要部分,比如对于SVM模型,不同SVM参数选取得到的回归精度也会有很大不同,合适的核函数和阈值对于计算精度非常重要,本发明对比了主流的机器学习模型用于ISP计算的精度,通过多种机器模型的集成进一步提高ISP的拟合精度;④模型应用:以往的研究几乎都采用一个计算模型进行ISP计算,其输出节点的ISP为0~1,这样有可能会带来模型的泛化性能不高;本发明拟采用两个计算模型分别对应ISP>0.5(不透水面比例占多数)和ISP<0.5(渗透表面比例占多数)两部分像元,提高了模型计算的稳定性。
本发明的实例在PC平台上实现,经实验证明,本发明能够得到较理想稳定的提取结果,如图7(a为ISA提取结果;b为ISP估算结果),并且较常规方法有着极大程度的自动化改进,实现提取流程的无人工参与。本发明中所提及方法可广泛应用于区域不透水面信息遥感影像分析与信息提取等过程中,并应用于土地资源调查、区域环境规划等大型应用。