CN115205528A - 一种用于面向地理对象影像分析的特征选择方法 - Google Patents

一种用于面向地理对象影像分析的特征选择方法 Download PDF

Info

Publication number
CN115205528A
CN115205528A CN202210824481.2A CN202210824481A CN115205528A CN 115205528 A CN115205528 A CN 115205528A CN 202210824481 A CN202210824481 A CN 202210824481A CN 115205528 A CN115205528 A CN 115205528A
Authority
CN
China
Prior art keywords
feature
ground
class
classification
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210824481.2A
Other languages
English (en)
Inventor
瞿伟
王宇豪
李久元
高源�
李达
王嘉鹏
张勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changan University
Original Assignee
Changan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changan University filed Critical Changan University
Priority to CN202210824481.2A priority Critical patent/CN115205528A/zh
Publication of CN115205528A publication Critical patent/CN115205528A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • G06V20/13Satellite images

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Multimedia (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Astronomy & Astrophysics (AREA)
  • Remote Sensing (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种用于面向地理对象影像分析的特征选择方法,能够模拟人工构建地物提取规则的过程进行特征空间优化,利用自创建评价指标实现特征去相关和特征子集优化,并给出了分类顺序和特征的软阈值,可直接作为输入来获取区域地表覆盖类型详细数据集。本方法相较于其他特征选择算法而言,使用了特征组合评价指标来构建地物分类规则的方式而非使用单个特征评价指标,构建的地物提取规则更加合理;使用隶属度函数结合软阈值来描述地物,而不是“非零即一”的分类准则,使得分类结果更接近人类的语言和思维方式。本发明实现过程简单,极大地减少了人工干预的影响,应用效果显著,可实现面向对象地物分类过程中的自动构建地物提取规则。

Description

一种用于面向地理对象影像分析的特征选择方法
技术领域
本发明属于面向地理对象影像分析技术的特征选择领域,涉及到一种用于面向地理对象影像分析的特征选择方法,该方法以高分辨率遥感影像的地物分类为实际应用背景,可用于复杂环境地物分类、典型目标地物提取和基于时间序列的土地利用类型变化监测等应用方向。
背景技术
面向地理对象影像分析(geographic object-based image analysis,GEOBIA)技术是遥感信息提取的一个新兴并迅速发展的研究领域,其充分利用了遥感影像的光谱、形状、纹理、拓扑、语义、时相等多方面特征,综合利用了多源信息,如GIS数据、数字高程模型(DEM)以及景观生态、人文地理专题数据等,融合了主流影像分析方法,如监督分类、模糊数学分类、基于规则的分类等,在一定程度上消除了基于像元分类过程中易出现的“同物异谱”和“同谱异物”现象,有效提高了信息提取的精度。GEOBIA技术从提出至今已有十余年,自动化、智能化是当今该技术最大的发展趋势,然而特征选择、规则集构建却成为制约GEOBIA自动化发展的关键因素。目前在特征选择和规则集构建方面主要存在两大难题:一是难以确定出哪些特征对于提取地物是有效的;二是数据源的差异限制了分类规则集的可移植性。因此,特征优选及构建分类规则集仍是当前费时且具有挑战性的研究工作。
目前,特征选择方法主要分为基于图像信息量和基于类间可分性两种:前者包括最佳指数法(optimal index factor,OIF)、自适应波段选择法(adaptive bandselection,ABS)、自动子空间划分法(auto-subspace partition,ASP)等;后者则包括基于欧氏距离(Euclidean distance,ED)、密度峰值聚类(density peaks cluster,DPC)、基于离散度(Scatter degree,SD)的方法和分离阈值法(separability and threshold,SEaTH)等。其中,OIF方法计算量过大,ABS模型是一种改进的OIF,方便快捷,有效缩短了OIF的运行时间,但难以选出真正具有代表性的波段,对于较复杂的影像目标分类时精度并不理想。ASP方法综合考虑波段相关性和信息量,但选出的波段较可能分布在同一子空间,难以达到最佳降维效果。基于ED的特征选择方法仅从类均值来评价,没有考虑类的分布和类间的重叠,SD模型没有考虑到特征间的相互影响,DPC也缺乏对波段信息量的度量。
本发明涉及到的SEaTH算法,首先由Nussbaum等人提出,该算法基于高斯分布混合模型,既能进行分类特征选取又能自动计算特征阈值,能够显著提高分类的精度和效率,是当前较有代表性的面向对象的特征优化方法,应用较为广泛。但该算法也存在局限性,例如该算法仅用J-M距离来评判单一特征、特征间可能存在较强相关性且无法确定分类顺序,另外,该算法给出的阈值只适用于硬分类,无法提供明确的、可调整的特征描述。国内外相关学者针对SEaTH算法存在的上述问题,主要针对特征不符合正态分布情况下的阈值计算问题和,使用类间距离、类内距离对特征波段综合进行评价等对该算法进行了优化研究,但现有的改进思路得到的阈值仍不可用于软分类中,且没有提出寻找最佳特征组合的方案,使得地物的提取还是无法达到理论最优的效果,地物分类顺序在一定程度上也过多地依赖于分类人员的专业技能和经验判断。
发明内容
本发明的目的在于克服现有技术的缺陷,提出了一种用于面向地理对象影像分析的特征选择方法—EXaST(extractability and softthreshold),该方法能够模拟人工构建地物提取规则的过程进行特征空间优化。EXaST首先创建单个特征对于地物的提取能力Ea这一评价指标,结合Pearson相关系数对特征库进行去相关。然后在保留集合对目标地物提取能力的前提下对特征子集进行优化,在去相关后的子集中寻找所有与该子集可区分的类别数目相等的特征组合,创建特征组合对于目标地物的提取能力Ce这一评价指标,衡量特征组合优劣,最终得到最优的特征组合。此外,SEaTH算法本身没有顾及到分类顺序的问题,且计算出的特征阈值只适用于硬分类,而EXaST算法则可根据提取每种地物所需的最优特征组合可区分的类别数目和Ce值来确定地物分类顺序,然后根据地物特征值分布的均值和方差确定类别间的软阈值,结合模糊分类法对地物进行描述,进而对地物对象进行分类。
本发明的技术方案如下:
一种用于面向地理对象影像分析的特征选择方法,包括以下步骤:
(1)基于影像分割技术获取影像对象,按照地物占比选择典型样本后输出其特征和特征值;
(2)基于Pearson相关系数计算待提取地物与其他所有地物的自相关系数矩阵,并设置合适的阈值调节入选特征的数目;
(3)根据特征对于目标地物的提取能力值依次在自相关系数矩阵中进行特征去相关;
(4)对于(3)得到的特征集合,以特征组合对目标地物的提取能力为评价指标,得到某一类地物最优的特征组合,完成特征子集的优化;
(5)重复(1)-(4),计算提取每种地物的最佳特征组合,基于提取每个特征组合能够区分的类别数目和提取能力值来确定先提取那种地物;
(6)重复(1)-(5)直至只剩两种地物未提取,基于类间可分性得到能够将其分离的最优特征;
(7)计算提取每种地物最佳特征的软阈值后结合隶属度函数,构建每一种地物的提取规则,实现地物提取。
进一步地,所述影像分割方法为多尺度分割,分割的尺度因子、光谱因子和平滑度根据多次试验取得,得到地物对象后,根据样本的代表性和在空间上分布的均匀性,按照地物占比选择约2.5%的典型样本后输出它们的特征和特征值。
进一步地,所述自相关系数矩阵r可表示为:
Figure BDA0003745884130000031
上式中,rij(i,j=1,…,N)为Pearson相关系数,表示两个特征的相关程度,可表示为:
Figure BDA0003745884130000032
设对象类别为Cn=(c1,c2,…,cn),原始高维特征集为FN=(f1,f2,…,fN),上式中,N表示特征集内特征的数目,
Figure BDA0003745884130000033
表示特征集中第l个样本的第i个特征值,
Figure BDA0003745884130000034
表示特征集中第l个样本的第j个特征值,
Figure BDA0003745884130000035
表示第i个特征的均值估计,
Figure BDA0003745884130000041
表示第j个特征的均值估计:
Figure BDA0003745884130000042
进一步地,类别c1和c2基于某个特征的J值为:
J=2(1-e-B)
其中,
Figure BDA0003745884130000043
式中,J值为Jeffries-Matudita距离,简称J-M距离,能够衡量某个特征对于两个类别的类间可分性,称为分离度。m1代表c1类别基于该特征分布的均值,m2代表c2类别基于该特征分布的均值,σ1代表c1类别基于该特征分布的方差,σ2代表c2类别基于该特征分布的均值;
特征对于目标地物的提取能力Ea值为:
Figure BDA0003745884130000044
式中,第i个特征对于c1与cj(j=2,3,…,n)间的分离度为
Figure BDA0003745884130000045
si表示
Figure BDA0003745884130000046
中大于等于1.25的数目,
Figure BDA0003745884130000047
表示
Figure BDA0003745884130000048
中大于1.25的值。
去相关的规则为:依次考察待提取地物与其他所有地物的自相关系数矩阵r中每两个特征的相关系数rij,当某两个特征相关系数超过阈值时,则去掉Ea值较小的特征。
进一步地,所述特征组合的提取能力Ce值为:
Figure BDA0003745884130000049
设经过去相关后的特征子集为FM=(f1,f2,…,fM),
Figure BDA00037458841300000410
表示第i个特征对于c1与cj(j=2,3,…,n)间的分离度,Ci表示
Figure BDA00037458841300000411
的所有j的集合,设Ci(i=1,2,…,N)的并集为Ca,使用特征集FM将类别c1与ck(k∈Ca)分离,并将Ce值最大的特征子集作为提取目标地物最佳的特征组合;
上式中,A为Ca内元素个数,Ji表示特征组合在目标地物类别与Ca第i个元素对应的类别之间的最大J值,ni表示特征组合内元素的个数,σj表示所有最大J值归一化之后的方差。
进一步地,所述分类顺序的定义规则为:重复(1)-(4)来计算提取每一种地物的所需的最佳特征组合和该组合的Ce值,将能够区分类别最多的特征组合对应的目标地物放在前面提取;若能够区分类别数目相等,则先提取Ce值较大的;若Ce值相等,则先提取地物对象数目少的,因为该做法便于分类人员在分类过程中评估分类效果。选择完成后在地物类别库中删除该类地物。
进一步地,所述隶属度函数的选取方法为:采用指派的方法,根据SEaTH(separability and threshold)算法给出的阈值形式套用现有的模糊分布。其中,SEaTH算法给出的阈值形式,是通过能够区分目标地物与其他所有地物的某一特征的最佳分离阈值得到的,该阈值通过下式计算:
Figure BDA0003745884130000051
其中,
Figure BDA0003745884130000052
式中,n1和n2表示两个地物类别的样本数目,m1代表c1类别基于该特征分布的均值,m2代表c2类别基于该特征分布的均值,σ1代表c1类别基于该特征分布的方差,σ2代表c2类别基于该特征分布的均值。
软阈值计算方法为:设软阈值下限为Ta,上限为Tb,本发明定义的软阈值上下限计算方法为:
Figure BDA0003745884130000053
Figure BDA0003745884130000054
上式中T′为硬阈值参数,表示为:
Figure BDA0003745884130000055
设x~N(m,σ2),根据正态分布的特性,特征值有95%分布在[m-1.96σ,m+1.96σ]段,95%以上分布在[m-1.96σ,+∞]或[-∞,m+1.96σ]段,若以m±1.96σ为软阈值的界限,理论上可保证95%以上地物成功归类,满足提取地物的要求。
本发明与现有技术相比具有以下优点:
本发明提出了一种用于面向地理对象影像分析的特征选择方法—EXaST,该方法计算出的特征和阈值可以直接作为分类的输入。EXaST在原SEaTH算法的基础上首先根据Pearson相关系数和特征评价指标Ea进行去相关,然后利用特征组合评价指标Ce寻找最优特征组合并确定分类顺序,最后根据地物特征值分布的均值和方差确定类别间的软阈值,结合模糊分类法对地物进行描述,进而对地物对象进行分类。新方法在对原始特征集进行降维的同时最大程度保留了原集合的分类能力,且提高了特征的有效性和分类精度的同时减少了分类过程中人工干预的影响因素。该方法实现过程简单,应用效果显著,可实现面向对象地物分类过程中的自动构建地物提取。
附图说明
图1是本发明流程图;
图2是本发明指派的两种模糊分布示意图;
图3是本发明计算提取c1类特征软阈值的示意图;
图4是本发明用作算例的实验数据示意图;
图5是利用EXaST算法进行特征选择并提取地物的研究区地物分类图;
图6是利用SEaTH算法和面向对象的最邻近分类法对研究区进行分类的结果图;
图7是图5与图6中白框中对应位置滑坡提取结果三维立体示意图;
图8是图5与图6中黑框内对应位置居民地的提取结果示意图。
具体实施方式
下面结合附图对本发明做进一步的描述。
参照图1,本发明的具体实施步骤如下:
步骤1.基于影像分割技术获取影像对象,按照地物占比选择典型样本后输出其特征和特征值;
其中,所述影像分割方法为多尺度分割,分割的尺度因子、光谱因子和平滑度根据多次试验取得,得到地物对象后,根据样本的代表性和在空间上分布的均匀性,按照地物占比选择约2.5%的典型样本后输出它们的特征和特征值。
步骤2.基于Pearson相关系数计算待提取地物与其他所有地物的自相关系数矩阵,并设置合适的阈值调节入选特征的数目;
其中,所述自相关系数矩阵r可表示为:
Figure BDA0003745884130000071
上式中,rij(i,j=1,…,N)为Pearson相关系数,表示两个特征的相关程度,可表示为:
Figure BDA0003745884130000072
设对象类别为Cn=(c1,c2,…,cn),原始高维特征集为FN=(f1,f2,…,fN),上式中,N表示特征集内特征的数目,
Figure BDA0003745884130000073
表示特征集中第l个样本的第i个特征值,
Figure BDA0003745884130000074
表示特征集中第l个样本的第j个特征值,
Figure BDA0003745884130000075
表示第i个特征的均值估计:
Figure BDA0003745884130000076
同理,
Figure BDA0003745884130000077
则表示第j个特征的均值估计。
步骤3.根据特征对于目标地物的提取能力Ea值依次在r中进行特征去相关;
其中,类别c1和c2基于某个特征的J值为:
J=2(1-e-B)
其中,
Figure BDA0003745884130000078
式中,J值为Jeffries-Matudita距离,简称J-M距离,能够衡量某个特征对于两个类别的类间可分性,称为分离度。m1代表c1类别基于该特征分布的均值,m2代表c2类别基于该特征分布的均值,σ1代表c1类别基于该特征分布的方差,σ2代表c2类别基于该特征分布的均值;
特征对于目标地物的提取能力Ea值为:
Figure BDA0003745884130000081
式中,第i个特征对于c1与cj(j=2,3,…,n)间的分离度为
Figure BDA0003745884130000082
si表示
Figure BDA0003745884130000083
中大于等于1.25的数目,
Figure BDA0003745884130000084
表示
Figure BDA0003745884130000085
中大于1.25的值;
去相关的方法是:依次考察待提取地物与其他所有地物的自相关系数矩阵r中每两个特征的相关系数rij,当某两个特征相关系数超过阈值时,则去掉Ea值较小的特征。
步骤4.对于步骤3得到的特征集合,以特征组合对目标地物的提取能力为评价指标,得到某一类地物最优的特征组合,完成特征子集的优化;
其中,所述特征组合的提取能力Ce值为:
Figure BDA0003745884130000086
设经过去相关后的特征子集为FM=(f1,f2,…,fM),
Figure BDA0003745884130000087
表示第i个特征对于c1与cj(j=2,3,…,n)间的分离度,Ci表示
Figure BDA0003745884130000088
的所有j的集合,设Ci(i=1,2,…,N)的并集为Ca,使用特征集FM将类别c1与ck(k∈Ca)分离,并将Ce值最大的特征子集作为提取目标地物最佳的特征组合;
上式中,A为Ca内元素个数,Ji表示特征组合在目标地物类别与Ca第i个元素对应的类别之间的最大J值,ni表示特征组合内元素的个数,σj表示所有最大J值归一化之后的方差。
步骤5.重复步骤1-4,计算提取每种地物的最佳特征组合,基于提取每个特征组合能够区分的类别数目和提取能力值来确定先提取那种地物;
其中,所述分类顺序的定义规则为:重复步骤1-4来计算提取每一种地物的所需的最佳特征组合和该组合的Ce值,将能够区分类别最多的特征组合对应的目标地物放在前面提取;若能够区分类别数目相等,则先提取Ce值较大的;若Ce值相等,则先提取地物对象数目少的,因为该做法便于分类人员在分类过程中评估分类效果。选择完成后在地物类别库中删除该类地物;
步骤6.重复步骤1-5直至只剩两种地物未提取,基于类间可分性得到能够将其分离的最优特征;
步骤7.计算提取每种地物最佳特征的软阈值后结合隶属度函数构建每一种地物的提取规则。
其中,所述隶属度函数的选取方法为:采用指派的方法,根据SEaTH(separabilityand threshold)算法给出的阈值形式套用现有的模糊分布。以c1类的提取为例,具体指派方法为:对于某一特征,若c1类地物能够以单一特征阈值与其余地物区分开,则给出三次函数的形式;若c1类地物需要一个阈值区间来保证与其余地物的分离效果,则给出二次函数(抛物线)的形式。
其中,SEaTH算法给出的阈值形式,是通过能够区分目标地物与其他所有地物的某一特征的最佳分离阈值得到的,该阈值通过下式计算:
Figure BDA0003745884130000091
其中,
Figure BDA0003745884130000092
式中,n1和n2表示两个地物类别的样本数目,m1代表c1类别基于该特征分布的均值,m2代表c2类别基于该特征分布的均值,σ1代表c1类别基于该特征分布的方差,σ2代表c2类别基于该特征分布的均值。
关于软阈值的上下限的设置,设x~N(m,σ2),根据正态分布的特性,特征值有95%分布在[m-1.96σ,m+1.96σ]段,95%以上分布在[m-1.96σ,+∞]或[-∞,m+1.96σ]段,若以m±1.96σ为软阈值的界限,理论上可保证95%以上地物成功归类,满足提取地物的要求。设软阈值下限为Ta,上限为Tb,本发明定义的软阈值上下限计算方法为:
Figure BDA0003745884130000093
Figure BDA0003745884130000094
上式中T′为硬阈值参数,表示为:
Figure BDA0003745884130000101
对于某一特征,若经指派给出的是三次函数形式的隶属度函数,则该特征对于提取c1类的软阈值区间为[Ta,Tb],记为“T>[Ta,Tb]”。其中Ta为软阈值下限,Tb为软阈值上限。表示特征值小于Ta的对象归为其它类,特征值大于Tb的对象归为c1类,特征值在Ta与Tb间的对象根据三次函数形式的模糊分布计算其归属度,进而判断其类别(如图3a)。
对于某一特征,若经指派给出的是二次函数形式的隶属度函数,则该特征对于提取c1类的软阈值区间为[Ta,T′b],记为“T~[Ta,T′b]”。其中Ta是特征值分布位于c1类左边,即特征均值小于c1类,且与c1类相隔最近的类别与c1类间的软阈值区间下限,T′b是特征值分布位于c1类右边,即特征均值大于c1类,且与c1类相隔最近的类别与c1类间的软阈值区间上限。表示特征值小于Ta的对象归为c2类,特征值大于T′b的对象归为c3类,特征值在Ta与T′b间的对象根据抛物线形式的模糊分布计算其归属度,进而判断其类别(如图3b)。
本方法相较于其他特征选择算法而言,使用了特征组合评价指标来构建地物分类规则的方式而非使用单个特征评价指标,构建的地物提取规则更加合理;使用隶属度函数结合软阈值来描述地物,而不是“非零即一”的分类准则,使得分类结果更接近人类的语言和思维方式。本发明实现过程简单,极大地减少了人工干预的影响,应用效果显著,可实现面向对象地物分类过程中的自动构建地物提取规则。
利用EXaST算法给出的每种地物的提取规则、特征软阈值以及分类顺序作为输入,可获取区域地表覆盖类型详细数据集,进一步结合人工目视解译和新闻资料、文献数据等作为验证,可用于复杂环境地物分类、典型目标地物提取和基于时间序列的土地利用类型变化监测,为经济发展、城乡建设及土地利用规划、地质灾害防治的提供科学依据。
本发明的效果可以通过下述算例加以说明:
1.算例设置
这里为证明本发明提出新算法的准确性及有效性,设置实际算例。
如图4所示,选取我国甘肃省临夏回族自治州所辖永靖县盐锅峡镇黑方台区域,利用该区域2020年11月9日获取的高分二号卫星影像和2020年获取的12.5m分辨率DEM数据来检验本发明提出的用于面向地理对象影像分析的特征选择新方法。其中高分二号影像数据覆盖范围为东经103°17′30″~103°19′15″,纬度范围为北纬36°5′00″~36°6′20″,空间分辨率为0.8m,其假彩色合成影像(NIR波段用于增强G波段以凸显植被)如图4a所示。首先将DEM重采样至与影像同分辨率,基于此进一步可得到高程(图4c)、坡度(图4d)和地形起伏度(图4e)等地形信息。然后对影像进行多尺度分割,本算例经多次试验后最终所采用的分割尺度为200,光谱因子为0.7、形状因子为0.3,平滑度与粗糙度均为0.5。此外,本算例还加入坡度图和地形起伏度图分别作为第六和第七波段参与特征提取,加入DEM作为第五波段与多光谱波段以1:1:1:1:1等权参与分割以提高分割效果,分割后的影像如图4b所示。
最后,将实验数据划分为滑坡、基岩、居民地、荒地和植被5大类,根据样本的代表性和在空间上分布的均匀性,按照地物占比选择了约2.5%的典型样本后输出它们的特征和特征值,分别利用SEaTH算法和EXaST算法进行特征选择实验并进行地物分类,并分别利用基于混淆矩阵和误差分析的分类精度评价方法对三种方法的分类结果进行评价。
2.算例结果
为对比不同方法对特征选择和最终分类效果的比较,本算例分别采用EXaST、SEaTH和面向对象的最邻近分类法三种方法对研究区地物进行了分类,考虑到分类结果的可对比性,在获取地物对象时使用了相同的多尺度分割参数,作为算法的输入,也使用了相同的样本和特征值。
图5给出了利用EXaST算法进行特征选择并提取地物的研究区地物分类图。
图6给出了分别利用SEaTH算法(图6a)和面向对象的最邻近分类法(图6b)对研究区进行分类的结果图。
图7给出了将图5与图6中白框中对应位置滑坡提取结果与影像叠加显示,并从高精度DSM上获取地面像素点高程进行三维立体显示的效果,依据国家自然资源部发布的滑坡信息结合滑坡遥感识别标志进行目视解译,给出人工解译的滑坡边界作参考(图7a)。对比SEaTH算法提取效果和EXaST算法提取效果可看出,SEaTH算法将斜坡上一些亮度值高于周围基岩地物的对象误判为滑坡,而党川黄土滑坡群右侧的部分黄土-基岩滑坡由于亮度均值低于阈值而没有被识别为滑坡,并且由于某些滑坡发生时间较久,部分滑坡的痕迹被表层土重新覆盖,使用SEaTH算法给出的提取顺序和特征组合并没有将这些对象识别为滑坡,导致最终分类结果的滑坡内部出现不连续现象(图7b)。而EXaST算法选择先提取植被等较容易提取的地物,将基岩与滑坡的提取放在最后,能更加精确地描述出二者的区别、更好地提取滑坡,提取结果与人工目视解译结果基本匹配(图7c)。由此可知,EXaST算法能够规划出更加合理的分类顺序。
图8给出了图5与图6中黑框内对应位置居民地的提取结果示意图,区域内植被与居民地分布密集,分割结果的对象不可避免地同时包含这两种地物(图8a),结合表1可知,SEaTH算法选择使用90°方向灰度差分矢量熵和R波段值标准差特征提取居民地,虽然这两个特征J值都较大,适合用来提取居民地,但其组成的特征组合却都只是保证了居民地与周围荒地具有较好的分离效果,而部分植被占比较大的对象会被识别为居民地(图8b)。此时若调整阈值,则会使得居民地无法完全提取。而EXaST算法使用0°方向灰度差分矢量对比度来提取居民地,该特征保证了目标地物,即居民地与其他所有地物都有较好的分离性(图8c)。因此,EXaST算法能够优选出更加合理的特征用于提取地物,减少错分和漏分的可能性。
表1给出了EXaST算法得到的研究区地物最优提取特征结果,地物提取顺序依次为由上到下。
表1 EXaST算法地物最优提取特征表
Figure BDA0003745884130000121
表2给出了SEaTH算法得到的研究区地物最优提取特征结果,地物提取顺序依次为由上到下。由表1和表2可知,SEaTH算法仅根据J-M距离来评判单一特征的有效性,对原始特征空间(188维)进行优化,得到一个7维的特征子集:NDVI、NDWI、90°方向灰度差分矢量熵(GLDV Entropy(90°))、R波段标准差(StandarddeviationLayer3)、Mean Layer6、0°方向灰度共生矩阵值(GLCM Mean(0°))和平均亮度值(MeanBrightness)。而EXaST算法首先根据Pearson相关系数和Ea值对特征进行去相关,然后对剩余的特征子集进行优化,得到与原子集地物提取能力相等的若干特征组合,最后根据评价指标Ce衡量特征组合提取目标地物的能力,通过在此优化特征空间得到一个4维的特征子集:NDVI、GLDV Contrast(0°)、MeanLayer6和Max different。经初步目视判读EXaST算法的分类结果(图5f),可知其分类结果大致符合真实地物分布情况。由此可以得出,EXaST算法能较好地去除不良特征,更好地降低特征维数,是一种有效的特征降维方法。
表2 SEaTH算法地物最优特征提取表
Figure BDA0003745884130000131
表3给出了基于误差分析的SEaTH算法与EXaST算法滑坡提取精度评价对比,由此知,EXaST算法的滑坡提取准确率为69.5%、滑坡识别率为75.1%,均能够满足滑坡提取的基本需求且优于SEaTH算法。
表3 SEaTH算法与EXaST算法滑坡提取精度评价表
Figure BDA0003745884130000132
表4、5、6分别给出了基于混淆矩阵的EXaST算法、SEaTH算法和面向对象的最邻近分类法分类精度评价表。结果显示,EXaST算法分类的总体精度为94%,Kappa系数为0.919,相对于SEaTH算法分别提高了10%和0.135,较最邻近分类法分别提高20%和0.268。此外,EXaST算法分类结果各地物的生产者精度和用户精度也普遍高于SEaTH算法和最邻近分类算法,由此可知,EXaST算法是一种更优的面向对象特征选择方法。
表4 EXaST算法分类精度验证混淆矩阵
Figure BDA0003745884130000141
表5 SEaTH算法分类精度验证混淆矩阵
Figure BDA0003745884130000142
表6最邻近分类法精度验证混淆矩阵
Figure BDA0003745884130000151

Claims (9)

1.一种用于面向地理对象影像分析的特征选择方法,其特征在于,包括以下步骤:
【1】基于影像分割技术获取影像对象,按照地物占比选择典型样本后输出其特征和特征值;
【2】基于Pearson相关系数计算待提取地物与其他所有地物的自相关系数矩阵,并设置合适的阈值调节入选特征的数目;
【3】根据特征对于目标地物的提取能力值依次在自相关系数矩阵中进行特征去相关;
【4】对于【3】得到的特征集合,以特征组合对目标地物的提取能力为评价指标,得到某一类地物最优的特征组合,完成特征子集的优化;
【5】重复【1】-【4】,计算提取每种地物的最佳特征组合,基于提取每个特征组合能够区分的类别数目和提取能力值来确定先提取那种地物;
【6】重复【1】-【5】直至只剩两种地物未提取,基于类间可分性得到能够将其分离的最优特征;
【7】计算提取每种地物最佳特征的软阈值后结合隶属度函数,构建每一种地物的提取规则,实现地物提取。
2.根据权利要求1所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【1】中所采用的影像分割方法为多尺度分割,分割的尺度因子、光谱因子和平滑度根据多次试验取得,得到地物对象后,根据样本的代表性和在空间上分布的均匀性,按照地物占比选择约2.5%的典型样本后输出它们的特征和特征值。
3.根据权利要求1所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【2】中自相关系数矩阵r可表示为:
Figure FDA0003745884120000011
上式中,rij(i,j=1,…,N)为Pearson相关系数,表示两个特征的相关程度;
Figure FDA0003745884120000012
设对象类别为Cn=(c1,c2,…,cn),原始高维特征集为FN=(f1,f2,…,fN),上式中,N表示特征集内特征的数目,
Figure FDA0003745884120000021
表示特征集中第l个样本的第i个特征值,
Figure FDA0003745884120000022
表示特征集中第l个样本的第j个特征值,
Figure FDA0003745884120000023
表示第i个特征的均值估计,
Figure FDA0003745884120000024
表示第j个特征的均值估计。
4.根据权利要求2所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【3】中,类别c1和c2基于某个特征的J值为:
J=2(1-e-B)
其中,
Figure FDA0003745884120000025
式中,J值为分离度;m1代表c1类别基于该特征分布的均值,m2代表c2类别基于该特征分布的均值,σ1代表c1类别基于该特征分布的方差,σ2代表c2类别基于该特征分布的均值;
特征对于目标地物的提取能力Ea值为:
Figure FDA0003745884120000026
式中,第i个特征对于c1与cj(j=2,3,…,n)间的分离度为
Figure FDA0003745884120000027
si表示
Figure FDA0003745884120000028
中大于等于1.25的数目,
Figure FDA0003745884120000029
表示
Figure FDA00037458841200000210
中大于1.25的值。
5.根据权利要求4所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【3】中,去相关的方法是:依次考察待提取地物与其他所有地物的自相关系数矩阵r中每两个特征的相关系数rij,当某两个特征相关系数超过阈值时,则去掉Ea值较小的特征。
6.根据权利要求1所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【4】中,特征组合的提取能力Ce值为:
Figure FDA00037458841200000211
设经过去相关后的特征子集为FM=(f1,f2,…,fM),
Figure FDA00037458841200000212
表示第i个特征对于c1与cj(j=2,3,…,n)间的分离度,Ci表示
Figure FDA00037458841200000213
的所有j的集合,设Ci(i=1,2,…,N)的并集为Ca,使用特征集FM将类别c1与ck(k∈Ca)分离,并将Ce值最大的特征子集作为提取目标地物最佳的特征组合;
上式中,A为Ca内元素个数,Ji表示特征组合在目标地物类别与Ca第i个元素对应的类别之间的最大J值,ni表示特征组合内元素的个数,σj表示所有最大J值归一化之后的方差。
7.根据权利要求6所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【5】中,分类顺序的定义规则为:重复【1】-【4】来计算提取每一种地物的所需的最佳特征组合和该组合的Ce值,将能够区分类别最多的特征组合对应的目标地物放在前面提取;若能够区分类别数目相等,则先提取Ce值较大的;若Ce值相等,则先提取地物对象数目少的,选择完成后在地物类别库中删除该类地物。
8.根据权利要求1所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【7】中,隶属度函数的软阈值计算公式为
Figure FDA0003745884120000031
其中
Figure FDA0003745884120000032
n1和n2表示两个地物类别的样本数目,m1代表c1类别基于该特征分布的均值,m2代表c2类别基于该特征分布的均值,σ1代表c1类别基于该特征分布的方差,σ2代表c2类别基于该特征分布的均值。
9.根据权利要求8所述的用于面向地理对象影像分析的特征选择新方法,其特征在于:步骤【7】中,设软阈值下限为Ta,上限为Tb,软阈值上下限计算方法为:
Figure FDA0003745884120000033
Figure FDA0003745884120000034
Figure FDA0003745884120000041
T′为硬阈值参数。
CN202210824481.2A 2022-07-14 2022-07-14 一种用于面向地理对象影像分析的特征选择方法 Pending CN115205528A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210824481.2A CN115205528A (zh) 2022-07-14 2022-07-14 一种用于面向地理对象影像分析的特征选择方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210824481.2A CN115205528A (zh) 2022-07-14 2022-07-14 一种用于面向地理对象影像分析的特征选择方法

Publications (1)

Publication Number Publication Date
CN115205528A true CN115205528A (zh) 2022-10-18

Family

ID=83579807

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210824481.2A Pending CN115205528A (zh) 2022-07-14 2022-07-14 一种用于面向地理对象影像分析的特征选择方法

Country Status (1)

Country Link
CN (1) CN115205528A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115965812A (zh) * 2022-12-13 2023-04-14 桂林理工大学 无人机影像对湿地植被物种和地物分类的评估方法
CN117171533A (zh) * 2023-11-02 2023-12-05 山东省国土测绘院 一种地理测绘作业数据实时采集处理方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115965812A (zh) * 2022-12-13 2023-04-14 桂林理工大学 无人机影像对湿地植被物种和地物分类的评估方法
CN115965812B (zh) * 2022-12-13 2024-01-19 桂林理工大学 无人机影像对湿地植被物种和地物分类的评估方法
CN117171533A (zh) * 2023-11-02 2023-12-05 山东省国土测绘院 一种地理测绘作业数据实时采集处理方法及系统
CN117171533B (zh) * 2023-11-02 2024-01-16 山东省国土测绘院 一种地理测绘作业数据实时采集处理方法及系统

Similar Documents

Publication Publication Date Title
Huang et al. A multidirectional and multiscale morphological index for automatic building extraction from multispectral GeoEye-1 imagery
CN101840581B (zh) 一种从卫星遥感影像中提取建筑物轮廓的方法
Herold et al. Spatial metrics and image texture for mapping urban land use
CN106503739A (zh) 联合光谱和纹理特征的高光谱遥感影像svm分类方法及系统
CN109063754B (zh) 一种基于OpenStreetMap的遥感影像多特征联合分类方法
CN103679675B (zh) 一种面向水质定量遥感应用的遥感影像融合方法
Zhao et al. Automatic recognition of loess landforms using Random Forest method
CN110309781B (zh) 基于多尺度光谱纹理自适应融合的房屋损毁遥感识别方法
CN105427309B (zh) 面向对象高空间分辨率遥感信息提取的多尺度分层处理方法
CN115205528A (zh) 一种用于面向地理对象影像分析的特征选择方法
CN111160199B (zh) 一种基于高分辨率遥感影像的公路灾害信息检测方法
CN103839267B (zh) 一种基于形态学建筑物指数的建筑物提取方法
CN110309780A (zh) 基于bfd-iga-svm模型的高分辨率影像房屋信息快速监督识别
CN111639587B (zh) 基于多尺度谱空卷积神经网络的高光谱图像分类方法
CN109657610A (zh) 一种高分辨率多源遥感影像的土地利用变化检测方法
CN108629287A (zh) 一种遥感影像地物分类方法
CN111191628B (zh) 基于决策树与特征优化的遥感影像震害建筑物识别方法
Xie et al. Object-based target search using remotely sensed data: A case study in detecting invasive exotic Australian Pine in south Florida
CN117541940B (zh) 基于遥感数据的土地利用分类方法及系统
CN109859219A (zh) 结合相位与光谱的高分遥感影像分割方法
CN113468982A (zh) 一种城市功能区分类方法、装置及存储介质
Li et al. Integrating multiple textural features for remote sensing image change detection
CN109635828A (zh) 一种生态保护红线区典型地理国情要素提取系统及方法
Jónsson RGB and Multispectral UAV image classification of agricultural fields using a machine learning algorithm
Myint et al. Examining lacunarity approaches in comparison with fractal and spatial autocorrelation techniques for urban mapping

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination