CN113610165B - 基于多源高维特征的城市土地利用分类确定方法和系统 - Google Patents
基于多源高维特征的城市土地利用分类确定方法和系统 Download PDFInfo
- Publication number
- CN113610165B CN113610165B CN202110914345.8A CN202110914345A CN113610165B CN 113610165 B CN113610165 B CN 113610165B CN 202110914345 A CN202110914345 A CN 202110914345A CN 113610165 B CN113610165 B CN 113610165B
- Authority
- CN
- China
- Prior art keywords
- data
- preprocessed
- sample
- preprocessing
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000007781 pre-processing Methods 0.000 claims abstract description 62
- 238000007637 random forest analysis Methods 0.000 claims abstract description 14
- 238000013507 mapping Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 10
- 238000010606 normalization Methods 0.000 claims description 10
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004140 cleaning Methods 0.000 claims description 7
- 238000010276 construction Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 238000011835 investigation Methods 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 5
- 238000002310 reflectometry Methods 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Processing (AREA)
Abstract
本发明涉及一种基于多源高维特征的城市土地利用分类确定方法和系统。该方法在对获取的城市空间数据进行预处理后,提取预处理数据中的多时相高维特征,基于预处理后的OSM路网数据对不透水面进行分割得到基本制图单元,然后,基于基本制图单元和多时相高维特征图层构建样本地块后,获取样本地块的类型标签,并结合样本地块与其对应的类型标签生成原始样本集,接着基于原始样本集生成扩充样本集,最后,采用随机森林模型以扩充样本集为输入得到城市土地利用分类结果后,对城市土地利用分类结果进行投票选择和映射处理后得到城市土地利用分类图,进而更好地解决了土地利用混杂所造成的影响,达到提高土地利用分类精度的目的。
Description
技术领域
本发明涉及数据处理技术领域,特别是涉及一种基于多源高维特征的城市土地利用分类确定方法和系统。
背景技术
城市土地利用是人类改造地球环境以适宜自身生存发展的顶级表现。由于人口增长和城市化进程的加快,城市土地利用正发生着迅猛变化。高质量的精细化城市土地动态制图,对于把握城市空间分布格局、预测城市发展规模与变化趋势,实现城市土地资源优化配置与集约利用至关重要。
早期的城市土地利用分类往往以实地调查、人工判读为主,耗费人力物力且时效性差;而基于遥感影像的半自动分类方法仅利用了影像的光谱信息,忽视了遥感影像中的空间信息和地面辅助信息,只能对城市土地利用信息进行粗略提取和估计,分类效果较差。因此,城市土地利用制图在空间尺度、数据精度以及制图手段上仍存在不足,难以满足城市精细化管理和城市建设更新的需求。针对这一问题,宫鹏等人提出基本城市土地利用类型(Essential urban land use categories,EULUC)的分类体系,采用了机器学习、多源时空数据,实现了城市地块尺度的城市土地利用分类,但是基本制图单元内部土地利用混合现象极大制约了分类精度。
发明内容
本发明的目的是提供一种基于多源高维特征的城市土地利用分类确定方法和系统,提高土地利用分类精度。
为实现上述目的,本发明提供了如下方案:
一种基于多源高维特征的城市土地利用分类确定方法,包括:
获取城市空间数据;所述城市空间数据包括:多时相的哨兵二号遥感影像、POI数据、OSM路网数据和不透水面数据;
对所述城市空间数据进行预处理,得到预处理数据;所述预处理数据包括:预处理后的多时相的哨兵二号遥感影像、预处理后的POI数据、预处理后的OSM路网数据和预处理后的不透水面数据;
提取所述预处理数据中的多时相高维特征,构成多时相高维特征图层;
基于所述预处理后的OSM路网数据对所述不透水面进行分割得到基本制图单元;
基于所述基本制图单元和所述多时相高维特征图层构建样本地块;
获取所述样本地块的类型标签,并结合所述样本地块与其对应的所述类型标签生成原始样本集;
基于所述原始样本集生成扩充样本集;
采用随机森林模型,以所述扩充样本集为输入得到扩充样本集的多样点分类结果;
对所述扩充样本集的多样点分类结果进行“投票”选择,获得改进后的城市土地利用初步分类结果;对所述改进后的城市土地利用初步分类结果映射处理后得到城市土地利用分类图。
优选地,所述对所述城市空间数据进行预处理,得到预处理数据,具体包括:
对所述多时相的哨兵二号遥感影像进行第一预处理得到预处理后的多时相的哨兵二号遥感影像;所述第一预处理包括:拼接、配准和裁剪;
对所述POI数据进行第二预处理得到预处理后的POI数据;所述第二预处理包括:清洗、去重和重分类;
对OSM路网数据进行第三预处理得到预处理后的OSM路网数据;所述第三预处理包括重分类、道路采样和建立道路缓冲区。
优选地,所述提取所述预处理数据中的多时相高维特征,构成多时相高维特征图层,具体包括:
对所述预处理后的多时相的哨兵二号遥感影像进行特征提取,得到多时相的纹理特征和遥感指数;
对所述预处理后的POI数据进行核密度分析和归一化处理得到核密度值;
对所述纹理特征、所述遥感指数和所述核密度值进行特征融合,得到所述多时相高维特征。
优选地,所述基于所述原始样本集生成扩充样本集,具体包括:
将所述原始样本集分隔为多个样本子集;
以在所述基本制图单元中布设多样点的方式对每一所述样本子集进行扩充;
基于扩充后的样本子集生成所述扩充样本集。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明提供的基于多源高维特征的城市土地利用分类确定方法,在对获取的城市空间数据进行预处理后,提取预处理数据中的多时相高维特征,构成多时相高维特征图层,基于预处理后的OSM路网数据对不透水面进行分割得到基本制图单元,然后,基于基本制图单元和多时相高维特征图层构建样本地块后,获取样本地块的类型标签,并结合样本地块与其对应的类型标签生成原始样本集,接着基于原始样本集生成扩充样本集,最后,采用随机森林模型以扩充样本集为输入得到的城市土地利用分类结果,对城市土地利用分类结果进行投票选择和映射处理后得到城市土地利用分类图,进而更好地解决了土地利用混杂所造成的影响,达到提高土地利用分类精度的目的。
对应于上述提供的基于多源高维特征的城市土地利用分类确定方法,本发明还对应提供了以下实施系统,具体为:
一种基于多源高维特征的城市土地利用分类确定系统,包括:
数据获取模块,用于获取城市空间数据;所述城市空间数据包括:多时相的哨兵二号遥感影像、POI数据、OSM路网数据和不透水面数据;
预处理模块,用于对所述城市空间数据进行预处理,得到预处理数据;所述预处理数据包括:预处理后的多时相的哨兵二号遥感影像、预处理后的POI数据、预处理后的OSM路网数据和预处理后的不透水面数据;
特征提取模块,用于提取所述预处理数据中的多时相高维特征,构成多时相高维特征图层;
单元分割模块,用于基于所述预处理后的OSM路网数据对所述不透水面进行分割得到基本制图单元;
单元构建模块,用于基于所述基本制图单元和所述多时相高维特征图层构建样本地块;
样本生成模块,用于获取所述样本地块的类型标签,并结合所述样本地块与其对应的所述类型标签生成原始样本集;
样本扩充模块,用于基于所述原始样本集生成扩充样本集;
分类结果确定模块,用于采用随机森林模型,以所述扩充样本集为输入得到扩充样本集的多样点分类结果;
选择-映射模块,用于对所述扩充样本集的多样点分类结果进行“投票”选择,获得改进后的城市土地利用初步分类结果,还用于对所述改进后的城市土地利用初步分类结果映射处理后得到城市土地利用分类图。
优选地,所述预处理模块具体包括:
第一预处理单元,用于对所述多时相的哨兵二号遥感影像进行第一预处理得到预处理后的多时相的哨兵二号遥感影像;所述第一预处理包括:拼接、配准和裁剪;
第二预处理单元,用于对所述POI数据进行第二预处理得到预处理后的POI数据;所述第二预处理包括:清洗、去重和重分类;
第三预处理单元,用于对OSM路网数据进行第三预处理得到预处理后的OSM路网数据;所述第三预处理包括重分类、道路采样和建立道路缓冲区。
优选地,所述特征提取模块具体包括:
特征提取单元,用于对所述预处理后的多时相的哨兵二号遥感影像进行特征提取,得到多时相的纹理特征和遥感指数;
POI处理单元,用于对所述预处理后的POI数据进行核密度分析和归一化处理得到核密度值;
融合单元,用于对所述纹理特征、所述遥感指数和所述核密度值进行特征融合,得到所述多时相高维特征。
优选地,所述样本扩充模块具体包括:
分割单元,用于将所述原始样本集分隔为多个样本子集;
扩充单元,用于以在所述基本制图单元中布设多样点的方式对每一所述样本子集进行扩充;
扩充样本生成单元,用于基于扩充后的样本子集生成所述扩充样本集。
因本发明提供的基于多源高维特征的城市土地利用分类确定系统达到的技术效果与上述提供的城市土地利用分类确定方法达到的技术效果相同,故在此不再进行赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的基于多源高维特征的城市土地利用分类确定方法的流程图;
图2为本发明实施例提供的基于多源高维特征的城市土地利用分类确定方法实施架构图;
图3为本发明实施例提供的基于多源高维特征的城市土地利用分类确定方法实施架构简图;
图4为本发明实施例提供的2018年郑州市归一化植被指数分布图;
图5为本发明实施例提供的2018年郑州市归一化建筑物指数分布图;
图6为本发明实施例提供的各要素核密度与归一化处理结果图;
图7为本发明实施例提供的基本制图单元示意图;
图8为本发明实施例提供的样本地块单元示意图;
图9为本发明实施例提供的郑州市城市土地利用一级分类图;
图10为本发明实施例提供的郑州市城市土地利用二级分类图;
图11为本发明提供的基于多源高维特征的城市土地利用分类确定系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于多源高维特征的城市土地利用分类确定方法和系统,提高土地利用分类精度。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1和2所示,本发明提供的基于多源高维特征的城市土地利用分类确定方法,包括:
步骤100:获取城市空间数据。城市空间数据包括:多时相的哨兵二号遥感影像、POI数据、OSM路网数据和不透水面数据。
步骤101:对城市空间数据进行预处理,得到预处理数据。预处理数据包括:预处理后的多时相的哨兵二号遥感影像、预处理后的POI数据、预处理后的OSM路网数据和预处理后的不透水面数据。该步骤具体实施过程为:
对多时相的哨兵二号遥感影像进行第一预处理得到预处理后的多时相的哨兵二号遥感影像。第一预处理包括:拼接、配准和裁剪。
对POI数据进行第二预处理得到预处理后的POI数据。第二预处理包括:清洗、去重和重分类。
对OSM路网数据进行第三预处理得到预处理后的OSM路网数据。第三预处理包括重分类、道路采样和建立道路缓冲区。
步骤102:提取预处理数据中的多时相高维特征,构成多时相高维特征图层。可依据多时相高维特征生成多时相高维特征库。该步骤具体实施过程为:
对预处理后的多时相的哨兵二号遥感影像进行特征提取,得到多时相的纹理特征和遥感指数。遥感指数包括归一化植被指数和归一化建筑指数。
对预处理后的POI数据进行核密度分析和归一化处理得到核密度值。
对纹理特征、遥感指数和核密度值进行特征融合,得到多时相高维特征。具体的,本发明基于Arcgis10.2、ENVI5.3软件分别计算了遥感影像的纹理特征、遥感指数与POI数据的核密度值,建立高维特征库。
在上述步骤102中,纹理特征能够包含物质表面形态信息及其与周围环境的关系,反映影像局部模式重复、排列的规则,是影像的重要属性之一。归一化后的植被指数NDVI能反映植被的空间分布情况,可以对识别城市内部公园绿地等类别有较大帮助;归一化后的建筑指数NDBI用来反映建筑用地的信息,对提取城市建筑用地有较大帮助。而POI数据直观的反映了人类活动的轨迹和范围,可以有效识别各个地类具体分布的空间布局。
步骤103:基于预处理后的OSM路网数据对不透水面进行分割得到基本制图单元。
步骤104:基于基本制图单元和多时相高维特征图层构建样本地块。具体的,在基本制图单元内部随机布设随机点,并采用实地调查、Google Earth平台和数据比对等方式获取随机点所在地块内部的地物混合情况,再通过高维特征库获取特征值,构成样本地块。若地块内部土地利用类别较为单一,则作为样本地块,反之,则不用。
步骤105:获取样本地块的类型标签,并结合样本地块与其对应的类型标签生成原始样本集。具体的,采用实地调查、数据比对等方式获取样本地块的类型标签(即土地利用类型);结合样本地块与其对应的样本标签,生成原始样本集;
步骤106:基于原始样本集生成扩充样本集。该步骤的具体实施过程为:
将原始样本集分隔为多个样本子集。以在基本制图单元中布设多样点的方式对每一样本子集进行扩充。
基于扩充后的样本子集生成扩充样本集。
具体的,将原始样本集随机分为不同比例的实验组,一个实验组即为一个样本子集。通过在基本制图单元内部的布设多样点来扩充样本集。这一过程的实施框架如图3所示。
步骤107:采用随机森林模型,以扩充样本集为输入得到扩充样本集的多样点分类结果。其中,随机森林模型是基于RStudio软件,采用R编程语言搭建形成的。具体搭建过程为:首先,引入Random Forest程序包;其次,加载训练数据与验证数据的csv文件,通过Random Forest()函数对初始模型进行训练、Predict()函数预测验证数据的分类结果;最后,将预测结果写入csv文件中,形成搭建好的随机森林模型。
步骤108:对扩充样本集的多样点分类结果进行“投票”选择,获得改进后的城市土地利用初步分类结果。对改进后的城市土地利用初步分类结果映射处理后得到城市土地利用分类图。具体的,通过Arcgis10.2软件中“连接”工具将分类结果映射至地理单元,在制图软件中输出并保存制图得到的城市土地利用分类图。
下面以采用本发明上述提供的基于多源高维特征的城市土地利用分类确定方法确定郑州市土地分类为例,对本发明所提供技术方案的优点进行说明。在实际应用过程中,本发明可应用于任意城市的土地分类确定。
郑州市位于河南中部偏北地区,位于东经112°42'-114°13',北纬34°16'-34°58'。北临黄河,西依嵩山,东南为广阔的黄淮平原。是中部地区中心城市以及国家重要的枢纽城市。
获取的郑州市的土地数据包括:2018年哨兵二号遥感影像数据、OpenStreetMap数据、兴趣点(POI)数据和不透水面数据。
其中,2018年哨兵二号遥感影像数据基于USGS平台下载,影像的获取时间分别为2月、6月、9月、11月,云量小于5%,如表1所示:
表1遥感影像来源表
鉴于模型运算效率和软硬件设施限制,选取波段2、波段3、波段4、波段5、波段6、波段7、波段8和波段8A,并进行重采样,将空间分辨率统一至10m。如表2所示:
表2 Sentinel-2参数表
其中,OpenStreetMap(网址:http://www.openstreetmap.org)是一种由众多志愿者采集、加工生产的开源地理数据,用户都可以在其平台上上传和编辑数据。具有更新快、成本低、免费获取等优点,在划分城市地块、城市街区等领域得到广泛应用。由于OSM平台是由众多志愿者自发采集、编辑、上传数据,数据之间存在重复区域。因此,对OSM数据进行拓扑检查、修改或删除错误要素以及重分类等预处理,将道路分为高速公路、城市快速路、一级主干道、二级次要道路、三级次要道路、小路以及特殊类型道路等七种类别。其次,对不同等级道路进行采样,并建立缓冲区,生成道路网,道路采样距离见表3。
表3不同等级道路采样距离表
其中,POI数据基于百度电子地图爬取和BigeMap平台下载两种获取方式,共有72061条POI数据。该数据具有更新速度快、数据量大、分类体系较细、容易获取等优势。为满足研究需求,需对POI数据进行清洗、去重、属性检查以及重分类等处理,如表4所示:
表4 POI重分类结果表
具体的,首先,纹理包含了物质表面形态信息及其与周围环境的关系,反映了影像局部模式重复、排列的规则,是影像的重要属性之一。其次,NDVI指数能反映植被的空间分布情况,可以对识别城市内部公园绿地等类别有较大帮助;归一化建筑指数NDBI用来反映建筑用地的信息,对提取城市建筑用地有较大帮助。最后,POI数据直观的反映了人类活动的轨迹和范围,可以有效识别各个地类具体分布的空间布局。因此,选取特征有:纹理特征、遥感指数、POI核密度和归一化处理结果。
其中,纹理特征基于灰度共生矩阵(Gray-Level Co-occurrence Matrix,GLCM)进行提取,包括:波段的均值、对比度、方差、协同度、相关性、相异性、熵和二阶矩。
遥感指数选取了归一化植被指数(NDVI)和归一化建筑指数(NDBI)。归一化植被指数用来监测和反映植被覆盖状况,通过不同波段的计算而得到:
NDVI=(NIR-R)/(NIR+R),R指的是红光波段的波段反射率,NIR是近红外波段的波段反射率;
归一化建筑指数反映建筑用地信息和城市化发展强度,同样基于不同波段间的计算而得到:
NDBI=(SWIR-NIR)/(SWIR+NIR),NIR是近红外波段的波段反射率,SWIR指中红外波段的波段反射率。
通过Arcgis10.2软件的“地图代数”工具分别计算遥感影像的NDVI与NDBI值,如图4和图5所示。
POI的核密度值和归一化处理结果。通过Arcgis10.2对预处理后的土地数据进行核密度分析,同时为了将不同类别的POI数据统一至相同量纲下,对POI数据进行了归一化处理。通过Arcgis10.2软件的“核密度分析”与“地图代数”工具分别计算各类别POI数据的核密度值,如图6中(a)-(e)所示。
因此,融合上述提取的多时相遥感影像的纹理特征、归一化植被指数、归一化建筑指数和核密度值,得到了2个光谱特征、256个纹理特征以及5个POI辅助特征作为输入模型特征值,构建高维特征库,具体见表5:
表5
通过预处理后的OSM路网数据分割郑州市不透水面,并对分割后面积较小且破碎的地块进行整合,降低基本制图单元的破碎程度,最终获得12466个基本制图单元,如图7所示。
采用随机选取的方式来确定样本地块:通过获得的基本制图单元内部布设随机点,采用实地调查、数据比对以及Google Earth平台判别地块内部混合度,筛选地物类型较为单一的样本地块,最终得到337个样本地块单元,如图8所示。
基于RStudio软件搭建随机森林模型。首先,加载“randomforest”程序包,调用随机森林模型,读取训练集与验证集。其次,构建参数最佳组合。先确定mtry值,将ntree默认为500,mtry范围为2到20,步长为1,遍历模型。观察OOB值,可以发现:当mtry为16时,袋外误差值最小。其次,当确定mtry的最佳值为16后,设置ntree范围为100-2000,步长为100,可以发现:当ntree≥600时,模型的误差值波动较小,并逐渐趋于稳定状态。为了防止实验结果过拟合,本发明采用ntree值为600作为最优值。由此得到模型参数的最佳组合。最后,对数据集进行训练预测,记录各组试验结果。
对获取的样本地块进行特征采样,并通过Google Earth、实地调查等确定土地利用类型,生成原始样本集;
将生成的原始样本集分为不同比例的实验组,各比例的样本数量如表6所示。
表6“原始样本集”实验组样本数量构成表
首先将原始样本集输入搭建好的随机森林模型中,获得城市土地利用分类结果,如表7所示。
表7“原始样本集”各组分类精度表
结果表明:当训练样本数量增多时,一级分类精度提升,二级分类精度在训练样本占比达到70%以后降低,实验结果可能与二级地类各类别验证样本数量较少、样本内部各类别分布差异较大有关。
然后,通过对基本制图单元的多点特征采样的方式在样本地块内部布设多个样本点。经过多次试验,本发明选取3N(N=10,为分类的类别数)作为布设的样本点个数,实现样本集的扩充,并代入各实验组中进行训练预测,得到一、二级地物的分类精度,如表8所示。
表8“扩充样本集”各组分类精度表
结果表明:对基本制图单元内部多个样点的预测结果进行总体精度统计,发现一级分类精度与二级分类精度降低。这是由于多个样点的预测结果平均化造成精度下降,但是在其个别地类分类精度有较大提升。
最后,将基于“扩充样本集”的多样点分类预测结果进行基于基本制图单元的“投票”机制选择,即将每一单元中被预测次数最多的土地利用类型作为该单元最终的土地利用类型。代入各实验组中,得到不同比例下一级、二级地物的分类精度,如表9所示。
表9基于“投票”机制选择的各组分类精度表
可见,将多时相高维特征、基本制图单元的多样点扩充、基本制图单元的多样点预测“投票”机制结合使用,可以有效提高地物总体分类精度,得到了郑州市城市土地利用的精细制图结果,如图9和图10所示。
综上,本发明上述提供的技术方案相对于现有技术具有以下优点:
1、本发明通过结合多时相高维特征、基本制图单元的多样点扩充和多样点预测“投票”机制的方法,有效提升了城市土地利用分类精度;
2、本发明将“投票”选择机制与多时相高维特征信息相结合,较好的降低了基本制图单元内部土地混杂的影响,为城市土地利用分类提供了新的研究思路。
此外,对应于上述提供的基于多源高维特征的城市土地利用分类确定方法,本发明还对应提供了一种基于多源高维特征的城市土地利用分类确定系统。如图11所示,该城市土地利用分类确定系统包括:数据获取模块1、预处理模块2、特征提取模块3、单元分割模块4、单元构建模块5、样本生成模块6、样本扩充模块7、分类结果确定模块8和选择-映射模块9。
数据获取模块1用于获取城市空间数据。城市空间数据包括:多时相的哨兵二号遥感影像、POI数据、OSM路网数据和不透水面数据。
预处理模块2用于对城市空间数据进行预处理,得到预处理数据。预处理数据包括:预处理后的多时相的哨兵二号遥感影像、预处理后的POI数据、预处理后的OSM路网数据和预处理后的不透水面数据。
特征提取模块3用于提取预处理数据中的多时相高维特征,构成多时相高维特征图层。
单元分割模块4用于基于预处理后的OSM路网数据对不透水面进行分割得到基本制图单元。
单元构建模块5用于基于基本制图单元和多时相高维特征图层构建样本地块。
样本生成模块6用于获取样本地块的类型标签,并结合样本地块与其对应的类型标签生成原始样本集。
样本扩充模块7用于基于原始样本集生成扩充样本集。
分类结果确定模块8用于采用随机森林模型,以扩充样本集为输入得到扩充样本集的多样点分类结果。
选择-映射模块9用于对扩充样本集的多样点分类结果进行“投票”选择,获得改进后的城市土地利用初步分类结果,还用于对改进后的城市土地利用初步分类结果映射处理后得到城市土地利用分类图。
其中,上述预处理模块2具体包括:第一预处理单元、第二预处理单元和第三预处理单元。
第一预处理单元用于对多时相的哨兵二号遥感影像进行第一预处理得到预处理后的多时相的哨兵二号遥感影像。第一预处理包括:拼接、配准和裁剪。
第二预处理单元用于对POI数据进行第二预处理得到预处理后的POI数据。第二预处理包括:清洗、去重和重分类。
第三预处理单元用于对OSM路网数据进行第三预处理得到预处理后的OSM路网数据。第三预处理包括重分类、道路采样和建立道路缓冲区。
上述特征提取模块3具体包括:特征提取单元、POI处理单元和融合单元。
特征提取单元用于对预处理后的多时相的哨兵二号遥感影像进行特征提取,得到多时相的纹理特征和遥感指数。
POI处理单元用于对预处理后的POI数据进行核密度分析和归一化处理得到核密度值。
融合单元用于对纹理特征、遥感指数和核密度值进行特征融合,得到多时相高维特征。
上述样本扩充模块7具体包括:分割单元、扩充单元和扩充样本生成单元。
分割单元用于将原始样本集分隔为多个样本子集。
扩充单元用于以在基本制图单元中布设多样点的方式对每一样本子集进行扩充。
扩充样本生成单元用于基于扩充后的样本子集生成扩充样本集。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (8)
1.一种基于多源高维特征的城市土地利用分类确定方法,其特征在于,包括:
获取城市空间数据;所述城市空间数据包括:多时相的哨兵二号遥感影像、POI数据、OSM路网数据和不透水面数据;
对所述城市空间数据进行预处理,得到预处理数据;所述预处理数据包括:预处理后的多时相的哨兵二号遥感影像、预处理后的POI数据、预处理后的OSM路网数据和预处理后的不透水面数据;
提取所述预处理数据中的多时相高维特征,构成多时相高维特征图层;
基于所述预处理后的OSM路网数据对所述不透水面进行分割得到基本制图单元;
基于所述基本制图单元和所述多时相高维特征图层构建样本地块;
获取所述样本地块的类型标签,并结合所述样本地块与其对应的所述类型标签生成原始样本集;
基于所述原始样本集生成扩充样本集;
采用随机森林模型,以所述扩充样本集为输入得到扩充样本集的多样点分类结果;
对所述扩充样本集的多样点分类结果进行“投票”选择,获得改进后的城市土地利用初步分类结果;对所述改进后的城市土地利用初步分类结果映射处理后得到城市土地利用分类图。
2.根据权利要求1所述的基于多源高维特征的城市土地利用分类确定方法,其特征在于,所述对所述城市空间数据进行预处理,得到预处理数据,具体包括:
对所述多时相的哨兵二号遥感影像进行第一预处理得到预处理后的多时相的哨兵二号遥感影像;所述第一预处理包括:拼接、配准和裁剪;
对所述POI数据进行第二预处理得到预处理后的POI数据;所述第二预处理包括:清洗、去重和重分类;
对OSM路网数据进行第三预处理得到预处理后的OSM路网数据;所述第三预处理包括重分类、道路采样和建立道路缓冲区。
3.根据权利要求2所述的基于多源高维特征的城市土地利用分类确定方法,其特征在于,所述提取所述预处理数据中的多时相高维特征,构成多时相高维特征图层,具体包括:
对所述预处理后的多时相的哨兵二号遥感影像进行特征提取,得到多时相的纹理特征和遥感指数;
对所述预处理后的POI数据进行核密度分析和归一化处理得到核密度值;
对所述纹理特征、所述遥感指数和所述核密度值进行特征融合,得到所述多时相高维特征。
4.根据权利要求1所述的基于多源高维特征的城市土地利用分类确定方法,其特征在于,所述基于所述原始样本集生成扩充样本集,具体包括:
将所述原始样本集分隔为多个样本子集;
以在所述基本制图单元中布设多样点的方式对每一所述样本子集进行扩充;
基于扩充后的样本子集生成所述扩充样本集。
5.一种基于多源高维特征的城市土地利用分类确定系统,其特征在于,包括:
数据获取模块,用于获取城市空间数据;所述城市空间数据包括:多时相的哨兵二号遥感影像、POI数据、OSM路网数据和不透水面数据;
预处理模块,用于对所述城市空间数据进行预处理,得到预处理数据;所述预处理数据包括:预处理后的多时相的哨兵二号遥感影像、预处理后的POI数据、预处理后的OSM路网数据和预处理后的不透水面数据;
特征提取模块,用于提取所述预处理数据中的多时相高维特征,构成多时相高维特征图层;
单元分割模块,用于基于所述预处理后的OSM路网数据对所述不透水面进行分割得到基本制图单元;
单元构建模块,用于基于所述基本制图单元和所述多时相高维特征图层构建样本地块;
样本生成模块,用于获取所述样本地块的类型标签,并结合所述样本地块与其对应的所述类型标签生成原始样本集;
样本扩充模块,用于基于所述原始样本集生成扩充样本集;
分类结果确定模块,用于采用随机森林模型,以所述扩充样本集为输入得到扩充样本集的多样点分类结果;
选择-映射模块,用于对所述扩充样本集的多样点分类结果进行“投票”选择,获得改进后的城市土地利用初步分类结果,还用于对所述改进后的城市土地利用初步分类结果映射处理后得到城市土地利用分类图。
6.根据权利要求5所述的基于多源高维特征的城市土地利用分类确定系统,其特征在于,所述预处理模块具体包括:
第一预处理单元,用于对所述多时相的哨兵二号遥感影像进行第一预处理得到预处理后的多时相的哨兵二号遥感影像;所述第一预处理包括:拼接、配准和裁剪;
第二预处理单元,用于对所述POI数据进行第二预处理得到预处理后的POI数据;所述第二预处理包括:清洗、去重和重分类;
第三预处理单元,用于对OSM路网数据进行第三预处理得到预处理后的OSM路网数据;所述第三预处理包括重分类、道路采样和建立道路缓冲区。
7.根据权利要求6所述的基于多源高维特征的城市土地利用分类确定系统,其特征在于,所述特征提取模块具体包括:
特征提取单元,用于对所述预处理后的多时相的哨兵二号遥感影像进行特征提取,得到多时相的纹理特征和遥感指数;
POI处理单元,用于对所述预处理后的POI数据进行核密度分析和归一化处理得到核密度值;
融合单元,用于对所述纹理特征、所述遥感指数和所述核密度值进行特征融合,得到所述多时相高维特征。
8.根据权利要求5所述的基于多源高维特征的城市土地利用分类确定系统,其特征在于,所述样本扩充模块具体包括:
分割单元,用于将所述原始样本集分隔为多个样本子集;
扩充单元,用于以在所述基本制图单元中布设多样点的方式对每一所述样本子集进行扩充;
扩充样本生成单元,用于基于扩充后的样本子集生成所述扩充样本集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110914345.8A CN113610165B (zh) | 2021-08-10 | 2021-08-10 | 基于多源高维特征的城市土地利用分类确定方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110914345.8A CN113610165B (zh) | 2021-08-10 | 2021-08-10 | 基于多源高维特征的城市土地利用分类确定方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113610165A CN113610165A (zh) | 2021-11-05 |
CN113610165B true CN113610165B (zh) | 2024-02-13 |
Family
ID=78307991
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110914345.8A Active CN113610165B (zh) | 2021-08-10 | 2021-08-10 | 基于多源高维特征的城市土地利用分类确定方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113610165B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114898089B (zh) * | 2022-05-18 | 2022-10-25 | 中国矿业大学(北京) | 一种融合高分影像和poi数据的功能区提取与分类方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930772A (zh) * | 2016-04-13 | 2016-09-07 | 武汉大学 | 基于sar影像与光学遥感影像融合的城市不透水面提取方法 |
CN111401692A (zh) * | 2020-02-24 | 2020-07-10 | 中国科学院城市环境研究所 | 一种度量城市空间功能紧凑度的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109816581A (zh) * | 2019-01-25 | 2019-05-28 | 东南大学 | 一种综合业态大数据与建筑形态的城市用地自动识别系统 |
-
2021
- 2021-08-10 CN CN202110914345.8A patent/CN113610165B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105930772A (zh) * | 2016-04-13 | 2016-09-07 | 武汉大学 | 基于sar影像与光学遥感影像融合的城市不透水面提取方法 |
CN111401692A (zh) * | 2020-02-24 | 2020-07-10 | 中国科学院城市环境研究所 | 一种度量城市空间功能紧凑度的方法 |
Non-Patent Citations (1)
Title |
---|
基于局地气候分区的北京夜间热岛强度空间分异特征研究;刘敬;慎利;黄媛;邓旭;;地理与地理信息科学;20200915(第05期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113610165A (zh) | 2021-11-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106529410B (zh) | 一种基于监控视频的灰霾扩散路径绘制与来源确定方法 | |
CN110111345B (zh) | 一种基于注意力网络的3d点云分割方法 | |
CN107092020A (zh) | 融合无人机LiDAR和高分影像的路面平整度监测方法 | |
CN105893972A (zh) | 基于影像进行的违章建筑物自动监测方法及其实现系统 | |
CN109146204A (zh) | 一种多层次综合评估的风电场升压站自动选址方法 | |
CN111651545A (zh) | 一种基于多源数据融合的城市边缘区提取方法 | |
Wang et al. | Urban development analysis using built-up area maps based on multiple high-resolution satellite data | |
CN110110025B (zh) | 基于特征向量空间滤值的区域人口密度模拟方法 | |
CN113610165B (zh) | 基于多源高维特征的城市土地利用分类确定方法和系统 | |
CN113436153A (zh) | 一种基于高光谱成像和支持向量机技术的原状土壤剖面碳组分预测方法 | |
Sabr et al. | Assessment of land use and land cover change using spatiotemporal analysis of landscape: case study in south of Tehran | |
Wang et al. | Processing methods for digital image data based on the geographic information system | |
Danilina et al. | Smart city: automatic reconstruction of 3D building models to support urban development and planning | |
Busho et al. | Quantifying spatial patterns of urbanization: growth types, rates, and changes in Addis Ababa City from 1990 to 2020 | |
CN113077458B (zh) | 一种遥感影像中的云和阴影检测方法及系统 | |
Fusco et al. | An application of artificial intelligence to support the discovering of roman centuriation remains | |
CN115186074A (zh) | 基于Meta分析的模拟土壤pH值空间分布格局的方法 | |
Van Leusen | Unbiasing the archaeological record | |
Huang et al. | Simultaneous update of high-resolution land-cover mapping attempt: Wuhan and the surrounding satellite cities cartography using L2HNet | |
CN114578448A (zh) | 基于多地源地质参数的考察点定位方法 | |
Li et al. | Automatic extraction of urban built-up area based on object-oriented method and remote sensing data | |
Tapia-McClung et al. | Defining city boundaries through percolation theory: the case of the mexican urban system | |
Bipu | Geographic information system & spatial analysis | |
Lehner et al. | Sentinel-1 for object-based delineation of built-up land within urban areas | |
Huang et al. | Temporal analysis of urban forest in Beijing using Landsat imagery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |