CN113239112B - 基于gis系统的第三产业增长量可视化方法及装置 - Google Patents
基于gis系统的第三产业增长量可视化方法及装置 Download PDFInfo
- Publication number
- CN113239112B CN113239112B CN202110781662.7A CN202110781662A CN113239112B CN 113239112 B CN113239112 B CN 113239112B CN 202110781662 A CN202110781662 A CN 202110781662A CN 113239112 B CN113239112 B CN 113239112B
- Authority
- CN
- China
- Prior art keywords
- data
- industry
- night light
- district
- county
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007794 visualization technique Methods 0.000 title claims abstract description 22
- 238000004519 manufacturing process Methods 0.000 title claims description 36
- 230000007613 environmental effect Effects 0.000 claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000012800 visualization Methods 0.000 claims abstract description 13
- 238000012549 training Methods 0.000 claims description 32
- 238000000034 method Methods 0.000 claims description 27
- 230000035515 penetration Effects 0.000 claims description 17
- 238000009826 distribution Methods 0.000 claims description 16
- 230000002159 abnormal effect Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 9
- 230000005855 radiation Effects 0.000 claims description 9
- 238000005520 cutting process Methods 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 5
- 238000013075 data extraction Methods 0.000 claims description 3
- 239000002245 particle Substances 0.000 description 10
- 230000008569 process Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 238000005457 optimization Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000019637 foraging behavior Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003333 near-infrared imaging Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000000149 penetrating effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000012732 spatial analysis Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 239000002352 surface water Substances 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Computation (AREA)
- Educational Administration (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Algebra (AREA)
- Artificial Intelligence (AREA)
- Development Economics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Remote Sensing (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明涉及一种基于GIS系统的第三产业增长量可视化方法及装置,通过获取道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息等环境参数,通过获取与第三产业增长量显著相关的N个环境参数作为影响参数,基于AdaBoost算法构建和训练用于预测第三产业增长量的回归模型,利用目标年度的影响参数和回归模型获取目标年度的各区/县的第三产业增长量预测值,并在GIS系统中生成该区域的第三产业增长量GIS地图,实现区/县尺度第三产业增长量的可视化。
Description
技术领域
本发明涉及可视化领域,尤其是涉及一种基于GIS系统的第三产业增长量可视化方法及装置。
背景技术
产业发展水平是衡量经济社会发展程度的重要标识,通过统计产业发展数据可以为相关部门制定经济政策和调控地区经济发展计划提供重要的参考依据。
目前,往往是通过统计年鉴数据,再借助数据处理或数据分析工具对获取的产业数据进行处理,得到产业的分布情况,数据处理量大,处理难度高。并且,目前对于产业数据的统计仅停留在数据处理和汇总,处理和汇总后的数据对于非专业人员来说理解难度大,不够直观,且根据已发生的数据进行处理,时间上存在一定的滞后性。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提供一种自动生成区域内区/县尺度的第三产业增长量地图的基于GIS系统的第三产业增长量可视化方法及装置。
一种基于GIS系统的第三产业增长量可视化方法,包括以下步骤:
获取区域内第三产业的年度增长量数据、道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息;
从所述NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据;
基于扩展空间句法模型,根据所述道路交通网络数据和预设的搜索半径,获取道路交通网络的接近度和穿行度;
根据所述区/县的边界位置信息,获取区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据、不透水面数据和年度增长量数据;
将所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据作为环境参数,获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数;其中,N>0;
基于AdaBoost 算法,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型;
获取目标年度的影响参数;
将所述目标年度的影响参数输入所述回归模型,获取目标年度的各区/县的第三产业增长量预测值;
在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图。
在一个实施例中,在获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数的步骤之前,还包括:
基于正态分布方法,去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值。
在一个实施例中,去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值的步骤具体包括:
分别获取所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据的平均值和标准差;
在一个实施例中,在去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值的步骤之后,还包括:
将所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据归一化至[0,1]之间。
在一个实施例中,所述获取道路交通网络的接近度和穿行度的步骤包括:
将所述道路交通网络数据转换为包括多个路段的数据;
按照以下方式,获取道路交通网络的接近度:
按照以下方式,获取道路交通网络的穿行度:
其中,表示穿行度,表示搜索半径R内通过节点x的节点y与节点z之间的最短拓扑距离,N表示整个路网空间的路段集合,Rx表示节点x在路网中搜索半径范围内的路径集合, Ry表示节点y在路网中搜索半径范围内的路径集合,表示搜索半径R内节点z的权重;
在一个实施例中,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型的步骤包括:
将所述影响参数和所述第三产业的年度增长量数据分为M个训练样本;
初始化训练样本的权重分布集合:
按照以下方式,获取样本的平均绝对误差值:
按照以下方式,获取第n+1个弱学习器的权重:
根据每一个弱学习器的权重系数,对所述弱学习器进行加权求和,构建用于预测第三产业增长量的回归模型。
在一个实施例中,所述NPP/VIIRS夜间灯光遥感数据为月尺度的NPP/VIIRS夜间灯光遥感数据,从NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据的步骤包括:
对所述月尺度的NPP/VIIRS夜间灯光遥感数据进行辐射校正、几何校正和掩模裁剪的预处理并剔除异常值;
对剔除异常值后的月尺度的NPP/VIIRS夜间灯光遥感数据进行加权平均,提取年尺度的夜间灯光亮度数据。
第二方面,本申请实施例还提供了一种基于GIS系统的第三产业增长量可视化装置,包括:
数据获取模块,用于获取区域内第三产业的年度增长量数据、道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息;
数据提取模块,用于从所述NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据;
道路数据处理模块,用于基于扩展空间句法模型,根据所述道路交通网络数据和预设的搜索半径,获取道路交通网络的接近度和穿行度;
区县尺度数据获取模块,用于根据所述区/县的边界位置信息,获取区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据、不透水面数据和年度增长量数据;
影响参数获取模块,用于将所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据作为环境参数,获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数;其中,N>0;
回归模型构建模块,用于基于AdaBoost 算法,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型;
目标年度数据获取模块,用于获取目标年度的影响参数;
预测值获取模块,用于将所述目标年度的影响参数输入所述回归模型,获取目标年度的各区/县的第三产业增长量预测值;
可视化模块,用于在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图。
第三方面,本申请实施例还提供了一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述的基于GIS系统的第三产业增长量可视化方法的步骤。
第四方面,本申请实施例还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述的基于GIS系统的第三产业增长量可视化方法的步骤
在本申请实施例中,通过获取区域内的道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息等环境参数,从NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据,基于扩展空间句法模型和预设的搜索半径,获取道路交通网络的接近度和穿行度,通过与第三产业增长量显著相关的N个环境参数作为影响参数,基于AdaBoost 算法,构建和训练用于预测第三产业增长量的回归模型,利用目标年度的影响参数和回归模型,获取目标年度的各区/县的第三产业增长量预测值,并在GIS系统中进行标识,从而自动生成该区域的第三产业增长量GIS地图,实现区/县尺度第三产业增长量的可视化。
为了更好地理解和实施,下面结合附图详细说明本发明。
附图说明
图1为本发明一个实施例的一种基于GIS系统的第三产业增长量可视化方法的流程图;
图2为本发明一个实施例的一种基于GIS系统的第三产业增长量可视化装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例方式作进一步地详细描述。
应当明确,所描述的实施例仅仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本申请实施例保护的范围。
在本申请实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请实施例。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请的描述中,需要理解的是,术语“第一”、“第二”、“第三”等仅用于区别类似的对象,而不必用于描述特定的顺序或先后次序,也不能理解为指示或暗示相对重要性。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
此外,在本申请的描述中,除非另有说明,“若干个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A 和/或B,可以表示:单独存在A,同时存在A 和B,单独存在B 这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
请参阅图1,本发明提供了一种基于GIS系统的第三产业增长量可视化方法,包括以下步骤:
步骤S1:获取区域内第三产业的年度增长量数据、道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息;
所述区域为设定的一片地表区域,例如,可以为包括多个县/区/市的行政区域。
第三产业的年度增长量数据可以通过查询国家统计局的统计年鉴数据得到。
道路交通网络数据可以通过OpenStreetMap(OSM)网站获取,道路交通网络数据包括高速公路、国道、省道、县道、乡道等类型的矢量数据。
NPP/VIIRS夜间灯光遥感数据是指利用可见光近红外成像辐射仪(NPP/VIIRS)捕捉的夜间灯光影像数据,包括夜间灯光亮度数据和分布位置,可用于反应区域的经济活动水平。
兴趣点数据可以通过从高德地图、百度地图等地图软件的应用程序接口
(ApplicationProgramming Interface,API)上获取。在一个优选的实施例中,在获取兴趣点数据之后,还包括以下步骤:
对兴趣点数据进行数据清洗和投影变换;
数据清洗可用于洗去除兴趣点特征以外的数据,以消除其它数据的干扰,得到准确的兴趣点数据,投影变换是指将一种地图投影点的坐标变换为另一种地图投影点的坐标,通过投影变换,在本申请实施例中,可以通过将兴趣点数据进行投影变换,以消除不用市局之间的视角差异。
地表覆盖数据为对Sentinel-2卫星数据进行遥感解译得到的空间分辨率为10 m的全球地表覆盖数据。
区/县边界位置信息可以从中国国家测绘局提供的国家边界数据、省界数据和地区边界数据得到。
步骤S2:从所述NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据;
在一个实施例中,所述NPP/VIIRS夜间灯光遥感数据为月尺度的NPP/VIIRS夜间灯光遥感数据,从NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据的步骤包括:
对所述月尺度的NPP/VIIRS夜间灯光遥感数据进行辐射校正、几何校正和掩模裁剪的预处理并剔除异常值;
对剔除异常值后的月尺度的NPP/VIIRS夜间灯光遥感数据进行加权平均,提取年尺度的夜间灯光亮度数据。
辐射校正是指对由于外界因素,数据获取和传输系统产生的系统的、随机的辐射失真或畸变进行的校正,消除或改正因辐射误差而引起影像畸变的过程。具体地,先对接收到的原始数据进行数据分解,分别建立原始遥感图像数据文件和遥测辅助信息数据文件;然后根据从辐射传输方程推导出的遥感图像辐射误差校正模型,在图像处理系统软硬件的支持下,进行系统辐射校正。
几何校正是指通过一系列的数学模型来改正和消除遥感影像成像时因摄影材料变形、物镜畸变、大气折光、地球曲率、地球自转、地形起伏等因素导致的原始图像上各地物的几何位置、形状、尺寸、方位等特征与在参照系统中的表达要求不一致时产生的变形。具体地,可以通过利用畸变的遥感图像与标准地图之间的一些对应点(即控制点数据对)求得几何畸变模型,利用该几何畸变模型实现几何校正,提高获取数据的精度。
掩模裁剪是指通过创建表示感兴趣区域的掩模文件,通过运行该掩模文件在遥感影像上将该感兴趣区域进行裁剪,便于后续对该感兴趣区域进行操作和处理。
在一个实施例中,从所述地表覆盖数据中提取区域内的不透水面数据的步骤包括:
对所述地表覆盖数据进行投影转换和掩模裁剪,提取区域内的不透水面数据。
不透水面通常定义为阻止地表水渗入裸土的人造地表,包括建筑物、道路、停车场和人行道等。不透水面能够表征城市的繁荣和发展程度,是城市化程度的重要标志,也是城市环境的重要指标。在本申请实施例中,不透水面数据包括该区域的不透水面面积及其分布情况等数据。
步骤S3:基于扩展空间句法模型,根据所述道路交通网络数据和预设的搜索半径,获取道路交通网络的接近度和穿行度;
城市交通网络是城市经济活动的重要载体,基于拓扑学视角对城市交通网络进行抽象和分析,有助于挖掘路网组织的内在规律,空间句法是一种基于拓扑视角对城市建成空间进行建模分析的研究方法,从非欧式距离的建模角度对建成空间进行数量化统计分析,揭示空间形式和功能相互作用关系,扩展空间句法模型主要围绕接近度和穿行度对道路交通网络进行空间分析。
接近度表示某路网到搜索半径内其余路网的难易程度,接近度高的路网通常具有较高的拓扑整合能量和中心性,对区域出行的交通流具有更大的吸引力;穿行度用于衡量路网被搜索半径内交通流通过的概率,穿行度越高代表路网的通过性越强,承载的人/车流更多;搜索半径表示计算某路段路网形态变量考虑的空间范围,搜索半径越大,说明该路段路网形态变量是由较大范围的路网特征计算而来;搜索半径可以根据区域的面积大小进行设定,在本申请实施例中,为了覆盖整个区域,将搜索半径设置为796千米。
在一个实施例中,所述获取道路交通网络的接近度和穿行度的步骤包括:
将所述道路交通网络数据转换为包括多个路段的数据;
具体地,可以利用ArcGIS工具,根据所述道路交通网络数据中道路的类型和/或连通方式进行打断和合并,得到包括多个路段的数据。
按照以下方式,获取道路交通网络的接近度:
按照以下方式,获取道路交通网络的穿行度:
其中,表示穿行度,表示搜索半径R内通过节点x的节点y与节点z之间的最短拓扑距离,N表示整个路网空间的路段集合,Rx表示节点x在路网中搜索半径范围内的路径集合, Ry表示节点y在路网中搜索半径范围内的路径集合,表示搜索半径R内节点z的权重;
步骤S4:根据所述区/县的边界位置信息,获取区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据;
通过获取区/县尺度的道路交通网络的接近度和穿行度、兴趣点数据和夜间灯光亮度数据,利用区/县尺度的道路交通网络的接近度和穿行度、兴趣点数据和夜间灯光亮度数据构建作为区/县尺度的回归模型,提高预测的第三产业增长量的精度。
步骤S5:将所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据作为环境参数,获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数;其中,N>0;
具体地,分别计算所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据与第三产业增长量数据的相关性,从中选取与第三产业增长量数据具有显著相关性的N个数据作为与第三产业增长量相关的影响参数。其中,N可以根据相关性分析的结果进行确定,以保证选取的影响参数与第三产业增长量具有显著相关性,保证预测的准确性。
步骤S6:基于AdaBoost 算法,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型;
AdaBoost 算法是指先通过利用训练集和初始权重训练出一个弱学习器1,根据弱学习的学习误差率表现来更新训练样本的权重,使得之前弱学习器1学习误差率高的训练样本点的权重变高,使得这些误差率高的点在后面的弱学习器2中得到更多的重视,然后基于调整权重后的训练集来训练弱学习器2.,如此重复进行,直到弱学习器数达到事先指定的数目T,最终将这T个弱学习器通过加权表决的方式进行整合,得到最终的强学习器。
步骤S7:获取目标年度的影响参数,将所述目标年度的影响参数输入所述回归模型,获取目标年度的各区/县的第三产业增长量预测值;
影响参数包括步骤S5中经过相关性计算得到的与所述第三产业增长量数据相关性最高的前N个环境参数,区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据的获取方式可参照步骤S1-S3的说明,在此不再赘述。
通过获取对应年度的影响参数,利用回归模型即可实现该年度第三产业增加量的预测,对政府部门制定对应的经济政策和进行宏观调控提供重要的参量依据。
步骤S8:在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图。
GIS系统(Geographic Information System或Geo-Information system,地理信息系统)是一种空间信息系统,GIS系统在计算机硬、软件系统支持下,可以对整个或部分地球表层(包括大气层)空间中的有关地理分布数据进行采集、储存、管理、运算、分析、显示和描述。在本申请实施例中,通过在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图,从而实现区/县尺度第三产业增长量的可视化,便于政府部门制定对应的经济政策和进行宏观调控。
在本申请实施例中,通过获取区域内的道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息等环境参数,从NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据,基于扩展空间句法模型和预设的搜索半径,获取道路交通网络的接近度和穿行度,通过与第三产业增长量显著相关的N个环境参数作为影响参数,基于AdaBoost 算法,构建和训练用于预测第三产业增长量的回归模型,利用目标年度的影响参数和回归模型,获取目标年度的各区/县的第三产业增长量预测值,并在GIS系统中进行标识,从而自动生成该区域的第三产业增长量GIS地图,实现区/县尺度第三产业增长量的可视化。
在一个实施例中,在获取兴趣点数据的步骤之后,还包括:
按照预设的分类方式,获取所述区域内的兴趣点分类数据;
分类方式可以根据区域的实际兴趣点分布情况及数量进行设置。在本申请实施例中,将所述区域内的兴趣点分为餐饮(Restaurant)、公共设施(Public facility)、金融服务(Finance)、生活服务(Life services)、科教文化(Scientific culture education)、公司企业(Enterprise)、体育休闲服务(Sports Leisure)、医疗保健(Health care)、交通服务(Transport services),通过统计各个类别的兴趣点数量,得到区域内的兴趣点分类数据。
在一个实施例中,在获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数的步骤之前,还包括:
基于正态分布方法,去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值。
在一个实施例中,去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值的步骤具体包括:
分别获取所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据的平均值和标准差;
在一个优选的实施例中,所述基于GIS系统的第三产业增长量可视化方法还包括以下步骤:
将所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据归一化至[0,1]之间。
具体地,可以通过利用最小值-最大值线性归一化方法对所述区/县尺度的兴趣点分类数据、所述夜间灯光亮度数据、所述接近度和穿行度进行归一化,使其数值保持在[0,1]之间,以便于后续过程第三产业增长量的预测,提高第三产业增长量预测的计算效率。其中,所述最小值-最大值线性归一化方法的计算公式如下:
在一个实施例中,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型的步骤包括:
将所述影响参数和所述第三产业的年度增长量数据分为M个训练样本;
初始化训练样本的权重分布集合:
按照以下方式,获取样本的平均绝对误差值:
按照以下方式,获取第n+1个弱学习器的权重:
根据每一个弱学习器的权重系数,对所述弱学习器进行加权求和,构建用于预测第三产业增长量的回归模型。
具体地,所述回归模型如下所示:
其中,表示第三产业预测值,mpervious表示不透水面,NQPDA表示接近度,TPB表示穿行度,Nightlight表示夜间灯光亮度,Restaurant、Public facility、Finance、 Life services、Scientific culture education、Enterprise、Sports Leisure、Health care、Transport services
分别表示餐饮、公共设施、金融服务、生活服务、科教文化、公司企业、体育休闲服务、医疗保健、交通服务等兴趣点分类数据。
优选地,在弱学习器的迭代计算过程中加入正则化项,这个正则化项称之为步长也就是学习率,定义为rate,以防止回归模型过拟合。具体地,在构建用于预测第三产业增长量的回归模型的步骤之前,还包括:
利用粒子群算法,对学习率进行参数优化;
按照以下方式,获取第k个弱学习器:
粒子群优化算法(Particle Swarm optimization,PSO)又翻译为粒子群算法、微粒群算法、或微粒群优化算法。是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法,通过将每个粒子视为N维搜索空间中的一个搜索个体,粒子的当前位置即为对应优化问题的一个候选解,粒子的飞行过程即为该个体的搜索过程.粒子的飞行速度可根据粒子历史最优位置和种群历史最优位置进行动态调整.粒子仅具有两个属性:速度和位置,速度代表移动的快慢,位置代表移动的方向。每个粒子单独搜寻的最优解叫做个体极值,粒子群中最优的个体极值作为当前全局最优解。不断迭代,更新速度和位置。最终得到满足终止条件的最优解。在本申请实施例中,通过利用粒子群算法对学习率进行参数优化,提高回归模型的训练精度。
请参阅图2,本发明还提供了一种基于GIS系统的第三产业增长量可视化装置,包括:
数据获取模块1,用于获取区域内第三产业的年度增长量数据、道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息;
数据提取模块2,用于从所述NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据;
道路数据处理模块3,用于基于扩展空间句法模型,根据所述道路交通网络数据和预设的搜索半径,获取道路交通网络的接近度和穿行度;
区县尺度数据获取模块4,用于根据所述区/县的边界位置信息,获取区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据、不透水面数据和年度增长量数据;
影响参数获取模块5,用于将所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据作为环境参数,获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数;其中,N>0;
回归模型构建模块6,用于基于AdaBoost 算法,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型;
预测值获取模块7,用于获取目标年度的影响参数,将所述目标年度的影响参数输入所述回归模型,获取目标年度的各区/县的第三产业增长量预测值;
可视化模块8,用于在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图。
需要说明的是,上述实施例提供的基于GIS系统的第三产业增长量可视化装置在执行基于GIS系统的第三产业增长量可视化方法时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分为不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的基于GIS系统的第三产业增长量可视化装置与基于GIS系统的第三产业增长量可视化方法属于同一构思,其体现实现过程详见方法实施例,这里不再赘述。
本申请实施例还提供了一种计算机可读存储介质,其上储存有计算机程序,该计算机程序被处理器执行时实现如上述任意一项所述基于GIS系统的第三产业增长量可视化方法的步骤。
本申请实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可读储存介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
本申请实施例还提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述任意一项所述基于GIS系统的第三产业增长量可视化方法的步骤。
本发明提供了一种基于GIS系统的第三产业增长量可视化方法及装置,综合考虑了道路交通网络的接近度和穿行度特征,不同类型POI大数据、夜光遥感数据、土地利用类型等多源大数据。此外,基于AdaBoost算法建立第三产业增加值与相关影响因子间的回归模型,充分考虑了第三产业增加值与相关影响因子的非线性关系,相关部门可以利用该回归模型快速准确预测区/县第三产业增长量,并自动生成第三产业增长量GIS地图,从而有助于快速预测研究区区/县GDP,对政府进行有效宏观调控有着巨大的指导意义。
本发明并不局限于上述实施方式,如果对本发明的各种改动或变形不脱离本发明的精神和范围,倘若这些改动和变形属于本发明的权利要求和等同技术范围之内,则本发明也意图包含这些改动和变形。
Claims (10)
1.一种基于GIS系统的第三产业增长量可视化方法,其特征在于,包括以下步骤:
获取区域内第三产业的年度增长量数据、道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息;
从所述NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据;
基于扩展空间句法模型,根据所述道路交通网络数据和预设的搜索半径,获取道路交通网络的接近度和穿行度;
根据所述区/县的边界位置信息,获取区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据、不透水面数据和年度增长量数据;
将所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据作为环境参数,获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数;其中,N>0;
基于AdaBoost算法,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型;
获取目标年度的影响参数,将所述目标年度的影响参数输入所述回归模型,获取目标年度的各区/县的第三产业增长量预测值;
在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图。
2.根据权利要求1所述的基于GIS系统的第三产业增长量可视化方法,其特征在于,在获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数的步骤之前,还包括:
基于正态分布方法,去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值。
4.根据权利要求2所述的基于GIS系统的第三产业增长量可视化方法,其特征在于,在去除所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据中的异常值的步骤之后,还包括:
将所述区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据和不透水面数据归一化至[0,1]之间。
5.根据权利要求1所述的基于GIS系统的第三产业增长量可视化方法,其特征在于,所述获取道路交通网络的接近度和穿行度的步骤包括:
将所述道路交通网络数据转换为包括多个路段的数据;
按照以下方式,获取道路交通网络的接近度:
按照以下方式,获取道路交通网络的穿行度:
其中,表示穿行度,表示搜索半径R内通过节点x的节点y与节点z之间的最短拓扑距离,N表示整个路网空间的路段集合,Rx表示节点x在路网中搜索半径范围内的路径集合, Ry表示节点y在路网中搜索半径范围内的路径集合,表示搜索半径R内节点z的权重;
6.根据权利要求2所述的基于GIS系统的第三产业增长量可视化方法,其特征在于,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型的步骤包括:
将所述影响参数和所述第三产业的年度增长量数据分为M个训练样本;
初始化训练样本的权重分布集合:
按照以下方式,获取样本的平均绝对误差值:
按照以下方式,获取第n+1个弱学习器的权重:
根据每一个弱学习器的权重系数,对所述弱学习器进行加权求和,构建用于预测第三产业增长量的回归模型。
7.根据权利要求1所述的基于GIS系统的第三产业增长量可视化方法,其特征在于,所述NPP/VIIRS夜间灯光遥感数据为月尺度的NPP/VIIRS夜间灯光遥感数据,从NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据的步骤包括:
对所述月尺度的NPP/VIIRS夜间灯光遥感数据进行辐射校正、几何校正和掩模裁剪的预处理并剔除异常值;
对剔除异常值后的月尺度的NPP/VIIRS夜间灯光遥感数据进行加权平均,提取年尺度的夜间灯光亮度数据。
8.一种基于GIS系统的第三产业增长量可视化装置,其特征在于,包括:
数据获取模块,用于获取区域内第三产业的年度增长量数据、道路交通网络数据、NPP/VIIRS夜间灯光遥感数据、兴趣点数据、地表覆盖数据和区/县边界位置信息;
数据提取模块,用于从所述NPP/VIIRS夜间灯光遥感数据中提取夜间灯光亮度数据,从所述地表覆盖数据中提取区域内的不透水面数据;
道路数据处理模块,用于基于扩展空间句法模型,根据所述道路交通网络数据和预设的搜索半径,获取道路交通网络的接近度和穿行度;
区县尺度数据获取模块,用于根据所述区/县的边界位置信息,获取区/县尺度的接近度、穿行度、夜间灯光亮度数据、兴趣点数据、不透水面数据和年度增长量数据;
影响参数获取模块,用于将所述区/县尺度的接近度、穿行度、兴趣点数据、夜间灯光亮度数据和不透水面数据作为环境参数,获取与第三产业增长量数据相关性最高的前N个环境参数作为影响参数;其中,N>0;
回归模型构建模块,用于基于AdaBoost 算法,利用所述影响参数和所述第三产业的年度增长量数据构建和训练用于预测第三产业增长量的回归模型;
预测值获取模块,用于获取目标年度的影响参数,将所述目标年度的影响参数输入所述回归模型,获取目标年度的各区/县的第三产业增长量预测值;
可视化模块,用于在GIS系统中获取区域的GIS地图数据,对所述区域内各区/县的第三产业增长量预测值进行标识,生成该区域的第三产业增长量GIS地图。
9.一种计算机可读存储介质,其上储存有计算机程序,其特征在于:该计算机程序被处理器执行时实现如权利要求1-7任意一项所述的基于GIS系统的第三产业增长量可视化方法的步骤。
10.一种计算机设备,其特征在于:包括存储器、处理器以及存储在所述存储器中并可被所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7中任意一项所述的基于GIS系统的第三产业增长量可视化方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110781662.7A CN113239112B (zh) | 2021-07-12 | 2021-07-12 | 基于gis系统的第三产业增长量可视化方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110781662.7A CN113239112B (zh) | 2021-07-12 | 2021-07-12 | 基于gis系统的第三产业增长量可视化方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113239112A CN113239112A (zh) | 2021-08-10 |
CN113239112B true CN113239112B (zh) | 2021-09-07 |
Family
ID=77135336
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110781662.7A Active CN113239112B (zh) | 2021-07-12 | 2021-07-12 | 基于gis系统的第三产业增长量可视化方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113239112B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118690919A (zh) * | 2024-08-22 | 2024-09-24 | 农业农村部规划设计研究院 | 基于大数据和机器学习的乡村产业发展方向预测方法和系统 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9734161B2 (en) * | 2013-03-15 | 2017-08-15 | The Florida International University Board Of Trustees | Streaming representation of moving objects and shapes in a geographic information service |
US11373105B2 (en) * | 2017-04-13 | 2022-06-28 | Oracle International Corporation | Autonomous artificially intelligent system to predict pipe leaks |
CN109508328A (zh) * | 2018-09-26 | 2019-03-22 | 全球能源互联网研究院有限公司 | 一种电力突发事件大数据可视化方法、装置及系统 |
CN111581927A (zh) * | 2020-04-03 | 2020-08-25 | 深圳市维度统计咨询股份有限公司 | 海洋经济运行监测与预警系统及计算机设备 |
CN111639833A (zh) * | 2020-04-23 | 2020-09-08 | 中国科学院空天信息创新研究院 | 一种基于自然和人文多要素的城市人居环境适宜性综合评价方法 |
-
2021
- 2021-07-12 CN CN202110781662.7A patent/CN113239112B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN113239112A (zh) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Falah et al. | Urban growth modeling using cellular automata model and AHP (case study: Qazvin city) | |
Feng et al. | Modeling urban growth with GIS based cellular automata and least squares SVM rules: a case study in Qingpu–Songjiang area of Shanghai, China | |
Murayama | Progress in geospatial analysis | |
De Smith et al. | Geospatial analysis: a comprehensive guide to principles, techniques and software tools | |
Surabuddin Mondal et al. | Modeling of spatio-temporal dynamics of land use and land cover in a part of Brahmaputra River basin using Geoinformatic techniques | |
Omar et al. | Markov-CA model using analytical hierarchy process and multiregression technique | |
Feng et al. | Incorporation of spatial heterogeneity-weighted neighborhood into cellular automata for dynamic urban growth simulation | |
CN112163367B (zh) | 融合萤火虫算法和元胞自动机的城市扩张模拟预测方法 | |
Zhang et al. | A new type of dual-scale neighborhood based on vectorization for cellular automata models | |
CN102646164A (zh) | 一种结合空间滤波的土地利用变化建模方法及其系统 | |
Li et al. | Firefly algorithm-based cellular automata for reproducing urban growth and predicting future scenarios | |
Xia et al. | Exploring the effects of partitioned transition rules upon urban growth simulation in a megacity region: A comparative study of cellular automata-based models in the Greater Wuhan Area | |
CN114861277B (zh) | 一种长时序国土空间功能与结构模拟方法 | |
Guru et al. | Comparison of probabilistic and expert-based models in landslide susceptibility zonation mapping in part of Nilgiri District, Tamil Nadu, India | |
Dolui et al. | Modelling landuse dynamics of ecologically sensitive peri-urban space by incorporating an ANN cellular automata-Markov model for Siliguri urban agglomeration, India | |
Salman Aal-shamkhi et al. | Extraction and modeling of urban sprawl development in Karbala City using VHR satellite imagery | |
Triantakonstantis et al. | A spatially heterogeneous expert based (SHEB) urban growth model using model regionalization | |
CN113239112B (zh) | 基于gis系统的第三产业增长量可视化方法及装置 | |
Shi et al. | An improved framework for assessing the impact of different urban development strategies on land cover and ecological quality changes-A case study from Nanjing Jiangbei New Area, China | |
Mustak et al. | Multi-scenario based urban growth modeling and prediction using earth observation datasets towards urban policy improvement | |
Yadav et al. | Computational model for urban growth using socioeconomic latent parameters | |
Abbas et al. | Multilayer perceptron and Markov Chain analysis based hybrid-approach for predicting land use land cover change dynamics with Sentinel-2 imagery | |
Stanislawski et al. | A rapid approach for automated comparison of independently derived stream networks | |
Zhou et al. | UGRoadUpd: An Unchanged-Guided Historical Road Database Updating Framework Based on Bi-Temporal Remote Sensing Images | |
Mohammadzadeh et al. | Spatiotemporal integration of GCN and E-LSTM networks for PM2. 5 forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |