CN113297174A - 基于深度学习的土地利用变化模拟方法 - Google Patents
基于深度学习的土地利用变化模拟方法 Download PDFInfo
- Publication number
- CN113297174A CN113297174A CN202110565706.2A CN202110565706A CN113297174A CN 113297174 A CN113297174 A CN 113297174A CN 202110565706 A CN202110565706 A CN 202110565706A CN 113297174 A CN113297174 A CN 113297174A
- Authority
- CN
- China
- Prior art keywords
- land use
- data
- cells
- land
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004088 simulation Methods 0.000 title claims abstract description 36
- 238000013135 deep learning Methods 0.000 title claims abstract description 22
- 230000008859 change Effects 0.000 title claims abstract description 19
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 53
- 230000001413 cellular effect Effects 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000013528 artificial neural network Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000010276 construction Methods 0.000 claims abstract description 7
- 238000007781 pre-processing Methods 0.000 claims abstract description 5
- 239000011159 matrix material Substances 0.000 claims description 35
- 239000013598 vector Substances 0.000 claims description 26
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 238000012795 verification Methods 0.000 claims description 15
- 238000012952 Resampling Methods 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000002474 experimental method Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 8
- 230000017105 transposition Effects 0.000 claims description 8
- 238000011161 development Methods 0.000 claims description 5
- 238000011176 pooling Methods 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 abstract description 2
- 238000009412 basement excavation Methods 0.000 abstract 1
- 210000004027 cell Anatomy 0.000 description 66
- 238000010586 diagram Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- WURBVZBTWMNKQT-UHFFFAOYSA-N 1-(4-chlorophenoxy)-3,3-dimethyl-1-(1,2,4-triazol-1-yl)butan-2-one Chemical compound C1=NC=NN1C(C(=O)C(C)(C)C)OC1=CC=C(Cl)C=C1 WURBVZBTWMNKQT-UHFFFAOYSA-N 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 241001075721 Hibiscus trionum Species 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/211—Schema design and management
- G06F16/212—Schema design and management with details for data modelling support
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Remote Sensing (AREA)
- Biophysics (AREA)
- Fuzzy Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于深度学习的土地利用变化模拟方法,包括获取历史土地利用数据,并进行预处理;将历史土地利用数据输入卷积神经网络,获取空间邻域特征;进行区位遥相关特征构建;融合空间邻域特征和区位遥相关特征,对样本特征进行欠采样处理;进行模型构建,对城市土地利用进行模拟演化,并对模型进行训练;将训练生成的土地利用模拟演化模型对土地利用变化进行预测。本发明在卷积神经网络中引入空洞卷积层,在扩大元胞感受野的同时兼顾局部特征,减少冗余特征的累积,进而实现对元胞空间邻域特征的构建;本发明基于图卷积神经网络感知地理场景遥相关,实现对地理区位条件相似的元胞关系的挖掘,处理精度更高。
Description
技术领域
本发明属于地理信息科学领域,具体涉及一种基于深度学习的土地利用变化模拟方法。
背景技术
如今随着经济社会的高速发展,水土流失、耕地占用等一系列问题应运而生。深入挖掘土地利用演化的机制,精准模拟土地利用演化有重大意义。因此许多学者针对土地利用演化模拟展开了一系列的研究,其中元胞自动机(Cellular Automata,CA)由于能够捕捉非线性规律和容易扩展而被广泛应用。CA模型主要由元胞、元胞空间、元胞状态、邻域、转换规则和元胞时间这六部分组成,其中,转换规则是CA模型的核心部分,现有学者对于元胞自动机的改进也多基于转换规则进行建模。
根据研究学者对转换规则的建模视角可以分为:线性规则建模和非线性规则提取。其中线性转换规则是指基于权重参数构造驱动因子之间的相互作用,具有计算简单、收敛较快的特点。而实际上各驱动因子间的相互作用更多服从非线性规律,线性转换规则难以进行精确模拟。遗传算法、粒子群优化算法等常用来被建模非线性规则,但该类方法存在算法复杂度高,收敛慢,容易陷入局部最优解等问题。随着这些年计算机技术发飞速发展,机器学习技术在捕获非线性规则上表现出了突出的优势,因此也被广泛应用于土地利用转换非线性规则的建模。例如,将卷积神经网络用于元胞空间邻域特征的构建表达,然后通过支持向量机、随机森林、神经网络等方法对转换规则进行建模,然而这类方法严重依赖于研究者对于相关特征的构建与模型本身的适用性,模拟过程不够精确,可信度不高。
发明内容
本发明的目的在于提供一种基于深度学习的土地利用变化模拟方法,该方法预测效果具有较高的可信度。
本发明提供的这种基于深度学习的土地利用变化模拟方法,包括如下步骤
S1.获取历史土地利用数据,并进行预处理;
S2.将历史土地利用数据输入卷积神经网络,获取空间邻域特征;
S3.利用图卷积神经网络进行区位遥相关特征构建;
S4.融合空间邻域特征和区位遥相关特征,对样本特征进行欠采样处理;
S5.进行模型构建,对城市土地利用进行模拟演化,训练土地利用模拟演化模型;
S6.利用训练生成的土地利用模拟演化模型对土地利用变化进行预测。
所述的步骤S1具体为,获取等间隔年份的历史土地利用数据,并对历史土地利用数据进行投影校正统一、矢量裁剪和重采样栅格对齐校正;基于历史土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,重编码用于特征提取,同时保存解码规则。
所述的步骤S2具体为,构建CNN卷积神经网络,将历史土地利用数据输入CNN卷积神经网络,获取元胞的空间邻域特征;CNN卷积神经网络包括一个普通卷积层、一个空洞卷积层、两个最大池化层、一个全连接层和一个softmax层,其中卷积层某一单元接收信号后输出值的表达为:
其中,为第k层第i个卷积核对应的输出变量值;为第k层第j维输入变量值;为第k层第i个卷积核的权重向量;为第k层第i个卷积核的偏置项;n为第k层第i个卷积核的维数;函数f(·)为激活函数;以编码后的土地利用数据作为输入,进而基于CNN卷积神经网络获取空间邻域特征。
所述的步骤S3具体为,对预设特征数据进行预处理构造区位条件特征,进而构造相似图,通过GCN卷积神经网络获取区位遥相关特征,具体包括如下步骤:
A1.选取预设特征数据;具体为选取高程和坡度为自然环境特征,表示区域地形;选取人口密度、到主干道距离、到次干道距离和到居民道路距离为社会经济特征,表示区域的经济发展水平;
A2.将预设特征融合为区位条件特征;
A3.以每一个元胞为单位,计算每个元胞的区位条件特征的余弦相似度;
A4.基于元胞间的相似度构建相似矩阵,通过假设和若干次调参设置相似度阈值和距离阈值,对于达到双重阈值约束的元胞建立联系,建立关联权重矩阵,进而构造区位条件相似图;
A5.提取区位条件相似结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个卷积层,通过反向传播求梯度更新参数,进而通过样本的训练集、测试集和验证集进行训练,获得区位遥相关特征。
所述的步骤A1,具体为从路网和DEM(Digital Elevation Model,数字高程模型)中提取预设特征数据;对预设特征数据通过Arcgis和Python进行投影转换,粗重采样,矢量裁剪,精重采样,并构造为高程特征、坡度特征、人口密度特征、到主干道距离特征、到次干道距离特征和到居民道路距离特征;对预设特征进行标准化处理,采用如下公式:
其中,x(l)为预设特征;max(x)为预设特征的最大值;min(x)为预设特征的最小值。
所述的步骤A2,融合区位条件特征具体为计算特征向量:
xenv(ind,t)=[xnat(ind,t),xeco(ind,t)]T
其中,xenv(ind,t)为第ind个元胞在时间t下区位条件特征向量;xnat(ind,t)为第ind个元胞在时间t下自然环境特征向量;xeco(ind,t)为第ind个元胞在时间t下社会经济特征向量;T表示转置;
所述的步骤A3,每个元胞的区位条件特征的余弦相似度的计算方式具体为:
其中,simij(t)为在时间t下第i个元胞和第j个元胞的余弦相似度;xenv(i,t)为第i个元胞在时间t下第k维区位特征;xenv(j,t)k为第j个元胞在时间t下第k维区位特征;n为区位条件特征的总维数。
步骤A4,关联权重矩阵表达为:
其中,Wij为关联权重矩阵W在元胞集合(i,j)的值;Tsim为相似度阈值;Tdis为距离阈值;disij为第i个元胞和第j个元胞之间的距离;
步骤A5,图卷积层的更新参数过程具体表达为信号x’与滤波器gθ的卷积表达:
gθ*x'=UgθUTx'
所述的步骤S4具体为,对特征进行TomeLinks欠采样处理;TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)<d(a,b)或d(b,c)<d(a,b)成立,其中d(·)表示两个样本之间的距离。
所述的步骤S5具体为,基于LightGBM算法对有效样本特征进行训练获取元胞自动机的转换规则,构建LightGBM_CA模型,并利用LightGBM_CA模型对城市土地利用进行模拟演化,具体步骤如下:随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行若干次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,得到土地利用模拟演化结果。
所述的步骤S6还包括验证模型,对评价指标进行分析;具体为对LightGBM_CA模型演化结果进行验证分析,基于OA系数、kappa系数和FoM系数实现评估;
OA系数表示预测正确的元胞数量占元胞总数的比例,Kappa系数为衡量模型预测结果与实际土地利用的一致性检验指标,FOM系数为比较整体模拟结果的空间格局与实际的空间格局的符合程度的指标;其中OA系数、Kappa系数和FoM系数的计算公式如下所示:
其中,sum为元胞总数;NAMQ为中间系数,Nij表示将实际为第i类的元胞预测为第j类元胞的元胞数量,Si表示第i类元胞的样本数,A为实际土地利用类型发生变化但模拟结果中土地利用类型不变的预测错误的元胞数;B为实际和模拟结果中土地利用类型都发生变化的预测正确的元胞数;C为实际土地利用类型发生变化但模拟结果中土地利用类型预测错误的元胞数;D为实际土地利用类型不变但模拟结果中土地利用类型发生变化的预测错误的元胞数。
本发明提供的这种基于深度学习的土地利用变化模拟方法,在卷积神经网络中引入空洞卷积层,在扩大元胞感受野的同时兼顾局部特征,减少冗余特征的累积,进而实现对元胞空间邻域特征的构建;以地理学第三定律为依据,基于图卷积神经网络感知地理场景遥相关,实现对地理区位条件相似的元胞关系的挖掘,处理精度更高。
附图说明
图1为本发明方法的流程示意图。
图2为本发明实施例的流程示意图。
图3为本发明实施例的研究区域土地利用示意图。
图4为本发明实施例的区位特征示意图。
图5为本发明实施例的土地利用模拟演化结果对比示意图。
具体实施方式
如图1为本发明方法的流程示意图:本发明提供的这种基于深度学习的土地利用变化模拟方法,包括如下步骤
S1.获取历史土地利用数据,并进行预处理;
S2.将历史土地利用数据输入卷积神经网络,获取空间邻域特征;
S3.利用图卷积神经网络进行区位遥相关特征构建;
S4.融合空间邻域特征和区位遥相关特征,对样本特征进行欠采样处理;
S5.进行模型构建,对城市土地利用进行模拟演化,训练土地利用模拟演化模型;
S6.利用训练生成的土地利用模拟演化模型对土地利用变化进行预测。
步骤S1具体为,获取等间隔年份的历史土地利用数据,并对历史土地利用数据进行投影校正统一、矢量裁剪和重采样栅格对齐校正;基于历史土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,用于特征提取,同时保存解码规则。
步骤S2具体为,构建CNN卷积神经网络,将历史土地利用数据输入CNN卷积神经网络,获取元胞的空间邻域特征:构建CNN卷积神经网络,CNN卷积神经网络一共包括六层,其中包括一个普通卷积层、一个空洞卷积层、两个最大池化(maxpooling)层、一个全连接层和一个softmax层,其中卷积层某一单元接收信号后输出值的表达为:
其中,为第k层第i个卷积核对应的输出变量值;为第k层第j维输入变量值;为第k层第i个卷积核的权重向量;为第k层第i个卷积核的偏置项;n为第k层第i个卷积核的维数;函数f(·)为激活函数,本实施例中选取sigmod函数。以编码后的土地利用数据作为输入,进而基于CNN卷积神经网络获取空间邻域特征。
步骤S3具体为,对预设特征数据进行预处理构造区位条件特征,进而构造相似图,通过GCN卷积神经网络获取区位遥相关特征,具体包括如下步骤:
A1.选取预设特征数据,具体为选取高程和坡度为自然环境特征,表示区域地形;选取人口密度、到主干道距离、到次干道距离和到居民道路距离为社会经济特征,表示区域的经济发展水平。从路网和DEM等数据中提取预设特征数据;对预设特征数据通过Arcgis和Python进行投影转换,粗重采样,矢量裁剪,精重采样,并构造为高程特征、坡度特征、人口密度特征、到主干道距离特征、到次干道距离特征和到居民道路距离特征;对预设特征进行标准化处理,采用如下公式:
其中,x(l)为预设特征;max(x)为预设特征的最大值;min(x)为预设特征的最小值。
A2.将预设特征融合为区位条件特征,具体为:
xenv(ind,t)=[xnat(ind,t),xeco(ind,t)]T
其中,xenv(ind,t)为第ind个元胞在时间t下区位条件特征向量;xnat(ind,t)为第ind个元胞在时间t下自然环境特征向量;xeco(ind,t)为第ind个元胞在时间t下社会经济特征向量;T表示转置。
A3.以每一个元胞为单位,计算每个元胞的区位条件特征的余弦相似度,具体为:
其中,simij(t)为在时间t下第i个元胞和第j个元胞的余弦相似度;xenv(i,t)为第i个元胞在时间t下第k维区位特征;xenv(j,t)k为第j个元胞在时间t下第k维区位特征;n为区位条件特征的总维数。
A4.基于元胞间的相似度构建相似矩阵,通过假设和若干次调参设置相似度阈值和距离阈值,对于达到双重阈值约束的元胞建立联系,建立关联权重矩阵,进而构造区位条件相似图,其中关联权重矩阵表达为:
其中,Wij为关联权重矩阵W在元胞集合(i,j)的值;Tsim为相似度阈值;Tdis为距离阈值;disij为第i个元胞和第j个元胞之间的距离。
A5.提取区位条件相似结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个卷积层,通过反向传播求梯度更新参数,进而通过样本的训练集、测试集和验证集进行训练,获得区位遥相关特征,其中信号x与滤波器gθ的卷积表达为:
gθ*x=UgθUTx
步骤S4具体为,对特征进行TomeLinks欠采样处理;对样本数据进行分析,了解数据不平衡的程度;基于主流解决数据不平衡的问题的方法(如过采样、欠采样以及二者融合的方法)进行多组对比实验,最终确定TomeLinks欠采样为解决当前数据不平衡的最佳方法,进而得到用于训练模型的样本数据集;TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)<d(a,b)或d(b,c)<d(a,b)成立,其中d(·)表示两个样本之间的距离。
步骤S5具体为,基于LightGBM算法对有效样本特征进行训练获取元胞自动机的转换规则,构建LightGBM_CA模型,并利用LightGBM_CA模型对城市土地利用进行模拟演化,具体步骤如下:随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行十次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,即得到土地利用模拟演化模型。
步骤S6还包括验证模型,对评价指标进行分析,输出并保存土地利用模拟演化结果;具体为对LightGBM_CA模型演化结果进行验证分析,基于OA系数(总体精度Overallaccurancy)、kappa系数和FoM(Figure of Merit)系数实现评估,输出并保存演化结果,具体步骤如下:
基于土地利用标准数据,对模型模拟演化结果进行分析评价,采用OA系数、Kappa系数、FOM系数作为评价指标。OA系数表示预测正确的元胞数量占元胞总数的比例,Kappa系数为衡量模型预测结果与实际土地利用的一致性检验指标,FOM系数为比较整体模拟结果的空间格局与实际的空间格局的符合程度的指标。其中OA系数、Kappa系数和FoM系数的计算公式如下所示:
其中,sum为元胞总数;NAMQ为中间系数,Nij表示将实际为第i类的元胞预测为第j类元胞的元胞数量,Si表示第i类元胞的样本数,A为实际土地利用类型发生变化但模拟结果中土地利用类型不变的预测错误的元胞数;B为实际和模拟结果中土地利用类型都发生变化的预测正确的元胞数;C为实际土地利用类型发生变化但模拟结果中土地利用类型预测错误的元胞数;D为实际土地利用类型不变但模拟结果中土地利用类型发生变化的预测错误的元胞数。
结合区域标准土地利用图,对评价指标进行分析,输出并保存土地利用模拟演化模型。
在具体实施方式中:
如图2为本发明实施例的流程示意图。以2000、2010、2020年长沙市芙蓉区土地利用为案例,如图3为本发明实施例的研究区域土地利用示意图。为验证本发明提出的方法在土地利用模拟这的有效性,案例将以本发明提出的方法为基础进行土地利用模拟演化,对本发明的模拟演化结果与其他主流模型(包括人工神经网络ANN_CA,逻辑回归LR_CA,随机森林RF_CA,梯度提升树GBT_CA)进行对比实验。下面对本发明的具体实施过程进行说明:
步骤一、获取湖南省长沙市2000、2010、2020年土地利用分布图和人口密度数据,以及路网数据、DEM数据,作为本案例特征集的基础数据来源。
步骤二、对土地利用数据进行投影校正统一、矢量裁剪、重采样栅格对齐校正,并基于土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,同时保存解码规则。
步骤三、构建CNN卷积神经网络,CNN卷积神经网络一共有六层,其中包括一个普通卷积层,一个空洞卷积层,两个最大池化(maxpooling)层,一个全连接层和一个softmax层,其中卷积层某一单元接收信号后输出值的表达为:
式中:为第k层第i个卷积核对应的输出变量值;为第k层第i个卷积核的权重向量;为第k层第j维输入变量值;为第k层第i个卷积核的偏置项;n为第k层第i个卷积核的维数;函数f(·)为激活函数(本实施例中选取sigmod函数)。
随机选取初始数据的30%样本量作为CNN卷积神经网络提取邻域空间特征的基础,其次再将选取样本中的70%作为训练集,30%作为测试集。选取土地利用类型地图的每个像素作为中心像素,将中心像素与其相邻像素进行裁剪,形成一个25×25网格。CNN卷积神经网络采用的是5×5卷积核,膨胀率为2的空洞卷积层,2×2池化层,最后通过softmax回归的4个神经元的全连接层生成输出邻域空间特征。
步骤四、通过DEM数据获取高程和坡度作为自然环境特征,选取人口密度、到主干道距离、到次干道距离和到居民道路的距离作为社会经济要素,后三者可基于路网数据生成欧式距离场获得,对这些要素数据通过Arcgis和Python进行投影转换,粗重采样,矢量裁剪,精重采样将其构造为六大特征,如图4为本发明实施例的区位特征示意图;图4a为本发明实施例的高程特征示意图,图4b为本发明实施例的坡度特征示意图,图4c为本发明实施例的2000年人口特征示意图,图4d为本发明实施例的距主干道距离特征示意图,图4e为本发明实施例的距次干道距离特征示意图,图4f为本发明实施例的距居民道距离特征示意图。对特征进行标准化处理,使用公式表示如下:
其中,x(l)为预设特征;max(x)为预设特征的最大值;min(x)为预设特征的最小值。
进而融合为区位条件特征,其表达为:
xenv(ind,t)=[xnat(ind,t),xeco(ind,t)]T
其中,xenv(ind,t)为第ind个元胞在时间t下区位条件特征向量;xnat(ind,t)为第ind个元胞在时间t下自然环境特征向量;xeco(ind,t)为第ind个元胞在时间t下社会经济特征向量;T表示转置。
步骤五、以每一个元胞为单位,计算其区位条件特征的余弦相似度,得到元胞之间的相似矩阵,其中余弦相似度表达为:
其中,simij(t)为在时间t下第i个元胞和第j个元胞的余弦相似度;xenv(i,t)为第i个元胞在时间t下第k维区位特征;xenv(j,t)k为第j个元胞在时间t下第k维区位特征;n为区位条件特征的总维数。
步骤六、通过合理假设和多次调参设置相似度阈值和距离阈值为0.995和1000m,对于达到双重阈值约束的元胞建立联系,进而构造区位条件相似图,其中关联权重矩阵表达为:
其中,Wij为关联权重矩阵W在元胞集合(i,j)的值;Tsim为相似度阈值;Tdis为距离阈值;disij为第i个元胞和第j个元胞之间的距离。
步骤七、提取区位条件相似图中结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似图为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个图卷积层,通过反向传播求梯度更新参数,进而通过上述样本数据集进行训练,获得区位遥相关特征,其中信号x与滤波器gθ的图卷积表达为:
gθ*x'=UgθUTx'
步骤八、考虑到数据中的多数类和少数类数量差距较大,基于TomeLinks欠采样解决当前数据不平衡的问题,进而得到用于训练模型的样本数据集,其中TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)<d(a,b)或者d(b,c)<d(a,b)成立.其中d(·)表示两个样本之间的距离。
步骤九、以2000年、2010年的特征数据集训练模型,2020年的特征数据集作为验证和精度评价。随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行十次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,即得到土地利用模拟演化结果;网格就是结果。
步骤十、将模拟预测结果与2020年真实土地利用进行对比,由表1和图5所示,如图5为本发明实施例的土地利用模拟演化结果对比示意图;图5a为本发明实施例的模拟结果示意图,图5b为本发明实施例的真实土地利用示意图。
表1本发明土地利用模拟演化结果
模型对于人造地表、水体预测效果较好,对于草地、林地预测效果一般,整体模拟效果较好。同时分析其总体精度(OA系数)、Kappa系数和FOM系数,并与其他主流模型进行对比,由表2所示,
表2本发明方法与其他主流模型的对比
相对于其他模型中表现最好的RF_CA模型,本发明的总体精度提高1.0%,kappa系数提高了7.8%,FoM系数提高了3.9%。综上,本发明能够以较高的精度模拟演化各土地利用,预测效果具有较高的可信度;输出并保存土地利用模拟演化结果,将训练生成土地模拟演化模型对土地利用变化进行预测。
Claims (10)
1.一种基于深度学习的土地利用变化模拟方法,其特征在于包括如下步骤
S1.获取历史土地利用数据,并进行预处理;
S2.将历史土地利用数据输入卷积神经网络,获取空间邻域特征;
S3.利用图卷积神经网络进行区位遥相关特征构建;
S4.融合空间邻域特征和区位遥相关特征,对样本特征进行欠采样处理;
S5.进行模型构建,对城市土地利用进行模拟演化,训练土地利用模拟演化模型;
S6.利用训练生成的土地利用模拟演化模型对土地利用变化进行预测。
2.根据权利要求1所述的基于深度学习的土地利用变化模拟方法,其特征在于所述的步骤S1具体为,获取等间隔年份的历史土地利用数据,并对历史土地利用数据进行投影校正统一、矢量裁剪和重采样栅格对齐校正;基于历史土地利用数据的分类标准,结合区域特征对土地利用数据进行重编码,重编码用于特征提取,同时保存解码规则。
4.根据权利要求3所述的基于深度学习的土地利用变化模拟方法,其特征在于所述的步骤S3具体为,对预设特征数据进行预处理构造区位条件特征,进而构造相似图,通过GCN卷积神经网络获取区位遥相关特征,具体包括如下步骤:
A1.选取预设特征数据;具体为选取高程和坡度为自然环境特征,表示区域地形;选取人口密度、到主干道距离、到次干道距离和到居民道路距离为社会经济特征,表示区域的经济发展水平;
A2.将预设特征融合为区位条件特征;
A3.以每一个元胞为单位,计算每个元胞的区位条件特征的余弦相似度;
A4.基于元胞间的相似度构建相似矩阵,通过假设和若干次调参设置相似度阈值和距离阈值,对于达到双重阈值约束的元胞建立联系,建立关联权重矩阵,进而构造区位条件相似图;
A5.提取区位条件相似结点的区位条件特征和标签,构建训练集、测试集和验证集为深度学习框架可处理的tensor类型;以区位条件相似为基础构建GCN卷积神经网络,GCN卷积神经网络包括两个卷积层,通过反向传播求梯度更新参数,进而通过样本的训练集、测试集和验证集进行训练,获得区位遥相关特征。
6.根据权利要求5所述的基于深度学习的土地利用变化模拟方法,其特征在于所述的步骤A2,融合区位条件特征具体为计算特征向量:
xenv(ind,t)=[xnat(ind,t),xeco(ind,t)]T
其中,xenv(ind,t)为第ind个元胞在时间t下区位条件特征向量;xnat(ind,t)为第ind个元胞在时间t下自然环境特征向量;xeco(ind,t)为第ind个元胞在时间t下社会经济特征向量;T表示转置;
所述的步骤A3,每个元胞的区位条件特征的余弦相似度的计算方式具体为:
其中,simij(t)为在时间t下第i个元胞和第j个元胞的余弦相似度;xenv(i,t)为第i个元胞在时间t下第k维区位特征;xenv(j,t)k为第j个元胞在时间t下第k维区位特征;n为区位条件特征的总维数。
8.根据权利要求7所述的基于深度学习的土地利用变化模拟方法,其特征在于所述的步骤S4具体为,对特征进行TomeLinks欠采样处理;TomeLinks欠采样噪声识别规则为:对于样本a和b,不存在另外一个样本c,使得d(a,c)<d(a,b)或d(b,c)<d(a,b)成立,其中d(·)表示两个样本之间的距离。
9.根据权利要求8所述的基于深度学习的土地利用变化模拟方法,其特征在于所述的步骤S5具体为,基于LightGBM算法对有效样本特征进行训练获取元胞自动机的转换规则,构建LightGBM_CA模型,并利用LightGBM_CA模型对城市土地利用进行模拟演化,具体步骤如下:随机选取初始样本数据集中20%的数据作为模型样本集,再从样本集中选取70%作为训练集,30%作为验证集,基于LightGBM算法对样本集进行训练,获取元胞自动机的转换规则,构建LightGBM_CA模型;将用于模拟演化的特征数据作为LightGBM_CA模型的输入,对模型进行若干次重复实验并记录每次实验的模拟演化结果,基于投票法确定元胞演化结果,得到土地利用模拟演化结果。
10.根据权利要求9所述的基于深度学习的土地利用变化模拟方法,其特征在于所述的步骤S6还包括验证模型,对评价指标进行分析;具体为对LightGBM_CA模型演化结果进行验证分析,基于OA系数、kappa系数和FoM系数实现评估,输出并保存演化结果;
系数OA表示预测正确的元胞数量占元胞总数的比例,Kappa系数为衡量模型预测结果与实际土地利用的一致性检验指标,FOM系数为比较整体模拟结果的空间格局与实际的空间格局的符合程度的指标;其中OA系数、Kappa系数和FoM系数的计算公式如下所示:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110565706.2A CN113297174B (zh) | 2021-05-24 | 2021-05-24 | 基于深度学习的土地利用变化模拟方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110565706.2A CN113297174B (zh) | 2021-05-24 | 2021-05-24 | 基于深度学习的土地利用变化模拟方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113297174A true CN113297174A (zh) | 2021-08-24 |
CN113297174B CN113297174B (zh) | 2023-10-13 |
Family
ID=77324333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110565706.2A Active CN113297174B (zh) | 2021-05-24 | 2021-05-24 | 基于深度学习的土地利用变化模拟方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113297174B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449936A (zh) * | 2021-08-31 | 2021-09-28 | 北京市城市规划设计研究院 | 城市空间演进模拟预测方法、装置、电子设备及存储介质 |
CN114841084A (zh) * | 2022-07-04 | 2022-08-02 | 西南交通大学 | 一种基于航拍图像的人员疏散模拟方法、系统及设备 |
CN117077497A (zh) * | 2023-10-16 | 2023-11-17 | 中国人民解放军海军工程大学 | 一种3d-ic嵌入式液冷热沉构形演化设计方法及系统 |
CN117114197A (zh) * | 2023-09-08 | 2023-11-24 | 浙江省自然资源征收中心 | 基于深度学习的征迁范围识别方法 |
CN117575014A (zh) * | 2023-10-07 | 2024-02-20 | 南京大学 | 基于图卷积神经网络的土地利用结构模式层次挖掘方法 |
CN118364712A (zh) * | 2024-04-19 | 2024-07-19 | 北京师范大学 | 基于卷积神经网络和Transformer的土地变化模拟方法及装置 |
CN118467857A (zh) * | 2024-05-23 | 2024-08-09 | 山东泓诚空间规划设计有限公司 | 一种土地利用智能引擎的构建方法及系统 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622503A (zh) * | 2011-12-31 | 2012-08-01 | 武汉理工大学 | 城市土地利用变化模拟方法 |
CN109325085A (zh) * | 2018-08-08 | 2019-02-12 | 中南大学 | 一种城市用地功能识别与变化检测方法 |
CN109344737A (zh) * | 2018-09-12 | 2019-02-15 | 中国农业大学 | 基于sar极化分解的一维dcnn土地利用分类方法 |
CN109376969A (zh) * | 2018-12-14 | 2019-02-22 | 中南大学 | 基于深度学习的城市精细化人口分布动态预测方法及装置 |
CN109508360A (zh) * | 2018-11-07 | 2019-03-22 | 武汉大学 | 一种基于元胞自动机的地理多元流数据时空自相关分析方法 |
CN110689544A (zh) * | 2019-09-06 | 2020-01-14 | 哈尔滨工程大学 | 一种遥感图像细弱目标分割方法 |
CN111738329A (zh) * | 2020-06-19 | 2020-10-02 | 中南大学 | 一种面向时间序列遥感影像的土地利用分类方法 |
CN111814368A (zh) * | 2020-06-09 | 2020-10-23 | 广东国地规划科技股份有限公司 | 基于张量的土地利用模拟方法、系统、设备及存储介质 |
CN112035584A (zh) * | 2020-08-28 | 2020-12-04 | 北京清华同衡规划设计研究院有限公司 | 空间规划情景模拟方法及系统 |
CN112070078A (zh) * | 2020-11-16 | 2020-12-11 | 武汉思众空间信息科技有限公司 | 基于深度学习的土地利用分类方法及系统 |
CN112200356A (zh) * | 2020-09-30 | 2021-01-08 | 杭州鲁尔物联科技有限公司 | 一种滑坡的预测方法、装置、设备和存储介质 |
CN112288013A (zh) * | 2020-10-30 | 2021-01-29 | 中南大学 | 基于元度量学习的小样本遥感场景分类方法 |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
CN112669201A (zh) * | 2020-12-25 | 2021-04-16 | 知天(珠海横琴)气象科技有限公司 | 一种基于红外光的可见光云图转换方法、系统及其终端 |
-
2021
- 2021-05-24 CN CN202110565706.2A patent/CN113297174B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622503A (zh) * | 2011-12-31 | 2012-08-01 | 武汉理工大学 | 城市土地利用变化模拟方法 |
CN109325085A (zh) * | 2018-08-08 | 2019-02-12 | 中南大学 | 一种城市用地功能识别与变化检测方法 |
CN109344737A (zh) * | 2018-09-12 | 2019-02-15 | 中国农业大学 | 基于sar极化分解的一维dcnn土地利用分类方法 |
CN109508360A (zh) * | 2018-11-07 | 2019-03-22 | 武汉大学 | 一种基于元胞自动机的地理多元流数据时空自相关分析方法 |
CN109376969A (zh) * | 2018-12-14 | 2019-02-22 | 中南大学 | 基于深度学习的城市精细化人口分布动态预测方法及装置 |
CN110689544A (zh) * | 2019-09-06 | 2020-01-14 | 哈尔滨工程大学 | 一种遥感图像细弱目标分割方法 |
CN111814368A (zh) * | 2020-06-09 | 2020-10-23 | 广东国地规划科技股份有限公司 | 基于张量的土地利用模拟方法、系统、设备及存储介质 |
CN111738329A (zh) * | 2020-06-19 | 2020-10-02 | 中南大学 | 一种面向时间序列遥感影像的土地利用分类方法 |
CN112035584A (zh) * | 2020-08-28 | 2020-12-04 | 北京清华同衡规划设计研究院有限公司 | 空间规划情景模拟方法及系统 |
CN112200356A (zh) * | 2020-09-30 | 2021-01-08 | 杭州鲁尔物联科技有限公司 | 一种滑坡的预测方法、装置、设备和存储介质 |
CN112288013A (zh) * | 2020-10-30 | 2021-01-29 | 中南大学 | 基于元度量学习的小样本遥感场景分类方法 |
CN112070078A (zh) * | 2020-11-16 | 2020-12-11 | 武汉思众空间信息科技有限公司 | 基于深度学习的土地利用分类方法及系统 |
AU2020103901A4 (en) * | 2020-12-04 | 2021-02-11 | Chongqing Normal University | Image Semantic Segmentation Method Based on Deep Full Convolutional Network and Conditional Random Field |
CN112669201A (zh) * | 2020-12-25 | 2021-04-16 | 知天(珠海横琴)气象科技有限公司 | 一种基于红外光的可见光云图转换方法、系统及其终端 |
Non-Patent Citations (2)
Title |
---|
井长青 等: "耦合神经网络与元胞自动机的城市土地利用动态演化模型", 《干旱区研究》, vol. 27, no. 6, pages 854 - 860 * |
王志远 等: "纳入动态数据的改进FLUS模型在城市增长边界划定中的应用", 《地球信息科学》, vol. 22, no. 12, pages 2326 - 2337 * |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113449936A (zh) * | 2021-08-31 | 2021-09-28 | 北京市城市规划设计研究院 | 城市空间演进模拟预测方法、装置、电子设备及存储介质 |
CN114841084A (zh) * | 2022-07-04 | 2022-08-02 | 西南交通大学 | 一种基于航拍图像的人员疏散模拟方法、系统及设备 |
CN117114197A (zh) * | 2023-09-08 | 2023-11-24 | 浙江省自然资源征收中心 | 基于深度学习的征迁范围识别方法 |
CN117114197B (zh) * | 2023-09-08 | 2024-09-10 | 浙江省自然资源征收中心 | 基于深度学习的征迁范围识别方法 |
CN117575014A (zh) * | 2023-10-07 | 2024-02-20 | 南京大学 | 基于图卷积神经网络的土地利用结构模式层次挖掘方法 |
WO2024179621A1 (zh) * | 2023-10-07 | 2024-09-06 | 南京大学 | 基于图卷积神经网络的土地利用结构模式层次挖掘方法 |
CN117077497A (zh) * | 2023-10-16 | 2023-11-17 | 中国人民解放军海军工程大学 | 一种3d-ic嵌入式液冷热沉构形演化设计方法及系统 |
CN117077497B (zh) * | 2023-10-16 | 2023-12-29 | 中国人民解放军海军工程大学 | 一种3d-ic嵌入式液冷热沉构形演化设计方法及系统 |
CN118364712A (zh) * | 2024-04-19 | 2024-07-19 | 北京师范大学 | 基于卷积神经网络和Transformer的土地变化模拟方法及装置 |
CN118467857A (zh) * | 2024-05-23 | 2024-08-09 | 山东泓诚空间规划设计有限公司 | 一种土地利用智能引擎的构建方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113297174B (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113297174B (zh) | 基于深度学习的土地利用变化模拟方法 | |
Feng et al. | Modeling urban growth with GIS based cellular automata and least squares SVM rules: a case study in Qingpu–Songjiang area of Shanghai, China | |
Veregin | Developing and testing of an error propagation model for GIS overlay operations | |
CN112884226A (zh) | 基于多智能体算法的国土空间格局模拟规划方法及系统 | |
Wang et al. | Identifying dominant factors for the calibration of a land-use cellular automata model using Rough Set Theory | |
CN116108758B (zh) | 滑坡易发性评价方法 | |
CN105512759A (zh) | 一种基于生物地理学优化算法的城市ca模型参数优化方法 | |
CN113190688B (zh) | 基于逻辑推理和图卷积的复杂网络链接预测方法及系统 | |
CN110909924A (zh) | 基于交叉熵优化器的城市扩张多情景模拟元胞自动机方法 | |
CN102646164A (zh) | 一种结合空间滤波的土地利用变化建模方法及其系统 | |
CN110826244B (zh) | 模拟轨道交通影响城市生长的共轭梯度元胞自动机方法 | |
CN114528949A (zh) | 一种基于参数优化的电能计量异常数据的识别与补偿方法 | |
CN108879732A (zh) | 电力系统暂态稳定评估方法及装置 | |
CN109829627A (zh) | 一种基于集成学习方案的电力系统动态安全置信评估方法 | |
CN112560215A (zh) | 一种基于深度强化学习的电力选线方法 | |
CN117668360A (zh) | 一种基于学习者在线学习行为分析的个性化习题推荐方法 | |
CN113449936B (zh) | 城市空间演进模拟预测方法、装置、电子设备及存储介质 | |
Khiali-Miab et al. | A network optimisation approach to identify trade-offs between socio-economic and ecological objectives for regional integrated planning | |
Cao et al. | A grey wolf optimizer–cellular automata integrated model for urban growth simulation and optimization | |
CN114757433A (zh) | 一种饮用水源抗生素抗性相对风险快速识别方法 | |
Momeni et al. | Pattern‐based calibration of cellular automata by genetic algorithm and Shannon relative entropy | |
CN110362911A (zh) | 一种面向设计过程的代理模型选择方法 | |
CN117808214A (zh) | 水利工程数据分析系统 | |
CN102279852A (zh) | 一种基于遗传算法的油藏自动历史拟合系统及其拟合方法 | |
CN113240219A (zh) | 一种土地利用模拟及预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |