CN116484266B - 一种精细城市用地类型识别模型训练方法 - Google Patents
一种精细城市用地类型识别模型训练方法 Download PDFInfo
- Publication number
- CN116484266B CN116484266B CN202310564712.5A CN202310564712A CN116484266B CN 116484266 B CN116484266 B CN 116484266B CN 202310564712 A CN202310564712 A CN 202310564712A CN 116484266 B CN116484266 B CN 116484266B
- Authority
- CN
- China
- Prior art keywords
- land
- grid
- urban
- sample
- recognition model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 49
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 238000007726 management method Methods 0.000 claims description 7
- 238000007621 cluster analysis Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims description 5
- 238000012360 testing method Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 4
- 238000007619 statistical method Methods 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005315 distribution function Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Tourism & Hospitality (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种精细城市用地类型识别模型训练方法,包括:将地块区域划分为若干个宫格排列的网格,将地块区域作为用地识别窗口,用地识别窗口的中心网格作为待识别地块,与中心网格相邻的网格作为邻接地块;获取每一网格的特征数据,特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;选取已知土地类型的地块作为用地识别窗口的中心地块,中心地块所邻接的地块作为样本,将样本的特征数据作为特征集合,构建样本特征数据集;将样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型。
Description
技术领域
本发明涉及城市信息化和城市空间治理技术领域,尤其是涉及一种精细城市用地类型识别模型训练方法。
背景技术
目前,土地利用方式和结构影响着城市发展的速度与规模,厘清城市土地利用情况对城市发展具有重大的意义。
城市的土地利用类型主要是根据其特定的功能需求而划分的。现有的城市用地类型识别方法通常是通过遥感分类的方式对城市内部的用地类型进行分类,但是难以获取高精度遥感数据,导致现有的城市用地类型模型训练方法难以准确识别城市用地类型。
发明内容
本发明提供一种精细城市用地类型识别模型训练方法,以解决现有的城市用地类型识别方法难以准确识别城市用地类型的技术问题。
本发明的实施例提供了一种精细城市用地类型识别模型训练方法,包括:
将地块区域划分为若干个宫格排列的网格,将所述地块区域作为用地识别窗口,所述用地识别窗口的中心网格作为待识别地块,与所述中心网格相邻的网格作为邻接地块;
获取每一网格的特征数据,所述特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;
选取已知土地类型的地块作为用地识别窗口的中心地块,所述中心地块所邻接的地块作为样本,将所述样本的特征数据作为特征集合,构建样本特征数据集;
将所述样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型。
进一步的,所述获取每一网格的特征数据,包括:
提取每一网格的兴趣点类型,所述兴趣点类型包括居住、道路交通、商业服务、绿地广场、工业和公共管理服务;
基于已知地类数据,将土地类型重分类为商业用地、生态用地、生产用地、交通用地和居住用地;
计算每一网格的人口数量,并根据所述人口数量确定每一网格的人口密度类别,所述人口包括工作人口和居住人口;
对每一网格数据与中心城区数据进行叠加分析,判断每一网格是否处于中心城区。
进一步的,所述提取每一网格的兴趣点类型,包括:
基于BM25算法提取出每一网格的兴趣点类型。
进一步的,计算每一网格的人口数量,并根据所述人口数量确定每一网格的人口密度类别,包括:
获取每一网格的人口数据,将所述人口数据与对应的网格输入进行统计分析得到每个网格的人口数量,并根据所述人口数量和对应的网格面积计算得到人口密度;
以每一网格为分析单元,基于K-Means算法对所述人口密度进行聚类分析,确定每一网格的人口密度类别。
进一步的,所述样本特征数据集为:
其中,X为训练样本数据集,L为样本数据的数量,d为样本的特征总数,代表第L个样本的第d个特征值,其数值为1或0;
所述样本标签数据集为Y=[y1y2...yL]T,其中Y为训练样本标签数据及,yL为第L个样本所对应的中心地块的实际地类。
进一步的,在进行模型训练得到用城市用地类型识别模型之后,还包括:
将测试样本数据集输入到城市用地类型识别模型中,基于所述城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数;
基于所述F1分数计算得到所述城市用地类型识别模型的macro-F1值,在所述macro-F1值小于预设阈值时,调整所述城市用地类型识别模型的网络结构参数,并重新计算所述城市用地类型识别模型的macro-F1值,直至所述macro-F1值大于或等于所述预设阈值,并保存当前网络结构参数。
进一步的,所述基于所述城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数,包括:
根据城市用地类型识别模型得到的用地分类结果计算得到各个地类的识别精准率和召回率;
根据所述识别精准率和所述召回率计算得到各个地类的F1分数。
进一步的,所述基于所述F1分数计算得到所述城市用地类型识别模型的macro-F1值,包括:
所述macro-F1值的计算公式为:
其中,所述n为用地类型分类数量,F1n为第n组用地分类结果的F1分数。
本发明的一个实施例提供了一种精细城市用地类型识别方法,包括:
利用如上述的精细城市用地类型识别模型训练方法得到城市用地类型识别模型;
选取待识别地块作为所述用地识别窗口的中心地块,将所述待识别地块的邻接地块的特征数据作为推测量输入到所述城市用地类型识别模型中,输出城市用地类别识别结果。
本发明的一个实施例提供了一种精细城市用地类型识别模型训练装置,包括:
地块区域划分模块,用于将地块区域划分为若干个宫格排列的网格,将所述地块区域作为用地识别窗口,所述用地识别窗口的中心网格作为待识别地块,与所述中心网格相邻的网格作为邻接地块;
特征数据获取模块,用于获取每一网格的特征数据,所述特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;
样本特征数据集构建模块,用于选取已知土地类型的地块作为用地识别窗口的中心地块,所述中心地块所邻接的地块作为样本,将所述样本的特征数据作为特征集合,构建样本特征数据集;
城市用地类型识别模型构建模块,用于将所述样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型。
本发明实施例通过地块区域进行划分得到用地识别窗口,并将用地识别窗口的中心网格作为待识别地块,通过获取每一网格的特征数据以构建特征数据特征集,能够通过模型训练得到城市用地类型类识别模型,考虑了多个特征数据对城市用地类型识别的影响,从而能够有效提高城市用地类型识别的精准度。
附图说明
图1是本发明实施例提供的精细城市用地类型识别模型训练方法的流程示意图;
图2是本发明实施例提供的用地识别窗口的示意图;
图3是本发明实施例提供的样本特征数据集的示意图;
图4是本发明实施例提供的精细城市用地类型识别模型训练方法的另一流程示意图;
图5是本发明实施例提供的精细城市用地类型识别方法的流程示意图;
图6是本发明实施例提供的精细城市用地类型识别方法的另一流程示意图;
图7是本发明实施例提供的精细城市用地类型识别模型训练装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。
请参阅图1,本发明的实施例提供了一种精细城市用地类型识别模型训练方法,包括:
S1、将地块区域划分为若干个宫格排列的网格,将地块区域作为用地识别窗口,用地识别窗口的中心网格作为待识别地块,与中心网格相邻的网格作为邻接地块;
请参阅图2,在本发明实施例中,可以将地块区域划分为九宫格排列形式的网格。例如,将某个区域划分为300米X300米的网格,以3网格X3网格的窗口作为用地识别窗口,其中,该窗口的中心网格为待识别地块,与该待识别地块相邻的网格对应的地块为邻接地块。
S2、获取每一网格的特征数据,特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;
在本发明实施例中,兴趣点类型可以包括居住、道路交通、商业服务、绿地广场、工业和公共管理服务。土地类型可以通过重分类已知地类确定,土地类型通过重分类后包括商业用地、生态用地、生产用地、交通用地和居住用地。
S3、选取已知土地类型的地块作为用地识别窗口的中心地块,中心地块所邻接的地块作为样本,将样本的特征数据作为特征集合,构建样本特征数据集;
请参阅图3,为本发明实施例提供的一种样本特征数据集示意图。
S4、将样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型。
在本发明实施例中,可以随机抽取样本特征数据集X中的85%的样本作为模型的训练样本,其余15%作为测试样本。本发明实施例的样本标签数据集可以为样本对应的中心地块的实际地类的集合。
本发明实施例得到的城市用地类型为精细城市用地类型识别模型,能够对城市用地类型进行精细化识别。本发明实施例通过地块区域进行划分得到用地识别窗口,并将用地识别窗口的中心网格作为待识别地块,通过获取每一网格的特征数据以构建特征数据特征集,能够通过模型训练得到城市用地类型类识别模型,考虑了多个特征数据对城市用地类型识别的影响,对城市用地类型进行精细化识别,从而能够有效提高城市用地类型识别的精准度。
请参阅图4,为本发明实施例提供的精细城市用地类型识别模型的训练流程示意图。
在一个实施例中,步骤S2、获取每一网格的特征数据,还可以包括以下子步骤:
S21、提取每一网格的兴趣点类型,兴趣点类型包括居住、道路交通、商业服务、绿地广场、工业和公共管理服务;
在本发明实施例中,可以参照《城市用地分类与规划建设用地标准(GB50137-2011)》的分类标准,将兴趣点类型分类为居住、道路交通、商业服务、绿地广场、工业和公共管理服务。
本发明实施例可以基于BM25算法提取出每一网格的兴趣点类型,包括:
其中,N为网格总数;n为包含第i类兴趣点的网格数量;k1∈(0,∞),通常取值1.2;b∈[0,1],通常取值0.75;dl为网格内兴趣点总数;avdl为所有网格的平均兴趣点数量;
本发明实施例通过比对同一网格不同类兴趣点的得分Score,选取得分最高的兴趣点类型作为当前网格的兴趣点类型。
本发明实施例通过在BM25算法中加入k1、b参数,能够有效解决次品饱和度和文本长度归一化的问题,从而能够准确提取得到每一网格的兴趣点类型。
S22、基于已知地类数据,将土地类型重分类为商业用地、生态用地、生产用地、交通用地和居住用地;
在本发明实施例中,已知地类数据可以为政府公开的土地数据,包括法定图则数据、土地调查数据和土地利用现状数据。
S23、计算每一网格的人口数量,并根据人口数量确定每一网格的人口密度类别,人口包括工作人口和居住人口;
S24、对每一网格数据与中心城区数据进行叠加分析,判断每一网格是否处于中心城区。
在本发明实施例中,可以每一网格数据与中心城区数据输入到叠加分析工具中,若网格数据与中心城区数据相交,则判断该网格位于中心城区,若网格数据与中心城区数据不相交,则判断网格不位于中心城区。
本发明实施例通过获取每一网格的特征数据,该特征数据包括兴趣点类型、土地类型、人口密度等级和是否处于中心城区,基于每一网格对应地块的特征数据作为模型训练的输入,能够在模型训练中考虑多种影响城市用地类型识别的因素,从而能够有效提高模型训练的精准度,进而能够有效提高城市用地类型识别的精准度。
在一个实施例中,步骤S23、计算每一网格的人口数量,并根据人口数量确定每一网格的人口密度类别,还可以以下子步骤:
S231、获取每一网格的人口数据,将人口数据与对应的网格输入进行统计分析得到每个网格的人口数量,并根据人口数量和对应的网格面积计算得到人口密度;
在本发明实施例中,可以将人口数据与对应的网格数据输入到分区统计工具中,利用分区统计工具统计得到各个网格的人口数量,其中人口数量包括工作人口数量和居住人口数量。
在统计得到人口数量之后,计算人口密度的步骤可以为:
网格工作(居住)人口密度=网格工作(居住)人口数量/网格面积。
S232、以每一网格为分析单元,基于K-Means算法对人口密度进行聚类分析,确定每一网格的人口密度类别。
在本发明实施例中,基于K-Means算法对人口密度进行无监督聚类分析得到每一网格的人口密度,根据预设的人口密度与人口密度类别的对应关系,确定每一网格的人口密度类别。其中,人口密度类别可以为低人口密度、中人口密度和高人口密度。
本发明实施例通过于K-Means算法对人口密度进行聚类分析能够准确获得每一网格的人口密度;通过确定每一网格的人口密度类别,能够准确对不同人口密度进行区分。
在一个实施例中,样本特征数据集为:
其中,X为样本特征数据集,L为样本数据的数量,d为样本的特征总数,代表第L个样本的第d个特征值,其数值为1或0;
样本标签数据集为Y=[y1 y2 ... yL]T,其中Y为训练样本标签数据及,yL为第L个样本所对应的中心地块的实际地类。
在一个实施例中,将训练样本特征数据及X作为输入,样本标签数据集Y作为输出,训练模型中的受限玻尔兹曼机,并保存拟合精度最高的网络结构参数。
需要说明得数,受限玻尔兹曼机是一种可通过输入数据集学习概率分布的随机生成神经网络,是基于能量的概率分布模型。其主要由两部分组成:第一部分是能量函数,第二部分是基于能量函数的概率分布函数。
在本发明实施例中,对于给定的状态(v,h),假设其可见层与隐藏层都服从高斯分布,受限玻尔兹曼机具备的能量为:
E(v,h)=-aTv-bTh-hTWv
其中,a,b是偏倚系数;W是权重矩阵。
受限玻尔兹曼机的权重是随机初始化的,在重建结果和原始输入的差距较大时,会重新调整权重并重建误差,误差会沿着受限玻尔兹曼机的权重反向传播,以一个迭代学习的过程不断反向传播,直到达到某个误差最小值。
基于能量函数的联合概率分布函数为:
其中Z是被称为配分函数的归一化常数:
在一个实施例中,在步骤S4、进行模型训练得到用城市用地类型识别模型之后,还包括以下步骤:
步骤S5、将测试样本数据集输入到城市用地类型识别模型中,基于城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数;
在本发明实施例中,步骤S5、基于城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数,还可以包括以下子步骤:
S51、根据城市用地类型识别模型得到的用地分类结果计算得到各个地类的识别精准率和召回率;
在本发明实施例中,识别精准率precision的计算公式如下:
召回率recall的计算公式如下:
其中,TP为用地类型预测正确的样本数量;FP将其他用地类型预测为本用地类型的样本数量;FN:将本用地类型预测为其他用地类型的样本数量。
S52、根据识别精准率和召回率计算得到各个地类的F1分数。
F1分数的计算公式如下:
步骤S6、基于F1分数计算得到城市用地类型识别模型的macro-F1值,在macro-F1值小于预设阈值时,调整城市用地类型识别模型的网络结构参数,并重新计算城市用地类型识别模型的macro-F1值,直至macro-F1值大于或等于预设阈值,并保存当前网络结构参数。
macro-F1值的计算公式为:
其中,n为用地类型分类数量,F1n为第n组用地分类结果的F1分数。
在本发明实施例中,可以根据实际需要设定预设阈值以及调整预设阈值,例如,预设阈值可以设定为0.8。
本发明实施例通过计算模型的macro-F1值来评估城市用地类型识别模型的模型精度,macro-F1值满足大于等于0.8时,判断当前的城市用地识别模型的精度符合要求,并保存当前的模型网络结构参数,从而能够使得城市用地类型识别模型保持较高的精准度。
实施本发明实施例,具有以下有益效果:
本发明实施例通过地块区域进行划分得到用地识别窗口,并将用地识别窗口的中心网格作为待识别地块,通过获取每一网格的特征数据以构建特征数据特征集,能够通过模型训练得到城市用地类型类识别模型,考虑了多个特征数据对城市用地类型识别的影响,对城市用地类型进行精细化识别,从而能够有效提高城市用地类型识别的精准度。
请参阅图5,本发明的一个实施例提供了一种精细城市用地类型识别方法,包括:
S10、利用如上述的精细城市用地类型识别模型训练方法得到城市用地类型识别模型;
S20、选取待识别地块作为用地识别窗口的中心地块,将待识别地块的邻接地块的特征数据作为推测量输入到城市用地类型识别模型中,输出城市用地类别识别结果。
请参阅图6,为本发明实施例提供的一种精细城市用地类型识别方法的另一流程示意图。
本发明实施例选取待识别地块作为用地识别窗口的中心地块,将待识别地块的邻接地块的特征数据作为推测量输入到城市用地类型识别模型,能够得到待识别地块的城市用地类别识别结果,城市用地类型识别结果可以为待识别地块为不同地类的概率,最大概率值对应的城市用地类型即为待识别地块的城市用地类型。
请参阅图7,基于与上述实施例相同的发明构思,本发明的一个实施例提供了一种精细城市用地类型识别模型训练装置,包括:
地块区域划分模块10,用于将地块区域划分为若干个宫格排列的网格,将地块区域作为用地识别窗口,用地识别窗口的中心网格作为待识别地块,与中心网格相邻的网格作为邻接地块;
特征数据获取模块20,用于获取每一网格的特征数据,特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;
样本特征数据集构建模块30,用于选取已知土地类型的地块作为用地识别窗口的中心地块,中心地块所邻接的地块作为样本,将样本的特征数据作为特征集合,构建样本特征数据集;
城市用地类型识别模型构建模块40,用于将样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型。
在一个实施例中,特征数据获取模块20还包括:
兴趣点类型提取单元,用于提取每一网格的兴趣点类型,兴趣点类型包括居住、道路交通、商业服务、绿地广场、工业和公共管理服务;
土地类型重分类单元,用于基于已知地类数据,将土地类型重分类为商业用地、生态用地、生产用地、交通用地和居住用地;
人口密度类别确定单元,用于计算每一网格的人口数量,并根据人口数量确定每一网格的人口密度类别,人口包括工作人口和居住人口;
中心城区判断单元,用于对每一网格数据与中心城区数据进行叠加分析,判断每一网格是否处于中心城区。
在一个实施例中,兴趣点类型提取单元还用于:
基于BM25算法提取出每一网格的兴趣点类型。
在一个实施例中,人口密度类别确定单元还用于:
获取每一网格的人口数据,将人口数据与对应的网格输入进行统计分析得到每个网格的人口数量,并根据人口数量和对应的网格面积计算得到人口密度;
以每一网格为分析单元,基于K-Means算法对人口密度进行聚类分析,确定每一网格的人口密度类别。
在一个实施例中,样本特征数据集为:
其中,X为训练样本数据集,L为样本数据的数量,d为样本的特征总数,代表第L个样本的第d个特征值,其数值为1或0;
样本标签数据集为Y=[y1 y2 ... yL]T,其中Y为训练样本标签数据及,yL为第L个样本所对应的中心地块的实际地类。
在一个实施例中,本装置还包括模型精度校验模块,用于:
将测试样本数据集输入到城市用地类型识别模型中,基于城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数;
基于F1分数计算得到城市用地类型识别模型的macro-F1值,在macro-F1值小于预设阈值时,调整城市用地类型识别模型的网络结构参数,并重新计算城市用地类型识别模型的macro-F1值,直至macro-F1值大于或等于预设阈值,并保存当前网络结构参数。
在一个实施例中,基于城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数,包括:
根据城市用地类型识别模型得到的用地分类结果计算得到各个地类的识别精准率和召回率;
根据识别精准率和召回率计算得到各个地类的F1分数。
在一个实施例中,基于F1分数计算得到城市用地类型识别模型的macro-F1值,包括:
macro-F1值的计算公式为:
其中,n为用地类型分类数量,F1n为第n组用地分类结果的F1分数。
本发明的一个实施例提供了一种计算机存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如上述的精细城市用地类型识别模型训练方法。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (7)
1.一种精细城市用地类型识别模型训练方法,其特征在于,包括:
将地块区域划分为若干个宫格排列的网格,将所述地块区域作为用地识别窗口,所述用地识别窗口的中心网格对应的中心地块作为待识别地块,与所述中心网格相邻的网格对应的地块作为邻接地块;
获取每一网格的特征数据,所述特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;
选取已知土地类型的地块作为用地识别窗口的中心地块,所述中心地块所邻接的地块作为样本,将所述样本的特征数据作为特征集合,构建样本特征数据集;
将所述样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型,所述样本标签数据集为所述已知土地类型的地块的地类集合。
2.如权利要求1所述的精细城市用地类型识别模型训练方法,其特征在于,所述获取每一网格的特征数据,包括:
提取每一网格的兴趣点类型,所述兴趣点类型包括居住、道路交通、商业服务、绿地广场、工业和公共管理服务;
基于已知地类数据,将土地类型重分类为商业用地、生态用地、生产用地、交通用地和居住用地;
计算每一网格的人口数量,并根据所述人口数量确定每一网格的人口密度类别,所述人口包括工作人口和居住人口;
对每一网格数据与中心城区数据进行叠加分析,判断每一网格是否处于中心城区。
3.如权利要求2所述的精细城市用地类型识别模型训练方法,其特征在于,计算每一网格的人口数量,并根据所述人口数量确定每一网格的人口密度类别,包括:
获取每一网格的人口数据,将所述人口数据与对应的网格输入进行统计分析得到每个网格的人口数量,并根据所述人口数量和对应的网格面积计算得到人口密度;
以每一网格为分析单元,基于K-Means算法对所述人口密度进行聚类分析,确定每一网格的人口密度类别。
4.如权利要求1所述的精细城市用地类型识别模型训练方法,其特征在于,所述样本特征数据集为:
其中,X为训练样本数据集,L为样本数据的数量,d为样本的特征总数,代表第L个样本的第d个特征值,其数值为1或0;
所述样本标签数据集为Y=[y1 y2...yL]T,其中Y为训练样本标签数据集,yL为第L个样本所对应的中心地块的实际地类。
5.如权利要求1所述的精细城市用地类型识别模型训练方法,其特征在于,在进行模型训练得到用城市用地类型识别模型之后,还包括:
将测试样本数据集输入到城市用地类型识别模型中,基于所述城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数;
基于所述F1分数计算得到所述城市用地类型识别模型的macro-F1值,在所述macro-F1值小于预设阈值时,调整所述城市用地类型识别模型的网络结构参数,并重新计算所述城市用地类型识别模型的macro-F1值,直至所述macro-F1值大于或等于所述预设阈值,并保存当前网络结构参数;
所述基于所述城市用地类型识别模型得到的用地分类结果,计算得到各个地类的F1分数,包括:
根据城市用地类型识别模型得到的用地分类结果计算得到各个地类的识别精准率和召回率;
识别精准率precision的计算公式如下:
召回率recall的计算公式如下:
其中,TP为用地类型预测正确的样本数量;FP为将其他用地类型预测为本用地类型的样本数量;FN为将本用地类型预测为其他用地类型的样本数量;
根据所述识别精准率和所述召回率计算得到各个地类的F1分数,F1分数的计算公式如下:
所述基于所述F1分数计算得到所述城市用地类型识别模型的macro-F1值,包括:
所述macro-F1值的计算公式为:
其中,所述n为用地类型分类数量,F1n为第n组用地分类结果的F1分数。
6.一种精细城市用地类型识别方法,其特征在于,包括:
利用如权利要求1-5任意一项所述的精细城市用地类型识别模型训练方法得到城市用地类型识别模型;
选取待识别地块作为所述用地识别窗口的中心地块,将所述待识别地块的邻接地块的特征数据作为推测量输入到所述城市用地类型识别模型中,输出城市用地类别识别结果。
7.一种精细城市用地类型识别模型训练装置,其特征在于,包括:
地块区域划分模块,用于将地块区域划分为若干个宫格排列的网格,将所述地块区域作为用地识别窗口,所述用地识别窗口的中心网格对应的中心地块作为待识别地块,与所述中心网格相邻的网格对应的地块作为邻接地块;
特征数据获取模块,用于获取每一网格的特征数据,所述特征数据包括兴趣点类型、土地类型、人口密度类别和是否处于中心城区;
样本特征数据集构建模块,用于选取已知土地类型的地块作为用地识别窗口的中心地块,所述中心地块所邻接的地块作为样本,将所述样本的特征数据作为特征集合,构建样本特征数据集;
城市用地类型识别模型构建模块,用于将所述样本特征数据集作为模型输入,样本标签数据集作为模型输出,进行模型训练得到用城市用地类型识别模型,所述样本标签数据集为所述已知土地类型的地块的地类集合。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310564712.5A CN116484266B (zh) | 2023-05-18 | 2023-05-18 | 一种精细城市用地类型识别模型训练方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310564712.5A CN116484266B (zh) | 2023-05-18 | 2023-05-18 | 一种精细城市用地类型识别模型训练方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116484266A CN116484266A (zh) | 2023-07-25 |
CN116484266B true CN116484266B (zh) | 2023-11-24 |
Family
ID=87223298
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310564712.5A Active CN116484266B (zh) | 2023-05-18 | 2023-05-18 | 一种精细城市用地类型识别模型训练方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116484266B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382330A (zh) * | 2020-03-10 | 2020-07-07 | 智慧足迹数据科技有限公司 | 一种土地用地性质识别方法、装置、电子设备及存储介质 |
CN111476325A (zh) * | 2020-06-29 | 2020-07-31 | 北京隆普智能科技有限公司 | 基于大数据的城市建设用地分类识别方法及系统 |
CN113011350A (zh) * | 2021-03-24 | 2021-06-22 | 深圳前海微众银行股份有限公司 | 一种地域图像的识别处理方法、装置及电子设备 |
CN114610827A (zh) * | 2022-03-15 | 2022-06-10 | 东南大学 | 一种针对村镇聚落的聚散性特征量化识别方法 |
CN114723596A (zh) * | 2022-03-28 | 2022-07-08 | 东南大学 | 一种基于多源交通出行数据和主题模型的城市功能区识别方法 |
DE102021201124A1 (de) * | 2021-02-08 | 2022-08-11 | Robert Bosch Gesellschaft mit beschränkter Haftung | Trainieren von bildklassifizierernetzen |
CN115563493A (zh) * | 2022-11-10 | 2023-01-03 | 东南大学 | 一种基于聚类算法划分乡村景观生态单元的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10922589B2 (en) * | 2018-10-10 | 2021-02-16 | Ordnance Survey Limited | Object-based convolutional neural network for land use classification |
US20220138260A1 (en) * | 2020-10-30 | 2022-05-05 | Here Global B.V. | Method, apparatus, and system for estimating continuous population density change in urban areas |
CN113902185B (zh) * | 2021-09-30 | 2023-10-31 | 北京百度网讯科技有限公司 | 区域用地性质的确定方法、装置、电子设备及存储介质 |
-
2023
- 2023-05-18 CN CN202310564712.5A patent/CN116484266B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111382330A (zh) * | 2020-03-10 | 2020-07-07 | 智慧足迹数据科技有限公司 | 一种土地用地性质识别方法、装置、电子设备及存储介质 |
CN111476325A (zh) * | 2020-06-29 | 2020-07-31 | 北京隆普智能科技有限公司 | 基于大数据的城市建设用地分类识别方法及系统 |
DE102021201124A1 (de) * | 2021-02-08 | 2022-08-11 | Robert Bosch Gesellschaft mit beschränkter Haftung | Trainieren von bildklassifizierernetzen |
CN113011350A (zh) * | 2021-03-24 | 2021-06-22 | 深圳前海微众银行股份有限公司 | 一种地域图像的识别处理方法、装置及电子设备 |
CN114610827A (zh) * | 2022-03-15 | 2022-06-10 | 东南大学 | 一种针对村镇聚落的聚散性特征量化识别方法 |
CN114723596A (zh) * | 2022-03-28 | 2022-07-08 | 东南大学 | 一种基于多源交通出行数据和主题模型的城市功能区识别方法 |
CN115563493A (zh) * | 2022-11-10 | 2023-01-03 | 东南大学 | 一种基于聚类算法划分乡村景观生态单元的方法 |
Non-Patent Citations (3)
Title |
---|
Classification of Urban Morphology with Deep Learning:Application on Urban Vitality;Wangyang Chen等;《arXiv:2105.09908v3》;1-29 * |
城市扩展元胞自动机多结构卷积神经网络模型;谢志文;王海军;张彬;黄鑫鑫;;测绘学报(03);112-122 * |
基于深度学习与多源遥感数据的新增建设用地自动检测;张泽瑞等;《中山大学学报(自然科学版)》;28-37 * |
Also Published As
Publication number | Publication date |
---|---|
CN116484266A (zh) | 2023-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245981B (zh) | 一种基于手机信令数据的人群类型识别方法 | |
CN111882446B (zh) | 一种基于图卷积网络的异常账户检测方法 | |
CN110674841B (zh) | 一种基于聚类算法的测井曲线识别方法 | |
CN104346379B (zh) | 一种基于逻辑和统计技术的数据元识别方法 | |
CN116108758B (zh) | 滑坡易发性评价方法 | |
CN110929939B (zh) | 一种基于聚类-信息量耦合模型下的滑坡灾害易发性空间预测方法 | |
CN104636449A (zh) | 基于lsa-gcc的分布式大数据系统风险识别方法 | |
CN109635010B (zh) | 一种用户特征及特征因子抽取、查询方法和系统 | |
CN113297174B (zh) | 基于深度学习的土地利用变化模拟方法 | |
CN114299742B (zh) | 一种高速公路的限速信息动态识别与更新推荐方法 | |
CN106600046A (zh) | 基于多分类器融合的土地闲置预测方法及装置 | |
CN112149922A (zh) | 高速公路隧道下行线出入口区域事故严重程度预测方法 | |
CN105786898A (zh) | 一种领域本体的构建方法和装置 | |
CN114912798A (zh) | 一种基于随机森林和震害大数据的地震损失评估系统 | |
CN113284369B (zh) | 一种基于ads-b实测航路数据的预测方法 | |
CN114662405A (zh) | 基于少样本度量和集成学习的岩爆预测方法 | |
CN114638300A (zh) | 一种识别页岩油气藏“甜点”的方法、装置及存储介质 | |
CN113177644A (zh) | 一种基于词嵌入和深度时序模型的自动建模系统 | |
CN111863135B (zh) | 一种假阳性结构变异过滤方法、存储介质及计算设备 | |
CN116484266B (zh) | 一种精细城市用地类型识别模型训练方法 | |
CN106991171A (zh) | 基于智慧校园信息服务平台的话题发现方法 | |
CN115343676B (zh) | 密封电子设备内部多余物定位技术的特征优化方法 | |
CN110362911A (zh) | 一种面向设计过程的代理模型选择方法 | |
CN113688870B (zh) | 一种采用混合算法的基于用户用电行为的群租房识别方法 | |
CN111985782B (zh) | 基于环境感知的自动驾驶有轨电车运行风险评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |