CN114819589A - 城市空间高质量利用测定方法、系统、计算机设备及终端 - Google Patents
城市空间高质量利用测定方法、系统、计算机设备及终端 Download PDFInfo
- Publication number
- CN114819589A CN114819589A CN202210415083.5A CN202210415083A CN114819589A CN 114819589 A CN114819589 A CN 114819589A CN 202210415083 A CN202210415083 A CN 202210415083A CN 114819589 A CN114819589 A CN 114819589A
- Authority
- CN
- China
- Prior art keywords
- data
- space
- quality
- urban
- evaluation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 85
- 238000011156 evaluation Methods 0.000 claims abstract description 80
- 238000012549 training Methods 0.000 claims abstract description 60
- 238000010801 machine learning Methods 0.000 claims abstract description 54
- 238000011161 development Methods 0.000 claims abstract description 33
- 238000013439 planning Methods 0.000 claims abstract description 32
- 238000005516 engineering process Methods 0.000 claims abstract description 30
- 230000006399 behavior Effects 0.000 claims abstract description 13
- 238000013210 evaluation model Methods 0.000 claims abstract description 11
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000005259 measurement Methods 0.000 claims abstract description 4
- 230000004927 fusion Effects 0.000 claims description 41
- 238000013441 quality evaluation Methods 0.000 claims description 37
- 238000004458 analytical method Methods 0.000 claims description 32
- 230000018109 developmental process Effects 0.000 claims description 31
- 230000008878 coupling Effects 0.000 claims description 21
- 238000010168 coupling process Methods 0.000 claims description 21
- 238000005859 coupling reaction Methods 0.000 claims description 21
- 238000004519 manufacturing process Methods 0.000 claims description 21
- 230000011218 segmentation Effects 0.000 claims description 20
- 238000011160 research Methods 0.000 claims description 17
- 230000000007 visual effect Effects 0.000 claims description 15
- 238000013499 data model Methods 0.000 claims description 14
- 230000009467 reduction Effects 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 13
- 239000002689 soil Substances 0.000 claims description 13
- 238000005192 partition Methods 0.000 claims description 9
- 238000013139 quantization Methods 0.000 claims description 9
- 238000012935 Averaging Methods 0.000 claims description 7
- 238000013135 deep learning Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000003066 decision tree Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000007500 overflow downdraw method Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 239000000470 constituent Substances 0.000 claims description 3
- 239000012535 impurity Substances 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000013138 pruning Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 3
- 239000002131 composite material Substances 0.000 claims description 2
- 230000035484 reaction time Effects 0.000 claims description 2
- 230000008901 benefit Effects 0.000 abstract description 14
- 238000010276 construction Methods 0.000 abstract description 12
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000007637 random forest analysis Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000007726 management method Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000005457 optimization Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 5
- 206010063385 Intellectualisation Diseases 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 238000007405 data analysis Methods 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000011430 maximum method Methods 0.000 description 2
- 238000005065 mining Methods 0.000 description 2
- 238000012732 spatial analysis Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000010485 coping Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 238000011157 data evaluation Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013278 delphi method Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000005111 flow chemistry technique Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Entrepreneurship & Innovation (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Marketing (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Informatics (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明属于国土空间规划信息处理技术领域,提供了一种城市空间高质量利用测定方法、系统、计算机设备及终端,通过城市空间数据、经济社会数据、城市运行数据及人群行为数据等多源空间数据融合并形成数据集;构建系统的城市空间(三类)高质量评价体系,基于机器学习模型对评价模型进行智能化训练,进而对城市空间进行自动化高质量测定。本发明基于机器学习的城市空间高质量利用测度方法,将机器学习算法与城市空间高质量发展评价相结合,充分发挥机器学习的自我学习优势,解决当前城市空间高质量发展特征识别精细化、问题查找精细化及治理决策精准化的问题,为高质量城市建设及高水平城市空间治理提供智能化的理论方法、智能技术与系统支撑。
Description
技术领域
本发明属于国土空间规划信息处理技术领域,尤其涉及一种城市空间高质量利用测定方法、系统、计算机设备及终端。
背景技术
目前,伴随着社会经济高速发展的城市人口增多、城镇化转型、城市土地资源错置、生态环境遭到破坏,新时期城市空间如何高质量发展成为现阶段我们要探讨解决的问题。首先,新时代国土空间规划体系的建立,表明中国国土空间的利用呈现出向集约化、绿色化、人本化、智慧化方向的转变,国土空间高质量利用评价作为国土空间规划治理的重要基础与支撑具有重大现实意义;其次,新时期城市需系统地解决“实现人的全面发展”的生产、生活及生态空间需求,并将居民行为研究与空间供需结合起来是亟需突破的问题;最后,伴随着智慧社会的崛起和大数据与人工智能等新技术的快速发展,将智能技术和智慧思维运用于提升资源的利用效率、优化空间规划治理是当前行业发展重要趋势。本发明基于新时代发展背景,结合当前的规划需求与技术发展的支撑,重点研究多源数据支撑的城市空间高质量利用评价思路,并搭建基于机器学习的城市空间高质量利用测度方法与应用框架对于精细识别空间高质量利用特征、精确定位空间高质量利用问题、精准突破空间高质量利用瓶颈有着重要意义,对新时期高质量发展与高水平治理极为重要。
大数据相较于传统数据具有海量性、持续性等特点,相较于传统数据在描述人地关系和发现空间问题上具有一定优势,数据更加全面、科学、客观,在城市空间质量评价中已有一些实践,应用于城镇体系与区域联系、城市空间结构与功能分区、公共服务设施布局等方面,但当前对整合多源数据,建立数据集,通过机器学习进行国土空间高质量利用评价的方法思路研究较少。
现有技术存在的问题及缺陷为:
(1)数据收集与融合的问题。当前对整合大数据,建立数据集,由于识别三生空间利用情况所需的数据繁多冗杂,导致数据收集及整理提取方法效率低,耗费时间长,且各类数据之间标准不一、维度不同,导致数据融合难度角度,空间问题识别过程繁多、效率低,且一些权重确定方法如特尔菲方法、AHP软件分析存在精度较低、客观性不足等问题。
(2)评价方法的科学性与智能化程度较低。一方面,目前主流的评价方法主要基于传统空间分析方法,过程中模型的自我调节能力较差,且分析过程容易受人为因素干扰,影响了结果的客观性、科学性和精准性;另一方面,当前通过机器学习进行国土空间高质量利用评价的方法思路研究较少,本发明可为行业创新提供一种新的方法。
发明内容
针对现有技术存在的问题,本发明的目的是提供一种城市空间高质量利用测定方法、系统、计算机设备及终端,尤其涉及一种基于机器学习的城市空间高质量利用测定方法、系统、计算机设备及终端。
本发明是这样实现的,一种城市空间高质量利用智能化测定方法,所述城市空间高质量利用测定方法包括:
在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
进一步,所述城市空间高质量利用测定方法包括以下步骤:
步骤一,多源异构融合数据集:进行城市空间高质量评价数据集的构建及数据预处理;
步骤二,评估模型训练:利用机器学习训练城市空间高质量量化模型;
步骤三,智能化评价:利用融合分析技术进行城市空间高质量利用分析。
进一步,所述步骤一中的多源异构融合数据集的构建包括:
构建基于深度学习的多源异构数据融合方法,实现多源异构数据间的融合;基于“特征变换-非线性操作-特征选择”的多层迭代模型,基于地理信息系统的栅格数据模型与矢量数据模型,实现文本数据、矢量数据与影像数据的融合。
进一步,所述步骤二中,利用机器学习方法进行评价模型训练包括:
(1)因子选取:根据测定目标设定及已有标准、规范、研究成果及需要选取评价因子,并构建评价指标体系;
(2)自助采样:利用自助采样法对原始数据集进行随机采样,从总训练样本D中用Bootstrap采样选取k个子训练样本集D1,D2,...,Dk,并预建k棵分类树;
(3)决策树生成:针对K个训练数据集,随机选择划分属性集合,递归节点划分,训练形成K棵不同基决策树;
1)利用Bagging方法获取训练集:从具有N个样本的总训练集中有放回地随机抽取n个组成单棵树的训练集,所述训练集是输入训练集S1;
2)随机选取节点效用指标:设RF模型共有M个效用指标,指定正整数m(m<<M)),Breiman推荐m取M的平方根;随机从M个指标中选取m个作为节点指标;
3)节点递归分割:对于每一节点效用指标都要遍历所有可能的分割方法,选择最小的基尼值Gini作为此节点的分割标准,对应的效用指标为最优分割效用指标,按最优分割效用指标进行分割;对于节点2,数据集S2被最优效用分割指标的一阈值t2分为两个子数据集1和S3;其中子集1节点的基尼指数Gini通过设定阈值判断,认为所有样板所属同一类别,所述类别为效用级别1,不用继续分割,而数据集S3则继续分割;节点基尼指数用于描述节点的不纯度,计算见下式:
式中,p(j|t)为效用等级j在t节点处的概率,Gini(t)为0时,表示在t节点处的样本数据为同一效用级别;Gini(t)越大,表明在t节点处的样本数据越趋于平均分布,能获得有用信息越小;
4)任意生长,不进行剪枝;
(4)模型泛化误差与效用指标重要性计算
RF采用Bagging算法集成训练集,样本容量为N的总训练集D中每个样本未被抽取的概率为(1-1/N)N,当N足够大时,表明D中1/3的样本不会出现在Bootstrap采样子集中,数据成为袋外OOB数据;在效用分类树生成后,利用OOB数据得出该棵树的错误分类率,所述错误分类率是OOB误差;对森林中所有树的OOB误差取平均作为模型的泛化误差;
RF对效用指标的重要性进行计算的方法包括以下两种:
1)对每棵树,计算OOB误差EOOB1,对效用指标i的数据加入噪声并计算OOB误差EOOB2;将EOOB1与EOOB2的差对所有树取平均,并用标准差归一化,得到效用指标i的重要性;
2)计算效用指标i在节点分割时基尼指数的减少值DGi;将森林中所有节点的DGi求和后对所有树取平均,得到效用指标i的重要性;
采用第二种方法对效用指标进行重要性评判,并以指标平均基尼减小值占所有指标平均基尼减少值总和的百分比度量指标的重要程度,按下式计算:
式中,m、n、t分别是总指标个数、分类树棵树和单棵树的节点数;DGkij为第k个指标在第i棵树的第j个节点的基尼指数减少值;Pk为第k个指标在所有指标中的重要程度。
所述步骤三中智能评价包括结果输出、可视化表达及智能辅助决策,具体包括:
(1)结果输出:利用城市空间高质量量化模型获取城市空间高质量量化结果;
1)城市空间评价结果加权指数
通过各指标的加权和计算综合得分,式中g是生产空间、生活空间或生态空间分值,Wj为权重,Yij为评价指标标准化值,公式为:
综合得分Y是将各项得分进行加权相加,公式为:
Y=aY1+bY2+cY3;
式中,Y为空间质量评价综合得分,a、b、c分别为生产空间、生活空间、生态空间的权重,由所属各评价指标之和得出;Y1、Y2、Y3分别为对应的评价质量综合分值,输出评价结果;
2)对城市空间利用质量结果进行耦合协调度评价
采用三生空间耦合度模型分析生产空间、生活空间和生态空间之间的协同关系:
式中,V1、V2、V3分别为生产空间、生活空间和生态空间利用质量分值;
引入耦合协调度模型:
式中,C为耦合度,D为耦合协调度,T为空间综合利用质量评价分值,α、β、λ为三生空间对应权重,并对耦合协调度进行等级划分;
(2)可视化展示:利用系统平台的展示模块,对评价结果进行展示输出;
(3)辅助决策:利用可视化平台辅助空间规划决策、分析城市空间高质量发展信息。
进一步,所述城市空间高质量利用测定方法还包括:
通过对国土空间规划新趋势的解读,明确不同趋势对应的国土空间高质量利用内涵,对生活空间、生产空间和生态空间的定义进行界定,归纳新趋势下不同国土空间高质量利用内涵在各类空间中应达到的高质量利用目标,总结评价维度、细化评价指标,形成国土空间高质量利用的总体评价框架与技术路线。
本发明的另一目的在于提供一种实施所述的城市空间高质量利用测定方法的城市空间高质量利用测定系统,所述城市空间高质量利用测定系统包括:
数据集制作模块,用于进行城市空间高质量利用评价数据集的构建;
评价模型训练模块,利用机器学习训练城市空间高质量量化模型;
空间利用评价模块,用于利用融合分析技术进行城市空间高质量利用分析。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
本发明的另一目的在于提供一种信息数据处理终端,所述信息数据处理终端用于实现所述的城市空间高质量利用测定系统。
结合上述的所有技术方案,本发明所具备的优点及有益效果为:
本发明将机器学习与城市空间高质量发展评价相结合,充分发挥机器学习自我学习的优势,解决目前研究人员评价城市空间高质量发展的路径问题,为辅助编制科学的国土空间规划提供支撑。
伴随着智慧社会的崛起和大数据与人工智能等新技术的快速发展,将智能技术和智慧思维运用于城市空间治理中,提升资源的利用效率、优化空间治理及辅助决策支撑。本发明通过城市空间数据、经济社会数据、城市运行数据和人群行为数据多源数据融合,制作城市空间高质量利用评价数据集,并实现数据集的实时更新与整理;构建系统的城市空间高质量评价体系,并在此基础上构建空间高质量利用模型,通过机器学习进行训练、融合分析得出结果。由此得到合理充分的多源数据,且该模型可以根据研究区域实际情况及规划要求因地制宜适当修改,大大提高国土空间高质量利用识别、评价效率及准确度。
本发明提供了的一种基于多源数据融合与机器学习方法的城市空间高质量利用测定方法,通过挖掘生态文明、新型城镇化、高质量发展的时代背景与发展内涵,对以“以人民为中心”发展理念,聚焦城市空间(分为“三生”空间,即生活空间、生产空间、生态空间),并构建完善的评价指标体系,引入机器学习方法,搭建智能化测度、可视化及辅助决策平台,为新时期城市空间治理提供技术支撑。该方法、模型及平台已经过了长期的实践检验与探索,主要情况如下:
突破传统方法,推进大数据、云计算、人工智能等先进技术在城市规划领域应用,为城市规划工作提供新的技术手段。(1)服务项目优化。2016年成功将大数据分析运用于长沙万科魅力之城项目后期方案设计优化研究项目,项目获得2017年湖南省地理信息产业优秀应用工程奖;(2)探索手机数据的应用。2016年,启动并完成基于大数据的长沙市宜居社区评价工作,形成了一套基于多源数据的宜居社区评估、诊断方法;2017年,启动了长沙手机数据库及规划决策支持平台的研究、开发与建设的课题研究工作,通过搭建核心数据库,并研究城市空间规划决策模型、城市交通规划决策模型、城市治理决策模型及城市人口动态监测模型等,为城市的人口、交通、服务设施等相关问题提供翔实数据和可靠结论。(3)支撑长沙国家中心城市论证。以长沙建设国家中心城市为例,通过多源数据分析长沙与中部武汉、郑州、南昌等城市、长沙城市群与其他城市群的差异与优势,并在此基础上提出长沙建设国家中心城市的应对建议;(4)支撑长沙市轨道网络交通优化。以空间句法、复杂网络理论、大数据挖掘等多个方法构建评价模型,对长沙市轨道线网规划方案进行评估与优化,为轨道线网规划的优中选优奠定了定量决策基础;(5)支撑长沙市交通网络优化。利用出租车GPS数据分析了长沙城市路网活力特征,为长沙路网活力优化决策提供依据;(6)支撑长沙市朝九晚五政策评估。基于百度拥堵数据分析了长沙实施“朝九晚五”政策对长沙交通拥堵的影响,分析了主要拥堵节点,辅助城市交通优化措施;(7)支撑国家新区发展状况评估。利用多源数据评估湖南湘江新区规划实施,是大数据在规划实施评估中的重要探索。通过大数据评估规划实施可以深度挖掘湘江新区城市发展背后隐藏的深层原因,为湘江新区下一步的良性发展提供指导依据;(8)支撑景区问题评估。利用微博语义分析等新技术探索橘子洲公园游客的行为规划与喜好,发现了橘子洲景区运营过程中存在的若干不足,相关结论与建议可以辅助景区提质改造。(9)支撑长沙市“十五分钟生活圈”评估及项目智能化工作。通过综合过空间数据、城市运行数据及互联网数据,科学划定生活圈,并量化分析出2018/2019年两年行动计划方案,将规划项目科学落地;(10)支撑长沙市“全龄友好”城市建设工作。2021年,团队结合长沙市儿童友好创建、老龄社区建设等系统性工作,构建了更加精细化的评价模型,并将全国优秀案例引入,对长沙市“全龄友好”社区的建设状况进行综合评价,为政府决策提出科学建议。(11)支撑长沙“健康社区”评估、体检及城市更新工作。结合平台建设,对城市空间高质量利用状况进行评估,并有针对性的评价社区健康状况,对城市进行智能化体检,支撑新时期城市更新量化决策。
本发明基于以上工作实践及研究成果,通过明确研究目标,经整合后形成了基于机器学习的城市空间高质量利用测度的总体框架(见图3)。
本发明的目的是提供一种基于机器学习的城市空间高质量利用测定方法,将机器学习与城市空间高质量发展评价相结合,充分发挥机器学习自我学习的优势,对机器学习如何助力国土空间高质量评价进行探索,解决目前研究人员评价城市空间高质量发展的路径问题,为辅助编制科学的国土空间规划提供支撑。本发明通过城市空间数据、经济社会数据、城市运行数据及人群行为数据等来量化城市空间土地利用情况,进行城市空间数据集制作,提出一个比较系统的城市空间高质量评价标准,发挥机器学习自我学习的优势,进行城市空间高质量自动化分析。
大数据相较于传统数据具有海量性、持续性等特点,相较于传统数据在描述人地关系和发现空间问题上具有一定优势,数据更加全面、科学、客观,在城市空间质量评价中已有一些实践,应用于城镇体系与区域联系、城市空间结构与功能分区、公共服务设施布局等方面,但当前对整合大数据,建立数据集,通过机器学习进行国土空间高质量利用评价的方法思路研究较少。本发明为高质量城市空间利用分析提供了新的途径,将机器学习与城市空间利用质量属性相结合,从大数据出发,在考虑人类活动对国土空间利用的动态影响方面,建立适当的国土空间高质量评价标准,通过机器学习的自我学习优势,快速准确地提取空间特征,避免了人工提取特征的局限性,更加科学、客观,提高了空间分析与决策的工作效率。为国土空间高质量评价提供一条新的路径。比以往的熵值法、最大值法、极对分析方法等传统评价方法更加全面、科学的评价国土空间高质量发展状况。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的城市空间高质量利用测定方法流程图;
图2是本发明实施例提供的城市空间高质量利用测定方法原理图;
图3是本发明实施例提供的国土空间高质量利用评价框架示意图;
图4是本发明实施例提供的随机森林算法示意图;
图5是本发明实施例提供的分类树构建过程示意图;
图6是本发明实施例提供的单棵效用分类树示意图;
图7是本发明实施例提供的基于随机森林(RF)模型的再配置效用评价流程图;
图8是本发明实施例提供的数据采集与流处理技术框架示意图;
图9是本发明实施例提供的人口分布数据与建筑物数据的数据融合示例图;
图10是本发明实施例提供的时空棱柱模型示意图;
图11是本发明实施例提供的时空轨迹的数据插补示意图;
图12是本发明实施例提供的基于深度学习的异构数据融合技术路线图;
图13是本发明实施例提供的数据模型设计图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种城市空间高质量利用测定方法、系统、计算机设备及终端,下面结合附图对本发明作详细的描述。
本发明实施例提供的城市空间高质量利用测定方法包括以下步骤:
S101,数据集制作:进行城市空间高质量利用评价数据集的构建;
S102,模型训练:利用机器学习训练城市空间高质量量化模型;
S103,利用融合分析技术进行城市空间高质量利用分析。
本发明实施例提供的城市空间高质量利用测定系统包括:
数据集制作1,用于进行城市空间高质量利用评价数据集的构建;
模型训练2,利用机器学习训练城市空间高质量量化模型;
空间利用评价3,用于利用融合分析技术分析城市空间的高质量利用。
下面结合具体实施例对本发明的技术方案作进一步描述。
实施例1
如图1所示,本发明实施例提供的城市空间高质量利用测定方法包括以下步骤:
(1)利用城市空间数据、经济社会数据、城市运行数据及人群行为数据等多源异构数据的基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;
(2)构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;
(3)自动输出城市空间高质量评价结果,对结果进行自动分析,并提供智能化可视化结果及辅助决策。
该方法主要包括以下步骤:
步骤一,多源异构融合数据集:进行城市空间高质量评价数据集的构建及数据预处理;
步骤二,评估模型训练:利用机器学习训练城市空间高质量量化模型;
步骤三,智能化评价:利用融合分析技术进行城市空间高质量利用分析。
优选地,步骤一中城市空间质量评价数据集的构建包括:
本发明研究了一种基于深度学习的多源异构数据融合方法,以实现多源异构数据之间的融合。基于“特征变换-非线性操作-特征选择(约简)”的多层迭代模型,基于地理信息系统(GIS)常用的栅格数据模型与矢量数据模型,实现了文本数据、矢量数据与影像数据的融合。
优选地,步骤二中的模型训练包括:
(1)因子选取。根据测定目标设定及已有标准、规范、研究成果及需要选取评价因子,并构建评价指标体系(见表1)。
表1评价指标体系
(2)自助采样。利用自助采样法(Bootstrap sampling)对原始数据集进行随机采样,从总训练样本D中用Bootstrap采样选取k个子训练样本集D1,D2,…,Dk,并预建k棵分类树。随机森林算法示意图如图4所示。
(3)决策树生成。针对K个训练数据集,随机选择划分属性集合,递归节点划分,训练形成K棵不同基决策树,图5为单棵分类树的生长过程;
i、利用Bagging方法获取训练集。从具有N个样本的总训练集中有放回地随机抽取n个组成单棵树的训练集,即输入训练集S1。
ii、随机选取节点效用指标。设RF模型共有M个效用指标,指定一正整数m(m<<M),Breiman推荐m取M的平方根;随机地从这M个指标中选取m个作为节点指标。
iii、节点递归分割。首先对于每一节点效用指标都要遍历所有可能的分割方法,选择最小的基尼值Gini作为此节点的分割标准,对应的效用指标为最优分割效用指标;然后按最优分割效用指标进行分割。如图6所示的节点2,数据集S2被最优效用分割指标的一阈值t2分为两个子数据集1和S3;其中子集1节点的基尼指数Gini已经很小(通过设定阈值判断),可认为所有样板所属同一类别,即效用级别1,不用继续分割;而数据集S3则继续分割。节点基尼指数描述了节点的不纯度,计算见下式:
式中:p(j|t)为效用等级j在t节点处的概率,Gini(t)为0时,表示在t节点处的样本数据为同一效用级别;Gini(t)越大,表明在t节点处的样本数据越趋于平均分布,能获得有用信息越小。
iv、任意生长,不进行剪枝。
(4)模型泛化误差与效用指标重要性计算;
RF采用Bagging算法集成训练集,样本容量为N的总训练集D中每个样本未被抽取的概率为(1-1/N)N,当N足够大时,这表明D中约1/3的样本不会出现在Bootstrap采样子集中,该部分数据成为袋外(out-of-bag,OOB)数据。在效用分类树生成后,利用OOB数据得出该棵树的错误分类率,即OOB误差。对森林中所有树的OOB误差取平均作为模型的泛化误差。模型OOB误差具有无偏性,并且其计算比交叉验证更高效,无需测试集。
RF对效用指标的重要性进行计算的方法主要有以下两种:
i、对每棵树,首先计算其OOB误差(EOOB1);然后对效用指标i的数据加入噪声并计算OOB误差(EOOB2);最后,把EOOB1与EOOB2的差对所有树取平均,并用标准差归一化,即为效用指标i的重要性。
ii、计算效用指标i在节点分割时基尼指数的减少值DGi;把森林中所有节点的DGi求和后对所有树取平均,即为效用指标i的重要性。
采用上述第二种方法对效用指标进行重要性评判,并以指标平均基尼减小值占所有指标平均基尼减少值总和的百分比度量指标的重要程度,可按下式(3)计算:
式中:m、n、t分别是总指标个数、分类树棵树和单棵树的节点数;DGkij为第k个指标在第i棵树的第j个节点的基尼指数减少值;Pk为第k个指标在所有指标中的重要程度。
基于随机森林(RF)模型的再配置效用评价流程图如图7所示。
优选的,步骤三中城市空间高质量评价数据集的构建包括:
(1)结果输出。利用城市空间高质量量化模型获取城市空间高质量量化结果;
i、城市空间(三生空间)评价结果加权指数
通过各指标的加权和计算综合得分。式中g是生产空间、生活空间或生态空间分值。Wj为权重,Yij为评价指标标准化值。其公式为:
综合得分Y是将各项得分进行加权相加,公式为:
Y=aY1+bY2+cY3
式中:Y为空间质量评价综合得分,a、b、c分别为生产空间、生活空间、生态空间的权重(由所属各评价指标之和得出),Y1、Y2、Y3分别为对应的评价质量综合分值,输出评价结果。
ⅱ、对城市空间利用质量(三生空间)结果进行耦合协调度评价。
为了分析生产空间、生活空间和生态空间之间的协同关系,采用三生空间耦合度模型:
其中,V1、V2、V3分别为生产空间、生活空间、生态空间利用质量分值。
由于耦合度只能显示交互程度的强弱,不能反映三生空间利用质量协调发展的水平。引入耦合协调度模型。
其中,C为耦合度;D为耦合协调度;T为空间综合利用质量评价分值,α、β、λ为三生空间对应权重。为了更好地体现生产、生活、生态空间三者间的协调程度,对耦合协调度进行了等级划分。
(2)可视化展示。利用系统平台的展示模块,对评价结果进行展示输出;
(3)辅助决策。利用可视化平台辅助空间规划决策、分析城市空间高质量发展信息,为政府决策做支撑。
优选的,城市空间高质量利用测定方法还包括:
通过对国土空间规划新趋势的解读,明确不同趋势对应的国土空间高质量利用内涵,对生活空间、生产空间和生态空间的定义进行界定,归纳新趋势下不同国土空间高质量利用内涵在各类空间中应达到的高质量利用目标,并总结评价维度,形成国土空间高质量利用的总体评价框架。
国土空间高质量利用的总体评价框架基于国土空间规划生态化、人本化、集约化新趋势,对于生态空间、生活空间及生产空间制定国土空间高质量目标,并构建空间评价维度;基于智慧化手段,对国土空间进行评价维度量化及数据分析。
实施例2
本发明通过对国土空间规划新趋势的解读,明确不同趋势对应的国土空间高质量利用内涵,在此基础上,对三类空间:生活空间、生产空间、生态空间的定义进行界定,归纳新趋势下不同国土空间高质量利用内涵在各类空间中应达到的高质量利用目标,并总结其评价维度,形成国土空间高质量利用的总体评价框架,如图3所示。
本发明提供了一种基于机器学习的城市空间高质量利用测定方法,将机器学习与城市空间高质量发展评价相结合,充分发挥机器学习自我学习的优势,对机器学习如何助力国土空间高质量评价进行探索,解决目前研究人员评价城市空间高质量发展的路径问题,为辅助编制科学的国土空间规划提供支撑。
如图2所示,本发明通过城市空间数据、经济社会数据、城市运行数据及人群行为数据等来量化城市空间土地利用情况,进行城市空间数据集制作,提出一个比较系统的城市空间高质量评价标准,发挥机器学习自我学习的优势,进行城市空间高质量自动化分析。
大数据相较于传统数据具有海量性、持续性等特点,相较于传统数据在描述人地关系和发现空间问题上具有一定优势,数据更加全面、科学、客观,在城市空间质量评价中已有一些实践,应用于城镇体系与区域联系、城市空间结构与功能分区、公共服务设施布局等方面,但当前对整合大数据,建立数据集,通过机器学习进行国土空间高质量利用评价的方法思路研究较少。本发明为高质量城市空间利用分析提供了新的途径,将机器学习与城市空间高质量领用属性相结合,从大数据出发,在考虑人类活动对国土空间利用的动态影响方面,建立适当的国土空间高质量评价标准,通过机器学习的自我学习优势,快速准确地提取空间特征,避免了人工提取特征的局限性,更加科学、客观,提高了工作效率,为城市空间高质量利用评价提供一条新的路径。比传统熵值法、最大值法、极对分析方法等方法更加全面、科学的评价国土空间高质量发展状况。
实施例3
城市空间高质量利用评价系统以利用评价支撑为主攻方向构建了城市时空大数据集成平台。该平台建成的主要功能模块包括数据治理模块、模型训练模块、评价结果模块三大主体功能模块。
(1)基于人、地、物、网的数据集模块。
数据是实现空间高质量治理的的重要基础。智能技术的发展为感知、解译、汇交与居民活动和城市空间要素有关的各类数据提供了支持,借助于传感器、智能终端等感知设备,对多源感知数据进行采集,同时集成各类自然资源、基础地理信息、居民行为活动等时空间异构数据,形成“人-空间-社会”关系基础数据集,并保障基础数据在信息平台上的互联互通,实现数据的共建共享和协同支持,作为建模评价分析的基础。
数据实时采集及与流处理关键技术攻关。利用湖南师范大学地理时空大数据实验室搭建的大数据分布式计算平台和高性能服务器集群的运行计算能力,构建了数据实时采集与流处理的技术框架,在该框架的基础上,对数据的实时采集及流式处理进行了技术攻关,重点实现了数据采集的时效性和不间断、数据清洗及去噪的多并发运行、数据传输的实效可靠、数据存储的高效高容,保证了数据建模与挖掘有较高的数据质量作支撑。实现了如实时交通数据、实时人口分布热力数据等城市地理时空数据的采集与流处理,为数据分析和挖掘奠定了可靠的数据基础。
数据采集与流处理技术框架如图8所示。
多源数据融合关键技术攻关。开展了数据融合方面的技术攻关,重点研究了不同空间尺度的数据融合、不同时间尺度的数据融合、不同数据类型的数据融合等相关技术的攻关。对于不同空间尺度的数据,通过构建空间单元的层级关系,从而映射数据在该空间层级之间的内在联系,以实现数据的融合。以街道级别的人口与社区级别的建筑物数据的融合及匹配为例,首先构建社区级别的建筑物与街道的层级对应及比例关系,在此基础上,通过该层级关系及比例关系,进行街道人口的社区级别分配,通过校准验证,最后可实现街道级别人口与社区级别建筑之间的匹配。
人口分布数据与建筑物数据的数据融合示例如图9所示。
不同时间尺度的数据融合,通过构建时间序列的相关模型,如时空棱柱、时空立方体模型等实现不同时间尺度的数据融合。以轨迹数据为例,对于不同时间段的轨迹数据,通过构建时间棱柱,实现数据的时序融合,对于时间段有丢失的相关数据,通过对历史规律的数据整理,进行丢失时间段的数据插补和修复,最终实现不同时间尺度的数据融合。
时空棱柱模型示意图如图10所示,时空轨迹的数据插补示意图如图11所示。
本发明研究了一种基于深度学习的多源异构数据融合方法,以实现多源异构数据之间的融合。基于“特征变换-非线性操作-特征选择(约简)”的多层迭代模型,基于地理信息系统(GIS)常用的栅格数据模型与矢量数据模型,实现了文本数据、矢量数据与影像数据的融合。具体来说,首先从一种数据源中提取目标多层特征,构建一种简单的可泛化的深度学习框架。通过对框架中使用到的特征变换、特征选择、特征分类方法进行研究和分析,构建一种有效的深度特征学习模型。为了更好的使用模型学习到的特征,将各层特征组合起来,对模型中所使用到的特征变换方法和分类器方法进行研究,并对模型中使用到的基础算法——特征选择算法进行了深入研究。通过组合特征变换和特征选择算法,实现一个用于提取选择目标高层特征的深度学习模型,以实现文本、矢量数据、影像数据之间的融合和变换。
基于深度学习的异构数据融合技术路线图如图12所示。
在多源数据融合的基础上,搭建了1套“城市空间信息数据库”。通过移动终端、互联网、职能部门等多渠道获取、挖掘、采集包括实时交通、人口热力、人口活动、POI、手机信令、社会宏观经济统计、各部门业务专项、地理信息等在内的多源大数据,融合城市地理信息数据库。
数据集内容及说明。基于多源数据,在标准化的数据框架下,使杂乱无章的多源异构数据有序、有节。制定了数据分类标准,根据数据的来源及格式明确了数据的分类体系、编码体系。统一了数据命名规则,减轻了上层次应用对数据调取的难度,制定了各数据库及文件的命名规则,大大提升数据及文件的查找效率。制定了数据格式与交换的相关标准、数据质量控制标准,规范化数据的形式,制定数据的提交规定和整理标准,从数据源头保障数据来源中第一手资料的可靠性。
多源数据融合的数据库设计。数据库设计上根据统一标准的地理参考坐标,按照数据库-数据子库要素类-要素的层次构筑。空间数据以图层形式存储,属性数据以数据库表的形式存储,二者根据规定好的字段进行关联。针对成果数据类型,分别采用属性数据库和空间数据库对数据进行管理。空间数据以要素类、栅格数据集等格式存于文件地理数据库中,属性数据以.dbf等格式存于关系数据库。由于城市时空地理数据具有属性数据和空间数据的双重特征,设计良好的数据模型来进行组织存储。采用可扩展数据模型对相关数据进行组织存储,对于属性数据,采用传统的关系型数据模型存储于SQLServer数据库中,对于空间数据,通过ArcSDE扩展的空间数据模型存放于SQLServer数据库中。数据模型设计如图13所示。
同时,系统可实现对城市空间中的要素进行全方位、全时空的指标监测,使决策者能够实时把握城市空间运行动态,主要包括指标量化、空间分布监测、时序变化监测和异常识别等。该模块基于空间大数据和社会大数据,构建全要素、多维度的数据集。
(2)基于机器学习的城市空间高质量评价模型训练模块。
新技术赋予了空间治理决策新动能。大数据、物联网、云计算和人工智能等新一代信息技术迅猛发展,“智慧”技术日趋成熟,契合新时代空间治理动态化、精细化、系统化、智能化的要求,成为推动我国国土空间规划空间治理智慧化的重要因素。
智能模型训练是空间治理的关键,主要包括基于多源异构数据集,智能构建样本库,基于机器学习方法突破“人-空间-社会”相互耦合关系评价模型,整合与基础设施、公共服务、交通运输、产业发展、社会资源、地理环境等要素有关的方法与技术应用模型,通过信息化建设为智慧城市规划业务开展提供数据指标、特征现象分析等技术支撑,重点评估城市空间高质量利用的状况,识别城市空间发展关键影响因素。
(3)基于“智能分析”和“智能化决策”模块。
目前,应用是本发明的主要目的,其模块基于“智能分析”和“智能化决策”的目标,包括结果输出、可视化展示及辅助决策三部分。其中,结果输出主要是基于模型训练结果,结合待评价对象,智能化输出评价结果;可视化展示则是结合不同应用场景,明确待可视化的样式与结果;辅助决策重在为决策提供便捷的智慧化服务,优化空间治理改善活动,改善“人-空间-社会”耦合关系,通过智能技术植入实体空间,增强空间智慧化能力,实现空间治理决策智能化。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质(例如软盘、硬盘、磁带)、光介质(例如DVD)、或者半导体介质(例如固态硬盘SolidStateDisk(SSD))等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种城市空间高质量利用智能化测定方法,其特征在于,所述城市空间高质量利用测定方法包括:
在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
2.如权利要求1所述的城市空间高质量利用测定方法,其特征在于,所述城市空间高质量利用测定方法包括以下步骤:
步骤一,多源异构融合数据集:进行城市空间高质量评价数据集的构建及数据预处理;
步骤二,评估模型训练:利用机器学习训练城市空间高质量量化模型;
步骤三,智能化评价:利用融合分析技术进行城市空间高质量利用分析。
3.如权利要求2所述的城市空间高质量利用测定方法,其特征在于,所述步骤一中的多源异构融合数据集的构建包括:
构建基于深度学习的多源异构数据融合方法,实现多源异构数据间的融合;基于“特征变换-非线性操作-特征选择”的多层迭代模型,基于地理信息系统的栅格数据模型与矢量数据模型,实现文本数据、矢量数据与影像数据的融合。
4.如权利要求2所述的城市空间高质量利用测定方法,其特征在于,所述步骤二中,利用机器学习方法进行评价模型训练包括:
(1)因子选取:根据测定目标设定及已有标准、规范、研究成果及需要选取评价因子,并构建评价指标体系;
(2)自助采样:利用自助采样法对原始数据集进行随机采样,从总训练样本D中用Bootstrap采样选取k个子训练样本集D1,D2,…,Dk,并预建k棵分类树;
(3)决策树生成:针对K个训练数据集,随机选择划分属性集合,递归节点划分,训练形成K棵不同基决策树;
1)利用Bagging方法获取训练集:从具有N个样本的总训练集中有放回地随机抽取n个组成单棵树的训练集,所述训练集是输入训练集S1;
2)随机选取节点效用指标:设RF模型共有M个效用指标,指定正整数m(m<<M),Breiman推荐m取M的平方根;随机从M个指标中选取m个作为节点指标;
3)节点递归分割:对于每一节点效用指标都要遍历所有可能的分割方法,选择最小的基尼值Gini作为此节点的分割标准,对应的效用指标为最优分割效用指标,按最优分割效用指标进行分割;对于节点2,数据集S2被最优效用分割指标的一阈值t2分为两个子数据集1和S3;其中子集1节点的基尼指数Gini通过设定阈值判断,认为所有样板所属同一类别,所述类别为效用级别1,不用继续分割,而数据集S3则继续分割;节点基尼指数用于描述节点的不纯度,计算见下式:
式中,p(j|t)为效用等级j在t节点处的概率,Gini(t)为0时,表示在t节点处的样本数据为同一效用级别;Gini(t)越大,表明在t节点处的样本数据越趋于平均分布,能获得有用信息越小;
4)任意生长,不进行剪枝;
(4)模型泛化误差与效用指标重要性计算
RF采用Bagging算法集成训练集,样本容量为N的总训练集D中每个样本未被抽取的概率为(1-1/N)N,当N足够大时,表明D中1/3的样本不会出现在Bootstrap采样子集中,数据成为袋外OOB数据;在效用分类树生成后,利用OOB数据得出该棵树的错误分类率,所述错误分类率是OOB误差;对森林中所有树的OOB误差取平均作为模型的泛化误差;
RF对效用指标的重要性进行计算的方法包括以下两种:
1)对每棵树,计算OOB误差EOOB1,对效用指标i的数据加入噪声并计算OOB误差EOOB2;将EOOB1与EOOB2的差对所有树取平均,并用标准差归一化,得到效用指标i的重要性;
2)计算效用指标i在节点分割时基尼指数的减少值DGi;将森林中所有节点的DGi求和后对所有树取平均,得到效用指标i的重要性;
采用第二种方法对效用指标进行重要性评判,并以指标平均基尼减小值占所有指标平均基尼减少值总和的百分比度量指标的重要程度,按下式计算:
式中,m、n、t分别是总指标个数、分类树棵树和单棵树的节点数;DGkij为第k个指标在第i棵树的第j个节点的基尼指数减少值;Pk为第k个指标在所有指标中的重要程度。
5.如权利要求2所述的城市空间高质量利用测定方法,其特征在于,所述步骤三中智能评价包括结果输出、可视化表达及智能辅助决策,具体包括:
(1)结果输出:利用城市空间高质量量化模型获取城市空间高质量量化结果;
1)城市空间评价结果加权指数
通过各指标的加权和计算综合得分,式中g是生产空间、生活空间或生态空间分值,Wj为权重,Yij为评价指标标准化值,公式为:
综合得分Y是将各项得分进行加权相加,公式为:
Y=aY1+bY2+cY3;
式中,Y为空间质量评价综合得分,a、b、c分别为生产空间、生活空间、生态空间的权重,由所属各评价指标之和得出;Y1、Y2、Y3分别为对应的评价质量综合分值,输出评价结果;
2)对城市空间利用质量结果进行耦合协调度评价
采用三生空间耦合度模型分析生产空间、生活空间和生态空间之间的协同关系:
式中,V1、V2、V3分别为生产空间、生活空间和生态空间利用质量分值;
引入耦合协调度模型:
式中,C为耦合度,D为耦合协调度,T为空间综合利用质量评价分值,α、β、λ为三生空间对应权重,并对耦合协调度进行等级划分;
(2)可视化展示:利用系统平台的展示模块,对评价结果进行展示输出;
(3)辅助决策:利用可视化平台辅助空间规划决策、分析城市空间高质量发展信息。
6.如权利要求1所述的城市空间高质量利用测定方法,其特征在于,所述城市空间高质量利用测定方法还包括:
通过对国土空间规划新趋势的解读,明确不同趋势对应的国土空间高质量利用内涵,对生活空间、生产空间和生态空间的定义进行界定,归纳新趋势下不同国土空间高质量利用内涵在各类空间中应达到的高质量利用目标,总结评价维度、细化评价指标,形成国土空间高质量利用的总体评价框架与技术路线。
7.一种实施权利要求1~6任意一项所述的城市空间高质量利用测定方法的城市空间高质量利用测定系统,其特征在于,所述城市空间高质量利用测定系统包括:
数据集制作模块,用于进行城市空间高质量利用评价数据集的构建;
评价模型训练模块,利用机器学习训练城市空间高质量量化模型;
空间利用评价模块,用于利用融合分析技术进行城市空间高质量利用分析。
8.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
在城市空间数据、经济社会数据、城市运行数据及人群行为数据的多源异构数据基础上,利用面向语义的元数据模型,构建基于多源数据的城市空间高质量评价数据集;构建系统的城市空间高质量评价标准及模型,并通过机器学习对模型进行不断训练强化模型适应性;利用机器学习技术,进行城市空间高质量自动化分析,并提供智能化可视化结果及辅助决策。
10.一种信息数据处理终端,其特征在于,所述信息数据处理终端用于实现如权利要求5所述的城市空间高质量利用测定系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210415083.5A CN114819589A (zh) | 2022-04-20 | 2022-04-20 | 城市空间高质量利用测定方法、系统、计算机设备及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210415083.5A CN114819589A (zh) | 2022-04-20 | 2022-04-20 | 城市空间高质量利用测定方法、系统、计算机设备及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114819589A true CN114819589A (zh) | 2022-07-29 |
Family
ID=82505528
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210415083.5A Pending CN114819589A (zh) | 2022-04-20 | 2022-04-20 | 城市空间高质量利用测定方法、系统、计算机设备及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114819589A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115099722A (zh) * | 2022-08-24 | 2022-09-23 | 自然资源部第三航测遥感院 | 基于知识化谱系的国土空间规划指标模型管理与应用方法 |
CN116956133A (zh) * | 2023-07-26 | 2023-10-27 | 中国地震局地质研究所 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
CN117077005A (zh) * | 2023-08-21 | 2023-11-17 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
-
2022
- 2022-04-20 CN CN202210415083.5A patent/CN114819589A/zh active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115099722A (zh) * | 2022-08-24 | 2022-09-23 | 自然资源部第三航测遥感院 | 基于知识化谱系的国土空间规划指标模型管理与应用方法 |
CN116956133A (zh) * | 2023-07-26 | 2023-10-27 | 中国地震局地质研究所 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
CN116956133B (zh) * | 2023-07-26 | 2024-02-27 | 中国地震局地质研究所 | 基于时序手机信令数据和机器学习的建筑功能识别方法 |
CN117077005A (zh) * | 2023-08-21 | 2023-11-17 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
CN117077005B (zh) * | 2023-08-21 | 2024-05-10 | 广东国地规划科技股份有限公司 | 一种城市微更新潜力的优化方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108710625B (zh) | 一种专题知识自动挖掘系统及方法 | |
Ma et al. | Analyzing driving factors of land values in urban scale based on big data and non-linear machine learning techniques | |
Hao et al. | The rise of big data on urban studies and planning practices in China: Review and open research issues | |
Xia et al. | The varying relationships between multidimensional urban form and urban vitality in Chinese megacities: Insights from a comparative analysis | |
CN114819589A (zh) | 城市空间高质量利用测定方法、系统、计算机设备及终端 | |
CN109636150A (zh) | 一种智慧城市“多规合一”评价体系的建立方法及其系统 | |
Tian et al. | Suburban identification based on multi-source data and landscape analysis of its construction land: A case study of Jiangsu Province, China | |
Rousi et al. | Semantically enriched crop type classification and linked earth observation data to support the common agricultural policy monitoring | |
Xia et al. | Exploring the effects of partitioned transition rules upon urban growth simulation in a megacity region: A comparative study of cellular automata-based models in the Greater Wuhan Area | |
Zeng et al. | A deep neural network-based decision support system for intelligent geospatial data analysis in intelligent agriculture system | |
CN108416524A (zh) | 基于一张图通用框架的产业规划精细化解读方法 | |
Wu et al. | Research themes of geographical information science during 1991–2020: a retrospective bibliometric analysis | |
Xu et al. | Exploring the spatial pattern of urban block development based on POI analysis: A case study in Wuhan, China | |
Hu et al. | A framework to detect and understand thematic places of a city using geospatial data | |
Zheng et al. | Understanding the city-transport system of urban agglomeration through improved space syntax analysis | |
Yu et al. | A heuristic approach to the generalization of complex building groups in urban villages | |
Tan et al. | Identifying urban agglomerations in China based on density–density correlation functions | |
Chen et al. | Intelligent management information system of urban planning based on GIS | |
CN114529154A (zh) | 人口规模预测指标体系的构建方法、预测方法、装置及系统 | |
Wang et al. | China’s poverty assessment and analysis under the framework of the UN SDGs based on multisource remote sensing data | |
Zhao et al. | Application of smart city construction in a new data environment | |
He et al. | Does partition matter? A new approach to modeling land use change | |
Yan et al. | Identification of secondary functional areas and functional structure analysis based on multisource geographic data | |
Liu et al. | An analysis on the spatiotemporal behavior of inbound tourists in Jiaodong Peninsula based on Flickr geotagged photos | |
Wang et al. | Identification of Urban Functional Areas and Urban Spatial Structure Analysis by Fusing Multi-Source Data Features: A Case Study of Zhengzhou, China |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |