CN112148821B - 一种城市混合职住空间计算方法和系统 - Google Patents

一种城市混合职住空间计算方法和系统 Download PDF

Info

Publication number
CN112148821B
CN112148821B CN202010860877.3A CN202010860877A CN112148821B CN 112148821 B CN112148821 B CN 112148821B CN 202010860877 A CN202010860877 A CN 202010860877A CN 112148821 B CN112148821 B CN 112148821B
Authority
CN
China
Prior art keywords
job
information point
spatial relationship
data
random forest
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010860877.3A
Other languages
English (en)
Other versions
CN112148821A (zh
Inventor
吕建军
袁泽皓
姚尧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Geosciences
Original Assignee
China University of Geosciences
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Geosciences filed Critical China University of Geosciences
Priority to CN202010860877.3A priority Critical patent/CN112148821B/zh
Publication of CN112148821A publication Critical patent/CN112148821A/zh
Application granted granted Critical
Publication of CN112148821B publication Critical patent/CN112148821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种城市混合职住空间计算方法,其特征在于,包括:根据城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度;将获取的不同类型的地图信息点核密度进行归一化处理,并且计算该地块地图信息点核密度均值;采用随机森林模型,将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系拟合模型;将全域地块数据集代入到训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度。本发明解决了以往传统城市职住空间关系发明效率较低,反映城市职住空间分布细节不明确、无法分析职住混合空间关系等问题。

Description

一种城市混合职住空间计算方法和系统
技术领域
本发明涉及的是职住空间评价技术领域,特别涉及一种城市混合职住空间计算方法和系统。
背景技术
在城市内部空间结构中,就业空间与居住空间(以下简称“职住空间”)是最基本的空间单元,构成了城市土地利用的两大基本要素,满足了城市居民基本的生活、工作需求。二者的空间关系在很大的程度上影响、决定了城市的交通特征、城市的运行效率以及城市的空间结构。因此对城市的职住空间关系的发明,近年来受到了国内外学者的广泛关注,逐渐成为城市地理和城市规划学界的重要课题。
对城市居民职住关系的发明,有助于我们能够进一步认识城市职能转变和空间结构重构过程;认识城市结构与职住关系的联系;从不同的角度对职住关系转变的动力机制进行深刻剖析,找到各大城市职住分离的共同影响因素,为城市建设和发展提供参照,将有助于城市规划者塑造具有经济活力的宜居城市地区提供参考。
在早期发明中,采用统计普查数据集、入户访谈、问卷调查数据的职住空间关系发明的空间分辨率多为人口普查的基本单元,比如城市、行政区、街道。并且统计普查数据集的空间覆盖范围一般广、记录时间长,可做大范围、长时间的变化分析。但数据受制作发布单位影响较大。入户访谈、问卷调查数据多结合统计普查数据集一起分析,问卷发明,可以开展准确深入的分析,更好的了解背后的成因机理。但基于传统数据源的发明不足之处在于,发明的空间尺度较大,因此难以反映城市职住空间分布的细节。发明的精度受限于数据的特性无法进一步的提升。并且数据采集需要耗费大量的人力、物力、财力以及时间。
近年来,随着基于位置的相关服务(LBS)的普及,大量的记录了人的活动轨迹的时空数据集的出现,使得我们能够从更加精细的尺度去描述与理解人的活动以及城市的空间结构。相较于早期的基于调查访谈和普查数据,基于LBS服务数据的城市职住空间布局发明在空间分辨率上有较大提升。目前常用于职住空间关系发明中的LBS数据主要有:城市智能公交数据、出租车轨迹数据、手机移动信令数据以及POIs(信息点)数据。
然而,现有技术中,仍然存在以下缺点:(1)基本空间单元仍然不够细腻。现有的职住空间发明大多是基于TAZ或类似尺度的空间单位,如1km空间分辨率或更为粗糙的像元栅格。在城市土地利用、功能区识别发明早已达到地块或建筑物尺度及城市规划日益精细化的今天,现有的职住空间关系发明的空间分辨率仍然不够精细,不能很好的反映城市的职住空间分布。发明的空间分辨率还需要进一步的提升。(2)没有反映城市真实职住空间分布。发明表明城市最基本的发明单元(街道、地块)中存在土地利用混合的情况,这进一步导致了,在基本发明单元中存在的居住空间与工作空间混合的情况出现。而现有的发明往往难以反映这种基本发明单元中所存在的职住空间混合的状况。(3)POI数据已被广泛应用于提取城市土地利用类型与功能区。虽然有发明表明工作类POI与区域的工作人口数量存在密切的相关性。但对不同类别POI与城市职住空间分布关系的发明仍然很少。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种城市混合职住空间计算方法和系统。
一种城市混合职住空间计算方法,包括:
S100.根据城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度;
S200.将获取的不同类型的地图信息点核密度进行归一化处理,并且计算该地块地图信息点核密度均值;
S300.采用随机森林模型,将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系拟合模型;
S400.对基于随机森林算法的职住空间关系拟合模型精度进行评价,当所得模型精度不符合预设阈值时,调整训练策略,将训练数据重新带入训练集,生成新的职住空间关系拟合模型,如此反复,直到所得模型精度符合预设阈值;
S500.将全域地块数据集带入训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度。
进一步地,S100中,计算地图地块核密度方法为:获取城市规划数据,以预设距离的空间栅格分辨率,对城市规划数据进行区域划分,将地图信息点数据融合到进行区域划分的城市规划数据,计算不同类型的地图信息点核密度。
进一步地,S100中,计算地图地块核密度公式为:
Figure BDA0002648063150000031
其中,
Figure BDA0002648063150000032
表示每个地块的信息点核密度值,di,j表示地块中任一空间位置的点到该地块的核心的距离,h表示距离衰减系数,K表示高斯函数。
进一步地,S200中,采用最大最小值归一化的方法进行归一化处理,具体公式为:
Figure BDA0002648063150000033
其中,
Figure BDA0002648063150000034
表示第i个栅格地块的第j类信息点核密度归一化值。
进一步地,S200中,地图信息点核密度均值计算方法为:
Figure BDA0002648063150000035
其中,
Figure BDA0002648063150000036
表示第i个地块的第j类信息点密度;n表示该地块包含的所有栅格数量。
进一步地,S400中,采用Pearson相关系数,拟合优度检验,平均平方根误差和平均绝对误差方法对职住空间关系拟合模型精度进行评价。
进一步地,职住空间模型中职住属性分为3类,分别为:仅在此地居住、仅在此地工作、在此地工作且居住。
进一步地,选取3个随机森林的拟合模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制。
进一步地,计算职住混合熵指数公式为:
Figure BDA0002648063150000041
其中,pi表示第i类职住空间关系属性在该地块职住空间关系属性中的占比;n表示职住空间关系属性的总类数,职住混合熵值越高表明该地块的职住混合程度越高,包含有更高比例的其他职住属性;熵值越低,表明该地块的职住混合程度越低,具有更高比例的单一职住属性。
本发明还公开了一种城市混合职住空间计算系统,包括:数据获取模块、数据处理模块、职住属性分类计算模块、职住空间分类拟合分析模块、精度评价模块、职住空间信息输出模块;
数据获取模块,用于获取城市规划数据和地图信息点数据;
数据处理模块,用于根据获取城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度,并且将获取的不同类型的地图信息点核密度进行归一化处理,计算该地块地图信息点核密度均值;
职住属性分类计算模块,用于将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系分类模型;
职住空间分类拟合分析模块,用于平衡得到的随机森林的分类模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制;
精度评价模块,.用于对基于随机森林算法的职住空间关系拟合模型精度进行评价,当所得模型精度不符合预设阈值时,调整训练策略,重新带入训练集,生成新的职住空间关系拟合模型,如此反复,直到所得模型精度符合预设阈值;
职住空间信息输出模块,用于将全域地块数据集带入训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度,输出职住属性混合结果。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明提出的一种城市混合职住空间计算方法和系统,采用多源融合地理空间数据,并结合机器学习算法,本发明的这种评价分析城市职住空间关系的方式解决了以往传统城市职住空间关系发明效率较低,反映城市职住空间分布细节不明确、无法分析职住混合空间关系等问题。职住混合熵可以很好地揭示城市的空间结构,反映城市空间形态特征,为在精细尺度下描绘城市的真实且复杂的职住空间分布,分析复杂的城市职住空间关系提供了新的思路和方法。同时结合城市规划数据和经济发展情况,可以深入挖掘形成当前城市职住空间关系的原因,为城市规划工作提供数据支持和决策建议,减少不合理规划对于城市职住空间关系的影响,在一定程度上可以有效解决居民交通通勤距离过长而造成的城市交通拥堵、大气环境污染等问题。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例1中,一种城市混合职住空间计算方法流程图;
图2为本发明实施例1中,一种城市混合职住空间计算方法示意图;
图3为本发明实施例2中,一种城市混合职住空间计算系统结构图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中存在的语音合成需要声码器解码和对数据库数据量需求大的问题,本发明实施例提供一种基于神经网络的语音合成方法和系统。
实施例1
一种城市混合职住空间计算方法,如图1,包括:
S100.根据城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度。
具体的,在S100中,计算地图地块核密度方法为:获取城市规划数据,以预设距离的空间栅格分辨率,对城市规划数据进行区域划分,将地图信息点数据融合到进行区域划分的城市规划数据,计算不同类型的地图信息点核密度。所述地图信息点数据可以通过互联网电商公司提取的匿名用户数据集获取,该数据集中,在地块的尺度上给出了仅在此地居住、仅在此地工作、在此地工作且居住的3种不同类型职住空间关系属性的人群占比。
在一些优选实施例中,计算地图地块核密度公式为:
Figure BDA0002648063150000061
其中,
Figure BDA0002648063150000062
表示每个地块的信息点核密度值,di,j表示地块中任一空间位置的点到该地块的核心的距离,h表示距离衰减系数,K表示高斯函数。
S200.将获取的不同类型的地图信息点核密度进行归一化处理,并且计算该地块地图信息点核密度均值。
在一些优选实施例中,采用最大最小值归一化的方法进行归一化处理,具体公式为:
Figure BDA0002648063150000071
其中,
Figure BDA0002648063150000072
表示第i个栅格地块的第j类信息点核密度归一化值。
在一些优选实施例中,地图信息点核密度均值计算方法为:
Figure BDA0002648063150000073
其中,
Figure BDA0002648063150000074
表示第i个地块的第j类信息点密度;n表示该地块包含的所有栅格数量。
S300.采用随机森林模型,将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系拟合模型,
随机森林是由很多决策树构成的,不同决策树之间没有关联。当随机森林进行分类任务时,新的输入样本进入,就让森林中的每一棵决策树分别进行判断和分类,每个决策树会得到一个自己的分类结果,决策树的分类结果中哪一个分类最多,那么随机森林就会把这个结果当做最终的结果。
随机森林的随机性体现在新的数据集不是原始数据集的简单复制,而是通过自身样本的重复而达到样本空间的重构,由于新产生的数据集都是原始数据集的子集,因此各个新的数据集间也存在着差异,从而使产生的森民也存在着一定的差异。并且这种差异也体现在决策树生长过程中的随机性。而这种随机性又是有条件的,可以看作是一种有条件的概率抽样,从而使得到的随机森林不至于过于发散,也不至于趋向局部的最优解。
假如有N个样本,则有放回的随机选择N个样本(每次随机选择一个样本,然后放回继续选择)。这选择好了的N个样本用来训练一个决策树,作为决策树根节点处的样本。当每个样本有M个属性时,在决策树的每个节点需要分裂时,随机从这N个属性中选取出m个属性,满足条件m<<M。然后从这m个属性中基于某种节点分裂策略(比如说本发明中所采用的CART算法)来选择1个属性作为该节点的分裂属性。一直到不能够再分裂为止。通过建立大量的决策树,这样就构成了随机森林了。
随机森林采用类似随机的方法建树,因此异常值对结果的影响将会减弱。最重要的是,随机森林具有变量重要性计算算法,这种算法可以衡量每个变量的重要性,因此随机森林算法具有可解释性。本发明中可用于解释不同类别POI对职住空间关系的影响。由于随机森林方法的众多优点,所以在构建职住空间关系拟合模型时,我们采用随机森林的方法来建立拟合模型,以获得精度更高的职住空间关系拟合模型。
在本实施例中,我们以20m的空间栅格分辨率,在发明区对14类不同类别的POI开展核密度计算。考虑到不同类型POI的数量级不一样,为了放入随机森林进入拟合,在核密度计算后,我们需要开展标准化。在标准化后我们分地块构建训练数据集。训练数据集的X即14类不同种类的POI的核密度,Y则是3类不同的职住属性。
优选的,如图2,本发明包括3个随机森林的拟合模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制。通过在已有职住属性数据的训练集上开展模型的训练,并逐步调整其中的参数,选取精度最高的职住拟合模型。
S400.对基于随机森林算法的职住空间关系拟合模型精度进行评价,当所得模型精度不符合预设阈值时,调整训练策略,将训练数据重新带入训练集,生成新的职住空间关系拟合模型,如此反复,直到所得模型精度符合预设阈值。在一些优选实施例中,可以采用Pearson相关系数,拟合优度检验,平均平方根误差和平均绝对误差方法对职住空间关系拟合模型精度进行评价。可以理解的,在实际精度评价过程中,在精度值不断提高过程中,所需的计算量也逐渐增大,考虑到模型评价精度和计算量大小,因此,在一些优选实施例中,需要预先对精度进行预设阈值。
具体的,Pearson R相关系数通常用于度量两个变量X和Y之间的线性相关程度,其值取值介于-1与1之间。在自然科学领域中,该系数被广泛用于度量两个变量之间的线性相关程度。Pearson R的值为1意味两个变量X和Y可以很好的由直线方程来描述,所有的数据点都很好的落在一条直线上,系数的值为0意味着两个变量之间没有线性关系。本发明中Pearson R相关系数值越接近于1,表示我们的拟合模型预测值与真实值相关性越强。
拟合优度检验(R2),是检验回归结果对样本值的拟合程度,即检验被解释变量与所有解释变量之间的相关程度。检验的方法是构造一个可以表征拟合程度的指标,可以理解为已解释的回归平方和占总平方和的百分比。总平方和是指所有观察值与样本均值之差的平方和,它能反映全部数据之间的差异;残差平方和是总平方和中未能被回归解释的部分,它是由解释变量中所没有包含的一切因素的影响所造成的]。如果R2越接近1,就说明回归的拟合优度越高,解释能力也越强。R2等于1时则表示回归完全拟合了样本观测值。
平均平方根误差(RMSE)则是反映拟合模型得出的预测值与实际值之间的偏差的平方和与样本个数n比值的平方根,用来反映了预测值与实际值之间的偏差情况。平均绝对误差(MAE)则是反映绝对误差的平均值,同样用于衡量预测值与实际值之间的偏差情况。二者的区别在于,相较于MAE,RMSE对异常值更为敏感。在本发明中,RMSE与MAE越小,说明我们的拟合模型效果越好。
此外在随机森林算法中,有一种比较好的估计泛化误差的方式,那就是使用袋外数据经行估计。如前所述,随机森林是使用bagging方法进行训练集的生成的,在生成这些数据集时,初始的训练集中有一些样本是不能被抽取的,这些样本的个数是初始数据集的(1-1/N)N(其中N为初始训练集中样本的个数)。发明证明,当N足够大时,(1-1/N)N将收敛于1/e≈0.368,这个数据说明,对于训练数据即D而言,有将近36.8%的样本不会被抽出来,这些不能从初始数据集中抽取出来的样本组成的集合,称之为袋外数据,简记为OOB。对于随机森林而言,有一个重要的特点就是,精度评价时没有必要对它进行交叉验证或者用一个独立的测试集来获得误差的一个无偏估计。它可以在内部进行评估,也就是说在生成的过程中就可以对误差建立一个无偏估计。
而使用OOB数据来进行随机森林算法的精度评价,称之为OOB估计。在分类任务中,以每一棵决策树为单位,利用未被该森林选中的所有的训练样本点的集合,统计该树的OOB误分率;将所有树的误分率取平均便可得到随机森林的OOB误分率,就可以得到一个OOB误差估计。有大量的发明表明,随机森林算法的精度评价可以通过使用OOB估计方法来完成。OOB估计越小,说明算法的性能越好。发明表明,OOB估计是随机森林的泛化误差的一个无偏估计。使用OOB估计和使用相同样本容量的测试集的精度一样,因此使用OOB估计的话,就没有必要再额外使用测试集。在本发明中,由于我们是回归任务,因此我们使用OOB RMSE以及OOB MAE来进行OOB估计,用于开展随机森林的精度评价。
S500.将全域地块数据集带入训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度。
本实施例使用了一个职住混合熵指数(Entropy Index EI)用于定量的衡量不同地块的职住属性混合程度。这里的熵指数计算公式参考了景观格局指数中的香农多样性指数的计算。景观格局指数中的熵指数来自于信息论中的Shannon信息熵。
在一些优选实施例中,计算职住混合熵指数公式为:
Figure BDA0002648063150000101
公式中pi表示第i类职住空间关系属性在该地块职住空间关系属性中的占比;n表示职住空间关系属性的总类数,在本发明中,我们共分为仅在此地居住、仅在此地工作、在此地工作且居住3类,因此n=3。职住混合熵的取值在[0,1]之间。职住混合熵值越高表明该地块的职住混合程度越高,包含有更高比例的其他职住属性;熵值越低,表明该地块的职住混合程度越低,具有更高比例的单一职住属性。
本实施例提出的一种城市混合职住空间计算方法,采用多源融合地理空间数据,并结合机器学习算法,本发明的这种评价分析城市职住空间关系的方式解决了以往传统城市职住空间关系发明效率较低,反映城市职住空间分布细节不明确、无法分析职住混合空间关系等问题。职住混合熵可以很好地揭示城市的空间结构,反映城市空间形态特征,为在精细尺度下描绘城市的真实且复杂的职住空间分布,分析复杂的城市职住空间关系提供了新的思路和方法。同时结合城市规划数据和经济发展情况,可以深入挖掘形成当前城市职住空间关系的原因,为城市规划工作提供数据支持和决策建议,减少不合理规划对于城市职住空间关系的影响,在一定程度上可以有效解决居民交通通勤距离过长而造成的城市交通拥堵、大气环境污染等问题。
实施例2
一种城市混合职住空间计算系统,如图3,包括:数据获取模块1、数据处理模块2、职住属性分类计算模块3、职住空间分类拟合分析模块4、精度评价模块5、职住空间信息输出模块6;
数据获取模块1,用于获取城市规划数据和地图信息点数据。所述地图信息点数据可以通过互联网电商公司提取的匿名用户数据集获取,该数据集中,在地块的尺度上给出了仅在此地居住、仅在此地工作、在此地工作且居住的3种不同类型职住空间关系属性的人群占比。对城市规划数据进行地块栅格化,优选的,以20m的空间分辨率,计算每个小栅格中心点的核密度值。
数据处理模块2,根据获取城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度,并且将获取的不同类型的地图信息点核密度进行归一化处理,计算该地块地图信息点核密度均值。
具体的,计算地图地块核密度公式为:
Figure BDA0002648063150000121
其中,
Figure BDA0002648063150000122
表示每个地块的信息点核密度值,di,j表示地块中任一空间位置的点到该地块的核心的距离,h表示距离衰减系数,K表示高斯函数。
在一些优选实施例中,采用最大最小值归一化的方法进行归一化处理,具体公式为:
Figure BDA0002648063150000123
其中,
Figure BDA0002648063150000124
表示第i个栅格地块的第j类信息点核密度归一化值。
在一些优选实施例中,地图信息点核密度均值计算方法为:
Figure BDA0002648063150000125
其中,
Figure BDA0002648063150000126
表示第i个地块的第j类信息点密度;n表示该地块包含的所有栅格数量。
职住属性分类计算模块3,用于将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系分类模型;
在本实施例中,我们以20m的空间栅格分辨率,在发明区对14类不同类别的POI开展核密度计算。考虑到不同类型POI的数量级不一样,为了放入随机森林进入拟合,在核密度计算后,我们需要开展标准化。在标准化后我们分地块构建训练数据集。训练数据集的X即14类不同种类的POI的核密度,Y则是3类不同的职住属性。
职住空间分类拟合分析模块4,用于平衡得到的随机森林的分类模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制;
优选的,发明包括有3个随机森林的拟合模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制。通过在已有职住属性数据的训练集上开展模型的训练,并逐步调整其中的参数,选取精度最高的职住拟合模型。
精度评价模块5,.用于对基于随机森林算法的职住空间关系拟合模型精度进行评价,当所得模型精度不符合预设阈值时,调整训练策略,重新带入训练集,生成新的职住空间关系拟合模型,如此反复,直到所得模型精度符合预设阈值;
在一些优选实施例中,采用Pearson相关系数,拟合优度检验,平均平方根误差和平均绝对误差方法对职住空间关系拟合模型精度进行评价。
职住空间信息输出模块6,将全域地块数据集带入训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度,输出职住属性混合结果。
本实施例使用了一个职住混合熵指数(Entropy Index EI)用于定量的衡量不同地块的职住属性混合程度。这里的熵指数计算公式参考了景观格局指数中的香农多样性指数的计算。景观格局指数中的熵指数来自于信息论中的Shannon信息熵
在一些优选实施例中,计算职住混合熵指数公式为:
Figure BDA0002648063150000131
公式中pi表示第i类职住空间关系属性在该地块职住空间关系属性中的占比;n表示职住空间关系属性的总类数,在本发明中,我们共分为仅在此地居住、仅在此地工作、在此地工作且居住3类,因此n=3。职住混合熵的取值在[0,1]之间。职住混合熵值越高表明该地块的职住混合程度越高,包含有更高比例的其他职住属性;熵值越低,表明该地块的职住混合程度越低,具有更高比例的单一职住属性。
本实施例提出的一种城市混合职住空间计算系统,采用多源融合地理空间数据,并结合机器学习算法,本发明的这种评价分析城市职住空间关系的方式解决了以往传统城市职住空间关系发明效率较低,反映城市职住空间分布细节不明确、无法分析职住混合空间关系等问题。职住混合熵可以很好地揭示城市的空间结构,反映城市空间形态特征,为在精细尺度下描绘城市的真实且复杂的职住空间分布,分析复杂的城市职住空间关系提供了新的思路和方法。同时结合城市规划数据和经济发展情况,可以深入挖掘形成当前城市职住空间关系的原因,为城市规划工作提供数据支持和决策建议,减少不合理规划对于城市职住空间关系的影响,在一定程度上可以有效解决居民交通通勤距离过长而造成的城市交通拥堵、大气环境污染等问题。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于发明偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的发明约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。

Claims (3)

1.一种城市混合职住空间计算方法,其特征在于,包括:
S100.根据城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度;S100中,计算地图地块核密度方法为:获取城市规划数据,以预设距离的空间栅格分辨率,对城市规划数据进行区域划分,将地图信息点数据融合到进行区域划分的城市规划数据,计算不同类型的地图信息点核密度;
S200.将获取的不同类型的地图信息点核密度进行归一化处理,并且计算该地块地图信息点核密度均值;S200中,采用最大最小值归一化的方法进行归一化处理,具体公式为:
Figure FDA0003531723740000011
其中,
Figure FDA0003531723740000012
表示第i个栅格地块的第j类信息点核密度归一化值;
S200中,地图信息点核密度均值计算方法为:
Figure FDA0003531723740000013
其中,
Figure FDA0003531723740000014
表示第i个地块的第j类信息点密度;n表示该地块包含的所有栅格数量,
Figure FDA0003531723740000015
表示每个地块的信息点核密度值;
计算地图地块信息点核密度
Figure FDA0003531723740000016
公式为:
Figure FDA0003531723740000017
其中,
Figure FDA0003531723740000018
表示每个地块的信息点核密度值,di,j表示地块中任一空间位置的点到该地块的核心的距离,h表示距离衰减系数,K表示高斯函数;
S300.采用随机森林模型,将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系模型;选取3个随机森林的关系模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制;
S400.对基于随机森林算法的职住空间关系拟合模型精度进行评价,当所得模型精度不符合预设阈值时,调整训练策略,将训练数据重新带入训练集,生成新的职住空间关系拟合模型,如此反复,直到所得模型精度符合预设阈值;
S500.将全域地块数据集带入训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度;计算职住混合熵指数公式为:
Figure FDA0003531723740000021
其中,pi表示第i类职住空间关系属性在该地块职住空间关系属性中的占比;n表示职住空间关系属性的总类数;职住混合熵值越高表明该地块的职住混合程度越高,包含有更高比例的其他职住属性;熵值越低,表明该地块的职住混合程度越低。
2.如权利要求1的一种城市混合职住空间计算方法,其特征在于,S400中,采用Pearson相关系数,拟合优度检验,平均平方根误差和平均绝对误差方法对职住空间关系拟合模型精度进行评价。
3.一种城市混合职住空间计算系统,其特征在于,包括:数据获取模块、数据处理模块、职住属性分类计算模块、职住空间分类拟合分析模块、精度评价模块、职住空间信息输出模块;
数据获取模块,用于获取城市规划数据和地图信息点数据;
数据处理模块,用于根据获取城市规划数据和地图信息点数据,计算不同类型的地图信息点核密度,并且将获取的不同类型的地图信息点核密度进行归一化处理,计算该地块地图信息点核密度均值;
采用最大最小值归一化的方法进行归一化处理,具体公式为:
Figure FDA0003531723740000031
其中,
Figure FDA0003531723740000032
表示第i个栅格地块的第j类信息点核密度归一化值;
地图信息点核密度均值计算方法为:
Figure FDA0003531723740000033
其中,
Figure FDA0003531723740000034
表示第i个地块的第j类信息点密度;n表示该地块包含的所有栅格数量,
Figure FDA0003531723740000035
表示每个地块的信息点核密度值;
计算地图地块信息点核密度
Figure FDA0003531723740000036
公式为:
Figure FDA0003531723740000037
其中,
Figure FDA0003531723740000038
表示每个地块的信息点核密度值,di,j表示地块中任一空间位置的点到该地块的核心的距离,h表示距离衰减系数,K表示高斯函数;
职住属性分类计算模块,用于将计算的核密度均值和对应的职住属性作为随机森林模型训练数据集,对随机森林模型进行训练,得到基于随机森林算法的职住空间关系分类模型;
职住空间分类拟合分析模块,用于平衡得到的随机森林的分类模型,对3类不同的职住空间关系属性开展拟合,并在最后的拟合结果中加入职住属性和为1的限制;
精度评价模块,.用于对基于随机森林算法的职住空间关系拟合模型精度进行评价,当所得模型精度不符合预设阈值时,调整训练策略,重新带入训练集,生成新的职住空间关系拟合模型,如此反复,直到所得模型精度符合预设阈值;
职住空间信息输出模块,用于将全域地块数据集带入训练好的职住空间关系拟合模型,计算职住混合熵指数,根据职住混合熵指数衡量不同地块的职住属性混合程度,输出职住属性混合结果;计算职住混合熵指数公式为:
Figure FDA0003531723740000041
其中,pi表示第i类职住空间关系属性在该地块职住空间关系属性中的占比;n表示职住空间关系属性的总类数;职住混合熵值越高表明该地块的职住混合程度越高,包含有更高比例的其他职住属性;熵值越低,表明该地块的职住混合程度越低。
CN202010860877.3A 2020-08-25 2020-08-25 一种城市混合职住空间计算方法和系统 Active CN112148821B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010860877.3A CN112148821B (zh) 2020-08-25 2020-08-25 一种城市混合职住空间计算方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010860877.3A CN112148821B (zh) 2020-08-25 2020-08-25 一种城市混合职住空间计算方法和系统

Publications (2)

Publication Number Publication Date
CN112148821A CN112148821A (zh) 2020-12-29
CN112148821B true CN112148821B (zh) 2022-05-03

Family

ID=73888318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010860877.3A Active CN112148821B (zh) 2020-08-25 2020-08-25 一种城市混合职住空间计算方法和系统

Country Status (1)

Country Link
CN (1) CN112148821B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117271670B (zh) * 2023-11-22 2024-02-23 苏州市吴江区盛泽镇人民政府 一种基于区块链技术的多事件处置方法及系统
CN117710746A (zh) * 2023-12-22 2024-03-15 中国科学院地理科学与资源研究所 一种融合开放地理数据的多尺度景观功能主体类型识别方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537597A (zh) * 2014-11-25 2015-04-22 中国科学院地理科学与资源研究所 一种城市空间格局合理性诊断的技术方法
CN107291918A (zh) * 2017-06-28 2017-10-24 武汉大学 一种兴趣点poi同位模式的可视化挖掘方法
CN108717676A (zh) * 2018-04-23 2018-10-30 深圳市数字城市工程研究中心 基于多数据融合的不同尺度下的职住空间评价方法及系统
CN110472882A (zh) * 2019-08-21 2019-11-19 河南大学 基于主成分分析的城市开发用地适宜性评价方法
CN111401692A (zh) * 2020-02-24 2020-07-10 中国科学院城市环境研究所 一种度量城市空间功能紧凑度的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105761191A (zh) * 2016-02-02 2016-07-13 东南大学 一种城市动态空间结构圈层界定法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104537597A (zh) * 2014-11-25 2015-04-22 中国科学院地理科学与资源研究所 一种城市空间格局合理性诊断的技术方法
CN107291918A (zh) * 2017-06-28 2017-10-24 武汉大学 一种兴趣点poi同位模式的可视化挖掘方法
CN108717676A (zh) * 2018-04-23 2018-10-30 深圳市数字城市工程研究中心 基于多数据融合的不同尺度下的职住空间评价方法及系统
CN110472882A (zh) * 2019-08-21 2019-11-19 河南大学 基于主成分分析的城市开发用地适宜性评价方法
CN111401692A (zh) * 2020-02-24 2020-07-10 中国科学院城市环境研究所 一种度量城市空间功能紧凑度的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"基于高分遥感影像和POI 的国土空间规划";王艳阳等;《热带地理》;20200731;"基于高分遥感影像和POI 的国土空间规划" *

Also Published As

Publication number Publication date
CN112148821A (zh) 2020-12-29

Similar Documents

Publication Publication Date Title
Pontius et al. Comparing the input, output, and validation maps for several models of land change
Wu et al. Housing submarket classification: The role of spatial contiguity
CN111242493B (zh) 一种街道品质评价方法、装置、系统及存储介质
Pontius Jr et al. GEOMOD modeling
Pijanowski et al. Modelling urbanization patterns in two diverse regions of the world
CN112148821B (zh) 一种城市混合职住空间计算方法和系统
CN110889196B (zh) 基于水质模型的水环境承载力评估方法、装置及存储介质
Díaz-Pacheco et al. The importance of scale in land use models: Experiments in data conversion, data resampling, resolution and neighborhood extent
Xu et al. Simulating multiple urban land use changes by integrating transportation accessibility and a vector-based cellular automata: a case study on city of Toronto
CN111797188B (zh) 一种基于开源地理空间矢量数据的城市功能区定量识别方法
CN113360587B (zh) 一种基于gis技术的土地测绘设备及测绘方法
McCluskey et al. Detecting and validating residential housing submarkets: A geostatistical approach for use in mass appraisal
Caceres et al. Estimating traffic flow profiles according to a relative attractiveness factor
CN114398951A (zh) 一种基于随机森林和众源地理信息的土地利用变化驱动因子挖掘方法
CN112561401A (zh) 一种基于多源大数据的城市活力测度与表征方法及系统
Lindley et al. Inter-comparison of interpolated background nitrogen dioxide concentrations across Greater Manchester, UK
CN111461163B (zh) 城市内部pm2.5浓度模拟和人口暴露度评估方法和装置
Li et al. Identifying urban form typologies in seoul with mixture model based clustering
Nakahira et al. Analyzing the impact of climatic and economic variables on tourism demand fluctuation in Japan
CN116297062B (zh) 一种面向多维时空因子的pm2.5浓度精细化时空模拟与定量分析方法
Mwakalounge et al. Comparison of Alternative Methods for Estimating Household Trip Rates of Cross-Classification Cells with Inadequate Data
Lahoz An analysis of how geographical factors affect real estate prices
CN115130618A (zh) 一种利用多源数据分类和识别城市非通勤出行的方法
CN115952953A (zh) 一种基于gis与poi数据的空气质量空间分布及相关性分析方法
De Falco et al. A new approach for measuring and analysing residential segregation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant