CN110852547B - 一种基于位置数据和聚类算法的公共服务设施分级方法 - Google Patents

一种基于位置数据和聚类算法的公共服务设施分级方法 Download PDF

Info

Publication number
CN110852547B
CN110852547B CN201910763492.2A CN201910763492A CN110852547B CN 110852547 B CN110852547 B CN 110852547B CN 201910763492 A CN201910763492 A CN 201910763492A CN 110852547 B CN110852547 B CN 110852547B
Authority
CN
China
Prior art keywords
facility
public service
area
travel
service facility
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910763492.2A
Other languages
English (en)
Other versions
CN110852547A (zh
Inventor
裘炜毅
罗力宇
李明敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yuanzhuo Information Technology Co ltd
Original Assignee
Shanghai Yuanzhuo Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yuanzhuo Information Technology Co ltd filed Critical Shanghai Yuanzhuo Information Technology Co ltd
Priority to CN201910763492.2A priority Critical patent/CN110852547B/zh
Publication of CN110852547A publication Critical patent/CN110852547A/zh
Application granted granted Critical
Publication of CN110852547B publication Critical patent/CN110852547B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种基于位置数据和聚类算法的公共服务设施分级方法。本发明包含设施核心辐射区面积、总辐射区面积、到访者人均出行距离、到访设施的总人数、设施面积五个维度的指标,前三个指标从不同角度衡量了公共服务设施辐射范围的大小,后两个指标则从客流和设施资源的角度衡量了公共服务设施服务规模的大小。根据实际经验,设施辐射范围越大、客流量越大、人均出行距离越长、设施占地面积越大,则其等级越高。因此基于上述五个维度指标均值之和,可以描述聚类所形成的三簇样本的主要特征,以及簇之间的核心区别,使聚类结果最终和城市公共服务设施等级相对应。

Description

一种基于位置数据和聚类算法的公共服务设施分级方法
技术领域
本发明涉及城市公共服务设施能级评定,具体来说,本发明涉及一种基于位置数据和K均值聚类算法的公共服务设施等级评定方法。
背景技术
城市公共服务中心体系规划在城市公共服务设施供给侧优化和提升中发挥重要作用,层级明确、分工合理的公共服务中心可以促进公共服务资源可有效兼顾效率和公平,增强城市活力,提升居民幸福感。公共服务中心体系是指在一个城市中,由不同等级规模、不同职能类型、不同服务范围的公共服务设施集合构成,联系密切、相互依存的有机整体。一般情况下可划分为市级、片区级及居住区级公共服务中心。而作为公共服务中心的组成要素,各类公共服务设施也需要进行相应的等级规模、职能类型、服务范围的划分。传统的公共服务设施等级划分一般从资源规划的角度出发,通过设施面积等规模指标作为评定标准,划定结果反映的是规划目标,而非实设施际运营水平。而在新数据条件下,采用设施使用者位置数据,可以量化公共服务设施的真实服务范围和真实服务人群的规模。在原设施面积规模指标的基础上,加入设施客流来源地覆盖面积、客流人均OD距离等反映设施辐射范围的指标,以及从设施使用者角度出发反映设施规模的总客流量指标,可对公共服务设施实际服务能力的等级进行划定。所得结果与设施规划的目标等级进行对比,还可进一步评估公共服务设施规划的实施效果。
发明内容
本发明目的是:通过采用设施使用者位置数据,设计一套公共服务设施的真实服务范围和真实服务规模的量化体系,在此基础上通过K均值聚类算法,实现对公共服务设施等级更客观有效的评估和划定。
为了达到上述目的,本发明的技术方案是提供了一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,包括以下步骤:
步骤1、将到访公共服务设施的设施使用者的位置数据导入数据库,在数据库中统计一日之内到访公共服务设施的OD出行数据,包括以下步骤:
步骤101、将位置数据导入数据库,从而获得各设施使用者的出行起点的经纬度坐标、出行起点编号、出行终点的纬度坐标、出行终点编号、出行终点所对应的公共服务设施编号、一日之内从各出行起点达到各出行终点的出行人数,将一日之内从出行起点i达到出行终点j的出行人数定义为pij;
步骤102、计算得到各出行起点与各出行终点之间的出行距离,将从出行起点i到达出行终点j的出行距离定义为qij,则有:
Figure BDA0002171126070000021
式中,(xOi,yOi)为出行起点i的经纬度坐标,(xDi,yDi)为出行终点j的经纬度坐标;
步骤2、对每个公共服务设施,计算其客流来源地的覆盖面积,计算公共服务设施Sk的客流来源地的覆盖面积包括以下步骤:
步骤201、从步骤1所获得的OD出行数据中筛选出具有相同出行起点和公共服务设施编号的数据组成OD出行数据子集,该公共服务设施编号为公共服务设施Sk的编号,获得OD出行数据子集中从相同出行起点达到公共服务设施Sk的总出行人数,将从出行起点i达到公共服务设施Sk的总出行人数定义为Pik;
步骤202、将公共服务设施Sk的所有的出行起点的经纬度坐标及相对应的总出行人数输入GIS,基于GIS的核密度算法生成公共服务设施Sk到访者来源地的核密度栅格;
步骤203、将核密度栅格转为面要素类,面要素类含表示每个面要素的密度值的字段gridcode,并对面要素类新增字段pct和字段Accu,字段pct表示密度值占比,由每个面要素的字段gridcode值除以所有面要素的该字段总和得到,字段Accu表示字段pct的累计值;
步骤204、将公共服务设施Sk每个面要素按照面要素内的到访者人数从高到低排序后,对所有面要素进行遍历,并对字段pct进行累加,赋予字段Accu,将字段Accu≤50%的面要素组成的区域划定为设施核心辐射区,剩余区域划定为边缘辐射区;
2.5、统计各设施核心辐射区面积Ck及总辐射区面积Tk;
步骤3、计算到访每个公共服务设施的到访者总人数,将到访公共服务设施Sk的到访者总人数定义为Pk,则有:
Figure BDA0002171126070000022
式中,n表示出行终点对应公共服务设施Sk的所有出行起点的总个数;
步骤4、计算每个公共服务设施的到访者人均出行距离,将公共服务设施Sk的到访者人均出行距离定义为Qk,则有:
Figure BDA0002171126070000031
式中,{j}表示设施Sk范围中所有的出行终点的集合,{i}表示出行终点为j点的所有出行的出行起点集合;
步骤5、计算各公共服务设施的占地面积,公共服务设施Sk的占地面积定义为Mk;
步骤6、将各个公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积分别进行归一化处理,并整理为csv格式的表table;
步骤7、利用K均值聚类算法,以表table中的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积作为5维向量,对所有公共服务设施进行聚类,统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施。
优选地,步骤6中,对于公共服务设施Sk的核心辐射区面积Ck、总辐射区面积Tk、到访者人均出行距离Qk、到访者总人数Pk、设施面积Mk进行归一化处理的公式为:
Ck'=(Ck-Cmin)/(Cmax-Cmin)
Tk'=(Tk-Tmin)/(Tmax-Tmin)
Qk'=(Qk-Qmin)/(Qmax-Qmin)
Pk'=(Pk-Pmin)/(Pmax-Pmin)
Mk'=(Mk-Mmin)/(Mmax-Mmin)
Cmax、Tmax、Qmax、Pmax及Mmax分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最大值;Cmin、Tmin、Qmin、Pmin、Mmin分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最小值;Ck'、Tk'、Qk'、Pk'、Mk'分别为归一化后的公共服务设施Sk的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积。
优选地,所述步骤7包括以下步骤:
步骤701、使用Python的pandas库将步骤6得到的表table读取为pandas中的DataFrame,命名为df;
步骤702、基于Python的sklearn库cluster下的KMeans算法包,实例化一个n_clusters为3以及其他参数保持缺省的模型对象model;
步骤703、使用model.fit(df)对步骤701所述DataFrame进行聚类,结果赋值给变量model_labels;
步骤704、将model_labels与步骤701中的df拼接,最终得到设施的分类属性列cluster,该列包含0、1、2三个值,分别代表某一级别设施;
步骤705、统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施。
本发明包含设施核心辐射区面积、总辐射区面积、到访者人均出行距离、到访设施的总人数、设施面积五个维度的指标,前三个指标从不同角度衡量了公共服务设施辐射范围的大小,后两个指标则从客流和设施资源的角度衡量了公共服务设施服务规模的大小。根据实际经验,设施辐射范围越大、客流量越大、人均出行距离越长、设施占地面积越大,则其等级越高。因此基于上述五个维度指标均值之和,可以描述聚类所形成的三簇样本的主要特征,以及簇之间的核心区别,使聚类结果最终和城市公共服务设施等级相对应。
附图说明
图1为计算设施客流来源地覆盖面积的流程图;
图2为基于sklearn.cluster下的KMeans对设施进行聚类的流程图。
具体实施方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明所述的公共服务设施包括公园绿地、商圈、大型医院、大型体育设施等。对公共服务设施等级进行评定,是指在某城市范围内,针对上述的其中一类设施进行等级评定。
具体而言,本发明提供的一种基于位置数据和聚类算法的公共服务设施分级方法包括以下步骤:
步骤1、将到访公共服务设施的设施使用者的位置数据导入数据库,在数据库中统计一日之内到访公共服务设施的OD出行数据,包括以下步骤:
步骤101、将位置数据导入数据库,从而获得各设施使用者的出行起点的经纬度坐标、出行起点编号、出行终点的纬度坐标、出行终点编号、出行终点所对应的公共服务设施编号、一日之内从各出行起点达到各出行终点的出行人数,将一日之内从出行起点i达到出行终点j的出行人数定义为pij;
步骤102、计算得到各出行起点与各出行终点之间的出行距离,将从出行起点i到达出行终点j的出行距离定义为qij,则有:
Figure BDA0002171126070000051
式中,(xOi,yOi)为出行起点i的经纬度坐标,(xDi,yDi)为出行终点j的经纬度坐标,R为地球平均半径;
Figure BDA0002171126070000052
Figure BDA0002171126070000061
表1
本实施例中,计算得到的OD出行数据如表1所示。
步骤2、对每个公共服务设施,计算其客流来源地的覆盖面积,计算公共服务设施Sk的客流来源地的覆盖面积包括以下步骤:
步骤201、从步骤1所获得的OD出行数据中筛选出具有相同出行起点和公共服务设施编号的数据组成OD出行数据子集,该公共服务设施编号为公共服务设施Sk的编号,获得OD出行数据子集中从相同出行起点达到公共服务设施Sk的总出行人数,将从出行起点i达到公共服务设施Sk的总出行人数定义为Pik;
步骤202、将公共服务设施Sk的所有的出行起点的经纬度坐标及相对应的总出行人数输入GIS,基于GIS的核密度算法生成公共服务设施Sk到访者来源地的核密度栅格;
步骤203、将核密度栅格转为面要素类,面要素类含表示每个面要素的密度值的字段gridcode,并对面要素类新增字段pct和字段Accu,字段pct表示密度值占比,由每个面要素的字段gridcode值除以所有面要素的该字段总和得到,字段Accu表示字段pct的累计值;
步骤204、将公共服务设施Sk每个面要素按照面要素内的到访者人数从高到低排序后,对所有面要素进行遍历,并对字段pct进行累加,赋予字段Accu,将字段Accu≤50%的面要素组成的区域划定为设施核心辐射区,剩余区域划定为边缘辐射区,本实施例中,公共服务设施S1对应的数据如表2所示
Figure BDA0002171126070000071
Figure BDA0002171126070000081
表2
2.5、统计各设施核心辐射区面积Ck及总辐射区面积Tk;
步骤3、计算到访每个公共服务设施的到访者总人数,将到访公共服务设施Sk的到访者总人数定义为Pk,则有:
Figure BDA0002171126070000082
式中,n表示出行终点对应公共服务设施Sk的所有出行起点的总个数;
步骤4、计算每个公共服务设施的到访者人均出行距离,将公共服务设施Sk的到访者人均出行距离定义为Qk,则有:
Figure BDA0002171126070000083
式中,{j}表示设施Sk范围中所有的出行终点的集合,{i}表示出行终点为j点的所有出行的出行起点集合。步骤5、计算各公共服务设施的占地面积,公共服务设施Sk的占地面积定义为Mk;
步骤2、3、4汇总结果如表3所示:
Figure BDA0002171126070000084
Figure BDA0002171126070000091
Figure BDA0002171126070000101
表3
步骤6、将各个公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积分别进行归一化处理,并整理为csv格式的表table;对于公共服务设施Sk的核心辐射区面积Ck、总辐射区面积Tk、到访者人均出行距离Qk、到访者总人数Pk、设施面积Mk进行归一化处理的公式为:
Ck'=(Ck-Cmin)/(Cmax-Cmin)
Tk'=(Tk-Tmin)/(Tmax-Tmin)
Qk'=(Qk-Qmin)/(Qmax-Qmin)
Pk'=(Pk-Pmin)/(Pmax-Pmin)
Mk'=(Mk-Mmin)/(Mmax-Mmin)
Cmax、Tmax、Qmax、Pmax及Mmax分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最大值;Cmin、Tmin、Qmin、Pmin、Mmin分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最小值;Ck'、Tk'、Qk'、Pk'、Mk'分别为归一化后的公共服务设施Sk的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积。
归一化处理后的实例数据如表4所示。
Figure BDA0002171126070000102
Figure BDA0002171126070000111
Figure BDA0002171126070000121
表4
步骤7、利用K均值聚类算法,以表table中的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积作为5维向量,对所有公共服务设施进行聚类,统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施,包括以下步骤:
步骤701、使用Python的pandas库将步骤6得到的表table读取为pandas中的DataFrame,命名为df;
步骤702、基于Python的sklearn库cluster下的KMeans算法包,实例化一个n_clusters为3以及其他参数保持缺省的模型对象model;n_clusters取3的目的是对应城市级、片区级和居住区级的公共服务设施分级规则;
步骤703、使用model.fit(df)对步骤701所述DataFrame进行聚类,结果赋值给变量model_labels;
步骤704、将model_labels与步骤701中的df拼接,最终得到设施的分类属性列cluster,该列包含0、1、2三个值,分别代表某一级别设施;聚类结果如表5所示:
Figure BDA0002171126070000122
Figure BDA0002171126070000131
Figure BDA0002171126070000141
表5
步骤705、统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施。
最终可得到各公共服务设施的等级列表,如表6及表7所示。
Figure BDA0002171126070000142
表6
Figure BDA0002171126070000143
Figure BDA0002171126070000151
Figure BDA0002171126070000161
表7

Claims (3)

1.一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,包括以下步骤:
步骤1、将到访公共服务设施的设施使用者的位置数据导入数据库,在数据库中统计一日之内到访公共服务设施的OD出行数据,包括以下步骤:
步骤101、将位置数据导入数据库,从而获得各设施使用者的出行起点的经纬度坐标、出行起点编号、出行终点的纬度坐标、出行终点编号、出行终点所对应的公共服务设施编号、一日之内从各出行起点达到各出行终点的出行人数,将一日之内从出行起点i达到出行终点j的出行人数定义为pij;
步骤102、计算得到各出行起点与各出行终点之间的出行距离,将从出行起点i到达出行终点j的出行距离定义为qij,则有:
Figure FDA0004058560690000011
式中,(xOi,yOi)为出行起点i的经纬度坐标,(xDj,yDj)为出行终点j的经纬度坐标,R为地球平均半径;
步骤2、对每个公共服务设施,计算其客流来源地的覆盖面积,计算公共服务设施Sk的客流来源地的覆盖面积包括以下步骤:
步骤201、从步骤1所获得的OD出行数据中筛选出具有相同出行起点和公共服务设施编号的数据组成OD出行数据子集,该公共服务设施编号为公共服务设施Sk的编号,获得OD出行数据子集中从相同出行起点达到公共服务设施Sk的总出行人数,将从出行起点i达到公共服务设施Sk的总出行人数定义为Pik;
步骤202、将公共服务设施Sk的所有的出行起点的经纬度坐标及相对应的总出行人数输入GIS,基于GIS的核密度算法生成公共服务设施Sk到访者来源地的核密度栅格;
步骤203、将核密度栅格转为面要素类,面要素类含表示每个面要素的密度值的字段gridcode,并对面要素类新增字段pct和字段Accu,字段pct表示密度值占比,由每个面要素的字段gridcode值除以所有面要素的该字段总和得到,字段Accu表示字段pct的累计值;
步骤204、将公共服务设施Sk每个面要素按照面要素内的到访者人数从高到低排序后,对所有面要素进行遍历,并对字段pct进行累加,赋予字段Accu,将字段Accu≤50%的面要素组成的区域划定为设施核心辐射区,剩余区域划定为边缘辐射区;
2.5、统计各设施核心辐射区面积Ck及总辐射区面积Tk;
步骤3、计算到访每个公共服务设施的到访者总人数,将到访公共服务设施Sk的到访者总人数定义为Pk,则有:
Figure FDA0004058560690000021
式中,n表示出行终点对应公共服务设施Sk的所有出行起点的总个数;
步骤4、计算每个公共服务设施的到访者人均出行距离,将公共服务设施Sk的到访者人均出行距离定义为Qk,则有:
Figure FDA0004058560690000022
式中,{j}表示设施Sk范围中所有的出行终点的集合,{i}表示出行终点为j点的所有出行的出行起点集合;
步骤5、计算各公共服务设施的占地面积,公共服务设施Sk的占地面积定义为Mk;
步骤6、将各个公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积分别进行归一化处理,并整理为csv格式的表table;
步骤7、利用K均值聚类算法,以表table中的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积作为5维向量,对所有公共服务设施进行聚类,统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施。
2.如权利要求1所述的一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,步骤6中,对于公共服务设施Sk的核心辐射区面积Ck、总辐射区面积Tk、到访者人均出行距离Qk、到访者总人数Pk、设施面积Mk进行归一化处理的公式为:
Ck'=(Ck-Cmin)/(Cmax-Cmin)
Tk'=(Tk-Tmin)/(Tmax-Tmin)
Qk'=(Qk-Qmin)/(Qmax-Qmin)
Pk'=(Pk-Pmin)/(Pmax-Pmin)
Mk'=(Mk-Mmin)/(Mmax-Mmin)
Cmax、Tmax、Qmax、Pmax及Mmax分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最大值;Cmin、Tmin、Qmin、Pmin、Mmin分别为所有公共服务设施中核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数及设施面积的最小值;Ck'、Tk'、Qk'、Pk'、Mk'分别为归一化后的公共服务设施Sk的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积。
3.如权利要求1所述的一种基于位置数据和聚类算法的公共服务设施分级方法,其特征在于,所述步骤7包括以下步骤:
步骤701、使用Python的pandas库将步骤6得到的表table读取为pandas中的DataFrame,命名为df;
步骤702、基于Python的sklearn库cluster下的KMeans算法包,实例化一个n_clusters为3以及其他参数保持缺省的模型对象model;
步骤703、使用model.fit(df)对步骤701所述DataFrame进行聚类,结果赋值给变量model_labels;
步骤704、将model_labels与步骤701中的df拼接,最终得到设施的分类属性列cluster,该列包含0、1、2三个值,分别代表某一级别设施;
步骤705、统计公共服务设施的核心辐射区面积、总辐射区面积、到访者人均出行距离、到访者总人数、设施面积的指标均值之和,将均值之和最大的类别评定为城市级设施,均值之和最小的类别评定为居住区级设施,处于中间的类别则评定为片区级设施。
CN201910763492.2A 2019-08-19 2019-08-19 一种基于位置数据和聚类算法的公共服务设施分级方法 Active CN110852547B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910763492.2A CN110852547B (zh) 2019-08-19 2019-08-19 一种基于位置数据和聚类算法的公共服务设施分级方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910763492.2A CN110852547B (zh) 2019-08-19 2019-08-19 一种基于位置数据和聚类算法的公共服务设施分级方法

Publications (2)

Publication Number Publication Date
CN110852547A CN110852547A (zh) 2020-02-28
CN110852547B true CN110852547B (zh) 2023-04-07

Family

ID=69594729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910763492.2A Active CN110852547B (zh) 2019-08-19 2019-08-19 一种基于位置数据和聚类算法的公共服务设施分级方法

Country Status (1)

Country Link
CN (1) CN110852547B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813835B (zh) * 2020-07-14 2023-09-26 上海元卓信息科技有限公司 一种基于手机信令和poi数据的公共活动中心识别系统
CN113011768B (zh) * 2021-03-31 2021-12-03 中国城市建设研究院有限公司 公共设施数据的处理方法、系统、电子设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909692A (zh) * 2017-03-09 2017-06-30 北京市测绘设计研究院 一种计算城市公共设施覆盖辐射指数的方法
CN107145724A (zh) * 2017-04-25 2017-09-08 武汉大学 一种城市绿道综合服务能力分析评价的空间分析方法
CN107609748A (zh) * 2017-08-18 2018-01-19 深圳航天智慧城市系统技术研究院有限公司 一种对城市设施进行发展评估的方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933286B (zh) * 2015-03-13 2018-01-05 华南理工大学 一种基于大数据的城市空间品质评价方法
CN104715036B (zh) * 2015-03-17 2018-07-20 南京师范大学 基于图形复杂度的gis面要素几何信息量的计算方法
CN106097222A (zh) * 2016-06-12 2016-11-09 河南理工大学 顾及用户特征的公共设施空间可达性分析方法及装置
CN106447582A (zh) * 2016-11-04 2017-02-22 国家电网公司 充电设施公共服务互动方法、平台和系统
CN107871184A (zh) * 2017-11-16 2018-04-03 南京邮电大学 一种面向区域充电设施的电动汽车充电站的选址方法
CN107729938B (zh) * 2017-12-11 2020-06-09 北方工业大学 一种基于公交接驳辐射区特征的轨道站点分类方法
CN109299438B (zh) * 2018-09-21 2023-01-17 东南大学 一种基于网约车数据的公共交通设施供给水平评价方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106909692A (zh) * 2017-03-09 2017-06-30 北京市测绘设计研究院 一种计算城市公共设施覆盖辐射指数的方法
CN107145724A (zh) * 2017-04-25 2017-09-08 武汉大学 一种城市绿道综合服务能力分析评价的空间分析方法
CN107609748A (zh) * 2017-08-18 2018-01-19 深圳航天智慧城市系统技术研究院有限公司 一种对城市设施进行发展评估的方法及系统

Also Published As

Publication number Publication date
CN110852547A (zh) 2020-02-28

Similar Documents

Publication Publication Date Title
CN109327841B (zh) 基于覆盖、价值关联的多维评定及精准建设评估方法
CN107247938B (zh) 一种高分辨率遥感影像城市建筑物功能分类的方法
CN110533038B (zh) 一种基于信息数据的城市活力区和中心城区边界识别的方法
CN109189917B (zh) 一种融合景观和社会特征的城市功能区划分方法及系统
CN109492950B (zh) 一种基于gis技术可满足大区域范围空间饱和负荷预测方法
WO2022198963A1 (zh) 基于大数据的商业空间品质评价方法、系统、设备及介质
CN106909692B (zh) 一种计算城市公共设施覆盖辐射指数的方法
Wu et al. Modified data-driven framework for housing market segmentation
CN110781267A (zh) 一种基于地理国情的多尺度空间分析评价方法及系统
CN110852547B (zh) 一种基于位置数据和聚类算法的公共服务设施分级方法
CN110717619A (zh) 一种自下而上配电网多尺度时空负荷预测方法及系统
CN112508332B (zh) 一种顾及多维特征的渐进式乡村聚落整治分区方法
CN112954623B (zh) 一种基于手机信令大数据的居民入住率估算方法
CN116341967A (zh) 基于gis模型的公园绿地方案评价与优化方法、装置、设备及存储介质
CN116437291A (zh) 一种基于手机信令的文化圈规划方法和系统
CN109885638B (zh) 一种三维立体空间索引方法及系统
CN113672788B (zh) 一种基于多源数据和权重系数法的城市建筑功能分类方法
CN110689055A (zh) 一种顾及格网单元属性分级的跨尺度统计指标空间化方法
CN110264010B (zh) 新型乡村电力饱和负荷预测方法
CN111008730B (zh) 基于城市空间结构的人群聚集度预测模型构建方法及装置
CN111105124A (zh) 一种基于距离约束的多地标影响力的计算方法
CN115018014B (zh) 基于多源信息的机器学习辅助的通信场景分类方法
CN115457386A (zh) 一种村庄用地信息化生成方法
CN115393886A (zh) 一种基于poi和aoi数据的城市功能区识别方法及存储介质
Li et al. Identifying urban form typologies in seoul with mixture model based clustering

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant