CN113379269A - 多因素空间聚类的城市商业功能区划方法、装置及介质 - Google Patents
多因素空间聚类的城市商业功能区划方法、装置及介质 Download PDFInfo
- Publication number
- CN113379269A CN113379269A CN202110686424.8A CN202110686424A CN113379269A CN 113379269 A CN113379269 A CN 113379269A CN 202110686424 A CN202110686424 A CN 202110686424A CN 113379269 A CN113379269 A CN 113379269A
- Authority
- CN
- China
- Prior art keywords
- index
- data
- business
- zoning
- clustering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000013316 zoning Methods 0.000 title claims abstract description 47
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 238000003064 k means clustering Methods 0.000 claims abstract description 12
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 10
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 230000001939 inductive effect Effects 0.000 claims abstract description 5
- 230000006870 function Effects 0.000 claims description 110
- 238000009826 distribution Methods 0.000 claims description 61
- 238000010586 diagram Methods 0.000 claims description 15
- 238000005192 partition Methods 0.000 claims description 14
- 230000000694 effects Effects 0.000 claims description 6
- 238000012545 processing Methods 0.000 claims description 5
- 230000006698 induction Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims description 4
- 230000000007 visual effect Effects 0.000 claims description 3
- 238000007621 cluster analysis Methods 0.000 claims description 2
- 238000013439 planning Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 4
- 238000004590 computer program Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 235000013361 beverage Nutrition 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06313—Resource planning in a project environment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0637—Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A30/00—Adapting or protecting infrastructure or their operation
- Y02A30/60—Planning or developing urban green infrastructure
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种多因素空间聚类的城市商业功能区划方法、装置及介质,其中方法包括:获取目标区域的商业数据,对商业数据进行预处理,将目标区域以建筑轮廓为基础划分区划单元,并对区划单元进行编号;确定聚类因子,根据聚类因子构建区划指标体系;对区划指标体系中的指标进行计算,采用K均值聚类算法对指标计算结果和区划单元的编号进行分析;将聚类分析结果与区划单元进行匹配,识别并归纳各类商业功能区划类型。本发明以建筑为区划单元,将经济因素和功能因素作为核心要素,识别和归纳出城市商业功能区划,为布局商业业态提供辅助和依据;借助K均值聚类的分析方法,具有快速计算和迭代、易于推广运用的优势,可广泛应用于城乡规划领域。
Description
技术领域
本发明涉及城乡规划领域,尤其涉及一种多因素空间聚类的城市商业功能区划方法、装置及介质。
背景技术
商业区作为城市中商业活动最为活跃和集中的区域,其功能区划与布局的合理性与精准性尤为重要。随着数字经济发展,新零售店铺出现,许多传统实体店铺完成数字化转型,开设网点或外卖服务,商业空间的功能区划日趋复杂。
商业空间功能的划分和研究方法经历了从经验主义、定性研究到空间相互作用模型、GIS空间分析方法以及利用经济普查数据等基于大数据的分析方法,以人口、交通、现有商业聚集度、商铺租金、设施等多方面因素为主要依据,但目前商业空间区划的范围界定和空间尺度都较大,且缺乏时效性,与实际情况存在差异,难以实现精准布局。
发明内容
为至少一定程度上解决现有技术中存在的技术问题之一,本发明的目的在于提供一种多因素空间聚类的城市商业功能区划方法、装置及介质。
本发明所采用的技术方案是:
一种多因素空间聚类的城市商业功能区划方法,包括以下步骤:
获取目标区域的商业数据,对所述商业数据进行预处理,将目标区域以建筑轮廓为基础划分区划单元,并对区划单元进行编号;其中,所述商业数据包括建筑矢量数据、POI数据、商铺租金数据、商铺人均消费额数据;
确定聚类因子,根据聚类因子构建区划指标体系;区划指标体系包括商业氛围指标、经济活力指标、功能分布指标3项大类聚类因子,以及综合商业氛围指标、商业业态混合度指标、租金水平指标、人均消费水平指标、商业规模指标、餐饮类功能分布指标、生活服务类功能分布指标、购物类功能分布指标、休闲娱乐类功能分布指标9项小类聚类因子;
对区划指标体系中的指标进行计算,采用K均值聚类算法对指标计算结果和区划单元的编号进行分析;
将聚类分析结果与区划单元进行匹配,识别并归纳各类商业功能区划类型。
进一步地,所述获取目标区域的商业数据,对所述商业数据进行预处理,将目标区域以建筑轮廓为基础划分区划单元,并对区划单元进行编号,包括:
获取建筑矢量数据,剔除建筑矢量数据中非商业区域建筑,并对筛选得到的建筑矢量数据进行编号,使每一个建筑轮廓为一个商业功能区划单元;其中建筑矢量数据包括建筑轮廓与建筑层数数据;
获取POI数据,剔除无法反映商业功能类型的POI数据,对筛选结果进行重分类,重分类结果包括餐饮类、购物类、生活服务类以及休闲娱乐类四类;其中POI数据包括POI坐标、具体类型、名称信息;
获取商铺租金数据;其中商铺租金数据包括商铺坐标、地址、每月租金价格;
获取商铺人均消费额数据;其中商铺人均消费额数据包括商铺坐标、地址、人均消费金额数。
进一步地,所述综合商业氛围指标与各类功能分布指标的值通过以下方式计算获得:
采用核密度估计函数对POI数据进行分析,获取目标区域的综合商业氛围指标与餐饮类功能分布指标、生活服务类功能分布指标、购物类功能分布指标、休闲娱乐类功能分布指标的值;
根据获得的指标的值获得目标区域的商业综合聚集度分布栅格图,以及餐饮类、购物类、生活服务类、休闲娱乐类商业聚集度分布栅格图;
其中,核密度估计函数的表达式为:
式中,K(x)称为核函数,(x-xi)2+(y-yi)2是点(xi,yi)和(x,y)之间的距离,h是带宽,n是研究范围内的点数。
进一步地,带宽h的表达式为:
其中,σ是样本方差。
进一步地,所述商业业态混合度指标的值通过以上方式计算获得:
根据预设类型将POI数据划分为多个小类,将划分结果与区划单元进行空间连接;
采用ArcGIS软件统计各个区划单元所包含的POI个数,以及统计各个区划单元所包含的各小类POI商业业态的占比;
将各个区划单元的POI个数、各小类POI商业业态占比以及建筑矢量数据进行空间连接,并计算各个区划单元的信息熵值,作为商业业态混合度指标的值;
其中,信息熵值的计算公式如下:
p(xi)代表随机事件X为xo的概率。
进一步地,所述租金水平指标通过以下方式获得:
将商铺租金数据与建筑矢量数据进行空间连接,将商铺租金数据除以相对应的建筑基底面积获得单位租金额,作为租金水平指标的值;
所述人均消费额指标通过以下方式获得:
将商铺人均消费额数据与建筑矢量数据进行空间连接,获取各个区划单元的人均消费额数据指标的值;
所述商业规模指标通过以下方式获得:
根据建筑矢量数据获取建筑层数属性,作为商业规模指标的值。
进一步地,所述采用K均值聚类算法对指标计算结果和区划单元的编号进行分析,包括:
将计算获得的综合商业氛围指标、商业业态混合度指标、租金水平指标、人均消费水平指标、商业规模指标、餐饮类功能分布指标指标、生活服务类功能分布指标指标、购物类功能分布指标指标、休闲娱乐类功能分布指标与区划单元的编号统计到一张表格;
将表格导入SPSS软件,采用K均值聚类算法分析,获得多个类簇作为聚类结果。
进一步地,所述将聚类分析结果与区划单元进行匹配,识别并归纳各类商业功能区划类型及基本特征,包括:
将聚类分析结果与区划单元导入ArcGIS软件中,进行空间连接;
识别并归纳各类商业功能区划类型及基本特征,将归纳结果进行可视化处理后,输出结果。
本发明所采用的另一技术方案是:
一种多因素空间聚类的城市商业功能区划装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现上所述方法。
本发明所采用的另一技术方案是:
一种存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序在由处理器执行时用于执行如上所述方法。
本发明的有益效果是:本发明以建筑为区划单元,重点将经济因素和功能因素作为核心要素,从微观尺度上精准识别和归纳出城市商业功能区划,为合理布局商业业态提供辅助和依据;另外,借助K均值聚类的分析方法,具有快速计算和迭代、易于推广运用的优势。
附图说明
为了更清楚地说明本发明实施例或者现有技术中的技术方案,下面对本发明实施例或者现有技术中的相关技术方案附图作以下介绍,应当理解的是,下面介绍中的附图仅仅为了方便清晰表述本发明的技术方案中的部分实施例,对于本领域的技术人员而言,在无需付出创造性劳动的前提下,还可以根据这些附图获取到其他附图。
图1为本发明实施例的多因素空间聚类的城市商业功能区划方法流程图;
图2为本发明实施例的综合商业氛围指标图;
图3为本发明实施例的餐饮类功能分布指标图;
图4为本发明实施例的生活服务类功能分布指标图;
图5为本发明实施例的购物类功能分布指标图;
图6为本发明实施例的休闲娱乐类商业聚集度评价图;
图7为本发明实施例的商业业态混合度指标图;
图8为本发明实施例的租金水平指标图;
图9为本发明实施例的人均消费水平指标图;
图10为本发明实施例的商业规模指标图;
图11为本发明实施例的商业功能区划结果图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。对于以下实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
在本发明的描述中,需要理解的是,涉及到方位描述,例如上、下、前、后、左、右等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
在本发明的描述中,若干的含义是一个或者多个,多个的含义是两个以上,大于、小于、超过等理解为不包括本数,以上、以下、以内等理解为包括本数。如果有描述到第一、第二只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
本发明的描述中,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本发明中的具体含义。
本实施例以广州市越秀区北京路商圈及周边地区为例,提供了一种基于多因素空间聚类的城市商业功能区划方法。实施例范围东起东壕涌高架路,西至解放中路,南起珠江,北至东风中路,总用地面积为3.267平方公里。
多因素空间聚类的城市商业功能区划方法,下面参考附图描述本发明实施例。
如图1所示,图1为本发明实施例的多因素空间聚类的城市商业功能区划方法的流程图,具体包括下述步骤:
步骤A:通过多源数据开放平台获取目标区域的数据并对数据进行预处理。
系统批量获取建筑矢量数据、POI(Point of Interest,兴趣点)数据、商铺租金数据、商铺人均消费额数据。在具体实施案例中,所述步骤A包括:
步骤A1:通过水经注万能地图下载器获取建筑矢量数据包括建筑轮廓与建筑层数数据。对建筑矢量数据进行筛选剔除非商业区域建筑,并对筛选得到的建筑矢量数据进行编号,每一个建筑轮廓为一个商业功能区划单元,得到区划单元2181个。
步骤A2:通过编写Python网络爬虫,通过高德地图开放平台中的API接口批量获取,对获取POI数据进行预处理和重分类。
由于部分POI类型无法明确反映商业功能类型,故被剔除。对POI数据的筛选结果进行重分类,重分类结果包括餐饮类、购物类、生活服务类以及休闲娱乐类四类,数据内容涵盖POI坐标、具体类型、名称信息。
如表1为POI功能重分类统计结果。
表1 POI功能重分类结果
步骤A3:通过安居客与58同城网站获取商铺租金数据,结合实地勘测调研统计的租金信息,包括商铺坐标、地址、每月租金价格。
步骤A4:通过大众点评网站获取商铺人均消费额数据,包括商铺坐标、地址、人均消费金额数。
步骤B:确定聚类因子,构建商业功能区划指标体系。
由于本发明的对象是商业空间,以其合理的功能区划为目的,因此结合功能区划需考虑的各类因素,在聚类因子选取时,重点以商业、经济方面因素为依据。本发明最终选取聚类指标商业氛围、经济活力、功能分布3项大类,9项小类指标,具体如表2所示:
表2聚类指标表
步骤C:进行聚类因子的指标计算与分析。
提取步骤A中获取并预处理的数据,计算商业氛围指标、经济活力指标、功能分布指标。
步骤C1:综合商业氛围指标与各类功能分布指标计算。
对于综合商业氛围与各类功能分布,采用核密度估计法分析上述步骤A中获取的重分类POI数据集,可以得到北京路商圈及其周边区域的综合商业氛围指标与餐饮类、购物类、生活服务类、休闲娱乐类商业功能类型的分布指标。
核密度估计法(Kernel Density Estimation)是借助一个移动的单元格对点或线格局的密度进行估计。给定样本点x1,x2,……,xn,利用核心估计模拟出属性变量数据的详细分布。计算二维数据时,d值取2,一个常用的核密度估计函数公式如下:
式中,K(x)称为核函数,(x-xi)2+(y-yi)2是点(xi,yi)和(x,y)之间的距离,h是带宽,n是研究范围内的点数。
在核密度估计中,带宽是定义平滑量大小的自由参数,带宽过大或过小均会影响f(x)的结果。采用Silverman的“经验法则”,在f(x)呈正态的假定下,根据Ker,A.P.和B.K.Goodwin的工作,宽带优化计算的公式可简化为:
式中,σ是样本方差。
获得案例区域商业综合聚集度分布栅格图,以及餐饮类、购物类、生活服务类、休闲娱乐类商业聚集度分布栅格图。
使用ArcGIS软件中“栅格转点”工具,将商业聚集度分布栅格图转为点要素,并使用ArcGIS软件中的“空间连接”与A1步骤中获得的区划单元连接,使用自然间断点分级法(Jenks)进行可视化处理,作为综合商业氛围指标、餐饮类功能分布指标、购物类功能分布指标、生活服务类功能分布指标、休闲娱乐类功能分布指标,获得图2-6。
步骤C2:商业业态混合度指标计算。
C21:将步骤A2中的POI数据类型进一步划分为69类小类,将划分结果与步骤A1中的区划单元空间连接。
C22:通过ArcGIS“交集制表”功能统计各个区划单元所包含的POI个数,再通过ArcGIS“汇总统计数据”工具汇总各个区划单元的POI总数,使用“连接”工具连接两个表格。
C23:使用字段计算器,输入区划单元每小类POI数量除以POI总数,获得各个区划单元所包含的各小类POI商业业态的占比。
C24:将各个区划单元的POI总数与各小类POI商业业态占比与建筑矢量数据空间连接。
C25:使用字段计算器编辑函数,计算各个区划单元的信息熵值。采用“信息熵”能够有效计算和反映出某一区域商业业态混合程度,商业混合度越高,熵值越大,其计算公式为:
其中P(xi)代表随机事件X为xi的概率。
C26:将计算结果可视化,获得商业业态混合度指标,如图7所示。
步骤C3:租金水平指标计算。
将步骤A3中获得的租金数据与建筑矢量数据在ArcGIS中进行空间连接,将租金数据除以相对应的建筑基底面积获得单位租金额,并进行可视化处理,结果如图8所示。
步骤C4:人均消费额指标计算。
将步骤A4中获得的人均消费额与建筑矢量数据在ArcGIS中进行空间连接,获得各个区划单元的人均消费额数据指标,使用自然间断点分级法(Jenks)进行可视化处理,结果如图9所示。
步骤C5:商业规模指标计算。
根据步骤A1中获得的经过筛选的建筑矢量数据,对其建筑层数属性进行可视化处理,获得图10。
步骤D:运行K均值聚类进行城市商业功能区划分析。
将上述获得的综合商业氛围、商业业态混合度、租金水平、人均消费水平、商业规模、餐饮类功能分布指标、生活服务类功能分布指标、购物类功能分布指标、休闲娱乐类功能分布指标与区划单元编号统计到一张表格,导入SPSS软件,并运行K均值聚类算法分析。
K均值(K-Means)聚类的算法原理是在给定K值和K个初始类簇中心点的情况下,把每个点(数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据类簇内的所有点重新计算该类簇的中心点(取平均值),然后再迭代的进行分配点和更新类簇中心点,直至类簇中心点的变化很小或达到指定的迭代次数。
假定给定数据样本X,包括了n个对象X={X1,X2,X3,…,Xn},其中每个对象都具有m个维度的属性,K均值聚类算法的目标是将n个对象依据对象间的相似性聚集到指定的k个类簇中,每个对象属于且仅属于一个其到类簇中心距离最小的类簇中。
步骤D1:初始化k个聚类中心{C1,C2,C3,…,Ck},1<k≤n,进一步地,通过计算每一个对象到聚类中心的欧式距离,计算公式如下:
上式中,Xi表示第i个对象1≤i≤n,Cj表示第j个聚类中心的1≤j≤k,Xit表示第i个对象的第t个属性,1≤t≤m,Cjt表示第j个聚类中心的第t个属性。
步骤D2:依次比较每个对象距离聚类中心的距离,将对象分配到距离最近的聚类中心的类簇中,得到k个类簇{S1,S2,S3,…,Sk}。
K均值聚类中心即为类簇内所有对象的均值,其计算公式如下:
式中,Cl代表第l个聚类的中心,1≤l≤k,|Sl|表示第l个类簇中对象的个数,Xi表示第l个类簇中第i个对象,1≤i≤|Sl|。
输入变量:商业规模、人均消费水平、租金水平、综合商业氛围、餐饮类功能分布、购物类功能分布、生活服务类功能分布、休闲娱乐类功能分布
输入个案标注依据:商业区划单元
分析结果如表3-5所示:
表3最终聚类中心
聚类类型 | 1 | 2 | 3 | 4 | 5 | 6 |
商业规模指标 | 6 | 21 | 9 | 7 | 8 | 16 |
人均消费水平 | 15 | 62 | 47 | 45 | 40 | 37 |
租金水平 | 35 | 60 | 566 | 1056 | 400 | 131 |
综合商业氛围指标 | 13768949 | 551972480 | 238998706 | 127729422 | 48228126 | 410088595 |
餐饮类功能分布指标 | 2955266 | 17701150 | 14981586 | 18325900 | 9834910 | 23869760 |
购物类功能分布指标 | 3027634 | 495281504 | 185708587 | 71768747 | 13949851 | 367515597 |
生活服务类功能分布指标 | 3027634 | 495281504 | 185708587 | 71768747 | 13949851 | 367515597 |
休闲娱乐类功能分布指标 | 796270 | 6456010 | 2961287 | 4297943 | 1929593 | 5717902 |
商业业态混合度指标 | 0.0601426 | 0.3557706 | 0.3310835 | 0.29281576 | 0.23981259 | 0.49671372 |
表4最终聚类中心之间的距离
聚类 | 1 | 2 | 3 | 4 | 5 | 6 |
1 | 880079690 | 342961258 | 150619350 | 38401022 | 650564256 | |
2 | 880079690 | 538184888 | 733970933 | 846877240 | 229821425 | |
3 | 342961258 | 538184888 | 195853004 | 308906286 | 308975608 | |
4 | 150619350 | 733970933 | 195853004 | 114386238 | 504670043 | |
5 | 38401022 | 846877240 | 308906286 | 114386238 | 617391125 | |
6 | 650564256 | 229821425 | 308975608 | 504670043 | 617391124 |
表5每个聚类中的个案数目
步骤E:将SPSS中生成的聚类结果,重新导入ArcGIS,使用“空间链接”工具将聚类结果与区划单元匹配。综合分析各类商业功能区划类型并识别基本特征。输出结果如表6,最终区划结果如图11。
表6最终区划结果
综上所述,本实施例方法以建筑轮廓为基础划分区划单元并编号;选取聚类因子,构建商业功能区划指标体系:商业氛围、经济活力、功能分布3项聚类因子,综合商业氛围、商业业态混合度、租金水平、人均消费水平、商业规模、餐饮类功能分布、生活服务类功能分布、购物类功能分布、休闲娱乐类功能分布9项子因子;对聚类因子逐一进行指标计算,并进行可视化处理;统计所述指标体系中各项聚类因子,运行K均值聚类算法分析;根据K均值聚类算法的分析结果识别商业功能区划及基本特征。
本实施例方法与现有技术相比,具有如下优点和有益效果:
1、克服现有技术的不足,以建筑为区划单元,重点将经济因素和功能因素作为核心要素,从微观尺度上精准识别和归纳出城市商业功能区划,为合理布局商业业态提供辅助和依据。
2、本发明基于多因素评价指标,借助K均值聚类等常用的分析方法,具有快速计算和迭代、易于推广运用的优势。
本实施例还提供一种多因素空间聚类的城市商业功能区划装置,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现如图1所述的方法。
本实施例的一种多因素空间聚类的城市商业功能区划装置,可执行本发明方法实施例所提供的一种多因素空间聚类的城市商业功能区划方法,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
本申请实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行图1所示的方法。
本实施例还提供了一种存储介质,存储有可执行本发明方法实施例所提供的一种多因素空间聚类的城市商业功能区划方法的指令或程序,当运行该指令或程序时,可执行方法实施例的任意组合实施步骤,具备该方法相应的功能和有益效果。
在一些可选择的实施例中,在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如,取决于所涉及的功能/操作,连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外,在本发明的流程图中所呈现和描述的实施例以示例的方式被提供,目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的,其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
此外,虽然在功能性模块的背景下描述了本发明,但应当理解的是,除非另有相反说明,所述的功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中,或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是,有关每个模块的实际实现的详细讨论对于理解本发明是不必要的。更确切地说,考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下,在工程师的常规技术内将会了解该模块的实际实现。因此,本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本发明。还可以理解的是,所公开的特定概念仅仅是说明性的,并不意在限制本发明的范围,本发明的范围由所附权利要求书及其等同方案的全部范围来决定。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的上述描述中,参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施方式或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施方式,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
以上是对本发明的较佳实施进行了具体说明,但本发明并不限于上述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
Claims (10)
1.一种多因素空间聚类的城市商业功能区划方法,其特征在于,包括以下步骤:
获取目标区域的商业数据,对所述商业数据进行预处理,将目标区域以建筑轮廓为基础划分区划单元,并对区划单元进行编号;其中,所述商业数据包括建筑矢量数据、POI数据、商铺租金数据、商铺人均消费额数据;
确定聚类因子,根据聚类因子构建区划指标体系;区划指标体系包括商业氛围指标、经济活力指标、功能分布指标3项大类聚类因子,以及综合商业氛围指标、商业业态混合度指标、租金水平指标、人均消费水平指标、商业规模指标、餐饮类功能分布指标、生活服务类功能分布指标、购物类功能分布指标、休闲娱乐类功能分布指标9项小类聚类因子;
对区划指标体系中的指标进行计算,采用K均值聚类算法对指标计算结果和区划单元的编号进行分析;
将聚类分析结果与区划单元进行匹配,识别并归纳各类商业功能区划类型。
2.根据权利要求1所述的一种多因素空间聚类的城市商业功能区划方法,其特征在于,所述获取目标区域的商业数据,对所述商业数据进行预处理,将目标区域以建筑轮廓为基础划分区划单元,并对区划单元进行编号,包括:
获取建筑矢量数据,剔除建筑矢量数据中非商业区域建筑,并对筛选得到的建筑矢量数据进行编号,使每一个建筑轮廓为一个商业功能区划单元;其中建筑矢量数据包括建筑轮廓与建筑层数数据;
获取POI数据,剔除无法反映商业功能类型的POI数据,对筛选结果进行重分类,重分类结果包括餐饮类、购物类、生活服务类以及休闲娱乐类四类;其中POI数据包括POI坐标、具体类型、名称信息;
获取商铺租金数据;其中商铺租金数据包括商铺坐标、地址、每月租金价格;
获取商铺人均消费额数据;其中商铺人均消费额数据包括商铺坐标、地址、人均消费金额数。
6.根据权利要求1所述的一种多因素空间聚类的城市商业功能区划方法,其特征在于,所述租金水平指标通过以下方式获得:
将商铺租金数据与建筑矢量数据进行空间连接,将商铺租金数据除以相对应的建筑基底面积获得单位租金额,作为租金水平指标的值;
所述人均消费额指标通过以下方式获得:
将商铺人均消费额数据与建筑矢量数据进行空间连接,获取各个区划单元的人均消费额数据指标的值;
所述商业规模指标通过以下方式获得:
根据建筑矢量数据获取建筑层数属性,作为商业规模指标的值。
7.根据权利要求1所述的一种多因素空间聚类的城市商业功能区划方法,其特征在于,所述采用K均值聚类算法对指标计算结果和区划单元的编号进行分析,包括:
将计算获得的综合商业氛围指标、商业业态混合度指标、租金水平指标、人均消费水平指标、商业规模指标、餐饮类功能分布指标指标、生活服务类功能分布指标指标、购物类功能分布指标指标、休闲娱乐类功能分布指标与区划单元的编号统计到一张表格;
将表格导入SPSS软件,采用K均值聚类算法分析,获得多个类簇作为聚类结果。
8.根据权利要求1所述的一种多因素空间聚类的城市商业功能区划方法,其特征在于,所述将聚类分析结果与区划单元进行匹配,识别并归纳各类商业功能区划类型及基本特征,包括:
将聚类分析结果与区划单元导入ArcGIS软件中,进行空间连接;
识别并归纳各类商业功能区划类型及基本特征,将归纳结果进行可视化处理后,输出结果。
9.一种多因素空间聚类的城市商业功能区划装置,其特征在于,包括:
至少一个处理器;
至少一个存储器,用于存储至少一个程序;
当所述至少一个程序被所述至少一个处理器执行,使得所述至少一个处理器实现权利要求1-8任一项所述方法。
10.一种存储介质,其中存储有处理器可执行的程序,其特征在于,所述处理器可执行的程序在由处理器执行时用于执行如权利要求1-8任一项所述方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110686424.8A CN113379269B (zh) | 2021-06-21 | 2021-06-21 | 多因素空间聚类的城市商业功能区划方法、装置及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110686424.8A CN113379269B (zh) | 2021-06-21 | 2021-06-21 | 多因素空间聚类的城市商业功能区划方法、装置及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113379269A true CN113379269A (zh) | 2021-09-10 |
CN113379269B CN113379269B (zh) | 2023-08-18 |
Family
ID=77578147
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110686424.8A Active CN113379269B (zh) | 2021-06-21 | 2021-06-21 | 多因素空间聚类的城市商业功能区划方法、装置及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113379269B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796943A (zh) * | 2023-01-31 | 2023-03-14 | 广州数说故事信息科技有限公司 | 一种行业开店空间规划方法及系统 |
CN116109643A (zh) * | 2023-04-13 | 2023-05-12 | 深圳市明源云科技有限公司 | 市场布局数据采集方法、设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109857983A (zh) * | 2018-12-29 | 2019-06-07 | 河南工程学院 | 一种面向超大城市的餐饮场馆热度分析方法 |
CN111949834A (zh) * | 2019-05-17 | 2020-11-17 | 上海树融数据科技有限公司 | 选址方法和选址平台 |
WO2020233152A1 (zh) * | 2019-05-17 | 2020-11-26 | 东南大学 | 基于城市建筑空间数据的建成区边界识别方法及设备 |
CN112766718A (zh) * | 2021-01-18 | 2021-05-07 | 华南理工大学 | 城市商圈边界识别方法、系统、计算机设备及存储介质 |
CN112819319A (zh) * | 2021-01-29 | 2021-05-18 | 华南理工大学 | 一种城市活力与空间社会特征相关性的测度方法及应用 |
CN112990976A (zh) * | 2021-03-29 | 2021-06-18 | 华南理工大学 | 基于开源数据挖掘的商业网点选址方法、系统、设备及介质 |
-
2021
- 2021-06-21 CN CN202110686424.8A patent/CN113379269B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109857983A (zh) * | 2018-12-29 | 2019-06-07 | 河南工程学院 | 一种面向超大城市的餐饮场馆热度分析方法 |
CN111949834A (zh) * | 2019-05-17 | 2020-11-17 | 上海树融数据科技有限公司 | 选址方法和选址平台 |
WO2020233152A1 (zh) * | 2019-05-17 | 2020-11-26 | 东南大学 | 基于城市建筑空间数据的建成区边界识别方法及设备 |
CN112766718A (zh) * | 2021-01-18 | 2021-05-07 | 华南理工大学 | 城市商圈边界识别方法、系统、计算机设备及存储介质 |
CN112819319A (zh) * | 2021-01-29 | 2021-05-18 | 华南理工大学 | 一种城市活力与空间社会特征相关性的测度方法及应用 |
CN112990976A (zh) * | 2021-03-29 | 2021-06-18 | 华南理工大学 | 基于开源数据挖掘的商业网点选址方法、系统、设备及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115796943A (zh) * | 2023-01-31 | 2023-03-14 | 广州数说故事信息科技有限公司 | 一种行业开店空间规划方法及系统 |
CN116109643A (zh) * | 2023-04-13 | 2023-05-12 | 深圳市明源云科技有限公司 | 市场布局数据采集方法、设备及计算机可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113379269B (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ma et al. | Analyzing driving factors of land values in urban scale based on big data and non-linear machine learning techniques | |
CN109493119B (zh) | 一种基于poi数据的城市商业中心识别方法及系统 | |
Wu et al. | Analyzing spatial heterogeneity of housing prices using large datasets | |
Xie | The overlaid network algorithms for areal interpolation problem | |
Wu et al. | Modified data-driven framework for housing market segmentation | |
CN107133900B (zh) | 城市土地混合利用特征格网计算方法及装置 | |
CN112861972B (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN113379269B (zh) | 多因素空间聚类的城市商业功能区划方法、装置及介质 | |
CN112990976A (zh) | 基于开源数据挖掘的商业网点选址方法、系统、设备及介质 | |
CN111755111A (zh) | 一种基于供需关系的医疗资源优化配置方法及系统 | |
Oshan et al. | A scoping review on the multiplicity of scale in spatial analysis | |
Lobsang et al. | Methodological framework for understanding urban people flow from a complex network perspective | |
Donnay et al. | Modelling geographical distributions in urban areas | |
Carlow et al. | TOPOI–A method for analysing settlement units and their linkages in an urban–rural fabric | |
CN117893383A (zh) | 一种城市功能区域识别方法、系统、终端设备及介质 | |
Doda et al. | So2Sat POP-A curated benchmark data set for population estimation from space on a continental scale | |
Ou et al. | Delineating functional regions from road networks: The case of South Korea | |
CN111310340B (zh) | 基于人类移动的城市区域交互异常关系识别方法及设备 | |
CN112766718A (zh) | 城市商圈边界识别方法、系统、计算机设备及存储介质 | |
Salinas et al. | Cityhub: A library for urban data integration | |
Cui et al. | Research on the driving forces of urban hot spots based on exploratory analysis and binary logistic regression model | |
Souza et al. | Exploratory spatial analysis of housing prices obtained from web scraping technique | |
Aydinoglu et al. | Comparing modelling performance and evaluating differences of feature importance on defined geographical appraisal zones for mass real estate appraisal | |
Wood et al. | Agroecological aspects of evaluating agricultural R&D | |
CN112579983B (zh) | 一种出行调查抽样的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |