CN112257970A - 一种基于兴趣点大数据的城市功能区自动划分方法 - Google Patents

一种基于兴趣点大数据的城市功能区自动划分方法 Download PDF

Info

Publication number
CN112257970A
CN112257970A CN201910660712.9A CN201910660712A CN112257970A CN 112257970 A CN112257970 A CN 112257970A CN 201910660712 A CN201910660712 A CN 201910660712A CN 112257970 A CN112257970 A CN 112257970A
Authority
CN
China
Prior art keywords
interest
information
data
points
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910660712.9A
Other languages
English (en)
Inventor
郭昊
刘海青
王胜利
刘瑞雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University of Science and Technology
Original Assignee
Shandong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University of Science and Technology filed Critical Shandong University of Science and Technology
Priority to CN201910660712.9A priority Critical patent/CN112257970A/zh
Publication of CN112257970A publication Critical patent/CN112257970A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06315Needs-based resource requirements planning or analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于兴趣点大数据的城市功能区自动划分方法,通过对城市兴趣点进行采集,得到每一个城市兴趣点的数据,将位置信息和属性信息提取并进行标准化处理,通过标准化后的数据进行数据异常和冗余的剔除;结合兴趣点的距离权重和属性权重,通过均值漂移算法,得出聚类结果,将聚类结果进行可视化处理;通过该方法能够有效的减少人力资源的浪费,避免因人为原因造成的城市划分错误;进而提高了工作效率,为决策者提供城市规划的依据。

Description

一种基于兴趣点大数据的城市功能区自动划分方法
技术领域
本发明涉及公共交通技术领域,尤其是涉及一种城市功能区域自动划分方法。
背景技术
随着城市的不断发展和扩张,形成了多种具有特定功能的地理区域,如商业区、CBD、居住区、工业区等。对诸类区域在城市中空间分布情况进行准确判别,把握城市整体演变规律,辅助制定有效的城市规划策略具有重要的意义。现阶段采取城市区域划分一般采用实地调查或者问卷调查,这类方法虽然能够有效划分,但是调查时间长,花费大量的人力物力,完成周期长,造成资源浪费,而且调查结果受个人主观因素影响较大,使得城市功能区划分情况受到影响。
发明内容
有鉴于此,本文发明的目的在于提出一种城市功能区域自动划分的方法,能够快速有效的进行城市功能区域划分,不仅能节约成本,更能节省前期人为城市区域划分的时间。
为实现上述目的,本发明提供如下技术方案,包括:
基于二分法获取相应的兴趣点内容并进行标准化,根据兴趣点的均值漂移算法编程软件,确定城市功能区的中心点位置;将中心点投影到该城市底图中,将符合该中心点的数据进行颜色标注,从而实现兴趣点可视化。
本发明带来了以下有益效果:
本发明提供一种自动识别城市功能区聚类的方法,不需要大量人力物力资源,能够根据自身需求设定参数,突出显示需求信息。减少了大量人力,节约成本,减少工作量。避免因为人为因素造成城市划分出现的错误。通过验证,该算法得到划分结果与实际区划分基本一致。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于均值漂移算法城市区域自动划分的流程图;
图2为本发明提供的一种二分法兴趣点获取的示意图;
图3为矩形区域分割示意图;
图4为聚类结果城市区域划分示意图。
具体实施方式
为使本发明所述方法的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,兴趣点只是用于地图导航,位置定位等应用,目前有学者进一步开发利用兴趣点做数据挖掘与应用。现有的城市规划,仅仅是通过人力调查获取城市信息,这类方法虽然能够有效划分,但是调查时间长,花费大量人力物力,完成周期长,造成资源浪费,而且调查结果受个人主观因素影响较大,使得城市功能区划分情况受到影响。虽然,通过传统实地调查手段可以更为准确地了解城市各区域的分布情况,但随着城市化进程的加快,城市区域变得复杂化、多样化加大了传统手段勘测城市的难度,致使实地调查已经不能满足快速城市化进程的需求。
本发明采用了数据获取较为简单和大众的兴趣点进行聚类分析城市划分,本发明尝试一种新聚类方法——均值漂移算法。
为便于对本发明所述方法的理解,现对本发明公开一种聚类算法,参见图1所示一种基于兴趣点的均值漂移自动聚类方法,该方法可以包括以下步骤:
首先,通过网络获取兴趣点,为了快速和有效的获取兴趣点,通过二分法获取,结合图2解释其过程与原理:
将检索区域假设成一个充满数据信息集的矩形并将其投影到x-y坐标系中,设A
Figure 473950DEST_PATH_IMAGE001
B
Figure 328773DEST_PATH_IMAGE002
C
Figure 46193DEST_PATH_IMAGE003
D
Figure 379086DEST_PATH_IMAGE004
,如图3所示,假设检索区域为矩形ABCD中每个节点都有兴趣点的完整记录。在实验中,使用
Figure 629676DEST_PATH_IMAGE005
来表示每个获取数据步骤中兴趣点最大数量。最初的矩形区域已经被程序完全检索覆盖。但是在这种情况下,该区域内兴趣点数量远大于
Figure 389822DEST_PATH_IMAGE005
并且应该进一步划分矩形以便可以满足数据提取需求。在初始矩形中,相对侧的中点线连接,将矩形切割成四部分,形成四个区域如下公式所示
Figure 594538DEST_PATH_IMAGE006
将分割后的区域再次进行遍历计数,直到满足某个条件后,停止检索并进行下一步操作,当把所有区域的遍历完成后,这表明该数据信息已经存储完毕。
将属性信息与位置信息中地理信息进行预处理,首先将兴趣点各类信息中的汉字信息赋值成数字信息并将其信息简化为一连串有固定位数的数字,该串数字分为三部分,第一部分将10类属性信息分别赋予0-9;第二部分将经纬度信息存入字符串,第三部分将地理位置信息转换为邮编信息,使其作为地区信息数字化依据的唯一标识。经过数据预处理后,处理后的数据整洁明了,能够大大提高后续处理速度,将预处理后的数据带入算法求解中心点。
均值漂移公式如下:
Figure 731122DEST_PATH_IMAGE007
将兴趣点选定的一个坐标信息作为一个起始点
Figure 839148DEST_PATH_IMAGE008
,容许误差
Figure 770195DEST_PATH_IMAGE009
,均值漂移算法循环执行下面四个步骤,直至结束条件满足:
(1)计算
Figure 524525DEST_PATH_IMAGE010
;
(2)把兴趣点赋给
Figure 199219DEST_PATH_IMAGE008
;
(3)如果
Figure 660288DEST_PATH_IMAGE011
,结束循环;若不然,继续执行(1);
(4)将所有兴趣点都作为一个起始点
Figure 464033DEST_PATH_IMAGE012
,进行以上几步遍历,即可以得到聚类的中心点位。
基于均值漂移算法求出聚类的中心点信息,结合可视化端口如ArcGIS、JavaScript等表现出来。
将可视化的结果与该地真实的城市功能区划分结果进行对比验证其算法的有效性。
应说明的是:以上所述技术方案,仅为本发明的具体实施方式,即本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (9)

1.一种基于兴趣点大数据的城市功能区自动划分方法,其特征在于,方法实施包括以下步骤:
步骤(1)利用二分法采集城市兴趣点信息,提取兴趣点的位置信息和属性信息;
步骤(2)对采集的城市兴趣点信息进行预处理并标准化;
步骤(3)利用均值漂移方法对标准化后的兴趣点进行聚类分析,提取出具有相同属性特征及相近位置的节点,形成城市功能区域;
步骤(4)对城市功能区域化划分结果进行验证,并进行可视化展示。
2.根据权利要求1所述方法,其特征在于,在步骤(1)中,利用二分法采集城市兴趣点数据,主要通过如下步骤实现:
步骤(1),以四元坐标组
Figure 826888DEST_PATH_IMAGE001
所形成的矩形区域划定待分析的地理区域,坐标组内每个坐标对代表举行区域四个定点;
步骤(2),取矩形区域对侧边中点连线,将矩形区域划分为四个部分,表示如下:
Figure 878021DEST_PATH_IMAGE002
其中
Figure 740934DEST_PATH_IMAGE003
代表分割后的矩形区域;
步骤(3),依次判断分割后的矩形区域中的兴趣点数量是否小于系统单次检索的最大目标数量,若小于,则提取区域中的兴趣点数据,否则,对不满足条件的矩形区域再次根据上述步骤进行二分,直至所有地理区域遍历完成。
3.根据权利要求2所示方法,所采集到的兴趣点位置信息(location)包括:经纬度(lat,lng)和所在地区街道(address);属性信息(type)包括餐饮服务、购物超市、酒店、旅游景点、房地产、休闲娱乐、运动健身、医疗服务和教育培训。
4.根据权利要求1所述方法,其特征在于,在步骤(2)中,对所属步骤(1)得到的兴趣点数据,根据位置和属性信息筛选有效字段数据并进行标准化处理,转化成能够被计算机编程执行的表述方式,在数据标准化后,进一步进行数据预处理,剔除冗余数据和错误数据。
5.根据权利要求4所述方法,其特征在于,所述标准化处理过程为,将兴趣点各类信息中的汉字信息赋值成数字信息并将其信息简化为具有特定位数和含义的数字串,如下所示:
{ xxxxxxxxxxxxxx(位置信息)xxxxxx(地理信息) x(存放属性信息)}
其中,地理信息为兴趣点所在区域的邮编信息;位置信息为兴趣点所在位置的经纬度;属性信息为权利要求3所述9类属性信息代码,分别赋予0-8。
6.根据权利要求4所述方法,其特征在于,所述数据预处理包括:
(1)冗余数据剔除,以权利要求5所述的标准化位置信息作为判别依据,如果多个兴趣点中经纬度信息出现重复,则将多余的兴趣点进行剔除;
(2)错误数据剔除,以权利要求5所述的标准化位置信息作为判别依据,当兴趣点位置超出分析区域时,判定为错误数据并将其剔除。
7.根据权利要求1所述方法,其特征在于,步骤(3)中,对得到标准化的兴趣点数据进行均值漂移聚类分析,对城市区域内的中心点进行识别,所采用的公式如下所示:
Figure 401461DEST_PATH_IMAGE004
其中
Figure 462958DEST_PATH_IMAGE005
是将所有城市兴趣点的聚类中心点,
Figure 684991DEST_PATH_IMAGE006
是兴趣点的初始位置;
Figure 35201DEST_PATH_IMAGE007
是所有的兴趣点样本;
Figure 883DEST_PATH_IMAGE008
是距离权重函数;
Figure 621614DEST_PATH_IMAGE009
是兴趣点属性权重,不同类型的兴趣点预分配不同的权重;
Figure 811287DEST_PATH_IMAGE010
为兴趣点数量。
8.根据权利要求7所述方法,其特征在于,均值漂移算法中的距离权重函数
Figure 648793DEST_PATH_IMAGE008
描述的方法如下:
利用高斯单位核函数将权重赋值,公式定义为:
Figure 152586DEST_PATH_IMAGE011
其中,
Figure 454255DEST_PATH_IMAGE012
表示目标点距离中心点的距离权重赋值,
Figure 752512DEST_PATH_IMAGE006
为两点之间的位置距离。
9.根据权利要求1所述的评价方法,其特征在于,所述步骤(4)中,通过跟实际城区功能区与均值漂移得到的结果进行定性分析,验证算法可行性。
CN201910660712.9A 2019-07-22 2019-07-22 一种基于兴趣点大数据的城市功能区自动划分方法 Pending CN112257970A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910660712.9A CN112257970A (zh) 2019-07-22 2019-07-22 一种基于兴趣点大数据的城市功能区自动划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910660712.9A CN112257970A (zh) 2019-07-22 2019-07-22 一种基于兴趣点大数据的城市功能区自动划分方法

Publications (1)

Publication Number Publication Date
CN112257970A true CN112257970A (zh) 2021-01-22

Family

ID=74224483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910660712.9A Pending CN112257970A (zh) 2019-07-22 2019-07-22 一种基于兴趣点大数据的城市功能区自动划分方法

Country Status (1)

Country Link
CN (1) CN112257970A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536153A (zh) * 2021-06-30 2021-10-22 北京达佳互联信息技术有限公司 兴趣点获取方法、装置、电子设备和存储介质
CN114495484A (zh) * 2021-12-17 2022-05-13 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008224993A (ja) * 2007-03-12 2008-09-25 Denso It Laboratory Inc 地図表示装置、地図表示方法およびプログラム
US20150120392A1 (en) * 2013-10-25 2015-04-30 Cellco Partnership (D/B/A Verizon Wireless) Ranking of Store Locations Using Separable Features of Traffic Counts
US20160377443A1 (en) * 2015-06-26 2016-12-29 Baidu Online Network Technology (Beijing) Co., Ltd Method and apparatus for determining a location of a point of interest
CN106503714A (zh) * 2016-10-11 2017-03-15 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN106649331A (zh) * 2015-10-29 2017-05-10 阿里巴巴集团控股有限公司 商圈识别方法及设备
CN109508585A (zh) * 2017-09-15 2019-03-22 中国科学院城市环境研究所 一种基于poi和高分辨率遥感影像提取城市功能区的方法
CN109582754A (zh) * 2018-12-10 2019-04-05 中国测绘科学研究院 利用poi数据进行城市主体功能区中心探测的方法
CN109857823A (zh) * 2019-01-04 2019-06-07 平安科技(深圳)有限公司 地图兴趣点获取方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008224993A (ja) * 2007-03-12 2008-09-25 Denso It Laboratory Inc 地図表示装置、地図表示方法およびプログラム
US20150120392A1 (en) * 2013-10-25 2015-04-30 Cellco Partnership (D/B/A Verizon Wireless) Ranking of Store Locations Using Separable Features of Traffic Counts
US20160377443A1 (en) * 2015-06-26 2016-12-29 Baidu Online Network Technology (Beijing) Co., Ltd Method and apparatus for determining a location of a point of interest
CN106649331A (zh) * 2015-10-29 2017-05-10 阿里巴巴集团控股有限公司 商圈识别方法及设备
CN106503714A (zh) * 2016-10-11 2017-03-15 湖州师范学院 一种基于兴趣点数据识别城市功能区的方法
CN109508585A (zh) * 2017-09-15 2019-03-22 中国科学院城市环境研究所 一种基于poi和高分辨率遥感影像提取城市功能区的方法
CN109582754A (zh) * 2018-12-10 2019-04-05 中国测绘科学研究院 利用poi数据进行城市主体功能区中心探测的方法
CN109857823A (zh) * 2019-01-04 2019-06-07 平安科技(深圳)有限公司 地图兴趣点获取方法、装置、计算机设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113536153A (zh) * 2021-06-30 2021-10-22 北京达佳互联信息技术有限公司 兴趣点获取方法、装置、电子设备和存储介质
CN114495484A (zh) * 2021-12-17 2022-05-13 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法
CN114495484B (zh) * 2021-12-17 2023-10-27 北京航空航天大学杭州创新研究院 基于多源数据层次图聚类算法的公交站点位置推荐方法

Similar Documents

Publication Publication Date Title
Demuzere et al. LCZ Generator: a web application to create Local Climate Zone maps
Karagiorgou et al. On vehicle tracking data-based road network generation
CN108415975B (zh) 基于bdch-dbscan的出租车载客热点识别方法
CN106681996B (zh) 确定地理范围内兴趣区域、兴趣点的方法和装置
CN112990086B (zh) 遥感影像建筑物检测方法、装置及计算机可读存储介质
CN104050196B (zh) 一种兴趣点数据冗余检测方法及装置
CN104330089B (zh) 一种利用历史gps数据进行地图匹配的方法
CN108427965A (zh) 一种基于路网聚类的热点区域挖掘方法
CN107133900B (zh) 城市土地混合利用特征格网计算方法及装置
CN109241846A (zh) 遥感影像的时空变化估测方法、装置与存储介质
CN112861972A (zh) 一种展业区域的选址方法、装置、计算机设备和介质
CN115409069A (zh) 村镇建筑的识别方法、分类方法、装置、电子设备和介质
CN114708521A (zh) 基于街景图像目标关系感知网络的城市功能区识别方法及系统
Biljecki et al. Raise the roof: Towards generating LOD2 models without aerial surveys using machine learning
CN112257970A (zh) 一种基于兴趣点大数据的城市功能区自动划分方法
CN112365595A (zh) 基于报警数据点要素的鉴别交通事故多发点的分析方法
CN111475746B (zh) 兴趣点位置挖掘方法、装置、计算机设备和存储介质
CN106844642B (zh) 一种基于gis计算路网网格中人口密度的方法
CN117893383B (zh) 一种城市功能区域识别方法、系统、终端设备及介质
Eckman et al. Methods of geo-spatial sampling
CN113516060B (zh) 基于多时相高分辨率数据的建筑空间融合判别方法及装置
CN115796629A (zh) 传统村落活力量化评价方法及系统、电子设备、存储介质
CN117128977B (zh) 基于双影像融合的优质绿道路径规划方法、装置及设备
CN118097961A (zh) 交通流量数据的分析方法、装置、电子设备及存储介质
CN112182125B (zh) 一种商务集聚区边界识别系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20210122