CN112257970A - 一种基于兴趣点大数据的城市功能区自动划分方法 - Google Patents
一种基于兴趣点大数据的城市功能区自动划分方法 Download PDFInfo
- Publication number
- CN112257970A CN112257970A CN201910660712.9A CN201910660712A CN112257970A CN 112257970 A CN112257970 A CN 112257970A CN 201910660712 A CN201910660712 A CN 201910660712A CN 112257970 A CN112257970 A CN 112257970A
- Authority
- CN
- China
- Prior art keywords
- interest
- information
- data
- points
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 32
- 230000000007 visual effect Effects 0.000 claims abstract description 3
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 4
- 235000013361 beverage Nutrition 0.000 claims 1
- 230000000694 effects Effects 0.000 claims 1
- 230000008030 elimination Effects 0.000 claims 1
- 238000003379 elimination reaction Methods 0.000 claims 1
- 238000011156 evaluation Methods 0.000 claims 1
- 238000004451 qualitative analysis Methods 0.000 claims 1
- 230000007261 regionalization Effects 0.000 claims 1
- 238000012216 screening Methods 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 3
- 239000002699 waste material Substances 0.000 abstract description 3
- 238000011835 investigation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000000224 chemical solution deposition Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0631—Resource planning, allocation, distributing or scheduling for enterprises or organisations
- G06Q10/06315—Needs-based resource requirements planning or analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于兴趣点大数据的城市功能区自动划分方法,通过对城市兴趣点进行采集,得到每一个城市兴趣点的数据,将位置信息和属性信息提取并进行标准化处理,通过标准化后的数据进行数据异常和冗余的剔除;结合兴趣点的距离权重和属性权重,通过均值漂移算法,得出聚类结果,将聚类结果进行可视化处理;通过该方法能够有效的减少人力资源的浪费,避免因人为原因造成的城市划分错误;进而提高了工作效率,为决策者提供城市规划的依据。
Description
技术领域
本发明涉及公共交通技术领域,尤其是涉及一种城市功能区域自动划分方法。
背景技术
随着城市的不断发展和扩张,形成了多种具有特定功能的地理区域,如商业区、CBD、居住区、工业区等。对诸类区域在城市中空间分布情况进行准确判别,把握城市整体演变规律,辅助制定有效的城市规划策略具有重要的意义。现阶段采取城市区域划分一般采用实地调查或者问卷调查,这类方法虽然能够有效划分,但是调查时间长,花费大量的人力物力,完成周期长,造成资源浪费,而且调查结果受个人主观因素影响较大,使得城市功能区划分情况受到影响。
发明内容
有鉴于此,本文发明的目的在于提出一种城市功能区域自动划分的方法,能够快速有效的进行城市功能区域划分,不仅能节约成本,更能节省前期人为城市区域划分的时间。
为实现上述目的,本发明提供如下技术方案,包括:
基于二分法获取相应的兴趣点内容并进行标准化,根据兴趣点的均值漂移算法编程软件,确定城市功能区的中心点位置;将中心点投影到该城市底图中,将符合该中心点的数据进行颜色标注,从而实现兴趣点可视化。
本发明带来了以下有益效果:
本发明提供一种自动识别城市功能区聚类的方法,不需要大量人力物力资源,能够根据自身需求设定参数,突出显示需求信息。减少了大量人力,节约成本,减少工作量。避免因为人为因素造成城市划分出现的错误。通过验证,该算法得到划分结果与实际区划分基本一致。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种基于均值漂移算法城市区域自动划分的流程图;
图2为本发明提供的一种二分法兴趣点获取的示意图;
图3为矩形区域分割示意图;
图4为聚类结果城市区域划分示意图。
具体实施方式
为使本发明所述方法的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,兴趣点只是用于地图导航,位置定位等应用,目前有学者进一步开发利用兴趣点做数据挖掘与应用。现有的城市规划,仅仅是通过人力调查获取城市信息,这类方法虽然能够有效划分,但是调查时间长,花费大量人力物力,完成周期长,造成资源浪费,而且调查结果受个人主观因素影响较大,使得城市功能区划分情况受到影响。虽然,通过传统实地调查手段可以更为准确地了解城市各区域的分布情况,但随着城市化进程的加快,城市区域变得复杂化、多样化加大了传统手段勘测城市的难度,致使实地调查已经不能满足快速城市化进程的需求。
本发明采用了数据获取较为简单和大众的兴趣点进行聚类分析城市划分,本发明尝试一种新聚类方法——均值漂移算法。
为便于对本发明所述方法的理解,现对本发明公开一种聚类算法,参见图1所示一种基于兴趣点的均值漂移自动聚类方法,该方法可以包括以下步骤:
首先,通过网络获取兴趣点,为了快速和有效的获取兴趣点,通过二分法获取,结合图2解释其过程与原理:
将检索区域假设成一个充满数据信息集的矩形并将其投影到x-y坐标系中,设ABCD,如图3所示,假设检索区域为矩形ABCD中每个节点都有兴趣点的完整记录。在实验中,使用来表示每个获取数据步骤中兴趣点最大数量。最初的矩形区域已经被程序完全检索覆盖。但是在这种情况下,该区域内兴趣点数量远大于并且应该进一步划分矩形以便可以满足数据提取需求。在初始矩形中,相对侧的中点线连接,将矩形切割成四部分,形成四个区域如下公式所示
将分割后的区域再次进行遍历计数,直到满足某个条件后,停止检索并进行下一步操作,当把所有区域的遍历完成后,这表明该数据信息已经存储完毕。
将属性信息与位置信息中地理信息进行预处理,首先将兴趣点各类信息中的汉字信息赋值成数字信息并将其信息简化为一连串有固定位数的数字,该串数字分为三部分,第一部分将10类属性信息分别赋予0-9;第二部分将经纬度信息存入字符串,第三部分将地理位置信息转换为邮编信息,使其作为地区信息数字化依据的唯一标识。经过数据预处理后,处理后的数据整洁明了,能够大大提高后续处理速度,将预处理后的数据带入算法求解中心点。
均值漂移公式如下:
基于均值漂移算法求出聚类的中心点信息,结合可视化端口如ArcGIS、JavaScript等表现出来。
将可视化的结果与该地真实的城市功能区划分结果进行对比验证其算法的有效性。
应说明的是:以上所述技术方案,仅为本发明的具体实施方式,即本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (9)
1.一种基于兴趣点大数据的城市功能区自动划分方法,其特征在于,方法实施包括以下步骤:
步骤(1)利用二分法采集城市兴趣点信息,提取兴趣点的位置信息和属性信息;
步骤(2)对采集的城市兴趣点信息进行预处理并标准化;
步骤(3)利用均值漂移方法对标准化后的兴趣点进行聚类分析,提取出具有相同属性特征及相近位置的节点,形成城市功能区域;
步骤(4)对城市功能区域化划分结果进行验证,并进行可视化展示。
3.根据权利要求2所示方法,所采集到的兴趣点位置信息(location)包括:经纬度(lat,lng)和所在地区街道(address);属性信息(type)包括餐饮服务、购物超市、酒店、旅游景点、房地产、休闲娱乐、运动健身、医疗服务和教育培训。
4.根据权利要求1所述方法,其特征在于,在步骤(2)中,对所属步骤(1)得到的兴趣点数据,根据位置和属性信息筛选有效字段数据并进行标准化处理,转化成能够被计算机编程执行的表述方式,在数据标准化后,进一步进行数据预处理,剔除冗余数据和错误数据。
5.根据权利要求4所述方法,其特征在于,所述标准化处理过程为,将兴趣点各类信息中的汉字信息赋值成数字信息并将其信息简化为具有特定位数和含义的数字串,如下所示:
{ xxxxxxxxxxxxxx(位置信息)xxxxxx(地理信息) x(存放属性信息)}
其中,地理信息为兴趣点所在区域的邮编信息;位置信息为兴趣点所在位置的经纬度;属性信息为权利要求3所述9类属性信息代码,分别赋予0-8。
6.根据权利要求4所述方法,其特征在于,所述数据预处理包括:
(1)冗余数据剔除,以权利要求5所述的标准化位置信息作为判别依据,如果多个兴趣点中经纬度信息出现重复,则将多余的兴趣点进行剔除;
(2)错误数据剔除,以权利要求5所述的标准化位置信息作为判别依据,当兴趣点位置超出分析区域时,判定为错误数据并将其剔除。
9.根据权利要求1所述的评价方法,其特征在于,所述步骤(4)中,通过跟实际城区功能区与均值漂移得到的结果进行定性分析,验证算法可行性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910660712.9A CN112257970A (zh) | 2019-07-22 | 2019-07-22 | 一种基于兴趣点大数据的城市功能区自动划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910660712.9A CN112257970A (zh) | 2019-07-22 | 2019-07-22 | 一种基于兴趣点大数据的城市功能区自动划分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112257970A true CN112257970A (zh) | 2021-01-22 |
Family
ID=74224483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910660712.9A Pending CN112257970A (zh) | 2019-07-22 | 2019-07-22 | 一种基于兴趣点大数据的城市功能区自动划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112257970A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536153A (zh) * | 2021-06-30 | 2021-10-22 | 北京达佳互联信息技术有限公司 | 兴趣点获取方法、装置、电子设备和存储介质 |
CN114495484A (zh) * | 2021-12-17 | 2022-05-13 | 北京航空航天大学杭州创新研究院 | 基于多源数据层次图聚类算法的公交站点位置推荐方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008224993A (ja) * | 2007-03-12 | 2008-09-25 | Denso It Laboratory Inc | 地図表示装置、地図表示方法およびプログラム |
US20150120392A1 (en) * | 2013-10-25 | 2015-04-30 | Cellco Partnership (D/B/A Verizon Wireless) | Ranking of Store Locations Using Separable Features of Traffic Counts |
US20160377443A1 (en) * | 2015-06-26 | 2016-12-29 | Baidu Online Network Technology (Beijing) Co., Ltd | Method and apparatus for determining a location of a point of interest |
CN106503714A (zh) * | 2016-10-11 | 2017-03-15 | 湖州师范学院 | 一种基于兴趣点数据识别城市功能区的方法 |
CN106649331A (zh) * | 2015-10-29 | 2017-05-10 | 阿里巴巴集团控股有限公司 | 商圈识别方法及设备 |
CN109508585A (zh) * | 2017-09-15 | 2019-03-22 | 中国科学院城市环境研究所 | 一种基于poi和高分辨率遥感影像提取城市功能区的方法 |
CN109582754A (zh) * | 2018-12-10 | 2019-04-05 | 中国测绘科学研究院 | 利用poi数据进行城市主体功能区中心探测的方法 |
CN109857823A (zh) * | 2019-01-04 | 2019-06-07 | 平安科技(深圳)有限公司 | 地图兴趣点获取方法、装置、计算机设备及存储介质 |
-
2019
- 2019-07-22 CN CN201910660712.9A patent/CN112257970A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008224993A (ja) * | 2007-03-12 | 2008-09-25 | Denso It Laboratory Inc | 地図表示装置、地図表示方法およびプログラム |
US20150120392A1 (en) * | 2013-10-25 | 2015-04-30 | Cellco Partnership (D/B/A Verizon Wireless) | Ranking of Store Locations Using Separable Features of Traffic Counts |
US20160377443A1 (en) * | 2015-06-26 | 2016-12-29 | Baidu Online Network Technology (Beijing) Co., Ltd | Method and apparatus for determining a location of a point of interest |
CN106649331A (zh) * | 2015-10-29 | 2017-05-10 | 阿里巴巴集团控股有限公司 | 商圈识别方法及设备 |
CN106503714A (zh) * | 2016-10-11 | 2017-03-15 | 湖州师范学院 | 一种基于兴趣点数据识别城市功能区的方法 |
CN109508585A (zh) * | 2017-09-15 | 2019-03-22 | 中国科学院城市环境研究所 | 一种基于poi和高分辨率遥感影像提取城市功能区的方法 |
CN109582754A (zh) * | 2018-12-10 | 2019-04-05 | 中国测绘科学研究院 | 利用poi数据进行城市主体功能区中心探测的方法 |
CN109857823A (zh) * | 2019-01-04 | 2019-06-07 | 平安科技(深圳)有限公司 | 地图兴趣点获取方法、装置、计算机设备及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113536153A (zh) * | 2021-06-30 | 2021-10-22 | 北京达佳互联信息技术有限公司 | 兴趣点获取方法、装置、电子设备和存储介质 |
CN114495484A (zh) * | 2021-12-17 | 2022-05-13 | 北京航空航天大学杭州创新研究院 | 基于多源数据层次图聚类算法的公交站点位置推荐方法 |
CN114495484B (zh) * | 2021-12-17 | 2023-10-27 | 北京航空航天大学杭州创新研究院 | 基于多源数据层次图聚类算法的公交站点位置推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Demuzere et al. | LCZ Generator: a web application to create Local Climate Zone maps | |
Karagiorgou et al. | On vehicle tracking data-based road network generation | |
CN108415975B (zh) | 基于bdch-dbscan的出租车载客热点识别方法 | |
CN106681996B (zh) | 确定地理范围内兴趣区域、兴趣点的方法和装置 | |
CN112990086B (zh) | 遥感影像建筑物检测方法、装置及计算机可读存储介质 | |
CN104050196B (zh) | 一种兴趣点数据冗余检测方法及装置 | |
CN104330089B (zh) | 一种利用历史gps数据进行地图匹配的方法 | |
CN108427965A (zh) | 一种基于路网聚类的热点区域挖掘方法 | |
CN107133900B (zh) | 城市土地混合利用特征格网计算方法及装置 | |
CN109241846A (zh) | 遥感影像的时空变化估测方法、装置与存储介质 | |
CN112861972A (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
CN115409069A (zh) | 村镇建筑的识别方法、分类方法、装置、电子设备和介质 | |
CN114708521A (zh) | 基于街景图像目标关系感知网络的城市功能区识别方法及系统 | |
Biljecki et al. | Raise the roof: Towards generating LOD2 models without aerial surveys using machine learning | |
CN112257970A (zh) | 一种基于兴趣点大数据的城市功能区自动划分方法 | |
CN112365595A (zh) | 基于报警数据点要素的鉴别交通事故多发点的分析方法 | |
CN111475746B (zh) | 兴趣点位置挖掘方法、装置、计算机设备和存储介质 | |
CN106844642B (zh) | 一种基于gis计算路网网格中人口密度的方法 | |
CN117893383B (zh) | 一种城市功能区域识别方法、系统、终端设备及介质 | |
Eckman et al. | Methods of geo-spatial sampling | |
CN113516060B (zh) | 基于多时相高分辨率数据的建筑空间融合判别方法及装置 | |
CN115796629A (zh) | 传统村落活力量化评价方法及系统、电子设备、存储介质 | |
CN117128977B (zh) | 基于双影像融合的优质绿道路径规划方法、装置及设备 | |
CN118097961A (zh) | 交通流量数据的分析方法、装置、电子设备及存储介质 | |
CN112182125B (zh) | 一种商务集聚区边界识别系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20210122 |