CN105426387B - 一种基于K-means算法的地图聚合方法 - Google Patents

一种基于K-means算法的地图聚合方法 Download PDF

Info

Publication number
CN105426387B
CN105426387B CN201510697813.5A CN201510697813A CN105426387B CN 105426387 B CN105426387 B CN 105426387B CN 201510697813 A CN201510697813 A CN 201510697813A CN 105426387 B CN105426387 B CN 105426387B
Authority
CN
China
Prior art keywords
cluster
marker
list
map
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510697813.5A
Other languages
English (en)
Other versions
CN105426387A (zh
Inventor
杨田镁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201510697813.5A priority Critical patent/CN105426387B/zh
Publication of CN105426387A publication Critical patent/CN105426387A/zh
Application granted granted Critical
Publication of CN105426387B publication Critical patent/CN105426387B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G09EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
    • G09BEDUCATIONAL OR DEMONSTRATION APPLIANCES; APPLIANCES FOR TEACHING, OR COMMUNICATING WITH, THE BLIND, DEAF OR MUTE; MODELS; PLANETARIA; GLOBES; MAPS; DIAGRAMS
    • G09B29/00Maps; Plans; Charts; Diagrams, e.g. route diagram
    • G09B29/10Map spot or coordinate position indicators; Map reading aids

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Educational Technology (AREA)
  • Educational Administration (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于K‑means算法的地图聚合方法,通过对视野范围内的标志物列表先进行聚合分类,使每一个标志物都找到自己的目标聚簇,形成最终的聚簇列表,再对聚簇列表中的每一个聚簇应用K‑means算法计算每一个聚簇的中心点,最后将所述中心点显示在地图上,实现了用少量的点来表示地图中的所有点,使地图显示的更清晰、明朗。

Description

一种基于K-means算法的地图聚合方法
技术领域
本发明实施例涉及地图数据处理技术领域,尤其涉及一种基于K-means算法的地图聚合方法。
背景技术
随着互联网地高速发展,数据已经渗透到每行每业中,逐渐成为重要的生产因素,伴随而来的是人类可以进行分析和处理的海量数据,称之为大数据。如今在中型以上的城市如北京、上海等,每天在网络行为中产生的各类数据已经非常庞大。
在地理信息系统(Geographic Information System,GIS)中,一个兴趣点(Pointof Interest,POI)可以是一栋房子、一个商铺、一个邮筒以及一个公交站等。传统的地理信息采集方法需要地图测绘专业人员采用精密的测绘仪器去获取一个兴趣点的经纬度,然后再标记下来。采集每一个POI是一个非常耗时耗力的工作,同时,POI的数量在一定程度上又代表着整个GIS的价值。每个POI包含四方面信息:名称、类别、经度和纬度,完整的POI信息是丰富导航地图的必备资讯,而及时的POI能提醒用户路况的分支及周边建筑的详细信息,也能方便导航查到用户所需要的各个地方,选择最为便捷和通畅的道路来进行路径规划,因此,导航地图中的POI数量直接影响了导航的质量和效率。
正是因为在电子地图中有着大量的POI,在使用电子地图时,通常会遇到在某个地区包含成千上万个POI的情况,若同时加载显示在电子地图中,会显得很乱,甚至覆盖地图底图,也会占用大量系统资源,甚至引发浏览器的崩溃或者卡顿,极大地影响用户体验。因此当数据量过大时,通过一种方法对数据进行处理显得非常有必要。
发明内容
本发明提供一种基于K-means算法的地图聚合方法,以实现标志物在地图上显示的更清晰明朗。
第一方面,本发明实施例提供了一种基于K-means算法的地图聚合方法。该方法包括:
S1、查询地图上视野范围内的标志物列表;
S2、根据所述标志物列表创建聚簇列表,提取所述标志物列表中的一个标志物作为当前标志物;
S3、判断所述当前标志物与所述聚簇列表中的每一个聚簇之间的距离,是否小于预设距离,若是,则将对应的聚簇作为所述当前标志物的目标聚簇,继续执行步骤S4,否则,执行步骤S6;
S4、判断所述当前标志物是否在目标聚簇的网格范围内,如果在,则将所述当前标志物加入到所述目标聚簇的标志物列表中,否则,执行步骤S6;
S5、判断所述标志物列表中是否存在下一个未确定目标聚簇的标志物,若是,则作为当前标志物,并返回执行步骤S3,若否,则执行步骤S7;
S6、以所述当前标志物为聚簇中心,建立新的聚簇,并将该聚簇加入到步骤S2中的聚簇列表中,返回步骤S5;
S7、对聚簇列表中的每一个聚簇应用K-means算法得到每个聚簇的中心点;
S8、将所述中心点在地图上进行显示。
进一步地,所述标志物列表中的每一个标志物包括:名称、类别、经度以及纬度信息。
优选的,根据所述标志物列表创建聚簇列表,包括:从所述标志物列表中选取设定数量的标志物,添加至聚簇列表中。
示例性地,判断所述当前标志物是否在目标聚簇的网格范围内之前,还包括:根据地图的缩放级别确定所述目标聚簇的网格范围。
优选的,所述K-means算法中的k设置为1。
本发明通过对视野范围内的标志物列表先进行聚合分类,使每一个标志物都找到自己的目标聚簇,形成最终的聚簇列表,再对聚簇列表中的每一个聚簇应用K-means算法计算每一个聚簇的中心点,最后将所述中心点显示在地图上,实现了用少量的点来表示地图中的所有点,使地图显示的更清晰、明朗。
附图说明
图1是本发明实施例一中的一种基于K-means算法的地图聚合方法的流程图;
图2是本发明实施例一中的一种K-means算法的流程图;
图3是本发明实施例一中的一种地图显示效果示意图一;
图4是本发明实施例一中的一种地图显示效果示意图二。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
实施例一
图1为本发明实施例一提供的一种基于K-means算法的地图聚合方法的流程图。本实施例可适用于电子地图,当地图上的标志物很多的时候,在地图上表示困难的情况,具体包括如下步骤:
S1、查询地图上视野范围内的标志物列表;
上述步骤具体可以通过调用地理信息系统中的数据库来得到视野范围内的标志物列表。所述视野范围可以是用户所使用终端的显示界面的大小,也可以是根据用户的请求去确定,例如,用户的搜索请求为“天津市东丽区的农业银行”,所述视野范围即为天津市东丽区。
S2、根据所述标志物列表创建聚簇列表,提取所述标志物列表中的一个标志物作为当前标志物,继续执行步骤S3;
优选的,根据所述标志物列表创建聚簇列表,包括:从所述标志物列表中选取设定数量的标志物,添加至聚簇列表中。本步骤为初始聚簇列表的创建,选取的设定数量的标志物即为初始的聚簇,所选的每个标志物即为初始聚簇的中心,可以随机选择,或选择排序在前的,具体选择策略不限。然后计算其他的标志物与每个聚簇之间的距离,首先提取所述标志物列表中的一个标志物作为当前标志物,继续执行步骤S3。
S3、判断所述当前标志物与所述聚簇列表中的每一个聚簇之间的距离,是否小于预设距离,如果是,则将对应的聚簇作为所述当前标志物的目标聚簇,继续执行步骤S4,否则,执行步骤S6;
示例性地,判断所述当前标志物与所述聚簇列表中的每一个聚簇之间的距离,其实质是计算当前标志物与聚簇列表中的每一个聚簇中心的距离,如果小于预设距离,即认为当前标志物与对应的聚簇的相似性最高,将该聚簇作为当前标志物的目标聚簇。如果不满足小于预设距离,即跳转到步骤S6。
进一步地,标志物列表中的每一个标志物的信息包括:名称、类别、经度以及纬度信息。通过一定的数学转换规则,将每一个标志物的信息都用一个数字向量来表示。
S4、判断所述当前标志物是否在目标聚簇的网格范围内,如果在,则将所述当前标志物加入到所述目标聚簇的标志物列表中,否则,执行步骤S6;
当步骤S3中的所述距离小于预设距离时,进一步判断当前标志物是否在目标聚簇的网格范围内,如果在,则将所述当前标志物加入到所述目标聚簇的标志物列表中,否则,执行步骤S6。
示例性地,判断所述当前标志物是否在目标聚簇的网格范围内之前,还包括:根据地图的缩放级别确定所述目标聚簇的网格范围。
S5、判断所述标志物列表中是否存在下一个未确定目标聚簇的标志物,若是,则作为当前标志物,并返回执行步骤S3,若否,则执行步骤S7;
当一个标志物找到了自己的目标聚簇之后,进一步判断标志物列表中的其余标志物是否都已经归类到了相应的目标聚簇总,如果还有未确定目标聚簇的标志物,则将其作为当前标志物,返回步骤S3,去寻找自己的目标聚簇。如果标志物列表中的所有标志物都已经归类到了相应的目标聚簇中,则跳转到步骤S7。
S6、以所述当前标志物为聚簇中心,建立新的聚簇,并将该聚簇加入到步骤S2中的聚簇列表中,返回步骤S5;
如果聚簇列表中不存在某一个标志物的目标聚簇,则以该标志物为中心建立一个新的聚簇,并将该聚簇加入到步骤S2中的聚簇列表中,返回步骤S5继续判断所述标志物列表中是否存在下一个未确定目标聚簇的标志物。
S7、对聚簇列表中的每一个聚簇应用K-means算法得到每个聚簇的中心点;
到此步骤时,所有的标志物都已经归类到了相应的目标聚簇中,但是此时每个聚簇的中心只是地图上网格的形心,并不是网格的质心,不能真实地反应每个标志物的位置,因此需要进一步对每个对聚簇列表中的每一个聚簇应用K-means算法得到每个聚簇的中心点,此中心点即为质心。
示例性地,参见图2,K-means算法的流程图具体为,
a、输入聚类个数(本实施例中即为每个聚簇中的标志物个数);
b、随机初始化k个聚类中心(在本实施例中即随机选取一个聚簇中的k个标志物作为中心点,k设置为1);
c、将各个对象分配到距离最近的聚类中(本实施中的各个对象即为每一个聚簇中的标志物);
上述过程具体为,计算每个标志物与中心点的距离,选取距离最小的中心点作为目标中心点,即为所属的类。
d、重新计算新类的中心点(中心点即为该类别中所有对象的均值);
e、判断聚类的准则函数是否收敛,若是,则输出聚类结果,否则,返回步骤c;所述准则函数为一个聚类中所有对象的误差平方和,准则函数收敛即为即聚类中心不再发生变化。
f、输出聚类结果。
S8、将所述中心点在地图上进行显示。
参见图3和图4,为采用K-means算法处理后的数据在地图上显示的效果图,使得当在地图上进行展示的数据量过大时,通过进行点聚合算法,实现了用少量的点来表示地图中的所有点,使地图显示的更清晰、明朗。
本实施例的技术方案,通过对视野范围内的标志物列表先进行聚合分类,使每一个标志物都找到自己的目标聚簇,形成最终的聚簇列表,再对聚簇列表中的每一个聚簇应用K-means算法计算每一个聚簇的中心点,最后将所述中心点显示在地图上,实现了用少量的点来表示地图中的所有点,使地图显示的更清晰、明朗。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (3)

1.一种基于K-means算法的地图聚合方法,其特征在于,包括:
S1、查询地图上视野范围内的标志物列表;
S2、从所述标志物列表中随机选取或顺序选取设定数量的标志物,添加至聚簇列表中,提取所述标志物列表中的一个标志物作为当前标志物;
S3、判断所述当前标志物与所述聚簇列表中的每一个聚簇之间的距离,是否小于预设距离,若是,则将对应的聚簇作为所述当前标志物的目标聚簇,继续执行步骤S4,否则,执行步骤S6;
S4、根据地图的缩放级别确定所述目标聚簇的网格范围,判断所述当前标志物是否在目标聚簇的网格范围内,如果在,则将所述当前标志物加入到所述目标聚簇的标志物列表中,否则,执行步骤S6;
S5、判断所述标志物列表中是否存在下一个未确定目标聚簇的标志物,若是,则作为当前标志物,并返回执行步骤S3,若否,则执行步骤S7;
S6、以所述当前标志物为聚簇中心,建立新的聚簇,并将该聚簇加入到步骤S2中的聚簇列表中,返回步骤S5;
S7、对聚簇列表中的每一个聚簇应用K-means算法得到每个聚簇的中心点,所述中心点为聚簇的质心;
S8、将所述中心点在地图上进行显示。
2.根据权利要求1所述的方法,其特征在于,所述标志物列表中的每一个标志物包括:名称、类别、经度以及纬度信息。
3.根据权利要求1所述的方法,其特征在于,所述K-means算法中的k设置为1。
CN201510697813.5A 2015-10-23 2015-10-23 一种基于K-means算法的地图聚合方法 Active CN105426387B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510697813.5A CN105426387B (zh) 2015-10-23 2015-10-23 一种基于K-means算法的地图聚合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510697813.5A CN105426387B (zh) 2015-10-23 2015-10-23 一种基于K-means算法的地图聚合方法

Publications (2)

Publication Number Publication Date
CN105426387A CN105426387A (zh) 2016-03-23
CN105426387B true CN105426387B (zh) 2020-02-07

Family

ID=55504599

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510697813.5A Active CN105426387B (zh) 2015-10-23 2015-10-23 一种基于K-means算法的地图聚合方法

Country Status (1)

Country Link
CN (1) CN105426387B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106528597B (zh) * 2016-09-23 2019-07-05 百度在线网络技术(北京)有限公司 兴趣点的标注方法以及装置
CN106933947B (zh) * 2017-01-20 2018-12-04 北京三快在线科技有限公司 一种搜索方法及装置、电子设备
CN110555088A (zh) * 2019-08-30 2019-12-10 高新兴科技集团股份有限公司 一种电子地图标签聚合方法
CN112764859A (zh) * 2021-01-22 2021-05-07 泰华智慧产业集团股份有限公司 网格化平台地图在移动端中网格员位置显示方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149759A (zh) * 2007-11-09 2008-03-26 山西大学 一种基于邻域模型的K-means初始聚类中心选择方法
CN103927336A (zh) * 2014-03-26 2014-07-16 北京邮电大学 基于地理位置的数据聚类挖掘系统及方法
CN104090959A (zh) * 2014-07-14 2014-10-08 国家电网公司 一种基于地理信息系统的信息点聚类方法
CN104102637A (zh) * 2013-04-02 2014-10-15 高德软件有限公司 一种生成热点区域的方法及装置
CN104376057A (zh) * 2014-11-06 2015-02-25 南京邮电大学 一种基于最大最小距离和K-means的自适应聚类方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150193446A1 (en) * 2014-01-07 2015-07-09 Microsoft Corporation Point(s) of interest exposure through visual interface

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101149759A (zh) * 2007-11-09 2008-03-26 山西大学 一种基于邻域模型的K-means初始聚类中心选择方法
CN104102637A (zh) * 2013-04-02 2014-10-15 高德软件有限公司 一种生成热点区域的方法及装置
CN103927336A (zh) * 2014-03-26 2014-07-16 北京邮电大学 基于地理位置的数据聚类挖掘系统及方法
CN104090959A (zh) * 2014-07-14 2014-10-08 国家电网公司 一种基于地理信息系统的信息点聚类方法
CN104376057A (zh) * 2014-11-06 2015-02-25 南京邮电大学 一种基于最大最小距离和K-means的自适应聚类方法

Also Published As

Publication number Publication date
CN105426387A (zh) 2016-03-23

Similar Documents

Publication Publication Date Title
CN110765219B (zh) 地理围栏生成方法、装置、计算机设备和存储介质
CN109376761B (zh) 一种地址标识及其经纬度的挖掘方法及装置
CN109478184B (zh) 识别、处理和显示数据点聚类
CN106681996B (zh) 确定地理范围内兴趣区域、兴趣点的方法和装置
CN110726418A (zh) 兴趣点区域确定方法、装置、设备及存储介质
CN105426387B (zh) 一种基于K-means算法的地图聚合方法
KR20160100809A (ko) 목표 주소를 확정하기 위한 방법 및 장치
CN106055607B (zh) 用户到访预测模型建立、用户到访预测方法和装置
CN106919567B (zh) 一种兴趣点poi地址的处理方法及装置
CN111651685A (zh) 一种兴趣点获取方法、装置、电子设备及存储介质
CN110556049B (zh) 一种地图数据处理方法、装置、服务器和存储介质
CN108204819B (zh) 一种地图数据自动检测方法和装置、及混合导航系统
CN112861972B (zh) 一种展业区域的选址方法、装置、计算机设备和介质
US10473476B2 (en) Vehicle routing guidance to an authoritative location for a point of interest
CN110309433B (zh) 一种数据处理方法、装置及服务器
CN110263840B (zh) 一种线路分析方法、装置及程序产品、存储介质
CN109688532A (zh) 一种划分城市功能区域的方法及装置
CN105183769B (zh) 基于流数据立方体的轨迹数据原位可视化方法
US20160323159A1 (en) Determining Semantic Place Names from Location Reports
CN103826299A (zh) 基于无线信号感知的室内增强现实实现方法
Kim et al. A simplified linear feature matching method using decision tree analysis, weighted linear directional mean, and topological relationships
US20150339848A1 (en) Method and apparatus for generating a composite indexable linear data structure to permit selection of map elements based on linear elements
CN111880144A (zh) 定位方法、装置、设备和存储介质
CN112700531A (zh) 一种融合矢量户型图的建筑物倾斜模型分层分户显示方法
CN106528559B (zh) 一种位置信息的提供方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant