CN109947881A - 一种poi判重方法、装置、移动终端及计算机可读存储介质 - Google Patents

一种poi判重方法、装置、移动终端及计算机可读存储介质 Download PDF

Info

Publication number
CN109947881A
CN109947881A CN201910143340.2A CN201910143340A CN109947881A CN 109947881 A CN109947881 A CN 109947881A CN 201910143340 A CN201910143340 A CN 201910143340A CN 109947881 A CN109947881 A CN 109947881A
Authority
CN
China
Prior art keywords
poi
point
data
weight
fused
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910143340.2A
Other languages
English (en)
Other versions
CN109947881B (zh
Inventor
陈韵
沈宇臻
吴卫
钟家晖
黄玲
李闯
何晓明
邱浩锋
陈婷
才翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Planning And Natural Resources Automation Center Guangzhou Basic Geographic Information Center
Guangzhou Urban Planning Technology Development Service Co ltd
Original Assignee
GUANGZHOU CITY PLANNING AUTOMATION CENTER
Guangzhou Urban Planning Technology Development Service Department
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GUANGZHOU CITY PLANNING AUTOMATION CENTER, Guangzhou Urban Planning Technology Development Service Department filed Critical GUANGZHOU CITY PLANNING AUTOMATION CENTER
Priority to CN201910143340.2A priority Critical patent/CN109947881B/zh
Publication of CN109947881A publication Critical patent/CN109947881A/zh
Application granted granted Critical
Publication of CN109947881B publication Critical patent/CN109947881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种POI判重方法、装置、终端设置及计算机可读存储介质,方法包括获取原始POI数据及待融合POI数据;依次将原始POI数据的每一POI点与待融合POI数据进行模糊判重;其中,原始POI数据的任一POI点与待融合POI数据进行模糊判重,具体步骤如下:将原始POI数据中的任意一POI点作为待比对POI点,继而以待比对POI点为圆心,建立空间几何圆,并将待融合POI数据中落入空间几何圆内的POI点作为待判重POI点;提取待比对POI点和每一待判重POI点的若干属性特征向量;根据属性特征向量,计算每一待判重POI点与待比对POI点的欧式距离,继而根据各欧式距离,进行判重。通过实施本发明的实施例,能够提高POI判重的精准度及效率。

Description

一种POI判重方法、装置、移动终端及计算机可读存储介质
技术领域
本发明涉及地理信息数据处理技术领域,尤其涉及一种POI判重方法、装置、移动终端及计算机可读存储介质。
背景技术
POI(Point of Interest),兴趣点,指地理信息系统中用于查询、导航、标注等作用而具有名称、类别、坐标、分类属性信息的点要素。POI宏观来讲是动态变化的,随着时间的变化,POI点的空间位置及属性信息都可能发生变化,为了确保POI实际应用中的有效性和现势性,则需要对POI数据进行周期性的更新,而POI数据的室外采集则需要耗费大量的人力物力,因此在实际作业生产中,POI的更新一般通过采购其他来源的最新POI数据(以下简称待融合数据),通过这种方式进行更新,可节省大量的人力物力及保证更新现势性。由于不同数据来源间存在大量重复POI点,而目前仅仅利用兴趣点的空间位置或名称信息进行,这种单一的描述信息判别两个POI是否为同一点,不够精确容易产生误判,其次在现有的判重方法中,在判断原始数据中某一POI是否在待融合数据中存在与之重复的POI点时,需要将原始数据中的一POI与待融合中数据的所有POI进行逐一的比对,判重效率较低。
发明内容
本发明实施例提供一种POI判重方法、装置、移动终端及计算机可读存储介质,能提高POI判重的精准度及效率。
本发明一实施例提供一种POI判重方法,包括:获取原始POI数据及待融合POI数据;
依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重;其中,原始POI数据的任一POI点与所述待融合POI数据进行模糊判重,具体步骤如下:
将所述原始POI数据中的任意一POI点作为待比对POI点,继而以所述待比对POI点为圆心,建立空间几何圆,并将所述待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点;
提取所述待比对POI点和每一待判重POI点的若干属性特征向量;
根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。
进一步的,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之前还包括:
以所述原始POI数据为基准,对所述待融合POI数据进行属性表重构、属性转换以及空间参考转换。
进一步的,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之前,还包括:
将原始POI数据的每一POI点逐一与所述待融合POI数据进行绝对判重,并剔除所述待融合POI数据中所有重复POI点;
其中,所述原始POI数据的任一POI点与所述待融合POI数据进行绝对判重的具体步骤如下:
将所述原始POI数据中的任意一POI点作为第二待比对POI点,继而以所述第二待比对POI点为圆心,建立第二空间几何圆,并将所述待融合POI数据中落入所述第二空间几何圆内的POI点,作为第二待判重POI点;
将各所述第二待判重POI点逐一与所述第二待比对POI点进行比对,并将与所述第二待比对POI点名称相同的第二待判重POI点,作为所述重复POI点。
可选的,所述根据各所述欧式距离进行判重,具体为:
根据各所述欧式距离,计算各所述待判重POI点与所述待比对POI点的相似度,并将相似度最高的待判重POI点作为所述待比对POI点的重复点。
可选的,所述根据各所述欧式距离进行判重,具体为:
根据各所述欧式距离,计算各所述待判重POI点与所述待比对POI点的相似度,并将相似度超过预设阈值的待判重POI点作为重复点。
进一步的,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之后,还包括:
剔除所述待融合POI数据中的所有第二重复POI点,获得第二待融合POI数据;其中,所述第二重复POI点为根据模糊判重,在所述待融合POI数据中筛选出的与所述原始POI数据重复的POI点;
根据预设的异称词汇库,依次将所述原始POI数据的每一POI点与所述第二待融合POI数据进行异称判重;
其中,原始POI数据的任一POI点与所述第二待融合POI数据进行异称判重,具体步骤如下:
将所述原始POI数据中的任意一POI点作为第三待比对POI点,继而以所述第三待比对POI点为圆心,建立第三空间几何圆,并将所述第二待融合POI数据中落入所述第三空间几何圆内的POI点,作为第三待判重POI点;
根据所述异称词汇库,获得所述第三待比对POI点及所有所述第三待判重POI点的标准名称;
将所述第三待比对POI点的标准名称逐一与各所述第三待判重POI点的标准名称进行比对,进行判重。
进一步的,所述属性特征向量包括:POI名称、地址祥址和空间距离。
本发明另一实施例对应提供了一种POI判重装置,其特征在于,包括:包括数据获取模块及模糊判重模块,所述模糊判重模块包括待判重POI点获取单元、属性特征向量获取单元以及判重单元;
其中,所述数据数据获取模块,用于获取原始POI数据及待融合POI数据;
所述模糊判重模块,用于依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重;
所述待判重POI点获取单元,用于将所述原始POI数据中的任意一POI点作为待比对POI点,继而以所述待比对POI点为圆心,建立空间几何圆,并将所述待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点;
所述属性特征向量获取单元,用于提取所述待比对POI点和每一待判重POI点的属性特征向量;
所述判重单元,用于根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。
本发明另一实施例提供了一种POI判重终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现上述发明实施例所述的POI判重方法。
本发明另一实施例提供了一种计算机存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行上述发明实施例所述的POI判重方法。
通过实施本发明的实施例具有如下有益效果:
本发明实施例提供了一种POI判重方法,在获取原始POI数据和待融合POI数据后进行模糊判重,具体的先以原始POI数据中的任意一POI点作为待比对POI点,继而以待比对POI点为圆心,建立空间几何圆,并将待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点,这一步在建立的空间几何圆内筛选出待判重POI点,使得在对原始POI数据的每一POI点进行判重时,不需要遍历待融合POI数据的所有POI点,减小了数据的处理量,提高了判重效率,紧接着,提取待比对POI点和每一待判重POI点的属性特征向量;根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。通过提取多个属性特征向量,并利用欧式距离来进行判重,相比与现有技术根据名称信息或空间位置,单一的判重方式来说,能筛选将实质上为同一POI但名称不同的POI点,增强了鲁棒性提高了判重的准确度。
附图说明
图1是本发明一实施例提供的一种POI判重方法的流程示意图。
图2是本发明一实施例提供的原始数据的任一POI点与待融合POI数据模糊判重的流程示意图。
图3是本发明一实施例提供的POI判重方法中空间几何圆的示意图。
图4是本发明另一实施例提供的一种POI判重方法的流程示意图。
图5是本发明一实施例提供的一种POI判重装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明一实施例提供的一种POI判重方法包括步骤:
S101、获取原始POI数据及待融合POI数据。
S102、依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重。
对于步骤S101、需要说明的是,待融合POI数据可以直接从一些专业类服务网站上抓取或者购买(例如大众点评,携程),或者直接从google,百度,高德的地图服务上的标注中进行筛选和获取。当然待融合POI数据的获取方式是多样的,上述待融合POI数据的获取方式,仅仅是示意性的,并不作为待融合POI数据获取方式的限定。
对于步骤S102、在获取原始POI数据及待融合POI数据后,需要将原始POI数据的每一个POI点与待融合POI数据中的POI点进行比对,进行模糊判重。
如图2所示,具体的,原始POI数据的任一POI点与所述待融合POI数据进行模糊判重,具体步骤包括:
S201、将所述原始POI数据中的任意一POI点作为待比对POI点,继而以所述待比对POI点为圆心,建立空间几何圆,并将所述待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点。
S202、提取所述待比对POI点和每一待判重POI点的属性特征向量。
S203、根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。
对于步骤S201、如图3所示假设a点、b点、c点、d点都为原始POI数据中的POI点,以任意一原始数据的POI点为待比对POI,例如以a点为待比对POI点,判断待融合POI数据中与点a对应的重复点,此时先以点a为圆心,以预设阈值R为半径,建立空间几何圆,则落入所述空间几何圆的待融合POI数据中的POI点如点1,点2,点3,作为待判重POI点,则此时在对a点进行判重的时候只需将a点依次与点1、点2、点3进行比对即可。
对于步骤202、根据实际情况来选择属性特征向量,在选择好属性特征向量后,提取待比对POI点和每一待判重POI点的属性特征向量。
在一个优选的实施例中,属性特征向量包括POI名称、地址详址和空间距离。
需要说明的是,属性特征向量的选取是根据实际情况进行选择的,除了POI名称、地址详址和空间距离,还可以包括“简称”“code”。也可以为上述提及的各属性特征向量的任意组合。可以理解的是,对于本实施例未提及POI点的属性特征向量,也在本发明的保护范围内。结合步骤S201的说明,在一个优选的实施例中,步骤202可以具体为:提取点a、点1、点2和点3,这4个点的POI名称、地址详址和空间距离。
对于步骤S203、在一个优先的实施例中,以“POI名称”、“地址祥址”、“空间距离”作为欧几里德相似度测量的多属性特征。
在了解多属性特征欧几里德相似度测量之前,需要了解文本相似度测量方法。
句子相似度测量实现——余弦相似度算法
第一步:文本输入
语句1——广东省广州市海珠区警安路1号
语句2——广东省广州市警安路1号大厦
第二步:分词(分词原理为马尔科夫链中求p(c1)p(c1/c2)p(c1c2/c3)....p(c1c2...cm-1/cm)最大)
语句1分词——广东/省/广州/市/海/珠/区/警/安/路/1/号
语句2分词——广东/省/广州/市/警/安/路/1/号/大厦
第三步:关键词汇总
广东省广州市海珠区警安路1号大厦
第四步:生成词汇频率向量
T1=[1 1 1 1 1 1 1 1 1 1 1 1 0]
T2=[1 1 1 1 0 0 0 1 1 1 1 1 1]
第五步:计算相似度
根据余弦计算公式:
可得cos(T1,T2)=0.822,且所得值越接近1,表示相似度越高,反之,则相似度越低,本专利中为使得名称相似度和地址详址相似度与实际距离统一标准,故在本专利中,名称相似度、地址祥址相似度皆为1减去实际相似度,即
Na=1-实际相似度(COS)
Ada=1-实际相似度(COS)
知悉上述原理之后,则设Na为基础POI数据点a与圆心名称相似度,Ada为对应的地址祥址相似度,Disa为点a到圆心的实际距离,其中i,j为点a的平面坐标。而由于在遍历过程中将以基础POI点数据作为圆心建立几何约束,故本发明中Na=0,Ada=0,i=0,j=0,Disa=0,既圆心a的属性特征为Fa={0,0,0}。
同理,则有N1为更新POI数据点1与圆心的名称相似度,Ad1为对应的地址祥址相似度,Dis1为点1到圆点的实际距离,其中u,v为点1的平面坐标。则更新POI点1的属性特征为F1={N1,Ad1,Dis1}。
在以半径为R的几何圆形约束下,首先建立欧几里德特征向量,由于分量量纲不一致,故需进行分量标准化。
其次,计算两个POI点之间的欧氏距离。距离越小,其相似性度就越大。反之,相似性度就越小。
设建立{x,y,z}为欧几里德特征向量,则点a、点1的特征向量如下式
Fa={xa,ya,za}
F1={x1,y1,z1} (1)
从式1可知,相当于已经知道点a与点1在三维空间的坐标,据此,可计算出点a与点1的欧式距离dem(a,1)。如下式。
同理计算出点a和点2的欧式距离:dem(a,2),点a与点3的欧式距离dem(a,3)。在计算出了各欧式距离后,进行判重;具体的判重方式包括但不限于以下两种;
第一种方式,在一个可选的实施例中,根据各所述欧式距离进行判重,具体为:
根据各所述欧式距离,计算各所述待判重POI点与所述待比对POI点的相似度,并将相似度最高的待判重POI点作为所述待比对POI点的重复点。欧式距离越小,相似度越高;在这种方式中,不考虑每种POI数据采集时的偶然误差的情况下,则两种POI数据融合时,每个POI最多重复一个,故根据欧式距离大小进行排序后,只需排查欧式距离值最小的点,即相似度最高的点,即可作为待比对POI点的重复点。
第二种方式,在一个可选的实施例中,根据各所述欧式距离进行判重,具体为:根据各所述欧式距离,计算各所述待判重POI点与所述待比对POI点的相似度,并将相似度超过预设阈值的待判重POI点作为重复点。
欧式距离越小,相似度越高;在这种方式中,考虑到待比对POI点在待融合POI数据中可能不存在重复点,也可能存在多个重复点,通过选取适当的阈值进行判重。
通过上述步骤S201、S202和步骤S203,可实现对原始POI数据中的任一POI点的判重,遍历原始POI数据中的每一POI点,重复执行步骤S201、S202和步骤S203,可完成原始POI数据中的所有POI点的模糊判重。
在一个优选的实施例中,在依次将原始POI数据的每一POI点与待融合POI数据进行模糊判重之前还包括:
以所述原始POI数据为基准,对所述待融合POI数据进行属性表重构、属性转换以及空间参考转换。
由于采集到的待融合POI数据的属性表结构不一定与原始POI数据相同,为实现数据结构统一,故需根据原始POI数据的属性表结构对更新POI数据属性表结构进行重构。
具体实现方式为通过Arcmap,按照原始POI数据的属性表结构生成一个与其结构一致的空属性表,所生成的空属性表中的字段名称、数据存储格式等详细内容皆一致。具体包括:
①Arcmap中新建点要素类(因为POI属于点要素)。
②对新建的点要素类赋予用于此数据中XY坐标的坐标系。(为保持与原始POI一致,选择与原始POI图层一致的坐标系即可)
③构建新要素类的属性表,导入原始POI数据,即可新建一个与原始POI数据一致的属性表。
由于原始数据与更新数据的来源不同,故其采集方式、参考坐标等信息可能有所不同,为了实现二者在空间位置上的统一,需对更新POI数据进行空间参考转换。空间参考转换即空间坐标系转换,如从广州坐标系转为国家2000坐标系。实质上坐标系A到坐标系B的转换是根据二者坐标系之间的特征建立数学转换模型,再根据构建好的数学转换模型进行转换。
属性转换:以原始POI数据属性表结构为基础,依次对更新POI数据的属性信息进行转换。以实现二者之间属性的统一与对接。
该步骤是将完成空间参考转换后的更新POI数据导入新建点要素并使其属性表中各字段属性与新建点要素属性表各字段属性一一对应的过程。具体过程如下
①在新建点要素上加载数据
②新建点要素属性表作为目标字段,待融合POI数据作为匹配源字段,进行一一匹对,完成属性转换。
在一个优选的实施例中,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之前,还包括:
将原始POI数据的每一POI点逐一与所述待融合POI数据进行绝对判重,并剔除所述待融合POI数据中所有重复POI点;
其中,所述原始POI数据的任一POI点与所述待融合POI数据进行绝对判重的具体步骤如下:
将所述原始POI数据中的任意一POI点作为第二待比对POI点,继而以所述第二待比对POI点为圆心,建立第二空间几何圆,并将所述待融合POI数据中落入所述第二空间几何圆内的POI点,作为第二待判重POI点;
将各所述第二待判重POI点逐一与所述第二待比对POI点进行比对,并将与所述第二待比对POI点名称相同的第二待判重POI点,作为所述重复POI点。
可选的,在进行模糊判重之前,先进行绝对判重直接筛除待融合POI数据中,名称与原始POI数据完全相同的POI点。
具体的,先以原始POI数据中的任意一POI点为需要进行绝对判重的第二待比对POI点,再建立第二空间几何圆,第二空间几何圆的建立方式与上述实施例中提及的建立方式一致,在此不再赘述。在建立第二空间几何圆后,找出第二待判重POI点,再将第二待比对POI点的POI名称逐一的与所有第二待判重POI的POI名称进行比对,将名称相同的第二待判重POI点,作为重复POI点。
遍历原始POI数据中的所有POI点,并按上述方式对原始POI数据的每一POI点都进行绝对判重,得到所有的重复POI点,并进行剔除。
在一优选的实施例中,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之后,还包括:
剔除所述待融合POI数据中的所有第二重复POI点,获得第二待融合POI数据;
其中,所述第二重复POI点为根据模糊判重,在所述待融合POI数据中筛选出的与所述原始POI数据重复的POI点;
根据预设的异称词汇库,依次将所述原始POI数据的每一POI点与所述第二待融合POI数据进行异称判重;其中,原始POI数据的任一POI点与所述第二待融合POI数据进行异称判重,具体步骤如下:
将所述原始POI数据中的任意一POI点作为第三待比对POI点,继而以所述第三待比对POI点为圆心,建立第三空间几何圆,并将所述第二待融合POI数据中落入所述第三空间几何圆内的POI点,作为第三待判重POI点;
根据所述异称词汇库,获得所述第三待比对POI点及所有所述第三待判重POI点的标准名称;
将所述第三待比对POI点的标准名称逐一与各所述第三待判重POI点的标准名称进行比对,进行判重。
在通过绝对判重和模糊后可完成大部分判重工作,但由于地名异称关系,导致部分数据无法通过模糊查重剔除,因此需要通过异称判重,在一定程度上解决由于不同地区的语言习惯导致的同物异称问题。
具体的,根据使用地区实际情况,建立一个异称词汇库,并建立对应关系,如“广州塔”=“小蛮腰”=“Canton Tower”;亦可对异称随机生成统一标识。
第一步:地区异称数据收集。除了收集一般异称数据以外,如“广州塔”=“小蛮腰”=“Canton Tower”,还需收集结合地区因素的异称,由于POI采集人员的主观因素,会导致同一POI点可能具有不同的名称,如广东地区“XX馄饨”=“XX云吞”。
第二步:建立异称词汇库。通过SQL新建database,并设置存储数据格式类型。存储方式为建立多个数据子集,每个子集为一类异称数据,如{“广州塔”;“小蛮腰”;“CantonTower”}、{“馄饨”;“云吞”}、{“红薯”;“番薯”}。
第三步:异称判重。
首先,将待融合POI数据中,通过模糊判重后筛选出的重复点即第二重复POI点剔除,获得第二待融合POI数据;
再将选定好的第三待比对POI点和各第三待判重POI,通过建立好的异称词义库对输入值进行查找,获得第三待比对POI点和各第三待判重POI的标准名称,最后进行对比,将标准名称与第三待比对POI点一致的第三待判重POI点作为重复点。
至此完成整个判重的步骤,如图4所示,在一个可选的实施例中,可将上述实施例所提及的POI判重方法进行结合,大致步骤如下:
(1)将待融合POI数据进行数据预处理包括:属性表重构、属性转换以及空间参考转换。
(2)建立几何约束,对原始POI数据的所有POI点进行绝对判重,并剔除待融合POI数据中的重复点。
(3)选择属性特征,计算欧式距离对原始POI数据的所有POI点进行模糊判重,并剔除待融合POI数据中的重复点。
(4)建立异称词汇库,对原始POI数据的所有POI点进行异称判重,完成所有判重步骤。
如图5所示,本发明一实施例提供的一种POI判重装置,其特征在于,包括数据获取模块500及模糊判重模块510,所述模糊判重模块包括待判重POI点获取单元511、属性特征向量获取单元512以及判重单元513;
其中,所述数据获取模块500,用于获取原始POI数据及待融合POI数据;
所述模糊判重模块510,用于依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重;
所述待判重POI点获取单元511,用于将所述原始POI数据中的任意一POI点作为待比对POI点,继而以所述待比对POI点为圆心,建立空间几何圆,并将所述待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点;
所述属性特征向量获取单元512,用于提取所述待比对POI点和每一待判重POI点的属性特征向量;
所述判重单元513,用于根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。
可以理解的是,本装置实施例与上述POI判重方法的方法实施例相对应的,本装置项实施例提供的一种POI判重装置,可以实现上述所有POI判重方法的方法项实施例的所有功能,在此不再赘述。
在本发明方法实施例的基础上又提供了另一实施例;
本发明另一实施例提供了一种POI判重终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现本发明提供的,任意一方法项实施例提供的,任意一项所述的POI判重方法。
在本发明方法实施例的基础上又提供了另一实施例;
本发明另一实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行本发明提供的,任意一方法项实施例提供的所述的POI判重方法。
通过实施本发明的实施例具有如下有益效果:
本发明实施例提供了一种POI判重方法,在获取原始POI数据和待融合POI数据后进行模糊判重,具体的先以原始POI数据中的任意一POI点作为待比对POI点,继而以待比对POI点为圆心,建立空间几何圆,并将待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点,这一步在建立的空间几何圆内筛选出待判重POI点,使得在对原始POI数据的每一POI点进行判重时,不需要遍历待融合POI数据的所有POI点,减小了数据的处理量,提高了判重效率,紧接着,提取待比对POI点和每一待判重POI点的属性特征向量;根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。通过提取多个属性特征向量,并利用欧式距离来进行判重,相比与现有技术根据名称信息或空间位置,单一的判重方式来说,能筛选将实质上为同一POI但名称不同的POI点,增强了鲁棒性提高了判重的准确度。通过建立异称词汇库,进行异称判重进一步提高了判重的准确度。
需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种POI判重方法,其特征在于,包括:
获取原始POI数据及待融合POI数据;
依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重;其中,原始POI数据的任一POI点与所述待融合POI数据进行模糊判重,具体步骤如下:
将所述原始POI数据中的任意一POI点作为待比对POI点,继而以所述待比对POI点为圆心,建立空间几何圆,并将所述待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点;
提取所述待比对POI点和每一待判重POI点的若干属性特征向量;
根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。
2.如权利要求1所述的POI判重方法,其特征在于,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之前还包括:
以所述原始POI数据为基准,对所述待融合POI数据进行属性表重构、属性转换以及空间参考转换。
3.如权利要求1所述的POI判重方法,其特征在于,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之前,还包括:将原始POI数据的每一POI点逐一与所述待融合POI数据进行绝对判重,并剔除所述待融合POI数据中所有重复POI点;
其中,所述原始POI数据的任一POI点与所述待融合POI数据进行绝对判重的具体步骤如下:
将所述原始POI数据中的任意一POI点作为第二待比对POI点,继而以所述第二待比对POI点为圆心,建立第二空间几何圆,并将所述待融合POI数据中落入所述第二空间几何圆内的POI点,作为第二待判重POI点;
将各所述第二待判重POI点逐一与所述第二待比对POI点进行比对,并将与所述第二待比对POI点名称相同的第二待判重POI点,作为所述重复POI点。
4.如权利要求1所述的POI判重方法,其特征在于,所述根据各所述欧式距离进行判重,具体为:
根据各所述欧式距离,计算各所述待判重POI点与所述待比对POI点的相似度,并将相似度最高的待判重POI点作为所述待比对POI点的重复点。
5.如权利要求1所述的POI判重方法,其特征在于,所述根据各所述欧式距离进行判重,具体为:
根据各所述欧式距离,计算各所述待判重POI点与所述待比对POI点的相似度,并将相似度超过预设阈值的待判重POI点作为重复点。
6.如权利要求1所述的POI判重方法,其特征在于,在所述依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重之后,还包括:
剔除所述待融合POI数据中的所有第二重复POI点,获得第二待融合POI数据;
其中,所述第二重复POI点为根据模糊判重,在所述待融合POI数据中筛选出的与所述原始POI数据重复的POI点;
根据预设的异称词汇库,依次将所述原始POI数据的每一POI点与所述第二待融合POI数据进行异称判重;其中,原始POI数据的任一POI点与所述第二待融合POI数据进行异称判重,具体步骤如下:
将所述原始POI数据中的任意一POI点作为第三待比对POI点,继而以所述第三待比对POI点为圆心,建立第三空间几何圆,并将所述第二待融合POI数据中落入所述第三空间几何圆内的POI点,作为第三待判重POI点;
根据所述异称词汇库,获得所述第三待比对POI点及所有所述第三待判重POI点的标准名称;
将所述第三待比对POI点的标准名称逐一与各所述第三待判重POI点的标准名称进行比对,进行判重。
7.如权利要求1任意一项所述的POI判重方法,其特征在于,所述属性特征向量包括:POI名称、地址祥址和空间距离。
8.一种POI判重装置,其特征在于,包括数据获取模块及模糊判重模块,所述模糊判重模块包括待判重POI点获取单元、属性特征向量获取单元以及判重单元;
其中,所述数据数据获取模块,用于获取原始POI数据及待融合POI数据;
所述模糊判重模块,用于依次将所述原始POI数据的每一POI点与所述待融合POI数据进行模糊判重;
所述待判重POI点获取单元,用于将所述原始POI数据中的任意一POI点作为待比对POI点,继而以所述待比对POI点为圆心,建立空间几何圆,并将所述待融合POI数据中落入所述空间几何圆内的POI点作为待判重POI点;
所述属性特征向量获取单元,用于提取所述待比对POI点和每一待判重POI点的属性特征向量;
所述判重单元,用于根据所述属性特征向量,计算每一所述待判重POI点与所述待比对POI点的欧式距离,继而根据各所述欧式距离,进行判重。
9.一种POI判重终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1-7任意一项所述的POI判重方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如权利要求1-7中任意一项所述的POI判重方法。
CN201910143340.2A 2019-02-26 2019-02-26 一种poi判重方法、装置、移动终端及计算机可读存储介质 Active CN109947881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910143340.2A CN109947881B (zh) 2019-02-26 2019-02-26 一种poi判重方法、装置、移动终端及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910143340.2A CN109947881B (zh) 2019-02-26 2019-02-26 一种poi判重方法、装置、移动终端及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109947881A true CN109947881A (zh) 2019-06-28
CN109947881B CN109947881B (zh) 2023-10-27

Family

ID=67007723

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910143340.2A Active CN109947881B (zh) 2019-02-26 2019-02-26 一种poi判重方法、装置、移动终端及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109947881B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111090630A (zh) * 2019-12-16 2020-05-01 中科宇图科技股份有限公司 基于多源空间点数据的数据融合处理方法
CN111400422A (zh) * 2020-03-16 2020-07-10 中国测绘科学研究院 一种多重判据约束的poi匹配方法及装置
CN112507223A (zh) * 2020-12-10 2021-03-16 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN112925773A (zh) * 2019-12-10 2021-06-08 中国再保险(集团)股份有限公司 一种构建行业风险暴露数据库的poi数据清洗与融合方法及装置
CN113127759A (zh) * 2021-04-16 2021-07-16 深圳集智数字科技有限公司 兴趣点处理方法、装置、计算设备及计算机可读存储介质
CN113361233A (zh) * 2021-06-08 2021-09-07 广州城市规划技术开发服务部有限公司 一种标准地址与建筑物关联匹配方法及装置

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101388023A (zh) * 2008-09-12 2009-03-18 北京搜狗科技发展有限公司 电子地图兴趣点数据冗余检测方法和系统
US20110069833A1 (en) * 2007-09-12 2011-03-24 Smith Micro Software, Inc. Efficient near-duplicate data identification and ordering via attribute weighting and learning
CN102279843A (zh) * 2010-06-13 2011-12-14 北京四维图新科技股份有限公司 处理短语数据的方法以及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN104699818A (zh) * 2015-03-25 2015-06-10 武汉大学 一种多源异构的多属性poi融合方法
CN105320657A (zh) * 2014-05-30 2016-02-10 中国电信股份有限公司 兴趣点数据融合方法和系统
CN105808609A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 一种信息点数据冗余的判别方法和设备
CN106777118A (zh) * 2016-12-16 2017-05-31 武汉大学 一种基于模糊字典树的地理词汇快速抽取方法
CN107609186A (zh) * 2017-09-30 2018-01-19 百度在线网络技术(北京)有限公司 信息处理方法及装置、终端设备及计算机可读存储介质
CN107742313A (zh) * 2017-09-26 2018-02-27 华勤通讯技术有限公司 一种应用于矢量空间的数据压缩方法及设备
CN107832404A (zh) * 2017-11-02 2018-03-23 武汉大学 一种poi信息的补全方法
CN108286976A (zh) * 2017-01-09 2018-07-17 北京四维图新科技股份有限公司 一种点云数据的融合方法和装置、以及混合导航系统
CN108629001A (zh) * 2018-05-03 2018-10-09 成都瀚涛天图科技有限公司 一种地理信息大数据的去重方法
CN109284446A (zh) * 2018-08-01 2019-01-29 昆明理工大学 一种poi信息融合方法

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110069833A1 (en) * 2007-09-12 2011-03-24 Smith Micro Software, Inc. Efficient near-duplicate data identification and ordering via attribute weighting and learning
CN101388023A (zh) * 2008-09-12 2009-03-18 北京搜狗科技发展有限公司 电子地图兴趣点数据冗余检测方法和系统
CN102279843A (zh) * 2010-06-13 2011-12-14 北京四维图新科技股份有限公司 处理短语数据的方法以及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN105320657A (zh) * 2014-05-30 2016-02-10 中国电信股份有限公司 兴趣点数据融合方法和系统
CN105808609A (zh) * 2014-12-31 2016-07-27 高德软件有限公司 一种信息点数据冗余的判别方法和设备
CN104699818A (zh) * 2015-03-25 2015-06-10 武汉大学 一种多源异构的多属性poi融合方法
CN106777118A (zh) * 2016-12-16 2017-05-31 武汉大学 一种基于模糊字典树的地理词汇快速抽取方法
CN108286976A (zh) * 2017-01-09 2018-07-17 北京四维图新科技股份有限公司 一种点云数据的融合方法和装置、以及混合导航系统
CN107742313A (zh) * 2017-09-26 2018-02-27 华勤通讯技术有限公司 一种应用于矢量空间的数据压缩方法及设备
CN107609186A (zh) * 2017-09-30 2018-01-19 百度在线网络技术(北京)有限公司 信息处理方法及装置、终端设备及计算机可读存储介质
CN107832404A (zh) * 2017-11-02 2018-03-23 武汉大学 一种poi信息的补全方法
CN108629001A (zh) * 2018-05-03 2018-10-09 成都瀚涛天图科技有限公司 一种地理信息大数据的去重方法
CN109284446A (zh) * 2018-08-01 2019-01-29 昆明理工大学 一种poi信息融合方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925773A (zh) * 2019-12-10 2021-06-08 中国再保险(集团)股份有限公司 一种构建行业风险暴露数据库的poi数据清洗与融合方法及装置
CN111090630A (zh) * 2019-12-16 2020-05-01 中科宇图科技股份有限公司 基于多源空间点数据的数据融合处理方法
CN111400422A (zh) * 2020-03-16 2020-07-10 中国测绘科学研究院 一种多重判据约束的poi匹配方法及装置
CN112507223A (zh) * 2020-12-10 2021-03-16 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN112507223B (zh) * 2020-12-10 2023-06-23 北京百度网讯科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN113127759A (zh) * 2021-04-16 2021-07-16 深圳集智数字科技有限公司 兴趣点处理方法、装置、计算设备及计算机可读存储介质
CN113361233A (zh) * 2021-06-08 2021-09-07 广州城市规划技术开发服务部有限公司 一种标准地址与建筑物关联匹配方法及装置
CN113361233B (zh) * 2021-06-08 2024-01-26 广州城市规划技术开发服务部有限公司 一种标准地址与建筑物关联匹配方法及装置

Also Published As

Publication number Publication date
CN109947881B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
CN109947881A (zh) 一种poi判重方法、装置、移动终端及计算机可读存储介质
Chen et al. TrajCompressor: An online map-matching-based trajectory compression framework leveraging vehicle heading direction and change
Dickerson et al. Two-site Voronoi diagrams in geographic networks
CN102693266B (zh) 搜索数据库的方法、生成索引结构的导航设备和方法
CN103471610B (zh) 一种支持在线、离线双模式的导航方法
CN107292919B (zh) 一种面向空间剖分的多尺度居民地匹配方法
US20150356088A1 (en) Tile-based geocoder
CN104462155A (zh) 一种兴趣点父子关系的建立方法及装置
CN108710663A (zh) 一种基于本体模型的数据匹配方法及系统
CN104657361A (zh) 一种数据处理方法及装置
CN104034340A (zh) 具有反欺骗者机制的导航系统及其操作的方法
CN106934417A (zh) 一种面向混合属性的数据流自适应聚类方法
CN108829804A (zh) 基于距离划分树的高维数据相似性连接查询方法及装置
CN109410329A (zh) 一种雪崩信息提取方法、装置、电子设备及存储介质
CN110019634A (zh) 定量精准的地理空间数据关联方法和装置
CN114595302A (zh) 空间要素的多层级空间关系构建方法、装置、介质及设备
CN111881573A (zh) 一种基于城市内涝风险评估的人口空间分布模拟方法及装置
CN115271564B (zh) 一种公路边坡灾害空间危险性区划方法及终端机
CN111553566A (zh) 一种城市公共服务设施服务范围的界定方法
Sasaki et al. Road segment interpolation for incomplete road data
CN110633890A (zh) 一种土地利用效率判断方法和系统
CN106709011B (zh) 一种基于空间定位簇的位置概念层次消解计算方法
CN109977190A (zh) 面向大规模矢量地图数据的面积查询处理方法及装置
Du et al. Similarity measurements on multi‐scale qualitative locations
CN110325984A (zh) 在图形中进行层次社区检测的系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 510000 West, 19th floor, no.300-1, Dongfeng Middle Road, Hongqiao street, Yuexiu District, Guangzhou City, Guangdong Province

Applicant after: Guangzhou Urban Planning Technology Development Service Co.,Ltd.

Applicant after: GUANGZHOU URBAN PLANNING AUTOMATION CENTER

Address before: Room 805, No. 19-2, Guangwei Road, Yuexiu District, Guangzhou City, Guangdong Province, 510000

Applicant before: GUANGZHOU URBAN PLANNING TECHNOLOGY DEVELOPMENT AND SERVICES STATE-OWNED ENTERPRISE

Applicant before: GUANGZHOU URBAN PLANNING AUTOMATION CENTER

CB02 Change of applicant information
TA01 Transfer of patent application right

Effective date of registration: 20230816

Address after: 510000 West, 19th floor, no.300-1, Dongfeng Middle Road, Hongqiao street, Yuexiu District, Guangzhou City, Guangdong Province

Applicant after: Guangzhou Urban Planning Technology Development Service Co.,Ltd.

Applicant after: Guangzhou planning and natural resources Automation Center (Guangzhou Basic Geographic Information Center)

Address before: 510000 West, 19th floor, no.300-1, Dongfeng Middle Road, Hongqiao street, Yuexiu District, Guangzhou City, Guangdong Province

Applicant before: Guangzhou Urban Planning Technology Development Service Co.,Ltd.

Applicant before: GUANGZHOU URBAN PLANNING AUTOMATION CENTER

TA01 Transfer of patent application right
GR01 Patent grant
GR01 Patent grant