CN109284446A - 一种poi信息融合方法 - Google Patents

一种poi信息融合方法 Download PDF

Info

Publication number
CN109284446A
CN109284446A CN201810860028.0A CN201810860028A CN109284446A CN 109284446 A CN109284446 A CN 109284446A CN 201810860028 A CN201810860028 A CN 201810860028A CN 109284446 A CN109284446 A CN 109284446A
Authority
CN
China
Prior art keywords
poi
map
poi information
information
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810860028.0A
Other languages
English (en)
Inventor
熊新
吴睿
龙华
邵玉斌
杜庆治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810860028.0A priority Critical patent/CN109284446A/zh
Publication of CN109284446A publication Critical patent/CN109284446A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)

Abstract

本发明涉及一种POI信息融合方法,属于地理信息处理技术领域。首先建立POI信息标准数据库和常见POI信息缩略词替代数据库作为参考数据库;然后对不同地图来源的POI名称和POI地址进行分词;再分别将POI名称和POI地址的分词结果匹配POI信息标准数据库,取与POI信息标准数据库相似度最高的分词结果匹配常见POI信息缩略词替代数据库,完成替代后得到融合后的POI名称和POI地址;最后判断融合后的POI地址中提供信息量最大的地图的来源,确定最终的POI坐标。本发明与现有技术相比,通过结合POI名称、POI地址和POI坐标,主要解决了传统的POI信息融合方法缺少空间数据,同一POI信息在不同的地图中存在着差异,从而使得POI信息融合的准确率低的现象,以提高POI信息融合的准确率。

Description

一种POI信息融合方法
技术领域
本发明涉及一种POI信息融合方法,属于地理信息处理技术领域。
背景技术
近年来,地理信息服务(Geographic Information service,GIS)系统广泛应用于各个行业领域,随着多种应用地图的出现,POI信息作为GIS系统中重要的数据,同一POI信息在不同的地图中存在着差异,这直接影响了用户对POI信息的使用,因此,完善POI信息的融合方法对GIS系统有着重要的意义。
一般地,非空间属性法只考虑非空间属性,不考虑POI坐标,使得缺少空间数据中的信息,从而导致POI信息融合的准确率低;而空间位置法虽然根据POI坐标就能找到相应的对象,解决了空间数据缺少的问题,但是不同来源的POI坐标可能存在误差。
发明内容
本发明要解决的技术问题是针对现有技术的局限和不足,提供一种POI信息融合方法,通过结合POI名称、POI地址和POI坐标对传统的POI信息融合方法进行改进,解决了传统的POI信息融合方法缺少空间数据,同一POI信息在不同的地图中存在着差异,从而使得POI信息融合的准确率低的现象,以提高POI信息融合的准确率。
本发明的技术方案是:一种POI信息融合方法,该方法结合POI名称、POI地址和POI坐标对传统的POI信息融合方法进行改进,具体包括以下6个步骤:
①建立POI信息数据库,包括POI信息标准数据库F和常见POI信息缩略词替代数据库S。
②爬取A地图和B地图的POI信息,包括POI名称、POI地址和POI坐标。
③计算A地图POI信息和B地图POI信息的距离L,若两者之间的距离L大于门限Ω,则该两个POI信息不匹配,不进行任何操作;若两者之间的距离L小于或等于门限Ω,则分别对该两个POI信息的POI名称和POI地址分词,得到A地图POI名称块集合NA、POI地址块集合DA和B地图的POI名称块集合NB、POI地址块集合DB
④将集合NA和NB中的每一个元素和集合DA和DB中的每一个元素分别匹配POI信息标准数据库F,取集合NA和NB以及集合DA和DB中与POI信息标准数据库F匹配后相似度最高的元素组成POI名称块集合NAB和POI地址块集合DAB
⑤将POI名称块集合NAB和POI地址块集合DAB中的元素匹配常见POI信息缩略词替代数据库S,进行常见POI信息缩略词替代,完成替代后得到新的POI名称块集合NAB'和POI地址块集合DAB'作为融合后的最终POI名称和POI地址。
⑥若集合DAB'的最后一个元素来源于A地图,则取A地图的POI坐标作为最终的POI坐标,否则取B地图的POI坐标作为最终的POI坐标。
进一步地,步骤①所述的POI为兴趣点(Point of Interest),在地理信息系统中,POI可以指房子、商铺、公交站等;所述的POI信息标准数据库F用于提供标准化POI信息,包括行政区划词典、街道词典、常见居住区名词典和常见地名词典;所述的常见POI信息缩略词替代数据库S用于实现常见POI信息缩略词的替代。
进一步地,步骤②所述的A地图和B地图的POI信息应在同一个区域内爬取,并且需要一一对应。
进一步地,步骤③所述的距离L的计算公式为:
其中,W为赤道到地球中心的地球半径距离,数值为6378137,单位为米,radE1为A地图中POI信息纬度的弧度,radE2为B地图中POI信息纬度的弧度,radN1为A地图中POI信息经度的弧度,radN2为B地图中POI信息经度的弧度。
进一步地,步骤③所述的门限Ω的大小根据实验结果来确定;所述的A地图POI名称块集合NA、POI地址块集合DA和B地图的POI名称块集合NB、POI地址块集合DB分别表示为:
NA={a1,a2,...,an}
DA={b1,b2,...,bk}
NB={c1,c2,...,cn}
DB={d1,d2,...,dk}
其中,an和cn分别为A地图和B地图的POI名称经过分词后得到的第n个元素,bk和dk分别为A地图和B地图的POI地址经过分词后得到的第k个元素。
进一步地,步骤④所述的匹配POI信息标准数据库F的具体流程是:取集合NA和集合NB的第一个元素进行对比,若元素相同,则取其中任意一个元素作为POI名称块集合NAB的第一个元素,若不相同,则将这两个元素与POI信息标准数据库F中的标准匹配项进行对比,并计算各自与标准匹配项的相似度,取相似度高的元素作为POI名称块集合NAB的第一个元素,以此类推,直到集合NA和集合NB的最后一个元素完成匹配;所述POI地址块集合DAB的获取如上。
进一步地,步骤④所述的相似度的计算公式为:
其中A和B分别表示集合中的元素和POI信息标准数据库F中的标准匹配项,Sim(A,B)表示A和B的相似度,ai和bi为A和B分别拆成字后组成的字频向量中的第i个值。
进一步地,步骤⑤所述的匹配常见POI信息缩略词替代数据库S是指因POI名称块集合NAB和POI地址块集合DAB中的元素可能存在缩略词,从而影响最终的POI信息的融合结果,所以需要将集合NAB和集合DAB中的每一个元素匹配常见POI信息缩略词替代数据库S,完成缩略词替代,以获取更精确的融合输出结果。
进一步地,步骤⑥所述的获取POI坐标的依据是:由于POI地址块集合DAB'的最后一个元素所提供的信息量最高,所以取最后一个元素的来源作为最终的POI坐标。
本发明的有益效果是:本发明与现有技术相比,通过结合POI名称、POI地址和POI坐标,主要解决了传统的POI信息融合方法缺少空间数据,同一POI信息在不同的地图中存在着差异,从而使得POI信息融合的准确率低的现象,以提高POI信息融合的准确率。
附图说明
图1是本发明步骤流程图;
图2是本发明步骤③步骤流程图;
图3是本发明步骤④步骤流程图;
图4是本发明步骤⑤~⑥步骤流程图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1-4所示,一种POI信息融合方法,首先建立POI信息标准数据库和常见POI信息缩略词替代数据库作为参考数据库;然后对不同地图来源的POI名称和POI地址进行分词;再分别将POI名称和POI地址的分词结果匹配POI信息标准数据库,取与POI信息标准数据库相似度最高的分词结果匹配常见POI信息缩略词替代数据库,完成替代后得到融合后的POI名称和POI地址;最后判断融合后的POI地址中提供信息量最大的地图的来源,确定最终的POI坐标。
具体步骤为:
①建立POI信息数据库,包括POI信息标准数据库F和常见POI信息缩略词替代数据库S。
②爬取A地图和B地图的POI信息,包括POI名称、POI地址和POI坐标。
③计算A地图POI信息和B地图POI信息的距离L,若两者之间的距离L大于门限Ω,则该两个POI信息不匹配,不进行任何操作;若两者之间的距离L小于或等于门限Ω,则分别对该两个POI信息的POI名称和POI地址分词,得到A地图POI名称块集合NA、POI地址块集合DA和B地图的POI名称块集合NB、POI地址块集合DB
④将集合NA和NB中的每一个元素和集合DA和DB中的每一个元素分别匹配POI信息标准数据库F,取集合NA和NB以及集合DA和DB中与POI信息标准数据库F匹配后相似度最高的元素组成POI名称块集合NAB和POI地址块集合DAB
⑤将POI名称块集合NAB和POI地址块集合DAB中的元素匹配常见POI信息缩略词替代数据库S,进行常见POI信息缩略词替代,完成替代后得到新的POI名称块集合NAB'和POI地址块集合DAB'作为融合后的最终POI名称和POI地址。
⑥若集合DAB'的最后一个元素来源于A地图,则取A地图的POI坐标作为最终的POI坐标,否则取B地图的POI坐标作为最终的POI坐标。
进一步地,步骤①所述的POI为兴趣点(Point of Interest),在地理信息系统中,POI可以指房子、商铺、公交站等;所述的POI信息标准数据库F用于提供标准化POI信息,包括行政区划词典、街道词典、常见居住区名词典和常见地名词典;所述的常见POI信息缩略词替代数据库S用于实现常见POI信息缩略词的替代。
进一步地,步骤②所述的A地图和B地图的POI信息应在同一个区域内爬取,并且需要一一对应。
进一步地,步骤③所述的距离L的计算公式为:
其中,W为赤道到地球中心的地球半径距离,数值为6378137,单位为米,radE1为A地图中POI信息纬度的弧度,radE2为B地图中POI信息纬度的弧度,radN1为A地图中POI信息经度的弧度,radN2为B地图中POI信息经度的弧度。
进一步地,步骤③所述的门限Ω的大小根据实验结果来确定;所述的A地图POI名称块集合NA、POI地址块集合DA和B地图的POI名称块集合NB、POI地址块集合DB分别表示为:
NA={a1,a2,...,an}
DA={b1,b2,...,bk}
NB={c1,c2,...,cn}
DB={d1,d2,...,dk}
其中,an和cn分别为A地图和B地图的POI名称经过分词后得到的第n个元素,bk和dk分别为A地图和B地图的POI地址经过分词后得到的第k个元素。
进一步地,步骤④所述的匹配POI信息标准数据库F的具体流程是:取集合NA和集合NB的第一个元素进行对比,若元素相同,则取其中任意一个元素作为POI名称块集合NAB的第一个元素,若不相同,则将这两个元素与POI信息标准数据库F中的标准匹配项进行对比,并计算各自与标准匹配项的相似度,取相似度高的元素作为POI名称块集合NAB的第一个元素,以此类推,直到集合NA和集合NB的最后一个元素完成匹配;所述POI地址块集合DAB的获取如上。
进一步地,步骤④所述的相似度的计算公式为:
其中A和B分别表示集合中的元素和POI信息标准数据库F中的标准匹配项,Sim(A,B)表示A和B的相似度,ai和bi为A和B分别拆成字后组成的字频向量中的第i个值。
进一步地,步骤⑤所述的匹配常见POI信息缩略词替代数据库S是指因POI名称块集合NAB和POI地址块集合DAB中的元素可能存在缩略词,从而影响最终的POI信息的融合结果,所以需要将集合NAB和集合DAB中的每一个元素匹配常见POI信息缩略词替代数据库S,完成缩略词替代,以获取更精确的融合输出结果。
进一步地,步骤⑥所述的获取POI坐标的依据是:由于POI地址块集合DAB'的最后一个元素所提供的信息量最高,所以取最后一个元素的来源作为最终的POI坐标。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (6)

1.一种POI信息融合方法,其特征在于:
①建立POI信息数据库,包括POI信息标准数据库F和常见POI信息缩略词替代数据库S;
②爬取A地图和B地图的POI信息,包括POI名称、POI地址和POI坐标;
③计算A地图POI信息和B地图POI信息的距离L,若两者之间的距离L大于门限Ω,则该两个POI信息不匹配,不进行任何操作;若两者之间的距离L小于或等于门限Ω,则分别对该两个POI信息的POI名称和POI地址分词,得到A地图POI名称块集合NA、POI地址块集合DA和B地图的POI名称块集合NB、POI地址块集合DB
④将集合NA和NB中的每一个元素和集合DA和DB中的每一个元素分别匹配POI信息标准数据库F,取集合NA和NB以及集合DA和DB中与POI信息标准数据库F匹配后相似度最高的元素组成POI名称块集合NAB和POI地址块集合DAB
⑤将POI名称块集合NAB和POI地址块集合DAB中的元素匹配常见POI信息缩略词替代数据库S,进行常见POI信息缩略词替代,完成替代后得到新的POI名称块集合NAB'和POI地址块集合DAB'作为融合后的最终POI名称和POI地址;
⑥若集合DAB'的最后一个元素来源于A地图,则取A地图的POI坐标作为最终的POI坐标,否则取B地图的POI坐标作为最终的POI坐标。
2.根据权利要求1所述的POI信息融合方法,其特征在于:所述步骤②所述的A地图和B地图的POI信息应在同一个区域内爬取,并且一一对应。
3.根据权利要求1所述的POI信息融合方法,其特征在于:所述步骤③中距离L的计算公式为:
其中,W为赤道到地球中心的地球半径距离,数值为6378137,单位为米,radE1为A地图中POI信息纬度的弧度,radE2为B地图中POI信息纬度的弧度,radN1为A地图中POI信息经度的弧度,radN2为B地图中POI信息经度的弧度。
4.根据权利要求1所述的POI信息融合方法,其特征在于:所述的A地图POI名称块集合NA、POI地址块集合DA和B地图的POI名称块集合NB、POI地址块集合DB分别表示为:
NA={a1,a2,...,an}
DA={b1,b2,...,bk}
NB={c1,c2,...,cn}
DB={d1,d2,...,dk}
其中,an和cn分别为A地图和B地图的POI名称经过分词后得到的第n个元素,bk和dk分别为A地图和B地图的POI地址经过分词后得到的第k个元素。
5.根据权利要求1所述的POI信息融合方法,其特征在于:所述步骤④的匹配POI信息标准数据库F的具体流程是:取集合NA和集合NB的第一个元素进行对比,若元素相同,则取其中任意一个元素作为POI名称块集合NAB的第一个元素,若不相同,则将这两个元素与POI信息标准数据库F中的标准匹配项进行对比,并计算各自与标准匹配项的相似度,取相似度高的元素作为POI名称块集合NAB的第一个元素,以此类推,直到集合NA和集合NB的最后一个元素完成匹配;所述POI地址块集合DAB的获取如上。
6.根据权利要求1所述的POI信息融合方法,其特征在于:所述步骤④中相似度的计算公式为:
其中A和B分别表示集合中的元素和POI信息标准数据库F中的标准匹配项,Sim(A,B)表示A和B的相似度,ai和bi为A和B分别拆成字后组成的字频向量中的第i个值。
CN201810860028.0A 2018-08-01 2018-08-01 一种poi信息融合方法 Pending CN109284446A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810860028.0A CN109284446A (zh) 2018-08-01 2018-08-01 一种poi信息融合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810860028.0A CN109284446A (zh) 2018-08-01 2018-08-01 一种poi信息融合方法

Publications (1)

Publication Number Publication Date
CN109284446A true CN109284446A (zh) 2019-01-29

Family

ID=65182884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810860028.0A Pending CN109284446A (zh) 2018-08-01 2018-08-01 一种poi信息融合方法

Country Status (1)

Country Link
CN (1) CN109284446A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947881A (zh) * 2019-02-26 2019-06-28 广州城市规划技术开发服务部 一种poi判重方法、装置、移动终端及计算机可读存储介质
CN110288023A (zh) * 2019-06-26 2019-09-27 广州小鹏汽车科技有限公司 融合方法及装置、检测方法、获取方法、服务器和车辆
CN110619088A (zh) * 2019-05-23 2019-12-27 北京无限光场科技有限公司 用于处理信息的方法和装置
CN110619086A (zh) * 2019-05-23 2019-12-27 北京无限光场科技有限公司 用于处理信息的方法和装置
CN110619087A (zh) * 2019-05-23 2019-12-27 北京无限光场科技有限公司 用于处理信息的方法和装置
CN110851547A (zh) * 2019-10-11 2020-02-28 上海中旖能源科技有限公司 一种多数据源地图数据融合方法
CN111723172A (zh) * 2020-06-10 2020-09-29 广东世纪高通科技有限公司 一种数据融合方法及装置
CN111767936A (zh) * 2019-11-07 2020-10-13 北京沃东天骏信息技术有限公司 地址相似性的检测方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885950A (zh) * 2012-12-19 2014-06-25 高德软件有限公司 一种获取缩略词与poi间对应关系的方法和装置
CN107256230A (zh) * 2017-05-03 2017-10-17 昆明理工大学 一种基于多元化地理信息点的融合方法
CN107832404A (zh) * 2017-11-02 2018-03-23 武汉大学 一种poi信息的补全方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103885950A (zh) * 2012-12-19 2014-06-25 高德软件有限公司 一种获取缩略词与poi间对应关系的方法和装置
CN107256230A (zh) * 2017-05-03 2017-10-17 昆明理工大学 一种基于多元化地理信息点的融合方法
CN107832404A (zh) * 2017-11-02 2018-03-23 武汉大学 一种poi信息的补全方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王逍翔 等: "基于词信息量加权的地理POI数据融合新方法研究", 《软件导刊》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947881A (zh) * 2019-02-26 2019-06-28 广州城市规划技术开发服务部 一种poi判重方法、装置、移动终端及计算机可读存储介质
CN109947881B (zh) * 2019-02-26 2023-10-27 广州城市规划技术开发服务部有限公司 一种poi判重方法、装置、移动终端及计算机可读存储介质
CN110619088A (zh) * 2019-05-23 2019-12-27 北京无限光场科技有限公司 用于处理信息的方法和装置
CN110619086A (zh) * 2019-05-23 2019-12-27 北京无限光场科技有限公司 用于处理信息的方法和装置
CN110619087A (zh) * 2019-05-23 2019-12-27 北京无限光场科技有限公司 用于处理信息的方法和装置
CN110288023A (zh) * 2019-06-26 2019-09-27 广州小鹏汽车科技有限公司 融合方法及装置、检测方法、获取方法、服务器和车辆
CN110851547A (zh) * 2019-10-11 2020-02-28 上海中旖能源科技有限公司 一种多数据源地图数据融合方法
CN111767936A (zh) * 2019-11-07 2020-10-13 北京沃东天骏信息技术有限公司 地址相似性的检测方法和装置
CN111723172A (zh) * 2020-06-10 2020-09-29 广东世纪高通科技有限公司 一种数据融合方法及装置

Similar Documents

Publication Publication Date Title
CN109284446A (zh) 一种poi信息融合方法
CN105976604B (zh) 一种基于gis和公交gps数据的公交线路匹配方法
CN109145169B (zh) 一种基于统计分词的地址匹配方法
CN108802776B (zh) 基于异常点剔除及轨迹压缩算法的公交gps纠偏方法
CN107256230B (zh) 一种基于多元化地理信息点的融合方法
CN105241445B (zh) 一种基于智能移动终端的室内导航数据获取方法及系统
WO2018177316A1 (zh) 信息识别方法、计算设备及存储介质
WO2020224305A1 (zh) 用于设备定位的方法、装置及设备
US20060041375A1 (en) Automated georeferencing of digitized map images
CN106919567B (zh) 一种兴趣点poi地址的处理方法及装置
CN104699818A (zh) 一种多源异构的多属性poi融合方法
TW201107713A (en) Apparatus and method for position determination
CN106469505B (zh) 一种浮动车轨迹纠偏方法和装置
EP3433763A1 (en) Identifying, processing and displaying data point clusters
Yang et al. A pattern‐based approach for matching nodes in heterogeneous urban road networks
CN109688532A (zh) 一种划分城市功能区域的方法及装置
CN110110902A (zh) 一种共享单车接驳轨道交通站点的可达性测算方法
CN108171529A (zh) 一种地址相似度评估方法
CN110046320A (zh) 基于插值和积分的轨迹相似性计算方法
CN109344263A (zh) 一种地址匹配方法
Yang et al. Geometric-based approach for integrating VGI POIs and road networks
CN108111965A (zh) 一种基站位置的确定方法和装置
CN108961403A (zh) 一种运用开源街道地图提取主干道的方法
CN112861972A (zh) 一种展业区域的选址方法、装置、计算机设备和介质
CN116518960B (zh) 路网更新方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190129