CN104572902B - 一种信息点匹配的方法及装置 - Google Patents
一种信息点匹配的方法及装置 Download PDFInfo
- Publication number
- CN104572902B CN104572902B CN201410828053.2A CN201410828053A CN104572902B CN 104572902 B CN104572902 B CN 104572902B CN 201410828053 A CN201410828053 A CN 201410828053A CN 104572902 B CN104572902 B CN 104572902B
- Authority
- CN
- China
- Prior art keywords
- information point
- road
- title
- target
- target information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种信息点匹配的方法及装置,所述方法包括:获取目标信息点的名称、目标信息点的地址和目标信息点的坐标;依据目标信息点的坐标,在信息点数据库中获得第一信息点集合;获取目标信息点地址对应的道路名称和道路的路号;依据道路名称和道路的路号,在第一信息点集合中,获得第二信息点集合;分别对目标信息点的名称和第二信息点集合中的各个信息点的名称进行分词;比较目标信息点的名称的分词结果和第二信息点集合中的各个信息点的名称分词结果的相似度;将相似度高于阈值的信息点作为目标信息点的相似信息点。通过本发明提供了一种信息点匹配的方法及装置,可以提高在海量信息点信息中匹配相似信息点的效率。
Description
技术领域
本申请涉及信息点技术领域,特别涉及一种信息点匹配的方法及装置。
背景技术
POI(Point of Interest,信息点),每个POI包含名称、类别、经度纬度和附近的酒店饭店商铺等信息。POI是整个电子导航产业的基石。
目前POI数据库已经发布北京市区POI数据16000条,全国村镇POI数据8万余条。全国其它地区的POI数据正在搜集整理中,同时还有一个全国公路收费站POI数据的计划也在进行。这个计划的远景的目标是建立全国的POI数据库,并且全部开放。
例如,北京市区POI数据库包含了北京城区的16000多个POI数据,POI名称有汉字和拼音两种版本,这些POI数据可以传输到GPS(Global Positioning System,全球定位系统)中,对地图机器来说,POI数据可以作为地图,因此只要地图机器的内存允许,就可以添加任意数量的POI。
但是现在POI数据库中的信息点数量太多,在POI数据库中查找与目的信息点相似的信息点的过程过于复杂,查找与目的信息点相似的信息点的效率太低。
发明内容
本申请的目的在于,提供一种信息点匹配的方法及装置,以解决上述技术的问题,具体方案包括:
一方面,本发明实施例提供了一种信息点匹配的方法,包括:
获取目标信息点的名称、目标信息点的地址和目标信息点的坐标;
依据所述目标信息点的坐标,在信息点数据库中获得第一信息点集合;
获取所述目标信息点地址对应的道路名称和所述道路的路号;
依据所述道路名称和所述道路的路号,在所述第一信息点集合中,获得第二信息点集合,其中,所述第一信息点集合中包括全部第二信息点集合中的信息点;
分别对所述目标信息点的名称和所述第二信息点集合中的各个信息点的名称进行分词;
比较所述目标信息点的名称的分词结果和所述第二信息点集合中的各个信息点的名称分词结果的相似度;
将所述相似度高于阈值的信息点作为目标信息点的相似信息点。
优选地,在获取目标信息点的名称、目标信息点的地址和目标信息点的坐标之后,在依据所述目标信息点的坐标,在信息点数据库中获得与所述目标信息点的坐标对应的信息点之前,还包括:
删除所述目标信息点地址和所述信息点的名称中无关内容;
所述无关内容包括标点符号。
优选地,所述第一信息点集合中的各个信息点为:坐标与所述目标信息点的坐标相同的信息点。
优选地,所述第二信息点集合中的各个信息点为:与所述目标信息点地址具有相同所述道路名称和所述道路的路号的信息点。
另一方面,本发明实施例提供了一种信息点匹配的装置,包括:
信息获取模块,用于获取目标信息点的名称、目标信息点的地址和目标信息点的坐标;
第一信息点集合获取模块,用于依据所述目标信息点的坐标,在信息点数据库中获得第一信息点集合;
道路名称获取模块,用于获取所述目标信息点地址对应的道路名称和所述道路的路号;
第二信息点集合获取模块,用于依据所述道路名称和所述道路的路号,在所述第一信息点集合中,获得第二信息点集合,其中,所述第一信息点集合中包括全部第二信息点集合中的信息点;
分词模块,用于分别对所述目标信息点的名称和所述第二信息点集合中的各个信息点的名称进行分词;
分词结果比较模块,用于比较所述目标信息点的名称的分词结果和所述第二信息点集合中的各个信息点的名称分词结果的相似度;
相似信息点确定模块,用于将所述相似度高于阈值的信息点作为目标信息点的相似信息点。
优选地,所述装置还包括:
无关内容删除模块,用于删除所述目标信息点地址和所述信息点的名称中无关内容;所述无关内容包括标点符号。
优选地,所述第一信息点集合中的各个信息点为:坐标与所述目标信息点的坐标相同的信息点。
优选地,所述第二信息点集合中的各个信息点为:与所述目标信息点地址具有相同所述道路名称和所述道路的路号的信息点。
与现有技术相比,本发明实施例提供的一种信息点匹配的方法及装置,包括以下优点:
简化了信息点匹配的过程,提高在海量信息点信息中匹配相似信息点的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种信息点匹配的方法的流程示意图;
图2为本发明实施例二提供的一种信息点匹配的装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例一
本发明实施例提供了一种信息点匹配的方法,如图1所示,包括以下步骤S101-S107:
步骤S101,获取目标信息点的名称、目标信息点的地址和目标信息点的坐标。
例如信息点的名称为“翠微大厦”,目标信息的地址为“北京市海淀区复兴路33号”,目标信息点的坐标为:北纬39°26'至41°03',东经115°25'至117°30'之间。
优选的是,删除目标信息点地址和信息点的名称中无关内容;无关内容包括标点符号等于与目标信息点地址和信息点的名称相关度较低的符号。
例如,将“翠微(大厦)”,修改为“翠微大厦”,将“北京市海淀区复兴路(33)号”修改为“北京市海淀区复兴路33号”,“北京市海淀区复兴路—33号”修改为“北京市海淀区复兴路33号”。用以降低无用信息对信息点匹配过程的干扰,提高了信息点匹配的准确率。
步骤S102,依据目标信息点的坐标,在信息点数据库中获得第一信息点集合。
在步骤S102中,第一信息点集合中的各个信息点为:坐标与目标信息点的坐标相同的信息点。例如,第一信息点集合中的各个信息点为“公主坟”、“公主坟地铁站”、“莲花桥”和“翠微商场”等与“翠微大厦”具有相同坐标的信息点。
步骤S103,获取目标信息点地址对应的道路名称和道路的路号。
在步骤S103中,获取“北京市海淀区复兴路33号”对应的道路名称“复兴路”。
步骤S104,依据道路名称和道路的路号,在第一信息点集合中,获得第二信息点集合,其中,第一信息点集合中包括全部第二信息点集合中的信息点。
在步骤S104中,第二信息点集合中的各个信息点为:与目标信息点地址具有相同道路名称和道路的路号的信息点。
例如“莲花桥”不在“复兴路”上,“公主坟”、“翠微商场”和“公主坟地铁站”在“复兴路”上,则第二信息点集合中包括“公主坟”、“翠微商场”和“公主坟地铁站”等与目标信息点地址具有相同道路名称和道路的路号的信息点。
步骤S105,分别对目标信息点的名称和第二信息点集合中的各个信息点的名称进行分词。
例如,将“翠微大厦”分词为“翠微”和“大厦”;将“公主坟”分词为“公主”和“坟”;将“翠微商场”分词为“翠微”和“商场”。
步骤S106,比较目标信息点的名称的分词结果和第二信息点集合中的各个信息点的名称分词结果的相似度。
例如,比较“翠微”、“大厦”与“公主”、“坟”、“翠微”和“商场”的相似度。
步骤S107,将相似度高于阈值的信息点作为目标信息点的相似信息点。
例如,“翠微”与“翠微”的相似度为100%,则将“翠微商场”作为“翠微大厦”的相似信息点。
通过本发明实施例公开的技术方案简化了信息点匹配的过程,提高在海量信息点信息中匹配相似信息点的效率。
实施例二
本发明实施例二提供了一种信息点匹配的装置,如图2所示,包括:信息获取模块21、第一信息点集合获取模块22、道路名称获取模块23、第二信息点集合获取模块24、分词模块25、分词结果比较模块26和相似信息点确定模块27。
其中,信息获取模块21,用于获取目标信息点的名称、目标信息点的地址和目标信息点的坐标;第一信息点集合获取模块22,用于依据目标信息点的坐标,在信息点数据库中获得第一信息点集合;道路名称获取模块23,用于获取目标信息点地址对应的道路名称和道路的路号;第二信息点集合获取模块24,用于依据道路名称和道路的路号,在第一信息点集合中,获得第二信息点集合,其中,第一信息点集合中包括全部第二信息点集合中的信息点;分词模块25,用于分别对目标信息点的名称和第二信息点集合中的各个信息点的名称进行分词;分词结果比较模块26,用于比较目标信息点的名称的分词结果和第二信息点集合中的各个信息点的名称分词结果的相似度;相似信息点确定模块27,用于将相似度高于阈值的信息点作为目标信息点的相似信息点。
优选地是,本发明实施例公开的信息点匹配的装置还包括:无关内容删除模块,用于删除目标信息点地址和信息点的名称中无关内容;无关内容包括标点符号。
在第一信息点集合获取模块22中,第一信息点集合中的各个信息点为:坐标与目标信息点的坐标相同的信息点。
在第二信息点集合获取模块24中,第二信息点集合中的各个信息点为:与目标信息点地址具有相同道路名称和道路的路号的信息点。
通过本发明实施例公开的信息点匹配的装置,简化了信息点匹配的过程,提高在海量信息点信息中匹配相似信息点的效率。
请注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
Claims (6)
1.一种信息点匹配的方法,其特征在于,包括:
获取目标信息点的名称、目标信息点的地址和目标信息点的坐标;
依据所述目标信息点的坐标,在信息点数据库中获得与所述目标信息点的坐标对应的信息点之前,删除所述目标信息点地址和所述信息点的名称中无关内容,所述无关内容包括标点符号,等于与目标信息点地址和信息点的名称相关度较低的符号,然后在信息点数据库中获得第一信息点集合;
获取所述目标信息点地址对应的道路名称和所述道路的路号;
依据所述道路名称和所述道路的路号,在所述第一信息点集合中,获得第二信息点集合,其中,所述第一信息点集合中包括全部第二信息点集合中的信息点;
分别对所述目标信息点的名称和所述第二信息点集合中的各个信息点的名称进行分词;
比较所述目标信息点的名称的分词结果和所述第二信息点集合中的各个信息点的名称分词结果的相似度;
将所述相似度高于阈值的信息点作为目标信息点的相似信息点。
2.根据权利要求1所述的方法,其特征在于,所述第一信息点集合中的各个信息点为:坐标与所述目标信息点的坐标相同的信息点。
3.根据权利要求1所述的方法,其特征在于,所述第二信息点集合中的各个信息点为:与所述目标信息点地址具有相同所述道路名称和所述道路的路号的信息点。
4.一种信息点匹配的装置,其特征在于,包括:
信息获取模块,用于获取目标信息点的名称、目标信息点的地址和目标信息点的坐标;
无关内容删除模块,用于,在信息点数据库中获得与所述目标信息点的坐标对应的信息点之前,删除所述目标信息点地址和所述信息点的名称中无关内容,所述无关内容包括标点符号,等于与目标信息点地址和信息点的名称相关度较低的符号;
第一信息点集合获取模块,用于依据所述目标信息点的坐标,在信息点数据库中获得第一信息点集合;
道路名称获取模块,用于获取所述目标信息点地址对应的道路名称和所述道路的路号;
第二信息点集合获取模块,用于依据所述道路名称和所述道路的路号,在所述第一信息点集合中,获得第二信息点集合,其中,所述第一信息点集合中包括全部第二信息点集合中的信息点;
分词模块,用于分别对所述目标信息点的名称和所述第二信息点集合中的各个信息点的名称进行分词;
分词结果比较模块,用于比较所述目标信息点的名称的分词结果和所述第二信息点集合中的各个信息点的名称分词结果的相似度;
相似信息点确定模块,用于将所述相似度高于阈值的信息点作为目标信息点的相似信息点。
5.根据权利要求4所述的装置,其特征在于,所述第一信息点集合中的各个信息点为:坐标与所述目标信息点的坐标相同的信息点。
6.根据权利要求5所述的装置,其特征在于,所述第二信息点集合中的各个信息点为:与所述目标信息点地址具有相同所述道路名称和所述道路的路号的信息点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410828053.2A CN104572902B (zh) | 2014-12-26 | 2014-12-26 | 一种信息点匹配的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410828053.2A CN104572902B (zh) | 2014-12-26 | 2014-12-26 | 一种信息点匹配的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104572902A CN104572902A (zh) | 2015-04-29 |
CN104572902B true CN104572902B (zh) | 2018-01-23 |
Family
ID=53088964
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410828053.2A Active CN104572902B (zh) | 2014-12-26 | 2014-12-26 | 一种信息点匹配的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104572902B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294384B (zh) * | 2015-05-19 | 2019-09-03 | 阿里巴巴集团控股有限公司 | 发现新路名的方法及装置 |
CN106095901A (zh) * | 2016-06-07 | 2016-11-09 | 乐视控股(北京)有限公司 | 一种数据验证方法及验证系统 |
CN108304423B (zh) * | 2017-03-29 | 2021-09-28 | 腾讯科技(深圳)有限公司 | 一种信息识别方法及装置 |
CN111797183A (zh) * | 2020-05-29 | 2020-10-20 | 汉海信息技术(上海)有限公司 | 挖掘信息点的道路属性的方法、装置及电子设备 |
CN112307142A (zh) * | 2020-06-05 | 2021-02-02 | 北京沃东天骏信息技术有限公司 | 地理信息系统中信息点的确定方法和装置以及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514199A (zh) * | 2012-06-25 | 2014-01-15 | 高德软件有限公司 | Poi数据处理方法及其装置、poi检索方法及其装置 |
CN104102637A (zh) * | 2013-04-02 | 2014-10-15 | 高德软件有限公司 | 一种生成热点区域的方法及装置 |
CN104156443A (zh) * | 2014-08-13 | 2014-11-19 | 北京嘀嘀无限科技发展有限公司 | 地理兴趣点模糊改写系统 |
CN104199937A (zh) * | 2014-09-10 | 2014-12-10 | 中国测绘科学研究院 | 一种多网站poi的位置映射方法及装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8204886B2 (en) * | 2009-11-06 | 2012-06-19 | Nokia Corporation | Method and apparatus for preparation of indexing structures for determining similar points-of-interests |
-
2014
- 2014-12-26 CN CN201410828053.2A patent/CN104572902B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103514199A (zh) * | 2012-06-25 | 2014-01-15 | 高德软件有限公司 | Poi数据处理方法及其装置、poi检索方法及其装置 |
CN104102637A (zh) * | 2013-04-02 | 2014-10-15 | 高德软件有限公司 | 一种生成热点区域的方法及装置 |
CN104156443A (zh) * | 2014-08-13 | 2014-11-19 | 北京嘀嘀无限科技发展有限公司 | 地理兴趣点模糊改写系统 |
CN104199937A (zh) * | 2014-09-10 | 2014-12-10 | 中国测绘科学研究院 | 一种多网站poi的位置映射方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104572902A (zh) | 2015-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104572902B (zh) | 一种信息点匹配的方法及装置 | |
CN102142215B (zh) | 一种顾及位置与速度的地理信息自适应语音讲解方法 | |
CN106294458A (zh) | 一种地图兴趣点更新方法及装置 | |
US20150356088A1 (en) | Tile-based geocoder | |
CN106030685B (zh) | 地图信息处理装置、地图信息处理方法及更新数据的调整方法 | |
CN102607578B (zh) | 用于制作局部区域的导航地图的方法及装置 | |
CN102147795A (zh) | 兴趣点检索方法、兴趣点检索装置和导航系统 | |
CN103186524A (zh) | 一种地名识别方法和装置 | |
CN103699623B (zh) | 地理编码实现方法和装置 | |
US20160140147A1 (en) | Searching for a map using an input image as a search query | |
CN103808325A (zh) | 交通出行方案的生成方法及装置 | |
CN101963962A (zh) | 兴趣点数据关联方法及装置 | |
CN104931037A (zh) | 一种导航提示信息生成方法及装置 | |
CN106323303A (zh) | 一种在地图中沿道路标记位置的系统及其方法 | |
WO2011095227A1 (en) | Methods for digital mapping and associated apparatus | |
CN106919569B (zh) | 一种获取兴趣点poi的行政区划信息的方法及装置 | |
CN110160538A (zh) | 一种基于手机信令数据的地图匹配方法 | |
CN104202817B (zh) | 大型室内空间中的多热点信号指纹地图的存储和匹配方法 | |
CN106844642B (zh) | 一种基于gis计算路网网格中人口密度的方法 | |
CN106155998A (zh) | 一种数据处理方法及装置 | |
CN101326559B (zh) | 位置信息交换装置以及位置信息交换方法 | |
CN103226559A (zh) | 用于组合的soi对象与内容的空间信息索引系统 | |
CN102881182A (zh) | 一种交通信息显示方法及其装置 | |
KR101459872B1 (ko) | SOI와 Content의 결합 객체에 대한 공간정보 색인 시스템 | |
CN111383446B (zh) | 电子地图道路信息的制作方法和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |