CN106874287B - 一种兴趣点 poi 地址编码的处理方法及装置 - Google Patents

一种兴趣点 poi 地址编码的处理方法及装置 Download PDF

Info

Publication number
CN106874287B
CN106874287B CN201510920751.XA CN201510920751A CN106874287B CN 106874287 B CN106874287 B CN 106874287B CN 201510920751 A CN201510920751 A CN 201510920751A CN 106874287 B CN106874287 B CN 106874287B
Authority
CN
China
Prior art keywords
road
poi
address
poi address
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510920751.XA
Other languages
English (en)
Other versions
CN106874287A (zh
Inventor
史川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navinfo Co Ltd
Original Assignee
Navinfo Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navinfo Co Ltd filed Critical Navinfo Co Ltd
Priority to CN201510920751.XA priority Critical patent/CN106874287B/zh
Publication of CN106874287A publication Critical patent/CN106874287A/zh
Application granted granted Critical
Publication of CN106874287B publication Critical patent/CN106874287B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Navigation (AREA)

Abstract

本发明提供一种兴趣点POI地址编码的处理方法及装置,解决了现有技术中人工地址编码效率低,且无法满足大数据量的地址编码的要求的问题。该方法包括:获取包括道路名称的道路数据;按照预设的道路分类规则建立所述道路数据对应的道路类型表;根据所述道路类型表,生成与所述道路数据相匹配的索引信息;通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。本发明通过道路类型表的建立及索引信息的生成,经不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。

Description

一种兴趣点 POI 地址编码的处理方法及装置
技术领域
本发明涉及电子地图的数据处理领域,特别是涉及一种兴趣点POI地址编码的处理方法及装置。
背景技术
随着网路电子地图与基于位置服务的快速发展,以POI为代表的空间地理数据出现快速增长。POI是兴趣点(Point of Interest)的缩写,是一种代表真实地理实体的点状数据,POI一般包括名称、类别、经纬度以及地址等基本信息。
现有技术中对POI地址的地址编码一般会根据作业员的工作经验,人工处理成“道路名+门牌号”或“小区名+楼栋号”。但是,人工地址编码的处理效率低,不能满足大数据量的地址编码要求。而且地址编码质量的好坏由人工作业经验决定,没有明确的衡量标准。
发明内容
本发明的目的在于提供一种兴趣点POI地址编码的处理方法及装置,用于解决现有技术中人工地址编码效率低,且无法满足大数据量的地址编码的要求的问题。
为了实现上述目的,本发明实施例提供了一种兴趣点POI地址编码的处理方法,包括:
获取包括道路名称的道路数据;
按照预设的道路分类规则建立所述道路数据对应的道路类型表;
根据所述道路类型表,生成与所述道路数据相匹配的索引信息;
通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。
其中,所述道路名称为按照省市区划分的道路名称。
其中,根据所述道路类型表,生成与所述道路数据相匹配的索引信息的步骤包括:
按照所述道路名称的字节长短顺序对所述道路数据进行排序;
根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。
其中,所述索引信息包括:行政区划代码、道路名称及道路类型。
其中,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码的步骤包括:
获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;
根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。
其中,所述根据所述道路类型表及所述索引信息得到所述POI地址的道路名称的步骤包括:
根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;
根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;
通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
其中,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码的步骤还包括:
根据所述预设算法获取所述POI地址中的门牌号码。
其中,还包括:
将所述地址编码保存于所述POI地址的数据库中。
本发明实施例还提供了一种兴趣点POI地址编码的处理装置,包括:
获取模块,用于获取包括道路名称的道路数据;
分类建立模块,用于按照预设的道路分类规则建立所述道路数据对应的道路类型表;
索引生成模块,用于根据所述道路类型表,生成与所述道路数据相匹配的 索引信息;
编码处理模块,用于通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。
其中,所述道路名称为按照省市区划分的地址编码。
其中,所述索引生成模块包括:
排序子模块,用于按照所述道路名称的字节长短顺序对所述道路数据进行排序;
索引生成子模块,用于根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。
其中,所述索引信息包括:行政区划代码、道路名称及道路类型。
其中,所述编码处理模块包括:
第一处理子模块,用于获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;
第二处理子模块,用于根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。
其中,所述第二处理子模块包括:
获取单元,用于根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;
检索单元,用于根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;
处理单元,用于通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
其中,所述编码处理模块还包括:
第三处理子模块,用于根据所述预设算法获取所述POI地址中的门牌号码。
其中,还包括:
数据存储模块,用于将所述地址编码保存于所述POI地址的数据库中。
本发明的上述技术方案的有益效果如下:
本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,通过 不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。
附图说明
图1为本发明实施例的兴趣点POI地址编码的处理方法的基本步骤示意图;
图2为本发明实施例的兴趣点POI地址编码的处理方法的具体流程示意图
图3为本发明实施例的兴趣点POI地址编码的处理装置的组成结构示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
本发明针对现有技术中人工地址编码效率低,且无法满足大数据量的地址编码的要求的问题,提供一种兴趣点POI地址编码的处理方法,通过道路类型表的建立及索引信息的生成,经不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。
第一实施例
如图1所示,本发明实施例提供一种兴趣点POI地址编码的处理方法,包括:
步骤11,获取包括道路名称的道路数据;
具体地,所述道路数据主要是指全国道路名称表。
步骤12,按照预设的道路分类规则建立所述道路数据对应的道路类型表;
这里,预设的道路分类规则主要是根据道路名称的后缀词组对所述道路数据进行分类。
例如,道路名称为“欧美中心北路”,则其道路类型为“北路”;又如,道路名称为“学院路”,则其道路类型为“路”;再如,道路名称为“金宁世纪购物广场步行街”,则其道路类型为“步行街。”
步骤13,根据所述道路类型表,生成与所述道路数据相匹配的索引信息;
步骤14,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。
这里,所述地址编码的形式为“道路名称+门牌号码”或“小区名+楼栋号”。
本发明实施例的兴趣点POI地址编码的处理方法,通过道路类型表的建立及索引信息的生成,经不断地迭代处理可快速地对POI地址进行编码。提高了地址编码的处理效率及编码的准确性。
具体地,所述道路名称为按照省市区划分的道路名称。
本发明实施例中所述步骤13可以进一步包括:
步骤131,按照所述道路名称的字节长短顺序对所述道路数据进行排序;
这里,道路名称的字节长短也就是道路名称汉字字符的长短。
步骤132,根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。
需说明的是,这里的检索引擎优选地为开源的Lucene.net全文检索引擎。Lucene.net是一个开源的全文检索引擎开发包,可提供完整的查询引擎和索引引擎。当然本发明不仅限于该检索引擎,其他可实现全文检索功能的检索引擎均可采用。
具体地,如下表1所示,所述索引信息包括:行政区划代码、道路名称及道路类型。
表1
行政区划代码 道路名称 道路类型
320116 金宁世纪购物广场步行街 步行街
330100 欧美中心北路 北路
330100 欧美中心南路 南路
110103 学院路
本发明实施例中所述步骤14可以包括:
步骤141,获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;
这里,所述区划配置表存储于本地数据库中,可直接获取调用。
步骤142,根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。
进一步地,本发明实施例中所述步骤142可以包括:
步骤1421,根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;
这里,将获取的POI地址信息根据所述道路类型表查询匹配,确定该POI地址对应的道路类型。
步骤1422,根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;
这里需说明的是,检索索引信息中,也就是索引文件中行政区划代码与所述POI行政区划代码相同,道路名称中包含有所述POI道路类型的道路数据,得到与所述POI道路类型相匹配的第一匹配道路名称。
步骤1423,通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
这里,举例简要说明本步骤中对所述POI地址进行迭代解析处理的过程。
首先,若获取的POI地址为“北京市海淀区中科院南路7号”,通过本地区划配置表查询确定与所述POI地址对应的的行政区划代码,即POI行政区划代码,这里海淀区的行政区划代码为110108;
这里需要说明的是,获取到POI地址信息并非以上述明文汉字的形式运行于程序中,需要对获取到的POI地址进行解析处理。
然后,通过遍历所述道路类型表,获取与所述POI地址相匹配的道路类型,即POI道路类型;
之后,使用开源的Lucene.net全文检索引擎检索行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型的道路名称,得到与所述POI道路类型相匹配的第一匹配道路名称。
这里需说明的是,道路名称包含所述POI道路类型的道路名称具体可以是较道路类型本身所占字符多预设字符数的道路名称。其中,所述字符数在POI地址迭代解析时可设置。以本POI地址为例,道路类型为“南路”,道路 名称包含所述POI道路类型的道路名称可为“科院南路”。
这里,得到的第一匹配道路名称以列表的形式呈现。
最后,对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
需说明的是,此处的迭代解析具体为:
以在检索文件中检索到行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型一第一道路名称列表;
根据POI地址信息,以设置的较POI道路类型本身所占字符多预设字符数的道路名称为检索对象,在所述第一道路名称列表中检索是否有与之相匹配的道路名称或第二道路名称列表中;
若存在与之相匹配的道路名称,则确定该道路名称为POI地址编码中的道路名称;
若存在与之相匹配的第二道路名称列表,则调整上述预设字符数的个数,一般为增加1个或2个字符,之后以调整的道路名称为检索对象,在该第二道路名称列表中检索是否有与之相匹配的道路名称或第三道路名称列表,如此一直迭代处理,直到获取到POI地址编码中的道路名称。
本举例中,迭代解析具体为:
在检索文件中检索到POI行政区划代码为110108,道路名称包含“南路”的一第一道路名称列表;
接着,在该第一道路名称列表中检索到与道路名称为“科院南路”相匹配的第二道路名称列表;
之后,遍历该第二道路名称列表,检索到与道路名称为“中科院南路”相匹配的道路名称。
这里,“中科院南路”字符数较之前的“科院南路”多一个,“科院南路”的字符数较之前的“南路”多两个。如此在第二道路名称列表中获取到POI地址编码中的道路名称。
进一步地,本发明实施例中所述步骤14还可以包括:
步骤143,根据所述预设算法获取所述POI地址中的门牌号码。
具体地,所述预设算法可以是数字提取算法,主要是为了提取POI地址 信息中的门牌号码或楼栋号。
这里,简要说明几种常见的数字位于POI地址中的位置,即POI地址的格式。
A:道路名称+数字;比如“学院路7号”,程序可直接将道路名称后面的数字7提取出来。
B:道路名称+同位词+数字;比如“万寿路甲15号”,首先需提取道路名“万寿路”与数字“15”之间的文字,遍历本地存储的同位词配置表,若查询到该字符串“甲”包含在同位词配置表内,则确定数字“15”为门牌号码。若查询到该字符串“甲”不在同位词配置表内则需要人工确认,判断是够需要将“甲”添加到同位词配置表内。
一般道路名称与门牌号码之间的字符串长度小于等于4位,门牌号码的长度小于等于4位。
C:道路名称+数字+字母;此种格式一般仅用于香港和澳门,程序可直接提取数字和字母。
需要说明的是,数字提取算法中提取的数字格式为半角阿拉伯数字,若识别到的POI地址中的数字格式不符合要求,需要在使用数字提取算法之前将其转换为符合要求的数字格式。比如“零”转换为“0”。
这样,上述举例POI地址信息中的数字可通过该数字提取算法得到,为道路名称“中科院南路”之后的数字“7”。
至此,上述举例POI地址为“北京市海淀区中科院南路7号”解析得到的地址编码为“中科院南路+7”。
本发明实施例中所述的兴趣点POI地址编码的处理方法还可包括:
步骤15,将所述地址编码保存于所述POI地址的数据库中。
本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,经不断地迭代处理以及数字提取算法的应用,可快速地对POI地址进行编码。同时提高了地址编码的处理效率及编码的准确性。
第二实施例
如图2所示,为本发明实施例的兴趣点POI地址编码的处理方法的具体流程示意图。下面就该图简要说明一下该兴趣点POI地址编码的处理方法的 主要处理过程。其具体步骤如下:
S01,建立一道路类型表;
这里,首先获取按省市区分类的全国道路名称表;然后按照预设的道路分类规则建立一与所述全国道路名称表对应的道路类型表。
需要说明的是,预设的道路分类规则主要是根据道路名称的后缀词组对所述全国道路名称表进行分类。
例如,道路名称为“欧美中心北路”,则其道路类型为“北路”;又如,道路名称为“学院路”,则其道路类型为“路”;再如,道路名称为“金宁世纪购物广场步行街”,则其道路类型为“步行街。”
S02,根据道路类型表,建立索引;
具体地,根据道路类型表,通过一全文检索引擎Lucene.net按照道路名称的字节长短顺序生成与全国道路名称表相对应的索引文件。
S03,解析POI地址进行地址编码;
这里需说明的是,通过建立的道路类型表、生成的索引文件以及一预设的算法对POI地址的地址解码处理。最终得到的地址编码格式为:“道路名称+门牌号码”或“小区名+楼栋号”。详细的过程参见第一实施例,在此不再赘述。
S04,将得到的地址编码结果输出并保存。
这里,对结果的输出并保存是为了便于用户查看最终的地址编码。
本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,经不断地迭代处理以及数字提取算法的应用,可快速地对POI地址进行编码。同时提高了地址编码的处理效率及编码的准确性。
第二实施例
如图3所示,本发明实施例还提供一种兴趣点POI地址编码的处理装置,包括:
获取模块21,用于获取包括道路名称的道路数据;
具体地,所述道路数据主要是指全国道路名称表。
分类建立模块22,用于按照预设的道路分类规则建立所述道路数据对应的道路类型表;
这里,预设的道路分类规则主要是根据道路名称的后缀词组对所述道路数 据进行分类。
例如,道路名称为“欧美中心北路”,则其道路类型为“北路”;又如,道路名称为“学院路”,则其道路类型为“路”;再如,道路名称为“金宁世纪购物广场步行街”,则其道路类型为“步行街。”
索引生成模块23,用于根据所述道路类型表,生成与所述道路数据相匹配的索引信息;
编码处理模块24,用于通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码。
这里,所述地址编码的形式为“道路名称+门牌号码”或“小区名+楼栋号”
具体地,所述道路名称为按照省市区划分的道路名称。
本发明实施例中所述索引生成模块23具体可以包括:
排序子模块,用于按照所述道路名称的字节长短顺序对所述道路数据进行排序;
这里,道路名称的字节长短也就是道路名称汉字字符的长短。
索引生成子模块,用于根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。
需说明的是,这里的检索引擎优选地为开源的Lucene.net全文检索引擎。Lucene.net是一个开源的全文检索引擎开发包,可提供完整的查询引擎和索引引擎。当然本发明不仅限于该检索引擎,其他可实现全文检索功能的检索引擎均可采用。
具体地,如第一实施例中的表1所示,所述索引信息包括:行政区划代码、道路名称及道路类型。
本发明实施例中所述编码处理模块24具体可以包括:
第一处理子模块,用于获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;
这里,所述区划配置表存储于本地数据库中,可直接获取调用。
第二处理子模块,用于根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。
具体地,所述第二处理子模块可以包括:
获取单元,用于根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;
这里,将获取的POI地址信息根据所述道路类型表查询匹配,确定该POI地址对应的道路类型。
检索单元,用于根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;
这里需说明的是,检索索引信息中,也就是索引文件中行政区划代码与所述POI行政区划代码相同,道路名称中包含有所述POI道路类型的道路数据,得到与所述POI道路类型相匹配的第一匹配道路名称。
处理单元,用于通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
这里,举例简要说明本处理单元中对所述POI地址进行迭代解析处理的过程。
首先,若获取的POI地址为“北京市海淀区中科院南路7号”,通过本地区划配置表查询确定与所述POI地址对应的的行政区划代码,即POI行政区划代码,这里海淀区的行政区划代码为110108;
这里需要说明的是,获取到POI地址信息并非以上述明文汉字的形式运行于程序中,需要对获取到的POI地址进行解析处理。
然后,通过遍历所述道路类型表,获取与所述POI地址相匹配的道路类型,即POI道路类型;
之后,使用开源的Lucene.net全文检索引擎检索行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型的道路名称,得到与所述POI道路类型相匹配的第一匹配道路名称。
这里需说明的是,道路名称包含所述POI道路类型的道路名称具体可以是较道路类型本身所占字符多预设字符数的道路名称。其中,所述字符数在POI地址迭代解析时可设置。以本POI地址为例,道路类型为“南路”,道路名称包含所述POI道路类型的道路名称可为“科院南路”。
这里,得到的第一匹配道路名称以列表的形式呈现。
最后,对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
需说明的是,此处的迭代解析具体为:
以在检索文件中检索到行政区划代码为所述POI行政区划代码,道路名称包含所述POI道路类型一第一道路名称列表;
根据POI地址信息,以设置的较POI道路类型本身所占字符多预设字符数的道路名称为检索对象,在所述第一道路名称列表中检索是否有与之相匹配的道路名称或第二道路名称列表中;
若存在与之相匹配的道路名称,则确定该道路名称为POI地址编码中的道路名称;
若存在与之相匹配的第二道路名称列表,则调整上述预设字符数的个数,一般为增加1个或2个字符,之后以调整的道路名称为检索对象,在该第二道路名称列表中检索是否有与之相匹配的道路名称或第三道路名称列表,如此一直迭代处理,直到获取到POI地址编码中的道路名称。
本举例中,迭代解析具体为:
在检索文件中检索到POI行政区划代码为110108,道路名称包含“南路”的一第一道路名称列表;
接着,在该第一道路名称列表中检索到与道路名称为“科院南路”相匹配的第二道路名称列表;
之后,遍历该第二道路名称列表,检索到与道路名称为“中科院南路”相匹配的道路名称。
这里,“中科院南路”字符数较之前的“科院南路”多一个,“科院南路”的字符数较之前的“南路”多两个。如此在第二道路名称列表中获取到POI地址编码中的道路名称。
本发明实施例中所述编码处理模块24具体还可以包括:
第三处理子模块,用于根据所述预设算法获取所述POI地址中的门牌号码。
具体地,所述预设算法可以是数字提取算法,主要是为了提取POI地址信息中的门牌号码或楼栋号。
这里,简要说明几种常见的数字位于POI地址中的位置,即POI地址的格式。
A:道路名称+数字;比如“学院路7号”,程序可直接将道路名称后面的数字7提取出来。
B:道路名称+同位词+数字;比如“万寿路甲15号”,首先需提取道路名“万寿路”与数字“15”之间的文字,遍历本地存储的同位词配置表,若查询到该字符串“甲”包含在同位词配置表内,则确定数字“15”为门牌号码。若查询到该字符串“甲”不在同位词配置表内则需要人工确认,判断是够需要将“甲”添加到同位词配置表内。
一般道路名称与门牌号码之间的字符串长度小于等于4位,门牌号码的长度小于等于4位。
C:道路名称+数字+字母;此种格式一般仅用于香港和澳门,程序可直接提取数字和字母。
需要说明的是,数字提取算法中提取的数字格式为半角阿拉伯数字,若识别到的POI地址中的数字格式不符合要求,需要在使用数字提取算法之前将其转换为符合要求的数字格式。比如“零”转换为“0”。
这样,上述举例POI地址信息中的数字可通过该数字提取算法得到,为道路名称“中科院南路”之后的数字“7”。
至此,上述举例POI地址为“北京市海淀区中科院南路7号”解析得到的地址编码为“中科院南路+7”。
本发明实施例中所述的兴趣点POI地址编码的处理装置具体还可包括:
数据存储模块25,用于将所述地址编码保存于所述POI地址的数据库中。
本发明实施例的方案中,通过道路类型表的建立及索引信息的生成,经不断地迭代处理以及数字提取算法的应用,可快速地对POI地址进行编码。同时提高了地址编码的处理效率及编码的准确性。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (16)

1.一种兴趣点POI地址编码的处理方法,其特征在于,包括:
获取包括道路名称的道路数据;
按照预设的道路分类规则建立所述道路数据对应的道路类型表,所述预设的道路分类规则是根据道路名称的后缀词组对所述道路数据进行分类;
根据所述道路类型表,生成与所述道路数据相匹配的索引信息;
通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码,所述预设算法为能够提取POI地址信息中门牌号码或楼栋号的算法。
2.根据权利要求1所述的兴趣点POI地址编码的处理方法,其特征在于,所述道路名称为按照省市区划分的道路名称。
3.根据权利要求2所述的兴趣点POI地址编码的处理方法,其特征在于,根据所述道路类型表,生成与所述道路数据相匹配的索引信息的步骤包括:
按照所述道路名称的字节长短顺序对所述道路数据进行排序;
根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。
4.根据权利要求3所述的兴趣点POI地址编码的处理方法,其特征在于,所述索引信息包括:行政区划代码、道路名称及道路类型。
5.根据权利要求4所述的兴趣点POI地址编码的处理方法,其特征在于,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码的步骤包括:
获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;
根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。
6.根据权利要求5所述的兴趣点POI地址编码的处理方法,其特征在于,所述根据所述道路类型表及所述索引信息得到所述POI地址的道路名称的步骤包括:
根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;
根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;
通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
7.根据权利要求5所述的兴趣点POI地址编码的处理方法,其特征在于,通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码的步骤还包括:
根据所述预设算法获取所述POI地址中的门牌号码。
8.根据权利要求5所述的兴趣点POI地址编码的处理方法,其特征在于,还包括:
将所述地址编码保存于所述POI地址的数据库中。
9.一种兴趣点POI地址编码的处理装置,其特征在于,包括:
获取模块,用于获取包括道路名称的道路数据;
分类建立模块,用于按照预设的道路分类规则建立所述道路数据对应的道路类型表,所述预设的道路分类规则是根据道路名称的后缀词组对所述道路数据进行分类;
索引生成模块,用于根据所述道路类型表,生成与所述道路数据相匹配的索引信息;
编码处理模块,用于通过所述道路类型表、所述索引信息以及一预设算法,对一POI地址进行编码处理,得到所述POI地址的地址编码,所述预设算法为能够提取POI地址信息中门牌号码或楼栋号的算法。
10.根据权利要求9所述的兴趣点POI地址编码的处理装置,其特征在于,所述道路名称为按照省市区划分的地址编码。
11.根据权利要求10所述的兴趣点POI地址编码的处理装置,其特征在于,所述索引生成模块包括:
排序子模块,用于按照所述道路名称的字节长短顺序对所述道路数据进行排序;
索引生成子模块,用于根据所述排序的结果,通过一检索引擎生成并保存与所述道路数据相匹配的索引信息。
12.根据权利要求11所述的兴趣点POI地址编码的处理装置,其特征在于,所述索引信息包括:行政区划代码、道路名称及道路类型。
13.根据权利要求12所述的兴趣点POI地址编码的处理装置,其特征在于,所述编码处理模块包括:
第一处理子模块,用于获取一POI地址信息,查询区划配置表确定所述POI地址对应的POI行政区划代码;
第二处理子模块,用于根据所述道路类型表及所述索引信息得到所述POI地址的道路名称。
14.根据权利要求13所述的兴趣点POI地址编码的处理装置,其特征在于,所述第二处理子模块包括:
获取单元,用于根据所述道路类型表获取与所述POI地址相匹配的POI道路类型;
检索单元,用于根据所述POI行政区划代码及所述POI道路类型,检索所述索引信息,得到与所述POI道路类型相匹配的第一匹配道路名称;
处理单元,用于通过对所述POI地址的迭代解析处理,在所述第一匹配道路名称中得到所述POI地址的道路名称。
15.根据权利要求13所述的兴趣点POI地址编码的处理装置,其特征在于,所述编码处理模块还包括:
第三处理子模块,用于根据所述预设算法获取所述POI地址中的门牌号码。
16.根据权利要求13所述的兴趣点POI地址编码的处理装置,其特征在于,还包括:
数据存储模块,用于将所述地址编码保存于所述POI地址的数据库中。
CN201510920751.XA 2015-12-11 2015-12-11 一种兴趣点 poi 地址编码的处理方法及装置 Active CN106874287B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510920751.XA CN106874287B (zh) 2015-12-11 2015-12-11 一种兴趣点 poi 地址编码的处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510920751.XA CN106874287B (zh) 2015-12-11 2015-12-11 一种兴趣点 poi 地址编码的处理方法及装置

Publications (2)

Publication Number Publication Date
CN106874287A CN106874287A (zh) 2017-06-20
CN106874287B true CN106874287B (zh) 2020-06-30

Family

ID=59178268

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510920751.XA Active CN106874287B (zh) 2015-12-11 2015-12-11 一种兴趣点 poi 地址编码的处理方法及装置

Country Status (1)

Country Link
CN (1) CN106874287B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107562787B (zh) * 2017-07-31 2020-11-13 北京三快在线科技有限公司 一种poi编码方法及装置、poi推荐方法,电子设备
CN110019645B (zh) * 2017-09-28 2022-04-19 北京搜狗科技发展有限公司 索引库构建方法、搜索方法及装置
CN107883974B (zh) * 2017-09-30 2020-08-28 百度在线网络技术(北京)有限公司 导航路径的规划方法、导航服务器及计算机可读介质
CN110345950B (zh) * 2018-04-08 2021-06-08 阿里巴巴(中国)有限公司 一种道路编码方法及道路匹配方法
CN108959609B (zh) * 2018-07-16 2021-09-21 创新先进技术有限公司 店铺地址的更新方法及装置
CN111400433B (zh) * 2019-01-02 2023-04-11 阿里巴巴集团控股有限公司 地址文本处理方法和装置
CN111435360B (zh) * 2019-01-15 2023-08-29 菜鸟智能物流控股有限公司 地址类型识别方法和装置以及电子设备
CN112069276B (zh) * 2020-08-31 2024-03-08 平安科技(深圳)有限公司 地址编码方法、装置、计算机设备及计算机可读存储介质
CN112040005A (zh) * 2020-09-10 2020-12-04 辽宁省交通高等专科学校 一种基于大数据的数据分包处理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957820A (zh) * 2009-07-17 2011-01-26 高德软件有限公司 一种生成门牌信息库的方法和装置
CN102902596A (zh) * 2012-09-29 2013-01-30 北京百度网讯科技有限公司 一种兴趣点数据校验方法及装置
CN103617252A (zh) * 2013-11-29 2014-03-05 北京掌行通信息技术有限公司 基于道路名称的检索及显示方法
CN104820721A (zh) * 2015-05-26 2015-08-05 厦门雅迅网络股份有限公司 一种基于地标及里程的突发交通事件播报方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100401640B1 (ko) * 2001-07-24 2003-10-17 현대자동차주식회사 자동차의 길안내 정보 시스템

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101957820A (zh) * 2009-07-17 2011-01-26 高德软件有限公司 一种生成门牌信息库的方法和装置
CN102902596A (zh) * 2012-09-29 2013-01-30 北京百度网讯科技有限公司 一种兴趣点数据校验方法及装置
CN103617252A (zh) * 2013-11-29 2014-03-05 北京掌行通信息技术有限公司 基于道路名称的检索及显示方法
CN104820721A (zh) * 2015-05-26 2015-08-05 厦门雅迅网络股份有限公司 一种基于地标及里程的突发交通事件播报方法

Also Published As

Publication number Publication date
CN106874287A (zh) 2017-06-20

Similar Documents

Publication Publication Date Title
CN106874287B (zh) 一种兴趣点 poi 地址编码的处理方法及装置
US11698261B2 (en) Method, apparatus, computer device and storage medium for determining POI alias
RU2667036C2 (ru) Способ и устройство для идентификации и сообщения местоположений
CN109344213B (zh) 一种基于字典树的中文地理编码方法
CN102591867B (zh) 一种基于移动设备位置的搜索服务方法
CN106909611B (zh) 一种基于文本信息抽取的酒店自动匹配方法
CN103473289A (zh) 一种通信地址补全的装置及方法
CN102063472B (zh) 图片搜索方法、图片搜索系统、客户端和服务器
CN108256718B (zh) 保单服务任务分配方法、装置、计算机设备和存储设备
CN107203526B (zh) 一种查询串语义需求分析方法及装置
CN110020224B (zh) 地图兴趣点数据的关联方法、装置、设备及介质
CN109492066B (zh) 一种兴趣点分支名称的确定方法、装置、设备及存储介质
CN102855480A (zh) 一种图像文字识别方法和装置
CN104080054A (zh) 一种异常兴趣点的获取方法及装置
CN103902521A (zh) 一种中文语句识别方法和装置
CN111797182A (zh) 一种地址编码解析方法及系统
CN110060472B (zh) 道路交通事件定位方法、系统、可读存储介质和设备
CN108733810A (zh) 一种地址数据匹配方法及装置
CN110837568A (zh) 实体对齐方法及装置、电子设备、存储介质
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN111896016A (zh) 位置信息的处理方法及装置、存储介质、终端
CN111382138B (zh) Poi数据处理方法、装置、设备及介质
CN111241229A (zh) 快递驿站地址辨别方法、计算机设备和存储介质
CN112069824B (zh) 基于上下文概率和引证的地域识别方法、装置及介质
CN113761137B (zh) 一种提取地址信息的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant