CN112328910A - 一种涵盖aoi和poi标准地址匹配引擎的方法及系统 - Google Patents

一种涵盖aoi和poi标准地址匹配引擎的方法及系统 Download PDF

Info

Publication number
CN112328910A
CN112328910A CN202011076968.4A CN202011076968A CN112328910A CN 112328910 A CN112328910 A CN 112328910A CN 202011076968 A CN202011076968 A CN 202011076968A CN 112328910 A CN112328910 A CN 112328910A
Authority
CN
China
Prior art keywords
address
matching
data
standard
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011076968.4A
Other languages
English (en)
Inventor
庄建新
李林
李勇琪
陈培成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Aerospace Smart City System Technology Co ltd
Original Assignee
Shenzhen Aerospace Smart City System Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Aerospace Smart City System Technology Co ltd filed Critical Shenzhen Aerospace Smart City System Technology Co ltd
Priority to CN202011076968.4A priority Critical patent/CN112328910A/zh
Publication of CN112328910A publication Critical patent/CN112328910A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明涉及地理信息数据处理领域,特别涉及一种涵盖AOI和POI标准地址匹配引擎的方法及系统。其中方法包括步骤:S1.输入地址数据;S2.对地址数据进行规范化预处理和解析;S3.将规范化后的地址数据进行逻辑组合,通过空间分析、融合分成多个不同级别、不同分区、不同节点的块数据,形成精确的查询条件;S4.通过查询条件和标准地址库中的数据进行匹配,若成功,则返回准确的AOI和POI数据;若不成功则进行问题反馈。本发明通过将不同的地名地址条数据通过空间分析、融合,最终分成不同级别、不同分区、不同节点的块数据。能够很好的兼容原先在使用地址匹配引擎时,用别名、俗称去检索的情况。也能同时返回AOI和POI数据,实现从点到面和从面到点的双向互通。

Description

一种涵盖AOI和POI标准地址匹配引擎的方法及系统
技术领域
本发明涉及地理信息数据处理领域,特别涉及一种涵盖AOI和POI标准地址匹配引擎的方法及系统。
背景技术
随着城市地址匹配引擎系统的建设,越来越多的地名地址数据融合汇聚在一起。房屋作为空间管理的基本单元,在众多政务应用业务中均涉及房屋或者楼栋地址选择与查询,实际使用中房屋和楼栋的地址在不同的业务中往往描述不一致,而且存在俗称、简称等,不利于业务间数据共享和交换。如何从纷繁复杂的地名地址数据当中寻找定位到精准匹配信息是当前城市地址匹配引擎系统建设当中的重点。当前城市地址匹配引擎大都停留在单一匹配的模式进行检索,即通过用户输入关键字进行精确查询或模糊查询,并且返回结果基本上都是单一的POI(Point Of Interesting,即兴趣点)或AOI(Area Of Interest,即多边形或兴趣面)。用户往往需要多次查询才能得到想要的结果。总体而言,现在市场上的地址匹配系统只能实现单一的查询,无法适应多种任务需求,也无法满足众多应用业务涉及房屋或者楼栋地址选择与查询。
目前城市地址匹配引擎大都停留在单一匹配的模式进行检索,即用户得到的结果为单一的POI或AOI。而用户在实际使用过程中,往往需要多次查询才能得到想要的结果,比如同一地址因为地址名称的不一样,用户就有可能要通过目标地址的上级或部分关键字查询,从而得到模糊的结果,从中再去查找。
要想解决城市地址匹配引擎查询地址的快速性、精准性,首先是要解决数据融合的问题,只有解决了如何将不同部门的地理信息数据融合转化形成一套统一的、规范的、合理的地理信息标准数据,通过标准的地理信息数据,我们才能保证地名地址查询过程的精准性。一般的方法是将不同的数据提取相同的部分数据,再去融合不同部分的数据。这样在用户查询的时候,系统才能最大限度的得到结果。但是这样的数据融合机制会形成一个问题。当地址数据需要融合多个部门的地址数据时,标准地名地址库的字段会无限增加,降低了标准地名地址库的可读性和可扩展性。
目前地址匹配引擎的数据基本都是条数据,在用户使用地址匹配引擎的时候,只能返回单一的POI或AOI数据,无法很好的匹配当前众多政务应用业务对于地名地址匹配引擎的需求。而且在众多政务应用在使用地址匹配引擎时,目标地址存在别名、俗称的情况,当前的地址匹配引擎无法完成匹配,致使用户无法查询到目标地址。从而导致地址匹配引擎的使用和推广受到了限制。用户在使用地址匹配引擎时,无法得到想要的结果,只能建设自身专属的地址匹配引擎,存在重复建设、资源浪费的现象。
发明内容
本发明提供一种涵盖AOI和POI标准地址匹配引擎的方法及系统,旨在解决现有地址匹配引擎查询时时间花销大、工作效率低、重复建设造成资源利用率低的问题。
本发明提供一种涵盖AOI和POI标准地址匹配引擎方法,包括以下步骤:
S1.输入地址数据;
S2.对地址数据进行规范化预处理和解析;
S3.将规范化后的地址数据进行逻辑组合,通过空间分析、融合分成多个不同级别、不同分区、不同节点的块数据,形成精确的查询条件;
S4.通过查询条件和标准地址库中的数据进行匹配,若匹配成功,则返回准确的AOI和POI数据;若匹配不成功则进行问题反馈。
作为本发明的进一步改进,所述步骤S2中,规范化预处理和解析包括:繁体简体转换、半角全角转换、汉字和数字转化、地址别名和标准地址名转化、同义词转化、地址数据进行分级分词处理、中文和拼音转化的预处理和解析。
作为本发明的进一步改进,所述步骤S4的匹配过程中,首先在最小级别的地址范围内进行精确匹配,如果没有找到匹配的地址,则继续在上一级的地址范围内进行搜寻,直到找到匹配结果为止,完成匹配的地址数据被赋予了空间坐标。
作为本发明的进一步改进,所述步骤S4的匹配过程包括正向匹配步骤,其包括:S41.将规范化后的地址数据通过分词算法进行词法分析和语义分析,分割形成地址数据段,关联标准地址库,查找潜在的位置,根据与联标准地址的接近程度为每个候选位置指定分值,最后用分值最高的来匹配该地址数据,返回分值最高的标准地址。
作为本发明的进一步改进,所述步骤S41包括:
S411.批量地址正向匹配:可以输入多条地址数据,进行批量的地址匹配,返回相应的地址匹配数据;
S412.单条地址正向匹配:输入单条地址数据进行匹配,返回匹配的坐标位置;
S413.正向匹配精度:根据每条地址数据的匹配情况,按照规则和算法计算地址的正向匹配精度。
作为本发明的进一步改进,所述步骤S4的匹配过程包括反向匹配步骤,其包括:S42.将输入自然语言描述的地址替换为空间信息坐标,判断是否有与该空间信息坐标关联的地址库数据,根据规范的地名地址,进行匹配,具体分为:
S421.批量地址逆向匹配:输入多条经纬度坐标数据,进行批量的地址匹配,返回相应的标准地名地址;
S422.单条地址逆向匹配:输入单条经纬度坐标数据进行匹配,返回匹配的标准地名地址;
S423.逆向匹配精度:根据每条经纬度坐标数据的匹配情况,按照规则和算法计算地址的逆向匹配精度。
作为本发明的进一步改进,所述步骤S4的匹配过程包括别名匹配步骤,其包括:S43.地名别名识别匹配:自动识别所输入的地址别名,并进行关联查询、匹配,返回相应的结果。
作为本发明的进一步改进,所述步骤S4的匹配过程包括容错匹配步骤,其包括:S44.根据输入的地址与标准地址的数据进行同音字、通假字、同义词的识别和匹配。
本发明还提供一种涵盖AOI和POI标准地址匹配引擎系统,包括
预处理模块,用于地址匹配前,根据用户输入的地址内容进行规范化的预处理和解析;包括繁体简体转换、半角全角转换、汉字和数字转化、地址别名和标准地址名转化、同义词转化、地址数据进行分级分词处理、中文和拼音转化的预处理和解析;
正向匹配模块,用于将地址信息分成块数据,并关联标准地址库匹配坐标位置,包括批量地址正向匹配、单条地址正向匹配;
反向匹配模块,用于将输入的空间信息坐标关联标准的地址库数据,并匹配对应的标准地名地址,包括批量地址逆向匹配、单条地址逆向匹配;
别名匹配模块,用于自动识别所输入的地址别名,并进行关联查询、匹配,返回相应的结果;
容错匹配模块,用于对输入的地址信息根据同音字、通假字和同义词对地址进行分析,并返回匹配结果。
作为本发明的进一步改进,该涵盖AOI和POI标准地址匹配引擎系统还包括:
智能提示模块,用于用户操作标准地址匹配引擎系统的内容和错误提示;包括地址智能提示、周边地址智能提示、非法或超界地址识别;
多坐标匹配支持模块,用于根据选择的坐标系,返回对应坐标系统的匹配结果;包括正向多坐标支持、逆向多坐标支持;
地图展示模块,用于在地图上展示匹配后的地址信息。
本发明的有益效果是:本发明通过将不同的地名地址条数据通过空间分析、融合,最终分成不同级别、不同分区、不同节点的块数据。能够很好的兼容原先用户在使用地址匹配引擎时,用别名、俗称去检索的情况。也能同时返回AOI和POI数据,实现从点到面和从面到点的双向互通。只需要一次部署,就能实现多级,多向复用。从而减少重复建设,提高了资源利用率。
附图说明
图1是本发明一种涵盖AOI和POI标准地址匹配引擎方法的流程图;
图2是本发明一种涵盖AOI和POI标准地址匹配引擎系统的架构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。
实施例一:
地址匹配是将地址数据按照一定的地址匹配策略与标准地名地址库中的信息数据进行比对,并进行必要的地址插值计算处理,从而自动获取该地名地址的对应的空间地理坐标值,并准确的定位到电子地图的相应空间位置上的过程。
地址匹配的目标是为输入的地址数据返回最准确的匹配结果。首先它会在最小级别的地名地址范围内进行精确匹配,如果没有找到匹配的地名地址,它会在上一级的地址范围内进行搜寻,直到找到匹配结果为止。最后,完成匹配的地址数据被赋予了空间坐标。地址匹配引擎既要能完成单个地址的匹配,也要能完成大批量地址匹配任务,从而实现多种类型的城市地址定位。
地址匹配的流程大致为:将用户输入的地名地址字符串依照规范进行地址规范化预处理和解析,将规范化后的地名地址数据进行逻辑组合,形成精确查询条件。然后通过查询条件和标准地名地址库中的数据进行匹配,如成功,则返回准确的结果数据;如不成功则进行相关反馈。
如图1所示,本发明中的涵盖AOI和POI标准地址匹配引擎方法具体包括以下步骤:
S1.输入地址数据;
S2.对地址数据进行规范化预处理和解析;
S3.将规范化后的地址数据进行逻辑组合,通过空间分析、融合分成多个不同级别、不同分区、不同节点的块数据,形成精确的查询条件;
S4.通过查询条件和标准地址库中的数据进行匹配,若匹配成功,则返回准确的AOI和POI数据;若匹配不成功则上报标准地址匹配投诉平台进行问题反馈。
其中步骤S2中,规范化预处理和解析包括:繁体简体转换、半角全角转换、汉字和数字转化、地址别名和标准地址名转化、同义词转化、地址数据进行分级分词处理、中文和拼音转化的预处理和解析。多样化的预处理和解析步骤,能够满足用于多种输入信息的转换,来进行快速的检索匹配。
步骤S4的匹配过程中,首先在最小级别的地址范围内进行精确匹配,如果没有找到匹配的地址,则继续在上一级的地址范围内进行搜寻,直到找到匹配结果为止,完成匹配的地址数据被赋予了空间坐标。通过块数据的构建,在搜寻时根据块数据的级别依次搜寻,更具层次和逻辑性,能提高地址查询的快速性。
作为匹配过程中的多种功能实现方法,步骤S4的匹配过程包括正向匹配步骤,其包括:S41.将规范化后的地址数据通过分词算法进行词法分析和语义分析,分割形成地址数据段,关联标准地址库,查找潜在的位置,根据与联标准地址的接近程度为每个候选位置指定分值,最后用分值最高的来匹配该地址数据,返回分值最高的标准地址。
步骤S41具体还包括:
S411.批量地址正向匹配:可以输入多条地址数据,进行批量的地址匹配,返回相应的地址匹配数据;
S412.单条地址正向匹配:输入单条地址数据进行匹配,返回匹配的坐标位置;
S413.正向匹配精度:根据每条地址数据的匹配情况,按照规则和算法计算地址的正向匹配精度。
通过地址的正向匹配,实现输入地址地名来查询出该地名对应的地理空间坐标位置,同时可以单条和批量进行检索搜寻,提高了查询的效率。
步骤S4的匹配过程包括反向匹配步骤,具体包括:
S42.将输入自然语言描述的地址替换为空间信息坐标,判断是否有与该空间信息坐标关联的地址库数据,根据规范的地名地址,进行匹配,具体分为:
S421.批量地址逆向匹配:输入多条经纬度坐标数据,进行批量的地址匹配,返回相应的标准地名地址;
S422.单条地址逆向匹配:输入单条经纬度坐标数据进行匹配,返回匹配的标准地名地址;
S423.逆向匹配精度:根据每条经纬度坐标数据的匹配情况,按照规则和算法计算地址的逆向匹配精度。
通过地址的逆向匹配,实现输入地址的地理空间坐标来查询出该坐标对应的标准地名,同时可以单条和批量进行检索搜寻,提高了查询的效率。
步骤S4的匹配过程包括别名匹配步骤,具体包括:S43.地名别名识别匹配:自动识别所输入的地址别名,并进行关联查询、匹配,返回相应的结果。对于仅知道地址别名的地址检索,系统也可以对地名别名进行匹配,并查询出标准的地名信息和坐标位置。
步骤S4的匹配过程包括容错匹配步骤,具体包括:S44.根据输入的地址与标准地址的数据进行同音字、通假字、同义词的识别和匹配。当用户对需要查询的地址只有模糊的信息时,可以根据已知的信息输入,通过系统的同音字、通假字、同义词识别来搜寻到标准的地名信息和坐标位置。
本发明基于最大公约数原则,整合各地址管理部门的行业标准形成了统一规范,将所有地址分成省、市、区、街道、社区、小区、楼栋、梯、户9个级别,从而实现从POI到AOI(即点到面)和从AOI到POI(即面到点)的查询。本发明将原本单一的地名地址条形数据通过空间关系构建成不同级别的块数据,从而提高数据查询的快速性、精确性等,能够使用户在使用本地址匹配引擎系统时,更加快速,精准的得到想要的结果,减少时间的花销,提高工作效率。
实施例二:
如图2所示,本发明提供一种来实施涵盖AOI和POI标准地址匹配引擎方法的系统,该涵盖AOI和POI标准地址匹配引擎系统包括预处理模块、正向匹配模块、反向匹配模块、智能提示模块、地图展示模块、多坐标匹配支持模块等。
其中,各个模块的功能和实施过程如下:
(1)预处理模块:由于地址信息获取的途径不同,以及这些数据是否由同一个人整理,都会影响地址数据质量的好坏,常见的问题有数据输入错误和地址位置表示不明等情况,上述有问题的数据不能直接进行编码,需要进行预处理,为标准化做准备。地址匹配前,根据用户输入的地址内容,进行相关的预处理,包括繁体简体转换、半角全角转换、汉字和数字转化等,通过地名别名预处理等,进一步提高地址匹配的准确率。具体功能包括:
a.对输入的匹配地址,如存在繁体字则需要先做繁简体转换预处理;
b.对匹配地址的全角数字转化成半角数字;
c.对输入的地址存在汉字数字的,进行普通数字转化预处理;
d.对输入的地址进行别名预处理,转化成标准的地址再去进行地址匹配;
e.对输入的地址进行同义词转化预处理。比如在地名地址库中,“#”、号、栋、幢等同义,如果地名地址中有“#”,就需要进行同义词转化预处理。转化后,跟“#”相关的同义词都会存在;
f.对规范化后的地址数据进行分级分词,如福建省福州市鼓楼区五四路118号三盛国际中心,最终会形成福建省/福州市/鼓楼区/五四路118号/三盛国际中心;
g.对规范化分词后的地址进行中文拼音转化,如“三盛国际”,转化后为三盛国际/sanshengguoji。
(2)正向匹配模块:地址数据具有分段式描述的特点,且分段的位置都是通过具有区域表示意义的地址信息指示关键词标识的。根据化整为零,化繁为简的思想,将地址信息通过分词算法等进行词法分析和语义分析,分割形成地址数据段,关联标准地名地址库,查找潜在的位置,根据与地址的接近程度为每个候选位置指定分值,最后用分值最高的来匹配这个地址,返回分值最高标准地名地址。具体功能包括:
a.批量地址正向匹配:可以输入多条地址数据,进行批量的地址匹配,返回相应的地名地址匹配数据;
b.单条地址正向匹配:输入单条地址数据进行匹配,返回匹配的坐标位置;
c.正向匹配精度:根据每条地址数据的匹配情况,按照规则和算法计算地址的正向匹配精度。
(3)反向匹配模块:输入空间信息坐标,判断是否有与该建筑物关联的地址库数据,根据规范的建筑物名称,进行智能匹配。用户输入的经度、纬度坐标值,便可实现反向查询得到该坐标所在的标准地名地址信息。具体功能包括:
a.批量地址逆向匹配:可以输入多条经纬度坐标数据,进行批量的地址匹配,返回相应的标准地名地址;
b.单条地址逆向匹配:输入单条经纬度坐标数据进行匹配,返回匹配的标准地名地址;
c.逆向匹配精度:根据每条经纬度坐标数据的匹配情况,按照规则和算法计算地址的逆向匹配精度。
(4)别名匹配模块:针对系统用户进行定位时,习惯使用别名的特点,如党政机关、科研院所和学校等,提供精确匹配地址别名功能,并返回这些别名的标准地名地址。具体功能包括:
a.地名识别匹配:自动识别所输入的地名地址,与标准地名地址进行关联查询,返回相应的标准地名地址;
b.地名别名识别匹配:自动识别所输入的地址别名,并进行关联查询、匹配,返回相应的结果。
(5)容错匹配模块:当用户输入的地址不规范甚至错误时,匹配引擎可以根据同音字、通假字和同义词对地址进行分析,并返回最佳的匹配结果。具体功能如下:
a.同音字容错匹配:根据输入的地址与标准地址的数据进行同音字识别、匹配;
b.通假字容错匹配:根据输入的地址与标准地址的数据进行通假字识别、匹配;
c.同义词容错匹配:根据输入的地址与标准地址的数据进行同义词识别、匹配。
(6)智能提示模块:在用户对地址匹配引擎系统进行相关操作时,在一些内容、错误进行必要的提示,防止用户操作错误。具体功能如下:
a.地址智能提示:用户在输入地址过程中,根据已输入内容先进行匹配,并快速高效返回匹配结果,按照匹配精度智能提示,方便用户的输入和选择补全;
b.周边地址智能提示:根据输入的地址和匹配结果,返回匹配精度最高的地址,同时智能提示该地址周边的地址;
c.非法或超界地址识别:匹配引擎可以识别严重的输入地址错误,或超出参考地址范围的地址输入,给出匹配失败信息。
(7)多坐标匹配支持模块:如标准地址库数据同时采用地方独立坐标系统和WGS84坐标系统,地址匹配引擎可以支持两套坐标系,根据用户的选择的坐标系,返回相应坐标系统的匹配结果。具体功能如下:
a.正向多坐标支持:根据输入的地址数据,以及所支持的坐标系统,返回匹配后地址所对应该坐标系统的经纬度坐标;
b.逆向多坐标支持:根据输入的经纬度坐标数据,以及该数据所对应并支持的坐标系统,返回匹配后的地址数据。
(8)地图展示模块:上述所有模块功能都将在地图展示模块进行一一匹配,使用户在使用地址匹配引擎时有更加优越的用户体验。
如图2所示,本系统还包括各个层面的实施部分,而标准地址匹配引擎作为其中的应用层面,可搭配其他应用层面共同实施对地址的查询检索。其他应用层面还包括有:
展示层面:有PC端、移动设备端、显示大屏;
服务层面:与正向匹配模块配合的正向匹配服务端,与反向匹配模块配合的反向匹配服务端,支持楼栋地址查询的楼栋地址服务端,对查询地址的可视区域分析服务端,标准地址范围服务端;
数据资源层面:包括统一标准地名地址库、统一标准地名地址别名库、统一标准地名地址历史库;
基础设施层面:包括服务器里的Docker引擎、KVM切换器、Linux系统。
本发明利用在相同坐标系下,将不同的地名地址数据通过空间关系构建成不同级别的块数据。从而提高地名地址数据查询的快速性、精确性,能够使用户在使用本专利地址匹配引擎时,更加快速,精准的得到想要的结果,减少时间的花销,提高工作效率。同时增加了地名地址数据库的可读性和可扩展性。
目前与本发明最相似的地址匹配引擎解决技术方案是利用关系型数据库中全文检索功能组件,构建地址匹配引擎。对每一条地名地址数据的关键信息的每一个字、每一个词建立索引。当用户使用地名地址引擎时,地址匹配程序就对事先建立的索引进行查询,并将结果返回给用户。
本发明通过利用全文检索工具将地名地址数据分成不同级别、不同分区、不同节点的块数据。当用户使用标准地名地址匹配引擎时,地址匹配引擎会将模糊的查询条件转化成多个可以利用索引进行精确查询的逻辑组合条件,然后再用组合条件的结果去标准地名地址数据库查询。最后将查询到的精准数据结果返回给系统用户。
本发明通过将不同的地名地址条数据通过空间分析、融合,最终分成不同级别、不同分区、不同节点的块数据。能够很好的兼容原先用户在使用地址匹配引擎时,用别名、俗称去检索的情况。也能同时返回AOI和POI数据,实现从点到面和从面到点的双向互通。本发明的地址匹配引擎也有非常优秀的弹性扩展能力,既能够实现市、省、国家、世界等级别的纵向扩展,也能够实现各级别不同政务的横向扩展。只需要一次部署,就能实现多级,多向复用。从而减少重复建设,提高了资源利用率。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (10)

1.一种涵盖AOI和POI标准地址匹配引擎方法,其特征在于,包括以下步骤:
S1.输入地址数据;
S2.对地址数据进行规范化预处理和解析;
S3.将规范化后的地址数据进行逻辑组合,通过空间分析、融合分成多个不同级别、不同分区、不同节点的块数据,形成精确的查询条件;
S4.通过查询条件和标准地址库中的数据进行匹配,若匹配成功,则返回准确的AOI和POI数据;若匹配不成功则进行问题反馈。
2.根据权利要求1所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S2中,规范化预处理和解析包括:繁体简体转换、半角全角转换、汉字和数字转化、地址别名和标准地址名转化、同义词转化、地址数据进行分级分词处理、中文和拼音转化的预处理和解析。
3.根据权利要求1所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S4的匹配过程中,首先在最小级别的地址范围内进行精确匹配,如果没有找到匹配的地址,则继续在上一级的地址范围内进行搜寻,直到找到匹配结果为止,完成匹配的地址数据被赋予了空间坐标。
4.根据权利要求1所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S4的匹配过程包括正向匹配步骤,其包括:
S41.将规范化后的地址数据通过分词算法进行词法分析和语义分析,分割形成地址数据段,关联标准地址库,查找潜在的位置,根据与联标准地址的接近程度为每个候选位置指定分值,最后用分值最高的来匹配该地址数据,返回分值最高的标准地址。
5.根据权利要求4所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S41包括:
S411.批量地址正向匹配:可以输入多条地址数据,进行批量的地址匹配,返回相应的地址匹配数据;
S412.单条地址正向匹配:输入单条地址数据进行匹配,返回匹配的坐标位置;
S413.正向匹配精度:根据每条地址数据的匹配情况,按照规则和算法计算地址的正向匹配精度。
6.根据权利要求1所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S4的匹配过程包括反向匹配步骤,其包括:
S42.将输入自然语言描述的地址替换为空间信息坐标,判断是否有与该空间信息坐标关联的地址库数据,根据规范的地名地址,进行匹配,具体分为:
S421.批量地址逆向匹配:输入多条经纬度坐标数据,进行批量的地址匹配,返回相应的标准地名地址;
S422.单条地址逆向匹配:输入单条经纬度坐标数据进行匹配,返回匹配的标准地名地址;
S423.逆向匹配精度:根据每条经纬度坐标数据的匹配情况,按照规则和算法计算地址的逆向匹配精度。
7.根据权利要求1所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S4的匹配过程包括别名匹配步骤,其包括:
S43.地名别名识别匹配:自动识别所输入的地址别名,并进行关联查询、匹配,返回相应的结果。
8.根据权利要求1所述涵盖AOI和POI标准地址匹配引擎方法,其特征在于,所述步骤S4的匹配过程包括容错匹配步骤,其包括:
S44.根据输入的地址与标准地址的数据进行同音字、通假字、同义词的识别和匹配。
9.一种基于权利要求1至8任一项所述方法的涵盖AOI和POI标准地址匹配引擎系统,其特征在于,包括
预处理模块,用于地址匹配前,根据用户输入的地址内容进行规范化的预处理和解析;包括繁体简体转换、半角全角转换、汉字和数字转化、地址别名和标准地址名转化、同义词转化、地址数据进行分级分词处理、中文和拼音转化的预处理和解析;
正向匹配模块,用于将地址信息分成块数据,并关联标准地址库匹配坐标位置,包括批量地址正向匹配、单条地址正向匹配;
反向匹配模块,用于将输入的空间信息坐标关联标准的地址库数据,并匹配对应的标准地名地址,包括批量地址逆向匹配、单条地址逆向匹配;
别名匹配模块,用于自动识别所输入的地址别名,并进行关联查询、匹配,返回相应的结果;
容错匹配模块,用于对输入的地址信息根据同音字、通假字和同义词对地址进行分析,并返回匹配结果。
10.根据权利要求9所述涵盖AOI和POI标准地址匹配引擎系统,其特征在于,还包括:
智能提示模块,用于用户操作标准地址匹配引擎系统的内容和错误提示;包括地址智能提示、周边地址智能提示、非法或超界地址识别;
多坐标匹配支持模块,用于根据选择的坐标系,返回对应坐标系统的匹配结果;包括正向多坐标支持、逆向多坐标支持;
地图展示模块,用于在地图上展示匹配后的地址信息。
CN202011076968.4A 2020-10-10 2020-10-10 一种涵盖aoi和poi标准地址匹配引擎的方法及系统 Pending CN112328910A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011076968.4A CN112328910A (zh) 2020-10-10 2020-10-10 一种涵盖aoi和poi标准地址匹配引擎的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011076968.4A CN112328910A (zh) 2020-10-10 2020-10-10 一种涵盖aoi和poi标准地址匹配引擎的方法及系统

Publications (1)

Publication Number Publication Date
CN112328910A true CN112328910A (zh) 2021-02-05

Family

ID=74314752

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011076968.4A Pending CN112328910A (zh) 2020-10-10 2020-10-10 一种涵盖aoi和poi标准地址匹配引擎的方法及系统

Country Status (1)

Country Link
CN (1) CN112328910A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113179306A (zh) * 2021-04-23 2021-07-27 上海中通吉网络技术有限公司 基于http请求内容的流量分发方法
CN113190596A (zh) * 2021-04-22 2021-07-30 华中科技大学 一种地名地址混合匹配的方法和装置
WO2023019526A1 (zh) * 2021-08-19 2023-02-23 展讯通信(上海)有限公司 一种定位坐标系的协商方法及相关产品

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113190596A (zh) * 2021-04-22 2021-07-30 华中科技大学 一种地名地址混合匹配的方法和装置
CN113179306A (zh) * 2021-04-23 2021-07-27 上海中通吉网络技术有限公司 基于http请求内容的流量分发方法
CN113179306B (zh) * 2021-04-23 2022-12-06 上海中通吉网络技术有限公司 基于http请求内容的流量分发方法
WO2023019526A1 (zh) * 2021-08-19 2023-02-23 展讯通信(上海)有限公司 一种定位坐标系的协商方法及相关产品

Similar Documents

Publication Publication Date Title
CN109299110B (zh) 数据查询方法、装置、存储介质和电子设备
CN109145169B (zh) 一种基于统计分词的地址匹配方法
CN108170859B (zh) 语音查询的方法、装置、存储介质及终端设备
CN112328910A (zh) 一种涵盖aoi和poi标准地址匹配引擎的方法及系统
CN101350012B (zh) 一种地址匹配的方法和系统
CN102395965B (zh) 用于在数据库中搜索对象的方法
US8959084B2 (en) Identifying locations
CN101350013A (zh) 一种地理信息的搜索方法和系统
CN101136028B (zh) 基于自然语言的位置查询系统以及基于关键词的位置查询系统
CN110399448B (zh) 中文地名地址搜索匹配方法、终端、计算机可读存储介质
CN101313300A (zh) 本地搜索
CN108959643B (zh) 生成标签的方法、装置、服务器和存储介质
CN104143005A (zh) 一种相关搜索系统及方法
CN112650858B (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN112528639B (zh) 对象识别方法和装置、存储介质及电子设备
CN111666425B (zh) 基于语义知识的汽配件搜索方法
WO2015018247A1 (zh) 事件多维度信息显示装置和方法
CN105701133A (zh) 一种地址输入的方法和设备
CN114579882A (zh) 地址查询方法、获取地理编码预测模型的方法及对应装置
CN111538796A (zh) 地址规范化处理方法、装置、设备及存储介质
CN110688434A (zh) 一种兴趣点处理方法、装置、设备和介质
Borges et al. Ontology-driven discovery of geospatial evidence in web pages
CN116662583B (zh) 一种文本生成方法、地点检索方法及相关装置
CN115712667B (zh) 一种图数据融合分析方法、装置及存储介质
US20060100999A1 (en) System and method for data entry and search

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination