CN111488409A - 一种城市地址库构建方法、检索方法及装置 - Google Patents

一种城市地址库构建方法、检索方法及装置 Download PDF

Info

Publication number
CN111488409A
CN111488409A CN201910072714.6A CN201910072714A CN111488409A CN 111488409 A CN111488409 A CN 111488409A CN 201910072714 A CN201910072714 A CN 201910072714A CN 111488409 A CN111488409 A CN 111488409A
Authority
CN
China
Prior art keywords
address
address data
fused
data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910072714.6A
Other languages
English (en)
Inventor
李新辉
徐传明
王韦
皮宇
刘志鹏
李扬
曾琨
吴泽驹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Autonavi Software Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910072714.6A priority Critical patent/CN111488409A/zh
Publication of CN111488409A publication Critical patent/CN111488409A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种城市地址库构建方法、检索方法及装置,其中的构建方法包括:从标准地址库中获取标准地址的地址数据,从兴趣点地址库中获取兴趣点地址的地址数据;从来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据;将查找到的所述多个地址数据融合成融合地址数据;基于所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。本发明能够形成具有足够信息量的统一的城市地址库,以满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。

Description

一种城市地址库构建方法、检索方法及装置
技术领域
本发明涉及一种城市地址库构建方法、检索方法及装置,属于智能交通、城市大脑、电子地图、车载导航等技术领域。
背景技术
城市地址库是指按照一定的地址标注标准而记录的城市中各处位置地址的数据库,每一个地址条目例如可以由市、区、街道、社区、房屋以及门牌号构成。然而,现有城市地址库存在如下问题:
1、不同的地址信息管理部门所依据的地址标准不统一
一个城市中的地址信息管理部门众多,分散在公安、规划国土、住建、网格管理等多个部门,比如公安负责管理门楼牌,规划国土负责管理建筑物、小区和道路,网格管理部门负责采集实有房屋信息。不同的地址信息管理部门都遵循各自的行业标准,地址格式和命名规范都不一致,缺乏统一的规范和标准,信息整合难度较大。这就导致整个城市没有一个统一规范的地址库可用,政府各职能部门的信息系统在采集地址时大多采用手工录入方式,地址的规范性和准确性得不到保证,给城市管理和社会治理带来诸多困难和不便。并且不同部门之间的地址信息资源相对独立,没有进行关联整合。从而造成了“分散采集、分散管理”的业务模式和“信息孤岛、信息不对称”的应用模式。
2、现有城市地址库中所保存的标准地址的信息量不足
虽然现有的标准地址包含街道、门牌号等详细信息,然而,在实际生活中,人们通常记不住门牌号等抽象的数字,而只能记住商户名或建筑物名等兴趣点名称,例如某某大厦、某某商场、某某购物中心等。但是,兴趣点未必是与某个地址同时产生的,而且也未必占据整个地址,因此兴趣点名称往往并不包含在标准地址中。例如,某某超市位于某某路某某号的建筑内,但该超市可能是该建筑建成后的若干年才入住的,并且该建筑内还入住有很多其他商户,因此虽然人们易于记住该超市的名称,但该超市的名称并不体现在现有的标准地址中。
这种标准地址的信息量不足会给日常生活带来诸多不便。例如,公安部门在接到老百姓报警时,往往由于地址不详,无法精准定位,造成民警多跑路、跑错路;在人口管理方面,由于缺乏完整的标准地址库认证,存在录入地址不规范、不合法的情况,以房管人难以落地;在商事主体注册登记方面,同样由于缺乏地址认证,存在不少虚假注册地址,给事后监管带来困难。
发明内容
鉴于现有技术中存在的技术缺陷和技术弊端,本发明实施例提供一种城市地址库构建方法、检索方法及装置,能够形成具有足够信息量的统一的城市地址库,以满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。
本发明一方面提供一种城市地址库构建方法,其中包括:
从标准地址库中获取标准地址的地址数据,从兴趣点地址库中获取兴趣点地址的地址数据;
从来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据;
将查找到的所述多个地址数据融合成融合地址数据;
基于所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。
本发明另一方面提供一种基于由上述方法构建的所述城市地址库的检索方法,其中包括:
根据检索目标关键词与所述城市地址库中的融合地址数据进行匹配;
根据所述检索目标关键词与各个所述融合地址数据的匹配率确定命中的融合地址数据;
根据命中的所述融合地址数据读取相应的地址数据作为检索结果。
本发明又一方面提供一种城市地址库构建装置,其中包括:
地址获取模块,用于从标准地址库中获取标准地址的地址数据,并从兴趣点地址库中获取兴趣点地址的地址数据;
地址查找模块,用于从由所述地址获取模块获取的来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据;
地址融合模块,用于将所述地址查找模块查找到的所述多个地址数据融合成融合地址数据;以及
地址建库模块,用于基于所述地址融合模块融合成的所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。
本发明再一方面提供一种基于上述方法构建的所述城市地址库的检索装置,其中包括:
地址匹配模块,用于根据检索目标关键词与所述城市地址库中的融合地址数据进行匹配;
地址命中模块,用于根据所述地址匹配模块进行所述匹配后得到的所述检索目标关键词与各个所述融合地址数据的匹配率确定命中的融合地址数据;以及
结果生成模块,用于根据所述地址命中模块命中的所述融合地址数据读取相应的地址数据作为检索结果。
本发明再一方面提供一种计算机可读存储介质,其上存储有计算机程序,其中该程序被处理器执行时实现上述方法。
本发明再一方面提供计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其看,所述处理器执行所述程序时实现上述方法。
本发明通过将来源于不同地址库但指向相同地址的多个地址数据融合成融合地址数据进而构建成城市地址库,使得城市地址库中的各个地址数据具有更全面的地址信息,不仅包含了标准地址的信息,也包含了兴趣点地址的信息,因此能够满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所记载的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例1提供的城市地址库构建方法的流程图;
图2为图1中步骤120的具体流程图;
图3为本发明实施例2提供的城市地址库检索方法的流程图;
图4为本发明实施例3提供的城市地址库构建装置的结构示意图;
图5为本发明实施例4提供的城市地址库检索装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
实施例1
图1为本发明实施例1提供的城市地址库构建方法的流程图,如图所示,该方法包括如下步骤:
步骤110,从标准地址库中获取标准地址的地址数据,从兴趣点地址库中获取兴趣点地址的地址数据。
其中,所述标准地址是指按照现有的地址标注标准记录的城市中各处位置的地址信息,所述标准地址库是指保存有由城市中的地址信息管理部门采集并管理的标准地址的数据库。
具体地,在获取标准地址的地址数据时,可以从多个标准地址库中分别获取各自存储的标准地址的地址数据。这些标准地址库有可能是由该城市的多个地址信息管理部门所各自采集并管理的标准地址库,以便在此后的步骤中所构建的城市地址库能够满足各个地址信息管理部门的应用需求。也就是说,如果标准地址库为一个,则获取的所述地址数据包括:来源于该标准地址库的标准地址的地址数据,以及来源于上述兴趣点地址库的兴趣点地址的地址数据;如果标准地址库为多个,则获取的所述地址数据包括:分别来源于多个标准地址库的标准地址的地址数据,以及来源于上述兴趣点地址库的兴趣点地址的地址数据。
所述兴趣点地址是指由电子地图服务提供商在构建电子地图时通过互联网导航软件等应用(APP)采集的地图上各个兴趣点(Point of Interest,POI)的地址信息。其中,一个兴趣点可以是一栋房子、一个商铺、一个邮筒、一个公交站等不同表达方式,一个兴趣点地址中可以包括兴趣点名称和兴趣点位置。其中,兴趣点名称可以包括某某大厦、某某商场、某某购物中心等正式名,也可以包括俗称、简称、曾用名等非正式名;兴趣点位置可以是标准地址也可以是非标准地址。所述兴趣点地址库是指保存有上述兴趣点地址的数据库,通常由电子地图服务提供商进行维护管理。
步骤120,从来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据。
其中,所述相同地址是指虽然多个地址数据之间的内容不完全相同,但实际上二者均指向地图上的同一位置。由于通常在同一个地址库中不会有重复的地址,因此只需要在来源于不同地址库的地址数据看进行上述查找过程。
例如,分别从两个标准地址库获取的标准地址S1和S2的地址数据以及从兴趣点地址库获取的兴趣点地址P1和P2的地址数据如表1所示:
表1
Figure BDA0001957775310000061
上述表1中的“M大厦”表示兴趣点地址P1、P2的兴趣点名称,“A市B区C大街E座F室”表示兴趣点地址P1的兴趣点位置,“A市B区C大街K座F室”表示兴趣点地址P2的兴趣点位置。在本例中,标准地址S1和S2及兴趣点地址P1指向相同地址,而兴趣点地址P2指向不同地址,具体的查找过程如图2所示例如可以包括如下步骤:
步骤121,基于预设的语义规则将获取的所述地址数据分别切割成多个字段。
其中,所述字段是指各条地址数据中用于特定地址内容的信息,例如:用于表示城市的城市名字段、用于表示城区的城区名字段等等。具体地,可以将从各个地址库中获取的原始的地址数据与进行切割后的各个字段相关联地保存在索引文件中。
例如,上述表1所示举例中的各个地址数据均为连续的字符串,在本步骤中,通过基于语义规则,例如基于“市”、“区”、“大街”等关键词可以将这些字符串切割成若干字段,切割后的结果如表2所示:
表2
字段 城市名 城区名 街道名 社区名 楼牌号 门牌号 兴趣点名
标准地址S1 A B C D E F
标准地址S2 A C D E F
兴趣点地址P1 A B C E F M
兴趣点地址P2 A B C K F M
步骤122,对来源于不同地址库的所述地址数据进行字段值的比较。
其中,所述字段值是指具体的字段内容。如上述表2可见,虽然标准地址S1中的“F号房间”与标准地址S2中“F室”的具体表述方式并不相同,但它们均属于“门牌号”这一字段,且字段值是相同的,均为“F”。类似地,虽然标准地址S1和标准地址S2中“E号楼”与兴趣点地址P1中的“E座”的具体表述方式并不相同,但它们均属于“楼牌号”这一字段,且字段值相同的,均为“E”,然而,兴趣点地址P2的楼牌号字段的字段值为“K”,与标准地址S1和S2中的楼牌号字段的字段值均不同。
具体地,由于兴趣点地址P1与兴趣点地址P2均来源于兴趣点地址库,如上所述,同一个地址库中不会有重复的地址,因此无需对二者进行字段值的比较。另外,由于标准地址中通常不包括兴趣点名,因此在进行比较时可以忽略该字段。
步骤123,当多个地址数据包含预定值以上个相同的高阶字段以及完全相同的低阶字段时,则确定所述多个地址数据指向相同地址。
其中,高阶字段是指地址数据中指向范围较大的字段,如城市名字段、城区名字段、街道名字段和社区名字段等;低阶字段是指地址数据中指向范围较小的字段,具体可以将建筑物后缀相关的字段指定为低阶字段,如表2中的楼牌号字段和门牌号字段等。
例如,所述预定值为3,在表2所述的例子中,标准地址S1与标准地址S2相比,它们包含有三个相同的高阶字段值,即:城市名字段、街道名字段和社区名字段,以及完全相同的低阶字段,即,楼牌号字段和门牌号字段,因此认为标准地址S1与标准地址S2指向相同地址。
另外,标准地址S1与兴趣点地址P1相比,它们包含有三个相同的高阶字段值,即:城市名字段、城区名字段和街道名字段,以及完全相同的低阶字段,即,楼牌号字段和门牌号字段,因此认为标准地址S1与兴趣点地址P1也指向相同地址。即,标准地址S1、S2及兴趣点地址P1均指向相同地址。
然而,在表2中,兴趣点地址P2的楼牌号字段的字段值为K,与标准地址S1和标准地址S1的楼牌号字段均不相同,由于楼牌号字段属于低阶字段,因此认为兴趣点地址P2与标准地址S1或S2并未指向相同地址。
步骤130,将查找到的所述多个地址数据融合成融合地址数据。
具体地,可以将查找到的所述多个地址数据中的相同字段及不同字段按照预设拼接规则拼接成一个字段序列作为所述融合地址数据。
例如,上述表2中所示的指向相同地址的标准地址S1、标准地址S2和兴趣点地址P1融合成表3所示的融合地址数据。
表3
字段 城市名 城区名 街道名 社区名 楼牌号 门牌号 兴趣点名
融合地址数据 A B C D E F M
步骤140,基于所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。
例如,在表3中的融合地址数据是由标准地址S1、标准地址S2和兴趣点地址P1融合而成,将这些地址进行相关联保存;类似地,将通过上述步骤生成的其他融合地址数据与相应的地址数据也进行相关联保存,从而构建成城市地址库。
另外,对于获取的所述地址数据中未被融合成所述融合地址数据的地址数据,例如兴趣点地址P2,也可以被添加到所述城市地址库中,以使城市地址库具有更丰富的内容。
本实施例所述构建方法通过将来源于不同地址库但指向相同地址的多个地址数据融合成融合地址数据进而构建成城市地址库,使得城市地址库中的各个地址数据具有更全面的地址信息,不仅包含了标准地址的信息,也包含了兴趣点地址的信息,因此能够满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。
实施例2
本实施例提供了一种基于上述实施例所述方法构建的所述城市地址库的检索方法,如图3所示,该检索方法可以包括如下步骤:
步骤210,根据检索目标关键词与所述城市地址库中的融合地址数据进行匹配。
其中,检索目标关键词可以是城市地址库的用户输入的用于检索地址信息的关键词,可以是一个,也可以是多个。这些关键词例如为:M大厦、E楼、F门。
具体地,本实施例所述的融合地址数据可以具有上述表3所示的字段序列结构,在进行所述匹配时,可以将所述检索目标关键词与所述融合地址数据中的字段进行匹配。
例如,在上例中,将关键词“M大厦”与各个融合地址数据中的兴趣点名字段进行匹配,将关键词“E楼”与各个融合地址数据中的楼牌号字段进行匹配,将关键词“F门”与各个融合地址数据中的门牌号字段进行匹配。
步骤220,根据所述检索目标关键词与各个所述融合地址数据的匹配率确定命中的融合地址数据。
其中,所述匹配率是指检索目标关键词与各个融合地址数据的匹配程度。具体地,当融合地址数据中与所述检索目标关键词相同的字段数量为预定阈值以上时,则该融合地址数据被命中。
例如,该预定阈值可以为3,在上例中,兴趣点名字段、楼牌号字段及门牌号字段的字段值与检索目标关键词相同,因此,表3中所示的融合地址数据能够被命中。由于与检索目标关键词相匹配的字段只是融合地址数据中的部分字段,因此被命中的融合地址数据可能是一个也可能是多个,可以通过调整预定阈值来进行调节。
步骤230,根据命中的所述融合地址数据读取相应的地址数据作为检索结果。
由于本实施例中所使用的城市地址库是基于融合地址数据与被融合的多个地址数据的对应关系构建的,因此能够根据命中的融合地址数据读取到相应的地址数据。
例如,在上例中,表3所示的融合地址数据被命中,如上所述,该融合地址数据是由标准地址S1和S2以及兴趣点地址P1融合而成的,因此可以读取这三个地址数据作为检索结果提供给用户,用户可以根据自身选择使用。
本实施例所述检索方法通过基于城市地址库中的融合地址数据进行检索,能够对整个城市实现全域范围内、多维度的地址智能管理和查询,因此能够满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。
例如,以背景技术中提到的几种应用场景中,可以得到如下的实际效果:
1,在公安报警的应用场景中
报案人员在向公安部门报警时,可以仅提供自己熟知的兴趣点名称,如某某大厦、某某公园、某某超市等。公安部门在接收到该报警后,基于城市地址库中融合地址数据中的兴趣点名字段便可以检索出相应的标准地址,从而能够精准地定位警情发生地点,避免多跑路、跑错路的问题。
2,在人口管理的应用场景中
人口管理部门可以根据被管理人员提供的地址片段从城市地址库中检索出完整的标准地址,从而保证录入地址的规范性和合法性,以便实现以房管人等各种行政手段;
3,在商事主体注册登记的应用场景中
工商行政管理部门在收到注册申请人提供的注册地址在城市地址库中检索出相应的标准地址,从而能够确认该地址的真实性,以排除虚假注册地址,便于事后监管。
实施例3
本实施例提供了一种城市地址库构建装置,能够实现上述构建方法,如图4所示,该装置包括:地址获取模块10、地址查找模块20、地址融合模块30和地址建库模块40,其工作原理如下:
地址获取模块10从标准地址库中获取标准地址的地址数据,并从兴趣点地址库中获取兴趣点地址的地址数据。具体地,地址获取模块10在获取所述标准地址的地址数据时,可以从多个标准地址库中分别获取各自存储的标准地址的地址数据。
然后,地址查找模块20从由地址获取模块10获取的来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据。具体地,可以由地址查找模块20中的字段切割单元21基于预设的语义规则将所述地址获取模块10获取的所述地址数据分别切割成多个字段;字段比较单元22根据所述字段切割单元21切割成的所述多个字段,对来源于不同地址库的所述地址数据进行字段值的比较;当字段比较单元22的比较结果表明多个地址数据包含预定值以上个相同的高阶字段以及完全相同的低阶字段时,地址确定单元23则确定多个地址数据指向相同地址。
此后,地址融合模块30将地址查找模块20查找到的所述多个地址数据融合成融合地址数据。具体地,可以将所述地址查找模块20查找到的所述多个地址数据中的相同字段及不同字段按照预设拼接规则拼接成一个字段序列作为所述融合地址数据。
最后,由地址建库模块40基于地址融合模块30融合成的所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。
另外,本实施例中未提及的技术细节及相关举例,可参见上述实施例1的相关内容,此处不再赘述。
本实施例所述构建装置通过将来源于不同地址库但指向相同地址的多个地址数据融合成融合地址数据进而构建成城市地址库,使得城市地址库中的各个地址数据具有更全面的地址信息,不仅包含了标准地址的信息,也包含了兴趣点地址的信息,因此能够满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。
实施例4
本实施例提供了一种城市地址库检索装置,能够基于由上述构建方法或构建装置构建的城市地址库实现上述检索方法。如图5所示,该装置包括:地址匹配模块70、地址命中模块80、以及结果生成模块90。其工作原理如下:
地址匹配模块70根据检索目标关键词与所述城市地址库中的融合地址数据进行匹配;地址命中模块80根据所述地址匹配模块进行所述匹配后得到的所述检索目标关键词与各个所述融合地址数据的匹配率确定命中的融合地址数据;结果生成模块90根据所述地址命中模块命中的所述融合地址数据读取相应的地址数据作为检索结果。
具体地,所述地址匹配模块70可以将所述检索目标关键词与所述融合地址数据中的字段进行匹配;然后由地址命中模块80根据所述地址匹配模块70进行所述匹配后得到的所述匹配率,当融合地址数据中与所述检索目标关键词相同的字段数量为预定阈值以上时,则确定该融合地址数据被命中。
本实施例中未提及的技术细节及相关举例,可参见上述实施例2的相关内容,此处不再赘述。
本实施例所述检索装置通过基于城市地址库中的融合地址数据进行检索,能够对整个城市实现全域范围内、多维度的地址智能管理和查询,因此能够满足各种场景下的地址查询需求,从而极大地提高应用城市地址库的灵活程度和服务效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种城市地址库构建方法,其特征在于,包括:
从标准地址库中获取标准地址的地址数据,从兴趣点地址库中获取兴趣点地址的地址数据;
从来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据;
将查找到的所述多个地址数据融合成融合地址数据;
基于所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。
2.根据权利要求1所述的方法,其特征在于,获取所述标准地址的地址数据包括:
从多个标准地址库中分别获取各自存储的标准地址的地址数据。
3.根据权利要求1或2所述的方法,其特征在于,所述从来源于不同地址库的所述地址数据中查找所述指向相同地址的多个地址数据包括:
基于预设的语义规则将获取的所述地址数据分别切割成多个字段;
对来源于不同地址库的所述地址数据进行字段值的比较;
当多个地址数据包含预定值以上个相同的高阶字段以及完全相同的低阶字段时,则确定所述多个地址数据指向相同地址。
4.根据权利要求3所述的方法,其特征在于,所述将查找到的所述多个地址数据融合成融合地址数据包括:
将查找到的所述多个地址数据中的相同字段及不同字段按照预设拼接规则拼接成一个字段序列作为所述融合地址数据。
5.一种基于权利要求1~4中任一项所述方法构建的所述城市地址库的检索方法,其特征在于,包括:
根据检索目标关键词与所述城市地址库中的融合地址数据进行匹配;
根据所述检索目标关键词与各个所述融合地址数据的匹配率确定命中的融合地址数据;
根据命中的所述融合地址数据读取相应的地址数据作为检索结果。
6.根据权利要求5所述的方法,其特征在于,
进行所述匹配包括:将所述检索目标关键词与所述融合地址数据中的字段进行匹配;
根据匹配率确定命中的融合地址数据包括:当融合地址数据中与所述检索目标关键词相同的字段数量为预定阈值以上时,则确定该融合地址数据被命中。
7.一种城市地址库构建装置,其特征在于,包括:
地址获取模块,用于从标准地址库中获取标准地址的地址数据,并从兴趣点地址库中获取兴趣点地址的地址数据;
地址查找模块,用于从由所述地址获取模块获取的来源于不同地址库的所述地址数据中查找指向相同地址的多个地址数据;
地址融合模块,用于将所述地址查找模块查找到的所述多个地址数据融合成融合地址数据;以及
地址建库模块,用于基于所述地址融合模块融合成的所述融合地址数据与被融合的所述多个地址数据的对应关系构建所述城市地址库。
8.根据权利要求7所述的装置,其特征在于,所述地址获取模块在获取所述标准地址的地址数据时,用于从多个标准地址库中分别获取各自存储的标准地址的地址数据。
9.根据权利要求7或8所述的装置,其特征在于,所述地址查找模块包括:
字段切割单元,用于基于预设的语义规则将所述地址获取模块获取的所述地址数据分别切割成多个字段;
字段比较单元,用于根据所述字段切割单元切割成的所述多个字段,对来源于不同地址库的所述地址数据进行字段值的比较;
地址确定单元,用于当所述字段比较单元的比较结果表明多个地址数据包含预定值以上个相同的高阶字段以及完全相同的低阶字段时,则确定所述多个地址数据指向相同地址。
10.根据权利要求9所述的装置,其特征在于,所述地址融合模块具体用于将所述地址查找模块查找到的所述多个地址数据中的相同字段及不同字段按照预设拼接规则拼接成一个字段序列作为所述融合地址数据。
11.一种基于权利要求1~4中任一项所述方法构建的所述城市地址库的检索装置,其特征在于,包括:
地址匹配模块,用于根据检索目标关键词与所述城市地址库中的融合地址数据进行匹配;
地址命中模块,用于根据所述地址匹配模块进行所述匹配后得到的所述检索目标关键词与各个所述融合地址数据的匹配率确定命中的融合地址数据;以及
结果生成模块,用于根据所述地址命中模块命中的所述融合地址数据读取相应的地址数据作为检索结果。
12.根据权利要求11所述的装置,其特征在于:
所述地址匹配模块具体用于将所述检索目标关键词与所述融合地址数据中的字段进行匹配;
所述地址命中模块具体用于根据所述地址匹配模块进行所述匹配后得到的所述匹配率,当融合地址数据中与所述检索目标关键词相同的字段数量为预定阈值以上时,则确定该融合地址数据被命中。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1~6任一项所述的方法。
14.一种计算机设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~6中任一项所述的方法。
CN201910072714.6A 2019-01-25 2019-01-25 一种城市地址库构建方法、检索方法及装置 Pending CN111488409A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910072714.6A CN111488409A (zh) 2019-01-25 2019-01-25 一种城市地址库构建方法、检索方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910072714.6A CN111488409A (zh) 2019-01-25 2019-01-25 一种城市地址库构建方法、检索方法及装置

Publications (1)

Publication Number Publication Date
CN111488409A true CN111488409A (zh) 2020-08-04

Family

ID=71793869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910072714.6A Pending CN111488409A (zh) 2019-01-25 2019-01-25 一种城市地址库构建方法、检索方法及装置

Country Status (1)

Country Link
CN (1) CN111488409A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113204613A (zh) * 2021-04-26 2021-08-03 北京百度网讯科技有限公司 地址生成方法、装置、设备和存储介质
CN113626408A (zh) * 2021-08-05 2021-11-09 广州城市信息研究所有限公司 一种城市信息数据库构建方法及一张图显示方法
CN114066284A (zh) * 2021-11-23 2022-02-18 上海歆广数据科技有限公司 一种标准地址体系服务管理系统及方法
JP2022092584A (ja) * 2020-12-10 2022-06-22 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データ処理方法、装置、電子デバイス及び可読記憶媒体

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072802A (ja) * 2004-09-03 2006-03-16 Hitachi Software Eng Co Ltd 住所データの検索方法及び住所データベース
CN105528372A (zh) * 2014-09-30 2016-04-27 华为技术有限公司 一种地址搜索方法和设备
CN106021556A (zh) * 2016-05-30 2016-10-12 深圳市华傲数据技术有限公司 地址信息处理方法及装置
WO2016165538A1 (zh) * 2015-04-13 2016-10-20 阿里巴巴集团控股有限公司 一种地址数据的管理方法和装置
CN107526786A (zh) * 2017-08-01 2017-12-29 江苏速度信息科技股份有限公司 基于多源数据的地名地址数据整合的方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006072802A (ja) * 2004-09-03 2006-03-16 Hitachi Software Eng Co Ltd 住所データの検索方法及び住所データベース
CN105528372A (zh) * 2014-09-30 2016-04-27 华为技术有限公司 一种地址搜索方法和设备
WO2016165538A1 (zh) * 2015-04-13 2016-10-20 阿里巴巴集团控股有限公司 一种地址数据的管理方法和装置
CN106021556A (zh) * 2016-05-30 2016-10-12 深圳市华傲数据技术有限公司 地址信息处理方法及装置
CN107526786A (zh) * 2017-08-01 2017-12-29 江苏速度信息科技股份有限公司 基于多源数据的地名地址数据整合的方法和系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022092584A (ja) * 2020-12-10 2022-06-22 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド データ処理方法、装置、電子デバイス及び可読記憶媒体
CN113204613A (zh) * 2021-04-26 2021-08-03 北京百度网讯科技有限公司 地址生成方法、装置、设备和存储介质
CN113626408A (zh) * 2021-08-05 2021-11-09 广州城市信息研究所有限公司 一种城市信息数据库构建方法及一张图显示方法
CN113626408B (zh) * 2021-08-05 2022-04-12 广州城市信息研究所有限公司 一种城市信息数据库构建方法及一张图显示方法
CN114066284A (zh) * 2021-11-23 2022-02-18 上海歆广数据科技有限公司 一种标准地址体系服务管理系统及方法
CN114066284B (zh) * 2021-11-23 2024-03-29 上海歆广数据科技有限公司 一种标准地址体系服务管理系统及方法

Similar Documents

Publication Publication Date Title
CN111488409A (zh) 一种城市地址库构建方法、检索方法及装置
CN112347222B (zh) 一种基于知识库推理的将非标准地址转换为标准地址的方法及系统
CN108628811B (zh) 地址文本的匹配方法和装置
JP5856618B2 (ja) 地理空間データベース統合方法、およびデバイス
CN111625732B (zh) 地址匹配方法及装置
CN109977287B (zh) 一种不同信息源的房产数据同一性判别方法
Wu et al. Impact of mixed land use on housing values in high-density areas: Evidence from Beijing
CN111723959A (zh) 区域的划分方法、装置、存储介质及电子装置
CN109741227B (zh) 一种基于最近邻算法预测人房一致性处理方法及系统
Christen et al. A probabilistic geocoding system based on a national address file
CN106874384A (zh) 一种异构地址标准转换及匹配方法
CN107577744A (zh) 非标地址自动匹配模型、匹配方法以及模型建立方法
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
Isaj et al. Multi-source spatial entity linkage
US20130018704A1 (en) Systems and methods for determining school geographic boundaries and related searches
Deng et al. Quantitative comparison of open-source data for fine-grain mapping of land use
CN112699640B (zh) 基于PostgreSQL的地理编码方法和系统
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
Huang et al. Recognition of Functional Areas in an Old City Based on POI: A Case Study in Fuzhou, China
CN102999618A (zh) 基于地址归户的个人行为属性信息库建立方法及系统
Loai Ali et al. Towards rule-guided classification for volunteered geographic information
KR102271234B1 (ko) Pnu를 활용한 부동산 유사사례 db 생성 방법
CN116431625A (zh) 一种地理实体的定位分析方法、装置及计算机设备
David et al. Smart geocoding of objects
CN113468146A (zh) 基于全要素和全能力摸清基层治理底数的构造方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210226

Address after: Floor 1-5, block B1, 18 Changsheng Road, science and Technology Park, Changping District, Beijing

Applicant after: AUTONAVI SOFTWARE Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.