CN106033460A - 地址数据处理方法及装置 - Google Patents

地址数据处理方法及装置 Download PDF

Info

Publication number
CN106033460A
CN106033460A CN201510121494.3A CN201510121494A CN106033460A CN 106033460 A CN106033460 A CN 106033460A CN 201510121494 A CN201510121494 A CN 201510121494A CN 106033460 A CN106033460 A CN 106033460A
Authority
CN
China
Prior art keywords
target
information
address
administrative
address data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510121494.3A
Other languages
English (en)
Inventor
凌宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201510121494.3A priority Critical patent/CN106033460A/zh
Publication of CN106033460A publication Critical patent/CN106033460A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请提供了地址数据处理方法及装置,其中一种方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则确定所述目标地址数据的缺失格式,并补充所述目标地址数据中与所述缺失格式对应的地址信息。在将地址信息补充至目标地址后,目标地址便符合预设地址格式规则的规定,即目标地址数据具有完整信息,从而可以被准确识别。本申请能够自动补充目标地址中缺失的信息,使得补充完整后的目标地址能够被准确识别,与传统人工识别方式相比能够提升目标地址数据的识别准确率以及效率。

Description

地址数据处理方法及装置
技术领域
本申请涉及计算机领域,尤其涉及地址数据处理方法及装置。
背景技术
随着网络技术的迅速发展,为了更好地实现数据交互,许多终端应用均涉及用户地址,所以对用户地址进行准确识别显得越来越重要。例如,对于各大购物网站或快递行业公司而言,准确识别用户地址,并据此判断是否在其业务覆盖范围内,这是提供快递服务的一个基础环节。
发明内容
发明人在研究过程中发现现有技术具有如下问题:
针对各大购物网站或第三方(例如快递公司)而言,为了判定用户地址是否在其业务范围内,可以将用户地址的省、市、县区,以及,街道或乡镇,组成的四级行政区域作为输入信息进行查询。但是,由于用户大多数情况下并不清楚自己的街道信息等,所以用户地址中一般未填写街道或乡镇一级行政区域,导致无法准确地处理地址数据,例如,确定用户地址是否在业务覆盖范围内。
因此,为了解决上述技术问题,本申请实施例提供一种地址数据处理方法及装置,用以自动补充用户地址所缺失的地址信息,以便用户地址补充完整后,能够被准确识别。
为了实现上述目的,本申请提供了以下技术手段:
一种地址数据处理方法,包括:
获取待处理的目标地址数据;
根据预设地址格式规则,判断所述目标地址数据的格式是否完整;
当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
优选的,所述根据预设地址格式规则判断所述目标地址数据的格式是否完整,包括:
对所述目标地址数据执行分词操作生成目标分词信息,所述目标分词信息包括:目标行政区域信息,所述目标行政区域信息包括至少一个行政区域名称,以及与行政区域名称对应的行政区域内容;
判断目标行政区域信息内的行政区域名称与所述预设地址格式规则指示的行政区域名称是否匹配。
优选的,所述按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息,包括:
按照所述预设地址格式规则指示的行政区域名称,确定所述目标行政区域信息内缺失的行政区域名称;
在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,所述预设地址数据库中存储有行政区域名称与行政区域内容之间的对应关系;
将所述目标行政区域内容作为所述地址信息,补充至所述目标地址数据中。
优选的,所述目标分词信息还包括目标道路信息和/或目标建筑物信息;所述目标行政区域信息中至少包括目标县区行政区域;则在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,包括:
在所述缺失的行政区域名称为省行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标行政区域信息,确定与所述省行政区域对应的目标省份内容;
在所述缺失的行政区域名称为街道或乡镇行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标道路信息和/或目标建筑物信息,以及,所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容。
优选的,在所述预设地址数据库中利用所述目标分词信息的目标道路信息以及所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容,包括:
在所述预设地址数据库中获取与所述目标县区行政区域对应的所有道路信息,其中所述预设道路信息库中包含有众多县区行政区域下的所有道路信息、以及每个道路信息所属的街道或乡镇信息;
在所述所有道路信息中、查找到与所述目标道路信息一致的道路信息;
将所述道路信息对应的街道或乡镇内容作为目标街道或乡镇内容。
优选的,在所述预设地址数据库中利用所述目标分词信息的目标建筑物信息以及目标县区行政区域确定对应的目标街道或乡镇内容,包括:
将所述目标建筑物信息进行二元分词,将所有分词结果的集合作为目标索引表,其中每个分词结果对应一个索引;
在所述预设地址数据库中、获得与目标县区行政区域对应的所有反向索引表;其中所述预设地址数据库中包含有众多县区行政区域下的所有反向索引表,以及每个反向索引表所属的街道或乡镇信息,所述每个反向索引表为对一个建筑物信息进行二元分词后生成分词结果的集合;
将所述目标索引表与所述所有反向索引表进行匹配,获得与所述目标索引表匹配率最高的反向索引表;
将所述反向索引表对应的街道或乡镇内容作为目标街道或乡镇内容。
优选的,所述获取待处理的目标地址数据包括:
从预设数据库中获取一个地址数据,作为待处理的目标地址数据;其中,所述预设数据库中存储有用户预先输入的地址数据,所述预设数据库为本方法所应用的电商的地址数据库,或,物流公司的地址数据库。
优选的,所述获取待处理的目标地址数据包括:
从第二服务器中获取用户预先输入的一个地址数据,作为待处理的目标地址数据;其中,所述第二服务器中存储有其余电商的地址数据库;或,其余物流系统的数据库。
优选的,在所述补充所述目标地址数据中与其缺失格式对应的地址信息之后,还包括:
将所述目标地址数据中补充的地址信息,推送至用户;
在收到用户确认所述地址信息正确后,保存补充有所述地址信息的目标地址数据。
一种地址数据处理方法,包括:
向服务器发送待处理的目标地址数据;
接收并显示服务器反馈的待补充地址信息,所述待补充的地址信息为按地址数据处理方法处理后得到的;
其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
一种地址数据处理方法,包括:
按地址数据处理方法补充目标地址数据中与其缺失格式对应的地址信息;
将补充地址信息后的目标地址数据、与预设覆盖数据库中第三方的业务覆盖范围信息进行匹配;
在匹配成功的情况下,确定所述目标地址数据在第三方的业务覆盖范围内,否则,确定所述目标地址数据不在第三方的业务覆盖范围内;
其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
优选的,还包括:
更新所述预设覆盖数据库中该第三方的业务覆盖范围。
一种地址数据处理装置,包括:
获取单元,用于获取待处理的目标地址数据;
判断单元,用于根据预设地址格式规则判断所述目标地址数据的格式是否完整;
补充单元,用于在所述目标地址数据的格式不完整的时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
优选的,所述判断单元具体用于:
对所述目标地址数据执行分词操作生成目标分词信息,所述目标分词信息包括由至少一个行政区域信息组成的目标行政区域信息,所述目标行政区域信息包括至少一个行政区域名称,以及与行政区域名称对应的行政区域内容;判断目标行政区域信息内的行政区域名称与所述预设地址格式规则指示的行政区域名称是否匹配。
优选的,所述补充单元包括:
确定单元,用于按照所述预设地址格式规则指示的行政区域名称、确定所述目标行政区域信息内缺失的行政区域名称;
查找单元,用于在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,所述预设地址数据库中存储有行政区域名称与行政区域内容之间的对应关系;
补充内容单元,用于将所述目标行政区域内容作为所述地址信息,补充至所述目标地址数据中。
优选的,所述目标分词信息还包括目标道路信息和/或目标建筑物信息;所述目标行政区域信息中至少包括目标县区行政区域;则所述查找单元包括:
第一查找单元,用于在所述缺失的行政区域名称为省行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标行政区域信息、确定与所述省行政区域对应的目标省份内容;
第二查找单元,用于在所述缺失的行政区域名称为街道或乡镇行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标道路信息和/或目标建筑物信息,以及,所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容。
优选的,所述第二查找单元包括:
第三查找单元,用于在所述预设地址数据库中获取与所述目标县区行政区域对应的所有道路信息,其中所述预设道路信息库中包含有众多县区行政区域下的所有道路信息、以及每个道路信息所属的街道或乡镇信息;在所述所有道路信息中、查找到与所述目标道路信息一致的道路信息;将所述道路信息对应的街道或乡镇内容作为目标街道或乡镇内容;和/或,
第四查找单元,用于将所述目标建筑物信息进行二元分词,将所有分词结果的集合作为目标索引表,其中每个分词结果对应一个索引;在所述预设地址数据库中、获得与目标县区行政区域对应的所有反向索引表;其中所述预设地址数据库中包含有众多县区行政区域下的所有反向索引表,以及每个反向索引表所属的街道或乡镇信息,所述每个反向索引表为对一个建筑物信息进行二元分词后生成分词结果的集合;将所述目标索引表与所述所有反向索引表进行匹配,获得与所述目标索引表匹配率最高的反向索引表;将所述反向索引表对应的街道或乡镇内容作为目标街道或乡镇内容。
优选的,还包括:
保存单元,用于将所述目标地址数据中补充的地址信息,推送至用户;待用户确认所述地址信息正确后,保存补充有所述地址信息的目标地址数据。
一种地址数据处理装置,包括:
第二补充单元,用于按地址数据处理方法补充目标地址数据中与其缺失格式对应的地址信息;其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息;
匹配单元,用于将补充地址信息后的目标地址数据、与预设覆盖数据库中第三方的业务覆盖范围信息进行匹配;
第二确定单元,用于在匹配成功的情况下,确定所述目标地址数据在第三方的业务覆盖范围内,否则,确定所述目标地址数据不在第三方的业务覆盖范围内。
优选的,还包括:
更新单元,用于更新所述预设覆盖数据库中该第三方的业务覆盖范围。
与现有技术相比,本申请具有以下优点:
在本申请实施例中,预先构建预设地址格式规则,该预设地址格式规则代表目标地址数据所应具有的完整格式,并依据预设地址格式规则判断目标地址数据的格式是否完整,在目标地址数据不完整的情况下,补充目标地址数据与缺失格式对应的地址信息,使得目标地址数据符合预设地址格式规则的规定,即目标地址数据具有完整格式,从而可以被准确识别。本申请与传统人工识别方式相比,能够提升对目标地址数据识别的准确率以及效率。
当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种地址数据处理方法实施例一的流程图;
图2为本申请实施例提供的一种地址数据处理方法实施例一中步骤S102的具体流程图;
图3为本申请实施例提供的一种地址数据处理方法实施例一中补充地址信息的流程图;
图4为本申请实施例提供的又一种地址数据处理方法实施例一中补充地址信息的流程图;
图5为本申请实施例提供的又一种地址数据处理方法实施例一中补充地址信息的流程图;
图6为本申请实施例提供的一种地址数据处理方法实施例二的流程图;
图7为本申请实施例提供的一种地址数据处理装置实施例一的结构示意图;
图8为本申请实施例提供的一种地址数据处理装置实施例一中补充单元的结构示意图;
图9为本申请实施例提供的一种地址数据处理装置实施例二的结构示意图;
图10为本申请实施例提供的又一种地址数据处理装置实施例二的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1所示,其为本申请提供的一种地址数据处理方法实施例一的流程图,本实施例可以包括:
步骤S101:获取待处理的目标地址数据。
本方法可以应用于淘宝网、当当网、天猫等各类购物网站的服务器中,还可以应用于快递公司的服务器中,以便服务器可以利用本实施例的方法来对地址数据进行处理。针对待处理的目标地址数据,当格式不完整时,容易出现无法准确处理目标地址数据的问题。例如,目标地址数据不能准确用于业务覆盖范围的判断。而通过本实施例,可将目标地址数据补充完整,以便后续正确处理目标地址数据,例如,使得识别目标地址数据可以准确用于业务覆盖范围的判断。
步骤S101中,获得的待处理的目标地址数据,具体获取过程可以为以下两种方式:
第一种方式:从预设数据库中获取一个地址数据,作为待处理的目标地址数据;其中,所述预设数据库中存储有用户预先输入的地址数据,所述预设数据库为本方法所应用的电商的地址数据库,或,物流公司的地址数据库;
在本方法应用于一个电商(各大购物网站)或一个物流公司的服务器的情况下,服务器内设有预设数据库。预设数据库内存储有用户预先输入的众多地址数据。服务器在预设数据库中选择一个地址数据,或者接收用户选择一个地址数据,将该地址数据作为目标地址数据。
例如,本方法应用于淘宝网的服务器内,淘宝网的预设数据库中存储有用户预先输入的众多地址数据,服务器自动选择一个地址数据,或者服务器接收用户选择的一个地址数据,并将该地址数据作为目标地址数据。
第二种方式:从第二服务器中获取用户预先输入的一个地址数据,作为待处理的目标地址数据;其中,所述第二服务器为其余电商的地址数据库;或,其余物流系统的数据库。
本方法应用的服务器称为第一服务器。在第一种方式中,第一服务器在自身内部的预设数据库中获取目标地址数据。在第二种方式中,第一服务器还可以从第二服务器中获取地址数据。第二服务器可以是其他电商的服务器,或者其他物流系统的服务器。
例如,当本方法应用于淘宝网的第一服务器的情况下,不仅可以在第一服务器中的预设数据库中获取地址数据,还是可以在天猫、当当网、京东、顺丰、中通、实体百货公司等系统的第二服务器的地址数据库中,获取目标地址数据。
步骤S102:根据预设地址格式规则,判断所述目标地址数据的格式是否完整;如果否,则进入步骤S103;如果是,则进入步骤S104。
在本实施例执行之前,可以预先构建预设地址格式规则,地址格式规则可以根据用户需求设定不同级别的行政区域。例如,预设地址格式规则可以包含四级行政区域名称,分别为省行政区域、市行政区域、县区行政区域,以及,街道或乡镇行政区域。
在预设地址格式规则包含四级行政区域的情况下,以中华人民共和国为例,中华人民共和国包括23个省,4个直辖市(北京、上海、天津、重庆),5个民族自治区(西藏、新疆、宁夏、内蒙古、广西)和2个特别行政区,23个省、4个直辖市和5个民族自治区、2个特别行政区域均为中央直属行政区。
为了使本方法适用于所有地市,将5个民族自治区作为省级行政区域,使其划分符合本申请所提供的四级行政区域。还可以将四个直辖市既作为省级行政区域又作为市级行政区域。以北京市朝阳区SOHU大厦为例,其四级行政区域为北京省级行政区域,北京市行政区域,朝阳区行政区域,左家庄街道行政区域。
在预先构建预设地址格式规则的基础上,如图2所示,步骤S102在具体实现时可以包括以下步骤S201~步骤S202:
步骤S201:对所述目标地址数据执行分词操作,生成目标分词信息,所述目标分词信息包括由目标行政区域信息,所述目标行政区域信息包括至少一个行政区域名称,以及与行政区域名称对应的行政区域内容。
为了识别目标地址数据的格式,即:目标地址数据所包含的行政区域名称,对目标地址数据执行分词操作。具体的,可以调用已有的分词服务,来执行分词操作,详细分词步骤不再赘述。
以目标地址数据为“河北省保定市北市区瑞兴路86号秀兰尚城小区”为例,对目标地址数据分词后的分词结果为:三个行政区域信息(河北省行政区域、保定市行政区域和北市区行政区域),一个道路信息(瑞兴路86号)和一个建筑物信息(秀兰尚城小区)。
可见,目标分词信息可以包含目标行政区域信息、道路信息和建筑物信息,而道路信息和建筑物信息不属于行政区域,所以本例中目标行政区域信息包含:“河北省行政区域”、“保定市行政区域”和“北市区行政区域”。
其中,一个行政区域信息包含行政区域名称和行政区域内容,以“河北省行政区域”为例,其中“省行政区域”为行政区域名称,“河北”为行政区域内容。
步骤S202:判断目标行政区域信息内的行政区域名称与所述预设地址格式规则指示的行政区域名称是否匹配。
以所述预设地址格式规则中包含四级行政区域为例,则预设地址格式规则指示的名称区域名称分别为:省行政区域、市行政区域、县区行政区域,以及,街道或乡镇行政区域。若目标行政区域信息中也同样包含有四级行政区域名称,则确定两者匹配,表示目标地址数据完整;若目标行政区域信息中少于四级行政区域名称,确定两者不匹配,表示目标地址数据不完整。
接着返回图1,进入步骤S103:按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
如图3所示,本步骤具体执行过程包括步骤S301~步骤303:
步骤S301:按照所述预设地址格式规则指示的行政区域名称,确定所述目标行政区域信息内缺失的行政区域名称。
将目标地址数据中的所有目标行政区域名称、与预设地址格式规则指示的行政区域名称逐一对比,确定目标地址数据所缺失的行政区域名称。例如:当目标地址数据为“河北省保定市北市区瑞兴路86号秀兰尚城小区”的情况下,目标行政区域信息中缺失的行政区域名称为“街道或乡镇”。
步骤S302:在预设地址数据库中,利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容;所述预设地址数据库中存储有行政区域名称与行政区域内容之间的对应关系。
在本实施例中,可以预先构建一个预设地址数据库,该预设地址数据库的形式为树形结构,最上层的父节点为各个省级行政区域信息,二级叶子节点为各个省级行政区域管辖范围内的市行政区域信息,三级叶子节点为每个市行政区域管辖范围的县区行政区域信息,四级叶子节点为每个县区行政区域管辖范围内的街道或乡镇行政区域信息,五级叶子节点为每个街道或乡镇管辖范围下的道路信息和建筑物信息。
在步骤S102将目标地址数据分词后,可以获得目标地址数据中所包含的多级行政区域信息,再将多级行政区域信息在预设地址数据库中逐级搜索,便可以与所述缺失的行政区域名称对应的目标行政区域内容。
步骤S303:将所述目标行政区域内容作为所述地址信息,补充至所述目标地址数据中。
在本步骤中,查找到目标行政区域内容之后,将其作为地址信息补充至目标地址数据中。例如:在预设地址数据库查找,与缺失的行政区域名称“街道或乡镇”对应的“五四路街道”,并将“五四路街道”补充至目标地址数据中,以完善目标地址数据,方便后续对目标地址数据进行准确识别。
接着返回图1,进入步骤S104:退出程序。
在目标地址数据完整的情况下,无需执行补充地址信息的操作,所以退出本实施例的执行程序。
经过上述步骤后,能够获得目标地址数据中所缺失的地址信息。为了验证补充的地址信息是否正确,可以将所述目标地址数据中补充的地址信息,推送至用户;供用户确认本方法的地址信息是否正确,待用户确认所述地址信息正确后,保存补充有所述地址信息的目标地址数据。以便后续准确验证目标地址数据是否在业务覆盖范围内。
本申请实施例提供的地址数据处理方法,其中预先构建了预设地址格式规则,该预设地址格式规则可以表示出目标地址数据所应具有的完整格式,然后再依据预设地址格式规则判断目标地址数据的格式是否完整,从而可以在目标地址数据不完整的情况下,通过补充目标地址数据中缺失格式所对应的地址信息,来使得目标地址数据符合预设地址格式规则的规定,即目标地址数据具有完整格式,从而可以保证补充后的目标地址数据被准确处理,例如准确识别目标地址数据是否在业务覆盖范围内。也因此,本申请与传统人工识别方式相比,能够提升对目标地址数据识别的准确率以及效率。
在实际应用中,目标分词信息还可以包括目标道路信息和/或目标建筑物信息,以及,目标行政区域信息;所述目标行政区域信息中至少包括目标县区行政区域。由于目标地址数据中所缺失的地址信息不确定,所以图3中步骤S302在具体执行时,可以分为以下三种情况:
第一种情况:在所述缺失的行政区域名称为省行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标行政区域信息、确定与所述省行政区域对应的目标省份内容。
在缺失省行政区域的情况下,一般可采用目标地址数据中目标市区内容(即市行政区域信息下的市行政区域内容,例如:保定市),在预设地址数据库的二级叶子节点中进行匹配,并获得匹配成功的市行政区域内容。然后确定该市行政区域内容、在预设地址数据库中对应的省份内容(例如:河北省),将该省份内容作为目标地址数据中所缺失的目标省份内容。
第二种情况:在所述缺失的行政区域名称为市行政区域的情况下,在所述预设地址数据库中利用所述目标县区行政区域信息、确定与所述市行政区域对应的目标市区内容。
在所述目标分词信息缺失行政区域名称为市行政区域情况下,在预设地址数据库中利用目标县区内容(即县区行政区域信息下的县区行政区域内容,例如:北市区),在预设地址数据库中在三级叶子节点中进行搜索,以确定县区信息对应的市区内容,将该市区内容作为目标地址数据中所缺失的目标市区内容。
可见,在第二种情况下,为了防止不同市信息下具有相同县区内容而出现匹配错误的情况,将目标省区内容和目标县区内容结合在一起,一并在预设地址数据库中搜素,以提高搜索的准确性。
第三种情况:在所述缺失的行政区域名称为街道或乡镇行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标道路信息和/或目标建筑物信息,以及,所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容;
因为在实际应用时一般用户会忽略填写街道或乡镇,因此本实施例中将着重描述如何补充街道或乡镇行政区域的内容。
针对第三种情况来说,补充街道或乡镇信息具体又分为以下两种方式:
第一种方式:在所述预设地址数据库中利用所述目标分词信息的目标道路信息以及所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容。
第一种方式的具体执行过程,如图4所示,包括如下所示的步骤S401~步骤S403:
步骤S401:在所述预设地址数据库中获取与所述目标县区行政区域对应的所有道路信息,其中所述预设道路信息库中包含有众多县区行政区域下的所有道路信息,以及,每个道路信息所属的街道或乡镇信息。
在预设地址数据库的三级叶子节点中查找到目标县区行政区域,并获得目标县区行政区域下所有街道或乡镇管辖范围内的所有道路信息。其中,道路信息可以包括道路名称和道路号码。
步骤S402:在所述所有道路信息中、查找到与所述目标道路信息一致的道路信息。
将目标道路信息与所有道路信息一一匹配,当目标道路信息与其中一个道路信息的道路名称和道路号码均一致时,确定匹配成功,将该匹配成功的道路信息所属的街道或乡镇、作为目标街道或乡镇信息。
传统的预设地址数据库中存储有:道路名称以及道路名称的所有号码,为了减少道路号码的冗余信息,仅在保存道路名称在一个街道或乡镇内的起始号码和终止号码。在搜索过程中,在道路名称一致时,仅需要判断道路号码是否在起始号码和终止号码的范围内即可。
步骤S403:将所述道路信息对应的街道或乡镇内容作为目标街道或乡镇内容。
在获得道路信息对应的街道或乡镇内容后,将其作为目标街道或乡镇内容,以完善目标地址数据。
在介绍完第一种方式的具体执行过程之后,下面介绍第二种方式。
第二种方式:在所述预设地址数据库中利用所述目标分词信息的目标建筑物信息以及目标县区行政区域确定对应的目标街道或乡镇内容。
该方式的具体执行过程,如图5所示,包括以下步骤S501~S504:
步骤S501:将所述目标建筑物信息进行二元分词,将所有分词结果的集合作为目标索引表;其中每个分词结果对应一个索引。
由于目标建筑物信息可能为用户习惯的缩略方式或简称方式,例如:一个大厦全称为“西湖国际科技大厦”,用户输入的可能为“西湖科技大厦”、“西湖国际大厦”、“西湖大厦”等。因此,以目标建筑物信息为“西湖国际大厦”为例,为了实现搜索匹配,将目标建筑物信息进行二元分词,分为西湖、湖国、国际、际大和大厦五个分词结果,将每个分词结果作为一个索引,所有分词结果组成目标索引表。
步骤S502:在所述预设地址数据库中获得与目标县区行政区域对应的所有反向索引表。
其中所述预设地址数据库中包含有众多县区行政区域下的所有反向索引表,以及每个反向索引表所属的街道或乡镇信息,所述每个反向索引表为对一个建筑物信息进行二元分词后生成分词结果的集合。
在申请本实施例一之前,对标准街道或乡镇信息下的建筑物信息的标准名称采用二元分词法进行拆分,例如,将标准的“西湖国际科技大厦”拆分为西湖、湖国、国际、际科、科技、技大和大厦6个分词结果,每个分词结果作为一个索引,所有分词结果的集合即所有索引的集合形成一个反向索引表。再将街道或乡镇信息下的所有建筑物信息,均构建为对应的反向索引表,并将反向索引表存储至预设地址数据库的对应街道或乡镇信息下。在从预设地址数据库中查找反向索引表时,将目标分词信息在预设地址数据库中逐级搜索,获得县区行政区域下的所有反向索引表,每个反向索引表对应一个街道或乡镇信息。
步骤S503:将所述目标索引表与所述所有反向索引表进行匹配,获得与所述目标索引表匹配率最高的反向索引表。
将目标索引表与所有反向索引表一一匹配,匹配率越高代表两者相似程度越高,所以在众所反向索引表中获得匹配率最高的反向索引表,匹配率最高代表目标索引表与反向索引表的相似程度最大,即目标建筑物信息与反向索引表对应的建筑物信息相似程度最大。
步骤S504:将所述反向索引表对应的街道或乡镇内容作为目标街道或乡镇内容。
在确定与目标建筑物信息对应的建筑物信息后,将该建筑物信息在预设数据库中对应的街道或乡镇信息作为目标街道或乡镇信息。
以上为对目标地址数据中缺失信息进行补充的具体实现方式,当然以上内容仅对部分缺失地址信息进行举例说明,可以理解的是,可按照类似的方式在预设地址数据库中搜索,而获得其他缺失的地址信息,具体实现方式不再一一赘述。
本申请还提供了一种地址数据处理方法,应用于客户端,包括:
向服务器发送待处理的目标地址数据;
接收并显示服务器反馈的待补充地址信息,所述待补充的地址信息为按地址数据处理方法处理后得到的;
其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
在上述实施例中将目标地址数据补充完整后,便可以进一步对目标地址数据进行处理,例如,判定目标地址数据是否在各大购物网站或第三方的业务覆盖范围内。如图6所示,本申请还提供了一种地址数据处理方法实施例二,本实施例可以包括:
步骤S601:按实施例一所示的地址数据处理方法补充目标地址数据中与缺失格式对应地址信息。
在获得目标地址数据后,对目标地址数据进行分词操作获得目标行政区域信息,并与预设地址格式规则进行对比,以判断目标地址数据的格式是否完整。若目标地址数据的格式完整,则无需补充地址信息;若目标地址数据的格式不完整,则需要补充地址信息。
以预设地址格式规则中包含四级行政区域为例,如果目标地址数据的格式只包括三级行政区域,那就需要将目标地址数据缺失的那级行政区域,补偿后的目标地址数据的格式也应该包含四级行政区域信息。
步骤S602:将补充地址信息后的目标地址数据与预设覆盖数据库中第三方的业务覆盖范围信息进行匹配。
在本申请实施例中,可以预先构建一个预设覆盖数据库,在预设覆盖数据库中可以维护第三方在预设地址格式规则下的覆盖范围,即:在四级行政区域下的覆盖范围。
在得到完整格式的目标地址数据之后,可以将目标地址数据的四级行政区域信息,与第三方在四级行政区域下的业务覆盖范围进行匹配。可以理解的是,还可以采用四级行政区域下的三级行政区域甚至两级行政区域,与第三方在四级行政区域下的业务覆盖范围进行匹配模糊匹配。例如,将四级行政区域信息中的市行政区域,县区行政区域,和,街道或乡镇行政区域,与第三方在四级行政区域下的业务覆盖范围进行匹配。
为了保证匹配的准确率,在将目标地址数据与第三方在四级行政区域下的业务覆盖范围进行匹配时,目标地址数据中至少应该包括县区行政区域,和,街道或乡镇行政区域。
步骤S603:在匹配成功的情况下,确定所述目标地址数据在第三方的业务覆盖范围内,否则,确定所述目标地址数据不在第三方的业务覆盖范围内。若预设覆盖数据库中第三方的业务覆盖范围包含目标地址数据的四级行政区域信息,则确定目标地址数据在第三方的业务覆盖范围内,否则表示目标地址数据不在第三方的业务覆盖范围内。
本实施例中仅需要将目标地址数据与预设覆盖数据库在四级行政区域下的业务覆盖范围进行对比即可,简单方便,无需将目标地址数据与历史地址数据进行对比,无需更新历史地址数据,因此提高了搜索效率,降低了预设覆盖数据库的维护成本。
进一步的,预设地址数据库中的业务覆盖范围还可以随时更新。例如:在第三方的业务覆盖范围有变动的情况下,修改预设地址数据库中原有第三方的业务覆盖范围;在预设地址数据库中添加第三方情况下,在预设地址数据库中添加第三方的业务覆盖范围;或者,删除预设地址数据库中某个第三方的业务覆盖范围。
本实施例中第三方的业务覆盖范围改变的情况下,仅需要更新预设覆盖数据库中第三方的业务覆盖范围即可,无需调整第三方的历史地址数据,从而减少对历史数据的维护费用。并且业务覆盖范围的数量远远小于第三方的历史地址数据,所以利用第三方的业务覆盖范围与目标地址数据进行匹配时,匹配效率能够大大提高。
与上述本申请一种地址数据处理方法中实施例一所提供的方法相对应,如图7所示,本申请提供了一种地址数据处理装置实施例一,具体包括:
获取单元701,用于获取待处理的目标地址数据;
判断单元702,用于根据预设地址格式规则判断所述目标地址数据的格式是否完整;
补充单元703,用于在所述目标地址数据的格式不完整的情况下,按照所述预设地址格式规则确定所述目标地址数据的缺失格式,并补充所述目标地址数据中与所述缺失格式对应的地址信息。
此外,本申请提供了一种地址数据处理装置实施例一,还包括:
保存单元704,用于将所述目标地址数据中补充的地址信息,推送至用户;待用户确认所述地址信息正确后,保存补充有所述地址信息的目标地址数据。
针对图7所示的地址数据处理装置,其中,获取单元701,具体用于从预设数据库中获取一个地址数据,作为待处理的目标地址数据;其中,所述预设数据库中存储有用户预先输入的地址数据,所述预设数据库为本方法所应用的电商的地址数据库,或,物流公司的地址数据库。
所述获取单元701,还可以具体用于从第二服务器中获取用户预先输入的一个地址数据,作为待处理的目标地址数据;其中,所述第二服务器中存储有其余电商的地址数据库;或,其余物流系统的数据库。
其中,所述判断单元702具体用于对所述目标地址数据执行分词操作生成目标分词信息,所述目标分词信息包括由至少一个行政区域信息组成的目标行政区域信息,所述目标行政区域信息包括至少一个行政区域名称,以及与行政区域名称对应的行政区域内容;判断目标行政区域信息内的行政区域名称与所述预设地址格式规则指示的行政区域名称是否匹配。如图8所示,图7所示的地址数据处理装置中,所述补充单元703包括:
确定单元801,用于按照所述预设地址格式规则指示的行政区域名称、确定所述目标行政区域信息内缺失的行政区域名称;
查找单元802,用于在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,所述预设地址数据库中存储有行政区域名称与行政区域内容之间的对应关系;
补充内容单元803,用于将所述目标行政区域内容作为所述地址信息,补充至所述目标地址数据中。
在“所述目标分词信息还包括目标道路信息和/或目标建筑物信息;所述目标行政区域信息中至少包括目标县区行政区域”的情况下;其中所述查找单元802包括:
第一查找单元812,用于在所述缺失的行政区域名称为省行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标行政区域信息、确定与所述省行政区域对应的目标省份内容;
第二查找单元822,用于在所述缺失的行政区域名称为街道或乡镇行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标道路信息和/或目标建筑物信息,以及,所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容。
其中,所述第二查找单元822包括:
第三查找单元8221,用于在所述预设地址数据库中获取与所述目标县区行政区域对应的所有道路信息,其中所述预设道路信息库中包含有众多县区行政区域下的所有道路信息、以及每个道路信息所属的街道或乡镇信息;在所述所有道路信息中、查找到与所述目标道路信息一致的道路信息;将所述道路信息对应的街道或乡镇内容作为目标街道或乡镇内容;和/或
第四查找单元8222,用于将所述目标建筑物信息进行二元分词,将所有分词结果的集合作为目标索引表,其中每个分词结果对应一个索引;在所述预设地址数据库中、获得与目标县区行政区域对应的所有反向索引表;其中所述预设地址数据库中包含有众多县区行政区域下的所有反向索引表,以及每个反向索引表所属的街道或乡镇信息,所述每个反向索引表为对一个建筑物信息进行二元分词后生成分词结果的集合;将所述目标索引表与所述所有反向索引表进行匹配,获得与所述目标索引表匹配率最高的反向索引表;将所述反向索引表对应的街道或乡镇内容作为目标街道或乡镇内容。
与上述本申请一种地址数据处理方法中实施例二所提供的方法相对应,如图9所示,本申请还提供了一种地址数据处理装置实施例二,包括:
第二补充单元901,用于按地址数据处理方法实施例一中所述的方法补充目标地址数据中与缺失格式对应的地址信息;其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息;
匹配单元902,用于将补充地址信息后的目标地址数据、与预设覆盖数据库中第三方的业务覆盖范围信息进行匹配;
第二确定单元903,用于在匹配成功的情况下,确定所述目标地址数据在第三方的业务覆盖范围内,否则,确定所述目标地址数据不在第三方的业务覆盖范围内。
如图10所示,本实施例还提供的一种地址数据处理装置还包括:
更新单元904,用于更新所述预设覆盖数据库中该第三方的业务覆盖范围。
本申请提供了一种地址数据处理装置,本申请实施例中预先构建预设地址格式规则,该预设地址格式规则代表目标地址数据所应具有的完整格式,依据预设地址格式规则判断目标地址数据的格式是否完整,在目标地址数据不完整的情况下,补充目标地址数据与缺失格式对应的地址信息,使得目标地址数据符合预设地址格式规则的规定,即目标地址数据具有完整格式,从而可以被准确识别,本申请与传统人工识别方式相比,能够提升对目标地址数据识别的准确率以及效率。
本实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (20)

1.一种地址数据处理方法,其特征在于,包括:
获取待处理的目标地址数据;
根据预设地址格式规则,判断所述目标地址数据的格式是否完整;
当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
2.如权利要求1所述的方法,其特征在于,所述根据预设地址格式规则判断所述目标地址数据的格式是否完整,包括:
对所述目标地址数据执行分词操作生成目标分词信息,所述目标分词信息包括:目标行政区域信息,所述目标行政区域信息包括至少一个行政区域名称,以及与行政区域名称对应的行政区域内容;
判断目标行政区域信息内的行政区域名称与所述预设地址格式规则指示的行政区域名称是否匹配。
3.如权利要求2所述的方法,其特征在于,所述按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息,包括:
按照所述预设地址格式规则指示的行政区域名称,确定所述目标行政区域信息内缺失的行政区域名称;
在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,所述预设地址数据库中存储有行政区域名称与行政区域内容之间的对应关系;
将所述目标行政区域内容作为所述地址信息,补充至所述目标地址数据中。
4.如权利要求3所述的方法,其特征在于,所述目标分词信息还包括目标道路信息和/或目标建筑物信息;所述目标行政区域信息中至少包括目标县区行政区域;则在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,包括:
在所述缺失的行政区域名称为省行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标行政区域信息,确定与所述省行政区域对应的目标省份内容;
在所述缺失的行政区域名称为街道或乡镇行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标道路信息和/或目标建筑物信息,以及,所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容。
5.如权利要求4所述的方法,其特征在于,在所述预设地址数据库中利用所述目标分词信息的目标道路信息以及所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容,包括:
在所述预设地址数据库中获取与所述目标县区行政区域对应的所有道路信息,其中所述预设道路信息库中包含有众多县区行政区域下的所有道路信息、以及每个道路信息所属的街道或乡镇信息;
在所述所有道路信息中、查找到与所述目标道路信息一致的道路信息;
将所述道路信息对应的街道或乡镇内容作为目标街道或乡镇内容。
6.如权利要求4所述的方法,其特征在于,在所述预设地址数据库中利用所述目标分词信息的目标建筑物信息以及目标县区行政区域确定对应的目标街道或乡镇内容,包括:
将所述目标建筑物信息进行二元分词,将所有分词结果的集合作为目标索引表,其中每个分词结果对应一个索引;
在所述预设地址数据库中、获得与目标县区行政区域对应的所有反向索引表;其中所述预设地址数据库中包含有众多县区行政区域下的所有反向索引表,以及每个反向索引表所属的街道或乡镇信息,所述每个反向索引表为对一个建筑物信息进行二元分词后生成分词结果的集合;
将所述目标索引表与所述所有反向索引表进行匹配,获得与所述目标索引表匹配率最高的反向索引表;
将所述反向索引表对应的街道或乡镇内容作为目标街道或乡镇内容。
7.如权利要求1-6任一项所述的方法,其特征在于,所述获取待处理的目标地址数据包括:
从预设数据库中获取一个地址数据,作为待处理的目标地址数据;其中,所述预设数据库中存储有用户预先输入的地址数据,所述预设数据库为本方法所应用的电商的地址数据库,或,物流公司的地址数据库。
8.如权利要求1-6任一项所述的方法,其特征在于,所述获取待处理的目标地址数据包括:
从第二服务器中获取用户预先输入的一个地址数据,作为待处理的目标地址数据;其中,所述第二服务器中存储有其余电商的地址数据库;或,其余物流系统的数据库。
9.如权利要求1-6任一项所述的方法,其特征在于,在所述补充所述目标地址数据中与其缺失格式对应的地址信息之后,还包括:
将所述目标地址数据中补充的地址信息,推送至用户;
在收到用户确认所述地址信息正确后,保存补充有所述地址信息的目标地址数据。
10.一种地址数据处理方法,其特征在于,包括:
向服务器发送待处理的目标地址数据;
接收并显示服务器反馈的待补充地址信息,所述待补充的地址信息为按地址数据处理方法处理后得到的;
其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
11.一种地址数据处理方法,其特征在于,包括:
按地址数据处理方法补充目标地址数据中与其缺失格式对应的地址信息;
将补充地址信息后的目标地址数据、与预设覆盖数据库中第三方的业务覆盖范围信息进行匹配;
在匹配成功的情况下,确定所述目标地址数据在第三方的业务覆盖范围内,否则,确定所述目标地址数据不在第三方的业务覆盖范围内;
其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
12.如权利要求11所述的方法,其特征在于,还包括:
更新所述预设覆盖数据库中该第三方的业务覆盖范围。
13.一种地址数据处理装置,其特征在于,包括:
获取单元,用于获取待处理的目标地址数据;
判断单元,用于根据预设地址格式规则判断所述目标地址数据的格式是否完整;
补充单元,用于在所述目标地址数据的格式不完整的时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息。
14.如权利要求13所述的装置,其特征在于,所述判断单元具体用于:
对所述目标地址数据执行分词操作生成目标分词信息,所述目标分词信息包括由至少一个行政区域信息组成的目标行政区域信息,所述目标行政区域信息包括至少一个行政区域名称,以及与行政区域名称对应的行政区域内容;判断目标行政区域信息内的行政区域名称与所述预设地址格式规则指示的行政区域名称是否匹配。
15.如权利要求14所述的装置,其特征在于,所述补充单元包括:
确定单元,用于按照所述预设地址格式规则指示的行政区域名称、确定所述目标行政区域信息内缺失的行政区域名称;
查找单元,用于在预设地址数据库中利用所述目标分词信息查找与所述缺失的行政区域名称对应的目标行政区域内容,所述预设地址数据库中存储有行政区域名称与行政区域内容之间的对应关系;
补充内容单元,用于将所述目标行政区域内容作为所述地址信息,补充至所述目标地址数据中。
16.如权利要求15所述的装置,其特征在于,所述目标分词信息还包括目标道路信息和/或目标建筑物信息;所述目标行政区域信息中至少包括目标县区行政区域;则所述查找单元包括:
第一查找单元,用于在所述缺失的行政区域名称为省行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标行政区域信息、确定与所述省行政区域对应的目标省份内容;
第二查找单元,用于在所述缺失的行政区域名称为街道或乡镇行政区域的情况下,在所述预设地址数据库中利用所述目标分词信息的目标道路信息和/或目标建筑物信息,以及,所述目标县区行政区域,确定与所述省行政区域对应的目标街道或乡镇内容。
17.如权利要求16所述的装置,其特征在于,所述第二查找单元包括:
第三查找单元,用于在所述预设地址数据库中获取与所述目标县区行政区域对应的所有道路信息,其中所述预设道路信息库中包含有众多县区行政区域下的所有道路信息、以及每个道路信息所属的街道或乡镇信息;在所述所有道路信息中、查找到与所述目标道路信息一致的道路信息;将所述道路信息对应的街道或乡镇内容作为目标街道或乡镇内容;和/或,
第四查找单元,用于将所述目标建筑物信息进行二元分词,将所有分词结果的集合作为目标索引表,其中每个分词结果对应一个索引;在所述预设地址数据库中、获得与目标县区行政区域对应的所有反向索引表;其中所述预设地址数据库中包含有众多县区行政区域下的所有反向索引表,以及每个反向索引表所属的街道或乡镇信息,所述每个反向索引表为对一个建筑物信息进行二元分词后生成分词结果的集合;将所述目标索引表与所述所有反向索引表进行匹配,获得与所述目标索引表匹配率最高的反向索引表;将所述反向索引表对应的街道或乡镇内容作为目标街道或乡镇内容。
18.如权利要求13所述的装置,其特征在于,还包括:
保存单元,用于将所述目标地址数据中补充的地址信息,推送至用户;待用户确认所述地址信息正确后,保存补充有所述地址信息的目标地址数据。
19.一种地址数据处理装置,其特征在于,包括:
第二补充单元,用于按地址数据处理方法补充目标地址数据中与其缺失格式对应的地址信息;其中,所述地址数据处理方法包括:获取待处理的目标地址数据;根据预设地址格式规则,判断所述目标地址数据的格式是否完整;当所述目标地址数据的格式不完整时,按照所述预设地址格式规则,补充所述目标地址数据中与其缺失格式对应的地址信息;
匹配单元,用于将补充地址信息后的目标地址数据、与预设覆盖数据库中第三方的业务覆盖范围信息进行匹配;
第二确定单元,用于在匹配成功的情况下,确定所述目标地址数据在第三方的业务覆盖范围内,否则,确定所述目标地址数据不在第三方的业务覆盖范围内。
20.如权利要求19所述的装置,其特征在于,还包括:
更新单元,用于更新所述预设覆盖数据库中该第三方的业务覆盖范围。
CN201510121494.3A 2015-03-19 2015-03-19 地址数据处理方法及装置 Pending CN106033460A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510121494.3A CN106033460A (zh) 2015-03-19 2015-03-19 地址数据处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510121494.3A CN106033460A (zh) 2015-03-19 2015-03-19 地址数据处理方法及装置

Publications (1)

Publication Number Publication Date
CN106033460A true CN106033460A (zh) 2016-10-19

Family

ID=57149149

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510121494.3A Pending CN106033460A (zh) 2015-03-19 2015-03-19 地址数据处理方法及装置

Country Status (1)

Country Link
CN (1) CN106033460A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106599303A (zh) * 2016-12-29 2017-04-26 苏碧云 一种地址匹配方法及系统
CN106649803A (zh) * 2016-12-29 2017-05-10 华南师范大学 一种地址匹配方法及系统
CN106682175A (zh) * 2016-12-29 2017-05-17 华南师范大学 一种地址匹配方法及系统
CN106875264A (zh) * 2017-03-31 2017-06-20 北京京东尚科信息技术有限公司 订单信息管理方法、装置和订单分拣系统
CN106874384A (zh) * 2017-01-10 2017-06-20 广东精规划信息科技股份有限公司 一种异构地址标准转换及匹配方法
CN107743153A (zh) * 2017-05-19 2018-02-27 贵州白山云科技有限公司 一种ip地址数据库生成方法和装置
CN109005249A (zh) * 2018-07-27 2018-12-14 国政通科技有限公司 一种地址数据补充装置
CN109426415A (zh) * 2017-08-31 2019-03-05 北京国双科技有限公司 一种生成级联选择器的方法及装置
CN109829025A (zh) * 2019-01-22 2019-05-31 浙江数链科技有限公司 线路校正方法及装置、电子设备、存储介质
CN110334162A (zh) * 2019-05-09 2019-10-15 德邦物流股份有限公司 地址识别方法及装置
CN110704564A (zh) * 2019-09-27 2020-01-17 北京沃东天骏信息技术有限公司 一种地址纠错方法和装置
CN111460055A (zh) * 2019-01-21 2020-07-28 阿里巴巴集团控股有限公司 一种poi地址的补充方法及装置
CN111859956A (zh) * 2020-07-09 2020-10-30 睿智合创(北京)科技有限公司 一种用于金融行业的地址分词方法
CN112100161A (zh) * 2019-09-17 2020-12-18 上海寻梦信息技术有限公司 数据处理方法及系统、电子设备及存储介质
CN112256812A (zh) * 2020-10-23 2021-01-22 盛威时代科技集团有限公司 一种行程信息展示方法、装置及服务器
CN113706065A (zh) * 2020-05-22 2021-11-26 百度在线网络技术(北京)有限公司 货物分类方法、装置、设备以及存储介质
CN113761085A (zh) * 2020-06-05 2021-12-07 北京京东振世信息技术有限公司 一种处理订单数据的方法和装置
CN116245078A (zh) * 2022-11-30 2023-06-09 荣耀终端有限公司 一种结构化信息提取方法和电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008155273A1 (de) * 2007-06-20 2008-12-24 Endress+Hauser Flowtec Ag Feldbuseinheit und verfahren zur konfiguration einer feldbuseinheit
CN101339638A (zh) * 2007-07-03 2009-01-07 周磊 一种订购平台的商品配送范围与收货地址自动匹配的方法和系统
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和系统
CN103279523A (zh) * 2013-05-29 2013-09-04 北京京东尚科信息技术有限公司 一种处理地址信息的方法和装置
CN103473289A (zh) * 2013-08-30 2013-12-25 深圳市华傲数据技术有限公司 一种通信地址补全的装置及方法
CN104166679A (zh) * 2014-07-08 2014-11-26 北京迪威特科技有限公司 一种用于分拣的地址匹配方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008155273A1 (de) * 2007-06-20 2008-12-24 Endress+Hauser Flowtec Ag Feldbuseinheit und verfahren zur konfiguration einer feldbuseinheit
CN101339638A (zh) * 2007-07-03 2009-01-07 周磊 一种订购平台的商品配送范围与收货地址自动匹配的方法和系统
CN102169498A (zh) * 2011-04-14 2011-08-31 中国测绘科学研究院 一种地址模型的构建方法,以及地址匹配的方法和系统
CN103279523A (zh) * 2013-05-29 2013-09-04 北京京东尚科信息技术有限公司 一种处理地址信息的方法和装置
CN103473289A (zh) * 2013-08-30 2013-12-25 深圳市华傲数据技术有限公司 一种通信地址补全的装置及方法
CN104166679A (zh) * 2014-07-08 2014-11-26 北京迪威特科技有限公司 一种用于分拣的地址匹配方法

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106649803A (zh) * 2016-12-29 2017-05-10 华南师范大学 一种地址匹配方法及系统
CN106682175A (zh) * 2016-12-29 2017-05-17 华南师范大学 一种地址匹配方法及系统
CN106599303A (zh) * 2016-12-29 2017-04-26 苏碧云 一种地址匹配方法及系统
CN106874384B (zh) * 2017-01-10 2020-12-04 航天精一(广东)信息科技有限公司 一种异构地址标准转换及匹配方法
CN106874384A (zh) * 2017-01-10 2017-06-20 广东精规划信息科技股份有限公司 一种异构地址标准转换及匹配方法
CN106875264A (zh) * 2017-03-31 2017-06-20 北京京东尚科信息技术有限公司 订单信息管理方法、装置和订单分拣系统
CN107743153A (zh) * 2017-05-19 2018-02-27 贵州白山云科技有限公司 一种ip地址数据库生成方法和装置
CN109426415A (zh) * 2017-08-31 2019-03-05 北京国双科技有限公司 一种生成级联选择器的方法及装置
CN109005249A (zh) * 2018-07-27 2018-12-14 国政通科技有限公司 一种地址数据补充装置
CN111460055B (zh) * 2019-01-21 2023-06-20 阿里巴巴集团控股有限公司 一种poi地址的补充方法及装置
CN111460055A (zh) * 2019-01-21 2020-07-28 阿里巴巴集团控股有限公司 一种poi地址的补充方法及装置
CN109829025A (zh) * 2019-01-22 2019-05-31 浙江数链科技有限公司 线路校正方法及装置、电子设备、存储介质
CN110334162B (zh) * 2019-05-09 2021-11-09 德邦物流股份有限公司 地址识别方法及装置
CN110334162A (zh) * 2019-05-09 2019-10-15 德邦物流股份有限公司 地址识别方法及装置
CN112100161A (zh) * 2019-09-17 2020-12-18 上海寻梦信息技术有限公司 数据处理方法及系统、电子设备及存储介质
CN110704564A (zh) * 2019-09-27 2020-01-17 北京沃东天骏信息技术有限公司 一种地址纠错方法和装置
CN113706065A (zh) * 2020-05-22 2021-11-26 百度在线网络技术(北京)有限公司 货物分类方法、装置、设备以及存储介质
CN113761085A (zh) * 2020-06-05 2021-12-07 北京京东振世信息技术有限公司 一种处理订单数据的方法和装置
WO2021244233A1 (zh) * 2020-06-05 2021-12-09 北京京东振世信息技术有限公司 一种处理订单数据的方法和装置
CN113761085B (zh) * 2020-06-05 2023-09-26 北京京东振世信息技术有限公司 一种处理订单数据的方法和装置
CN111859956B (zh) * 2020-07-09 2021-08-27 睿智合创(北京)科技有限公司 一种用于金融行业的地址分词方法
CN111859956A (zh) * 2020-07-09 2020-10-30 睿智合创(北京)科技有限公司 一种用于金融行业的地址分词方法
CN112256812A (zh) * 2020-10-23 2021-01-22 盛威时代科技集团有限公司 一种行程信息展示方法、装置及服务器
CN116245078A (zh) * 2022-11-30 2023-06-09 荣耀终端有限公司 一种结构化信息提取方法和电子设备

Similar Documents

Publication Publication Date Title
CN106033460A (zh) 地址数据处理方法及装置
Pickett et al. Global urbanization as a shifting context for applying ecological science toward the sustainable city
CN101084499B (zh) 用于搜索和存储数据的系统和方法
CN108628811B (zh) 地址文本的匹配方法和装置
Goodman et al. European cities & technology: Industrial to post-industrial city
CN111324679B (zh) 地址信息的处理方法、装置和系统
CN105630938A (zh) 一种智能问答系统
CN106469372B (zh) 一种地址映射方法及装置
CN103514201A (zh) 一种非关系型数据库的数据查询方法和装置
CN107766433A (zh) 一种基于Geo‑BTree的范围查询方法及装置
CN105022748A (zh) 一种运单地址分级方法及装置
CN106021336A (zh) 一种对批量地址信息进行自动行政区划划分的方法
Morton et al. Virtual city models: Avoidance of obsolescence
CN103808325A (zh) 交通出行方案的生成方法及装置
CN104077322A (zh) 基于问题的地理信息挖掘方法及系统
CN112528639B (zh) 对象识别方法和装置、存储介质及电子设备
Rademacher et al. Places of nature in ecologies of urbanism
Anichini et al. Developing the ArchAIDE application: a digital workflow for identifying, organising and sharing archaeological pottery using automated image recognition
CN106326233A (zh) 地址提示方法及装置
CN104679829A (zh) 对车牌号进行快速搜索的方法及装置
CN101963993B (zh) 一种数据库单表记录快速查找的方法
CN105718457A (zh) 基于电子票据的信息推送方法及系统
Skaggs et al. Vegetation maps at the passage of the Taylor Grazing Act (1934): a baseline to evaluate rangeland change after a regime shift
CN109710814A (zh) 一种多源遥感数据归档处理方法及装置
Morris et al. A partnership framework for geospatial data preservation in North Carolina

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20180328

Address after: Four story 847 mailbox of the capital mansion of Cayman Islands, Cayman Islands, Cayman

Applicant after: CAINIAO SMART LOGISTICS HOLDING Ltd.

Address before: Cayman Islands Grand Cayman capital building a four storey No. 847 mailbox

Applicant before: ALIBABA GROUP HOLDING Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20161019

RJ01 Rejection of invention patent application after publication