CN111241229B - 快递驿站地址辨别方法、计算机设备和存储介质 - Google Patents

快递驿站地址辨别方法、计算机设备和存储介质 Download PDF

Info

Publication number
CN111241229B
CN111241229B CN202010065598.8A CN202010065598A CN111241229B CN 111241229 B CN111241229 B CN 111241229B CN 202010065598 A CN202010065598 A CN 202010065598A CN 111241229 B CN111241229 B CN 111241229B
Authority
CN
China
Prior art keywords
address
express
administrative
standardized
names
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010065598.8A
Other languages
English (en)
Other versions
CN111241229A (zh
Inventor
杨周龙
李斯
苌生辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongpu Software Co Ltd
Original Assignee
Dongpu Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongpu Software Co Ltd filed Critical Dongpu Software Co Ltd
Priority to CN202010065598.8A priority Critical patent/CN111241229B/zh
Publication of CN111241229A publication Critical patent/CN111241229A/zh
Application granted granted Critical
Publication of CN111241229B publication Critical patent/CN111241229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种快递驿站地址辨别方法、计算机设备和存储介质。快递驿站地址辨别方法包括步骤:预存至少一快递驿站地址;录入一快递地址;将所述快递地址转换为标准化地址;计算每一快递驿站地址与所述优化地址的相似度;以及按照所述相似度的大小顺序将至少一快递驿站地址排序,生成一预测目标地址列表。本发明通过对消费者填写的快递地址进行标准化及优化处理,即使在快递地址填写不完整或不标准情况下也不影响对快递地址的识别,从而保证了派送正确,进而提高了送件效率,缩短了送件时间,避免了因派送错误带来的经济损失。

Description

快递驿站地址辨别方法、计算机设备和存储介质
技术领域
本发明涉及文件处理相关领域,尤其涉及快递驿站地址辨别方法、计算机设备和存储介质。
背景技术
在现在网络非常发达的环境下,消费者寄快递的方式非常多,线上手机APP端和电脑网页端,线下快递门店,快递柜子,快递员上门等寄快递的方式。但无论哪种方式均需要寄件人填写邮寄地址以及收件地址信息。
目前,快递行业对快递柜或者快递驿站的需求越来越大,在快递柜收件后查询快递信息,然后发消息给收件人取件;当前快递柜从收件到发消息时间延迟过长,直接影响到取件的效率,也妨碍后续快递的存放。另外客户填写的收件地址缺失、错误、表述方式可能千差万别,在对快递件进行派送的时候往往造成一些错误。
因此,现有技术存在消费者填写信息不完整或不标准造成派送错误的问题。
发明内容
有鉴于此,本发明提供一种快递驿站地址辨别方法、计算机设备和存储介质,以解决现有的快递行业中存在消费者填写信息不完整或不标准造成派送错误带来时间延迟、送件效率低以及经济损失的技术问题。
为解决上述问题,本发明提供一种快递驿站地址辨别方法,包括步骤:预存至少一快递驿站地址;录入一快递地址;将所述快递地址转换为标准化地址;计算每一快递驿站地址与所述优化地址的相似度;以及按照所述相似度的大小顺序将至少一快递驿站地址排序,生成一预测目标地址列表。
进一步地,所述将一快递地址转换为标准化地址,包括如下步骤:生成一行政区数据库,包括至少一级行政区的名称及隶属关系;解析一快递地址中的至少一行政区的名称;将所述快递地址转变为优化地址,在所述优化地址中,所述行政区根据行政级别排序;查找所述优化地址中行政级别最低的行政区;根据最低行政区的名称调用所述行政区数据库中与最低行政区对应的各级别行政区名称,将其与所述优化地址中各级别行政区的名称依次对比,判断所述优化地址中缺失或错误的行政区名称;补充或修正所述优化地址中缺失或错误的行政区名称,获得一标准化地址。
进一步地,所述解析一快递地址中的至少一行政区的名称包括如下步骤:对所述快递地址解析所有行政区的名称,得到多种解析结果;获取多种所述解析结果中的最高行政区;根据最高行政区的名称调用所述行政区数据库中与最高行政区对应的各级别行政区名称,将其与所述解析结果中各级别行政区的名称依次对比,判断所述解析结果是否正确;当所述解析结果中的各级别行政区的名称与所述行政区数据库中的各级别行政区的名称相对应时,判定所述解析结果正确;统计被判定正确的所述解析结果中的所述行政区名称的数量;以及将获得最多数量的所述解析结果作为准确解析的行政区名称进行输出。
进一步地,所述计算每一快递驿站地址与所述标准化地址的相似度,包括如下步骤:分别提取所述标准化地址及快递驿站地址的至少一关键词;对比所述标准化地址及快递驿站地址的至少一关键词;以及计算所述相似度,即为所述标准化地址与快递驿站地址的相同关键词的数量。
进一步地,所述计算每一快递驿站地址与所述标准化地址的相似度,包括如下步骤:分别提取所述标准化地址及快递驿站地址的至少一关键词;对比所述标准化地址及快递驿站地址的至少一关键词,获取两者的相同关键词;统计所述相同关键词中的每一关键词的词频;计算所述相同关键词中的每一关键词的文字个数,即为该关键词的权重;以及计算所述相似度,即为所有关键词的词频与权重的乘积并求和。
进一步地,分别提取所述标准化地址及快递驿站地址的至少一关键词包括如下步骤:提取所述标准化地址及快递驿站地址中的地区特征名以及地区通用名;以及获取关键词,即为将所述地区通用名与其前一个所述地区特征名合并。
进一步地,所述地区通用名包括但不限于市、镇、乡、村、道、路、街、大路、东路、西路、南路、北路、中路、公路、大道、大街、东街、西街、南街、北街、中街、小区、社区、公司、店、学校、医院、号、弄。
进一步地,在所述按照所述相似度的大小顺序将至少一快递驿站地址排序步骤之前,还包括:计算所述相似度与一预设阈值的差值,当该差值大于0时,与该相似度对应的所述快递驿站地址输出至所述预测目标地址列表中。
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行所述快递驿站地址辨别方法的步骤中的任一种。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行所述快递驿站地址辨别方法的步骤中的任一种。
上述快递驿站地址辨别方法、计算机设备和存储介质,通过对消费者填写的快递地址进行标准化及优化处理,即使在快递地址填写不完整或不标准情况下也不影响对快递地址的识别,从而保证了派送正确,进而提高了送件效率,缩短了送件时间,避免了因派送错误带来的经济损失。当快递进入驿站或者快递柜的时候,可以快速发送取件信息,既提高了查询效率,又可以第一时间通知收件人,提高用户体验。对驿站和快递柜来说,可以有效减少快递在快递柜和驿站的滞留时间,提高流转速度。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。
图1为本发明实施例中所述快递驿站地址辨别方法的流程图。
图2为本发明实施例中所述将一快递地址转换为标准化地址步骤的流程图。
图3为本发明实施例中所述解析一快递地址中的至少一行政区的名称步骤的流程图。
图4为本发明一实施例中所述计算每一快递驿站地址与所述标准化地址的相似度步骤的流程图。
图5为本发明另一实施例中所述计算每一快递驿站地址与所述标准化地址的相似度步骤的流程图。
图6为本发明实施例中所述分别提取所述标准化地址及快递驿站地址的至少一关键词步骤的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
如图1所示,在本发明实施例中,提出了一种快递驿站地址辨别方法,该快递驿站地址辨别方法具体可以包括步骤S1-S7。
本实施例通过对消费者填写的快递地址进行标准化及优化处理,即使在快递地址填写不完整或不标准情况下也不影响对快递地址的识别,从而保证了派送正确,进而提高了送件效率,缩短了送件时间,避免了因派送错误带来的经济损失。
S1、预存至少一快递驿站地址至一计算机。每个快递驿站地址可以为快递点地址也可以为快递柜地址。
计算机作为服务器,是本实施例中用于储存快递驿站地址文件的执行实体,首先计算机接收终端上传的快递驿站地址文件,将快递驿站地址文件存储至计算机的存储路径指向的存储区域,比如手机、平板电脑等用户终端需要向计算机申请存储网络文件,该网络文件用来存储用户终端上传的快递驿站地址文件数据。
S2、录入一快递地址至计算机;寄件人在手机或计算机上填写快递地址,包括寄件人地址和/或收件人地址信息。或者,寄件人将快递地址手写在地址标签上,通过摄像头扫描等方式将快递地址录入至一计算机。
计算机同样作为服务器,是本实施例中用于储存寄件人填写的快递地址文件的执行实体,首先计算机接收终端上传的快递地址文件,将快递地址文件存储至计算机的存储路径指向的存储区域,比如手机、平板电脑或计算机等用户终端需要向计算机申请存储网络文件,该网络文件用来存储寄件人上传的快递地址文件数据。
S3、在计算机中将所述快递地址转换为标准格式下的标准化地址,并将标准化地址优化为优化地址。
在计算机中将所述快递地址转换为标准格式下的标准化地址,主要是首先查找所述优化地址中行政级别最低的行政区,再根据最低行政区的名称调用所述行政区数据库中与最低行政区对应的各级别行政区名称,将其与所述优化地址中各级别行政区的名称依次对比,判断所述优化地址中缺失或错误的行政区名称,从而补充或修正所述优化地址中缺失或错误的行政区名称,获得一标准化地址。
并将获得的标准化地址优化为优化地址,此方法的核心是通过逐级解析和采用投票决策机制,标准化地址中的行政单位,实现对收件人地址的规范化、补全、纠错等,从而能够获得优化地址。本实施例通过对消费者填写的快递地址进行标准化及优化处理,即使在快递地址填写不完整或不标准情况下也不影响对快递地址的识别,从而保证了派送正确,进而提高了送件效率,缩短了送件时间,避免了因派送错误带来的经济损失。
S4、在计算机中计算每一快递驿站地址与所述优化地址的相似度。
通过相似度的计算可以评估快递驿站地址与所述优化地址是否相同,评估方法有很多种,常见的一种评估方法就是用两个地址中相同关键词的数量来衡量两个地址的相似程度。另外也可以通过基于夹角余弦相似度的原理计算相似度,从三个角度计算并加权得到最终相似度。首先基于关键词词频计算相似度;再基于关键词长度的相似度,匹配上的关键词越长,该关键词值的权重越大,相似度越大;最后基于匹配上的关键词数量计算相似度,匹配上的关键词越多,相似度越大。
S5、在计算机中计算每一相似度与一预设阈值的差值,当该差值大于0时,相应的相似度大于一预设阈值,与该相似度对应的快递驿站地址输出至所述预测目标地址列表中。
在此步骤中通过设置预设阈值进行筛选,找出驿站地址与所述优化地址较为相似的至少一个快递驿站,将这些驿站地址生成一个预测目标地址列表,显示在快递员的手持终端上。
S6、在计算机中按照所述相似度的大小顺序将至少一快递驿站地址排序,生成一预测目标地址列表。
在快递员的手持终端上,在预测目标地址列表中,多个驿站地址按照相似度排序,与所述优化地址最为接近的一个驿站地址,被显示在列表最上部的第一项。这样可以使得快递员可依据在列表最上部的第一项储存对应的所述标准化地址信息,用于查询和作为快递分区派送的依据。
S7、在计算机中根据所述预测目标地址列表的第一项显示的快递驿站地址,存储对应的所述标准化地址信息,用于查询和作为快递分区派送的依据。
根据所述预测目标地址列表的第一项显示的快递驿站地址存储对应的所述标准化地址信息,用于查询和作为快递分区派送的依据,做到了根据所述预测目标地址列表的预测结果,提前将快递信息根据快递驿站地址分别存储,以备查询,并且相应快递信息按照快递柜优选进行分块存储,每个快递驿站地址可以为快递点地址也可以为快递柜地址,在快递分区派送时只需要到相应区块查询信息即可,从而大大节省信息查询时间。
当快递进入快递驿站或者快递柜的时候,可以快速发送取件信息,既提高了查询效率,又可以第一时间通知收件人,提高用户体验。对驿站和快递柜来说,可以有效减少快递在快递柜和驿站的滞留时间,提高流转速度。
如图2所示,本实施例中,所述将一快递地址转换为标准化地址的步骤,包括如下步骤S31-S36。在计算机中将所述快递地址转换为标准格式下的标准化地址,主要是首先查找所述优化地址中行政级别最低的行政区,再根据最低行政区的名称调用所述行政区数据库中与最低行政区对应的各级别行政区名称,将其与所述优化地址中各级别行政区的名称依次对比,判断所述优化地址中缺失或错误的行政区名称,从而补充或修正所述优化地址中缺失或错误的行政区名称,获得一标准化地址。
S31、生成一行政区数据库,包括至少一级行政区的名称及隶属关系。
所述隶属关系为省、市、区县、街道乡镇四个行政级别的相互隶属关系,所述行政区数据库可简称字典,作为四级行政区划分分逐级查找的依据,通过字典可以查询每一级别的行政单位包含哪些下级行政单位,以及它的上级行政单位,其中所述行政单位即为所述行政区名称。
S32、解析一快递地址中的至少一行政区的名称。
所述行政区的名称是根据四级行政区划分分逐级解析。在解析一个收件人地址的时候,采取从上层行政区到下级行政区逐级查询的方法进行解析,先解析地址中的省级名称,再根据解析到的省级名称,进一步解析地市级名称,以此类推逐级解析。
S33、将所述快递地址转变为优化地址,在所述优化地址中,所述行政区根据行政级别排序。
在所述优化地址中,所述行政区根据行政级别排序,这样便于后续识别行政级别,行政级别优选从高级向低级的顺序排序。
S34、查找所述优化地址中行政级别最低的行政区。
行政级别最低的行政区为排序后的最后的行政区的名称。
S35、根据最低行政区的名称调用所述行政区数据库中与最低行政区对应的各级别行政区名称,将其与所述优化地址中各级别行政区的名称依次对比,判断所述优化地址中缺失或错误的行政区名称。
S36、补充或修正所述优化地址中缺失或错误的行政区名称,获得一标准化地址。
在修正时,对所述标准化地址中解析出的所有行政区名称依据标准名称进行修正处理,更换或补充非规范的行政区名称。
如图3所示,本实施例中,所述解析一快递地址中的至少一行政区的名称的步骤,包括如下步骤S321-S325。
本方法核心是通过逐级解析和采用投票决策机制,标准化地址中的行政单位,实现对收件人地址的规范化、补全、纠错等,从而能够获得优化地址。本实施例通过对消费者填写的快递地址进行标准化及优化处理,即使在快递地址填写不完整或不标准情况下也不影响对快递地址的识别,从而保证了派送正确,进而提高了送件效率,缩短了送件时间,避免了因派送错误带来的经济损失。
S321、对所述快递地址解析所有行政区的名称,得到多种解析结果。
上述逐级解析的结果可以得到地址中包含的四级行政区名称列表,由于地址写法以及可能存在的错误各种各样,可能存在行政区的缺失、错误、不规范以及混淆等情况,如“上海黄浦区河南中路220号”,计算机就可以解析出来“上海”以及“河南”两个省级词汇以及“黄浦区”县区级词汇,因此需要设计一种规则让计算机判断哪一个才是地址中真正的省级单位。
S322、获取多种所述解析结果中的最高行政区。
最高行政区为排序后的最前的行政区的名称,或者根据省级的名称进行匹配的方式识别。
S323、根据最高行政区的名称调用所述行政区数据库中与最高行政区对应的各级别行政区名称,将其与所述解析结果中各级别行政区的名称依次对比,判断所述解析结果是否正确;当所述解析结果中的各级别行政区的名称与所述行政区数据库中的各级别行政区的名称相对应时,判定所述解析结果正确。
S324、统计被判定正确的所述解析结果中的所述行政区名称的数量。
S325、将获得最多数量的所述解析结果作为准确解析的行政区名称进行输出。
本实施例中的标准化方法采用投票决策机制,对于解析出来的每一级别行政单位,通过四级行政区划分相互隶属词典,我们查看该级别行政区划分名称的上一级和下一级行政单位是否也在地址中解析出来,如果上下级行政单位也在解析的地址中,那么该行政区划分就获得一个投票,获得投票最多的作为准确的解析值。
举例说明,在例子“上海黄浦区河南中路220号”中,“上海”就会获得“黄浦区”的投票从而确定为地址中正确的省级行政区划分。当解析完各级行政区划分后,会存在缺失的情况,如“浙江省大同镇松溪村60号”,解析出“浙江省”和“大同镇”,两者存在隶属关系,但是中间行政级别缺失,那么从解析出的最小行政级别向上逐级查找,补充缺失的行政区划分,最终标准化为“浙江省,杭州市,建德市,大同镇,松溪村60号”。对于错误的地址“湖北省娄底市双峰县三塘铺镇”,由于“湖北省”不包含“娄底市双峰县三塘铺镇”,没有下级单位对其投票支持,因此最终不能确认为有效的省级单位,省级单位最终由“娄底市双峰县三塘铺镇”向上查找修正为“湖南省”。
对于步骤S4在计算机中计算每一快递驿站地址与所述优化地址的相似度中,相似度的评估方法有很多种,常见的一种评估方法就是用两个地址中相同关键词的数量来衡量两个地址的相似程度。
如图4所示,本实施例中,所述计算每一快递驿站地址与所述标准化地址的相似度的步骤,包括如下步骤S411-S413。此方法是用两个地址中相同关键词的数量来衡量两个地址的相似程度。
S411、分别提取所述标准化地址及快递驿站地址的至少一关键词。
S412、对比所述标准化地址及快递驿站地址的至少一关键词。
S413、计算所述相似度,即为所述标准化地址与快递驿站地址的相同关键词的数量。相似度的另一种评估方法,用两个地址中相同关键词的词频和权重来衡量两个地址的相似程度。
如图5所示,在其他实施例中,所述计算每一快递驿站地址与所述标准化地址的相似度的步骤,包括如下步骤S421-S425。首先基于关键词词频计算相似度;再基于关键词长度的相似度,匹配上的关键词越长,该关键词值的权重越大,相似度越大;最后基于匹配上的关键词数量计算相似度,匹配上的关键词越多,相似度越大。
S421、分别提取所述标准化地址及快递驿站地址的至少一关键词。
S422、对比所述标准化地址及快递驿站地址的至少一关键词,获取两者的相同关键词。
S423、统计所述相同关键词中的每一关键词的词频。
S424、计算所述相同关键词中的每一关键词的文字个数,即为该关键词的权重。
S425、计算所述相似度,即为所有关键词的词频与权重的乘积并求和。
以上计算相似度的方法基于夹角余弦相似度,从三个角度计算并加权得到最终相似度。首先基于关键词词频计算相似度;再基于关键词长度的相似度,匹配上的关键词越长,该关键词值的权重越大,相似度越大;最后基于匹配上的关键词数量计算相似度,匹配上的关键词越多,相似度越大。
如图6所示,本实施例中,分别提取所述标准化地址及快递驿站地址的至少一关键词的步骤,包括如下步骤S401-S402。提取关键词步骤的目的为对获取的所述快递地址的分词进行优化,优化与地点、道路相关的分词规则,设计更加适用于快递行业的关键词分析方法。
S401、提取所述标准化地址及快递驿站地址中的地区特征名以及地区通用名。
本实施例中,所述地区通用名包括但不限于市、镇、乡、村、道、路、街、大路、东路、西路、南路、北路、中路、公路、大道、大街、东街、西街、南街、北街、中街、小区、社区、公司、店、学校、医院、号、弄。
所述地区特征名是指通用名前面的行政名称或者标志性地名,用于区分不同的地址。
S402、获取关键词,即为将所述地区通用名与其前一个所述地区特征名合并。此步骤中将所述地区通用名与其前一个所述地区特征名合并得到所述关键词可克服结巴分词的缺陷。
在快递行业的快递地址中,涉及到道、路、街等道路关键词以及小区、社区、公司、店、乡、镇、村等地点关键词,这些关键词对快递的投递非常关键,然而常见的结巴分词等分词工具往往并不能很好的分词,如“重庆市.渝北区.双凤桥街道空港大道655号长安锦尚城25栋”,结巴分词结果为“重庆市”,“渝北区”,“双凤桥”,“街道”,“空”,“港大道”,“655”,“号”,“长安”,“锦尚”,“城”,“25”,“栋“”,而对快递关键的“双凤桥街道”、“空港大道”、“空港大道655号”等关键词信息并不能很好的划分出来,因此需要针对快递行业地址分析做出优化。
基于结巴分析的基础,从两个方面优化:
首先,与道、路、街相关的分词进行合并优化,对于解析到的“路”,“道”,“街”,“大路”,“东路”,“西路”,“南路”,“北路”,“中路”,“公路”,“大道”,“大街”,“东街”,“西街”,“南街”,“北街”,“中街“等道路有关词汇,向前合并;同时如果道路相关词汇后接数字以及“号”、“弄”等词汇的时候,向后合并上路号。
其次,对地点关键词汇进行向前合并;如“医院”关键词,向前合并,结巴分词“湖南省株洲市石峰区响田路株洲市二医院”,结果为[“湖南省”,“株洲市”,“石峰区”,“响”,“田路”,“株洲市”,“二”,“医院”],优化为[“湖南省”,“株洲市”,“石峰区”,“响田路”,“二医院”]。通过以上规则可以将大量道路和地点相关的地址关键词进行有效优化,使得对收件人地址的关键词提取更加准确。
通过以上两个步骤S401-S402,得到收件人的标准化地址以及地址中的关键词信息,那么根据标准化的行政区划分,寻找该地区包含的快递柜或者驿站,通过计算收件人地址的关键词和驿站快递柜代收件的关键词计算相似度,从而预测快递最可能到达的目标驿站或者快递柜。
本发明还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行所述快递驿站地址辨别方法的步骤S1-S4中的任一种。
本发明还提供一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行所述快递驿站地址辨别方法的步骤S1-S4中的任一种。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁盘或光盘等。
本发明提供的上述快递驿站地址辨别方法、计算机设备和存储介质,通过对消费者填写的快递地址进行标准化及优化处理,即使在快递地址填写不完整或不标准情况下也不影响对快递地址的识别,从而保证了派送正确,进而提高了送件效率,缩短了送件时间,避免了因派送错误带来的经济损失。当快递进入驿站或者快递柜的时候,可以快速发送取件信息,既提高了查询效率,又可以第一时间通知收件人,提高用户体验。对驿站和快递柜来说,可以有效减少快递在快递柜和驿站的滞留时间,提高流转速度。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明一些示例性实施例,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (6)

1.一种快递驿站地址辨别方法,其特征在于,包括如下步骤:
预存至少一快递驿站地址;
录入一快递地址;
将所述快递地址转换为标准化地址;
将一快递地址转换为标准化地址的步骤,包括如下步骤:
生成一行政区数据库,包括至少一级行政区的名称及隶属关系;
解析一快递地址中的至少一行政区的名称;
将所述快递地址转变为优化地址,所述优化地址中的行政区根据行政级别排序;
查找所述优化地址中行政级别最低的行政区;
根据级别最低的行政区的名称调用所述行政区数据库中与该行政区对应的各级别行政区名称,将其与所述优化地址中各级别行政区的名称依次对比,判断所述优化地址中缺失或错误的行政区名称;以及
补充或修正所述优化地址中缺失或错误的行政区名称,获得一标准化地址;
解析一快递地址中的至少一行政区的名称的步骤,包括如下步骤:
对所述快递地址解析所有行政区的名称,得到多种解析结果;
获取多种所述解析结果中的最高行政区;
根据最高行政区的名称调用所述行政区数据库中与最高行政区对应的各级别行政区名称,将其与所述解析结果中各级别行政区的名称依次对比,判断所述解析结果是否正确;当所述解析结果中的各级别行政区的名称与所述行政区数据库中的各级别行政区的名称相对应时,判定所述解析结果正确;
统计被判定正确的所述解析结果中的所述行政区名称的数量;以及
将获得最多数量的所述解析结果作为准确解析的行政区名称进行输出;
计算每一快递驿站地址与所述标准化地址的相似度;
所述计算每一快递驿站地址与所述标准化地址的相似度的步骤,包括如下步骤:
分别提取所述标准化地址及快递驿站地址的至少一关键词;
对比所述标准化地址及快递驿站地址的至少一关键词;以及
计算所述相似度,即为所述标准化地址与快递驿站地址的相同关键词的数量;
所述计算每一快递驿站地址与所述标准化地址的相似度,包括如下步骤:
分别提取所述标准化地址及快递驿站地址的至少一关键词;
对比所述标准化地址及快递驿站地址的至少一关键词,获取两者的相同关键词;
统计所述相同关键词中的每一关键词的词频;
计算所述相同关键词中的每一关键词的文字个数,即为该关键词的权重;以及
计算所述相似度,即为所有关键词的词频与权重的乘积并求和;
以及
按照所述相似度的大小顺序将至少一快递驿站地址排序,生成一预测目标地址列表。
2.根据权利要求1所述的快递驿站地址辨别方法,其特征在于,分别提取所述标准化地址及快递驿站地址的至少一关键词包括如下步骤:
提取所述标准化地址及快递驿站地址中的地区特征名以及地区通用名;以及
获取关键词,即为将所述地区通用名与其前一个所述地区特征名合并。
3.根据权利要求2所述的快递驿站地址辨别方法,其特征在于,
所述地区通用名包括市、镇、乡、村、道、路、街、大路、东路、西路、南路、北路、中路、公路、大道、大街、东街、西街、南街、北街、中街、小区、社区、公司、店、学校、医院、号、弄。
4.根据权利要求1所述的快递驿站地址辨别方法,其特征在于,在所述按照所述相似度的大小顺序将至少一快递驿站地址排序步骤之前,还包括:
计算所述相似度与一预设阈值的差值,当该差值大于0时,与该相似度对应的所述快递驿站地址输出至所述预测目标地址列表中。
5.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行如权利要求1至4中任一项所述的快递驿站地址辨别方法的步骤。
6.一种存储介质,用于存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至4中任一项所述的快递驿站地址辨别方法的步骤。
CN202010065598.8A 2020-01-20 2020-01-20 快递驿站地址辨别方法、计算机设备和存储介质 Active CN111241229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010065598.8A CN111241229B (zh) 2020-01-20 2020-01-20 快递驿站地址辨别方法、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010065598.8A CN111241229B (zh) 2020-01-20 2020-01-20 快递驿站地址辨别方法、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN111241229A CN111241229A (zh) 2020-06-05
CN111241229B true CN111241229B (zh) 2023-09-26

Family

ID=70871473

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010065598.8A Active CN111241229B (zh) 2020-01-20 2020-01-20 快递驿站地址辨别方法、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN111241229B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930869B (zh) * 2020-08-11 2024-02-06 上海寻梦信息技术有限公司 地址纠偏方法、装置、电子设备以及存储介质
CN112581252A (zh) * 2020-12-03 2021-03-30 信用生活(广州)智能科技有限公司 融合多维相似度与规则集合的地址模糊匹配方法及系统
CN113139028A (zh) * 2021-04-23 2021-07-20 上海中通吉网络技术有限公司 配送地址的预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107533746A (zh) * 2015-02-28 2018-01-02 华为技术有限公司 信息保护方法、服务器及终端
CN110569239A (zh) * 2019-09-19 2019-12-13 圆通速递有限公司 一种快递包裹地址标准化的方法和系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2423865A1 (en) * 2010-08-26 2012-02-29 RAF Technology, Inc. Multiple address verification system for delivery routing
US10373103B2 (en) * 2015-11-11 2019-08-06 International Business Machines Corporation Decision-tree based address-station matching

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107533746A (zh) * 2015-02-28 2018-01-02 华为技术有限公司 信息保护方法、服务器及终端
CN110569239A (zh) * 2019-09-19 2019-12-13 圆通速递有限公司 一种快递包裹地址标准化的方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
向雯婷 ; 郭旦怀 ; .基于地名相似度算法与空间场景相似性评价的地址规范化研究.科研信息化技术与应用.2013,(01),全文. *

Also Published As

Publication number Publication date
CN111241229A (zh) 2020-06-05

Similar Documents

Publication Publication Date Title
CN111241229B (zh) 快递驿站地址辨别方法、计算机设备和存储介质
CN109255565B (zh) 地址的归属识别和物流任务的分发方法及其装置
WO2020228706A1 (zh) 基于围栏地址的坐标数据处理方法、装置和计算机设备
US8249744B2 (en) Mail routing system including a data block analyzer
US9323779B2 (en) Reverse geocoding system using combined street segment and point datasets
US20060041375A1 (en) Automated georeferencing of digitized map images
CN105718506A (zh) 一种科技项目查重对比的方法
KR20140097805A (ko) 좌표(x, y)위치 값을 이용한 체계적인 블록번호 생성 및 그 이용한 주소매칭 서비스 방법
CN113255642B (zh) 一种用于人伤理赔的医疗票据信息整合方法
CN111797182A (zh) 一种地址编码解析方法及系统
CN111523433B (zh) 快件末端地址的标准化处理方法、装置和设备
CN111896016A (zh) 位置信息的处理方法及装置、存储介质、终端
Cetl et al. A comparison of address geocoding techniques–case study of the city of Zagreb, Croatia
CN113642313A (zh) 地址文本的处理方法、装置、设备、存储介质及程序产品
CN110555432A (zh) 一种兴趣点处理方法、装置、设备和介质
Burns et al. Accessible and practical geocoding method for traffic collision record mapping: Quebec, Canada, case study
CN103324749A (zh) 一种基于标准文本地址的空间化解析及纠偏方法
CN111382138B (zh) Poi数据处理方法、装置、设备及介质
CN113434708B (zh) 地址信息检测方法、装置、电子设备和存储介质
CN105279249A (zh) 一种网站中兴趣点数据的置信度的判定方法和装置
CN114065762A (zh) 一种文本信息的处理方法、装置、介质及设备
CN109635057B (zh) 用电业务处理方法、装置、计算机设备和存储介质
CN111538797A (zh) 确定收信地址的方法及相关设备
CN105160032A (zh) 一种网站中兴趣点数据的置信度的判定方法和装置
de Armas García et al. Deployment of a National Geocoding Service: Cuban Experience.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant