CN111523433B - 快件末端地址的标准化处理方法、装置和设备 - Google Patents

快件末端地址的标准化处理方法、装置和设备 Download PDF

Info

Publication number
CN111523433B
CN111523433B CN202010303834.5A CN202010303834A CN111523433B CN 111523433 B CN111523433 B CN 111523433B CN 202010303834 A CN202010303834 A CN 202010303834A CN 111523433 B CN111523433 B CN 111523433B
Authority
CN
China
Prior art keywords
address
level
standard
express mail
matching degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010303834.5A
Other languages
English (en)
Other versions
CN111523433A (zh
Inventor
曹文军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongtongji Network Technology Co Ltd
Original Assignee
Shanghai Zhongtongji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongtongji Network Technology Co Ltd filed Critical Shanghai Zhongtongji Network Technology Co Ltd
Priority to CN202010303834.5A priority Critical patent/CN111523433B/zh
Publication of CN111523433A publication Critical patent/CN111523433A/zh
Application granted granted Critical
Publication of CN111523433B publication Critical patent/CN111523433B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Strategic Management (AREA)
  • Multimedia (AREA)
  • General Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种快件末端地址的标准化处理方法、装置和设备,将修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,若匹配度第一等级为中匹配度,解析当前六级地址的地理信息,得到当前经纬度地址,确定与当前经纬度地址匹配度最高的标准经纬度地址作为标准地址。派件员可以根据标准地址派送快件,不需要派件员对快件地址进行进一步地辨认和分析,降低了派件员的工作量,缩短了快件的转运时间。而且,标准地址达到末端单元级别,从而对快递行业的末端派送产生实际的促进作用,以便于进行快递柜选址、快递派送时效制度完善、快递刷单管控以及客户精准画像等。

Description

快件末端地址的标准化处理方法、装置和设备
技术领域
本发明涉及快递技术领域,具体涉及一种快件末端地址的标准化处理方法、装置和设备。
背景技术
随着物流信息技术的高速发展,人们从网络上进行购物的频率越来越高,使得快递业务也迅速增长。
目前,快递公司主要采用三段码进行转运分派相关快件,三段码可以把一个快递单号明确到具体的派件网点和派件员,然而,一般一个快递网点对应多个派件的居民小区、办公大厦的末端单元,物流公司只能得到快递网点的派件量,而无法获取具体末端单元的派件量,在赋能末端的大环境下,难以满足快递行业日益精细管理的需要。而且,由于人们的书写习惯不同,使得末端地址的书写并不规范,还需要派件员对快件地址进行进一步地辨认和分析,以确认派送地址,增大了派件员的工作量,延长了快件的转运时间。
发明内容
有鉴于此,本发明的目的在于提供一种快件末端地址的标准化处理方法、装置和设备,以克服目前由于人们的书写习惯不同,使得末端地址的书写并不规范,还需要派件员对快件进行进一步地辨认和分拣,增大了派件员的工作量,延长了快件的转运时间的问题。
为实现以上目的,本发明采用如下技术方案:
一种快件末端地址的标准化处理方法,包括:
获取快件地址;
基于预设的标准地址库,对所述快件地址进行字符修正,得到修正快件地址;
将所述修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;
在所述标准地址库中确定与所述当前六级地址匹配度最高的第一标准六级地址,并确定匹配度对应的第一等级;
若所述第一等级为高匹配度,则将所述第一标准六级地址作为标准地址;
若所述第一等级为中匹配度,解析所述当前六级地址的地理信息,得到所述当前六级地址对应的当前经纬度地址;
在所述标准地址库中确定与所述当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度对应的第二等级;
若所述第二等级为高匹配度,则将所述标准经纬度地址对应的第二标准六级地址作为所述标准地址。
进一步地,以上所述快件末端地址的标准化处理方法,所述基于预设的标准地址库,对所述快件地址进行字符修正,得到修正快件地址,包括:
利用预设的字符串处理工具,对所述快件地址进行基础字符处理;
对照所述标准地址库,对进行基础字符处理后的所述快件地址进行修正,得到所述修正快件地址。
进一步地,以上所述快件末端地址的标准化处理方法,所述六级地址处理模型的建立过程包括:
获取预设数量的快件地址样本和对应的标准六级地址样本作为训练样本;
将所述训练样本输入预先构建的深度学习模型进行训练,得到所述六级地址处理模型。
进一步地,以上所述快件末端地址的标准化处理方法,所述方法还包括:
获取工作人员根据处理结果输入的反馈信息;
根据所述反馈信息,对所述六级地址处理模型、所述第一等级的划分标准和所述第二等级的划分标准中的至少一种进行修正。
进一步地,以上所述快件末端地址的标准化处理方法,所述方法还包括:
获取标准地址更新信息,以更新所述标准地址库。
进一步地,以上所述快件末端地址的标准化处理方法,所述当前六级地址和所述标准六级地址均包括省、市、区县、街道、路和门牌号六级。
本发明还提供了一种快件末端地址的标准化处理装置,包括:获取模块、修正模块、输入模块、确定模块和解析模块;
所述获取模块,用于获取快件地址;
所述修正模块,用于基于预设的标准地址库,对所述快件地址进行字符修正,得到修正快件地址;
所述输入模块,用于将所述修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;
所述确定模块,用于在所述标准地址库中确定与所述当前六级地址匹配度最高的第一标准六级地址,并确定匹配度对应的第一等级;
所述确定模块,还用于若所述第一等级为高匹配度,则将所述第一标准六级地址作为标准地址;
所述解析模块,用于若所述第一等级为中匹配度,解析所述当前六级地址的地理信息,得到所述当前六级地址对应的当前经纬度地址;
所述确定模块,还用于在所述标准地址库中确定与所述当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度对应的第二等级;
所述确定模块,还用于若所述第二等级为高匹配度,则将所述标准经纬度地址对应的第二标准六级地址作为所述标准地址。
进一步地,以上所述快件末端地址的标准化处理装置,所述修正模块,具体用于利用预设的字符串处理工具,对所述快件地址进行基础字符处理;
对照所述标准地址库,对进行基础字符处理后的所述快件地址进行修正,得到所述修正快件地址。
进一步地,以上所述快件末端地址的标准化处理装置,还包括模型建立模块;
所述模型建立模块,用于获取预设数量的快件地址样本和对应的标准六级地址样本作为训练样本;
将所述训练样本输入预先构建的深度学习模型进行训练,得到所述六级地址处理模型。
本发明还提供了一种快件末端地址的标准化处理设备,包括处理器和存储器,所述处理器与存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行以上任一项所述的快件末端地址的标准化处理方法。
本发明的快件末端地址的标准化处理方法、装置和设备,将修正后的修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,若匹配度第一等级为中匹配度,解析当前六级地址的地理信息,得到当前六级地址对应的当前经纬度地址,在标准地址库中确定与当前经纬度地址匹配度最高的标准经纬度地址,若匹配度第二等级为高匹配度,则将标准经纬度地址对应的第二标准六级地址作为标准地址。派件员可以根据标准地址派送快件,不需要派件员对快件地址进行进一步地辨认和分析,降低了派件员的工作量,缩短了快件的转运时间。而且,标准地址达到末端单元级别,从而对快递行业的末端派送产生实际的促进作用,以便于进行快递柜选址、快递派送时效制度完善、快递刷单管控以及客户精准画像等。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明快件末端地址的标准化处理方法一种实施例提供的流程图;
图2是本发明快件末端地址的标准化处理装置一种实施例提供的结构示意图;
图3是本发明快件末端地址的标准化处理设备一种实施例提供的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明快件末端地址的标准化处理方法一种实施例提供的流程图,请参阅图1,本实施例可以包括以下步骤:
S101、获取快件地址;
每个快递下单后,都会对应一个快件地址,此地址是客户按照自己的认知和书写习惯填写的,可能会出现错别字、简略写法、拼音、繁体字、标点符号以及重复值等不同地址书写问题。
本实施例中,可以获取该快件地址。
S102、基于预设的标准地址库,对快件地址进行字符修正,得到修正快件地址;
本实施例中,预先设置有标准地址库,标准地址库中存储有国家有关部门发布的省市区街道地址。本实施例中,首先可以利用字符串处理工具,例如python正则表达式或者其他的自定义函数等,对快件地址进行基础字符处理,以除去不必要的标点符号,将繁体字转为简体字,将拼音转为简体汉字;然后对照标准地址库,对进行基础字符处理后的快件地址进行修正,更改错别字,补全缺失字,以及,去除重复字等。其中,可以基于省、市、区三级联动或者省、市、区、街道四级联动的方式对快件地址进行修正,以避免出现错误修正的情况。
例如,快件地址中,部分地址信息被误写为“删西省大同市”,基于上述三级联动或者四级联动,则可以将其修正为“山西省大同市”,而避免误修正为“陕西省大同市”。
S103、将修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;
将修正快件地址输入到预设的六级地址处理模型中,经过六级地址处理模型的处理后,得到输出的当前六级地址。
当前六级地址包括省、市、区县、街道、路、门牌号的六级地址。其中,区县为快件地址所属的区或者县一级的地址,街道为快件地址所属的乡镇、社区以及街道一级的地址,路为快件地址所在具体某条街、某条道或者某条路等。需要注意的是,北京市、上海市、天津市和重庆市作为直辖市,当前六级地址中省、市部分可以写作“北京北京市”“上海上海市”“天津天津市”“重庆重庆市”。
六级地址处理模型是通过训练预先构建的深度学习模型得到的,本实施例中优选BILSTM-CRF算法模型。具体地,可以先获取大量的快件地址样本和与快件地址样本对应的标准六级地址样本作为训练样本,将训练样本输入到上述深度学习模型中,以对深度学习模型进行训练,进而得到六级地址处理模型。
S104、在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,并确定匹配度的第一等级是否为高匹配度,若是执行S105,若否,执行S106;
在得到当前六级地址后,在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,并对第一标准六级地址和当前六级地址之间的匹配度进行评分,评分依据是第一标准六级地址和当前六级地址的相似度,相似度越高,则评分越高。
若该评分大于第一标准评分,则表示为高匹配度,此时可以执行S105,若该评分小于或等于第一标准评分,则表示为中匹配度或者低匹配度,可以执行S106。
需要注意的是,第一标准评分可以根据六级地址处理模型得到的查全率和准确率进行动态的调整。
S105、将第一标准六级地址作为标准地址;
若第一标准六级地址和当前六级地址之间的匹配度为高匹配度,则说明当前六级地址与第一标准六级地址极为相似或者相同,那么可以直接将第一标准六级地址作为标准地址。
S106、解析当前六级地址的地理信息,得到当前六级地址对应的当前经纬度地址;
若该评分小于或等于第一标准评分,且小于预设的第二评分标准,那么第一标准六级地址和当前六级地址之间的匹配度为低匹配度,可以生成低匹配度提醒,以进行人工处理。
若该评分小于或等于第一标准评分,且大于或等于预设的第二评分标准,那么第一标准六级地址和当前六级地址之间的匹配度为中匹配度,那么可以解析当前六级地址的地理信息,确定当前六级地址对应的当前经纬度地址。可以利用地理信息系统(GeographicInformation System,GIS),获取当前六级地址对应的当前经纬度地址,即当前六级地址对应的经纬度。
S107、在标准地址库中确定与当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度的第二等级;
确定当前六级地址对应的经纬度后,在标准地址库中确定与当前经纬度地址匹配度最高的标准经纬度地址,并对标准经纬度地址和当前经纬度地址之间的匹配度进行评分,确定匹配度的第二等级。其中,评分依据是标准经纬度地址和当前经纬度地址之间的相似度,相似度越高,则评分越高。
S108、若第二等级为高匹配度,则将标准经纬度地址对应的第二标准六级地址作为标准地址。
若标准经纬度地址和当前经纬度地址之间的匹配度评分大于或等于第三标准评分,则表示第二等级为高匹配度,则说明标准经纬度地址和当前经纬度地址极为相似或者相同,那么可以直接将标准经纬度地址对应的第二标准六级地址作为标准地址。
若标准经纬度地址和当前经纬度地址之间的匹配度评分小于第三标准评分,则表示第二等级为低匹配度,可以生成低匹配度提醒,以进行人工处理。
本实施例的快件末端地址的标准化处理方法,能够获取快件地址,基于预设的标准地址库,对快件地址进行字符修正,得到修正快件地址;将修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,并确定匹配度的第一等级;若第一等级为高匹配度,则将第一标准六级地址作为标准地址;若第一等级为中匹配度,解析当前六级地址的地理信息,得到当前六级地址对应的当前经纬度地址;在标准地址库中确定与当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度的第二等级;若第二等级为高匹配度,则将标准经纬度地址对应的第二标准六级地址作为标准地址。派件员可以根据标准地址派送快件,不需要派件员对快件地址进行进一步地辨认和分析,降低了派件员的工作量,缩短了快件的转运时间。
本方案将地址直接到达末端小区、办公大厦以及村组的级别,总部、省总等业务部门能够快速掌握末端派件热点,通过对末端单元的快递数据进行统计分析,协助解决相应的业务难题。例如,可以通过对末端单元的数据分析确定派件量大的末端小区,进而在该小区增设快递柜,对派件员的派件区域进行细分调整,以提高快件派送效率。
而且,基于本实施例,快件派送员可以对末端单元进行标记,例如标记“**省**市**县**街道**路668号”为办公大厦,标记“**省**市**县**街道**路669号”为居民小区,对进行派件时效的差异化管控提供数据支持,即办公大厦的快件可以集中在工作日派送,居民小区的快件在工作日可以放置在快递柜,休息日正常派送等。从而在照顾派送员的合理派送时间诉求的同时,满足客户的需求,提高派件员的服务质量。
由于客户在不同平台填写相同的地址时,有时对于该地址的描述不一致,导致同一个客户在物流公司的系统中被区分成不同的客户,对客户管理、客户画像工作有一定的影响。而本实施例,通过的对客户地址标准化处理,能够解决一个地址多种写法的问题,从而对推动客户的精细化管理,为客户画像的准确度提供数据支持。
进一步地,本实施例还可以包括以下步骤:获取工作人员根据处理结果输入的反馈信息,根据反馈信息,对六级地址处理模型、第一等级的划分标准和第二等级的划分标准中的至少一种进行修正。
具体地,本实施例在以上实施例的基础上,输出标准地址后,工作人员可以判断标准地址是否正确,若错误,可以反馈正确的标准地址;输出低匹配度提醒信息后,工作人员可以确定并反馈该快件地址对应的标准地址。本实施例中,获得工作人员反馈的标准地址后,将快件地址和标准地址作为新的训练样本,对六级地址处理模型进行修正,还可以对第一等级的划分标准和第二等级的划分标准进行修正,即调整上述第一标准评分、第二标准评分和第三标准评分中的至少一个。
进一步地,本实施例还可以包括以下步骤:获取标准地址更新信息,以更新标准地址库。
具体地,我国民政部门目前会对省市区街道地址进行更新,本实施例可以获取标准地址更新信息,以对标准地址库进行更新。
本发明还提供了一种快件末端地址的标准化处理装置,用于实现上述方法实施例。图2是本发明快件末端地址的标准化处理装置一种实施例提供的结构示意图,请参阅图2,本实施例的快件末端地址的标准化处理装置,可以包括:获取模块11、修正模块12、输入模块13、确定模块14和解析模块15;
获取模块11,用于获取快件地址;
修正模块12,用于基于预设的标准地址库,对快件地址进行字符修正,得到修正快件地址;
输入模块13,用于将修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;
确定模块14,用于在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,并确定匹配度对应的第一等级;
确定模块14,还用于若第一等级为高匹配度,则将第一标准六级地址作为标准地址;
解析模块15,用于若第一等级为中匹配度,解析当前六级地址的地理信息,得到当前六级地址对应的当前经纬度地址;
确定模块14,还用于在标准地址库中确定与当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度对应的第二等级;
确定模块14,还用于若第二等级为高匹配度,则将标准经纬度地址对应的第二标准六级地址作为标准地址。
本实施例的快件末端地址的标准化处理装置,输入模块13将修正模块12修正后的修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;确定模块14在标准地址库中确定与当前六级地址匹配度最高的第一标准六级地址,若匹配度第一等级为中匹配度,解析模块15解析当前六级地址的地理信息,得到当前六级地址对应的当前经纬度地址,确定模块14在标准地址库中确定与当前经纬度地址匹配度最高的标准经纬度地址,若匹配度第二等级为高匹配度,则将标准经纬度地址对应的第二标准六级地址作为标准地址。派件员可以根据标准地址派送快件,不需要派件员对快件地址进行进一步地辨认和分析,降低了派件员的工作量,缩短了快件的转运时间。而且,标准地址达到末端单元级别,从而对快递行业的末端派送产生实际的促进作用,以便于进行快递柜选址、快递派送时效制度完善、快递刷单管控以及客户精准画像等。
进一步地,本实施例的修正模块,具体用于利用预设的字符串处理工具,对快件地址进行基础字符处理;对照标准地址库,对进行基础字符处理后的快件地址进行修正,得到修正快件地址。
进一步地,本实施例还包括模型建立模块;
模型建立模块,用于获取预设数量的快件地址样本和对应的标准六级地址样本作为训练样本;将训练样本输入预先构建的深度学习模型进行训练,得到六级地址处理模型。
进一步地,本实施例模型建立模块,还用于获取工作人员根据处理结果输入的反馈信息;
根据反馈信息,对六级地址处理模型、第一等级的划分标准和第二等级的划分标准中的至少一种进行修正。
进一步地,本实施例还包括更新模块;
更新模块,用于获取标准地址更新信息,以更新标准地址库。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本发明还提供了一组快件末端地址的标准化处理设备,用于实现上述方法实施例。图3是本发明快件末端地址的标准化处理设备一种实施例提供的结构示意图,请参阅图3,本实施例的快件末端地址的标准化处理设备包括处理器21和存储器22,处理器21与存储器22相连:
其中,处理器21,用于调用并执行存储器22中存储的程序;
存储器22,用于存储程序,程序至少用于执行以上实施例的快件末端地址的标准化处理方法。
本实施例的快件末端地址的标准化处理设备,派件员可以根据标准地址派送快件,不需要派件员对快件地址进行进一步地辨认和分析,降低了派件员的工作量,缩短了快件的转运时间。而且,标准地址达到末端单元级别,从而对快递行业的末端派送产生实际的促进作用,以便于进行快递柜选址、快递派送时效制度完善、快递刷单管控以及客户精准画像等。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (9)

1.一种快件末端地址的标准化处理方法,其特征在于,包括:
获取快件地址;
基于预设的标准地址库,对所述快件地址进行字符修正,得到修正快件地址;
将所述修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;
在所述标准地址库中确定与所述当前六级地址匹配度最高的第一标准六级地址,并确定匹配度对应的第一等级;
若所述第一等级为高匹配度,则将所述第一标准六级地址作为标准地址;
若所述第一等级为中匹配度,解析所述当前六级地址的地理信息,得到所述当前六级地址对应的当前经纬度地址;
在所述标准地址库中确定与所述当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度对应的第二等级;
若所述第二等级为高匹配度,则将所述标准经纬度地址对应的第二标准六级地址作为所述标准地址;
所述六级地址处理模型的建立过程包括:
获取预设数量的快件地址样本和对应的标准六级地址样本作为训练样本;
将所述训练样本输入预先构建的深度学习模型进行训练,得到所述六级地址处理模型。
2.根据权利要求1所述快件末端地址的标准化处理方法,其特征在于,所述基于预设的标准地址库,对所述快件地址进行字符修正,得到修正快件地址,包括:
利用预设的字符串处理工具,对所述快件地址进行基础字符处理;
对照所述标准地址库,对进行基础字符处理后的所述快件地址进行修正,得到所述修正快件地址。
3.根据权利要求1所述快件末端地址的标准化处理方法,其特征在于,所述方法还包括:
获取工作人员根据处理结果输入的反馈信息;
根据所述反馈信息,对所述六级地址处理模型、所述第一等级的划分标准和所述第二等级的划分标准中的至少一种进行修正。
4.根据权利要求1所述快件末端地址的标准化处理方法,其特征在于,所述方法还包括:
获取标准地址更新信息,以更新所述标准地址库。
5.根据权利要求1所述快件末端地址的标准化处理方法,其特征在于,所述当前六级地址和所述标准六级地址均包括省、市、区县、街道、路和门牌号六级。
6.一种快件末端地址的标准化处理装置,其特征在于,包括:获取模块、修正模块、输入模块、确定模块和解析模块;
所述获取模块,用于获取快件地址;
所述修正模块,用于基于预设的标准地址库,对所述快件地址进行字符修正,得到修正快件地址;
所述输入模块,用于将所述修正快件地址输入到预设的六级地址处理模型中,获取输出的当前六级地址;所述六级地址处理模型的建立过程包括:
获取预设数量的快件地址样本和对应的标准六级地址样本作为训练样本;
将所述训练样本输入预先构建的深度学习模型进行训练,得到所述六级地址处理模型;
所述确定模块,用于在所述标准地址库中确定与所述当前六级地址匹配度最高的第一标准六级地址,并确定匹配度对应的第一等级;
所述确定模块,还用于若所述第一等级为高匹配度,则将所述第一标准六级地址作为标准地址;
所述解析模块,用于若所述第一等级为中匹配度,解析所述当前六级地址的地理信息,得到所述当前六级地址对应的当前经纬度地址;
所述确定模块,还用于在所述标准地址库中确定与所述当前经纬度地址匹配度最高的标准经纬度地址,并确定匹配度对应的第二等级;
所述确定模块,还用于若所述第二等级为高匹配度,则将所述标准经纬度地址对应的第二标准六级地址作为所述标准地址。
7.根据权利要求6所述快件末端地址的标准化处理装置,其特征在于,所述修正模块,具体用于利用预设的字符串处理工具,对所述快件地址进行基础字符处理;
对照所述标准地址库,对进行基础字符处理后的所述快件地址进行修正,得到所述修正快件地址。
8.根据权利要求6所述快件末端地址的标准化处理装置,其特征在于,还包括模型建立模块;
所述模型建立模块,用于获取预设数量的快件地址样本和对应的标准六级地址样本作为训练样本;
将所述训练样本输入预先构建的深度学习模型进行训练,得到所述六级地址处理模型。
9.一种快件末端地址的标准化处理设备,其特征在于,包括处理器和存储器,所述处理器与存储器相连:
其中,所述处理器,用于调用并执行所述存储器中存储的程序;
所述存储器,用于存储所述程序,所述程序至少用于执行权利要求1-5任一项所述的快件末端地址的标准化处理方法。
CN202010303834.5A 2020-04-17 2020-04-17 快件末端地址的标准化处理方法、装置和设备 Active CN111523433B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010303834.5A CN111523433B (zh) 2020-04-17 2020-04-17 快件末端地址的标准化处理方法、装置和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010303834.5A CN111523433B (zh) 2020-04-17 2020-04-17 快件末端地址的标准化处理方法、装置和设备

Publications (2)

Publication Number Publication Date
CN111523433A CN111523433A (zh) 2020-08-11
CN111523433B true CN111523433B (zh) 2023-09-19

Family

ID=71902711

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010303834.5A Active CN111523433B (zh) 2020-04-17 2020-04-17 快件末端地址的标准化处理方法、装置和设备

Country Status (1)

Country Link
CN (1) CN111523433B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112101878B (zh) * 2020-11-11 2021-02-19 万邑通商(北京)信息科技有限公司 一种自动校验和修正全球地址的方法
CN112488195B (zh) * 2020-11-30 2024-04-19 上海寻梦信息技术有限公司 派件员代派送识别方法、装置、设备以及存储介质
CN112835922A (zh) * 2021-01-29 2021-05-25 上海寻梦信息技术有限公司 地址区划分类方法、系统、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016179987A1 (zh) * 2015-05-12 2016-11-17 深圳市华傲数据技术有限公司 中文地址分词标注方法
CN107527312A (zh) * 2016-06-22 2017-12-29 顺丰科技有限公司 快件地址处理系统和方法
CN110795472A (zh) * 2019-11-11 2020-02-14 集奥聚合(北京)人工智能科技有限公司 基于模糊匹配的地址标准化方法、系统、设备及介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016179987A1 (zh) * 2015-05-12 2016-11-17 深圳市华傲数据技术有限公司 中文地址分词标注方法
CN107527312A (zh) * 2016-06-22 2017-12-29 顺丰科技有限公司 快件地址处理系统和方法
CN110795472A (zh) * 2019-11-11 2020-02-14 集奥聚合(北京)人工智能科技有限公司 基于模糊匹配的地址标准化方法、系统、设备及介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
叶培根 ; .快递配送信息中智能客户端的应用.科技创新与应用.2015,(06),全文. *

Also Published As

Publication number Publication date
CN111523433A (zh) 2020-08-11

Similar Documents

Publication Publication Date Title
CN111523433B (zh) 快件末端地址的标准化处理方法、装置和设备
CN107766371B (zh) 一种文本信息分类方法及其装置
CN110020433B (zh) 一种基于企业关联关系的工商高管人名消歧方法
CN102163214B (zh) 一种数字地图生成装置及方法
CN103514235B (zh) 一种增量码库的建立方法和装置
CN107679189A (zh) 一种兴趣点更新方法、装置、服务器和介质
CN110019617B (zh) 地址标识的确定方法和装置、存储介质、电子装置
CN104462155A (zh) 一种兴趣点父子关系的建立方法及装置
CN109389270A (zh) 一种物流对象确定方法、装置和机器可读介质
CN107368480B (zh) 一种兴趣点数据错误类型定位、重复识别方法及装置
CN107273295A (zh) 一种基于文本混乱度的软件问题报告分类方法
CN110633895A (zh) 一种基于地理信息的特色小镇评价方法
CN110674152A (zh) 数据同步方法与装置、存储介质、电子设备
CN111241229B (zh) 快递驿站地址辨别方法、计算机设备和存储介质
CN111896016A (zh) 位置信息的处理方法及装置、存储介质、终端
CN112000755A (zh) 一种基于手机信令数据的区域出行廊道识别方法
CN112419124B (zh) 一种低效工业用地的快速识别方法、装置及其存储介质
CN113743080A (zh) 一种分层级地址文本相似度比对方法、装置及介质
CN116881430B (zh) 一种产业链识别方法、装置、电子设备及可读存储介质
CN108021638A (zh) 一种离线地理编码非结构化地址解析系统
CN115935231A (zh) 一种数据分类方法、装置、设备及存储介质
CN111401051B (zh) 快递信息解析方法及系统
CN113590781A (zh) 末端快递编码预测方法、系统、电子设备及可读存储介质
CN115438629A (zh) 数据处理方法、装置、存储介质及电子设备
CN114003812A (zh) 地址匹配方法、系统、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant