CN113139028A - 配送地址的预测方法 - Google Patents

配送地址的预测方法 Download PDF

Info

Publication number
CN113139028A
CN113139028A CN202110439512.8A CN202110439512A CN113139028A CN 113139028 A CN113139028 A CN 113139028A CN 202110439512 A CN202110439512 A CN 202110439512A CN 113139028 A CN113139028 A CN 113139028A
Authority
CN
China
Prior art keywords
address
street
delivery
preprocessed
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110439512.8A
Other languages
English (en)
Inventor
邢哲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Zhongtongji Network Technology Co Ltd
Original Assignee
Shanghai Zhongtongji Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Zhongtongji Network Technology Co Ltd filed Critical Shanghai Zhongtongji Network Technology Co Ltd
Priority to CN202110439512.8A priority Critical patent/CN113139028A/zh
Publication of CN113139028A publication Critical patent/CN113139028A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes
    • G06F18/24137Distances to cluster centroïds
    • G06F18/2414Smoothing the distance, e.g. radial basis function networks [RBFN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Remote Sensing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及配送地址的预测技术领域,具体涉及一种配送地址的预测方法,包括获取目标快递的收货地址;使用jieba分词对收货地址进行预处理,得到预处理后的收货地址;将预处理后的收货地址输入到预先训练的分类网络模型中,得到预测出的第一街道地址;以及,使用预处理后的收货地址对应的经纬度与国家行政街道经纬度进行欧式距离计算,确定欧式距离最短的第二街道地址;若第一街道地址和第二街道地址为同一地址,则将地址作为配送地址,避免了地址中街道名称不存在以及街道名称错误的问题,提高了快递员派送效率,使相同街道的包裹可以被统一派送。

Description

配送地址的预测方法
技术领域
本发明涉及配送地址的预测技术领域,具体涉及一种配送地址的预测方法。
背景技术
近几年快递行业迎来高速发展,日均配送量达到4000万以上,地址填写的标准程度直接决定了末端快递员的配送效率,只有将快递员的配送效率最大化,才能带来良好的用户体验。
现有技术中,是按照已有的行政区划地址来进行正则匹配。但是,在实际操作中存在大量的收获地址书写不规范,书写错误,地址错乱,存在多个同一级别行政区等问题,大大降低末端快递员的配送效率。
发明内容
有鉴于此,本发明的目的在于提供一种配送地址的预测方法,以克服目前际操作中存在大量的收获地址书写不规范,书写错误,地址错乱,存在多个同一级别行政区等问题,大大降低末端快递员的配送效率的问题。
为实现以上目的,本发明采用如下技术方案:
一种配送地址的预测方法,包括:
获取目标快递的收货地址;
使用jieba分词对所述收货地址进行预处理,得到预处理后的收货地址;
将预处理后的收货地址输入到预先训练的分类网络模型中,得到预测出的第一街道地址;以及,使用预处理后的收货地址对应的经纬度与国家行政街道经纬度进行欧式距离计算,确定欧式距离最短的第二街道地址;
若所述第一街道地址和所述第二街道地址为同一地址,则将所述地址作为配送地址。
进一步地,以上所述的配送地址的预测方法,所述使用jieba分词对所述收货地址进行预处理,得到预处理后的收货地址,包括:
使用jieba分词对所述收货地址进行分割,将重复的地址字段过滤,并且,将所述收货地址中存在的繁体字转化为简体字,得到预处理后的收货地址。
进一步地,以上所述的配送地址的预测方法,若所述第一街道地址和所述第二街道地址不为同一地址,输出异常提醒;
获取用户根据所述异常提醒反馈的信息;
根据用户反馈的信息,确定所述第一街道地址或所述第二街道地址为所述配送地址。
进一步地,以上所述的配送地址的预测方法,所述方法还包括:
将所述配送地址发送给对应的终端快递员,以使所述终端快递员根据所述配送地址进行快递的配送。
进一步地,以上所述的配送地址的预测方法,所述方法还包括:
将预设的训练样本输入到神经网络模型中进行训练,得到训练好的所述分类网络模型。
进一步地,以上所述的配送地址的预测方法,所述神经网络模型包括textcnn。
本发明的配送地址的预测方法,包括获取目标快递的收货地址;使用jieba分词对收货地址进行预处理,得到预处理后的收货地址;将预处理后的收货地址输入到预先训练的分类网络模型中,得到预测出的第一街道地址;以及,使用预处理后的收货地址对应的经纬度与国家行政街道经纬度进行欧式距离计算,确定欧式距离最短的第二街道地址;若第一街道地址和第二街道地址为同一地址,则将地址作为配送地址,避免了地址中街道名称不存在以及街道名称错误的问题,充分利用地址中其他的位置信息进行街道预测,提高了快递员派送效率,使相同街道的包裹可以被统一派送。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明配送地址的预测方法一种实施例提供的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
图1是本发明配送地址的预测方法一种实施例提供的流程图。请参阅图1,本实施例可以包括以下步骤:
S11、获取目标快递的收货地址。
在一些可选的实施例中,可以先获取待派送的目标快递的收货地址。例如,可以拉取第二天需要派送的目标快递的收货地址。
S12、使用jieba分词对收货地址进行预处理,得到预处理后的收货地址。
使用jieba分词对收货地址进行预处理。在一些可选的实施例中,预处理的过程包括如下步骤:
使用jieba分词对收货地址进行分割,将重复的地址字段过滤,并且,将收货地址中存在的繁体字转化为简体字,得到预处理后的收货地址。
具体地,jieba分词是一个Python中文分词组件,可以对中文文本进行分词、词性标注、关键词抽取等功能,并且支持自定义词典。例如,可以将河北省保定市竞秀区竞秀区富裕大厦3201室,分为“河北省”“保定市”“竞秀区”“竞秀区”“富裕大厦3201室”几个部分。其中“竞秀区”与“竞秀区”是重复的地址字段,将其中一组“竞秀区”过滤掉,得到处理后的收货地址“河北省”“保定市”“竞秀区”“富裕大厦3201室”。若收货地址中存在繁体字,还可以自动将繁体字转换为简体字。
S13、将预处理后的收货地址输入到预先训练的分类网络模型中,得到预测出的第一街道地址。
将处理后的收货地址输入到预先训练的分类网络模型中,得到从分类模型中输出的结果,将该结果作为第一街道地址。
其中,分类网络模型是通过神经网络模型训练得来的,在一些可选的实施例中,神经网络模型包括textcnn。将预设的训练样本输入到textcnn中进行训练。其中,训练样本为地区名称和对应的街道名称。训练样本包括训练集和测试集,使用训练集对textcnn进行训练,使用测试集进行测试,当测试结果收敛以后,则表示训练完成,得到分类网络模型。
例如,可以将“河北省”“保定市”“竞秀区”“富裕大厦3201室”输入到分类网络模型,得到输出的结果“先锋街道”作为第一街道地址。
除了textcnn外,还可以使用其他模型,但是需要考虑时效和精度等条件。
S14、使用预处理后的收货地址对应的经纬度与国家行政街道经纬度进行欧式距离计算,确定欧式距离最短的第二街道地址。
根据预处理后的收货地址,确定该收货地址对应的经纬度,将该经纬度与国家行政街道经纬度进行欧式距离计算,将欧式距离最短的街道作为第二街道地址。
需要说明的是,本实施例并不会限定S13和S14的执行顺序,可以先执行S13,再执行S14;还可以先执行S14,再执行S13,本实施例不做限定。
S15、若第一街道地址和第二街道地址为同一地址,则将地址作为配送地址。
进一步判断第一街道地址和第二街道地址是否为同一地址,如果第一街道地址和第二街道地址为同一地址,则将地址作为配送地址。
本发明的配送地址的预测方法,包括获取目标快递的收货地址;使用jieba分词对收货地址进行预处理,得到预处理后的收货地址;将预处理后的收货地址输入到预先训练的分类网络模型中,得到预测出的第一街道地址;以及,使用预处理后的收货地址对应的经纬度与国家行政街道经纬度进行欧式距离计算,确定欧式距离最短的第二街道地址;若第一街道地址和第二街道地址为同一地址,则将地址作为配送地址,避免了地址中街道名称不存在以及街道名称错误的问题,充分利用地址中其他的位置信息进行街道预测,提高了快递员派送效率,使相同街道的包裹可以被统一派送。
在一些可选的实施例中,还可以包括如下步骤:
步骤一、若第一街道地址和第二街道地址不为同一地址,输出异常提醒;
步骤二、获取用户根据异常提醒反馈的信息;
步骤三、根据用户反馈的信息,确定第一街道地址或第二街道地址为配送地址。
具体地,如果第一街道地址和第二街道地址不为同一地址,可以输出异常提醒,用户根据异常提醒手动选择第一街道地址或第二街道地址为配送地址。本实施例中,获取用户反馈的信息,根据用户反馈的信息,确定第一街道地址或第二街道地址为配送地址。
例如,若用户反馈为选择第一街道地址为配送地址,那么确定第一街道地址为配送地址。若用户反馈为选择第二街道地址为配送地址,那么确定第二街道地址为配送地址。
在一些可选的实施例中,还可以在第一街道地址和第二街道地址不为同一地址时,直接将第一街道地址作为收货地址。
在一些可选的实施例中,确定收货地址以后,还可以包括如下步骤:
将配送地址发送给对应的终端快递员,以使终端快递员根据配送地址进行快递的配送。
可以理解的是,上述各实施例中相同或相似部分可以相互参考,在一些实施例中未详细说明的内容可以参见其他实施例中相同或相似的内容。
需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是指至少两个。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (6)

1.一种配送地址的预测方法,其特征在于,包括:
获取目标快递的收货地址;
使用jieba分词对所述收货地址进行预处理,得到预处理后的收货地址;
将预处理后的收货地址输入到预先训练的分类网络模型中,得到预测出的第一街道地址;以及,使用预处理后的收货地址对应的经纬度与国家行政街道经纬度进行欧式距离计算,确定欧式距离最短的第二街道地址;
若所述第一街道地址和所述第二街道地址为同一地址,则将所述地址作为配送地址。
2.根据权利要求1所述的配送地址的预测方法,其特征在于,所述使用jieba分词对所述收货地址进行预处理,得到预处理后的收货地址,包括:
使用jieba分词对所述收货地址进行分割,将重复的地址字段过滤,并且,将所述收货地址中存在的繁体字转化为简体字,得到预处理后的收货地址。
3.根据权利要求1所述的配送地址的预测方法,其特征在于,若所述第一街道地址和所述第二街道地址不为同一地址,输出异常提醒;
获取用户根据所述异常提醒反馈的信息;
根据用户反馈的信息,确定所述第一街道地址或所述第二街道地址为所述配送地址。
4.根据权利要求1所述的配送地址的预测方法,其特征在于,所述方法还包括:
将所述配送地址发送给对应的终端快递员,以使所述终端快递员根据所述配送地址进行快递的配送。
5.根据权利要求1所述的配送地址的预测方法,其特征在于,所述方法还包括:
将预设的训练样本输入到神经网络模型中进行训练,得到训练好的所述分类网络模型。
6.根据权利要求5所述的配送地址的预测方法,其特征在于,所述神经网络模型包括textcnn。
CN202110439512.8A 2021-04-23 2021-04-23 配送地址的预测方法 Pending CN113139028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110439512.8A CN113139028A (zh) 2021-04-23 2021-04-23 配送地址的预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110439512.8A CN113139028A (zh) 2021-04-23 2021-04-23 配送地址的预测方法

Publications (1)

Publication Number Publication Date
CN113139028A true CN113139028A (zh) 2021-07-20

Family

ID=76811869

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110439512.8A Pending CN113139028A (zh) 2021-04-23 2021-04-23 配送地址的预测方法

Country Status (1)

Country Link
CN (1) CN113139028A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN110069626A (zh) * 2017-11-09 2019-07-30 菜鸟智能物流控股有限公司 一种目标地址的识别方法、分类模型的训练方法以及设备
CN111241229A (zh) * 2020-01-20 2020-06-05 上海东普信息科技有限公司 快递驿站地址辨别方法、计算机设备和存储介质
CN112199501A (zh) * 2020-10-13 2021-01-08 华中科技大学 一种科技信息文本分类方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109255564A (zh) * 2017-07-13 2019-01-22 菜鸟智能物流控股有限公司 一种取件点地址推荐方法及装置
CN110069626A (zh) * 2017-11-09 2019-07-30 菜鸟智能物流控股有限公司 一种目标地址的识别方法、分类模型的训练方法以及设备
CN111241229A (zh) * 2020-01-20 2020-06-05 上海东普信息科技有限公司 快递驿站地址辨别方法、计算机设备和存储介质
CN112199501A (zh) * 2020-10-13 2021-01-08 华中科技大学 一种科技信息文本分类方法

Similar Documents

Publication Publication Date Title
CN106909654B (zh) 一种基于新闻文本信息的多级分类系统及方法
CN107766371B (zh) 一种文本信息分类方法及其装置
CN111414479A (zh) 基于短文本聚类技术的标签抽取方法
CN106598999B (zh) 一种计算文本主题归属度的方法及装置
CN107291840B (zh) 一种用户属性预测模型构建方法和装置
CN113495900A (zh) 基于自然语言的结构化查询语言语句获取方法及装置
CN111651996A (zh) 摘要生成方法、装置、电子设备及存储介质
CN111815432B (zh) 金融服务风险预测方法及装置
CN112527994A (zh) 情绪分析方法、装置、设备及可读存储介质
CN111930792A (zh) 数据资源的标注方法、装置、存储介质及电子设备
CN112395858B (zh) 融合试题数据和解答数据的多知识点标注方法和系统
CN110659367B (zh) 文本分类号的确定方法、装置以及电子设备
WO2022135496A1 (zh) 一种语音交互的数据处理方法和装置
CN110263854A (zh) 直播标签确定方法、装置及存储介质
CN112163081A (zh) 标签确定方法、装置、介质及电子设备
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
CN112001173A (zh) 派件编码管理方法、装置、终端设备和存储介质
CN107704869B (zh) 一种语料数据抽样方法及模型训练方法
CN110532449B (zh) 一种业务文档的处理方法、装置、设备和存储介质
CN116306974A (zh) 问答系统的模型训练方法、装置、电子设备及存储介质
CN111143517A (zh) 人选标签预测方法、装置、设备和存储介质
CN110825874A (zh) 一种中文文本分类方法和装置及计算机可读存储介质
CN113177644A (zh) 一种基于词嵌入和深度时序模型的自动建模系统
CN113139028A (zh) 配送地址的预测方法
CN111325495B (zh) 异常件分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination