CN112101878A - 一种自动校验和修正全球地址的方法 - Google Patents

一种自动校验和修正全球地址的方法 Download PDF

Info

Publication number
CN112101878A
CN112101878A CN202011249616.4A CN202011249616A CN112101878A CN 112101878 A CN112101878 A CN 112101878A CN 202011249616 A CN202011249616 A CN 202011249616A CN 112101878 A CN112101878 A CN 112101878A
Authority
CN
China
Prior art keywords
address
buyer
matching degree
library
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011249616.4A
Other languages
English (en)
Other versions
CN112101878B (zh
Inventor
章进刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wanyi Tongshang Beijing Information Technology Co ltd
Original Assignee
Wanyi Tongshang Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wanyi Tongshang Beijing Information Technology Co ltd filed Critical Wanyi Tongshang Beijing Information Technology Co ltd
Priority to CN202011249616.4A priority Critical patent/CN112101878B/zh
Publication of CN112101878A publication Critical patent/CN112101878A/zh
Application granted granted Critical
Publication of CN112101878B publication Critical patent/CN112101878B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/003Destination control; Electro-mechanical or electro- magnetic delay memories
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Computational Linguistics (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种自动校验和修正全球地址的方法,涉及包裹派送技术领域。本发明通过过抓取或API对接的方式,获取全球国家、城市、州、邮编和街道信息作为地址的基础信息,记为地址一,并建立标准地址库;记录所有正确订单的收货地址,建立历史订单库;获取买家收件地址信息,记为地址二。本发明根据地址相似度匹配算法找出匹配度高于0.8的地址信息,并通过在高匹配度的地址列表里找出最接近真实地址的推荐地址,从而达到将错误或缺失的买家地址修正和补全,从而大大降低因买家地址错误导致的退件;大大降低因买家地址错误导致的错误派送;提升派送效率,特别是对买家地址信息不够精准包裹。

Description

一种自动校验和修正全球地址的方法
技术领域
本发明属于包裹派送技术领域,特别是涉及一种自动校验和修正全球地址的方法。
背景技术
在目前全球跨境电商平台交易的过程中,要求卖家填写准确的国家、城市、州、邮编和街道信息。通常情况下,买家收件地址填写错误的几种处理方式:1.派件时发现买家地址信息填写错误,将货物退货原仓库;2.派件人员根据经验猜测可能的正确地址,可能派送正确,也可能派送错误;3.根据包裹电话联系买家,有可能通过买家了解到正确的派送地址;4.直接将包裹派送到错误的收件地址,错误派送导致损失。以上处理办法最大的问题就是会导致包裹退件或派件错误,造成经济损失或降低买家用户体验。
发明内容
本发明的目的在于提供一种自动校验和修正全球地址的方法,以解决了现有的问题:当买家收件地址填写错误时,现有的处理办法会导致包裹退件或派件错误,造成经济损失或降低买家用户体验。本发明旨在通过对买家填错的收件人地址信息进行判断、修正,从而降低因收件地址信息错误导致的退件或派件错误。
为解决上述技术问题,本发明是通过以下技术方案实现的:
一种自动校验和修正全球地址的方法,所述方法包括:
通过抓取或API对接的方式,获取全球国家、城市、州、邮编和街道信息作为地址的基础信息,记为地址一,并建立标准地址库;
记录所有正确订单的收货地址,建立历史订单库;
获取买家收件地址信息,记为地址二;
根据上述的标准地址库检验该地址二是否正确,如果正确则直接返回地址给工作人员并进行配送;
如果上述地址二不正确,则将所述的地址二和地址一进行对比,根据匹配算法找出在标准地址库里是否有和买家提供的地址二匹配度大于匹配度预设值的地址;
如果在标准地址库没有和买家提供的地址二匹配度大于匹配度预设值的地址,则修正失败,将结果返还给工作人员,人工进行地址修正后,将正确地址进补入所述历史订单库;
如果在标准地址库有和买家提供的地址二匹配度大于匹配度预设值的地址,则记为待选地址,将所述的待选地址与历史订单库进行对比,优先选择存在于历史订单库的待选地址,并且优先选择匹配度高的待选地址,记为最优地址;
将最优地址返回给工作人员并进行配送;
派送完成后将派送结果补入历史订单库。进一步可选的,所述匹配度预设值为0.8。进一步可选的,所述匹配算法为Levenshtein Distance算法。本发明提供一种自动校验和修正全球地址的系统,包括:
本发明具有以下有益效果:
本发明根据地址相似度匹配算法找出匹配度高于0.8的地址信息,并通过在高匹配度的地址列表里找出最接近真实地址的推荐地址,从而达到将错误或缺失的买家地址修正和补全,从而大大降低因买家地址错误导致的退件;大大降低因买家地址错误导致的错误派送;提升派送效率,特别是对买家地址信息不够精准包裹。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
图1为本发明的自动校验和修正全球地址方法的流程图。
具体实施方式
下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例一:
一种自动校验和修正全球地址的方法:
参阅图1:
本发明根据地址相似度匹配算法找出匹配度高于0.8的地址信息,并通过机器学习在高匹配度的地址列表里找出最接近真实地址的推荐地址,从而达到将错误或缺失的买家地址修正和补全,主要思路如下:
S1.通过抓取或API对接的方式,获取全球国家、城市、州、邮编和街道信息作为地址的基础信息,记为地址一,并建立标准地址库;记录所有正确订单的收货地址,建立历史订单库;
S2.获取买家收件地址信息,记为地址二;
S3.根据上述的标准地址库检验该地址二是否正确,如果正确则直接返回地址给工作人员并进行配送;
S4.如果上述地址二不正确,则将所述的地址二和地址一进行对比,根据匹配算法找出在标准地址库里是否有和买家提供的地址二匹配度大于0.8的地址;
S5.如果在标准地址库没有和买家提供的地址二匹配度大于0.8的地址,则修正失败,将结果返还给工作人员,人工进行地址修正后,将正确地址进补入所述历史订单库;
S6.如果在标准地址库有和买家提供的地址二匹配度大于0.8的地址,则记为待选地址,将所述的待选地址与历史订单库进行对比,优先选择存在于历史订单库的待选地址,并且优先选择匹配度高的待选地址,记为最优地址;
S7.将最优地址返回给工作人员并进行配送;
S8.派送完成后将派送结果补入历史订单库,作为下次推荐的计算因子,以持续优化和改进推荐,提升推荐成功率。
在此,所述的匹配算法优选为Levenshtein Distance算法;
为方便理解,该算法简述如下:
首先将对比的字符串写进下表,这里以ABC和ABD为例;
ABC A B C
ABD 0 1 2 3
A 1 a处 d处 g处
B 2 b处 e处 h处
D 3 c处 f处 i处
表格中每一处的值取决于它左边的格子、上边的格子和左上角的格子。
左边数字加一;上边数字加一;如果这一格对应的行和列字母不同的话,左上角的数字加一,否则加零;取这三个数中的最小值,记为操作数。
例如:a处:上面的值和左面的值都要求加1,这样得到1+1=2;由于是两个a相同,左上角的值加0. 这样得到0+0=0。则取他们里面最小的0。
b处:左边计算后为3;上边计算后为1;由于对应的字符为a、b,不相等,所以左上角应该在当前值的基础上加1,这样得到1+1=2;在(3,1,2)中选出最小的为b处的值,为1。
综上,最终可得到操作数的表格如下:
ABC A B C
ABD 0 1 2 3
A 1 0(a处) 1(d处) 2(g处)
B 2 1(b处) 0(e处) 1(h处)
D 3 2(c处) 1(f处) 1(i处)
则意味着:
a处: 表示a和a需要有0个操作。字符串一样
b处: 表示ab和a需要有1个操作。
c处: 表示abe和a需要有2个操作。
d处: 表示a和ab需要有1个操作。
e处: 表示ab和ab需要有0个操作。字符串一样
f处: 表示abe和ab需要有1个操作。
g处: 表示a和abc需要有2个操作。
h处: 表示ab和abc需要有1个操作。
i处: 表示abe和abc需要有1个操作。
计算相似度:
记上面的操作数为M,字符串最大长度为N,则相似度=1-(M/N)
例如:
abc 和abe 操作数为1,字符串最大长度为3,所以相似度为1-1/3=0.666。
用于实现本发明进行信息控制的程序,可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、python、C++,还包括常规的过程式程序设计语言—诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
在本发明所提供的实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
另外,在本发明实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例方法的部分步骤。
而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (3)

1.一种自动校验和修正全球地址的方法,其特征在于,所述方法包括:
通过抓取或API对接的方式,获取全球国家、城市、州、邮编和街道信息作为地址的基础信息,记为地址一,并建立标准地址库;
记录所有正确订单的收货地址,建立历史订单库;
获取买家收件地址信息,记为地址二;
根据上述的标准地址库检验该地址二是否正确,如果正确则直接返回地址给工作人员并进行配送;
如果上述地址二不正确,则将所述的地址二和地址一进行对比,根据匹配算法找出在标准地址库里是否有和买家提供的地址二匹配度大于匹配度预设值的地址;
如果在标准地址库没有和买家提供的地址二匹配度大于匹配度预设值的地址,则修正失败,将结果返还给工作人员,人工进行地址修正后,将正确地址进补入所述历史订单库;
如果在标准地址库有和买家提供的地址二匹配度大于匹配度预设值的地址,则记为待选地址,将所述的待选地址与历史订单库进行对比,优先选择存在于历史订单库的待选地址,并且优先选择匹配度高的待选地址,记为最优地址;
将最优地址返回给工作人员并进行配送;
派送完成后将派送结果补入历史订单库。
2.根据权利要求1所述的一种自动校验和修正全球地址的方法,其特征在于,所述匹配度预设值为0.8。
3.根据权利要求1所述的一种自动校验和修正全球地址的方法,其特征在于,所述匹配算法为Levenshtein Distance算法。
CN202011249616.4A 2020-11-11 2020-11-11 一种自动校验和修正全球地址的方法 Expired - Fee Related CN112101878B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011249616.4A CN112101878B (zh) 2020-11-11 2020-11-11 一种自动校验和修正全球地址的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011249616.4A CN112101878B (zh) 2020-11-11 2020-11-11 一种自动校验和修正全球地址的方法

Publications (2)

Publication Number Publication Date
CN112101878A true CN112101878A (zh) 2020-12-18
CN112101878B CN112101878B (zh) 2021-02-19

Family

ID=73785076

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011249616.4A Expired - Fee Related CN112101878B (zh) 2020-11-11 2020-11-11 一种自动校验和修正全球地址的方法

Country Status (1)

Country Link
CN (1) CN112101878B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984716A (zh) * 2014-05-08 2014-08-13 深圳市天维尔通讯技术有限公司 基于地理信息空间地址精确定位的方法及系统
CN103984735A (zh) * 2014-05-21 2014-08-13 北京京东尚科信息技术有限公司 一种用于生成推荐配送地点名称的方法和装置
US20180225627A1 (en) * 2017-02-07 2018-08-09 Alibaba Group Holding Limited Express package delivery
CN110377675A (zh) * 2019-06-17 2019-10-25 中国平安人寿保险股份有限公司 地址校验方法、装置、计算机设备及存储介质
CN111291099A (zh) * 2020-05-13 2020-06-16 中邮消费金融有限公司 一种地址模糊匹配方法、系统及计算机设备
CN111368697A (zh) * 2020-02-28 2020-07-03 中国建设银行股份有限公司 一种信息识别方法和装置
CN111523433A (zh) * 2020-04-17 2020-08-11 上海中通吉网络技术有限公司 快件末端地址的标准化处理方法、装置和设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103984716A (zh) * 2014-05-08 2014-08-13 深圳市天维尔通讯技术有限公司 基于地理信息空间地址精确定位的方法及系统
CN103984735A (zh) * 2014-05-21 2014-08-13 北京京东尚科信息技术有限公司 一种用于生成推荐配送地点名称的方法和装置
US20180225627A1 (en) * 2017-02-07 2018-08-09 Alibaba Group Holding Limited Express package delivery
CN110377675A (zh) * 2019-06-17 2019-10-25 中国平安人寿保险股份有限公司 地址校验方法、装置、计算机设备及存储介质
CN111368697A (zh) * 2020-02-28 2020-07-03 中国建设银行股份有限公司 一种信息识别方法和装置
CN111523433A (zh) * 2020-04-17 2020-08-11 上海中通吉网络技术有限公司 快件末端地址的标准化处理方法、装置和设备
CN111291099A (zh) * 2020-05-13 2020-06-16 中邮消费金融有限公司 一种地址模糊匹配方法、系统及计算机设备

Also Published As

Publication number Publication date
CN112101878B (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
US11816571B2 (en) Named entity recognition with convolutional networks
US20230021040A1 (en) Methods and systems for automated table detection within documents
US5305396A (en) Data processing system and method for selecting customized character recognition processes and coded data repair processes for scanned images of document forms
CN110895651A (zh) 地址标准化处理方法、装置、设备及计算机可读存储介质
CN112580637B (zh) 文本信息识别方法、提取方法、装置及系统
CN112418812A (zh) 分布式全链路自动化智能通关系统、方法及存储介质
CN112581252A (zh) 融合多维相似度与规则集合的地址模糊匹配方法及系统
CN111724114A (zh) 一种基于大数据的电商商品分配物流智能管理系统
CN112101878B (zh) 一种自动校验和修正全球地址的方法
CN111915256A (zh) 构建派件围栏的方法、异地签收识别方法及相关设备
CN111784238A (zh) 电子围栏分单方法、装置、终端设备及存储介质
CN112015916A (zh) 知识图谱的补全方法、装置、服务器和计算机存储介质
CN112395874A (zh) 订单信息的校正方法、装置、设备及存储介质
CN117523590B (zh) 一种校验生产厂商名称的方法、装置、设备及存储介质
CN111639905A (zh) 企业业务流程管控系统、方法、电子设备及存储介质
CN117523570B (zh) 一种药品标题的修正方法、装置、设备及存储介质
CN117115839B (zh) 一种基于自循环神经网络的发票字段识别方法和装置
CN110619010A (zh) 一种推销信息处理装置、相关方法及相关装置
CN114844956B (zh) 报文校验的方法、装置、存储介质和电子设备
CN117456532B (zh) 一种药品金额的校正方法、装置、设备及存储介质
CN115330497A (zh) 数据处理方法、系统及计算机可读存储介质
CN114723353A (zh) 地址信息提取方法、装置、计算机设备和存储介质
CN117609500A (zh) 一种数据的校准方法、系统及介质
US20190220931A1 (en) System and method for generating a reissue probability score for a transaction evidence
CN116957444A (zh) 一种基于签收单的物流管理方法、装置、介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20210219

Termination date: 20211111

CF01 Termination of patent right due to non-payment of annual fee