CN109255565B - 地址的归属识别和物流任务的分发方法及其装置 - Google Patents

地址的归属识别和物流任务的分发方法及其装置 Download PDF

Info

Publication number
CN109255565B
CN109255565B CN201710576484.8A CN201710576484A CN109255565B CN 109255565 B CN109255565 B CN 109255565B CN 201710576484 A CN201710576484 A CN 201710576484A CN 109255565 B CN109255565 B CN 109255565B
Authority
CN
China
Prior art keywords
address
sub
addresses
logistics
target area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710576484.8A
Other languages
English (en)
Other versions
CN109255565A (zh
Inventor
康岳群
吴黎霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Cainiao Smart Logistics Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cainiao Smart Logistics Holding Ltd filed Critical Cainiao Smart Logistics Holding Ltd
Priority to CN201710576484.8A priority Critical patent/CN109255565B/zh
Publication of CN109255565A publication Critical patent/CN109255565A/zh
Application granted granted Critical
Publication of CN109255565B publication Critical patent/CN109255565B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请实施例提供了一种地址的归属识别方法与装置,所述方法包括将物流任务的收件地址拆分为对应不同地域级别的多个子地址,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域,实现了基于大量样本学习出的多分类器对收件地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了收件地址的归属识别的准确性。

Description

地址的归属识别和物流任务的分发方法及其装置
技术领域
本申请涉及网络技术领域,具体涉及一种地址的归属识别方法与装置,一种物流任务的分发方法与装置,一种物流系统。
背景技术
随着电商行业和物流行业的快速发展,大学生的网购行为激增,广大校园用户成为网购的主力,为了解决快递包裹的收发问题,物流公司以校园驿站门店的形式为校园用户提供包裹收件和寄件等综合物流服务。
校园驿站经常出现大量包裹的堆积,为缓解此问题和提升校园师生的用户体验,校园众包服务平台应运而生,让校园用户在闲时顺路多取几个包裹,并且将快递送到其他校园用户手中,不仅充分挖掘学生群体的闲置精力,还能大大提高校园驿站的运营效率。通常来说,对于送货人只需浏览本人所在学校的订单,对于委托人来说,派送任务的正确发放能提高物流时效,减少等待时间,所以物流任务的分发的准确性变得尤为重要。
目前业界主流的判断收件地址归属的校园的方式有两种,一种是通过GeoHash算法进行经纬度匹配,另一种是通过收件地址与校园名称进行文本匹配。
申请人经研究发现,首先,GeoHash编码是根据经纬度范围划分成一个一个的矩形区域,对每一个矩形区域进行编码,但是大部分校园的地址围栏都是不规则的形状,如果强行用矩形对校园进行分块,势必会造成校园周边区域识别的不准确性,导致部分收件地址无法准确识别。其次,校园名称文本匹配也仅仅利用了收件地址中校园这一个维度的信息,如果收件地址填写不规范,收件地址中的校园名称是简称或昵称,将直接降低校园文本匹配的准确率。基于以上原因,由于无法为收件地址准确匹配校园,导致物流任务的分发也无法做到准确。
发明内容
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种物流任务的分发方法和相应的一种物流任务的分发装置。
依据本申请的一个方面,提供了一种地址的归属识别方法,包括:
获取多个地址样本以及对应标记的区域;
将地址样本拆分为对应不同地域级别的多个子地址;
根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域。
依据本申请的另一个方面,提供了一种物流任务的分发方法,包括:
将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
将所述物流任务分发至所述区域对应的物流系统,以由所述物流系统执行所述物流任务。
可选地,所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址包括:
对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
可选地,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
可选地,在所述采用匹配数据集合基于所述多个子地址进行匹配之前,所述方法还包括:
创建基于子地址确定区域的匹配数据集合。
可选地,所述创建基于子地址确定区域的匹配数据集合包括:
获取多个地址样本以及对应标记的区域;
将地址样本拆分为对应不同地域级别的多个子地址;
根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
可选地,所述方法在分布式服务集群上执行,在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,所述方法还包括:
查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
按照查找的子地址对所述地址样本进行分类;
将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
可选地,在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,所述方法还包括:
获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
可选地,单个服务器用于创建一个或多个子地址对应的匹配数据集合,当用于创建多个子地址对应的匹配数据集合时,所述方法还包括:
针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
可选地,在所述按照查找的子地址对所述地址样本进行分类之后,所述方法还包括:
将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
可选地,所述方法还包括:
调用地图系统将所述收件地址转换为地图上对应的坐标点;
识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
可选地,所述识别所述坐标点超出目标区域的边界线包括:
确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
可选地,所述方法还包括:
根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
可选地,所述根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正包括:
提取物流任务的收件方标识;
从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
采用获取的目标区域对匹配的目标区域进行修正。
可选地,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域包括:
从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
依据本申请的另一个方面,提供了一种地址的归属识别装置,包括:
样本获取模块,用于获取多个地址样本以及对应标记的区域;
子地址拆分模块,用于将地址样本拆分为对应不同地域级别的多个子地址;
匹配数据集合创建模块,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
区域匹配模块,用于采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域。
依据本申请的另一个方面,提供了一种物流任务的分发装置,包括:
子地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
区域匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
物流任务分发模块,用于将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务。
在本申请实施例中,优选地,所述子地址拆分模块包括:
分词子模块,用于对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
子地址组合模块,用于按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
在本申请实施例中,优选地,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
在本申请实施例中,优选地,所述装置还包括:
集合创建模块,用于在所述采用匹配数据集合基于所述多个子地址进行匹配之前,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,优选地,所述集合创建模块包括:
区域获取子模块,用于获取多个地址样本以及对应标记的区域;
子地址拆分子模块,用于将地址样本拆分为对应不同地域级别的多个子地址;
集合创建子模块,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,优选地,所述装置在分布式服务集群上执行,所述装置还包括:
子地址查找模块,用于在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
样本分类模块,用于按照查找的子地址对所述地址样本进行分类;
服务器分发模块,用于将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
在本申请实施例中,优选地,所述装置还包括:
集合合并模块,用于在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
在本申请实施例中,优选地,单个服务器用于创建一个或多个子地址对应的匹配数据集合,所述装置还包括:
任务启用模块,用于当用于创建多个子地址对应的匹配数据集合时,针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
在本申请实施例中,优选地,所述装置还包括:
样本聚合排序模块,用于在所述按照查找的子地址对所述地址样本进行分类之后,将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
在本申请实施例中,优选地,所述装置还包括:
坐标点转换模块,用于调用地图系统将所述收件地址转换为地图上对应的坐标点;
边界线识别模块,用于识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
在本申请实施例中,优选地,所述边界线识别模块包括:
交点个数确定子模块,用于确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
在本申请实施例中,优选地,所述装置还包括:
区域修正模块,用于根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
在本申请实施例中,优选地,所述区域修正模块包括:
标识提取子模块,用于提取物流任务的收件方标识;
区域获取子模块,用于从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
区域修正子模块,用于采用获取的目标区域对匹配的目标区域进行修正。
在本申请实施例中,优选地,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述区域获取子模块包括:
第一区域查找子单元,用于从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,第二区域查找子单元,用于从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
依据本申请的另一个方面,提供了一种物流系统,包括
物流任务提交客户端、物流任务分发系统以及针对不同区域的物流系统;
所述物流任务分发系统包括:
任务接收模块,用于接收物流任务提交客户端提交的物流任务;
地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
地址匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,得到所述收件地址在划分的多个区域中归属的目标区域;
任务分发模块,用于将所述物流任务分发至所述物流系统;
所述物流系统,用于执行所述物流任务。
依据本申请的另一个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如上述一个或多个的方法。
依据本申请的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述一个或多个的方法。
依据本申请实施例,通过将物流任务的收件地址拆分为对应不同地域级别的多个子地址,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域,实现了基于大量样本学习出的多分类器对收件地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了收件地址的归属识别的准确性。
进一步,通过将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务,由于基于子地址识别收件地址的归属的准确性,提高了物流任务分发的准确性。
进一步,通过将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合,使得任务被分解后,可以通过大量机器进行并行计算,减少整个操作的时间。
进一步,通过将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序,排序后样本可以减小创建匹配数据集合的服务器运算的压力。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本申请实施例一的一种地址的归属识别方法实施例的流程图;
图2示出了根据本申请实施例二的一种物流任务的分发方法实施例的流程图;
图3示出了根据本申请实施例三的一种物流任务的分发方法实施例的流程图;
图4示出了本申请实施例的一个示例中收件地址归属校区匹配的过程示意图;
图5示出了本申请实施例的一个示例中收件地址特征抽取方式的示意图;
图6示出了本申请实施例的一个示例中分布式学习收件地址归属的匹配模型的过程示意图;
图7示出了本申请实施例的一个示例中根据经纬度与校园地址围栏的关系判断收件地址归属的过程示意图;
图8所示为一个校园地址围栏内部的部分地址的经纬度坐标点的示意图;
图9示出了根据本申请实施例四的一种地址的归属识别装置实施例的结构框图;
图10示出了根据本申请实施例五的一种物流任务的分发装置实施例的结构框图;
图11示出了根据本申请实施例六的一种物流系统的结构框图;
图12示出了可被用于实现本公开中所述的各个实施例的示例性系统。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例可以应用在物流任务的分发过程中,是对传统的识别收件地址归属区域的方法以及物流任务的分发方法的改进。物流任务包括将包裹、信件等物件从一处派送往另一处的任务,具体至少需要收件地址等信息来完成派送,在一些诸如学校等区域,为了解决物件的收发问题,可以以校园驿站门店的形式为校园用户提供收件和寄件等综合物流服务,也可以以校园众包平台的形式为校园用户提供代送等物流服务。因此需要正确识别物流任务的收件地址归属的校园,然后对物流任务进行分发。
本申请实施例中,物流系统是指提供物件收件和寄件等物流服务的计算机网络平台,可以管理、记录线下的物流任务。物流系统可以针对不同区域进行服务,具体针对同一种类型的区域可以是一个可以分区域管理的物流系统,也可以是针对同一种类型的多个区域对应多个物流系统,只有物流任务的收件方或寄件方所在区域属于区域,物流任务才会被分发到区域专用的物流系统其中,区域可以包括校园、工业园、软件园、居民社区、商业写字楼等区域类型。例如,校园驿站门店可以为校园内的用户提供包裹收件和寄件等物流服务,管理校园驿站的物流派送系统就是校园这种区域专用的。
本申请实施例中,为了让机器学习出识别收件地址的归属区域的能力,需要收集大量归属区域的地址样本,具体包括区域中完成派送的部分或全部地址。在区域中完成派送时,还可以为地址样本标记对应的区域,其中,区域可以预先划定的,具体可以是因各种原因分群体聚集的区域,例如某校园、某工业园、某软件园、某居民社区、某商业写字楼等。
本申请实施例中,为了有效地利用地址样本的所有信息,可以将地址样本拆分成对应不同地域级别的多个子地址,其中,子地址可以是对地址样本按照最细的粒度进行分词,得到对应不同地域级别的多个子地址,也可以是对地址样本按照最细的粒度进行分词,然后将最细粒度的地址分词选取其中至少一个进行重新组合,得到的子地址中包含有不同的地域级别。
参照图1,示出了根据本申请实施例一的一种地址的归属识别方法实施例的流程图,该方法具体可以包括以下步骤:
步骤101,获取多个地址样本以及对应标记的区域。
在本申请实施例中,地址样本可以从收件地址中获取,具体可以选取全部收件地址作为地址样本,也可以选取部分收件地址作为地址样本。收件地址可以包括物流系统或第三方系统中历史记录的地址信息,地址样本可以取自任意适用的系统,本申请实施例对此不做限制。
例如,物流系统中保存有历史完成的物流任务,具体可以包括对应的收件地址,还可以标记派送成功的收件地址对应的区域。从物流系统,获取多个地址样本以及对应标记的区域,其对应的收件地址都是归属区域的地址。例如,从各个校园专用的校园驿站物流系统中,获取所有的地址样本以及对应标记的校园名称。
步骤102,将地址样本拆分为对应不同地域级别的多个子地址。
在本申请实施例中,地址样本可以是多种形式的,地址文本可以是一整句话,例如,北京市海淀区双清路30号清华大学某某楼302室,地址文本也可以是分为多条记录的,例如,北京市、海淀区、双清路30号清华大学某某楼302室。
具体实现时,可以将每一个地址样本的地址文本进行分词,拆分得到对应不同地域级别的多个子地址,例如可以按照最细的粒度进行分词,得到的子地址可以包括省级行政区、地级行政区、县级行政区、街道、主路等等。也可以在按照最细的粒度进行分词后,再选取其中至少一种地域级别的地址分词进行重新组合,得到多种组合的子地址。具体可以采用任意拆分方式对地址样本进行拆分,本申请实施例对此不做限制。将地址分词组合后得到的子地址具有更强的指向性,可以提高模型的鲁棒性和泛化能力,使得匹配的准确率更高。
例如,以安徽省铜陵市为例子,假设该地区有A、B、C三个校园,子地址表示如下:feature1=铜陵市_铜官山区虚镇_新苑四期,feature2=铜陵市_铜官山区虚镇_新苑四期_5栋,feature3=铜陵市_铜官山区_新苑四期,……,featuren=狮子山区_铜陵市经济开发区_万泰_翡翠城,其中n表示这个地区所有的子地址的数目。每一个地址样本用xi表示,为一个n维向量,包含该子地址向量相应值置1,不包含该子地址向量相应值置0,比如收件地址“安徽省铜陵市铜官山区铜官山区虚镇新苑四期5栋”,首先对该地址进行分词得到铜陵市_铜官山区虚镇_新苑四期,铜陵市_铜官山区虚镇_新苑四期_5栋,……,铜陵市_铜官山区_新苑四期,该地址的子地址向量包含feature1,feature2,feature3,则该地址样本向量形式表示为xi=[1,1,1,0,0,0……0]。
步骤103,根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,匹配数据集合为可以匹配除地址样本外其他地址的归属的区域的数据集合,具体为根据子地址确定区域的匹配数据集合。
根据多个地址样本的多个子地址与对应标记的区域,计算地址归属各区域在各子地址出现时的概率,并将结果记录,生成根据子地址确定地址归属的区域的多分类器,也就是创建基于子地址确定区域的匹配数据集合。通过学习得到的匹配数据集合,可以对其他地址做同样的拆分,然后就可以根据拆分得到的子地址对地址归属的区域进行匹配。具体可以采用任意适用的方式创建匹配数据集合,本申请实施例对此不作限制。
例如,W=[w1,w2,w3]是一个n*3维的权值向量,wi(j)表示的是第i个子地址相对于第j个校园的权重,以上面步骤102的地址样本xi=[1,1,1,0,0,0……0]为例,当模型使用逻辑回归时,匹配结果为校园A,B,C的概率分别为:
Figure BDA0001351085360000121
Figure BDA0001351085360000122
Figure BDA0001351085360000123
匹配数据集合的模型优化目标如下所示:
Figure BDA0001351085360000131
其中,W是子地址的权重,xi是子地址,yi代表是哪个校园。(1)当损失函数为指数函数,该模型为逻辑回归:
Figure BDA0001351085360000132
(2)当损失函数为门函数,该模型为支持向量机:
Figure BDA0001351085360000133
其中,第一部分
Figure BDA0001351085360000134
是模型的正则化项,防止模型过拟合,第二部分为模型拟合训练数据的误差惩罚项,针对分类错误的样本进行惩罚,C是正则化系数,用来平衡模型的复杂程度与训练数据的偏差。
由于逻辑回归可以很好的从概率学模型进行解释,优化目标可以解释为让所有的地址样本识别出正确校园的概率最大化,因此本发明选用逻辑回归作为分类模型,具体可以采用LibLinear工具根据选中的优化目标采用牛顿法进行优化求解,解出最优的权值向量W,最优解也就是匹配数据集合。在机器学习中,LibLinear是一个简单的求解大规模规则化线性分类和回归的软件包,而且LibLinear是支持多分类的。
步骤104,采用匹配数据集合对目标地址进行匹配,得到目标地址在划分的多个区域中归属的目标区域。
在本申请实施例中,采用匹配数据集合对目标地址进行匹配,就可以得到目标地址在划分的多个区域中归属的目标区域。具体可以将目标地址进行与步骤102相同的拆分,得到多个子地址。匹配数据集合中记录有各子地址归属各区域的概率,根据目标地址拆分得到的多个子地址对应的概率,可以计算得到目标地址归属各区域的概率,其中概率最大的区域可以作为目标区域。具体可以采用任意适用的方式对目标地址归属各区域的概率进行计算,本申请实施例对此不做限制。
例如,针对安徽省铜陵市的收件地址xnew=[0,0,1,0,1,1……0],使用安徽省铜陵市的模型计算该样本归属于A,B,C三个校园的概率:
Figure BDA0001351085360000141
Figure BDA0001351085360000142
Figure BDA0001351085360000143
当匹配概率大于设定的阈值时,则确定为该校园。
依据本申请实施例,通过获取多个地址样本以及对应标记的区域,将地址样本拆分为对应不同地域级别的多个子地址,根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合,使得本申请方案可以由大量样本数据,得到地址样本的文本特征,通过机器学习,实现了识别收件地址归属的多分类器。
进一步,采用匹配数据集合对目标地址进行匹配,得到目标地址在划分的多个区域中归属的目标区域。基于多分类器对目标地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了地址的归属识别的准确性。
参照图2,示出了根据本申请实施例二的一种物流任务的分发方法实施例的流程图,该方法具体可以包括以下步骤:
步骤201,将物流任务的收件地址拆分为对应不同地域级别的多个子地址。
在本申请实施例中,对于待分发的物流任务,将物流任务的收件地址的地址文本进行分词,拆分得到对应不同地域级别的多个子地址,例如可以按照最细的粒度进行分词,得到的子地址可以包括省级行政区、地级行政区、县级行政区、街道、主路等等。也可以在按照最细的粒度进行分词后,再选取其中至少一种地域级别进行重新组合,得到多种组合的子地址。具体可以采用任意拆分方式对收件地址进行拆分,本申请实施例对此不做限制。对物流任务的收件地址进行拆分的方式应与生成匹配数据集合时拆分地址样本的方式一致。
在本申请的一种优选实施例中,所述步骤201中所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址可以包括:
子步骤S1,对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
子步骤S2,按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
在本申请实施例中,对物流任务的收件地址的地址文本进行分词,具体可以按照最细粒度进行分词,也可以按照填写地址时划分的多个地址字段进行分词,得到多个对应不同地域级别的地址分词,具体可以采用任意适用的方式进行分词,本申请实施例对此不作限制。按照设定规则对地址分词进行组合,例如可以随机在多个地址分词中选取设定个数的地址分词进行组合得到子地址,也可以按照设定的组合方式从多个地址分词中选取设定的地址分词组合成各个子地址。组合得到的各个子地址中包含有不同的地域级别。
步骤202,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域。
在本申请实施例中,采用匹配数据集合基于所述多个子地址进行匹配的具体实现方式,可以参见前述实施例的描述,不另赘述。
在本申请的一种优选实施例中,所述方法还包括:
子步骤S3,调用地图系统将所述收件地址转换为地图上对应的坐标点;
子步骤S4,识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
在本申请实施例中,地图系统为提供地理位置信息的系统,具体可以将地址信息对应到地图上的坐标点,调用地图系统将收件地址转换为地图上对应的坐标点。然后通过比较收件地址对应的坐标点与目标区域的边界线,如果识别出坐标点在目标区域的边界线外,则查找坐标点所在的目标区域相邻的区域,例如坐标点位于清华大学校外,为相邻的非校园城市区域,则将目标区域修正为校园外城区。
在本申请的一种优选实施例中,所述子步骤S4中所述识别所述坐标点超出目标区域的边界线可以包括:
子步骤S41,确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
在本申请实施例中,从坐标点出发引一条射线,看这条射线和目标区域的边界线的交点数目。如果有奇数个交点,则说明在内部,如果有偶数个交点,则说明在外部。
在本申请的一种选优实施例中,还可以包括:
子步骤S5,根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
在本申请实施例中,物件自取系统是指将物件分发到收件地址附近的自取点通知收件人自取物件的物流系统,例如校园驿站系统就是一种物件自取系统,系统中可以记录完成收件的物流任务对应标记的目标区域。目标区域的物流系统中也可以为完成收件的物流任务对应标记目标区域。根据物流系统或物件自取系统的历史数据,查找到收件地址对应标记的目标区域,对确定的目标区域修正为查找到的收件地址对应的目标区域。
具体实现时,添加历史数据中在校园驿站有过取件、寄件记录的用户的收件地址的归属区域,和在校园众包平台有过委托、抢单记录的用户的收件地址的归属区域,能够对收件地址的校园或非校园匹配不准的情况进行修正,提高物流任务的分发的准确性。
在本申请的一种优选的实施例中,所述子步骤S5中所述根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正可以包括:
子步骤S51,提取物流任务的收件方标识;
子步骤S52,从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
子步骤S53采用获取的目标区域对匹配的目标区域进行修正。
具体实现时,收件方标识是指收件人的名字、昵称、编码等标识,提取物流任务的收件方标识,从目标区域的物流系统或者物件自取系统获取收件方标识的收件方的收件地址归属的目标区域,采用获取的目标区域对匹配的目标区域进行修正。例如根据收件人标识查找到对应标记的收件地址归属的校园是北京大学,但为收件地址匹配得到归属的校园是清华大学,则将收件地址归属的校园修正为北京大学。
在本申请的一种优选实施例中,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述子步骤S52中所述从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域可以包括:
子步骤S521,从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,子步骤S522,从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
在本申请实施例中,寄件事件是指将物件寄送出去的事件,物件派送事件是指对物件进行派送的事件,派送任务抢单事件是指选择派送任务并接收的事件,取件事件是指从存储点取走物件的事件。具体而言,物流系统如校园众包平台中,记录有寄件事件、物件派送事件和派送任务抢单事件的收件方对应标记了其收件地址归属的校园,从中查找物流任务的收件方标识以及对应标识的归属校园。或者物件自取系统如校园驿站系统中,记录有取件事件的收件方对应标记了其收件地址归属的校园,从中查找物流任务的收件方标识以及对应标识的归属校园。
步骤203,将所述物流任务分发至所述区域对应的物流系统,以由所述物流系统执行所述物流任务。
在本申请实施例中,匹配到收件地址归属的目标区域后,可以根据目标区域,查找到对应配置的物流系统,例如,匹配到收件地址归属的清华大学校园,确定针对清华大学校园配置的校园众包平台,其中校园众包平台可以为一所大学配置,也可以为多所大学配置。
在本申请的一种优选实施例中,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
物流系统可以向区域内的群体提供针对物流任务的派送征集服务,派送征集服务是指征集人员来完成派送任务的服务,例如校园众包平台就是一种物流系统,可以征集校园内的人员代替校园内的其他收件人领取物件并送到收件人处。
在本申请实施例中,将物流任务分发到目标区域配置的物流系统,以由该物流系统执行所述物流任务,进行物件的派送。
依据本申请实施例,通过将物流任务的收件地址拆分为对应不同地域级别的多个子地址,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域,实现了基于大量样本学习出的多分类器对收件地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了收件地址的归属识别的准确性。
进一步,将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务,由于基于子地址识别收件地址的归属的准确性,提高了物流任务分发的准确性。
参照图3,示出了根据本申请实施例三的一种物流任务的分发方法实施例的流程图,该方法具体可以包括以下步骤:
步骤301,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,在采用匹配数据集合基于所述多个子地址进行匹配之前,需要先创建基于子地址确定区域的匹配数据集合,具体创建匹配数据集合的方式可以参见前述实施例的描述,此处不另赘述。
在本申请的一种优选实施例中,所述步骤301中所述创建基于子地址确定区域的匹配数据集合可以包括:
子步骤S6,获取多个地址样本以及对应标记的区域;
子步骤S7,将地址样本拆分为对应不同地域级别的多个子地址;
子步骤S8,根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,物流系统中保存有历史完成物流任务,具体可以包括对应的收件地址,还可以标记派送成功的收件地址对应的区域。从物流系统,获取多个地址样本以及对应标记的区域,其对应的收件地址都是归属区域的地址。例如,从各个校园专用的校园驿站物流系统中,获取所有的地址样本以及对应标记的校园名称。
在本申请实施例中,对于待分发的物流任务,将物流任务的收件地址的地址文本进行分词,拆分得到对应不同地域级别的多个子地址,例如可以按照最细的粒度进行分词,得到的子地址可以包括省级行政区、地级行政区、县级行政区、街道、主路等等。也可以在按照最细的粒度进行分词后,再选取其中至少一种地域级别进行重新组合,得到多种组合的子地址。具体可以采用任意拆分方式对收件地址进行拆分,本申请实施例对此不做限制。
在本申请实施例中,匹配数据集合为可以匹配除地址样本外其他收件地址的归属的区域的数据集合,具体为根据子地址确定区域的匹配数据集合。
根据多个地址样本的多个子地址与对应标记的区域,计算收件地址归属各区域在各子地址出现时的概率,并将结果记录,生成根据子地址匹配收件地址归属的区域的多分类器,也就是创建基于子地址确定区域的匹配数据集合。通过学习得到的匹配数据集合,可以对其他物流任务的收件地址做同样的拆分,然后就可以根据拆分得到的子地址对收件地址归属的区域进行匹配。具体可以采用任意适用的方式创建匹配数据集合,本申请实施例对此不作限制。具体实现方式可以参见前述实施例描述,不另赘述。
在本申请的一种优选实施例中,还可以包括:采用所述匹配数据集合对所述多个地址样本进行匹配;若有超过设定百分比的匹配的区域与针对地址样本对应标记的区域不一致,则切换拆分地址样本的规则,重新创建匹配数据集合。
具体实现时,一种按照设定规则对地址分词进行组合得到多个子地址后,根据多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合,然后选取多个地址样本,采用匹配数据集合对匹配数据集合的收件地址进行匹配,如果匹配的正确率达到设定的标准就可以采用这种组合方式,如果匹配的正确率未达到设定的标准,就切换另一种拆分地址样本的规则,重新生成新的一种组合,根据新得到的收货子地址创建新的匹配数据集合,再重复这个过程,直到匹配的正确率达到设定的标准。
在本申请的一种优选实施例中,所述方法可以在分布式服务集群上执行,在所述子步骤S8中所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,还可以包括:
子步骤S9,查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
子步骤S10,按照查找的子地址对所述地址样本进行分类;
子步骤S11,将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
在本申请实施例中,针对地址样本对应标记的区域,查找区域在设定地域级别下的子地址,例如省或自治区一级,地级市一级等。按照查找的子地址对地址样本进行分类,将设定地域级别下的同一子地址的多个地址样本分为一类,然后将同一类的多个地址样本分发至针对所述子地址配置的服务器,每个服务器分别用于创建子地址对应的匹配数据集合。
具体实现时,可以采用MapReduce分布式编程模型,MapReduce是一种计算模型,简单的说就是将大批量的工作或者数据分解执行,然后再将结果合并成最终结果。这样做的好处是可以在任务被分解后,可以通过大量机器进行并行计算,减少整个操作的时间。总的来说,Mapreduce的原理就是一个归并排序。例如,将所有的样本分开放在不同的服务器上,由所有服务器共同对他们按照设定地域级别的子地址进行分类,再将每一个地级行政区的所有样本分别放在不同服务器上在Reduce阶段学习出一个匹配数据集合。通过大规模分布式机器学习模型,针对每一个地级行政区训练得到一个多分类模型,不仅能解决由于地址中采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错行政区的情况都能学习出相应的权重,该模型相对于校区名称匹配更具有泛化能力,鲁棒性更强。
在本申请的一种优选实施例中,在所述所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,还可以包括:
子步骤S12,获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
在本申请实施例中,获取各个服务器针对各子地址对应的匹配数据集合,然后将各匹配数据集合合并得到一个针对完整的匹配数据集合。
在本申请的一种优选实施例中,单个服务器用于创建一个或多个子地址对应的匹配数据集合,当用于创建多个子地址对应的匹配数据集合时,还可以包括:针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
在本申请实施例中,在分布式服务器的单个服务器上,可以用于创建一个或多个子地址对应的匹配数据集合,当单个服务器用于创建多个子地址对应的匹配数据集合时,可以针对每个设定地域级别下的子地址分别启用一个任务,来创建对应的匹配数据集合。
在本申请的一种优选实施例中,在所述子步骤S10所述按照查找的子地址对所述地址样本进行分类之后,还可以包括:
子步骤S13,将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
在本申请实施例中,对于设定地域级别下同一子地址的多个地址样本,查找其每个地址样本对应标记的区域,然后按照对应的区域将地址样本聚合在一起,然后在每一分类中对聚合后的地址样本进行排序。例如将归属清华大学的地址样本放在一起,再将归属北京大学的地址样本放在一起,然后在海淀区这一分类中,按照清华大学、北京大学等区域的地址样本排序后,分发至针对所述子地址配置的服务器,排序后样本可以减小创建匹配数据集合的服务器运算的压力。
步骤302,将物流任务的收件地址拆分为对应不同地域级别的多个子地址。
在本申请实施例中,此步骤具体实现方式可以参见前述实施例描述,此处不另赘述。
步骤303,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域。
在本申请实施例中,此步骤具体实现方式可以参见前述实施例描述,此处不另赘述。
步骤304,将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务。
在本申请实施例中,此步骤具体实现方式可以参见前述实施例描述,此处不另赘述。
依据本申请实施例,通过创建基于子地址确定区域的匹配数据集合,将物流任务的收件地址拆分为对应不同地域级别的多个子地址,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域,,实现了基于大量样本学习出的多分类器对收件地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了收件地址的归属识别的准确性。
进一步,将物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务,由于基于子地址识别收件地址的归属的准确性,提高了物流任务分发的准确性。
为使本领域技术人员更好地理解本申请,以下通过具体的示例对本申请的一种物流任务的分发方法进行说明。
参见图4,示出了本申请实施例的一个示例中收件地址归属校区匹配的过程示意图。
步骤1,收集校园用户收件地址,收集所有校园用户的详细地址。
步骤2,进行结构化特征抽取,采用图5的特征抽取方式,先对收件地址进行最细粒度的分词,再将分词组合成各种结构化文本特征。如图5中,最细粒度的分词包括省级行政区、地级行政区、县级行政区、街道、主路等等,其中POI(Point Of Interest,兴趣点)为用户感兴趣的位置点,直观理解是对一个具体地理位置的称呼。比如“浙江大学玉泉校区”、“西溪印象城”等等。
步骤3,分布式LibLinear训练,采用MapReduce等分布式编程模型,将每一个地级行政区的所有样本训练出一个多分类模型,模型采用适合应用与大规模数据处理的LibLinear工具包。
步骤4,文本模型,学习出的多分类模型就是一个可以匹配收件地址归属的校园的文本模型。
步骤5,新的收货地址,针对新的派送任务输入新的收件地址。
步骤6,特征提取,按照步骤2中相同的方式抽取出新的收件地址的特征。
步骤7,模型匹配出校区,采用文本模型根据抽取的特征对收件地址的归属进行匹配,得到收件地址归属的校园。
参见图6,示出了本申请实施例的一个示例中分布式学习收件地址归属的匹配模型的过程示意图。
步骤1,对源数据切分,在各个服务器(Node1~N)上对所有校园用户收件地址的样本数据进行切分为多个数据分片。
步骤2,map读取分片,输出中间键值对,映射(map)模块读取数据分片,经过特征抽取得到收件地址的文本特征和对应校区标签的中间键值对。
步骤3,shuffle和sort中间结果,生成有序键值对,将每一个地级行政区的所有样本分别划分为一类,然后按照所有收件地址样本归属的校园对中间键值对进行排序,得到有序的键值对。
步骤4,reduce读入有序键值对,计算输出结果,归约(reduce)模块读入有序键值对,学习出可以匹配收件地址归属校园的分类器。
参见图7,示出了本申请实施例的一个示例中根据经纬度与校园地址围栏的关系判断收件地址归属的过程示意图。
步骤1,收件地址,收到物流任务的收件地址。
步骤2,GeoCoding(地址匹配)服务将收件地址转换为经纬度,通过GeoCoding服务得到收件地址的经纬度坐标。GeoCoding(地址匹配)服务是一种将详细地址的地理位置信息转换成可以被用于GIS(地理信息系统)经纬度坐标的服务。
步骤3,校园地址围栏数据,得到所有校园的地址围栏数据,具体包括校园在地图上的多边形的所有顶点的坐标。
步骤4,Pnpoly算法判断地址是否在地址围栏内部,从目标点出发引一条射线,看这条射线和校园地址围栏所有边的交点数目,如果有奇数个交点,则说明目标点归属于校园,如果有偶数个交点,则说明在校园外部。如图8所示为一个校园地址围栏内部的部分地址的经纬度坐标点的示意图。
参照图9,示出了根据本申请实施例四的一种地址的归属识别装置实施例的结构框图,具体可以包括:
样本获取模块401,用于获取多个地址样本以及对应标记的区域;
子地址拆分模块402,用于将地址样本拆分为对应不同地域级别的多个子地址;
匹配数据集合创建模块403,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
区域匹配模块404,用于采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域。
依据本申请实施例,通过获取多个地址样本以及对应标记的区域,将地址样本拆分为对应不同地域级别的多个子地址,根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合,使得本申请方案可以由大量样本数据,得到地址样本的文本特征,通过机器学习,实现了识别收件地址归属的多分类器。
进一步,采用匹配数据集合对目标地址进行匹配,得到目标地址在划分的多个区域中归属的目标区域。基于多分类器对目标地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了地址的归属识别的准确性。
参照图10,示出了根据本申请实施例五的一种物流任务的分发装置实施例的结构框图,具体可以包括:
子地址拆分模块501,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
区域匹配模块502,用于采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
物流任务分发模块503,用于将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务。
在本申请实施例中,优选地,所述子地址拆分模块包括:
分词子模块,用于对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
子地址组合模块,用于按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
在本申请实施例中,优选地,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
在本申请实施例中,优选地,所述装置还包括:
集合创建模块,用于在所述采用匹配数据集合基于所述多个子地址进行匹配之前,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,优选地,所述集合创建模块包括:
区域获取子模块,用于获取多个地址样本以及对应标记的区域;
子地址拆分子模块,用于将地址样本拆分为对应不同地域级别的多个子地址;
集合创建子模块,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
在本申请实施例中,优选地,所述装置在分布式服务集群上执行,所述装置还包括:
子地址查找模块,用于在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
样本分类模块,用于按照查找的子地址对所述地址样本进行分类;
服务器分发模块,用于将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
在本申请实施例中,优选地,所述装置还包括:
集合合并模块,用于在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
在本申请实施例中,优选地,单个服务器用于创建一个或多个子地址对应的匹配数据集合,所述装置还包括:
任务启用模块,用于当用于创建多个子地址对应的匹配数据集合时,针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
在本申请实施例中,优选地,所述装置还包括:
样本聚合排序模块,用于在所述按照查找的子地址对所述地址样本进行分类之后,将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
在本申请实施例中,优选地,所述装置还包括:
坐标点转换模块,用于调用地图系统将所述收件地址转换为地图上对应的坐标点;
边界线识别模块,用于识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
在本申请实施例中,优选地,所述边界线识别模块包括:
交点个数确定子模块,用于确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
在本申请实施例中,优选地,所述装置还包括:
区域修正模块,用于根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
在本申请实施例中,优选地,所述区域修正模块包括:
标识提取子模块,用于提取物流任务的收件方标识;
区域获取子模块,用于从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
区域修正子模块,用于采用获取的目标区域对匹配的目标区域进行修正。
在本申请实施例中,优选地,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述区域获取子模块包括:
第一区域查找子单元,用于从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,第二区域查找子单元,用于从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
依据本申请实施例,通过将物流任务的收件地址拆分为对应不同地域级别的多个子地址,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域,实现了基于大量样本学习出的多分类器对收件地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了收件地址的归属识别的准确性。
进一步,将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务,由于基于子地址识别收件地址的归属的准确性,提高了物流任务分发的准确性。
参考图11,其示出了根据本申请实施例六的一种物流系统的结构框图,具体可以包括:
物流任务提交客户端601、物流任务分发系统602以及针对不同区域的物流系统603;
所述物流任务分发系统602包括:
任务接收模块,用于接收物流任务提交客户端提交的物流任务;
地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
地址匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,得到所述收件地址在划分的多个区域中归属的目标区域;
任务分发模块,用于将所述物流任务分发至所述物流系统;
所述物流系统603,用于执行所述物流任务。
物流系统可以向区域内的群体提供针对物流任务的派送征集服务,派送征集服务是指征集人员来完成派送任务的服务,例如校园众包平台就是一种物流系统,可以征集校园内的人员代替校园内的其他收件人领取物件并送到收件人处。
依据本申请实施例,通过将物流任务的收件地址拆分为对应不同地域级别的多个子地址,采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域,实现了基于大量样本学习出的多分类器对收件地址的归属进行匹配,不仅能解决由于地址采用简称或者昵称导致识别失败的问题,而且针对用户的错别字与写错部分地址的情况都能学习出相应的权重,相对于校区名称匹配更具有泛化能力,鲁棒性更强,提高了收件地址的归属识别的准确性。
进一步,将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务,由于基于子地址识别收件地址的归属的准确性,提高了物流任务分发的准确性。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开的实施例可被实现为使用任意适当的硬件,固件,软件,或及其任意组合进行想要的配置的系统。图12示意性地示出了可被用于实现本公开中所述的各个实施例的示例性系统(或装置)700。
对于一个实施例,图12示出了示例性系统700,该系统具有一个或多个处理器702、被耦合到(一个或多个)处理器702中的至少一个的系统控制模块(芯片组)704、被耦合到系统控制模块704的系统存储器706、被耦合到系统控制模块704的非易失性存储器(NVM)/存储设备708、被耦合到系统控制模块704的一个或多个输入/输出设备710,以及被耦合到系统控制模块706的网络接口712。
处理器702可包括一个或多个单核或多核处理器,处理器702可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。在一些实施例中,系统700能够作为本申请实施例中所述的浏览器。
在一些实施例中,系统700可包括具有指令的一个或多个计算机可读介质(例如,系统存储器706或NVM/存储设备708)以及与该一个或多个计算机可读介质相合并被配置为执行指令以实现模块从而执行本公开中所述的动作的一个或多个处理器702。
对于一个实施例,系统控制模块704可包括任意适当的接口控制器,以向(一个或多个)处理器702中的至少一个和/或与系统控制模块704通信的任意适当的设备或组件提供任意适当的接口。
系统控制模块704可包括存储器控制器模块,以向系统存储器706提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
系统存储器706可被用于例如为系统700加载和存储数据和/或指令。对于一个实施例,系统存储器706可包括任意适当的易失性存储器,例如,适当的DRAM。在一些实施例中,系统存储器706可包括双倍数据速率类型四同步动态随机存取存储器(DDR4SDRAM)。
对于一个实施例,系统控制模块704可包括一个或多个输入/输出控制器,以向NVM/存储设备708及(一个或多个)输入/输出设备710提供接口。
例如,NVM/存储设备708可被用于存储数据和/或指令。NVM/存储设备408可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(一个或多个)非易失性存储设备(例如,一个或多个硬盘驱动器(HDD)、一个或多个光盘(CD)驱动器和/或一个或多个数字通用光盘(DVD)驱动器)。
NVM/存储设备708可包括在物理上作为系统700被安装在其上的设备的一部分的存储资源,或者其可被该设备访问而不必作为该设备的一部分。例如,NVM/存储设备708可通过网络经由(一个或多个)输入/输出设备1110进行访问。
(一个或多个)输入/输出设备710可为系统700提供接口以与任意其他适当的设备通信,输入/输出设备710可以包括通信组件、音频组件、传感器组件等。网络接口712可为系统700提供接口以通过一个或多个网络通信,系统700可根据一个或多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的一个或多个组件进行无线通信,例如接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合进行无线通信。
对于一个实施例,(一个或多个)处理器702中的至少一个可与系统控制模块704的一个或多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(一个或多个)处理器702中的至少一个可与系统控制模块704的一个或多个控制器的逻辑封装在一起以形成系统级封装(SiP)。对于一个实施例,(一个或多个)处理器702中的至少一个可与系统控制模块704的一个或多个控制器的逻辑集成在同一模具上。对于一个实施例,(一个或多个)处理器702中的至少一个可与系统控制模块704的一个或多个控制器的逻辑集成在同一模具上以形成片上系统(SoC)。
在各个实施例中,系统700可以但不限于是:浏览器、工作站、台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)。在各个实施例中,系统700可具有更多或更少的组件和/或不同的架构。例如,在一些实施例中,系统700包括一个或多个摄像机、键盘、液晶显示器(LCD)屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路(ASIC)和扬声器。
其中,如果显示器包括触摸面板,显示屏可以被实现为触屏显示器,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。
本申请实施例还提供了一种非易失性可读存储介质,该存储介质中存储有一个或多个模块(programs),该一个或多个模块被应用在终端设备时,可以使得该终端设备执行本申请实施例中各方法步骤的指令(instructions)。
在一个示例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如本申请实施例的方法。
在一个示例中还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如本申请实施例的一个或多个的方法。
本申请实施例公开了一种地址的归属识别方法和装置,示例1包括一种地址的归属识别方法,包括获取多个地址样本以及对应标记的区域;
将地址样本拆分为对应不同地域级别的多个子地址;
根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域。
示例2包括一种物流任务的分发方法,包括将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
将所述物流任务分发至所述区域对应的物流系统,以由所述物流系统执行所述物流任务。
示例3可包括示例2所述的方法,其中,所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址包括:
对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
示例4可包括示例2-示例3一个或多个所述的方法,其中,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
示例5可包括示例2-示例4一个或多个所述的方法,其中,在所述采用匹配数据集合基于所述多个子地址进行匹配之前,所述方法还包括:
创建基于子地址确定区域的匹配数据集合。
示例6可包括示例2-示例5一个或多个所述的方法,其中,所述创建基于子地址确定区域的匹配数据集合包括:
获取多个地址样本以及对应标记的区域;
将地址样本拆分为对应不同地域级别的多个子地址;
根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
示例7可包括示例2-示例6一个或多个所述的方法,其中,所述方法在分布式服务集群上执行,在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,所述方法还包括:
查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
按照查找的子地址对所述地址样本进行分类;
将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
示例8可包括示例2-示例7一个或多个所述的方法,其中,在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,所述方法还包括:
获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
示例9可包括示例2-示例8一个或多个所述的方法,其中,单个服务器用于创建一个或多个子地址对应的匹配数据集合,当用于创建多个子地址对应的匹配数据集合时,所述方法还包括:
针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
示例10可包括示例2-示例9一个或多个所述的方法,其中,在所述按照查找的子地址对所述地址样本进行分类之后,所述方法还包括:
将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
示例11可包括示例2-示例10一个或多个所述的方法,其中,所述方法还包括:
调用地图系统将所述收件地址转换为地图上对应的坐标点;
识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
示例12可包括示例2-示例11一个或多个所述的方法,其中,所述识别所述坐标点超出目标区域的边界线包括:
确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
示例13可包括示例2-示例12一个或多个所述的方法,其中,所述方法还包括:
根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
示例14可包括示例2-示例13一个或多个所述的方法,其中,所述根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正包括:
提取物流任务的收件方标识;
从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
采用获取的目标区域对匹配的目标区域进行修正。
示例15可包括示例2-示例14一个或多个所述的方法,其中,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域包括:
从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
示例16包括一种地址的归属识别装置,其中,包括:
样本获取模块,用于获取多个地址样本以及对应标记的区域;
子地址拆分模块,用于将地址样本拆分为对应不同地域级别的多个子地址;
匹配数据集合创建模块,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
区域匹配模块,用于采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域。
示例17包括一种物流任务的分发装置,其中,包括:
子地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
区域匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
物流任务分发模块,用于将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务。
示例18可包括示例17所述的装置,其中,所述子地址拆分模块包括:
分词子模块,用于对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
子地址组合模块,用于按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
示例19可包括示例17-示例18一个或多个所述的装置,其中,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
示例20可包括示例17-示例19一个或多个所述的装置,其中,集合创建模块,用于在所述采用匹配数据集合基于所述多个子地址进行匹配之前,创建基于子地址确定区域的匹配数据集合。
示例21可包括示例17-示例20一个或多个所述的装置,其中,所述集合创建模块包括:
区域获取子模块,用于获取多个地址样本以及对应标记的区域;
子地址拆分子模块,用于将地址样本拆分为对应不同地域级别的多个子地址;
集合创建子模块,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
示例22可包括示例17-示例21一个或多个所述的装置,其中,所述装置在分布式服务集群上执行,所述装置还包括:
子地址查找模块,用于在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
样本分类模块,用于按照查找的子地址对所述地址样本进行分类;
服务器分发模块,用于将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
示例23可包括示例17-示例22一个或多个所述的装置,其中,所述装置还包括:
集合合并模块,用于在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
示例24可包括示例17-示例23一个或多个所述的装置,其中,单个服务器用于创建一个或多个子地址对应的匹配数据集合,所述装置还包括:
任务启用模块,用于当用于创建多个子地址对应的匹配数据集合时,针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
示例25可包括示例17-示例24一个或多个所述的装置,其中,所述装置还包括:
样本聚合排序模块,用于在所述按照查找的子地址对所述地址样本进行分类之后,将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
示例26可包括示例17-示例25一个或多个所述的装置,其中,所述装置还包括:
坐标点转换模块,用于调用地图系统将所述收件地址转换为地图上对应的坐标点;
边界线识别模块,用于识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
示例27可包括示例17-示例26一个或多个所述的装置,其中,所述边界线识别模块包括:
交点个数确定子模块,用于确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
示例28可包括示例17-示例27一个或多个所述的装置,其中,所述装置还包括:
区域修正模块,用于根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
示例29可包括示例17-示例28一个或多个所述的装置,其中,所述区域修正模块包括:
标识提取子模块,用于提取物流任务的收件方标识;
区域获取子模块,用于从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
区域修正子模块,用于采用获取的目标区域对匹配的目标区域进行修正。
示例30可包括示例17-示例29一个或多个所述的装置,其中,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述区域获取子模块包括:
第一区域查找子单元,用于从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,第二区域查找子单元,用于从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
示例30可包括一种信息编码的风险识别装置,其中,包括:
第一特征信息获取模块,用于获取信息编码的第一类编码特征信息,所述第一类编码特征信息包括信息编码所处环境的环境信息和位置信息中至少一种;
特征信息提交模块,用于将所述第一类编码特征信息提交至服务端,以供服务端基于所述第一类编码特征信息进行信息编码的风险识别。
示例31包括一种物流系统,其中,包括:
物流任务提交客户端、物流任务分发系统以及针对不同区域的物流系统;
所述物流任务分发系统包括:
任务接收模块,用于接收物流任务提交客户端提交的物流任务;
地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
地址匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,得到所述收件地址在划分的多个区域中归属的目标区域;
任务分发模块,用于将所述物流任务分发至所述物流系统;
所述物流系统,用于执行所述物流任务。
示例32、一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如示例1-15一个或多个的方法。
示例33、一个计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如示例1-15一个或多个的方法。
虽然某些实施例是以说明和描述为目的的,各种各样的替代、和/或、等效的实施方案、或计算来达到同样的目的实施例示出和描述的实现,不脱离本申请的实施范围。本申请旨在覆盖本文讨论的实施例的任何修改或变化。因此,显然本文描述的实施例仅由权利要求和它们的等同物来限定。

Claims (20)

1.一种地址的归属识别方法,其特征在于,包括:
获取多个地址样本以及对应标记的区域;其中,所述区域为预先划定的地理区域;
将地址样本拆分为对应不同地域级别的多个子地址;
根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域;
所述将地址样本拆分为对应不同地域级别的多个子地址包括:
对所述地址样本进行分词后,选取至少一种地域级别的地址分词进行重新组合,得到多种组合的子地址。
2.一种物流任务的分发方法,其特征在于,包括:
将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
将所述物流任务分发至所述区域对应的物流系统,以由所述物流系统执行所述物流任务;
所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址包括:
对所述物流任务的收件地址进行分词后,选取至少一种地域级别的地址分词进行重新组合,得到多种组合的子地址。
3.根据权利要求2所述的方法,其特征在于,所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址包括:
对物流任务的收件地址进行分词,得到对应不同地域级别的地址分词;
按照设定规则对地址分词进行组合,得到对应不同地域级别的多个子地址。
4.根据权利要求2所述的方法,其特征在于,所述物流系统向对应区域内群体提供针对所述物流任务的派送征集服务。
5.根据权利要求2所述的方法,其特征在于,在所述采用匹配数据集合基于所述多个子地址进行匹配之前,所述方法还包括:
创建基于子地址确定区域的匹配数据集合。
6.根据权利要求5所述的方法,其特征在于,所述创建基于子地址确定区域的匹配数据集合包括:
获取多个地址样本以及对应标记的区域;
将地址样本拆分为对应不同地域级别的多个子地址;
根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合。
7.根据权利要求6所述的方法,其特征在于,所述方法在分布式服务集群上执行,在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之前,所述方法还包括:
查找针对所述地址样本对应标记的区域配置的在设定地域级别下的子地址;
按照查找的子地址对所述地址样本进行分类;
将对应设定地域级别下同一子地址的多个地址样本,分发至针对所述子地址配置的服务器;所述服务器用于创建子地址对应的匹配数据集合。
8.根据权利要求7所述的方法,其特征在于,在所述根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合之后,所述方法还包括:
获取各个服务器针对各子地址对应的匹配数据集合并进行合并。
9.根据权利要求7所述的方法,其特征在于,单个服务器用于创建一个或多个子地址对应的匹配数据集合,当用于创建多个子地址对应的匹配数据集合时,所述方法还包括:
针对各子地址分别启用一个任务用于创建对应的匹配数据集合。
10.根据权利要求7所述的方法,其特征在于,在所述按照查找的子地址对所述地址样本进行分类之后,所述方法还包括:
将对应设定地域级别下同一子地址的多个地址样本,按照对应的区域进行聚合,并对聚合后的地址样本进行排序。
11.根据权利要求2所述的方法,其特征在于,所述方法还包括:
调用地图系统将所述收件地址转换为地图上对应的坐标点;
识别所述坐标点超出目标区域的边界线,则修正所述目标区域为相邻区域。
12.根据权利要求11所述的方法,其特征在于,所述识别所述坐标点超出目标区域的边界线包括:
确定所述坐标点发出的射线与所述目标区域的边界线的交点为偶数个。
13.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正。
14.根据权利要求13所述的方法,其特征在于,所述根据目标区域的物流系统或物件自取系统对应标记的目标区域,对确定的目标区域进行修正包括:
提取物流任务的收件方标识;
从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域;
采用获取的目标区域对匹配的目标区域进行修正。
15.根据权利要求14所述的方法,其特征在于,所述物流系统中记录有寄件事件、物件派送事件和派送任务抢单事件,所述物件自取系统记录有取件事件;
所述从所述目标区域的物流系统或物件自取系统获取针对收件方标识标记的目标区域包括:
从物流系统中记录的寄件事件、物件派送事件和派送任务抢单事件中查找针对收件方标识标记的目标区域;
或,从物件自取系统记录的取件事件中查找针对收件方标识标记的目标区域。
16.一种地址的归属识别装置,其特征在于,包括:
样本获取模块,用于获取多个地址样本以及对应标记的区域;其中,所述区域为预先划定的地理区域;
子地址拆分模块,用于将地址样本拆分为对应不同地域级别的多个子地址;
匹配数据集合创建模块,用于根据多个地址样本的多个子地址与对应标记的区域,创建基于子地址确定区域的匹配数据集合;
区域匹配模块,用于采用匹配数据集合对目标地址进行匹配,得到所述目标地址在划分的多个区域中归属的目标区域;
所述将地址样本拆分为对应不同地域级别的多个子地址包括:
对所述地址样本进行分词后,选取至少一种地域级别的地址分词进行重新组合,得到多种组合的子地址。
17.一种物流任务的分发装置,其特征在于,包括:
子地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
区域匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,确定所述收件地址在划分的多个区域中归属的目标区域;
物流任务分发模块,用于将所述物流任务分发至所述区域对应的物流系统,以由物流系统执行所述物流任务;
所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址包括:
对所述物流任务的收件地址进行分词后,选取至少一种地域级别的地址分词进行重新组合,得到多种组合的子地址。
18.一种物流系统,包括
物流任务提交客户端、物流任务分发系统以及针对不同区域的物流系统;
所述物流任务分发系统包括:
任务接收模块,用于接收物流任务提交客户端提交的物流任务;
地址拆分模块,用于将物流任务的收件地址拆分为对应不同地域级别的多个子地址;
地址匹配模块,用于采用匹配数据集合基于所述多个子地址进行匹配,得到所述收件地址在划分的多个区域中归属的目标区域;
任务分发模块,用于将所述物流任务分发至所述物流系统;
所述物流系统,用于执行所述物流任务;
所述将物流任务的收件地址拆分为对应不同地域级别的多个子地址包括:
对所述物流任务的收件地址进行分词后,选取至少一种地域级别的地址分词进行重新组合,得到多种组合的子地址。
19.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-15任一所述的方法。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-15任一所述的方法。
CN201710576484.8A 2017-07-14 2017-07-14 地址的归属识别和物流任务的分发方法及其装置 Active CN109255565B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710576484.8A CN109255565B (zh) 2017-07-14 2017-07-14 地址的归属识别和物流任务的分发方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710576484.8A CN109255565B (zh) 2017-07-14 2017-07-14 地址的归属识别和物流任务的分发方法及其装置

Publications (2)

Publication Number Publication Date
CN109255565A CN109255565A (zh) 2019-01-22
CN109255565B true CN109255565B (zh) 2022-12-16

Family

ID=65051862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710576484.8A Active CN109255565B (zh) 2017-07-14 2017-07-14 地址的归属识别和物流任务的分发方法及其装置

Country Status (1)

Country Link
CN (1) CN109255565B (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737373A (zh) * 2019-03-25 2020-10-02 菜鸟智能物流控股有限公司 地址编码修正方法和装置以及电子设备
CN110334162B (zh) * 2019-05-09 2021-11-09 德邦物流股份有限公司 地址识别方法及装置
CN110532546B (zh) * 2019-07-29 2023-03-31 中国电子科技集团公司第五十四研究所 一种融合地理位置和文本相似性的警情自动下发方法
CN112100161B (zh) * 2019-09-17 2021-05-28 上海寻梦信息技术有限公司 数据处理方法及系统、电子设备及存储介质
CN110765280B (zh) * 2019-10-22 2021-05-25 京东数字科技控股有限公司 地址识别方法和装置
CN111198954B (zh) * 2019-11-28 2023-08-22 深圳市跨越新科技有限公司 一种下单地址结构化解析方法和系统
CN112884390A (zh) * 2019-11-29 2021-06-01 北京三快在线科技有限公司 订单处理的方法、装置、可读存储介质及电子设备
CN112231429A (zh) * 2020-11-09 2021-01-15 山东健康医疗大数据有限公司 一种基于机器学习分类算法的地址匹配方法
CN112488648A (zh) * 2020-11-26 2021-03-12 杭州安恒信息技术股份有限公司 一种管辖企业统计方法及相关组件
CN112487120A (zh) * 2020-11-30 2021-03-12 上海寻梦信息技术有限公司 收件地址归类方法、装置、设备以及存储介质
CN112465035A (zh) * 2020-11-30 2021-03-09 上海寻梦信息技术有限公司 物流配送任务分配方法、系统、设备及存储介质
CN113052513B (zh) * 2021-05-13 2024-03-26 上海寻梦信息技术有限公司 构建地址分类模型的方法、地址分类方法及相关设备
CN114363797A (zh) * 2021-05-26 2022-04-15 科大国创云网科技有限公司 基于mr常驻地与建筑物属性的用户群体分类方法及系统
CN114363823B (zh) * 2021-05-26 2023-09-19 科大国创云网科技有限公司 基于mr常驻地和建筑物轮廓的人口密度监测方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002059817A1 (en) * 2001-01-26 2002-08-01 Accenture Method for a shipper-based electronic/physical mail address database architecture
CN105809383A (zh) * 2014-12-29 2016-07-27 华为软件技术有限公司 一种自动发送派件通知的方法和系统

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102024024B (zh) * 2010-11-10 2013-07-10 百度在线网络技术(北京)有限公司 地址数据库的建构方法及装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN104077308B (zh) * 2013-03-28 2018-02-13 阿里巴巴集团控股有限公司 一种物流服务范围确定方法及装置
CN104572645B (zh) * 2013-10-11 2020-07-10 阿里巴巴(中国)有限公司 兴趣点数据关联方法及装置
CN103984735B (zh) * 2014-05-21 2017-02-15 北京京东尚科信息技术有限公司 一种用于生成推荐配送地点名称的方法和装置
CN104166679B (zh) * 2014-07-08 2018-10-09 北京迪威特科技有限公司 一种用于分拣的地址匹配方法
CN105528372B (zh) * 2014-09-30 2019-05-24 华为技术有限公司 一种地址搜索方法和设备
US9418350B2 (en) * 2014-10-13 2016-08-16 Avaya Inc. Contact center delivery in-building homing service
CN104484790A (zh) * 2014-12-26 2015-04-01 清华大学深圳研究生院 一种物流业务的地址匹配方法及装置
CN106296059B (zh) * 2015-06-02 2020-08-25 菜鸟智能物流控股有限公司 派送网点确定方法及设备
CN106326233B (zh) * 2015-06-18 2019-10-11 菜鸟智能物流控股有限公司 地址提示方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002059817A1 (en) * 2001-01-26 2002-08-01 Accenture Method for a shipper-based electronic/physical mail address database architecture
CN105809383A (zh) * 2014-12-29 2016-07-27 华为软件技术有限公司 一种自动发送派件通知的方法和系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于概率统计模型的快递地址自动分类方法;邵妍 等;《计算机工程》;20121205;第38卷(第23期);277-280+283 *
基于网络分析的快递布局优化研究;梁会民 等;《物流科技》;20150410;第38卷(第04期);623-630 *
顾及位置关系的网络POI地址信息标准化处理方法;王勇 等;《测绘学报》;20160515;第45卷(第05期);37-40 *

Also Published As

Publication number Publication date
CN109255565A (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
CN109255565B (zh) 地址的归属识别和物流任务的分发方法及其装置
Liu et al. Classifying urban land use by integrating remote sensing and social media data
CN106296059B (zh) 派送网点确定方法及设备
CN109101474B (zh) 一种地址聚合的方法、包裹聚合的方法以及设备
CN106681996B (zh) 确定地理范围内兴趣区域、兴趣点的方法和装置
CN109389270B (zh) 一种物流对象确定方法、装置和机器可读介质
CN109255564B (zh) 一种取件点地址推荐方法及装置
US11118921B2 (en) Vehicle routing guidance to an authoritative location for a point of interest
CN107590250A (zh) 一种时空轨迹生成方法及装置
CN104050196A (zh) 一种兴趣点数据冗余检测方法及装置
CN107330027B (zh) 一种弱监督的深度台标检测方法
WO2021203728A1 (zh) 一种展业区域的选址方法、装置、计算机设备和介质
US11966424B2 (en) Method and apparatus for dividing region, storage medium, and electronic device
CN102163214A (zh) 一种数字地图生成装置及方法
CN111966766A (zh) 地址信息的检测方法、系统、电子设备和存储介质
CN111522838A (zh) 地址相似度计算方法及相关装置
US20230049839A1 (en) Question Answering Method for Query Information, and Related Apparatus
CN111967808B (zh) 确定物流对象收货方式的方法、装置、电子设备及存储介质
CN107437367B (zh) 一种标注选择方法及装置
CN111241229B (zh) 快递驿站地址辨别方法、计算机设备和存储介质
CN111523433B (zh) 快件末端地址的标准化处理方法、装置和设备
TW201810093A (zh) 使用者背景資訊的收集方法及裝置
CN112800165A (zh) 一种基于聚类算法的产业集群定位方法、装置及电子设备
US11908220B2 (en) System and method for automatically recognizing delivery point information
CN112347131B (zh) 一种基于城轨项目需求识别和覆盖的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant