CN109255564B - 一种取件点地址推荐方法及装置 - Google Patents

一种取件点地址推荐方法及装置 Download PDF

Info

Publication number
CN109255564B
CN109255564B CN201710570755.9A CN201710570755A CN109255564B CN 109255564 B CN109255564 B CN 109255564B CN 201710570755 A CN201710570755 A CN 201710570755A CN 109255564 B CN109255564 B CN 109255564B
Authority
CN
China
Prior art keywords
point information
pickup point
address
pickup
pick
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710570755.9A
Other languages
English (en)
Other versions
CN109255564A (zh
Inventor
杨建明
王国印
郭育林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cainiao Smart Logistics Holding Ltd
Original Assignee
Cainiao Smart Logistics Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cainiao Smart Logistics Holding Ltd filed Critical Cainiao Smart Logistics Holding Ltd
Priority to CN201710570755.9A priority Critical patent/CN109255564B/zh
Publication of CN109255564A publication Critical patent/CN109255564A/zh
Application granted granted Critical
Publication of CN109255564B publication Critical patent/CN109255564B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0834Choice of carriers

Abstract

本申请提供了一种取件点地址推荐方法,通过获取收货地址,并根据收货地址,利用设置的取件点推荐模型确定取件点信息,该取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得,当确定取件点信息后,将取件点信息返回至客户端。由此消除了推荐的取件点地址存在的原始数据偏差,取得了提高推荐结果的精确度以及提高推荐内容更加人性化的有益效果。

Description

一种取件点地址推荐方法及装置
技术领域
本申请涉及信息技术领域,特别是涉及一种取件点地址推荐方法及装置。
背景技术
在电子商务快速发展的今天,网购已经是人们日常生活中非常普遍的一种交易方式,在网购的整个流程中,物流发挥了重大的作用,也因为物流的发展出现了一些问题,特别是“物流最后100米问题”,成为了制约电子商务发展的瓶颈之一。“最后一百米”是物流行业近年热点关注的问题,如何在“最后一百米”的配送上提高效率,提高用户体验是众多快递公司考虑的重点。在一些电商促销活动期间,物流压力很大,货物从中转场发出去了,但到达终端却因人力不足送不出去。派件的“最后100米”难题,在业务量剧增时特别明显,已经成了影响工作效率的最大原因。为了解决“最后100米”难题,电商公司和物流公司携手建立面向社区和校园的物流服务平台,为网购用户提供包裹代收服务,致力于为消费者提供多元化的最后100米服务。目前在末端配送网络建设上,在城市,超过4万个取件点构成快递网络的城市末端网络。对于收货不便和有保护隐私需求的用户,在网购平台下单填写地址后,从页面上会根据所填写的地址自动推荐出最优的取件点供用户进行选择,而如何根据收货地址预测出最适合收货的取件点,成为影响用户购物体验和提升物流效率的一个关键环节。
在目前,电商为了方便用户收取自己网购的货物,通常先提取用户网购订单中的收货地址的经纬度,根据GeoHash算法(一种将经纬度转换成字符串的方法,并且字符串前缀匹配的越多,距离越近)将收货地址的经纬度转换为字符串,并将转换后的字符串与收货取件点的字符串进行前缀匹配,并将匹配最多的几个取件点返回给用户以供选择。
但是,目前的收货取件点地址推荐方法只是根据距离,可能推荐出在收货地址周围主干道、河流、小区围墙、山等对面的取件点,但是GeoHash算法非常耗性能,且有原始数据偏差,导致推荐的收货地址准确度不高,且不人性化。
发明内容
鉴于上述问题,本申请实施例提供一种取件点地址推荐方法及装置,以通过利用预设的取件点推荐模型确定取件点信息,解决现有技术中推荐的收货地址准确度不高,且不人性化的问题。
相应的,本申请实施例还提供了一种取件点地址推荐方法及装置,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种取件点地址推荐方法,包括:
获取收货地址;
根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得;
将所述取件点信息发送至客户端。
相应的,本申请实施例还公开了一种取件点地址推荐装置,包括:
地址获取模块,用于获取收货地址;
推荐信息确定模块,用于根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得;
推荐信息返回模块,用于将所述取件点信息发送至客户端。
相应的,本申请实施例还公开了一种装置,其特征在于,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行一种取件点地址推荐方法。
相应的,本申请实施例还公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行一种取件点地址推荐方法。
本申请实施例包括以下优点:
本申请实施例通过获取收货地址,并根据收货地址,利用预设的取件点推荐模型确定取件点信息,该取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得,当确定取件点信息后,将取件点信息返回至客户端。由于取件点的设立位置具有社区性和区域性,且取件点推荐模型中大量的用户历史数据包含了用户的使用习惯,即某一社区或区域的用户在选择需要派送快递的取件点时通常会偏向于选择某一指定取件点,则当用户输入的收货地址落入该社区或区域范围内时,服务器会根据该社区或区域用户曾经的历史收货地址对应的取件点进行推荐,这样的推荐结果更加具有人性化,解决了单纯通过网络地图定位离收货地址最近的取件点进行推荐时,由于网络地图存在数据误差而导致推荐结果不准确的问题,也降低了只根据距离进行推荐而导致推荐的取件点与收货地址之间存在地理隔离物的几率,取得了提高推荐结果的精确度以及使推荐内容更加人性化的有益效果。
附图说明
参照图1,示出了本申请实施例中的一种取件点地址推荐方法的推荐处理示意图
图2是本申请一实施例提供的一种取件点地址推荐方法实施例的步骤流程图;
图3是本申请一实施例提供的一种取件点地址推荐方法实施例的具体步骤流程图;
图4是本申请一实施例提供的一种取件点地址推荐装置实施例的结构图;
图5是本申请一实施例提供的一种取件点地址推荐装置实施例的具体结构图;
图6是本申请另一实施例提供的一种装置的硬件结构示意图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
取件点收货的场景中,每个取件点的设立位置具有社区性和区域性,其收货范围一般是周边的多个小区、写字楼等POI(Point of Interest,信息点)列表,同时由于不同小区的取件点派送范围基本无交叉,即派送至不同小区取件点的包裹其收货地址无交集,所以每个小区的用户选择的收货取件点具有相似性。因此,取件点预测,可抽象为基于用户收货地址的文本分类问题,以取件点ID作为分类标签,基于所有取件点的历史收货地址数据,建立文本模型,能最大程度上匹配到最合理的取件点。
在本申请实施例中,取件点地址推荐方法是基于用户在填写网购订单时输入的收货地址与预先训练好的取件点推荐模型匹配的过程。其中,取件点推荐模型是根据已派送快递的历史收货地址和对应的取件点信息训练获得,已派送快递的历史收货地址是指设立在全国范围内的所有取件点的历史收货数据,该数据包括已派送快递成功的历史收货地址和该历史收货地址对应的取件点ID(取件点ID是取件点的编号,用于识别取件点)。
当建立好取件点推荐模型后,根据得到的收货地址,利用预设的取件点推荐模型确定推荐的取件点信息,并返回给用户客户端供用户进行选择,用户根据推荐的一个或多个取件点,选取其中一个进行快递包裹的派送。
在本申请实施例中,由于取件点的设立位置具有社区性和区域性,且取件点推荐模型中大量的用户历史数据包含了用户的使用习惯,即某一社区或区域的用户在选择需要派送快递的取件点时通常会偏向于选择某一指定取件点,则当用户输入的收货地址落入该社区或区域范围内时,服务器会根据该社区或区域用户曾经的历史收货地址对应的取件点进行推荐,这样的推荐结果更加具有人性化,解决了单纯通过网络地图定位离收货地址最近的取件点进行推荐时,由于网络地图存在数据误差而导致推荐结果不准确的问题,也降低了只根据距离进行推荐而导致推荐的取件点与收货地址之间存在地理隔离物的几率(河流、山川、高架桥等)。
参照图1,示出了本申请实施例中的一种取件点地址推荐方法的推荐处理示意图。
在具体实现中,客户端可以为安装有网购应用的移动终端、计算机等,在全国范围内建设有多个取件点,取件点的设立基于周边环境的社区性和区域性。
用户在网购应用中选择好商品后,生成网购订单,执行步骤S1:输入收货地址。
客户端提取该收货地址,并执行步骤S2:上传收货地址至服务器。
服务器根据接收到的收货地址,利用预设的取件点推荐模型确定取件点信息列表。并执行步骤S3:将确定的取件点信息返回至客户端。
客户端将反馈的取件点信息列表通过网购应用展示给用户,用户对列表中的推荐取件点进行选择,执行步骤S4:根据选择的取件点信息,确定优选取件点。确定优选取件点后,将优选取件点信息发送给服务器。
服务器根据收到的优选取件点信息,执行步骤S5:将确定的优选取件点信息上传至包裹派送系统,包裹派送系统接收到优选取件点作为派送目的地后,执行步骤S6:派送快递包裹至确定的优选取件点。用户在收到优选取件点发出的收货信息后可以自行至优选取件点进行包裹提取。
取件点地址推荐中常见的术语有:
特征(Feature):是一个客体或一组客体特性的抽象结果,是用来描述概念。
n-gram:若一个句子S由m个词构成(w1w2w3…wm),则n-gram定义为:{wiwi+1…wi+n-1|1≤i≤m-n+1}。
GeoHash:一种将经纬度转换成字符串的方法,并且使得在大部分情况下,字符串前缀匹配越多的距离越近。
收货地址:是人们接收包裹或信件的通讯地址。
结构化地址:是通讯地址通过分词之后产生的带有结构性标注的字串,如标注上:省、市、区县、街道、社区、道路、门牌号、POI标识、楼栋号,单元号、房间号等。
取件点:由众多电商牵头,建立面向社区和校园的物流服务平台,为网购用户提供包裹代收服务,致力于为消费者提供多元化的最后一公里服务。
参照图2,示出了本申请的一种取件点地址推荐方法实施例的步骤流程图,具体可以包括如下步骤:
步骤101,获取收货地址。
在本申请实施例中,填写正确规范的收获地址,是网购流程中非常重要的一个环节,填写收货地址发生在用户在网络商城选取好自己心仪的商品后,生成网购订单的过程中,收货地址是网购订单中非常重要的一个数据,用于告知电商送货目的地,使物流能够将货物准确的配送到用户手中。
具体的,收货地址本质上是一个文本(Text),文本是书面语言的表现形式,从文学的角度说,通常是具有完整、系统含义(Message)的一个句子或多个句子的组合。一个文本可以是一个句子(Sentence)、一个段落(Paragraph)或者一个篇章(Discourse)。在实际应用中文本的存在形式可以由很多种,常见的文本文档的扩展名有.txt、.doc、.docx、.wps等等。本申请中的目标文档可以为任何一种文本形式,对此本申请不加以限定。而且本申请中的目标文本还可以不以前述的文本文档形式存放,而是直接以数组、链表等等任何可用方式存放,对此本申请都不加以限定。另外,在本申请中可以通过任何可用方式获取待提取特征的目标文本,对此本申请也不加以限定。
进一步的,在取件点地址推荐方法中,当获得收货地址文本后,可以对收货地址文本进行地址结构化、数据集分割和提取N-gram特征,得到对应收货地址文本的N元特征,即地址结构化N-gram,地址结构化N-gram用于导入取件点推荐模型进行匹配,获得匹配后的结果。
其中,结构化地址是指将收货地址通过分词之后产生的带有结构性标注的字串,如标注上:省、市、区县、街道、社区、道路、门牌号、POI标识、楼栋号,单元号、房间号等。分词处理就是将连续的字序列按照一定的规范重新组合成词序列的过程。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。
在本申请中可以利用任何一种可用分词处理方法对目标文本进行分词处理,对此本申请不加以限定。
例如,假设获取的收货地址文本为“浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼”,分词处理后得到的分词分别为浙江省、杭州市、余杭区、五常街道、荆丰社区、文一西路、969号、阿里巴巴西溪园区、6号楼。如果预设的结构化识别规则中包括以“省”结束的字段对应于prov,以“市”结束的字段对应于city,以“区”结束的字段对应于district,以“街道”结束的字段对应于town,以“社区”结束的字段对应于community,以“路”结束的字段对应于road,以“号”结束的字段对应于roadNo,表示建筑等名称的字段对应于POI,以“楼”结束的字段对应于houseNo。
在本申请中,对收货地址文本进行地址结构化、数据集分割和提取N-gram特征,得到对应收货地址文本的N元特征,即地址结构化N-gram,由此取得了提高特征提取的质量以及减少垃圾特征的有益效果,增加了取件点推荐的效率。
步骤102,根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得。
在本申请实施例中,可以通过已派送快递的历史收货地址和对应的取件点信息训练得到取件点推荐模型,再将步骤101得到的收货地址的N元特征,即收货地址结构化N-gram导入取件点推荐模型进行匹配,得到匹配后的取件点信息列表。
其中,取件点是由网络牵头,建立面向社区和校园的物流服务平台,为网购用户提供包裹代收服务,致力于为消费者提供多元化的最后一公里服务。在取件点的收货场景中,每个取件点收货范围一般是周边的多个小区、写字楼等POI列表,同时由于不同小区的取件点派送范围基本无交叉,即派送至不同小区取件点的包裹其收货地址无交集,历史收货数据,即为取件点的数据库储存的用户历史网购订单,订单中包含有历史收货数据。由于取件点具有明显的社区属性,所以每个小区的用户选择的收货取件点具有相似性,即大量的历史收货地址中包含了用户习惯这一重要特征,用户习惯,就是长期延续下来的一种用户行为,这种习惯是用户和商业行为相互影响、相互适应了的行为。即包含了用户的在网购中的收货取件点选择习惯,本申请通过已派送快递的历史收货地址和对应的取件点信息训练得到取件点推荐模型,即赋予取件点推荐模型了用户习惯,是取件点推荐模型更加人性化,更加高效化。
因此,取件点预测,可抽象为基于用户收货地址的文本分类问题,以取件点信息作为分类标签,基于历史收货地址,建立取件点推荐模型,能最大程度上匹配到最合理的取件点。解决了现有的收货取件点地址推荐方法根据距离推荐出在收货地址周围主干道、河流、小区围墙、山等对面的取件点的问题。
需要说明的是,取件点信息即为取件点的取件点ID,取件点ID可以为一个数字编号,分别对应一个取件点。基于每一个历史收货地址,分别与之对应一个取件点ID,即基于此次历史收货地址,用户选择了对应的取件点。本方法主要实现根据取件点的地理分布和历史派送数据对用户历史收货地址进行分类,分类结果例如下表一:
Figure BDA0001349604200000081
Figure BDA0001349604200000091
表一
步骤103,将所述取件点信息发送至客户端。
在本申请实施例中,将收货地址结构化N-gram导入取件点推荐模型进行匹配,得到匹配后的取件点信息的列表后,根据取件点信息列表的状态,当取件点信息列表不为空时,即获得了匹配结果,此时将取件点信息返回至客户端,供用户根据取件点信息列表,选择相应的收货取件点。
例如,张先生在网络商城进行网络购物,选取一款产品后点击购买进入了订单处理流程,张先生在订单中输入了自己的收货地址:浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼。并在收货方式中选取取件点代收,系统根据该地址在取件点推荐模型中的配结果,返回了包括131206,135263,142542,9514四个取件点ID的推荐列表,张先生在推荐列表中选取取件点ID为131206的取件点作为收货点,在2天后,张先生前往取件点ID为131206的取件点拿到了网购购买的产品。
需要说明的是,将收货地址结构化N-gram导入取件点推荐模型进行匹配,得到匹配后的取件点信息的列表后,根据取件点信息列表的状态,当取件点信息列表为空时,即用户收货地址在取件点推荐模型中未匹配到结果,这种情况有可能是用户收货地址周围存在新开设的取件点或包裹量较少的取件点(新开设的取件点和包裹量较少的取件点中历史收货数据匮乏,导致取件点推荐模型基于此类取件点无法完成推荐)或用户输入的收货地址不规范导致的,此时可以通过将用户的收货地址标准化,再将标准化后的收货地址导入Geohash模型匹配预设公里范围以内的取件点,即通过距离大小推荐与用户收货地址最近的若干个取件点以供用户选择,解决了由于用户收货地址周围存在新开设的取件点或包裹量较少的取件点或用户输入的收货地址不规范导致无法推荐取件点的问题。
综上所述,本申请实施例提供的一种取件点地址推荐方法,通过获取收货地址,并根据收货地址,利用预设的取件点推荐模型确定取件点信息,该取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得,当确定取件点信息后,将取件点信息返回至客户端。由于取件点的设立位置具有社区性和区域性,且取件点推荐模型中大量的用户历史数据包含了用户的使用习惯,即某一社区或区域的用户在选择需要派送快递的取件点时通常会偏向于选择某一指定取件点,则当用户输入的收货地址落入该社区或区域范围内时,服务器会根据该社区或区域用户曾经的历史收货地址对应的取件点进行推荐,这样的推荐结果更加具有人性化,解决了单纯通过网络地图定位离收货地址最近的取件点进行推荐时,由于网络地图存在数据误差而导致推荐结果不准确的问题,降低了只根据距离进行推荐而导致推荐的取件点与收货地址之间存在地理隔离物的几率,取得了提高推荐结果的精确度以及使推荐内容更加人性化的有益效果。
参照图3,示出了本申请的一种取件点地址推荐方法的具体步骤流程图,具体可以包括如下步骤:
步骤201,根据已派送快递的历史收货地址及对应的取件点信息训练获得所述取件点推荐模型。
在本申请实施例中,可以通过已派送快递的历史收货地址和对应的取件点信息训练得到取件点推荐模型,再将步骤101得到的收货地址的N元特征,即收货地址结构化N-gram导入取件点推荐模型进行匹配,得到匹配后的取件点信息列表。
因此,取件点预测,可抽象为基于用户收货地址的文本分类问题,以取件点信息作为分类标签,基于历史收货地址进行训练,得到取件点推荐模型,能最大程度上匹配到最合理的取件点。解决了现有的收货取件点地址推荐方法根据距离推荐出在收货地址周围主干道、河流、小区围墙、山等对面的取件点的问题。
可选地,在本申请中,所述步骤201进一步可以包括:
子步骤2011,基于至少一个N元特征模板,针对已派送快递的历史收货地址,抽取相应个数的N元特征。
在执行子步骤2011之前,可以针对已派送快递的历史收货地址进行结构化分词,并按照预设的结构化识别规则,确定各分词的结构化语义标签。其中,结构化地址是指将收货地址通过分词之后产生的带有结构性标注的字串,如标注上:省、市、区县、街道、社区、道路、门牌号、POI标识、楼栋号,单元号、房间号等。分词处理就是将连续的字序列按照一定的规范重新组合成词序列的过程。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。
在本申请中可以利用任何一种可用分词处理方法对目标文本进行分词处理,对此本申请不加以限定。
例如,假设获取的收货地址文本为“浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼”,分词处理后得到的分词分别为浙江省、杭州市、余杭区、五常街道、荆丰社区、文一西路、969号、阿里巴巴西溪园区、6号楼。如果预设的结构化识别规则中包括以“省”结束的字段对应于prov,以“市”结束的字段对应于city,以“区”结束的字段对应于district,以“街道”结束的字段对应于town,以“社区”结束的字段对应于community,以“路”结束的字段对应于road,以“号”结束的字段对应于roadNo,表示建筑等名称的字段对应于POI,以“楼”结束的字段对应于houseNo。
在本申请实施例中,通过人工定义特征模板,可以得到N元特征模板,特征模板中包含有:省、市、区县、街道、社区、道路、门牌号、POI标识、楼栋号,单元号、房间号等特征信息,其中的特征可以由人工删减或增加。通过N元特征模板,可以将结构化的历史收货地址中的特征抽取出来,组成N-gram,举例来说,如果N元特征模板中的特征在结构化历史收货地址中都存在,那么该结构化历史收货地址可以转化成n个特征,如果结构化历史收货地址中有特征不存在于N元特征模板中,则该特征不输出到特征集中。
例如,如果某一特征模板为city、road、POI,那么根据“浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼”以及该地址中各分词对应的结构化语义标签,可以从该地址中提取出的特征可以为“杭州市_文一西路_阿里巴巴西溪园区”,其中的“_”为前后两个分词之间的连接符,当然也可以利用“-”、“&”等等符号或字符等任何可用标识作为连接符,也可以直接不用任何连接符,而得到形如“杭州市文一西路阿里巴巴西溪园区”的特征,在本申请中可以根据需求在本步骤之前,或者是本步骤之前的任一步骤之前设置是否需要连接符,以及连接符的内容,对此本申请不加以限定。
需要说明的是,N元特征模板的数量可以由自行设定,即设定N的值为大于或等于1的整数,本申请实施例对N的值不作限定。
例如,如果具有两个特征模板,分别如下:
特征模板1:city、road、POI
特征模板2:city、road、roadNo
那么则可以分别利用两个特征模板遍历“浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼”的各个分词,判断当前遍历的分词的结构化语义标签是否与特征模板中包含的结构化语义标签匹配,当遍历完全部分词时,则可以进一步判断是否针对特征模板所包含的全部结构化语义标签都获取到与之匹配的分词,如果是则可以利用与特征模板所包含的各个结构化语义标签匹配的分词构建特征数据。
在本申请中,可以获取历史收货地址文本;对所述历史收货地址文本进行分词处理,得到至少一个分词;按照预设的结构化识别规则,确定各分词的结构化语义标签;从具有结构化语义标签的各分词中,提取与预设的特征模板对应的特征数据;所述特征模板包括结构化语义标签组合。由此取得了提高特征提取的质量以及减少垃圾特征的有益效果。
需要说明的是,还可以对结构化后得到的结构化历史收货地址进行以行政区(也可以为省、市、街道等)对结构化历史收货地址集合进行进一步划分,以控制每一个训练集的大小。
子步骤2012,将每个N元特征与所述历史收货地址对应的取件点信息组合为训练特征。
在本申请实施例中,可以将每条提取的N元特征与该述历史收货地址对应的取件点信息表示为对的方式,例如:<历史收货地址结构化N-gram,取件点ID标签>。该对的集合即为训练特征。
例如,针对“浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼”的目标地址,若N元特征模板为:
特征模板1:省,市,区,街道,道路,路号,POI,houseNO。
特征模板2:省,市,区,街道,道路,路号。
特征模板3:市,道路,路号,POI。
特征模板4:道路,路号,POI。
特征模板5:街道,社区,POI。
由于上述目标地址的特征在N元特征模板中都存在,则可以提取出5个特征对,每个对包含对应特征模板中的特征与对应的取件点ID。
子步骤2013,利用所述训练特征训练文本分类模型以获得所述取件点推荐模型。
在本申请实施例中,通过自定义的特征提取模板对所有用户历史收货地址进行特征提取后,建立推荐模型的推荐算法,并将提取的特征对导入该推荐算法训练出参数值,得到取件点推荐模型。由此,取件点推荐模型便被赋予了众多用户的使用习惯,由于用户和取件点分布位置的社区性,使得当用户网购时输入收货地址后,可以通过该地址在取件点推荐模型进行匹配,确定该地址周围社区的其他用户经常选择使用的取件点,并推荐给网购用户进行选择,大大增加了取件点推荐的可靠性和人性化程度。
子步骤2014,将各训练特征按预设规则聚合为至少一个簇。
在本申请实施例中,将提取的已派送快递的历史收货地址的特征对进行簇聚合,即按照分类设定,将提取的已派送快递的历史收货地址的特征对以预设规则进行分类合并,使得取件点推荐模型的内容更加有序,减少了匹配时花费的时间。
可选地,在本申请中,所述步骤2014进一步可以包括:
子步骤20141,将具有相同N元特征的训练特征、以及具有相同取件点信息的训练特征聚合到一个簇。
在本申请实施例中,在特征对<历史收货地址结构化N-gram,取件点ID标签>中,具有相同N元特征的训练特征、以及具有相同取件点信息的训练特征可以理解为若两个特征对中,历史收货地址结构化N-gram匹配和取件点ID标签中任意一项匹配,则将这两个特征对聚合到一个簇中,,并将簇外具有相同取件点信息分类标签的特征加入到簇中,并重复上述步骤直到没有新特征加入为止。
其伪代码如下:
Figure BDA0001349604200000141
通过上述代码,输入特征对列表,且每个元素格式为<ngram,label>,输出聚合后的簇列表。
例如,对如下特征对列表<a,1>,<b,1>,<c,1>,<a,2>,<d,3>,<e,2>,<f,3>,<g,5>,<g,6>,<d,7>进行聚合簇的结果:
Figure BDA0001349604200000142
Figure BDA0001349604200000151
当簇有多个时,所述步骤2013进一步可以包括:
子步骤20131,针对每个簇,分别采用预设逻辑回归算法训练文本分类模型。
在本申请实施例中,Logistic regression(逻辑回归)是当前业界比较常用的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。(注意这里是:“可能性”,而非数学上的“概率”,logisitc回归的结果并非数学定义中的概率值,不可以直接当作概率值来用。该结果往往用于和其他特征值加权求和,而非直接相乘)。逻辑回归算法可用于概率预测,也可用于分类。
通过逻辑回归算法,针对簇中单一对<历史收货地址结构化N-gram,取件点ID标签>,可以得到历史收货地址结构化N-gram对应的取件点ID的权重值,该权重值即可以简单理解为该用户选择该取件点ID的可能性,权重值越大,说明该取件点的推荐度越高,对簇中每个对进行逻辑回归算法,可以得到簇中每个对的权重值,得到聚合后的每个簇的文本分类模型,这样做的优势是每个取件点和收货地址具有区域独立性,按簇划分的方法一方面降低了训练的时间,另一方面也提高了算法的准确率。
子步骤20132,将各个簇的文本分类模型进行整合,获得所述取件点推荐模型。
在本申请实施例中,对簇中每个对计算出权重并得到文本分类模型后,将各个簇的文本分类模型进行整合,获得完整的取件点推荐模型。
步骤202,获取收货地址。
该步骤可以参考步骤101,此处不再赘述。
步骤203,根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得。
该步骤可以参考步骤102,此处不再赘述。
可选地,在本申请中,所述步骤203进一步可以包括:
子步骤2031,基于所述至少一个N元特征模板,针对所述收货地址抽取相应个数的N元特征。
该步骤可以参考子步骤2011中基于至少一个N元特征模板,对已派送快递的历史收货地址抽取相应个数的N元特征的描述,此处不再赘述。
可选地,在本申请中,所述步骤2031进一步可以包括:
子步骤20311,对所述收货地址进行分词处理,得到至少一个分词。
分词处理就是将连续的字序列按照一定的规范重新组合成词序列的过程。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。
在本申请中可以利用任何一种可用分词处理方法对目标文本进行分词处理,对此本申请不加以限定。
子步骤20312,按照预设的结构化识别规则,确定各分词的结构化语义标签。
为了方便根据预设的特征模板进行特征提取,需要确定切分后得到的各分词的结构化语义标签。
例如可以预先设置多个结构化语义标签,并且设置各个结构化语义标签各自匹配的字段,那么则可以设置结构化识别规则为以与各分词匹配度最高的结构化语义标签作为该分词对应的结构化语义标签;也可以根据各个分词的内容以及含义等确定各分词的结构化语义标签;等等,对此本申请不加以限定。在本申请中可以在本步骤之前,或者是本步骤之前的任一步骤之前设定确定各分词结构化语义标签的结构化识别规则,对此本申请不加以限定。
其中的结构化语义标签都可以根据需求在本步骤之前,或者是本步骤之前的任一步骤之前进行设定,对此本申请不加以限定。但是结构化语义标签是为了对收货地址进行特征提取,那么如果是根据预设的特征提取模板进行特征提取,那么则需要要求预设的特征模板为至少一个结构化语义标签,或者是多个结构化语义标签的组合。
子步骤20313,将所述至少一个N元特征模板中的结构化语义标签,分别与各分词的结构化语义标签进行匹配,以获取相应的N元特征。
例如,对于前述的的结构化语义标签prov、city、district、town、community、road、roadNo、POI、houseNo,那么用于特征提取的特征模板可以为city、road、POI三个结构化语义标签的组合,或者是其中任意一个结构化语义标签单独为一个特征模板,等等。
那么确定了目标文本的各分词结构化语义标签之后,则可以相应的根据特征模板中包含的结构化语义标签,提取出相应的分词以组成特征。
子步骤2032,将每个N元特征单独输入所述取件点推荐模型,获得输出结果。
在该步骤中,将每个N元特征单独输入所述取件点推荐模型,获得输出结果,其中,N元特征的数量至少为一个,每个N元特征若匹配成功,则匹配结果至少为一个,若一个N元特征匹配不成功,则舍弃该N元特征。
例如,某一特征模板为city、road、POI,那么根据“浙江省杭州市余杭区五常街道荆丰社区文一西路969号阿里巴巴西溪园区6号楼”以及该地址中各分词对应的结构化语义标签,可以从该地址中提取出的特征可以为“杭州市_文一西路_阿里巴巴西溪园区”,将该特征导入取件点推荐模型进行匹配,可以匹配得到3个特征对:<历史收货地址结构化N-gram,取件点ID1>;<历史收货地址结构化N-gram,取件点ID2>;<历史收货地址结构化N-gram,取件点ID3>,则将取件点1,取件点2,取件点3确定为与上述地址对应的取件点,即上述地址对应的历史收货地址曾经从取件点1,取件点2,取件点3中取得过快递包裹。
子步骤2033,当各输出结果中的一个或多个包括取件点信息及其权重时,根据所述取件点信息及其权重推荐至少一个取件点信息。
在本申请实施例中,当各输出结果中的一个或多个包括取件点信息及其权重时,则可以根据权重值对推荐列表中的一个或多个取件点进行优先级排布,并将排布后的结果返回给用户,其中,权重值一般是由高到低进行排布。
可选地,在本申请中,所述步骤2033进一步可以包括:
子步骤20331,当各输出结果中的一个或多个输出结果中,累计只包括一个取件点信息及其权重时,则直接对所述取件点信息及其权重进行推荐。
即输出结果为一个取件点信息时,直接推荐该取件点。
子步骤20332,当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,则对多个取件点信息及其权重按照同一取件点信息进行归并,并对归并后的取件点信息及其权重进行推荐。
在本申请实施例中,当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,即为输出结果为多个取件点以及多个取件点对应的权重,则根据每个取件点进行权重的累加,并将累加后的多个取件点进行推荐。
可选地,在本申请中,所述步骤20332进一步可以包括:
子步骤20332A,当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,对多个取件点信息及其权重中,属于同一取件点信息的权重进行累加,获得累加权重。
子步骤20332B,针对每个取件点信息的累加权重,采用平滑映射函数将所述累加权重映射为指定区间范围的映射权重。
在本申请实施例中,平滑映射函数可以为sigmoid函数,sigmod函数定义如下:
S(x)=1/(1+e^(-x))
其中,sigmod函数是一个简单的、可导的、[0,1]区间的阶跃函数,是由广义模型推导所得,可以满足统计的最大熵模型,并且其基于逻辑回归算法,性质优秀,方便使用。x的值为取件点信息对应的权重。使用sigmod函数将结果平滑地映射到[0,1]区间,根据降序排列返回前n个取件点推荐给用户。
通过sigmod函数将结果平滑地映射到[0,1]区间,即在推荐取件点的过程中增加了训练数据的重要性(即权重),并且,sigmod函数的值域是[0,1],满足权重的要求;其次,它是一个单调上升的S型函数,其S型特征可以满足其将权重值平滑的映射在其定义域区间内。sigmod函数的具体使用可以参照神经网络模型中的描述,本申请在此不做赘述。
子步骤20332C,以各取件点信息的映射权重对所述取件点信息进行排序。
该排序方式可以为根据权重值对推荐的取件点信息进行降序排列。
子步骤20332D,从排序后的取件点信息中选择至少一个取件点信息。
步骤204,当利用预设取件点推荐模型未确定出取件点信息时,则利用地址哈希模型确定离所述收货地址距离最近的至少一个取件点信息。
需要说明的是,将收货地址结构化N-gram导入取件点推荐模型进行匹配,得到匹配后的取件点信息的列表后,根据取件点信息列表的状态,当取件点信息列表为空时,即用户收货地址在取件点推荐模型中未匹配到结果,这种情况有可能是用户收货地址周围存在新开设的取件点或包裹量较少的取件点(新开设的取件点和包裹量较少的取件点中历史收货数据匮乏,导致取件点推荐模型基于此类取件点无法完成推荐)或用户输入的收货地址不规范导致的,此时可以通过将用户的收货地址标准化,再将标准化后的收货地址导入Geohash模型匹配预设公里范围以内的取件点,即通过距离大小推荐与用户收货地址最近的若干个取件点以供用户选择,解决了由于用户收货地址周围存在新开设的取件点或包裹量较少的取件点或用户输入的收货地址不规范导致无法推荐取件点的问题。
可选地,在本申请中,所述步骤204进一步可以包括:
子步骤2041,将所述收货地址标准化。
在本申请实施例中,对收货地址标准化的目的是对相似的地址或用户输入不规范的地址进行统一标准化,减少模型中键值数量,标准化举例如下:
Figure BDA0001349604200000191
收货地址:浙江杭州西湖区蒋村街道西溪花园紫菱苑16栋3单元202室。
Figure BDA0001349604200000192
标准化后:浙江省杭州市西湖区蒋村街道西溪花园紫菱苑16栋。
子步骤2042,获取标准化后的收货地址的经纬度。
在该步骤中,可以通过网络地图获取标准化后的收货地址的经纬度,用于与地址哈希模型中的数据进行匹配。
子步骤2043,将所述提取的经纬度在地址哈希模型中进行匹配,确定离所述经纬度设定距离内的一个或多个取件点信息。
在本申请实施例中,地址哈希模型基于Geohash算法,该算法为一种将经纬度转换成字符串的方法,并且使得在大部分情况下,字符串前缀匹配越多的距离越近。通过将收货地址的经纬度导入预先训练得到的地址哈希模型,匹配出预设公里范围以内的取件点,并且根据经纬度计算出推荐取件点距离收货地址的公里数。
子步骤2044,从所述一个或多个取件点信息中选择距离收货地址最近的至少一个。
步骤205,将所述取件点信息发送至客户端。
该步骤可以参考步骤103,此处不再赘述。
综上所述,本申请实施例提供的一种取件点地址推荐方法,通过获取收货地址,并根据收货地址,利用预设的取件点推荐模型确定取件点信息,并通过逻辑回归算法计算取件点信息对应的权重,该取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得,当确定取件点信息后,根据权重值将取件点信息排列后返回至客户端,若没有确定取件点信息,则将收货地址结构化后,通过预设的地址哈希模型进行进一步确定对应的取件点信息,并将取件点信息返回至客户端。由于取件点的设立位置具有社区性和区域性,且取件点推荐模型中大量的用户历史数据包含了用户的使用习惯,即某一社区或区域的用户在选择需要派送快递的取件点时通常会偏向于选择某一指定取件点,则当用户输入的收货地址落入该社区或区域范围内时,服务器会根据该社区或区域用户曾经的历史收货地址对应的取件点进行推荐,这样的推荐结果更加具有人性化,解决了单纯通过网络地图定位离收货地址最近的取件点进行推荐时,由于网络地图存在数据误差而导致推荐结果不准确的问题,也降低了只根据距离进行推荐而导致推荐的取件点与收货地址之间存在地理隔离物的几率,取得了提高推荐结果的精确度以及使推荐内容更加人性化的有益效果。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依据本申请实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本申请实施例所必须的。
参照图4,示出了本申请一个具体示例中的一种取件点地址推荐装置的结构图,具体可以包括如下模块:
地址获取模块301,用于获取收货地址。
推荐信息确定模块302,用于根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得。
推荐信息返回模块303,用于将所述取件点信息发送至客户端。
本申请提供了一种取件点地址推荐装置,通过获取收货地址,并根据收货地址,利用预设的取件点推荐模型确定取件点信息,该取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得,当确定取件点信息后,将取件点信息返回至客户端。由于取件点的设立位置具有社区性和区域性,且取件点推荐模型中大量的用户历史数据包含了用户的使用习惯,即某一社区或区域的用户在选择需要派送快递的取件点时通常会偏向于选择某一指定取件点,则当用户输入的收货地址落入该社区或区域范围内时,服务器会根据该社区或区域用户曾经的历史收货地址对应的取件点进行推荐,这样的推荐结果更加具有人性化,解决了单纯通过网络地图定位离收货地址最近的取件点进行推荐时,由于网络地图存在数据误差而导致推荐结果不准确的问题,也降低了只根据距离进行推荐而导致推荐的取件点与收货地址之间存在地理隔离物的几率,取得了提高推荐结果的精确度以及使推荐内容更加人性化的有益效果。
参照图5,示出了本申请一个具体示例中的一种取件点地址推荐装置的具体结构图,具体可以包括如下模块:
模型训练模块401,用于根据已派送快递的历史收货地址及对应的取件点信息训练获得所述取件点推荐模型。
可选的,模型训练模块401还包括:
第一提取子模块,用于基于至少一个N元特征模板,针对已派送快递的历史收货地址,抽取相应个数的N元特征。
可选的,第一提取子模块还包括:
分词单元,用于对所述收货地址进行分词处理,得到至少一个分词。
确定单元,用于按照预设的结构化识别规则,确定各分词的结构化语义标签。
特征生成单元,用于将所述至少一个N元特征模板中的结构化语义标签,分别与各分词的结构化语义标签进行匹配,以获取相应的N元特征。
训练特征生成子模块,用于将每个N元特征与所述历史收货地址对应的取件点信息组合为训练特征。
训练子模块,用于利用所述训练特征训练文本分类模型以获得所述取件点推荐模型。
可选的,训练子模块还可以包括:
文本分类模型生成单元,用于针对每个簇,分别采用预设逻辑回归算法训练文本分类模型。
取件点推荐模型生成单元,用于将各个簇的文本分类模型进行整合,获得所述取件点推荐模型。
簇聚合模块402,用于将各训练特征按预设规则聚合为至少一个簇。
可选的,簇聚合模块402还包括:
簇聚合子模块,用于将具有相同N元特征的训练特征、以及具有相同取件点信息的训练特征聚合到一个簇。
地址获取模块403,用于获取收货地址。
推荐信息确定模块404,用于根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得。
可选的,推荐信息确定模块404还包括:
第二提取子模块,用于基于所述至少一个N元特征模板,针对所述收货地址抽取相应个数的N元特征。
第一匹配子模块,用于将每个N元特征单独输入所述取件点推荐模型,获得输出结果。
推荐子模块,用于当各输出结果中的一个或多个包括取件点信息及其权重时,根据所述取件点信息及其权重推荐至少一个取件点信息。
可选的,推荐子模块还包括:
第一推荐单元,用于当各输出结果中的一个或多个输出结果中,累计只包括一个取件点信息及其权重时,则直接对所述取件点信息及其权重进行推荐。
第二推荐单元,用于当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,则对多个取件点信息及其权重按照同一取件点信息进行归并,并对归并后的取件点信息及其权重进行推荐。
可选的,第二推荐单元还包括:
权重累加子单元,用于当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,对多个取件点信息及其权重中,属于同一取件点信息的权重进行累加,获得累加权重。
权重映射子单元,用于针对每个取件点信息的累加权重,采用平滑映射函数将所述累加权重映射为指定区间范围的映射权重。
排序子单元,用于以各取件点信息的映射权重对所述取件点信息进行排序。
选择子单元,用于从排序后的取件点信息中选择至少一个取件点信息。
距离推荐模块405,用于当利用预设取件点推荐模型未确定出取件点信息时,则利用地址哈希模型确定离所述收货地址距离最近的至少一个取件点信息。
可选的,距离推荐模块还包括:
地址标准化子模块,用于将所述收货地址标准化。
经纬度获取子模块,用于获取标准化后的收货地址的经纬度。
第二匹配子模块,用于将所述提取的经纬度在地址哈希模型中进行匹配,确定离所述经纬度设定距离内的一个或多个取件点信息。
选择子模块,用于从所述一个或多个取件点信息中选择距离收货地址最近的至少一个。
推荐信息返回模块406,用于将所述取件点信息发送至客户端。
综上所述,本申请实施例提供的一种取件点地址推荐装置,通过获取收货地址,并根据收货地址,利用预设的取件点推荐模型确定取件点信息,并通过逻辑回归算法计算取件点信息对应的权重,该取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得,当确定取件点信息后,根据权重值将取件点信息排列后返回至客户端,若没有确定取件点信息,则将收货地址结构化后,通过预设的地址哈希模型进行进一步确定对应的取件点信息,并将取件点信息返回至客户端。由于取件点的设立位置具有社区性和区域性,且取件点推荐模型中大量的用户历史数据包含了用户的使用习惯,即某一社区或区域的用户在选择需要派送快递的取件点时通常会偏向于选择某一指定取件点,则当用户输入的收货地址落入该社区或区域范围内时,服务器会根据该社区或区域用户曾经的历史收货地址对应的取件点进行推荐,这样的推荐结果更加具有人性化,解决了单纯通过网络地图定位离收货地址最近的取件点进行推荐时,由于网络地图存在数据误差而导致推荐结果不准确的问题,也降低了只根据距离进行推荐而导致推荐的取件点与收货地址之间存在地理隔离物的几率,取得了提高推荐结果的精确度以及使推荐内容更加人性化的有益效果。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
图6是本申请实施例提供的一种服务器的结构示意图。参见图6,服务器500可以用于实施上述实施例中提供的取件点地址推荐方法。该服务器500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)522(例如,一个或一个以上处理器)和存储器532,一个或一个以上存储应用程序542或数据544的存储介质530(例如一个或一个以上海量存储设备)。其中,存储器532和存储介质530可以是短暂存储的或持久存储的。存储在存储介质530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器522可以设置为与存储介质530通信,在服务器500上执行存储介质530中的一系列指令操作。
服务器500还可以包括一个或一个以上电源526,一个或一个以上有线或无线网络接口550,一个或一个以上输入输出接口558,一个或一个以上键盘556,和/或,一个或一个以上操作系统541,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。其中,中央处理器522可以在服务器500上执行以下操作的指令:
获取收货地址;
根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得;
将所述取件点信息发送至客户端。
可选地,该一个或多个模块可以具有如下功能:
根据已派送快递的历史收货地址及对应的取件点信息训练获得所述取件点推荐模型。
可选的,基于至少一个N元特征模板,针对已派送快递的历史收货地址,抽取相应个数的N元特征;
将每个N元特征与所述历史收货地址对应的取件点信息组合为训练特征;
利用所述训练特征训练文本分类模型以获得所述取件点推荐模型。
可选的,将各训练特征按预设规则聚合为至少一个簇。
可选的,将具有相同N元特征的训练特征、以及具有相同取件点信息的训练特征聚合到一个簇。
可选的,针对每个簇,分别采用预设逻辑回归算法训练文本分类模型;
将各个簇的文本分类模型进行整合,获得所述取件点推荐模型。
可选的,基于所述至少一个N元特征模板,针对所述收货地址抽取相应个数的N元特征;
将每个N元特征单独输入所述取件点推荐模型,获得输出结果;
当各输出结果中的一个或多个包括取件点信息及其权重时,根据所述取件点信息及其权重推荐至少一个取件点信息。
可选的,当各输出结果中的一个或多个输出结果中,累计只包括一个取件点信息及其权重时,则直接对所述取件点信息及其权重进行推荐;
当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,则对多个取件点信息及其权重按照同一取件点信息进行归并,并对归并后的取件点信息及其权重进行推荐。
可选的,当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,对多个取件点信息及其权重中,属于同一取件点信息的权重进行累加,获得累加权重;
针对每个取件点信息的累加权重,采用平滑映射函数将所述累加权重映射为指定区间范围的映射权重;
以各取件点信息的映射权重对所述取件点信息进行排序;
从排序后的取件点信息中选择至少一个取件点信息。
可选的,对所述收货地址进行分词处理,得到至少一个分词;
按照预设的结构化识别规则,确定各分词的结构化语义标签;
将所述至少一个N元特征模板中的结构化语义标签,分别与各分词的结构化语义标签进行匹配,以获取相应的N元特征。
可选的,当利用预设取件点推荐模型未确定出取件点信息时,则利用地址哈希模型确定离所述收货地址距离最近的至少一个取件点信息。
可选的,将所述收货地址标准化;
获取标准化后的收货地址的经纬度;
将所述提取的经纬度在地址哈希模型中进行匹配,确定离所述经纬度设定距离内的一个或多个取件点信息;
从所述一个或多个取件点信息中选择距离收货地址最近的至少一个。
一种装置其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行一种取件点地址推荐方法。
本申请还提供一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行一种取件点地址推荐方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本申请所提供的一种取件点地址推荐方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (22)

1.一种取件点地址推荐方法,其特征在于,包括:
获取收货地址;
根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得;
将所述取件点信息发送至客户端;
所述根据所述收货地址,利用设置的取件点推荐模型确定取件点信息,包括:
基于至少一个N元特征模板,针对所述收货地址抽取相应个数的N元特征;
将每个N元特征单独输入所述取件点推荐模型,获得输出结果;
当各输出结果中的一个或多个输出结果中,累计只包括一个取件点信息及其权重时,则直接对所述取件点信息及其权重进行推荐;
当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,则对多个取件点信息及其权重按照同一取件点信息进行归并,并对归并后的取件点信息及其权重进行推荐。
2.根据权利要求1所述的方法,其特征在于,还包括:
根据已派送快递的历史收货地址及对应的取件点信息训练获得所述取件点推荐模型。
3.根据权利要求2所述的方法,其特征在于,所述根据已派送快递的历史收货地址及对应的取件点信息训练获得所述取件点推荐模型的步骤,包括:
基于至少一个N元特征模板,针对已派送快递的历史收货地址,抽取相应个数的N元特征;
将每个N元特征与所述历史收货地址对应的取件点信息组合为训练特征;
利用所述训练特征训练文本分类模型以获得所述取件点推荐模型。
4.根据权利要求3所述的方法,其特征在于,还包括:
将各训练特征按预设规则聚合为至少一个簇。
5.根据权利要求4所述的方法,其特征在于,所述将各训练特征按预设规则聚合为至少一个簇的步骤,包括:
将具有相同N元特征的训练特征、以及具有相同取件点信息的训练特征聚合到一个簇。
6.根据权利要求4所述的方法,其特征在于,当所述簇有多个时,所述利用所述训练特征训练文本分类模型以获得所述取件点推荐模型的步骤,包括:
针对每个簇,分别采用预设逻辑回归算法训练文本分类模型;
将各个簇的文本分类模型进行整合,获得所述取件点推荐模型。
7.根据权利要求1所述的方法,所述当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,则对多个取件点信息及其权重按照同一取件点信息进行归并,并对归并后的取件点信息及其权重进行推荐的步骤,包括:
当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,对多个取件点信息及其权重中,属于同一取件点信息的权重进行累加,获得累加权重;
针对每个取件点信息的累加权重,采用平滑映射函数将所述累加权重映射为指定区间范围的映射权重;
以各取件点信息的映射权重对所述取件点信息进行排序;
从排序后的取件点信息中选择至少一个取件点信息。
8.根据权利要求3所述的方法,其特征在于,所述基于至少一个N元特征模板,针对已派送快递的历史收货地址抽取相应个数的N元特征的步骤,包括:
对所述收货地址进行分词处理,得到至少一个分词;
按照预设的结构化识别规则,确定各分词的结构化语义标签;
将所述至少一个N元特征模板中的结构化语义标签,分别与各分词的结构化语义标签进行匹配,以获取相应的N元特征。
9.根据权利要求1所述的方法,其特征在于,还包括:
当利用预设取件点推荐模型未确定出取件点信息时,则利用地址哈希模型确定离所述收货地址距离最近的至少一个取件点信息。
10.根据权利要求9所述的方法,其特征在于,所述利用地址哈希模型确定离所述收货地址距离最近的至少一个取件点信息的步骤,包括:
将所述收货地址标准化;
获取标准化后的收货地址的经纬度;
将所述获取的经纬度在地址哈希模型中进行匹配,确定离所述经纬度设定距离内的一个或多个取件点信息;
从所述一个或多个取件点信息中选择距离收货地址最近的至少一个。
11.一种取件点地址推荐装置,其特征在于,包括:
地址获取模块,用于获取收货地址;
推荐信息确定模块,用于根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得;
推荐信息返回模块,用于将所述取件点信息发送至客户端;
所述推荐信息确定模块,包括:
第二提取子模块,用于基于至少一个N元特征模板,针对所述收货地址抽取相应个数的N元特征;
第一匹配子模块,用于将每个N元特征单独输入所述取件点推荐模型,获得输出结果;
第一推荐单元,用于当各输出结果中的一个或多个输出结果中,累计只包括一个取件点信息及其权重时,则直接对所述取件点信息及其权重进行推荐;
第二推荐单元,用于当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,则对多个取件点信息及其权重按照同一取件点信息进行归并,并对归并后的取件点信息及其权重进行推荐。
12.根据权利要求11所述的装置,其特征在于,还包括:
模型训练模块,用于根据已派送快递的历史收货地址及对应的取件点信息训练获得所述取件点推荐模型。
13.根据权利要求12所述的装置,其特征在于,所述模型训练模块,包括:
第一提取子模块,用于基于至少一个N元特征模板,针对已派送快递的历史收货地址,抽取相应个数的N元特征;
训练特征生成子模块,用于将每个N元特征与所述历史收货地址对应的取件点信息组合为训练特征;
训练子模块,用于利用所述训练特征训练文本分类模型以获得所述取件点推荐模型。
14.根据权利要求13所述的装置,其特征在于,还包括:
簇聚合模块,用于将各训练特征按预设规则聚合为至少一个簇。
15.根据权利要求14所述的装置,其特征在于,所述簇聚合模块,包括:
簇聚合子模块,用于将具有相同N元特征的训练特征、以及具有相同取件点信息的训练特征聚合到一个簇。
16.根据权利要求14所述的装置,其特征在于,当所述簇有多个时,所述训练子模块,包括:
文本分类模型生成单元,用于针对每个簇,分别采用预设逻辑回归算法训练文本分类模型;
取件点推荐模型生成单元,用于将各个簇的文本分类模型进行整合,获得所述取件点推荐模型。
17.根据权利要求11所述的装置,其特征在于,所述第二推荐单元,包括:
权重累加子单元,用于当各输出结果中的一个或多个输出结果中,累计包括多个取件点信息及其权重时,对多个取件点信息及其权重中,属于同一取件点信息的权重进行累加,获得累加权重;
权重映射子单元,用于针对每个取件点信息的累加权重,采用平滑映射函数将所述累加权重映射为指定区间范围的映射权重;
排序子单元,用于以各取件点信息的映射权重对所述取件点信息进行排序;
选择子单元,用于从排序后的取件点信息中选择至少一个取件点信息。
18.根据权利要求13所述的装置,其特征在于,所述第一提取子模块,包括:
分词单元,用于对所述收货地址进行分词处理,得到至少一个分词;
确定单元,用于按照预设的结构化识别规则,确定各分词的结构化语义标签;
特征生成单元,用于将所述至少一个N元特征模板中的结构化语义标签,分别与各分词的结构化语义标签进行匹配,以获取相应的N元特征。
19.根据权利要求11所述的装置,其特征在于,还包括:
距离推荐模块,用于当利用预设取件点推荐模型未确定出取件点信息时,则利用地址哈希模型确定离所述收货地址距离最近的至少一个取件点信息。
20.根据权利要求19所述的装置,其特征在于,所述距离推荐模块,包括:
地址标准化子模块,用于将所述收货地址标准化;
经纬度获取子模块,用于获取标准化后的收货地址的经纬度;
第二匹配子模块,用于将所述获取的经纬度在地址哈希模型中进行匹配,确定离所述经纬度设定距离内的一个或多个取件点信息;
选择子模块,用于从所述一个或多个取件点信息中选择距离收货地址最近的至少一个。
21.一种取件点地址推荐装置,其特征在于,包括:
一个或多个处理器;和
一个或多个模块,所述一个或多个模块存储于存储器中并被配置成由所述一个或多个处理器执行,其中,所述一个或多个模块具有如下功能:
获取收货地址;
根据所述收货地址,利用设置的取件点推荐模型确定取件点信息;所述取件点推荐模型根据已派送快递的历史收货地址和对应的取件点信息训练获得;
将所述取件点信息发送至客户端;
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如权利要求1至10任一项所述的方法。
22.一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得装置执行如权利要求1至10任一项所述的方法。
CN201710570755.9A 2017-07-13 2017-07-13 一种取件点地址推荐方法及装置 Active CN109255564B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710570755.9A CN109255564B (zh) 2017-07-13 2017-07-13 一种取件点地址推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710570755.9A CN109255564B (zh) 2017-07-13 2017-07-13 一种取件点地址推荐方法及装置

Publications (2)

Publication Number Publication Date
CN109255564A CN109255564A (zh) 2019-01-22
CN109255564B true CN109255564B (zh) 2022-09-06

Family

ID=65051749

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710570755.9A Active CN109255564B (zh) 2017-07-13 2017-07-13 一种取件点地址推荐方法及装置

Country Status (1)

Country Link
CN (1) CN109255564B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109886632A (zh) * 2019-02-27 2019-06-14 杭州优行科技有限公司 取派件方法、装置及服务器
CN110532546B (zh) * 2019-07-29 2023-03-31 中国电子科技集团公司第五十四研究所 一种融合地理位置和文本相似性的警情自动下发方法
CN110795515B (zh) * 2019-08-26 2022-04-12 腾讯科技(深圳)有限公司 兴趣点poi的处理方法、装置、电子设备及计算机存储介质
CN110728557A (zh) * 2019-09-30 2020-01-24 张文 商品代购方法、装置、系统和计算机存储介质
CN110826318A (zh) * 2019-10-14 2020-02-21 浙江数链科技有限公司 物流信息识别的方法、设备、计算机设备和存储介质
CN110851477B (zh) * 2019-10-16 2022-09-09 浙江大搜车软件技术有限公司 流数据处理方法、装置、计算机设备和存储介质
CN111144818B (zh) * 2019-12-27 2023-06-20 合肥美的智能科技有限公司 物流作业方法、控制装置、电子设备及可读存储介质
CN111428933B (zh) * 2020-03-30 2022-10-04 江苏满运软件科技有限公司 物流地址推荐方法、系统、设备及存储介质
CN111967808B (zh) * 2020-04-30 2023-11-24 上海寻梦信息技术有限公司 确定物流对象收货方式的方法、装置、电子设备及存储介质
CN112734347B (zh) * 2021-04-06 2021-06-22 杭州拼便宜网络科技有限公司 一种物流配送方法、装置、设备及存储介质
CN113139028A (zh) * 2021-04-23 2021-07-20 上海中通吉网络技术有限公司 配送地址的预测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329147A (zh) * 2010-11-04 2013-09-25 数字标记公司 基于智能手机的方法和系统
CN106897899A (zh) * 2017-01-24 2017-06-27 武汉奇米网络科技有限公司 一种将客户分群后个性化推荐商品的方法及系统

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7031959B2 (en) * 2000-11-17 2006-04-18 United States Postal Service Address matching
CN101350013A (zh) * 2007-07-18 2009-01-21 北京灵图软件技术有限公司 一种地理信息的搜索方法和系统
CN101719128B (zh) * 2009-12-31 2012-05-23 浙江工业大学 一种基于模糊匹配的中文地理编码确定方法
CN102289467A (zh) * 2011-07-22 2011-12-21 浙江百世技术有限公司 确定目标网点的方法和装置
CN103997505B (zh) * 2013-02-18 2018-10-23 阿里巴巴集团控股有限公司 一种业务对象的自提点的信息推荐方法以及装置
CN103440311A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种地名实体识别的方法及系统
CN106156145A (zh) * 2015-04-13 2016-11-23 阿里巴巴集团控股有限公司 一种地址数据的管理方法和装置
CN106296059B (zh) * 2015-06-02 2020-08-25 菜鸟智能物流控股有限公司 派送网点确定方法及设备
CN106372821B (zh) * 2015-07-21 2020-05-08 菜鸟智能物流控股有限公司 确定服务站点信息的方法及装置
CN106557485B (zh) * 2015-09-25 2020-11-06 北京国双科技有限公司 一种选取文本分类训练集的方法及装置
CN106569994B (zh) * 2015-10-10 2019-02-26 阿里巴巴集团控股有限公司 地址的分析方法及装置
CN105373588B (zh) * 2015-10-14 2019-05-24 浙江百世技术有限公司 快递分拣装置及方法
CN105550291B (zh) * 2015-12-10 2019-05-31 百度在线网络技术(北京)有限公司 文本分类方法和装置
CN105913273A (zh) * 2015-12-14 2016-08-31 乐视网信息技术(北京)股份有限公司 智能推荐的全端显示方法及装置
CN106251164A (zh) * 2016-03-21 2016-12-21 上海驴徒电子商务有限公司 一种景区推荐方法及系统
CN106296344B (zh) * 2016-07-29 2020-01-07 北京小米移动软件有限公司 恶意地址识别方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103329147A (zh) * 2010-11-04 2013-09-25 数字标记公司 基于智能手机的方法和系统
CN106897899A (zh) * 2017-01-24 2017-06-27 武汉奇米网络科技有限公司 一种将客户分群后个性化推荐商品的方法及系统

Also Published As

Publication number Publication date
CN109255564A (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
CN109255564B (zh) 一种取件点地址推荐方法及装置
CN109145219B (zh) 基于互联网文本挖掘的兴趣点有效性判断方法和装置
US11734717B2 (en) Dynamic predictive similarity grouping based on vectorization of merchant data
CN106296059B (zh) 派送网点确定方法及设备
CN112329467B (zh) 地址识别方法、装置、电子设备以及存储介质
TWI703862B (zh) 內容推薦方法及裝置
CN103455545A (zh) 社交网络用户的位置估计的方法和系统
CN109389270B (zh) 一种物流对象确定方法、装置和机器可读介质
CN110147421B (zh) 一种目标实体链接方法、装置、设备及存储介质
CN104731958A (zh) 一种面向用户需求倾向的云制造服务推荐方法
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN112650858A (zh) 应急协助信息的获取方法、装置、计算机设备及介质
CN113268615A (zh) 资源标签生成方法、装置、电子设备及存储介质
CN104077288B (zh) 网页内容推荐方法和网页内容推荐设备
CN110825889A (zh) 一种宣传信息交互方法、装置、电子设备及存储介质
CN112069824B (zh) 基于上下文概率和引证的地域识别方法、装置及介质
CN114036921A (zh) 一种政策信息匹配方法和装置
CN116308684B (zh) 一种网购平台店铺信息推送方法及系统
CN111639700A (zh) 目标相似度识别方法、装置、计算机设备及可读存储介质
CN114297235A (zh) 风险地址识别方法、系统及电子设备
US20220188292A1 (en) Data processing method, apparatus, electronic device and readable storage medium
CN113762846B (zh) 一种面单文本判别方法和装置
JP2003036261A (ja) 文章自動分類装置、文章自動分類プログラム、文章自動分類方法及び文章自動分類プログラムを記録したコンピュータ読取可能な記録媒体
CN111723164B (zh) 地址信息的处理方法和装置
CN113779429A (zh) 交通拥堵态势预测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant