CN112465036A - 地址匹配模型的训练方法、代收地址确定方法及相关设备 - Google Patents

地址匹配模型的训练方法、代收地址确定方法及相关设备 Download PDF

Info

Publication number
CN112465036A
CN112465036A CN202011373599.5A CN202011373599A CN112465036A CN 112465036 A CN112465036 A CN 112465036A CN 202011373599 A CN202011373599 A CN 202011373599A CN 112465036 A CN112465036 A CN 112465036A
Authority
CN
China
Prior art keywords
address
sample
training
neural network
receiving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011373599.5A
Other languages
English (en)
Inventor
谷东兴
郑德鹏
王国印
田冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Xunmeng Information Technology Co Ltd
Original Assignee
Shanghai Xunmeng Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Xunmeng Information Technology Co Ltd filed Critical Shanghai Xunmeng Information Technology Co Ltd
Priority to CN202011373599.5A priority Critical patent/CN112465036A/zh
Publication of CN112465036A publication Critical patent/CN112465036A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping
    • G06Q10/0838Historical data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/08Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
    • G06Q10/083Shipping

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

本发明涉及物流技术领域,提供一种地址匹配模型的训练方法、代收地址确定方法及相关设备。地址匹配模型的训练方法包括:获得历史进入过代收点的收件地址;对收件地址进行归类,形成多组样本数据,每组样本数据包括一目标样本地址、与目标样本地址进入相同代收点的正样本地址及与目标样本地址进入不同代收点的负样本地址;基于每组样本数据训练一深度神经网络模型,深度神经网络模型最大化目标样本地址相对负样本地址的第一距离与目标样本地址相对正样本地址的第二距离之间的差值;以及,优化深度神经网络模型,生成地址匹配模型。本发明能够根据地址匹配模型确定准确的代收地址,提升用户的快递代收体验,并提升物流配送效率。

Description

地址匹配模型的训练方法、代收地址确定方法及相关设备
技术领域
本发明涉及物流技术领域,具体地说,涉及一种地址匹配模型的训练方法、代收地址确定方法及相关设备。
背景技术
随着网购的发展,为解决用户不方便接收快递的问题,逐渐衍生出快递代收服务。快递代收服务允许用户将快递包裹存放于代收点,等到方便时取件,提升用户的取件便利性。
但是,由于很多用户不清楚代收点的准确地址,导致快递代收服务的使用体验并不好。具体来说,目前的快递代收场景主要包括两种:
一种是用户在下单时申请代收快递,则需要用户输入准确的代收地址,或从系统给出的一系列代收地址中选择;但对于用户来说,即使其知道家庭/公司附近存在代收点,也难以准确描述出代收点的具体地址,影响了快递代收服务的正常使用;
另一种是快递员在配送时发现收件地址无人接收,再与用户沟通确认快递存放于何处;此时,一方面如上所述,用户很大可能并不清楚代收点的具体地址,另一方面也打扰了用户的正常生活和工作,影响用户体验,并且也会极大影响物流配送效率。
需要说明的是,上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种地址匹配模型的训练方法、代收地址确定方法及相关设备,能够根据地址匹配模型确定准确的代收地址,提升用户的快递代收体验,并提升物流配送效率。
本发明的一个方面提供一种地址匹配模型的训练方法,包括:获得历史进入过代收点的收件地址;对所述收件地址进行归类,形成多组样本数据,每组所述样本数据包括一目标样本地址、与所述目标样本地址进入相同代收点的正样本地址及与所述目标样本地址进入不同代收点的负样本地址;基于每组所述样本数据训练一深度神经网络模型,所述深度神经网络模型最大化所述目标样本地址相对所述负样本地址的第一距离与所述目标样本地址相对所述正样本地址的第二距离之间的差值;以及,优化所述深度神经网络模型,生成地址匹配模型。
在一些实施例中,每组所述样本数据中,所述目标样本地址自所述收件地址中随机抽取,所述负样本地址与所述目标样本地址隶属相同配送区域且具有不同末端地址信息。
在一些实施例中,根据所述负样本地址携带的快递员信息与所述目标样本地址携带的快递员信息相同,确定所述负样本地址与所述目标样本地址隶属相同配送区域;以及,所述末端地址信息为小区信息或街道信息。
在一些实施例中,所述深度神经网络模型包括自注意力网络和三元组损失函数,所述基于每组所述样本数据训练一深度神经网络模型,包括:通过所述自注意力网络提取所述目标样本地址、所述正样本地址和所述负样本地址的特征向量;通过所述三元组损失函数增大所述第一距离,减小所述第二距离,并使所述差值大于一最小阈值。
在一些实施例中,所述优化所述深度神经网络模型,包括:通过梯度下降法,减小所述三元组损失函数的损失值。
在一些实施例中,所述形成多组样本数据后,还包括对每组所述样本数据进行向量化处理;所述基于每组所述样本数据训练一深度神经网络模型时,将向量化处理后的所述样本数据输入所述深度神经网络模型。
在一些实施例中,所述对每组所述样本数据进行向量化处理,包括:对所述目标样本地址、所述正样本地址和所述负样本地址进行预处理,分别生成预设格式的地址文本;构造数据字典,将每个所述地址文本中的字词转换成数字序列;将所述数字序列中的每个字词对应的数字转换成向量,并按每个所述地址文本的字词顺序拼接转换后的向量,生成分别对应所述目标样本地址、所述正样本地址和所述负样本地址的向量矩阵。
本发明的又一个方面提供一种代收地址确定方法,包括:接收基于一当前收件地址的代收请求;对所述当前收件地址进行预处理,输入经上述任意实施例所述的训练方法训练生成的地址匹配模型,获得历史进入过代收点的收件地址中,与所述当前收件地址距离最近的一匹配收件地址;以及将所述匹配收件地址的代收点,确定为所述当前收件地址的代收地址。
在一些实施例中,所述确定为所述当前收件地址的代收地址后,还包括:获得发出所述代收请求的用户端的当前所在地址;基于地图服务,获得自所述当前所在地址,经所述代收地址,到达所述当前收件地址的取件路线,发送至所述用户端。
在一些实施例中,获得所述取件路线后,还包括:判断所述取件路线与所述用户端的自所述当前所在地址至所述当前收件地址的历史轨迹是否重叠;若否,还将所述历史轨迹及所述代收地址相对所述历史轨迹的位置信息发送至所述用户端。
本发明的又一个方面提供一种地址匹配模型的训练装置,包括:样本采集模块,配置为获得历史进入过代收点的收件地址;样本处理模块,配置为对所述收件地址进行归类,形成多组样本数据,每组所述样本数据包括一目标样本地址、与所述目标样本地址进入相同代收点的正样本地址及与所述目标样本地址进入不同代收点的负样本地址;模型训练模块,配置为基于每组所述样本数据训练一深度神经网络模型,所述深度神经网络模型最大化所述目标样本地址相对所述负样本地址的第一距离与所述目标样本地址相对所述正样本地址的第二距离之间的差值;以及模型优化模块,配置为优化所述深度神经网络模型,生成地址匹配模型。
本发明的又一个方面提供一种代收地址确定装置,包括:代收请求响应模块,配置为接收基于一当前收件地址的代收请求;匹配地址计算模块,配置为对所述当前收件地址进行预处理,输入经上述任意实施例所述的训练方法训练生成的地址匹配模型,获得历史进入过代收点的收件地址中,与所述当前收件地址距离最近的一匹配收件地址;以及代收地址确定模块,配置为将所述匹配收件地址的代收点,确定为所述当前收件地址的代收地址。
本发明的又一个方面提供一种电子设备,包括:一处理器;一存储器,存储有可执行指令;其中,所述可执行指令被所述处理器执行时,实现如上述任意实施例所述的地址匹配模型的训练方法,和/或,实现如上述任意实施例所述的代收地址确定方法。
本发明的又一个方面提供一种计算机可读的存储介质,存储有计算机程序,所述计算机程序被执行时实现如上述任意实施例所述的地址匹配模型的训练方法,和/或,实现如上述任意实施例所述的代收地址确定方法。
本发明与现有技术相比的有益效果至少包括:
基于历史代收数据,将与目标收件地址进入相同代收点的收件地址作为正样本,进入不同代收点的收件地址作为负样本,训练深度神经网络模型,使深度神经网络模型学习到目标收件地址与正样本之间的关联及与负样本之间的区别,最大化目标样本地址分别与正负样本之间的距离的差值,优化形成地址匹配模型;
从而,采用训练生成的地址匹配模型,能够根据用户的收件地址,计算出最接近且进入过代收点的匹配地址信息,根据该匹配地址信息的代收点,即可自动确定用户的收件地址的准确代收信息,用户无需知道代收点的具体地址即可享受快递代收服务,提升用户的使用体验,并提升物流配送效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出本发明实施例中地址匹配模型的训练方法的步骤示意图;
图2示出本发明实施例中地址匹配模型的训练装置的模块示意图;
图3示出本发明一实施例中代收地址确定方法的步骤示意图;
图4示出本发明又一实施例中代收地址确定方法的步骤示意图;
图5示出本发明实施例中向用户端推送历史轨迹及代收地址相对历史轨迹的位置信息的场景示意图;
图6示出本发明实施例中代收地址确定装置的模块示意图;
图7示出本发明实施例中电子设备的结构示意图;以及
图8示出本发明实施例中计算机可读的存储介质的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式。相反,提供这些实施方式使本发明全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
下面实施例中的步骤序号仅用于表示不同的执行内容,并不严格限定步骤之间的执行顺序。具体描述时使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。需要说明的是,在不冲突的情况下,本发明的实施例及不同实施例中的特征可以相互组合。
图1示出实施例中地址匹配模型的训练方法的主要步骤,参照图1所示,本实施例中地址匹配模型的训练方法包括:在步骤S110中,获得历史进入过代收点的收件地址;在步骤S120中,对收件地址进行归类,形成多组样本数据,每组样本数据包括一目标样本地址、与目标样本地址进入相同代收点的正样本地址及与目标样本地址进入不同代收点的负样本地址;在步骤S130中,基于每组样本数据训练一深度神经网络模型,深度神经网络模型最大化目标样本地址相对负样本地址的第一距离与目标样本地址相对正样本地址的第二距离之间的差值;以及在步骤S140中,优化深度神经网络模型,生成地址匹配模型。
上述的训练方法基于历史代收数据,将与目标收件地址进入相同代收点的收件地址作为正样本,进入不同代收点的收件地址作为负样本,训练深度神经网络模型,使深度神经网络模型学习到目标收件地址与正样本之间的关联及与负样本之间的区别,最大化目标样本地址分别与正负样本之间的距离的差值,并优化形成地址匹配模型;从而,采用训练生成的地址匹配模型,在实际应用场景中,能够根据用户的收件地址,计算出最接近且进入过代收点的匹配地址信息,根据该匹配地址信息的代收点,即可自动确定用户的收件地址的准确代收信息,用户无需知道代收点的具体地址即可享受快递代收服务,提升用户的使用体验,并能够提升物流配送效率。
下面结合具体的示例,对地址匹配模型的训练方法的各个步骤进行详细说明。
步骤S110中,历史进入过代收点,在物流记录中体现为签收地址与收件地址不一致,且签收地址为代收点的地址。具体来说,在物流配送活动中,收件地址指用户填写至快递单上的地址;若快递包裹存放至代收点,由代收点,而非用户本人签收,则实际的签收地址显示为代收点的地址,而非收件地址。因此,可以自电商平台/物流平台的所有历史配送数据中,获得签收地址与收件地址不一致,且签收地址为代收点的地址的相关历史代收数据,从中提取历史进入过代收点的收件地址,作为样本数据。
另外,为保证足够多的样本数据,同时解决数据分布不均匀的问题,采用过采样的方式扩充数据,以获得数量足够且分布均匀的样本数据。
步骤S120中,对采集到的样本数据进行处理,归类为包括目标样本地址、正样本地址和负样本地址的多组样本数据。形成每组样本数据时,先确定目标样本地址,再将与目标收件地址进入相同代收点的一收件地址确定为正样本地址,并将与目标收件地址进入不同代收点的一收件地址确定为负样本地址。
在一个实施例中,根据目标收件地址确定负样本地址时,采用同一个快递员配送的不同小区或者街道的收件地址作为对抗样本,即负样本地址,以提高同组样本数据中负样本地址与目标样本地址/正样本地址之间的区别性。
具体来说,每组样本数据中,目标样本地址自收件地址中随机抽取,负样本地址与目标样本地址隶属相同配送区域且具有不同末端地址信息。其中,根据负样本地址携带的快递员信息与目标样本地址携带的快递员信息相同,确定负样本地址与目标样本地址隶属相同配送区域;以及,末端地址信息为小区信息或街道信息。
进一步地,形成多组样本数据后,还包括对每组样本数据进行向量化处理;后续训练深度神经网络模型时,将向量化处理后的样本数据作为输入数据,对深度神经网络模型进行训练。
在一个实施例中,对每组样本数据进行向量化处理的过程具体包括:首先,对目标样本地址、正样本地址和负样本地址进行预处理,包括填充、截断、纠错等预处理操作,生成三个分别对应目标样本地址、正样本地址和负样本地址的预设格式的地址文本。接着,构造数据字典,根据数据字典的顺序生成索引,分别将三个地址文本中的字词转换成数字,完成文本序列到数字序列的转换。在将地址文本转换成数字序列时,可以字为单位,对地址文本中的每个字进行文本到数字的转换;或者,也可先对地址文本进行分词,再以词为单位,对地址文本中的每个词进行文本到数字的转换;然后按照地址文本中字/词的顺序拼接转换后的数字,生成数字序列。最后,将数字序列中的每个字/词对应的数字转换成向量,例如每个字/词映射为一个200维的向量,并按地址文本的字词顺序拼接转换后的向量,生成分别对应目标样本地址、正样本地址和负样本地址的向量矩阵。
步骤S130中,基于每组样本数据训练深度神经网络模型,深度神经网络模型可以学习每组样本数据中目标收件地址与正样本地址之间的关联及与负样本地址之间的区别,最大化目标样本地址分别与正负样本地址之间的距离的差值,使训练生成的地址匹配模型能够准确地表达目标样本地址与正样本地址之间的关联性,从而基于用户的收件地址,计算出最接近且进入过代收点的匹配地址信息。
在一个实施例中,深度神经网络模型基于自注意力(Self-Attention)网络和三元组损失函数(triplet-loss)构建,基于每组样本数据训练深度神经网络模型的过程具体包括:通过自注意力网络提取目标样本地址、正样本地址和负样本地址的特征向量;通过三元组损失函数增大目标样本地址与负样本地址之间的第一距离,减小目标样本地址与正样本地址之间的第二距离,并使第一距离与第二距离之间的差值大于一最小阈值。也即,深度神经网络模型通过学习,使目标样本地址与负样本地址之间的第一距离尽可能大,而使目标样本地址与正样本地址之间的第二距离尽可能小,且使第一距离与第二距离之间有一个最小间隔。
步骤S140中,对深度神经网络模型进行优化,具体是通过梯度下降法,减小三元组损失函数的损失值,以提高深度神经网络模型对目标样本地址、正样本地址和负样本地址进行向量化表示的准确性。
基于上述对地址匹配模型的训练方法的说明,在一个具体的训练示例中,一组样本数据包括:Anchor(锚示例,即目标样本地址):上海市长宁区金虹桥国际中心15楼、Positive(正示例,即正样本地址):上海市长宁区娄山关路233号15楼、以及Negative(负示例,即负样本地址):上海市长宁区娄山关路12号,其中Anchor是从历史代收数据中随机抽取的进入过代收点的一收件地址,Positive是与Anchor进入相同代收点的一收件地址,Negative是与Anchor进入不同代收点的一收件地址,且Negative优选地与Anchor指向同一快递员配送的不同小区或者街道。训练时,将Anchor、Positive和Negative三条收件地址作为一组训练样本,输入到深度神经网络模型中,使深度神经网络模型学习出三者的区别,并且得到该三条收件地址的向量化表示。
通过多组训练样本的训练,并且优化后,最终生成的地址匹配模型在实际应用场景中,可以对用户的收件地址进行向量化表示,并基于向量化表示的收件地址,与历史进入过代收点的收件地址进行相似度计算,找到与用户的收件地址距离最小且进入过代收点的匹配地址信息;基于地址匹配模型输出的匹配地址信息的代收点,即可确定用户的收件地址的准确代收信息,实现用户无需知道代收点的具体地址即可享受快递代收服务,提升用户的使用体验,并能够提升物流配送效率。
本发明实施例还提供一种地址匹配模型的训练装置,可用于实现上述实施例描述的地址匹配模型的训练方法。图2示出地址匹配模型的训练装置的主要模块,参照图2所示,本实施例中地址匹配模型的训练装置200包括:样本采集模块210,配置为获得历史进入过代收点的收件地址;样本处理模块220,配置为对收件地址进行归类,形成多组样本数据,每组样本数据包括一目标样本地址、与目标样本地址进入相同代收点的正样本地址及与目标样本地址进入不同代收点的负样本地址;模型训练模块230,配置为基于每组样本数据训练一深度神经网络模型,深度神经网络模型最大化目标样本地址相对负样本地址的第一距离与目标样本地址相对正样本地址的第二距离之间的差值;以及模型优化模块240,配置为优化深度神经网络模型,生成地址匹配模型。
进一步地,地址匹配模型的训练装置200还可包括实现上述任意地址匹配模型的训练方法实施例的其他流程步骤的模块,各个模块的具体原理可参照上述各训练方法实施例的描述,此处不再重复说明。
如上所述,经本实施例训练生成的地址匹配模型,在实际应用时可以对用户的收件地址进行准确的向量化表示,并基于向量化表示的收件地址,与历史进入过代收点的收件地址进行相似度计算,找到与用户的收件地址距离最近且进入过代收点的匹配地址信息;从而基于地址匹配模型输出的匹配地址信息的代收点,自动确定用户的收件地址的准确代收信息,使用户无需知道代收点的具体地址即可享受快递代收服务,提升用户的使用体验,并能够提升物流配送效率。
本发明实施例还提供一种代收地址确定方法,将经上述训练方法实施例训练生成的地址匹配模型应用至实际的代收地址确定场景,根据用户的收件地址确定出准确的代收地址。
图3示出实施例中代收地址确定方法的主要步骤,参照图3所示,本实施例中代收地址确定方法包括:在步骤S310中,接收基于一当前收件地址的代收请求;在步骤S320中,对当前收件地址进行预处理,输入经上述训练方法实施例训练生成的地址匹配模型,获得历史进入过代收点的收件地址中,与当前收件地址距离最近的一匹配收件地址;以及在步骤S330中,将匹配收件地址的代收点,确定为当前收件地址的代收地址。
步骤S310中,代收请求可以在下单时、或者包裹配送途中等任意用户需要代收快递的场景中,通过用户端触发订单页面的代收项发起。代收请求携带当前收件地址,以便根据当前收件地址,确定合理准确的代收地址。
步骤S320中,对当前收件地址进行预处理,包括填充、纠错等预处理操作,并对当前收件地址进行向量转换,生成能够输入地址匹配模型进行运算的向量矩阵。地址匹配模型经过自注意力网络层的特征向量提取和triplet-loss损失函数层的相似度计算,自历史进入过代收点的收件地址中筛选出与当前收件地址距离最近的一匹配收件地址。
步骤S330中,根据地址匹配模型输出的匹配收件地址,确定当前收件地址的代收地址,实现用户无需知道代收点的具体地址即可享受快递代收服务,从而提升用户的使用体验,并能够提升物流配送效率。
进一步地,考虑到用户在不清楚代收点的具体地址的情况下,即使获知了代收点的代收地址,仍无法清楚前往代收地址取件的具体路线,因此根据当前收件地址确定代收地址后,还可进一步向用户推送自其当前所在地址前往代收地址取件,并最终到达当前收件地址的路线信息,以方便用户取件,提升代收服务体验。
具体来说,参照图4所示,在一个实施例中,确定代收地址后,还包括:步骤S440,获得发出代收请求的用户端的当前所在地址;以及步骤S450,基于地图服务,获得自当前所在地址,经代收地址,到达当前收件地址的取件路线,发送至用户端。从而,用户根据接收到的取件路线,即可方便地从当前所在地址前往代收地址拿取快递包裹,并最终回到当前收件地址。
进一步地,上述向用户推送的取件路线若与用户的常用路线不同,反而会给用户造成不便,因此在一个实施例中,还判断取件路线是否符合用户的常用路线,若不符合则进一步向用户推送代收地址相对其常用路线的位置信息,以便用户根据推送的信息自主选择适合的取件方式,增加取件灵活性。
具体参照图4所示,获得取件路线后,还包括:步骤S460,判断取件路线与用户端的自当前所在地址至当前收件地址的历史轨迹是否重叠;用户端的自当前所在地址至当前收件地址的历史轨迹通常是用户的常用路线,例如是用户从公司回家的路线。步骤S470,若取件路线与历史轨迹不重叠,表明取件路线与用户的常用路线不同,因此还将历史轨迹及代收地址相对历史轨迹的位置信息发送至用户端,供用户根据推送的信息自主选择适合的取件方式。
图5示出实施例中向用户端推送历史轨迹及代收地址相对历史轨迹的位置信息的场景,参照图5所示,经计算发现,自用户端的当前所在地址510经代收地址530到达当前收件地址520的取件路线P2,与用户端的自当前所在地址510至当前收件地址520的历史轨迹P1并不重叠,也即代收地址530并不在历史轨迹P1上。此时,除向用户端推送取件路线P2外,还推送历史轨迹P1以及代收地址530相对历史轨迹P1的位置信息,用户可通过相关触发操作,例如双击取件路线P2,查看取件路线P2的具体驾车导航信息/公交乘坐信息等,或者双击代收地址530,查看代收地址530与当前收件地址520之间的具体驾车导航信息/公交乘坐信息等,实现使用户根据推送的信息自主选择适合的取件方式。
从而,上述的代收地址确定方法,能够通过训练好的代收地址匹配模型自动根据用户的当前收件地址确定合理准确的代收地址,使用户无需知道代收点的具体地址即可享受快递代收服务,并能进一步向用户推送代收地址相关的路线信息,以方便用户取件,提升用户体验。
本发明实施例还提供一种代收地址确定装置,可用于实现上述任意实施例描述的代收地址确定方法。图6示出实施例中代收地址确定装置的主要模块,参照图6所示,本实施例中代收地址确定装置600包括:代收请求响应模块610,配置为接收基于一当前收件地址的代收请求;匹配地址计算模块620,配置为对当前收件地址进行预处理,输入训练好的地址匹配模型,获得历史进入过代收点的收件地址中,与当前收件地址距离最近的一匹配收件地址;以及代收地址确定模块630,配置为将匹配收件地址的代收点,确定为当前收件地址的代收地址。
进一步地,代收地址确定装置600还可包括实现上述任意代收地址确定方法实施例的其他流程步骤的模块,各个模块的具体原理可参照上述各代收地址确定方法实施例的描述,此处不再重复说明。
如上所述,本实施例的代收地址装置,能够通过训练好的代收地址匹配模型自动根据用户的当前收件地址确定合理准确的代收地址,使用户无需知道代收点的具体地址即可享受快递代收服务,并且还能进一步向用户推送代收地址相关的路线信息,以方便用户取件,提升用户体验。
本发明实施例还提供一种电子设备,包括处理器和存储器,存储器中存储有可执行指令,可执行指令被处理器执行时,实现上述任意实施例描述的地址匹配模型的训练方法和/或代收地址确定方法。
如上所述,本发明的电子设备能够基于历史代收数据,将与目标收件地址进入相同代收点的收件地址作为正样本,进入不同代收点的收件地址作为负样本,训练深度神经网络模型,使深度神经网络模型学习到目标收件地址与正样本之间的关联及与负样本之间的区别,最大化目标样本地址分别与正负样本之间的距离的差值,优化形成地址匹配模型;并且,采用训练生成的地址匹配模型,在实际应用场景中,能够根据用户的收件地址,计算出最接近且进入过代收点的匹配地址信息,从而根据匹配地址信息的代收点自动确定用户的收件地址的准确代收信息,使用户无需知道代收点的具体地址即可享受快递代收服务,提升用户的使用体验,并能够提升物流配送效率。
图7是本发明实施例中电子设备的结构示意图,应当理解的是,图7仅仅是示意性地示出各个模块,这些模块可以是虚拟的软件模块或实际的硬件模块,这些模块的合并、拆分及其余模块的增加都在本发明的保护范围之内。
如图7所示,电子设备700以通用计算设备的形式表现。电子设备700的组件包括但不限于:至少一个处理单元710、至少一个存储单元720、连接不同平台组件(包括存储单元720和处理单元710)的总线730、显示单元740等。
其中,存储单元存储有程序代码,程序代码可以被处理单元710执行,使得处理单元710执行上述任意实施例描述的地址匹配模型的训练方法和/或代收地址确定方法的步骤。例如,处理单元710可以执行如图1、图3和图4所示的步骤。
存储单元720可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)7201和/或高速缓存存储单元7202,还可以进一步包括只读存储单元(ROM)7203。
存储单元720还可以包括具有一个或多个程序模块7205的程序/实用工具7204,这样的程序模块7205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线730可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备700也可以与一个或多个外部设备800通信,外部设备800可以是键盘、指向设备、蓝牙设备等设备中的一种或多种。这些外部设备800使得用户能与该电子设备700进行交互通信。电子设备700也能与一个或多个其它计算设备进行通信,所示计算机设备包括路由器、调制解调器。这种通信可以通过输入/输出(I/O)接口750进行。并且,电子设备700还可以通过网络适配器760与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器760可以通过总线730与电子设备700的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备700使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。
本发明实施例还提供一种计算机可读的存储介质,用于存储程序,程序被执行时实现上述任意实施例描述的地址匹配模型的训练方法和/或代收地址确定方法。在一些可能的实施方式中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在终端设备上运行时,程序代码用于使终端设备执行上述任意实施例描述的地址匹配模型的训练方法和/或代收地址确定方法。
如上所述,本发明的计算机可读的存储介质能够基于历史代收数据,将与目标收件地址进入相同代收点的收件地址作为正样本,进入不同代收点的收件地址作为负样本,训练深度神经网络模型,使深度神经网络模型学习到目标收件地址与正样本之间的关联及与负样本之间的区别,最大化目标样本地址分别与正负样本之间的距离的差值,优化形成地址匹配模型;并且,采用训练生成的地址匹配模型,在实际应用场景中,能够根据用户的收件地址,计算出最接近且进入过代收点的匹配地址信息,从而根据匹配地址信息的代收点自动确定用户的收件地址的准确代收信息,使用户无需知道代收点的具体地址即可享受快递代收服务,提升用户的使用体验,并能够提升物流配送效率。
图8是本发明的计算机可读的存储介质的结构示意图。参考图8所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品900,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子包括但不限于:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
计算机可读的存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备,例如利用因特网服务提供商来通过因特网连接。
以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (14)

1.一种地址匹配模型的训练方法,其特征在于,包括:
获得历史进入过代收点的收件地址;
对所述收件地址进行归类,形成多组样本数据,每组所述样本数据包括一目标样本地址、与所述目标样本地址进入相同代收点的正样本地址及与所述目标样本地址进入不同代收点的负样本地址;
基于每组所述样本数据训练一深度神经网络模型,所述深度神经网络模型最大化所述目标样本地址相对所述负样本地址的第一距离与所述目标样本地址相对所述正样本地址的第二距离之间的差值;以及
优化所述深度神经网络模型,生成地址匹配模型。
2.如权利要求1所述的训练方法,其特征在于,每组所述样本数据中,所述目标样本地址自所述收件地址中随机抽取,所述负样本地址与所述目标样本地址隶属相同配送区域且具有不同末端地址信息。
3.如权利要求2所述的训练方法,其特征在于,根据所述负样本地址携带的快递员信息与所述目标样本地址携带的快递员信息相同,确定所述负样本地址与所述目标样本地址隶属相同配送区域;以及
所述末端地址信息为小区信息或街道信息。
4.如权利要求1所述的训练方法,其特征在于,所述深度神经网络模型包括自注意力网络和三元组损失函数,所述基于每组所述样本数据训练一深度神经网络模型,包括:
通过所述自注意力网络提取所述目标样本地址、所述正样本地址和所述负样本地址的特征向量;
通过所述三元组损失函数增大所述第一距离,减小所述第二距离,并使所述差值大于一最小阈值。
5.如权利要求4所述的训练方法,其特征在于,所述优化所述深度神经网络模型,包括:
通过梯度下降法,减小所述三元组损失函数的损失值。
6.如权利要求1所述的训练方法,其特征在于,所述形成多组样本数据后,还包括对每组所述样本数据进行向量化处理;
所述基于每组所述样本数据训练一深度神经网络模型时,将向量化处理后的所述样本数据输入所述深度神经网络模型。
7.如权利要求6所述的训练方法,其特征在于,所述对每组所述样本数据进行向量化处理,包括:
对所述目标样本地址、所述正样本地址和所述负样本地址进行预处理,分别生成预设格式的地址文本;
构造数据字典,将每个所述地址文本中的字词转换成数字序列;
将所述数字序列中的每个字词对应的数字转换成向量,并按每个所述地址文本的字词顺序拼接转换后的向量,生成分别对应所述目标样本地址、所述正样本地址和所述负样本地址的向量矩阵。
8.一种代收地址确定方法,其特征在于,包括:
接收基于一当前收件地址的代收请求;
对所述当前收件地址进行预处理,输入经权利要求1-7任一项所述的训练方法训练生成的地址匹配模型,获得历史进入过代收点的收件地址中,与所述当前收件地址距离最近的一匹配收件地址;以及
将所述匹配收件地址的代收点,确定为所述当前收件地址的代收地址。
9.如权利要求8所述的代收地址确定方法,其特征在于,所述确定为所述当前收件地址的代收地址后,还包括:
获得发出所述代收请求的用户端的当前所在地址;
基于地图服务,获得自所述当前所在地址,经所述代收地址,到达所述当前收件地址的取件路线,发送至所述用户端。
10.如权利要求9所述的代收地址确定方法,其特征在于,获得所述取件路线后,还包括:
判断所述取件路线与所述用户端的自所述当前所在地址至所述当前收件地址的历史轨迹是否重叠;
若否,还将所述历史轨迹及所述代收地址相对所述历史轨迹的位置信息发送至所述用户端。
11.一种地址匹配模型的训练装置,其特征在于,包括:
样本采集模块,配置为获得历史进入过代收点的收件地址;
样本处理模块,配置为对所述收件地址进行归类,形成多组样本数据,每组所述样本数据包括一目标样本地址、与所述目标样本地址进入相同代收点的正样本地址及与所述目标样本地址进入不同代收点的负样本地址;
模型训练模块,配置为基于每组所述样本数据训练一深度神经网络模型,所述深度神经网络模型最大化所述目标样本地址相对所述负样本地址的第一距离与所述目标样本地址相对所述正样本地址的第二距离之间的差值;以及
模型优化模块,配置为优化所述深度神经网络模型,生成地址匹配模型。
12.一种代收地址确定装置,其特征在于,包括:
代收请求响应模块,配置为接收基于一当前收件地址的代收请求;
匹配地址计算模块,配置为对所述当前收件地址进行预处理,输入经权利要求1-7任一项所述的训练方法训练生成的地址匹配模型,获得历史进入过代收点的收件地址中,与所述当前收件地址距离最近的一匹配收件地址;以及
代收地址确定模块,配置为将所述匹配收件地址的代收点,确定为所述当前收件地址的代收地址。
13.一种电子设备,其特征在于,包括:
一处理器;
一存储器,存储有可执行指令;
其中,所述可执行指令被所述处理器执行时,实现如权利要求1-7任一项所述的地址匹配模型的训练方法,和/或,实现如权利要求8-10任一项所述的代收地址确定方法。
14.一种计算机可读的存储介质,存储有计算机程序,其特征在于,所述计算机程序被执行时实现如权利要求1-7任一项所述的地址匹配模型的训练方法,和/或,实现如权利要求8-10任一项所述的代收地址确定方法。
CN202011373599.5A 2020-11-30 2020-11-30 地址匹配模型的训练方法、代收地址确定方法及相关设备 Pending CN112465036A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011373599.5A CN112465036A (zh) 2020-11-30 2020-11-30 地址匹配模型的训练方法、代收地址确定方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011373599.5A CN112465036A (zh) 2020-11-30 2020-11-30 地址匹配模型的训练方法、代收地址确定方法及相关设备

Publications (1)

Publication Number Publication Date
CN112465036A true CN112465036A (zh) 2021-03-09

Family

ID=74805611

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011373599.5A Pending CN112465036A (zh) 2020-11-30 2020-11-30 地址匹配模型的训练方法、代收地址确定方法及相关设备

Country Status (1)

Country Link
CN (1) CN112465036A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191602A (zh) * 2021-04-13 2021-07-30 上海东普信息科技有限公司 基于地址的物流分派方法、装置、设备和存储介质
CN113434792A (zh) * 2021-07-20 2021-09-24 北京百度网讯科技有限公司 网络地址匹配模型的训练方法和网络地址匹配方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959270A (zh) * 2018-08-10 2018-12-07 新华智云科技有限公司 一种基于深度学习的实体链接方法
CN109829677A (zh) * 2019-02-22 2019-05-31 西南科技大学 一种物流运输过程监控方法及系统
CN110619497A (zh) * 2019-08-14 2019-12-27 北京三快在线科技有限公司 地址检验方法、装置、电子设备及存储介质
CN110874702A (zh) * 2018-09-04 2020-03-10 菜鸟智能物流控股有限公司 物流分拣场景下的模型训练方法、装置以及电子设备
CN111260296A (zh) * 2020-02-12 2020-06-09 上海东普信息科技有限公司 快件派送方式推荐方法、装置、设备及存储介质
US20200327557A1 (en) * 2017-07-21 2020-10-15 Vispera Bilgi Teknolojileri Sanayi Ic Ve Dis Ticaret A.S. Electronic detection of products and arrangement of products in a display structure, electronic detection of objects and arrangement of objects on and around the display structure, electronic detection of conditions of and around the display structure, and electronic scoring of the detected product and object arrangements and of the detected conditions

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200327557A1 (en) * 2017-07-21 2020-10-15 Vispera Bilgi Teknolojileri Sanayi Ic Ve Dis Ticaret A.S. Electronic detection of products and arrangement of products in a display structure, electronic detection of objects and arrangement of objects on and around the display structure, electronic detection of conditions of and around the display structure, and electronic scoring of the detected product and object arrangements and of the detected conditions
CN108959270A (zh) * 2018-08-10 2018-12-07 新华智云科技有限公司 一种基于深度学习的实体链接方法
CN110874702A (zh) * 2018-09-04 2020-03-10 菜鸟智能物流控股有限公司 物流分拣场景下的模型训练方法、装置以及电子设备
CN109829677A (zh) * 2019-02-22 2019-05-31 西南科技大学 一种物流运输过程监控方法及系统
CN110619497A (zh) * 2019-08-14 2019-12-27 北京三快在线科技有限公司 地址检验方法、装置、电子设备及存储介质
CN111260296A (zh) * 2020-02-12 2020-06-09 上海东普信息科技有限公司 快件派送方式推荐方法、装置、设备及存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113191602A (zh) * 2021-04-13 2021-07-30 上海东普信息科技有限公司 基于地址的物流分派方法、装置、设备和存储介质
CN113434792A (zh) * 2021-07-20 2021-09-24 北京百度网讯科技有限公司 网络地址匹配模型的训练方法和网络地址匹配方法
CN113434792B (zh) * 2021-07-20 2023-07-18 北京百度网讯科技有限公司 网络地址匹配模型的训练方法和网络地址匹配方法

Similar Documents

Publication Publication Date Title
CN107133645B (zh) 预估乘客取消订单行为的方法、设备及存储介质
CN109658033B (zh) 货源路线相似度计算方法、系统、设备及存储介质
CN110413788B (zh) 会话文本的场景类别的预测方法、系统、设备和存储介质
CN110222893B (zh) 共享交通资源的投放地点推荐方法、装置与电子设备
CN110599200B (zh) Ota酒店的虚假地址的检测方法、系统、介质及设备
CN112465036A (zh) 地址匹配模型的训练方法、代收地址确定方法及相关设备
CN111666427A (zh) 一种实体关系联合抽取方法、装置、设备及介质
CN107038157A (zh) 基于人工智能的识别错误发现方法、装置及存储介质
CN110489423B (zh) 一种信息抽取的方法、装置、存储介质及电子设备
CN113657274B (zh) 表格生成方法、装置、电子设备及存储介质
CN115658955B (zh) 跨媒体检索及模型训练方法、装置、设备、菜谱检索系统
CN113392253B (zh) 视觉问答模型训练及视觉问答方法、装置、设备及介质
CN111899061A (zh) 订单推荐方法、装置、设备及存储介质
CN112488103A (zh) 地址信息抽取方法、模型训练方法及相关设备
CN110990651B (zh) 地址数据处理方法、装置、电子设备及计算机可读介质
CN112818667A (zh) 地址纠正方法、系统、设备及存储介质
CN112818666A (zh) 地址识别方法、装置、电子设备和存储介质
CN110348581B (zh) 用户特征群中用户特征寻优方法、装置、介质及电子设备
CN112559877A (zh) 基于跨平台异构数据及行为上下文的ctr预估方法及系统
CN111445371A (zh) 运输路线生成方法、装置、计算机设备和存储介质
CN114638308A (zh) 一种获取对象关系的方法、装置、电子设备和存储介质
CN112835922A (zh) 地址区划分类方法、系统、设备及存储介质
CN113836446A (zh) 出行信息的向量化表示方法及装置
CN113128222A (zh) 电子面单生成方法、系统、设备及存储介质
CN112818684A (zh) 地址元素排序方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination