CN111461379A - 一种位置预测方法以及装置 - Google Patents
一种位置预测方法以及装置 Download PDFInfo
- Publication number
- CN111461379A CN111461379A CN201910054765.6A CN201910054765A CN111461379A CN 111461379 A CN111461379 A CN 111461379A CN 201910054765 A CN201910054765 A CN 201910054765A CN 111461379 A CN111461379 A CN 111461379A
- Authority
- CN
- China
- Prior art keywords
- sample
- feature vector
- user
- order
- predicted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Abstract
本申请实施例提供了一种位置预测方法以及装置,该方法包括:获取待预测用户在预设历史时间段内的多个订单的订单信息;根据多个订单的订单信息,构建待预测用户的订单特征向量序列,订单特征向量序列中包括与每个订单分别对应的订单特征向量;根据待预测用户的待预测时间信息以及待预测位置信息,构建用于表征待预测用户的待预测时间和待预测位置的目标特征向量;将订单特征向量序列和目标特征向量输入至预先训练的位置预测模型中,得到待预测用户在未来预设时间段内的位置预测结果。本申请实施例能够以更高的准确率来确定待预测用户在未来预设时间段内的位置,从而能提前预测用户位置信息,有利于提前进行资源调配,及进行相关服务策略的配置。
Description
技术领域
本申请涉及机器学习技术领域,具体而言,涉及一种位置预测方法以及装置。
背景技术
通过获取用户位置信息,可以为用户匹配与用户位置相关的个性化服务、激励策略、以及运力调配策略等。例如,通过预测次日用户所在的城市,可以找到异地旅游或者出差的用户,进行差异化运营,提升用户体验。
当前在确定用户位置的时候,可以实时获取用户定位位置信息,但是实时获取定位位置的方式及时性较差,不利于提前进行资源调配,及相关服务策略的配置。
发明内容
有鉴于此,本申请实施例的目的在于提供一种位置预测方法以及装置,能够以更高的准确率来确定待预测用户在未来预设时间段内的位置。
第一方面,本申请实施例提供一种位置预测方法,该方法包括:
获取待预测用户在预设历史时间段内的多个订单的订单信息;
根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量;
将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
在一种可选实施方式中,根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个位置影响特征下的特征值;
根据该订单在多个位置影响特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
在一种可选实施方式中,所述根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量,包括:
根据所述待预测时间信息以及待预测位置信息,确定所述待预测用户在多种预测时间和位置特征下的特征值;
根据所述待预测用户在多种所述预测时间和位置特征下的特征值,构建该待预测用户的目标特征向量。
在一种可选实施方式中,所述预测时间和位置特征包括以下特征中的多种:
用户意向前往的区域的经纬度信息,用户意向前往的区域的时间信息,用户意向前往的区域是否为家庭住址所在的区域,用户意向前往的区域是否为公司地址所在的区域。
在一种可选实施方式中,所述位置影响特征包括以下特征中的多种:
出发地经纬度信息、目的地经纬度信息、出发地的兴趣点POI分类信息、目的地的POI分类信息、发起订单的时间信息、出发地与用户家庭住址的距离信息、出发地与用户公司地址的距离信息、目的地与用户家庭住址的距离、目的地与用户公司地址的距离信息、订单城市是否为用户常驻城市。
在一种可选实施方式中,采用下述方式训练所述位置预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
根据该样本用户的待预测历史时间信息以及待预测位置信息,生成用于表征该样本用户的待预测历史时间和待预测历史位置的目标特征向量;
基于各个所述样本用户的样本订单特征向量序列、所述样本用户的目标特征向量以及基础预测模型,确定各个所述样本用户在预测历史时间段内的位置预测结果;
将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果。
在一种可选实施方式中,所述将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果,包括:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果。
在一种可选实施方式中,所述针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量,包括:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
在一种可选实施方式中,所述将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量,包括:
将所述目标特征向量输入至所述第二神经网络中,从所述第二神经网络的指定网络层获取与所述目标特征向量对应的变换特征向量;
以及,针对每个所述中间特征向量,计算该中间特征向量与所述变换特征向量的乘积,获取与该中间特征向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
在一种可选实施方式中,所述基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量,包括:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
在一种可选实施方式中,所述根据各个所述样本用户的位置预测结果以及对应的实际位置,训练所述基础预测模型,包括:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的位置预测结果,以及对应的实际位置,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
在一种可选实施方式中,所述完成对所述基础预测模型的本轮训练后,还包括:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述位置预测模型。
第二方面,本申请实施例提供一种位置预测装置,该装置包括:
获取模块,用于获取待预测用户在预设历史时间段内的多个订单的订单信息;
构建模块,用于根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量;
确定模块,用于将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
在一种可选实施方式中,所述构建模块,用于采用下述步骤根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个位置影响特征下的特征值;
根据该订单在多个位置影响特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
在一种可选实施方式中,所述构建模块,用于采用下述步骤根据所述待预测用户的待预测时间信息以及待预测位置信息,构建所述待预测用户的目标特征向量:
根据所述待预测时间信息以及待预测位置信息,确定所述待预测用户在多种预测时间和位置特征下的特征值;
根据所述待预测用户在多种所述预测时间和位置特征下的特征值,构建该待预测用户的目标特征向量。
在一种可选实施方式中,所述预测时间和位置特征包括以下特征中的多种:
用户意向前往的区域的经纬度信息,用户意向前往的区域的时间信息,用户意向前往的区域是否为家庭住址所在的区域,用户意向前往的区域是否为公司地址所在的区域。
在一种可选实施方式中,所述位置影响特征包括以下特征中的多种:
出发地经纬度信息、目的地经纬度信息、出发地的兴趣点POI分类信息、目的地的POI分类信息、发起订单的时间信息、出发地与用户家庭住址的距离信息、出发地与用户公司地址的距离信息、目的地与用户家庭住址的距离、目的地与用户公司地址的距离信息、订单城市是否为用户常驻城市。
在一种可选实施方式中,还包括:训练模块,用于采用下述方式训练所述位置预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
针对每个样本用户,根据该样本用户的待预测历史时间信息以及待预测位置信息,生成用于表征该样本用户待预测历史时间和待预测历史位置的目标特征向量;
基于各个所述样本用户的样本订单特征向量序列、所述样本用户的目标特征向量以及基础预测模型,确定各个所述样本用户在预测历史时间段内的位置预测结果;
将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果。
在一种可选实施方式中,所述训练模块,用于采用下述步骤将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果。
在一种可选实施方式中,所述训练模块,用于采用下述步骤针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
在一种可选实施方式中,所述训练模块,用于采用下述步骤将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量:
将所述目标特征向量输入至所述第二神经网络中,从所述第二神经网络的指定网络层获取与所述目标特征向量对应的变换特征向量;
以及,针对每个所述中间特征向量,计算该中间特征向量与所述变换特征向量的乘积,获取与该中间特征向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
在一种可选实施方式中,所述训练模块,用于采用下述步骤基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
在一种可选实施方式中,所述训练模块,用于采用下述步骤将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果:
将所述融合特征向量以及所述变换特征向量进行拼接,并输入至所述第三神经网络中,获取所述样本用户的位置预测结果。
在一种可选实施方式中,所述训练模块,用于采用下述步骤根据各个所述样本用户的位置预测结果以及对应的实际位置,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的位置预测结果,以及对应的实际位置,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
在一种可选实施方式中,所述训练模块,完成对所述基础预测模型的本轮训练后,还用于:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述位置预测模型。
第三方面,本申请实施例提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如第一方面任一所述的位置预测方法的步骤。
第四方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如第一方面任一所述的位置预测方法的步骤。
本申请实施例可以通过获取待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据待预测用户的待预测时间信息和待预测位置信息构建目标特征向量,并根据订单特征向量序列、目标特征向量和预先训练的位置预测模型,确定待预测用户在未来预设时间段内的位置预测结果,从而可以提前预测用户位置信息,有利于提前进行资源调配,及进行相关服务策略的配置。
另外,本申请实施例是基于各个订单的中间特征向量的注意力分配权重,对中间特征向量进行融合,构成融合特征向量,并基于融合特征向量确定待预测用户的位置预测结果,能够基于订单对待预测用户影响程度的大小,实现对位置的预测,预测的结果更加真实准确。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请一些实施例的位置确定方法应用的一种场景下的系统100框图;
图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110、服务请求方终端130、服务提供方终端140的电子设备200的示例性硬件和软件组件的示意图;
图3示出了本申请实施例所提供的一种位置预测方法的流程图;
图4示出了本申请各实施例所提供的位置预测方法中,根据多个订单的订单信息构建待预测用户的订单特征向量序列的具体方法的流程图;
图5示出了本申请各实施例所提供的位置预测方法中,构建待预测用户的目标特征向量的具体方法的流程图;
图6示出了本申请各实施例所提供的位置预测方法中,获得预先训练的位置预测模型的具体方法的流程图;
图7示出了本申请各实施例所提供的位置预测方法中,另一种获得预先训练的位置预测模型的具体方法的流程图;
图8示出了本申请实各施例所提供的位置预测方法中,将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果具体方法的示意图;
图9示出了本申请实各施例所提供的位置预测方法中,基础预测网络的结构示意图;
图10示出了本申请实施例所提供的一种位置预测装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。
另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了使得本领域技术人员能够使用本申请内容,结合示例性应用场景“网约车出行场景”做相关介绍。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕预测网约车乘客位置进行描述,但是应该理解,这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如,本申请可以应用于不同的运输系统环境,包括陆地,海洋,或航空等,或其任意组合。运输系统的交通工具可以包括出租车、私家车、顺风车、公共汽车、火车、子弹头列车、高速铁路、地铁、船只、飞机、宇宙飞船、热气球、或无人驾驶车辆等,或其任意组合。本申请还可以包括用于基于互联网为用户提供服务的任何服务系统,例如,用于发送和/或接收快递的系统、用于买卖双方交易的服务系统。本申请的系统或方法的应用可以包括网页、浏览器的插件、客户端终端、定制系统、内部分析系统、或人工智能机器人等,或其任意组合。
需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。
本申请的一个方面涉及一种位置预测方法。该方法通过获取待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据待预测用户的待预测时间信息和待预测位置信息构建目标特征向量,并根据订单特征向量序列、目标特征向量和预先训练的位置预测模型,确定待预测用户在未来预设时间段内的位置预测结果,从而可以提前预测用户位置信息,有利于提前进行资源调配,及进行相关服务策略的配置。
值得注意的是,用户位置的预测也可以是基于待预测用户的统计量来进行,但是这种方式的预测准确率较低,本申请提供的位置预测方法可以以更高的准确率来对待预测用户的位置进行预测。
图1是本申请一些实施例的位置预测方法应用的一种场景下的系统100框图。例如,系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。系统100可以包括服务器110、网络120、服务请求方终端130、服务提供方终端140和数据库150中的一种或多种,服务器110中可以包括执行指令操作的处理器112。本申请实施例提供的位置预测方法可以应用于上述系统100中的服务器110,具体可以由处理器112执行相关操作指令。
图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110的电子设备200的示例性硬件和软件组件的示意图。例如,处理器112可以用于电子设备200上,并且用于执行本申请中的功能。
电子设备200可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的位置预测方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。
例如,电子设备200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的存储介质240,例如,磁盘、ROM、或RAM,或其任意组合。示例性地,计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备200还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output,I/O)接口250。
为了便于说明,在电子设备200中仅描述了一个处理器。然而,应当注意,本申请中的电子设备200还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备200的处理器执行步骤A和步骤B,则应该理解,步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,处理器执行步骤A,第二处理器执行步骤B,或者处理器和第二处理器共同执行步骤A和B。
图3示出本申请实施例提供的位置预测方法的示意图,包括S301~S304。
S301:获取待预测用户在预设历史时间段内的多个订单的订单信息。
在具体实施中,待预测用户可以是网约车平台的全部用户;另外,由于网约车的用户数量非常庞大,一般是以千万甚至亿计的,要针对每个用户都确定其位置,计算量是非常庞大的,因此为了更有针对性,也可以是基于一定的条件从网约车平台的全部用户中筛选出来的用户。
示例性的,可以周期性计算各个用户在冒泡时的所在位置,如果任一用户在周期内的冒泡位置归属于至少两个城市或者预设的区域,则将该用户确定为待预测用户。
示例性的,可以周期性计算各个用户在发出订单的出发地,如果任一用户在周期内的出发地归属于至少两个城市或者归属于至少两个预设的区域,则将该用户确定为待预测用户。
预设历史时间段可以根据实际的需求进行具体的设定,例如可以将预设历史时间段设置为3个月、4个月、5个月、半年等,还可以设置为1周、2周、3周等。该预设历史时间段例如是以当前时间为最晚时间的时间段。预设历史时间段内的多个订单,是指订单时间在该预设历史时间段内的订单。
S302:根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量。
此处,每个订单都对应有订单信息,根据每个订单的订单信息,能够构建与该订单对应的订单特征向量。多个订单的订单特征向量按照订单时间的先后顺序排布后,形成该订单特征向量序列。
例如针对某待预测用户甲某,其在预设历史时间段内的多个订单有n个,则为该待预测用户生成的订单特征向量序列为:X1、X2、X3、……Xn。
假设每个订单特征向量中有m个元素,则待该与测用户的订单特征向量X1~Xn分别表示为:
X1=(x11,x12,x13,x14,…,x1m);
X2=(x21,x22,x23,x24,…,x2m);
……
Xn=(xn1,xn2,xn3,xn4,…,xnm)。
具体地,参见图4所示,本申请实施例还提供一种根据多个订单的订单信息构建待预测用户的订单特征向量序列的具体方法,包括:
S401:针对每个所述订单,根据该订单的订单信息,确定该订单在多个位置影响特征下的特征值。
示例性的,以构建待预测预测特征向量序列的订单信息,是订单信息中除通用的待预测时间信息以及待预测位置信息外的订单信息为例,位置影响特征包括但不限于下述(1)~(10)中一种或者多种:
(1)出发地经纬度信息;此处,用户在通过用户端向网约车平台发起订单的时候,订单中会携带用户的出发地;其中,出发地可以通过两中形式体现,其一,经纬度信息;其二,兴趣点(Point of Interest,POI)信息。网约车平台在接收到订单后,会对将用户的出发地作为订单信息的一部分进行记录。
当获取待预测用户在预设历史时间段内的多个订单的订单信息时,能够获取出发地的相关信息。在构建与各个订单对应的待预测用户的订单特征向量时,基于订单信息中携带的出发地的相关经纬度信息的具体数值,确定与该位置影响特征对应的特征值。
(2)目的地经纬度信息;此处,用户在通过用户端向网约车平台发起订单的时候,订单中还会携带用户的目的地;目的地也可以通过两种形式体现,其一,经纬度信息;其二,POI信息。网约车平台在接收到订单后,会对将用户的目的地作为订单信息的一部分进行记录。
当获取待预测用户在预设历史时间段内的多个订单的订单信息时,能够获取目的地的相关信息。在构建与各个订单对应的待预测用户的订单特征向量时,基于订单信息中携带的目的地的相关经纬度信息的具体数值,确定与该位置影响特征对应的特征值。
(3)出发地的兴趣点POI分类信息;此处,出发地可以通过POI信息来体现,网约车平台会将不同的POI信息进行分类;在构建与各个订单对应的待预测用户的订单特征向量时,可以基于订单信息中的出发地的POI信息,确定与其POI信息对应的POI分类信息。
(4)目的地的POI分类信息;此处,目的地可以通过POI信息来体现,网约车平台会将不同的POI信息进行分类;在构建与各个订单对应的待预测用户的订单特征向量时,可以基于订单信息中的目的地的POI信息,确定与其POI信息对应的POI分类信息。
(5)发起订单的时间信息;此处,发起订单的时间信息可以通过多个维度的时间信息来表征,包括:发起订单的时间为每天的第几个小时、发起订单的时间属于周几、发起订单的时间时每月的第几天、发起订单的时间归属的月份等。
(6)出发地与用户家庭住址的距离信息。此处,用户家庭住址,可以是用户主动设置的,也可以是根据用户的常用出发地或者目的地检测得到。例如用户经常性的在上午8:00左右发出订单,且订单的出发地大多数情况为A地,则可以判断A地为该用户家庭住址的概率是比较大的,因此将该A地作为该用户的家庭住址。出发地与用户家庭住址的距离,可以是出发地与用户家庭住址的直线距离,也可以是最近路线长度。
(7)出发地与用户公司地址的距离信息。与用户家庭住址的获取方式类似,可以是用户主动设置的,也可以是根据用户常用的出发地或者目的地检测得到的。例如用户经常性的在下午5:00~8:00之间发出订单,且订单的出发地大多数情况为B地,则可以判断B地为该用户公司地址的概率是比较大的,因此将该B地作为该用户的公司地址。
(8)目的地与用户家庭住址的距离。
(9)目的地与用户公司地址的距离信息。
(10)订单城市是否为用户常驻城市。此处,可以根据多个订单的出发地或者目的地来确定订单城市是否为用户常驻城市。例如,假若用户在预设历史时间段内的出发地大部分为C城市,则该C城市为用户在该预设历史时间段内的常驻城市。
在上述位置影响特征中,既包括了数值特征,又包括了类别特征。对于数值特征,则是接使用其对应的数值来表示。对应类别特征则使用热独(one-hot)的编码方式,即每一个类别特征对应一个0、1组成的向量,类别数对应向量的维数,即一个类别对应向量的一维,当该预设操作行为特征为某一类别时,该类别对应的向量位置取1,其他部分则全部置0。
S402:根据该订单在多个位置影响特征下的特征值,构建与该订单对应的订单特征向量;
S403:根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
S303:根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户待预测时间和待预测位置的目标特征向量。
此处,参见图5所示,本申请实施例还提供一种构建待预测用户的目标特征向量的具体方法,包括:
S501:根据所述待预测时间信息以及待预测位置信息,确定所述待预测用户在多种预测时间和位置特征下的特征值;
S502:根据所述待预测用户在多种所述预测时间和位置特征下的特征值,构建该待预测用户的目标特征向量。
在具体实施中,预测时间和位置特征包括下述①~④中一种或者多种:
①、用户意向前往的区域的经纬度信息;此处,用户意向前往的区域可以是预设的区域范围,也可以是城市。
其中,用户意向前往的地点,通常是用户曾经前往过的地点中的一个。
②、用户意向前往的区域的时间信息;此处,时间信息可以通过多个维度的时间信息来表征,例如:要预测的日期、要预测的日期是周几、要预测的日期是每月的第几天、要预测的日期归属的月份等。
③、用户意向前往的区域是否为家庭住址所在的区域。
④、用户意向前往的地点是否为公司地址所在的区域。
需要注意的是,上述S302和S303并无执行的先后顺序。承接上述S302和S303,,在构建待预测用户的订单特征向量序列之后,本申请实施例提供的位置预测方案还包括:
S304:将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
在一些实施例,可以仅仅构建订单特征向量序列,并将构建的特征向量序列输入到预先训练的位置预测模型中,确定待预测用户在未来预设时间段内的位置预测结果。
在此种情况下,参见图6所示,可以采用下述方式获得预先训练的位置预测模型:
S601:获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置。
此处,样本用户在目标历史时间段内的多个样本订单的样本订单信息的,与待预测用户在预设历史时间段内的多个订单的订单信息类似,在此不在赘述。
S602:针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量。
此处,针对生成每个样本用户的样本订单特征向量序列的方式,与生成待预测用户的订单特征向量序列的方式类似,在此不再赘述。
S603:基于各个所述样本用户的样本订单特征向量序列以及基础预测模型,确定各个所述样本用户在预测历史时间段内的位置预测结果。
此处,示例性的,基础预测模型包括:循环神经网络(Recurrent Neural Network,RNN)。
S604:根据各个所述样本用户的位置预测结果以及对应的实际位置结果,训练所述基础预测模型,得到所述位置预测模型。
此处,根据样本用户的位置预测结果以及对应的实际位置结果,训练基础模型的过程,实际上就是将各个样本用户的特征向量序列输入至基础预测模型中,使得基础模型对特征向量序列进行特征学习,并输出位置预测结果,并根据位置预测结果以及对应的实际位置结果调整基础预测模型的参数,使得基础预测模型输出的位置预测结果与实际位置结果不断趋于一致的过程。
具体地,可以采用下述方式根据各个所述样本用户的位置预测结果以及对应的实际位置结果,训练所述基础预测模型:
针对每个所述样本订单特征向量序列,按照其中的样本订单特征向量对应订单生成时间的先后顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量。
获取将前一样本订单特征向量输入所述基础预测模型后,所述基础预测模型的目标特征提取层为前一样本订单特征向量输出的中间特征向量。
将所述当前样本订单特征向量以及所述中间特征向量输入至基础预测模型,得到与该样本订单特征向量对应的位置预测结果。
基于得到的位置预测结果和对应的实际位置结果,对所述基础预测模型的参数进行调整,并基于调整后的基础预测模型,返回所述从该样本订单特征向量序列中选择一个样本订单特征向量输入至基础预测模型中的步骤,直到满足训练截止条件。
此处,训练截至条件可以根据实际的需要进行设定,例如可以是:使用多个样本订单特征向量序列对基础预测模型进行预设轮数的训练,并将最后一轮训练得到的基础预测模型作为位置预测模型。在每一轮训练中,依次使用多个样本订单特征向量序列中的各个样本订单特征向量对模型进行一次训练。
或者,该训练截至条件还可以是:使用测试集对本轮得到的基础预测模型进行验证;若测试集中,交叉熵损失不大于预设交叉熵损失的测试数据的条数,占据测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对基础预测模型的训练,并将最后一轮训练得到的基础预测模型作为位置预测模型。
或者,该训练截至条件还可以是:依次将本轮各个样本用户的交叉熵损失,与前一轮对应样本用户的交叉熵损失进行比对;若本轮样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将上一轮训练得到的所述基础预测模型作为位置预测模型。
示例性的,可以采用下述方式对基础预测模型进行训练:构建初始的基础预测模型,并对初始的基础预测模型的各个参数进行初始赋值。
确定样本用户包括A1~As共s个样本用户。
针对其中的第i个样本用户Ai,i∈[1,s]:
针对第i个样本用户Ai,该样本用户Ai在目标历史时间段内的样本订单有n个,对应的位置影响特征有m个,则为该样本用户Ai生成的样本订单特征向量序列为:Xi1、Xi2、Xi3、……、Xin。
使用样本用户Ai的特征向量序列对基础预测模型进行本轮训练:
在使用该样本用户A的样本订单特征向量序列对基础预测模型进行本轮训练时:首先将样本订单特征向量Xi1输入至基础预测模型中:
此时,若在使用样本订单特征向量Xi1输入至基础预测模型中之前,并未有其他的样本订单特征向量对其进行过训练,则仅基于基础预测模型的初始赋值,以及样本订单特征向量Xi1,得到与该样本订单特征向量Xi1对应的位置预测结果。基于该位置预测结果以及样本订单特征向量Xi1对应的实际位置结果,对基础预测模型的参数进行调整。
若在使用样本订单特征向量Xi1输入至基础预测模型中之前,已经使用了其他的样本订单特征向量对其进行过训练,则获取将前一样本订单特征向量输入基础预测模型后,基础预测模型的目标特征提取层为前一样本订单特征向量提取的中间特征向量Z0,并将该中间特征向量Z0,作为本次使用样本订单特征向量Xi1对基础预测模型进行训练时的参数,输入至基础预测模型中,基于该中间特征向量Z0,以及样本订单特征向量Xi1,得到与该样本订单特征向量Xi1对应的位置预测结果。基于该位置预测结果以及样本订单特征向量Xi1对应的实际位置结果,对基础预测模型的参数进行调整。
并且从基础预测模型的目标提取层,获取为该样本订单特征向量Xi1提取的中间特征向量Z1。
此处,在基于该位置预测结果以及样本订单特征向量Xi1对应的实际位置结果,对基础预测模型的参数进行调整时,可以将样本订单特征向量Xi1对应的位置预测结果和实际位置结果进行比对;在两者之间的差值小于预设的差值阈值的情况下,调整基础预测模型的参数。
在基于该位置预测结果以及样本订单特征向量Xi1对应的实际位置结果,对基础预测模型的参数进行调整时,还可以根据样本订单特征向量Xi1对应的位置预测结果和实际位置结果计算交叉熵损失;并根据交叉熵损失调整基础预测模型的参数。
在一些实施例中,若交叉熵损失较大时,对基础预测模型的参数的调整步长,要大于交叉熵损失较小时对基础预测模型的参数的调整步长。
然后样本订单特征向量Xi2和上述中间特征向量Z1输入至经样本订单特征向量Xi1训练得到的基础预测模型中,得到样本订单特征向量Xi2的位置预测结果。
基于样本订单特征向量Xi2的位置预测结果和实际位置结果,对基础预测模型的参数继续调整。
并且从基础预测模型的目标提取层,获取为该样本订单特征向量Xi2提取的中间特征向量Z2。
分别将样本特征向Xi3、……、Xin对基础预测模型进行训练,完成基于当前样本订单特征向量序列为:Xi1、Xi2、Xi3、……、Xin对基础预测模型的训练。
依次基于各个样本用户对应的样本订单特征向量序列,对基础预测模型进行训练后,完成对基础预测模型的本轮训练。
在一些实施例中,基础预测模型为循环神经网络,包括输入层、目标特征提取层以及输出层。将所述当前样本订单特征向量以及所述中间特征向量输入至基础预测模型,得到与该样本订单特征向量对应的位置预测结果,可以采用下述方式:将当前样本订单特征向量输入至输入层,使用输入层为样本订单特征向量提取中间特征向量;将中间特征向量输入和基础预测模型的目标特征提取层为样本订单特征向量提取中间特征向量输入至目标特征提取层,对中间特征向量以及基础预测模型的目标特征提取层为样本订单特征向量提取中间特征向量进行加权求和,得到基础预测模型的目标特征提取层为当前样本订单特征向量提取的中间特征向量,并将基础预测模型的目标特征提取层为当前样本订单特征向量提取的中间特征向量输入至输出层,得到位置预测结果。
在另外一些实施例中,还可以构建订单特征向量序列以及目标特征向量,则将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
在此种情况下,参见图7所示,可以采用下述方式获得预先训练的位置预测模型:
S701:获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置结果;以及获取各个所述样本用户的待预测时间信息以及待预测位置信息。
此处,多个样本订单的样本订单信息,与待预测用户的订单信息类似,且样本用户的待预测时间信息以及待预测位置信息,与待预测用户的待预测时间信息以及待预测位置信息类似,在此不再赘述。
S702:针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;以及根据该样本用户的待预测时间信息以及待预测位置信息,生成该样本用户的目标特征向量。
此处,样本订单特征向量序列以及样本用户的目标特征向量的生成方式,与待预测用户的订单特征向量序列和目标特征向量的获取方式类似,在此不再赘述。
S703:将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果。
S704:根据各个所述样本用户的位置预测结果以及对应的实际位置结果,训练所述基础预测模型,得到所述位置预测模型。
在具体实施中,图8示出本申请实施例提供将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果具体方式示意图,图9示出本申请实施例提供的基础预测网络的结构示意图。其中,参见图8和图9所示,将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果,包括:
S801:针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述样本订单特征向量对应的中间特征向量。
此处,在样本订单特征向量序列中包括了多个样本订单特征向量,为了建立各个样本订单特征向量之间的关系,可以采用下述方式获取每个样本订单特征向量输入至第一神经网络中,获取每个所述样本订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
此处,中间特征向量的获取方式与上述S603中获取中间特征向量的获取方式类似,在次不再赘述。
S802:将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量。
此处,可以采用下述方式获取与各个中间特征向量对应的注意力分配权重以及变换特征向量:
将所述目标特征向量输入至所述第二神经网络中,从所述第二神经网络的指定网络层获取与所述目标特征向量对应的变换特征向量;以及,针对每个所述中间特征向量,计算该中间特征向量与所述变换特征向量的乘积,获取与该中间特征向量对应的匹配度;基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
具体地,第二神经网络是一个至少一层的全连接网络,通过该第二神经网络能够建立目标特征向量中各个元素之间的关系,一般地,将第二神经网络的最后一层网络层作为指定网络层,并将该指定网络层输出的特征向量,作为变换特征向量;该变换特征向量是使用第二神经网络对目标神经网络进行特征提取后得到的特征向量。
然后计算各个中间特征向量与变换特征向量的乘积,将乘积的结果,确定为各个中间特征向量对应的匹配度。
然后使用激活函数,对各个中间特征向量对应的匹配度进行激活运算,的到与各个中间特征向量对应的注意力分配权重。
示例性的,激活函数包括:softmax函数。
S803:基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量。
此处,可以对各个中间特征向量进行加权求和的方式,生成融合特征向量。其中,在对各个中间特征向量进行加权求和的权重,即为每个中间特征向量分别对应的注意力分配权重。
S804:将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果。
示例性的,将所述融合特征向量以及所述变换特征向量进行拼接,并输入至所述第三神经网络中,获取所述样本用户的位置预测结果。
此处,第三神经网络可以包括至少一层网络层和分类器。将融合他正向量以及变换特征向量进行拼接后,输入至第三神经网络中的至少一层网络层,为拼接后得到的特征向量进行特征提取,然后将特征提取的结果输入至分类器,得到用户的位置预测结果。
示例性的,参见图9所示,样本用户的样本订单特征向量序列包括X1~X10共10个样本订单特征向量,依次输入至第一神经网络,样本用户的目标特征向量为q。其中:
将X1输入至第一神经网络后,得到中间特征向量h1;
将h1和X2输入至第一神经网络后,得到中间特征向量h2;
……
将h9和X10输入至第一神经网络后,得到中间特征向量h10;
将目标特征向量q输入至第二神经网络,得到变换特征向量hq,
然后依次计算h1~h10和hq的乘积,并将得到的乘积使用激活函数进行激活运算,得到各个中间特征向量分别对应的注意力分配权重w1~w10;
根据注意力分配权重w1~w10,对h1~h10进行加权求和,形成融合特征向量e。
将融合特征向量e和变换特征向量hq拼接后,输入至第三神经网络,得到样本用户的位置预测结果P。
示例性的,第三神经网络是一个包括了多层全连接层的神经网络和分类器,通过该第三神经网络,能够建立融合特征向量和变换特征向量中各个元素之间的联系,并提取能够表征用户位置的特征向量。然后将该用于表征用户位置的特征向量输入至分类器,得到样本用户的位置预测结果。
在根据基础预测模型得到样本用户的位置预测结果后,可以采用下述方式根据各个所述样本用户的位置预测结果以及对应的实际位置结果,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的位置预测结果,以及对应的实际位置结果,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
此处,根据各个所述样本用户的位置预测结果以及对应的实际位置结果,训练所述基础预测模型的过程,与上述S604的过程类似,在此不再赘述。
与上述S604类似的,本申请实施例在完成对基础预测模型的本轮训练之后,还可以通过下述三种方式中任意一种检测是否停止训练:
(1)检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型。
具体实现的时候,在模型训练时,会预先设置一个训练的预设轮数,如果检测到本轮达到预设轮数,则停止对基础预测模型的训练,将最后一轮训练得到的基础预测模型作为位置预测模型。
(2)使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
在模型训练的过程中,需要使得交叉熵损失的值逐渐减小,因此,使用测试集对本轮得到的基础预测模型进行验证时,如果测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,达到一定预设比例,例如,90%、95%等,则停止对基础预测模型的训练,将最后一轮训练得到的基础预测模型作为位置预测模型。
(3)依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述位置预测模型。
在模型训练的过程中,需要使得交叉熵损失的值逐渐减小,并将交叉熵损失的值最小时得到的基础预测模型作为位置预测模型。
在得到位置预测模型后,就能够基于该位置预测模型对待预测用户在未来预设时间段内的位置预测结果进行预测。
其中,位置预测模型对订单特征向量序列的处理方式与模型训练过程中,基础预测模型对样本订单特征向量的处理方式类似,在此不再赘述。
本申请实施例可以通过获取待预测用户在预设历史时间段内的多个订单的订单信息,构建待预测用户的订单特征向量序列,并根据待预测用户的待预测时间信息和待预测位置信息构建目标特征向量,并根据订单特征向量序列、目标特征向量和预先训练的位置预测模型,确定待预测用户在未来预设时间段内的位置预测结果,从而可以提前预测用户位置信息,有利于提前进行资源调配,及进行相关服务策略的配置。
另外,本申请实施例是基于各个订单的中间特征向量的注意力分配权重,对中间特征向量进行融合,构成融合特征向量,并基于融合特征向量确定待预测用户的位置预测结果,能够利用基于订单对待预测用户影响程度的大小,实现对位置的预测,预测的结果更加真实准确。
图10示出本申请实施例二提供的一种位置预测装置的框图,该位置预测装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图10所示,位置预测装置可以包括:
获取模块11,用于获取待预测用户在预设历史时间段内的多个订单的订单信息;
构建模块12,用于根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量;
确定模块13,用于将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
在一种可选实施方式中,所述构建模块12,用于采用下述步骤根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个位置影响特征下的特征值;
根据该订单在多个位置影响特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
在一种可选实施方式中,所述构建模块12,用于采用下述步骤根据所述待预测用户的待预测时间信息以及待预测位置信息,构建所述待预测用户的目标特征向量:
根据所述待预测时间信息以及待预测位置信息,确定所述待预测用户在多种预测时间和位置特征下的特征值;
根据所述待预测用户在多种所述预测时间和位置特征下的特征值,构建该待预测用户的目标特征向量。
在一种可选实施方式中,所述预测时间和位置特征包括以下特征中的多种:
用户意向前往的区域的经纬度信息,用户意向前往的区域的时间信息,用户意向前往的区域是否为家庭住址所在的区域,用户意向前往的区域是否为公司地址所在的区域。
在一种可选实施方式中,所述位置影响特征包括以下特征中的多种:
出发地经纬度信息、目的地经纬度信息、出发地的兴趣点POI分类信息、目的地的POI分类信息、发起订单的时间信息、出发地与用户家庭住址的距离信息、出发地与用户公司地址的距离信息、目的地与用户家庭住址的距离、目的地与用户公司地址的距离信息、订单城市是否为用户常驻城市。
在一种可选实施方式中,还包括:训练模块14,用于采用下述方式训练所述位置预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;以及,
针对每个样本用户,根据该样本用户的待预测历史时间信息以及待预测位置信息,生成用于表征该样本用户待预测历史时间和待预测历史位置的目标特征向量;
基于各个所述样本用户的样本订单特征向量序列、所述样本用户的目标特征向量以及基础预测模型,确定各个所述样本用户在预测历史时间段内的位置预测结果;
将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果。
在一种可选实施方式中,所述训练模块14,用于采用下述步骤将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果。
在一种可选实施方式中,所述训练模块14,用于采用下述步骤针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
在一种可选实施方式中,所述训练模块14,用于采用下述步骤将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量:
将所述目标特征向量输入至所述第二神经网络中,从所述第二神经网络的指定网络层获取与所述目标特征向量对应的变换特征向量;
以及,针对每个所述中间特征向量,计算该中间特征向量与所述变换特征向量的乘积,获取与该中间特征向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
在一种可选实施方式中,所述训练模块14,用于采用下述步骤基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
在一种可选实施方式中,所述训练模块14,用于采用下述步骤将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果:
将所述融合特征向量以及所述变换特征向量进行拼接,并输入至所述第三神经网络中,获取所述样本用户的位置预测结果。
在一种可选实施方式中,所述训练模块14,用于采用下述步骤根据各个所述样本用户的位置预测结果以及对应的实际位置,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的位置预测结果,以及对应的实际位置,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
在一种可选实施方式中,所述训练模块14,完成对所述基础预测模型的本轮训练后,还用于:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述位置预测模型。
上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。
如图2所示,本申请实施例还提供一种电子设备,包括:处理器220、存储介质和总线230,所述存储介质存储有所述处理器220可执行的机器可读指令,当电子设备运行时,所述处理器220与所述存储介质之间通过总线通信230,所述处理器220执行所述机器可读指令,以执行时执行如本申请实施例提供的位置预测方法的步骤。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如本申请实施例提供的位置预测方法的步骤。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (28)
1.一种位置预测方法,其特征在于,该方法包括:
获取待预测用户在预设历史时间段内的多个订单的订单信息;
根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;
根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量;
将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
2.根据权利要求1所述的方法,其特征在于,根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,包括:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个位置影响特征下的特征值;
根据该订单在多个位置影响特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
3.根据权利要求1所述的方法,其特征在于,所述根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量,包括:
根据所述待预测时间信息以及待预测位置信息,确定所述待预测用户在多种预测时间和位置特征下的特征值;
根据所述待预测用户在多种所述预测时间和位置特征下的特征值,构建该待预测用户的目标特征向量。
4.根据权利要求3所述的方法,其特征在于,所述预测时间和位置特征包括以下特征中的多种:
用户意向前往的区域的经纬度信息,用户意向前往的区域的时间信息,用户意向前往的区域是否为家庭住址所在的区域,用户意向前往的区域是否为公司地址所在的区域。
5.根据权利要求2所述的方法,其特征在于,所述位置影响特征包括以下特征中的多种:
出发地经纬度信息、目的地经纬度信息、出发地的兴趣点POI分类信息、目的地的POI分类信息、发起订单的时间信息、出发地与用户家庭住址的距离信息、出发地与用户公司地址的距离信息、目的地与用户家庭住址的距离、目的地与用户公司地址的距离信息、订单城市是否为用户常驻城市。
6.根据权利要求1所述的方法,其特征在于,采用下述方式训练所述位置预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
根据该样本用户的待预测历史时间信息以及待预测位置信息,生成用于表征该样本用户的待预测历史时间和待预测历史位置的目标特征向量;
基于各个所述样本用户的样本订单特征向量序列、所述样本用户的目标特征向量以及基础预测模型,确定各个所述样本用户在预测历史时间段内的位置预测结果;
将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果。
7.根据权利要求6所述的方法,其特征在于,所述将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果,包括:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果。
8.根据权利要求7所述的方法,其特征在于,所述针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量,包括:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
9.根据权利要求7所述的方法,其特征在于,所述将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量,包括:
将所述目标特征向量输入至所述第二神经网络中,从所述第二神经网络的指定网络层获取与所述目标特征向量对应的变换特征向量;
以及,针对每个所述中间特征向量,计算该中间特征向量与所述变换特征向量的乘积,获取与该中间特征向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
10.根据权利要求7所述的方法,其特征在于,所述基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量,包括:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
11.根据权利要求7所述的方法,其特征在于,将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果,包括:
将所述融合特征向量以及所述变换特征向量进行拼接,并输入至所述第三神经网络中,获取所述样本用户的位置预测结果。
12.根据权利要求6所述的方法,其特征在于,所述根据各个所述样本用户的位置预测结果以及对应的实际位置,训练所述基础预测模型,包括:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的位置预测结果,以及对应的实际位置,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
13.根据权利要求12所述的方法,其特征在于,所述完成对所述基础预测模型的本轮训练后,还包括:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述位置预测模型。
14.一种位置预测装置,其特征在于,该装置包括:
获取模块,用于获取待预测用户在预设历史时间段内的多个订单的订单信息;
构建模块,用于根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列,所述订单特征向量序列中包括与每个所述订单分别对应的订单特征向量;根据所述待预测用户的待预测时间信息以及待预测位置信息,构建用于表征所述待预测用户的待预测时间和待预测位置的目标特征向量;
确定模块,用于将所述订单特征向量序列和所述目标特征向量输入至预先训练的位置预测模型中,得到所述待预测用户在未来预设时间段内的位置预测结果。
15.根据权利要求14所述的装置,其特征在于,所述构建模块,用于采用下述步骤根据所述多个订单的订单信息,构建所述待预测用户的订单特征向量序列:
针对每个所述订单,根据该订单的订单信息,确定该订单在多个位置影响特征下的特征值;
根据该订单在多个位置影响特征下的特征值,构建与该订单对应的订单特征向量;
根据所述多个所述订单分别对应的订单特征向量,按照订单生成时间的先后顺序构建所述订单特征向量序列。
16.根据权利要求14所述的装置,其特征在于,所述构建模块,用于采用下述步骤根据所述待预测用户的待预测时间信息以及待预测位置信息,构建所述待预测用户的目标特征向量:
根据所述待预测时间信息以及待预测位置信息,确定所述待预测用户在多种预测时间和位置特征下的特征值;
根据所述待预测用户在多种所述预测时间和位置特征下的特征值,构建该待预测用户的目标特征向量。
17.根据权利要求16所述的装置,其特征在于,所述预测时间和位置特征包括以下特征中的多种:
用户意向前往的区域的经纬度信息,用户意向前往的区域的时间信息,用户意向前往的区域是否为家庭住址所在的区域,用户意向前往的区域是否为公司地址所在的区域。
18.根据权利要求15所述的装置,其特征在于,所述位置影响特征包括以下特征中的多种:
出发地经纬度信息、目的地经纬度信息、出发地的兴趣点POI分类信息、目的地的POI分类信息、发起订单的时间信息、出发地与用户家庭住址的距离信息、出发地与用户公司地址的距离信息、目的地与用户家庭住址的距离、目的地与用户公司地址的距离信息、订单城市是否为用户常驻城市。
19.根据权利要求14所述的装置,其特征在于,还包括:训练模块,用于采用下述方式训练所述位置预测模型:
获取多个样本用户在目标历史时间段内的多个样本订单的样本订单信息,以及各个所述样本用户在预测历史时间段内的实际位置;
针对每个样本用户,根据该样本用户在目标历史时间段内的各个样本订单对应的样本订单信息,生成该样本用户的样本订单特征向量序列;所述样本订单特征向量序列中包括与各个样本订单对应的样本订单特征向量;
针对每个样本用户,根据该样本用户的待预测历史时间信息以及待预测位置信息,生成用于表征该样本用户待预测历史时间和待预测历史位置的目标特征向量;
基于各个所述样本用户的样本订单特征向量序列、所述样本用户的目标特征向量以及基础预测模型,确定各个所述样本用户在预测历史时间段内的位置预测结果;
将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果。
20.根据权利要求19所述的装置,其特征在于,所述训练模块,用于采用下述步骤将每个所述样本用户的样本订单特征向量序列和目标特征向量输入至基础预测模型中,得到每个所述样本用户的位置预测结果:
针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至第一神经网络,获取每个所述订单特征向量对应的中间特征向量;
将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量;
基于所述样本用户的各个所述中间特征向量与所述注意力分配权重,生成融合特征向量;
将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果。
21.根据权利要求20所述的装置,其特征在于,所述训练模块,用于采用下述步骤针对每个所述样本用户,将该样本用户的样本订单特征向量序列中的样本订单特征向量输入至所述第一神经网络,获取每个所述订单特征向量对应的中间特征向量:
针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量;
将获取的前一样本订单特征向量输入至所述第一神经网络后,所述第一神经网络的目标特征提取层为前一样本订单特征向量输出的中间特征向量;
将当前样本订单特征向量,以及前一样本订单特征向量的中间特征向量,输入至所述第一神经网络中,获取当前样本订单特征向量对应的中间特征向量;
返回针对该样本用户的样本订单特征向量序列,按照其中样本订单特征向量的排列顺序,从该样本订单特征向量序列中选择一个样本订单特征向量作为当前样本订单特征向量的步骤,直至提取了所有样本订单特征向量的中间特征向量。
22.根据权利要求20所述的装置,其特征在于,所述训练模块,用于采用下述步骤将所述样本用户的各个所述中间特征向量以及所述目标特征向量输入至第二神经网络,获取与各个所述中间特征向量对应的注意力分配权重,以及所述第二神经网络的指定网络层输出的变换特征向量:
将所述目标特征向量输入至所述第二神经网络中,从所述第二神经网络的指定网络层获取与所述目标特征向量对应的变换特征向量;
以及,针对每个所述中间特征向量,计算该中间特征向量与所述变换特征向量的乘积,获取与该中间特征向量对应的匹配度;
基于预设的激活函数对所述匹配度进行激活运算,得到与该中间特征向量对应的注意力分配权重。
23.根据权利要求20所述的装置,其特征在于,所述训练模块,用于采用下述步骤基于所述样本用户的各个所述中间特征向量以及与所述注意力分配权重,生成融合特征向量:
根据各个所述中间特征向量对应的注意力分配权重,对所述中间特征向量进行加权求和,生成所述融合特征向量。
24.根据权利要求20所述的装置,其特征在于,所述训练模块,用于采用下述步骤将所述样本用户的融合特征向量以及所述变换特征向量输入至第三神经网络中,获取所述样本用户的位置预测结果:
将所述融合特征向量以及所述变换特征向量进行拼接,并输入至所述第三神经网络中,获取所述样本用户的位置预测结果。
25.根据权利要求19所述的装置,其特征在于,所述训练模块,用于采用下述步骤根据各个所述样本用户的位置预测结果以及对应的实际位置,训练所述基础预测模型:
将本轮还未完成训练的样本用户中的任意一个样本用户作为当前样本用户,并根据当前样本用户的位置预测结果,以及对应的实际位置,确定当前样本用户在本轮的交叉熵损失;
根据当前样本用户在本轮的交叉熵损失,调整所述基础预测模型的参数;
将所述当前样本用户作为本轮完成训练的样本用户,并返回确定当前样本用户在本轮的交叉熵损失的步骤,直至所有样本用户都完成本轮的训练。
26.根据权利要求25所述的装置,其特征在于,所述训练模块,完成对所述基础预测模型的本轮训练后,还用于:
检测本轮是否达到预设轮数;如果是,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
使用测试集对本轮得到的所述基础预测模型进行验证;若所述测试集中,交叉熵损失不大于预设的交叉熵损失阈值的测试数据的条数,占据所述测试集中测试数据总条数的百分比,大于预设的第一百分比阈值,则停止对所述基础预测模型的训练,将最后一轮训练得到的所述基础预测模型作为所述位置预测模型;
或者,
依次将本轮各个所述样本用户的交叉熵损失,与前一轮对应的样本用户的交叉熵损失进行比对;若本轮所述样本用户的交叉熵损失大于前一轮对应样本用户的交叉熵损失的样本用户的数量,占据所有样本用户数量的百分比达到预设的第二百分比阈值,则停止对所述基础预测模型的训练,并将前一轮训练得到的所述基础预测模型作为所述位置预测模型。
27.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行如权利要求1至13任一所述的位置预测方法的步骤。
28.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至13任一所述的位置预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910054765.6A CN111461379A (zh) | 2019-01-21 | 2019-01-21 | 一种位置预测方法以及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910054765.6A CN111461379A (zh) | 2019-01-21 | 2019-01-21 | 一种位置预测方法以及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111461379A true CN111461379A (zh) | 2020-07-28 |
Family
ID=71682185
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910054765.6A Pending CN111461379A (zh) | 2019-01-21 | 2019-01-21 | 一种位置预测方法以及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111461379A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822709A (zh) * | 2021-09-15 | 2021-12-21 | 摩拜(北京)信息技术有限公司 | 一种出行数据的处理方法、装置及服务器 |
CN114201246A (zh) * | 2022-02-18 | 2022-03-18 | 浙江中控技术股份有限公司 | 数据预测方法及相关设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202236A (zh) * | 2016-06-28 | 2016-12-07 | 联想(北京)有限公司 | 一种用户位置预测方法及装置 |
CN107633680A (zh) * | 2016-07-12 | 2018-01-26 | 阿里巴巴集团控股有限公司 | 出行数据的获取方法、装置、设备和系统 |
GB201803663D0 (en) * | 2017-01-10 | 2018-04-25 | Beijing Didi Infinity Technology & Dev Co Ltd | No details |
CN107992530A (zh) * | 2017-11-14 | 2018-05-04 | 北京三快在线科技有限公司 | 信息推荐方法及电子设备 |
-
2019
- 2019-01-21 CN CN201910054765.6A patent/CN111461379A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106202236A (zh) * | 2016-06-28 | 2016-12-07 | 联想(北京)有限公司 | 一种用户位置预测方法及装置 |
CN107633680A (zh) * | 2016-07-12 | 2018-01-26 | 阿里巴巴集团控股有限公司 | 出行数据的获取方法、装置、设备和系统 |
GB201803663D0 (en) * | 2017-01-10 | 2018-04-25 | Beijing Didi Infinity Technology & Dev Co Ltd | No details |
CN107992530A (zh) * | 2017-11-14 | 2018-05-04 | 北京三快在线科技有限公司 | 信息推荐方法及电子设备 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113822709A (zh) * | 2021-09-15 | 2021-12-21 | 摩拜(北京)信息技术有限公司 | 一种出行数据的处理方法、装置及服务器 |
CN114201246A (zh) * | 2022-02-18 | 2022-03-18 | 浙江中控技术股份有限公司 | 数据预测方法及相关设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Bus stop-skipping scheme with random travel time | |
Ma et al. | Personalized real-time traffic information provision: Agent-based optimization model and solution framework | |
Islam et al. | Bus service quality prediction and attribute ranking: a neural network approach | |
CN111325374B (zh) | 一种订单取消概率的预测方法、装置和电子设备 | |
CN111292105B (zh) | 一种业务需求确定方法以及装置 | |
CN111612122A (zh) | 实时需求量的预测方法、装置及电子设备 | |
Pamucar et al. | Evaluation of metaverse integration alternatives of sharing economy in transportation using fuzzy Schweizer-Sklar based ordinal priority approach | |
CN111192090A (zh) | 航班的座位分配方法、装置、存储介质和电子设备 | |
Ban et al. | Curvature-based distribution algorithm: rebalancing bike sharing system with agent-based simulation | |
CN111461379A (zh) | 一种位置预测方法以及装置 | |
CN113326641A (zh) | 路径规划方法、装置、计算机设备及存储介质 | |
Zhang et al. | A taxi gap prediction method via double ensemble gradient boosting decision tree | |
JP2012043296A (ja) | 需要予測システム及び需要予測方法 | |
CN109345048B (zh) | 预测方法、装置、电子设备及计算机可读存储介质 | |
Peña et al. | A novel multi-objective optimization approach to guarantee quality of service and energy efficiency in a heterogeneous bus fleet system | |
Xu et al. | A taxi dispatch system based on prediction of demand and destination | |
CN111104585A (zh) | 一种问题推荐方法及装置 | |
CN110766187B (zh) | 路径规划方法、装置、服务器及存储介质 | |
CN111291253B (zh) | 模型训练方法、咨询推荐方法、装置及电子设备 | |
CN111369029A (zh) | 服务选择预测方法、装置、电子设备及存储介质 | |
CN111292106A (zh) | 一种业务需求影响因素确定方法以及装置 | |
CN113902427B (zh) | 一种预估到达时间的确定方法、装置、设备及存储介质 | |
CN107111941A (zh) | 交通链路速度预测方法及用于其的装置 | |
CN111507554A (zh) | 一种服务资源调度方法、装置、设备及存储介质 | |
Li et al. | Use of Private Probe Data in Route Choice Analysis to Explore Heterogeneity in Drivers' Familiarity with Origin–Destination Pairs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20230228 |
|
AD01 | Patent right deemed abandoned |