CN109117989B

CN109117989B - 一种任务匹配时的预测方法及装置

Info

Publication number: CN109117989B
Application number: CN201810831647.7A
Authority: CN
Inventors: 周建新; 周而重
Original assignee: Beijing Yunniao Technology Co ltd
Current assignee: Beijing Yunniao Technology Co ltd
Priority date: 2018-07-26
Filing date: 2018-07-26
Publication date: 2021-06-11
Anticipated expiration: 2038-07-26
Also published as: CN109117989A

Abstract

本发明实施例提供了一种任务匹配时的预测方法及装置，其中方法包括：获取候选任务执行者浏览过的任务数据作为样本集合，其中每条任务数据包含至少两项属性；通过构建分类回归树确定所述候选任务执行者的优先属性；当新任务到来后，根据贝叶斯模型得到所述候选任务执行者是否会接受所述新任务的预测结果。本发明采用大数据分析手段为候选任务执行者(例如司机)绘制画像，从更全面的视角对候选任务执行者是否可能会接受新任务进行预测。这样新任务推送给候选任务执行者时便能更有针对性，保证订单任务和候选任务执行者的精准匹配，实现订单任务的精确推送，从而提升了整个物流平台配送效率，降低了物流成本，此外还有降低筛选任务耗时等有益效果。

Description

一种任务匹配时的预测方法及装置

技术领域

本发明实施例涉及互联网及物流技术领域，尤其涉及一种任务匹配时的预测方法及装置。

背景技术

随着国民经济及互联网技术的快速发展，我国当前的物流规模呈现出几何式的增长，据统计2017年社会物流总额便已达到252.8万亿元的规模。虽然有众多的物流网络平台和货运公司应运而生，但物流配送效率提升慢的状况依然没有得到显著的改善，物流成本仍然居高不下。

物流配送存在各种复杂环节，为了降低成本、提升物流配送效率，现有技术多着眼于如何减少配送环节的等待时间、降低货车的空载率及对订单数量进行预测以提前备车等手段。例如，可基于客户的位置和订单量来计算最佳的提货点，从而进行车型调度，其基本原理多是通过构建线性规划模型或采用启发式优化算法衡量各种配送方案下的时间成本值，每种方案的目标都是简化和缩短各个配送环节的提货或交货过程，如考虑提货点附近车辆的货运状态和路线距离，选择最近的车辆来提升配送车辆的满载率，并结合实时路况计算出最短的配送路线，等等。

然而发明人在实现本发明的过程中发现：现有的物流技术方案虽然通过在物流调度模型上加入更多的物流相关因素来优化物流配送过程，甚至预测下一时刻的物流状态，然而物流配送效率的提升却仍然有限，未有所突破。究其原因，关键就在于现有技术依然没有做到司机与订单任务这两种资源的精准匹配，更深入的讲，现有技术构建的各种物流模型中均将“车”等同于“人”，只看到了车辆，却忽略了司机的存在，未考虑、未融合司机的个性化因素。司机是物流行业中的宝贵资源，是“最后一公里”的执行人，因此司机这一群体直接影响到物流末端的配送效率，例如一个司机对订单任务是否存在某种倾向性、其经验是否能胜任订单任务、哪些司机更愿意接受哪些订单、是否能将订单更有针对性的推送给更合适的司机，等等，但现有技术在将司机与订单任务这两种资源进行匹配时，其实只是做到了车辆与订单任务的匹配，忽略了司机的存在，从而最终导致优化物流配送效率时遇到了瓶颈。

发明内容

本发明实施例提供一种任务匹配时的预测方法及装置，以进一步提升物流配送效率。

根据本发明实施例的第一方面，提供一种任务匹配时的预测方法，所述方法包括：

获取与候选任务执行者对应的样本集合，其中所述样本集合中的样本为所述候选任务执行者浏览过的任务数据，每条所述任务数据包含至少两项属性；

根据预设规则在所述样本集合中区分出正例样本和负例样本，以所述至少两项属性作为样本属性，通过构建分类回归树确定所述候选任务执行者的优先属性，其中所述优先属性是所述至少两项属性中对所述候选任务执行者最重要的属性；

当新任务到来后，将所述优先属性作为贝叶斯模型的输入变量，根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果。

可选的，所述候选任务执行者为司机，所述任务为运送任务。

可选的，每条所述任务数据的所述至少两项属性包括以下属性中的至少两项：

仓库位置是否超出候选任务执行者工作半径、配送点位置是否超出候选任务执行者工作半径、配送点数量、货物重量、货物类型、客户口碑值。

可选的，当所述至少两项属性包括仓库位置是否超出候选任务执行者工作半径，或者，包括配送点位置是否超出候选任务执行者工作半径时，所述获取与候选任务执行者对应的样本集合，包括：

获取所述候选任务执行者的工作半径；

获取所述候选任务执行者浏览过的任务数据；

将处理过的所述任务数据作为所述样本集合，其中，所述处理包括：根据每条任务数据中的仓库位置为每条任务数据填写仓库位置是否超出候选任务执行者工作半径这一属性的属性值，根据每条任务数据中的配送点位置为每条任务数据填写配送点位置是否超出候选任务执行者工作半径这一属性的属性值。

可选的，所述获取所述候选任务执行者的工作半径，包括：

获取所述候选任务执行者的住址；

获取所述候选任务执行者的每日轨迹；

根据所述每日轨迹和所述住址确定所述候选任务执行者以所述住址为中心的所述工作半径。

可选的，当所述至少两项属性包括客户口碑值时，所述获取与候选任务执行者对应的样本集合，包括：

获取所述候选任务执行者浏览过的任务数据；

将处理过的所述任务数据作为所述样本集合，其中所述处理包括：根据每条任务数据的客户的订单任务完成率为每条任务数据填写客户口碑值这一属性的属性值。

可选的，所述根据预设规则在所述样本集合中区分出正例样本和负例样本，以所述至少两项属性作为样本属性，通过构建分类回归树确定所述候选任务执行者的优先属性，包括：

将所述样本集合中所述候选任务执行者完成的任务数据作为正例样本，将所述样本集合中所述候选任务执行者浏览但未申请的任务数据作为负例样本，每次从所述至少两项属性中选择一项属性作为当前属性，使用当前属性对所述样本集合进行划分，计算当前属性下所述候选任务执行者接受任务的概率，依据正例样本中被判定为接受任务概率高的样本占比和负例样本中被判定为接受任务概率低的样本占比来判断各个属性的分类效果，以分类效果最好的属性作为分类节点并记录其最佳的分类属性值，根据每项属性对分类结果的影响进行树形结构的裁剪，筛选出所述候选任务执行者的优先属性。

可选的，所述根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，包括：

根据所述样本集合中正例样本C₁和负例样本C₂出现的概率P(C_i)，所述样本集合中与所述新任务x相似的任务的占比P(x)，以及C_i中与所述新任务x在优先属性a_j上相似的任务的占比P(a_j|C_i)，计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，其中i＝1,2，j＝1,2…,n，n为所述优先属性的个数。

根据本发明实施例的第二方面，提供一种任务匹配时的预测装置，所述装置包括：

样本获取模块，用于获取与候选任务执行者对应的样本集合，其中所述样本集合中的样本为所述候选任务执行者浏览过的任务数据，每条所述任务数据包含至少两项属性；

优先属性确定模块，用于根据预设规则在所述样本集合中区分出正例样本和负例样本，以所述至少两项属性作为样本属性，通过构建分类回归树确定所述候选任务执行者的优先属性，其中所述优先属性是所述至少两项属性中对所述候选任务执行者最重要的属性；

预测模块，用于当新任务到来后，将所述优先属性作为贝叶斯模型的输入变量，根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果。

可选的，当所述至少两项属性包括仓库位置是否超出候选任务执行者工作半径，或者，包括配送点位置是否超出候选任务执行者工作半径时，所述样本获取模块包括：

工作半径获取子模块，用于获取所述候选任务执行者的工作半径；

任务数据获取子模块，用于获取所述候选任务执行者浏览过的任务数据；

样本处理子模块，用于将处理过的所述任务数据作为所述样本集合，其中，所述处理包括：根据每条任务数据中的仓库位置为每条任务数据填写仓库位置是否超出候选任务执行者工作半径这一属性的属性值，根据每条任务数据中的配送点位置为每条任务数据填写配送点位置是否超出候选任务执行者工作半径这一属性的属性值。

可选的，所述工作半径获取子模块用于：

获取所述候选任务执行者的住址；

获取所述候选任务执行者的每日轨迹；

可选的，当所述至少两项属性包括客户口碑值时，所述样本获取模块包括：

样本处理子模块，用于将处理过的所述任务数据作为所述样本集合，其中所述处理包括：根据每条任务数据的客户的订单任务完成率为每条任务数据填写客户口碑值这一属性的属性值。

可选的，所述优先属性确定模块用于：

可选的，所述预测模块用于：

当新任务到来后，根据所述样本集合中正例样本C₁和负例样本C₂出现的概率P(C_i)，所述样本集合中与所述新任务x相似的任务的占比P(x)，以及C_i中与所述新任务x在优先属性a_j上相似的任务的占比P(a_j|C_i)，计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，其中i＝1,2，j＝1,2…,n，n为所述优先属性的个数，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果。

本发明实施例提供的技术方案可以包括以下有益效果：

在本发明实施例中，采用大数据分析这一技术手段为每个候选任务执行者(例如司机)绘制画像，即，通过样本集合和分类回归树，分析出每个候选任务执行者的优先属性，也就是在选择任务时的倾向性。当一个新任务到来后，通过优先属性和贝叶斯模型可计算出每个候选任务执行者接受该新任务和不接受该新任务的概率，从更全面的视角对候选任务执行者是否可能会接受新任务进行预测。这样新任务推送给候选任务执行者时便能更有针对性，保证订单任务和候选任务执行者的精准匹配，实现订单任务的精确推送，从而提升了整个物流平台的配送效率，降低了物流成本，而且还有着降低了司机因缺乏配送经验导致物流事故的风险、减少了司机在物流网络平台上筛选任务的耗时等多种有益效果。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。此外，这些介绍并不构成对实施例的限定，附图中具有相同参考数字标号的元件表示为类似的元件，除非有特别申明，附图中的图不构成比例限制。

图1是根据本发明一示例性实施例示出的一种任务匹配时的预测方法的流程图；

图2是根据本发明一示例性实施例示出的一种任务匹配时的预测方法的流程图；

图3是根据本发明一示例性实施例示出的一种任务匹配时的预测方法的流程图；

图4是根据本发明一示例性实施例示出的一种任务匹配时的预测方法的流程图；

图5是根据本发明一示例性实施例示出的一种任务匹配时的预测装置的示意图；

图6是根据本发明一示例性实施例示出的一种任务匹配时的预测装置的示意图；

图7是根据本发明一示例性实施例示出的一种任务匹配时的预测装置的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据本发明一示例性实施例示出的一种任务匹配时的预测方法的流程图。作为示例，该方法可用于服务器等设备。

参见图1所示，该方法可以包括以下步骤：

步骤S101，获取与候选任务执行者对应的样本集合，其中所述样本集合中的样本为所述候选任务执行者浏览过的任务数据，每条所述任务数据包含至少两项属性。

作为示例，所述候选任务执行者可以为司机，所述任务可以为运送任务，例如可以是货物的配送任务，或者是乘客的运送任务等等。

以司机为例，在物流平台上，司机通常会浏览很多任务数据，如司机可以主动在物流平台上寻找合适的订单任务，也可以浏览推送给自己的订单任务，每条任务数据一般都会自带多项属性，例如本条任务数据的下单客户信息、目的地信息、货物信息，等等。在本实施例中，将这些浏览过的任务数据集合起来，可作为该司机的样本集合，也就相当于该司机的大数据。对于具体是哪些项属性，本实施例并不进行限制，本领域技术人员可以根据不同需求\不同场景而自行选择、设计，可以在此处使用的这些选择和设计都没有背离本发明的精神和保护范围。

步骤S102，根据预设规则在所述样本集合中区分出正例样本和负例样本，以所述至少两项属性作为样本属性，通过构建分类回归树确定所述候选任务执行者的优先属性，其中所述优先属性是所述至少两项属性中对所述候选任务执行者最重要的属性。

本实施例基于从物流平台获得的线上订单任务数据和线下数据所组成的大数据，在服务司机但又不侵犯司机个人隐私的前提下，建立完善的司机画像，通过司机画像反映该司机对不同行业订单任务的喜好程度及行业配送经验等，从而实现订单任务和司机的精准匹配。

一条任务数据中通常会包含客户名称、仓库位置、司机到仓库时间、配送点位置、配送点数、搬运重量、货物类型等多种属性信息，其中有一些属性会是一个司机优先考虑和关注的，可称为该司机的优先属性，这些优先属性反映了司机的倾向性，也即反映出司机的特点，因此可以构成司机画像。例如司机多不会选择离住地较远，配送区域不熟悉，影响固定作息习惯，搬运强度或其他配送要求超过司机能力范围的订单，这也是同样的价位但不同司机接受程度不同的主要原因。

为了从众多属性中筛选出哪个或哪些属性是一个司机关注的，本发明实施例采用了分类回归树技术来刻画司机群体在订单任务上的个性化差异，即找出影响司机接单意愿的关键因素，判断一个司机是否在意仓库位置、是否在意配送区域、是否在意工作时间、是否在意搬运重量、是否在意配送点数量、是否在意货物类型及是否在意客户口碑等等。大数据分析技术中的分类问题是指把具有某种共同属性或特征的数据归并在一起，即通过类别的属性或特征来对数据进行区别。决策树是模式识别或大数据分类等领域中的一种现有技术，分类回归树则是决策树的一种实现方式。在有了样本集合及明确了样本属性的情况下，对于具体如何通过构建分类回归树从各属性中确定哪些是所述候选任务执行者的优先属性，本实施例并不进行限制，本领域技术人员可以根据不同需求\不同场景而自行选择、设计，可以在此处使用的这些选择和设计都没有背离本发明的精神和保护范围。

步骤S103，当新任务到来后，将所述优先属性作为贝叶斯模型的输入变量，根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果。

贝叶斯分类是一种利用概率统计值进行分类的方法，即判断待分类样本某个属性值出现的条件下该样本属于不同类别的概率，并选择概率值最大的类别作为其分类结果。贝叶斯分类也属于一种现有技术，因此此处不再赘述，本领域技术人员可以根据不同需求\不同场景而自行选择、设计，可以在此处使用的这些选择和设计都没有背离本发明的精神和保护范围。

当计算出司机选择接受新任务和不接受新任务两种结果的概率值后，可选择概率值最大的结果来判断司机是否愿意接受该新任务，完成预测。

在本实施例或本发明其他某些实施例中，每条所述任务数据的所述至少两项属性可以包括以下属性中的至少两项：

仓库位置是否超出候选任务执行者的作半径、配送点位置是否超出候选任务执行者工作半径、配送点数量、货物重量、货物类型、客户口碑值。

作为示例可参见表1，表1为分类决策树的训练样本属性结构：

表1

其中“是否完成本任务”可用于将样本集合划分为正例样本和负例样本。

因为有时一条任务数据中只包含仓库位置的信息，而并不进一步包含仓库位置是否超出候选任务执行者工作半径的属性信息，所以这类情况下需要专门在任务数据中补充仓库位置是否超出候选任务执行者工作半径这一属性的属性值，作为示例：

参见图2所示，当所述至少两项属性包括仓库位置是否超出候选任务执行者工作半径，或者，包括配送点位置是否超出候选任务执行者工作半径时，所述获取与候选任务执行者对应的样本集合，可以包括：

步骤S201，获取所述候选任务执行者的工作半径。

例如可参见图3所示，所述获取所述候选任务执行者的工作半径，可以包括：

步骤S2011，获取所述候选任务执行者的住址。

步骤S2012，获取所述候选任务执行者的每日轨迹。

例如司机的手机上通常装有专门用于登录物流平台的APP，可以通过该APP进行GPS定位，得到司机的每日运动轨迹。

步骤S2013，根据所述每日轨迹和所述住址确定所述候选任务执行者以所述住址为中心的所述工作半径。

可以依据其每日轨迹点确定其主要停留区域，进而确定司机以其住址为中心的工作半径。

步骤S202，获取所述候选任务执行者浏览过的任务数据。

步骤S203，将处理过的所述任务数据作为所述样本集合，其中，所述处理包括：根据每条任务数据中的仓库位置为每条任务数据填写仓库位置是否超出候选任务执行者工作半径这一属性的属性值，根据每条任务数据中的配送点位置为每条任务数据填写配送点位置是否超出候选任务执行者工作半径这一属性的属性值。

又因为有时一条任务数据中只包含下单客户的客户名称等信息，而并不进一步包含客户口碑值这一属性信息，所以这种情况下需要专门在任务数据中补充客户口碑值，作为示例：

参见图4所示，当所述至少两项属性包括客户口碑值时，所述获取与候选任务执行者对应的样本集合，可以包括：

步骤S401，获取所述候选任务执行者浏览过的任务数据。

步骤S402，将处理过的所述任务数据作为所述样本集合，其中所述处理包括：根据每条任务数据的客户的订单任务完成率为每条任务数据填写客户口碑值这一属性的属性值。

例如，如果有客户下过100个订单，完成了其中的99个，则该客户的客户口碑值为0.99。

下面再对分类回归树和贝叶斯模型在本发明实施例中的具体应用进行举例说明。

决策树是一种倒置的树形结构，其每个节点代表依据一个样本属性值的判断，每个分支代表一个判断结果的输出，每个叶子节点代表一种类别。决策树的分类过程是从其根节点开始，将待分类样本与决策树中同一层上的节点进行比较，并按照比较结果选择下一次比较的分支，直到叶子节点为止，最后将叶子节点代表的类别作为待分类样本的分类结果。

分类回归树是决策树的一种实现方式，其实现过程如下：

1)从样本未被使用的属性集合中选取出一个最佳的属性和属性值，对样本集进行分割。若样本集合S中的样本分属于k个类别的集合C＝{C₁,C₂,..,C_k}，按样本属性A的第个i值分割成的集合为S₁和S₂，则属性A第个i值的分类效果度量公式如下：

Gain_GINI_A,i＝P(S₁)GINI(S₁)+P(S₂)GINI(S₂) (1)

其中P(C_i)代表类别C_i在样本集中出现的概率。

2)对分割出的样本集重复上述操作，直至所有属性都被使用。

3)依据每个属性对其分类结果的影响，进行树形结构的裁剪。若从属性t衍生出的子树T_t对应的叶子节点数为|L(T_t)|，r(t)代表删除子树T_t后属性t作为叶子节点时输出的样本的分类效果(分类误差)，P(t)为输出的分类样本在样本集合S中的比重，R(t)为未删除子树T_t时子树T_t各叶子节点对正负例样本的分类效果,则删除属性t前后对分类的影响度量公式如下：

R(T_t)＝r(t)×P(t) (4)

在本发明实施例中，所述根据预设规则在所述样本集合中区分出正例样本和负例样本，以所述至少两项属性作为样本属性，通过构建分类回归树确定所述候选任务执行者的优先属性，可以包括：

作为示例，上段中的申请可以是直接申请执行任务，也可以是以竞价、竞标、报价等形式申请执行任务，对此本发明实施例并不进行限制。

另外需要说明的是，对于候选任务执行者浏览过的任务数据，可以分为两部分，一部分是该候选任务执行者已完成的任务，另一部分则是该候选任务执行者未完成的任务。而对于该候选任务执行者未完成的任务，则又可分为浏览但未申请、浏览并申请但申请未成功、浏览并申请且申请成功但因故未完成这三类，对于后面的浏览并申请但申请未成功、浏览并申请且申请成功但因故未完成这两类，因为其比较特殊，从中很难分析出候选任务执行者的倾向性，故在进行样本训练时将后面这两类舍弃。

以仓库位置是否超过工作半径这一属性为例，利用公式(1)构建分类回归树，即将司机浏览过的订单任务分割为仓库位置超过司机工作半径的订单任务集合T1和未超过工作半径的任务集合T2后，评估司机接受订单的概率：

Gain_GINI(仓库位置)＝

P(T1)×(1-P(T1中接受订单)-P(T1中不接受订单))+

P(T2)×(1-P(T2中接受订单)-P(T2中不接受订单))

其中P(T1)为司机浏览过的订单任务中T1的占比，P(T1中接受订单)指订单集合T1中正例样本的占比，P(T1中不接受订单)指订单集合T1中负例样本的占比。

类似的，将司机浏览过的订单任务分割为配送点超过其工作半径和未超过工作半径的任务集合后，评估司机接受订单的概率Gain_GINI(配送点位置)。根据货物重量分割任务集后评估司机接受订单的概率Gain_GINI(货物重量)。根据配送点数量分割任务集后评估司机接受订单的概率Gain_GINI(配送点数量)。根据订单任务配送的货物类型分割任务集后评估司机接受订单的概率Gain_GINI(货物类型)。根据客户口碑值分割任务集后评估司机接受订单的概率Gain_GINI(客户口碑)。最后选出Gain_GINI值最小的属性作为分类回归树中的分类节点。

构建出分类回归树后，利用公式(3)筛选出司机对订单任务的重点关注项，即若属性“客户口碑”为父节点，属性“搬运重量”(也即货物重量)为其子节点且“搬运重量”无子节点，依据“客户口碑”分类出2个任务集合Ts1和Ts2，任务Ts1的分类效果为r(Ts1)，Ts1在司机浏览过的任务集中占比为P(Ts1)，依据属性“搬运重量”从Ts1中分类出2个任务集合TL1和TL2，则属性“搬运重量”的重要性：

α(搬运重量)＝P(Ts1)×r(Ts1)-P(TL1)×r(TL1)-P(TL2)×r(TL2)

若α(搬运重量)超过指定值，则说明“搬运重量”是该司机关注的属性，也即优先属性。

通过判断每个属性在分类树中的重要性可完善或更新每个司机的画像，作为示例，司机画像的组成可参见表2。司机画像中属性值为“是”的属性即为司机在意的属性，也即优先属性，界定值则反映了司机对属性的接受界限，该界定值即为分类回归树上对应节点的分类属性值，例如表2中，司机不能接受的订单会存在下面的特征：仓库在居住地5000m以外；配送点出现在居住地10公里以外；货物重量在2吨以上；客户口碑值在0.9以下。

表2

属性	属性值	界定值
			司机编号	*****
注册车型	金杯
			家庭住址	******
仓库位置离家距离倾向性	是	5000
			配送点离家距离倾向性	是	10000
货物重量倾向性	是	2
			配送点数量倾向性	否
货物类型倾向性	否
			客户口碑值倾向性	是	0.9

贝叶斯分类是一种利用概率统计值进行分类的方法，即判断待分类样本某个属性值出现的条件下该样本属于不同类别的概率，并选择概率值最大的类别作为其分类结果。若样本x＝{a₁,a₂,..,a_m}，a_j为x的第j个属性，由n个类别组成的集合C＝{C₁,C₂,..,C_n}，贝叶斯分类过程如下：

i)计算样本集中样本x出现的概率P(x)、各类别出现的概率P(C_i)及样本各属性a_j的条件概率P(a_j|C_i)

ii)计算样本x属于各类别概率值，即

选择最大概率值的类别。

在本发明实施例中，所述根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，可以包括：

假设司机在意的属性也即优先属性为a_j，将作为贝叶斯模型的输入变量。依据公式(5)，贝叶斯模型根据样本集合C中正例或负例样本出现的概率P(C_i)，C中与新订单x相似的订单占比P(x),以及C_i中与新订单x在属性a_j方面相似的订单占比P(a_j|C_i)，分别计算出司机选择接单和不接单的概率值。最后通过比较两种情况下的概率值来判断司机是否愿意接单。

作为示例，为方便贝叶斯模型的计算，正例和负例样本及最新发布的订单任务将依据司机画像的界定值转变为表3所示的贝叶斯模型训练样本属性结构。

表3

举例来讲，若司机在意订单任务的“搬运重量”和“客户口碑”两项属性，新订单x的搬运重量为Wn，客户口碑值为Vn，司机画像中属性“搬运重量”的界定值为Ws，属性“客户口碑”的界定值为Vs。如果Wn>Ws且Vn>Vs，即贝叶斯模型中新订单的司机“搬运重量接受意愿”值为“否”，“客户口碑接受意愿”值为“是”。此时样本集合C中订单x出现的概率为：

P(搬运重量接受意愿＝否,客户口碑接受意愿＝是)

C₁中“搬运重量”不符合司机接受意愿的订单占比为：

P(搬运重量接受意愿＝否|C₁)

C₁中“客户口碑”达到司机接受意愿的订单占比为：

P(客户口碑意愿＝是|C₁)

则司机接受订单x的概率为：

C₂中“搬运重量”不符合司机接受意愿的订单占比为：

P(搬运重量接受意愿＝否|C₂)

C₂中“客户口碑”达到司机接受意愿的订单占比为：

P(客户口碑接受意愿＝是|C₂)

则司机不接受订单x的概率为：

若P(C₁|x)大于P(C₂|x)，则认定司机会选择接受订单x；否则认定司机会拒绝接单。其他情况下，若Wn<Ws且Vn>Vs，则订单x出现的概率为：

P(搬运重量接受意愿＝是,客户口碑接受意愿＝是)

若Wn<Ws且Vn<Vs，则订单x出现的概率为：

P(搬运重量接受意愿＝是,客户口碑接受意愿＝否)

判断司机是否接单的计算方法同上，不再赘述。

下述为本发明装置实施例，可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节，请参照本发明方法实施例。

图5是根据本发明一示例性实施例示出的一种任务匹配时的预测装置的示意图。作为示例，该装置可用于服务器等设备。

参见图5所示，该装置可以包括：

样本获取模块501，用于获取与候选任务执行者对应的样本集合，其中所述样本集合中的样本为所述候选任务执行者浏览过的任务数据，每条所述任务数据包含至少两项属性。

优先属性确定模块502，用于根据预设规则在所述样本集合中区分出正例样本和负例样本，以所述至少两项属性作为样本属性，通过构建分类回归树确定所述候选任务执行者的优先属性，其中所述优先属性是所述至少两项属性中对所述候选任务执行者最重要的属性。

预测模块503，用于当新任务到来后，将所述优先属性作为贝叶斯模型的输入变量，根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果。

参见图6所示，当所述至少两项属性包括仓库位置是否超出候选任务执行者工作半径，或者，包括配送点位置是否超出候选任务执行者工作半径时，所述样本获取模块可以包括：

工作半径获取子模块601，用于获取所述候选任务执行者的工作半径。

任务数据获取子模块602，用于获取所述候选任务执行者浏览过的任务数据。

样本处理子模块603，用于将处理过的所述任务数据作为所述样本集合，其中，所述处理包括：根据每条任务数据中的仓库位置为每条任务数据填写仓库位置是否超出候选任务执行者工作半径这一属性的属性值，根据每条任务数据中的配送点位置为每条任务数据填写配送点位置是否超出候选任务执行者工作半径这一属性的属性值。

作为示例，所述工作半径获取子模块具体可以用于：

获取所述候选任务执行者的住址；

获取所述候选任务执行者的每日轨迹；

例如司机的手机上通常装有专门用于登录物流平台的APP，可以通过该APP进行GPS定位，得到司机的每日运动轨迹。可以依据其每日轨迹点确定其主要停留区域，来确定司机以其住址为中心的工作半径。

参见图7所示，当所述至少两项属性包括客户口碑值时，所述样本获取模块可以包括：

任务数据获取子模块701，用于获取所述候选任务执行者浏览过的任务数据；

样本处理子模块702，用于将处理过的所述任务数据作为所述样本集合，其中所述处理包括：根据每条任务数据的客户的订单任务完成率为每条任务数据填写客户口碑值这一属性的属性值。

在本实施例或本发明其他某些实施例中，所述优先属性确定模块具体可以用于：

需要说明的是，对于候选任务执行者浏览过的任务数据，可以分为两部分，一部分是该候选任务执行者已完成的任务，另一部分则是该候选任务执行者未完成的任务。而对于该候选任务执行者未完成的任务，又可分为浏览但未申请、浏览并申请但申请未成功、浏览并申请且申请成功但因故未完成这三类，对于后面的浏览并申请但申请未成功、浏览并申请且申请成功但因故未完成这两类，因为其比较特殊，从中很难分析出候选任务执行者的倾向性，故在进行样本训练时将后面这两类舍弃。

在本实施例或本发明其他某些实施例中，所述预测模块具体可以用于：

关于上述实施例中的装置，其中各个单元\模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由所附的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims

1.一种任务匹配时的预测方法，其特征在于，所述方法包括：

当新任务到来后，将所述优先属性作为贝叶斯模型的输入变量，根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果；

其中，通过构建分类回归树确定所述候选任务执行者的优先属性，包括：

将所述样本集合中所述候选任务执行者完成的任务数据作为正例样本，将所述样本集合中所述候选任务执行者浏览但未申请的任务数据作为负例样本，每次从所述至少两项属性中选择一项属性作为当前属性，使用当前属性对所述样本集合进行划分，计算当前属性下所述候选任务执行者接受任务的概率，依据正例样本中被判定为接受任务概率高的样本占比和负例样本中被判定为接受任务概率低的样本占比来判断各个属性的分类效果，以分类效果最好的属性作为分类节点并记录其最佳的分类属性值，根据每项属性对分类结果的影响进行树形结构的裁剪，筛选出所述候选任务执行者的优先属性；

具体地，若从属性t衍生出的子树T_t对应的叶子节点数为|L(T_t)|，r(t)代表删除子树T_t后属性t作为叶子节点时输出的样本的分类效果，P(t)为输出的分类样本在样本集合S中的比重，R(t)为未删除子树T_t时子树T_t各叶子节点对正负例样本的分类效果，则删除属性t前后对分类的影响度量公式如下：

R(T_t)＝r(t)×P(t)。

2.根据权利要求1所述的方法，其特征在于，所述候选任务执行者为司机，所述任务为运送任务。

3.根据权利要求1所述的方法，其特征在于，每条所述任务数据的所述至少两项属性包括以下属性中的至少两项：

4.根据权利要求3所述的方法，其特征在于，当所述至少两项属性包括仓库位置是否超出候选任务执行者工作半径，或者，包括配送点位置是否超出候选任务执行者工作半径时，所述获取与候选任务执行者对应的样本集合，包括：

获取所述候选任务执行者的工作半径；

获取所述候选任务执行者浏览过的任务数据；

5.根据权利要求4所述的方法，其特征在于，所述获取所述候选任务执行者的工作半径，包括：

获取所述候选任务执行者的住址；

获取所述候选任务执行者的每日轨迹；

6.根据权利要求3所述的方法，其特征在于，当所述至少两项属性包括客户口碑值时，所述获取与候选任务执行者对应的样本集合，包括：

获取所述候选任务执行者浏览过的任务数据；

7.根据权利要求1所述的方法，其特征在于，所述根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，包括：

8.一种任务匹配时的预测装置，其特征在于，所述装置包括：

预测模块，用于当新任务到来后，将所述优先属性作为贝叶斯模型的输入变量，根据所述贝叶斯模型分别计算所述候选任务执行者接受所述新任务和不接受所述新任务的概率，以及，根据所述概率得到所述候选任务执行者是否会接受所述新任务的预测结果；

其中，所述优先属性确定模块用于：

R(T_t)＝r(t)×P(t)。

9.根据权利要求8所述的装置，其特征在于，所述候选任务执行者为司机，所述任务为运送任务。

10.根据权利要求8所述的装置，其特征在于，每条所述任务数据的所述至少两项属性包括以下属性中的至少两项：

11.根据权利要求10所述的装置，其特征在于，当所述至少两项属性包括仓库位置是否超出候选任务执行者工作半径，或者，包括配送点位置是否超出候选任务执行者工作半径时，所述样本获取模块包括：

12.根据权利要求11所述的装置，其特征在于，所述工作半径获取子模块用于：

获取所述候选任务执行者的住址；

获取所述候选任务执行者的每日轨迹；

13.根据权利要求10所述的装置，其特征在于，当所述至少两项属性包括客户口碑值时，所述样本获取模块包括：

14.根据权利要求8所述的装置，其特征在于，所述预测模块用于：