CN109961248A

CN109961248A - 运单投诉预测方法、装置、设备及其存储介质

Info

Publication number: CN109961248A
Application number: CN201711426163.6A
Authority: CN
Inventors: 王本玉; 陈佳琦; 刘琼; 金晶
Original assignee: SF Technology Co Ltd
Current assignee: SF Technology Co Ltd
Priority date: 2017-12-25
Filing date: 2017-12-25
Publication date: 2019-07-02
Anticipated expiration: 2037-12-25
Also published as: CN109961248B

Abstract

本申请公开了运单投诉预测方法、装置、设备及其存储介质。该方法包括：基于历史运单数据创建运单投诉基础模型；基于历史运单数据创建运单投诉实时模型；由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型；将新运单数据输入到运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。本申请实施例的技术方案，通过构建运单投诉基础模型和运单投诉实时模型，提升了预测值的精准度，同时通过引入分段时间特征，提升了预测值的时效性，解决了现有技术中运单投诉滞后的问题，有助于事先预警运单被投诉的情况，优化了物流行业的管理质量，同时提升了客户的体验感。

Description

运单投诉预测方法、装置、设备及其存储介质

技术领域

本申请一般涉及计算机技术领域，具体涉及数据挖掘技术领域，尤其涉及运单投诉预测方法、装置、设备及其存储介质。

背景技术

随着物流行业的发展，快递运单量迅速增长，伴随而生的客户资料数据，具有极大的利用价值。大部分用于对用户投诉的处理和预防，但是现有技术中利用物流数据处理用户投诉问题，存在滞后的问题，不能实时预测客户投诉的概率。

传统的二元判别模型仅仅给出一个运单被投诉的概率，这种方式预测运单被投诉的概率存在与真实投诉场景不符合的问题，例如，在运单产生的初期阶段，可能存在高估运单被投诉概率的问题，而随着运单耗时增加，又会导致运单被投诉的概率降低。

基于上述问题，亟待提出一种实时更新运单被投诉的概率的方法。

发明内容

鉴于现有技术中的上述缺陷或不足，期望提供一种可用于实时预测运单被投诉的方案。

第一方面，本申请实施例提供了一种运单投诉预测方法，该方法包括：

基于历史运单数据创建运单投诉基础模型；

基于历史运单数据创建运单投诉实时模型；

由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型；

将新运单数据输入到运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

第二方面，本申请实施例提供了一种运单投诉预测装置，该装置包括：

基础模型创建单元，用于基于历史运单数据创建运单投诉基础模型；

实时模型创建单元，用于基于历史运单数据创建运单投诉实时模型；

总模型创建单元，用于由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型；

预测单元，用于将新运单数据输入到运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

第三方面，本申请实施例提供了一种设备，包括处理器、存储装置，该存储装置，用于存储一个或多个程序；

当前述一个或多个程序被前述处理器执行，使得前述处理器实现本申请实施例描述的方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，其上存储有计算机程序，前述计算机程序被处理器执行时，实现本申请实施例描述的方法。

本申请实施例提供的可用于实时预测运单被投诉的方案，通过基于历史运单数据分别搭建运单投诉基础模型和运单投诉实时模型，分别用于挖掘影响历史运单被投诉的主要特征，并根据运单投诉基础模型和运单投诉实时模型构建一个运单投诉总模型，均衡考虑了不同机器学习模型在挖掘历史运单数据被投诉概率的影响程度，同时，提出将历史运单数据进行时间分段处理后，以创建运单投诉实时模型，通过将运单的实时时间特征引入模型，降低了运单被投诉的概率，提升了物流的服务质量。

按照本申请实施例的技术方案，通过构建运单投诉基础模型和运单投诉实时模型，提升了预测值的精准度，同时通过引入分段时间特征，提升了预测值的时效性，解决了现有技术中运单投诉滞后的问题，有助于事先预警运单被投诉的情况，优化了物流行业的管理质量，同时提升了客户的体验感。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：

图1示出了本申请实施例提供的运单投诉预测方法的流程示意图；

图2示出了本申请又一实施例提供的运单投诉预测方法的流程示意图；

图3示出了本申请实施例提供的运单投诉预测装置的结构示意图；

图4示出了本申请又一实施例提供的运单投诉预测装置的结构示意图；

图5示出了适于用来实现本申请实施例的终端设备的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与发明相关的部分。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

请参考图1，图1示出了本申请实施例提供运单投诉预测方法的流程示意图。

如图1所示，该方法包括：

步骤101，基于历史运单数据创建运单投诉基础模型。

本申请实施例，在获取设定时间范围内的历史运单数据之后，对该历史运单数据进行挖掘，以获得影响运单被投诉的重要特征因素。然后，基于重要特征因素来创建运单投诉基础模型。

本申请实施例中，运单投诉基础模型包括至少两个机器学习模型，例如第一机器学习模型和第二机器学习模型。基于第一机器学习模型和/或第二机器学习模型从历史运单数据中提取影响运单被投诉的重要特征因素。重要特征因素包括运单维度、客户维度、员工维度等因素。其中，运单维度包括：运单的揽收时间、运单重量、收件大区、寄件大区、保价情况、易碎情况、托寄物的体积(或运单体积)、运单费用、付费类型、托寄物类型、运单类型等等。

其中，客户维度包括：收件人作为客户，寄件人作为客户，细分为客户类型、客户行业类别、客户历史投诉次数、和最近投诉时间等等。

其中，员工维度包括：员工的工龄、历史被投诉次数、最近投诉时间等等。

本申请实施例中，基于历史运单数据提取的重要特征因素及其权重系数创建运单投诉基础模型，可以是将经过处理的历史运单数据划分为训练数据集和验证数据集，基于训练数据集提取影响运单的重要特征及其系数，然后以运单是否被投诉作为响应变量，提取的重要特征作为因变量，创建第一机器学习模型。采用同样的方式创建第二机器学习模型，其中第一机器学习模型可以是逻辑回归模型或随机森林模型或其他判别模型，第二机器学习模型也可以是逻辑回归模型或随机森林模型或其他判别模型。优选地，第一机器学习模型为逻辑回归模型，第二机器学习模型为随机森林模型。

通过创建第一机器学习模型和第二机器学习模型，以获得运单投诉基础模型，均衡考虑了不同机器学习模型在挖掘历史运单数据被投诉概率的影响力，从而获得更为准确的预测结果。

步骤102，基于历史运单数据创建运单投诉实时模型。

本申请实施例中，经过历史运单数据分析可知，运单从生成到结束的整个时间范围内，运单被投诉的概率是不同的。现有技术中预测模型，在运单生成时可能存在较高的预测概率，而在运单结束时可能存在较低的预测概率，与真实被投诉场景并不相符。例如，属于即日件的运单A，从揽件到妥投(即运单被投递或者派件完成)的生命周期可以定义为12个小时。但是，运单A被投诉的概率在整个生命周期内并不是均匀分布的，也不是特定唯一的。例如，运单A，揽收时间2017年10月24日上午8点，如果妥投时间为2017年10月24日下午17:00，运单A可能一直未被投诉。如果运单A的妥投时间在2017年10月24日下午18:30，运单A可能在2017年10月24日下午17:30被投诉。如果利用现有的预测模型，不能准确地获取运单A被投诉的概率，即使得到运单A被投诉的概率，也只能获得滞后的预测概率。

为了从运单维度中筛选出更有价值的时间特征来预测运单被投诉的概率值。本申请实施例，优选地，将历史运单投诉数据进行还原处理，将运单在整个生命周期的时间特征进行划分监测，从而建立能够实时反映运单在生命周期内被投诉的概率的实时预测模型。这里的生命周期是根据运单类型定义的时间范围。例如，即日件，生命周期为12个小时，次晨件为28个小时，次日件为36个小时。

为了更准确地预测运单被投诉的概率，进一步获取运单生命周期内的信息。可选地，将生命周期按照预设时间间隔划分成多个连续时间段，并对该连续时间段内，运单是否被投诉进行标记。通过将历史运单数据进行还原，将运单在整个生命周期内的时间段进行切分来实现。预设时间间隔可以是3个小时，1个小时，30分钟，甚至更短时间。例如，运单A的生命周期为12个小时，运单A的实际耗时为2017年10月24日上午8点到2017年10月24日下午17:00，预设时间间隔可以设定为3小时，即每隔3小时切分一次。如果揽收时间为8点00分，每隔3小时划分一段，8:00-11:00(3小时)，8:00-14:00(6小时)，8:00-17:00(9小时)，8:00-20:00(12小时)，可以得到重叠连续的时间段，通过对前述重叠连续时间段进行判断分析，可以得到运单A被投诉的结果。

通过将训练数据集的数据进行时间分段处理，从经过时间分段处理后的训练数据集中提取影响运单被投诉的重要特征因素及其权重，从而创建运单投诉实时模型。运单投诉实时模型基于训练数据集学习得到运单在生命周期的变化规律，并将生命周期的分段时间特征作为影响运单被投诉的实时因变量，引入运单投诉实时模型，从而解决现有技术中只能获得滞后概率的问题。

本申请实施例中，可选地，利用第三机器学习模型对训练数据集进行训练，得到第三机器学习模型。第三机器学习模型以分段时间特征是否被投诉作为响应变量，运单维度特征中运单类型、运单自揽收开始耗时特征、运单分段时间的上一时间段是否妥投特征、员工维度等作为因变量。第三机器学习模型可以是逻辑回归模型，逻辑回归森林模型或者随机森林模型或者梯度提升决策树GBDT模型。

步骤103，由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型。

本申请实施例中，通过将历史运单数据的验证数据集分别输入运单投诉基础模型和运单投诉实时模型，以获取历史运单被投诉的基础预测概率值和实时预测概率值。

其中历史运单被投诉的基础预测概率值等于第一机器学习模型和第二机器学习模型分别预测的概率值的加权值。该基础预测概率值等于第一机器学习模型预测的第一概率值乘以第一权重系数加上第二机器学习模型预测的第二概率值乘以第二权重系数。其中，第一权重系数和第二权重系数按照曲线下的面积AUC的最大原则确定。

历史运单被投诉的实时预测概率值等于第三机器学习模型预测的概率值，其中，第三机器学习模型可以作为运单投诉实时模型，第三机器学习模型可以是随机森林模型或逻辑回归模型，梯度提升决策树GBDT模型或其他判别模型。优选地，第三学习模型为逻辑回归模型。

为了综合历史运单和实时监测运单的影响权重，基于基础预测概率值和实时预测概率值，可以计算出历史运单被投诉的总预测概率值。其中，该总预测概率值等于基础概预测率值乘以第三权重系数加上实时预测概率值乘以1与第三权重系数的差值。其中，第三权重系数按照曲线下的面积AUC的最大原则确定。

通过对历史运单数据的训练得到运单投诉总模型，该运单投诉总模型包括运单投诉基础模型和运单投诉实时模型两部分。

步骤104，将新运单数据输入到运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

在运单投诉总模型创建完成之后，将新运单数据输入到运单投诉总模型中，即可得到新运单被投诉的总预测概率值，该总预测概率值是与新运单的揽收时间分段相关的，能够提前预测下一个时间段新运单是否被投诉，在新运单整个生命周期内可以实时地更新被投诉的预测概率，从而使得整个预测过程中引入了前置信息，解决了现有技术中预测滞后的问题。

请参考图2，图2示出了本申请又一实施例提供运单投诉预测方法的流程示意图。

如图2所示，该方法包括：

步骤201，基于历史运单数据创建运单投诉基础模型。

本申请实施例中，在于基于历史运单数据创建运单投诉基础模型之前，需要对历史运单数据进行处理。例如，清洗转换获取的预设时间范围的历史运单数据，并利用随机抽样法从历史运单数据中抽取第一训练数据集和第一验证数据集。例如，预设时间范围为2016年5月1日至2017年5月1日，获取预设时间范围内的历史运单数据，对这部分数据进行预处理之后，利用随机抽样法建立训练数据集和验证数据集，例如70％为训练数据集，30％为验证数据集。

通过对历史运单数据进行预处理，可以消除可能由输入错误导致的重复数据，例如去重处理；可以对空值、无实际意义的数据进行数据转换等等，例如填补缺失值。具体根据不同的数据类型采用不同的预处理方式。然后，基于清洗处理后的历史运单数据，提取运单被投诉的重要影响因素(也称为主要特征)，例如运单维度、客户维度、员工维度等。

利用历史运单数据的第一训练数据集，以运单是否被投诉为响应变量，运单维度、客户维度、员工维度为因变量，利用第一机器学习模型训练得到影响运单被投诉的主要特征及其权重系数。本申请实施例中，第一机器学习模型可以是逻辑回归模型、随机森林模型或者其他判别模型。

可选地，运单投诉基础模型包括至少两个机器学习模型，例如第一机器学习模型和第二机器学习模型。基于第一机器学习模型和/或第二机器学习模型从历史运单数据中提取影响运单被投诉的重要特征因素。重要特征因素包括运单维度、客户维度、员工维度等因素。其中，运单维度包括：运单的揽收时间、运单重量、收件大区、寄件大区、保价情况、易碎情况、托寄物的体积(或运单体积)、运单费用、付费类型、托寄物类型、运单类型等等。

本申请实施例中，基于历史运单数据提取的重要特征因素及其权重系数创建运单投诉基础模型，可以是将经过处理的历史运单数据划分为训练数据集和验证数据集，基于训练数据集提取影响运单的重要特征及其系数，然后以运单是否被投诉作为响应变量，提取的重要特征作为因变量，创建第一机器学习模型。采用同样的方式创建第二机器学习模型，其中第一机器学习模型可以是逻辑回归模型或随机森林模型或其他神经网络模型，第二机器学习模型也可以是逻辑回归模型或随机森林模型或其他判别模型。优选地，第一机器学习模型为逻辑回归模型，第二机器学习模型为随机森林模型。

本申请在获取设定时间范围内的历史运单数据之后，通过第一机器学习模型和第二机器学习模型对历史运单投诉数据进行挖掘处理，以获得影响运单被投诉的重要影响因素，并获得更好地的拟合性能，使得模型性能更加优异。

可选地，步骤201包括：

步骤2011，清洗转换获取的预设时间范围的历史运单数据；

步骤2012，利用随机抽样法从历史运单数据中抽取第一训练数据集和第一验证数据集；

步骤2013，创建第一机器学习模型和第二机器学习模型；

步骤2014，由第一机器学习模型和第二机器学习模型加权得到运单投诉基础模型。

其中，步骤2013，通过创建第一机器学习模型和第二机器学习模型，从而创建运单投诉基础模型。创建机器学习模型的数量不限于两个，可以是两个以上，也可以仅选择一个，根据不同的处理数据，可以选择不同的组合方式。优选地，创建第一机器学习模型和第二机器学习模型。对于机器学习模型的类型，可以是随机森林模型、逻辑回归模型或其他判别模型。优选地，第一机器学习模型为逻辑回归模型，第二机器学习模型为随机森林模型。

以第一机器学习模型为逻辑回归模型，第二机器学习模型为随机森林模型为例。优选地，预设时间范围为2016年5月1日至2017年5月1日，获取预设时间范围内的历史运单数据，对这部分数据进行预处理之后，利用随机抽样法建立训练数据集和验证数据集，例如70％为第一训练数据集，30％为第二验证数据集。

针对训练数据集，根据AIC最小的原则利用逻辑回归模型逐步回归，提取影响运单被投诉的重要影响因素(也称为主要特征或重要特征、或影响特征等)及其系数，在对训练数据集进行逐步回归的过程中，得到逻辑回归模型。

同样，针对训练数据集，利用逻辑回归模型逐步回归提取的主要特征作为因变量，运单是否被投诉作为响应变量，训练得到随机森林模型。

可选地，步骤2013，还可以包括：

对第一训练数据集进行训练，以运单是否被投诉作为响应变量，运单维度特征、客户维度特征及其员工维度特征为因变量，提取影响运单被投诉的主要特征及其对应的权重系数，以创建第一机器学习模型；

对第一训练数据集进行训练，以运单是否被投诉作为响应变量，该第一机器学习模型提取的主要特征作为因变量，以创建第二机器学习模型。

在创建逻辑回归模型之后，利用逻辑回归模型对验证数据集进行预测，利用主要特征及其系数得到预测结果。

在创建随机森林模型之后，利用随机森林模型对验证数据集进行预测，利用逻辑回归模型提取的主要特征进行分裂判断，得到预测结果。

可选地，步骤2014，可以包括：

基于第一机器学习模型对验证数据集进行预测，得到历史运单被投诉的第一预测概率值，并计算第一AUC值；

基于第二机器学习模型对验证数据集进行预测，得到历史运单被投诉的第二预测概率值，并计算第二AUC值；

利用第一预测概率值乘以第一权重系数与第二预测概率值乘以第二权重系数之和得到运单投诉基础模型。

本申请实施例中，将第一验证数据集中历史运单的数据输入第一机器学习模型进行预测，可以得到第一验证数据集中各历史运单被投诉的第一预测概率值，该概率值与第一机器学习模型相关。例如，第一机器学习模型可以是逻辑回归模型，则利用逻辑回归模型对第一验证数据集中各历史运单进行预测，得到第一验证数据集中各历史运单被投诉的第一概率值，并计算第一AUC值。

第一验证数据集中历史运单的数据输入第二机器学习模型进行预测，可以得到第一验证数据集中各历史运单被投诉的第二预测概率值，该概率值与第二机器学习模型相关。例如，第二机器学习模型可以是随机森林模型，则利用随机森林模型对第一验证数据集中各历史运单进行预测，得到第一验证数据集中各历史运单被投诉的第二概率值，并计算第二AUC值。

在获得第一验证数据集中各历史运单被投诉的第一概率值和第二概率值之后，计算第一验证数据集中各历史运单被投诉的基础预测概率值。

可选地，利用第一预测概率值乘以第一权重系数与第二预测概率值乘以第二权重系数求和来表示历史运单被投诉的基础预测概率值。

其中，第一权重系数和第二权重系数根据AUC最大原则确定。

具体地，根据AUC最大原则确定第一权重系数和第二权重系数，可以通过分别给k1和k2赋予不同的取值(其中，k1和k2的取值范围为0到1之间的数值，且k1与k2之和为1)，以计算第一验证数据集中各历史运单被投诉的基础概率值对应的AUC来确定第一权重系数和第二权重系数。

例如，初次给k1和k2分别赋予0.5的取值，则通过k1乘以第一概率值加上k2乘以第二概率值的和，得到各历史运单被投诉的基础预测概率值，并计算该基础预测概率值对应的AUC。

然后，通过调整k1和k2的取值，例如，k1赋值0.4，k2赋值0.6，再次计算各历史运单被投诉的基础预测概率值，以及计算该基础预测概率值对应的AUC。

重复上述赋值计算的步骤，最后比较所有AUC，确定最大的AUC对应的k1和k2的取值作为第一权重系数和第二权重系数。

步骤202，基于历史运单数据创建运单投诉实时模型。

本申请实施例中，为了从运单维度中筛选出更有价值的时间特征来预测运单被投诉的概率值。本申请实施例，优选地，将历史运单投诉数据进行还原处理，将运单在整个生命周期的时间特征进行划分监测，从而建立能够实时反映运单在生命周期内被投诉的概率。

本申请实施例中，可选地，利用第三机器学习模型对训练数据集进行训练，得到第三机器学习模型。第三机器学习模型以分段时间特征是否被投诉作为响应变量，运单维度特征中运单类型、运单自揽收开始耗时特征、运单分段时间的上一时间段是否妥投特征、员工维度等作为因变量。第三机器学习模型可以是逻辑回归模型，或者随机森林模型，或者梯度提升决策树GBDT模型。

可选地，步骤202，包括：

步骤2021，还原处理历史运单数据，以获取历史运单的分段时间特征；

步骤2022，基于还原处理后的历史运单数据，创建运单投诉实时模型。

可选地，在获得历史运单数据后，对历史运单投诉数据进行时间分段处理，以获取运单被投诉的时耗数据。不同类型的运单，生命周期不同。例如，即日件，生命周期为12个小时，次日件为36个小时，次晨件为28个小时。

可选地，以即日件为例。假设运单A为即日件，其生命周期为12个小时。对该运单A进行时间分段处理，假设预设时间间隔为3小时，则对运单A的时间分段处理可以理解为：

运单类型为即日件；

运单A的生命周期可以划分为4个阶段，每个阶段分别为8:00-11:00(3小时)，8:00-14:00(6小时)，8:00-17:00(9小时)，8:00-20:00(12小时)。对运单A的4个阶段是否被妥投(即派件完成)进行标注，是否被投诉进行标注。例如，第一阶段，8:00-11:00，自运单A被揽收到11:00耗时时间长度为3小时，这段时间之前的一个时间段是否妥投(运单A在8:00揽件不存在上一时间段，初始值设置为否)，标记为否，运单A在这一时间段是否被投诉，标记结果为否。第二阶段，11:00-14:00，自运单A被揽收到14:00耗时时间长度为6小时，上一时间段内是否妥投，即8:00-11:00是否妥投，标记为否，运单A在这一时间段是否被投诉，标记结果为否。第三阶段，14:00-17:00，自运单A被揽收到17:00耗时时间长度为9小时，上一时间段内是否妥投，即11:00-14:00是否妥投，标记为否，运单A在这一时间段是否被投诉，标记结果为否。第四阶段，17:00-20:00，自运单A被揽收到20:00耗时时间长度为12小时，上一时间段内是否妥投，即14:00-17:00是否妥投，标记为是，运单A在这一时间段是否被投诉，标记结果为是。

可选地，步骤2021可以包括：

基于历史运单的运单类型确定历史运单的生命周期；

将生命周期按照预设时间间隔分段处理，得到历史运单的分段时间特征。

其中，将生命周期按照预设间隔分段处理，得到历史运单的分段时间特征，又可以包括：

将生命周期按照预设时间间隔划分成连续的若干时间段；

在每个时间段上标识历史运单是否完成派件的结果；

在每个时间段上标识历史运单是否被投诉的结果。

在将历史运单数据进行处理后，通过机器学习模型，可以提取影响运单被投诉的实时影响因素，从而创建机器学习模型以获得历史运单被投诉的预测概率值。

步骤2022，可以包括：基于还原处理后的历史运单数据得到第二训练数据集和第二验证数据集；

利用第二训练数据集进行训练，以每个时间段内历史运单是否被投诉的结果作为响应变量，历史运单的运单类型、分段时间特征、员工维度特征作为因变量，创建运单投诉实时模型。

其中，分段时间特征可以包括：运单自揽收开始到各个分割点的耗时，上一时间段内运单是否被妥投等特征；员工维度特征包括员工的工龄、历史被投诉次数、最近投诉时间等特征。

本申请实施例中，运单投诉实时模型可以是逻辑回归模型，或者随机森林模型，或者梯度提升决策树GBDT模型。

以逻辑回归模型为例，获取历史运单数据后，对这些数据进行时间分段处理，然后基于分段处理后的数据按照随机抽样法，获取第二训练数据集和第二验证数据集。利用第二训练数据集，以每个时间段内历史运单是否被投诉的结果作为响应变量，历史运单的运单类型、分段时间特征、员工维度特征作为因变量，提取影响运单被投诉的重要影响因素及其权重系数，从而创建逻辑回归模型。

步骤203，由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型。

通过步骤201建模，确定运单投诉基础模型中的主要特征及其用于计算基础概率值的第一权重系数和第二权重系数，以获取运单投诉基础模型输出的基础预测概率值P_base。

通过步骤202建模，确定运单实时投诉基础模型中的主要特征，以获取运单投诉实时模型输出的实时预测概率值P_tm。

其中，通过运单投诉基础模型输出的基础预测概率值和运单投诉实时模型输出的实时预测概率值加权，得到运单投诉总模型输出的总预测概率值。

可选地，将第二验证数据集中的各历史运单输入到运单投诉基础模型进行预测，得到运单投诉基础模型输出的第二验证数据集中各历史运单的基础预测概率值P_base，将其输入到运单实时投诉模型进行预测，可以得到第二验证数据集中各历史运单的实时预测概率值P_tm。

运单投诉总模型输出结果等于基础预测概率值P_base乘以第三权重系数加上实时预测概率值P_tm乘以数值1与第三权重系数的差值。

其中，第三权重系数根据AUC最大原则确定。

具体地，根据AUC最大原则确定第三权重系数，可以通过给k3赋予不同的取值(其中，k3的取值范围为0到1之间的数值)，以计算第二验证数据集中各历史运单经过运单投诉总模型输出的结果对应的AUC来确定第三权重系数。

例如，初次给k3赋予0.3的取值，则通过k3乘以第一基础预测概率值加上实时预测概率值乘以数值1与k3的差值，得到各历史运单经过运单投诉总模型输出的结果，并计算该结果对应的AUC。

然后，通过调整k3的取值，例如，k3赋值0.6，再次计算各历史运单各历史运单经过运单投诉总模型输出的结果，以及计算该结果对应的AUC。

重复上述赋值计算的步骤，最后比较所有AUC，确定最大的AUC对应的k3的取值作为第三权重系数。

可选地，步骤203可以包括：

利用运单投诉基础模型输出的基础预测概率值乘以第三权重系数再加上运单投诉实时模型输出的实时预测概率值乘以数值1与第三权重系数的差值得到运单投诉总模型。

步骤204，将新运单数据输入运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

本申请实施例中，基于新运单的预测，通过将新运单的各项数据输入到运单投诉基础模型和运单投诉实时模型，以获取新运单被投诉的基础预测概率值和新运单被投诉的实时预测概率值。

例如，新运单C，即日件，揽收时间为2017年11月25日上午9:00，妥投时间为2017年11月25日下午17:30，以及新运单C的员工维度数据，运单维度数据，客户维度数据。将新运单C的这些数据输入运单投诉基础模型得到新运单C被投诉的基础预测概率值P_base。

基础预测概率值P_base等于新运单被投诉的第一预测概率值乘以第一权重系数与第二预测概率值乘以第二权重系数之和。其中，第一权重系数与第二权重系数在步骤2014中已经确定。

然后，通过分段处理可以将新运单C的这些数据分段输入运单投诉实时模型得到新运单C被投诉的实时预测概率值P_tm。

例如，对于新运单C，预设间隔时间设置为3小时，在2017年11月25日上午9:00，自新运单C被揽收到12:00耗时时间长度为3小时，这段时间之前的一个时间段是否妥投，标记为否，新运单C在这一时间段是否被投诉作为响应变量，将新运单C的其他数据信息输入到运单投诉实时模型，得到这一时间段新运单C被投诉的实时预测概率值。

基于运单投诉总模型输出新运单C的总预测概率值等于新运单C的基础预测概率值P_base乘以第三权重系数再加上新运单C的实时预测概率值P_tm乘以数值1与第三权重系数的差值。

其中，第三权重系数在步骤203中已经确定。

通过创建的运单投诉总模型能够结合新运单的路由耗时及其运输情况，不断地更新实时投诉概率，从而得到新运单在未来各个时间段内的投诉概率，直到运单妥投结束计算。

通过将运单实时数据进行时间分段处理，解决了运单投诉问题滞后的问题。根据引入的员工维度特征，还能够在运单的生命周期内基于预测的结果帮助员工优先处理被投诉概率较大的运单，从而提升客户体验度，降低投诉率，并为客服提供有价值的预警信息。

即步骤204包括：

将新运单数据输入到运单投诉基础模型，得到新运单被投诉的基础预测概率值；

将新运单数据输入到运单投诉实时模型，得到新运单被投诉的实时预测概率值；

利用新运单被投诉的基础预测概率值乘以第三权重系数再加上新运单被投诉的实时预测概率值乘以数值1与第三权重系数的差值得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

可选地，在得到新运单被投诉的总预测概率值之后，该方法还包括：

步骤205，根据总预测概率值指示新运单被处理的优先级。

本申请实施例中，在运单被投诉的预测结果中引入实时更新机制，能够计算出新运单在未来各个时间段内的总预测概率值，该值与某阈值比较后能够预测新运单是否存在被投诉潜在风险，如果存在，则提醒员工(例如，派件员)区分紧急处理件和非紧急处理件，从而提升客户体验度，极大地优化了服务质量。

应当注意，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。相反，流程图中描绘的步骤可以改变执行顺序。例如，创建第一机器学习模型和创建第二机器学习模型。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。例如，基于历史运单数据创建运单投诉基础模型，包括：清洗转换获取的设定时间范围的历史运单数据；利用随机抽样法从历史运单数据中抽取第一训练数据集和第一验证数据集；创建第一机器学习模型和第二机器学习模型；由第一机器学习模型和第二机器学习模型加权得到运单投诉基础模型。

进一步参考图3，其示出了根据本申请一个实施例的运单投诉预测装置的结构示意图。

如图3所示，该装置300包括：

基础模型创建单元301，用于基于历史运单数据创建运单投诉基础模型。

实时模型创建单元302，用于基于历史运单数据创建运单投诉实时模型。

为了从运单维度中筛选出更有价值的时间特征来预测运单被投诉的概率值。本申请实施例，优选地，将历史运单投诉数据进行还原处理，将运单在整个生命周期的时间特征进行划分监测，从而建立能够实时反映运单在生命周期内被投诉的概率。这里的生命周期是根据运单类型定义的时间范围。例如，即日件，生命周期为12个小时，次晨件为28个小时，次日件为36个小时。

总模型创建单元303，由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型。

预测单元304，用于将新运单数据输入到运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

请参考图4，图4示出了本申请又一实施例提供运单投诉预测装置的结构示意图。

如图4所示，该装置400包括：

基础模型创建单元401，基于历史运单数据创建运单投诉基础模型。

可选地，基础模型创建单元401包括：

清洗转换单元4011，用于清洗转换获取的预设时间范围的历史运单数据；

样本抽取单元4012，用于利用随机抽样法从历史运单数据中抽取第一训练数据集和第一验证数据集

创建子单元4013，用于创建第一机器学习模型和第二机器学习模型；

加权子单元4014，用于由第一机器学习模型和第二机器学习模型加权得到运单投诉基础模型。

其中，创建子单元4013，通过创建第一机器学习模型和第二机器学习模型，从而创建运单投诉基础模型。创建机器学习模型的数量不限于两个，可以是两个以上，也可以仅选择一个，根据不同的处理数据，可以选择不同的组合方式。优选地，创建第一机器学习模型和第二机器学习模型。对于机器学习模型的类型，可以是随机森林模型、逻辑回归模型或其他判别模型。优选地，第一机器学习模型为逻辑回归模型，第二机器学习模型为随机森林模型。

同样，针对训练数据集，利用逻辑回归模型提取的主要特征作为因变量，运单是否被投诉作为响应变量，训练得到随机森林模型。

可选地，创建子单元4013，还可以包括：

第一机器模型创建子单元，用于利用第一训练数据集进行训练，以运单是否被投诉作为响应变量，运单维度特征、客户维度特征及其员工维度特征为因变量，提取影响运单被投诉的主要特征及其对应的权重系数，以创建第一机器学习模型；

第二机器模型创建子单元，用于利用第一训练数据集进行训练，以运单是否被投诉作为响应变量，第一机器学习模型提取的主要特征作为因变量，以创建第二机器学习模型。

可选地，加权子单元4014，可以包括：

第一预测概率获取子单元，用于基于第一机器学习模型对第一验证数据集进行预测，得到历史运单被投诉的第一预测概率值，并计算第一AUC值；

第二预测概率获取子单元，用于基于第二机器学习模型对第一验证数据集进行预测，得到历史运单被投诉的第二预测概率值，并计算第二AUC值；

基础预测概率计算子单元，用于利用第一预测概率值乘以第一权重系数与第二预测概率值乘以第二权重系数之和得到运单投诉基础模型。

在获得第一概率值和第二概率值之后，计算历史运单被投诉的基础预测概率值。

其中，第一权重系数和第二权重系数根据AUC最大原则确定。

具体地，根据AUC最大原则确定第一权重系数和第二权重系数，可以通过分别给k1和k2赋予不同的取值(其中，k1和k2的取值范围为0到1之间的数值，且k1与k2之和为1)，以计算验证数据集中各历史运单被投诉的基础概率值对应的AUC来确定第一权重系数和第二权重系数。

实时模型创建单元402，用于基于历史运单数据创建运单投诉实时模型。

可选地，实时模型创建单元402，包括：

第一数据处理子单元4021，用于还原处理历史运单数据，以获取历史运单的分段时间特征；

模型创建子单元4022，用于基于还原处理后的历史运单数据，创建运单投诉实时模型。

运单类型为即日件；

可选地，第一数据处理子单元4021可以包括：

确定子单元，用于基于历史运单的运单类型确定历史运单的生命周期；

分段处理子单元，用于将生命周期按照预设时间间隔分段处理，得到历史运单的分段时间特征。

其中，分段处理子单元，又可以包括：

划分子单元，用于将生命周期按照预设时间间隔划分成连续的若干时间段；

第一标识子单元，用于在每个时间段上标识历史运单是否完成派件的结果；

第二标识子单元，用于在每个时间段上标识历史运单是否被投诉的结果。

模型创建子单元4022，可以包括：第二数据处理子单元，用于基于还原处理后的历史运单数据得到第二训练数据集和第二验证数据集；

实时模型创建子单元，用于利用第二训练数据集进行训练，以每个时间段内历史运单是否被投诉的结果作为响应变量，历史运单的运单类型、分段时间特征、员工维度特征作为因变量，创建运单投诉实时模型。

总模型创建单元403，用于由运单投诉基础模型和运单投诉实时模型加权得到运单投诉总模型。

通过基础模型创建单元401建模，确定运单投诉基础模型中的主要特征及其用于计算基础概率值的第一权重系数和第二权重系数，以获取运单投诉基础模型输出的基础预测概率值P_base。

通过实时模型创建单元402建模，确定运单实时投诉基础模型中的主要特征，以获取运单投诉实时模型输出的实时预测概率值P_tm。

可选地，将第二验证数据集中的各历史运单输入到运单投诉基础模型进行预测，得到运单投诉基础模型输出的第二验证数据集中各历史运单的基础预测概率值P_base，将其输入到运单实时投诉模型进行预测，可以得到第二验证数据集中各历史运单B的实时预测概率值P_tm。

运单投诉总模型等于基础预测概率值P_base乘以第三权重系数加上实时预测概率值P_tm乘以数值1与第三权重系数的差值。

其中，第三权重系数根据AUC最大原则确定。

具体地，根据AUC最大原则确定第三权重系数，可以通过分别给k3赋予不同的取值(其中，k3的取值范围为0到1之间的数值)，以计算第二验证数据集中各历史运单经过运单投诉总模型输出的结果对应的AUC来确定第三权重系数。

即总模型创建单元403可以包括：利用运单投诉基础模型输出的基础预测概率值乘以第三权重系数再加上运单投诉实时模型输出的实时预测概率值乘以数值1与第三权重系数的差值得到运单投诉总模型。

预测单元404，用于将新运单数据输入运单投诉总模型，得到新运单被投诉的总预测概率值，以预测新运单是否被投诉。

基础预测概率值P_base等于新运单被投诉的第一预测概率值乘以第一权重系数与第二预测概率值乘以第二权重系数之和。其中，第一权重系数与第二权重系数在加权子单元4014中已经确定。

其中，第三权重系数在总模型创建单元403中已经确定。

即预测单元404还用于：

可选地，在预测单元之后，该装置还包括：

指示单元405，用于根据总预测概率值指示新运单被处理的优先级。

本申请实施例中，在运单被投诉的预测结果中引入实时更新机制，能够计算出新运单在未来各个时间段内的总预测概率值，该值与某阈值比较后能够预测新运单是否存在被投诉潜在风险，如果存在，则提醒员工(例如，派件员)区分紧急处理件和非紧急处理件，从而提升客户体验度，极大地优化了服务质量

应当理解，装置300或400中记载的诸单元或模块与参考图1或2描述的方法中的各个步骤相对应。由此，上文针对方法描述的操作和特征同样适用于装置300或400及其中包含的单元，在此不再赘述。装置400可以预先实现在电子设备的浏览器或其他安全应用中，也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。装置400中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。

下面参考图5，其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。

如图5所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。

以下部件连接至I/O接口505：包括键盘、鼠标等的输入部分506；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507；包括硬盘等的存储部分508；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。

特别地，根据本公开的实施例，上文参考图1或2描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，前述计算机程序包含用于执行图1或2的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。

附图中的流程图和框图，图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中，例如，可以描述为：一种处理器包括基础模型创建单元、实时模型创建单元、总模型创建单元以及预测单元。其中，这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定，例如，基础模型创建单元还可以被描述为“用于创建基础模型的单元”。

作为另一方面，本申请还提供了一种计算机可读存储介质，该计算机可读存储介质可以是上述实施例中前述装置中所包含的计算机可读存储介质；也可以是单独存在，未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序，前述程序被一个或者一个以上的处理器用来执行描述于本申请的运单投诉预测方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离前述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种运单投诉预测方法，其特征在于，所述方法包括：

基于历史运单数据创建运单投诉基础模型；

基于历史运单数据创建运单投诉实时模型；

由所述运单投诉基础模型和所述运单投诉实时模型加权得到运单投诉总模型；

将新运单数据输入到所述运单投诉总模型，得到新运单被投诉的总预测概率值，以预测所述新运单是否被投诉。

2.根据权利要求1所述的方法，其特征在于，所述基于历史运单数据创建运单投诉实时模型，包括：

还原处理所述历史运单数据，以获取历史运单的分段时间特征；

基于还原处理后的所述历史运单数据，创建所述运单投诉实时模型。

3.根据权利要求2所述的方法，其特征在于，所述还原处理所述历史运单数据，以获取历史运单的分段时间特征，包括：

基于所述历史运单的运单类型确定所述历史运单的生命周期；

将所述生命周期按照预设时间间隔分段处理，得到所述历史运单的所述分段时间特征。

4.根据权利要求3所述的方法，其特征在于，所述将所述生命周期按照预设时间间隔分段处理，得到所述历史运单的所述分段时间特征，包括：

将所述生命周期按照所述预设时间间隔划分成连续的若干时间段；

在每个所述时间段上标识所述历史运单是否完成派件的结果；

在每个所述时间段上标识所述历史运单是否被投诉的结果。

5.根据权利要求2-4任一项所述的方法，其特征在于，所述基于还原处理后的所述历史运单数据，创建所述运单投诉实时模型，包括：

基于还原处理后的所述历史运单数据得到第二训练数据集和第二验证数据集；

利用所述第二训练数据集进行训练，以每个所述时间段内所述历史运单是否被投诉的结果作为响应变量，所述历史运单的运单类型、所述分段时间特征、所述员工维度特征作为因变量，创建所述运单投诉实时模型。

6.根据权利要求1-5任一项所述的方法，其特征在于，所述基于历史运单数据创建运单投诉基础模型，包括：

清洗转换获取的设定时间范围的历史运单数据；

利用随机抽样法从所述历史运单数据中抽取第一训练数据集和第一验证数据集；

创建第一机器学习模型和第二机器学习模型；

由所述第一机器学习模型和所述第二机器学习模型加权得到运单投诉基础模型。

7.根据权利要求6所述的方法，其特征在于，所述创建第一机器学习模型和第二机器学习模型，包括：

利用所述第一训练数据集进行训练，以运单是否被投诉作为响应变量，运单维度特征、客户维度特征及其员工维度特征为因变量，提取影响运单被投诉的主要特征及其对应的权重系数，以创建第一机器学习模型；

利用所述第一训练数据集进行训练，以运单是否被投诉作为响应变量，所述第一机器学习模型提取的主要特征作为因变量，以创建第二机器学习模型。

8.根据权利要求7所述的方法，其特征在于，所述由所述第一机器学习模型和所述第二机器学习模型加权得到运单投诉基础模型，包括：

基于所述第一机器学习模型对所述第一验证数据集进行预测，得到历史运单被投诉的第一预测概率值，并计算第一AUC值；

基于所述第二机器学习模型对所述第一验证数据集进行预测，得到历史运单被投诉的第二预测概率值，并计算第二AUC值；

利用所述第一预测概率值乘以第一权重系数与所述第二预测概率值乘以第二权重系数之和得到所述运单投诉基础模型。

9.根据权利要求1-8任一项所述的方法，其特征在于，所述由所述运单投诉基础模型和所述运单投诉实时模型加权得到运单投诉总模型，包括：

利用所述运单投诉基础模型输出的所述基础预测概率值乘以第三权重系数再加上所述运单投诉实时模型输出的实时预测概率值乘以数值1与第三权重系数的差值得到所述运单投诉总模型。

10.根据权利要求1-9任一项所述的方法，其特征在于，所述将新运单数据输入到所述运单投诉总模型，得到新运单被投诉的总预测概率值，以预测所述新运单是否被投诉，包括：

将所述新运单数据输入到所述运单投诉基础模型，得到新运单被投诉的基础预测概率值；

将所述新运单数据输入到所述运单投诉实时模型，得到新运单被投诉的实时预测概率值；

利用所述新运单被投诉的基础预测概率值乘以第三权重系数再加上所述新运单被投诉的实时预测概率值乘以数值1与第三权重系数的差值得到所述新运单被投诉的所述总预测概率值，以预测所述新运单是否被投诉。

11.根据权利要求1-10任一项所述的方法，其特征在于，在所述得到新运单被投诉的总预测概率值之后，该方法还包括：

根据所述总预测概率值指示所述新运单被处理的优先级。

12.根据权利要求6-11任一项所述的方法，其特征在于，

所述第一机器学习模型是逻辑回归模型或随机森林模型；

所述第二机器学习模型是逻辑回归模型或随机森林模型。

13.根据权利要求1-12任一项所述的方法，其特征在于，

所述运单投诉实时模型是逻辑回归森林模型或者随机森林模型或者梯度提升决策树GBDT模型。

14.一种运单投诉预测装置，其特征在于，所述装置包括：

总模型创建单元，用于由所述运单投诉基础模型和所述运单投诉实时模型加权得到运单投诉总模型；

预测单元，用于将新运单数据输入到所述运单投诉总模型，得到新运单被投诉的总预测概率值，以预测所述新运单是否被投诉。

15.根据权利要求14所述的装置，其特征在于，所述实时模型创建单元，包括：

第一数据处理子单元，用于还原处理所述历史运单数据，以获取历史运单的分段时间特征；

模型创建子单元，用于基于还原处理后的所述历史运单数据，创建所述运单投诉实时模型。

16.根据权利要求15所述的装置，其特征在于，所述第一数据处理子单元，包括：

确定子单元，用于基于所述历史运单的运单类型确定所述历史运单的生命周期；

分段处理子单元，用于将所述生命周期按照预设时间间隔分段处理，得到所述历史运单的所述分段时间特征。

17.根据权利要求16所述的装置，其特征在于，所述分段处理子单元，包括：

划分子单元，用于将所述生命周期按照所述预设时间间隔划分成连续的若干时间段；

第一标识子单元，用于在每个所述时间段上标识所述历史运单是否完成派件的结果；

第二标识子单元，用于在每个所述时间段上标识所述历史运单是否被投诉的结果。

18.根据权利要求15-17任一项所述的装置，其特征在于，所述模型创建子单元，包括：

第二数据处理子单元，用于基于还原处理后的所述历史运单数据得到第二训练数据集和第二验证数据集；

实时模型创建子单元，用于利用所述第二训练数据集进行训练，以每个所述时间段内所述历史运单是否被投诉的结果作为响应变量，所述历史运单的运单类型、所述分段时间特征、所述员工维度特征作为因变量，创建所述运单投诉实时模型。

19.根据权利要求14-18任一项所述的装置，其特征在于，所述基础模型创建单元，包括：

清洗转换单元，用于清洗转换获取的设定时间范围的历史运单数据；

样本抽取单元，用于利用随机抽样法从所述历史运单数据中抽取第一训练数据集和第一验证数据集；

创建子单元，用于创建第一机器学习模型和第二机器学习模型；

加权子单元，用于由所述第一机器学习模型和所述第二机器学习模型加权得到运单投诉基础模型。

20.根据权利要求19所述的装置，其特征在于，所述创建子单元包括：

第一机器模型创建子单元，用于利用所述第一训练数据集进行训练，以运单是否被投诉作为响应变量，运单维度特征、客户维度特征及其员工维度特征为因变量，提取影响运单被投诉的主要特征及其对应的权重系数，以创建第一机器学习模型；

第二机器模型创建子单元，用于利用所述第一训练数据集进行训练，以运单是否被投诉作为响应变量，所述第一机器学习模型提取的主要特征作为因变量，以创建第二机器学习模型。

21.根据权利要求20所述的装置，其特征在于，所述加权子单元单元，包括：

第一预测概率获取子单元，用于基于所述第一机器学习模型对所述第一验证数据集进行预测，得到历史运单被投诉的第一预测概率值，并计算第一AUC值；

第二预测概率获取子单元，用于基于所述第二机器学习模型对所述第一验证数据集进行预测，得到历史运单被投诉的第二预测概率值，并计算第二AUC值；

基础预测概率计算子单元，用于利用所述第一预测概率值乘以第一权重系数与所述第二预测概率值乘以第二权重系数之和得到所述运单投诉基础模型。

22.根据权利要求14-21任一项所述的装置，其特征在于，所述总模型创建单元，包括：

用于利用所述运单投诉基础模型输出的所述基础预测概率值乘以第三权重系数再加上所述运单投诉实时模型输出的实时预测概率值乘以数值1与第三权重系数的差值得到所述运单投诉总模型。

23.根据权利要求14-22任一项所述的装置，其特征在于，所述预测单元，包括：

用于将所述新运单数据输入到所述运单投诉基础模型，得到新运单被投诉的基础预测概率值；

24.根据权利要求14-23任一项所述的装置，其特征在于，在所述预测单元之后，该装置还包括：

指示单元，用于根据所述总预测概率值指示所述待预测运单的优先级。

25.一种设备，包括处理器、存储装置；其特征在于：

所述存储装置，用于存储一个或多个程序；

当所述一个或多个程序被所述处理器执行，使得所述处理器实现如权利要求1-13中任一项所述的方法。

26.一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如权利要求1-13中任一项所述的方法。