CN115809713A - 催派预测模型的训练方法、快递催派量的预测方法及装置 - Google Patents
催派预测模型的训练方法、快递催派量的预测方法及装置 Download PDFInfo
- Publication number
- CN115809713A CN115809713A CN202111075255.0A CN202111075255A CN115809713A CN 115809713 A CN115809713 A CN 115809713A CN 202111075255 A CN202111075255 A CN 202111075255A CN 115809713 A CN115809713 A CN 115809713A
- Authority
- CN
- China
- Prior art keywords
- express
- training
- classification model
- training set
- dispatch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 296
- 238000012384 transportation and delivery Methods 0.000 title claims abstract description 135
- 238000000034 method Methods 0.000 title claims abstract description 68
- 238000013145 classification model Methods 0.000 claims abstract description 165
- 230000001737 promoting effect Effects 0.000 claims abstract description 22
- 230000001133 acceleration Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 8
- 238000012795 verification Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 3
- 238000011144 upstream manufacturing Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 239000000654 additive Substances 0.000 description 2
- 230000000996 additive effect Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供一种催派预测模型的训练方法、快递催派量的预测方法及装置,该催派预测模型的训练方法包括:获取第一快递催派训练集,其中,第一快递催派训练集中包括多个第一快递催派训练样本;将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,第二快递催派训练集包括多个第二快递催派训练样本;基于第二快递催派训练集训练第一分类模型,得到第二分类模型;判断第二分类模型是否满足预设参数条件;若第二分类模型满足预设参数条件,则将第二分类模型确定为催派预测模型。本申请能够实现催派预测模型降维同时仍能保持模型性能,从而能够提高快递催派量的预测效率。
Description
技术领域
本申请主要涉及大数据技术领域,具体涉及一种催派预测模型的训练方法、快递催派量的预测方法及装置。
背景技术
快递行业比拼的是用户体验和成本,用户体验和大部分客诉赔付主要发生在派送阶段,在用户要求客诉赔付之前,设置一个快递催派的功能,搭建用户跟快递员的沟通缓冲平台,可以用最小沟通成本达到降低客诉赔付,提升用户体验的目的。风险在于,在快递员紧张的派送过程中,突然收到用户的催派沟通,沟通态度在压力下容易降低沟通服务质量,增加客诉赔付风险。于是,提前预测当天会有多少次催派,会给予快递员心理预期,缓解压力,有助于更好的服务和解决问题,降低成本提升用户体验。由于物流行业的数据较多,特征维度较高,训练出来的模型较为复杂,导致快递催派量的预测效率较低。
也即,现有快递催派量预测的方法预测效率较低。
发明内容
本申请提供一种催派预测模型的训练方法、快递催派量的预测方法及装置,旨在解决现有快递催派量预测的方法预测效率较低的问题。
第一方面,本申请提供一种催派预测模型的训练方法,该催派预测模型的训练方法包括:
获取第一快递催派训练集,其中,所述第一快递催派训练集中包括多个第一快递催派训练样本;
将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,所述第二快递催派训练集包括多个第二快递催派训练样本;
基于所述第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断所述第二分类模型是否满足预设参数条件;
若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
可选地,所述将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,包括:
基于所述第一快递催派训练集对所述第一分类模型进行训练,得到所述第一快递催派训练集中各个样本特征的SHAP值;
将所述第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到所述第二快递催派训练集。
可选地,所述将所述第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到所述第二快递催派训练集,包括:
基于同一样本特征在各个第一快递催派训练样本的特征值确定各个样本特征的标准差;
将所述第一快递催派训练集中SHAP值不大于第一预设值且标准差不大于第二预设值的样本特征删除,得到所述第二快递催派训练集。
可选地,所述若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型,包括:
若所述第二分类模型满足预设参数条件,将所述第二快递催派训练集中每个所述第二快递催派训练样本中预设数量的样本特征删除,得到第三快递催派训练集,其中,所述第三快递催派训练集包括多个第三快递催派训练样本;
基于所述第三快递催派训练集训练第一分类模型,得到第三分类模型;
判断所述第三分类模型是否满足预设参数条件;
若所述第三分类模型不满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
可选地,所述判断所述第二分类模型是否满足预设参数条件,包括:
基于预设验证集对所述第二分类模型进行验证,得到所述第二分类模型的预测精确率;
若所述第二分类模型的预测精确率大于第三预设值,则确定所述第二分类模型满足预设参数条件;若所述第二分类模型的预测精确率不大于第三预设值,则确定所述第二分类模型满足不预设参数条件。
可选地,所述获取第一快递催派训练集,包括:
获取第一历史时间段内的运单信息;
根据所述运单信息获取各个网点在第二历史时间段内的运单特征信息和对应催派标签,其中,所述第一历史时间段的时间长度长于所述第二历史时间段的时间长度;
将网点在第二历史时间段内的运单特征信息和对应催派标签确定为第一快递催派训练样本。
第二方面,本申请提供一种快递催派量的预测方法,所述快递催派量的预测方法,包括:
获取目标网点在目标历史时间段的待预测运单特征信息;
将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量,其中,所述催派预测模型为第一方面任一项所述的催派预测模型。
第三方面,本申请提供一种催派预测模型的训练装置,所述催派预测模型的训练装置包括:
获取单元,用于获取第一快递催派训练集,其中,所述第一快递催派训练集中包括多个第一快递催派训练样本;
特征删除单元,用于将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,所述第二快递催派训练集包括多个第二快递催派训练样本;
模型训练单元,用于基于所述第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断单元,用于判断所述第二分类模型是否满足预设参数条件;
确定单元,用于若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
可选地,所述特征删除单元,用于:
基于所述第一快递催派训练集对所述第一分类模型进行训练,得到所述第一快递催派训练集中各个样本特征的SHAP值;
将所述第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到所述第二快递催派训练集。
可选地,所述特征删除单元,用于:
基于同一样本特征在各个第一快递催派训练样本的特征值确定各个样本特征的标准差;
将所述第一快递催派训练集中SHAP值不大于第一预设值且标准差不大于第二预设值的样本特征删除,得到所述第二快递催派训练集。
可选地,所述确定单元,用于:
若所述第二分类模型满足预设参数条件,将所述第二快递催派训练集中每个所述第二快递催派训练样本中预设数量的样本特征删除,得到第三快递催派训练集,其中,所述第三快递催派训练集包括多个第三快递催派训练样本;
基于所述第三快递催派训练集训练第一分类模型,得到第三分类模型;
判断所述第三分类模型是否满足预设参数条件;
若所述第三分类模型不满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
可选地,所述判断单元,用于:
基于预设验证集对所述第二分类模型进行验证,得到所述第二分类模型的预测精确率;
若所述第二分类模型的预测精确率大于第三预设值,则确定所述第二分类模型满足预设参数条件;若所述第二分类模型的预测精确率不大于第三预设值,则确定所述第二分类模型满足不预设参数条件。
可选地,所述获取单元,用于:
获取第一历史时间段内的运单信息;
根据所述运单信息获取各个网点在第二历史时间段内的运单特征信息和对应催派标签,其中,所述第一历史时间段的时间长度长于所述第二历史时间段的时间长度;
将网点在第二历史时间段内的运单特征信息和对应催派标签确定为第一快递催派训练样本。
第四方面,本申请提供一种快递催派量的预测装置,所述快递催派量的预测装置包括:
获取单元,用于获取目标网点在目标历史时间段的待预测运单特征信息;
预测单元,用于将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量,其中,所述催派预测模型为第一方面任一项所述的催派预测模型。
第五方面,本申请提供一种计算机设备,所述计算机设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现第一方面中任一项所述的催派预测模型的训练方法或者第二方面中所述的快递催派量的预测方法。
第六方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行第一方面中任一项所述的催派预测模型的训练方法或者第二方面中所述的快递催派量的预测方法中的步骤。
本申请提供一种催派预测模型的训练方法、快递催派量的预测方法及装置,该催派预测模型的训练方法包括:获取第一快递催派训练集,其中,第一快递催派训练集中包括多个第一快递催派训练样本;将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,第二快递催派训练集包括多个第二快递催派训练样本;基于第二快递催派训练集训练第一分类模型,得到第二分类模型;判断第二分类模型是否满足预设参数条件;若第二分类模型满足预设参数条件,则将第二分类模型确定为催派预测模型。本申请将第一快递催派训练集中的部分样本特征剔除,得到剔除特征后的第二快递催派训练集,根据第二快递催派训练集训练得到第二分类模型,在第二分类模型满足预设参数条件时,将第二分类模型确定为催派预测模型,由于训练得到第二分类模型时所使用的第二快递催派训练集相对原始的第一快递催派训练集维度更低,第二分类模型的复杂度降低,同时第二分类模型仍然满足预设参数条件,模型性能仍然符合要求,因此实现催派预测模型降维同时仍能保持模型性能,从而能够提高快递催派量的预测效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的快递催派量的预测系统的场景示意图;
图2是本申请实施例中提供的催派预测模型的训练方法的一个实施例流程示意图;
图3是本申请实施例中提供的催派预测模型的训练方法的另一个实施例流程示意图;
图4是本申请实施例中提供的快递催派量的预测方法的一个实施例流程示意图;
图5是本申请实施例中提供的催派预测模型的训练装置的一个实施例结构示意图;
图6是本申请实施例中提供的快递催派量的预测装置的一个实施例结构示意图;
图7是本申请实施例中提供的计算机设备的一个实施例结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本申请中,“示例性”一词用来表示“用作例子、例证或说明”。本申请中被描述为“示例性”的任何实施例不一定被解释为比其它实施例更优选或更具优势。为了使本领域任何技术人员能够实现和使用本申请,给出了以下描述。在以下描述中,为了解释的目的而列出了细节。应当明白的是,本领域普通技术人员可以认识到,在不使用这些特定细节的情况下也可以实现本申请。在其它实例中,不会对公知的结构和过程进行详细阐述,以避免不必要的细节使本申请的描述变得晦涩。因此,本申请并非旨在限于所示的实施例,而是与符合本申请所公开的原理和特征的最广范围相一致。
本申请实施例提供一种催派预测模型的训练方法及装置,以下分别进行详细说明。
请参阅图1,图1为本申请实施例所提供的快递催派量的预测系统的场景示意图,该快递催派量的预测系统可以包括计算机设备100,计算机设备100中集成有催派预测模型的训练装置和/或快递催派量的预测装置。
本申请实施例中,该计算机设备100可以是独立的服务器,也可以是服务器组成的服务器网络或服务器集群,例如,本申请实施例中所描述的计算机设备100,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云服务器。其中,云服务器由基于云计算(Cloud Computing)的大量计算机或网络服务器构成。
本申请实施例中,上述的计算机设备100可以是一个通用计算机设备或者是一个专用计算机设备。在具体实现中计算机设备100可以是台式机、便携式电脑、网络服务器、掌上电脑(Personal Digital Assistant,PDA)、移动手机、平板电脑、无线终端设备、通信设备、嵌入式设备等,本实施例不限定计算机设备100的类型。
本领域技术人员可以理解,图1中示出的应用环境,仅仅是本申请方案的一种应用场景,并不构成对本申请方案应用场景的限定,其他的应用环境还可以包括比图1中所示更多或更少的计算机设备,例如图1中仅示出1个计算机设备,可以理解的,该快递催派量的预测系统还可以包括一个或多个可处理数据的其他计算机设备,具体此处不作限定。
另外,如图1所示,该快递催派量的预测系统还可以包括存储器200,用于存储数据。
需要说明的是,图1所示的快递催派量的预测系统的场景示意图仅仅是一个示例,本申请实施例描述的快递催派量的预测系统以及场景是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域普通技术人员可知,随着快递催派量的预测系统的演变和新业务场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
首先,本申请实施例中提供一种催派预测模型的训练方法,该催派预测模型的训练方法包括:获取第一快递催派训练集,其中,第一快递催派训练集中包括多个第一快递催派训练样本;将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,第二快递催派训练集包括多个第二快递催派训练样本;基于第二快递催派训练集训练第一分类模型,得到第二分类模型;判断第二分类模型是否满足预设参数条件;若第二分类模型满足预设参数条件,则将第二分类模型确定为催派预测模型。
如图2所示,图2是本申请实施例中催派预测模型的训练方法的一个实施例流程示意图,该催派预测模型的训练方法包括如下步骤S201~S205:
S201、获取第一快递催派训练集。
其中,第一快递催派训练集中包括多个第一快递催派训练样本。
在一个具体的实施例中,获取第一快递催派训练集,包括:
(1)获取第一历史时间段内的运单信息。
本申请实施例中,第一历史时间段可以为历史1个月、2个月等,根据具体情况设定即可。运单信息可以从历史运单中读取。
(2)根据运单信息获取各个网点在第二历史时间段内的运单特征信息和对应催派标签。
其中,第一历史时间段的时间长度长于第二历史时间段的时间长度。第二历史时间段可以为7天、10天等,根据具体情况确定即可。催派标签为网点在第二历史时间段之后预设时长内的快递催派量范围。预设时长可以为1天,两天等。快递催派量范围可以为[0,3],[4,9],[10,+∞]。例如,第二历史时间段可为7天,预设时长为1天,则催派标签为网点在历史7天之后的一天内的快递催派量。
具体的,从第一历史时间段中选取连续的预设天数,将预设天数确定为一个第二历史时间段,并获取第二历史时间段内运单特征信息和对应催派标签。
(3)将网点在第二历史时间段内的运单特征信息和对应催派标签确定为第一快递催派训练样本。
例如,第一历史时间段为2021年6月1日-2021年7月1日,其中一个样本为:第二历史时间段2021年6月1日-2021年6月7日的运单特征信息,催派标签为2021年6月8日的快递催派量范围[0,3];另一个样本为:第二历史时间段2021年6月3日-2021年6月9日的运单特征信息,催派标签为2021年6月10日的快递催派量范围[4,9]。
在一个具体的实施例中,运单特征信息可以包括运单线路特征、区域特征、时间特征、历史同期特征以及天气特征。
其中,运单线路特征以运单线路为逻辑基础,统计目标网点向上回溯的各个上游网点的进出件量比和第二历史时间段(7天)平均的进出件量比的比值。具体的,将第二历史时间段内向目标网点进件的网点确定为目标网点的上游网点。例如,上游网点1的进出件量比为0.8,上游网点1的进出件量比与七天平均上游网点1的进出件量比的比值为1.1,上游网点2的进出件量比为0.7,上游网点1的进出件量比与七天平均上游网点2的进出件量比的比值为0.9。
区域特征以区域为逻辑基础,按照网点的行政区划特征,进行分组。具体的,根据各个网点的经纬度确定任意两个网点的半正矢(haversine)距离,根据各个网点的半正矢距离进行聚类,得到各个网点的类别。将目标网点的各个上游网点的类别确定为区域特征。
时间特征以时间为逻辑基础,识别第二预设时间段中每天的月份、周几,以及是否节假日等离散特征,对连续特征进行时间上的1天,2天,3天,5天累计,获取变化趋势信息。例如,第二预设时间段中1天,2天,3天,5天的累计拥堵等级的变化趋势信息。
历史同期特征:包括在第二预设时间段内难以获取的去年历史同期信息,比如,国庆假期之前的9月底,往往会有大量催派。例如,去年第二预设时间段内1天,2天,3天,5天的累计拥堵等级。
天气特征:目标网点所处经纬度区域的天气预测特征,可通过天气预报获取。
由于运单特征信息包括运单线路特征、区域特征、时间特征、历史同期特征以及天气特征等多类特征,每类特征中又包括多维样本特征。因此,每个第一快递催派训练样本中包括上百维度的样本特征。例如,上游网点1的进出件量比为一个样本特征,特征值为0.8;目标网点所处经纬度区域为一个样本特征,特征值为1,表示晴天。
S202、将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集。
其中,预设数量可以为1个、2个或者其他数量等,根据具体情况设定即可。其中,第二快递催派训练集包括多个第二快递催派训练样本。第二快递催派训练样本的数量和第一快递催派训练样本的数量相同,即,样本特征删除只是减小每个样本中样本特征的数量,不减少样本的数量。例如,第一快递催派训练集中第一快递催派训练样本为100个,每个第一快递催派训练样本有100个样本特征;第二快递催派训练集中第二快递催派训练样本为100个,每个第二快递催派训练样本有99个样本特征。
本申请实施例中,将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,可以包括:
(1)基于第一快递催派训练集对第一分类模型进行训练,得到第一快递催派训练集中各个样本特征的SHAP值。
其中,第一分类模型可以为提升树模型(Boosting Tree)、GBDT、XGBoost等,根据具体情况选用即可。
其中,SHAP(SHapley Additive ExPlanations,沙普利加和解释)属于模型事后解释的方法,它的核心思想是计算特征对模型输出的边际贡献,再从全局和局部两个层面对“黑盒模型”进行解释。SHAP构建一个加性的解释模型,所有的特征都视为“贡献者”。对于每个训练样本,模型都产生一个预测值,SHAP值就是该训练样本中每个样本特征所分配到的数值。基本思想:计算一个样本特征加入到模型时的边际贡献,然后考虑到该样本特征在所有的特征序列的情况下不同的边际贡献,取均值,即某该样本特征的SHAP值。
其中,各个样本特征的SHAP值的计算方式如公式(1)所示:
其中,F是特征个数,set是特征集,feature是样本特征。
根据上述公式即可得到各个样本特征的SHAP值。
(2)将第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到第二快递催派训练集。
其中,第一预设值可以根据具体情况设定,例如,第一预设值可以为0.05。当然,第一预设值也可以是第一快递催派训练集中各个第一快递催派训练样本的SHAP值中的最小值。样本特征的SHAP值越小,表明该样本特征的重要性越低,将SHAP值不大于第一预设值的样本特征删除,能够在实现模型降维的同时保证模型的性能。
在一个具体的实施例中,将第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到第二快递催派训练集,包括:基于同一样本特征在各个第一快递催派训练样本的特征值确定各个样本特征的标准差;将第一快递催派训练集中SHAP值不大于第一预设值且标准差不大于第二预设值的样本特征删除,得到第二快递催派训练集。其中,第二预设值可以根据具体情况设定,例如,第二预设值为各个样本特征的标准差的最小值。
其中,样本特征的标准差是样本特征在各个第一快递催派训练样本的特征值的标准差。样本特征的标准差可以反映各个第一快递催派训练样本在样本特征上的波动。样本特征的标准差越小,表明各个第一快递催派训练样本在样本特征上基本没有差异,可能样本特征中的大多特征值都一样,甚至样本特征的取值都相同,那这个样本特征对于训练样本区分没有什么作用,可以删除,能够在实现模型降维的同时保证模型的性能。因此,将SHAP值较小且标准差较小的样本特征删除,能够确保删除的样本特征不影响模型性能。
在其他实施例中,也可以仅将第一快递催派训练集中标准差不大于第二预设值的样本特征删除,得到第二快递催派训练集。
S203、基于第二快递催派训练集训练第一分类模型,得到第二分类模型。
S204、判断第二分类模型是否满足预设参数条件。
在一个具体的实施例中,判断第二分类模型是否满足预设参数条件可以包括:
(1)基于预设验证集对第二分类模型进行验证,得到第二分类模型的预测精确率。
具体的,将预设验证集输入第二分类模型进行预测,得到预测结果,根据预测结果确定第二分类模型的预测精确率。精确率(precision)是指分类正确的目标类别样本占预测为目标类别样本的样本个数的比例。由于是针对快递员的应用,针对快递员的使用体验,以精确率(precision)为优化目标。即预警且真实发生的催派更重要,相对应的,没有预警且没有催派的并没有那么重要,因此精确率(precision)更适合快递催派场景。而Recall,ROC,AUC等模型评估指标不适用此场景。
(2)若第二分类模型的预测精确率大于第三预设值,则确定第二分类模型满足预设参数条件;若第二分类模型的预测精确率不大于第三预设值,则确定第二分类模型满足不预设参数条件。
其中,第三预设值可以根据具体情况设定,例如,第三预设值为90%。
S205、若第二分类模型满足预设参数条件,则将第二分类模型确定为催派预测模型。
若第二分类模型满足预设参数条件表明,即使删除部分特征训练得到了降维的第二分类模型,第二分类模型仍然具有90%以上的精确率,模型性能依然能够保证。因此,可以将第二分类模型作为催派预测模型。
进一步的,参阅图3,图3是本申请实施例中提供的催派预测模型的训练方法的另一个实施例流程示意图,该催派预测模型的训练方法包括如下步骤S301~S309:
S301、获取第一快递催派训练集。
本申请实施例中,S301的具体步骤可以参阅上一实施方式中的S201,在此不再赘述。
S302、将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集。
本申请实施例中,S302的具体步骤可以参阅上一实施方式中的S202,在此不再赘述。
S303、基于第二快递催派训练集训练第一分类模型,得到第二分类模型。
本申请实施例中,S303的具体步骤可以参阅上一实施方式中的S203,在此不再赘述。
S304、判断第二分类模型是否满足预设参数条件。
具体的,基于预设验证集对第二分类模型进行验证,得到第二分类模型的预测精确率。若第二分类模型的预测精确率大于第三预设值,则确定第二分类模型满足预设参数条件,执行S305;若第二分类模型的预测精确率不大于第三预设值,则确定第二分类模型满足不预设参数条件,结束或执行其他操作。
S305、将第二快递催派训练集中每个第二快递催派训练样本中预设数量的样本特征删除,得到第三快递催派训练集。
其中,第三快递催派训练集包括多个第三快递催派训练样本。
本申请实施例中,若第二分类模型的预测精确率大于第三预设值,则确定第二分类模型满足预设参数条件,表明即使删除了部分样本特征模型性能仍然能满足要求,可以继续删除样本特征。S305的具体步骤类似上一实施方式中的S202。
具体的,将第三快递催派训练集中SHAP值不大于第一预设值且标准差不大于第二预设值的样本特征删除,得到第三快递催派训练集。
S306、基于第三快递催派训练集训练第一分类模型,得到第三分类模型。
S307、判断第三分类模型是否满足预设参数条件。
具体的,基于预设验证集对第三分类模型进行验证,得到第三分类模型的预测精确率。若第三分类模型的预测精确率不大于第三预设值,则确定第三分类模型不满足预设参数条件,执行S308;若第三分类模型的预测精确率大于第三预设值,则确定第三分类模型满足预设参数条件,执行S309。
S308、将最近一次训练得到的满足预设参数条件的分类模型确定为催派预测模型。
本申请实施例中,若第三分类模型不满足预设参数条件,说明从第二快递催派训练集继续删除样本特征将会影响模型性能,因此,最近一次训练得到的满足预设参数条件的分类模型,即第二分类模型,为能够满足预设参数条件的最优模型,将第二分类模型确定为催派预测模型。显然,若S305-S307仅执行一次第三分类模型就不满足预设参数条件,第二分类模型就为最近一次训练得到的满足预设参数条件的分类模型。
S309、将第三快递催派训练集确定为第二快递催派训练集。
本申请实施例中,若第三分类模型满足预设参数条件,说明从第二快递催派训练集继续删除样本特征不会影响模型性能,可以继续删除样本特征,则将将第三快递催派训练集确定为第二快递催派训练集,即循环执行S305-S207,每次循环都会得到一个新的第三分类模型,直至新的第三分类模型不满足预设参数条件,执行S308。
进一步的,参阅图4,图4是本申请实施例中提供的快递催派量的预测方法的一个实施例流程示意图,该快递催派量的预测方法包括如下步骤S401~S402:
S401、获取目标网点在目标历史时间段的待预测运单特征信息。
具体的,目标历史时间段的长度与第二历史时间段长度相同,目标历史时间段的末端时间为当前时间。例如,获取目标网点在历史7天内的待预测运单特征信息。
S402、将待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量。
其中,催派预测模型为以上任一实施方式中的催派预测模型,预设时长可以为1天。例如,将目标网点在历史7天内的待预测运单特征信息输入催派预测模型,得到目标网点未来1天内的快递催派量为[0,3]。
为了更好实施本申请实施例中催派预测模型的训练方法,在催派预测模型的训练方法基础之上,本申请实施例中还提供一种催派预测模型的训练装置,如图5所示,催派预测模型的训练装置500包括:
获取单元501,用于获取第一快递催派训练集,其中,第一快递催派训练集中包括多个第一快递催派训练样本;
特征删除单元502,用于将第一快递催派训练集中每个第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,第二快递催派训练集包括多个第二快递催派训练样本;
模型训练单元503,用于基于第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断单元504,用于判断第二分类模型是否满足预设参数条件;
确定单元505,用于若第二分类模型满足预设参数条件,则将第二分类模型确定为催派预测模型。
可选地,特征删除单元502,用于:
基于第一快递催派训练集对第一分类模型进行训练,得到第一快递催派训练集中各个样本特征的SHAP值;
将第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到第二快递催派训练集。
可选地,特征删除单元502,用于:
基于同一样本特征在各个第一快递催派训练样本的特征值确定各个样本特征的标准差;
将第一快递催派训练集中SHAP值不大于第一预设值且标准差不大于第二预设值的样本特征删除,得到第二快递催派训练集。
可选地,确定单元505,用于:
若第二分类模型满足预设参数条件,将第二快递催派训练集中每个第二快递催派训练样本中预设数量的样本特征删除,得到第三快递催派训练集,其中,第三快递催派训练集包括多个第三快递催派训练样本;
基于第三快递催派训练集训练第一分类模型,得到第三分类模型;
判断第三分类模型是否满足预设参数条件;
若第三分类模型不满足预设参数条件,则将第二分类模型确定为催派预测模型。
可选地,判断单元504,用于:
基于预设验证集对第二分类模型进行验证,得到第二分类模型的预测精确率;
若第二分类模型的预测精确率大于第三预设值,则确定第二分类模型满足预设参数条件;若第二分类模型的预测精确率不大于第三预设值,则确定第二分类模型满足不预设参数条件。
可选地,获取单元501,用于:
获取第一历史时间段内的运单信息;
根据运单信息获取各个网点在第二历史时间段内的运单特征信息和对应催派标签,其中,第一历史时间段的时间长度长于第二历史时间段的时间长度;
将网点在第二历史时间段内的运单特征信息和对应催派标签确定为第一快递催派训练样本。
为了更好实施本申请实施例中快递催派量的预测方法,在快递催派量的预测方法基础之上,本申请实施例中还提供一种快递催派量的预测装置,如图6所示,催派预测模型的训练装置600包括:
获取单元601,用于获取目标网点在目标历史时间段的待预测运单特征信息;
预测单元602,用于将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量,其中,所述催派预测模型为以上任一项所述的催派预测模型。
本申请实施例还提供一种计算机设备,其集成了本申请实施例所提供的任一种催派预测模型的训练装置和/或快递催派量的预测装置,计算机设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中一个或多个应用程序被存储于存储器中,并配置为由处理器执行上述催派预测模型的训练方法实施例中任一实施例中的催派预测模型的训练方法或者中上述快递催派量的预测方法实施例中任一实施例中的快递催派量的预测方法的步骤。
如图7所示,其示出了本申请实施例所涉及的计算机设备的结构示意图,具体来讲:
该计算机设备可以包括一个或者一个以上处理核心的处理器701、一个或一个以上计算机可读存储介质的存储器702、电源703和输入单元704等部件。本领域技术人员可以理解,图中示出的计算机设备结构并不构成对计算机设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
处理器701是该计算机设备的控制中心,利用各种接口和线路连接整个计算机设备的各个部分,通过运行或执行存储在存储器702内的软件程序和/或模块,以及调用存储在存储器702内的数据,执行计算机设备的各种功能和处理数据,从而对计算机设备进行整体监控。可选的,处理器701可包括一个或多个处理核心;处理器701可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,优选的,处理器701可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器701中。
存储器702可用于存储软件程序以及模块,处理器701通过运行存储在存储器702的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器702还可以包括存储器控制器,以提供处理器701对存储器702的访问。
计算机设备还包括给各个部件供电的电源703,优选的,电源703可以通过电源管理系统与处理器701逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源703还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
该计算机设备还可包括输入单元704,该输入单元704可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
尽管未示出,计算机设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,计算机设备中的处理器701会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器702中,并由处理器701来运行存储在存储器702中的应用程序,从而实现各种功能,如下:
获取第一快递催派训练集,其中,所述第一快递催派训练集中包括多个第一快递催派训练样本;
将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,所述第二快递催派训练集包括多个第二快递催派训练样本;
基于所述第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断所述第二分类模型是否满足预设参数条件;
若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型;
或者,
获取目标网点在目标历史时间段的待预测运单特征信息;
将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。其上存储有计算机程序,计算机程序被处理器进行加载,以执行本申请实施例所提供的任一种催派预测模型的训练方法或者快递催派量的预测方法中的步骤。例如,计算机程序被处理器进行加载可以执行如下步骤:
获取第一快递催派训练集,其中,所述第一快递催派训练集中包括多个第一快递催派训练样本;
将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,所述第二快递催派训练集包括多个第二快递催派训练样本;
基于所述第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断所述第二分类模型是否满足预设参数条件;
若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型;
或者,
获取目标网点在目标历史时间段的待预测运单特征信息;
将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见上文针对其他实施例的详细描述,此处不再赘述。
具体实施时,以上各个单元或结构可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现,以上各个单元或结构的具体实施可参见前面的方法实施例,在此不再赘述。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种催派预测模型的训练方法、快递催派量的预测方法及装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本申请的限制。
Claims (11)
1.一种催派预测模型的训练方法,其特征在于,所述催派预测模型的训练方法包括:
获取第一快递催派训练集,其中,所述第一快递催派训练集中包括多个第一快递催派训练样本;
将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,所述第二快递催派训练集包括多个第二快递催派训练样本;
基于所述第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断所述第二分类模型是否满足预设参数条件;
若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
2.根据权利要求1所述的催派预测模型的训练方法,其特征在于,所述将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,包括:
基于所述第一快递催派训练集对所述第一分类模型进行训练,得到所述第一快递催派训练集中各个样本特征的SHAP值;
将所述第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到所述第二快递催派训练集。
3.根据权利要求2所述的催派预测模型的训练方法,其特征在于,所述将所述第一快递催派训练集中SHAP值不大于第一预设值的样本特征删除,得到所述第二快递催派训练集,包括:
基于同一样本特征在各个第一快递催派训练样本的特征值确定各个样本特征的标准差;
将所述第一快递催派训练集中SHAP值不大于第一预设值且标准差不大于第二预设值的样本特征删除,得到所述第二快递催派训练集。
4.根据权利要求1所述的催派预测模型的训练方法,其特征在于,所述若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型,包括:
若所述第二分类模型满足预设参数条件,将所述第二快递催派训练集中每个所述第二快递催派训练样本中预设数量的样本特征删除,得到第三快递催派训练集,其中,所述第三快递催派训练集包括多个第三快递催派训练样本;
基于所述第三快递催派训练集训练第一分类模型,得到第三分类模型;
判断所述第三分类模型是否满足预设参数条件;
若所述第三分类模型不满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
5.根据权利要求1所述的催派预测模型的训练方法,其特征在于,所述判断所述第二分类模型是否满足预设参数条件,包括:
基于预设验证集对所述第二分类模型进行验证,得到所述第二分类模型的预测精确率;
若所述第二分类模型的预测精确率大于第三预设值,则确定所述第二分类模型满足预设参数条件;若所述第二分类模型的预测精确率不大于第三预设值,则确定所述第二分类模型满足不预设参数条件。
6.根据权利要求1所述的催派预测模型的训练方法,其特征在于,所述获取第一快递催派训练集,包括:
获取第一历史时间段内的运单信息;
根据所述运单信息获取各个网点在第二历史时间段内的运单特征信息和对应催派标签,其中,所述第一历史时间段的时间长度长于所述第二历史时间段的时间长度;
将网点在第二历史时间段内的运单特征信息和对应催派标签确定为第一快递催派训练样本。
7.一种快递催派量的预测方法,其特征在于,所述快递催派量的预测方法,包括:
获取目标网点在目标历史时间段的待预测运单特征信息;
将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量,其中,所述催派预测模型为权利要求1-6任一项所述的催派预测模型。
8.一种催派预测模型的训练装置,其特征在于,所述催派预测模型的训练装置包括:
获取单元,用于获取第一快递催派训练集,其中,所述第一快递催派训练集中包括多个第一快递催派训练样本;
特征删除单元,用于将所述第一快递催派训练集中每个所述第一快递催派训练样本中预设数量的样本特征删除,得到第二快递催派训练集,其中,所述第二快递催派训练集包括多个第二快递催派训练样本;
模型训练单元,用于基于所述第二快递催派训练集训练第一分类模型,得到第二分类模型;
判断单元,用于判断所述第二分类模型是否满足预设参数条件;
确定单元,用于若所述第二分类模型满足预设参数条件,则将所述第二分类模型确定为催派预测模型。
9.一种快递催派量的预测装置,其特征在于,所述快递催派量的预测装置包括:
获取单元,用于获取目标网点在目标历史时间段的待预测运单特征信息;
预测单元,用于将所述待预测运单特征信息输入催派预测模型,得到目标网点未来预设时长内的快递催派量,其中,所述催派预测模型为权利要求1-6任一项所述的催派预测模型。
10.一种计算机设备,其特征在于,所述计算机设备包括:
一个或多个处理器;
存储器;以及
一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现权利要求1至6中任一项所述的催派预测模型的训练方法或者权利要求7中所述的快递催派量的预测方法。
11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至6中任一项所述的催派预测模型的训练方法或者权利要求7中所述的快递催派量的预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111075255.0A CN115809713A (zh) | 2021-09-14 | 2021-09-14 | 催派预测模型的训练方法、快递催派量的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111075255.0A CN115809713A (zh) | 2021-09-14 | 2021-09-14 | 催派预测模型的训练方法、快递催派量的预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115809713A true CN115809713A (zh) | 2023-03-17 |
Family
ID=85481478
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111075255.0A Pending CN115809713A (zh) | 2021-09-14 | 2021-09-14 | 催派预测模型的训练方法、快递催派量的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115809713A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402236A (zh) * | 2023-05-31 | 2023-07-07 | 北京京东乾石科技有限公司 | 信息生成方法和装置 |
-
2021
- 2021-09-14 CN CN202111075255.0A patent/CN115809713A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116402236A (zh) * | 2023-05-31 | 2023-07-07 | 北京京东乾石科技有限公司 | 信息生成方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555578B (zh) | 一种销量预测方法和装置 | |
CN107679683B (zh) | 软件开发进度预警方法和装置 | |
WO2019061990A1 (zh) | 用户意图预测方法、电子设备及计算机可读存储介质 | |
CN111737646A (zh) | 广告推广的效果评估数据处理方法、系统和存储介质 | |
CN116050947A (zh) | 车辆调度效果的评价方法、装置、计算机设备和存储介质 | |
CN115809713A (zh) | 催派预测模型的训练方法、快递催派量的预测方法及装置 | |
CN114663015A (zh) | 补货方法和装置 | |
CN113205189B (zh) | 训练预测模型的方法、预测方法及装置 | |
CN111404974A (zh) | 一种云计算效能评估方法、装置及评估设备 | |
CN110414875B (zh) | 产能数据处理方法、装置、电子设备及计算机可读介质 | |
US20150339693A1 (en) | Determination of initial value for automated delivery of news items | |
CN115759574A (zh) | 物资的存储方法、装置、计算机设备和存储介质 | |
CN114066642A (zh) | 电力零售的风险预测方法、终端及存储介质 | |
CN116228316A (zh) | 投放选址的确定方法、装置、电子设备及可读存储介质 | |
CN114282881A (zh) | 折旧测算方法、装置、存储介质及计算机设备 | |
CN115730888A (zh) | 货品库存分配方法及装置 | |
CN111598630A (zh) | 小区画像构建方法、装置及存储介质 | |
CN111523802B (zh) | 送达时间应答方法、装置、设备及介质 | |
CN113362095B (zh) | 一种信息投放的方法和装置 | |
CN113537574B (zh) | 业务处理时效的推送方法、装置、存储介质及计算机设备 | |
CN118153954A (zh) | 对象关系的识别方法、装置和计算机设备 | |
CN117421180A (zh) | 一种数据资源健康维护方法、装置及设备 | |
CN116484987A (zh) | 件量预测方法、装置、电子设备及计算机可读存储介质 | |
CN116975580A (zh) | 一种信息评估方法、装置及设备 | |
CN116484990A (zh) | 订单量异动预测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |