CN113313439A - 一种计算妥投时长的方法和装置 - Google Patents
一种计算妥投时长的方法和装置 Download PDFInfo
- Publication number
- CN113313439A CN113313439A CN202010120937.8A CN202010120937A CN113313439A CN 113313439 A CN113313439 A CN 113313439A CN 202010120937 A CN202010120937 A CN 202010120937A CN 113313439 A CN113313439 A CN 113313439A
- Authority
- CN
- China
- Prior art keywords
- time
- model
- calculating
- target
- target model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 63
- 238000012549 training Methods 0.000 claims abstract description 42
- 238000012795 verification Methods 0.000 claims description 27
- 238000012360 testing method Methods 0.000 claims description 21
- 230000004927 fusion Effects 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 12
- 238000007637 random forest analysis Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000012417 linear regression Methods 0.000 claims description 7
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000009826 distribution Methods 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 13
- 230000002159 abnormal effect Effects 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000005266 casting Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0833—Tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/08—Logistics, e.g. warehousing, loading or distribution; Inventory or stock management
- G06Q10/083—Shipping
- G06Q10/0838—Historical data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0633—Lists, e.g. purchase orders, compilation or processing
- G06Q30/0635—Processing of requisition or of purchase orders
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Entrepreneurship & Innovation (AREA)
- Quality & Reliability (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Operations Research (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种计算妥投时长的方法和装置,涉及物流配送技术领域。该方法的一具体实施方式包括:采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。该实施方式能够解决估计出的履约时间不准确的技术问题。
Description
技术领域
本发明涉及物流配送技术领域,尤其涉及一种计算妥投时长的方法和装置。
背景技术
物流公司在配送时会分配给用户预约到达的时间,但由于一些特殊原因,比如收货地点位置比较偏远、天气极端、货量较大、交通堵塞或者其它一些异常情况等,部分货物可能无法在预约的时间配送完成(即履约)。为了提升用户体验,对于这一类货物,需要对履约的时间进行重新估计,将新的履约时间分配给用户,使用户有所准备。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
无法履约时,使用业务规则对预计履约时间进行更新,即在之前的预计履约时间基础上加上一个固定时长。这种方式没有综合考虑任何客观因素对履约时间的影响,估计出的履约时间显然是非常不准确的,导致用户体验较差;同时也无法及时发现履约异常的订单。
发明内容
有鉴于此,本发明实施例提供一种计算妥投时长的方法和装置,以解决估计出的履约时间不准确的技术问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种计算妥投时长的方法,包括:
采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;
采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;
对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
可选地,对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长,包括:
根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重;
对所述各个目标模型的预测妥投时长以及权重进行加权求和,计算得到融合妥投时长。
可选地,根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重,包括:
对于任意一个目标模型,采用以下方法计算所述目标模型的权重:
根据当前时间点之前的各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算时长方差;
根据所述时长方差、所述当前时间点之前的各个时间点的实际妥投时长、所述目标模型的预测妥投时长以及所述目标模型的初始权重,计算所述目标模型当前时间点的权重。
可选地,对于任意一个目标模型,采用以下方法计算所述目标模型的初始权重:
根据验证集中各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算验证方差;
计算所述验证方差的倒数,并对所述验证方差的倒数进行归一化,从而得到所述目标模型的初始权重。
可选地,采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型,包括:
将实际妥投数据分为训练集和测试集;其中,每组实际妥投数据至少包括实际妥投时长、待配送单量、待上门揽件单量、上个波次未及时妥投的单量;
采用训练集分别训练模型组中的各个模型,得到多个目标模型;
采用测试集分别对所述多个目标模型进行测试,以优化所述多个目标模型。
可选地,将实际妥投数据分为训练集和测试集之前,还包括:
以实际妥投时长作为响应变量,其他维度的数据作为自变量;
分别采用皮尔森相关系数法计算所述响应变量与各个自变量之间的相关系数;
从所述实际妥投数据中删除相关系数小于预设阈值的自变量。
可选地,所述模型组中的各个模型至少包括以下两个模型:
随机森林模型、xgboost模型、平均模型和广义线性回归模型。
另外,根据本发明实施例的另一个方面,提供了一种计算妥投时长的装置,包括:
训练模块,用于采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;
计算模块,用于采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;
融合模块,用于对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
可选地,所述融合模块还用于:
根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重;
对所述各个目标模型的预测妥投时长以及权重进行加权求和,计算得到融合妥投时长。
可选地,所述融合模块还用于:
对于任意一个目标模型,采用以下方法计算所述目标模型的权重:
根据当前时间点之前的各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算时长方差;
根据所述时长方差、所述当前时间点之前的各个时间点的实际妥投时长、所述目标模型的预测妥投时长以及所述目标模型的初始权重,计算所述目标模型当前时间点的权重。
可选地,所述融合模块还用于:
对于任意一个目标模型,采用以下方法计算所述目标模型的初始权重:
根据验证集中各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算验证方差;
计算所述验证方差的倒数,并对所述验证方差的倒数进行归一化,从而得到所述目标模型的初始权重。
可选地,所述训练模块还用于:
将实际妥投数据分为训练集和测试集;其中,每组实际妥投数据至少包括实际妥投时长、待配送单量、待上门揽件单量、上个波次未及时妥投的单量;
采用训练集分别训练模型组中的各个模型,得到多个目标模型;
采用测试集分别对所述多个目标模型进行测试,以优化所述多个目标模型。
可选地,所述训练模块还用于:将实际妥投数据分为训练集和测试集之前,以实际妥投时长作为响应变量,其他维度的数据作为自变量;
分别采用皮尔森相关系数法计算所述响应变量与各个自变量之间的相关系数;
从所述实际妥投数据中删除相关系数小于预设阈值的自变量。
可选地,所述模型组中的各个模型至少包括以下两个模型:
随机森林模型、xgboost模型、平均模型和广义线性回归模型。
根据本发明实施例的另一个方面,还提供了一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一实施例所述的方法。
根据本发明实施例的另一个方面,还提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任一实施例所述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为采用通过训练后的各个目标模型分别计算预测妥投时长,对各个目标模型的预测妥投时长进行融合,从而得到融合妥投时长的技术手段,所以克服了现有技术中估计出的履约时间不准确的技术问题。由于每个模型考虑了不同层面的信息,本发明实施例对各个模型输出的结果进行融合能够综合考虑不同层面的信息并结合不同模型的优势,进一步减小误差,从而提高预测准确性。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的计算妥投时长的方法的主要流程的示意图;
图2是根据本发明一个可参考实施例的计算妥投时长的方法的主要流程的示意图;
图3是根据本发明实施例的计算妥投时长的装置的主要模块的示意图;
图4是本发明实施例可以应用于其中的示例性系统架构图;
图5是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
目前,当无法履约时,系统会使用业务规则对预计履约时间进行更新,即,在之前的预计履约时间基础上加上一个固定时长。这种方式没有综合考虑任何客观因素对履约时间的影响,估计出的履约时间显然是非常不准确的,导致用户体验较差。同时,也无法及时发现履约异常的订单。例如,在受到其它因素影响的情况下,某一波次的货物最后一件的履约时间比估计的履约时间可能延迟两个小时,如果在晚了两个小时之后还没有送到,则说明有可能发生货物丢失等异常现象。但是如果将履约时间延长24小时,则说明至少要24个小时候才能发现这种情况。
为了解决上述技术问题,本发明实施例通过考虑地理位置、单量、天气等因素来估计货物的履约时间,并对各个模型进行输出的结果进行融合,由于每个模型考虑了不同层面的信息,对各个模型输出的结果进行融合能够综合考虑不同层面的信息并结合不同模型的优势,进一步减小误差。
图1是根据本发明实施例的计算妥投时长的方法的主要流程的示意图。作为本发明的一个实施例,如图1所示,所述计算妥投时长的方法可以包括:
步骤101,采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型。
对于某个站点来说,获取该站点最近一段时间(比如最近两个月、最近三个月或者最近半年等)每个到货波次的实际妥投数据,每组实际妥投数据至少包括实际妥投时长、待配送单量、待上门揽件单量、上个波次未及时妥投的单量,还可以包括待配送运单号、入站时间、所属生产波次、站点归属的城市等级、异常天气报备、生鲜订单标识、跨境订单标识、揽件单号等。每个到货波次有若干个包裹,分别需要送往不同地址,这些地址均在站点配送范围之内,实际妥投时长是指到货波次的所有包裹从入站到完成妥投的时长。站点的到货波次是指入该站点的车辆批次,一般情况下每个站点每天的到货波次是固定的。
由于一些特殊原因导致个别包裹妥投时间过长,因此需要将这些异常值排除掉,排除异常值的方法分为以下几步:1)对于某个站点某天某个到货波次,获取每个包裹的妥投时长,对这些包裹按照妥投时长由小到大的顺序进行排列;2)找出这个排序中的第一四分位数Q1和第三四分位数Q3;3)计算该到货波次的正常妥投时长为:Q3+1.5*(Q3-Q1),大于该正常妥投时长的包裹则认为是异常妥投。将计算得到的正常妥投时长作为这个到货波次的实际妥投时长,按照同样的方法可以计算得到该站点每天每个到货波次的实际妥投时长。
可选地,也可以采用其他方法进行异常值剔除。比如,对于某个站点某天某个到货波次,如果95%的订单的妥投时长都是2小时,另外5%的订单的妥投时长是大于2小时,那么就将2小时作为这个到货波次的正常妥投时长。
可选地,步骤101包括:将实际妥投数据分为训练集和测试集;采用训练集分别训练模型组中的各个模型,得到多个目标模型;采用测试集分别对所述多个目标模型进行测试,以优化所述多个目标模型。通过实际妥投数据分别训练各个模型,从而得到多个目标模型,然后通过测试集判断模型的预测效果,并通过不断地调整参数来优化各个目标模型。
可选地,为了训练得到更好的目标模型,将实际妥投数据分为训练集和测试集之前,还包括:以实际妥投时长作为响应变量,其他维度的数据作为自变量;分别采用皮尔森相关系数法计算所述响应变量与各个自变量之间的相关系数;从所述实际妥投数据中删除相关系数小于预设阈值的自变量。
一般来说,考虑的因素主要有待配送单量、待上门揽件的单量、上个波次未及时妥投的单量、站点所在城市偏远程度、天气、大件单量占比、生鲜单量占比等,可以将这些因素作为自变量,实际妥投时长作为响应变量,采用皮尔森相关系数法计算每个自变量与实际妥投时长之间的相关系数。相关系数越高,说明该变量对妥投时长的影响越大。如果相关系数小于预设阈值,则将该自变量的数据从实际妥投数据中删除,也就是说该自变量的数据不用于训练模型。
还可以查看各个自变量的缺失率、分布状态等,如果某个自变量(比如天气)的数据缺失率达到90%,也可以将该自变量的数据从实际妥投数据中删除。
可选地,所述模型组中的各个模型至少包括以下两个模型:随机森林模型、xgboost模型、平均模型和广义线性回归模型。其中,平均模型可以包括简单平均模型、移动平均模型或者加权移动平均模型。可选地,所述模型组中包括随机森林模型、xgboost模型、简单平均模型和移动平均模型。可选地,所述模型组中包括模型随机森林模型、xgboost模型、简单平均模型、移动平均模型和加权移动平均模型。可选地,所述模型组中包括随机森林模型、xgboost模型、简单平均模型和广义线性回归模型。
步骤102,采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长。
将待预测的到货波次的妥投数据输入到训练后的各个目标模型中,从而得到所述各个目标模型输出的预测妥投时长。其中,所述妥投数据可以包括待配送单量、待上门揽件单量、上个波次未及时妥投的单量,还可以包括待配送运单号、入站时间、所属生产波次、站点归属的城市等级、生鲜订单标识、跨境订单标识、揽件单号等。
可选地,简单平均模型是将某个站点某个到货波次对应的历史所有妥投时长取平均值,作为该站点在当前到货波次的预测妥投时长。可选地,移动平均模型是将某站点某个到货波次最近20天的妥投时长取平均值,作为该站点在当前波次的预测妥投时长。可选地,加权移动平均模型是在移动平均模型的基础上给每个妥投时长设置权重,权重设置为标准正态分布的y值,确保时间越近的权重越大,时间越久的权重越小。
步骤103,对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
在该步骤中,对步骤102中得到的各个目标模型的预测妥投时长进行融合,从而得到融合妥投时长,以优化最终的预测效果。通过融合的方式综合考虑不同层面的信息并结合不同模型的优势,增强了模型预测的准确性。
可选地,步骤103可以包括:根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重;对所述各个目标模型的预测妥投时长以及权重进行加权求和,计算得到融合妥投时长。在本发明的实施例中,可以采用加权求和的方式计算得到融合妥投时长,以综合考虑不同层面的信息并结合不同模型的优势。模型融合的基本思想是通过每个目标模型在历史上的预测准确度来为给每个目标模型设置权重,对各个目标模型的预测结果进行加权求和,作为最终的预测结果。由于在进行预测时,上一个到货波次的预测效果已经可以得到,因此可以使用当前到货波次(即当前时间点)之前的预测准确度计算实时权重。而对于第一次预测,由于没有历史上的预测准确度可以参考,因此可以在训练集中分割出一个验证数据集合,在这个数据集上得到验证误差,用于计算各个目标模型的初始权重。
可选地,对于任意一个目标模型,采用以下方法计算所述目标模型的初始权重:根据验证集中各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算验证方差;计算所述验证方差的倒数,并对所述验证方差的倒数进行归一化,从而得到所述目标模型的初始权重。
其似然可以写为:
然后使用最大似然来求解y与yj的关系,可以得到:
通过求导得到:
在验证集中,yi是第i个时间点的实际妥投时长,yi,j是第j个模型的预测妥投时长。
可选地,根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重,包括:对于任意一个目标模型,采用以下方法计算所述目标模型的权重:根据当前时间点之前的各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算时长方差;根据所述时长方差、所述当前时间点之前的各个时间点的实际妥投时长、所述目标模型的预测妥投时长以及所述目标模型的初始权重,计算所述目标模型当前时间点的权重。
对于每个站点每天每个到货波次来说,会得到各个目标模型的预测妥投时长以及货物配送后得到的实际妥投时长。以模型随机森林模型、xgboost模型、简单平均模型、移动平均模型和加权移动平均模型为例,各个模型的预测妥投时长和实际妥投时长如下表所示:
需要对各个时间点对应的权重进行迭代,从而得到当前时间点的权重,可以采用如下方法计算第j个模型的实时权重Pj,n:
然后再对实时权重进行归一化,得到第j个模型的最终权重Wj,n:
因此,第n个时间点(也就是当前时间点)的最终输出为:
例如,对于站点A在9:00-10:00这个波次时,上述5个模型当前时间点的最终权重Wj,n分别为0.1,0.3,0.2,0.1,0.3,则融合后的预测妥投时长为12*0.1+13*0.3+14*0.2+14*0.1+15*0.3=13.8。
需要强调的是,由于基于平均的模型是以站点为单位对历史数据进行的平均,模型的融合也要以站点为单位,因此每个站点都有一套用于模型融合的权重。为了保证预测准确性,每当站点新来了一个到货波次的包裹,都会触发执行本发明实施例提供的方法进行妥投时长预测,这样能实时更新预测结果。而且,由于快递员的配送路线是不可知的,因此系统无法估计每一件货物的具体履约时间。为了克服这个困难,本发明实施例预测的是每个到货波次所有货物的最晚正常履约时间,作为对每件货物履约时间的估计,并且跟据数据实时更新预测结果。
根据上面所述的各种实施例,可以看出本发明通过采用训练后的各个目标模型分别计算预测妥投时长,对各个目标模型的预测妥投时长进行融合,从而得到融合妥投时长的技术手段,解决了现有技术中估计出的履约时间不准确的技术问题。由于每个模型考虑了不同层面的信息,本发明实施例对各个模型输出的结果进行融合能够综合考虑不同层面的信息并结合不同模型的优势,进一步减小误差,从而提高预测准确性。
图2是根据本发明一个可参考实施例的计算妥投时长的方法的主要流程的示意图。作为本发明的另一个实施例,如图2所示,所述计算妥投时长的方法可以包括以下步骤:
步骤201,获取实际妥投数据,以实际妥投时长作为响应变量,其他维度的数据作为自变量,分别采用皮尔森相关系数法计算所述响应变量与各个自变量之间的相关系数。
可以获取最近一段时间的每个到货波次的实际妥投数据,实际妥投数据至少包括实际妥投时长、待配送单量、待上门揽件单量、上个波次未及时妥投的单量,还可以包括待配送运单号、入站时间、所属生产波次、站点归属的城市等级、异常天气报备、生鲜订单标识、跨境订单标识、揽件单号等。
步骤202,从实际妥投数据中删除相关系数小于预设阈值的自变量。
步骤203,采用删除相关系数小的自变量后的实际妥投数据分别训练模型组中的各个模型,得到多个目标模型。
可选地,所述模型组中的各个模型至少包括以下两个模型:随机森林模型、xgboost模型、平均模型和广义线性回归模型。
步骤204,采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长。
步骤205,计算所述各个目标模型的初始权重。
对于任意一个目标模型,采用以下方法计算所述目标模型的初始权重:
根据验证集中各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算验证方差;
计算所述验证方差的倒数,并对所述验证方差的倒数进行归一化,从而得到所述目标模型的初始权重。
步骤206,根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重。
对于任意一个目标模型,采用以下方法计算所述目标模型的权重:
根据当前时间点之前的各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算时长方差;
根据所述时长方差、所述当前时间点之前的各个时间点的实际妥投时长、所述目标模型的预测妥投时长以及所述目标模型的初始权重,计算所述目标模型当前时间点的权重。
步骤207,对所述各个目标模型的预测妥投时长以及权重进行加权求和,计算得到融合妥投时长。
另外,在本发明一个可参考实施例中计算妥投时长的方法的具体实施内容,在上面所述计算妥投时长的方法中已经详细说明了,故在此重复内容不再说明。
图3是根据本发明实施例的计算妥投时长的装置的主要模块的示意图,如图3所示,所述计算妥投时长的装置300包括训练模块301、计算模块302和融合模块303。其中,训练模块301用于采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;计算模块302用于采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;融合模块303用于对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
可选地,所述融合模块303还用于:
根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重;
对所述各个目标模型的预测妥投时长以及权重进行加权求和,计算得到融合妥投时长。
可选地,所述融合模块303还用于:
对于任意一个目标模型,采用以下方法计算所述目标模型的权重:
根据当前时间点之前的各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算时长方差;
根据所述时长方差、所述当前时间点之前的各个时间点的实际妥投时长、所述目标模型的预测妥投时长以及所述目标模型的初始权重,计算所述目标模型当前时间点的权重。
可选地,所述融合模块303还用于:
对于任意一个目标模型,采用以下方法计算所述目标模型的初始权重:
根据验证集中各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算验证方差;
计算所述验证方差的倒数,并对所述验证方差的倒数进行归一化,从而得到所述目标模型的初始权重。
可选地,所述训练模块301还用于:
将实际妥投数据分为训练集和测试集;其中,每组实际妥投数据至少包括实际妥投时长、待配送单量、待上门揽件单量、上个波次未及时妥投的单量;
采用训练集分别训练模型组中的各个模型,得到多个目标模型;
采用测试集分别对所述多个目标模型进行测试,以优化所述多个目标模型。
可选地,所述训练模块301还用于:将实际妥投数据分为训练集和测试集之前,以实际妥投时长作为响应变量,其他维度的数据作为自变量;
分别采用皮尔森相关系数法计算所述响应变量与各个自变量之间的相关系数;
从所述实际妥投数据中删除相关系数小于预设阈值的自变量。
可选地,所述模型组中的各个模型至少包括以下两个模型:
随机森林模型、xgboost模型、平均模型和广义线性回归模型。
根据上面所述的各种实施例,可以看出本发明通过采用训练后的各个目标模型分别计算预测妥投时长,对各个目标模型的预测妥投时长进行融合,从而得到融合妥投时长的技术手段,解决了现有技术中估计出的履约时间不准确的技术问题。由于每个模型考虑了不同层面的信息,本发明实施例对各个模型输出的结果进行融合能够综合考虑不同层面的信息并结合不同模型的优势,进一步减小误差,从而提高预测准确性。
需要说明的是,在本发明所述计算妥投时长的装置的具体实施内容,在上面所述计算妥投时长的方法中已经详细说明了,故在此重复内容不再说明。
图4示出了可以应用本发明实施例的计算妥投时长的方法或计算妥投时长的装置的示例性系统架构400。
如图4所示,系统架构400可以包括终端设备401、402、403,网络404和服务器405。网络404用以在终端设备401、402、403和服务器405之间提供通信链路的介质。网络404可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备401、402、403通过网络404与服务器405交互,以接收或发送消息等。终端设备401、402、403上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备401、402、403可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器405可以是提供各种服务的服务器,例如对用户利用终端设备401、402、403所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的物品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、物品信息——仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的计算妥投时长的方法一般由服务器405执行,相应地,所述计算妥投时长的装置一般设置在服务器405中。本发明实施例所提供的计算妥投时长的方法也可以由终端设备401、402、403执行,相应地,所述计算妥投时长的装置可以设置在终端设备401、402、403中。
应该理解,图4中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图5,其示出了适于用来实现本发明实施例的终端设备的计算机系统500的结构示意图。图5示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。CPU 501、ROM 502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括训练模块、计算模块和融合模块,其中,这些模块的名称在某种情况下并不构成对该模块本身的限定。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
根据本发明实施例的技术方案,因为采用通过训练后的各个目标模型分别计算预测妥投时长,对各个目标模型的预测妥投时长进行融合,从而得到融合妥投时长的技术手段,所以克服了现有技术中估计出的履约时间不准确的技术问题。由于每个模型考虑了不同层面的信息,本发明实施例对各个模型输出的结果进行融合能够综合考虑不同层面的信息并结合不同模型的优势,进一步减小误差,从而提高预测准确性。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (10)
1.一种计算妥投时长的方法,其特征在于,包括:
采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;
采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;
对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
2.根据权利要求1所述的方法,其特征在于,对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长,包括:
根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重;
对所述各个目标模型的预测妥投时长以及权重进行加权求和,计算得到融合妥投时长。
3.根据权利要求2所述的方法,其特征在于,根据当前时间点之前的实际妥投时长和所述各个目标模型的预测妥投时长,计算所述各个目标模型的权重,包括:
对于任意一个目标模型,采用以下方法计算所述目标模型的权重:
根据当前时间点之前的各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算时长方差;
根据所述时长方差、所述当前时间点之前的各个时间点的实际妥投时长、所述目标模型的预测妥投时长以及所述目标模型的初始权重,计算所述目标模型当前时间点的权重。
4.根据权利要求3所述的方法,其特征在于,对于任意一个目标模型,采用以下方法计算所述目标模型的初始权重:
根据验证集中各个时间点的实际妥投时长和所述目标模型的预测妥投时长,计算验证方差;
计算所述验证方差的倒数,并对所述验证方差的倒数进行归一化,从而得到所述目标模型的初始权重。
5.根据权利要求1所述的方法,其特征在于,采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型,包括:
将实际妥投数据分为训练集和测试集;其中,每组实际妥投数据至少包括实际妥投时长、待配送单量、待上门揽件单量、上个波次未及时妥投的单量;
采用训练集分别训练模型组中的各个模型,得到多个目标模型;
采用测试集分别对所述多个目标模型进行测试,以优化所述多个目标模型。
6.根据权利要求5所述的方法,其特征在于,将实际妥投数据分为训练集和测试集之前,还包括:
以实际妥投时长作为响应变量,其他维度的数据作为自变量,分别采用皮尔森相关系数法计算所述响应变量与各个自变量之间的相关系数;
从所述实际妥投数据中删除相关系数小于预设阈值的自变量。
7.根据权利要求1所述的方法,其特征在于,所述模型组中的各个模型至少包括以下两个模型:
随机森林模型、xgboost模型、平均模型和广义线性回归模型。
8.一种计算妥投时长的装置,其特征在于,包括:
训练模块,用于采用实际妥投数据分别训练模型组中的各个模型,得到多个目标模型;
计算模块,用于采用训练后的各个目标模型分别计算所述各个目标模型的预测妥投时长;
融合模块,用于对所述各个目标模型的预测妥投时长进行融合,得到融合妥投时长。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010120937.8A CN113313439B (zh) | 2020-02-26 | 2020-02-26 | 一种计算妥投时长的方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010120937.8A CN113313439B (zh) | 2020-02-26 | 2020-02-26 | 一种计算妥投时长的方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113313439A true CN113313439A (zh) | 2021-08-27 |
CN113313439B CN113313439B (zh) | 2024-04-05 |
Family
ID=77369803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010120937.8A Active CN113313439B (zh) | 2020-02-26 | 2020-02-26 | 一种计算妥投时长的方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113313439B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090216583A1 (en) * | 2008-02-27 | 2009-08-27 | Alfred Degbotse | Approximating cycle times within material flow network |
CN106886875A (zh) * | 2017-02-21 | 2017-06-23 | 世纪禾光科技发展(北京)有限公司 | 物流妥投时长分析方法及装置 |
CN109063935A (zh) * | 2018-09-27 | 2018-12-21 | 北京三快在线科技有限公司 | 一种预测任务处理时间的方法、装置及存储介质 |
CN109416878A (zh) * | 2017-06-13 | 2019-03-01 | 北京嘀嘀无限科技发展有限公司 | 用于推荐预计到达时间的系统和方法 |
WO2019056499A1 (zh) * | 2017-09-20 | 2019-03-28 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
CN109993367A (zh) * | 2019-04-04 | 2019-07-09 | 拉扎斯网络科技(上海)有限公司 | 配送时长的估计方法、估计装置、存储介质和电子设备 |
CN110110936A (zh) * | 2019-05-13 | 2019-08-09 | 拉扎斯网络科技(上海)有限公司 | 订单时长的估计方法、估计装置、存储介质和电子设备 |
CN110543968A (zh) * | 2019-07-30 | 2019-12-06 | 北京三快在线科技有限公司 | 预计送达时间确定方法、装置、电子设备及存储介质 |
CN110599078A (zh) * | 2019-07-26 | 2019-12-20 | 平安科技(深圳)有限公司 | 物流配送信息的处理方法、装置及计算机设备 |
-
2020
- 2020-02-26 CN CN202010120937.8A patent/CN113313439B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090216583A1 (en) * | 2008-02-27 | 2009-08-27 | Alfred Degbotse | Approximating cycle times within material flow network |
CN106886875A (zh) * | 2017-02-21 | 2017-06-23 | 世纪禾光科技发展(北京)有限公司 | 物流妥投时长分析方法及装置 |
CN109416878A (zh) * | 2017-06-13 | 2019-03-01 | 北京嘀嘀无限科技发展有限公司 | 用于推荐预计到达时间的系统和方法 |
WO2019056499A1 (zh) * | 2017-09-20 | 2019-03-28 | 平安科技(深圳)有限公司 | 预测模型训练方法、数据监控方法、装置、设备及介质 |
CN109063935A (zh) * | 2018-09-27 | 2018-12-21 | 北京三快在线科技有限公司 | 一种预测任务处理时间的方法、装置及存储介质 |
CN109993367A (zh) * | 2019-04-04 | 2019-07-09 | 拉扎斯网络科技(上海)有限公司 | 配送时长的估计方法、估计装置、存储介质和电子设备 |
CN110110936A (zh) * | 2019-05-13 | 2019-08-09 | 拉扎斯网络科技(上海)有限公司 | 订单时长的估计方法、估计装置、存储介质和电子设备 |
CN110599078A (zh) * | 2019-07-26 | 2019-12-20 | 平安科技(深圳)有限公司 | 物流配送信息的处理方法、装置及计算机设备 |
CN110543968A (zh) * | 2019-07-30 | 2019-12-06 | 北京三快在线科技有限公司 | 预计送达时间确定方法、装置、电子设备及存储介质 |
Non-Patent Citations (4)
Title |
---|
LUCA URCIUOLI: "An algorithm for improved ETAs estimations and potential impacts on supply chain decision making", PROCEDIA MANUFACTURING, vol. 25, pages 185 - 193 * |
叶创鑫;谭满春;: "基于SVM与人工神经网络组合模型的物流规划车辆行程时间预测", 暨南大学学报(自然科学与医学版), no. 05 * |
孙文鹤;胡文;: "连锁超市CRM物流配送系统中预测模型研究", 哈尔滨商业大学学报(自然科学版), no. 06 * |
张晶;: "基于AdaBoost回归树的多目标预测算法", 计算机与现代化, no. 09 * |
Also Published As
Publication number | Publication date |
---|---|
CN113313439B (zh) | 2024-04-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10204374B1 (en) | Parallel fraud check | |
KR20180013843A (ko) | 오더 할당 시스템 및 방법 | |
US20120226647A1 (en) | Flight itinerary delay estimation | |
CN110738436B (zh) | 一种确定可用库存的方法和装置 | |
US20170277776A9 (en) | System and method for reception, analysis and dissemination of user feedback | |
CN111898784A (zh) | 用于车辆租赁预订的方法、电子设备和存储介质 | |
CN109684624A (zh) | 一种自动识别订单地址路区的方法和装置 | |
CN110766184A (zh) | 订单量预测方法和装置 | |
CN113259144A (zh) | 一种仓储网络规划方法和装置 | |
CN110858347A (zh) | 一种用于物流配送分单的方法和装置 | |
WO2023124363A1 (zh) | 库存的确定方法和装置 | |
CN110753041A (zh) | 基于cdn系统的源站状态检测方法以及设备 | |
CN111044062B (zh) | 路径规划、推荐方法和装置 | |
CN110738508A (zh) | 一种数据分析方法和装置 | |
US11397906B1 (en) | Predicting demand for route generation | |
KR20170034776A (ko) | 실시간 택배 접수 시스템 및 방법 | |
CN109902847A (zh) | 预测分库订单量的方法和装置 | |
CN113313439A (zh) | 一种计算妥投时长的方法和装置 | |
CN114706862B (zh) | 酒店房态预测方法、装置、设备及存储介质 | |
CN113537680B (zh) | 一种确定运输任务的完成时间的方法及装置 | |
CN114418482A (zh) | 订单信息处理方法、装置、电子设备和计算机可读介质 | |
CN114257521A (zh) | 流量预测方法、装置、电子设备和存储介质 | |
CN113743849B (zh) | 一种物流任务运输方法和装置 | |
CN113822609A (zh) | 物流线路的生成方法、装置以及服务器 | |
CN112073454B (zh) | 资源分发方法、装置、电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |