CN109063935A - 一种预测任务处理时间的方法、装置及存储介质 - Google Patents

一种预测任务处理时间的方法、装置及存储介质 Download PDF

Info

Publication number
CN109063935A
CN109063935A CN201811132628.1A CN201811132628A CN109063935A CN 109063935 A CN109063935 A CN 109063935A CN 201811132628 A CN201811132628 A CN 201811132628A CN 109063935 A CN109063935 A CN 109063935A
Authority
CN
China
Prior art keywords
task
processing time
tag
training
tree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811132628.1A
Other languages
English (en)
Other versions
CN109063935B (zh
Inventor
雷德龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201811132628.1A priority Critical patent/CN109063935B/zh
Publication of CN109063935A publication Critical patent/CN109063935A/zh
Application granted granted Critical
Publication of CN109063935B publication Critical patent/CN109063935B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063116Schedule adjustment for a person or group

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供一种预测任务处理时间的方法、装置及存储介质,方法包括:提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务;将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。本申请由于基于同一回归模型同时预测出多个任务的处理时间,可以保证同一订单的多个任务的处理时间之间的先后顺序,提高预测任务处理时间的准确性,有利于订单处理方合理安排任务执行时间,并可以提升用户体验。

Description

一种预测任务处理时间的方法、装置及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种预测任务处理时间的方法、装置及存储介质。
背景技术
目前涉及线下运送的业务(如,外卖业务、快递业务或打车业务等)中,每个订单处理过程通常会分为多个阶段性任务。例如,外卖业务或快递业务的订单处理过程会分为用户下单、卖家提供货物、配送员取货以及货物送达等任务;又如,打车业务的订单处理过程会分为用户下单、司机到达上车点、乘客上车、乘客送到等任务。
以外卖业务为例,为了方便配送员合理安排时间,提升配送效率,以及提升用户体验,服务端通常会在用户下单后,预测其中几个关键任务的处理时间(如,取餐时间和货物送达时间等),并分别向配送员和用户进行发送。
然而现有技术中通常采用多种预设的方法,对同一订单的多个任务的处理时间进行分别预测,无法保证同一订单的多个任务的先后顺序,导致预测任务处理时间的准确性较低,导致订单处理方(如、配送员或餐厅服务员等)无法合理安排时间,影响订单配送效率,进而会影响用户体验。
发明内容
有鉴于此,本申请提供一种预测任务处理时间的方法、装置及存储介质,可以解决现有技术中的问题。
具体地,本申请是通过如下技术方案实现的:
根据本申请的第一方面,提出了一种预测任务处理时间的方法,包括:
提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务;
将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
在一实施例中,所述多标签回归模型包括多标签随机森林回归模型;
所述方法还包括根据以下步骤训练多标签随机森林回归模型:
确定所述每个任务的处理时间对应的标签权重;
基于所述标签权重训练多个多标签最小二乘树模型;
基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型。
在一实施例中,所述基于所述标签权重训练多个多标签最小二乘树模型,包括:
获取多个历史样本订单信息,每个所述历史样本订单信息的处理过程中均包含多个任务;
提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值;
提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间;
将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型。
在一实施例中,所述将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型,包括:
根据所述标签权重构造最优切分变量与切分点的求解公式;
基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件;
根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型。
在一实施例中,所述将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间,包括:
将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果,所述初始预测结果中包括所述多个任务中每个任务的处理时间;
对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果。
在一实施例中,所述方法还包括:
将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端;和/或,
将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
根据本申请的第二方面,提出了一种预测任务处理时间的装置,包括:
目标特征提取模块,用于提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务;
处理时间预测模块,用于将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
在一实施例中,所述多标签回归模型包括多标签随机森林回归模型;
所述装置还包括随机森林训练模块;
所述随机森林训练模块包括:
标签权重确定单元,用于确定所述每个任务的处理时间对应的标签权重;
二乘树训练单元,用于基于所述标签权重训练多个多标签最小二乘树模型;
随机森林训练单元,用于基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型。
在一实施例中,所述二乘树训练单元,还用于:
获取多个历史样本订单信息,每个所述历史样本订单信息的处理过程中均包含多个任务;
提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值;
提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间;
将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型。
在一实施例中,所述二乘树训练单元,还用于:
根据所述标签权重构造最优切分变量与切分点的求解公式;
基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件;
根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型。
在一实施例中,所述处理时间预测模块,包括:
初始结果确定单元,用于将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果,所述初始预测结果中包括所述多个任务中每个任务的处理时间;
最终结果确定单元,用于对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果。
在一实施例中,所述装置还包括:处理时间发送模块;
所述处理时间发送模块,包括:
第一时间发送单元,用于发送将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端;和/或,
第二时间发送单元,用于将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
根据本申请的第三方面,提出了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一所述的预测任务处理时间的方法。
本申请通过对接收的处理过程中包含多个任务的订单信息进行特征提取,得到目标特征值,并将所述目标特征值输入预先训练的多标签回归模型中,得到多个任务中每个任务的预测处理时间,可以准确地确定多个任务中每个任务的预测处理时间,由于基于同一回归模型同时预测出多个任务的处理时间,可以保证同一订单的多个任务的处理时间之间的先后顺序,提高预测任务处理时间的准确性,有利于订单配送方合理安排任务执行的时间,并可以提升用户体验。
附图说明
图1是本申请一示例性实施例示出的一种预测任务处理时间的方法的流程图;
图2是本申请又一示例性实施例示出的一种预测任务处理时间的方法的流程图;
图3是本申请一示例性实施例示出的如何基于所述标签权重训练多个多标签最小二乘树模型的流程图;
图4是本申请一示例性实施例示出的如何基于所述标签权重训练每个多标签最小二乘树模型;
图5是本申请一示例性实施例示出的如何得到所述多个任务中每个任务的预测处理时间的流程图;
图6是本申请又一示例性实施例示出的一种预测任务处理时间的方法的流程图;
图7是本申请一示例性实施例示出的一种预测任务处理时间的装置的结构框图;
图8是本申请又一示例性实施例示出的一种预测任务处理时间的装置的结构框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
图1是本申请一示例性实施例示出的一种预测任务处理时间的方法的流程图;该实施例可以用于服务端(例如,一台服务器和多台服务器组成的服务器集群等)。如图1所示,该方法包括步骤S101-S102:
在步骤S101中,提取订单信息的目标特征值。
其中,所述订单信息的处理过程分为多个阶段性任务。
在一实施例中,上述订单可以为涉及线下运送业务(如,外卖业务、快递业务或打车业务等)的订单。其中,每个订单处理过程中可以包含多个任务:如外卖业务或快递业务的订单处理过程中会包含用户下单、卖家提供货物、配送员取货以及货物送达等;又如打车业务的订单处理过程中会包含用户下单、司机到达上车点、乘客上车、乘客送到等。
在一实施例中,用户可以通过智能手机、平板电脑和台式笔记本等终端设备上安装的客户端生成订单信息,并将订单信息发送给服务端。进而,当服务端接收到该订单信息后,可以对该订单信息进行特征提取,得到目标特征值。
在一实施例中,可以对所述订单信息提取一种特征,或者同时提取多种特征(与回归模型训练过程中提取的特征种类相对应),以充分全面地表现出该订单信息处理过程中包含的多个任务的特点。
值得说明的是,在实际实施中,上述提取的特征可以为既能很好地突出该订单信息的特点,又能表现出与同一业务内的其他订单信息的区别与联系的特征,以增强特征辨识度。
仍以外卖业务为例,所提取的特征可以包括配送距离、配送城市ID、配送员评价到达餐厅时间、当前未取餐单量(运单数量)、餐盒费总价等,本实施例对此不进行限定。
在步骤S102中,将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
在一实施例中,当提取订单信息的目标特征值后,可以将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
其中,所述多标签回归模型中的多标签分别对应于多个任务中每个任务的处理时间,即所述多标签中每个标签对应于一不同任务的处理时间。
在一实施例中,上述多标签回归模型可以基于输入的目标特征同时计算并输出多个任务中每个任务的处理时间。
在一实施例中,可以根据大量的历史样本订单信息进行特征提取,以根据提取的样本特征训练多标签回归模型,进而可以将上述目标特征值输入该训练好的多标签回归模型汇中,得到所述多个任务中每个任务的预测处理时间。
在一实施例中,上述多标签回归模型的训练方式还可以参见下述图2所示实施例,在此先不进行详述。
由上述描述可知,本实施例通过对接收的处理过程中包含多个任务的订单信息进行特征提取,得到目标特征值,并将所述目标特征值输入预先训练的多标签回归模型中,得到多个任务中每个任务的预测处理时间,可以准确地确定多个任务中每个任务的预测处理时间,由于基于同一回归模型同时预测出多个任务的处理时间,可以保证同一订单的多个任务的处理时间之间的先后顺序,提高预测任务处理时间的准确性,有利于订单配送方合理安排任务执行的时间,并可以提升用户体验。
图2是本申请又一示例性实施例示出的一种预测任务处理时间的方法的流程图;该实施例可以用于服务端(例如,一台服务器和多台服务器组成的服务器集群等)。
本实施例中,多标签回归模型可以包括多标签随机森林回归模型。在此基础上,如图2所示,该方法可以包括步骤S201-S205:
在步骤S201中,确定多个任务中每个任务的处理时间对应的标签权重。
在一实施例中,上述多个任务可以为当前业务的订单信息的处理过程中包含的任务。
在一实施例中,可以由开发人员根据实际业务需要设置上述标签权重。仍以外卖业务为例,若当前预测的多个业务的处理时间为配送员取货时间及货物送达时间,且二者中更偏重于配送员取货时间的预测准确率,则可以令配送员取货时间对应的标签权重大于货物送达时间对应的标签权重,例如,可以将配送员取货时间对应的标签权重设置为0.6,而将货物送达时间对应的标签权重设置为0.4。
值得说明的是,在实际实施中,上述标签权重的数值可以由开发人员根据业务需要进行自由设置,本实施例对此不进行限定。
在步骤S202中,基于所述标签权重训练多个多标签最小二乘树模型。
在一实施例中,当确定多个任务中每个任务的处理时间对应的标签权重后,可以将各个标签权重带入用于决策树训练公式,生成决策树(即,最小二乘树)模型。
在一实施例中,可以重复上述方式训练出多个多标签最小二乘树模型。
在一实施例中,基于标签权重训练最小二乘树模型的方式还可以参见下述图3所示实施例,在此先不进行详述。
在步骤S203中,基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型。
在一实施例中,当基于所述标签权重训练多个多标签最小二乘树模型后,可以根据训练好的多个多标签最小二乘树模型生成多标签随机森林回归模型。
举例来说,可以对多个多标签最小二乘树模型进行组合,形成多标签随机森林回归模型。
在一实施例中,基于训练的多标签随机森林回归模型得到所述多个任务中每个任务的预测处理时间的方式可以参见下述图5所示实施例,在此先不进行详述。
在步骤S204中,提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务。
在步骤S205中,将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间,所述多标签中每个标签对应于一不同任务的处理时间。
其中,步骤S204-S205的相关解释和说明可以参见上述实施例,在此不进行赘述。
由上述描述可知,本实施例通过确定所述每个任务的处理时间对应的标签权重,并基于所述标签权重训练多个多标签最小二乘树模型,进而基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型,可以后续基于多标签随机森林回归模型预测各个任务的处理时间的针对性,使预测结果更符合业务需要。
图3是本申请一示例性实施例示出的如何基于所述标签权重训练多个多标签最小二乘树模型的流程图;本实施例在上述实施例的基础上,以如何基于所述标签权重训练多个多标签最小二乘树模型为例进行示例性说明。如图3所示,上述步骤S202中所述基于所述标签权重训练多个多标签最小二乘树模型,可以包括以下步骤S301-S304:
在步骤S301中,获取多个历史样本订单信息,每个所述历史样本订单信息的处理过程中均包含多个任务。
在一实施例中,服务端可以从业务平台的历史数据中获取多个历史样本订单信息,其中,每个所述历史样本订单信息的处理过程中均包含多个任务。
值得说明的是,订单信息的处理过程中均包含多个任务的解释和说明可以参见上述实施例,在此不进行赘述。
在步骤S302中,提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值。
在一实施例中,当获取多个历史样本订单信息后,可以提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值。
在一实施例中,可以对每个所述历史样本订单信息提取一种样本特征,或者同时提取多种样本特征(与回归模型应用过程中提取的特征种类相对应),以充分全面地表现出该历史样本订单信息处理过程中包含的多个任务的特点。
值得说明的是,在实际实施中,上述提取的特征可以为既能很好地突出该历史样本订单信息的特点,又能表现出与同一业务内的其他历史样本订单信息的区别与联系的样本特征,以增强样本特征辨识度。
仍以外卖业务为例,所提取的样本特征可以包括配送距离、配送城市ID、配送员评价到达餐厅时间、当前未取餐单量(运单数量)、餐盒费总价等,本实施例对此不进行限定。
在步骤S303中,提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间。
在一实施中,当提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值后,可以从历史数据中获取每个历史样本订单信息对应的多个任务中每个任务的处理时间。
在一实施例中,当获取每个历史样本订单信息对应的多个任务中每个任务的处理时间后,可以根据每个历史样本订单信息对应的各个任务的处理时间对每个样本目标特征值进行提取。
在步骤S304中,将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型。
在一实施例中,当提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间后,可以将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,并基于上述确定的标签权重训练每个多标签最小二乘树模型。
在一实施例中,基于上述训练集以及所述标签权重训练每个多标签最小二乘树模型的方式还可以参见下述图4所示实施例,在此先不进行详述。
由上述描述可知,本实施例通过获取多个历史样本订单信息,并提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值,然后提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间,进而将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型,可以实现基于标签权重训练多个多标签最小二乘树模型,为后续基于多个多标签最小二乘树模型生成多标签随机森林回归模型,以及基于多标签随机森林回归模型预测多个任务中每个任务的处理时间奠定基础。
图4是本申请一示例性实施例示出的如何基于所述标签权重训练每个多标签最小二乘树模型;本实施例在上述实施例的基础上,以如何基于所述标签权重训练多个多标签最小二乘树模型为例进行示例性说明。如图3所示,上述步骤S304中所述将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型,可以包括以下步骤S401-S403:
在步骤S401中,根据所述标签权重构造最优切分变量与切分点的求解公式。
在一实施例中,当确定多个任务中每个任务的处理时间对应的标签权重后,可以根据所述标签权重构造最优切分变量与切分点的求解公式,如下式(1)所示:
其中,j为最优切分变量,s为切分点,c1为xi∈R1(j,s)时最小二乘树模型的输出值,c2为xi∈R2(j,s)时最小二乘树模型的输出值,αk为第k个任务的处理时间对应的标签权重,K为任务的个数,x(j)为第j个变量,为cm的最优值,cm为训练集所在的输入空间中划分的第m个区域的输出值。
在步骤S402中,基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件。
在一实施例中,当根据所述标签权重构造最优切分变量与切分点的求解公式后,可以基于上述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件。
在一实施例中,可以遍历变量j,对固定的切分变量j扫描切分点s,选择使式(1)达到最小值的对(j,s)。
在此基础上,可以用选定的对(j,s)划分上述输入空间的区域,并决定各个区域对应的输出值(即,任务的处理时间)的最优值,如下式(2)、(3)所示:
R1(j,s)={x|x(j)≤s},R2(j,s)={x|x(j)>s}, (2)
其中,Nm为输入变量的个数,R1(j,s)和R2(j,s)为划分的区域,为第m个区域对应的输出值的最优值。
在一实施例中,可以继续对得到的每个区域进行区域划分,直至满足预设的停止条件。
值得说明的是,上述基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分的方式可以参见相关技术中的解释和说明,本实施例对此不进行限定。
在一实施例中,上述预设的停止条件可以由开发人员根据实际业务需要进行设置,如设置为划分的相邻两个区域对应的输出值的差值小于预设阈值等,本实施例对此不进行限定。
在步骤S403中,根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型。
在一实施例中,当将输入空间划分为M个区域R1,R2,...,RM后,可以根据该划分结果以及对应的输出值(即,任务的处理时间)生成所述多标签最小二乘树模型,如下所示:
其中,f(x)为最小二乘树模型的输出,M为输入空间的区域数量,为第m个区域对应的输出值的最优值,I=1或0(当x∈Rm时,I=1,否则,I=0)。
由上述描述可知,本实施例通过根据所述标签权重构造最优切分变量与切分点的求解公式,并基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件,进而根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型,可以实现准确地基于标签权重训练每个多标签最小二乘树模型,进而可以为后续基于多个多标签最小二乘树模型生成多标签随机森林回归模型,以及基于多标签随机森林回归模型预测多个任务中每个任务的处理时间奠定基础。
图5是本申请一示例性实施例示出的如何得到所述多个任务中每个任务的预测处理时间的流程图;本实施例在上述实施例的基础上,以如何得到所述多个任务中每个任务的预测处理时间为例进行示例性说明。如图5所示,步骤S102中所述将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间,可以包括以下步骤S501-S502:
在步骤S501中,将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果。
其中,所述初始预测结果中包括所述多个任务中每个任务的处理时间。
在一实施例中,当提取订单信息的目标特征值后,可以将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果。
举例来说,若当前的多标签随机森林回归模型是由E个多标签最小二乘树模型组成的,则当将所述目标特征值输入该E个多标签最小二乘树模型中后,可以得到E个多标签最小二乘树模型的初始预测结果,如以下数组所示:
其中,E为最小二乘树模型的数量,k为标签的数量(即,订单信息的处理过程中包含的任务的数量),fEk为第E个最小二乘树模型对第k个任务的预测处理时间。
在步骤S502中,对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果。
在一实施例中,当得到每个所述多标签最小二乘树模型的初始预测结果后,可以对得到的各个初始预测结果进行求平均值,即对各个初始预测结果中的对应任务的处理时间求均值,进而得到所述多个任务中每个任务的处理时间的最终预测结果。
仍以步骤S501中的数组为例,对得到的各个初始预测结果进行求平均值,即可得到以下最终预测结果:
由上述描述可知,本实施例通过将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果,所述初始预测结果中包括所述多个任务中每个任务的处理时间,进而对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果,可以准确地确定多个任务中每个任务的预测处理时间,由于基于同一回归模型同时预测出多个任务的处理时间,可以保证同一订单的多个任务的处理时间之间的先后顺序,提高预测任务处理时间的准确性,有利于订单配送方合理安排任务执行的时间,并可以提升用户体验。
图6是本申请又一示例性实施例示出的一种预测任务处理时间的方法的流程图;该实施例可以用于服务端(例如,一台服务器和多台服务器组成的服务器集群等)。如图6所示,该方法包括步骤S601-S604:
在步骤S601中,提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务。
在步骤S602中,将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间,所述多标签中每个标签对应于一不同任务的处理时间。
其中,步骤S601-S602的相关解释和说明可以参见上述实施例,在此不进行赘述。
在步骤S603中,将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端。
在步骤S604中,将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
在一实施例中,当得到所述多个任务中每个任务的预测处理时间后,可以确定上述多个任务中与订单处理方关联的任务,以及,与订单下发方关联的任务。
在一实施例中,若当前业务为外卖业务,则上述订单处理方可以包括配送员或餐厅服务员等;而订单下发方可以为在终端设备上订外卖的用户。
同理,若当前业务为打车业务,则上述订单处理方可以包括司机等;而订单下发方可以为在终端设备上打车的用户。
在一实施例中,当确定上述多个任务中与订单处理方关联的任务,以及,与订单下发方关联的任务后,可以将与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端,并且,可以将与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
值得说明的是,上述各个任务的处理时间发送给订单处理方或订单下发方的客户端的方式可以参见现有技术,本实施例对此不进行限定。
由上述描述可知,本实施例通过将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端;和/或,将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端,有助于订单处理方合理地单排订单的处理时间,提高订单的处理效率,进而可以提升用户体验。
图7是本申请一示例性实施例示出的一种预测任务处理时间的装置的结构框图;如图7所示,该装置包括:目标特征提取模块110以及处理时间预测模块120,其中:
目标特征提取模块110,用于提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务;
处理时间预测模块120,用于将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
由上述描述可知,本实施例通过对接收的处理过程中包含多个任务的订单信息进行特征提取,得到目标特征值,并将所述目标特征值输入预先训练的多标签回归模型中,得到多个任务中每个任务的预测处理时间,可以准确地确定多个任务中每个任务的预测处理时间,由于基于同一回归模型同时预测出多个任务的处理时间,可以保证同一订单的多个任务的处理时间之间的先后顺序,提高预测任务处理时间的准确性,有利于订单配送方合理安排任务执行的时间,并可以提升用户体验。
图8是本申请又一示例性实施例示出的一种预测任务处理时间的装置的结构框图。其中,目标特征提取模块210以及处理时间预测模块220与前述图7所示实施例中的目标特征提取模块110以及处理时间预测模块120的功能相同,在此不进行赘述。如图8所示,所述多标签回归模型包括多标签随机森林回归模型;
所述装置还包括:随机森林训练模块230;
所述随机森林训练模块230可以包括:
标签权重确定单元231,用于确定所述每个任务的处理时间对应的标签权重;
二乘树训练单元232,用于基于所述标签权重训练多个多标签最小二乘树模型;
随机森林训练单元233,用于基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型。
在一实施例中,二乘树训练单元232,还可以用于:
获取多个历史样本订单信息,每个所述历史样本订单信息的处理过程中均包含多个任务;
提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值;
提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间;
将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型。
在一实施例中,二乘树训练单元232,还可以用于:
根据所述标签权重构造最优切分变量与切分点的求解公式;
基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件;
根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型。
在一实施例中,处理时间预测模块220,可以包括:
初始结果确定单元221,用于将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果,所述初始预测结果中包括所述多个任务中每个任务的处理时间;
最终结果确定单元222,用于对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果。
在一实施例中,所述装置还包括:处理时间发送模块240;
所述处理时间发送模块240,可以包括:
第一时间发送单元241,用于发送将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端;和/或,
第二时间发送单元242,用于将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
值得说明的是,上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
另一方面,本申请还提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序用于执行上述图1~图6所示实施例提供的预测任务处理时间的方法。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (13)

1.一种预测任务处理时间的方法,其特征在于,包括:
提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务;
将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
2.根据权利要求1所述的方法,其特征在于,所述多标签回归模型包括多标签随机森林回归模型;
所述方法还包括根据以下步骤训练多标签随机森林回归模型:
确定所述每个任务的处理时间对应的标签权重;
基于所述标签权重训练多个多标签最小二乘树模型;
基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型。
3.根据权利要求2所述的方法,其特征在于,所述基于所述标签权重训练多个多标签最小二乘树模型,包括:
获取多个历史样本订单信息,每个所述历史样本订单信息的处理过程中均包含多个任务;
提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值;
提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间;
将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型。
4.根据权利要求3所述的方法,其特征在于,所述将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型,包括:
根据所述标签权重构造最优切分变量与切分点的求解公式;
基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件;
根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型。
5.根据权利要求2所述的方法,其特征在于,所述将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间,包括:
将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果,所述初始预测结果中包括所述多个任务中每个任务的处理时间;
对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端;和/或,
将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
7.一种预测任务处理时间的装置,其特征在于,包括:
目标特征提取模块,用于提取订单信息的目标特征值,所述订单信息的处理过程分为多个阶段性任务;
处理时间预测模块,用于将所述目标特征值输入预先训练的多标签回归模型中,得到所述多个任务中每个任务的预测处理时间。
8.根据权利要求7所述的装置,其特征在于,所述多标签回归模型包括多标签随机森林回归模型;
所述装置还包括随机森林训练模块;
所述随机森林训练模块包括:
标签权重确定单元,用于确定所述每个任务的处理时间对应的标签权重;
二乘树训练单元,用于基于所述标签权重训练多个多标签最小二乘树模型;
随机森林训练单元,用于基于训练的多个多标签最小二乘树模型生成多标签随机森林回归模型。
9.根据权利要求8所述的装置,其特征在于,所述二乘树训练单元,还用于:
获取多个历史样本订单信息,每个所述历史样本订单信息的处理过程中均包含多个任务;
提取所述多个历史样本订单信息中每个历史样本订单信息的样本目标特征值,得到多个样本目标特征值;
提取每个所述样本目标特征值对应的、多个任务中每个任务的处理时间;
将所述多个样本目标特征值和对应的多个任务中每个任务的处理时间作为训练集,基于所述标签权重训练每个多标签最小二乘树模型。
10.根据权利要求9所述的装置,其特征在于,所述二乘树训练单元,还用于:
根据所述标签权重构造最优切分变量与切分点的求解公式;
基于所述求解公式,对所述训练集所在的输入空间进行递归性的区域划分,并确定各个所述区域对应的所述处理时间,直至满足预设的停止条件;
根据所述输入空间的划分结果以及对应的所述处理时间生成所述多标签最小二乘树模型。
11.根据权利要求8所述的装置,其特征在于,所述处理时间预测模块,包括:
初始结果确定单元,用于将所述目标特征值输入预先训练的多个多标签最小二乘树模型中,得到每个所述多标签最小二乘树模型的初始预测结果,所述初始预测结果中包括所述多个任务中每个任务的处理时间;
最终结果确定单元,用于对所述初始预测结果进行求平均值处理,得到所述多个任务中每个任务的处理时间的最终预测结果。
12.根据权利要求7-11任一项所述的装置,其特征在于,所述装置还包括:处理时间发送模块;
所述处理时间发送模块,包括:
第一时间发送单元,用于发送将所述多个任务中与订单处理方关联的任务的处理时间发送至所述订单处理方的客户端;和/或,
第二时间发送单元,用于将所述多个任务中与订单下发方关联的任务的处理时间发送至所述订单下发方的客户端。
13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-6任一所述的预测任务处理时间的方法。
CN201811132628.1A 2018-09-27 2018-09-27 一种预测任务处理时间的方法、装置及存储介质 Active CN109063935B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811132628.1A CN109063935B (zh) 2018-09-27 2018-09-27 一种预测任务处理时间的方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811132628.1A CN109063935B (zh) 2018-09-27 2018-09-27 一种预测任务处理时间的方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN109063935A true CN109063935A (zh) 2018-12-21
CN109063935B CN109063935B (zh) 2020-11-03

Family

ID=64766129

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811132628.1A Active CN109063935B (zh) 2018-09-27 2018-09-27 一种预测任务处理时间的方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN109063935B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109801400A (zh) * 2018-12-29 2019-05-24 天津五八到家科技有限公司 行车数据处理方法、设备及存储介质
CN109816442A (zh) * 2019-01-16 2019-05-28 四川驹马科技有限公司 一种基于特征标签的多维度运费预测方法及其系统
CN110472910A (zh) * 2019-07-22 2019-11-19 北京三快在线科技有限公司 确定目标配送任务节点的方法、装置及存储介质、电子设备
CN111241159A (zh) * 2020-01-08 2020-06-05 山东汇贸电子口岸有限公司 确定任务执行时间的方法及装置
CN111612197A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 一种安全事件订单的检测方法、装置和电子设备
CN109063935B (zh) * 2018-09-27 2020-11-03 北京三快在线科技有限公司 一种预测任务处理时间的方法、装置及存储介质
CN113313439A (zh) * 2020-02-26 2021-08-27 北京京东振世信息技术有限公司 一种计算妥投时长的方法和装置
CN113436003A (zh) * 2021-06-29 2021-09-24 中国工商银行股份有限公司 时长确定方法、装置、电子设备、介质和程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108345958A (zh) * 2018-01-10 2018-07-31 拉扎斯网络科技(上海)有限公司 一种订单出餐时间预测模型构建、预测方法、模型和装置
CN108364085A (zh) * 2018-01-02 2018-08-03 拉扎斯网络科技(上海)有限公司 一种外卖配送时间预测方法和装置
CN108491951A (zh) * 2018-01-25 2018-09-04 北京三快在线科技有限公司 一种外卖配送时间的预测方法、装置及电子设备
US20190073611A1 (en) * 2017-09-07 2019-03-07 International Business Machines Corporation Real-time cognitive supply chain optimization

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063935B (zh) * 2018-09-27 2020-11-03 北京三快在线科技有限公司 一种预测任务处理时间的方法、装置及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190073611A1 (en) * 2017-09-07 2019-03-07 International Business Machines Corporation Real-time cognitive supply chain optimization
CN108364085A (zh) * 2018-01-02 2018-08-03 拉扎斯网络科技(上海)有限公司 一种外卖配送时间预测方法和装置
CN108345958A (zh) * 2018-01-10 2018-07-31 拉扎斯网络科技(上海)有限公司 一种订单出餐时间预测模型构建、预测方法、模型和装置
CN108491951A (zh) * 2018-01-25 2018-09-04 北京三快在线科技有限公司 一种外卖配送时间的预测方法、装置及电子设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
任钱德: "基于偏最小二乘回归的多标签分类算法研究", 《浙江师范大学硕士学位论文》 *
林世杭: "基于层次化随机森林的多标签分类算法研究", 《华南理工大学硕士学位论文》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109063935B (zh) * 2018-09-27 2020-11-03 北京三快在线科技有限公司 一种预测任务处理时间的方法、装置及存储介质
CN109801400A (zh) * 2018-12-29 2019-05-24 天津五八到家科技有限公司 行车数据处理方法、设备及存储介质
CN109816442A (zh) * 2019-01-16 2019-05-28 四川驹马科技有限公司 一种基于特征标签的多维度运费预测方法及其系统
CN111612197A (zh) * 2019-02-25 2020-09-01 北京嘀嘀无限科技发展有限公司 一种安全事件订单的检测方法、装置和电子设备
CN110472910A (zh) * 2019-07-22 2019-11-19 北京三快在线科技有限公司 确定目标配送任务节点的方法、装置及存储介质、电子设备
CN111241159A (zh) * 2020-01-08 2020-06-05 山东汇贸电子口岸有限公司 确定任务执行时间的方法及装置
CN111241159B (zh) * 2020-01-08 2023-07-07 山东汇贸电子口岸有限公司 确定任务执行时间的方法及装置
CN113313439A (zh) * 2020-02-26 2021-08-27 北京京东振世信息技术有限公司 一种计算妥投时长的方法和装置
CN113313439B (zh) * 2020-02-26 2024-04-05 北京京东振世信息技术有限公司 一种计算妥投时长的方法和装置
CN113436003A (zh) * 2021-06-29 2021-09-24 中国工商银行股份有限公司 时长确定方法、装置、电子设备、介质和程序产品

Also Published As

Publication number Publication date
CN109063935B (zh) 2020-11-03

Similar Documents

Publication Publication Date Title
CN109063935A (zh) 一种预测任务处理时间的方法、装置及存储介质
CN104731895B (zh) 自动应答的方法和装置
CN106296059B (zh) 派送网点确定方法及设备
WO2019037202A1 (zh) 目标客户的识别方法、装置、电子设备及介质
CN109772714A (zh) 货物拣选方法及装置、存储介质、电子设备
CN107767259A (zh) 贷款风险控制方法、电子装置及可读存储介质
CN105468742A (zh) 恶意订单识别方法及装置
CN109388675A (zh) 数据分析方法、装置、计算机设备及存储介质
CN108280091B (zh) 一种任务请求执行方法和装置
US11334758B2 (en) Method and apparatus of data processing using multiple types of non-linear combination processing
CN108876545A (zh) 订单识别方法、装置和可读存储介质
CN115130711A (zh) 一种数据处理方法、装置、计算机及可读存储介质
CN112487794A (zh) 行业分类方法、装置、终端设备及存储介质
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN114638391A (zh) 运单风险场景识别处理方法、装置、计算机设备和介质
US20190042995A1 (en) Automated Item Assortment System
US11587094B2 (en) Customer service ticket evaluation using multiple time-based machine learning models customer
CN110619400A (zh) 用于生成订单信息的方法和装置
CN108335008A (zh) 网络信息处理方法和装置、存储介质及电子装置
CN111832782A (zh) 确定物品物流属性的方法和装置
CN112783468A (zh) 目标对象的排序方法和排序装置
CN107077475A (zh) 根据产品/用户标签和共安装图推荐产品捆绑包的系统和方法
CN111105176A (zh) 数据处理方法、装置、设备和存储介质
CN115392361A (zh) 一种智能排序方法、装置、计算机设备及存储介质
CN113822477A (zh) 快件拦截处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant