CN112686418A - 一种履约时效预测方法和装置 - Google Patents

一种履约时效预测方法和装置 Download PDF

Info

Publication number
CN112686418A
CN112686418A CN201910994721.1A CN201910994721A CN112686418A CN 112686418 A CN112686418 A CN 112686418A CN 201910994721 A CN201910994721 A CN 201910994721A CN 112686418 A CN112686418 A CN 112686418A
Authority
CN
China
Prior art keywords
time
data
decision tree
performance
fulfillment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910994721.1A
Other languages
English (en)
Inventor
孟雨生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Zhenshi Information Technology Co Ltd
Original Assignee
Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Zhenshi Information Technology Co Ltd filed Critical Beijing Jingdong Zhenshi Information Technology Co Ltd
Priority to CN201910994721.1A priority Critical patent/CN112686418A/zh
Publication of CN112686418A publication Critical patent/CN112686418A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种履约时效预测方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取实时履约数据,实时履约数据包括实时结束履约流程的业务数据和所述业务数据在所述履约流程各时间节点的实际履约时效;从业务数据中提取各时间节点对应的特征条件集;利用各时间节点对应的特征条件集和实际履约时效,构造各时间节点对应的决策树模型;根据各时间节点对应的决策树模型预测新生成业务数据的履约时效。该实施方式能够减少业务员在时效调整时的复杂手工操作,节省人力和时间成本,可以实时并精准地预测履约时效,并且可以对未能及时调整的业务方案进行预警,提高运营效率,改善用户体验,且计算量可以满足实际需求。

Description

一种履约时效预测方法和装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种履约时效预测方法和装置。
背景技术
现有物流系统提供了时效(计算商品从仓库或分拣中心到达用户所需要的时间,包含每个分拣中心和站点的时间点)计算的逻辑,包含仓库的配置、路由配置、本地配送的配置等。随着仓库、分拣中心(货物分拣场所)、站点(商品最终发送到用户附近的统一场所称为站点,派送员从站点取货并送达客户)的不断增加,配置量非常巨大,调整不同的配置可能造成其他路线的时效异常,影响用户体验,导致大量用户投诉。对其他系统的业务调整,需要业务员手动调整履约的配置,目前出现大量的误配置、漏配置的情况,造成计算出的履约时效异常。因此,上述方案人工操作的工作量大,在调整履约时效的工作较多时耗时也较大,并且在预测履约时效时容易出现误配置和/或漏配置,从而导致时效异常。虽然也有一些企业依据大数据的搜索结果进行预测时效,但是需要预先筛选结果,需要计算的数据需要第二天才能获取到(即T+1规则),无法满足实时性要求,且计算量巨大,无法满足实际需求。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
现有方案在时效调整时需要较大的人工操作量,时间成本高,且易出现误配置和/或漏配置而导致时效异常,也无法对未能及时调整的业务方案进行预警,用户体验差,且计算量巨大。
发明内容
有鉴于此,本发明实施例提供一种履约时效预测方法和装置,能够减少业务员在时效调整时的复杂手工操作,节省人力和时间成本,可以实时并精准地预测履约时效,并且可以对未能及时调整的业务方案进行预警,提高运营效率,改善用户体验,且计算量可以满足实际需求。
为实现上述目的,根据本发明实施例的一个方面,提供了一种履约时效预测方法。
一种履约时效预测方法,包括:获取实时履约数据,所述实时履约数据包括实时结束履约流程的业务数据和所述业务数据在所述履约流程各时间节点的实际履约时效;从所述业务数据中提取所述各时间节点对应的特征条件集;利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型;根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效。
可选地,通过分布式集群构造所述各时间节点对应的决策树模型。
可选地,利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型的步骤,包括:在当前存在各时间节点对应的已有决策树模型的情况下,利用各时间节点对应的所述特征条件集和所述实际履约时效,更新各已有决策树模型,以得到所述各时间节点对应的决策树模型,其中,所述更新包括:计算各特征条件集中每一特征条件的信息增益或信息增益比,以及对所述各已有决策树模型进行剪裁。
可选地,根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效的步骤之后,包括:将预测得到的所述新生成业务数据的履约时效,与由所述各时间节点对应的配置信息确定出的履约时效进行比对,以得到差异数据;在所述差异数据大于或等于预设阈值时输出报警消息。
可选地,根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效的步骤之前,包括:在无法获取到所述获取实时履约数据的情况下,获取已存履约数据,所述已存履约数据包括:由所述各时间节点对应的配置信息确定出的履约时效和对应的已存业务数据;利用所述已存履约数据构造所述各时间节点对应的决策树模型。
根据本发明实施例的另一方面,提供了一种履约时效预测装置。
一种履约时效预测装置,包括:履约数据获取模块,用于获取实时履约数据,所述实时履约数据包括实时结束履约流程的业务数据和所述业务数据在所述履约流程各时间节点的实际履约时效;特征条件提取模块,用于从所述业务数据中提取所述各时间节点对应的特征条件集;模型构造模块,用于利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型;履约时效预测模块,用于根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效。
可选地,所述模型构造模块还用于:通过分布式集群构造所述各时间节点对应的决策树模型。
可选地,所述模型构造模块还用于:在当前存在各时间节点对应的已有决策树模型的情况下,利用各时间节点对应的所述特征条件集和所述实际履约时效,更新各已有决策树模型,以得到所述各时间节点对应的决策树模型,其中,所述更新包括:计算各特征条件集中每一特征条件的信息增益或信息增益比,以及对所述各已有决策树模型进行剪裁。
可选地,还包括报警消息输出模块,用于:将预测得到的所述新生成业务数据的履约时效,与由所述各时间节点对应的配置信息确定出的履约时效进行比对,以得到差异数据;在所述差异数据大于或等于预设阈值时输出报警消息。
可选地,所述履约数据获取模块还用于:在无法获取到所述获取实时履约数据的情况下,获取已存履约数据,所述已存履约数据包括:由所述各时间节点对应的配置信息确定出的履约时效和对应的已存业务数据;所述模型构造模块还用于:利用所述已存履约数据构造所述各时间节点对应的决策树模型。
根据本发明实施例的又一方面,提供了一种电子设备。
一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现本发明提供的履约时效预测方法。
根据本发明实施例的又一方面,提供了一种计算机可读介质。
一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明提供的履约时效预测方法。
上述发明中的一个实施例具有如下优点或有益效果:获取实时履约数据,实时履约数据包括实时结束履约流程的业务数据和该业务数据在履约流程各时间节点的实际履约时效;从业务数据中提取各时间节点对应的特征条件集;利用各时间节点对应的特征条件集和实际履约时效,构造各时间节点对应的决策树模型;根据各时间节点对应的决策树模型预测新生成业务数据的履约时效。能够减少业务员在时效调整时的复杂手工操作,节省人力和时间成本,可以实时并精准地预测履约时效,并且可以对未能及时调整的业务方案进行预警,提高运营效率,改善用户体验,且计算量可以满足实际需求。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明第一实施例的履约时效预测方法的主要步骤示意图;
图2是根据本发明第二实施例的履约时效预测流程示意图;
图3是根据本发明第三实施例的履约时效预测流程示意图;
图4是根据本发明第三实施例的决策树模型的示意图;
图5是根据本发明第四实施例的履约时效预测流程示意图;
图6是根据本发明第五实施例的履约时效预测装置的主要模块示意图;
图7是本发明实施例可以应用于其中的示例性系统架构图;
图8是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本领域技术技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
图1是根据本发明第一实施例的履约时效预测方法的主要步骤示意图。
如图1所示,本发明第一实施例的履约时效预测方法主要包括如下的步骤S101至步骤S104。
步骤S101:获取实时履约数据,实时履约数据包括实时结束履约流程的业务数据和该业务数据在履约流程各时间节点的实际履约时效。
履约流程是包括多个时间节点的一套业务流程,例如电商的物流配送中的履约流程为用户下单之后,经过开始转移时间节点、截止打包时间节点、发车时间节点、妥投时间节点等,最后将订单商品交付用户的整个流程。一个时间节点的履约时效,是指从履约流程起始(例如用户下单时间)到该时间节点所花费的时间。
步骤S102:从该业务数据中提取各时间节点对应的特征条件集。
以电商的履约场景为例,业务数据为订单数据。履约流程的各时间节点可以包括开始转移时间节点、截止打包时间节点、发车时间节点、妥投时间节点等。以妥投时间节点为例,特征条件集可以包括:
仓库:配送中心+仓库号,例如:612;
四级地址(用户的收货地址),例如:省13市1007县1014镇38077
下单时间(按整点计),例如:1点前为1,1点到2点为2;
是否超重,例如:超重为1,非超重为2;
是否第三方商家,例如:非三方为1,第三方为2;
业务类型,例如:普通为1,生鲜为2,城配为3,逆向为4,外单为5;生鲜协同仓为6等。
上述特征条件集仅为示例,随着业务的改变特征条件集也可以相应变化。
步骤S103:利用各时间节点对应的特征条件集和实际履约时效,构造各时间节点对应的决策树模型。
决策树模型的构造需要三个步骤:特征选择(即提取特征条件集)、决策树的生成、决策树的修剪。上述步骤S102已经提取出特征条件集,本步骤重点介绍决策树的生成和修剪。
在构造决策树模型时,选择区分度更高的分类作为最开始的条件进行构建,能够尽快地选择出所需要的结果。
作为一种实施方式,本发明实施例的实现决策树的算法可以采用ID3算法。ID3算法是以信息论为基础,以信息熵和信息增益为衡量标准,从而实现对数据的归纳分类。
信息增益表示由于特征A而使得对数据集D的分类的不确定性减少的程度。信息增益是对于特征值而言的,即,特征A对训练数据集合D的信息增益为g(D,A),定义为集合D经验熵H(D)和特征在给定条件下D的经验条件熵H(D|A)的差值,即:
g(D,A)=H(D)-H(D|A)
其中条件熵H(Y|X)代表在已知随机变量X的条件下随机变量Y的不确定性,即随机变量X在给定的条件下随机变量Y的条件熵H(Y|X)(conditional entropy)为:
Figure BDA0002239374920000071
其中,pi=P(X=xi),
经验熵公式为:
Figure BDA0002239374920000072
其中,|D|表示样本容量,即样本个数。K为分类的数量,Ck表示第k个类,|Ck|为属于类Ck的样本个数。
经验熵公式是熵公式中概率由数据估计获得的。熵的公式为:
Figure BDA0002239374920000081
不同的特征往往具有不同的信息增益。信息增益大的特征具有更强的分类能力。
作为另一种实施方式,本发明实施例的实现决策树的算法可以采用C4.5算法。C4.5算法要求所有数据必须放在内存中,对硬件配置要求比较高,本发明实施例在实施时,如果剪枝后服务器现有硬件配置(例如内存容量)能满足C4.5算法要求,可以采用该算法,否则,需要采用ID3算法。
C4.5算法采用信息增益比来计算,信息增益比是信息增益为g(D,A)与训练数据集合D的经验熵之比:
Figure BDA0002239374920000082
通过计算信息增益比,选择信息增益比较大的特征开始构建决策树,由于特征值有多个,则第一次划分后,数据集会被向下传递到树的分支下一个节点,在新的节点上就可以再次划分数据,这样可以采用递归的原则来处理数据集。
决策树算法会递归地产生决策树,直到不能继续构建为止,对于已经存在的数据,产生的决策树对数据的分类很准确,预测时也会很准确,但是对未知的数据分类结果却没有那么准确,会出现过拟合现象。过拟合的原因在于学习的过程中过多地考虑如何提高数据分类的正确性,构建出过于复杂的决策树,那么,解决的方法是考虑简化决策树,即对决策树进行裁剪。
裁剪(pruning)是决策树针对学习算法解决过拟合问题的主要方法。基本策略有预剪枝和后剪枝两种。
预剪枝是指在决策生成的过程中,对每个节点在进行划分前先进行评估。若当前节点的划分不能带来决策树泛化性能的提升,则停止划分然后将当前节点标记为叶子节点。后剪枝是从训练集中先生成一个完整的决策树,然后自底向上对非叶子节点进行考察,若该节点对应的子树替换为叶子节点能够对决策树泛化性能提升,则将该字树替换为叶子节点。
本发明实施例采用后剪枝的方法,通过极小化决策树整体的损失函数或者代价函数来实现。
损失函数定义为:
Figure BDA0002239374920000091
其中:T代表这个子树的叶子节点,Ht(T)代表第t个叶子的熵,Nt代表第t个叶子所含的训练样例的个数,α为惩罚系数,|T|代表子树的叶子节点的个数。其中,第t个叶子的熵Ht(T)为:
Figure BDA0002239374920000092
利用各时间节点对应的特征条件集和实际履约时效,分别按照上述方法生成决策树并进行后剪枝,得到构造好的各时间节点对应的决策树模型。
本发明实施例的履约时效预测方法可以在服务器执行,通常在服务器系统重启时构造一次决策树模型,后续实时修正该决策树模型即可。即,在当前存在各时间节点对应的已有决策树模型的情况下,利用各时间节点对应的特征条件集和实际履约时效,更新各已有决策树模型,以得到各时间节点对应的决策树模型,其中,该更新包括:计算各特征条件集中每一特征条件的信息增益或信息增益比,以及对各已有决策树模型进行剪裁。需要说明的是,本发明实施例也可以将决策树模型持久化,以减少重启后构建决策树时间成本。保证能够持续不间断提供服务。
其中,计算信息增益或信息增益比取决于所采用的实现决策树的算法,若采用ID3算法,则计算各特征条件集中每一特征条件的信息增益,并根据信息增益调整决策树的节点,并对调整后的决策树进行剪裁;若采用C4.5算法则计算各特征条件集中每一特征条件的信息增益比,并根据信息增益比调整决策树的节点,并对调整后的决策树进行剪裁。
可以通过分布式集群构造各时间节点对应的决策树模型。例如,一部分服务器专门用于计算信息增益或信息增益比,然后把得到的计算结果推送到集群中,每台服务器从集群读取计算结果,根据该计算结果确定决策树的区分度,以调整决策树的节点,然后对各自的决策树进行剪裁。从而,提高了处理大数据的性能,减轻单一服务器的运算负担。
步骤S104:根据各时间节点对应的决策树模型预测新生成业务数据的履约时效。
以电商履约流程为例,通常情况下,实时有新的订单数据生成,也实时有结束履约流程的订单。本发明实施例从上游数据源获取实时有结束履约流程的订单来实时地构造决策树模型,用于预测新生成订单的履约时效,减少大量非特殊业务的时效调整带来的工作量,并对新生成的数据进行精确预测,更有效地降低运营成本。
对于一些特殊情形,没有实时结束履约流程的订单,从而无法获取到实时履约数据。
作为一种实施方式,在步骤S104之前,还包括:在步骤S101无法获取到实时履约数据的情况下,获取已存履约数据,已存履约数据包括:由各时间节点对应的配置信息确定出的履约时效和对应的已存业务数据;利用已存履约数据构造各时间节点对应的决策树模型。具体地,从已存业务数据中提取各时间节点对应的特征条件集,根据该提取的特征条件集和由各时间节点对应的配置信息确定出的履约时效,构造各时间节点对应的决策树模型。
例如,对于一些新的业务(线路),不存在实时履约数据,则可以利用上述方法,利用已存履约数据来构造决策树模型,从而保证了在新增业务线路下,也可以使用本发明实施例的履约时效预测方法来预测履约时效。
作为另一种实施方式,在步骤S104之前,还包括:在步骤S101无法获取到实时履约数据的情况下,获取模拟履约数据,模拟履约数据为人为设定的用于构造决策树模型的履约数据,这些数据不是真实的履约数据。利用模拟履约数据构造各时间节点对应的决策树模型。具体地,从模拟履约数据中提取各时间节点对应的特征条件集,根据该提取的特征条件集和模拟履约数据中的履约时效,构造各时间节点对应的决策树模型。
步骤S104之后,可以将预测得到的新生成业务数据的履约时效,与由各时间节点对应的配置信息确定出的履约时效进行比对,以得到差异数据;在差异数据大于或等于预设阈值时输出报警消息。
由各时间节点对应的配置信息确定出的履约时效,即现有的通过依赖业务员手动配置的计算逻辑确定出的履约时效。将本实施的决策树模型预测得到的履约时效与该由各时间节点对应的配置信息确定出的履约时效进行比对,使得可以对未能及时调整的业务方案进行预警,实现了通过使用人工智能算法,既可以预测实际的路由时效(路由例如商品从一个地点搬运到另一个地点的整个转运过程称为一条路由,时效例如是计算商品从仓库或分拣中心到达用户所需要的时间,包含每个分拣中心和站点的时间点),弥补业务员漏配置的情况,又可以校验配置与实际时效的差异。
对于业务系统而言,虽然业务较多,但是计算履约时效所需的入参通常是有限的,从而为机器学习提供了可行条件。以电商的履约流程为例,图2是本发明第二实施例的履约时效预测流程示意图。开始转移时间节点、截止打包时间节点、发车时间节点、妥投时间节点等为履约流程的各时间节点。原始数据为从上游业务系统获取的实时结束履约流程的订单数据和对应的实际履约时效数据,进行数据整理(例如将数据整理成生成决策树算法所需要的格式),并拆分得到订单数据中对应各时间节点的数据。提取各时间节点对应的特征条件集作为入参矩阵,计算各特征条件的信息增益比,构造决策树并进行剪枝,然后利用最终得到的决策树对新生成的订单数据(新数据)分别计算各时间节点对应的履约时效。
以妥投时间节点为例,特征条件可以包括:仓库、四级地址(用户的收货地址)、下单时间(按整点计)、是否超重、是否第三方商家、业务类型等。实际履约时效数据可以参见表1和表2(仅为示例)。
表1
Figure BDA0002239374920000121
表2(接续表1)
截止装车时间 站点验货时间 配送员收货时间 截止妥投时间
2018/8/30 7:00 2018/8/30 12:00 2018/8/30 12:30 2018/8/30 15:00
其中,所有的时间均是相对于下单时间(本例下单时间以2018年8月29日为例)的偏移量,偏移1天12小时30分钟可以记作1D12:30。按照此格式将实际履约时效数据整理为如表3和表4的格式。
表3
开始转移时间 截止转移时间 截止打包时间 截止进港 截止发车
0D12:00 0D23:00 1D00:00 1D05:00 1D07:00
表4(接续表3)
截止装车时间 站点验货时间 配送员收货时间 截止妥投时间
1D7:00 1D07:00 1D12:30 1D15:00
再将特征条件集和实际履约时效将数据整理成如表5的格式。
表5
Figure BDA0002239374920000131
上述仅以妥投时间节点的特征条件集的一部分数据和对应的实际履约时效数据为例进行说明,对于全部数据不一一列举。利用整理好的妥投时间节点对应的特征条件集和实际履约时效,构造妥投时间节点对应的决策树模型。
图3是根据本发明第三实施例的履约时效预测流程示意图。将新生成的订单数据存入数据库。获取实际的时效数据,即实时履约数据,具体包括实时结束履约流程的业务数据和该业务数据在履约流程各时间节点的实际履约时效。将实时履约数据整理为本发明生成决策树的算法需要的格式,进行机器学习生成决策树(参见上述各实施例的决策树构造方法),从数据库获取保存的新生成的订单数据(简称新订单数据,或新数据),对新订单数据进行预测,得到各时间节点的履约时效,并将预测的结果(履约时效)存入数据库。需要说明的是,本发明实施例的新生成的订单数据也可以实时地从上游系统获取,而不必预先保存在数据库中。
其中,新生成的订单数据的特征条件集和对应的妥投时间例如表6所示,构造的决策树模型如图4所示。其中,可以利用上述各实施例介绍的ID3算法或C4.5算法计算各特征条件的信息增益或信息增益比,以生成决策树。对决策树剪枝时,图4中三方订单(即属于除了平台之外的第三方商家的订单)由于其配置基本相同,可以剪枝到根节点。图4两处灰色区域,普通订单和生鲜订单的妥投时间相同,“超重”节点下面只有一个子树,因此,这两处对应的子树均可分别剪枝为一个节点。
表6
Figure BDA0002239374920000141
Figure BDA0002239374920000151
图5是根据本发明第四实施例的履约时效预测流程示意图。
本发明实施例增加一个定时任务,对现有订单数据进行采样,分别调用机器学习的服务(决策树模型)和原有时效系统的计算逻辑,然后将通过决策树模型预测出的履约时效与原有时效系统确定出的履约时效进行比较,得到二者的差异数据。因为机器学习是根据实际订单不断动态改变的,若其他系统、仓储进行业务调整,原有时效系统未及时更新配置数据,将导致与预测出的履约时效不一致,若二者差异较大(差异数据大于或等于预设阈值),则存储履约时效的预测结果并及时报警,而无需等到用户投诉才进行处理。若通过决策树模型预测出的履约时效与原有时效系统确定出的履约时效的差异小于预设阈值,则保存预测结果即可。
其中,原有时效系统是指按照现有方案的由各时间节点对应的配置信息确定出履约时效的系统。原有时效系统的履约时效计算逻辑依赖于业务员的手动配置,例如,配置从北京到上海的妥投时间为3天,如遇业务调整引起时效变化,需要业务员手动更改配置信息。
本发明实施例可以对原有时效系统得出的结果进行改造,例如对于计算失败的结果调用机器学习服务,还可以设置开关,例如只针对某个仓库或者某个地区进行预测,若结果理想(可由业务人员根据业务需求来判断),继续进行灰度发布,灰度发布(又名金丝雀发布)是指在黑与白之间,能够平滑过渡的一种发布方式。在其上可以进行A/B testing(测试),即让一部分用户继续用产品特性A,一部分用户开始用产品特性B,如果用户对B没有反对意见,那么逐步扩大范围,把所有用户都迁移到B上面来。
对于预调整的线路(比如预先调整上海到北京的时效),可以将(原有时效系统)由各时间节点对应的配置信息确定出的履约时效推送到服务器,通过本发明的人工智能算法学习预调整的结果。例如,对于一些新的业务线路,不存在实时履约数据。那么,可以将原有时效系统的由各时间节点对应的配置信息确定出的履约时效,以及对应的订单数据推送到服务器,根据推送过来的订单数据提取各时间节点对应的特征条件集,并根据该特征条件集合推送过来的履约时效构造各时间节点对应的决策树模型。
本发明实施例利用现有订单数据,进行人工智能学习,对新订单数据的履约时效进行预测,也可以对原有时效系统的计算结果(由各时间节点对应的配置信息)进行对比,对于差异较大的数据进行报警,提高运营效率,改善用户体验,并且构造决策树模型所需的现有订单数据是实时获取的,无需预先保存和筛选数据,克服了现有技术计算量巨大的缺陷,计算量可以满足实际需求。并且,对于一些新线路(或新业务),在不存在实时结束履约流程的订单数据的情况下,也可以利用原有时效系统配置的时效和对应的订单数据来构建决策树模型,从而进行履约时效的预测。
图6是根据本发明第五实施例的履约时效预测装置的主要模块示意图。
本发明第五实施例的履约时效预测装置600主要包括:履约数据获取模块601、特征条件提取模块602、模型构造模块603、履约时效预测模块604。
履约数据获取模块601,用于获取实时履约数据,实时履约数据包括实时结束履约流程的业务数据和该业务数据在履约流程各时间节点的实际履约时效。
履约数据获取模块601还可以用于:在无法获取到获取实时履约数据的情况下,获取已存履约数据,已存履约数据包括:由各时间节点对应的配置信息确定出的履约时效和对应的已存业务数据。
特征条件提取模块602,用于从该业务数据中提取各时间节点对应的特征条件集。
模型构造模块603,用于利用各时间节点对应的特征条件集和实际履约时效,构造各时间节点对应的决策树模型。
模型构造模块603还可以用于:利用已存履约数据构造各时间节点对应的决策树模型。具体地,从已存业务数据中提取各时间节点对应的特征条件集,根据该提取的特征条件集和由各时间节点对应的配置信息确定出的履约时效,构造各时间节点对应的决策树模型。
模型构造模块603可以通过分布式集群构造各时间节点对应的决策树模型。
模型构造模块603在当前存在各时间节点对应的已有决策树模型的情况下,利用各时间节点对应的特征条件集和实际履约时效,更新各已有决策树模型,以得到各时间节点对应的决策树模型,其中,该更新包括:计算各特征条件集中每一特征条件的信息增益或信息增益比,以及对各已有决策树模型进行剪裁。
其中,计算信息增益或信息增益比取决于所采用的实现决策树的算法,若采用ID3算法,则计算各特征条件集中每一特征条件的信息增益,并根据信息增益调整决策树的节点,并对调整后的决策树进行剪裁;若采用C4.5算法则计算各特征条件集中每一特征条件的信息增益比,并根据信息增益比调整决策树的节点,并对调整后的决策树进行剪裁。
履约时效预测模块604,用于根据各时间节点对应的决策树模型预测新生成业务数据的履约时效。
履约时效预测装置600还可以包括报警消息输出模块,用于:将预测得到的新生成业务数据的履约时效,与由各时间节点对应的配置信息确定出的履约时效进行比对,以得到差异数据;在差异数据大于或等于预设阈值时输出报警消息。
另外,在本发明实施例中履约时效预测装置的具体实施内容,在上面所述履约时效预测方法中已经详细说明了,故在此重复内容不再说明。
图7示出了可以应用本发明实施例的履约时效预测方法或履约时效预测装置的示例性系统架构700。
如图7所示,系统架构700可以包括终端设备701、702、703,网络704和服务器705。网络704用以在终端设备701、702、703和服务器705之间提供通信链路的介质。网络704可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备701、702、703通过网络704与服务器705交互,以接收或发送消息等。终端设备701、702、703上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备701、702、703可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器705可以是提供各种服务的服务器,例如对用户利用终端设备701、702、703所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的履约时效预测方法一般由服务器705执行,相应地,履约时效预测装置一般设置于服务器705中。
应该理解,图7中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图8,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统800的结构示意图。图8示出的终端设备或服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图8所示,计算机系统800包括中央处理单元(CPU)801,其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM 803中,还存储有系统800操作所需的各种程序和数据。CPU 801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。
以下部件连接至I/O接口805:包括键盘、鼠标等的输入部分806;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807;包括硬盘等的存储部分808;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器810上,以便于从其上读出的计算机程序根据需要被安装入存储部分808。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分809从网络上被下载和安装,和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元(CPU)801执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括履约数据获取模块、特征条件提取模块、模型构造模块、履约时效预测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,履约数据获取模块还可以被描述为“用于获取实时履约数据的模块”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:获取实时履约数据,所述实时履约数据包括实时结束履约流程的业务数据和所述业务数据在所述履约流程各时间节点的实际履约时效;从所述业务数据中提取所述各时间节点对应的特征条件集;利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型;根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效。
根据本发明实施例的技术方案,获取实时履约数据,实时履约数据包括实时结束履约流程的业务数据和该业务数据在履约流程各时间节点的实际履约时效;从业务数据中提取各时间节点对应的特征条件集;利用各时间节点对应的特征条件集和实际履约时效,构造各时间节点对应的决策树模型;根据各时间节点对应的决策树模型预测新生成业务数据的履约时效。能够减少业务员在时效调整时的复杂手工操作,节省人力和时间成本,可以实时并精准地预测履约时效,并且可以对未能及时调整的业务方案进行预警,提高运营效率,改善用户体验,且计算量可以满足实际需求。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (12)

1.一种履约时效预测方法,其特征在于,包括:
获取实时履约数据,所述实时履约数据包括实时结束履约流程的业务数据和所述业务数据在所述履约流程各时间节点的实际履约时效;
从所述业务数据中提取所述各时间节点对应的特征条件集;
利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型;
根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效。
2.根据权利要求1所述的方法,其特征在于,通过分布式集群构造所述各时间节点对应的决策树模型。
3.根据权利要求1所述的方法,其特征在于,利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型的步骤,包括:
在当前存在各时间节点对应的已有决策树模型的情况下,利用各时间节点对应的所述特征条件集和所述实际履约时效,更新各已有决策树模型,以得到所述各时间节点对应的决策树模型,其中,
所述更新包括:计算各特征条件集中每一特征条件的信息增益或信息增益比,以及对所述各已有决策树模型进行剪裁。
4.根据权利要求1所述的方法,其特征在于,根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效的步骤之后,包括:
将预测得到的所述新生成业务数据的履约时效,与由所述各时间节点对应的配置信息确定出的履约时效进行比对,以得到差异数据;
在所述差异数据大于或等于预设阈值时输出报警消息。
5.根据权利要求1所述的方法,其特征在于,根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效的步骤之前,包括:
在无法获取到所述获取实时履约数据的情况下,获取已存履约数据,所述已存履约数据包括:由所述各时间节点对应的配置信息确定出的履约时效和对应的已存业务数据;
利用所述已存履约数据构造所述各时间节点对应的决策树模型。
6.一种履约时效预测装置,其特征在于,包括:
履约数据获取模块,用于获取实时履约数据,所述实时履约数据包括实时结束履约流程的业务数据和所述业务数据在所述履约流程各时间节点的实际履约时效;
特征条件提取模块,用于从所述业务数据中提取所述各时间节点对应的特征条件集;
模型构造模块,用于利用各时间节点对应的所述特征条件集和所述实际履约时效,构造所述各时间节点对应的决策树模型;
履约时效预测模块,用于根据所述各时间节点对应的决策树模型预测新生成业务数据的履约时效。
7.根据权利要求6所述的装置,其特征在于,所述模型构造模块还用于:
通过分布式集群构造所述各时间节点对应的决策树模型。
8.根据权利要求6所述的装置,其特征在于,所述模型构造模块还用于:
在当前存在各时间节点对应的已有决策树模型的情况下,利用各时间节点对应的所述特征条件集和所述实际履约时效,更新各已有决策树模型,以得到所述各时间节点对应的决策树模型,其中,
所述更新包括:计算各特征条件集中每一特征条件的信息增益或信息增益比,以及对所述各已有决策树模型进行剪裁。
9.根据权利要求6所述的装置,其特征在于,还包括报警消息输出模块,用于:
将预测得到的所述新生成业务数据的履约时效,与由所述各时间节点对应的配置信息确定出的履约时效进行比对,以得到差异数据;
在所述差异数据大于或等于预设阈值时输出报警消息。
10.根据权利要求6所述的装置,其特征在于,所述履约数据获取模块还用于:
在无法获取到所述获取实时履约数据的情况下,获取已存履约数据,所述已存履约数据包括:由所述各时间节点对应的配置信息确定出的履约时效和对应的已存业务数据;
所述模型构造模块还用于:
利用所述已存履约数据构造所述各时间节点对应的决策树模型。
11.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201910994721.1A 2019-10-18 2019-10-18 一种履约时效预测方法和装置 Pending CN112686418A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910994721.1A CN112686418A (zh) 2019-10-18 2019-10-18 一种履约时效预测方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910994721.1A CN112686418A (zh) 2019-10-18 2019-10-18 一种履约时效预测方法和装置

Publications (1)

Publication Number Publication Date
CN112686418A true CN112686418A (zh) 2021-04-20

Family

ID=75445004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910994721.1A Pending CN112686418A (zh) 2019-10-18 2019-10-18 一种履约时效预测方法和装置

Country Status (1)

Country Link
CN (1) CN112686418A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537574A (zh) * 2021-06-23 2021-10-22 北京健康之家科技有限公司 业务处理时效的推送方法、装置、存储介质及计算机设备
CN114564611A (zh) * 2022-02-28 2022-05-31 华南师范大学 一种用于音乐治疗的音乐播放方法、装置及系统
CN115345716A (zh) * 2022-10-17 2022-11-15 北京永辉科技有限公司 订单履约时长的预估方法、系统、介质及电子设备
CN116341765A (zh) * 2023-05-24 2023-06-27 南京新桐数字科技有限公司 一种订单自动寻源和拆分方法及系统

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002037234A2 (en) * 2000-10-20 2002-05-10 Brown Kenneth B System and method for collaborative order fulfillment
US7747543B1 (en) * 2001-09-27 2010-06-29 Amazon Technologies, Inc Dynamically determining actual delivery information for orders based on actual order fulfillment plans
CN105956738A (zh) * 2016-04-19 2016-09-21 国网山东省电力公司阳信县供电公司 一种物资合同履约监管预警系统
CN106096748A (zh) * 2016-04-28 2016-11-09 武汉宝钢华中贸易有限公司 基于聚类分析和决策树算法的装车工时预测模型
CN107330614A (zh) * 2017-06-29 2017-11-07 北京京东尚科信息技术有限公司 一种业务活动效果的实时评估方法和装置
CN108389018A (zh) * 2018-03-02 2018-08-10 侨益物流股份有限公司 一种智能化大宗商品物流管理系统
CN108805379A (zh) * 2017-05-03 2018-11-13 北京京东尚科信息技术有限公司 支持多模式履约流程的系统和方法
CN109416878A (zh) * 2017-06-13 2019-03-01 北京嘀嘀无限科技发展有限公司 用于推荐预计到达时间的系统和方法
WO2019056499A1 (zh) * 2017-09-20 2019-03-28 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN109903140A (zh) * 2019-03-07 2019-06-18 阿里巴巴集团控股有限公司 一种信用服务推荐方法、装置及设备
CN109978062A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种模型在线监控方法及系统
CN109993367A (zh) * 2019-04-04 2019-07-09 拉扎斯网络科技(上海)有限公司 配送时长的估计方法、估计装置、存储介质和电子设备
CN110060118A (zh) * 2019-02-27 2019-07-26 浙江执御信息技术有限公司 一种订单履约全链路实时监控方法、装置及计算机设备
CN110084438A (zh) * 2019-05-09 2019-08-02 上汽安吉物流股份有限公司 订单的预测方法及装置、物流系统以及计算机可读介质

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002037234A2 (en) * 2000-10-20 2002-05-10 Brown Kenneth B System and method for collaborative order fulfillment
US7747543B1 (en) * 2001-09-27 2010-06-29 Amazon Technologies, Inc Dynamically determining actual delivery information for orders based on actual order fulfillment plans
CN105956738A (zh) * 2016-04-19 2016-09-21 国网山东省电力公司阳信县供电公司 一种物资合同履约监管预警系统
CN106096748A (zh) * 2016-04-28 2016-11-09 武汉宝钢华中贸易有限公司 基于聚类分析和决策树算法的装车工时预测模型
CN108805379A (zh) * 2017-05-03 2018-11-13 北京京东尚科信息技术有限公司 支持多模式履约流程的系统和方法
CN109416878A (zh) * 2017-06-13 2019-03-01 北京嘀嘀无限科技发展有限公司 用于推荐预计到达时间的系统和方法
CN107330614A (zh) * 2017-06-29 2017-11-07 北京京东尚科信息技术有限公司 一种业务活动效果的实时评估方法和装置
WO2019056499A1 (zh) * 2017-09-20 2019-03-28 平安科技(深圳)有限公司 预测模型训练方法、数据监控方法、装置、设备及介质
CN108389018A (zh) * 2018-03-02 2018-08-10 侨益物流股份有限公司 一种智能化大宗商品物流管理系统
CN110060118A (zh) * 2019-02-27 2019-07-26 浙江执御信息技术有限公司 一种订单履约全链路实时监控方法、装置及计算机设备
CN109903140A (zh) * 2019-03-07 2019-06-18 阿里巴巴集团控股有限公司 一种信用服务推荐方法、装置及设备
CN109978062A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种模型在线监控方法及系统
CN109993367A (zh) * 2019-04-04 2019-07-09 拉扎斯网络科技(上海)有限公司 配送时长的估计方法、估计装置、存储介质和电子设备
CN110084438A (zh) * 2019-05-09 2019-08-02 上汽安吉物流股份有限公司 订单的预测方法及装置、物流系统以及计算机可读介质

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A. H. KHATAIE, A. A. BULGAK AND J. J. SEGOVIA: ""Advanced decision support tool by integrating activity-based costing and management to system dynamics"", PICMET 2010 TECHNOLOGY MANAGEMENT FOR GLOBAL ECONOMIC GROWTH, 14 October 2010 (2010-10-14), pages 132 - 134 *
刘新锋;亓振新;刘姝玉;林凤兰;: "物料履约跟踪管理系统设计与实现", 《计算机光盘软件与应用》, no. 13, 1 July 2013 (2013-07-01), pages 60 - 62 *
滕佳东等: "《基于社区视野的特殊群体空间研究 管窥当代中国城市的社会空间》", 东北财经大学出版社, pages: 132 - 134 *
陈超;: "基于SCOR的订单履约流程分析", 《珠江水运》, no. 5, 15 May 2010 (2010-05-15), pages 84 - 85 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113537574A (zh) * 2021-06-23 2021-10-22 北京健康之家科技有限公司 业务处理时效的推送方法、装置、存储介质及计算机设备
CN113537574B (zh) * 2021-06-23 2024-03-26 北京水滴科技集团有限公司 业务处理时效的推送方法、装置、存储介质及计算机设备
CN114564611A (zh) * 2022-02-28 2022-05-31 华南师范大学 一种用于音乐治疗的音乐播放方法、装置及系统
CN114564611B (zh) * 2022-02-28 2024-05-10 华南师范大学 一种用于音乐治疗的音乐播放方法、装置及系统
CN115345716A (zh) * 2022-10-17 2022-11-15 北京永辉科技有限公司 订单履约时长的预估方法、系统、介质及电子设备
CN116341765A (zh) * 2023-05-24 2023-06-27 南京新桐数字科技有限公司 一种订单自动寻源和拆分方法及系统
CN116341765B (zh) * 2023-05-24 2023-08-01 南京新桐数字科技有限公司 一种订单自动寻源和拆分方法及系统

Similar Documents

Publication Publication Date Title
CN107809331B (zh) 识别异常流量的方法和装置
CN112686418A (zh) 一种履约时效预测方法和装置
CN110555640B (zh) 路由规划的方法和装置
CN108229986B (zh) 信息点击预测中的特征构建方法、信息投放方法和装置
CN109961198B (zh) 关联信息生成方法和装置
WO2019076001A1 (zh) 信息更新方法和装置
CN106228263A (zh) 基于大数据的物流信息化方法
CN112819263A (zh) 一种调度客服的方法和装置
CN107704357B (zh) 日志生成方法和装置
CN110807050B (zh) 性能分析方法、装置、计算机设备及存储介质
CN110378739B (zh) 一种数据流量匹配方法及装置
US20220129447A1 (en) Method, system, device and medium for querying product history
CN110895591B (zh) 一种定位自提点的方法和装置
CN108985805B (zh) 一种选择性执行推送任务的方法和装置
CN112231299B (zh) 一种特征库动态调整的方法和装置
CN110930101B (zh) 确定订单的配送时间的方法、装置、电子设备和可读介质
CN116777324A (zh) 一种物流网络调度的方法和装置
CN109902196B (zh) 一种商标类别推荐方法、装置、计算机设备及存储介质
CN107679096B (zh) 数据集市间指标共享的方法和装置
CN110062112A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN115202847A (zh) 任务的调度方法和装置
CN110990401B (zh) 一种酒店搜索方法及系统
CN113190558A (zh) 一种数据加工方法和系统
CN113379173A (zh) 为仓库商品标记标签的方法和装置
CN113781237B (zh) 基于分布式人工智能系统的产品订购单消费方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination