CN114139636A

CN114139636A - 异常作业处理方法及装置

Info

Publication number: CN114139636A
Application number: CN202111469624.4A
Authority: CN
Inventors: 黄立; 王毅
Original assignee: China Construction Bank Corp
Current assignee: China Construction Bank Corp
Priority date: 2021-12-03
Filing date: 2021-12-03
Publication date: 2022-03-04
Anticipated expiration: 2041-12-03
Also published as: CN114139636B

Abstract

本发明提供了一种异常作业处理方法及装置，该方法包括：响应于检测指令，确定批量作业中的处于异常状态的目标作业；对所述目标作业的作业标识进行特征提取，获得所述作业标识对应的作业标识特征；将所述作业标识特征输入至预先构建的决策树模型，得到所述决策树模型输出的决策结果；根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。应用本发明提供的异常作业处理方法，能够快速确定与目标作业的异常状态相关联的作业，从而可以确定出异常作业的影响范围，能够快速评估异常作业对整个批量以及业务系统的影响程度。

Description

异常作业处理方法及装置

技术领域

本发明涉及数据处理技术领域，特别涉及一种异常作业处理方法及装置。

背景技术

随着现在IT技术的快速发展，各类金融及其他交易业务量的不断增长，IT系统愈发复杂、批处理规模愈发庞大从而导致批量作业组织架构越来越复杂。因此，当批量执行过程中某个批量作业出现异常情况，可能造成的影响就需要快速全面定位，才能够评估对整个批量以及业务系统的影响程度。

然而，现有的批量调度工具，比如BMC公司的批量调度软件Control-M，当前主机批量作业多用CONTROL-M来进行作业调度，当作业在调度过程中出现异常时，CONTROL-M只能够反馈当前处于异常状态的作业，并无法确定异常作业的影响范围，导致无法快速评估异常作业对整个批量作业的影响程度。

发明内容

本发明所要解决的技术问题是提供一种异常作业处理方法，能够快速确定与目标作业的异常状态相关联的作业。

本发明还提供了一种异常作业处理装置，用以保证上述方法在实际中的实现及应用。

一种异常作业处理方法，包括：

响应于检测指令，确定批量作业中的处于异常状态的目标作业；

对所述目标作业的作业标识进行特征提取，获得所述作业标识对应的作业标识特征；

将所述作业标识特征输入至预先构建的决策树模型，得到所述决策树模型输出的决策结果；

根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。

上述的方法，可选的，所述决策树模型的构建过程，包括：

获取所述批量作业的调度日志；

基于所述批量作业中的各个作业之间的依赖关系，对所述调度日志进行关键字提取，获得各个作业关键字；

对每个所述作业关键字进行特征提取，得到每个所述作业关键字对应的训练样本；

将各个所述训练样本组成训练样本集，并将所述训练样本集放入预设的根节点；

从放入所述根节点的所述训练样本集中选择一个最优特征；

根据所述最优特征对所述训练数据集进行分割得到多个训练数据子集；对每个所述训练子执行第一操作；

所述第一操作包括：在各个所述训练数据子集满足预设的分类条件的情况下，构建每个所述训练数据子集对应的叶子节点，并将每个所述训练数据子集放入其对应的叶子节点中；对于每个所述叶子节点，对放入所述叶子节点的所述训练数据子集进行最优特征选取，若成功在所述训练数据子集中选取出新的最优特征，则基于所述新的最优对所述训练数据子集进行分割，得到多个新的训练数据子集；

对每个所述新的训练数据子集重新执行所述第一操作，直至新的训练数据子集满足预设的停止迭代条件，以构建得到决策树模型，所述停止迭代条件包括：所有训练数据子集均已放入其各自对应的叶子节点中，或在新的训练数据子集中未成功选取出新的最优特征。

上述的方法，可选的，所述从放入所述根节点的所述训练样本集中选择一个最优特征，包括：

确定所述训练样本集中的每一训练样本的基尼系数；

将基尼系数最小的训练样本作为最优特征。

上述的方法，可选的，在构建得到所述决策树模型之后，还包括：

基于预设的剪枝损失函数对所述决策树模型进行修剪优化，得到优化后的决策树模型。

上述的方法，可选的，所述基于预设的剪枝损失函数对所述决策树模型进行修剪优化，得到优化后的决策树模型，包括：

利用所述剪枝损失函数对所述决策树模型的各个节点进行计算，得到每个所述节点的损失函数值、叶子节点数量以及正则化阈值；

在各个所述正则化阈值中选取出数值最大的正则化阈值作为目标正则化阈值；

基于每个所述节点的损失函数值、叶子节点数量以及目标正则化阈值，对所述决策树模型进行剪枝，得到所述决策树的最优子树集合；

在所述最优子树集合中选取出目标子树；

将所述目标子树作为优化后的决策树模型。

一种异常作业处理装置，包括：

第一确定单元，用于响应检测指令，确定批量作业中的处于异常状态的目标作业；

第一执行单元，用于对所述目标作业的作业标识进行特征提取，获得所述作业标识对应的作业标识特征；

第二执行单元，用于将所述作业标识特征输入至预先构建的决策树模型，得到所述决策树模型输出的决策结果；

第二确定单元，用于根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。

上述的装置，可选的，所述第二执行单元，包括：

获取子单元，用于获取所述批量作业的调度日志；

第一执行子单元，用于基于所述批量作业中的各个作业之间的依赖关系，对所述调度日志进行关键字提取，获得各个作业关键字；

第二执行子单元，用于对每个所述作业关键字进行特征提取，得到每个所述作业关键字对应的训练样本；

第三执行子单元，用于将各个所述训练样本组成训练样本集，并将所述训练样本集放入预设的根节点；

选取子单元，用于从放入所述根节点的所述训练样本集中选择一个最优特征；

分割子单元，用于根据所述最优特征对所述训练数据集进行分割得到多个训练数据子集；

第四执行子单元，用于对每个所述训练子执行第一操作；

第五执行子单元，用于对每个所述新的训练数据子集重新执行所述第一操作，直至新的训练数据子集满足预设的停止迭代条件，以构建得到决策树模型，所述停止迭代条件包括：所有训练数据子集均已放入其各自对应的叶子节点中，或在新的训练数据子集中未成功选取出新的最优特征。

上述的装置，可选的，所述选取子单元，包括：

确定子模块，用于确定所述训练样本集中的每一训练样本的基尼系数；

第一执行子模块，用于将基尼系数最小的训练样本作为最优特征。

上述的装置，可选的，所述第二执行单元还包括：

优化子单元，用于基于预设的剪枝损失函数对所述决策树模型进行修剪优化，得到优化后的决策树模型。

上述的装置，可选的，所述优化子单元，包括：

计算子模型，用于利用所述剪枝损失函数对所述决策树模型的各个节点进行计算，得到每个所述节点的损失函数值、叶子节点数量以及正则化阈值；

第一选取子模块，用于在各个所述正则化阈值中选取出数值最大的正则化阈值作为目标正则化阈值；

第二执行子模块，用于基于每个所述节点的损失函数值、叶子节点数量以及目标正则化阈值，对所述决策树模型进行剪枝，得到所述决策树的最优子树集合；

第二选取子模块，用于在所述最优子树集合中选取出目标子树；

第三执行子模块，用于将所述目标子树作为优化后的决策树模型。

基于上述本发明提供的一种异常作业处理方法及装置，其中，该方法包括：可以确定批量作业中的处于异常状态的目标作业；对目标作业的作业标识进行特征提取，获得作业标识对应的作业标识特征；将作业标识特征输入至预先构建的决策树模型，得到决策树模型输出的决策结果；根据决策结果确定批量作业中与目标作业的异常状态相关联的作业。应用本发明提供的异常作业处理方法，能够快速确定与目标作业的异常状态相关联的作业，从而可以确定出异常作业的影响范围，能够快速评估异常作业对整个批量以及业务系统的影响程度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1为本发明提供的一种异常作业处理方法的方法流程图；

图2为本发明提供的一种决策树模型的构建过程的流程图；

图3为本发明提供的一种基于剪枝损失函数对决策树模型进行修剪优化的过程的流程图；

图4为本发明提供的一种构建决策树的流程示意图；

图5为本发明提供的一种异常作业处理装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本申请中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本发明实施例提供了一种异常作业处理方法，该方法可以应用于电子设备，所述方法的方法流程图如图1所示，具体包括：

S101：响应于检测指令，确定批量作业中的处于异常状态的目标作业。

在本实施中，在批量作业的调度过程中出现异常时，触发检测指令，确定出批量作业中当前处于异常状态的目标作业。

S102：对所述目标作业的作业标识进行特征提取，获得所述作业标识对应的作业标识特征。

在本实施例中，目标作业的作业标识可以是目标作业的作业名称，基于特征向量法对所述作业标识进行特征提取，可以得到作业标识对应的作业标识特征。

S103：将所述作业标识特征输入至预先构建的决策树模型，得到所述决策树模型输出的决策结果。

在本实施例中，决策树模型基于训练样本集构建得到，所述训练样本集包含批量作业中的各个作业的作业关键字的特征。

可选的，决策结果包括与目标作业的异常状态相关联的作业的作业标识特征。

S104：根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。

在本实施例中，可以确定决策结果中的作业标识特征对应的关联作业名称，根据关联作业名称确定与所述目标作业的异常状态相关联的作业。

应用本发明实施例提供的方法，在确定批量作业中处于异常状态的目标作业之后，基于预先构建好的决策树模型，快速的确定与该目标作业存在关联的作业，可以明确异常状态的影响范围，从而能够快速的解决异常。

在本发明提供的实施例中，基于上述的实施过程，可选的，所述决策树模型的构建过程，如图2所示，具体包括：

S201：获取所述批量作业的调度日志。

在本实施例中，调度日志包括批量作业的调度信息。

S202：基于所述批量作业中的各个作业之间的依赖关系，对所述调度日志进行关键字提取，获得各个作业关键字。

在本实施例中，依赖关系可以包括前置依赖、后置依赖、时间依赖和文件依赖等以上一种或多种关系。

可选的，各个作业之间的依赖关系可以基于预设的主机批图文件确定，可以根据各个作业之间的依赖关系以及各个作业的作业标识对调度日志进行切分，得到各个作业关键字。

S203：对每个所述作业关键字进行特征提取，得到每个所述作业关键字对应的训练样本。

在本实施例中，对每个作业关键字进行特征提取，得到每个作业关键字对应的关键字特征，将关键字特征作为训练样本。

S204：将各个所述训练样本组成训练样本集，并将所述训练样本集放入预设的根节点。

S205：从放入所述根节点的所述训练样本集中选择一个最优特征。

在本实施例中，可以确定训练样本集中的每个训练样本的基尼系数，根据各个训练样本的基尼系数在训练样本集中选择出最优特征。

S206：根据所述最优特征对所述训练数据集进行分割得到多个训练数据子集。

在本实施例中，可以通过最优特征对训练数据集进行分割，得到多个训练子集，从而对训练数据集中的训练样本进行分类，每个训练子集包含至少一个训练样本。

S207：对每个所述训练子执行第一操作。

所述第一操作包括：在各个所述训练数据子集满足预设的分类条件的情况下，构建每个所述训练数据子集对应的叶子节点，并将每个所述训练数据子集放入其对应的叶子节点中；对于每个所述叶子节点，对放入所述叶子节点的所述训练数据子集进行最优特征选取，若成功在所述训练数据子集中选取出新的最优特征，则基于所述新的最优对所述训练数据子集进行分割，得到多个新的训练数据子集。

在本实施例中，可以判断分割得到的训练数据子集是否被正确分类，若训练数据子集被正确分类，则确定训练数据子集满足预设的分类条件，否则，确定训练数据子集不满足预设的分类条件，在训练数据子集不满足预设的分类条件的情况下，重新在训练样本集中选取出新的最优特征，并基于新的最优特征对训练样本进行分割，直至分割得到的训练数据子集满足分类条件，或者训练数据集中的特征均已选取完毕，则确定未成功选取出新的最优特征。

可选的，在训练数据子集中选取最优特征的方式与在训练数据集中选取最优特征的方式一致，可参见。

S208：对每个所述新的训练数据子集重新执行所述第一操作，直至所述新的训练数据子集满足预设的停止迭代条件，以构建得到所述决策树模型，所述停止迭代条件包括：所有训练数据子集均已放入其各自对应的叶子节点中，或在新的训练数据子集中未成功选取出新的最优特征。

在本实施例中，通过对训练样本集进行递归分割，将分割得到各个训练样本子集放入其各自对应的叶子节点中，从而构建出决策树模型。

在本发明提供的实施例中，基于上述的实施过程，可选的，所述从放入所述根节点的所述训练样本集中选择一个最优特征，具体包括：

确定所述训练样本集中的每一训练样本的基尼系数；

将基尼系数最小的训练样本作为最优特征。

在本实施例中，可以通过预设的基尼系数公式计算得到每一训练样本的基尼稀释。

基尼系数公式如下：

其中，A表示训练样本集，|A|表示训练样本个数，|A1|表示A1中的样本个数，|A2|表示A2中的样本个数。子集A1和子集A2由特征D对A二分类得到，特征D为训练样本集A中的训练样本。

在确定出每一训练样本的基尼系数之后，可以将基尼系数最小的训练样本作为最优特征。

在本发明提供的实施例中，基于上述的实施过程，可选的，在构建得到所述决策树模型之后，还包括：

在本实施例中，剪枝损失函数的表达式如下：

Cα(T_t)＝C(T_t)+α|T_t|

其中，α为正则化参数；C(Tt)为训练数据的预测误差；|Tt|是子树叶子节点数量。

在本发明提供的实施例中，基于上述的实施过程，可选的，所述基于预设的剪枝损失函数对所述决策树模型进行修剪优化，得到优化后的决策树模型，如图3所示，包括：

S301：利用所述剪枝损失函数对所述决策树模型的各个节点进行计算，得到每个所述节点的损失函数值、叶子节点数量以及正则化阈值。

在本实施例中，先设置最优化子树集合ω＝{T}，α_min＝∞，可以将决策树模型的叶子节点作为起点，自下而上计算决策树模型的节点t的损失函数值Cα(Tt)，叶子节点数|Tt|,以及正则化阈值

并更新α_min＝α。

S302：在各个所述正则化阈值中选取出数值最大的正则化阈值作为目标正则化阈值。

S303：基于每个所述节点的损失函数值、叶子节点数量以及目标正则化阈值，对所述决策树模型进行剪枝，得到所述决策树的最优子树集合。

在本实施例中，可以自上而下访问子树t的内部节点，如果

时，进行剪枝，并确定叶子节点t的值，这样就可以得到目标正则化阈值α_k对应的最优子树T_k。

可选的，最优子树集合ω＝ω∪T_k，M＝M-{α_k}。

S304：在所述最优子树集合中选取出目标子树。

在本实施例中，可以选择多个主机批量作业调度日志组成训练集，将这些日志划分成M个不相交的子集(即将没有直接作业依赖的作业日志划分在一个子集)。每个子集中N-1个作业调度日志作为训练作业，对生成决策树进行先序遍历机器学习，将剩余的1个作业调度日志作为验证作业，对影响决策树正则化参数α进行修正；进行M轮不断学习验证后，正则化参数α更适应于主机批量作业调度模式，提升主机批量作业调度日志中字段之间的血缘分析结果准确度。

S305：将所述目标子树作为优化后的决策树模型。

应用本实施例提供的方法，可以提升决策树模型的决策结果的准确性。

参见图4，为本发明实施例提供的一种构建决策树的流程示意图，可以先获取主机批量调度作业训练集，根据作业类型在调度作业训练集中取子集，并建立窗口，以将该子集作为训练数据集，基于训练数据集构建决策树，测试窗口之外的其他数据是否存在错误分类，若不存在错误分类，则获得决策树模型，若存在错误分类，则拓展窗口，将原窗口中的数据错误分类后调整新窗口。其中，基于训练数据集构建决策树的过程可以为：将根节点作为当前训练集A，判断训练集A的样本值是否小于阈值或者无特征，若是，则确定建树完成，否则，确定样本基尼系数是否小于阈值，若是，则确定建树完成，否则，计算各个特征基尼系数，根据特征的基尼系数选择特征，基于特征对训练集进行划分，得到训练集A1和训练集A2，将A1作为左子节点，将A2作为右子节点，分别将A1和A2节点作为新的根节点，如此递归，直至所有训练数据子集被基本正确分类，或者没有合适的特征为止。

与图1所述的方法相对应，本发明实施例还提供了一种异常作业处理装置，用于对图1中方法的具体实现，本发明实施例提供的异常作业处理装置可以应用于电子设备中，其结构示意图如图5所示，具体包括：

第一确定单元501，用于响应检测指令，确定批量作业中的处于异常状态的目标作业；

第一执行单元502，用于对所述目标作业的作业标识进行特征提取，获得所述作业标识对应的作业标识特征；

第二执行单元503，用于将所述作业标识特征输入至预先构建的决策树模型，得到所述决策树模型输出的决策结果；

第二确定单元504，用于根据所述决策结果确定所述批量作业中与所述目标作业的异常状态相关联的作业。

在本发明提供的一实施例中，基于上述的方案，可选的，所述第二执行单元503，包括：

获取子单元，用于获取所述批量作业的调度日志；

第四执行子单元，用于对每个所述训练子执行第一操作；

在本发明提供的一实施例中，基于上述的方案，可选的，所述选取子单元，包括：

在本发明提供的一实施例中，基于上述的方案，可选的，所述第二执行单元还包括：

在本发明提供的一实施例中，基于上述的方案，可选的，所述优化子单元，包括：

上述本发明实施例公开的异常作业处理装置中的各个单元和模块具体的原理和执行过程，与上述本发明实施例公开的异常作业处理方法相同，可参见上述本发明实施例提供的异常作业处理方法中相应的部分，这里不再进行赘述。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

以上对本发明所提供的一种异常作业处理方法进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

Claims

1.一种异常作业处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述决策树模型的构建过程，包括：

获取所述批量作业的调度日志；

从放入所述根节点的所述训练样本集中选择一个最优特征；

3.根据权利要求2所述的方法，其特征在于，所述从放入所述根节点的所述训练样本集中选择一个最优特征，包括：

确定所述训练样本集中的每一训练样本的基尼系数；

将基尼系数最小的训练样本作为最优特征。

4.根据权利要求2所述的方法，其特征在于，在构建得到所述决策树模型之后，还包括：

5.根据权利要求4所述的方法，其特征在于，所述基于预设的剪枝损失函数对所述决策树模型进行修剪优化，得到优化后的决策树模型，包括：

在所述最优子树集合中选取出目标子树；

将所述目标子树作为优化后的决策树模型。

6.一种异常作业处理装置，其特征在于，包括：

7.根据权利要求6所述的装置，其特征在于，所述第二执行单元，包括：

获取子单元，用于获取所述批量作业的调度日志；

第四执行子单元，用于对每个所述训练子执行第一操作；

8.根据权利要求7所述的装置，其特征在于，所述选取子单元，包括：

9.根据权利要求7所述的装置，其特征在于，所述第二执行单元还包括：

10.根据权利要求9所述的装置，其特征在于，所述优化子单元，包括：