CN113448808B - 一种批处理任务中单任务时间的预测方法、系统及存储介质 - Google Patents

一种批处理任务中单任务时间的预测方法、系统及存储介质 Download PDF

Info

Publication number
CN113448808B
CN113448808B CN202111000535.5A CN202111000535A CN113448808B CN 113448808 B CN113448808 B CN 113448808B CN 202111000535 A CN202111000535 A CN 202111000535A CN 113448808 B CN113448808 B CN 113448808B
Authority
CN
China
Prior art keywords
batch
task
data
time
single task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111000535.5A
Other languages
English (en)
Other versions
CN113448808A (zh
Inventor
张文池
曹立
隋楷心
刘大鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Bishi Technology Co ltd
Original Assignee
Beijing Bishi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Bishi Technology Co ltd filed Critical Beijing Bishi Technology Co ltd
Priority to CN202111000535.5A priority Critical patent/CN113448808B/zh
Publication of CN113448808A publication Critical patent/CN113448808A/zh
Application granted granted Critical
Publication of CN113448808B publication Critical patent/CN113448808B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种批处理任务中单任务时间的预测方法、系统及存储介质,包括:获取所有跑批任务的历史数据;对所有跑批任务的历史数据进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分;获取单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日;确定单任务的指标类别和特殊日;将获得的单任务的指标类别对应的数据,输入到一个训练网络模型中进行预测,最终获得批处理任务中单任务时间的预测值。本发明解决了无法实现批处理时间的整体动态监控、无法实现单任务时长过长或过短监控、人力及设备资源浪费严重的技术问题,对批处理单任务检测的针对性强、准确率高。

Description

一种批处理任务中单任务时间的预测方法、系统及存储介质
技术领域
本发明涉及批处理任务的时间预测,具体涉及批处理任务中单任务的时间预测方法。
背景技术
批处理任务,指任务会按照一定周期定时执行(比如每天执行),比如数据备份、业务对账等。批处理任务是金融行业最基础和最重要的任务,重要业务如果不能按时完成会直接影响第二天的正常营业(如结息、对账),所以对批处理任务运行的监控是特别重要的,例如,单任务的运行时间不能过长,会影响后续任务的如期完成,单任务的运行时间过短,往往意味着任务报错提前退出或者没有拿到期望的输入。
目前业界对于跑批时间的预测均采用比较基础的时序预测算法,由管理员依据经验设置固定阈值。然而,现有的时序预测算法难以适应动态变化的系统,并且特殊日的维护和阈值需额外设置,耗费大量的人力。
现有技术通常是针对跑批时间的整体进行预测和监控,并未对单任务的跑批时长进行监控,尤其是未对单任务执行时长过短进行监控和预警。现有技术CN111737095A同样针对不同类型的数据进行判断。为满足不同数据的特点提高训练精度,该专利的技术方案采用不同的模型训练人为划分的不同的类别数据。然而,一是人为划分的方式无法准确体现数据特点,二是训练模型无法动态根据实际数据特点调整,三是多个模型无法综合处理数据间的耦合,故而无法实现泛化数据精细化处理。
另外,为保障跑批业务的正常运行,通常会配置相当比例的冗余机器专门用于处理批处理任务,以防由机器故障导致的跑批任务失败(如某国有银行有6台服务器专门处理跑批任务,一般CPU利用率不超过40%),设备资源浪费严重。
发明内容
为解决现有技术存在的无法实现批处理时间的整体动态监控、无法实现单任务的时长监控、人力及设备资源浪费严重,无法精细化处理泛化跑批数据的技术问题,本发明提供:
一种批处理任务中单任务时间的预测方法,包括:S1获取所有跑批任务的历史数据;S2 根据获取的所有跑批任务的历史数据,对所有跑批任务进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分;S3 获取单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日;S4 基于S2获得的指标类别,确定单任务的指标类别,以及基于S3的判断结果,确定单任务是否存在特殊日;S5 将获得的单任务的指标类别对应的数据,根据判定的聚类结果输入到一个训练网络模型中的多个通道,增设体现通道类型的数据标签,并输入公共的预测神经网络模块进行预测,最终获得批处理任务中单任务时间的预测值。
一种批处理任务中单任务时间的预测系统,包括以下模块:
数据获取模块,用于获取所有跑批任务的历史数据;指标类别划分模块,用于根据获取的所有跑批任务的历史数据,对所有跑批任务进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分;特殊日判断模块,用于获取的单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日;单任务数据类别确定模块,用于基于指标类别划分模块获得的指标类别,确定单任务的指标类别,以及基于特殊日判断模块的判断结果,确定单任务是否存在特殊日;单任务时间预测模块,用于将获得的单任务的指标类别对应的数据,输入一个训练网络模型中进行预测,最终获得批处理任务中单任务时间的预测值。
一种存储介质,其存储有计算机程序;当所述计算机程序被计算机设备中的处理器执行时,计算机设备执行如上述任一项所述的方法。
本发明基于批处理任务的历史跑批时长数据,聚类后进行典型数据的指标分类,实现了特殊日的自动识别,进而对不同的指标类别数据通过输入层的异构神经网络单独训练,再经公共神经网络进行训练与检测,最终获得跑批任务中单任务的时间预测,并支持检测结果的反馈和优化,从而实现了批处理任务通用的整体动态监控,以及单任务的时间预测,在提高时间预测与异常检测准确度的同时,节省了人力及设备资源。本发明通过耦合聚类结果并整合形成一个训练网络模型,将泛化的各类跑批数据综合至一个可适应不同数据特点的网络模型中,实现泛化数据精细化处理。
附图说明
为了更清楚地说明发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是不同数据形态的时序数据;
图2是典型的具有特殊日(月度/季度)的时序数据;
图3是本发明技术方案的整体处理流程;
图4是本发明的方法流程图;
图5是本发明的训练网络模型。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
本实施例提供了一种批处理任务中单任务时间的预测方法,如图1-5所示。
在所属领域,跑批任务的时序数据形态各异,有的数据周期性很明显(如历史统计分析,每周末会进行周分析),有的数据有节假日的特性(和线上业务相关的任务,如报表数据生成),有的数据有一定的趋势性(如数据备份任务),有的数据很稳定,偶尔有一些超长耗时的任务(可能是异常情况),图1(横轴表示时间,纵轴表示跑批耗时)给出了几种不同形态的跑批任务的时序数据。
另外,区别于一般的业务监控的时间序列,批处理任务存在很多“特殊日”,需要算法支持复杂的识别,特殊日可能包括但不限于:
i. 每个月的第一天、倒数第二天等
ii. 每个季度的最后一个月的20日
iii. 每年的最后一天
iv. 每个月的第一个工作日
图2是一个典型的具有特殊日的跑批任务的时序数据图,除了每个月的固定跑批,还有每个季度的固定跑批。
为实现不同数据形态的时序数据监测,自动识别特殊日,以及实现批处理的单任务监测,本发明提出一种批处理任务中单任务时间的预测方法,图3、4为本发明的整体处理过程示意图,包括以下步骤:
在不同的场景下,时间序列千差万别,本发明专注于跑批任务的历史执行时长。
S1获取所有跑批任务的历史数据。
具体的,每条历史数据取最新的700个数据点的数据(约2年的数据)。
S2 根据获取的所有跑批任务的历史数据,对所有跑批任务进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分。通过S2 对跑批数据的指标类别的划分,实现了针对不同数据指标类别的针对性训练,相比于现有技术采用统一模型对所有数据进行处理的做法,本发明有效提高了模型训练速度和预测结果准确度。
具体的,采用DBSCAN实现聚类。
进一步的,设置
Figure 100002_DEST_PATH_IMAGE001
,
Figure DEST_PATH_IMAGE002
Figure 100002_DEST_PATH_IMAGE003
作为一优先实施例,获得的聚类结果为3个,分别称为C1、C2、C3,其他未成簇的数据归为“其他类”O1。
S3 获取单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日。若判定存在特殊日,对该任务的特殊日进行单独训练,本发明通过人为通配特殊日及基于特殊日并结合非特殊日的DTW检验的双轨识别,并提前对自动识别特殊日进行单独训练,有效提高了特殊日预测的针对性和准确率。
具体的,判断是否存在特殊日可通过以下方式实现:
S3.1 预设特殊日日期。
具体的,设置特殊日包含普通节日、春节、特殊行为日期(如11月11日、6月18日等大型促销日)、每月/每季度/每年的某天(如倒数某天或倒数第K个工作日)。
S3.2 利用动态时间规整DTW算法,自动识别是否存在特殊日。
具体的,以判断某个任务的历史数据是否存在某一个特殊日(如每月1日)为例,经以下方式实现自动识别:
S3.2.1 筛选获得属于这个特殊日的数据;
S3.2.2 计算特殊日日期的DTW距离,并计算非特殊日日期的DTW距离;DTW距离通过以下公式计算:
Figure DEST_PATH_IMAGE004
其中,
Figure 100002_DEST_PATH_IMAGE005
表示跑批任务的执行时间,
Figure DEST_PATH_IMAGE006
表示跑批任务的序号,
Figure 100002_DEST_PATH_IMAGE007
表示第
Figure DEST_PATH_IMAGE008
次跑批任务和第
Figure 321988DEST_PATH_IMAGE009
次跑批任务耗时的差值的绝对值,
Figure DEST_PATH_IMAGE010
为第i次跑批任务和第j次跑批任务的匹配矩阵,
Figure 100002_DEST_PATH_IMAGE011
为第i-1次跑批任务和第j次跑批任务的匹配矩阵,
Figure DEST_PATH_IMAGE012
为第i次跑批任务和第j-1次跑批任务的匹配矩阵,
Figure 100002_DEST_PATH_IMAGE013
为第i-1次跑批任务和第j-1次跑批任务的匹配矩阵。。
S3.2.3 获取特殊日日期的DTW距离和非特殊日日期的DTW距离,并计算获取特殊日日期的DTW距离的分布和非特殊日日期的DTW距离的分布,通过K-S判断特殊日日期的DTW距离和非特殊日日期的DTW距离的分布是否一致,如果不一致,则判定计算的该任务的历史数据中存在特殊日类型。
S4 基于S2获得的指标类别,确定单任务的指标类别,以及基于S3的判断结果,确定单任务是否存在特殊日。
S5 将获得的单任务的指标类别对应的数据,根据判定的聚类结果输入到一个训练网络模型中的多个通道,增设体现通道类型的数据标签,并输入公共的预测神经网络模块进行预测,最终获得批处理任务中单任务时间的预测值。
其中,批处理任务中单任务时间的预测值表示单任务跑批时间的预测值。具体的,将不同的指标类别对应的数据和特殊日对应的数据放到一个训练网络模型中进行检测,训练网络模型包括神经网络异构处理模块和预测神经网络模块。本发明的网络模型如图5所示:
整个网络模型采用统一的目标函数,在网络模型最后输出预测结果后计算RMSE,并通过反向传播更新网络的权重。考虑到不同的数据具有不同的自身属性,本发明的网络模型的输入层采用异构结构(网络的尺寸不同),分为5部分,分别对应C1、C2、C3、O1的正常日的输入通道、以及特殊日数据的输入通道。
在一实施例中,C1通道设置为周期性明显的数据,C2通道设置为趋势性明显的数据,C3通道设置为波动值在极小范围内的数据,O1通道设置为波动范围较大,无明显特征的数据。通过网格搜索的方式,将按照上述四种特征聚类获得的数据,对应至同一模型的不同通道进行训练。不同通道分别适应数据特征,采用最佳匹配的神经元数量和结构、训练周期、及必要的其他参数。最佳匹配的神经元数量和结构、训练周期、及必要的其他参数的获得方式由单一通道的历史数据训练网络获得,并形成多种可选的固定搭配,以备适应不同特征的聚类后的数据。
上述方法将聚类后的不同类型的数据特征与训练模型相结合,模型的各个通道直接适应聚类后的数据特征,对跑批数据的特征、范围、波动程度均无特殊要求,更符合实际的跑批数据的特点,泛化兼容性更佳。此外,由于上述数据输入的是同一神经网络模型,而非现有技术公开的不同数据输入不同的多个神经网络模型,在后续的LSTM层和全连接层中多种不同特征的数据可以充分耦合,提高预测的精度。故而,本实施例通过耦合聚类结果并整合形成一个训练网络模型,将泛化的各类跑批数据综合至一个可适应不同数据特点的网络模型中,实现泛化数据精细化处理。
输入层神经网络根据不同数据的自身属性选择对应的输入神经元部分,并将其他的输入神经元部分在输入时置0,接下来经过各自的不同结构的LSTM层进行训练。其中,输入是指任务历史跑批时长的原始数据,如C1型数据是1 * 14的神经元,意味着把最近14天非特殊日的时长作为输入放入网络中。
经输入层各自不同结构的LSTM层训练后,进入预测神经网络模块,即公共神经网络模块,包括3层公共的LSTM层、1层公共的全连接层(MLP),最终输出对时间序列的预测值,也就是接下来一次跑批任务的预测时长。通过不同通道的LSTM数据数据输入至公共的LSTM层及全连接层前,所有数据集均带有标识源头的信息标签,使得在LSTM层及全连接层的所有数据集均带有体现通道的分类特点,进而在LSTM和MLP模型训练时,可针对不同的数据类型有不同的侧重点。本实施例通过在输入公共层的数据中差异性的增设体现通道类型的数据标签,有效提高了后续训练时的类型追溯性,进而提升反馈调优效率。
本发明通过在输入层对不同指标类别的数据、不同大小的数据分别训练,再将训练后的数据整合到公共神经网络模块进行统一的训练,最终获得时间预测值,相比于现有技术采用相同的模型实现所有数据的预测,或不基于不同指标不同大小进行划分的分别训练模型,或者分别采用相互独立的模型实现不同数据类别的预测的方式,本发明在有效提高数据处理的针对性和预测准确度的同时,降低了整个模型的复杂度,提高了计算效率。另外,在数据指标类别划分出现错误的情况下,由于公共神经网络模块的存在,相比于现有技术采用相互独立的模型实现不同数据类别预测的方式,本发明的预测结果也会相对更准确。综上,本发明将耦合聚类结果并整合形成一个训练网络模型,将泛化的各类跑批数据综合至一个可适应不同数据特点的网络模型中,实现泛化数据精细化处理。此外,通过进一步在输入公共层的数据中差异性的增设体现通道类型的数据标签,有效提高了后续训练时的类型追溯性,提升反馈调优效率。
作为一个实施例,本发明网络模型的LSTM和MLP采用pytorch实现。其中,本发明对LSTM的输入参数进行了设定,包括输入数据的大小和隐藏层的大小,num1*num2,num1表示输入数据的大小,num2表示隐藏层的大小,循环层的数量设置为1。同样作为一个实施例,本发明对MLP的输入维度和输出维度进行了设置,参见图5中的4*2。
本发明的目标函数采用的是预测的跑批时长和真实的跑批时长的RMSE(x,y):
Figure DEST_PATH_IMAGE014
其中,
Figure 100002_DEST_PATH_IMAGE015
表示用于训练的跑批任务的时间序列,
Figure DEST_PATH_IMAGE016
表示预测函数,
Figure 100002_DEST_PATH_IMAGE017
表示实际的跑批任务的时间序列,
Figure DEST_PATH_IMAGE018
表示预测的第
Figure 176549DEST_PATH_IMAGE018
个数据点,
Figure 100002_DEST_PATH_IMAGE019
表示预测的数据点个数。
具体的,上述参数采取搜索的方式,首先固定后续公共部分的参数,对前面特有的异构网络进行超参搜索,收敛后再固定前面异构网络的参数,对公共部分进行搜索,直到整体结构收敛。相比于整体搜索,上述搜索方式的搜索空间大大降低,收敛速度显著提升。
具体的,本发明采取对跑批任务进行动态的实时的持续训练,即最新的一次跑批任务完成后,先对其类型进行判断,同时训练得到这个跑批任务所含有的特殊日的情况。然后把最近一段时间的数据输入网络中进行训练,具体输入的数据长度取决于它的数据类型所对应的结构。最后能够得到下一次任务的预期时长以及它的特殊日的预期时长。
S6 根据预测结果,对训练网络模型进行反馈和优化学习。
具体的,可以针对以下几方面进行反馈:
1)针对特殊日是否符合实际业务的反馈
管理员可以手动增加或者删除某个特殊日,在下次训练中算法会优先考虑人工配置的部分,同时根据配置来修改K-S检验的置信程度的阈值。比如管理员认为一个
Figure DEST_PATH_IMAGE020
的特殊日并不特殊,那么阈值会自动修改为0.03对其余检测到的特殊日进行重新判断。
2)针对预测指标类别情况的反馈
管理员可以手动修改某个指标类别的情况,一旦修改后,根据该指标的实际距离修改eps参数,以使它能够属于目标类别,并重新对距离它很近的指标进行自动的类别修改。
3)针对于异常检测的判定范围的反馈
管理员可以手动修改某个指标的阈值范围,默认的10%可以根据实际情况进行调整。
在具体应用本发明的模型时,当程序接收到一个任务的开始信息后,先对其是否属于特殊日进行判断,然后取得训练好的模型中对应的预期时长作为任务执行时间的预测值。例如,本发明采用预测值的±10%作为合理的任务执行时间区域,一旦任务真实的执行时间超过这个范围,即产生报警信息 ,发给运维监控人员。
实施例二
本实施例还提供一种批处理单任务时间预测与异常检测系统,包括:
数据获取模块,用于获取所有跑批任务的历史数据。例如,每条历史数据取最新的700个数据点的数据(约2年的数据)。
指标类别划分模块,用于根据获取的所有跑批任务的历史数据,对所有跑批任务进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分。通过对跑批数据的指标类别的划分,实现了针对不同数据指标类别的针对性训练,相比于现有技术采用统一模型对所有数据进行处理的做法,本发明有效提高了模型训练速度和预测结果准确度。
作为实施例,采用DBSCAN实现聚类。
进一步的,设置
Figure DEST_PATH_IMAGE021
,
Figure 888897DEST_PATH_IMAGE002
Figure 683678DEST_PATH_IMAGE003
作为实施例,获得的聚类结果为3个,分别称为C1、C2、C3,其他未成簇的数据归为“其他类”O1。
特殊日判断模块,用于获取的单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日。若判定存在特殊日,对该任务的特殊日进行单独训练,本发明通过提前自动识别特殊日并进行单独训练,有效提高了特殊日预测的针对性和准确率。
具体的,判断是否存在特殊日可通过以下方式实现:
S3.1 预设特殊日日期。
具体的,设置特殊日包含普通节日、春节、特殊行为日期(如11月11日、6月18日等大型促销日)、每月/每季度/每年的某天(如倒数某天或倒数第K个工作日)。
S3.2 利用动态时间规整DTW算法,自动识别是否存在特殊日。
具体的,以判断某个任务的历史数据是否存在某一个特殊日类型(如每月1日)为例,经以下方式实现自动识别:
S3.2.1 筛选获得属于这个特殊日的数据;
S3.2.2 计算特殊日日期的DTW距离,非特殊日日期的其他数据同样两两计算DTW距离;DTW距离通过以下公式计算:
Figure DEST_PATH_IMAGE022
其中,
Figure 581227DEST_PATH_IMAGE005
表示跑批任务的执行时间,
Figure 170471DEST_PATH_IMAGE006
表示跑批任务的序号,
Figure 150541DEST_PATH_IMAGE007
表示第
Figure 483433DEST_PATH_IMAGE008
次跑批任务和第
Figure 969909DEST_PATH_IMAGE009
次跑批任务耗时的差值的绝对值,
Figure 261213DEST_PATH_IMAGE010
为第i次跑批任务和第j次跑批任务的匹配矩阵,
Figure 200350DEST_PATH_IMAGE011
为第i-1次跑批任务和第j次跑批任务的匹配矩阵,
Figure DEST_PATH_IMAGE023
为第i次跑批任务和第j-1次跑批任务的匹配矩阵,
Figure 9037DEST_PATH_IMAGE013
为第i-1次跑批任务和第j-1次跑批任务的匹配矩阵。
S3.2.3 获取特殊日日期的DTW距离和非特殊日日期的DTW距离,并计算DTW距离的分布,通过K-S判断特殊日日期的DTW距离和非特殊日日期的DTW距离的分布是否一致,如果不一致,则判定计算的单任务的历史数据中存在特殊日类型。
单任务数据类别确定模块,用于基于指标类别划分模块获得的指标类别,确定单任务的指标类别,以及基于特殊日判断模块的判断结果,确定单任务是否存在特殊日。
单任务时间预测模块,用于将获得的单任务的指标类别对应的数据,输入一个训练网络模型中进行预测,最终获得批处理任务中单任务时间的预测值。
具体的,将不同的指标类别数据和特殊日的指标数据放到一个训练网络模型中进行训练与检测,训练网络模型包括神经网络异构处理模块和预测神经网络模块。本发明的网络模型如图5所示:
整个网络模型采用统一的目标函数,在网络模型最后输出预测结果后计算RMSE,并通过反向传播更新网络的权重。考虑到不同的数据具有不同的自身属性,本发明的网络模型的输入层采用异构结构,即,不同尺寸的网络,分为5部分,分别对应C1、C2、C3、O1的正常日的输入、以及不分类别的特殊日数据的输入。
输入层神经网络根据不同数据的自身属性选择对应的输入神经元部分,并将其他的输入神经元部分在输入时置0,接下来经过各自的不同结构的LSTM层进行训练。其中,输入是指任务历史跑批时长的原始数据,如C1型数据是1 * 14的神经元,意味着把最近14天非特殊日的时长作为输入放入网络中。
经输入层各自不同结构的LSTM层训练后,进入预测神经网络模块,即公共神经网络模块,包括3层公共的LSTM层、1层公共的全连接层(MLP),最终输出对时间序列的预测值,也就是接下来一次跑批任务的预测时长。本发明通过在输入层对不同指标类别、不同尺寸的数据分别训练,再将训练后的数据整合到公共神经网络模块进行统一的训练,最终获得时间预测值,相比于现有技术采用完全相同的模型实现所有数据的预测,或者分别采用相互独立的模型实现不同数据类别的预测的方式,本发明在有效提高数据处理的针对性和预测准确度的同时,降低了整个模型的复杂度。另外,在数据指标类别划分出现错误的情况下,由于公共神经网络模块的存在,相比于现有技术采用相互独立的模型实现不同数据类别预测的方式,本发明的预测结果也会相对更准确。
作为一个实施例,本发明网络模型的LSTM和MLP采用pytorch实现。其中,本发明对LSTM的输入参数进行了设定,包括输入数据的大小和隐藏层的大小。num1*num2,num1表示输入数据的大小,num2表示隐藏层的大小,循环层的数量设置为1。同样作为一个实施例,本发明对MLP的输入维度和输出维度进行了设置,参见图5中的4*2。
其中,本发明目标函数采用的是预测的跑批时长和真实的跑批时长的RMSE(x,y):
Figure 881179DEST_PATH_IMAGE014
其中,
Figure 74875DEST_PATH_IMAGE015
表示用于训练的跑批任务的时间序列,
Figure 501308DEST_PATH_IMAGE016
表示预测函数,
Figure 441582DEST_PATH_IMAGE017
表示实际的跑批任务的时间序列,
Figure 902651DEST_PATH_IMAGE018
表示预测的第
Figure 4599DEST_PATH_IMAGE018
个数据点,
Figure 183908DEST_PATH_IMAGE019
表示预测的数据点个数。
具体的,上述参数采取搜索的方式,首先固定后续公共部分的参数,对前面特有的异构网络进行超参搜索,收敛后再固定前面异构网络的参数,对公共部分进行搜索,直到整体结构收敛。相比于整体搜索,上述搜索方式的搜索空间大大降低,收敛速度显著提升。
反馈模块,用于基于预测结果,对训练网络模型进行反馈和优化学习。
具体的,可以针对以下几方面进行反馈:
1)针对特殊日是否符合实际业务的反馈
管理员可以手动增加或者删除某个特殊日,在下次训练中算法会优先考虑人工配置的部分,同时根据配置来修改K-S检验的置信程度的阈值。比如管理员认为一个
Figure 865556DEST_PATH_IMAGE020
的特殊日并不特殊,那么阈值会自动修改为0.03并对其余检测到的特殊日进行重新判断。
2)针对预测指标类别情况的反馈
管理员可以手动修改某个指标类别的情况提供每个类别的典型指标样式,一旦修改后,根据该指标的实际距离修改eps参数,以使它能够属于目标类别,并重新对距离它很近的指标进行自动的类别修改。
3)针对于异常检测的判定范围的反馈
管理员可以手动修改某个指标的阈值范围,默认的10%可以根据实际情况进行调整。
实施例三
本实施例提供一种计算机可读存储介质,其存储有计算机程序;当所述计算机程序被计算机设备中的处理器执行时,使得计算机设备执行实施例一任一所述的方法。
实施例一至三基于批处理任务的历史跑批时长数据,聚类后获得数据的典型指标分类,实现特殊日的自动识别后,通过神经网络异构处理模块对不同类别数据进行针对性的处理及融合,再经公共神经网络进行进一步的训练与检测,最终获得单任务跑批数据的时间预测,并支持检测结果的反馈和优化,从而实现了批处理任务通用的整体动态监控,以及单任务的时间预测和异常检测,在提高时间预测与异常检测准确度的同时,节省了人力及设备资源。本发明将聚类后的不同类型的数据特征与训练模型相结合,模型的各个通道直接适应聚类后的数据特征,对跑批数据的特征、范围、波动程度均无特殊要求,更符合实际的跑批数据的特征,泛化兼容性更佳。此外,由于上述数据输入的是同一神经网络模型,而非现有技术公开的不同数据输入不同的多个神经网络模型,在后续的LSTM层和全连接层中多种不同特征的数据可以充分耦合,提高预测的精度。
综上,本发明将耦合聚类结果并整合形成一个训练网络模型,将泛化的各类跑批数据综合至一个可适应不同数据特点的网络模型中,实现泛化数据精细化处理。此外,通过进一步在输入公共层的数据中差异性的增设体现通道类型的数据标签,有效提高了后续训练时的类型追溯性,提升反馈调优效率。
为了说明的目的,前述描述使用具体命名以提供对所述实施方案的透彻理解。然而,对于本领域的技术人员而言将显而易见的是,不需要具体细节即可实践所述实施方案。因此,出于例示和描述的目的,呈现了对本文所述的具体实施方案的前述描述。这些描述并非旨在是穷举性的或将实施方案限制到所公开的精确形式。对于本领域的普通技术人员而言将显而易见的是,鉴于上面的教导内容,许多修改和变型是可行的。另外,当在本文中用于指部件的位置时,上文和下文的术语或它们的同义词不一定指相对于外部参照的绝对位置,而是指部件的参考附图的相对位置。
此外,前述附图和描述包括许多概念和特征,其可以多种方式组合以实现多种有益效果和优点。因此,可组合来自各种不同附图的特征,部件,元件和/或概念,以产生未必在本说明书中示出或描述的实施方案或实施方式。此外,在任何特定实施方案和/或实施方式中,不一定需要具体附图或说明中所示的所有特征,部件,元件和/或概念。应当理解,此类实施方案和/或实施方式落入本说明书的范围。

Claims (9)

1.一种批处理任务中单任务时间的预测方法,其特征在于,包括以下步骤:
S1获取所有跑批任务的历史数据;
S2 根据获取的所有跑批任务的历史数据,对所有跑批任务进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分;
S3 获取单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日;
S4 基于S2获得的指标类别,确定单任务的指标类别,以及基于S3的判断结果,确定单任务是否存在特殊日;
S5 将获得的单任务的指标类别对应的数据,根据判定的聚类结果输入到一个训练网络模型中的多个通道,增设体现通道类型的数据标签,并输入公共的预测神经网络模块进行预测,最终获得批处理任务中单任务时间的预测值;
其中,所述训练网络模型包括神经网络异构处理模块和预测神经网络模块;将获得的单任务指标类别对应的数据分别输入到输入层的神经网络异构处理模块,经输入层与所述单任务指标类别对应的LSTM层训练后,进入预测神经网络模块,经预测神经网络模块计算后,最终输出对批处理任务中单任务时间的预测值。
2.根据权利要求1所述的批处理任务中单任务时间的预测方法,其特征在于,所述S2采用DBSCAN实现聚类,设置
Figure DEST_PATH_IMAGE001
,
Figure 57106DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
3.根据权利要求1所述的批处理任务中单任务时间的预测方法,其特征在于,所述S3具体包括以下步骤:
S3.1 预设特殊日日期;
S3.2 利用动态时间规整DTW算法,自动识别是否存在特殊日。
4.根据权利要求3所述的批处理任务中单任务时间的预测方法,其特征在于,所述S3.2具体包括以下步骤:
S3.2.2 计算特殊日日期的DTW距离,并计算非特殊日日期的DTW距离;DTW距离通过以下公式计算:
Figure 977788DEST_PATH_IMAGE004
其中,
Figure DEST_PATH_IMAGE005
表示跑批任务的执行时间,
Figure 472134DEST_PATH_IMAGE006
表示跑批任务的序号,
Figure DEST_PATH_IMAGE007
表示第
Figure 161872DEST_PATH_IMAGE008
次跑批任务和第
Figure 656439DEST_PATH_IMAGE010
次跑批任务耗时的差值的绝对值;
Figure DEST_PATH_IMAGE011
为第i次跑批任务和第j次跑批任务的匹配矩阵,
Figure 77799DEST_PATH_IMAGE012
为第i-1次跑批任务和第j次跑批任务的匹配矩阵,
Figure DEST_PATH_IMAGE013
为第i次跑批任务和第j-1次跑批任务的匹配矩阵,
Figure 227765DEST_PATH_IMAGE014
为第i-1次跑批任务和第j-1次跑批任务的匹配矩阵;
S3.2.3 获取特殊日日期的DTW距离和非特殊日日期的DTW距离,并分别计算特殊日日期的DTW距离的分布和非特殊日日期的DTW距离的分布,通过K-S检验判断特殊日日期的DTW距离和非特殊日日期的DTW距离的分布是否一致,如果不一致,则判定计算的单任务的历史数据中存在特殊日类型。
5.根据权利要求1所述的批处理任务中单任务时间的预测方法,其特征在于:所述预测神经网络模块包括3层公共的LSTM层、1层公共的全连接层MLP。
6.根据权利要求1所述的批处理任务中单任务时间的预测方法,其特征在于,训练网络模型的目标函数采用的是时间的预测值和真实的跑批时长的RMSE:
Figure DEST_PATH_IMAGE015
其中,
Figure 34659DEST_PATH_IMAGE016
表示用于训练的跑批任务的时间序列,
Figure DEST_PATH_IMAGE017
表示预测函数,
Figure 106651DEST_PATH_IMAGE018
表示实际的跑批任务的时间序列,
Figure DEST_PATH_IMAGE019
表示预测的第
Figure 218571DEST_PATH_IMAGE019
个数据点,
Figure 752320DEST_PATH_IMAGE020
表示预测的数据点个数。
7.根据权利要求1所述的批处理任务中单任务时间的预测方法,其特征在于,所述批处理任务中单任务时间的预测方法还包括:S6根据预测结果,对训练网络模型进行反馈和优化学习,其中,所述反馈至少包括针对特殊日是否符合实际业务的反馈、针对预测指标类别情况的反馈或针对于异常检测的判定范围的反馈中的一项或几项的组合。
8.一种批处理任务中单任务时间的预测系统,其特征在于,包括以下模块:
数据获取模块,用于获取所有跑批任务的历史数据;
指标类别划分模块,用于根据获取的所有跑批任务的历史数据,对所有跑批任务进行聚类,并对聚类结果进行判定,实现跑批数据的指标类别的划分;
特殊日判断模块,用于获取的单任务的历史数据,并对单任务的历史数据进行动态时间规整DTW检验,自动判断单任务是否存在特殊日;
单任务数据类别确定模块,用于基于指标类别划分模块获得的指标类别,确定单任务的指标类别,以及基于特殊日判断模块的判断结果,确定单任务是否存在特殊日;
单任务时间预测模块,用于将获得的单任务的指标类别对应的数据,根据判定的聚类结果输入到一个训练网络模型中的多个通道,增设体现通道类型的数据标签,并输入公共的预测神经网络模块进行预测,最终获得批处理任务中单任务时间的预测值;
其中,所述训练网络模型包括神经网络异构处理模块和预测神经网络模块;将获得的单任务指标类别对应的数据分别输入到输入层的神经网络异构处理模块,经输入层与所述单任务指标类别对应的LSTM层训练后,进入预测神经网络模块,经预测神经网络模块计算后,最终输出对批处理任务中单任务时间的预测值。
9.一种存储介质,其特征在于,其存储有计算机程序;当所述计算机程序被计算机设备中的处理器执行时,计算机设备执行如权利要求1-7任一项所述的方法。
CN202111000535.5A 2021-08-30 2021-08-30 一种批处理任务中单任务时间的预测方法、系统及存储介质 Active CN113448808B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111000535.5A CN113448808B (zh) 2021-08-30 2021-08-30 一种批处理任务中单任务时间的预测方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111000535.5A CN113448808B (zh) 2021-08-30 2021-08-30 一种批处理任务中单任务时间的预测方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN113448808A CN113448808A (zh) 2021-09-28
CN113448808B true CN113448808B (zh) 2021-11-12

Family

ID=77818960

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111000535.5A Active CN113448808B (zh) 2021-08-30 2021-08-30 一种批处理任务中单任务时间的预测方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN113448808B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117130873B (zh) * 2023-10-26 2024-01-26 中国证券登记结算有限责任公司 一种任务监控的方法和装置
CN117707747B (zh) * 2024-02-06 2024-05-24 山东省计算中心(国家超级计算济南中心) 基于资源使用率预测的作业超量分配调度方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109685240B (zh) * 2018-10-24 2023-10-13 国网浙江省电力有限公司 一种基于lstm深度学习的95598话务工单预测与异动预警方法
CN109754113B (zh) * 2018-11-29 2022-08-30 南京邮电大学 基于动态时间规整与长短时间记忆的负荷预测方法
CN110457159A (zh) * 2019-08-21 2019-11-15 深圳前海微众银行股份有限公司 一种处理批量任务的方法、装置、计算设备及存储介质
CN111737095A (zh) * 2020-08-05 2020-10-02 北京必示科技有限公司 批处理任务时间监控方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113448808A (zh) 2021-09-28

Similar Documents

Publication Publication Date Title
US20230143654A1 (en) Method for smart gas pipeline network inspection and internet of things system thereof
JP7167009B2 (ja) 自動車保証の不正の予測のためのシステム及び方法
US20200125465A1 (en) Automatic prediction system for server failure and method of automatically predicting server failure
CN113448808B (zh) 一种批处理任务中单任务时间的预测方法、系统及存储介质
KR101966557B1 (ko) 빅데이터와 머신러닝을 이용한 수리부속수요 예측 시스템 및 방법
US7899761B2 (en) System and method for signal prediction
CN106201897B (zh) 基于主成分分布函数的软件缺陷预测不平衡数据处理方法
CN113935497A (zh) 智能运维故障处理方法、装置、设备及其存储介质
CN109919423B (zh) 一种基于深度学习的智慧水务管理方法及系统
CN114267178B (zh) 一种车站的智能运营维护方法及装置
Chongwatpol Prognostic analysis of defects in manufacturing
CN115796372A (zh) 一种基于scor的供应链管理优化方法及系统
CN115423289B (zh) 智能板材加工车间数据处理方法及终端
CN114155072A (zh) 基于大数据分析的财务预测模型构建方法及系统
Lyu et al. A data-driven approach for identifying possible manufacturing processes and production parameters that cause product defects: A thin-film filter company case study
CN109409780B (zh) 变更处理方法、装置、计算机设备和存储介质
CN113723637B (zh) 一种面向船舶维修体系的经济性修理级别分析方法及系统
CN110781206A (zh) 一种学习拆回表故障特征规则预测在运电能表是否故障的方法
US20170236071A1 (en) Alarm management system
CN109829115B (zh) 搜索引擎关键词优化方法
CN115577890A (zh) 智能质量管理方法、电子装置及存储介质
CN116308679A (zh) 供应链异常订单处理方法、装置、设备及存储介质
CN111160717A (zh) 一种企业创新潜力评估方法和装置
CN114647951A (zh) 一种基于模糊运算的fms可靠性动态量化评价方法
TWI821666B (zh) 服務管理系統及服務資訊流程的調適方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant