CN115587008A - 一种任务监控方法、装置、服务器和存储介质 - Google Patents

一种任务监控方法、装置、服务器和存储介质 Download PDF

Info

Publication number
CN115587008A
CN115587008A CN202211185865.0A CN202211185865A CN115587008A CN 115587008 A CN115587008 A CN 115587008A CN 202211185865 A CN202211185865 A CN 202211185865A CN 115587008 A CN115587008 A CN 115587008A
Authority
CN
China
Prior art keywords
target task
time
task
predicted
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211185865.0A
Other languages
English (en)
Inventor
袁征
王巧慧
刘建家
黄勇涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202211185865.0A priority Critical patent/CN115587008A/zh
Publication of CN115587008A publication Critical patent/CN115587008A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开一种任务监控方法、装置、服务器和存储介质,该方法包括:根据目标任务的数据量增长率,确定目标任务的预测耗时;确定与目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各数据处理任务的配置信息确定目标任务的预测开始时间;根据目标任务的预测开始时间和预测耗时确定目标任务的预测结束时间;比较目标任务的预测结束时间和期望完成时间,根据比较结果确定目标任务的完成情况。上述技术方案,确定目标任务更精确的预测耗时和预测开始时间以确定更精确的预测结束时间,根据预测结束时间和期望结束时间确定目标任务的完成情况,在目标任务执行前对目标任务完成情况进行预测,实现对目标任务的监控。

Description

一种任务监控方法、装置、服务器和存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种任务监控方法、装置、服务器和存储介质。
背景技术
数据仓库技术(Extraction-Transformation-Loading,ETL)用于描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程。随着数据中心的数据处理需求不断提高,需要多个服务器构成的服务器集群内多台服务器并行执行以同时执行大量的数据处理任务,即需要同时执行多个ETL。为了确保数据处理任务的正常运行,对各数据处理任务的监控就显得极为重要。
现有技术中,在服务器资源充足的情况下可以实时监控各数据处理任务的执行状态,并在任务数据处理任务运行超时后进行告警。
在实现本发明的过程中,发明人发现现有技术中至少存在以下技术问题:
仅可以在数据处理任务运行超时后进行告警,无法预测数据处理任务是否可以顺利完成。
发明内容
本发明提供一种任务监控方法、装置、服务器和存储介质,对数据处理任务进行实时监控,以在数据处理任务执行前确定数据处理任务是否可以顺利完成。
第一方面,本发明实施例提供了一种任务监控方法,包括:
根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
第二方面,本发明实施例还提供了一种任务监控装置,包括:
预测耗时确定模块,用于根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
预测开始时间确定模块,用于确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
预测结束时间确定模块,用于根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
执行模块,用于比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
第三方面,本发明实施例还提供了一种服务器,所述服务器包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面中任一项所述的任务监控方法。
第四方面,本发明实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行第一方面中任一所述的任务监控方法。
上述发明中的实施例具有如下优点或有益效果:
本发明实施例提供一种任务监控方法,包括:根据目标任务的数据量增长率,确定所述目标任务的预测耗时;确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。上述技术方案,一方面,可以根据目标任务的数据量增长率确定目标任务更加精确的预测耗时,又一方面,可以根据服务器集群中运行的各数据处理任务的配置信息确定各数据处理任务的执行顺序,并根据各数据处理任务的执行顺序、计划开始时间、节点资源使用量和队列资源使用量,在服务器集群的各队列中对各数据处理任务进行排队,以确定目标任务的排队开始时间,进而确定目标任务更加精确的预测开始时间,在确定目标任务的预测耗时和预测开始时间后,可以根据目标任务的预测耗时和预测开始时间确定目标任务的预测结束时间,并根据预测结束时间和期望结束时间确定目标任务的完成情况,在目标任务执行前对目标任务的完成情况进行预测,实现对目标任务的监控。
附图说明
图1为本发明实施例提供的一种任务监控方法的流程图;
图2为本发明实施例提供的另一种任务监控方法的流程图;
图3为本发明实施例提供的运行在服务器集群上以执行任务监控方法的监控系统的示意图;
图4为本发明实施例提供的另一种任务监控方法中步骤230的流程图;
图5为本发明实施例提供的另一种任务监控方法中各数据处理任务的执行顺序和资源占用情况示意图;
图6为本发明实施例提供的另一种任务监控方法中对各数据处理进行排队的示意图;
图7为本发明实施例提供的另一种任务监控方法中对数据处理任务完成异常的示意图;
图8为本发明实施例提供的另一种任务监控方法的实现流程图;
图9为本发明实施例提供的一种任务监控装置的结构示意图;
图10为本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。此外,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
ETL可以将分布的异构数据源中的数据,如关系数据、平面数据文件等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,是数据处理和数据挖掘的基础。因此,对ETL对应的数据处理任务进行监控就显得极为重要。
随着数据量和数据处理任务的增多,现有技术仅可以在当前数据处理任务运行超时后进行告警,无法提前预测当前数据处理任务是否可以顺利完成,无法提醒工作人员提前处理异常数据处理任务,可能导致当前数据处理任务之后的数据处理任务均延迟,影响数据处理的时效性。
因此,本申请提出一种任务监控方法,在数据处理任务执行前对数据处理任务进行预测,以确定数据处理任务是否可以顺利完成,下面将结合示图和实施例对本申请提出的任务监控方法进行详细的描述。
图1为本发明实施例提供的一种任务监控的流程图,本发明实施例可适用于需要在数据处理任务执行前准确预测数据处理任务运行状态的情况。该方法可以由任务监控装置来执行,该装置可以由软件和/或硬件的方式来实现。如图1所述,该方法具体包括以下步骤:
步骤110、根据目标任务的数据量增长率,确定所述目标任务的预测耗时。
具体地,随着时间的推移,执行数据处理任务时,需要处理的数据量可能发生变化,而数据量的变化,会影响数据处理任务的执行速度,进而影响执行数据处理任务的耗时。因此,可以根据目标任务对应的数据量增长率,确定目标任务的预测耗时。
本发明实施例中,在确定目标任务的预测耗时时,充分考虑到了目标任务执行数据处理任务时需要处理的数据量的增长率,使确定的目标任务的预测耗时更加精确,当然,更加精确的预测耗时可以确定更加精确的预测结束时间,为确定目标任务的完成情况提供更加精确的数据储备。
步骤120、确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间。
其中,此处的服务器可以为多个服务器构成的服务器集群,服务器集群中存在多个队列,各队列中可以同时执行多个数据处理任务。服务器集群的内存可以称为集群资源,队列的内存可以称为队列资源,服务器集群内节点的内存可以称为节点资源。服务器集群中可以运行有调度系统、元数据系统和集群管理系统。调度系统中存储有运行在各队列中的数据处理任务的配置信息,即执行数据处理任务所需的队列资源和节点资源;元数据系统中存储有运行在各队列中的数据处理任务的脚本或程序,数据处理任务的脚本或程序记录有执行该数据处理任务时,读取或写入的库表信息以及分区信息;集群管理系统可以存储有服务器集群内各队列的队列资源以及集群内的节点资源。
数据处理任务的配置信息可以包括数据处理任务的上下游关系、计划开始时间、节点资源使用量和队列资源使用量。
具体地,服务器集群中可以并行、串行执行多个数据处理任务。调度系统中存储有运行在各队列中的数据处理任务的配置信息。因此,可以根据各数据处理任务的配置信息中的上下游关系确定服务器集群中运行的各数据处理任务对应的有向无环图(Directedacyclic graph,DAG),DAG可以表明服务器集群中运行的各数据处理任务的执行顺序。由于各数据处理任务的配置信息还包括数据处理任务的计划开始时间、节点资源使用量和队列资源使用量,因此,在确定服务器集群中运行的各数据处理任务的执行顺序时,还可以确定各数据处理任务的排队开始时间。
在实际应用中,目标任务对应的上一数据处理任务的结束时间、目标任务的计划开始时间和排队开始时间均会影响目标任务的开始时间。为了确保预测开始时间的准确,可以将目标任务对应的上一数据处理任务的结束时间、目标任务的计划开始时间和排队开始时间中最晚的时间确定为目标任务的预测开始时间。
当然,如果目标任务对应的上一数据处理任务的结束时间与计划结束时间一致,目标任务所在队列内的剩余队列资源足以支持目标任务运行,服务器集群内节点的节点资源也足以支持目标任务运行,则目标任务的预测开始时间与计划开始时间一致。
本发明实施例中,可以根据服务器集群中运行的各数据处理任务的配置信息确定各数据处理任务的执行顺序,进而可以在服务器集群的各队列中对各数据处理任务进行排队,实现确定目标任务的排队开始时间,为了确保目标任务的预测开始时间的准确,可以将目标任务对应的上一数据处理任务的结束时间、目标任务的计划开始时间和排队开始时间中的最晚的时间确定为目标任务的预测开始时间。
步骤130、根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间。
具体地,在确定目标任务的预测开始时间后,可以将预测开始时间增加预测耗时得到的时间确定为目标任务的预测结束时间。
本发明实施例中,可以根据预测开始时间和预测耗时确定目标任务的预测结束时间,实现对目标任务的结束时间的预测。
步骤140、比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
其中,数据处理任务的配置信息还可以包括数据处理任务的期望完成时间。
具体地,比较目标任务的预测结束时间和目标任务的配置信息中的期望完成时间,如果预测结束时间晚于期望完成时间,则确定目标任务完成异常;如果目标任务的预测结束时间不晚于期望完成时间,则确定目标任务完成正常。
目标任务完成异常的原因可能包括:目标任务抽取数据的数据源无法链接、执行目标任务所需处理的数据量暴增或者目标任务脚本逻辑不严谨等。
在实际应用中,如果目标任务完成异常,则可以向管理中心对应的客户端发送告警信息,以告知工作人员目标任务异常,以便于工作人员及时维护目标任务。
本发明实施例中,在确定目标任务的预测结束时间后,可以根据预测结束时间和期望结束时间的比较结果预测目标任务的完成情况,实现对目标任务的监控,便于工作人员及时得知目标任务的完成情况,以便做出及时的处理。
本发明实施例提供的一种任务监控方法,包括:根据目标任务的数据量增长率,确定所述目标任务的预测耗时;确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。上述技术方案,一方面,可以根据目标任务的数据量增长率确定目标任务更加精确的预测耗时,又一方面,可以根据服务器集群中运行的各数据处理任务的配置信息确定各数据处理任务的执行顺序,并根据各数据处理任务的执行顺序、计划开始时间、节点资源使用量和队列资源使用量,在服务器集群的各队列中对各数据处理任务进行排队,以确定目标任务的排队开始时间,进而确定目标任务更加精确的预测开始时间,在确定目标任务的预测耗时和预测开始时间后,可以根据目标任务的预测耗时和预测开始时间确定目标任务的预测结束时间,并根据预测结束时间和期望结束时间确定目标任务的完成情况,在目标任务执行前对目标任务的完成情况进行预测,实现对目标任务的监控。
图2为本发明实施例提供的另一种任务监控方法的流程图,本发明实施例可适用于需要在数据处理任务执行前准确预测数据处理任务运行状态的情况。本发明实施例在上述实施例的基础上,在根据目标任务的数据量增长率,确定所述目标任务的预测耗时之前,增加了“通过所述目标任务的历史执行记录,确定所述目标任务的历史耗时和历史数据量;根据所述目标任务的当前数据量和历史数据量确定所述目标任务的数据量增长率。”;在确定所述目标任务完成异常之后,增加了“根据各所述数据处理任务的队列资源使用量,确定空闲队列资源;根据所述空闲队列资源和总队列资源确定资源倾斜系数,根据所述资源倾斜系数更新所述目标任务的预测耗时,得到更新后预测耗时;基于所述目标任务的预测开始时间和更新后预测耗时确定所述目标任务的更新后预测结束时间;比较所述目标任务的更新后预测结束时间和期望完成时间,根据比较结果更新所述目标任务的完成情况。”,其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图2,本发明实施例提供的任务监控方法包括:
步骤210、通过目标任务的历史执行记录,确定所述目标任务的历史耗时和历史数据量。
图3为本发明实施例提供的运行在服务器集群上以执行任务监控方法的监控系统的示意图,如图3所示,监控系统与运行在服务器集群上的调度系统、元数据系统以及集群管理系统通信连接,以从调度系统、元数据系统以及集群管理系统处获取任务监控所需的数据。
具体地,如图3所示,监控系统可以包括第一层和第二层,第一层为汇总模块,第二层为预测模块。监控系统可以基于汇总模块从元数据系统中获取目标任务的历史执行记录,以确定历史时间段内执行目标任务所花费的时间,即历史耗时,以及执行目标任务所处理的数据量,即历史数据量。
在实际应用中,历史时间段可以为当前时刻之前的30天或者7天,具体历史时间段的选择可以根据实际需求进行确定。
例如,历史时间段为30天时,可以确定当前时刻之前的30天的平均耗时,首先可以去除前20天的耗时中最长2条耗时和最短2条耗时,然后根据剩余16天的耗时计算第一平均时长,其次可以去除最近10天的耗时中最长耗时和最短耗时,然后根据剩余8天的耗时计算第二平均时长,进而可以为第一平均时长赋予30%的权重,为第二平均时长赋予70%的权重,确定30天的历史耗时。
随着时间的推进,可能优化了目标任务的函数或者脚本,使得执行目标任务的耗时变短。充分考虑到了这种情况,为靠近当前时刻的时间段内执行目标任务的耗时赋予更高的权重,以确定更加执行目标任务精确的历史耗时。
本发明实施例中,运行在服务器集群上的元数据系统中可以存储有运行在服务器集群上的各数据处理任务的历史执行记录,进而可以根据目标任务的历史执行记录确定历史耗时和历史数据量,为确定目标任务更加精确的预测耗时提供数据储备。
步骤220、根据所述目标任务的当前数据量和历史数据量确定所述目标任务的数据量增长率。
具体地,监控系统可以将汇总模块所获取的目标任务的历史耗时和历史数据量发送至预测模块,预测模块首先可以根据目标任务的当前数据量和历史数据量确定数据量增长量,其次可以根据数据量增长量和历史数据量确定数据量增长量,即数据量增长环比。
本发明实施例中,在服务器集群中执行目标任务所需处理的数据量的增长会影响目标任务的执行速度,进而影响执行目标任务的耗时,因此,确定目标任务所需处理的数据量的数据量增长率,进一步为确定目标任务更加精确的预测耗时提供数据储备。
步骤230、根据所述目标任务的数据量增长率,确定所述目标任务的预测耗时。
具体地,监控系统的预测模块确定目标任务的数据量增长率之后,可以根据目标任务的数据量增长率,确定目标任务的预测耗时。
图4为本发明实施例提供的另一种任务监控方法中步骤230的流程图,如图4所示,一种实施方式中,步骤230具体可以包括:
步骤2310、根据所述目标任务的数据量增长率、历史耗时和预设权重确定所述目标任务的耗时增加量。
进一步地,所述预设权重包括聚合函数权重和集群资源倾斜权重,相应地,步骤2310具体可以包括:
将所述聚合函数权重与所述目标任务的数据量增长率以及历史耗时的乘积确定为第一数值;根据所述第一数值和所述集群资源倾斜权重确定所述目标任务的耗时增加量。
其中,预设权重可以包括执行目标任务时运行的聚合函数对应的聚合函数权重,也可以包括执行目标任务时调用的集群资源对应的集群资源倾斜权重。当然,聚合函数权重和集群资源倾斜权重均可以在执行数据处理任务之前进行预设,预设原则同样与执行数据处理任务时需要处理的数据量有关。进而可以根据目标任务的数据量增长率和历史耗时,以及预设的聚合函数权重和集群资源倾斜权重,确定目标任务的预测耗时。聚合函数权重为1时,目标任务的预测耗时与历史耗时保持一致。随着目标任务所需处理的数据量的增大,可以确定新的聚合函数权重,以提升目标任务的执行效率。新的聚合函数权重的取值在1-2之间,因此,新的聚合函数权重与1的差值在0-1之间。集群资源倾斜权重可以为1或者集群资源内空闲队列资源与总队列资源的比值。如果目标任务所在队列未经过扩展,则确定集群资源倾斜权重为1,否则,可以确定集群资源倾斜权重为集群资源内空闲队列资源与总队列资源的比值。
具体地,可以根据聚合函数权重、目标任务的数据量增长率以及历史耗时的乘积确定第一数值,并将第一数值和集群资源倾斜权重的商值确定为目标任务的耗时增加量。
步骤2320、根据所述目标任务的历史耗时和耗时增加量确定所述目标任务的预测耗时。
具体地,在确定目标任务的耗时增加量后,可以将目标任务的历史耗时和耗时增加量的和值确定为目标任务的预测耗时。
本发明实施例中,可以根据影响耗时增加量的三个因素,即集群资源倾斜权重、聚合函数权重以及目标任务的数据量增长率,确定执行目标任务的耗时增加量,并根据目标任务的历史耗时和耗时增加量确定目标任务的预测耗时,由于充分考虑到了影响目标任务的耗时增加量,因此,确定的目标任务的预测耗时更加精确。
步骤240、根据各所述数据处理任务的配置信息中的上下游关系确定各所述数据处理任务的执行顺序。
其中,数据处理任务的配置信息可以包括数据处理任务的上下游关系,即任一数据处理任务的配置信息可以包括该数据处理任务对应的上一数据处理任务和下一数据处理任务。
具体地,监控系统可以基于汇总模块从调度系统中获取各数据处理任务的配置信息中数据处理任务的上下游关系,并确定各数据任务对应的服务器集群中运行的各数据处理任务对应的DAG,进一步可以根据DAG确定服务器集群中运行的各数据处理任务的执行顺序。
本发明实施例中,确定服务器集群执行各数据处理任务时的DAG,实现确定各数据处理任务的执行顺序。
步骤250、根据各所述数据处理任务的执行顺序,以及各所述数据处理任务的配置信息中的计划开始时间、节点资源使用量和队列资源使用量,在集群资源的各队列资源内对各所述数据处理任务进行排队,以确定所述目标任务的排队开始时间。
具体地,监控系统可以基于汇总模块确定各数据处理任务的执行顺序,也可以基于汇总模块从调度系统获取各数据处理任务的计划开始时间、队列资源使用量和节点资源使用量,从集群管理系统获取服务器集群内总队列资源量和总节点资源量。汇总模块也可以将各数据处理任务的执行顺序,各数据处理任务的计划开始时间、队列资源使用量和节点资源使用量,以及服务器集群内总队列资源量和总节点资源量发送至预测模块。进而预测模块可以根据各数据处理任务的计划开始时间、队列资源使用量和节点资源使用量,以及各数据处理任务的执行顺序,在服务器集群的各队列中对各数据处理任务进行排队,以确定目标任务的排队开始时间。
图5为本发明实施例提供的另一种任务监控方法中各数据处理任务的执行顺序和资源占用情况示意图,如图5所示,数据处理任务A计划在9点到10点之间执行,且占用1C(核)节点资源和1G队列资源,数据处理任务B计划在10点到11点之间执行,且占用2C节点资源和2G队列资源,数据处理任务C计划在11点到13点之间执行,且占用1C节点资源和1G队列资源,数据处理任务D计划在10点到11点之间执行,且占用1C节点资源和1G队列资源,数据处理任务E计划在12点到13点之间执行,且占用2C节点资源和2G队列资源,数据处理任务F计划在13点到14点之间执行,且占用2C节点资源和2G队列资源。且数据处理任务A、B、C、D、E、F的执行顺序为“A-B-C”和“D-E-F”。
图6为本发明实施例提供的另一种任务监控方法中对各数据处理进行排队的示意图,如图6所示,服务器集群中各队列对应的总队列资源为3G,当然,服务器集群内节点对应的总节点资源可以大于3核,以确保数据处理任务B、D可以在10点到11点之间同时执行,数据处理任务C、E可以在12点到13点之间同时执行。进而,可以在服务器集群的队列内对各数据处理任务进行排队,得到如图5所示的排队结果,因此可以确定服务器集群内任一数据处理任务的排队开始时间。例如,可以确定数据处理任务A的排队开始时间为9点,数据处理任务B的排队开始时间为10点,数据处理任务C的排队开始时间为11点,数据处理任务D的排队开始时间为10点,数据处理任务E的排队开始时间为12点,数据处理任务F的排队开始时间为13点。
本发明实施例中,通过在服务器集群的队列中对各数据处理任务进行排队,实现确定各数据处理任务的排队开始时间,即实现确定目标任务的排队开始时间。
步骤260、根据所述目标任务所对应上一数据处理任务的结束时间以及所述目标任务的计划开始时间和排队开始时间,确定所述目标任务的预测开始时间。
一种实施方式中,步骤260具体可以包括:
按照时间顺序对所述目标任务所对应上一数据处理任务的结束时间、所述目标任务的计划开始时间和所述目标任务的排队开始时间进行排序;根据排序结果确定所述目标任务的预测开始时间。
具体地,目标任务对应的上一数据处理任务的结束时间会影响目标任务的开始时间,在服务器集群的各队列中对各数据处理任务进行排队,确定的目标任务的排队开始时间与目标任务对应的计划开始时间可能不一致。为了确定目标任务更加精确的预测开始时间,以确保目标任务顺利执行,可以按照时间顺序对目标任务所对应上一数据处理任务的结束时间、目标任务的计划开始时间和目标任务的排队开始时间进行排序,并将目标任务对应的上一数据处理任务的结束时间、目标任务的计划开始时间和排队开始时间中最晚的时间确定为目标任务的预测开始时间。
如果预测开始时间早于目标任务对应的上一数据处理任务的结束时间,那么上一数据处理任务还在占用队列资源时,目标任务需要在队列内执行,可能导致目标任务执行失败。
本发明实施例中,充分考虑对应时间内队列资源的动态变化情况,确定目标任务对应的上一数据处理任务的结束时间、目标任务的计划开始时间和排队开始时间中最晚的时间为目标任务的预测开始时间,使确定的目标任务的预测开始时间更加精确。
步骤270、根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间。
具体地,在确定目标任务的预测开始时间后,可以将预测开始时间增加预测耗时得到的时间确定为目标任务的预测结束时间。
本发明实施例中,实现对目标任务的结束时间的预测。
步骤280、比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
具体地,如果所述目标任务的预测结束时间不晚于期望完成时间,则确定所述目标任务完成正常;如果所述目标任务的预测结束时间晚于期望完成时间,则确定所述目标任务完成异常。
当然,在确定目标任务完成异常之后,还可以根据服务器集群内各数据处理任务的队列资源使用量,确定服务器集群的空闲队列资源,进而可以基于空闲队列资源对目标任务所在队列进行内存扩展,目标任务所在队列的内存增加后,目标任务的执行效率也会得到提升。可以根据空闲队列资源和总队列资源确定资源倾斜系数,根据资源倾斜系数更新目标任务的预测耗时,得到更新后预测耗时,由于目标任务的执行效率得到提升,因此,更新后预测耗时相比于原来的预测耗时,时间更短。
进一步可以基于目标任务的预测开始时间和更新后预测耗时确定目标任务的更新后预测结束时间;比较目标任务的更新后预测结束时间和期望完成时间,根据比较结果更新目标任务的完成情况,在扩展目标任务所处队列后,重新确定目标任务的完成情况,实现对目标任务的持续监控。
在实际应用中,在确定目标任务的完成情况为完成正常后,可以间隔五分钟,再次确定目标任务的完成情况;在确定所述目标任务完成异常后,可以立即扩展目标任务所处队列后,并重新确定目标任务的完成情况,以实现对目标任务的持续监控。
图7为本发明实施例提供的另一种任务监控方法中对数据处理任务完成异常的示意图,对应于图6中的数据处理任务完成正常,图7中数据处理任务A由在9点到10点之间执行,延迟至在10点到11点之间执行,此时,数据处理任务D、E、F完成正常,数据处理任务B、C的开始时间发生变化,进而导致数据处理任务B、C完成异常。如果此时服务器集群其他队列存在空闲队列资源,可以对该队列资源进行扩展,以将队列资源的内存扩展为4G,这时,在9点到10点之间执行的数据处理任务为A、B、D,执行数据处理任务A、B、D分别需要1核、2核、1核节点资源,因此,为满足在10点到11点之间执行的数据处理任务为A、B、D,服务器集群内节点资源需要大于4核。
本发明实施例中,在确定目标任务的预测结束时间后,可以根据预测结束时间和期望结束时间的比较结果预测目标任务的完成情况,实现对目标任务的监控,便于工作人员及时得知目标任务的完成情况,以便做出及时的处理。
当然,在确定目标任务的完成情况为完成异常时,可以基于服务器集群中的空闲队列资源扩展目标任务所处队列,并重新确定目标任务的完成情况,进一步提升目标任务的完成情况为完成正常的概率。
本发明实施例提供的任务监控方法包括:通过目标任务的历史执行记录,确定所述目标任务的历史耗时和历史数据量;根据所述目标任务的当前数据量和历史数据量确定所述目标任务的数据量增长率;根据所述目标任务的数据量增长率,确定所述目标任务的预测耗时;根据各所述数据处理任务的配置信息中的上下游关系确定各所述数据处理任务的执行顺序;根据各所述数据处理任务的执行顺序,以及各所述数据处理任务的配置信息中的计划开始时间、节点资源使用量和队列资源使用量,在集群资源的各队列资源内对各所述数据处理任务进行排队,以确定所述目标任务的排队开始时间;根据所述目标任务所对应上一数据处理任务的结束时间以及所述目标任务的计划开始时间和排队开始时间,确定所述目标任务的预测开始时间;根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。上述技术方案,可以根据目标任务的历史执行记录,确定目标任务的历史耗时和历史数据量,并根据目标任务所需处理的当前数据量以及历史数据量确定数据量增长率,根据数据量增长率确定目标任务更加精确的预测耗时,还可以根据服务器集群中运行的各数据处理任务的配置信息确定各数据处理任务的执行顺序,并根据各数据处理任务的执行顺序、计划开始时间、节点资源使用量和队列资源使用量,在服务器集群的各队列中对各数据处理任务进行排队,以确定目标任务的排队开始时间,进而确定目标任务更加精确的预测开始时间,在确定目标任务的预测耗时和预测开始时间后,可以根据目标任务的预测耗时和预测开始时间确定目标任务的预测结束时间,并根据预测结束时间和期望结束时间确定目标任务的完成情况,在目标任务执行前对目标任务的完成情况进行预测,实现对目标任务的监控。
另外,在确定目标任务完成异常之后,在确定节点资源足以支持各数据处理任务运行的情况下,基于服务器集群中空闲队列资源对目标任务所处队列进行扩展,以重新确定目标任务的完成情况,进一步提升目标任务的完成情况为完成正常的概率,进一步减少数据处理任务延迟情况的发生。
图8为本发明实施例提供的另一种任务监控方法的实现流程图,示例性的给出了其中一种实现方式。如图8所示,
步骤810、通过目标任务的历史执行记录,确定所述目标任务的历史耗时和历史数据量。
步骤811、根据所述目标任务的当前数据量和历史数据量确定所述目标任务的数据量增长率。
步骤812、根据所述目标任务的数据量增长率、历史耗时和预设权重确定所述目标任务的耗时增加量。
步骤813、根据所述目标任务的历史耗时和耗时增加量确定所述目标任务的预测耗时。
步骤814、根据各所述数据处理任务的配置信息中的上下游关系确定各所述数据处理任务的执行顺序。
步骤815、根据各所述数据处理任务的执行顺序,以及各所述数据处理任务的计划开始时间、节点资源使用量和队列资源使用量,在集群资源的各队列资源内对各所述数据处理任务进行排队,以确定所述目标任务的排队开始时间。
步骤816、按照时间顺序对所述目标任务所对应上一数据处理任务的结束时间、所述目标任务的计划开始时间和所述目标任务的排队开始时间进行排序,并根据排序结果确定所述目标任务的预测开始时间。
步骤817、根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间。
步骤818、比较所述目标任务的预测结束时间和期望完成时间。
如果所述目标任务的预测结束时间不晚于期望完成时间,则执行步骤819;如果所述目标任务的预测结束时间晚于期望完成时间,则执行步骤820。
步骤819、确定所述目标任务完成正常。
步骤820、确定所述目标任务完成异常。
步骤821、根据各所述数据处理任务的队列资源使用量,确定空闲队列资源。
步骤822、根据所述空闲队列资源和总队列资源确定资源倾斜系数,根据所述资源倾斜系数更新所述目标任务的预测耗时,得到更新后预测耗时。
步骤822之后,返回执行步骤817。
本发明实施例提供的任务监控的实现方式,具备执行前述任一任务监控方法相应的有益效果。
图9为本发明实施例提供的一种任务监控装置的结构示意图。该装置与上述各实施例的任务监控方法属于同一个发明构思,在任务监控装置的实施例中未详尽描述的细节内容,可以参考上述任务监控方法的实施例。
该任务监控装置的具体结构如图9所示,包括:
预测耗时确定模块910,用于根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
预测开始时间确定模块920,用于确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
预测结束时间确定模块930,用于根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
执行模块940,用于比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
在上述实施例的基础上,该装置还包括:
数据量增长率确定模块,用于通过所述目标任务的历史执行记录,确定所述目标任务的历史耗时和历史数据量;
根据所述目标任务的当前数据量和历史数据量确定所述目标任务的数据量增长率。
在上述实施例的基础上,预测耗时确定模块910,具体用于:
根据所述目标任务的数据量增长率、历史耗时和预设权重确定所述目标任务的耗时增加量;
根据所述目标任务的历史耗时和耗时增加量确定所述目标任务的预测耗时。
一种实施方式中,所述预设权重包括聚合函数权重和集群资源倾斜权重,相应地,根据目标任务的数据量增长率、历史耗时和预设权重确定所述目标任务的耗时增加量,包括:
将所述聚合函数权重与所述目标任务的数据量增长率以及历史耗时的乘积确定为第一数值;
根据所述第一数值和所述集群资源倾斜权重确定所述目标任务的耗时增加量。
在上述实施例的基础上,预测开始时间确定模块920,具体用于:
确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息;
根据各所述数据处理任务的配置信息中的上下游关系确定各所述数据处理任务的执行顺序;
根据各所述数据处理任务的执行顺序,以及各所述数据处理任务的配置信息中的计划开始时间、节点资源使用量和队列资源使用量,在集群资源的各队列资源内对各所述数据处理任务进行排队,以确定所述目标任务的排队开始时间;
根据所述目标任务所对应上一数据处理任务的结束时间以及所述目标任务的计划开始时间和排队开始时间,确定所述目标任务的预测开始时间。
一种实施方式中,根据所述目标任务所对应上一数据处理任务的结束时间以及所述目标任务的计划开始时间和排队开始时间,确定所述目标任务的预测开始时间,包括:
按照时间顺序对所述目标任务所对应上一数据处理任务的结束时间、所述目标任务的计划开始时间和所述目标任务的排队开始时间进行排序;
根据排序结果确定所述目标任务的预测开始时间。
在上述实施例的基础上,执行模块940,具体用于:
如果所述目标任务的预测结束时间不晚于期望完成时间,则确定所述目标任务完成正常;
如果所述目标任务的预测结束时间晚于期望完成时间,则确定所述目标任务完成异常。
在上述实施例的基础上,该装置还包括:
重新确定模块,用于在确定所述目标任务完成异常之后,根据各所述数据处理任务的队列资源使用量,确定空闲队列资源;根据所述空闲队列资源和总队列资源确定资源倾斜系数,根据所述资源倾斜系数更新所述目标任务的预测耗时,得到更新后预测耗时;基于所述目标任务的预测开始时间和更新后预测耗时确定所述目标任务的更新后预测结束时间;比较所述目标任务的更新后预测结束时间和期望完成时间,根据比较结果更新所述目标任务的完成情况。
本发明实施例所提供的任务监控装置可执行本发明任意实施例所提供的任务监控方法,具备执行任务监控方法相应的功能模块和有益效果。
值得注意的是,上述任务监控装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
图10为本发明实施例提供的一种服务器的结构示意图。图10示出了适于用来实现本发明实施方式的示例性服务器10的框图。图10显示的服务器10仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图10所示,服务器10以通用计算服务器的形式表现。服务器10的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。
总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总线。
服务器10典型地包括多种计算机系统可读介质。这些介质可以是任何能够被服务器10访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
系统存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(RAM)30和/或高速缓存存储器32。服务器10可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图10未显示,通常称为“硬盘驱动器”)。尽管图10中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。系统存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本发明各实施例的功能。
具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如系统存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明所描述的实施例中的功能和/或方法。
服务器10也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该服务器10交互的设备通信,和/或与使得该服务器10能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且,服务器10还可以通过网络适配器20与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图10所示,网络适配器20通过总线18与服务器10的其它模块通信。应当明白,尽管图10中未示出,可以结合服务器10使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及页面显示,例如实现本发实施例所提供的任务监控方法,该方法包括:
根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
当然,本领域技术人员可以理解,处理器还可以实现本发明任意实施例所提供的任务监控方法的技术方案。
本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现例如本发实施例所提供的任务监控方法,该方法包括:
根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
本发明实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本领域普通技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个计算装置上,或者分布在多个计算装置所组成的网络上,可选地,他们可以用计算机装置可执行的程序代码来实现,从而可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件的结合。
另外,本发明技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种任务监控方法,其特征在于,包括:
根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
2.根据权利要求1所述的任务监控方法,其特征在于,在根据目标任务的数据量增长率,确定所述目标任务的预测耗时之前,还包括:
通过所述目标任务的历史执行记录,确定所述目标任务的历史耗时和历史数据量;
根据所述目标任务的当前数据量和历史数据量确定所述目标任务的数据量增长率。
3.根据权利要求2所述的任务监控方法,其特征在于,根据目标任务的数据量增长率,确定所述目标任务的预测耗时,包括:
根据所述目标任务的数据量增长率、历史耗时和预设权重确定所述目标任务的耗时增加量;
根据所述目标任务的历史耗时和耗时增加量确定所述目标任务的预测耗时。
4.根据权利要求3所述的任务监控方法,其特征在于,所述预设权重包括聚合函数权重和集群资源倾斜权重,相应地,根据所述目标任务的数据量增长率、历史耗时和预设权重确定所述目标任务的耗时增加量,包括:
将所述聚合函数权重与所述目标任务的数据量增长率以及历史耗时的乘积确定为第一数值;
根据所述第一数值和所述集群资源倾斜权重确定所述目标任务的耗时增加量。
5.根据权利要求1所述的任务监控方法,其特征在于,根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间,包括:
根据各所述数据处理任务的配置信息中的上下游关系确定各所述数据处理任务的执行顺序;
根据各所述数据处理任务的执行顺序,以及各所述数据处理任务的配置信息中的计划开始时间、节点资源使用量和队列资源使用量,在集群资源的各队列资源内对各所述数据处理任务进行排队,以确定所述目标任务的排队开始时间;
根据所述目标任务所对应上一数据处理任务的结束时间以及所述目标任务的计划开始时间和排队开始时间,确定所述目标任务的预测开始时间。
6.根据权利要求5所述的任务监控方法,其特征在于,根据所述目标任务所对应上一数据处理任务的结束时间以及所述目标任务的计划开始时间和排队开始时间,确定所述目标任务的预测开始时间,包括:
按照时间顺序对所述目标任务所对应上一数据处理任务的结束时间、所述目标任务的计划开始时间和所述目标任务的排队开始时间进行排序;
根据排序结果确定所述目标任务的预测开始时间。
7.根据权利要求6所述的任务监控方法,其特征在于,比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况,包括:
如果所述目标任务的预测结束时间不晚于期望完成时间,则确定所述目标任务完成正常;
如果所述目标任务的预测结束时间晚于期望完成时间,则确定所述目标任务完成异常。
8.根据权利要求7所述的任务监控方法,其特征在于,在确定所述目标任务完成异常之后,还包括:
根据各所述数据处理任务的队列资源使用量,确定空闲队列资源;
根据所述空闲队列资源和总队列资源确定资源倾斜系数,根据所述资源倾斜系数更新所述目标任务的预测耗时,得到更新后预测耗时;
基于所述目标任务的预测开始时间和更新后预测耗时确定所述目标任务的更新后预测结束时间;
比较所述目标任务的更新后预测结束时间和期望完成时间,根据比较结果更新所述目标任务的完成情况。
9.一种任务监控装置,其特征在于,包括:
预测耗时确定模块,用于根据目标任务的数据量增长率,确定所述目标任务的预测耗时;
预测开始时间确定模块,用于确定与所述目标任务运行于相同服务器的各数据处理任务的配置信息,并根据各所述数据处理任务的配置信息确定所述目标任务的预测开始时间;
预测结束时间确定模块,用于根据所述目标任务的预测开始时间和预测耗时确定所述目标任务的预测结束时间;
执行模块,用于比较所述目标任务的预测结束时间和期望完成时间,根据比较结果确定所述目标任务的完成情况。
10.一种服务器,其特征在于,所述服务器包括:
至少一个处理器;以及与所述至少一个处理器通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的任务监控方法。
11.一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-8中任一所述的任务监控方法。
CN202211185865.0A 2022-09-27 2022-09-27 一种任务监控方法、装置、服务器和存储介质 Pending CN115587008A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211185865.0A CN115587008A (zh) 2022-09-27 2022-09-27 一种任务监控方法、装置、服务器和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211185865.0A CN115587008A (zh) 2022-09-27 2022-09-27 一种任务监控方法、装置、服务器和存储介质

Publications (1)

Publication Number Publication Date
CN115587008A true CN115587008A (zh) 2023-01-10

Family

ID=84778504

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211185865.0A Pending CN115587008A (zh) 2022-09-27 2022-09-27 一种任务监控方法、装置、服务器和存储介质

Country Status (1)

Country Link
CN (1) CN115587008A (zh)

Similar Documents

Publication Publication Date Title
US8914805B2 (en) Rescheduling workload in a hybrid computing environment
RU2538920C2 (ru) Способ распределения задач сервером вычислительной системы, машиночитаемый носитель информации и система для реализации способа
US8595732B2 (en) Reducing the response time of flexible highly data parallel task by assigning task sets using dynamic combined longest processing time scheme
US8832695B2 (en) Method of scheduling jobs and information processing apparatus implementing same
US20090077235A1 (en) Mechanism for profiling and estimating the runtime needed to execute a job
US9430283B2 (en) Information processing apparatus and job scheduling method
US20090083746A1 (en) Method for job management of computer system
US9652491B2 (en) Out-of-order execution of strictly-ordered transactional workloads
JP2010134522A (ja) データベース管理方法、データベース管理プログラム、および、データベース管理装置
CN111190712A (zh) 一种任务调度方法、装置、设备及介质
CN108769162B (zh) 分布式消息均衡处理方法、装置、电子设备、存储介质
CN112114973A (zh) 一种数据处理方法及装置
CN110673959A (zh) 用于处理任务的系统、方法和装置
CN111488492A (zh) 用于检索图数据库的方法和装置
CN115150471A (zh) 数据处理方法、装置、设备、存储介质及程序产品
US20120144039A1 (en) Computing scheduling using resource lend and borrow
US10048991B2 (en) System and method for parallel processing data blocks containing sequential label ranges of series data
CN108595251B (zh) 动态图更新方法、装置、存储引擎接口和程序介质
CN114399228A (zh) 任务调度方法及装置、电子设备和介质
CN113553216A (zh) 数据恢复方法、装置、电子设备及存储介质
CN113760176A (zh) 数据存储方法和装置
CN116821187A (zh) 基于数据库的数据处理方法、装置、介质和电子设备
CN115587008A (zh) 一种任务监控方法、装置、服务器和存储介质
CN117093335A (zh) 分布式存储系统的任务调度方法及装置
CN112035460A (zh) 一种标识分配方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination