CN115016917A - 一种任务控制方法、装置及可读存储介质 - Google Patents

一种任务控制方法、装置及可读存储介质 Download PDF

Info

Publication number
CN115016917A
CN115016917A CN202210764627.9A CN202210764627A CN115016917A CN 115016917 A CN115016917 A CN 115016917A CN 202210764627 A CN202210764627 A CN 202210764627A CN 115016917 A CN115016917 A CN 115016917A
Authority
CN
China
Prior art keywords
task
executed
execution
subtask
control method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210764627.9A
Other languages
English (en)
Inventor
葛国周
张国辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202210764627.9A priority Critical patent/CN115016917A/zh
Publication of CN115016917A publication Critical patent/CN115016917A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/48Indexing scheme relating to G06F9/48
    • G06F2209/481Exception handling

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开一种任务控制方法、装置及可读存储介质,涉及电子信息领域。本申请所提供的任务控制方法,通过接收待执行任务,依据数据的原子性将任务分段为多段子任务,当任务执行失败时,获取任务执行失败时正在执行的当前子任务,检测当前子任务执行失败的原因,并在解决当前子任务执行失败的问题后,从当前子任务开始继续执行。本方案通过在大规模集群生产环境中,通过该方法实现的任务定义模式,具备操作步骤原子化、支持任务失败恢复、支持任务从断点处再执行等功能。通过这种方式管理任务,方便用户实时查询任务执行状态的同时,遇到任务执行失败情形时,可以简化目前人力手动操作,节省人力投入,可以极大提升问题的解决效率。

Description

一种任务控制方法、装置及可读存储介质
技术领域
本申请涉及电子信息领域,特别是涉及一种任务控制方法、装置及可读存储介质。
背景技术
近年来,随着计算机技术以及信息技术的发展,数据大量迸发,集群运行负荷过重,无法为用户提供良好的可持续的服务。为此,需要为用户提供解决方案,在现有集群的基础上,提供扩大集群规模、提升服务运载能力的解决方案。比如存储产品AS13000,通过在集群添加新的节点,并在新节点上配置运行所需的各种服务,来达到扩大整个集群规模,提升集群服务能力的目的。
目前存储产品单次扩容支持同时扩N个节点,且各节点的服务配置并发执行。在任务执行过程中,可能会遇到节点故障、服务配置失败等问题,导致任务执行失败。此时需要排查任务执行失败原因,解决问题后,需要手动将新扩容节点上的服务配置进行清理,再次进行扩容操作。因此当前任务管理器不支持任务恢复,自动清理新扩容节点上的服务配置,也不支持任务执行失败并排除故障后,从断点处继续执行,再每次任务执行失败后需要从头进行执行操作。
鉴于上述技术,寻找一种能任务控制方法是本领域技术人员亟待解决的问题。
发明内容
本申请的目的是提供一种任务控制方法、装置及可读存储介质,以便于解决在遇到节点故障、服务配置失败等问题,导致任务执行失败。需要排查任务执行失败原因,解决问题后,需要手动将新扩容节点上的服务配置进行清理,再次进行扩容操作。因此当前任务管理器不支持任务恢复,自动清理新扩容节点上的服务配置,也不支持任务执行失败并排除故障后,从断点处继续执行,再每次任务执行失败后需要从头进行执行操作的问题。
为解决上述技术问题,本申请提供一种任务控制方法,包括:
接收待执行任务,依据数据的原子性将所述任务分段为多段子任务;
当所述任务执行失败时,获取所述任务执行失败时正在执行的当前所述子任务;
检测当前所述子任务执行失败的原因,并在解决当前所述子任务执行失败的问题后,从所述当前所述子任务开始继续执行所述任务。
优选地,还包括
在集群中各管理节点部署任务管理器服务;
利用主备容灾机制,在各所述管理节点中的任务信息保持同步。
优选地,在所述利用主备容灾机制,在各所述管理节点中的任务信息保持同步之后,还包括:
当所述管理节点异常导致任务失败中止时,切换所述管理节点,接收原所述管理节点管理维护中的所述任务。
优选地,所述依据数据的原子性将所述任务分段为多段子任务包括:
根据所述任务的操作步骤进行原子性划分;
为各所述操作步骤定义编号、名称、执行状态,并依据所述操作步骤生成各所述子任务。
优选地,所述获取所述任务执行失败时正在执行的当前所述子任务包括:
获取各所述子任务的执行状态,得到所述执行状态为待执行的子任务,定义所述执行状态为待执行的所述子任务的前一个子任务为当前所述子任务。
优选地,当所述任务执行失败时,还包括:
对所述任务进行恢复操作,恢复所述任务执行前的集群状态。
优选地,还包括:
当所述任务执行失败时,进行报警处理。
为解决上述问题,本申请还提供一种任务控制装置,包括:
接收模块,用于接收待执行任务,依据数据的原子性将所述任务分段为多段子任务;
获取模块,用于当所述任务执行失败时,获取所述任务执行失败时正在执行的当前子任务;
执行模块,用于检测所述子任务执行失败的原因,并在解决所述子任务执行失败的问题后,从所述当前子任务开始继续执行所述任务。
优选地,该装置还包括
部署模块,用于在集群中各管理节点部署任务管理器服务;
同步模块,用于利用主备容灾机制,在各所述管理节点中的任务信息保持同步。
优选地,该装置还包括:
恢复模块,用于对所述任务进行恢复操作,恢复所述任务执行前的集群状态。
优选地,该装置还包括:
报警模块,用于当所述任务执行失败时,进行报警处理。
优选地,该装置还包括:
切换模块,用于当所述管理节点异常导致任务失败中止时,切换所述管理节点,接收原所述管理节点管理维护中的所述任务。
为解决上述问题,本申请还提供一种任务控制装置,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述的任务控制装置的步骤。
为解决上述问题,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的任务控制方法的步骤。
本申请所提供的任务控制方法,通过接收待执行任务,依据数据的原子性将任务分段为多段子任务,当任务执行失败时,获取任务执行失败时正在执行的当前子任务,检测当前子任务执行失败的原因,并在解决当前子任务执行失败的问题后,从当前子任务开始继续执行。本方案通过在大规模集群生产环境中,通过该方法实现的任务定义模式,具备操作步骤原子化、支持任务失败恢复、支持任务从断点处再执行等功能。通过这种方式管理任务,方便用户实时查询任务执行状态的同时,遇到任务执行失败情形时,可以简化目前人力手动操作,节省人力投入,可以极大提升问题的解决效率。
本申请提供的任务控制装置以及计算机可读存储介质与上述的任务控制方法对应,有益效果同上。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种任务控制方法流程图;
图2为本申请实施例提供的一种任务控制装置示意图;
图3为本申请另一实施例提供的任务控制装置的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。
本申请的核心是提供一种任务控制方法、装置及可读存储介质,以便于解决在遇到节点故障、服务配置失败等问题,导致任务执行失败。需要排查任务执行失败原因,解决问题后,需要手动将新扩容节点上的服务配置进行清理,再次进行扩容操作。因此当前任务管理器不支持任务恢复,自动清理新扩容节点上的服务配置,也不支持任务执行失败并排除故障后,从断点处继续执行,再每次任务执行失败后需要从头进行执行操作的问题。
在实际生产运营中,现有生产环境可能受限于集群规模、存储空间等各方面因素,随着数据大量迸发,集群运行负荷过重,无法为用户提供良好的可持续的服务。为此,需要为用户提供解决方案,在现有集群的基础上,提供扩大集群规模、提升服务运载能力的解决方案。比如存储产品AS13000,通过在集群添加新的节点,并在新节点上配置运行所需的各种服务,来达到扩大整个集群规模,提升集群服务能力的目的。
目前存储产品AS13000单次扩容支持同时扩N个节点,且各节点的服务配置并发执行。扩容流程界面可视化操作,允许用户根据需要选择配置新节点上的关键性服务,操作简单易执行。界面配置完毕后,调用API接口下发扩容节点请求,后端接收到请求后,启动扩容任务,并将其添加到任务管理器中。用户可以通过界面实时查看扩容任务执行进度、执行结果等。在任务执行过程中,可能会遇到节点故障、服务配置失败等问题,导致任务执行失败。此时需要排查任务执行失败原因,解决问题后,需要手动将新扩容节点上的服务配置进行清理,再次进行扩容操作。当前任务管理器不支持任务恢复,自动清理新扩容节点上的服务配置,也不支持任务执行失败并排除故障后,从断点处继续执行。在实际生产环境中,遇到扩容任务执行失败,可能会是各种各样的原因导致的,且任务失败时,整体进度不一致,处理起来比较费事,不易操作。
为了使本技术领域的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。
图1为本申请实施例提供的一种任务控制方法流程图,如图1所示,该方法包括:
S10:接收待执行任务,依据数据的原子性将任务分段为多段子任务;
数据是在计算机系统中,各种字母、数字符号的组合、语音、图形、图像等统称为数据,数据经过加工后就成为信息。在计算机科学中,数据是指所有能输入到计算机并被计算机程序处理的符号的介质的总称,是用于输入电子计算机进行处理,具有一定意义的数字、字母、符号和模拟量等的通称。是组成地理信息系统的最基本要素,种类很多。在本实施例中的待执行任务也由数据构成,因此具备基本的数据的原子性。
原子操作是指事务的一个完整操作。操作成功则提交,失败则回滚,所谓原子操作是指不会被线程调度机制打断的操作,这种操作一旦开始,就一直运行到结束,中间不会有任何其他操作。原子性:即不可再分了,不能分为多步操作。比如赋值或者return,比如a=1和return a这样的操作都具有原子性。在本实施例中即可以认为,即将步骤分开后,某一个单独且完整的操作步骤即可以定义为该待执行任务的原子性中的某一个原子。
任务则是指在多道程序或多进程环境中,要由计算机来完成的基本工作元,它是由控制程序处理的一个或多个指令序列,由操作员完成的一种基本工作单位,为了在系统中建立和跟踪并发程序的执行,由管理程序使用的可调度实体。每个任务表示通过一个程序或一组程序执行的单一线索。在每个任务下执行的第一个程序是主程序,其它皆是辅程序。需要说明的是,本实施例中对子任务的划分方式不进行限定,一般来说是依据待执行任务中的操作步骤所进行的划分,
S11:当任务执行失败时,获取任务执行失败时正在执行的当前子任务;
需要说明的是,本实施例中对于如何获取任务执行失败时正在执行的当前子任务的方式不进行限定,可以是通过任务管理器中的日志的方式,或者通过数据对于子任务的执行状态进行定义划分,从而确认任务执行失败时正在执行的当前子任务,例如通过加入代码1表示任务执行成功,代码0表示任务执行失败,而只有当任务被执行才能对该代码进行赋值,从而依据获取得到代码为0的子任务,并检测该子任务后的所有子任务是否为未赋值的状态从而保证并非由于代码错误而引起的误判,从而确定该子任务是导致任务执行失败的子任务。
S12:检测当前子任务执行失败的原因,并在解决当前子任务执行失败的问题后,从当前子任务开始继续执行任务。
需要说明的是,由于子任务是按照数据的原子性进行划分的,即为总任务的多个分步骤,当前序的步骤执行结束后,则由任务管理器记载相关子任务执行结束,从而将执行后的修改数据存储至计算机中的相应位置,因此针对于对应的子任务的数据处理方式主要是依托与不同分段任务之间相对独立的原子性,将原本整个的待执行任务划分为相对独立的多段子任务,从而起到在任务执行失败后,从当前子任务进行执行的功能。
导致任务执行失败的原因可能是一种或多种,例如网络,安全环境,或者硬件条件,处理器等等,通过对计算机或执行主体的本身的各个方面进行排查,从而获取得到任务执行失败的具体原因。
本方案主要是应用于任务管理器中,一般而言,任务管理器提供了有关计算机性能的信息,并显示了计算机上所运行的程序和进程的详细信息;如果连接到网络,那么还可以查看网络状态并迅速了解网络是如何工作的。
本方案适用于加入任务管理器中的各种任务,需要将完整任务的具体执行步骤进行细分并原子化管理,方便记录任务具体执行进度及执行情况。任务执行失败后,根据记录的具体进度,对失败前已完成的配置进行恢复操作,或者排除故障后,可以从断点处继续执行任务。
本申请所提供的任务控制方法,通过接收待执行任务,依据数据的原子性将任务分段为多段子任务,当任务执行失败时,获取任务执行失败时正在执行的当前子任务,检测当前子任务执行失败的原因,并在解决当前子任务执行失败的问题后,从当前子任务开始继续执行。本方案通过在大规模集群生产环境中,通过该方法实现的任务定义模式,具备操作步骤原子化、支持任务失败恢复、支持任务从断点处再执行等功能。通过这种方式管理任务,方便用户实时查询任务执行状态的同时,遇到任务执行失败情形时,可以简化目前人力手动操作,节省人力投入,可以极大提升问题的解决效率。
考虑到在联系到多台计算机时针对于多台计算机的服务器节点的集群的任务执行,在此提供优选方案,还包括:
在集群中各管理节点部署任务管理器服务;
利用主备容灾机制,在各管理节点中的任务信息保持同步。
集群通信系统是一种用于集团调度指挥通信的移动通信系统,主要应用在专业移动通信领域。该系统具有的可用信道可为系统的全体用户共用,具有自动选择信道功能,它是共享资源、分担费用、共用信道设备及服务的多用途、高效能的无线调度通信系统。在本实施例中对于集群中的元素的具体类型不进行限定。
容灾系统是指在相隔较远的异地,建立两套或多套功能相同的信息系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作。容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个信息节点的影响,提供节点级别的系统恢复功能。
通过利用主备容灾机制,在各节点任务管理器中的任务信息保持同步,当主节点异常导致任务失败中止,集群主节点切换后,可以替代原主节点继续管理维护管理器中的任务,从而保证在一个集群中的任务的流程运行。
考虑到针对于,在利用主备容灾机制,在各管理节点中的任务信息保持同步之后,还包括:
当管理节点异常导致任务失败中止时,切换管理节点,接收原管理节点管理维护中的任务。
"节点"一概念被应用于许多领域。节点,通常来说,是指局部的膨胀,亦或是一个交汇点。在网络拓扑学中,节点是网络任何支路的终端或网络中两个或更多支路的互连公共点。在程序语言中,节点是XML文件中有效而完整的结构的最小单元。在本实施例中管理节点即代指任务管理器在集群的多个计算机节点上的任务管理单元,依据不同的单元对集群中的任务进行相应的管理。
通过利用主备容灾机制,在各节点任务管理器中的任务信息保持同步,当主节点异常导致任务失败中止,集群主节点切换后,可以替代原主节点继续管理维护管理器中的任务,从而保证在一个集群中的任务的流程运行。
上述实施例中对于生成子任务的具体方式以及划分依据未进行限定,在此提供优选方案,依据数据的原子性将任务分段为多段子任务包括:
根据任务的操作步骤进行原子性划分;
为各操作步骤定义编号、名称、执行状态,并依据操作步骤生成各子任务。
需要说明的是,本实施例中是依据任务操作步骤的各个进行划分,而并非完全依据数据的原子性进行子任务的划分,并且通过定义编号,名称以及执行状态,即将子任务相互独立,由任务管理器进行执行,并且通过定义编号以及名称方便对于不同子任务进行查询,也便于在任务执行失败后查找对应的出现异常的子任务。
上述实施例中对于如何获取任务执行失败时对应的当前子任务的方式未进行限定。在本实施例中提供优选方案,获取任务执行失败时正在执行的当前子任务包括:
获取各子任务的执行状态,得到执行状态为待执行的子任务,定义执行状态为待执行的子任务的前一个子任务为当前子任务。
需要说明的是,由于通过划分的方式将待执行任务划分为了多个子任务,子任务间相互独立,且由于任务数据的连续性,需要对多个子任务依次执行,因此任务管理器中能明确独立任务是否执行,从而无需额外编程,即可识别任务执行失败时的当前子任务,增加了便捷性,减少了人工成本。
考虑到对于任务的具体执行操作,在本实施例中提出优选方案,当任务执行失败时,还包括:
对任务进行恢复操作,恢复任务执行前的集群状态。
需要说明的是,本实施例中所提到的对任务进行恢复操作与上述的在任务执行失败时,检测子任务为两种不同的处理方式,即在任务执行失败时,可以考虑对于任务进行恢复操作,或者检测当前执行的子任务,从断点处继续执行的两种方案,视具体情况采取两种方案中的任意一种进行执行,本实施例中通过加入了额外的任务失败时的处理情况,增加了本方案中对于不同任务处理失败时的适用性以及相应的实用能力。
考虑到任务执行失败后,需要对用户进行提醒,以便于处理较复杂的情况,在本实施例中提供优选方案,还包括:
当任务执行失败时,进行报警处理。
需要说明的是,本实施例中对于报警处理的具体报警方式以及报警方式对应的报警装置不进行限定,可以理解的是,报警装置可以是蜂鸣器,警示灯等等,或者通过发送信息的方式进行报警,通过在本实施例中加入了报警的步骤,从而便于用户及时了解任务执行情况以及对任务失败的原因进行相应的处理。
在上述实施例中,对于任务控制方法进行了详细描述,本申请还提供任务控制装置对应的实施例。需要说明的是,本申请从两个角度对装置部分的实施例进行描述,一种是基于功能模块的角度,另一种是基于硬件的角度。
图2为本申请实施例提供的一种任务控制装置示意图,该装置包括:
接收模块10,用于接收待执行任务,依据数据的原子性将任务分段为多段子任务;
获取模块11,用于当任务执行失败时,获取任务执行失败时正在执行的当前子任务;
执行模块12,用于检测子任务执行失败的原因,并在解决子任务执行失败的问题后,从当前子任务开始继续执行任务。
优选地,该装置还包括
部署模块,用于在集群中各管理节点部署任务管理器服务;
同步模块,用于利用主备容灾机制,在各管理节点中的任务信息保持同步。
优选地,该装置还包括:
恢复模块,用于对任务进行恢复操作,恢复任务执行前的集群状态。
优选地,该装置还包括:
报警模块,用于当任务执行失败时,进行报警处理。
优选地,该装置还包括:
切换模块,用于当管理节点异常导致任务失败中止时,切换管理节点,接收原管理节点管理维护中的任务。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例及请参见方法部分的实施例的描述,这里暂不赘述。
本实施例所提供的任务控制装置,包含接收模块,处理模块,合并模块,空闲模块,可通过判断管理软件是否空闲,若是,则将信息发送至管理软件进行处理,若否,则建立信息队列,并对信息队列中的信息进行合并,在集群管理软件空闲时,将合并后的信息发送至管理软件进行处理。与以往传统的任务控制方式相比,本申请提出了一种分布式存储管理软件对接多平台的任务控制方法,减少同时对接多平台时的重复请求和信息上报,提高管理软件的运行效率,减轻管理软件的运行压力,减少管理软件的冗余。
图3为本申请另一实施例提供的任务控制装置的结构图,如图3所示,任务控制装置包括:存储器20,用于存储计算机程序;
处理器21,用于执行计算机程序时实现如上述实施例中所提到的任务控制方法的步骤。
本实施例提供的任务控制装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
其中,处理器21可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器21可以采用数字信号处理(Digital Signal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessing Unit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以在集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器21还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器20可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器20还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器20至少用于存储以下计算机程序201,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例公开的任务控制方法的相关步骤。另外,存储器20所存储的资源还可以包括操作系统202和数据203等,存储方式可以是短暂存储或者永久存储。其中,操作系统202可以包括Windows、Unix、Linux等。数据203可以包括但不限于上述任务控制方法中涉及的数据等。
在一些实施例中,任务控制装置还可包括有显示屏22、输入输出接口23、通信接口24、电源25以及通信总线26。
本领域技术人员可以理解,图3中示出的结构并不构成对任务控制装置的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的任务控制装置,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如下方法:上述实施例中涉及的任务控制方法。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例及其对应的有益效果请参见方法部分的实施例的描述,这里暂不赘述。
本申请所提供的任务控制装置,包含存储器与执行器,在存储器中的程序被执行器执行时可以实现在接收到信息时,判断管理软件是否空闲,若是,则将信息发送至管理软件进行处理,若否,则建立信息队列,并对信息队列中的信息进行合并,在集群管理软件空闲时,将合并后的信息发送至管理软件进行处理。与以往传统的任务控制方式相比,本申请提出了一种分布式存储管理软件对接多平台的任务控制方法,减少同时对接多平台时的重复请求和信息上报,提高管理软件的运行效率,减轻管理软件的运行压力,减少管理软件的冗余。
最后,本申请还提供一种计算机可读存储介质对应的实施例。计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
由于可读存储介质部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例及其对应的有益效果请参见方法部分的实施例的描述,这里暂不赘述。
本申请所提供的计算机可读存储装置,存储的内容被执行时,可以达到在接收到信息时,判断管理软件是否空闲,若是,则将信息发送至管理软件进行处理,若否,则建立信息队列,并对信息队列中的信息进行合并,在集群管理软件空闲时,将合并后的信息发送至管理软件进行处理。与以往传统的任务控制方式相比,本申请提出了一种分布式存储管理软件对接多平台的任务控制方法,减少同时对接多平台时的重复请求和信息上报,提高管理软件的运行效率,减轻管理软件的运行压力,减少管理软件的冗余。
以上对本申请所提供的一种任务控制方法及装置及可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种任务控制方法,其特征在于,包括:
接收待执行任务,依据数据的原子性将所述任务分段为多段子任务;
当所述任务执行失败时,获取所述任务执行失败时正在执行的当前所述子任务;
检测当前所述子任务执行失败的原因,并在解决当前所述子任务执行失败的问题后,从所述当前所述子任务开始继续执行所述任务。
2.根据权利要求1所述的任务控制方法,其特征在于,还包括:
在集群中各管理节点部署任务管理器服务;
利用主备容灾机制,在各所述管理节点中的任务信息保持同步。
3.根据权利要求2所述的任务控制方法,其特征在于,在所述利用主备容灾机制,在各所述管理节点中的任务信息保持同步之后,还包括:
当所述管理节点异常导致任务失败中止时,切换所述管理节点,接收原所述管理节点管理维护中的所述任务。
4.根据权利要求3所述的任务控制方法,其特征在于,所述依据数据的原子性将所述任务分段为多段子任务包括:
根据所述任务的操作步骤进行原子性划分;
为各所述操作步骤定义编号、名称、执行状态,并依据所述操作步骤生成各所述子任务。
5.根据权利要求4所述的任务控制方法,其特征在于,所述获取所述任务执行失败时正在执行的当前所述子任务包括:
获取各所述子任务的执行状态,得到所述执行状态为待执行的所述子任务,定义所述执行状态为待执行的所述子任务的前一个子任务为当前所述子任务。
6.根据权利要求1-5任意一项所述的任务控制方法,其特征在于,在所述任务执行失败之后,还包括:
对所述任务进行恢复操作,恢复所述任务执行前的集群状态。
7.根据权利要求6所述的任务控制方法,其特征在于,还包括:
当所述任务执行失败时,进行报警处理。
8.一种任务控制装置,其特征在于,包括:
接收模块,用于接收待执行任务,依据数据的原子性将所述任务分段为多段子任务;
获取模块,用于当所述任务执行失败时,获取所述任务执行失败时正在执行的当前子任务;
执行模块,用于检测所述子任务执行失败的原因,并在解决所述子任务执行失败的问题后,从所述当前子任务开始继续执行所述任务。
9.一种任务控制装置,其特征在于,包括存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的任务控制方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的任务控制方法的步骤。
CN202210764627.9A 2022-06-30 2022-06-30 一种任务控制方法、装置及可读存储介质 Pending CN115016917A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210764627.9A CN115016917A (zh) 2022-06-30 2022-06-30 一种任务控制方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210764627.9A CN115016917A (zh) 2022-06-30 2022-06-30 一种任务控制方法、装置及可读存储介质

Publications (1)

Publication Number Publication Date
CN115016917A true CN115016917A (zh) 2022-09-06

Family

ID=83078695

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210764627.9A Pending CN115016917A (zh) 2022-06-30 2022-06-30 一种任务控制方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN115016917A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116339958A (zh) * 2023-05-30 2023-06-27 支付宝(杭州)信息技术有限公司 一种任务执行方法、装置以及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116339958A (zh) * 2023-05-30 2023-06-27 支付宝(杭州)信息技术有限公司 一种任务执行方法、装置以及设备
CN116339958B (zh) * 2023-05-30 2023-09-08 支付宝(杭州)信息技术有限公司 一种任务执行方法、装置以及设备

Similar Documents

Publication Publication Date Title
Castelli et al. Proactive management of software aging
CN103414712B (zh) 一种分布式虚拟桌面管理系统和方法
CN107016480B (zh) 任务调度方法、装置及系统
CN109871384B (zh) 基于PaaS平台进行容器迁移的方法、系统、设备和存储介质
CN113569987A (zh) 模型训练方法和装置
CN113886089B (zh) 一种任务处理方法、装置、系统、设备及介质
CN109361777B (zh) 分布式集群节点状态的同步方法、同步系统及相关装置
CN105589756A (zh) 批处理集群系统以及方法
US20220147391A1 (en) Cloud Resource Monitor and Interface Method and System for Containerized Applications
CN109240897A (zh) 一种事件处理页面信息展示方法、装置、设备及存储介质
CN111782341B (zh) 用于管理集群的方法和装置
CN111666266A (zh) 一种数据迁移方法及相关设备
CN111984274A (zh) 一种一键自动化部署etcd集群的方法及装置
CN115016917A (zh) 一种任务控制方法、装置及可读存储介质
CN116089011A (zh) 创建镜像仓库的方法、装置、存储介质以及电子设备
CN112000574A (zh) 一种压力测试方法、装置、设备和存储介质
CN115167992A (zh) 任务处理方法、系统、装置、服务器、介质及程序产品
CN112181724A (zh) 大数据容灾方法、装置和电子设备
CN110209497B (zh) 一种主机资源动态扩缩容的方法及系统
CN115543543A (zh) 一种应用服务处理方法、装置、设备及介质
CN115525717A (zh) 一种数据同步处理方法及装置
CN114189429A (zh) 一种服务器集群故障的监测系统、方法、装置及介质
CN113687908A (zh) Pmem虚拟机的创建方法、装置、设备及可读存储介质
CN111147554A (zh) 一种数据的存储方法、装置及计算机系统
CN111858234A (zh) 一种任务执行方法、装置、设备、介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination