CN117389749B - 基于双主板的任务处理方法、装置、设备及存储介质 - Google Patents

基于双主板的任务处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN117389749B
CN117389749B CN202311698282.2A CN202311698282A CN117389749B CN 117389749 B CN117389749 B CN 117389749B CN 202311698282 A CN202311698282 A CN 202311698282A CN 117389749 B CN117389749 B CN 117389749B
Authority
CN
China
Prior art keywords
main board
task
target
processing
motherboard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311698282.2A
Other languages
English (en)
Other versions
CN117389749A (zh
Inventor
李洪明
李晓涛
李俊岭
李伟
庄楚雄
徐晓霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jifang Industrial Control Co ltd
Original Assignee
Shenzhen Jifang Industrial Control Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jifang Industrial Control Co ltd filed Critical Shenzhen Jifang Industrial Control Co ltd
Priority to CN202311698282.2A priority Critical patent/CN117389749B/zh
Publication of CN117389749A publication Critical patent/CN117389749A/zh
Application granted granted Critical
Publication of CN117389749B publication Critical patent/CN117389749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5044Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering hardware capabilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/503Resource availability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请公开了一种基于双主板的任务处理方法、装置、设备及存储介质,属于数据处理技术领域。本申请通过在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源,并根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板,从而可通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果,即根据双主板设备的可用算力资源的情况,将目标任务分配至双主板设备中的第一主板和第二主板中,以实现通过第一主板和第二主板,对目标任务的并发式处理的效果,以提高对设备对目标任务处理时的效率。

Description

基于双主板的任务处理方法、装置、设备及存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及一种基于双主板的任务处理方法、装置、设备及存储介质。
背景技术
工控设备通过其内部配置的主板和CPU,实现对各项任务进行处理的功能,其中,通常需要该工控设备满足及时、高效和精准处理任务的需求。
在工控设备使用过程中,不免出现工控设备中的CPU产生异常,导致工控设备无法正常处理任务,或工控设备所得到的处理结果的偏差较大等异常情况,需要将该工控设备暂停使用,对CPU进行复位或检修等中断修复操作,通常在同一个工控设备中以配置冗余CPU的方式,实现在一个CPU出现故障时,启用另一个CPU,以保证持续处理任务。
但是配置两个CPU的应用场景中,同一时间中仅使用了一个CPU进行任务处理,以此导致工控设备的处理效率相对较低。
发明内容
本申请的主要目的在于提供一种基于双主板的任务处理方法、装置、设备及存储介质,旨在解决监控设备的异常状态排查效率低的技术问题。
为实现上述目的,本申请提供一种基于双主板的任务处理方法,所述基于双主板的任务处理方法包括以下步骤:
在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源;
根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板;
通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果。
可选地,所述可用算力资源包括所述第一主板对应的第一算力资源和所述第二主板对应的第二算力资源;
所述根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板的步骤,包括:
根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板,以通过所述目标监控主板对所述第一主板和所述第二主板的处理进程进行实时监控,并将监控得到的数据实时上报;
根据所述目标监控主板,生成所述目标任务的分配方案;
根据所述分配方案,将所述目标任务分配至所述第一主板和所述第二主板。
可选地,所述根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板的步骤,包括:
计算所述第一算力资源和所述第二算力资源的资源差值;
在所述资源差值大于预设阈值,且所述第一算力资源大于所述第二算力资源时,将所述第二主板作为目标监控主板;
在所述资源差值大于预设阈值,且所述第一算力资源小于所述第二算力资源时,将所述第一主板作为目标监控主板;
在所述资源差值小于预设阈值时,将所述第一主板和所述第二主板均作为目标监控主板,以通过所述第一主板监控所述第二主板的处理进程,和通过所述第二主板监控所述第一主板的处理进程。
可选地,所述根据所述目标监控主板,生成所述目标任务的分配方案的步骤,包括:
在所述第一主板和所述第二主板中任一主板作为目标监控主板时,确定所述目标监控主板配置监控任务所需占用的监控资源;
根据所述监控资源,计算所述目标监控主板空闲的剩余资源;
根据所述剩余资源,生成所述目标任务的分配方案。
可选地,所述处理结果包括由所述第一主板处理得到的第一处理结果和由所述第二主板处理得到的第一处理结果,所述通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果的步骤之后,所述方法还包括:
接收所述第一处理结果和所述第二处理结果,并将所述第一处理结果和所述第二处理结果按照对应目标任务的任务顺序进行整合;
接收由所述目标监控主板上报的监控数据;
根据所述监控数据,对整合后的处理结果进行复检,并将复检得到的结果添加至所述整合的处理结果中。
可选地,所述根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板的步骤之后,所述方法还包括:
若接收到所述目标监控主板上报的故障提示信息,则根据所述故障提示信息,确定在处理任务进程中存在故障的故障主板,其中,该故障主板为所述第一主板和所述第二主板中的任一主板;
调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配。
可选的,所述调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配的步骤,包括:
复位所述故障主板,将所述故障主板所配置的任务重新下发至复位后的故障主板;
若所述复位后的故障主板再次出现故障,则确定未发生故障的主板当前处理任务的处理进度;
根据所述处理进度,将所述故障主板所配置的任务进行任务重分配。
此外,为实现上述目的,本申请还提供一种基于双主板的任务处理装置,所述基于双主板的任务处理装置包括:
确定模块,用于在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源;
分配模块,用于根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板;
处理模块,用于根据所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果。
此外,为实现上述目的,本申请还提供一种基于双主板的任务处理设备,所述基于双主板的任务处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于双主板的任务处理程序,所述基于双主板的任务处理程序配置为实现如上所述的基于双主板的任务处理方法的步骤。
此外,为实现上述目的,本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于双主板的任务处理程序,所述基于双主板的任务处理程序被处理器执行时实现如上所述的基于双主板的任务处理方法的步骤。
本申请通过在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源,并根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板,从而可通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果,即根据双主板设备的可用算力资源的情况,将目标任务分配至双主板设备中的第一主板和第二主板中,以实现通过第一主板和第二主板,对目标任务的并发式处理的效果,以提高对设备对目标任务处理时的效率。
附图说明
图1为本申请基于双主板的任务处理方法第一实施例的流程示意图;
图2为本申请基于双主板的任务处理方法第二实施例中步骤S20的流程示意图;
图3为本申请实施例中双主板处理目标任务的应用场景示意图;
图4为本申请基于双主板的任务处理方法第三实施例的流程示意图;
图5为本申请基于双主板的任务处理装置一实施例的结构框图;
图6是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,图1为本申请基于双主板的任务处理方法第一实施例的流程示意图。
在第一实施例中,所述基于双主板的任务处理方法包括以下步骤:
S10,在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源。
可理解的是,双主板设备即为配置两块相同或两块不同的主板的设备,其中任一块主板均能实现通信、任务处理或其他基本满足工控设备的任务需求的功能,即双主板设备使用其中任一块主板均能满足该设备正常使用功能。
需要说明的是,该双主板设备与双CPU(或多CPU的冗余CPU布置场景)的设备存在区别,双CPU设备中,仅能实现其中任一CPU出现故障,使用另一CPU将其替换,而单独使用其中任一CPU时,无法实现任务处理或其他工控设备的基本功能,而本申请的双主板设备能够实现使用任一主板完成工控设备的基本功能的效果。
可理解的是,双主板设备即为工控设备。
可理解的是,可用算力资源指的是双主板对应的CPU的未使用的算力资源,例如,双主板设备对应会配置相应的系统,或配置相应的监控软件或其他功能性软件,需要占用主板中CPU的相应的计算资源或算力资源,因此,在主板对应的CPU处理任务时,其所使用的算力资源存在上限,且需要根据当前CPU的使用情况进一步确定其可处理的任务数量,因此,在分配给双主板设备对应目标任务之前,需要先确定其对应主板的CPU的可用算力资源,该可用算力资源可计算出分配任务数量的上限。
需要说明的是,以常规冗余CPU的布置方式中,通常使用一个CPU对另一CPU进行安全性监控,监测其是否存在故障或其他问题,需要使用部分算力实现监控效果,在本实施例中的双主板同样可配置此类方案,该双主板存在需要占用部分算力资源实现安全性监控的功能。
S20,根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板。
可理解的是,双主板设备中设置两个主板,分别为第一主板和第二主板,其中,第一主板和第二主板应分别对应的不同的可用算力资源,例如,第一主板还剩下80%未使用资源,第二主板剩下75%未使用资源,因此,可用算力资源中应根据第一主板和第二主板,分别确定出两个主板的可用算力资源,例如,确定出第一主板对应的第一算力资源和第二主板对应的第二算力,从而实现目标任务分配至两个主板的效果。
具体的,以第一主板还剩下80%未使用资源,第二主板剩下75%未使用资源为例进行阐述,在第一主板和第二主板为相同的主板的情况下,第一主板剩余的未使用资源大于第二主板,因此,可将目标任务中的任务倾向于分配至第一主板,分配给第二主板时的任务数量可比分配给第一主板时的任务数量少。
具体的,在分配目标任务时,还可结合可用算力资源将目标任务平均分配至两个主板,例如,仍以第一主板还剩下80%未使用资源,第二主板剩下75%未使用资源为例进行阐述,目标任务需要占用第一主板或第二主板的40%的算力资源,因此,可将目标任务平均分配至第一主板和第二主板,此时第一主板和第二主板仍未达到资源利用上限。
综上,在分配目标任务时,可以平均分配任务的方式,将目标任务分配至第一主板和第二主板,同时,也可考虑第一主板和第二主板的可用算力资源,确定其最大承担任务上限,并以该上限进行不均等分配。
其中,在分配目标任务时,还需考虑目标任务中各任务之间的数据处理逻辑关联,例如,在目标任务中存在10个子任务,分别编号为1、2、3至10,其中,编号4、5和6对应的任务存在处理逻辑关联(例如,任务4得到的结果作为任务5的计算条件,任务5得到的结果作为任务6的计算条件),因此,在分配时保证任务处理的关联性,保证将任务4至6分配至同一个主板即可。
S30,通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果。
可理解的是,在将目标任务分配至第一主板和第二主板后,可通过该第一主板和第二主板,对分配后的目标任务进行并发处理,得到处理结果,其中,该并发处理过程即为使用第一主板和第二主板均处理相应的任务。
例如,目标任务共分为100个待计算事项,将该100个待计算事项分配至第一主板60个,分配至第二主板40个,或分配至第一主板和第二主板均50个,分配完成后,第一主板和第二主板均开始对相应分配得到的任务进行处理即可。
本实施例通过在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源,并根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板,从而可通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果,即根据双主板设备的可用算力资源的情况,将目标任务分配至双主板设备中的第一主板和第二主板中,以实现通过第一主板和第二主板,对目标任务的并发式处理的效果,以提高对设备对目标任务处理时的效率。
如图2所示,基于第一实施例提出本申请基于双主板的任务处理方法第二实施例,本实施例中,步骤S20具体包括:
S21,根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板,以通过所述目标监控主板对所述第一主板和所述第二主板的处理进程进行实时监控,并将监控得到的数据实时上报。
可理解的是,可用算力资源需要对应第一主板和第二主板,即第一主板对应第一算力资源,第二主板对应第二算力资源,从而可根据该第一算力资源和第二算力资源,从第一主板和第二主板中选择目标监控主板。
需要说明的是,目标监控主板需要实现对主板的处理进程和主板的处理能力进行监控的效果,一方面监控主板的当前处理进度,记录监控主板处理的结果,另一方面监控主板是否存在故障,是否能够正常处理任务,该目标监控主板需要执行相应的监控任务,且该监控任务同时为多项任务,会占用主板的部分算力资源,因此,在从第一主板和第二主板中选择目标监控主板时,需要综合性考虑主板的算力资源,以均衡第一主板和第二主板的算力资源利用情况(保证第一主板和第二主板的算力占用比相近或相等)为主要目的,其次,可优先选择可用算力资源剩余较多的主板作为目标监控主板,以实现灵活分配任务至主板的效果。
应理解的是,在选择目标监控主板时,先计算所述第一算力资源和所述第二算力资源的资源差值,并根据相应的资源差值和预设阈值之间的大小,选择合适的主板作为目标监控主板,其中,第一主板和/或第二主板可作为目标监控主板。
具体的,在所述资源差值大于预设阈值,且所述第一算力资源大于所述第二算力资源时,将所述第二主板作为目标监控主板;在所述资源差值大于预设阈值,且所述第一算力资源小于所述第二算力资源时,将所述第一主板作为目标监控主板;在所述资源差值小于预设阈值时,将所述第一主板和所述第二主板均作为目标监控主板,以通过所述第一主板监控所述第二主板的处理进程,和通过所述第二主板监控所述第一主板的处理进程。
可理解的是,资源差值指的是第一算力资源和第二算力资源的差值,当该差值大于预设阈值时,即证明当前双主板设备中的两个主板之间的存在算力使用不均衡的情况(一个主板占用较多的算力资源,另一个占用较少的算力资源),因此,可在资源差值大于预设阈值的情况下,将第一算力资源和第二算力资源中较少资源对应的主板作为目标监控主板。
其中,在第一主板和第二主板中任一主板作为目标监控主板时,该目标监控主板需要同时对自身的任务处理进程和另一个主板的任务处理进程均进行监控。
进一步地,在资源差值小于预设阈值时,可确定当前双主板设备中的两个主板之间的算力分配均衡,为了维持当前的均衡情况,可将两个主板均作为目标监控主板,并分别监控对方,以实现监控任务的均分效果。
可理解的是,在确定出目标监控主板后,可在双主板设备处理目标任务时,目标监控主板需要对处理目标任务的进程进行监控,并将监控得到的数据上报。
需要说明的是,双主板设备除了配置双主板,以实现相比于原本的设备的双倍处理效率的效果,还需要配置用于管理双主板进程和处理任务分配等的管理节点,该管理节点相当于信息汇总和分配的节点,目标任务的分配由该管理节点下发和分配,目标监控主板监控处理进程的数据同样反馈至该管理节点,以及第一主板和第二主板处理目标任务的结果同样反馈该管理节点,由该管理节点将两个主板所处理的结果进行汇总,以输出至对应的相关人员处,具体的,可参照图3。
其中,该管理节点相当于中间中转节点,通过相关人员与该管理节点进行信息交互,从而通过该管理节点同时管理两个主板,以提高管理效率。
S22,根据所述目标监控主板,生成所述目标任务的分配方案。
可理解的是,在确定出目标监控主板后,需要给目标监控主板分配相应的监控任务,占用部分算力资源,因此,需要在可用算力资源的基础上,在确定目标监控主板所配置监控任务所使用的算力资源之后,再分配相应的目标任务至对应的主板。
其中,在分配目标任务至主板时,需要先生成相应的分配方案,以保证管理节点能够根据该分配方案,对各主板处理目标任务的处理结果进行复检,或在后期再次分配目标任务时,依靠该分配方案进行重分配,保证分配的任务的精准性。
其中,该分配方案应包括目标任务按照分配批次的情况,目标任务分配至对应的主板,目标任务之间的处理顺序,目标任务中特定的任务处理逻辑等内容。
即生成分配方案时,需要从两方面进行考虑,一方面为主板所剩余的可用算力资源的情况进行分配任务,另一方面为目标任务的相关顺序和特性进行关联性任务的整体分配方案。
具体的,以目标任务为100个子任务为例、以第一主板(22)和第二主板(28)每次一共承接50个任务为例进行阐述,考虑第一主板和第二主板每次承接任务的数量为50个,将目标任务划分为两个批次进行处理,第一批次处理目标任务中的前50个任务,第二批次处理目标任务中的后50个任务,同时,将前后的50个任务合理分配至第一主板和第二主板,建立两个批次任务和第一主板和第二主板之间的关联关系。
其中,在确定分批次后的目标任务和第一主板和第二主板之间的关联关系后,还需确定分批次的目标任务之间的处理顺序,例如,分配至第一主板的A批次任务为目标任务中的前22个任务,分配至第二主板的B批次任务为目标任务中的第23个任务至低50个任务,分配至第一主板的C批次任务为目标任务中后50个任务中的前22个,分配至第二主板的D批次任务为目标任务中后50个任务中的后28个,以此,限定第一主板和第二主板所处理的任务在目标任务中的任务处理顺序,可以编号的方式或建立分配方案的方式,确定目标任务的分配的具体内容。
其中,第一主板所能承接的22个任务,第二主板所能承接的28个任务,均为满足主板所能实现的最大承接能力,且第一主板和第二主板均衡使用算力资源所能实现的分配方案,但是目标任务中存在部分具备强运算逻辑关联的任务,例如,任务A的运算结果为任务B的初始数据,因此,在上述保证主板均衡使用的情况下,还要做出迎合实际目标任务中任务特性的情况,对目标任务进行优化分配的方案,例如,将存在强运算逻辑关联的任务分配至同一个主板进行处理,微调主板所承接的任务的数量,例如,将第一主板承接的任务数量增加至26等,以此为基础将上述的分配方案进行整体优化调整,保证主板处理任务的灵活分配任务的效果。
具体的,在考虑可用算力资源的情况下分配目标任务时,需要确定第一主板和第二主板的可用算力资源,并考虑目标监控主板占用部分算力资源的情况,在本实施例中,以第一主板和第二主板中任一主板作为目标监控主板为例,可先确定所述目标监控主板配置监控任务所需占用的监控资源,并根据所述监控资源,计算所述目标监控主板空闲的剩余资源,从而可根据所述剩余资源,生成所述目标任务的分配方案。
可理解的是,该监控资源即为目标监控主板执行相应的监控任务时所占用的资源,该剩余资源即指的是目标监控主板的剩余可用的资源,从而在计算出剩余资源后,将根据该剩余资源,生成相应的目标任务的分配方案。
S23,根据所述分配方案,将所述目标任务分配至所述第一主板和所述第二主板。
可理解的是,根据该分配方案,管理节点即可对应将目标任务分配至第一主板和第二主板,从而实现任务分配的效果。
本实施例通过根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板,以通过所述目标监控主板对所述第一主板和所述第二主板的处理进程进行实时监控,并将监控得到的数据实时上报,并根据所述目标监控主板,生成所述目标任务的分配方案,从而可根据所述分配方案,将所述目标任务分配至所述第一主板和所述第二主板,从而可从第一主板和第二主板中选择得到目标监控主板,并根据选择的出的目标监控主板,进一步生成目标任务的分配方案,从而可合理将目标任务均衡分配至第一主板和第二主板。
如图4所示,基于第一实施例和第二实施例提出本申请基于双主板的任务处理方法第三实施例,本实施例中,所述方法还包括:
S41,若接收到所述目标监控主板上报的故障提示信息,则根据所述故障提示信息,确定在处理任务进程中存在故障的故障主板,其中,该故障主板为所述第一主板和所述第二主板中的任一主板。
可理解的是,目标监控主板用于监控主板在处理任务时是否发生异常,从而在目标监控主板上报故障提示信息时,可确定在处理任务进程中存在有故障的主板,该主板作为故障主板。
需要说明的是,目标监控主板可为第一主板和/或第二主板,可使用双主板设备中任一主板对另一主板进行监控,或使用双主板设备中任一主板对自身任务处理进程和另一主板进行监控,在本实施例中,为了保证故障监测的精准性,最优选择第一主板监控第二主板,第二主板监控第一主板的方式,以实现双目标监控主板的监控效果,且在第一主板和第二主板中任一主板为故障主板时,方能实现后续灵活调配的情况(若两个主板均故障则无法继续处理目标任务)。
因此,在本实施例中以第一主板监控到第二主板存在故障,且第一主板上报故障提示信息至管理节点的方案为例进行阐述,以第二主板监控到第一主板存在故障,且第二主板上报故障提示信息至管理节点的方案与上述方案相同,后续不再赘述。
可理解的是,故障主板即为存在故障,无法继续处理目标任务的主板,但此时为了保证目标任务的处理进度,需要及时对故障主板进行修复或需要对目标任务的处理方案进行调整。
S42,调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配。
可理解的是,为了保证故障主板之前所分配的任务能够正常处理完成,需要对故障主板所配置的任务进行调取,确认该故障主板当前所处理的任务,以便于后续重新分配任务,或对该故障主板所配置的任务进行复检等。
其中,故障主板所配置的任务可包含多项任务,例如,故障主板分配有100个任务,但是在处理100个任务中的第48个任务时,目标监控主板发现该主板存在故障,其处理结果存在异常,此时无法确定该主板之前所处理的47个任务的处理结果是否精准,因此,需要调取该故障主板所配置的任务进行复检和排查,针对前47个任务进行重复执行等方式,以保证故障主板的存在异常的处理结果不会影响到双主板设备最终输出的处理结果的精准性。
其中,调取出该故障主板所配置的任务,可确定将该任务进行重新分配至未出现故障的主板中,以保证该任务能够得到处理结果。
其中,在将故障主板所配置的任务进行任务重分配时,重分配方案包括以下两种,可直接将给任务分配至未发生故障的主板进行处理,或可将该故障主板进行复位,并将该故障主板所配置的任务重新分配至该复位过的主板中继续进行处理。
具体的,复位所述故障主板,将所述故障主板所配置的任务重新下发至复位后的故障主板,其中,若所述复位后的故障主板再次出现故障,则确定未发生故障的主板当前处理任务的处理进度,并根据所述处理进度,将所述故障主板所配置的任务进行任务重分配。
可理解的是,主板进行复位后,可将该主板所对应的配置数据和内存数据等进行相应复位处理,可通过设定相应的复位程序,或在主板外接上复位电路等方式,在确定有主板存在故障时,将该故障主板进行复位,从而可再次使用该复位后的故障主板。
其中,故障主板所存在的故障可能为硬件上的故障问题,仅靠复位的方式,无法解决该故障问题,因此,在使用复位后的故障主板时,仍然设置相应的判断逻辑,在复位后的故障主板使用过程中,若目标监控主板仍然发现该复位后的故障主板存在故障问题,则确定该复位后的故障主板无法正常使用,需要再次制定新的任务分配的方案。
具体的,在再次实现任务分配的方案时,可将下发至复位后的故障主板的任务重新进行分配,并将其分配至为发生故障的主板中,但是该未发生故障的主板中仍然存在相应需要处理的任务,此时,则需要确定该未发生故障的主板的具体任务处理进度,将未发生故障的主板所处理的任务和故障主板所处理的任务进行任务整合,即在分配目标任务时,将目标任务中的多个任务拆分至两个主板,在两个主板中任一主板存在故障时,将分配至两个主板的任务进行整合,以保证未发生故障的主板能够按照目标任务中原本的各项任务的顺序进行处理。
例如,以目标任务为100个任务为例,该100个任务可下发前50个任务至第一主板和第二主板中进行处理,其中50个任务中的前20个任务分配至第一主板,其中50个任务中的后30个任务分配至第二主板,同时,预定分配目标任务100个任务中的后50个任务至两个主板(后50个任务中的前20个任务预计分配至第一主板,后30个任务预计分配至第二主板)此时,第二主板存在故障,将第二主板的30个任务进行重分配,并确定将该30个任务分配至第一主板,但是第一主板和第二主板还有预计分配的任务,因此,在将故障的第二主板的30个任务分配至第一主板时,需要考虑第一主板的处理进度,若第一主板还在处理第一批任务中的20个任务,则将该故障的第二主板的30个任务直接安排在第一主板第一批任务处理完成之后的处理顺序,若第二主板在处理第二批任务,则将该故障的第二主板的30个任务进行任务顺序标记,并在标记后安排在第一主板第二批任务处理完成之后的处理顺序。
此外,若第一主板和第二主板均正常工作,则会分别输出由第一主板所处理得到的第一处理结果,和由第二主板所处理得到的第二处理结果,该第一处理结果和第二处理结果均需要上传至管理节点,并通过管理节点对外输出并展示第一主板和第二主板的处理结果。
具体的,接收所述第一处理结果和所述第二处理结果,并将所述第一处理结果和所述第二处理结果按照对应目标任务的任务顺序进行整合,将第一处理结果和第二处理结果按照目标任务的任务编号的先后顺序,将第一处理结果和第二处理结果按照一定的顺序进行整合排列。
此外,还可通过管理节点,对第一处理结果和第二处理结果进行复检,例如,判断各处理结果中的处理数据是否存在异常(格式异常或数据内容与预期内容偏差较大等),以此,在本实施例可接收由所述目标监控主板上报的监控数据,并根据所述监控数据,对整合后的处理结果进行复检,并将复检得到的结果添加至所述整合的处理结果中。
其中,在主板得到的处理结果上报至管理节点时,可能在上传过程中出现错误,或由管理节点整理数据时出现问题,因此,需要采用复检的方式,通过目标监控主板上报的监控数据,可实现以监控数据,对整合后的处理结果进行复检的效果,并可将复检得到的结果添加至整合的处理结果中,以便于后续相关人员的人工复核。
需要说明的是,监控数据应包括目标监控主板对处理目标任务的处理过程的监控内容,以及监控到的处理结果等。
本实施例通过若接收到所述目标监控主板上报的故障提示信息,则根据所述故障提示信息,确定在处理任务进程中存在故障的故障主板,其中,该故障主板为所述第一主板和所述第二主板中的任一主板,从而可调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配,从而可在双主板设备中存在故障主板的情况下,通过任务重分配的方案,仍然保证目标任务的可处理效果。
此外,本申请实施例还提出一种基于双主板的任务处理装置,参照图5,所述基于双主板的任务处理装置包括:
确定模块10,用于在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源;
分配模块20,用于根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板;
处理模块30,用于根据所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果。
本实施例通过在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源,并根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板,从而可通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果,即根据双主板设备的可用算力资源的情况,将目标任务分配至双主板设备中的第一主板和第二主板中,以实现通过第一主板和第二主板,对目标任务的并发式处理的效果,以提高对设备对目标任务处理时的效率。
需要说明的是,上述装置中的各模块可用于实现上述方法中的各个步骤,同时达到相应的技术效果,本实施例在此不再赘述。
参照图6,图6为本申请实施例方案涉及的硬件运行环境的设备的结构示意图。
如图6所示,该设备可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图6中示出的结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图6所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于双主板的任务处理程序。
在图6所示的设备中,网络接口1004主要用于与外部网络进行数据通信;用户接口1003主要用于接收用户的输入指令;所述设备通过处理器1001调用存储器1005中存储的基于双主板的任务处理程序,并执行以下操作:
在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源;
根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板;
通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果。
进一步地,处理器1001可以调用存储器1005中存储的基于双主板的任务处理程序,还执行以下操作:
根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板,以通过所述目标监控主板对所述第一主板和所述第二主板的处理进程进行实时监控,并将监控得到的数据实时上报;
根据所述目标监控主板,生成所述目标任务的分配方案;
根据所述分配方案,将所述目标任务分配至所述第一主板和所述第二主板。
进一步地,处理器1001可以调用存储器1005中存储的基于双主板的任务处理程序,还执行以下操作:
计算所述第一算力资源和所述第二算力资源的资源差值;
在所述资源差值大于预设阈值,且所述第一算力资源大于所述第二算力资源时,将所述第二主板作为目标监控主板;
在所述资源差值大于预设阈值,且所述第一算力资源小于所述第二算力资源时,将所述第一主板作为目标监控主板;
在所述资源差值小于预设阈值时,将所述第一主板和所述第二主板均作为目标监控主板,以通过所述第一主板监控所述第二主板的处理进程,和通过所述第二主板监控所述第一主板的处理进程。
进一步地,处理器1001可以调用存储器1005中存储的基于双主板的任务处理程序,还执行以下操作:
在所述第一主板和所述第二主板中任一主板作为目标监控主板时,确定所述目标监控主板配置监控任务所需占用的监控资源;
根据所述监控资源,计算所述目标监控主板空闲的剩余资源;
根据所述剩余资源,生成所述目标任务的分配方案。
进一步地,处理器1001可以调用存储器1005中存储的基于双主板的任务处理程序,还执行以下操作:
接收所述第一处理结果和所述第二处理结果,并将所述第一处理结果和所述第二处理结果按照对应目标任务的任务顺序进行整合;
接收由所述目标监控主板上报的监控数据;
根据所述监控数据,对整合后的处理结果进行复检,并将复检得到的结果添加至所述整合的处理结果中。
进一步地,处理器1001可以调用存储器1005中存储的基于双主板的任务处理程序,还执行以下操作:
若接收到所述目标监控主板上报的故障提示信息,则根据所述故障提示信息,确定在处理任务进程中存在故障的故障主板,其中,该故障主板为所述第一主板和所述第二主板中的任一主板;
调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配。
进一步地,处理器1001可以调用存储器1005中存储的基于双主板的任务处理程序,还执行以下操作:
复位所述故障主板,将所述故障主板所配置的任务重新下发至复位后的故障主板;
若所述复位后的故障主板再次出现故障,则确定未发生故障的主板当前处理任务的处理进度;
根据所述处理进度,将所述故障主板所配置的任务进行任务重分配。
本实施例通过在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源,并根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板,从而可通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果,即根据双主板设备的可用算力资源的情况,将目标任务分配至双主板设备中的第一主板和第二主板中,以实现通过第一主板和第二主板,对目标任务的并发式处理的效果,以提高对设备对目标任务处理时的效率。
此外,本申请实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有基于双主板的任务处理程序,所述基于双主板的任务处理程序被处理器执行时实现如下操作:
在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源;
根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板;
通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果。
本实施例通过在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源,并根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板,从而可通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果,即根据双主板设备的可用算力资源的情况,将目标任务分配至双主板设备中的第一主板和第二主板中,以实现通过第一主板和第二主板,对目标任务的并发式处理的效果,以提高对设备对目标任务处理时的效率。
需要说明的是,上述计算机可读存储介质被处理器执行时还可实现上述方法中的各个步骤,同时达到相应的技术效果,本实施例在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还 包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、 方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (3)

1.一种基于双主板的任务处理方法,其特征在于,所述基于双主板的任务处理方法包括以下步骤:
在双主板设备需处理目标任务时,确定所述双主板设备的可用算力资源;
根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板;
所述可用算力资源包括所述第一主板对应的第一算力资源和所述第二主板对应的第二算力资源;
所述根据所述可用算力资源,将所述目标任务分配至所述双主板设备的第一主板和第二主板的步骤,包括:
根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板,以通过所述目标监控主板对所述第一主板和所述第二主板的处理进程进行实时监控,并将监控得到的数据实时上报;
所述根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板的步骤之后,所述方法还包括:
若接收到所述目标监控主板上报的故障提示信息,则根据所述故障提示信息,确定在处理任务进程中存在故障的故障主板,其中,该故障主板为所述第一主板和所述第二主板中的任一主板;
调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配;
所述调取所述故障主板所配置的任务,将所述故障主板所配置的任务进行任务重分配的步骤,包括:
复位所述故障主板,将所述故障主板所配置的任务重新下发至复位后的故障主板;
若所述复位后的故障主板再次出现故障,则确定未发生故障的主板当前处理任务的处理进度;
根据所述处理进度,将所述故障主板所配置的任务进行任务重分配;
所述目标监控主板为第一主板和/或第二主板,所述根据所述第一算力资源和所述第二算力资源,从所述第一主板和所述第二主板中选择得到目标监控主板的步骤,包括:
计算所述第一算力资源和所述第二算力资源的资源差值;
在所述资源差值大于预设阈值,且所述第一算力资源大于所述第二算力资源时,将所述第二主板作为目标监控主板;
在所述资源差值大于预设阈值,且所述第一算力资源小于所述第二算力资源时,将所述第一主板作为目标监控主板;
在所述资源差值小于预设阈值时,将所述第一主板和所述第二主板均作为目标监控主板,以通过所述第一主板监控所述第二主板的处理进程,和通过所述第二主板监控所述第一主板的处理进程;
根据所述目标监控主板,生成所述目标任务的分配方案;
所述根据所述目标监控主板,生成所述目标任务的分配方案的步骤,包括:
在所述第一主板和所述第二主板中任一主板作为目标监控主板时,确定所述目标监控主板配置监控任务所需占用的监控资源;
根据所述监控资源,计算所述目标监控主板空闲的剩余资源;
根据所述剩余资源,生成所述目标任务的分配方案;
根据所述分配方案,将所述目标任务分配至所述第一主板和所述第二主板;
通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果;
所述处理结果包括由所述第一主板处理得到的第一处理结果和由所述第二主板处理得到的第二处理结果,所述通过所述第一主板和所述第二主板,对分配后的目标任务进行并发处理,得到处理结果的步骤之后,所述方法还包括:
接收所述第一处理结果和第二处理结果,并将所述第一处理结果和所述第二处理结果按照对应目标任务的任务顺序进行整合;
接收由所述目标监控主板上报的监控数据;
根据所述监控数据,对整合后的处理结果进行复检,并将复检得到的结果添加至整合的处理结果中。
2.一种基于双主板的任务处理设备,其特征在于,所述基于双主板的任务处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于双主板的任务处理程序,所述基于双主板的任务处理程序配置为实现如权利要求1所述的基于双主板的任务处理方法的步骤。
3.一种存储介质,其特征在于,存储介质上存储有实现基于双主板的任务处理方法的程序,实现基于双主板的任务处理方法的程序被处理器执行以实现如权利要求1所述的基于双主板的任务处理方法的步骤。
CN202311698282.2A 2023-12-12 2023-12-12 基于双主板的任务处理方法、装置、设备及存储介质 Active CN117389749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311698282.2A CN117389749B (zh) 2023-12-12 2023-12-12 基于双主板的任务处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311698282.2A CN117389749B (zh) 2023-12-12 2023-12-12 基于双主板的任务处理方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN117389749A CN117389749A (zh) 2024-01-12
CN117389749B true CN117389749B (zh) 2024-03-26

Family

ID=89468815

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311698282.2A Active CN117389749B (zh) 2023-12-12 2023-12-12 基于双主板的任务处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN117389749B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178673A (zh) * 2007-12-14 2008-05-14 中国人民解放军国防科学技术大学 一种并行计算机系统管理控制器的容错备份方法及系统
CN107888709A (zh) * 2017-12-25 2018-04-06 上海京颐科技股份有限公司 便携式移动医疗终端和医护通信系统
WO2023020010A1 (zh) * 2021-08-16 2023-02-23 华为技术有限公司 一种运行进程的方法及相关设备
CN116302568A (zh) * 2023-05-17 2023-06-23 算力互联(北京)科技有限公司 一种算力资源调度方法及系统、调度中心、数据中心
CN116541338A (zh) * 2023-06-27 2023-08-04 苏州浪潮智能科技有限公司 一种计算系统、模型训练方法、装置及产品

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178673A (zh) * 2007-12-14 2008-05-14 中国人民解放军国防科学技术大学 一种并行计算机系统管理控制器的容错备份方法及系统
CN107888709A (zh) * 2017-12-25 2018-04-06 上海京颐科技股份有限公司 便携式移动医疗终端和医护通信系统
WO2023020010A1 (zh) * 2021-08-16 2023-02-23 华为技术有限公司 一种运行进程的方法及相关设备
CN116302568A (zh) * 2023-05-17 2023-06-23 算力互联(北京)科技有限公司 一种算力资源调度方法及系统、调度中心、数据中心
CN116541338A (zh) * 2023-06-27 2023-08-04 苏州浪潮智能科技有限公司 一种计算系统、模型训练方法、装置及产品

Also Published As

Publication number Publication date
CN117389749A (zh) 2024-01-12

Similar Documents

Publication Publication Date Title
CN109669758A (zh) 服务器资源的调配方法、装置、设备及存储介质
US10268513B2 (en) Computing resource allocation optimization
US7712102B2 (en) System and method for dynamically configuring a plurality of load balancers in response to the analyzed performance data
US7574620B2 (en) Method for operating an arrangement of a plurality of computers in the event of a computer failure
US20070233838A1 (en) Method for workload management of plural servers
US20050132379A1 (en) Method, system and software for allocating information handling system resources in response to high availability cluster fail-over events
US9244721B2 (en) Computer system and divided job processing method and program
CN113886089B (zh) 一种任务处理方法、装置、系统、设备及介质
CN110308980A (zh) 数据的批量处理方法、装置、设备及存储介质
CN112162839A (zh) 任务调度方法、装置、计算机设备和存储介质
CN113157379A (zh) 集群节点资源调度方法及装置
CN111045811A (zh) 一种任务分配方法、装置、电子设备及存储介质
CN111209098A (zh) 一种智能渲染调度方法、服务器、管理节点及存储介质
CN117971491A (zh) 进程内资源控制方法、装置、设备及存储介质
CN117389749B (zh) 基于双主板的任务处理方法、装置、设备及存储介质
CN110569124A (zh) 一种任务分配方法和装置
US9836342B1 (en) Application alerting system and method for a computing infrastructure
CN113377535A (zh) 分布式定时任务分配方法、装置、设备及可读存储介质
US20100083034A1 (en) Information processing apparatus and configuration control method
CN115373826B (zh) 一种基于云计算的任务调度方法及装置
US11513858B2 (en) System for operating and method for arranging nodes thereof
JP2009087213A (ja) 計算機余力算出装置、計算機余力算出方法
CN114461401A (zh) 资源调度方法方法、装置、电子设备及存储介质
JP6374059B2 (ja) コンピュータ資源配分決定方法、コンピュータ資源配分決定方法プログラムおよび制御用コンピュータ
CN111597037B (zh) 作业分配方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant