CN117271142B - 用于分析概率安全分析模型的负载均衡方法和任务调度器 - Google Patents

用于分析概率安全分析模型的负载均衡方法和任务调度器 Download PDF

Info

Publication number
CN117271142B
CN117271142B CN202311557767.XA CN202311557767A CN117271142B CN 117271142 B CN117271142 B CN 117271142B CN 202311557767 A CN202311557767 A CN 202311557767A CN 117271142 B CN117271142 B CN 117271142B
Authority
CN
China
Prior art keywords
task scheduler
computing node
computing
complexity
available
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311557767.XA
Other languages
English (en)
Other versions
CN117271142A (zh
Inventor
潘延卿
张佶翱
孔凡鹏
况慧文
沙平川
李华
肖冰山
耿飞
刘桂刚
宋林
杨汝贞
陈国才
杨赟
汪秉忠
彭涣淋
张华志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CNNC Fujian Nuclear Power Co Ltd
Original Assignee
CNNC Fujian Nuclear Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CNNC Fujian Nuclear Power Co Ltd filed Critical CNNC Fujian Nuclear Power Co Ltd
Priority to CN202311557767.XA priority Critical patent/CN117271142B/zh
Publication of CN117271142A publication Critical patent/CN117271142A/zh
Application granted granted Critical
Publication of CN117271142B publication Critical patent/CN117271142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • G06F9/5088Techniques for rebalancing the load in a distributed system involving task migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种用于分析概率安全分析模型的负载均衡方法和任务调度器,该负载均衡方法包括:任务调度器获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力;任务调度器将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列;任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。本申请通过优先将复杂度高的任务分发给计算能力强的可用的计算节点,且从分布式集群框架和任务调度等多层次对概率安全分析模型的计算过程进行细粒度的并行计算,从而提升计算效率低,且避免因子模型大小不均衡造成的长尾效应。

Description

用于分析概率安全分析模型的负载均衡方法和任务调度器
技术领域
本申请属于核电厂概率安全分析技术领域,具体涉及一种用于分析概率安全分析模型的负载均衡方法和任务调度器。
背景技术
核电厂实时风险监测软件需要高效的风险计算引擎作为底层支撑,在机组设备发生状态变化的情况下,通过计算引擎及时得到核电厂的安全风险变化,对提高电厂安全部门的风险见解,促进相关人员快速采取风险响应措施,提升核电厂纵深防御水平具有重要意义。
风险计算引擎的高效性很大程度上取决于概率安全分析(Probabilistic SafetyAssessment,PSA)模型的最小割集求解算法,但是随着PSA模型的精细化程度提升,PSA模型的内部逻辑越发复杂,导致最小割集的计算复杂度呈指数提升,尤其是对于核电机组这种庞大复杂的系统而言,设计一套最小割集的高效求解技术显得尤为重要。
提升PSA风险计算引擎效率的办法包括但不限于:办法1、最小割集求解算法的优化;办法2、对模型采用“分而治之”的办法。办法1需要较为专业的理论研究且实施难度较大,相比而言,办法2中将PSA模型拆分成子模型,通过并行计算的方式提升计算效率,在工程上更为实用。目前国内外对PSA模型拆分并行计算的研究相对较少,如何设计有效的并行策略,避免子模型大小不均衡造成的“长尾效应”,是值得研究的科学性和工程性问题。
发明内容
有鉴于此,本申请实施例致力于提供一种用于分析概率安全分析模型的负载均衡方法和任务调度器,通过优先将复杂度高的任务分发给计算能力强的可用的计算节点,且从分布式集群框架和任务调度等多层次对概率安全分析模型的计算过程进行细粒度的并行计算,以解决现有的概率安全分析风险计算中存在的计算效率低和因子模型大小不均衡造成的长尾效应的问题。
本申请第一方面提供了一种用于分析概率安全分析模型的负载均衡方法,该负载均衡方法包括:任务调度器获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力;任务调度器将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列;任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
在上述方案中,通过设置任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点,从而使得任务调度器能够结合计算节点的计算能力和任务的复杂度进行任务动态合理分配,减缓了计算环节的“长尾效应”。另外,通过从分布式集群框架和任务调度这两个层次,对大型的概率安全分析模型的计算过程进行细粒度的并行计算,从而能够充分利用计算机的多核并行能力,提升了计算引擎的计算效率,及时反映核电厂的风险水平变化。
在本申请一个具体实施方式中,上述任务调度器获取多个计算节点中至少一个可用的计算节点和至少一个可用的计算节点的计算能力,包括:任务调度器接收当前分布式集群中多个计算节点发送的注册心跳消息,注册心跳消息包括心跳发送时间、算力信息和当前节点的信息;任务调度器根据注册心跳消息确定多个计算节点中至少一个可用的计算节点和至少一个可用的计算节点的计算能力。
在本申请一个具体实施方式中,在上述任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点之前,该负载均衡方法还包括:任务调度器将多个待计算的事故序列经拆分重组算法拆分重组成多组拆分序列求解任务,多组拆分序列求解任务对应的最高复杂度小于多个待计算的事故序列对应的最高复杂度。上述任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点,包括:任务调度器将多组拆分序列求解任务按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
在本申请一个具体实施方式中,上述任务调度器将多个待计算的事故序列经拆分重组算法拆分重组成多组拆分序列求解任务,包括:任务调度器根据多个待计算的事故序列中功能事件的数量和功能事件连接的故障树节点数量分别计算多个待计算的事故序列对应的复杂度;任务调度器计算多个待计算的事故序列对应的均值和标准差;将至少一个待计算的事故序列中复杂度超出均值和标准差之和的事故序列中的超出部分进行拆分,以形成多组拆分序列求解任务。
在本申请一个具体实施方式中,上述任务调度器按照复杂度从高到低的顺序将多组拆分序列求解任务依次分发给计算能力从强到弱的至少一个可用的计算节点,包括:任务调度器将多组拆分序列求解任务按照复杂度从高到低排序;任务调度器查找当前分布式集群中是否存在至少一个可用的计算节点;若当前分布式集群中不存在至少一个可用的计算节点,则任务调度器等待直至计算节点可用或者拆分序列求解任务过期;若当前分布式集群中存在至少一个可用的计算节点,则任务调度器将至少一个可用的计算节点按照从强到弱排序;任务调度器按照复杂度从高到低的顺序将多组拆分序列求解任务分别分发给按照计算能力从强到弱的至少一个可用的计算节点,直至多组拆分序列求解任务完成。
在本申请一个具体实施方式中,在上述任务调度器优先将多组拆分序列求解任务中复杂度高的拆分序列求解任务分发给至少一个可用的计算节点中计算能力强的计算节点,直至多组拆分序列求解任务完成之后,还包括:任务调度器从至少一个可用的计算节点中选取计算能力最强的计算节点;任务调度器将多组拆分序列求解任务对应的处理结果在计算能力最强的计算节点上聚集规约,以获得最终的结算结果。结算结果包括顶事件发生概率、顶事件发生频率和重要度值中的任一个或多个。
本申请第二方面提供了一种任务调度器,该任务调度器包括获取模块、推导模块和分发模块。获取模块用于获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力。推导模块用于将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列。分发模块用于将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
本申请第三方面提供了一种用于分析概率安全分析模型的负载均衡装置,该负载均衡装置包括多个计算节点和本申请第二方面的任务调度器。任务调度器用于执行本申请第一方面的用于分析概率安全分析模型的负载均衡方法。多个计算节点用于向任务调度器发送注册心跳消息,以便于任务调度器根据注册心跳消息确定当前分布式集群中至少一个可用的计算节点。
本申请第四方面提供了一种电子设备,该电子设备包括处理器和存储器。处理器用于执行本申请第一方面的用于分析概率安全分析模型的负载均衡方法。存储器用于存储处理器的可执行指令。
本申请第五方面提供了一种计算机可读存储介质,其上存储有计算机的可执行指令。可执行指令被处理器执行时实现本申请第一方面的用于分析概率安全分析模型的负载均衡方法。
附图说明
图1所示为本申请一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。
图2所示为本申请一实施例提供的一种任务分配策略的示意图。
图3所示为本申请另一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。
图4所示为本申请一实施例提供的一种分布式集群消息注册机制的结构示意图。
图5所示为本申请又一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。
图6所示为图5所示实施例的负载均衡方法的框图。
图7所示为本申请再一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。
图8所示为图7所示实施例的负载均衡方法对应的结构示意图。
图9所示为本申请一实施例提供的一种任务调度器的框图。
图10所示为本申请一实施例提供的一种用于分析概率安全分析模型的负载均衡装置的结构示意图。
图11所示为本申请一实施例提供的一种电子设备的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1所示为本申请一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。图2所示为本申请一实施例提供的一种任务分配策略的示意图。如图1所示,该用于分析概率安全分析模型的负载均衡方法包括以下步骤。
S10:任务调度器获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力。
S20:任务调度器将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列。
具体而言,求解最小割集过程中可以将整个概率安全分析模型(PSA模型)作为输入,任务调度器可以利用事件树模型推导出所有待计算的事故序列。
在一些实施例中,当PSA模型过大时,可以采用增加计算节点的方式增加当前分布式集群的并行能力,从而突破了单台计算机的内存和算力瓶颈,使得当前分布式集群作为一种分布式计算框架,能够支持平行扩展的事件树求解,相比于其他计算方式,该分布式计算方式具有更强的计算适应能力。
S40:任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
在一些实施例中,若至少一个可用的计算节点的数量M不少于多个待计算的事故序列的数量N,则任务调度器直接将N个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的N个可用的计算节点。M和N均为大于1的正整数。举例来说,多个待计算的事故序列按照复杂度从高到低的顺序依次包括待计算的事故序列1和待计算的事故序列2,至少一个可用的计算节点按照计算能力从强到弱的顺序依次包括可用的计算节点1、可用的计算节点2和可用的计算节点3,则任务调度器先将待计算的事故序列1分发给可用的计算节点1,再将待计算的事故序列2分发给可用的计算节点2。
在另一些实施例中,若至少一个可用的计算节点的数量M少于多个待计算的事故序列的数量N,则任务调度器直接将M个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的M个可用的计算节点,剩余的N-M个待计算的事故序列按照复杂度从高到低排队,等待计算节点再次处于可用状态时,依次向处于可用状态的计算节点再次分发待计算的事故序列。举例来说,如图2所示,多个待计算的事故序列对应于多个任务,多个任务按照复杂度从高到低的顺序依次包括任务1(例如,待计算的事故序列1)、任务2(例如,待计算的事故序列2)和任务3(例如,待计算的事故序列3),至少一个可用的计算节点按照计算能力从强到弱的顺序依次包括可用的计算节点1和可用的计算节点2。图2展示了任务1、任务2和任务3这三个不同复杂度的任务,任务1的复杂度为t1,任务2的复杂度为t2,任务3的复杂度为t3,图2中的复杂度通过任务长短表示,任务越长表示复杂度越高。任务调度器先将任务1分发给计算节点1对应的线程1,再将任务2分发给计算节点2对应的线程2,由于任务1的复杂度大于任务2的复杂度,因而线程2较线程1优先再次处于可用状态,则在线程2再次处于可用状态时,将任务3分发给线程2(如图2的策略一)。在双线程(线程1和线程2)的算力配置下,由不同的分配策略导致的计算时间差异。从图2中的任务分配策略对比可以看出,相较于优先分配复杂度低的任务分配策略(策略二),优先分配复杂度高的任务分配策略(策略一)能更好的避免并行计算过程中的“长尾效应”。
根据本申请实施例提供的技术方案,通过设置任务调度器获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力,从而保证了任务调度器能够获得当前分布式集群中计算节点的存活情况以及处于存活状态下的可用的计算节点的计算能力,有利于任务调度器合理分配计算任务。另外,通过设置任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点,从而通过调整各任务(例如,多个待计算的事故序列)的优先级,向较强的计算节点优先分配复杂度高的待计算的事故序列,复杂度较低的待计算的事故序列则相对滞后计算,进而减缓了计算环节的“长尾效应”。本申请实施例通过从分布式集群框架和任务调度这两个层次,对大型的概率安全分析模型的计算过程进行细粒度的并行计算,通过多层次的负载均衡方法增强了概率安全分析风险计算引擎的最小割集的并行计算能力,充分利用了计算机的多核并行能力,进而提升了计算引擎的计算效率,及时反映了核电厂的风险水平变化。
图3所示为本申请另一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。图4所示为本申请一实施例提供的一种分布式集群消息注册机制的结构示意图。图3所示实施例为图1所示实施例的一变型例。如图3所示,与图1所示实施例的不同之处在于,步骤S11和S12为图1所示实施例中步骤S10的一具体实现方式。
S11:任务调度器接收当前分布式集群中多个计算节点发送的注册心跳消息。注册心跳消息包括心跳发送时间、算力信息和当前节点的信息。
具体而言,如图4所示,当前分布式集群中多个计算节点可以向任务调度器发送注册心跳消息,任务调度器则接收多个计算节点发送的注册心跳消息。
需要说明的是,当前节点的信息包括但不限于互联网协议(Internet Protocol,IP)地址和服务端口号。算力信息包括但不限于中央处理器(Central Processing Unit,CPU)主频、CPU核数、CPU利用率和内存利用率。
S12:任务调度器根据注册心跳消息确定多个计算节点中至少一个可用的计算节点和至少一个可用的计算节点的计算能力。
根据本申请实施例提供的技术方案,通过设置任务调度器根据多个计算节点发送的注册心跳消息实时或定时确定当前分布式集群中可用的计算节点和相关的计算能力,从而在分布式计算集群中,通过节点的注册机制,实现集群节点的算力感知功能,有利于后续任务调度器根据计算节点的计算能力合理地分配计算任务,实现任务动态分配。
图5所示为本申请又一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。图6所示为图5所示实施例的负载均衡方法的框图。图5所示为图1所示实施例的一变型例。如图5所示,与图1所示实施例的不同之处在于,在步骤S40之前,该负载均衡方法还包括步骤S30。步骤S41为图1所示实施例中步骤S40的一变型例。
S30:任务调度器将多个待计算的事故序列经拆分重组算法拆分重组成多组拆分序列求解任务。多组拆分序列求解任务对应的最高复杂度小于多个待计算的事故序列对应的最高复杂度。
在一些实施例中,任务调度器可以将多个待计算的事故序列中每个待计算的事故序列均进行拆分。在另一些实施例中,任务调度器可以将多个待计算的事故序列中部分的待计算的事故序列均进行拆分。多个待计算的事故序列与多组拆分序列求解任务一一对应,对于拆分过的待计算的事故序列,则对应的拆分序列求解任务中包括多个子任务。对于未拆分过的待计算的事故序列,则对应的拆分序列求解任务中包括未拆分过的待计算的事故序列。
S41:任务调度器将多组拆分序列求解任务按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
根据本申请实施例提供的技术方案,通过设置任务调度器对多个待计算的事故序列拆分重组成复杂度较小的多组拆分序列求解任务,从而通过PSA模型的诸如模型预加载、事故树预拼接和状态化简操作等预编译过程,对模型进行统计和拆分,将长事故序列进行拆分,平衡了不同待计算的事故序列的计算时长,避免了单个待计算的事故序列计算耗时过长带来整个计算任务的低效。本申请实施例从分布式集群框架、任务调度和序列模型拆分三个层次(如图6所示),对概率安全分析模型进行细粒度的并行计算,从而进一步提升了计算引擎的计算效率。
图7所示为本申请再一实施例提供的一种用于分析概率安全分析模型的负载均衡方法的流程示意图。图8所示为图7所示实施例的负载均衡方法对应的结构示意图。如图7所示,步骤S31至S33为图5所示实施例中步骤S30的一具体实现方式。
S31:任务调度器根据多个待计算的事故序列中功能事件的数量和功能事件连接的故障树节点数量分别计算多个待计算的事故序列对应的复杂度。
S32:任务调度器计算多个待计算的事故序列对应的均值和标准差。
S33:将至少一个待计算的事故序列中复杂度超出均值和标准差之和的事故序列中的超出部分进行拆分,以形成多组拆分序列求解任务。
举例来说,假设存在m个待计算的事故序列,某个待计算的事故序列包含n个功能事件,每个功能事件连接的故障树节点数量分别为x1, x2, x3,… xn,用于衡量故障树计算复杂度的函数表示为f(xi),则该待计算的事故序列的计算复杂度表示为C=Πf(xi)(对应于步骤S31);然后计算所有序列的复杂度的均值μ和标准差σ,μ=(ΣCj)/m,σ2=Σ(Cj-μ)2/m(对应于步骤S32);对于复杂度超过μ+σ的事故序列,将其超出部分进行拆分(对应于步骤S33)。
根据本申请实施例提供的技术方案,通过多个待计算的事故序列中功能事件的数量和功能事件连接的故障树规模来衡量多个待计算的事故序列对应的复杂度,结合多个待计算的事故序列对应的均值和标准差来确定是否对待计算的事故序列进行一致性拆分,从而进一步保证了多组拆分序列求解任务的复杂度的均衡。
在本申请至少一实施例中,步骤S411至S415为图5所示实施例中步骤S41的一具体实现方式。
S411:任务调度器将多组拆分序列求解任务按照复杂度从高到低排序。
需要说明的是,多组拆分序列求解任务可以按照复杂度从高到低的顺序排列在任务队列中。
S412:任务调度器查找当前分布式集群中是否存在至少一个可用的计算节点。
S413:若当前分布式集群中不存在至少一个可用的计算节点,则任务调度器等待直至计算节点可用或者拆分序列求解任务过期。
S414:若当前分布式集群中存在至少一个可用的计算节点,则任务调度器将至少一个可用的计算节点按照计算能力从强到弱排序。
需要说明的是,至少一个可用的计算节点按照计算能力从强到弱的顺序排列在计算节点队列中。
S415:任务调度器按照复杂度从高到低的顺序将多组拆分序列求解任务分别分发给按照计算能力从强到弱的至少一个可用的计算节点,直至多组拆分序列求解任务完成。
具体而言,任务调度器依次将多组拆分序列求解任务分发给至少一个可用的计算节点,分发过程中优先将复杂度高的拆分序列求解任务分发给计算能力强的可用的计算节点,直至所有的拆分序列求解任务分发完成。
在本申请至少一实施例中,在上述S415之后,该负载均衡方法还包括S50和S60。
S50:任务调度器从至少一个可用的计算节点中选取计算能力最强的计算节点。
S60:任务调度器将多组拆分序列求解任务对应的处理结果在计算能力最强的计算节点上聚集规约,以获得最终的结算结果。结算结果包括顶事件发生概率、顶事件发生频率和重要度值中的任一个或多个。
举例来说,在聚集规约过程中,对于始发事件输入为基本事件的最小割集结果,由于始发事件的不同,不存在割集吸收的可能,直接加入到最终的最小割集结果即可。对于始发事件输入为故障树的最小割集,存在割集吸收的可能,在加入最终结果之前,需要对每个割集进行吸收、去重操作。
在本申请实施例中,通过在计算能力最强的计算节点上将多组拆分序列求解任务对应的处理结果进行聚集规约,从而能够尽可能准确快速地获得最终的结算结果。
图9所示为本申请一实施例提供的一种任务调度器的框图。如图9所示,该任务调度器100包括获取模块110、推导模块120和分发模块130。获取模块110用于获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力。推导模块120用于将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列。分发模块130用于将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
需要说明的是,该任务调度器100能够执行上述方法实施例的负载均衡方法,包括了上述方法实施例中对应的技术特征,至少能够实现相应的技术效果,此处不再赘述。
图10所示为本申请一实施例提供的一种用于分析概率安全分析模型的负载均衡装置的结构示意图。如图10所示,该负载均衡装置200包括多个计算节点210和本申请上述实施例中的任务调度器100。任务调度器100用于执行本申请上述实施例中的用于分析概率安全分析模型的负载均衡方法。多个计算节点210用于向任务调度器100发送注册心跳消息,以便于任务调度器100根据注册心跳消息确定当前分布式集群中至少一个可用的计算节点。
需要说明的是,任务调度器和多个计算节点可以构成负载均衡装置中的分布式计算引擎。
该负载均衡装置200为上述负载均衡方法实施例对应的装置,包括了上述方法实施例中对应的技术特征,至少能够实现相应的技术效果,此处不再赘述。
图11所示为本申请一实施例提供的一种电子设备的框图。
参照图11,电子设备10包括处理器11和存储器12。存储器12用于存储可由处理器11执行的指令,例如应用程序。处理器11的数量可以为一个或多个。存储器12中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器11被配置为执行指令,以执行上述用于分析概率安全分析模型的负载均衡方法。
电子设备10还可以包括一个电源组件被配置为电子设备10的电源管理,一个有线或无线网络接口被配置为将电子设备10连接到网络,和一个输入输出(I/O)接口。电子设备10可以操作基于存储在存储器12的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当存储介质中的指令由上述电子设备10的处理器执行时,使得上述电子设备10能够执行一种用于分析概率安全分析模型的负载均衡方法。该负载均衡方法由代理程序执行。该用于分析概率安全分析模型的负载均衡方法包括:任务调度器获取当前分布式集群中至少一个可用的计算节点和至少一个可用的计算节点的计算能力;任务调度器将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列;任务调度器将多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的至少一个可用的计算节点。
本领域普通技术人员可以意识到,结合本申请中所公开的实施例描述的各示例的算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的几个实施例中,应该理解到,所揭露的负载均衡方法、任务调度器和负载均衡装置,可以通过其它的方式实现。例如,以上所描述的任务调度器实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本申请各个实施例所述负载均衡方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序校验码的介质。
本领域的技术人员可以清楚的了解到,为了描述的方便和简洁,上述描述的任务调度器和负载均衡装置的具体工作过程,可以参考前述负载均衡方法实施例中的对应过程,在此不再赘述。
需要说明的是,本申请实施例中各技术特征的组合方式并不限本申请实施例中所记载的组合方式或是具体实施例所记载的组合方式,本申请所记载的所有技术特征可以以任何方式进行自由组合或结合,除非相互之间产生矛盾。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种用于分析概率安全分析模型的负载均衡方法,其特征在于,包括:
任务调度器获取当前分布式集群中至少一个可用的计算节点和所述至少一个可用的计算节点的计算能力;
所述任务调度器将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列;
所述任务调度器将多个待计算的事故序列经拆分重组算法拆分重组成多组拆分序列求解任务,包括:所述任务调度器根据多个待计算的事故序列中功能事件的数量和功能事件连接的故障树节点数量分别计算所述多个待计算的事故序列对应的复杂度;所述任务调度器计算所述多个待计算的事故序列对应的均值和标准差;将所述至少一个待计算的事故序列中复杂度超出均值和标准差之和的事故序列中的超出部分进行拆分,以形成多组拆分序列求解任务,其中,多组所述拆分序列求解任务对应的最高复杂度小于多个待计算的事故序列对应的最高复杂度;所述任务调度器将所述多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的所述至少一个可用的计算节点,包括:所述任务调度器将多组所述拆分序列求解任务按照复杂度从高到低的顺序依次分发给计算能力从强到弱的所述至少一个可用的计算节点;
其中,所述任务调度器将多组所述拆分序列求解任务按照复杂度从高到低的顺序依次分发给计算能力从强到弱的所述至少一个可用的计算节点,包括:
所述任务调度器将多组所述拆分序列求解任务按照复杂度从高到低排序;
所述任务调度器查找当前分布式集群中是否存在至少一个可用的计算节点;
若当前分布式集群中不存在至少一个可用的计算节点,则所述任务调度器等待直至计算节点可用或者所述拆分序列求解任务过期;
若所述当前分布式集群中存在至少一个可用的计算节点,则所述任务调度器将所述至少一个可用的计算节点按照从强到弱排序;
所述任务调度器按照复杂度从高到低的顺序将多组所述拆分序列求解任务分别分发给按照计算能力从强到弱的所述至少一个可用的计算节点,直至多组所述拆分序列求解任务完成。
2.根据权利要求1所述的负载均衡方法,其特征在于,所述任务调度器获取多个计算节点中至少一个可用的计算节点和所述至少一个可用的计算节点的计算能力,包括:
任务调度器接收所述当前分布式集群中多个计算节点发送的注册心跳消息,其中,所述注册心跳消息包括心跳发送时间、算力信息和当前节点的信息;
所述任务调度器根据所述注册心跳消息确定多个所述计算节点中至少一个可用的计算节点和所述至少一个可用的计算节点的计算能力。
3.根据权利要求1所述的负载均衡方法,其特征在于,在所述任务调度器优先将多组所述拆分序列求解任务中复杂度高的所述拆分序列求解任务分发给所述至少一个可用的计算节点中计算能力强的计算节点,直至多组所述拆分序列求解任务完成之后,还包括:
所述任务调度器从所述至少一个可用的计算节点中选取计算能力最强的计算节点;
所述任务调度器将多组所述拆分序列求解任务对应的处理结果在所述计算能力最强的计算节点上聚集规约,以获得最终的结算结果,所述结算结果包括顶事件发生概率、顶事件发送频率和重要度值中的任一个或多个。
4.一种任务调度器,其特征在于,用于执行如权利要求1至3中任一项所述的一种用于分析概率安全分析模型的负载均衡方法,其中,所述任务调度器包括:
获取模块,用于获取当前分布式集群中至少一个可用的计算节点和所述至少一个可用的计算节点的计算能力;
推导模块,用于将概率安全分析模型作为输入,利用事件树模型推导出多个待计算的事故序列;以及
分发模块,用于将所述多个待计算的事故序列按照复杂度从高到低的顺序依次分发给计算能力从强到弱的所述至少一个可用的计算节点。
5.一种用于分析概率安全分析模型的负载均衡装置,其特征在于,包括:
如权利要求4所述的一种任务调度器,用于执行权利要求1至3中任一项所述的一种用于分析概率安全分析模型的负载均衡方法;以及
多个计算节点,用于向所述任务调度器发送注册心跳消息,以便于所述任务调度器根据所述注册心跳消息确定当前分布式集群中至少一个可用的计算节点。
6.一种电子设备,其特征在于,包括:
处理器,用于执行权利要求1至3中任一项所述的一种用于分析概率安全分析模型的负载均衡方法;以及
存储器,用于存储所述处理器的可执行指令。
7.一种计算机可读存储介质,其上存储有计算机的可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至3中任一项所述的一种用于分析概率安全分析模型的负载均衡方法。
CN202311557767.XA 2023-11-22 2023-11-22 用于分析概率安全分析模型的负载均衡方法和任务调度器 Active CN117271142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311557767.XA CN117271142B (zh) 2023-11-22 2023-11-22 用于分析概率安全分析模型的负载均衡方法和任务调度器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311557767.XA CN117271142B (zh) 2023-11-22 2023-11-22 用于分析概率安全分析模型的负载均衡方法和任务调度器

Publications (2)

Publication Number Publication Date
CN117271142A CN117271142A (zh) 2023-12-22
CN117271142B true CN117271142B (zh) 2024-03-01

Family

ID=89208477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311557767.XA Active CN117271142B (zh) 2023-11-22 2023-11-22 用于分析概率安全分析模型的负载均衡方法和任务调度器

Country Status (1)

Country Link
CN (1) CN117271142B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140055100A (ko) * 2012-10-30 2014-05-09 한국수력원자력 주식회사 원자력 발전소의 정비계획에 따른 리스크 평가를 위한 운영 시스템 및 그 방법
CN109254846A (zh) * 2018-08-01 2019-01-22 国电南瑞科技股份有限公司 基于两级调度的cpu与gpu协同计算的动态调度方法及系统
WO2021179462A1 (zh) * 2020-03-12 2021-09-16 重庆邮电大学 基于改进量子蚁群算法的Spark平台任务调度方法
WO2023165105A1 (zh) * 2022-03-04 2023-09-07 深圳海星智驾科技有限公司 负载均衡控制方法、装置电子设备、存储介质和计算机程序

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4193302A1 (en) * 2020-08-05 2023-06-14 Avesha, Inc. Performing load balancing self adjustment within an application environment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140055100A (ko) * 2012-10-30 2014-05-09 한국수력원자력 주식회사 원자력 발전소의 정비계획에 따른 리스크 평가를 위한 운영 시스템 및 그 방법
CN109254846A (zh) * 2018-08-01 2019-01-22 国电南瑞科技股份有限公司 基于两级调度的cpu与gpu协同计算的动态调度方法及系统
WO2021179462A1 (zh) * 2020-03-12 2021-09-16 重庆邮电大学 基于改进量子蚁群算法的Spark平台任务调度方法
WO2023165105A1 (zh) * 2022-03-04 2023-09-07 深圳海星智驾科技有限公司 负载均衡控制方法、装置电子设备、存储介质和计算机程序

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Task Scheduling Algorithm for Heterogeneous Real-time Systems Based on Deadline Constraints;Jianpeng Li;《IEEE》;20190805(第05期);全文 *

Also Published As

Publication number Publication date
CN117271142A (zh) 2023-12-22

Similar Documents

Publication Publication Date Title
CN112162865B (zh) 服务器的调度方法、装置和服务器
CN109218355B (zh) 负载均衡引擎,客户端,分布式计算系统以及负载均衡方法
CN111459665A (zh) 一种分布式边缘计算系统及分布式边缘计算方法
CN112003763B (zh) 网络链路的监测方法、监测装置、监测设备及存储介质
CN103699433B (zh) 一种于Hadoop平台中动态调整任务数目的方法及系统
CN108062499A (zh) 一种人脸识别的方法、系统及平台
CN111600967A (zh) 一种基于访问压力的区块链节点间负载均衡系统
CN109614227A (zh) 任务资源调配方法、装置、电子设备及计算机可读介质
CN111160873A (zh) 基于分布式架构的跑批处理装置及方法
TW201804392A (zh) 風險識別方法、風險識別裝置、雲風險識別裝置及系統
US20190280945A1 (en) Method and apparatus for determining primary scheduler from cloud computing system
CN112422448A (zh) Fpga加速卡网络数据传输方法及相关组件
CN109117285B (zh) 支持高并发的分布式内存计算集群系统
CN111158904A (zh) 一种任务调度方法、装置、服务器及介质
CN117271142B (zh) 用于分析概率安全分析模型的负载均衡方法和任务调度器
CN106302241A (zh) 在线消息队列调度方法和装置
CN106294445B (zh) 基于跨机房Hadoop集群的数据存储的方法及装置
CN111158896A (zh) 一种分布式进程调度方法及系统
Yang et al. Yun: a high-performance container management service based on openstack
WO2016165471A1 (zh) Hadoop集群组件指标的采集方法及装置
WO2012116587A1 (zh) 相似邮件处理系统和方法
CN113377866A (zh) 一种虚拟化数据库代理服务的负载均衡方法及装置
CN109120704A (zh) 一种云平台的资源监控方法、装置及设备
CN111831428A (zh) 一种云数据中心资源利用率优化方法及系统
CN112019630A (zh) 一种负载均衡方法以及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant