CN111581033A - 负载均衡方法、系统及装置 - Google Patents

负载均衡方法、系统及装置 Download PDF

Info

Publication number
CN111581033A
CN111581033A CN201910123698.9A CN201910123698A CN111581033A CN 111581033 A CN111581033 A CN 111581033A CN 201910123698 A CN201910123698 A CN 201910123698A CN 111581033 A CN111581033 A CN 111581033A
Authority
CN
China
Prior art keywords
node
task
nodes
scheduling
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910123698.9A
Other languages
English (en)
Other versions
CN111581033B (zh
Inventor
邵珠龙
李晓冬
王向宇
夏玲玲
张雪庆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hisense TransTech Co Ltd
Original Assignee
Hisense TransTech Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hisense TransTech Co Ltd filed Critical Hisense TransTech Co Ltd
Priority to CN201910123698.9A priority Critical patent/CN111581033B/zh
Publication of CN111581033A publication Critical patent/CN111581033A/zh
Application granted granted Critical
Publication of CN111581033B publication Critical patent/CN111581033B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/203Failover techniques using migration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Quality & Reliability (AREA)
  • Hardware Redundancy (AREA)

Abstract

本公开提供了一种负载均衡方法、系统及装置。所述方法实现在包括多个节点的任务处理系统中,所述方法包括:所述多个节点中的每个节点获取系统任务调度表,所述系统任务调度表列出了多个任务集以及分配给每个任务集的节点和每个节点处理该任务集的优先级;所述每个节点读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;所述每个节点处理所获取的所述与本节点具有的预定最大优先级对应的任务集。通过本公开各实施例,可以使得系统负载均衡分配。

Description

负载均衡方法、系统及装置
技术领域
本公开涉及自动化监控技术领域,具体涉及一种负载均衡方法、系统及装置。
背景技术
随着综合监控系统在轨道交通、智慧楼宇、智慧管廊、智能运维、综合枢纽等行业的应用越来越广泛,监控的数据量也日益增长,多机冗余进行数据监控成为行业普遍做法。传统的多机冗余是一主多备的调度方法,即:一台机器处理所有业务,其它机器不处理业务,处于热备状态。这种模式下的系统整体的处理能力受制于单一计算机节点处理能力,横向扩容困难,而且处于热备的计算机长期不处理业务,造成硬件资源的浪费。
发明内容
本公开的实施例提供一种负载均衡方法、系统及装置,以解决传统的一主多备调度方法所造成的系统节点负载不均衡问题。
根据本公开实施例的第一方面,公开了一种负载均衡方法,所述方法实现在包括多个节点的任务处理系统中,所述方法包括:
所述多个节点中的每个节点获取系统任务调度表,所述系统任务调度表列出了多个任务集、分配给每个任务集的节点、以及每个节点处理该任务集的优先级;
所述每个节点读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
所述每个节点处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
根据一示例性实施例,所述方法还包括:
在所述多个节点中出现故障节点的情况下,所述多个节点中的调度节点根据系统任务调度表将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理。
根据一示例性实施例,在所述调度节点根据系统任务调度表将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理之前,所述方法还包括:
调度节点将故障节点的数据同步到其他节点。
根据一示例性实施例,所述调度节点将故障节点的数据同步到其他节点包括:
调度节点向其他节点发送调度通知;
调度节点将故障节点的数据同步到其他节点中对所述调度通知有反馈的节点。
根据一示例性实施例,在所述调度节点根据系统任务调度表将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理之前,所述方法还包括:
调度节点将故障节点的状态置为切换状态,
在所述调度节点根据系统任务调度表将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理之后,所述方法还包括:
调度节点将故障节点的状态置为等待处理。
根据一示例性实施例,在所述系统任务调度表中,每个任务集被分配一个具有预定最大优先级的处理节点。
根据一示例性实施例,所述方法还包括:
所述多个节点中的每个节点获取更新的系统任务调度表,其中在所述更新的系统任务调度表中包括分配给新增节点的一个或多个任务集以及所述新增节点处理所述一个或多个任务集的优先级;
所述新增节点获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集,并执行该任务集。
根据一示例性实施例,所述系统任务调度表中所包括的每个任务集为所述任务处理系统的调度粒度。
根据本公开的第二方面,提供一种任务处理系统,其包括用于处理任务的多个节点,其中所述多个节点中的每个节点被配置为:
获取系统任务调度表,所述系统任务调度表列出了多个任务集、分配给每个任务集的节点、以及每个节点处理该任务集的优先级;
读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
根据本公开的第三方面,提供一种节点设备,其包括:
调度表获取单元,获取系统任务调度表,所述系统任务调度表列出了多个任务集以及分配给每个任务集的节点和每个节点处理该任务集的优先级;
任务获取单元,读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
任务处理单元,处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
根据本公开的第四方面,提供一种节点设备,其包括存储器和处理器,所述存储器上存储有程序代码,所述处理器用于执行所述程序代码,其中,所述处理器在执行所述程序代码时被配置为实现如上所述的负载均衡方法。
本公开的实施例提供的技术方案可以具有以下有益效果:
在本公开以上和以下各实施例的一个或多个中,系统节点获取预先配置的系统任务调度表,并执行系统任务调度表中与本节点具有的预定最大优先级对应的任务集,使得节点对任务的处理与组态配置数据解耦。从而,能够通过在系统任务调度表中将系统各节点预先配置为负载均衡来实现系统运行时的负载均衡,避免了传统方案的一主多备模式导致的负载不均衡。另外,由于节点对任务的处理与组态配置数据解耦,使得可以通过实时更新系统任务调度表并下发给各节点来实现系统节点的在线增删,从而使得在线扩容更方便快捷。此外,由于节点对任务的处理与组态配置数据解耦,并且调度粒度在系统任务调度表中可配置,因此可以通过更改系统任务调度表来方便地更改调度粒度。
本公开的以上以及其他特性和优点将通过下面的详细描述变得清楚,或部分地通过本公开的实践而习得。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
通过参照附图对本公开示例性实施例的详细描述,本公开的上述和其它目标、特征及优点将变得清楚。本公开的附图被并入说明书中并构成本说明书的一部分。附图示例性地示出了适合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1示出了根据本公开一示例性实施例的本公开所涉及的实施环境的示意图。
图2示出根据本公开一示例性实施例的负载均衡方法的流程示意图。
图3示出根据本公开另一示例性实施例的负载均衡方法的流程示意图。
图4示出根据本公开又一示例性实施例的在存在故障节点情况下的负载均衡方法的流程示意图。
图5示出根据本公开又一示例性实施例的在系统中新增节点的情况下的负载均衡方法的流程示意图。
图6示出根据本公开一示例性实施例的节点设备的组成框图。
图7示出根据本公开另一示例性实施例的节点设备的示意组成框图。
具体实施方式
现在将参考附图更全面地描述本公开的示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些示例实施方式目的是使得本公开的描述将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多示例实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的示例实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、步骤等。在其它情况下,不详细示出或描述公知结构、方法、实现或者操作以避免喧宾夺主而使得本公开的各方面变得模糊。
附图中所示的一些框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
传统的综合监控系统为了实现负载均衡一般采用一主多备的模式进行数据容灾,主节点承担所有任务,节点故障时,将整机任务切换到其另一个节点上。其中,不同子系统监控点的数量差距可能较大,如此就可能造成各个服务器系统负载差别较大,数据量大的专业主节点负载过高。
另外,传统的综合监控系统内大多按照子系统进行调度,即以子系统作为调度粒度,并且调度粒度不可配置。如果某个节点集中处理多个站点的数据,那么该节点处理对应子系统所有的数据,无法拆分一个单站的子系统单独启动/停止以进行调试,从而一个进程故障可能造成整个域内所有站的子系统无法正常提供服务。不同子系统监控点的数量差距可能较大,如果调度粒度单一,可能造成各个服务器系统的负载差别较大,无法按照现有负载状态来将每个子系统的任务动态调整到不同的节点执行、以实现动态负载均衡。
此外,传统的综合监控系统一般按照既定的组态配置来配置横向负载节点的部署。其中,利用关系型数据库存放组态数据,然后根据组态数据生成节点部署的配置文件,最后启动工程。此类基础信息无法动态修改,组态完成之后系统规模也就无法轻易变更,如果要变动,需要关闭所有工程,重新组态,再次生成配置文件,然后重启工程,对于生产环境影响十分严重。例如,如果要增加冗余节点,需要关闭工程,重新组态配置并部署新节点,再启动工程。对于综合监控系统来说一般需要支持7*24运行,因此重启工程可能造成较大的影响。
因此,需要一种高效、通用、面向数据的负载均衡调度方法。在本公开的实施例中,不同于传统的一主多备方案,而是根据预先配置的系统任务调度表来保证在启动时或故障时负载在多个节点之间均衡分配。
图1示出了根据本公开一示例性实施例的本公开所涉及的实施环境的示意图。如图1所示,任务处理系统包括多个节点(图1的示例中以4个节点为例):节点1、节点2、……节点4。系统任务调度表是预先配置好的,其中列出了系统要处理的多个任务集以及分配给每个任务集的节点和每个节点处理该任务集的优先级。在一个示例中,对于每个任务集,分配多个节点,并且针对该任务集对每个节点赋予处理该任务集的优先级,其中一个节点具有预定最大优先级(例如优先级为1,即,在正常情况下由该节点来执行该任务集),其他节点具有其他优先级(例如,具有依次降低的优先级)。每个节点可以获取系统任务调度表并将其保存到例如自己的内存数据库中。之后(例如在节点启动时),每个节点读取内存数据库中的系统任务调度表,获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集,并执行该任务集。这样,每个任务集都有针对该任务集具有预定最大优先级的一个节点来处理,这个节点是该任务集的处于主状态的主机,而分配给该任务集的具有其他处理优先级的其他节点对于该任务集来说是处于备状态的备机。在一个示例中,并不是所有的节点都被分配了优先级为预定最大优先级的任务集,有些节点可能并不具有优先级为预定最大优先级的任务集,这样的节点只作为备机。
可以通过配置系统任务调度表中具有预定最大优先级的节点(即主机),使得系统中的多个任务集在多个节点上被处理,例如,每个节点处理大致等量的任务集,以使得负载在多个节点之间均衡。并且还可以通过配置系统任务调度表中具有其他优先级的节点(即备机),使得在发生节点故障时故障节点所处理的任务能够被其他节点均衡地承担。
如图1所示,初始任务集被分配到每台可用节点,每台机器均承担一定量的任务:比如节点1处理车站1的PSCADA任务集、节点2处理车站1的BAS任务集等,从而使得全部节点均都处于活动状态。当节点1发生故障时,车站1的PSCADA任务集会调度到节点2,此时节点2处理两个任务:车站1-PSCADA任务集、车站1-BAS任务集。进一步地,当节点2也发生故障时,车站1-PSCADA任务集将会被调度到节点4,车站1-BAS任务集将会被调度到节点3,而并非像现有技术那样将节点2处理的任务集全部切换到一个节点处理。在该示例中,每次故障切换均能最大限度地平衡现有集群中各节点的负载,不会出现单点负载过高而引起业务异常的现象。
在本公开的实施例中,在节点启动时根据预先配置的系统任务调度表动态分配任务,保证每个节点/机器都承担一定的任务,其中一台机器故障时,系统根据安装的调度规则将故障机器所处理的任务调度到指定节点,而不是将任务全部调度到一台机器上。在以上或以下描述中,任务集可以包括一个或多个任务,其是能够被调度的最小任务单位,即调度粒度。在本公开的各实施例中,调度粒度可以灵活配置。例如,对于集中站的情况可以配置为一个车站一个子系统的调度,例如:调试车站1的PSCADA任务集的时候,仅影响单一车站单一子系统。另外,在本公开的一些实施例中,各节点可以获取预先配置好的系统任务调度表并将其保存(例如保存在自己的内存中),在启动时,各节点可以直接读取所保存的(例如内存数据库中的)系统任务调度表,并根据系统任务调度表来处理任务,因此各节点能够通过系统任务调度表的变化实时感知节点的增删,进而可以轻松实现在线扩容或节点删减、调试。
图2示出了根据本公开一示例性实施例的负载均衡方法的流程示意图。该示例负载均衡方法可以实现在包含多个节点的任务处理系统(例如如图1中所示的系统)中。如图2所示,该示例方法包括:
S210,所述多个节点中的每个节点获取系统任务调度表,所述系统任务调度表列出了多个任务集以及分配给每个任务集的节点和每个节点处理该任务集的优先级。
系统任务调度表是对系统中的任务的调度计划表,每个任务集可以包括一个或多个任务,是调度的最小粒度。如上所述,每个任务集都有针对该任务集具有预定最大优先级的一个节点来处理,这个节点是该任务集的处于主状态的主机,而分配给该任务集的具有其他处理优先级的其他节点对于该任务集来说是处于备状态的备机。系统任务调度表可以由人工配置而成,也可以由设备(例如管理节点)根据预定规则(例如各节点负载均衡原则)来自动生成。这里,某节点相对于某任务集处于“主状态”是指该节点正在处理该任务集,该节点可以称为该任务集的主机;某节点相对于某任务集处于“备状态”是指该节点没有在处理该任务集,而是作为处理该任务集的备用节点,称为该任务集的备机。在该任务集的主机发生故障时,可以将该任务集从主机切换到备机。
系统的每个节点可以通过主动获取或被动接收等方式来获取预先配置的系统任务调度表。例如,在一个示例中,由管理节点获取预先配置的系统任务调度表,并将其下发给各个节点。其中,管理节点可以是系统的多个节点中的一个,也可以是另外的独立节点或其他设备。在另一示例中,预先配置好的系统任务调度表存放在系统中的节点可以访问的位置,各节点在需要时(例如启动时)去该位置自动获取。
S220,所述每个节点读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
如上所述,如果一个节点针对某任务集具有预定最大优先级,那么该节点对于该任务集来说为处于主状态的主机,即,在正常情况下由该节点来处理该任务集。因此,在步骤S220中,每个节点根据系统任务调度表获取其中与本节点具有的预定最大优先级对应的任务集,即由本节点作为主机来处理的任务集,并在步骤S230中对所获取的任务集进行处理。
在一个示例中,将预定最大优先级设置为1,将其他优先级按照由高到低的顺序依次设置为2、3、4、5……。
S230,所述每个节点处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
通过本公开的上述及其他一些实施例,每个系统节点获取根据负载均衡原则预先配置好的系统任务调度表并执行系统任务调度表中与本节点具有的预定最大优先级对应的任务集,使得系统负载能够均衡分配。在一些实施例中,可以通过配置系统任务调度表中具有预定最大优先级的节点(即主机),使得系统中的多个任务集在多个节点上被处理,例如,每个节点处理大致等量的任务集,以使得负载在多个节点之间均衡。在一些实施例中,还可以通过配置系统任务调度表中具有其他优先级的节点(即备机),使得在发生节点故障时故障节点所处理的任务能够被其他节点均衡地承担。另外,在本公开的一些实施例中,各节点可以获取预先配置好的系统任务调度表并将其保存(例如保存在自己的内存中),各节点可以直接读取所保存的(例如内存数据库中的)系统任务调度表,并根据系统任务调度表来处理任务,因此各节点能够通过系统任务调度表的变化实时感知节点的增删,进而可以轻松实现在线扩容或节点删减、调试。此外,在本公开的一些实施例中,可以通过设置系统任务调度表中的可调度任务集来灵活地改变调度粒度,能够使得调试或故障情况下受影响的范围可控。
图3示出了根据本公开另一示例性实施例的负载均衡方法的流程示意图。该示例负载均衡方法同样可以实现在包含多个节点的任务处理系统(例如如图1中所示的系统)中。如图3所示,该示例方法包括:
S310,生成系统任务调度表。
步骤S310也可以称为调度组态配置。初始组态配置将参考涉及工程的节点数目与调度粒度,结合各个节点的处理性能,生成一份系统任务调度表(例如如下表1所示)。系统任务调度表可以由设备(例如管理节点或其他设备)根据预定规则自动生成,也可以由人工配置而成。在生成系统任务调度表时,可以按照负载均衡原则为每个任务集指定主机和备机(即为分配给该任务集的节点设置优先级高低),从而保证各个节点在正常运行时和故障时都能保持负载均衡。系统任务调度表结构的主要字段如下:
表1示例系统任务调度表
Figure BDA0001972875410000091
Figure BDA0001972875410000101
在上表中,共有4个任务集(即调度粒度ID),每个任务集均分配4个节点,其中,对于任务集车站1-PSCADA,节点1为主机,其他节点为备机,对于任务集车站1-BAS,节点4为主机,其他节点为备机,对于任务集车站1-PA,节点3为主机,其他节点为备机,对于任务集车站1-FAS,节点2为主机,其他节点为备机。系统任务调度表配置了调度粒度、可处理该调度粒度的节点、以及节点的优先级。以上表中的车站1-PSCADA调度粒度为例说明:由表中数据可以看出,对车站1-PSCADA配置了4个节点可以参与调度,且调度优先级从高到底为:节点1>节点2>节点3>节点4,即车站1-PSCADA默认由节点1优先处理,如果节点1故障无法处理,那么节点2替代节点1处理此任务,节点3、节点4以此类推以相似的方式调度此任务。
在一个示例中,系统任务调度表配置完成后被下发到各个节点的内存库中。
在一个示例中,除了生成系统任务调度表,还生成调度层级表(例如如表2所示),可对不同中心、车站的可调度的任务粒度进行配置。以下表2为例:配置各个域的调度层级为子系统层级(相应的可以根据实际情况,配置为车站层级的调度粒度等),表示如果当前节点所属的层级为3,那么将按照域(层级4)的调度粒度来处理;如果当前节点所属的层级为4,那么将按照子系统(层级6)的调度粒度来处理。
表2调度层级表
Figure BDA0001972875410000102
Figure BDA0001972875410000111
在一个示例中,在发生由于故障等而导致的重新调度时,管理节点将按照系统任务调度表和调度层级表来执行调度,使得故障节点所处理的任务被调度到其他节点。
在一个示例中,调度粒度作为数据的集合,需要关联对应的数据测点。工程中的测点表(例如如下表2所示)记录调度粒度ID与测点ID的对应关系,下表仅说明此对应关系,未列出全部数据表记录。本实施例中的调度粒度是以车站子系统为粒度定义,每个调度粒度下面的数据一般来说可以包括几千或几万条。
表3测点表
测点ID 所属子系统(即调度粒度) 其它列
1001110 车站1-PSCADA
1001111 车站1-BAS
1001112 车站1-PA
1001113 车站1-FAS
S320,工程启动后,系统的各节点读取系统任务调度表,获取其中与本节点的优先级1相对应的任务。
在本实施例中,优先级1为预定最大优先级,具有该优先级的节点为主机。每个节点通过读取例如各自的内存数据库获取系统任务调度表,并获取其中与本节点的优先级1相对应的任务。例如,参考表1,节点1获取其优先级为1所对应的任务集车站1-PSCADA,节点2获取其优先级为1所对应的任务集车站1-FAS,节点3获取其优先级为1所对应的任务集车站1-PA,节点4获取其优先级为1所对应的任务集车站1-BAS。由此,系统的每个任务集均被一个作为主机的节点获取,并在步骤S330中被执行。
S330,系统的各节点处理所获取的任务,并将自身节点状态设置为主状态(hot)。
在本实施例中,在步骤S330中,除了执行所获取的任务,正在处理任务的各节点还将自身节点状态设置为hot。在一个实施例(如图4)中,当节点发生故障要切换任务时,可以将故障节点的状态设置为switch(切换状态),并在切换任务后将故障节点的状态设置为pending(等待处理)。
在一个示例中,启动工程后,各个节点可以按照既定的调度策略(例如系统任务调度表),将自身节点需要处理的调度粒度任务,写入实时任务执行表(例如如下表3所示),用以记录当前节点正在处理哪些调度粒度(任务集)的数据(例如下表,节点1当前处理车站1-PSCADA的数据)。实时任务执行表可以存放在管理节点上或各节点均可以访问的其他位置。
表4实时任务执行表
调度粒度 处理节点
车站1-PSCADA 节点1
车站1-BAS 节点2
车站1-PA 节点3
车站1-FAS 节点4
在上面参考图3描述了初始启动任务调度的示例流程。在一个示例中,在初始任务调度之后,当有节点发生故障时,由管理节点/调度节点根据系统任务调度表将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理。图4示出了根据本公开又一示例性实施例的在存在故障节点情况下的负载均衡方法的流程示意图。该示例负载均衡方法同样可以实现在包含多个节点的任务处理系统(例如如图1中所示的系统)中,并且图4所示的示例方法可以由系统中的管理节点/调度节点来执行。如图4所示,该示例方法包括:
S410,将故障节点的状态设置为切换状态。
当系统中出现故障节点时,管理节点/调度节点检测到这一故障情况后,开始启动任务调度,以把故障节点处理的任务调度到其他节点处理。在图4所示的示例中,管理节点/调度节点先把故障节点的状态从hot(主状态)设置为switch(切换状态),之后向系统中的其他节点发送调度通知(S420)。
管理节点/调度节点可以是故障节点本身,也可以是系统的其他节点,还可以是独立于系统的各节点的设备。在一个示例中,在故障节点无法与其他节点进行通信的情况下,由其他的节点推选出一个节点作为管理节点/调度节点。在另一个示例中,故障节点虽然由于出现故障而无法再继续处理任务,但可以与其他节点进行通信,在这种情况下由故障节点作为管理节点/调度节点。在又一个示例中,不管故障节点是否可以与其他节点进行通信,都由其他节点或设备来充当管理节点/调度节点。
S420,向故障节点之外的其他节点发送调度通知。
管理节点/调度节点向其他节点发送调度通知,以通知其他节点要调度故障节点的任务。发送调度通知是为了测试其他节点是否可用。在一个示例中,如果其他节点对调度通知有反馈,则说明可用,如果无反馈,则说明不可用。在一示例中,收到调度通知的节点根据系统任务调度表查看本节点针对故障节点所处理的任务所具有的优先级,仅在本节点的优先级除了故障节点外排名最高的情况下才对调度通知有反馈。在另一示例中,其他节点只要收到了调度通知就向管理节点/调度节点发送反馈。
S430,将故障节点的数据同步到对所述调度通知有反馈的节点。
在图4所示的实施例中,管理节点/调度节点将故障节点的数据(例如,所处理的任务集的相关数据、系统任务调度表、调度层级表、实时任务执行表等)同步到对所述调度通知有反馈的所有节点。在另一示例中,可以仅将故障节点的数据同步到部分有反馈的节点,例如,仅同步到系统任务调度表中针对故障节点所处理的任务集的优先级排名最高(除故障节点外排名最高)的那些节点,再例如,仅同步到系统任务调度表中针对故障节点所处理的任务集的优先级排名较高(除故障节点外排名较高)的那些节点。
S440,按照系统任务调度表,将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理。
一般地,针对所要调度的任务集,故障节点具有最高的优先级,其他节点的优先级依次递减。例如,如表1中所示,对于任务集车站1-BAS,节点4具有最高优先级1(也是预定最大优先级),如果故障节点是节点4,则可以判断在除故障节点4之外的其他节点中,节点1针对任务集车站1-BAS具有最高优先级2,其他两个节点的优先级均低于优先级2(节点2的优先级为3,节点3的优先级为4)。在这种情况下,管理节点/故障节点将故障节点4处理的任务集车站1-BAS调度到节点1处理。
在另一示例中,如果除故障节点外,分配给要调度的任务集的节点还有未对调度通知作出反馈的节点,则在调度时将该节点排除在外。
S450,同步实时任务执行表。
调度完成后,每个节点正在执行的任务发生了变化。在一个示例中,管理节点/故障节点在调度完成后会根据实际情况更新、同步实时任务执行表。
S460,将故障节点的状态设置为等待处理状态。
管理节点/故障节点在调度完成后还将故障节点的状态设置为pending(等待处理),以告知其他节点该故障节点正在等待维修。
通过如图4所示的上述实施例,可以在系统出现故障节点的情况下进行任务调度时仍然保持负载均衡。在上面的实施例中,虽然示出了步骤S410-S420、S450-S460,但应当理解的是,也可以省略这些步骤。相似地,步骤S430也可以省略,例如,任务所调度到的节点可以重新从管理节点或其他位置获取该任务的数据。
在上面的示例中,步骤S410、S420、S430、S450和S460均不是必要的步骤,都是可选的。另外,虽然在图4中以及以上对图4的描述中按照顺序的方式示出步骤S410-S460,但应当理解的是,步骤S410-S460也可以按照其他的顺序来执行,各个步骤之间的顺序并不是固定的。
图5示出了根据本公开又一示例性实施例的在系统中新增节点的情况下的负载均衡方法的流程示意图。该示例负载均衡方法同样可以实现在包含多个节点的任务处理系统(例如如图1中所示的系统)中。如图5所示,该示例方法包括:
S510,生成更新的系统任务调度表。
如果要在系统中新增节点,可以先根据新增节点更新系统任务调度表,将新增节点要处理的任务也配置在系统任务调度表中。例如,可以将新任务分配给新增节点处理,也可以将其他节点在处理的任务更改为由新增节点处理。在一个示例中,即使没有新增节点(例如,在删减节点的情况下,再例如,在没有节点增删的情况下),如果想要改变系统任务调度表,也可以生成新的系统任务调度表并下发给各节点。如果系统任务调度表中有新增的任务集,则可以以与前所述相同的方式为新增的任务集配置主备机,在此不再赘述。相似地,可以由管理节点或其他设备来自动生成更新的系统任务调度表,也可以由人工手动配置更新的系统任务调度表。下表5示出了更新的系统任务调度表示例,其中调度粒度ID为任务集ID。
表5更新的系统任务调度表
Figure BDA0001972875410000151
在上表中,节点5为新增节点。与表1相比,新增了任务集(调度粒度ID)车站2-PSCADA,并将节点5配置为其主机,其他为备机,同时还将节点5配置为其他任务集的备机。
S520,各节点获取更新的系统任务调度表。
各节点可以以与前所述的方式相似的方式来获取更新的系统任务调度表,在此不再赘述。
S530,新增节点获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集,并执行该任务集。
例如,以上表5为例,新增节点5在启动后从例如自己的内存数据库获取更新的系统任务调度表,查找到与本节点具有的预定最大优先级对应的任务集车站2-PSCADA,从而获取相应的数据来执行该任务集。在一个示例中,其他原有节点读取更新的系统任务调度表,如果发现与本节点具有的预定最大优先级对应的任务集有变化,则根据更新的系统任务调度表执行变化后的任务集,如果没有变化,则不动作。在一个示例中,在没有节点增删的情况下,各节点读取更新的系统任务调度表,并判断自己要执行的任务是否有变化,如果有变化,则根据更新的系统任务调度表执行变化后的任务集,如果没有变化,则不动作。
通过如上所述参考图5所述的实施例,可以轻松实现在线扩容,横向增加冗余节点,而无需重启整个工程。
综上所述,在本公开实施例中的一个或多个,由于可以通过系统任务调度表灵活地配置调度粒度,因此使得系统能够支持多粒度的调度,既可以实现以单站子系统为粒度调度,也可以实现以区域为粒度调度,解决了传统综合监控系统内大多按照单域子系统进行调度、从而导致车站之间相互影响的问题。另外,由于不再使用根据无法修改的组态数据生成配置文件来部署系统节点的方案,使得节点与业务数据解耦,各个节点只需简单判断当前节点是否有需要处理的任务,来决定是否要进行业务处理。此外,本公开的一个或多个实施例支持通过组态实现集群节点全主模式、一主多备、多主多备模式的运行,可以根据不同的业务场景配置不同的调度策略,解决了传统综合监控系统的一主多备模式造成主机负载过高、而备机资源闲置的状况。此外,本公开的一个或多个实施例可通过更新系统任务调度表来支持对现有集群进行在线扩容,无需重启工程,解决了传统综合监控系统在扩容时需要进行停机、组态后再次重启的问题,保障了工程的平稳运行、平滑扩容。此外,本公开的一个或多个实施例可灵活地更新、调整系统任务调度表,从而支持在线动态调整各个节点的任务负载,解决了传统综合监控系统单子系统下各车站数据分配不均导致负载不均衡的问题。
本公开的实施例还提供一种任务处理系统,其包括用于处理任务的多个节点,其中每个节点被配置为执行如上所述的各方法实施例。在一个示例中,每个节点被配置为:
获取系统任务调度表,所述系统任务调度表列出了多个任务集以及分配给每个任务集的节点和每个节点处理该任务集的优先级;
读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
本公开的实施例还提供一种节点设备,其为任务处理系统中的一个节点,用于实现如前所述的各方法实施例。图6示出了根据本公开的一示例性实施例的节点设备的示意组成框图。如图6所示,该示例节点设备600包括:
调度表获取单元610,获取系统任务调度表,所述系统任务调度表列出了多个任务集以及分配给每个任务集的节点和每个节点处理该任务集的优先级;
任务获取单元620,读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
任务处理单元630,处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
上述设备中各个单元/模块的功能和作用的实现过程以及相关细节具体详见上述方法实施例中对应步骤的实现过程,在此不再赘述。
以上各实施例中的装置实施例可以通过硬件、软件、固件或其组合的方式来实现,并且其可以被实现为一个单独的装置,也可以被实现为各组成单元/模块分散在一个或多个计算设备中并分别执行相应功能的逻辑集成系统。
以上各实施例中组成节点设备的各单元/模块是根据逻辑功能而划分的,它们可以根据逻辑功能被重新划分,例如可以通过更多或更少的单元/模块来实现该装置。这些组成单元/模块分别可以通过硬件、软件、固件或其组合的方式来实现,它们可以是分别的独立部件,也可以是多个组件组合起来执行相应的逻辑功能的集成单元/模块。所述硬件、软件、固件或其组合的方式可以包括:分离的硬件组件,通过编程方式实现的功能模块、通过可编程逻辑器件实现的功能模块,等等,或者以上方式的组合。
根据一个示例性实施例,该节点设备可被实现为一种计算设备,该计算设备包括存储器和处理器,所述存储器中存储有计算机程序或程序代码,所述计算机程序或程序代码在被所述处理器执行时,使得所述处理器执行如上所述的各方法实施例中的任一个,即,所述计算机程序或程序代码在被所述处理器执行时使得该计算设备实现如上所述的节点设备各实施例的组成单元/模块所实现的功能。
上面的实施例中所述的处理器可以指单个的处理单元,如中央处理单元CPU,也可以是包括多个分散的处理单元的分布式处理器系统。
上面的实施例中所述的存储器可以包括一个或多个存储器,其可以是计算设备的内部存储器,例如暂态或非暂态的各种存储器,也可以是通过存储器接口连接到计算设备的外部存储装置。
图7示出了这样的计算设备形式的节点设备的一个示例性实施例的示意组成框图。如图7所示,计算设备701可以包括:处理器710、通信接口720、存储器730和总线740。存储器730内存储有可被处理器710执行的计算机程序。处理器710执行所述计算机程序时实现上述实施例中的方法及设备的功能。存储器730和处理器710的数量分别可以为一个或多个。通信接口720用于处理器710与外部设备之间的通信。
其中,处理器710可以是中央处理单元、通用处理器、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明公开内容所描述的各种示例性的流程步骤、功能单元/模块和/或电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合、数字信号处理器等等。
存储器730可以包括易失性存储器和/或非易失性存储器,例如非易失性动态随机存取存储器、相变随机存取存储器、磁阻式随机存取存储器、磁盘存储器、电子可擦除可编程只读存储器、闪存器件、半导体器件(例如固态硬盘)等。存储器730可选地还可以是外部远程存储装置。
总线740可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图7中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。可选地,如果存储器730、处理器710及通信接口720集成在一块芯片上,则存储器730、处理器710及通信接口720可以通过内部接口完成相互间的通信。
以上各方法和设备实施例还可以被实现为计算机程序的形式,被存储在存储介质上,并且可被分发。因此,根据本公开的另一方面,还提供一种存储介质,其上存储有可供处理器执行的计算机程序,所述计算机程序在被处理器执行时实现如上所述的各方法和设备实施例中的任一个。
该存储介质可以是任何可以保持和存储可由指令执行设备使用的指令的有形设备。例如,其可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。
这里所描述的计算机程序/计算机指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
本公开中所述的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。但本领域技术人员应当清楚的是,上述各实施例可以根据需要单独使用或者相互结合使用。另外,对于装置实施例而言,由于其是与方法实施例相对应,所以描述得比较简单,相关之处参见方法实施例的对应部分的说明即可。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种负载均衡方法,其特征在于,所述方法实现在包括多个节点的任务处理系统中,所述方法包括:
所述多个节点中的每个节点获取系统任务调度表,所述系统任务调度表列出了多个任务集、分配给每个任务集的节点、以及每个节点处理该任务集的优先级;
所述每个节点读取系统任务调度表,并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
所述每个节点处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
2.根据权利要求1所述的方法,其特征在于,还包括:
在所述多个节点中出现故障节点的情况下,所述多个节点中的调度节点根据系统任务调度表,将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理。
3.根据权利要求2所述的方法,其特征在于,在所述调度节点根据系统任务调度表,将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理之前,所述方法还包括:
调度节点将故障节点的数据同步到其他节点。
4.根据权利要求3所述的方法,其特征在于,所述调度节点将故障节点的数据同步到其他节点包括:
调度节点向其他节点发送调度通知;
调度节点将故障节点的数据同步到其他节点中对所述调度通知有反馈的节点。
5.根据权利要求1-3中任一项所述的方法,其特征在于,在所述调度节点根据系统任务调度表,将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理之前,所述方法还包括:
调度节点将故障节点的状态置为切换状态,
在所述调度节点根据系统任务调度表,将故障节点正在处理的每个任务集调度到分配给该任务集的其他节点中具有最高优先级的节点进行处理之后,所述方法还包括:
调度节点将故障节点的状态置为等待处理。
6.根据权利要求1所述的方法,其特征在于,在所述系统任务调度表中,每个任务集被分配一个具有预定最大优先级的处理节点。
7.根据权利要求1所述的方法,其特征在于,还包括:
所述多个节点中的每个节点获取更新的系统任务调度表,其中在所述更新的系统任务调度表中包括分配给新增节点的一个或多个任务集,以及所述新增节点处理所述一个或多个任务集的优先级;
所述新增节点获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集,并执行该任务集。
8.根据权利要求1所述的方法,其特征在于,所述系统任务调度表中所包括的每个任务集为所述任务处理系统的调度粒度。
9.一种任务处理系统,其特征在于,包括用于处理任务的多个节点,其中所述多个节点中的每个节点被配置为:
获取系统任务调度表,所述系统任务调度表列出了多个任务集、分配给每个任务集的节点、以及每个节点处理该任务集的优先级;
读取系统任务调度表并获取系统任务调度表中与本节点具有的预定最大优先级对应的任务集;
处理所获取的所述与本节点具有的预定最大优先级对应的任务集。
10.一种节点设备,其特征在于,包括存储器和处理器,所述存储器上存储有程序代码,所述处理器用于执行所述程序代码,其中,所述处理器在执行所述程序代码时被配置为实现如权利要求1-8中任一项所述的负载均衡方法。
CN201910123698.9A 2019-02-19 2019-02-19 负载均衡方法、系统及装置 Active CN111581033B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910123698.9A CN111581033B (zh) 2019-02-19 2019-02-19 负载均衡方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910123698.9A CN111581033B (zh) 2019-02-19 2019-02-19 负载均衡方法、系统及装置

Publications (2)

Publication Number Publication Date
CN111581033A true CN111581033A (zh) 2020-08-25
CN111581033B CN111581033B (zh) 2023-10-27

Family

ID=72114824

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910123698.9A Active CN111581033B (zh) 2019-02-19 2019-02-19 负载均衡方法、系统及装置

Country Status (1)

Country Link
CN (1) CN111581033B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112416559A (zh) * 2020-11-30 2021-02-26 中国民航信息网络股份有限公司 调度策略更新方法、服务调度方法、存储介质及相关装置
CN112416559B (zh) * 2020-11-30 2024-06-04 中国民航信息网络股份有限公司 调度策略更新方法、服务调度方法、存储介质及相关装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1722664A (zh) * 2004-07-13 2006-01-18 联想网御科技(北京)有限公司 集群模式下实现网络安全设备高可用性的方法
CN102404390A (zh) * 2011-11-07 2012-04-04 广东电网公司电力科学研究院 高速实时数据库的智能化动态负载均衡方法
US20160204923A1 (en) * 2015-01-12 2016-07-14 International Business Machines Corporation Dynamically allocating compute nodes among cloud groups based on priority and policies
CN106126346A (zh) * 2016-07-05 2016-11-16 东北大学 一种大规模分布式数据采集系统及方法
CN108519911A (zh) * 2018-03-23 2018-09-11 上饶市中科院云计算中心大数据研究院 一种基于容器的集群管理系统中资源的调度方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1722664A (zh) * 2004-07-13 2006-01-18 联想网御科技(北京)有限公司 集群模式下实现网络安全设备高可用性的方法
CN102404390A (zh) * 2011-11-07 2012-04-04 广东电网公司电力科学研究院 高速实时数据库的智能化动态负载均衡方法
US20160204923A1 (en) * 2015-01-12 2016-07-14 International Business Machines Corporation Dynamically allocating compute nodes among cloud groups based on priority and policies
CN106126346A (zh) * 2016-07-05 2016-11-16 东北大学 一种大规模分布式数据采集系统及方法
CN108519911A (zh) * 2018-03-23 2018-09-11 上饶市中科院云计算中心大数据研究院 一种基于容器的集群管理系统中资源的调度方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112416559A (zh) * 2020-11-30 2021-02-26 中国民航信息网络股份有限公司 调度策略更新方法、服务调度方法、存储介质及相关装置
CN112416559B (zh) * 2020-11-30 2024-06-04 中国民航信息网络股份有限公司 调度策略更新方法、服务调度方法、存储介质及相关装置

Also Published As

Publication number Publication date
CN111581033B (zh) 2023-10-27

Similar Documents

Publication Publication Date Title
US10817501B1 (en) Systems and methods for using a reaction-based approach to managing shared state storage associated with a distributed database
US10656929B2 (en) Autonomously healing microservice-based applications
US10429914B2 (en) Multi-level data center using consolidated power control
US20150169313A1 (en) Integrated system and firmware update method
US9880827B2 (en) Managing software version upgrades in a multiple computer system environment
CN111209011A (zh) 一种跨平台的容器云自动化部署系统
CN104115447A (zh) 一种云计算架构下的容灾方案配置方法及装置
CN109656742B (zh) 一种节点异常处理方法、装置及存储介质
CN101689114B (zh) 用于集群软件实体的动态cli映射
CN105229613A (zh) 协调分布式系统中的故障恢复
CN110795503A (zh) 分布式存储系统的多集群数据同步方法及相关装置
WO2013158813A1 (en) Distributed electrical power network model maintenance
JP2016508638A (ja) 階層データ構造のノードにおいて再帰的イベントリスナを用いる方法およびシステム
CN113259148B (zh) 基于联邦学习的告警关联检测方法、系统及介质
CN113204353B (zh) 一种大数据平台组件部署方法及装置
CN105701099A (zh) 用于在分布式环境中执行任务的方法、装置及系统
CN115562911B (zh) 虚拟机数据备份方法及装置、系统、电子设备、存储介质
CN113312145A (zh) 一种容器调度方法、装置、电子设备及介质
CN105183591A (zh) 一种高可用集群的实现方法及系统
US20170244252A1 (en) Autonomous Operational Platform for Micro-Grid Energy Management
CN112231399A (zh) 一种应用于图数据库的方法和装置
CN111581033B (zh) 负载均衡方法、系统及装置
CN110908824A (zh) 一种故障识别方法、装置及设备
CN112395269B (zh) MySQL高可用组的搭建方法及装置
CN112685486B (zh) 数据库集群的数据管理方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant