CN114490195A - 业务的接管方法、装置、存储介质及电子装置 - Google Patents

业务的接管方法、装置、存储介质及电子装置 Download PDF

Info

Publication number
CN114490195A
CN114490195A CN202210096690.XA CN202210096690A CN114490195A CN 114490195 A CN114490195 A CN 114490195A CN 202210096690 A CN202210096690 A CN 202210096690A CN 114490195 A CN114490195 A CN 114490195A
Authority
CN
China
Prior art keywords
node
determining
target
substitute
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210096690.XA
Other languages
English (en)
Inventor
王林锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202210096690.XA priority Critical patent/CN114490195A/zh
Publication of CN114490195A publication Critical patent/CN114490195A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例提供了一种业务的接管方法、装置、存储介质及电子装置,其中,该方法包括:在目标节点的目标主控模块发生故障的情况下,按照预设规则从目标节点所在集群中确定出用于接管目标节点的第一替代节点,其中,集群中包括多个节点,多个节点间按照预设连接关系连接;利用第一替代节点的替代主控模块执行目标主控模块所执行的操作。通过本发明,解决了相关技术中存在的无法接管异常节点所执行的业务的问题,达到高效接管异常节点的效果。

Description

业务的接管方法、装置、存储介质及电子装置
技术领域
本发明实施例涉及通信领域,具体而言,涉及一种业务的接管方法、装置、存储介质及电子装置。
背景技术
在集群系统方案中,当其中有节点发生故障时,需要另外的正常节点来接管异常节点的业务。然而,在相关技术中,在出现异常主机节点时,并没有有效的切换,接管该异常主机的方案。
由此可知,相关技术中存在无法接管异常节点所执行的业务的问题。
针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种业务的接管方法、装置、存储介质及电子装置,以至少解决相关技术中存在的无法接管异常节点所执行的业务的问题。
根据本发明的一个实施例,提供了一种业务的接管方法,包括:在目标节点的目标主控模块发生故障的情况下,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点,其中,所述集群中包括多个节点,多个所述节点按照预设连接关系连接;利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作。
根据本发明的另一个实施例,提供了一种业务的接管装置,包括:确定模块,用于在目标节点的目标主控模块发生故障的情况下,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点,其中,所述集群中包括多个节点,多个所述节点的存储单元构成预定形状的结构;接管模块,用于利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作。
根据本发明的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项中所述的方法的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,在目标节点的目标主控模块发生故障的情况下,按照预设规则从目标节点所在集群中确定出用于接管目标节点的第一替代节点,利用第一替代节点的替代主控模块执行目标主控模块所执行的操作。由于在目标节点的目标主控系统发生故障时,可以按照预设规则确定第一替代节点,利用第一替代节点的替代主控系统替代目标主控系统,因此,可以解决相关技术中存在的无法接管异常节点所执行的业务的问题,达到高效接管异常节点的效果。
附图说明
图1是本发明实施例的一种业务的接管方法的移动终端的硬件结构框图;
图2是根据本发明实施例的业务的接管方法的流程图;
图3是根据本发明实施例的目标节点所在的集群示意图;
图4是根据本发明具体实施例的业务的接管方法流程图;
图5是根据本发明具体实施例的业务的接管示意图一;
图6是根据本发明具体实施例的业务的接管示意图二;
图7是根据本发明实施例的业务的接管装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明的实施例。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种业务的接管方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的业务的接管方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种业务的接管方法,图2是根据本发明实施例的业务的接管方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,在目标节点的目标主控模块发生故障的情况下,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点,其中,所述集群中包括多个节点,多个所述节点间按照预设连接关系连接;
步骤S204,利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作。
在上述实施例中,目标节点所在的集群可以是存储集群,即集群中包括的节点可以为存储设备,用于存储其他设备产生的数据,以及支持其他设备从存储设备中拉取数据。目标节点所在的集群中可以包括多个节点,每两个节点之间可以通过网络直接连接,或者通过网络连接到交换机,以使每两个节点之间可以通讯。即集群中的节点可以感知到其他节点是否出现故障。
在上述实施例中,集群中包括的多个节点可以按照预设连接关系连接。其中,多个节点按照预设连接关系连接可以是每个节点的存储单元按照预设连接关系连接。每个节点的存储单元可以通过SAS连接,例如,预设连接关系可以是线性连接,还可以是环形连接。当预设连接关系为为环形连接时,目标节点所在的集群示意图可参见附图3,如图3所示,集群包括5个主机节点,分别是节点A,B,C,D,E,每个主机节点包括主控模块(对应于上述主控系统)和硬盘管理模块,硬盘管理模块通过SAS连接线组成一个环形结构。距离+1表示相邻的两个节点,主控访问对端的硬盘管理模块需要增加的延时距离。比如对于节点A和节点B相邻,主控A访问相邻节点硬盘管理模块B需要的时间大于访问本地硬盘管理模块A的时间,主控A访问硬盘管理模块C需要的时间大于访问硬盘管理模块B的时间。相差时间认为是距离+1。在该集群方案中,出现一个或者多个主控发生异常时,硬盘模块资源和主控业务需要交给正常的主机节点来接管,可以根据接管主机距离最近原则来实现,以提升接管后的整体集群性能,达到最优。即,预设规则可以是就近接管规则。集群最大距离就是主控访问硬盘资源模块最大的距离,比如在图3中对于节点A,它最远的访问硬盘管理资源是C或者D,最大距离为+2。扫描一轮集群所有节点通过最近距离大于最大距离来判断。第一替代节点可以接管目标节点的条件可以是,接管主机需要正常运行,并当前未接管其它业务,或者评估当前的所有工作业务正常工作情况下,还有资源能力接管其它业务。
在上述实施例中,第一替代节点可以根据自身的CPU能力,确定能够接管的目标节点的数量。例如,第一替代节点可以除了自身业务外,最多只能再接管一个其它主机的业务。当然,也可以根据第一替代节点主机的能力,处理自身业务外,也可以接管多个目标节点的业务。
可选地,上述步骤的执行主体可以集群中除目标节点之外的节点,但不限于此。
通过本发明,在目标节点的目标主控模块发生故障的情况下,按照预设规则从目标节点所在集群中确定出用于接管目标节点的第一替代节点,利用第一替代节点的替代主控模块执行目标主控模块所执行的操作。由于在目标节点的目标主控系统发生故障时,可以按照预设规则确定第一替代节点,利用第一替代节点的替代主控系统替代目标主控系统,因此,可以解决相关技术中存在的无法接管异常节点所执行的业务的问题,达到高效接管异常节点的效果。
在一个示例性实施例中,按照预设原则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点包括:确定所述集群中包括的第一候选节点,其中,所述第一候选节点为位于所述目标节点第一方位的节点;从所述第一候选节点中确定出所述第一替代节点。在本实施例中,在确定第一替代节点时,可以首先确定位于目标节点的第一方位的第一候选节点,从第一候选节点中确定出第一替代节点。其中,第一方位可以是左侧、右侧、上侧或者下侧中的任意一个。例如,当第一方位为左侧时,当目标节点故障时,可以首先确定位于目标节点左侧的节点确定为第一候选节点。
在一个示例性实施例中,从所述第一候选节点中确定出所述第一替代节点包括:确定所述第一候选节点的第一资源状态;在所述第一资源状态满足第一预定条件的情况下,确定所述第一候选节点所接管的节点的第一数量;在所述第一数量小于或等于预定阈值的情况下,将所述第一候选节点确定为所述第一替代节点。在本实施例中,当第一候选节点的第一资源状态满足第一预定条件时,还可以确定第一候选节点的所接管的节点的第一数量是否满足条件,如当第一数量小于预定阈值时,确定第一数量满足条件,将第一候选节点确定为第一替代节点。其中,预定阈值可以是预先确定的候选节点所能接管的最大数量。如预定阈值可以为2、3等,该取值仅是一种示例性说明,还可以是4、5等,本发明对此不作限制。
在一个示例性实施例中,在确定所述集群中包括的位于所述目标节点的第一方位的第一候选节点的第一资源状态之后,所述方法还包括:在所述第一资源状态不满足所述第一预定条件的情况下,确定所述集群中包括的位于所述目标节点的第二方位的第二候选节点,以及确定所述第二候选节点的第二资源状态,其中,所述第一方位与所述第二方位不同;在所述第二资源状态满足所述第一预定条件的情况下,将所述第二候选节点确定为所述第一替代节点。在本实施例中,当第一候选节点的第一资源状态不满足第一预定条件的情况下,可以确定集群中包括的位于目标节点的第二方位的第二候选节点的第二资源状态,在第二资源状态满足第一预定条件时,将第二候选节点确定为替换节点。其中,第二方位可以是左侧、右侧、上侧或者下侧中的任意一个。例如,当第一方位为左侧、第二方位为右侧时,当目标节点故障时,可以首先确定位于目标节点左侧的第一候选节点是否可以接管目标节点,如果可以,则将第一候选节点确定为替换节点。如果不可以,则确定位于目标节点右侧的第二候选节点是否可以接管目标节点,如果可以,则将第二候选节点确定为目标节点。
在一个示例性实施例中,在将所述第一候选节点确定为所述第一替代节点之前,所述方法还包括:确定所述第一资源状态中包括的资源剩余量;确定接管所述目标节点所需的资源占用量;在所述资源占用量小于或等于所述资源剩余量的情况下,确定所述第一资源状态满足所述第一预定条件;在所述资源占用量大于所述资源剩余量的情况下,确定所述第一资源状态不满足所述第一预定条件。在本实施例中,确定第一资源状态是否满足第一预定条件时,可以确定第一资源状态中包括的资源剩余量,再确定接管目标节点所需的资源占有量,如果资源占用量小于或等于资源剩余量,则确定第一资源状态满足第一预定条件。确定第二资源状态是否满足第一预定条件的确定方式与确定第一资源状态是否满足第一预定条件的方法相同,在此不再赘述。
在一个示例性实施例中,按照预设原则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点包括:重复执行以下步骤,直到确定出所述第一替代节点为止:确定到所述目标节点的距离为第一距离的第二候选节点;确定所述第二候选节点的第二资源状态;在所述第二资源状态中存在满足第一预定条件的资源状态的情况下,将满足所述第一预定条件的资源状态对应的候选节点确定为所述第一替代节点;在所述第二资源状态中不存在满足所述第一预定条件的资源状态的情况下,将所述第一距离增加预定距离,得到第二距离;将所述第二距离确定为所述第一距离。在本实施例中,在确定第一替代节点时,可以确定到目标节点的距离为第一距离的第二候选节点,确定第二候选节点中是否存在替代节点。在不存在时,将第一距离增加预定距离,得到第二距离,并将第二距离确定为第一距离,即更新第一距离,确定到目标节点的距离为更新后的第一距离的节点中是否存在替代节点。
在上述实施例中,第一距离可以为1,预定距离可以为1,即当距离目标节点的距离为1中的节点不能接管目标节点时,可以将第一距离+1,确定距离目标节点的距离为2的节点中是否包括替代节点。若不存在,则将距离再次+1,再次确定替代节点。
在上述实施例中,到目标节点的距离为第一距离的节点可以包括多个,在确定替代节点时,可以先确定第一方位的节点是否可以为替代节点,在可以时,将位于目标节点第一方位,且到目标节点的距离为第一距离的节点确定为替代节点,当位于目标节点第一方位的节点不能接管时,可确定位于目标节点第二方位,且到目标节点的距离为第二距离的节点是否可以接管,若可以则将其确定为替换节点。若不可以,则确定到目标节点的距离为第二距离,且位于目标节点第一方位的节点是否可以接管,若可以,则将其确定为替换节点,若不可以,则确定到目标节点的距离为第二距离,且位于目标节点第二方位的节点是否可以接管,若可以,则将其确定为替换节点,若不可以,则增加距离,重复上述步骤,直到确定出替代节点。
在一个示例性实施例中,所述第一距离小于或等于所述目标节点的最大访问距离,所述最大访问距离为所述目标主控模块访问所述集群中包括的其他节点的存储模块的最大距离。在本实施例中,集群最大访问距离就是主控访问硬盘资源模块最大的距离,比如在图3中,对于节点A,它最远的访问硬盘管理资源是C或者D,最大距离为+2。扫描一轮集群所有节点通过最近距离大于最大距离来判断。
在一个示例性实施例中,在将所述第一候选节点确定为所述第一替代节点之前,所述方法还包括:确定所述第一候选节点所接管的节点的第二数量;在所述第二数量小于或等于所述预定阈值的情况下,将所述第一候选节点确定为所述第一替代节点。在本实施例中,当第一候选节点的第一资源状态满足第一预定条件时,还可以确定第一候选节点的所接管的节点的第二数量是否满足条件,如当第二数量小于或等于预定阈值时,确定第二数量满足条件,将第一候选节点确定为第一替代节点。其中,预定阈值可以是预先确定的候选节点所能接管的最大数量。如预定阈值可以为2、3等,该取值仅是一种示例性说明,还可以是4、5等,本发明对此不作限制。
在一个示例性实施例中,在利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作之后,所述方法还包括:检测所述目标节点的状态信息;在所述状态信息指示所述目标节点为正常状态的情况下,控制所述第一替代节点停止接管所述目标节点。在本实施例中,在第一替代节点的替代主控模块执行目标主控模块所执行的操作后,可以检测目标节点的状态信息,当状态信息指示目标节点为正常状态时,可以控制第一替代节点停止接管目标节点。
在一个示例性实施例中,在利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作之后,所述方法还包括:在所述替代主控模块发生故障的情况下,确定用于接管所述目标节点的第二替代节点,以及确定用于接管所述第一替代节点的第三替代节点;控制所述第二替代节点接管所述目标节点,以及控制所述第三替代节点接管所述第一替代节点。在本实施例中,当第一替代节点的替代主控模块执行目标主控模块所执行的操作之后,若替代主控模块发生故障,则可以确定用于接管目标节点的第二替代节点,以及确定接管第一替代节点的第三替代节点。其中,确定第二替代节点和确定第三替代节点的方法与确定第一替代节点的方法相同,不再赘述。
在上述实施例中,如果在图3情况下,节点B的主控硬件发生异常,即在主板B上运行的主控A和主控B都故障了,那根据策略,主控A交由左边+1节点E节点来接管,主控B由主控B的右b边+1节点C节点来接管。
下面结合具体实施方式对业务的接管方法进行说明:
图4是根据本发明具体实施例的业务的接管方法流程图,如图4所示,该方法包括:
1.集群系统通过心跳监听方法,发现某个节点主机发生故障。
2.优先选择离该故障主机距离+1(最近)的正常主机进行接管。
3.距离+1优先选故障主机右边主机,如果右边+1主机正常,并且当前除了自身主机业务,未接管其它主机业务,那就选右边+1主机来接管故障主机的业务和硬盘资源模块。
4.故障主机右边+1主机如果故障或者已经接管了其它业务,那就考虑左边+1主机,如果左边+1主机正常,并未接管其它业务主机,那就选左边+1主机来接管故障主机的业务和硬盘资源模块。
5,如果经过步骤3、4,故障主机左右+1都无法接管,那就考虑故障主机距离+2的左右节点,同样按优先右边,再左边选择,直到找到符合要求的节点(距离最新,主机正常,并没有接管其它业务)。
6,如果扫描整个集群系统都未找到符合要求的主机节点,根据主机CPU,内存和其它资源能力,评估该主机最多只能有2个主机业务运行的,那就不进行异常节点异常接管动作,如果评估可以运行多于2个主机业务的,那就进行第2轮扫描。再按以上步骤选择合适的接管主机。
例如,附图3中的A节点发生故障,则由距离+1的右节点B来接管主机A的业务和硬盘资源模块A,如图5所示。如果,节点B的主控硬件发生异常,即在主板B上运行的主控A和主控B都故障了,那根据策略,主控A交由左边+1节点E节点来接管,主控B由主控B的右b边+1节点C节点来接管,如图6所示。
在上述实施例中,通过异常主机的最近距离硬盘管理模块的原则进行接管主机的选择。评估当前主机CPU,内存等资源,能力,判断在保证当前所有业务能正常工作的情况下,还有能力接管其它主机业务的,就在集群中按最近距离原则多轮循环选择合适的接管主机。如果最终没有找到合适的主机,那故障主机业务不被接管,优先保证集群中原先的业务正常工作。即当出现故障主机时,可以通过故障主机硬盘管理模块的接管距离最近原则来选择合适的接管主机,按最近距离不断轮询检查接管主机是否满足接管要求,并根据接管节点能力多轮覆盖。使用该远程接管的主机可以以最快的性能访问故障主机的硬盘管理模块,低延时的继续进行集群的业务工作,比其它方式更能提升整体集群的性能,业务高响应,低延时。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
在本实施例中还提供了一种业务的接管装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是根据本发明实施例的业务的接管装置的结构框图,如图7所示,该装置包括:
确定模块72,用于在目标节点的目标主控模块发生故障的情况下,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点,其中,所述集群中包括多个节点,多个所述节点间按照预设连接关系连接;
接管模块74,用于利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作。
在一个示例性实施例中,确定模块72可以通过如下方式实现按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点包括:确定所述集群中包括的第一候选节点,其中,所述第一候选节点为位于所述目标节点第一方位的节点;从所述第一候选节点中确定出所述第一替代节点。
在一个示例性实施例中,确定模块72可以通过如下方式实现从所述第一候选节点中确定出所述第一替代节点:确定所述第一候选节点的第一资源状态;在所述第一资源状态满足第一预定条件的情况下,确定所述第一候选节点所接管的节点的第一数量;在所述第一数量小于或等于预定阈值的情况下,将所述第一候选节点确定为所述第一替代节点。
在一个示例性实施例中,所述装置可以用于在确定第一候选节点的第一资源状态之后,在所述第一资源状态不满足所述第一预定条件的情况下,确定所述集群中包括的位于所述目标节点的第二方位的第二候选节点的第二资源状态,以及确定所述第二候选节点的,其中,所述第一方位与所述第二方位不同;在所述第二资源状态满足所述第一预定条件的情况下,将所述第二候选节点确定为所述第一替代节点。
在一个示例性实施例中,所述装置可以用于在将所述第一候选节点确定为所述第一替代节点之前,确定所述第一资源状态中包括的资源剩余量;确定接管所述目标节点所需的资源占用量;在所述资源占用量小于或等于所述资源剩余量的情况下,确定所述第一资源状态满足所述第一预定条件;在所述资源占用量大于所述资源剩余量的情况下,确定所述第一资源状态不满足所述第一预定条件。
在一个示例性实施例中,所述确定模块72可以通过如下方式实现按照预设原则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点:重复执行以下步骤,直到确定出所述第一替代节点为止:确定到所述目标节点的距离为第一距离的第二候选节点;确定所述第二候选节点的第二资源状态;在所述第二资源状态中存在满足第一预定条件的资源状态的情况下,将满足所述第一预定条件的资源状态对应的候选节点确定为所述第一替代节点;在所述第二资源状态中不存在满足所述第一预定条件的资源状态的情况下,将所述第一距离增加预定距离,得到第二距离;将所述第二距离确定为所述第一距离。
在一个示例性实施例中,所述第一距离小于或等于所述目标节点的最大访问距离,所述最大访问距离为所述目标主控模块访问所述集群中包括的其他节点的存储模块的最大距离。
在一个示例性实施例中,所述装置可以用于在利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作之后,检测所述目标节点的状态信息;在所述状态信息指示所述目标节点为正常状态的情况下,控制所述第一替代节点停止接管所述目标节点。
在一个示例性实施例中,所述装置可以用于在利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作之后,在所述替代主控模块发生故障的情况下,确定用于接管所述目标节点的第二替代节点,以及确定用于接管所述第一替代节点的第三替代节点;控制所述第二替代节点接管所述目标节点,以及控制所述第三替代节点接管所述第一替代节点。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现上述任一项中所述的方法的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种业务的接管方法,其特征在于,包括:
在目标节点的目标主控模块发生故障的情况下,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点,其中,所述集群中包括多个节点,多个所述节点间按照预设连接关系连接;
利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作。
2.根据权利要求1所述的方法,其特征在于,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点包括:
确定所述集群中包括的第一候选节点,其中,所述第一候选节点为位于所述目标节点第一方位的节点;
从所述第一候选节点中确定出所述第一替代节点。
3.根据权利要求2所述的方法,其特征在于,从所述第一候选节点中确定出所述第一替代节点包括:
确定所述第一候选节点的第一资源状态;
在所述第一资源状态满足第一预定条件的情况下,确定所述第一候选节点所接管的节点的第一数量;
在所述第一数量小于或等于预定阈值的情况下,将所述第一候选节点确定为所述第一替代节点。
4.根据权利要求3所述的方法,其特征在于,在确定所述第一候选节点的第一资源状态之后,所述方法还包括:
在所述第一资源状态不满足所述第一预定条件的情况下,确定所述集群中包括的位于所述目标节点的第二方位的第二候选节点,以及确定所述第二候选节点的第二资源状态,其中,所述第一方位与所述第二方位不同;
在所述第二资源状态满足所述第一预定条件的情况下,将所述第二候选节点确定为所述第一替代节点。
5.根据权利要求3所述的方法,其特征在于,在将所述第一候选节点确定为所述第一替代节点之前,所述方法还包括:
确定所述第一资源状态中包括的资源剩余量;
确定接管所述目标节点所需的资源占用量;
在所述资源占用量小于或等于所述资源剩余量的情况下,确定所述第一资源状态满足所述第一预定条件;
在所述资源占用量大于所述资源剩余量的情况下,确定所述第一资源状态不满足所述第一预定条件。
6.根据权利要求1所述的方法,其特征在于,按照预设原则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点包括:
重复执行以下步骤,直到确定出所述第一替代节点为止:
确定到所述目标节点的距离为第一距离的第二候选节点;
确定所述第二候选节点的第二资源状态;
在所述第二资源状态中存在满足第一预定条件的资源状态的情况下,将满足所述第一预定条件的资源状态对应的候选节点确定为所述第一替代节点;
在所述第二资源状态中不存在满足所述第一预定条件的资源状态的情况下,将所述第一距离增加预定距离,得到第二距离;
将所述第二距离确定为所述第一距离。
7.根据权利要求6所述的方法,其特征在于,所述第一距离小于或等于所述目标节点的最大访问距离,所述最大访问距离为所述目标主控模块访问所述集群中包括的其他节点的存储模块的最大距离。
8.根据权利要求1所述的方法,其特征在于,在利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作之后,所述方法还包括:
检测所述目标节点的状态信息;
在所述状态信息指示所述目标节点为正常状态的情况下,控制所述第一替代节点停止接管所述目标节点。
9.根据权利要求1所述的方法,其特征在于,在利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作之后,所述方法还包括:
在所述替代主控模块发生故障的情况下,确定用于接管所述目标节点的第二替代节点,以及确定用于接管所述第一替代节点的第三替代节点;
控制所述第二替代节点接管所述目标节点,以及控制所述第三替代节点接管所述第一替代节点。
10.一种业务的接管装置,其特征在于,包括:
确定模块,用于在目标节点的目标主控模块发生故障的情况下,按照预设规则从所述目标节点所在集群中确定出用于接管所述目标节点的第一替代节点,其中,所述集群中包括多个节点,多个所述节点间按照预设连接关系连接;
接管模块,用于利用所述第一替代节点的替代主控模块执行所述目标主控模块所执行的操作。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至9任一项中所述的方法的步骤。
12.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求1至9任一项中所述的方法。
CN202210096690.XA 2022-01-26 2022-01-26 业务的接管方法、装置、存储介质及电子装置 Pending CN114490195A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210096690.XA CN114490195A (zh) 2022-01-26 2022-01-26 业务的接管方法、装置、存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210096690.XA CN114490195A (zh) 2022-01-26 2022-01-26 业务的接管方法、装置、存储介质及电子装置

Publications (1)

Publication Number Publication Date
CN114490195A true CN114490195A (zh) 2022-05-13

Family

ID=81476987

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210096690.XA Pending CN114490195A (zh) 2022-01-26 2022-01-26 业务的接管方法、装置、存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN114490195A (zh)

Similar Documents

Publication Publication Date Title
US10938710B2 (en) Protection switching method and system, and network device
CN108370341B (zh) 资源配置方法、虚拟网络功能管理器和网元管理系统
CN108810100B (zh) 一种主节点的选举方法、装置及设备
CN111464355A (zh) Kubernetes容器集群的伸缩容控制方法、装置和网络设备
CN111818159A (zh) 数据处理节点的管理方法、装置、设备及存储介质
EP2493118A1 (en) Information processing system
CN110311800B (zh) 通信设备、节点的连接方法、存储介质、电子装置
CN109451540A (zh) 一种网络切片的资源分配方法和设备
CN105141400A (zh) 一种高可用性集群管理方法及相关设备
WO2021136335A1 (zh) 一种控制边缘节点的方法、节点及边缘计算系统
CN108429675B (zh) Vrrp联动切换方法、装置及电子设备
CN108600100B (zh) 成员端口选取方法和装置
CN111817959A (zh) 网络路径管理方法、装置、sdn控制器及可读存储介质
CN112788089A (zh) 多边缘云的网络通讯控制方法及边缘运算装置与系统
US10216593B2 (en) Distributed processing system for use in application migration
US11159608B2 (en) Method and control node for managing cloud resources in a communications network
CN112217727B (zh) 多度量维度的路由选择方法、装置、计算机设备及存储介质
CN110119314B (zh) 一种服务器调用方法、装置、服务器及存储介质
US11979335B2 (en) Network controller
CN112788088A (zh) 多边缘云的网络通信控制方法及边缘运算系统
CN114546493A (zh) 核共享方法及装置、处理核、电子设备、介质
CN111917870A (zh) 请求处理方法、系统、装置、电子设备及存储介质
CN114490195A (zh) 业务的接管方法、装置、存储介质及电子装置
US10382301B2 (en) Efficiently calculating per service impact of ethernet ring status changes
CN111885159B (zh) 数据采集方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination