CN115733736A - 一种故障切换方法、计算机可读存储介质、系统及装置 - Google Patents
一种故障切换方法、计算机可读存储介质、系统及装置 Download PDFInfo
- Publication number
- CN115733736A CN115733736A CN202211448124.7A CN202211448124A CN115733736A CN 115733736 A CN115733736 A CN 115733736A CN 202211448124 A CN202211448124 A CN 202211448124A CN 115733736 A CN115733736 A CN 115733736A
- Authority
- CN
- China
- Prior art keywords
- board
- scm
- scm board
- main
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000004891 communication Methods 0.000 claims abstract description 89
- 230000002159 abnormal effect Effects 0.000 claims abstract description 44
- 230000004044 response Effects 0.000 claims description 28
- 238000004590 computer program Methods 0.000 claims description 12
- 230000001960 triggered effect Effects 0.000 claims description 10
- 208000031339 Split cord malformation Diseases 0.000 claims 62
- 230000008569 process Effects 0.000 abstract description 13
- 238000010586 diagram Methods 0.000 description 8
- 238000013461 design Methods 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 230000009471 action Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004801 process automation Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明公开了一种故障切换方法、计算机可读存储介质、系统及装置,涉及故障控制领域。本申请通过主板上设置的处理器完成对于主SCM板与备用SCM板的故障切换,首先处理器判断与主SCM板是否为通讯连接状态,不是通讯连接状态时控制备用SCM板开启,是通讯连接状态时,进一步确定主SCM板的板上信息是否为异常信息,异常时仍然切换备用SCM板开启,完成在主SCM板故障时控制备用SCM板开启的过程,且该控制备用SCM板开启的过程不由主SCM板执行,解决了主SCM板的故障问题较为严重,不能再将故障的情况发送给备用SCM板的问题,提高了服务器的可靠性。
Description
技术领域
本发明涉及故障控制领域,特别是涉及一种故障切换方法、计算机可读存储介质、系统及装置。
背景技术
通常服务器的BMC和CPLD等器件都会设计在主板上,随着服务器的设计日新月异,把BMC和CPLD从主板移出放到SCM(Secure Connector Module,安全连接模块)板的设计也越来越多的被服务器设计公司采用。这样的设计可以使得运维成本下降,以往BMC或CPLD发生损坏时,需要更换整个主板,采用这个设计只需要更换SCM板,维修的成本大幅下降。第二点是方便维护,维护更换时抽出SCM板即可,不再需要把整台服务器从机柜上取下做更换。
然而一旦SCM板发生故障,维修时仍然需要抽出SCM板,更换新的SCM板,而维修时间通常过长,板上BMC和CPLD等器件在维修期间不能继续维持其所执行的业务,会使得BMC和CPLD正在执行的业务终止,造成数据传输的可靠性降低。
当前存在主SCM板故障时,控制切换从属SCM板继续执行业务的技术,这种技术的特点是主SCM板发现自身故障时,将故障的情况发给从属SCM板,以开启从属SCM板继续执行故障之前的业务,但是这种技术存在问题,一旦主SCM板的故障问题较为严重,已经不能再将故障的情况发送给从属SCM板时,就会使得故障之前执行的任务终止,降低服务器的可靠性。
发明内容
本发明的目的是提供一种故障切换方法、计算机可读存储介质、系统及装置,本申请通过主板上设置的处理器完成对于主SCM板与备用SCM板的故障切换,首先处理器判断与主SCM板是否为通讯连接状态,不是通讯连接状态时控制备用SCM板开启,是通讯连接状态时,进一步确定主SCM板的板上信息是否为异常信息,异常时仍然切换备用SCM板开启,完成在主SCM板故障时控制备用SCM板开启的过程,且该控制备用SCM板开启的过程不由主SCM板执行,解决了主SCM板的故障问题较为严重,不能再将故障的情况发送给备用SCM板的问题,提高了服务器的可靠性。
为解决上述技术问题,本发明提供了一种故障切换方法,应用于服务器的主板的处理器,所述服务器还包括主SCM板和备用SCM板,所述处理器分别与所述主SCM板和所述备用SCM板连接,所述故障切换方法包括:
判断与所述主SCM板是否为通讯连接状态;
若与所述主SCM板不为通讯连接状态,控制所述备用SCM板开启以便与所述备用SCM板通讯连接;
若与所述主SCM板为通讯连接状态,获取所述主SCM板的当前的板上信息;
判断所述板上信息是否为异常信息;
若述板上信息为异常信息,控制所述备用SCM板开启并控制所述主SCM板关闭以便与所述备用SCM板通讯连接。
优选的,判断与所述主SCM板是否为通讯连接状态,包括:
发送询问指令至所述主SCM板;
判断是否接收到所述主SCM板发送的对应所述询问指令的响应指令;
若接收到所述主SCM板发送的对应所述询问指令的响应指令,判定与所述主SCM板为所述通讯连接状态;
若未接收到所述主SCM板发送的对应所述询问指令的响应指令,判定与所述主SCM板不为所述通讯连接状态。
优选的,判断与所述主SCM板是否为通讯连接状态,包括:
判断未接收到所述主SCM板发送的连接信号的时间是否达到第一预设时长,所述连接信号用于表征所述处理器与所述主SCM板为通讯连接状态;
若是,判定与所述主SCM板不为通讯连接状态;
若否,判定与所述主SCM板为通讯连接状态。
优选的,判定未接收到所述主SCM板发送的对应所述询问指令的响应指令,包括:
在第二预设时长内未接收到所述主SCM板发送的对应所述询问指令的响应指令时,判定未接收到所述主SCM板发送的对应所述询问指令的响应指令。
优选的,所述主SCM板包括电路板和设置在所述电路板上的芯片模块,所述芯片模块与所述处理器连接;
获取所述主SCM板的当前的板上信息,包括:
获取所述芯片模块的芯片信息作为所述主SCM板的当前的板上信息;
判断所述板上信息是否为异常信息,包括:
判断所述芯片信息是否为异常信息;
若所述芯片信息为异常信息,判定所述板上信息为异常信息;
若所述芯片信息不为异常信息,判定所述板上信息不为异常信息。
优选的,判断与所述主SCM板是否为通讯连接状态,包括:
周期性判断与所述主SCM板是否为通讯连接状态。
优选的,所述服务器还包括电源模块,所述电源模块的供电端分别与所述主SCM板的被供电端和所述备用SCM板的被供电端连接,被控端与所述处理器的控制端连接;
控制所述备用SCM板开启,包括:
控制开启所述电源模块对于所述备用SCM板的供电,并发送开启指令至所述备用SCM板以使所述备用SCM板开启;
控制所述主SCM板关闭,包括:
控制关闭所述电源模块对于所述主SCM板的供电,并发送关闭指令至所述主SCM板以使所述主SCM板关闭。
为解决上述技术问题,本发明提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述故障切换方法的步骤。
为解决上述技术问题,本发明提供了一种故障切换系统,包括:
第一判断单元,用于判断与所述主SCM板是否为通讯连接状态,若否,触发开启控制单元,若是,触发板上信息获取单元;
所述开启控制单元,用于控制所述备用SCM板开启以便与所述备用SCM板通讯连接;
所述板上信息获取单元,用于获取所述主SCM板的当前的板上信息;
第二判断单元,用于判断所述板上信息是否为异常信息,若是,触发控制单元;
所述控制单元,用于控制所述备用SCM板开启并控制所述主SCM板关闭以便与所述备用SCM板通讯连接。
为解决上述技术问题,本发明提供了一种故障切换装置,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现上述所述故障切换方法的步骤。
本申请提供了一种故障切换方法、计算机可读存储介质、系统及装置。判断与主SCM板是否为通讯连接状态;若与主SCM板不为通讯连接状态,控制备用SCM板开启以便与备用SCM板通讯连接;若与主SCM板为通讯连接状态,获取主SCM板的当前的板上信息;判断板上信息是否为异常信息;若为异常信息,控制备用SCM板开启并控制主SCM板关闭以便与备用SCM板通讯连接。本申请通过主板上设置的处理器完成对于主SCM板与备用SCM板的故障切换,首先处理器判断与主SCM板是否为通讯连接状态,不是通讯连接状态时控制备用SCM板开启,是通讯连接状态时,进一步确定主SCM板的板上信息是否为异常信息,异常时仍然切换备用SCM板开启,完成在主SCM板故障时控制备用SCM板开启的过程,且该控制备用SCM板开启的过程不由主SCM板执行,解决了主SCM板的故障问题较为严重,不能再将故障的情况发送给备用SCM板的问题,提高了服务器的可靠性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的一种故障切换方法的流程图;
图2为本发明提供的一种服务器内部结构的示意图;
图3为本发明提供的另一种服务器内部结构的示意图;
图4为本发明提供的一种故障切换系统的结构示意图;
图5为本发明提供的一种故障切换装置的结构示意图。
具体实施方式
本发明的核心是提供一种故障切换方法、计算机可读存储介质、系统及装置,本申请通过主板上设置的处理器完成对于主SCM板与备用SCM板的故障切换,首先处理器判断与主SCM板是否为通讯连接状态,不是通讯连接状态时控制备用SCM板开启,是通讯连接状态时,进一步确定主SCM板的板上信息是否为异常信息,异常时仍然切换备用SCM板开启,完成在主SCM板故障时控制备用SCM板开启的过程,且该控制备用SCM板开启的过程不由主SCM板执行,解决了主SCM板的故障问题较为严重,不能再将故障的情况发送给备用SCM板的问题,提高了服务器的可靠性。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1及图2,图1为本发明提供的一种故障切换方法的流程图,图2为本发明提供的一种服务器内部结构的示意图。该方法应用于服务器的主板的处理器1,服务器还包括主SCM板2和备用SCM板3,处理器1分别与主SCM板2和备用SCM板3连接,该方法包括:
S11:判断与主SCM板2是否为通讯连接状态,若否,进入S12,若是,进入S13;
本方案通过服务器的主板上设置的处理器1,判断处理器1自身与主SCM板2是否为通讯连接状态,相比于现有技术中通过主SCM板2和备用SCM板3之间的交互而控制备用SCM板3开启,本方案利用主板上的处理器1实现与备用SCM板3和主SCM板2的交互,进而可以在主SCM板2发生的故障问题严重而不能发送故障情况给备用SCM板3时,可以控制备用SCM板3开启,提高了方案的可靠性与可行性。
S12:控制备用SCM板3开启以便与备用SCM板3通讯连接;
如果发现处理器1自身与主SCM板2之间没有通讯连接,不处于通讯连接状态时,就控制备用SCM板3开启,以使得备用SCM板3代替主SCM板2处理故障之前主SCM板2正在执行的业务,通过主板上处理器1的控制切换,使得可以在发现故障问题时,第一时间切换备用SCM板3开启,提高了服务器的可靠性。
处理器1自身建立与备用SCM板3的通信连接之后,和备用SCM板3实现信息交互,然后备用SCM板3可以代替主SCM板2继续处理之前的业务,使得在主SCM板2故障时第一时间切换备用SCM板3,执行主SCM板2的任务,使得正在执行的任务不中断,进而不会发生数据丢失,提高了方案的可靠性。由于本申请通过主板的处理器1进行切换,并不会像现有技术那样,主SCM板2的问题严重时无法控制备用SCM板3开启的情况,提高了方案的可靠性。
S13:获取主SCM板2的当前的板上信息;
如果处理器1自身和主SCM板2之间仍然建有通讯连接,这时就获取主SCM板2上当前的板上信息,然后根据板上信息执行后续动作,根据板上信息执行进一步的判断,整个过程自动化进行,提高了方案的自动化程度。
S14:判断板上信息是否为异常信息,若是,进入S15;
处理器1可以判断主SCM板2的当前的板上信息是否为异常信息,如果板上信息不是异常信息,那么说明当前处理器1和主SCM板2之间建立的是正常的通讯连接,可以由主SCM板2继续处理正在执行的业务,如果判断板上信息为异常信息,就说明虽然和主SCM板2之间建立了通讯连接,但是其不能继续执行之前的业务,仍然会对数据传输造成影响,降低服务器的可靠性,所以在判断板上信息为异常信息时,执行后续动作,提高服务器的可靠性。
S15:控制备用SCM板3开启并控制主SCM板2关闭以便与备用SCM板3通讯连接。
如果发现获取的板上信息为异常信息,就说明当前的主SCM板2不可用,不能执行之前的业务,所以这时仍然需要控制备用SCM板3开启,通过备用SCM板3代替主SCM板2所需要执行的业务继续处理业务,使得在主SCM板2故障时,其之前所执行的任务不会中断,提高了方案的可靠性和服务器的可靠性。
需要说明的是,处理器1凭借着LVDS0和主SCM板2进行沟通,处理器1凭借着LVDS1和备用SCM板3进行沟通。其中LVDS0和LVDS1代表通信协议,处理器1可以但不限于使用主板上的CPLD,可以根据实际情况和使用需求进行更换。
总的来说,本申请提供了一种故障切换方法。判断与主SCM板2是否为通讯连接状态;若与主SCM板2不为通讯连接状态,控制备用SCM板3开启以便与备用SCM板3通讯连接;若与主SCM板2为通讯连接状态,获取主SCM板2的当前的板上信息;判断板上信息是否为异常信息;若为异常信息,控制备用SCM板3开启并控制主SCM板2关闭以便与备用SCM板3通讯连接。本申请通过主板上设置的处理器1完成对于主SCM板2与备用SCM板3的故障切换,首先处理器1判断与主SCM板2是否为通讯连接状态,不是通讯连接状态时控制备用SCM板3开启,是通讯连接状态时,进一步确定主SCM板2的板上信息是否为异常信息,异常时仍然切换备用SCM板3开启,完成在主SCM板2故障时控制备用SCM板3开启的过程,且该控制备用SCM板3开启的过程不由主SCM板2执行,解决了主SCM板2的故障问题较为严重,不能再将故障的情况发送给备用SCM板3的问题,提高了服务器的可靠性。
在上述实施例的基础上:
请参照图3,图3为本发明提供的另一种服务器内部结构的示意图。
作为一种优选的实施例,判断与主SCM板2是否为通讯连接状态,包括:
发送询问指令至主SCM板2;
判断是否接收到主SCM板2发送的对应询问指令的响应指令;
若接收到主SCM板2发送的对应询问指令的响应指令,判定与主SCM板2为通讯连接状态;
若未接收到主SCM板2发送的对应询问指令的响应指令,判定与主SCM板2不为通讯连接状态。
判断和主SCM板2之间是否为通讯连接状态的其中一种方式,是处理器1会发送询问指令到主SCM板2判断是否接收到主SCM板2发送回来的对应该询问指令的响应指令,该发送过程可以是周期性发送,周期性询问主SCM板2是否异常,如果接收到主SCM板2发送回来的对应的响应指令,就说明当前处理器1和主SCM板2之间仍然保持为通讯连接状态,如果没有收到主SCM板2发送回的响应指令,就说明当前的主SCM板2可能出现了问题,不能与处理器1进行通讯连接,整个过程自动化进行提高了方案的可靠性。
作为一种优选的实施例,判断与主SCM板2是否为通讯连接状态,包括:
判断未接收到主SCM板2发送的连接信号的时间是否达到第一预设时长,连接信号用于表征处理器1与主SCM板2为通讯连接状态;
若是,判定与主SCM板2不为通讯连接状态;
若否,判定与主SCM板2为通讯连接状态。
判断处理器1和主SCM板2之间是否为通讯连接状态的另一种方式是,判断主SCM板2发送的连接信号,主SCM板2可以主动向处理器1发送连接信号,该连接信号成功发送过来的时候就说明主SCM板2和处理器1之间的状态为通讯连接状态,如果持续一段时间内没有接收到主SCM板2发送的链接信号,当该时间达到第一预设时长时,就说明此时的主SCM板2出现了问题,不在与处理器1为通讯连接状态,这时可以控制备用SCM板3开启,提高了方案的可靠性。
作为一种优选的实施例,判定未接收到主SCM板2发送的对应询问指令的响应指令,包括:
在第二预设时长内未接收到主SCM板2发送的对应询问指令的响应指令时,判定未接收到主SCM板2发送的对应询问指令的响应指令。
在判定没有接收到主SCM板2发送的响应指令时,也需要在一定的时间内进行判断,该时间为第二预设时长,这样做可以给主SCM板2一定的处理时间,如果在第二预设时长结束时仍然没有接收到主SCM板2发送的对应询问指令的响应指令,那么此时证明主SCM板2真实出现了故障问题,这时在控制备用SCM板3开启,提高方案的可靠性。
作为一种优选的实施例,主SCM板2包括电路板和设置在电路板上的芯片模块4,芯片模块4与处理器1连接;
获取主SCM板2的当前的板上信息,包括:
获取芯片模块4的芯片信息作为主SCM板2的当前的板上信息;
判断板上信息是否为异常信息,包括:
判断芯片信息是否为异常信息;
若芯片信息为异常信息,判定板上信息为异常信息;
若芯片信息不为异常信息,判定板上信息不为异常信息。
获取主SCM板2上的板上信息的具体方式是,由于主SCM板2上面设置有CPLD和BMC等芯片,这些芯片统称为芯片模块4,这些芯片模块4存在自身的电平参数、芯片参数等,在这些芯片正常时,这些参数通常不会有较大的偏差,一旦发现芯片的参数偏差情况较大或者甚至于发送给处理器1的参数出现了乱码情况时,就说明芯片信息为异常信息,这时控制备用SCM板3开启,提高了方案的可靠性。
作为一种优选的实施例,判断与主SCM板2是否为通讯连接状态,包括:
周期性判断与主SCM板2是否为通讯连接状态。
判断处理器1自身和主SCM板2之间是否为通讯连接状态的实际判定方式为周期性判断,也就是实时的检测处理器1自身是否和主SCM板2之间建立正常的通讯连接,周期性判断时,可以在主SCM板2发生问题时,第一时间确定其故障问题,进而控制主SCM板2关闭,控制备用SCM板3开启,整个过程自动化进行,提高了方案自动化程度。
作为一种优选的实施例,服务器还包括电源模块5,电源模块5的供电端分别与主SCM板2的被供电端和备用SCM板3的被供电端连接,被控端与处理器1的控制端连接;
控制备用SCM板3开启,包括:
控制开启电源模块5对于备用SCM板3的供电,并发送开启指令至备用SCM板3以使备用SCM板3开启;
控制主SCM板2关闭,包括:
控制关闭电源模块5对于主SCM板2的供电,并发送关闭指令至主SCM板2以使主SCM板2关闭。
服务器上还设置有电源模块5,电源模块5分别与备用SCM板3和主SCM板2连接,同时,电源模块5受到处理器1的控制,在控制主SCM板2关闭时,首先要关闭主SCM板2的电源模块5,然后再将关闭指令发送至主SCM板2,这样主SCM板2就可以正常关闭,同样的,在控制备用SCM板3开启时,需要首先接通备用SCM板3的电源也就是控制备用SCM板3对应的电源模块5开启以实现对备用SCM板3的上电,备用SCM板3上电之后,处理器1控制发送开启指令至备用SCM板3,使得备用SCM板3开启即可,整个过程自动化进行,提高了方案的自动化程度,提高了服务器的可靠性。
需要说明的是,CPU0和CPU1是主板上固有的其他芯片,这里不作额外的限定。主板上的处理器1预设是先开启LVDS0和通往主SCM板2的电源模块5,所以当处理器1和主SCM板2上的CPLD等芯片成功透过LVDS0进行沟通,并确认主SCM板2上所收集到的讯息里没有发生错误,此时系统将会自动由主SCM板2开启运行,并同时关闭LVDS1和通往备用SCM板3的电源模块5,当主板上的处理器1无法成功透过LVDS0和主SCM板2上的CPLD等芯片进行沟通,这段沟通失败的时间持续并超过30秒(持续时间可由系统开发者依据自身需求去设定)或者是成功沟通后发现主SCM板2上的CPLD或BMC的芯片参数有出现重大错误,此时处理器1将会自动切断通往主SCM板2上的电源模块5并同时开启LVDS1和通往备用SCM板3上的电源模块5,尝试和备用SCM板3上的CPLD等芯片沟通,成功沟通后便启动整个系统,达到备援SCM板的功能发明,其中电源模块5的供电电压可以但不限于是12V,可以根据实际情况进行更换,提高了方案的可靠性与灵活性。
为解决上述技术问题,本发明提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述任一项故障切换方法的步骤。
对于本方案提供的计算机可读存储介质的介绍请参照上述故障切换方法的实施例,此处不再赘述。
请参照图4,图4为本发明提供的一种故障切换系统的结构示意图。
为解决上述技术问题,本发明提供了一种故障切换系统,包括:
第一判断单元20,用于判断与主SCM板是否为通讯连接状态,若否,触发开启控制单元,若是,触发板上信息获取单元;
开启控制单元21,用于控制备用SCM板开启以便与备用SCM板通讯连接;
板上信息获取单元22,用于获取主SCM板的当前的板上信息;
第二判断单元23,用于判断板上信息是否为异常信息,若是,触发控制单元;
控制单元24,用于控制备用SCM板开启并控制主SCM板关闭以便与备用SCM板通讯连接。
其中,第一判断单元,包括:
询问指令发送单元,用于发送询问指令至主SCM板;
响应指令判断单元,用于判断是否接收到主SCM板发送的对应询问指令的响应指令,若是,触发第一判定单元,若是触发第二判定单元;
第一判定单元,用于判定与主SCM板为通讯连接状态;
第二判定单元,用于判定与主SCM板不为通讯连接状态。
其中,第一判断单元,包括:
连接信号判断单元,用于判断未接收到主SCM板发送的连接信号的时间是否达到第二预设时长,连接信号用于表征处理器与主SCM板为通讯连接状态,若是,进入第三判定单元,若否,进入第四判定单元;
第三判定单元,用于判定与主SCM板不为通讯连接状态;
第四判定单元,用于判定与主SCM板为通讯连接状态。
其中,响应指令判断单元,包括:
在第一预设时长内未接收到主SCM板发送的对应询问指令的响应指令时,判定未接收到主SCM板发送的对应询问指令的响应指令。
其中,主SCM板包括电路板和设置在电路板上的芯片模块,芯片模块与处理器连接;
板上信息获取单元,包括:
获取芯片模块的芯片信息作为主SCM板的当前的板上信息;
第二判断单元,包括:
判断芯片信息是否为异常信息;
若芯片信息为异常信息,判定板上信息为异常信息;
若芯片信息不为异常信息,判定板上信息不为异常信息。
其中,第一判断单元,包括:
周期性判断与主SCM板是否为通讯连接状态。
其中,服务器还包括电源模块,电源模块的供电端分别与主SCM板的被供电端和备用SCM板的被供电端连接,被控端与处理器的控制端连接;
开启控制单元,包括:
控制开启电源模块对于备用SCM板的供电,并发送开启指令至备用SCM板以使备用SCM板开启;
控制单元,包括:
控制关闭电源模块对于主SCM板的供电,并发送关闭指令至主SCM板以使主SCM板关闭。
对于本方案提供的故障切换系统的介绍请参照上述故障切换方法的实施例,此处不再赘述。
请参照图5,图5为本发明提供的一种故障切换装置的结构示意图。
为解决上述技术问题,本发明提供了一种故障切换装置,包括:
存储器30,用于存储计算机程序;
处理器1,用于执行计算机程序以实现上述故障切换方法的步骤。
对于本方案提供的故障切换装置的介绍请参照上述故障切换方法的实施例,此处不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种故障切换方法,其特征在于,应用于服务器的主板的处理器,所述服务器还包括主SCM板和备用SCM板,所述处理器分别与所述主SCM板和所述备用SCM板连接,所述故障切换方法包括:
判断与所述主SCM板是否为通讯连接状态;
若与所述主SCM板不为通讯连接状态,控制所述备用SCM板开启以便与所述备用SCM板通讯连接;
若与所述主SCM板为通讯连接状态,获取所述主SCM板的当前的板上信息;
判断所述板上信息是否为异常信息;
若述板上信息为异常信息,控制所述备用SCM板开启并控制所述主SCM板关闭以便与所述备用SCM板通讯连接。
2.如权利要求1所述的故障切换方法,其特征在于,判断与所述主SCM板是否为通讯连接状态,包括:
发送询问指令至所述主SCM板;
判断是否接收到所述主SCM板发送的对应所述询问指令的响应指令;
若接收到所述主SCM板发送的对应所述询问指令的响应指令,判定与所述主SCM板为所述通讯连接状态;
若未接收到所述主SCM板发送的对应所述询问指令的响应指令,判定与所述主SCM板不为所述通讯连接状态。
3.如权利要求1所述的故障切换方法,其特征在于,判断与所述主SCM板是否为通讯连接状态,包括:
判断未接收到所述主SCM板发送的连接信号的时间是否达到第一预设时长,所述连接信号用于表征所述处理器与所述主SCM板为通讯连接状态;
若是,判定与所述主SCM板不为通讯连接状态;
若否,判定与所述主SCM板为通讯连接状态。
4.如权利要求2所述的故障切换方法,其特征在于,判定未接收到所述主SCM板发送的对应所述询问指令的响应指令,包括:
在第二预设时长内未接收到所述主SCM板发送的对应所述询问指令的响应指令时,判定未接收到所述主SCM板发送的对应所述询问指令的响应指令。
5.如权利要求1所述的故障切换方法,其特征在于,所述主SCM板包括电路板和设置在所述电路板上的芯片模块,所述芯片模块与所述处理器连接;
获取所述主SCM板的当前的板上信息,包括:
获取所述芯片模块的芯片信息作为所述主SCM板的当前的板上信息;
判断所述板上信息是否为异常信息,包括:
判断所述芯片信息是否为异常信息;
若所述芯片信息为异常信息,判定所述板上信息为异常信息;
若所述芯片信息不为异常信息,判定所述板上信息不为异常信息。
6.如权利要求1所述的故障切换方法,其特征在于,判断与所述主SCM板是否为通讯连接状态,包括:
周期性判断与所述主SCM板是否为通讯连接状态。
7.如权利要求1至6任一项所述的故障切换方法,其特征在于,所述服务器还包括电源模块,所述电源模块的供电端分别与所述主SCM板的被供电端和所述备用SCM板的被供电端连接,被控端与所述处理器的控制端连接;
控制所述备用SCM板开启,包括:
控制开启所述电源模块对于所述备用SCM板的供电,并发送开启指令至所述备用SCM板以使所述备用SCM板开启;
控制所述主SCM板关闭,包括:
控制关闭所述电源模块对于所述主SCM板的供电,并发送关闭指令至所述主SCM板以使所述主SCM板关闭。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述故障切换方法的步骤。
9.一种故障切换系统,其特征在于,包括:
第一判断单元,用于判断与所述主SCM板是否为通讯连接状态,若否,触发开启控制单元,若是,触发板上信息获取单元;
所述开启控制单元,用于控制所述备用SCM板开启以便与所述备用SCM板通讯连接;
所述板上信息获取单元,用于获取所述主SCM板的当前的板上信息;
第二判断单元,用于判断所述板上信息是否为异常信息,若是,触发控制单元;
所述控制单元,用于控制所述备用SCM板开启并控制所述主SCM板关闭以便与所述备用SCM板通讯连接。
10.一种故障切换装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现权利要求1至7任一项所述故障切换方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211448124.7A CN115733736B (zh) | 2022-11-18 | 2022-11-18 | 一种故障切换方法、计算机可读存储介质、系统及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211448124.7A CN115733736B (zh) | 2022-11-18 | 2022-11-18 | 一种故障切换方法、计算机可读存储介质、系统及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115733736A true CN115733736A (zh) | 2023-03-03 |
CN115733736B CN115733736B (zh) | 2024-06-25 |
Family
ID=85296612
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211448124.7A Active CN115733736B (zh) | 2022-11-18 | 2022-11-18 | 一种故障切换方法、计算机可读存储介质、系统及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115733736B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101056445A (zh) * | 2006-04-11 | 2007-10-17 | 大唐移动通信设备有限公司 | NodeB的NBAP资源的备份及恢复方法 |
WO2015154525A1 (zh) * | 2014-09-05 | 2015-10-15 | 中兴通讯股份有限公司 | 一种使用多板卡保护HQoS的方法和装置 |
US20200403848A1 (en) * | 2019-06-24 | 2020-12-24 | Hewlett Packard Enterprise Development Lp | Dynamic distribution of bidirectional forwarding detection echo sessions across a multi-processor system |
CN113190180A (zh) * | 2021-05-26 | 2021-07-30 | 北京自由猫科技有限公司 | 一种基于混合介质的存储装置及分布式存储系统 |
CN114650213A (zh) * | 2020-12-18 | 2022-06-21 | 航天信息股份有限公司 | 配置Jenkins服务器集群的方法、装置、存储介质 |
-
2022
- 2022-11-18 CN CN202211448124.7A patent/CN115733736B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101056445A (zh) * | 2006-04-11 | 2007-10-17 | 大唐移动通信设备有限公司 | NodeB的NBAP资源的备份及恢复方法 |
WO2015154525A1 (zh) * | 2014-09-05 | 2015-10-15 | 中兴通讯股份有限公司 | 一种使用多板卡保护HQoS的方法和装置 |
CN105471610A (zh) * | 2014-09-05 | 2016-04-06 | 中兴通讯股份有限公司 | 一种使用多板卡保护HQoS的方法和装置 |
US20200403848A1 (en) * | 2019-06-24 | 2020-12-24 | Hewlett Packard Enterprise Development Lp | Dynamic distribution of bidirectional forwarding detection echo sessions across a multi-processor system |
CN114650213A (zh) * | 2020-12-18 | 2022-06-21 | 航天信息股份有限公司 | 配置Jenkins服务器集群的方法、装置、存储介质 |
CN113190180A (zh) * | 2021-05-26 | 2021-07-30 | 北京自由猫科技有限公司 | 一种基于混合介质的存储装置及分布式存储系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115733736B (zh) | 2024-06-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP4206839A1 (en) | Method for managing ecu on vehicle, and ecu and readable storage medium | |
CN109445981B (zh) | 计算机运行状态监控装置 | |
CN113360347B (zh) | 一种服务器及其控制方法 | |
CN101751265B (zh) | 服务器的基本输入/输出系统的更新系统及其方法 | |
CN115733736A (zh) | 一种故障切换方法、计算机可读存储介质、系统及装置 | |
CN104836829A (zh) | 车辆的远程监控方法及远程监控系统 | |
CN110209092B (zh) | 楼宇自控系统及其控制方法、装置、楼宇系统 | |
CN114537146B (zh) | 一种车辆控制方法、装置、电子设备和存储介质 | |
CN115390539A (zh) | 车辆异常休眠诊断方法、装置、车辆及存储介质 | |
CN112153714B (zh) | 一种低功耗设备的无线自适应网关方法 | |
CN114828135A (zh) | 一种网络旁路功能控制处理方法和装置 | |
CN111858183B (zh) | 一种电子设备的重启方法和装置 | |
CN114138567A (zh) | 一种基板管理控制模块维护方法、装置、设备及存储介质 | |
CN114528242A (zh) | 一种计算机平台双系同步方法、装置、设备及介质 | |
CN101217444B (zh) | 一种基于can总线的网络控制方法 | |
CN113721448A (zh) | 一种冗余模块切换方法和装置 | |
CN112052024A (zh) | 一种兆芯服务器bios的升级方法、装置、设备及介质 | |
CN111858443A (zh) | 一种交换机i2c通讯系统及方法 | |
KR101552785B1 (ko) | 실시간 모니터링 시스템을 위한 자동 복구 방법 및 시스템 | |
CN218974903U (zh) | 一种国产服务器bios固件备份装置 | |
CN113595837B (zh) | 通讯协议管理方法、装置、电子设备及存储介质 | |
CN109861868B (zh) | 基于Linux的两级三系统架构的网关系统加强方法 | |
US11481012B2 (en) | Maintainable distributed fail-safe real-time computer system | |
JP4983704B2 (ja) | 電力供給管理システム及び電力供給管理方法 | |
CN113572626A (zh) | 终端设备维护方法、设备维护装置及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |