CN113742165A - 双主控设备及主备控制方法 - Google Patents
双主控设备及主备控制方法 Download PDFInfo
- Publication number
- CN113742165A CN113742165A CN202110840996.7A CN202110840996A CN113742165A CN 113742165 A CN113742165 A CN 113742165A CN 202110840996 A CN202110840996 A CN 202110840996A CN 113742165 A CN113742165 A CN 113742165A
- Authority
- CN
- China
- Prior art keywords
- control board
- main control
- standby
- state
- software
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000012544 monitoring process Methods 0.000 claims abstract description 73
- 230000002159 abnormal effect Effects 0.000 claims abstract description 66
- 238000012545 processing Methods 0.000 claims description 17
- 230000009977 dual effect Effects 0.000 claims description 13
- 238000001514 detection method Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3031—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a motherboard or an expansion card
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Hardware Redundancy (AREA)
Abstract
本申请涉及一种双主控设备和主备控制方法,其中,该双主控设备包括第一主控板和第二主控板;第一主控板和第二主控板中的主用主控板用于监控主用主控板的第一软件状态和第一主控板和第二主控板中的备用主控板的第二硬件状态;备用主控板用于监控备用主控板的第二软件状态和主用主控板的第一硬件状态;若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态均正常,则主用主控板和备用主控板进行主备切换。通过本申请可以快速进行主备切换,保证整个系统能够正常工作。
Description
技术领域
本申请涉及设备控制领域,尤其涉及一种双主控设备及主备控制方法。
背景技术
在高可靠性的应用环境中,对于设备的可靠性具有很高的要求,当设备出现硬件和软件单点故障时,整个设备还能可靠的工作;为此设备的主要控制单板通常采用1+1热备的方式;即同一时刻一块控制板处于master(主用),另一块控制板处于slave(备用)。但是,现有技术中主备主控板分别配置有独立的CPU,因此,在主用主控板发生故障的时候如何快速进行主备切换是一个亟待解决的问题。
发明内容
本申请提供了一种双主控设备及主备控制方法,以解决现有技术中主用主控板发生故障时不能及时进行主备切换的技术问题。
第一方面,本申请提供了一种双主控设备,双主控设备包括第一主控板和第二主控板;
第一主控板和第二主控板中的主用主控板用于监控主用主控板的第一软件状态和第一主控板和第二主控板中的备用主控板的第二硬件状态;
备用主控板用于监控备用主控板的第二软件状态和主用主控板的第一硬件状态;
若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态均正常,则主用主控板和备用主控板进行主备切换。
第二方面,本申请提供了一种主备控制方法,应用于双主控设备,双主控设备包括第一主控板和第二主控板,该方法包括:
利用第一主控板和第二主控板中的主用主控板监控主用主控板的第一软件状态和第一主控板和第二主控板中的备用主控板的第二硬件状态;
利用备用主控板监控备用主控板的第二软件状态和主用主控板的第一硬件状态;
若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态均正常,则控制备用主控板和主用主控板进行主备切换。
第三方面,提供了一种主控板,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现第一方面任一项实施例的主备控制方法的步骤。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面任一项实施例的主备控制方法的步骤。
本申请实施例提供的上述技术方案与现有技术相比具有如下优点:
本申请实施例提供的该双主控设备和主备控制方法,通过两个主控板分别对对端主控板的硬件进行硬件故障检测,通过两个主控板分别对本端主控板的软件进行软件故障检测,只要主用主控板软件和硬件任意一个发生故障,则触发主备切换,从硬件和软件两个维度对主用主控板进行性能监测,保证主用主控板的正常运行状态,进而保证了整个系统的正常运行。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种双主控设备的结构示意图;
图2为本申请实施例提供的一种主备控制方法的流程示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种双主控设备的结构示意图;参考图1,该双主控设备包括第一主控板和第二主控板;
第一主控板和第二主控板中的主用主控板用于监控主用主控板的第一软件状态和第一主控板和第二主控板中的备用主控板的第二硬件状态;
备用主控板用于监控备用主控板的第二软件状态和主用主控板的第一硬件状态;
若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态均正常,则主用主控板和备用主控板进行主备切换。
具体地,第一主控板和第二主控板包括硬件部分和软件部分。第一主控板和第二主控板组成了设备或控制系统中高可用硬件HA。第一主控板和第二主控板的状态有四种:Master(主用)、salve(备用)、unknow(未知状态)、error(发生错误)。
主用主控板和备用主控板是在双主控设备上电时根据预设的主备策略从第一主控板和第二主控板中确定的,其中一个为主用主控板、另外一个为备用主控板。主用主控板可能为第一主控板,也可以为第二主控板。同理,备用主控板可能为第一主控板,也可以为第二主控板。在同一时刻,不能同时两个都为主用主控板,也不能同时两个都为备用主控板。
在该双主控设备中还包括除第一主控板和第二主控板之外的其他业务单板,其他业务单板分别与第一主控板和第二主控板连接,但是在同一时刻,只有其中一个主用主控板与其他业务单板进行数据通信。
箫一软件状态和第一硬件状态为第一主控板和第二主控板中主用主控板的第一软硬件状态;第二软件状态和第二硬件状态为第一主控板和第二主控板中备用主控板的第二软硬件状态。
当检测到主用主控板的第一软件状态或第一硬件状态中的至少一个发生异常时,则会根据备用主控板当前的第二软件状态和第二硬件状态,进行主备切换。
主备切换的目的是将发生异常的主用主控板切换为备用主控板,将没有发生异常的备用主控板切换为主用主控板,同时对第一主控板和第二主控板中其他硬件和软件进行对应的设置。以保证整个系统主用主控板性能正常,进而保证整个系统的正常运行。
本申请实施例通过两个主控板分别对对端主控板的硬件进行硬件故障检测,通过两个主控板分别对本端主控板的软件进行软件故障检测,只要主用主控板软件和硬件任意一个发生故障,则触发主备切换,从硬件和软件两个维度对主用主控板进行性能监测,保证主用主控板的正常运行状态,进而保证了整个系统的正常运行。
在-一个实施例中,第一主控板和第二主控板均包括CPU和管理模块,CPU包括运行在该CPU上的软件监控模块,管理模块包括硬件监控模块;
主用主控板的软件监控模块用于对主用主控板的CPU进行软件故障检测,得到主用主控板对应的第一软件状态,
备用主控板的硬件监控模块用于对主用主控板的硬件进行硬件故障检测,得到主用主控板对应的第一硬件状态,
备用主控板的软件监控模块用于对备用主控板的CPU进行软件故障检测,得到备用主控板对应的第二软件状态,
主用主控板的硬件监控模块用于对备用主控板的硬件进行硬件故障检测,得到备用主控板对应的第二硬件状态。
具体地,管理模块具体为FPGA模块,FPGA模块用于对本端的CPU、软件、硬件进行相关管理。FPGA模块中的硬件监控模块具体为FPGA HA,FPGA HA为FPGA模块中FPGA软件中的部分软件模块,用于控制主备逻辑,包括CPU即所在的主控板主备状态的确定、主备的切换、对端主控板硬件故障的检测。
运行在CPU中的软件监控模块具体为CPU中运行的CPU软件模块中的部分软件模块即软件HA,其用于监控运行在CPU中的其他软件模块。
第一主控板和第二主控板中的FPGA HA可以相互通信。同一个主控板中CPU中的软件HA可以通过FPGA模块读取第一主控板和第二主控板的主备状态,即本端的主控板是主用主控板还是备用主控板,该主控板的CPU中的软件HA可以获知。
主用主控板的软件HA用于对主用主控板中的CPU中运行的其他软件模块进行软件故障检测,得到主用主控板的第一软件状态,第一软件状态包括正常或异常。当然还可以包括具体地其他软件模块中哪些模块异常。
主用主控板的FPGA HA用于对备用主控板的硬件进行硬件故障检测,相当于是对对端的硬件进行故障检测,得到的是备用主控板的硬件的第二硬件状态。第二硬件状态包括正常或异常。当然还可以包括具体地硬件中哪些硬件异常。
备用主控板的软件HA用于对备用主控板中的CPU中运行的其他软件模块进行软件故障检测,得到备用主控板的第二软件状态,第二软件状态包括正常或异常。当然还可以包括具体地其他软件模块中哪些模块异常。
备用主控板的FPGA HA用于对主用主控板的硬件进行硬件故障检测,相当于是对对端的硬件进行故障检测,得到的是主用主控板的硬件的第一硬件状态。第一硬件状态包括正常或异常。当然还可以包括具体地硬件中哪些硬件异常。
在一个实施例中,CPU还包括运行在该CPU上的其他软件模块;
若主用主控板的第一软件状态异常,且,备用主控板的第二软件状态和第二硬件状态均正常,则主用主控板的硬件监控模块用于对主用主控板的管理模块进行第一相关设置,以将主用主控板的主备状态由主控状态切换为备用状态,
主用主控板的硬件监控模块还用于将主用主控板的主备状态切换事件通知至备用主控板的管理模块,
主用主控板的硬件监控模块还用于通过中断的方式将主用主控板的主备状态切换事件通知至主用主控板的软件监控模块,
主用主控板的软件监控模块用于将主用主控板的主备状态切换事件通知至主用主控板的其他软件模块,使主用主控板的其他软件模块进行对应的业务逻辑处理;
若备用主控板的硬件监控模块接收到主用主控板的主备状态切换事件,则备用主控板的硬件监控模块用于根据主用主控板的主备状态切换事件对备用主控板的管理模块进行第二相关设置,以将备用主控板的主备状态由备用状态切换为主控状态,
备用主控板的硬件监控模块还用于将备用主控板的主备状态切换事件通知至备用主控板的软件监控模块,使备用主控板的软件监控模块根据备用主控板的主备状态切换事件进行对应的业务逻辑处理。
具体地,主用主控板发生软件故障或硬件故障时,如果备用主控板软件和硬件都正常,则会发生主备切换。但是如果主用主控板发生软件故障或硬件故障时,备用主控板软件或硬件也异常,则需要根据二者异常程度的比较来决定是否执行主备切换。
当主用主控板的第一软件状态异常,且备用主控板软件和硬件都正常,则主用主控板的FPGA HA会对FPGA模块进行第一相关设置,第一相关设置具体为对FPGA模块中的相关寄存器进行相关设置,使得FPGA模块将本端的CPU设置为备用状态,进而使本端的主用主控板由主用状态切换为备用状态,即实现了硬件的主备切换。
同时该主用主控板的FPGA HA还会将该主用主控板的主备状态切换事件通知给备用主控板的FPGA模块。
同时该主用主控板的FPGA HA还会通过中断的方式将该主用主控板的主备状态切换事件通知给该主用主控板本端的软件HA。相当于是将主用主控板当前为备用状态的主备状态通知给本端的软件HA。
主用主控板的软件HA将主用主控板的主备状态切换事件通知给所在CPU中运行的其他软件模块,其他软件模块根据该切换事件进行相应的业务逻辑处理,即实现了软件的主备切换。
通过上述切换操作,主用主控板在进行主备切换后从硬件和软件层面都进行了相应切换。
同时,备用主控板也会进行相应切换。上述的主用主控板在进行主备切换的时候主用主控板的FPGAHA还会将主用主控板的主备状态切换事件通知给备用主控板的FPGAHA。备用主控板的FPGAHA接收到此事件后,对备用主控板的FPGA模块进行第二相关设置,第二相关设置具体为对FPGA模块中的相关寄存器进行相关设置,使得FPGA模块将本端的CPU设置为主用状态,进而使本端的备用主控板由备用状态切换为主用状态,即实现了硬件的主备切换。
同时,备用主控板的FPGA HA还会将备用主控板由备用状态切换为主用状态的主备状态切换事件通知给本端的软件HA,本端的软件HA将备用主控板当前为主用状态的信息通知给本端CPU中运行的其他软件模块,其他软件模块根据备用主控板设备的主备切换事件进行相应的业务逻辑处理,得到备用主控板在软件层面作为主用,即实现软件的主备切换。
其中,本端的软件监控模块即软件HA会将监控到的本端的软件状态通知给本端的硬件监控模块即FPGA HA。
在另一个实施例中,主用主控板会将本端监控到的第一软件状态后和第二硬件状态通知给备用主控板,备用主控板也会将本端监控到的第二软件状态和第一硬件状态通知给主用主控板,实现信息共享。
在一个实施例中,CPU还包括运行在CPU上的其他软件模块;
若主用主控板的第一硬件状态异常,且,备用主控板的第二软件状态和第二硬件状态均正常,则备用主控板的硬件监控模块用于对备用主控板的管理模块进行第三相关设置,以将备用主控板的主备状态由备用状态切换为主控状态,
备用主控板的硬件监控模块还用于通过中断的方式将备用主控板的主备状态切换事件通知至备用主控板的软件监控模块,
备用主控板的软件监控模块还用于将备用主控板的主备状态切换事件通知至备用主控板的其他软件模块,使备用主控板的其他软件模块进行对应的业务逻辑处理;
备用主控板的硬件监控模块还用于对主用主控板的管理模块进行第四相关设置,以将主用主控板的主备状态由主用状态切换为备用状态,
或,
备用主控板的硬件监控模块还用于重启主用主控板。
具体地,主用主控板发生软件故障或硬件故障时,如果备用主控板软件和硬件都正常,则会发生主备切换。但是如果主用主控板发生软件故障或硬件故障时,备用主控板软件或硬件也异常,则需要根据二者异常程度的比较来决定是否执行主备切换。
当主用主控板的第一硬件状态异常,且备用主控板软件和硬件都正常,则备用主控板的FPGA HA会对本端的FPGA模块进行第三相关设置,第三相关设置具体为对FPGA模块中的相关寄存器进行相关设置,使得FPGA模块将本端的CPU设置为主用状态,进而使本端的备用主控板由备用状态切换为主用状态,即实现了硬件的主备切换。
同时该备用主控板的FPGA HA还会将该备用主控板的主备状态切换事件通知给主用主控板的FPGA模块。
同时该备用主控板的FPGA HA还会通过中断的方式将该备用主控板的主备状态切换事件通知给该备用主控板本端的软件HA。相当于是将备用主控板当前为主用状态的主备状态通知给本端的软件HA。
备用主控板的软件HA将备用主控板的主备状态切换事件通知给本端所在CPU中运行的其他软件模块,其他软件模块根据该切换事件进行相应的业务逻辑处理,即实现了软件的主备切换。
通过上述切换操作,备用主控板在进行主备切换后从硬件和软件层面都进行了相应切换。
同时,主用主控板也会进行相应切换。备用主控板的FPGA HA会对主用主控板的FPGA模块进行第四相关设置,第四相关设置具体为对FPGA模块中的相关寄存器进行相关设置,使得主用主控板的FPGA模块将本端的CPU设置为备用状态,进而使主用主控板由主用状态切换为备用状态,即实现了硬件的主备切换。
与此同时,主用主控板的FPGA HA还会通过中断的方式将该主用主控板的主备状态切换事件通知给该主用主控板本端的软件HA。相当于是将主用主控板当前为备用状态的主备状态通知给本端的软件HA。
主用主控板的软件HA将主用主控板的主备状态切换事件通知给所在CPU中运行的其他软件模块,其他软件模块根据该切换事件进行相应的业务逻辑处理,即实现了软件的主备切换。
在另外一个具体实施例中,当备用主控板进行主备切换的时候,还可以通过控制主用主控板进行重启,使得主用主控板改变主备状态由主用改为备用。
在另外一个具体实施例中,备用主控板进行主备切换的时候,主用主控板的切换还可以如下操作:
上述的备用主控板在进行主备切换的时候备用主控板的FPGA HA还会将备用主控板的主备状态切换事件通知给主用主控板的FPGA HA。主用主控板的FPGA HA接收到此事件后,对主用主控板的FPGA模块进行第五相关设置,第五相关设置具体为对FPGA模块中的相关寄存器进行相关设置,使得主用主控板的FPGA模块将本端的CPU设置为备用状态,进而使本端的主用主控板由主用状态切换为备用状态,即实现了主用主控板硬件的主备切换。
同时,主用主控板的FPGA HA还会将主用主控板由主用状态切换为备用状态的硬件主备状态切换事件通知给本端的软件HA,本端的软件HA将主用主控板当前为备用状态的信息通知给本端CPU中运行的其他软件模块,其他软件模块根据主用主控板设备的主备切换事件进行相应的业务逻辑处理,得到主用主控板在软件层面作为主用,即实现主用主控板软件的主备切换。
在一个实施例中,若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态中至少一个异常,则主用主控板比较自身的异常程度和备用主控板的异常程度;
若自身的异常程度高于备用主控板的异常程度,则备用主控板和主用主控板进行主备切换;
若自身的异常程度低于备用主控板的异常程度,则不进行主备切换。
具体地,在本申请实施例中,主用主控板和备用主控板可以通过FPGA HA进行信息交互,例如将主备状态切换事件通知给对端。还可以将检测到的软件状态和硬件状态通知给对端。
这样主用主控板可以在硬件或软件异常的情况下,综合备用主控板的硬件或软件情况决定是否进行主备切换。以免在备用主控板异常更严重的情况下,切换到更糟糕的主控环境下,使整个系统工作更加不稳定。
当然在另外一个实施例中,在主用主控板和备用主控板都异常的情况下还可以发送预警信息,以提醒工作人员及时检修。
图2为本申请实施例提供的一种主备控制方法的流程示意图。参考图2,该主备控制方法,应用于图1中的双主控设备,双主控设备包括第一主控板和第二主控板,该方法包括以下步骤:
S100:利用第一主控板和第二主控板中的主用主控板监控主用主控板的第一软件状态和第一主控板和第二主控板中的备用主控板的第二硬件状态;
S200:利用备用主控板监控备用主控板的第二软件状态和主用主控板的第一硬件状态;
S300:若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态均正常,则控制备用主控板和主用主控板进行主备切换。
在一个实施例中,在步骤S100之前,该方法还包括:
若监测到控制设备上电,则根据预设的主备策略从第一主控板和第二主控板中确定一个为主用主控板、另一个为备用主控板。
在一个实施例中,第一主控板和第二主控板均包括CPU和管理模块,CPU包括运行在CPU上的软件监控模块,管理模块包括硬件监控模块。
步骤S100具体包括以下步骤:
利用主用主控板的软件监控模块对主用主控板的CPU进行软件故障检测,得到主用主控板对应的第一软件状态,
利用主用主控板的硬件监控模块对备用主控板的硬件进行硬件故障检测,得到备用主控板对应的第二硬件状态。
步骤S200具体包括:
利用备用主控板的软件监控模块对备用主控板的CPU进行软件故障检测,得到备用主控板对应的第二软件状态,
利用备用主控板的硬件监控模块对主用主控板的硬件进行硬件故障检测,得到主用主控板对应的第一硬件状态。
在一个实施例中,CPU还包括运行在CPU上的其他软件模块。
S300具体包括:
若主用主控板的第一软件状态异常,且,备用主控板的第二软件状态和第二硬件状态均正常,则通过主用主控板的硬件监控模块对主用主控板的管理模块进行第一相关设置,以将主用主控板的主备状态由主控状态切换为备用状态,
并通过主用主控板的硬件监控模块将主用主控板的主备状态切换事件通知至备用主控板的管理模块,
并通过主用主控板的硬件监控模块通过中断的方式将主用主控板的主备状态切换事件通知至主用主控板的软件监控模块,使软件监控模块将主用主控板的主备状态切换事件通知至主用主控板的其他软件模块,使主用主控板的其他软件模块进行对应的业务逻辑处理:
若备用主控板的硬件监控模块接收到主用主控板的主备状态切换事件,则利用备用主控板的硬件监控模块根据主用主控板的主备状态切换事件对备用主控板的管理模块进行第二相关设置,以将备用主控板的主备状态由备用状态切换为主控状态,
并通过备用主控板的硬件监控模块将备用主控板的主备状态切换事件通知至备用主控板的软件监控模块,使备用主控板的软件监控模块根据备用主控板的主备状态切换事件进行对应的业务逻辑处理。
在一个实施例中,CPU还包括运行在CPU上的其他软件模块。
S300具体包括:
若主用主控板的第一软件状态和第一硬件状态中至少一个异常、备用主控板的第二软件状态和第二硬件状态均正常,则控制备用主控板和主用主控板进行主备切换,包括:
若主用主控板的第一硬件状态异常,且,备用主控板的第二软件状态和第二硬件状态均正常,则通过备用主控板的硬件监控模块对备用主控板的管理模块进行第三相关设置,以将备用主控板的主备状态由备用状态切换为主控状态,
利用备用主控板的硬件监控模块通过中断的方式将备用主控板的主备切换状态事件通知至备用主控板的软件监控模块,
利用备用主控板的软件监控模块将备用主控板的主备状态切换事件通知至备用主控板的其他软件模块,使备用主控板的其他软件模块进行对应的业务逻辑处理;
利用备用主控板的硬件监控模块对主用主控板的管理模块进行第四相关设置,以将主用主控板的主备状态由主用状态切换为备用状态,
或,
利用备用主控板的硬件监控模块重启主用主控板。
在一个实施例中,该方法还包括:
若主用主控板的第一软硬件状态异常、备用主控板的第二软硬件状态异常,则比较第一软硬件状态的异常程度和第二软硬状态的异常程度;
若第一软硬件状态的异常程度高于第二软硬件状态的异常程度,则控制备用主控板和主用主控板进行主备切换;
若第一软硬件状态的异常程度低于第二软硬件状态的异常程度,则不进行主备切换。
本申请实施例提供了一种主控板,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现前述任意一个方法实施例提供的主备控制方法。
本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述任意一个方法实施例提供的主备控制方法的步骤。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种双主控设备,其特征在于,所述双主控设备包括第一主控板和第二主控板;
所述第一主控板和第二主控板中的主用主控板用于监控所述主用主控板的第一软件状态和所述第一主控板和第二主控板中的备用主控板的第二硬件状态;
所述备用主控板用于监控所述备用主控板的第二软件状态和所述主用主控板的第一硬件状态;
若所述主用主控板的第一软件状态和第一硬件状态中至少一个异常、所述备用主控板的第二软件状态和第二硬件状态均正常,则主用主控板和备用主控板进行主备切换。
2.根据权利要求1所述的双主控设备,其特征在于,所述第一主控板和第二主控板均包括CPU和管理模块,所述CPU包括运行在所述CPU上的软件监控模块,所述管理模块包括硬件监控模块;
所述主用主控板的软件监控模块用于对所述主用主控板的CPU进行软件故障检测,得到所述主用主控板对应的第一软件状态,
所述备用主控板的硬件监控模块用于对所述主用主控板的硬件进行硬件故障检测,得到所述主用主控板对应的第一硬件状态,
所述备用主控板的软件监控模块用于对所述备用主控板的CPU进行软件故障检测,得到所述备用主控板对应的第二软件状态,
所述主用主控板的硬件监控模块用于对所述备用主控板的硬件进行硬件故障检测,得到所述备用主控板对应的第二硬件状态。
3.根据权利要求2所述的双主控设备,其特征在于,所述CPU还包括运行在所述CPU上的其他软件模块;
若所述主用主控板的第一软件状态异常,且,所述备用主控板的第二软件状态和第二硬件状态均正常,则所述主用主控板的硬件监控模块用于对所述主用主控板的管理模块进行第一相关设置,以将所述主用主控板的主备状态由主控状态切换为备用状态,
所述主用主控板的硬件监控模块还用于将所述主用主控板的主备状态切换事件通知至所述备用主控板的管理模块,
所述主用主控板的硬件监控模块还用于通过中断的方式将所述主用主控板的主备状态切换事件通知至所述主用主控板的软件监控模块,
所述主用主控板的软件监控模块用于将所述主用主控板的主备状态切换事件通知至所述主用主控板的其他软件模块,使主用主控板的其他软件模块进行对应的业务逻辑处理;
若所述备用主控板的硬件监控模块接收到所述主用主控板的主备状态切换事件,则所述备用主控板的硬件监控模块用于根据所述主用主控板的主备状态切换事件对所述备用主控板的管理模块进行第二相关设置,以将所述备用主控板的主备状态由备用状态切换为主控状态,
所述备用主控板的硬件监控模块还用于将所述备用主控板的主备状态切换事件通知至所述备用主控板的软件监控模块,使所述备用主控板的软件监控模块根据所述备用主控板的主备状态切换事件进行对应的业务逻辑处理。
4.根据权利要求2或3所述的双主控设备,其特征在于,所述CPU还包括运行在所述CPU上的其他软件模块;
若所述主用主控板的第一硬件状态异常,且,所述备用主控板的第二软件状态和第二硬件状态均正常,则所述备用主控板的硬件监控模块用于对所述备用主控板的管理模块进行第三相关设置,以将所述备用主控板的主备状态由备用状态切换为主控状态,
所述备用主控板的硬件监控模块还用于通过中断的方式将所述备用主控板的主备状态切换事件通知至所述备用主控板的软件监控模块,
所述备用主控板的软件监控模块还用于将所述备用主控板的主备状态切换事件通知至所述备用主控板的其他软件模块,使备用主控板的其他软件模块进行对应的业务逻辑处理;
所述备用主控板的硬件监控模块还用于对所述主用主控板的管理模块进行第四相关设置,以将所述主用主控板的主备状态由主用状态切换为备用状态,
或,
所述备用主控板的硬件监控模块还用于重启所述主用主控板。
5.根据权利要求1-4任一项所述的双主控设备,其特征在于,
若所述主用主控板的第一软件状态和第一硬件状态中至少一个异常、所述备用主控板的第二软件状态和第二硬件状态中至少一个异常,则所述主用主控板比较自身的异常程度和备用主控板的异常程度;
若所述自身的异常程度高于所述备用主控板的异常程度,则所述备用主控板和主用主控板进行主备切换;
若所述自身的异常程度低于所述备用主控板的异常程度,则不进行主备切换。
6.一种主备控制方法,应用于双主控设备,所述双主控设备包括第一主控板和第二主控板,其特征在于,所述方法包括:
利用所述第一主控板和第二主控板中的主用主控板监控所述主用主控板的第一软件状态和所述第一主控板和第二主控板中的备用主控板的第二硬件状态;
利用所述备用主控板监控所述备用主控板的第二软件状态和所述主用主控板的第一硬件状态;
若所述主用主控板的第一软件状态和第一硬件状态中至少一个异常、所述备用主控板的第二软件状态和第二硬件状态均正常,则控制所述备用主控板和主用主控板进行主备切换。
7.根据权利要求6所述的方法,其特征在于,所述第一主控板和第二主控板均包括CPU和管理模块,所述CPU包括运行在所述CPU上的软件监控模块,所述管理模块包括硬件监控模块;
所述利用所述第一主控板和第二主控板中的主用主控板监控所述主用主控板的第一软件状态和所述第一主控板和第二主控板中的备用主控板的第二硬件状态,包括:
利用所述主用主控板的软件监控模块对所述主用主控板的CPU进行软件故障检测,得到所述主用主控板对应的第一软件状态,
利用所述主用主控板的硬件监控模块对所述备用主控板的硬件进行硬件故障检测,得到所述备用主控板对应的第二硬件状态;
所述利用所述备用主控板监控所述备用主控板的第二软件状态和所述主用主控板的第一硬件状态,包括:
利用所述备用主控板的软件监控模块对所述备用主控板的CPU进行软件故障检测,得到所述备用主控板对应的第二软件状态,
利用所述备用主控板的硬件监控模块对所述主用主控板的硬件进行硬件故障检测,得到所述主用主控板对应的第一硬件状态。
8.根据权利要求7所述的方法,其特征在于,所述CPU还包括运行在所述CPU上的其他软件模块;
所述若所述主用主控板的第一软件状态和第一硬件状态中至少一个异常、所述备用主控板的第二软件状态和第二硬件状态均正常,则控制所述备用主控板和主用主控板进行主备切换,包括:
若所述主用主控板的第一软件状态异常,且,所述备用主控板的第二软件状态和第二硬件状态均正常,则通过所述主用主控板的硬件监控模块对所述主用主控板的管理模块进行第一相关设置,以将所述主用主控板的主备状态由主控状态切换为备用状态,
并通过所述主用主控板的硬件监控模块将所述主用主控板的主备状态切换事件通知至所述备用主控板的管理模块,
并通过所述主用主控板的硬件监控模块通过中断的方式将所述主用主控板的主备状态切换事件通知至所述主用主控板的软件监控模块,使所述软件监控模块将所述主用主控板的主备状态切换事件通知至所述主用主控板的其他软件模块,使主用主控板的其他软件模块进行对应的业务逻辑处理;
若所述备用主控板的硬件监控模块接收到所述主用主控板的主备状态切换事件,则利用所述备用主控板的硬件监控模块根据所述主用主控板的主备状态切换事件对所述备用主控板的管理模块进行第二相关设置,以将所述备用主控板的主备状态由备用状态切换为主控状态,
并通过所述备用主控板的硬件监控模块将所述备用主控板的主备状态切换事件通知至所述备用主控板的软件监控模块,使所述备用主控板的软件监控模块根据所述备用主控板的主备状态切换事件进行对应的业务逻辑处理。
9.根据权利要求7或8所述的方法,其特征在于,所述CPU还包括运行在所述CPU上的其他软件模块;
所述若所述主用主控板的第一软件状态和第一硬件状态中至少一个异常、所述备用主控板的第二软件状态和第二硬件状态均正常,则控制所述备用主控板和主用主控板进行主备切换,包括:
若所述主用主控板的第一硬件状态异常,且,所述备用主控板的第二软件状态和第二硬件状态均正常,则通过所述备用主控板的硬件监控模块对所述备用主控板的管理模块进行第三相关设置,以将所述备用主控板的主备状态由备用状态切换为主控状态,
利用所述备用主控板的硬件监控模块通过中断的方式将所述备用主控板的主备切换状态事件通知至所述备用主控板的软件监控模块,
利用所述备用主控板的软件监控模块将所述备用主控板的主备状态切换事件通知至所述备用主控板的其他软件模块,使备用主控板的其他软件模块进行对应的业务逻辑处理;
利用所述备用主控板的硬件监控模块对所述主用主控板的管理模块进行第四相关设置,以将所述主用主控板的主备状态由主用状态切换为备用状态,
或,
利用所述备用主控板的硬件监控模块重启所述主用主控板。
10.根据权利要求6-9任一项所述的方法,其特征在于,所述方法还包括:
若所述主用主控板的第一软硬件状态异常、所述备用主控板的第二软硬件状态异常,则比较所述第一软硬件状态的异常程度和所述第二软硬状态的异常程度;
若所述第一软硬件状态的异常程度高于所述第二软硬件状态的异常程度,则控制所述备用主控板和主用主控板进行主备切换;
若所述第一软硬件状态的异常程度低于所述第二软硬件状态的异常程度,则不进行主备切换。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110840996.7A CN113742165B (zh) | 2021-07-23 | 双主控设备及主备控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110840996.7A CN113742165B (zh) | 2021-07-23 | 双主控设备及主备控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113742165A true CN113742165A (zh) | 2021-12-03 |
CN113742165B CN113742165B (zh) | 2024-05-24 |
Family
ID=
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114385254A (zh) * | 2021-12-27 | 2022-04-22 | 四川华鲲振宇智能科技有限责任公司 | 一种基于vpx架构的双控主从切换实现方法 |
CN114398088A (zh) * | 2021-12-28 | 2022-04-26 | 中国电子科技集团公司第五十四研究所 | 一种软硬件协同控制的自管理主备切换方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1494228A (zh) * | 2002-11-02 | 2004-05-05 | 华为技术有限公司 | 一种实现单板主备倒换的方法及其电路 |
CN1612495A (zh) * | 2003-10-28 | 2005-05-04 | 港湾网络有限公司 | 一种用于通信设备的主备倒换控制方法 |
CN1889373A (zh) * | 2005-06-30 | 2007-01-03 | 华为技术有限公司 | 一种配线连接设备实现主备倒换的方法 |
CN101106443A (zh) * | 2007-08-10 | 2008-01-16 | 中兴通讯股份有限公司 | 一种控制主备板倒换的系统和方法 |
CN101145895A (zh) * | 2007-09-20 | 2008-03-19 | 中兴通讯股份有限公司 | 主备设备倒换方法 |
CN101207408A (zh) * | 2006-12-22 | 2008-06-25 | 中兴通讯股份有限公司 | 一种用于主备倒换的综合故障检测装置和方法 |
CN101635646A (zh) * | 2009-06-24 | 2010-01-27 | 中兴通讯股份有限公司 | 主/备板卡的倒换方法及系统 |
CN103297279A (zh) * | 2013-06-20 | 2013-09-11 | 烽火通信科技股份有限公司 | 一种多软件进程系统上软件控制的主备单盘倒换方法 |
CN104579774A (zh) * | 2014-12-31 | 2015-04-29 | 北京山石网科信息技术有限公司 | 主控设备的切换方法和装置 |
CN107819617A (zh) * | 2017-11-01 | 2018-03-20 | 京信通信系统(中国)有限公司 | 一种通信设备的监控方法和通信设备 |
CN109768884A (zh) * | 2018-12-26 | 2019-05-17 | 京信通信系统(中国)有限公司 | 通信系统及其高可用性的实现方法、装置和计算机设备 |
CN112887176A (zh) * | 2021-04-28 | 2021-06-01 | 北京城建智控科技有限公司 | 一种基于心跳报文的计算机联锁子系统主备切换系统 |
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1494228A (zh) * | 2002-11-02 | 2004-05-05 | 华为技术有限公司 | 一种实现单板主备倒换的方法及其电路 |
CN1612495A (zh) * | 2003-10-28 | 2005-05-04 | 港湾网络有限公司 | 一种用于通信设备的主备倒换控制方法 |
CN1889373A (zh) * | 2005-06-30 | 2007-01-03 | 华为技术有限公司 | 一种配线连接设备实现主备倒换的方法 |
CN101207408A (zh) * | 2006-12-22 | 2008-06-25 | 中兴通讯股份有限公司 | 一种用于主备倒换的综合故障检测装置和方法 |
CN101106443A (zh) * | 2007-08-10 | 2008-01-16 | 中兴通讯股份有限公司 | 一种控制主备板倒换的系统和方法 |
CN101145895A (zh) * | 2007-09-20 | 2008-03-19 | 中兴通讯股份有限公司 | 主备设备倒换方法 |
CN101635646A (zh) * | 2009-06-24 | 2010-01-27 | 中兴通讯股份有限公司 | 主/备板卡的倒换方法及系统 |
CN103297279A (zh) * | 2013-06-20 | 2013-09-11 | 烽火通信科技股份有限公司 | 一种多软件进程系统上软件控制的主备单盘倒换方法 |
CN104579774A (zh) * | 2014-12-31 | 2015-04-29 | 北京山石网科信息技术有限公司 | 主控设备的切换方法和装置 |
CN107819617A (zh) * | 2017-11-01 | 2018-03-20 | 京信通信系统(中国)有限公司 | 一种通信设备的监控方法和通信设备 |
CN109768884A (zh) * | 2018-12-26 | 2019-05-17 | 京信通信系统(中国)有限公司 | 通信系统及其高可用性的实现方法、装置和计算机设备 |
CN112887176A (zh) * | 2021-04-28 | 2021-06-01 | 北京城建智控科技有限公司 | 一种基于心跳报文的计算机联锁子系统主备切换系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114385254A (zh) * | 2021-12-27 | 2022-04-22 | 四川华鲲振宇智能科技有限责任公司 | 一种基于vpx架构的双控主从切换实现方法 |
CN114398088A (zh) * | 2021-12-28 | 2022-04-26 | 中国电子科技集团公司第五十四研究所 | 一种软硬件协同控制的自管理主备切换方法 |
CN114398088B (zh) * | 2021-12-28 | 2022-12-09 | 中国电子科技集团公司第五十四研究所 | 一种软硬件协同控制的自管理主备切换方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10579484B2 (en) | Apparatus and method for enhancing reliability of watchdog circuit for controlling central processing device for vehicle | |
US7802138B2 (en) | Control method for information processing apparatus, information processing apparatus, control program for information processing system and redundant comprisal control apparatus | |
AU2020285262B2 (en) | Error recovery method and apparatus | |
TWI529624B (zh) | Method and system of fault tolerance for multiple servers | |
CN108243031B (zh) | 一种双机热备的实现方法及装置 | |
JP4655718B2 (ja) | コンピュータシステム及びその制御方法 | |
CN113672306B (zh) | 服务器组件自检异常恢复方法、装置、系统及介质 | |
CN109358982B (zh) | 硬盘自愈装置、方法以及硬盘 | |
JPS6375963A (ja) | システム回復方式 | |
EP3764234B1 (en) | Method and enable apparatus for starting physical device | |
CN111078454A (zh) | 一种云平台配置恢复方法及装置 | |
WO2008004330A1 (fr) | Système à processeurs multiples | |
CN113742165A (zh) | 双主控设备及主备控制方法 | |
JP5332257B2 (ja) | サーバシステム、サーバ管理方法、およびそのプログラム | |
CN113742165B (zh) | 双主控设备及主备控制方法 | |
CN113778763A (zh) | 一种三方接口服务故障智能切换方法及系统 | |
JP2015106226A (ja) | 二重化システム | |
CN113849350A (zh) | 环形两地三中心拓扑切换方法、装置、系统及介质 | |
CN113590203A (zh) | 基板管理控制器失效处理方法及系统、存储介质及单片机 | |
JP3325785B2 (ja) | 計算機の故障検出・回復方式 | |
CN107783855B (zh) | 虚拟网元的故障自愈控制装置及方法 | |
CN115269244A (zh) | 一种控制方法、装置及电子设备 | |
JP2007026038A (ja) | パス監視システム,パス監視方法,およびパス監視プログラム | |
CN112052024A (zh) | 一种兆芯服务器bios的升级方法、装置、设备及介质 | |
CN117743012A (zh) | 一种芯片失效的处理系统、方法、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |