CN102622279B - 冗余控制系统、方法及管理控制器 - Google Patents

冗余控制系统、方法及管理控制器 Download PDF

Info

Publication number
CN102622279B
CN102622279B CN201210069773.6A CN201210069773A CN102622279B CN 102622279 B CN102622279 B CN 102622279B CN 201210069773 A CN201210069773 A CN 201210069773A CN 102622279 B CN102622279 B CN 102622279B
Authority
CN
China
Prior art keywords
management controller
module
expansion module
interfacing expansion
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210069773.6A
Other languages
English (en)
Other versions
CN102622279A (zh
Inventor
张蔚
李迪挺
张羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201210069773.6A priority Critical patent/CN102622279B/zh
Publication of CN102622279A publication Critical patent/CN102622279A/zh
Application granted granted Critical
Publication of CN102622279B publication Critical patent/CN102622279B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明实施例公开了一种冗余控制系统、方法及管理控制器,该系统至少包括两个容错节点,每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器;每个管理控制器包括微处理器模块和与微处理器模块相连的接口扩展模块,每个管理控制器所控制的所有功能模块通过接口扩展模块上设置的接口接入管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接;当冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器,通过总线接管故障管理控制器的接口扩展模块,并对故障管理控制器的所有功能模块进行管理。本发明保证了切换前后在故障容错节点上实现管理控制功能的完整性。

Description

冗余控制系统、方法及管理控制器
技术领域
本发明涉及计算机技术领域,特别是涉及冗余控制系统、方法及管理控制器。
背景技术
高性能容错计算机通过BMC(Baseboard Management Controller,基板管理控制器)来监控设备的运行状态,通常BMC集成在计算机主板上,BMC上的管理系统与主机系统之间相互独立,用于管理和监控容错计算机主板上的各类传感器,收集故障信息,提供远程控制台功能和远程视频、鼠标、键盘功能,以及管理风扇、电源、分区等功能。由于BMC承载了容错计算机的软硬件管理工作,当BMC出现故障时,会影响计算机的可用性和可靠性。
现有技术中,对于并行的容错计算机系统,每台容错计算机上均设置一个BMC,当其中一个BMC发生故障时,可以由其他正常工作的BMC接管其监控功能。但是,发明人在对现有技术的研究过程中发现,当一个BMC发生故障时,正常工作的BMC通过切换只能接管故障BMC上通过I2C总线连接的监控功能和管理部件,而对于故障BMC上的鼠标、键盘功能和远程控制台功能则无法接管,导致切换后所实现的功能不完整。
发明内容
本发明实施例中提供了一种本发明实施例提供了一种冗余控制系统、方法及管理控制器,以解决现有技术中仅能对故障管理控制器的部分控制功能进行接管,导致冗余后实现功能不完整的问题。
为了解决上述技术问题,本发明实施例公开了如下技术方案:
一种冗余控制系统,所述系统至少包括两个容错节点,每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器;每个管理控制器包括微处理器模块和与所述微处理器模块相连的接口扩展模块,每个所述管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接;
当所述冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器,用于通过所述总线接管所述故障管理控制器的接口扩展模块,并对所述故障管理控制器的所有功能模块进行管理。
一种冗余控制方法,所述方法应用于至少包括两个容错节点的系统中,所述系统中每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器;每个管理控制器包括微处理器模块和与所述微处理器模块相连的接口扩展模块,每个所述管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接,所述方法包括:
所述冗余组内的管理控制模块通过接口扩展模块对各自的功能模块进行管理控制;
当所述冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器,通过所述总线接管故障管理控制器的接口扩展模块,对所述故障管理控制器的所有功能模块进行管理。
一种管理控制器,所述管理控制器作为第一管理控制器设置在第一容错节点上,所述第一容错节点与设置了第二管理控制器的第二容错节点组成冗余组,所述第一管理控制器包括第一微处理器模块和第一接口扩展模块,所述第二管理控制器包括第二微处理器模块和第二接口扩展模块,所述第一接口扩展模块通过总线与第二接口扩展模块连接;其中,
所述第一接口扩展模块,用于当所述第二管理控制器发生故障时,通过所述总线接管所述第二接口扩展模块;
所述第一微处理器模块,用于对所述第二管理控制器的所有功能模块进行管理。
本发明实施例中的冗余控制系统,至少包括两个容错节点,每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器,每个管理控制器包括微处理器模块和与微处理器模块相连的接口扩展模块,每个管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接;当冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器通过总线接管故障管理控制器的接口扩展模块,并对故障管理控制器的所有功能模块进行管理。由于本发明实施例通过接口扩展模块上设置的接口对所有功能模块进行管理,且相互冗余的两个容错节点之间的管理控制器通过总线相连,因此当一个容错节点内的管理控制器故障时,另一个容错节点的管理控制器可以通过总线接管故障管理控制器的所有管理功能,保证了切换前后故障容错节点上实现管理控制功能的完整性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明冗余控制系统的第一实施例框图;
图2为本发明冗余控制系统的第二实施例框图;
图3为本发明冗余控制系统实施例中的一种接口扩展模块的实施例框图;
图4为本发明冗余控制系统的第三实施例框图;
图5为本发明冗余控制方法的第一实施例流程图;
图6为本发明冗余控制方法的第二实施例流程图;
图7为本发明一种冗余控制系统的具体应用实例示意图;
图8为本发明管理控制器的第一实施例框图;
图9为本发明管理控制器的第二实施例框图;
图10为本发明管理控制器的第三实施例框图。
具体实施方式
本发明如下实施例提供了一种冗余控制系统、方法及管理控制器。
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
参见图1,为本发明冗余控制系统的第一实施例框图:
该冗余控制系统包括:至少两个容错节点,每两个容错节点组成一个冗余组,为了示例方便,图1中仅示出了由两个容错节点组成的冗余组。
其中,每个容错节点内设置一个管理控制器;每个管理控制器包括微处理器模块和与所述微处理器模块相连的接口扩展模块,每个所述管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接。
参见图1,假设两个容错节点分别为第一容错节点110和第二容错节点120。第一容错节点110内包括第一管理控制器111,第一管理控制器111内包括第一微处理器模块1111和第一接口扩展模块1112,第一接口扩展模块1112与第一功能模块112相连,该第一功能模块112表示由第一管理控制器111管理和监控的各类功能的集合;第二容错节点120内包括第二管理控制器121,第二管理控制器121内包括第二微处理器模块1211和第二接口扩展模块1212,第二接口扩展模块1212与第二功能模块122相连,该第二功能模块122表示由第二管理控制器121管理和监控的各类功能的集合。其中,第一接口扩展模块1112和第二接口扩展模块1212之间通过总线130相连。
其中,假设第二容错节点120的第二管理控制器121发生故障成为故障管理控制器时,第一容错节点110的第一管理控制器111作为正常管理控制器。该第一管理控制器111,用于通过所述总线130接管所述第二管理控制器121的第二接口扩展模块1212,并对所述第二管理控制器121的第二功能模块122进行管理。
上述实施例中,每个冗余组内的两个管理控制器上的接口扩展模块可以具体通过EMI(External Memory Interface,外部存储接口)总线连接。
上述实施例中,每个管理控制器内的微处理器模块的功能可以具体通过MCU实现,接口扩展模块的功能可以具体通过FPGA(Field Programmable Gate Array,现场可编程门阵列)、或者ASIC(Application Specific Integrated Circuit,特殊应用集成电路)芯片实现。
参见图2,为本发明冗余控制系统的第二实施例框图,该实施例仍然以由两个容错节点组成的冗余组为例,其中连接接口扩展模块的总线具体为EMI总线,管理控制模块BMC内的接口扩展模块具体为FPGA:
该冗余控制系统包括:第一容错节点210和第二容错节点220。其中,第一容错节点210内包括第一BMC211,第一BMC211内包括第一MCU2111和第一FPGA2112,第一FPGA2112与第一功能模块212相连,该第一功能模块212中包括了通过第一BMC211所管理控制的第一容错节点210上的传感器、E2PROM(Electrically ErasableProgrammable Read-Only Memory,电可擦可编程只读存储器)、NIC(Network InterfaceCard,网络适配器)控制器、PCIE(Peripheral Component Interconnect Express,扩展外设组件互联标准)设备、系统接口和显示芯片等;第二容错节点220内包括第二BMC221,第二BMC221内包括第二MCU2211和第二FPGA2212,第二FPGA2212与第二功能模块222相连,该第二功能模块222中包括了通过第二BMC221所管理控制的第二容错节点220上的传感器、E2PROM、NIC控制器、PCIE设备、系统接口和显示芯片等。其中,第一MCU2111和第二MCU2211可以具体为ARM处理器或者PowerPC处理器。
其中,第一FPGA2112和第二FPGA2212之间通过EMI总线230相连,在第一FPGA2112和第二FPGA2212之间还进一步设置了切换请求信号线240。假设冗余组内的第一BMC211正常工作,第二BMC221发生故障。
此时,所述第二BMC221的第二MCU2211,用于断开与所述第二BMC221的第二FPGA2212的连接。
所述第一BMC211的第一FPGA2112,用于接收所述第二BMC221的第二FPGA2212通过所述切换请求信号线240发送的切换请求信号,并使能所述第二BMC221的第二FPGA2212通过所述EMI总线230接入所述第一BMC211的第一MCU2111;
所述第一BMC211的第一FPGA2112,用于将所述第二BMC221的第二FPGA2212的地址映射到所述第一BMC211的第一MCU2111;
所述第一BMC211的第一MCU2111,用于根据所述第二BMC221的第二FPGA2212的地址,通过所述EMI总线230对所述第二BMC221的第二功能模块222进行管理。
参见图3,为本发明冗余控制系统实施例中的一种接口扩展模块的实施例框图:
所述接口扩展模块上设置的接口包括:用于访问I2C设备与传感器的I2C/SMBUS(System Management Bus,系统管理总线)接口310,用于与容错节点的系统接口进行通信的LPC(Low Pin Count)接口320,用于实现视频信号采集于压缩的DVI(DigitalVisual Interface,数字视频接口)接口330,用于向微处理器模块提供对外设控制器进行访问功能的本地总线接口340,用于与其它接口扩展模块通过总线相连的远程总线接口350。
结合图2所示的冗余控制系统的实施例可知,该接口扩展模块的一种具体实现方式为FPGA,该FPGA可以通过其上设置的接口与功能模块中的各个具体功能对应的实体相连。
参见图4,为本发明冗余控制系统的第三实施例框图,该实施例中示出的系统中包括N个容错节点,N为大于2的整数。其中,每个容错节点内的结构与图1中所示出的容错节点一致,在实现冗余控制时,该系统中的相邻两个容错节点可以两两组合成一个冗余组,每个冗余组内的两个容错节点之间的冗余控制过程与图1所描述的一致,在此不再赘述。
与本发明冗余控制系统的实施例相对应,本发明还提供了应用于该系统实施例的冗余控制方法的实施例。由于前述已经对冗余控制系统进行了详细的说明,在下述方法实施例中不再对系统结构进行描述,而直接描述冗余控制过程。
参见图5,为本发明冗余控制方法的第一实施例流程图:
步骤501:冗余组内的管理控制模块通过接口扩展模块对各自的功能模块进行管理控制。
步骤502:当冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器,通过总线接管故障管理控制器的接口扩展模块,对故障管理控制器的所有功能模块进行管理。
参见图6,为本发明冗余控制方法的第二实施例流程图:
步骤601:冗余组内的管理控制模块通过接口扩展模块对各自的功能模块进行管理控制。
步骤602:当冗余组内的一个管理控制器成为故障管理控制器时,该故障管理控制器的微处理器模块断开与故障管理控制器的接口扩展模块的连接。
步骤603:正常管理控制器的接口扩展模块接收该故障管理控制器的接口扩展模块通过切换请求信号线发送的切换请求信号。
步骤604:正常管理控制器的接口扩展模块使能故障管理控制器的接口扩展模块通过总线接入正常管理控制器的微处理器模块。
步骤605:正常管理控制器的接口扩展模块将故障管理控制器的接口扩展模块的地址映射到正常管理控制器的微处理器模块。
步骤606:正常管理控制器的微处理器模块根据故障管理控制器的接口扩展模块的地址,通过总线对故障管理控制器的所有功能模块进行管理。
参见图7,为一种冗余控制系统的具体应用实例,该图7中示出的冗余控制系统与图2一致,不同在于该图7具体示出了每个BMC内的MCU与FPGA之间连接关系,包括本地FPGA的EMI片选连接CS2,远端FPGA的EMI片选连接CS3,以及心跳检测连接。下面结合该图7对本发明实施例中的冗余控制过程进行描述:
容错节点1和容错节点2组成一个冗余组。冗余组内的BMC1的FPGA1和BMC2的FPGA2之间通过EMI总线相互连接,当每个容错节点正常工作时,每个BMC的MCU通过本地EMI总线访问本地的FPGA,FPGA通过与MCU之间的心跳来确认MCU的状态,如果心跳正常,使能CS2片选,禁用CS3片选,每个容错节点的BMC可以通过访问本节点的FPGA来管理系统功能。
当容错节点1的BMC1的MCU1出现故障后,MCU1与本地FPGA1之间的心跳丢失,BMC1的FPGA1禁用CS2片选,FPGA1与MCU1断开连接,FPGA1通过接管请求信号线向容错节点2的FPGA2发起连接请求,FPGA2收到请求后将FPGA1的地址映射到容错节点2的本地片选CS3,并使能该CS3,此时BMC2通过本地片选CS2与远端片选CS3分别对FPGA2和FPGA1进行控制,接管容错节点1的全部管理功能。
与本发明冗余控制系统的实施例相对应,本发明还提供了应用于该系统中的管理控制器的实施例。本实施例中的管理控制器作为第一管理控制器设置在第一容错节点上,所述第一容错节点与设置了第二管理控制器的第二容错节点组成冗余组,所述第一管理控制器包括第一微处理器模块和第一接口扩展模块,所述第二管理控制器包括第二微处理器模块和第二接口扩展模块,所述第一接口扩展模块通过总线与第二接口扩展模块连接。
参见图8,为本发明管理控制器的第一实施例框图:
其中,该管理控制器作为第一管理控制器,包括第一接口扩展模块810和第一微处理器模块820。
其中,所述第一接口扩展模块810,用于当所述第二管理控制器发生故障时,通过所述总线接管所述第二接口扩展模块;
所述第一微处理器模块820,用于对所述第二管理控制器的所有功能模块进行管理。
参见图9,为本发明管理控制器的第二实施例框图:
其中,该管理控制器作为第一管理控制器,包括第一接口扩展模块910和第一微处理器模块920。
其中,所述第一接口扩展模块910,用于当所述第二管理控制器发生故障时,通过所述总线接管所述第二接口扩展模块;
所述第一微处理器模块920,用于对所述第二管理控制器的所有功能模块进行管理。
具体的,第一接口扩展模块910包括:接收单元911、使能单元912和映射单元913。其中,接收单元911,用于接收所述第二接口扩展模块通过切换请求信号线发送的切换请求信号;使能单元912,用于使能所述第二接口扩展模块通过所述总线接入所述第一微处理器模块;映射单元913,用于将所述第二接口扩展模块的地址映射到所述第一微处理器模块;
第一微处理器模块920包括:管理单元921。其中,管理单元921,用于根据所述第二接口扩展模块的地址,通过所述总线对所述第二管理控制器的所有功能模块进行管理。
参见图10,为本发明管理控制器的第三实施例框图:
其中,该管理控制器作为第一管理控制器,包括第一接口扩展模块1010和第一微处理器模块1020。
其中,所述第一接口扩展模块1010,用于当所述第二管理控制器发生故障时,通过所述总线接管所述第二接口扩展模块;
所述第一微处理器模块1020,用于对所述第二管理控制器的所有功能模块进行管理。
具体的,第一接口扩展模块1010包括:断开单元1011,用于当所述第一管理控制器发生故障时,断开所述第一微处理器模块1020与所述第一接口扩展模块1010的连接。
由上述实施例可见,本发明实施例中的冗余控制系统,至少包括两个容错节点,每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器,每个管理控制器包括微处理器模块和与微处理器模块相连的接口扩展模块,每个管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接;当冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器通过总线接管故障管理控制器的接口扩展模块,并对故障管理控制器的所有功能模块进行管理。由于本发明实施例通过接口扩展模块上设置的接口对所有功能模块进行管理,且相互冗余的两个容错节点之间的管理控制器通过总线相连,因此当一个容错节点内的管理控制器故障时,另一个容错节点的管理控制器可以通过总线接管故障管理控制器的所有管理功能,保证了切换前后故障容错节点上实现管理控制功能的完整性。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种冗余控制系统,其特征在于,所述系统至少包括两个容错节点,每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器;每个管理控制器包括微处理器模块和与所述微处理器模块相连的接口扩展模块,每个所述管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接;
所述接口扩展模块上设置的接口包括:用于访问I2C设备与传感器的I2C/SMBUS接口,用于与容错节点的系统接口进行通信的LPC接口,用于实现视频信号采集与压缩的DVI接口,用于向微处理器模块提供对外设控制器进行访问功能的本地总线接口,用于与其它接口扩展模块通过总线相连的远程总线接口;所述接口扩展模块的功能通过FPGA实现,或者通过ASIC芯片实现;
当所述冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器,用于通过所述总线接管所述故障管理控制器的接口扩展模块,并对所述故障管理控制器的所有功能模块进行管理;
所述故障管理控制器的接口扩展模块,用于断开与所述故障管理控制器的微处理器模块的连接。
2.根据权利要求1所述的系统,其特征在于,还包括:每个冗余组内的两个管理控制器的接口扩展模块之间设置切换请求信号线;
所述正常管理控制器的接口扩展模块,用于接收所述故障管理控制器的接口扩展模块通过所述切换请求信号线发送的切换请求信号,并使能所述故障管理控制器的接口扩展模块通过所述总线接入所述正常管理控制器的微处理器模块。
3.根据权利要求1所述的系统,其特征在于,
所述正常管理控制器的接口扩展模块,用于将所述故障管理控制器的接口扩展模块的地址映射到所述正常管理控制器的微处理器模块;
所述正常管理控制器的微处理器模块,用于根据所述故障管理控制器的接口扩展模块的地址,通过所述总线对所述故障管理控制器的所有功能模块进行管理。
4.根据权利要求1至3任意一项所述的系统,其特征在于,所述每个冗余组内的两个管理控制器上的接口扩展模块通过总线连接具体为:每个冗余组内的两个管理控制器上的接口扩展模块通过EMI总线连接。
5.一种冗余控制方法,其特征在于,所述方法应用于至少包括两个容错节点的系统中, 所述系统中每两个容错节点组成一个冗余组,每个容错节点内设置一个管理控制器;每个管理控制器包括微处理器模块和与所述微处理器模块相连的接口扩展模块,每个所述管理控制器所控制的所有功能模块通过所述接口扩展模块上设置的接口接入所述管理控制器,每个冗余组内的两个管理控制器的接口扩展模块通过总线连接;所述接口扩展模块上设置的接口包括:用于访问I2C设备与传感器的I2C/SMBUS接口,用于与容错节点的系统接口进行通信的LPC接口,用于实现视频信号采集与压缩的DVI接口,用于向微处理器模块提供对外设控制器进行访问功能的本地总线接口,用于与其它接口扩展模块通过总线相连的远程总线接口所述接口扩展模块的功能通过FPGA实现,或者通过ASIC芯片实现;
所述方法包括:
所述冗余组内的管理控制模块通过接口扩展模块对各自的功能模块进行管理控制;
当所述冗余组内的一个管理控制器发生故障成为故障管理控制器时,另一个管理控制器作为正常管理控制器,通过所述总线接管故障管理控制器的接口扩展模块,对所述故障管理控制器的所有功能模块进行管理,以及所述故障管理控制器的接口扩展模块断开与所述故障管理控制器的微处理器模块的连接。
6.根据权利要求5所述的方法,其特征在于,所述正常管理控制器通过所述总线接管故障管理控制器的接口扩展模块包括:
所述正常管理控制器的接口扩展模块接收所述故障管理控制器的接口扩展模块通过切换请求信号线发送的切换请求信号;
所述正常管理控制器的接口扩展模块使能所述故障管理控制器的接口扩展模块通过所述总线接入所述正常管理控制器的微处理器模块。
7.根据权利要求5所述的方法,其特征在于,所述正常管理控制器对所述故障管理控制器的所有功能模块进行管理包括:
所述正常管理控制器的接口扩展模块将所述故障管理控制器的接口扩展模块的地址映射到所述正常管理控制器的微处理器模块;
所述正常管理控制器的微处理器模块根据所述故障管理控制器的接口扩展模块的地址,通过所述总线对所述故障管理控制器的所有功能模块进行管理。
8.一种管理控制器,其特征在于,所述管理控制器作为第一管理控制器设置在第一容错节点上,所述第一容错节点与设置了第二管理控制器的第二容错节点组成冗余组,所述第一管理控制器包括第一微处理器模块和第一接口扩展模块,所述第二管理控制器包括第二微处理器模块和第二接口扩展模块,所述第一接口扩展模块通过总线与第二接口扩展模块连接;所述接口扩展模块上设置的接口包括:用于访问I2C设备与传感器的I2C/SMBUS接口,用于 与容错节点的系统接口进行通信的LPC接口,用于实现视频信号采集与压缩的DVI接口,用于向微处理器模块提供对外设控制器进行访问功能的本地总线接口,用于与其它接口扩展模块通过总线相连的远程总线接口;所述接口扩展模块的功能通过FPGA实现,或者通过ASIC芯片实现;
其中,
所述第一接口扩展模块,用于当所述第二管理控制器发生故障时,通过所述总线接管所述第二接口扩展模块;
所述第一微处理器模块,用于对所述第二管理控制器的所有功能模块进行管理;其中,
所述第一接口扩展模块包括:
断开单元,用于当所述第一管理控制器发生故障时,断开所述第一微处理器模块与所述第一接口扩展模块的连接。
9.根据权利要求8所述的管理控制器,其特征在于,所述第一接口扩展模块包括:
接收单元,用于接收所述第二接口扩展模块通过切换请求信号线发送的切换请求信号;
使能单元,用于使能所述第二接口扩展模块通过所述总线接入所述第一微处理器模块;
映射单元,用于将所述第二接口扩展模块的地址映射到所述第一微处理器模块;
所述第一微处理器模块包括:
管理单元,用于根据所述第二接口扩展模块的地址,通过所述总线对所述第二管理控制器的所有功能模块进行管理。
CN201210069773.6A 2012-03-16 2012-03-16 冗余控制系统、方法及管理控制器 Active CN102622279B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210069773.6A CN102622279B (zh) 2012-03-16 2012-03-16 冗余控制系统、方法及管理控制器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210069773.6A CN102622279B (zh) 2012-03-16 2012-03-16 冗余控制系统、方法及管理控制器

Publications (2)

Publication Number Publication Date
CN102622279A CN102622279A (zh) 2012-08-01
CN102622279B true CN102622279B (zh) 2015-08-19

Family

ID=46562206

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210069773.6A Active CN102622279B (zh) 2012-03-16 2012-03-16 冗余控制系统、方法及管理控制器

Country Status (1)

Country Link
CN (1) CN102622279B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014192160A1 (ja) * 2013-05-31 2014-12-04 株式会社東芝 機能制御装置、及び機能追加装置
DE102015105929A1 (de) * 2015-04-17 2016-10-20 Phoenix Contact Gmbh & Co. Kg Automatisierungsgerät zum redundanten Steuern eines Busteilnehmers
CN105159034B (zh) * 2015-09-21 2017-08-25 中国科学院长春光学精密机械与物理研究所 光刻投影物镜容错控制装置
TWI612429B (zh) * 2016-04-12 2018-01-21 緯創資通股份有限公司 伺服器系統及其資料存取方法
US10806057B2 (en) * 2017-08-09 2020-10-13 Quanta Computer Inc. Multi-node system-fan-control switch
CN108279755A (zh) * 2018-01-22 2018-07-13 郑州云海信息技术有限公司 服务器风扇管理方法、装置、系统及计算机可读存储介质
DE102018114405A1 (de) * 2018-06-15 2019-12-19 Liebherr-Components Biberach Gmbh Energiespeichervorrichtung für elektrische Antriebssysteme
CN109723666B (zh) * 2018-11-26 2021-08-03 曙光信息产业股份有限公司 风扇控制装置及方法
CN109766110B (zh) * 2018-12-27 2022-05-31 联想(北京)有限公司 一种控制方法、基板管理控制器及控制系统
CN110247809B (zh) * 2019-07-09 2022-03-25 浙江中控技术股份有限公司 双环网控制系统的通信控制方法
CN112415885B (zh) * 2020-11-30 2022-07-05 北京控制工程研究所 一种适用于多机多总线冗余容错系统的通用总线管理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089451B2 (en) * 1995-05-31 2006-08-08 Hitachi, Ltd. Computer management system
CN101178673A (zh) * 2007-12-14 2008-05-14 中国人民解放军国防科学技术大学 一种并行计算机系统管理控制器的容错备份方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2328057T3 (es) * 2006-05-16 2009-11-06 Saab Ab Sistema de control tolerante a fallos.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089451B2 (en) * 1995-05-31 2006-08-08 Hitachi, Ltd. Computer management system
CN101178673A (zh) * 2007-12-14 2008-05-14 中国人民解放军国防科学技术大学 一种并行计算机系统管理控制器的容错备份方法及系统

Also Published As

Publication number Publication date
CN102622279A (zh) 2012-08-01

Similar Documents

Publication Publication Date Title
CN102622279B (zh) 冗余控制系统、方法及管理控制器
CN102223394B (zh) 用于提供远程直接存储设备访问的方法、服务器
EP2951963B1 (en) Failover in response to failure of a port
CN106776159B (zh) 具有故障转移的快速外围元件互连网络系统与操作方法
CN108153622B (zh) 一种故障处理的方法、装置和设备
CN101710314B (zh) 高速外围部件互连交换控制器及其实现方法
CN104102559B (zh) 一种基于冗余心跳链路和对端重启链路的双控制器存储系统
US20100049926A1 (en) Enhancement of data mirroring to provide parallel processing of overlapping writes
US10114688B2 (en) System and method for peripheral bus device failure management
CN105426275A (zh) 双活集群系统中容灾的方法及装置
CN102402395A (zh) 基于仲裁磁盘的高可用系统不间断运行方法
CN108923992A (zh) 一种nas集群高可用方法、系统及电子设备和存储介质
CN105874442B (zh) 计算机系统和计算机系统中端点设备访问的方法
CN103678031A (zh) 二乘二取二冗余系统及方法
KR101586354B1 (ko) 병렬 연결식 서버시스템의 통신 장애 복구방법
CN104125049A (zh) 一种基于brickland平台的pcie设备冗余实现方法
CN206807466U (zh) 一种基于pcie非透明桥的高可用冗余加密终端
CN104317677A (zh) 一种基于Brickland的冗余监控管理系统及方法
CN113342261A (zh) 伺服器与应用于伺服器的控制方法
CN115550291A (zh) 交换机的复位系统及方法、存储介质、电子设备
US10990481B2 (en) Using alternate recovery actions for initial recovery actions in a computing system
CN109684257B (zh) 一种远程内存扩展管理系统
CN109032901A (zh) 一种远程带外ssd的监控方法、装置及受控终端
WO2021012169A1 (zh) 一种提高存储系统可靠性的方法和相关装置
CN116615719A (zh) 生成用于在数据中心中电隔离故障域的配置的技术

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant