CN104168127A - 可动态切换主节点的服务器系统及动态切换主节点的方法 - Google Patents
可动态切换主节点的服务器系统及动态切换主节点的方法 Download PDFInfo
- Publication number
- CN104168127A CN104168127A CN201310186427.0A CN201310186427A CN104168127A CN 104168127 A CN104168127 A CN 104168127A CN 201310186427 A CN201310186427 A CN 201310186427A CN 104168127 A CN104168127 A CN 104168127A
- Authority
- CN
- China
- Prior art keywords
- node
- host node
- management controller
- baseboard management
- passage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
一种可动态切换主节点的服务器系统,包括多个节点、I2C多路器及内嵌模块,该多个节点中的每一节点均包括BMC,该多个节点中的其中一个节点被设为主节点。I2C多路器通过IPMB通道与各个节点的BMC连接,内嵌模块将I2C多路器与主节点连接的通道设为有效通信通道。该内嵌模块通过IPMB通道与当前主节点的BMC保持通信,并持续获取当前主节点的各项状态信息。该内嵌模块在当前主节点不运行或运行状态异常时,将其他节点中的一个节点设置为新的主节点,并将该I2C多路器的有效通信通道切换至该新的主节点的BMC。本发明还提供一种动态切换主节点的方法,可及时将失效的主节点自动切换至其他节点,维护系统的正常运行。
Description
技术领域
本发明涉及一种网络通讯技术领域,尤其涉及一种可动态切换主节点的服务器系统及动态切换主节点的方法。
背景技术
随着网络技术的迅速发展,服务器在人们生活中扮演的角色越来越重要。单个的服务器已经不能满足人们的需求,组建具有多个服务器的集群系统就显得尤为必要。在构建服务器系统时,影响服务器系统整体运行状态的关键因素主要有电源管理、电源保护及散热管理等三个功能。这三个功能的成功构建可以保证系统的正常运行。然而,在集群环境下,一般都有一个固定的主节点,一旦主节点失效,则整个服务器系统将瘫痪,无法正常运行。
发明内容
有鉴于此,有必要提供一种可动态切换主节点的服务器系统,以解决上述技术问题。
一种可动态切换主节点的服务器系统,该服务器系统包括:
多个节点,该多个节点中的每一节点均包括一基板管理控制器,该多个节点中的其中一个节点被设为主节点;
一I2C多路器通过IPMB通道与各个节点的基板管理控制器连接;及
一内嵌模块与该I2C多路器连接,并将该I2C多路器与主节点连接的IPMB通道设为有效通信通道;
其中,该内嵌模块通过IPMB通道与当前主节点的基板管理控制器保持通信,并持续通过IPMB通道从当前主节点的基板管理控制器获取该当前主节点的各项状态信息;该内嵌模块还在该当前主节点不运行或运行状态异常时,将其他节点中的一个节点设置为新的主节点,并将该I2C多路器与该新的主节点的基板管理控制器连接的IPMB通道设为有效通信通道,并与新的主节点保持通信。
还有必要提供一种动态切换主节点的方法,以解决上述技术问题。
一种动态切换主节点的方法,该服务器系统包括多个节点、一I2C多路器及一内嵌模块,该多个节点中的每一节点均包括一基板管理控制器,该多个节点中的其中一个节点被设为主节点;该I2C多路器通过IPMB通道与各个节点的基板管理控制器连接,该内嵌模块与该I2C多路器连接,并将该I2C多路器与主节点连接的IPMB通道设为有效通信通道;该方法具体包括以下步骤:
该内嵌模块通过IPMB通道与当前主节点的基板管理控制器保持通信,并持续通过IPMB通道从当前主节点的基板管理控制器获取该当前主节点的各项状态信息;
该内嵌模块根据获取的该当前主节点的状态信息判断该当前主节点是否在运行;
若在运行,该内嵌模块继续判断该当前主节点的运行状态是否正常;
若该当前主节点不运行或运行状态异常,则该内嵌模块将其他节点中的一个节点设置为新的主节点,并将该I2C多路器与该新的主节点的基板管理控制器连接的IPMB通道设为有效通信通道,并与新的主节点保持通信。
本发明提供的可动态切换主节点的服务器系统及其动态切换主节点的方法,在当前主节点失效后,可及时将当前主节点自动切换至其他节点,从而保证系统时刻都有一个主节点正常工作,维护系统的正常运行。
附图说明
图1为本发明一实施方式中的服务器系统的架构示意图。
图2为图1中的服务器系统的动态切换主节点的方法流程图。
图3为图1中的服务器系统的电源管理方法流程图。
图4为图1中的服务器系统的电源保护方法流程图。
图5为图1中的服务器系统的散热管理方法流程图。
主要元件符号说明
服务器系统 | 100 |
节点模块 | 10 |
节点 | 11 |
内存模块 | 111 |
处理器 | 112 |
芯片组 | 113 |
基板管理控制器 | 114 |
中板 | 20 |
I2C多路器 | 21 |
IPMB通道 | 211 |
以太网交换机 | 22 |
LAN通道 | 221 |
电源分配基板 | 30 |
电源管理保护模块 | 31 |
电源管理保护芯片 | 311 |
内嵌模块 | 32 |
PMB通道 | 321 |
电源供给模块 | 40 |
电源供给单元 | 41 |
风扇模块 | 50 |
风扇 | 51 |
步骤 | S201~S204、S301~S304、S401~S404、S501~S505 |
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
下面将结合附图,对本发明作进一步的详细说明。
请参阅图1,本发明的服务器系统100包括一节点模块10、一中板20、一电源分配基板(Power Distribution Board,PDB)30、一电源供给模块40以及一风扇模块50。
该节点模块10包括多个节点11,其中,每一节点11均为一服务器主板,在本实施方式中,每一节点11均部署着相同的系统,该每一节点11均包括一内存模块(Dual Inline Memory Modules,DIMMs)111、一处理器112、一芯片组113以及一基板管理控制器(Board Management Controller,BMC)114等。其中,该多个节点11中的其中一个节点,例如图1中的节点一被设为主节点,主要负责与该节点模块10的其他节点11及该服务器系统100的其他功能模块进行通信。
该中板20上设有一I2C多路器21以及一以太网交换机(Ethernet Switch)22,其中,该I2C多路器21通过IPMB (Intelligent Platform Management Bus,智能平台管理总线)通道211与该节点模块10的各个节点11的基板管理控制器114连接。该以太网交换机22通过LAN(Local Area Network,局域网)通道221与各个节点11的基板管理控制器114连接,并与各个节点11的基板管理控制器114构成一本地局域网,负责各个节点11的基板管理控制器114之间的通信。
该电源分配基板30包括一电源管理保护模块31以及一内嵌模块32,其中,该电源管理保护模块31包括多个电源管理保护芯片(Power Management and Protection IC)311,该多个电源管理保护芯片311分别与该节点模块10的相应节点一一连接,用于分别对相应的节点的电源进行管理及保护。该电源供给模块40包括多个电源供给单元(Power Supply Unit,PSU)41,用于为整个系统的运行提供电源支持。该内嵌模块32与该中板20的I2C多路器21连接,并将该I2C多路器21与主节点的基板管理控制器114连接的IPMB通道211设为有效通信通道,该内嵌模块32还通过PMB(Power Management Bus,电源管理总线)通道321与该多个电源管理保护芯片311及多个电源供给单元41分别连接。该风扇模块50包括多个风扇51,用于为系统散热。该内嵌模块32还与该多个风扇51连接。
其中,该服务器系统100的各个模块的功能及相互之间的通信将结合下面的描述进行说明。
图2为本发明的服务器系统的动态切换主节点的方法流程图,该方法具体包括以下步骤:
步骤S201,该内嵌模块32通过IPMB通道与当前主节点11的基板管理控制器114保持通信,并持续通过IPMB通道从当前主节点11的基板管理控制器114获取该当前主节点11的各项状态信息。
步骤S202,该内嵌模块32根据获取的该当前主节点11的状态信息判断该当前主节点11是否在运行,若在运行,则执行步骤S203;否则,则执行步骤S204。
步骤S203,该内嵌模块32继续判断该当前主节点11的运行状态是否正常,若该当前主节点11的运行状态正常,则返回步骤S201,继续与该当前主节点11的基板管理控制器114保持通信;否则,则执行步骤S204。
步骤S204,该内嵌模块32将其他节点中的一个节点设置为新的主节点,并将该I2C多路器21与该新的主节点的基板管理控制器114连接的IPMB通道211设为有效通信通道,并与新的主节点保持通信。
如此,在当前主节点失效后,该内嵌模块32可及时将当前主节点自动切换至其他节点,从而保证系统时刻都有一个主节点正常工作,维护系统的正常运行。
图3为本发明的服务器系统的电源管理方法流程图,该方法具体包括以下步骤:
步骤S301,内嵌模块32持续地从各个电源管理保护芯片311以及各个电源供给单元41中获取系统的电源消耗、各个电源供给单元41的最大输出功率和当前输出功率等系统功耗信息,并通过IPMB通道211将获取到的系统功耗信息发送给主节点11的基板管理控制器114。
步骤S302,各个节点的基板管理控制器114持续地读取相应节点内的内存模块111、处理器112、芯片组113等各个功能模块的功耗信息,主节点11的基板管理控制器114同时通过LAN通道221获取各个节点的基板管理控制器114读取的各个功能模块的功耗信息。
步骤S303,主节点11的基板管理控制器114根据以上获取的系统功耗信息及各个节点的功耗信息来确定该服务器系统100所处的特定状态,并根据该特定状态采取相应的电源管理方案。在本实施方式中,主节点的基板管理控制器114可根据该服务器系统100的系统功耗信息与各个节点的功耗信息之间的关系预先制定多种特定状态下的电源管理方案,主节点11的基板管理控制器114确定该服务器系统100当前的状态所符合的特定状态后,采用该符合的特定状态对应的电源管理方案对该服务器系统100的电源进行管理。
如此,即可根据预先制定的电源管理方案对各种特定状态下的服务器系统100的电源进行有效的管理,使系统始终工作在一个安全可靠的环境中。此外,该节点模块10的多个节点之间通过该以太网交换机22在局域网内进行通信,而主节点与该内嵌模块32之间通过该I2C多路器21以I2C通信协议进行通信,两种通信方式可以同时进行,不会造成相互之间的干扰,从而加快了通信速度,大大提高了电源管理的效率。
图4为本发明的服务器系统的电源保护方法流程图,该方法具体包括以下步骤:
步骤S401,内嵌模块32持续地从各个电源管理保护芯片311、各个电源供给单元41以及各个风扇51等中获取电源数据及其他数据,并通过IPMB通道211将这些数据发送给主节点11的基板管理控制器114,主节点11的基板管理控制器114同时通过LAN通道221持续地获取各个节点的状态信息。
步骤S402,主节点11的基板管理控制器114判断以上获取的各个节点的运行状态、电源数据及其他数据是否均正常。若有异常的运行状态或数据,则执行步骤S403;否则,则返回步骤S401。
步骤S403,主节点11的基板管理控制器114将异常的信息报告给该内嵌模块32。
步骤S404,该内嵌模块32根据异常的信息采取相应的保护方案,例如控制相应的电源管理保护芯片311关闭异常节点的电源或整个系统的电源等,并通过IPMB通道211向主节点11的基板管理控制器114发送一事件日志,以供后续的调试操作作参考,同时,流程返回步骤S401。
如此,本发明的服务器系统通过该内嵌模块32这一主动模块以及该电源管理保护模块31这一被动模块,即可实时监控该服务器系统100的各个节点的电源状态,并为整个系统的电源保护提供更为健全的保护方案,从而保证该服务器系统100不受突发情况下电源供给问题的影响而正常运行。
图5为本发明的服务器系统的散热管理方法流程图,该方法具体包括以下步骤:
步骤S501,各个节点的基板管理控制器114从节点内的内存模块111、处理器112和芯片组113等各个功能模块中获取温度信息,并根据该获取的温度信息计算出该风扇模块50的每一风扇51对应的脉冲宽度调制(PWM)数据。
步骤S502,各个节点的基板管理控制器114通过LAN通道221将该脉冲宽度调制数据发送给主节点11的基板管理控制器114。
步骤S503,主节点11的基板管理控制器114比较接收到的各组脉冲宽度调制数据,并将具有最大值的脉冲宽度调制数据通过IPMB通道发送给该内嵌模块32。
步骤S504,该内嵌模块32接收到主节点11的基板管理控制器114发送的脉冲宽度调制数据后,将该脉冲宽度调制数据发送给各个风扇51,以控制各个风扇51转动。
步骤S505,各个风扇51将各自的转速数据反馈给该内嵌模块32,该内嵌模块32再将各个风扇的转速数据反馈给主节点的基板管理控制器114,以供该主节点的基板管理控制器114监控各个风扇51的运行状态。
如此,即可保持系统的热量平衡,从而保证系统的各个功能模块能正常运行。
本技术领域的普通技术人员应当认识到,以上的实施方式仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围之内,对以上实施方式所作的适当改变和变化都落在本发明要求保护的范围之内。
Claims (8)
1.一种可动态切换主节点的服务器系统,其特征在于,该服务器系统包括:
多个节点,该多个节点中的每一节点均包括一基板管理控制器,该多个节点中的其中一个节点被设为主节点;
一I2C多路器通过IPMB通道与各个节点的基板管理控制器连接;及
一内嵌模块与该I2C多路器连接,并将该I2C多路器与主节点连接的IPMB通道设为有效通信通道;
其中,该内嵌模块通过IPMB通道与当前主节点的基板管理控制器保持通信,并持续通过IPMB通道从当前主节点的基板管理控制器获取该当前主节点的各项状态信息;该内嵌模块还在该当前主节点不运行或运行状态异常时,将其他节点中的一个节点设置为新的主节点,并将该I2C多路器与该新的主节点的基板管理控制器连接的IPMB通道设为有效通信通道,并与新的主节点保持通信。
2.如权利要求1所述的服务器系统,其特征在于,还包括:
一以太网交换机通过LAN通道与各个节点的基板管理控制器连接;
多个电源管理保护芯片分别与多个节点中的相应节点一一连接,用于分别对相应的节点的电源进行管理及保护;
多个电源供给单元,用于为整个系统的运行提供电源支持;及
多个风扇,用于为系统散热;
其中,该内嵌模块与该多个电源管理保护芯片、多个电源供给单元及多个风扇分别连接。
3.如权利要求2所述的服务器系统,其特征在于,该内嵌模块持续地从各个电源管理保护芯片以及各个电源供给单元中获取系统的电源消耗、各个电源供给单元的最大输出功率和当前输出功率等系统功耗信息,并通过IPMB通道将获取到的系统功耗信息发送给主节点的基板管理控制器;
各个节点的基板管理控制器持续地读取相应节点内的各个功能模块的功耗信息,主节点的基板管理控制器同时通过LAN通道获取各个节点的基板管理控制器读取的各个功能模块的功耗信息;
主节点的基板管理控制器根据以上获取的系统功耗信息及各个节点的功耗信息来确定该服务器系统所处的特定状态,并根据该特定状态采取相应的电源管理方案。
4.如权利要求3所述的服务器系统,其特征在于,主节点的基板管理控制器根据该服务器系统的系统功耗信息与各个节点的功耗信息之间的关系预先制定多种特定状态下的电源管理方案,主节点的基板管理控制器确定该服务器系统当前的状态所符合的特定状态后,采用该符合的特定状态对应的电源管理方案对该服务器系统的电源进行管理。
5.如权利要求2所述的服务器系统,其特征在于,该内嵌模块持续地从各个电源管理保护芯片、各个电源供给单元以及各个风扇等中获取电源数据及其他数据,并通过IPMB通道将这些数据发送给主节点的基板管理控制器,主节点的基板管理控制器同时通过LAN通道持续地获取各个节点的状态信息;
主节点的基板管理控制器判断以上获取的各个节点的运行状态、电源数据及其他数据是否均正常;
若有异常的运行状态或数据,则主节点的基板管理控制器将异常的信息报告给该内嵌模块;
该内嵌模块根据异常的信息控制相应的电源管理保护芯片关闭异常节点的电源或整个系统的电源,并通过IPMB通道向主节点的基板管理控制器发送一事件日志。
6.如权利要求2所述的服务器系统,其特征在于,各个节点的基板管理控制器从节点内的各个功能模块中获取温度信息,并根据该获取的温度信息计算出每一风扇对应的脉冲宽度调制数据;
各个节点的基板管理控制器通过LAN通道将该脉冲宽度调制数据发送给主节点的基板管理控制器;
主节点的基板管理控制器比较接收到的各组脉冲宽度调制数据,并将具有最大值的脉冲宽度调制数据通过IPMB通道发送给该内嵌模块;以及
该内嵌模块接收到主节点的基板管理控制器发送的脉冲宽度调制数据后,将该脉冲宽度调制数据发送给各个风扇,以控制各个风扇转动。
7.如权利要求6所述的服务器系统,其特征在于,各个风扇将各自的转速数据反馈给该内嵌模块,该内嵌模块再将各个风扇的转速数据反馈给主节点的基板管理控制器,以供该主节点的基板管理控制器监控各个风扇的运行状态。
8.一种动态切换主节点的方法,其特征在于,该服务器系统包括多个节点、一I2C多路器及一内嵌模块,该多个节点中的每一节点均包括一基板管理控制器,该多个节点中的其中一个节点被设为主节点;该I2C多路器通过IPMB通道与各个节点的基板管理控制器连接,该内嵌模块与该I2C多路器连接,并将该I2C多路器与主节点连接的IPMB通道设为有效通信通道;该方法具体包括以下步骤:
该内嵌模块通过IPMB通道与当前主节点的基板管理控制器保持通信,并持续通过IPMB通道从当前主节点的基板管理控制器获取该当前主节点的各项状态信息;
该内嵌模块根据获取的该当前主节点的状态信息判断该当前主节点是否在运行;
若在运行,该内嵌模块继续判断该当前主节点的运行状态是否正常;
若该当前主节点不运行或运行状态异常,则该内嵌模块将其他节点中的一个节点设置为新的主节点,并将该I2C多路器与该新的主节点的基板管理控制器连接的IPMB通道设为有效通信通道,并与新的主节点保持通信。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310186427.0A CN104168127A (zh) | 2013-05-20 | 2013-05-20 | 可动态切换主节点的服务器系统及动态切换主节点的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310186427.0A CN104168127A (zh) | 2013-05-20 | 2013-05-20 | 可动态切换主节点的服务器系统及动态切换主节点的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104168127A true CN104168127A (zh) | 2014-11-26 |
Family
ID=51911777
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310186427.0A Pending CN104168127A (zh) | 2013-05-20 | 2013-05-20 | 可动态切换主节点的服务器系统及动态切换主节点的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104168127A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104503932A (zh) * | 2015-01-07 | 2015-04-08 | 加弘科技咨询(上海)有限公司 | 多主板服务器主基板管理控制器仲裁方法及系统 |
CN105549696A (zh) * | 2015-12-07 | 2016-05-04 | 中国电子科技集团公司第三十二研究所 | 具有机箱管理功能的机架式服务器系统 |
CN107505991A (zh) * | 2017-08-11 | 2017-12-22 | 郑州云海信息技术有限公司 | 一种灵活配置的多单元服务器系统及配置方法 |
CN107769953A (zh) * | 2016-08-23 | 2018-03-06 | 佛山市顺德区顺达电脑厂有限公司 | 服务器故障检测系统 |
CN109062849A (zh) * | 2018-08-01 | 2018-12-21 | 郑州云海信息技术有限公司 | 两级管理架构服务器的管理模块间的通信建立方法及装置 |
-
2013
- 2013-05-20 CN CN201310186427.0A patent/CN104168127A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104503932A (zh) * | 2015-01-07 | 2015-04-08 | 加弘科技咨询(上海)有限公司 | 多主板服务器主基板管理控制器仲裁方法及系统 |
CN104503932B (zh) * | 2015-01-07 | 2017-11-24 | 加弘科技咨询(上海)有限公司 | 多主板服务器主基板管理控制器仲裁方法及系统 |
CN105549696A (zh) * | 2015-12-07 | 2016-05-04 | 中国电子科技集团公司第三十二研究所 | 具有机箱管理功能的机架式服务器系统 |
CN105549696B (zh) * | 2015-12-07 | 2019-04-26 | 中国电子科技集团公司第三十二研究所 | 具有机箱管理功能的机架式服务器系统 |
CN107769953A (zh) * | 2016-08-23 | 2018-03-06 | 佛山市顺德区顺达电脑厂有限公司 | 服务器故障检测系统 |
CN107505991A (zh) * | 2017-08-11 | 2017-12-22 | 郑州云海信息技术有限公司 | 一种灵活配置的多单元服务器系统及配置方法 |
CN109062849A (zh) * | 2018-08-01 | 2018-12-21 | 郑州云海信息技术有限公司 | 两级管理架构服务器的管理模块间的通信建立方法及装置 |
CN109062849B (zh) * | 2018-08-01 | 2021-07-16 | 郑州云海信息技术有限公司 | 两级管理架构服务器的管理模块间的通信建立方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TW201445936A (zh) | 可動態切換主節點的伺服器系統及動態切換主節點的方法 | |
US9092223B1 (en) | Systems and methods to save power in data-center networks | |
CN102893554B (zh) | 电力共享网络通信设备、方法和系统 | |
CN102510344B (zh) | 机柜服务器系统 | |
CN104168127A (zh) | 可动态切换主节点的服务器系统及动态切换主节点的方法 | |
CN103139248B (zh) | 机架系统 | |
US9128688B2 (en) | Method, apparatus and system for device management | |
CN105721546A (zh) | 一种基于工业物联通讯的多数据集成服务平台 | |
CN103135732A (zh) | 服务器机柜系统 | |
CN109857614A (zh) | 一种机架服务器的容灾装置和方法 | |
CN104281511A (zh) | 智能平台管理接口系统、基板管理控制器及实现方法 | |
CN102164044A (zh) | 联网方法和联网系统 | |
US20150156117A1 (en) | High density server system | |
US11460908B2 (en) | Storage system and method for transmitting signal in storage system | |
CN113645047B (zh) | 一种基于智能网卡的带外管理系统和服务器 | |
US20170308137A1 (en) | System and method for rack over provisioning and intelligent power management | |
CN1937509A (zh) | 一种获取单板框号的方法及系统 | |
CN111324503B (zh) | 机框管理装置、方法和计算机可读存储介质 | |
CN203554493U (zh) | 一种服务器用远程管理接口系统 | |
CN110096114B (zh) | 一种管理多个arm服务器节点的系统和方法 | |
CN103375420A (zh) | 机柜系统及其风扇控制系统及其控制方法 | |
CN105471652A (zh) | 大数据一体机及其冗余管理单元 | |
US11733762B2 (en) | Method to allow for higher usable power capacity in a redundant power configuration | |
CN103138975A (zh) | 多个机架系统的托管方法 | |
CN104008019A (zh) | 一种实现刀片服务器中服务器电源功率自动分配的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20141126 |