CN103885860A - 一种应用ipmi命令实现bmc双管理热冗余的方法 - Google Patents
一种应用ipmi命令实现bmc双管理热冗余的方法 Download PDFInfo
- Publication number
- CN103885860A CN103885860A CN201410107087.2A CN201410107087A CN103885860A CN 103885860 A CN103885860 A CN 103885860A CN 201410107087 A CN201410107087 A CN 201410107087A CN 103885860 A CN103885860 A CN 103885860A
- Authority
- CN
- China
- Prior art keywords
- bmc
- order
- ipmi
- double
- management control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Hardware Redundancy (AREA)
Abstract
本发明提供一种应用IPMI命令实现BMC双管理热冗余的方法,其具体操作步骤为:在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令。该一种应用IPMI命令实现BMC双管理热冗余的方法和现有技术相比,用I2C传输IPMI命令来完成心跳,实现BMC双管理热冗余,可靠性高,易于实现,实用性强,易于推广。
Description
技术领域
本发明涉及计算机服务器技术领域,具体的说是一种应用IPMI命令实现BMC双管理热冗余的方法。
背景技术
刀片服务器机箱中一般包括刀片服务器、管理控制板、交换机、存储等板卡。其中管理控制板的功能包括监控各板卡的健康信息、开关机复位控制、媒体重定向、报警等。管理控制板是整个机箱的核心,为了提供高可靠性,管理控制板往往设计成双管理热冗余。
目前多数厂商是用串口和GPIO来实现双管理热冗余。占用BMC芯片的一组串口来实现有些浪费,而使用GPIO又没有那么高的可靠性,电平状态可能在BMC芯片失效之后出现不可预知的异常。而I2C总线非常可靠,并且BMC芯片往往提供了比串口多很多的I2C。心跳命令使用标准的IPMI协议来传输,更加规范可靠、容易实现。基于此,现提供一种有着高可靠性、易实现、新的双管理热冗余的实现方法。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种应用IPMI命令实现BMC双管理热冗余的方法。
本发明的技术方案是按以下方式实现的,该一种应用IPMI命令实现BMC双管理热冗余的方法,其具体操作步骤为:
一、在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;
二、两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;
三、两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令。
所述步骤三的详细过程为:当刀片服务器开机时,底层程序先判断BMC芯片是活动的主管理控制板还是待机的从管理控制板,如果是主管理控制板,就发送IPMI命令,从管理控制板接收该命令,知道主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机;当从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,当又收到主BMC的命令后让出管理权,状态从活动转为待机。
本发明与现有技术相比所产生的有益效果是:
本发明的一种应用IPMI命令实现BMC双管理热冗余的方法,用I2C传输IPMI命令来完成心跳,实现BMC双管理热冗余,可靠性高,易于实现,实用性强,易于推广。
附图说明
附图1是本发明的实现流程图。
附图2是本发明的实施例示意图。
附图3是本发明的IPMI命令格式示意图。
具体实施方式
下面结合附图对本发明的一种应用IPMI命令实现BMC双管理热冗余的方法作以下详细说明。
如附图1所示,该一种应用IPMI命令实现BMC双管理热冗余的方法,其具体操作步骤为:
一、在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;
二、两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;
三、两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令,该命令格式如附图3所示。
所述步骤三的详细过程为:当刀片服务器开机时,底层程序先判断BMC芯片是活动的主管理控制板还是待机的从管理控制板,如果是主管理控制板,就发送IPMI命令,从管理控制板接收该命令,知道主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机;当从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,当又收到主BMC的命令后让出管理权,状态从活动转为待机。
如附图2所示的一种实施例,在该实施例中,提供一刀片服务器机箱,内含4刀服务器、双管理、双交换机、双电源、双存储。双管理应用本发明实现热冗余。管理板开机时,处于主管理的BMC,底层程序判断BMC是主的,将其置于活动状态,通过IPMB发送IPMI命令;处于从管理的BMC,底层程序判断BMC是从的,将其置于待机状态,接收IPMI命令。当从BMC能接收到IPMI命令的时候,其判断出主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机。当主BMC失效时,从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,并且报警。当主BMC故障排除,又正常启动后,从BMC又能收到主BMC的命令了,从BMC让出管理权,状态从活动转为待机,主BMC重新管理整机。
除说明书所述技术特征外,均为本专业技术人员的公知技术。
Claims (2)
1.一种应用IPMI命令实现BMC双管理热冗余的方法,其特征在于:其具体操作步骤为:
一、在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;
二、两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;
三、两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令。
2.根据权利要求1所述的应用IPMI命令实现BMC双管理热冗余的方法,其特征在于:所述步骤三的详细过程为:当刀片服务器开机时,底层程序先判断BMC芯片是活动的主管理控制板还是待机的从管理控制板,如果是主管理控制板,就发送IPMI命令,从管理控制板接收该命令,知道主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机;当从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,当又收到主BMC的命令后让出管理权,状态从活动转为待机。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410107087.2A CN103885860A (zh) | 2014-03-21 | 2014-03-21 | 一种应用ipmi命令实现bmc双管理热冗余的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410107087.2A CN103885860A (zh) | 2014-03-21 | 2014-03-21 | 一种应用ipmi命令实现bmc双管理热冗余的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103885860A true CN103885860A (zh) | 2014-06-25 |
Family
ID=50954768
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410107087.2A Pending CN103885860A (zh) | 2014-03-21 | 2014-03-21 | 一种应用ipmi命令实现bmc双管理热冗余的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103885860A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104104725A (zh) * | 2014-07-23 | 2014-10-15 | 浪潮集团有限公司 | 一种应用于云计算的分层异构结构的服务器管理系统 |
CN104317677A (zh) * | 2014-09-29 | 2015-01-28 | 浪潮电子信息产业股份有限公司 | 一种基于Brickland的冗余监控管理系统及方法 |
CN105718231A (zh) * | 2016-01-19 | 2016-06-29 | 山东超越数控电子有限公司 | 一种刀片式服务器kvm冗余管理系统及管理方法 |
CN105912438A (zh) * | 2016-03-07 | 2016-08-31 | 联想(北京)有限公司 | 基板控制系统、电子设备及信息处理方法 |
CN108038019A (zh) * | 2017-12-25 | 2018-05-15 | 曙光信息产业(北京)有限公司 | 一种基板管理控制器的故障自动恢复方法及系统 |
CN108628412A (zh) * | 2017-11-30 | 2018-10-09 | 英业达科技有限公司 | 刀锋服务器 |
CN109032978A (zh) * | 2018-05-31 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种基于bmc的文件传输方法、装置、设备及介质 |
CN109254882A (zh) * | 2018-09-28 | 2019-01-22 | 山东超越数控电子股份有限公司 | 一种刀片服务器分布式smc管理的实现方法 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1723425A (zh) * | 2002-10-09 | 2006-01-18 | 英特尔公司 | 在服务器管理协处理器子系统内封装tcpa可信平台模块功能 |
US20060106968A1 (en) * | 2004-11-15 | 2006-05-18 | Wooi Teoh Gary C | Intelligent platform management bus switch system |
CN101132314A (zh) * | 2007-09-21 | 2008-02-27 | 中兴通讯股份有限公司 | 实现冗余备份的方法 |
CN101212345A (zh) * | 2006-12-31 | 2008-07-02 | 联想(北京)有限公司 | 一种刀片服务器管理系统 |
CN202004776U (zh) * | 2011-01-07 | 2011-10-05 | 北京捷世伟业电子科技有限公司 | 冗余热切换系统 |
CN102664873A (zh) * | 2012-03-28 | 2012-09-12 | 山东超越数控电子有限公司 | 一种带bmc的国产龙芯cpu服务器的kvm-over-ip实现方法 |
CN103473152A (zh) * | 2013-09-25 | 2013-12-25 | 浪潮电子信息产业股份有限公司 | 一种刀片服务器主备管理模块备份及更新方法 |
-
2014
- 2014-03-21 CN CN201410107087.2A patent/CN103885860A/zh active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1723425A (zh) * | 2002-10-09 | 2006-01-18 | 英特尔公司 | 在服务器管理协处理器子系统内封装tcpa可信平台模块功能 |
US20060106968A1 (en) * | 2004-11-15 | 2006-05-18 | Wooi Teoh Gary C | Intelligent platform management bus switch system |
CN1819525A (zh) * | 2004-11-15 | 2006-08-16 | 英特尔公司 | 智能平台管理总线交换系统 |
CN101212345A (zh) * | 2006-12-31 | 2008-07-02 | 联想(北京)有限公司 | 一种刀片服务器管理系统 |
CN101132314A (zh) * | 2007-09-21 | 2008-02-27 | 中兴通讯股份有限公司 | 实现冗余备份的方法 |
CN202004776U (zh) * | 2011-01-07 | 2011-10-05 | 北京捷世伟业电子科技有限公司 | 冗余热切换系统 |
CN102664873A (zh) * | 2012-03-28 | 2012-09-12 | 山东超越数控电子有限公司 | 一种带bmc的国产龙芯cpu服务器的kvm-over-ip实现方法 |
CN103473152A (zh) * | 2013-09-25 | 2013-12-25 | 浪潮电子信息产业股份有限公司 | 一种刀片服务器主备管理模块备份及更新方法 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104104725A (zh) * | 2014-07-23 | 2014-10-15 | 浪潮集团有限公司 | 一种应用于云计算的分层异构结构的服务器管理系统 |
CN104317677A (zh) * | 2014-09-29 | 2015-01-28 | 浪潮电子信息产业股份有限公司 | 一种基于Brickland的冗余监控管理系统及方法 |
CN105718231A (zh) * | 2016-01-19 | 2016-06-29 | 山东超越数控电子有限公司 | 一种刀片式服务器kvm冗余管理系统及管理方法 |
CN105912438A (zh) * | 2016-03-07 | 2016-08-31 | 联想(北京)有限公司 | 基板控制系统、电子设备及信息处理方法 |
CN105912438B (zh) * | 2016-03-07 | 2019-04-26 | 联想(北京)有限公司 | 基板控制系统、电子设备及信息处理方法 |
CN108628412A (zh) * | 2017-11-30 | 2018-10-09 | 英业达科技有限公司 | 刀锋服务器 |
CN108038019A (zh) * | 2017-12-25 | 2018-05-15 | 曙光信息产业(北京)有限公司 | 一种基板管理控制器的故障自动恢复方法及系统 |
CN108038019B (zh) * | 2017-12-25 | 2021-06-11 | 曙光信息产业(北京)有限公司 | 一种基板管理控制器的故障自动恢复方法及系统 |
CN109032978A (zh) * | 2018-05-31 | 2018-12-18 | 郑州云海信息技术有限公司 | 一种基于bmc的文件传输方法、装置、设备及介质 |
US11314670B2 (en) | 2018-05-31 | 2022-04-26 | Zhengzhou Yunhai Information Technology Co., Ltd. | Method, apparatus, and device for transmitting file based on BMC, and medium |
CN109254882A (zh) * | 2018-09-28 | 2019-01-22 | 山东超越数控电子股份有限公司 | 一种刀片服务器分布式smc管理的实现方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103885860A (zh) | 一种应用ipmi命令实现bmc双管理热冗余的方法 | |
CN101132314B (zh) | 实现冗余备份的方法 | |
CN106850286B (zh) | 单板上的基板管理控制器及网元管理盘的基板管理控制器 | |
CN103473152B (zh) | 一种刀片服务器主备管理模块备份及更新方法 | |
CN104731670B (zh) | 一种面向卫星的轮换式星载计算机容错系统 | |
CN103067206A (zh) | 物联网跨机房分布式全自动热备用服务器切换系统 | |
CN102541697A (zh) | 一种双余度计算机故障处理的切换方法 | |
CN104035831A (zh) | 一种高端容错计算机管理系统及方法 | |
CN106254097A (zh) | 一种基于第三方判定的ats系统双机仲裁系统及方法 | |
CN105577430A (zh) | 一种高端容错服务器的节点管理方法 | |
TWI608337B (zh) | 在機架式系統內進行電源管理之方法 | |
CN102843259A (zh) | 集群内中间件自管理热备方法及系统 | |
CN103019870A (zh) | 一种处理复位信号的方法及通信设备 | |
CN104618501A (zh) | 一种服务器集群系统的无线智能监控管理装置 | |
WO2016165157A1 (zh) | 家庭服务系统的故障处理方法及家电设备、服务器 | |
CN104503947B (zh) | 多路服务器及其信号处理方法 | |
WO2020088351A1 (zh) | 设备信息发送的方法、计算机设备和分布式计算机设备系统 | |
CN104104725A (zh) | 一种应用于云计算的分层异构结构的服务器管理系统 | |
CN102646065B (zh) | 具有保护功能的设备上电检测方法及装置 | |
CN207869116U (zh) | 一种主备设备的切换控制系统 | |
CN201576280U (zh) | 智能平台管理接口 | |
CN103500140A (zh) | 一种快速获知分布式集群节点失效的方法 | |
CN107948018A (zh) | 一种能够检测市电停电并实现服务器软关机的方法和系统 | |
CN102835072B (zh) | 用于运行总线控制设备的方法以及总线控制设备 | |
CN116483613A (zh) | 故障内存条的处理方法及装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140625 |
|
WD01 | Invention patent application deemed withdrawn after publication |