CN103885860A - 一种应用ipmi命令实现bmc双管理热冗余的方法 - Google Patents

一种应用ipmi命令实现bmc双管理热冗余的方法 Download PDF

Info

Publication number
CN103885860A
CN103885860A CN201410107087.2A CN201410107087A CN103885860A CN 103885860 A CN103885860 A CN 103885860A CN 201410107087 A CN201410107087 A CN 201410107087A CN 103885860 A CN103885860 A CN 103885860A
Authority
CN
China
Prior art keywords
bmc
order
ipmi
double
management control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410107087.2A
Other languages
English (en)
Inventor
赵萌
刘强
金长新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Group Co Ltd
Original Assignee
Inspur Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Group Co Ltd filed Critical Inspur Group Co Ltd
Priority to CN201410107087.2A priority Critical patent/CN103885860A/zh
Publication of CN103885860A publication Critical patent/CN103885860A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)

Abstract

本发明提供一种应用IPMI命令实现BMC双管理热冗余的方法,其具体操作步骤为:在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令。该一种应用IPMI命令实现BMC双管理热冗余的方法和现有技术相比,用I2C传输IPMI命令来完成心跳,实现BMC双管理热冗余,可靠性高,易于实现,实用性强,易于推广。

Description

一种应用IPMI命令实现BMC双管理热冗余的方法
技术领域
本发明涉及计算机服务器技术领域,具体的说是一种应用IPMI命令实现BMC双管理热冗余的方法。
背景技术
刀片服务器机箱中一般包括刀片服务器、管理控制板、交换机、存储等板卡。其中管理控制板的功能包括监控各板卡的健康信息、开关机复位控制、媒体重定向、报警等。管理控制板是整个机箱的核心,为了提供高可靠性,管理控制板往往设计成双管理热冗余。
目前多数厂商是用串口和GPIO来实现双管理热冗余。占用BMC芯片的一组串口来实现有些浪费,而使用GPIO又没有那么高的可靠性,电平状态可能在BMC芯片失效之后出现不可预知的异常。而I2C总线非常可靠,并且BMC芯片往往提供了比串口多很多的I2C。心跳命令使用标准的IPMI协议来传输,更加规范可靠、容易实现。基于此,现提供一种有着高可靠性、易实现、新的双管理热冗余的实现方法。
发明内容
本发明的技术任务是解决现有技术的不足,提供一种应用IPMI命令实现BMC双管理热冗余的方法。
本发明的技术方案是按以下方式实现的,该一种应用IPMI命令实现BMC双管理热冗余的方法,其具体操作步骤为:
一、在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;
二、两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;
三、两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令。
所述步骤三的详细过程为:当刀片服务器开机时,底层程序先判断BMC芯片是活动的主管理控制板还是待机的从管理控制板,如果是主管理控制板,就发送IPMI命令,从管理控制板接收该命令,知道主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机;当从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,当又收到主BMC的命令后让出管理权,状态从活动转为待机。
本发明与现有技术相比所产生的有益效果是:
本发明的一种应用IPMI命令实现BMC双管理热冗余的方法,用I2C传输IPMI命令来完成心跳,实现BMC双管理热冗余,可靠性高,易于实现,实用性强,易于推广。
附图说明
附图1是本发明的实现流程图。
附图2是本发明的实施例示意图。
附图3是本发明的IPMI命令格式示意图。
具体实施方式
下面结合附图对本发明的一种应用IPMI命令实现BMC双管理热冗余的方法作以下详细说明。
如附图1所示,该一种应用IPMI命令实现BMC双管理热冗余的方法,其具体操作步骤为:
一、在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;
二、两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;
三、两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令,该命令格式如附图3所示。
所述步骤三的详细过程为:当刀片服务器开机时,底层程序先判断BMC芯片是活动的主管理控制板还是待机的从管理控制板,如果是主管理控制板,就发送IPMI命令,从管理控制板接收该命令,知道主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机;当从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,当又收到主BMC的命令后让出管理权,状态从活动转为待机。
如附图2所示的一种实施例,在该实施例中,提供一刀片服务器机箱,内含4刀服务器、双管理、双交换机、双电源、双存储。双管理应用本发明实现热冗余。管理板开机时,处于主管理的BMC,底层程序判断BMC是主的,将其置于活动状态,通过IPMB发送IPMI命令;处于从管理的BMC,底层程序判断BMC是从的,将其置于待机状态,接收IPMI命令。当从BMC能接收到IPMI命令的时候,其判断出主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机。当主BMC失效时,从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,并且报警。当主BMC故障排除,又正常启动后,从BMC又能收到主BMC的命令了,从BMC让出管理权,状态从活动转为待机,主BMC重新管理整机。
除说明书所述技术特征外,均为本专业技术人员的公知技术。

Claims (2)

1.一种应用IPMI命令实现BMC双管理热冗余的方法,其特征在于:其具体操作步骤为:
一、在刀片服务器机箱内设置两个管理控制板,每个管理控制板上均设置一个BMC芯片;
二、两个BMC芯片之间接入I2C总线,使双管理板的I2C可以相互通信;
三、两BMC芯片之间通过相互传送IPMI命令实现心跳,该IPMI命令选用OEM自定义命令。
2.根据权利要求1所述的应用IPMI命令实现BMC双管理热冗余的方法,其特征在于:所述步骤三的详细过程为:当刀片服务器开机时,底层程序先判断BMC芯片是活动的主管理控制板还是待机的从管理控制板,如果是主管理控制板,就发送IPMI命令,从管理控制板接收该命令,知道主BMC存在并且活动,然后回复响应,主BMC收到响应就知道从BMC存在并且在待机;当从BMC一段时间都没有接收到主BMC发送的命令,从BMC就认为主BMC失效,于是从BMC状态从待机转为活动,接手整机的管理工作,并且一直处于可以收取IPMI命令的状态,当又收到主BMC的命令后让出管理权,状态从活动转为待机。
CN201410107087.2A 2014-03-21 2014-03-21 一种应用ipmi命令实现bmc双管理热冗余的方法 Pending CN103885860A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410107087.2A CN103885860A (zh) 2014-03-21 2014-03-21 一种应用ipmi命令实现bmc双管理热冗余的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410107087.2A CN103885860A (zh) 2014-03-21 2014-03-21 一种应用ipmi命令实现bmc双管理热冗余的方法

Publications (1)

Publication Number Publication Date
CN103885860A true CN103885860A (zh) 2014-06-25

Family

ID=50954768

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410107087.2A Pending CN103885860A (zh) 2014-03-21 2014-03-21 一种应用ipmi命令实现bmc双管理热冗余的方法

Country Status (1)

Country Link
CN (1) CN103885860A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104104725A (zh) * 2014-07-23 2014-10-15 浪潮集团有限公司 一种应用于云计算的分层异构结构的服务器管理系统
CN104317677A (zh) * 2014-09-29 2015-01-28 浪潮电子信息产业股份有限公司 一种基于Brickland的冗余监控管理系统及方法
CN105718231A (zh) * 2016-01-19 2016-06-29 山东超越数控电子有限公司 一种刀片式服务器kvm冗余管理系统及管理方法
CN105912438A (zh) * 2016-03-07 2016-08-31 联想(北京)有限公司 基板控制系统、电子设备及信息处理方法
CN108038019A (zh) * 2017-12-25 2018-05-15 曙光信息产业(北京)有限公司 一种基板管理控制器的故障自动恢复方法及系统
CN108628412A (zh) * 2017-11-30 2018-10-09 英业达科技有限公司 刀锋服务器
CN109032978A (zh) * 2018-05-31 2018-12-18 郑州云海信息技术有限公司 一种基于bmc的文件传输方法、装置、设备及介质
CN109254882A (zh) * 2018-09-28 2019-01-22 山东超越数控电子股份有限公司 一种刀片服务器分布式smc管理的实现方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1723425A (zh) * 2002-10-09 2006-01-18 英特尔公司 在服务器管理协处理器子系统内封装tcpa可信平台模块功能
US20060106968A1 (en) * 2004-11-15 2006-05-18 Wooi Teoh Gary C Intelligent platform management bus switch system
CN101132314A (zh) * 2007-09-21 2008-02-27 中兴通讯股份有限公司 实现冗余备份的方法
CN101212345A (zh) * 2006-12-31 2008-07-02 联想(北京)有限公司 一种刀片服务器管理系统
CN202004776U (zh) * 2011-01-07 2011-10-05 北京捷世伟业电子科技有限公司 冗余热切换系统
CN102664873A (zh) * 2012-03-28 2012-09-12 山东超越数控电子有限公司 一种带bmc的国产龙芯cpu服务器的kvm-over-ip实现方法
CN103473152A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种刀片服务器主备管理模块备份及更新方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1723425A (zh) * 2002-10-09 2006-01-18 英特尔公司 在服务器管理协处理器子系统内封装tcpa可信平台模块功能
US20060106968A1 (en) * 2004-11-15 2006-05-18 Wooi Teoh Gary C Intelligent platform management bus switch system
CN1819525A (zh) * 2004-11-15 2006-08-16 英特尔公司 智能平台管理总线交换系统
CN101212345A (zh) * 2006-12-31 2008-07-02 联想(北京)有限公司 一种刀片服务器管理系统
CN101132314A (zh) * 2007-09-21 2008-02-27 中兴通讯股份有限公司 实现冗余备份的方法
CN202004776U (zh) * 2011-01-07 2011-10-05 北京捷世伟业电子科技有限公司 冗余热切换系统
CN102664873A (zh) * 2012-03-28 2012-09-12 山东超越数控电子有限公司 一种带bmc的国产龙芯cpu服务器的kvm-over-ip实现方法
CN103473152A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种刀片服务器主备管理模块备份及更新方法

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104104725A (zh) * 2014-07-23 2014-10-15 浪潮集团有限公司 一种应用于云计算的分层异构结构的服务器管理系统
CN104317677A (zh) * 2014-09-29 2015-01-28 浪潮电子信息产业股份有限公司 一种基于Brickland的冗余监控管理系统及方法
CN105718231A (zh) * 2016-01-19 2016-06-29 山东超越数控电子有限公司 一种刀片式服务器kvm冗余管理系统及管理方法
CN105912438A (zh) * 2016-03-07 2016-08-31 联想(北京)有限公司 基板控制系统、电子设备及信息处理方法
CN105912438B (zh) * 2016-03-07 2019-04-26 联想(北京)有限公司 基板控制系统、电子设备及信息处理方法
CN108628412A (zh) * 2017-11-30 2018-10-09 英业达科技有限公司 刀锋服务器
CN108038019A (zh) * 2017-12-25 2018-05-15 曙光信息产业(北京)有限公司 一种基板管理控制器的故障自动恢复方法及系统
CN108038019B (zh) * 2017-12-25 2021-06-11 曙光信息产业(北京)有限公司 一种基板管理控制器的故障自动恢复方法及系统
CN109032978A (zh) * 2018-05-31 2018-12-18 郑州云海信息技术有限公司 一种基于bmc的文件传输方法、装置、设备及介质
US11314670B2 (en) 2018-05-31 2022-04-26 Zhengzhou Yunhai Information Technology Co., Ltd. Method, apparatus, and device for transmitting file based on BMC, and medium
CN109254882A (zh) * 2018-09-28 2019-01-22 山东超越数控电子股份有限公司 一种刀片服务器分布式smc管理的实现方法

Similar Documents

Publication Publication Date Title
CN103885860A (zh) 一种应用ipmi命令实现bmc双管理热冗余的方法
CN101132314B (zh) 实现冗余备份的方法
CN106850286B (zh) 单板上的基板管理控制器及网元管理盘的基板管理控制器
CN103473152B (zh) 一种刀片服务器主备管理模块备份及更新方法
CN104731670B (zh) 一种面向卫星的轮换式星载计算机容错系统
CN103067206A (zh) 物联网跨机房分布式全自动热备用服务器切换系统
CN102541697A (zh) 一种双余度计算机故障处理的切换方法
CN104035831A (zh) 一种高端容错计算机管理系统及方法
CN106254097A (zh) 一种基于第三方判定的ats系统双机仲裁系统及方法
CN105577430A (zh) 一种高端容错服务器的节点管理方法
TWI608337B (zh) 在機架式系統內進行電源管理之方法
CN102843259A (zh) 集群内中间件自管理热备方法及系统
CN103019870A (zh) 一种处理复位信号的方法及通信设备
CN104618501A (zh) 一种服务器集群系统的无线智能监控管理装置
WO2016165157A1 (zh) 家庭服务系统的故障处理方法及家电设备、服务器
CN104503947B (zh) 多路服务器及其信号处理方法
WO2020088351A1 (zh) 设备信息发送的方法、计算机设备和分布式计算机设备系统
CN104104725A (zh) 一种应用于云计算的分层异构结构的服务器管理系统
CN102646065B (zh) 具有保护功能的设备上电检测方法及装置
CN207869116U (zh) 一种主备设备的切换控制系统
CN201576280U (zh) 智能平台管理接口
CN103500140A (zh) 一种快速获知分布式集群节点失效的方法
CN107948018A (zh) 一种能够检测市电停电并实现服务器软关机的方法和系统
CN102835072B (zh) 用于运行总线控制设备的方法以及总线控制设备
CN116483613A (zh) 故障内存条的处理方法及装置、电子设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140625

WD01 Invention patent application deemed withdrawn after publication