CN102467434A - 利用基板管理控制器取得储存装置状态信号的方法 - Google Patents

利用基板管理控制器取得储存装置状态信号的方法 Download PDF

Info

Publication number
CN102467434A
CN102467434A CN2010105413727A CN201010541372A CN102467434A CN 102467434 A CN102467434 A CN 102467434A CN 2010105413727 A CN2010105413727 A CN 2010105413727A CN 201010541372 A CN201010541372 A CN 201010541372A CN 102467434 A CN102467434 A CN 102467434A
Authority
CN
China
Prior art keywords
storage device
baseboard management
management controller
electric signal
bmc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010105413727A
Other languages
English (en)
Inventor
陈志伟
卢晓芬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inventec Corp
Original Assignee
Inventec Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inventec Corp filed Critical Inventec Corp
Priority to CN2010105413727A priority Critical patent/CN102467434A/zh
Publication of CN102467434A publication Critical patent/CN102467434A/zh
Pending legal-status Critical Current

Links

Images

Abstract

利用基板管理控制器取得储存装置状态信号的方法,适用于具有基板管理控制器BMC以及储存装置的服务器。利用BMC取得储存装置状态信号的方法包括:利用输入输出扩展器接收对应于储存装置的储存装置控制器产生的电信号;以及产生系统管理中断,以触发基本输入输出系统的SMI处理程序。其中SMI处理程序包括:读取电信号;以及依据电信号,发送错误事件给BMC。

Description

利用基板管理控制器取得储存装置状态信号的方法
技术领域
本发明涉及一种取得储存装置状态信号的方法,特别涉及一种利用基板管理控制器(Baseboard Management Controller,BMC)取得储存装置状态信号的方法。
背景技术
随着计算机的普及与网络技术的快速发展,仅由普通计算机或设备所能提供的服务以不敷使用,故发展出了服务器的技术。服务器是为一种善于处理网络技术的计算机平台,其可连结至各种网络系统,并对通过网络系统相连结的计算机提供各种的应用服务。服务器大多具有大容量的储存装置,以提供诸如多媒体播放、网络硬盘或是企业用数据库等服务。由此可知,储存装置是服务器中相当重要的一个组件,一但发生故障就会对服务器乃至提供给客户的服务造成严重的不良影响。
而为了管理服务器,智能型平台管理接口(Intelligent Platform ManagementInterface,IPMI)的技术应运而生。管理者可以通过IPMI以及配置于服务器中的基板管理控制器(Baseboard Management Controller,BMC)监控服务器。但是目前的服务器在储存装置故障后,是通过独立运作的硬件发出代表故障的状态信号再点亮服务器上的灯号,而不会通知管理员。也就是说,现有的状态信号是直接由硬件译码控制。因此造成现有的服务器无法整合并行的故障信号与管理机制,也无法有效率地通知管理员故障事件的问题。
发明内容
为了解决上述问题,本发明所要解决的技术问题在于提供一种利用基板管理控制器(Baseboard Management Controller,BMC)取得储存装置状态信号的方法。利用BMC取得储存装置状态信号的方法适用于具有一BMC以及一储存装置的一服务器。
为了实现上述目的,本发明提供一种利用BMC取得储存装置状态信号的方法,包括:利用一输入输出扩展器(input/output expander,I/O expander)接收对应于储存装置的一储存装置控制器产生的一电信号;以及产生一系统管理中断(system management interrupt,SMI),以触发一基本输入输出系统(basicinput/output system,BIOS)的一SMI处理程序。其中SMI处理程序包括:读取电信号;以及依据电信号,发送一错误事件给BMC。
其中在”利用一输入输出扩展器接收对应于储存装置的一储存装置控制器的一电信号”的步骤中,可以从一复杂可程序逻辑装置(Complex ProgrammableLogic Device,CPLD)接收电信号。此外,可以由输入输出扩展器产生SMI,以触发BIOS的SMI处理程序。上述SMI并可以通过内部整合电路总线(interintegrated circuit bus,I2C bus)触发BIOS的SMI处理程序。
储存装置控制器可以监测储存装置的状态,并通过序列式通用型输入输出(serial general purpose input/output,SGPIO)据以发送电信号给CPLD。
根据一实施范例,利用BMC取得储存装置状态信号的方法还可包括:令CPLD依据电信号点亮对应于储存装置的一发光二极管(light emitting diode,LED)组。其中储存装置可包括多个储存单元,而电信号是对应于这些储存单元。
根据另一实施范例,利用BMC取得储存装置状态信号的方法也包括:令BMC依据电信号执行一储存装置管理程序。其中储存装置管理程序可以包括:通知通过智能平台管理总线(Intelligent Platform Management Bus,IPMB)与BMC相连的一远程管理程序。储存装置管理程序或是可以包括:依据电信号暂停储存装置的至少一储存单元。
综上所述,利用BMC取得储存装置状态信号的方法产生电信号后,点亮对应的LED组并通过SMI以及SMI处理程序告知BMC。因此由硬件控制的故障点灯机制被整合入BMC管理的事件之中,使管理接口得以统一而增进管理效率。
以下结合附图和具体实施例对本发明进行详细描述,但不作为对本发明的限定。
附图说明
图1为一实施范例的服务器的示意图;
图2为一实施范例的利用基板管理控制器取得储存装置状态信号的方法的流程图;
图3为一实施范例的SMI处理程序的流程图;
图4为另一实施范例的利用基板管理控制器取得储存装置状态信号的方法的流程图;
图5为另一实施范例的服务器的示意图。
其中,附图标记
20   服务器
21   基板管理控制器(BMC)
212  侦测器
22   储存装置
222,222a,222b,222c  储存单元
23   中央处理器
232  储存装置控制器
234  基本输入输出系统(BIOS)
236  SMI处理程序
24   硬件编码手段
25   输入输出扩展器
26   发光二极管组(LED组)
262,262a,262b,262c  发光二极管灯号(LED灯号)
30   远程计算器
32   远程管理程序
具体实施方式
以下在实施方式中详细叙述本发明的详细特征以及优点,其内容足以使任何本领域技术人员了解本发明的技术内容并据以实施,且根据本说明书所揭露的内容、权利要求范围及图式,任何本领域技术人员可轻易地理解本发明相关的目的及优点。
本发明是关于一种利用基板管理控制器(Baseboard ManagementController,BMC)取得储存装置状态信号的方法,其适用于具有一基板管理控制器(BMC)以及一储存装置的一服务器。
请参照图1,其为一实施范例的服务器的示意图。服务器20包括BMC 21、储存装置22以及一中央处理器(central processor unit,CPU)23。中央处理器23通过一储存装置控制器232与储存装置22电性相连,并运行一基本输入输出系统(basic input/output system,BIOS)234。其中储存装置控制器232可位于中央处理器23的一南桥(未绘示)之中。储存装置22可以例如是各种大容量的硬盘,或是磁盘阵列(redundant array of inexpensive disk,RAID)系统。服务器20并可通过网络与一远程计算器(remote computer)30相连,而远程计算器30则可通过一远程管理程序32以及BMC 21管理服务器20。
服务器20可支持智能型平台管理接口(Intelligent Platform ManagementInterface,IPMI),并通过上述硬件运行一操作系统。其中服务器20可使用Unix的Linux、FreeBSD或是微软(Microsoft)的Windows(窗口操作系统)Server 2003等操作系统,也可为磁盘操作系统(Disk Operating System,DOS)或是可延伸韧体接口(可扩展固件接口,Extensible Firmware Interface,EFI)的系统。且服务器20也可各种厂牌的各种服务器产品,本发明并不对其限制。
更详细地说,智能型平台管理接口是一种服务器管理平台的标准架构,它包含BMC 21、系统接口(System Interface)、非挥发性储存单元(Non-volatileStorage)、智能平台管理总线(Intelligent Platform Management Bus,IPMB)以及智能型机箱管理总线(Intelligent Chassis Management Bus,ICMB)等5项组件。而其中最重要的就是BMC 21。BMC 21就像是一台独立的计算机,包括自己的处理器以及内存等资源。且BMC 21的运作均使用自己具有的资源,而不会占用服务器20的硬件模块的其它资源。举例而言,远程计算器30可使用惠普(HP)公司的iLO系统、戴尔DELL公司的iDRAC系统,或是英特尔(Intel)公司的ESB2系统。
请配合图1并参照图2,图2为一实施范例的利用BMC取得储存装置状态信号的方法的流程图。首先利用一输入输出扩展器(input/output expander,I/O expander)25接收对应于储存装置22的储存装置控制器232产生的一电信号(步骤S100)。其中输入输出扩展器25可将收到的电信号存于一输入缓存器(未绘示)。
更详细地说,储存装置控制器232随时监测储存装置22的状态;而当储存装置22发生故障时,储存装置控制器232可发送代表故障或异常的一储存装置状态信号给一硬件编码手段24。硬件编码手段24再将储存装置控制器232发出的储存装置状态信号转换成电信号。也就是说,电信号就是表示储存装置22的状态的状态信号。
其中硬件编码手段24可以是一复杂可程序逻辑装置(ComplexProgrammable Logic Device,CPLD)。CPLD中可包含多个可程序逻辑阵列(Programmable Array Logic,PAL),并用来实现各种运算和组合逻辑(combinational logic)。各个PAL间的互接连线也可以进行程序性的规划以及烧录。CPLD运用这种多合一(All-In-One)的整合作法,使其能实现数千个逻辑闸,甚至数十万个逻辑闸才能构成的电路。而在本实施范例中CPLD被程序化以执行硬件编码手段24所需的功能。例如CPLD可接收储存装置控制器232通过序列式通用型输入输出(serial general purpose input/output,SGPIO)发送的电信号,再将其重新编码为电信号。
需注意的是,即使储存装置22没有发生故障,储存装置控制器232仍可持续发出表示正常的储存装置状态信号以表示目前状况正常。CPLD也对应地将表示正常的储存装置状态信号转换为表示正常的电信号,例如全由二进制“0”表示的信号。
接着输入输出扩展器25产生一系统管理中断(system managementinterrupt,SMI),以触发BIOS 234的一SMI处理程序236(步骤S110)。SMI会使得中央处理器23进入称为系统管理模式(System Management mode,SMM)的执行模式。SMM底下包括事先定义好的SMI处理程序236,并在被触发时执行。例如SMM可以用来处理例如内存错误等系统事件;或是在中央处理器23温度过高时强制关机以维护服务器20的安全。
根据一实施范例,当输入输出扩展器25收到不是表示正常的电信号(表示正常的电信号例如是全由二进制“0”表示的信号)时,以软件仿真的方式发出SMI,以触发BIOS 234的SMI处理程序236。
请参照图3,其为一实施范例的SMI处理程序的流程图。SMI处理程序236被执行时先读取电信号(步骤S200)。SMI处理程序236可通过连接中央处理器23的一南桥(未绘示)与输入输出扩展器25的内部整合电路总线(interintegrated circuit bus,I2C bus)读取输入输出扩展器25的输入缓存器的值,以确定有发生储存装置22错误的情形。例如当储存装置22包括多个储存单元时,可以通过电信号得知故障的是哪一个储存单元。
SMI处理程序236并依据电信号,发送一错误事件给BMC 21(步骤S210)。根据一实施范例,SMI处理程序236可将电信号够过一事先定义的格式由IPMI的系统接口通知BMC 21。系统接口例如可以是知识中心支持系统(Knowledge-Centered Support,KCS)或是服务器管理接口(Server ManagementInterface Chip,SMIC)。
请参照图4,其为另一实施范例的利用BMC取得储存装置状态信号的方法的流程图。利用BMC取得储存装置状态信号的方法还可以令CPLD依据电信号点亮对应于储存装置22的一发光二极管(light emitting diode,LED)组26(步骤S120)。
请配合参照图5,其为另一实施范例的服务器的示意图。储存装置22可包括多个储存单元222,例如储存单元222a、储存单元222b以及储存单元222c;而LED组26则可包括与储存单元222数量相同的多个LED灯号262,例如LED灯号262a、LED灯号262b以及LED灯号262c。经重新编码的电信号是对应这些储存单元222,并用以点亮LED灯号262。
此外,错误事件中除了指出储存装置22的故障状况外,并可包括需要由BMC 21执行的工作。当BMC 21接收到的错误事件之后,利用BMC取得储存装置状态信号的方法并可令BMC 21依据电信号执行一储存装置管理程序(步骤S130)。BMC 21可纪录储存装置22发生故障的事件,并依照储存装置管理程序进行后续处置。而储存装置管理程序可以依据电信号暂停储存装置22的至少一个故障的储存单元222,或是通知通过IPMB与BMC 21相连的远程计算器30的远程管理程序32。因此通过步骤S110以及SMI处理程序236,可以使得BMC 21能够轻松地得知储存装置22的故障情况,以及需要进行的处理方法。
需注意的是,对于步骤S120以及步骤S130的执行顺序并没有限制。
以下是为利用BMC取得储存装置状态信号的方法实际运作时的一实施范例。
例如当储存单元222b发生故障时,储存装置控制器232会据以发出储存装置故障信号。CPLD接收到储存装置故障信号后将其转换为电信号。例如可以序列的二进制代码对应表示所有的储存单元222,且以“0”表示正常时,“010”的电信号辨识表示现在只有储存单元222b发生故障。硬件编码手段24接着将电信号传送给输入输出扩展器25,并依据“010的电信号将LED灯号262b点亮为红灯。而没发生故障的储存单元222a以及222b所对应的LED灯号262a以及262b可以不点灯也可以维持点亮绿灯以表示正常状态。
由于输入输出扩展器25收到与代表正常的“000”不同的电信号“010”,其便产生SMI以触发BIOS 234的SMI处理程序236。接着BIOS 234将电信号以及储存装置管理程序作为错误事件发送给BMC 21。而当BMC 21收到错误事件后,便执行储存装置管理程序以经由网络以及通知远程计算器30通知管理人。如此一来,管理人便可实时前往维修或更换故障的储存单元222b。
综上所述,利用BMC取得储存装置状态信号的方法利用硬件编码手段产生电信号后,不但用以点亮对应的LED组,也通过SMI以及SMI处理程序告知BMC。也就是说,原先独立由硬件控制的故障点灯机制被整合入BMC管理的事件之中,使管理接口得以统一。如此一来,可以解决现有技术像多头马车并行般的杂乱的管理方式,而能以更简洁且有效率的方法管理服务器,并有效率地再发生故障事件时通知管理员。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (10)

1.一种利用基板管理控制器取得储存装置状态信号的方法,适用于具有一基板管理控制器BMC以及一储存装置的一服务器,其特征在于,该利用基板管理控制器取得储存装置状态信号的方法包括:
利用一输入输出扩展器接收对应于该储存装置的一储存装置控制器产生的一电信号;以及
产生一系统管理中断SMI,以触发一基本输入输出系统BIOS的一SMI处理程序,该SMI处理程序包括:读取该电信号;以及依据该电信号,发送一错误事件给该BMC。
2.根据权利要求1所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该利用一输入输出扩展器接收对应于该储存装置的一储存装置控制器产生的一电信号的步骤,是从一复杂可程序逻辑装置CPLD接收该电信号。
3.根据权利要求2所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该储存装置控制器监测该储存装置的状态,并通过序列式通用型输入输出据以发送该电信号给该CPLD。
4.根据权利要求2所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,还包括:
令该CPLD依据该电信号点亮对应于该储存装置的一发光二极管组。
5.根据权利要求1所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该输入输出扩展器产生该SMI,以触发该BIOS的该SMI处理程序。
6.根据权利要求1所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该SMI是通过内部整合电路总线触发该BIOS的该SMI处理程序。
7.根据权利要求1所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该错误事件包括:
令该BMC依据该电信号执行一储存装置管理程序。
8.根据权利要求7所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该储存装置管理程序包括:
通知通过智能平台管理总线与该BMC相连的一远程管理程序。
9.根据权利要求7所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该储存装置管理程序包括:
依据该电信号暂停该储存装置的至少一储存单元。
10.根据权利要求1所述的利用基板管理控制器取得储存装置状态信号的方法,其特征在于,该储存装置包括多个储存单元,该电信号对应于该些储存单元。
CN2010105413727A 2010-11-10 2010-11-10 利用基板管理控制器取得储存装置状态信号的方法 Pending CN102467434A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2010105413727A CN102467434A (zh) 2010-11-10 2010-11-10 利用基板管理控制器取得储存装置状态信号的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2010105413727A CN102467434A (zh) 2010-11-10 2010-11-10 利用基板管理控制器取得储存装置状态信号的方法

Publications (1)

Publication Number Publication Date
CN102467434A true CN102467434A (zh) 2012-05-23

Family

ID=46071098

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010105413727A Pending CN102467434A (zh) 2010-11-10 2010-11-10 利用基板管理控制器取得储存装置状态信号的方法

Country Status (1)

Country Link
CN (1) CN102467434A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799506A (zh) * 2012-06-29 2012-11-28 浪潮电子信息产业股份有限公司 一种定位故障内存的方法
CN106155706A (zh) * 2015-03-22 2016-11-23 联想(北京)有限公司 保存电子设备启动信息的系统及方法
CN106484599A (zh) * 2015-08-25 2017-03-08 佛山市顺德区顺达电脑厂有限公司 服务器及电力重置侦测方法
CN106502846A (zh) * 2016-10-14 2017-03-15 合肥联宝信息技术有限公司 一种电脑故障检测方法及装置
WO2018233118A1 (zh) * 2017-06-23 2018-12-27 联想(北京)有限公司 一种通信控制方法及电子设备
CN112988442A (zh) * 2021-03-05 2021-06-18 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797367A (zh) * 2004-12-30 2006-07-05 英业达股份有限公司 使用系统管理中断信号的监控系统及方法
US20070088988A1 (en) * 2005-10-14 2007-04-19 Dell Products L.P. System and method for logging recoverable errors
CN101430589A (zh) * 2007-11-08 2009-05-13 英业达股份有限公司 风扇转速控制装置
CN101795204A (zh) * 2009-02-02 2010-08-04 广达电脑股份有限公司 远距硬件检测系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797367A (zh) * 2004-12-30 2006-07-05 英业达股份有限公司 使用系统管理中断信号的监控系统及方法
US20070088988A1 (en) * 2005-10-14 2007-04-19 Dell Products L.P. System and method for logging recoverable errors
CN101430589A (zh) * 2007-11-08 2009-05-13 英业达股份有限公司 风扇转速控制装置
CN101795204A (zh) * 2009-02-02 2010-08-04 广达电脑股份有限公司 远距硬件检测系统及方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102799506A (zh) * 2012-06-29 2012-11-28 浪潮电子信息产业股份有限公司 一种定位故障内存的方法
CN106155706A (zh) * 2015-03-22 2016-11-23 联想(北京)有限公司 保存电子设备启动信息的系统及方法
CN106155706B (zh) * 2015-03-22 2021-10-22 联想(北京)有限公司 保存电子设备启动信息的系统及方法
CN106484599A (zh) * 2015-08-25 2017-03-08 佛山市顺德区顺达电脑厂有限公司 服务器及电力重置侦测方法
CN106484599B (zh) * 2015-08-25 2019-08-20 佛山市顺德区顺达电脑厂有限公司 判断服务器重置事件是否为电力中断所导致的方法
CN106502846A (zh) * 2016-10-14 2017-03-15 合肥联宝信息技术有限公司 一种电脑故障检测方法及装置
WO2018233118A1 (zh) * 2017-06-23 2018-12-27 联想(北京)有限公司 一种通信控制方法及电子设备
CN112988442A (zh) * 2021-03-05 2021-06-18 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备
CN112988442B (zh) * 2021-03-05 2023-03-24 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备

Similar Documents

Publication Publication Date Title
CN102467425A (zh) 利用基板管理控制器取得储存装置故障信号的方法
CN103873279B (zh) 一种服务器管理方法,及装置
KR101888029B1 (ko) 가상 머신 클러스터 모니터링 방법 및 모니터링 시스템
CN102467434A (zh) 利用基板管理控制器取得储存装置状态信号的方法
US8910172B2 (en) Application resource switchover systems and methods
CN100440157C (zh) 用于将可恢复的错误记入日志的系统和方法
US20120110389A1 (en) Method for obtaining storage device state signal by using bmc
US20140026000A1 (en) Highly available server system based on cloud computing
US20120330918A1 (en) Flexible event data content management for relevant event and alert analysis within a distributed processing system
US10489232B1 (en) Data center diagnostic information
US11157373B2 (en) Prioritized transfer of failure event log data
US20140122930A1 (en) Performing diagnostic tests in a data center
CN104268061A (zh) 一种适用于虚拟机的存储状态监控机制
US7793151B2 (en) Dynamic partitioning of event patterns for determining symptoms
CN112579288A (zh) 一种基于云计算智能安全用数据管理系统
CN103559124A (zh) 故障快速检测方法及装置
CN105183591A (zh) 一种高可用集群的实现方法及系统
US20210224121A1 (en) Virtual machine-initiated workload management
CN103631736A (zh) 设备资源控制方法和装置
CN102467438A (zh) 利用基板管理控制器取得储存装置故障信号的方法
US20240103824A1 (en) Server management apparatus and server management method
US20180285232A1 (en) Management apparatus and management method
TW201220076A (en) A method for obtaining a status signal of a storage device using a Baseboard Management Controller
CN116416085A (zh) 换电站的云管理方法、系统、服务器及存储介质
Zhu et al. High-availability in δ-CORE: A formal derivation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120523