CN106354610B - 伺服器系统及其操作方法 - Google Patents

伺服器系统及其操作方法 Download PDF

Info

Publication number
CN106354610B
CN106354610B CN201510735683.XA CN201510735683A CN106354610B CN 106354610 B CN106354610 B CN 106354610B CN 201510735683 A CN201510735683 A CN 201510735683A CN 106354610 B CN106354610 B CN 106354610B
Authority
CN
China
Prior art keywords
controller
storage device
server
status
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510735683.XA
Other languages
English (en)
Other versions
CN106354610A (zh
Inventor
施青志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Publication of CN106354610A publication Critical patent/CN106354610A/zh
Application granted granted Critical
Publication of CN106354610B publication Critical patent/CN106354610B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/175Controlling the light source by remote control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B15/00Systems controlled by a computer
    • G05B15/02Systems controlled by a computer electric
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B45/00Circuit arrangements for operating light-emitting diodes [LED]
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/10Controlling the light source
    • H05B47/105Controlling the light source in response to determined parameters
    • HELECTRICITY
    • H05ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
    • H05BELECTRIC HEATING; ELECTRIC LIGHT SOURCES NOT OTHERWISE PROVIDED FOR; CIRCUIT ARRANGEMENTS FOR ELECTRIC LIGHT SOURCES, IN GENERAL
    • H05B47/00Circuit arrangements for operating light sources in general, i.e. where the type of light source is not relevant
    • H05B47/20Responsive to malfunctions or to light source life; for protection
    • H05B47/21Responsive to malfunctions or to light source life; for protection of two or more light sources connected in parallel
    • H05B47/22Responsive to malfunctions or to light source life; for protection of two or more light sources connected in parallel with communication between the lamps and a central unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)
  • Warehouses Or Storage Devices (AREA)
  • Electromagnetism (AREA)

Abstract

本发明涉及一种伺服器系统的操作方法和伺服器系统。管理控制器可动态地管理位于伺服器机架系统中的储存装置的状态灯。举例而言,管理装置可决定在伺服器机架中的哪一个储存装置发生问题,并可发送代表特定储存装置出错的频外要求至管理控制器。此一要求包括用以操作相应于故障的储存装置的灯的指令。接着,管理控制器可经由至少一灯控制器或一SAS扩展器,产生用以操作相应于故障的储存装置的状态灯的指令。

Description

伺服器系统及其操作方法
技术领域
本发明涉及一种伺服器中的储存装置的远端管理机制,其被用于纠错。
背景技术
传统上应用于数据中心或他处的伺服器机架(server rack)包括一伺服器,此一伺服器具有一或多个储存装置(例如硬盘)和/或其它元件。随伺服器机架技术的演进,伺服器机架中的伺服器的数量增加。因此,伺服器机架中的储存装置和/或其它元件的数量亦增加。并且,随着伺服器机架中的储存装置的数量增加,在大型数据中心中辨识出哪一储存装置发生错误的操作变得越来越复杂。
在典型操作中,操作者(例如维修技术人员)是以人力辨识位于伺服器机架外,储存装置的启动的状态灯,以辨别储存装置是否故障。然而,如此的程序仅适用于频内控制(in-band control),且只能由伺服器内部的程序触发。亦即,灯的显示状况是相应于来自伺服器操作系统的信号。如此一来,若错误意外地被伺服器所清除,则没有有效的方法再次启动状态灯,而使得技术人员无法辨别出受影响的储存装置。
发明内容
本发明涉及系统及方法,其中一管理控制器是用以动态地管理于伺服器机架(server rack)中的储存装置的状态灯,以协助技术人员或其它人辨识伺服器中故障的储存装置或其它元件。在一些实施例中,管理控制器用以判断哪一个储存装置遭遇问题,并支援来自远端管理装置、用于控制储存装置的远端控制指令。举例而言,远端管理装置可判断在伺服器机架中的哪一个储存装置遭遇问题或故障,并发送一要求至伺服器中的管理控制器,以令相应于该储存装置的状态灯运作。在一些实施例中,此一要求可包括用以辨识故障的储存装置的标识(identifier),以及用以辨识安装于故障的储存装置中的伺服器的标识。此一要求可还包括令相应于故障的储存装置的状态灯运作所需的指令。在接收到此一要求时,管理控制器可转送所述指令至一灯控制器或一SAS扩展器。此一灯控制器或此一SAS扩展器可执行此一指令,以触发相应于故障的储存装置的状态灯的运作,以指示故障或错误。
在以下内容中,一或多个实施例的细节将随着附图及叙述进行说明。其它特征、态样、及潜在的优点可从附图的描述中明显得知。
附图说明
图1为一例示性系统的方块图,用以表示在伺服器机架(server rack)中储存装置的管理;
图2A、2B、2C为例示性系统图式,用以表示在伺服器中的储存装置的状态灯的控制操作;
图3A、3B、3C为多个步骤的流程图,这些步骤是在一例示性程序中对伺服器中的储存装置进行辨识及纠错;
图4为一例示性系统架构的方块图,用以实现在图1-3中的特征及程序;
在不同附图中,相同的符号代表相同的元件。
附图符号说明
100:系统
102:伺服器机架
103:伺服器
106:伺服器
108:伺服器
110:伺服器
112:伺服器
104:管理控制器
107:管理控制器
109:管理控制器
113:管理控制器
117:管理控制器
123:储存装置
125:状态灯
160:网络
170:管理装置
111:灯控制器
119:灯控制器
115:SAS扩展器
121:SAS扩展器
202:管理装置
204:网络
206:伺服器
208:管理控制器
210:SAS扩展器
212:灯控制器
214:储存装置
M0-M7:储存装置
216:状态灯
226:伺服器
236:伺服器
302-304:步骤
312-314:步骤
322-325:步骤
400:架构
402:处理器
404:输入装置
406:显示装置
408:网络接口
410:计算机可读取媒体
412:总线
414:操作系统
416:网络通讯指令
418:图形处理系统
420:应用程序
422:系统控制器
具体实施方式
图1为一例示性系统100的方块图,用以表示在伺服器机架(server rack)中储存装置的管理。如图1所示,系统100包括一伺服器机架102。伺服器机架102可包括伺服器103、106、108、110、112。在本发明内容中,每一伺服器可为任何形态的伺服器,包括应用伺服器、通讯伺服器、储存伺服器、网页伺服器,在此不一一列举。再者,在本发明内容中,图1中的任何伺服器可用任何其它形态的计算装置所取代。
伺服器机架102可用一机箱(chassis)实现,其中该机箱提供一组合物(assembly),该组合物用以令元件装载(mount)至伺服器机架102。在一些情况下,伺服器机架102可包括多个不同的子系统,用以支持多个不同的计算装置的操作。伺服器机架102并可经过适当设计,以便于装载于其内的计算装置及电性子系统进行运作及通风。伺服器机架102的机箱(chassis)可用以机械上及电性上支持伺服器103、106、108、110、112及其内的元件。
每一伺服器103、106、108、110、112可为一受管理的伺服器装置,分别包括一管理控制器104、107、109、113、117。举例而言,每一管理控制器104、107、109、113、117可为基板管理器(baseboard management controller,BMC),用以提供对应伺服器的频外管理(out-of-band management/administration)。如此的基板管理器可独立操作对应伺服器的中央处理器和/或操作系统。
如图1所示,每一伺服器103、106、108、110、112可包括储存装置123,用以储存数据档案或计算机程序指令,其中储存装置123例如可为硬盘或任何其它形态的储存装置。这些伺服器也可包括其它未显示于图1的元件。每一储存装置123也可包括一状态灯125,用以指示每一分别的储存装置123的状态。然而,每一储存装置123也可相应于多于一个的状态灯。再者,储存装置123可被设置,以令状态灯125在不同的状态下进行不同的运作。举例而言,在故障或错误的情况下,每一储存装置123可用以在对应的状态灯125上提供一特定形态的显示行为。亦即,状态灯可在正常操作状态下进行一种方式的操作,并在故障或错误的情况下进行另一种不同方式的操作。在一些实现方式中,状态灯125可改变颜色以指示故障的储存装置。举例而言,绿色的状态灯可代表无需注意的情况,红色的状态灯可代表需要进行处置。在其它实现方式中,状态灯可改变其显示样式或时间,以指示故障的储存装置。举例而言,状态灯可为稳定灯号以代表无需注意的情况,状态灯可闪烁以代表需要进行处置。在其它实现方式中,可组合颜色与样式。举例而言,储存装置的状态灯可闪烁(flash)、眨动(blink)、显示为稳定灯号和/或以不同颜色显示。
在不同实施例中,特定储存装置对应的状态灯的数量或形态可有所变化。举例而言,一硬盘可相应于一活动发光二极管以及一状态发光二极管,其中活动发光二极管是由此一硬盘所控制,以指示此一硬盘是否当前处于使用状态,且一状态发光二极管由此一硬盘或操作系统所控制,以指示此一硬盘当前处于线上、离线或错误状态等。在本发明内容中,在不同的实施例中,可利用此处所描述的方法以单一地或组合式地控制这些状态灯,以提供所需的指示给使用者。然而,这些不同的实施例并不以此为限,且在本发明内容中,储存装置可包括较上述描述为多或少的状态灯。举例而言,在特定的实施例中,一状态灯可专门用以定位或辨识储存装置。如此的状态灯可单独地或组合式地使用,以提供所需的指示予使用者。举例而言,此一状态灯可以第一方式进行显示,以协助使用者辨识一储存装置故障,而其它相应于此一储存装置的状态灯可以第二方式进行显示,以提供信息给使用者,例如是储存装置故障的原因、可安全地移除储存装置、或其它任何可协助使用者处理储存装置的信息。
状态灯125可设置于伺服器机架102中,使其可从伺服器机架102的外部观看,而无需自伺服器机架102中移出储存装置123和/或伺服器103、106、108、110、112中的对应一个。因此,状态灯125可指示技术人员去更正伺服器103、106、108、110、112中一个及故障的储存装置,以提升所需的修复或置换伺服器103、106、108、110、112中一个及故障的储存装置的效率。应注意到,在本发明内容中,状态灯125可受操作以指示储存装置的故障或错误,或指示任何相应于伺服器103、106、108、110、112的支持元件的故障或错误。可触发状态灯以此方式进行运作的错误例如可包括电源供应错误、风扇错误、或在一支援伺服器中任何其它需被修复的错误,同样也包括储存装置的错误。用以指示错误的状态灯可受操作以持续地指示错误,直到错误或故障被更正。例如,直到故障的储存装置或其它元件被置换和/或修复。
在一些实施例中,状态灯125可用发光二极管实现。在特定的实施例中,状态灯125可为串行通用型输入输出(serial general purpose input and output(SGPIO))发光二极管灯,其为用于主机总线配接卡(host bus adapter,HBA)与背板之间的4信号总线。
管理控制器104、107、109、113、117可配置操作系统和/或其它计算机可读取指令,以执行此处所述的储存装置123的远端控制。举例而言,管理控制器104、107、109、113、117可经由网络160(例如是区域网络、广域网络、网际网络等),从管理装置170(例如是笔记型计算机、平板计算机、智能型手机等)获取伺服器设置信息,其指示伺服器机架102和/或伺服器机架102中的伺服器103、106、108、110、112的储存装置的需求。管理控制器可用一智能平台管理接口(intelligent platform management interface,IPMI)或一Redfish应用程序接口(application program interface,API),以远端控制状态灯。管理控制器并可用以与灯控制器和/或SAS扩展器(serial attached SCSI expander,SAS expander)沟通。例如,如伺服器108、110、112中所示。内部集成电路(Inter-Integrated circuit,I2C)/系统管理总线(system management bus interface,SMbus interface)可用以分别(respectively)处理灯控制器111、119与管理控制器109、117之间的通讯。
在一些实施方式中,灯控制器111、119可为发光二极管控制器。每一灯控制器111、119可分别(respectively)相应于每一位于伺服器108、112之中的储存装置123。在特定的实施方式中,灯控制器111、119可为串行通用型输入输出(serial general purpose inputand output(SGPIO))发光二极管控制器。在一些实施例中,灯控制器111、119可位于伺服器的背板(backplane)中。举例而言,串行通用型输入输出(serial general purpose inputand output(SGPIO))发光二极管控制器可用以控制背板的储存装置的状态灯。如此的串行通用型输入输出(serial general purpose input and output(SGPIO))发光二极管控制器可经由一个或多个接口管理,例如内部集成电路(Inter-Integrated circuit,I2C)/系统管理总线(system management bus interface,SMbus interface)或串行通用型输入输出(serial general purpose input and output(SGPIO))控制器接口。
SAS扩展器115、121可用以与管理控制器或灯控制器通讯,以支援远端管理功能。在一些实施方式中,可用串行ATA(serial ATA,SATA)主机总线配接卡(host bus adapter,HBA)取代SAS扩展器。SAS扩展器115、121也可用串行通用型输入输出(serial generalpurpose input and output(SGPIO))控制器接口控制串行通用型输入输出(serialgeneral purpose input and output(SGPIO))发光二极管控制器。
在一些实施例中,除了状态灯125外,可更提供附加的状态灯于伺服器机架102的机箱(chassis)中和/或伺服器103、106、108、110、112的机箱中。在操作上,这些附加的状态灯可用以替代状态灯125或与状态灯125同时运作,以增加辨识出包括有故障的储存装置或其它元件的伺服器机架102或伺服器103、106、108、110、112的效率。
在一些实施例中,这些附加的状态灯可设置于伺服器机架102中,使其可从相应机箱的前端和/或背端观看,而无需移除或调整伺服器机架102中的任何元件。因此,在修复过程中,这些状态灯可导引技术人员至正确的机箱。在一些实施例中,每一机箱可具有至少两个发光二极管,例如是健康状态(health status)发光二极管以及注意状态(attentionstatus)发光二极管。举例而言,当发光二极管为绿灯,代表无需注意的情况。当发光二极管为红灯,代表需注意的情况。然而,这些实施例并不以此为限,且完整上来说,本发明内容可利用任何数量的状态灯、样式、时序、及颜色于指示机箱(chassis)或其它故障元件。
为监视储存装置123,每一储存装置123可相应于一标识(identifier),其包括储存装置的信息(如型态、能力、接口等)及储存装置于伺服器机架102中的地址。储存装置的标识信息可还相应于储存装置的状态灯。因此,当储存装置的标识信息发送至远端管理装置(如管理装置170)以进行纠错时,需要发送指令以操作故障的储存装置的状态灯的信息是被包括在故障的储存装置的标识信息当中。用以辨识机箱(如机架(rack)和/或机架中的伺服器)的标识信息还可随故障的储存装置的标识信息发送。
如图1所示,伺服器机架102及其中具有不同元件的伺服器用以显示伺服器系统的不同实施例,如伺服器103、106、108、110、112皆显示为具有不同元件。因此,每一这些设置的状态灯的操作过程可彼此不同。这些设置的操作细节将随图2A-2C描述于下。图2A、2B、2C为示例性系统图式,用以表示在伺服器中的储存装置的状态灯控制。图2A、2B、2C分别地(respectively)显示相似于伺服器108、110、112的设置的操作。
首先参照图2A,其显示伺服器206具有管理控制器208、灯控制器212、以及相应的储存装置214。如此的设置可适用于储存装置214(以及灯控制器)是位于与伺服器206相同的节点,并相应于相同的管理控制器。因此,在如此的设置中,管理控制器208可用以直接操作(access)灯控制器212以彼此进行沟通。再者,每一储存装置214(M0-M7)可相应于管理控制器208及灯控制器212。亦即,虽然第2A图中未显示,但管理控制器208亦可与储存装置214进行沟通。如上所述,每一储存装置214的状态灯可受操作以指示每一储存装置214的当前状态。举例而言,储存装置M0、M1的状态灯可具有相异于其它储存装置M2-M7的状态灯的灯号,以显示储存装置M0、M1故障,需要维修。如上所述,储存装置的状态灯可闪烁(flash)、眨动(blink)、显示为稳定灯号和/或以不同颜色显示,以指示故障或错误。然而,其它变化的实施例不以此为限,且仍可能存在其它用以操作状态灯的设置,以指示储存装置故障。
在操作上,管理装置202可检测在伺服器206中的储存装置214中的一个故障或遭遇错误。在一些实施例中,所述的检测操作可经由频外程序(out-of-band process)(亦即,经由管理控制器208)进行。亦即,管理控制器208可检测故障或错误并经由网络204传送讯息至管理装置202。在其它实施例中,所述的检测操作可经由频内程序(in-band process)进行。亦即,伺服器206的操作系统可检测故障或错误,并产生要被传送至管理装置202的讯息。在上述的两种情况下,此一讯息可包括供管理装置202辨识故障的储存装置的信息,并选择性地包括供管理装置202辨识故障的储存装置所在的伺服器206和/或机架的信息。相应于管理装置202检测到一或多个储存装置214故障,管理装置202可经由网络204发送一要求至管理控制器208,以相应于故障的储存装置操作状态灯216。此一要求可包括用以识别在伺服器206中故障的储存装置的标识(identifier),且若有需要,还可包括用以识别伺服器206和/或伺服器206装载于其中的机架(rack)。在特定的实施例中,此标识并可包括储存装置的信息以及其在伺服器机架系统(server rack system)中的地址。
接着,管理控制器208经由网络204接收来自管理装置202的前述要求。在管理装置202的检测操作程序是频内程序的情况下,管理控制器208可借助此一要求判断一或多个储存装置214故障。此一要求可还包括用以点亮相应于伺服器206中故障的储存装置的状态灯的指令。接着,管理控制器208可转送此一要求至灯控制器212,其可依次触发相应于故障的储存装置的状态灯,以指示故障或错误。
接着参照图2B,其绘示伺服器226。相似于图2A,伺服器226可包括管理控制器208以及多个储存装置214。然而,如图2B所示,其系具有SAS扩展器210而非灯控制器。SAS扩展器210可与管理控制器208、储存装置214(M0-M7)、及储存装置214(M0-M7)的状态灯216进行沟通。如此的设置可适用于储存装置214(以及SAS扩展器210)是位于与伺服器226不同的节点的情况。例如,适用于伺服器节点存取一分离的储存节点(如JBOD节点)的情况。在如此的设置中,伺服器226上的管理控制器208可与储存节点上的SAS扩展器210沟通,以经由SAS扩展器210操作(access)储存装置214以及相应于储存装置的状态灯。
在操作上,管理装置202可检测在伺服器226中故障或遭遇错误的储存装置214。此一操作可如先前段落所述,以频内或频外程序进行。而后,管理装置202可经由网络204发送一要求至管理控制器208以使相应于故障的储存装置214的状态灯216进行运作,以告知操作员或技术人员一或多个储存装置214故障。举例而言,如图2B所示,在储存装置M0-M1故障的情况下,相应于这些储存装置的状态灯216可进行运作。
前述要求可包括储存装置的标识以及机箱(chassis)(例如是伺服器和/或伺服器机架(server rack))的标识,用以指定哪一个状态灯需受操作。具体而言,储存装置的标识可包括储存装置的信息以及其在伺服器机架系统(server rack system)中的地址。在接收到此一要求时,管理控制器208可转送此一要求至相应于故障的储存装置的SAS扩展器210。在接收到指令时,SAS扩展器210可基于前述标识产生多个信号,以令相应于故障的储存装置的状态灯216进行运作,以指示故障或错误。
接着参照图2C,其绘示伺服器236,伺服器236具有管理控制器208、SAS扩展器210、以及灯控制器212。相似于图2B中的设置,图2C中的设置可适用于储存装置214(以及SAS扩展器210)与伺服器236是位于不同的节点的情况。例如,适用于伺服器节点存取一分离的储存节点(如JBOD节点)的情况。在如此的设置中,伺服器236上的管理控制器208可与储存节点上的SAS扩展器210沟通,以经由SAS扩展器210操作(access)储存装置214以及灯控制器212以控制状态灯216。
在操作上,管理装置202可检测在伺服器23中故障或遭遇错误的储存装置214。此一操作可如先前段落所述,以频内或频外程序进行。而后,管理装置202可经由网络204发送一要求至管理控制器208以使相应于故障的储存装置214的状态灯216进行运作,以告知操作员或技术人员一或多个储存装置214故障。举例而言,如图2C所示,在储存装置M0-M1故障的情况下,相应于这些储存装置的状态灯216可进行运作。
前述要求可包括储存装置的标识以及机箱(chassis)(例如是伺服器和/或伺服器机架(server rack))的标识,以指定哪一个状态灯需受操作。具体而言,储存装置的标识可包括储存装置的信息以及其在伺服器机架系统(server rack system)中的地址。在接收到此一要求时,管理控制器208可转送此一要求至相应于故障的储存装置的SAS扩展器210。在接收到指令时,SAS扩展器210可基于前述标识产生多个信号,以令相应于故障的储存装置的状态灯216进行运作,以指示故障或错误。
在一些设置中,图2B或图2C中的SAS扩展器210可设置为具有进行频内通讯、频外通讯、或此两者的网络能力。因此,伺服器节点的通讯操作可用多种不同的方式进行。在其它设置中,储存节点可包括其自身的管理控制器。因此,用以操作状态灯216的通讯可直接发送至储存节点而不需经由伺服器226。在另一设置中,SAS扩展器210可用以提供部份或全部管理控制器的功能,而不需提供分散的管理控制器于储存节点。因此,检测储存装置214的通讯操作与操作状态灯的通讯操作皆可经由SAS扩展器210进行。
图3A、3B、3C分别(respectively)根据图2A、2B、2C中实施例,对安装于伺服器中的储存装置进行纠错所绘示的例示性程序的方块图。
首先,参照图3A,一种基于灯控制器的程序启始于步骤302。在步骤302中,管理控制器接收一要求以操作相应于故障的储存装置的状态灯,以相应于故障的储存装置指示故障或错误。举例而言,如前相应于图2A的叙述,管理控制器208可经由网络204接收来自管理装置202的一要求。如前所述,此一要求可包括储存装置的标识以及用以识别故障的储存装置相应的伺服器和/或伺服器机架(server rack)的标识。举例而言,此一标识可包括储存装置的数据以及其在伺服器机架系统(server rack system)中的地址。
在步骤303中,接着,管理控制器可发送一指令至相应于故障的储存装置的状态灯的灯控制器。此一指令可包括用以识别特定储存装置的标识,以令对应的状态灯可被正确地识别及操作。而后,在步骤304中,灯控制器可相应于来自管理控制器的指令,操作对应于故障的储存装置的状态灯,以指示故障或错误。
在本发明内容中,除了相应于故障的储存装置控制状态灯外,灯控制器更可用以操作附加的状态灯,例如是相应于伺服器或伺服器机架(server rack)的状态灯,其中此一伺服器或伺服器机架对应于故障的储存装置。因此,灯控制器可用以产生额外的指令和/或控制信号,以与故障的储存装置的状态灯共同操作这些附加的状态灯,以便于在大量的伺服器或伺服器机架(server rack)中定位故障的储存装置。在一些实施例中,如此的附加的状态灯可与用以辨识故障的储存装置的状态灯同步运作。亦即,如此的附加的状态灯可与用以辨识故障的储存装置的状态灯具有相同的样式、时序、和/或颜色。然而,在其它实施例中,附加的状态灯可与用以辨识故障的储存装置的状态灯以不同的方式运作。
接着,参照图3B,一种基于SAS扩展器的程序启始于步骤312。在步骤312中,管理控制器接收一要求以操作相应于故障的储存装置的状态灯,以相应于故障的储存装置指示故障或错误。举例而言,如前相应于图2B的叙述,管理控制器208可经由网络204接收来自管理装置202的一要求。如前所述,此一要求可包括储存装置的标识以及用以识别故障的储存装置相应的伺服器和/或伺服器机架(server rack)的标识。举例而言,此一标识可包括储存装置的数据以及其在伺服器机架系统(server rack system)中的地址。
在步骤313中,接着,管理控制器可发送一指令至相应于故障的储存装置的状态灯的SAS扩展器。此一指令可包括用以识别特定储存装置的标识,以令对应的状态灯可被正确地识别及操作。而后,在步骤314中,SAS扩展器可相应于来自管理控制器的指令,操作对应于故障的储存装置的状态灯,以指示故障或错误。
在本发明内容中,除了相应于故障的储存装置控制状态灯外,SAS扩展器还可用以产生指令,用以令位于连接于SAS扩展器的其它元件之中的附加的状态灯运作。例如,典型而言,一SAS控制器是与储存装置控制器共同运作,以管理连接于SAS扩展器的多个不同的储存装置的操作。如此的SAS控制器可控制伺服器或伺服器中其它元件的附加的状态灯。因此,SAS扩展器可用以产生指令,以使这些附加的状态灯与故障的储存装置的状态灯共同操作,以便于在大量的伺服器或伺服器机架(server rack)中定位故障的储存装置。在一些实施例中,如此的附加的状态灯可与用以辨识故障的储存装置的状态灯同步运作。亦即,如此的附加的状态灯可与用以辨识故障的储存装置的状态灯具有相同的样式、时序、和/或颜色。然而,在其它实施例中,附加的状态灯可与用以辨识故障的储存装置的状态灯以不同的方式运作。
接着,参照图3C,一种基于SAS扩展器的程序启始于步骤322。在步骤322中,管理控制器接收一要求以操作相应于故障的储存装置的状态灯,以相应于故障的储存装置指示故障或错误。举例而言,如前相应于图2C的叙述,管理控制器208可经由网络204接收来自管理装置202的一要求。如前所述,此一要求可包括储存装置的标识以及用以识别故障的储存装置相应的伺服器和/或伺服器机架(server rack)的标识。举例而言,此一标识可包括储存装置的数据以及其在伺服器机架系统(server rack system)中的地址。
在步骤323中,接着,管理控制器可发送一指令至相应于故障的储存装置的状态灯的SAS扩展器。此一指令可包括用以识别特定储存装置的标识,以令对应的状态灯可被正确地识别及操作。而后,在步骤324中,SAS扩展器可相应于来自管理控制器的指令,操作对应于故障的储存装置的状态灯,以指示故障或错误。
如同从管理控制器至SAS扩展器的指令,从管理控制器至灯控制器的指令可包括用以识别故障的储存装置的标识(identifier),以确保操作正确的状态灯。在本发明内容中,SAS扩展器从管理控制器接收的指令以及SAS扩展器提供至灯控制器的指令无需相同。
最后,在步骤325中,相应于接收到来自SAS扩展器的指令,灯控制器可产生需要的多个控制信号以操作对应于故障的储存装置的状态灯,以指示故障或错误。
如上所述,在本发明内容中,灯控制器和/或SAS扩展器可用以控制或使用附加的状态灯。因此,如前相应于图3B的叙述,在一些实施例中,SAS扩展器可产生额外的指令至其它元件,以令附加的状态灯运作。在其它实施例中,如前相应于图3A的叙述,灯控制器可产生额外的指令和/或控制信号以令附加的状态灯运作,例如伺服器和/或伺服器机架(server rack)的灯。在其它实施例中,灯控制器及SAS扩展器皆可产生如此的额外的指令和/或控制信号。
图4为一例示性系统架构400的方块图,用以实现在图1-3中的特征及程序。架构400可实现于任何运行软件应用程序的电子装置上,其中软件应用程序是源自编译过的指令,且电子装置可包括但不限于:个人计算机、伺服器、智能型手机、媒体播放器、平板计算机、游戏控制器、电子装置等。在一些实施方式中,架构400可包括一或多个处理器402、一或多个输入装置404、一或多个显示装置406、一或多个网络接口408、以及一或多个计算机可读取媒体410。每一这些元件可借助总线412耦接。
显示装置406可用任何已知的显示技术实现,包括但不限于液晶显示器或发光二极管显示技术。处理器402可用任何已知的处理器技术实现,包括但不限于图形处理器或多核处理器。输入装置404可用任何已知的输入装置技术实现,包括但不限于键盘(包括虚拟键盘)、鼠标、轨迹球(track ball)、触碰感测板或触碰感测屏幕。总线412可用任何已知的内部或外部总线技术实现,包括但不限于ISA、EISA、PCI、PCI Express、NuBus、USB、SerialATA、或FireWire。
计算机可读取媒体410可为任何参与提供指令至处理器执行的媒体,包括但不限于非易失性储存媒体(如光盘、磁盘、随身盘(flash drive)等)或易失性储存媒体(如SDRAM、ROM等)。计算机可读取媒体(例如储存装置、媒介(medium)、及存储器)可包括,例如,包括比特流(bit stream)等的有线或无线信号。然而,于述及时,非易失性储存媒体直接排除能量、载波信号、电磁波及信号等媒体。
计算机可读取媒体410可包括多种不同的指令以实现操作系统414(如麦金塔操作系统、微软操作系统、或Linux操作系统)。操作系统可为多使用者(multiuser)、多重处理(multiprocessing)、多工操作(multitasking)、多线程(multithreading)、即时操作(real-time)等。操作系统执行基本工作(task),包括但不限于辨识来自输入装置404的输入,发送输出至显示装置406,保存档案或目录的路径(track)于计算机可读取媒体410上,控制周边装置(如磁盘机、印表机等),其可被直接控制或通过输入/输出控制器(I/Ocontroller)并通过总线412上的流量管理。网络通讯指令416可建立及维持网络连线(例如为用以实现通讯协议(如TCP/IP、HTTP、Ethernet等)的软件)。
图形处理系统418可包括指令以提供图形及影像处理功能。应用程序420可为利用或实现图1-3所描述的程序的应用程序。这些程序也可实现于操作系统414。
系统控制器422可包括管理控制器、灯控制器、或SAS扩展器。管理控制器可为独立操作处理器和/或操作系统414的控制器。在一些实施方式中,在处理器402通电且操作系统414载入处理器402前,管理控制器可先通电并运作。举例而言,管理控制器可经由专门的网络接口或其它输入装置,提供前置操作系统管理(pre-OS management)至计算装置。举例而言,管理控制器可为基板管理器(baseboard management controller,BMC),用以监视储存装置的灯(如发光二极管状态灯)以及执行低层级的储存装置管理,和/或经由智能平台管理接口(intelligent platform management interface,IPMI)、键盘及视频及鼠标(keyboard,video,mouse,KVM)、重新导向(redirection)、SOL(serial over LAN),和/或其它接口,提供远端管理功能。管理控制器实现于参照前述图1-3所描述的程序之中。
灯控制器可为发光二极管控制器。灯控制器可为一种控制器,用以控制储存装置的灯,并通过内部集成电路(Inter-Integrated circuit,I2C)/系统管理总线(systemmanagement bus interface,SMbus interface)或串行通用型输入输出(serial generalpurpose input and output(SGPIO)控制器接口,提供远端管理功能。灯控制器可为串行通用型输入输出(serial general purpose input and output(SGPIO)控制器。在一些实施例中,灯控制器可位于伺服器的背板(backplane)中。举例而言,串行通用型输入输出发光二极管控制器(SGPIO LED controller)用以控制背板的储存装置的状态灯。串行通用型输入输出发光二极管控制器(SGPIO LED controller)可由至少两个接口管理,如内部集成电路(Inter-Integrated circuit,I2C)/系统管理总线(system management businterface,SMbus interface)或串行通用型输入输出(serial general purpose inputand output(SGPIO)控制器接口。
SAS扩展器(serial attached small computer system interface)为一控制器,用以控制储存装置的灯,并通过内部集成电路(Inter-Integrated circuit,I2C)/系统管理总线(system management bus interface,SMbus interface)或串行通用型输入输出(serial general purpose input and output(SGPIO)控制器接口,提供远端管理功能。SAS扩展器用以与管理控制器或灯控制器进行通讯,以支援远端管理功能。在本例中,可用串行ATA(serial ATA,SATA)主机总线配接卡(host bus adapter,HBA)取代SAS扩展器。SAS扩展器115、121也可用串行通用型输入输出(serial general purpose input and output(SGPIO))控制器接口,控制串行通用型输入输出(serial general purpose input andoutput(SGPIO))发光二极管控制器。
所述的特征可有利地被实现于可在一可编程系统(programmable system)上执行的一或多个计算机程序,此一可编程系统包括至少一可编程处理器(programmableprocessor)用以接收数据及指令至一数据储存系统、至少一输入装置、以及至少一输出装置,以及用以传送数据及指令至该数据储存系统、该至少一输入装置、以及该至少一输出装置。一计算机程序为一组指令,可直接或间接地用于计算机中以执行一特定活动或产生特定结果。计算机程序可写为任何形式的程序语言(如Objective-C或Java),包括编译式语言(compiled language)或直译式语言(interpreted language),且其可以任何形式展开,包括展开为单独程序(stand-alone program)或展开为模块、元件、副程序(subroutine)、或其它适可使用于计算环境中的单元。
适用于执行多个指令的程序的处理器包括,举例而言,任何形式计算机的通用目的及特定目的的微处理器,以及单处理器(sole processor)或多处理器或多核心中的一个。一般而言,处理器从唯读存储器、随机存取存储器、或此两者接收指令及数据。计算机的基本元件为:用以执行指令的一处理器;以及用以储存指令或数据的一或多个存储器。一般而言,计算机也包括用以储存数据档案的一或多个大量储存装置(mass storage device),或操作性耦接用以储存数据档案的一或多个大量储存装置(mass storage device)以与之沟通,其中如此装置包括磁盘机(如内部硬盘(internal hard disk drive)以及可移除磁盘(removable disk));磁光盘(magneto-optical disk);以及光盘。适用于使计算机程序及数据实际成型的储存装置包括,举例而言,半导体储存装置(semiconductor memorydevice)(如EPROM、EEPROM、以及快闪储存装置(flash memory device));磁盘(如内部硬盘(internal hard disk drive)以及可移除磁盘(removable disk));磁光盘(magneto-optical disk)以及CD-ROM及DVD-ROM。处理器与存储器可由特殊应用集成电路(application-specific integrated circuit,ASIC)增补,或集成于其中。
为提供与使用者互动,所述特征能够在计算机上实现,所述计算机具有显示装置以向使用者显示信息,如阴极射线管或液晶显示器,以及可供使用者向计算机提供输入的键盘和定点装置(pointing device),如鼠标或轨迹球(track ball)。
这些特征还可以实现于一计算机系统中,该计算机系统可包括后端元件,如数据伺服器,或是中间件元件,如应用伺服器或网际网络伺服器,或是前端元件,如客户计算机,其中客户计算机具有图形使用者界面、网际网络浏览器或是这二者的组合。该系统的元件可以通过任何数位数据通讯形式或介质来连接,例如通讯网络。举例来说,该通讯网络的实例例如包括区域网络、广域网络以及构成网际网络的计算机和网络。
该计算机系统可以包括客户机和伺服器。客户机和伺服器通常是相互远离的,并且通常是通过网络互动。客户机与伺服器的关系是依照在相应计算机上运行并且相互具有客户机-伺服器关系的计算机程序来呈现的。
可使用API实施所发明实施例的一或多个特征或步骤。API可定义在呼叫应用程序与提供服务、提供数据或执行操作或计算的其他软件程序码(例如,操作系统、程序库常式、函数)之间传递的一或多个参数。
API可实施为呈程序码形式的一或多个呼叫,该一或多个呼叫基于在该API规格文件中定义的呼叫惯例而经由参数清单或其他结构发送或接收一或多个参数。参数可为常数、密钥、数据结构、物件、物件类别、变数、数据类型、指标、阵列、清单或另一呼叫。API呼叫及.参数可以任何程序设计语言来实施。程序设计语言可定义程序设计者将用以存取支援该API的函数的词汇及呼叫惯例。
在一些实施方案中,API呼叫可向应用程序报告执行该应用程序的装置的能力,诸如输入能力、输出能力、处理能力、功率能力、通信能力等。
已描述了数个实施方案。然而,将理解,可进行各种修改。举例而言,可提供其他步骤,或可自所描述的流程中消除数个步骤,且可向所描述系统添加其他元件或自所描述系统中移除其他元件。因此,其他实施方案在权利要求的范畴内。
尽管使用了各种范例和其他信息来解释权利要求的范围内的多个态样,但并非要基于这种范例中的具体特征或安排来暗示对权利要求范围进行限制,因为普通技术人员将能够使用这些范例推导出很多种实现方式。进一步地,并且尽管以结构特征和/或方法步骤的范例专用的语言描述了某个标的,但应理解到,权利要求中限定的标的不一定局限于这些描述的特征或动作。例如,这些功能可以不同地分布在或执行于与除了在此标识的元件以外的元件。相对地,所述特征和步骤是作为权利要求的范围内的系统和方法的元件的范例而揭示。

Claims (8)

1.一种伺服器系统的操作方法,包括:
通过多个第一控制器,经由一网络接口,接收来自一远端装置的要求,其中,所述多个第一控制器中的每一个第一控制器接收用于操作与该第一控制器对应的伺服器中包含的特定存储装置的至少一个状态灯的要求,
对于与该第一控制器对应的伺服器而言:
基于所述要求,通过该第一控制器直接地控制与所述伺服器对应的第二控制器,
通过所述第二控制器产生用以直接操作所述至少一个状态灯的控制信号。
2.如权利要求1所述的伺服器系统的操作方法,其中该第一控制器为一基板控制器,该第二控制器为一SAS扩展器。
3.如权利要求1所述的伺服器系统的操作方法,其中该至少一状态灯为一发光二极管,且该第二控制器为一串行通用型输入输出发光二极管控制器。
4.如权利要求1所述的伺服器系统的操作方法,其中该要求包括对应一机箱的一标识,该机箱容置该特定存储装置,且还包括产生用以操作相应于该机箱的至少一个附加状态灯的多个控制信号。
5.如权利要求1所述的伺服器系统的操作方法,其中所述控制信号用以令该至少一个状态灯以一预定方式操作,以代表该特定存储装置故障。
6.一种伺服器系统,包括:
多个伺服器,所述多个伺服器中的每一个伺服器包括:
一个数据储存装置,所述数据储存装置分别具有至少一个状态灯;
一管理控制器,耦接至一网络接口;以及
至少一个第二控制器,在通讯上耦接于至少所述管理控制器以及所述至少一个状态灯;
其中所述管理控制器用以经由该网络接口接收来自一远端装置的一要求,所述要求是用于操作与该管理控制器对应的伺服器中包含的特定存储装置的至少一个状态灯的要求,且所述管理控制器更用以发送一指令至该至少一个第二控制器,以通过所述第二控制器直接操作所述至少一个状态灯。
7.如权利要求6所述的伺服器系统,其中该管理控制器为一基板控制器,该第二控制器为一SAS扩展器。
8.如权利要求6所述的伺服器系统,其中该至少一个状态灯为一发光二极管,且该第二控制器为一串行通用型输入输出发光二极管控制器。
CN201510735683.XA 2015-07-16 2015-11-03 伺服器系统及其操作方法 Active CN106354610B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/801,403 2015-07-16
US14/801,403 US9713215B2 (en) 2015-07-16 2015-07-16 Identification of storage device for trouble shooting

Publications (2)

Publication Number Publication Date
CN106354610A CN106354610A (zh) 2017-01-25
CN106354610B true CN106354610B (zh) 2020-07-14

Family

ID=57776215

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510735683.XA Active CN106354610B (zh) 2015-07-16 2015-11-03 伺服器系统及其操作方法

Country Status (3)

Country Link
US (1) US9713215B2 (zh)
CN (1) CN106354610B (zh)
TW (1) TWI589135B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870692B2 (en) 2015-07-17 2018-01-16 International Business Machines Corporation Server computing device lighting for maintenance
US10334334B2 (en) * 2016-07-22 2019-06-25 Intel Corporation Storage sled and techniques for a data center
US20190109720A1 (en) 2016-07-26 2019-04-11 Samsung Electronics Co., Ltd. Modular system (switch boards and mid-plane) for supporting 50g or 100g ethernet speeds of fpga+ssd
US11461258B2 (en) * 2016-09-14 2022-10-04 Samsung Electronics Co., Ltd. Self-configuring baseboard management controller (BMC)
US10210123B2 (en) 2016-07-26 2019-02-19 Samsung Electronics Co., Ltd. System and method for supporting multi-path and/or multi-mode NMVe over fabrics devices
WO2018106376A1 (en) * 2016-12-05 2018-06-14 Mcginnis Diane K Footwear system
US10826883B2 (en) * 2017-04-11 2020-11-03 Dell Products L.P. Systems and methods for host system management of an information handling system via a mobile information handling system
CN107239385B (zh) * 2017-06-06 2021-03-19 苏州浪潮智能科技有限公司 一种服务器及指示灯控制方法
US20180367870A1 (en) * 2017-06-14 2018-12-20 Quanta Computer Inc. System for determining slot location in an equipment rack
CN109062835A (zh) * 2018-06-27 2018-12-21 郑州云海信息技术有限公司 一种实现串行通用输入输出重新编写的方法
JP6849237B2 (ja) * 2019-04-02 2021-03-24 Necプラットフォームズ株式会社 サーバ、サーバ管理システム、サーバ管理方法及びプログラム
CN110572365A (zh) * 2019-08-08 2019-12-13 深圳中电长城信息安全系统有限公司 多协议服务器管理方法、系统、终端设备及存储介质
TWI724700B (zh) * 2019-12-17 2021-04-11 三泰科技股份有限公司 頻外的外接控制設備、系統與方法
US20210329755A1 (en) * 2020-04-16 2021-10-21 Dell Products L.P. Navigational dynamic lighting
TWI818385B (zh) * 2021-12-16 2023-10-11 神雲科技股份有限公司 儲存設備

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102479140A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 计算机系统及其硬盘状态显示方法
CN104461800A (zh) * 2014-11-24 2015-03-25 英业达科技有限公司 硬盘运行状态检测系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6867701B2 (en) * 2002-04-18 2005-03-15 International Business Machines Corporation Computer-server rack enclosure fault light diagnostic system
US20070055740A1 (en) 2005-08-23 2007-03-08 Luciani Luis E System and method for interacting with a remote computer
JP4957631B2 (ja) * 2008-04-10 2012-06-20 日本電気株式会社 フォールトトレラントサーバの動作確認方法及び検査支援プログラム
US8291266B2 (en) * 2009-09-15 2012-10-16 International Business Machines Corporation Server network diagnostic system
US8599035B2 (en) * 2011-01-28 2013-12-03 Dell Products L.P. Equipment module indicator handle and methods for indicating equipment module status
CN103514078A (zh) * 2012-06-28 2014-01-15 鸿富锦精密工业(深圳)有限公司 硬盘监视系统
TWI468931B (zh) 2012-11-07 2015-01-11 Inventec Corp 磁碟配置方法及伺服器機架系統

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102479140A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 计算机系统及其硬盘状态显示方法
CN104461800A (zh) * 2014-11-24 2015-03-25 英业达科技有限公司 硬盘运行状态检测系统

Also Published As

Publication number Publication date
US9713215B2 (en) 2017-07-18
US20170018149A1 (en) 2017-01-19
TW201705723A (zh) 2017-02-01
CN106354610A (zh) 2017-01-25
TWI589135B (zh) 2017-06-21

Similar Documents

Publication Publication Date Title
CN106354610B (zh) 伺服器系统及其操作方法
US10127032B2 (en) System and method for unified firmware management
TWI534708B (zh) 用於管理電腦系統中之基本輸入輸出系統組態之方法、管理裝置、及電腦可讀取媒體
CN107122321B (zh) 硬件修复方法、硬件修复系统以及计算机可读取存储装置
US20170046152A1 (en) Firmware update
US20200218613A1 (en) System and Method for Information Handling System Boot Status and Error Data Capture and Analysis
TW201702799A (zh) 動態管理電力供應的方法、系統
US20140122931A1 (en) Performing diagnostic tests in a data center
US20150026526A1 (en) Techniques for testing enclosure management controller using backplane initiator
US20070055740A1 (en) System and method for interacting with a remote computer
US20150149684A1 (en) Handling two ses sidebands using one smbus controller on a backplane controller
MX2014001056A (es) Método y sistema para construir un sistema informatico de baja potencia.
US20120041707A1 (en) Cold boot test system and method for electronic devices
US20170212561A1 (en) Power supply unit fan management
CN110109782B (zh) 一种故障PCIe设备的更换方法、装置及系统
US9690602B2 (en) Techniques for programming and verifying backplane controller chip firmware
US20180018189A1 (en) Platform simulation for management controller development projects
US9507744B2 (en) Handling two SGPIO channels using single SGPIO decoder on a backplane controller
US10853213B2 (en) Validation of installation of removeable computer hardware components
US9979799B2 (en) Impersonating a specific physical hardware configuration on a standard server
US9886335B2 (en) Techniques for validating functionality of backplane controller chips
US8819484B2 (en) Dynamically reconfiguring a primary processor identity within a multi-processor socket server
CN107765993B (zh) 硬盘界面装置
US9471433B2 (en) Optimizing computer hardware usage in a computing system that includes a plurality of populated central processing unit (‘CPU’) sockets
US7464257B2 (en) Mis-configuration detection methods and devices for blade systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant