CN1896958A - 应用于刀锋伺服系统的错误检测方法与装置 - Google Patents

应用于刀锋伺服系统的错误检测方法与装置 Download PDF

Info

Publication number
CN1896958A
CN1896958A CN 200510083352 CN200510083352A CN1896958A CN 1896958 A CN1896958 A CN 1896958A CN 200510083352 CN200510083352 CN 200510083352 CN 200510083352 A CN200510083352 A CN 200510083352A CN 1896958 A CN1896958 A CN 1896958A
Authority
CN
China
Prior art keywords
mentioned
type
output module
module
subcard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN 200510083352
Other languages
English (en)
Other versions
CN100375961C (zh
Inventor
施青志
陈利琮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Quanta Computer Inc
Original Assignee
Quanta Computer Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Quanta Computer Inc filed Critical Quanta Computer Inc
Priority to CNB2005100833529A priority Critical patent/CN100375961C/zh
Publication of CN1896958A publication Critical patent/CN1896958A/zh
Application granted granted Critical
Publication of CN100375961C publication Critical patent/CN100375961C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

一种应用于刀锋伺服系统的错误检测方法。提供一刀锋伺服系统,其配置多个刀锋服务器、一第一输出入模块、一第二输出入模块以及一管理模块,其中每一刀锋服务器皆配置一子卡。该管理模块根据子卡类型决定一第一候选输出入类型并启动上述刀锋服务器,或者执行一子卡错误配置操作,根据该子卡类型与该第一输出入模块类型决定一第二候选输出入类型并启动该第一输出入模块,或者执行一输出入模块错误配置操作,以及根据该第一输出入模块类型决定启动该第二输出入模块,或者执行一输出入模块错误配置操作。

Description

应用于刀锋伺服系统的错误检测方法与装置
技术领域
本发明涉及一种检测方法,特别是涉及一种应用于刀锋伺服系统的错误检测方法。
背景技术
许多企业已经开始整合其内部设置的服务器到集中的数据中心,通过使用实体、应用程序或数据的整合来降低管理分散在各处的多台小服务器所产生的问题和成本开销。
目前,实体整合通常是利用单机架(1U,即1.75吋高)或双机架(2U,即2×1.75=3.5吋高)系统替代直立式服务器,以节省空间并使管理员可更加轻松地进行管理。然而,每台服务器都需要其独立的设备,包括电源缆线、以太网络(Ethernet)接口、系统管理、电源、键盘/显示/鼠标(Keyboard/Video/Mouse,以下简称为KVM)接口和光纤交换接口。一个标准42U高(即42×1.75=73.5吋高)的机柜,如果装满42台1U的服务器,将有数以百计的缆线遍布其中。如此一来,不仅使得在发生问题时难于快速除错,还在安插和替换某台服务器时带来了不便。此外,每个服务器独立的电源和交换器单元也将耗费机柜内大量的空间。
为了解决上述问题,刀锋伺服系统(Blade System)即因应而生。刀锋伺服系统与其它直立式服务器或者机架式服务器的不同点如下。首先,安插于刀锋伺服系统中的每一刀锋服务器(Server Blade)的体积远小于一般直立式服务器或者机架式服务器并呈刀锋状,且同样整合了中央处理器(CPU)、硬盘、内存、网络接口和控制芯片等。其次,安插于刀锋伺服系统中的每一刀锋服务器如同个人计算机(PC)内的各种适配卡,并列地安插刀锋伺服系统的中背板上。参考图1,其示出了刀锋伺服系统的结构图。在刀锋伺服系统100中,数个刀锋服务器110并列安插于插槽中,而通常一个刀锋伺服系统可安插10个刀锋服务器。所有的刀锋服务器110共享统一的电源供应器120、风扇130、交换器140、鼠标(未显示)、键盘(未显示)以及显示接口设备(未显示),并且通过一管理模块150控管所有刀锋服务器。
一般来说,每一刀锋伺服系统具有4个输出入隔间(I/O bay),而每一I/O隔间可安插一输出入模块(I/O module)以做为网络联机的用。此外,每一刀锋服务器配置有一子卡(Daughter Card,DC)以与上述I/O模块进行联机运作。当终端使用者在刀锋服务器上使用不同类型的子卡,或者使用与I/O模块类型不符的子卡时,将使得刀锋服务器或I/O模块无法正常运作。
因此,为了防止终端使用者安插与I/O模块不同类型的子卡,或者使用不同类型的子卡,故本发明提供了一种应用于刀锋伺服系统的错误检测方法与装置,在终端使用者使用错误类型的子卡或I/O模块时,将发出警示讯息以警告终端使用者,并且执行相关的错误控制。
发明内容
基于上述目的,本发明实施例披露了一种应用于刀锋伺服系统的错误检测方法。提供一刀锋伺服系统,其配置多个刀锋服务器、一第一输出入模块、一第二输出入模块以及一管理模块,其中每一刀锋服务器皆配置一子卡。当启动该等刀锋服务器时,该管理模块判断每一子卡类型是否相同。若每一子卡类型皆相同,则该管理模块指定该子卡类型为一第一候选输出入类型,并且启动该等刀锋服务器,否则会发生子卡错误配置的状况,并且执行一子卡错误配置操作。该管理模块判断该第一输出入模块的类型是否与该第一候选输出入类型相同。若该第一输出入模块类型与该第一候选输出入类型相同,则该管理模块指定该第一输出入模块类型为一第二候选输出入类型,并且启动该第一输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
此外,该管理模块判断该第二输出入模块的类型是否与该第二候选输出入类型相同。若该第二输出入模块的类型与该第二候选输出入类型相同,则启动该第二输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
此外,当该等刀锋服务器皆为非启动状态时,该管理模块判断每一子卡类型是否相同。若每一子卡类型皆相同,则该管理模块指定该子卡类型为一第三候选输出入类型,并且启动该等刀锋服务器,否则会发生机箱错误配置的状况,并且执行一机箱错误配置操作。该管理模块判断该第一输出入模块的类型是否与该第三候选输出入类型相同。若该第一输出入模块类型与该第三候选输出入类型相同,则该管理模块指定该第一输出入模块类型为一第四候选输出入类型,并且启动该第一输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
本发明实施例还披露了一种应用于刀锋伺服系统的错误检测方法。提供一刀锋伺服系统,其具有一第一插槽与一第二插槽且不具配置子卡的刀锋服务器,其中该第一与第二插槽无安插任何输出入模块。当安插一第一输出入模块于该第一插槽时,指定该第一输出入模块的类型为一第一候选输出入类型,并且启动该第一输出入模块。此外,当安插一第二输出入模块于该第二插槽且该第一插槽无安插任何输出入模块时,则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
此外,当安插一配置子卡的刀锋服务器于该刀锋伺服系统中时,将该子卡的类型指定为一第二候选输出入类型,并且启动该等刀锋服务器。
本发明实施例还露了一种应用于刀锋伺服系统的错误检测方法。提供一刀锋伺服系统,其具有多个置不同子卡类型的刀锋服务器且发生机箱错误配置的状况。安插一输出入模块于该刀锋伺服系统,并且指定该输出入模块的类型为一候选输出入类型,然后启动该输出入模块。判断该输出入模块类型是否与其中一子卡类型相同。若该输出入模块类型与其中一子卡类型相同,则可启动配置与该输出入模块类型相同的该子卡类型的刀锋服务器,且其它刀锋服务器发生子卡错误配置的状况。若该输出入模块类型与每一子卡类型不同,则该机箱错误配置的状况依然存在。
本发明实施例还披露了一种应用于刀锋伺服系统的错误检测装置,其包括多个刀锋服务器、一第一输出入模块、一第二输出入模块以及一管理模块,其中每一刀锋服务器皆配置一子卡。该管理模块执行一初始化操作时,判断每一子卡类型是否相同,若每一子卡类型皆相同,则指定该子卡类型为一第一候选输出入类型,并且启动该等刀锋服务器,否则会发生子卡错误配置的状况,并且执行一子卡错误配置操作,判断该第一输出入模块的类型是否与该第一候选输出入类型相同,以及若该第一输出入模块类型与该第一候选输出入类型相同,则指定该第一输出入模块类型为一第二候选输出入类型,并且启动该第一输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
附图说明
图1示出了刀锋伺服系统的结构图。
图2示出了本发明实施例的刀锋伺服系统的结构示意图。
图3A与3B示出了本发明实施例的应用于刀锋伺服系统的错误检测方法的步骤流程图。
图4示出了本发明另一实施例的应用于刀锋伺服系统的错误检测方法的步骤流程图。
图5示出了本发明另一实施例的应用于刀锋伺服系统的错误检测方法的步骤流程图。
附图符号说明
100~刀锋伺服系统
110~刀锋服务器
120~电源供应器
130~风扇
140~交换器
150~管理模块
160~前面板
200~刀锋伺服系统
211..214~I/O隔间
221~主要基板管理控制器
222~从属基板管理控制器
230~KVM模块
具体实施方式
为了使本发明的目的、特征、及优点能更明显易懂,下文特举较佳实施例,结合图2至图5详细说明。本发明说明书提供不同的实施例来说明本发明不同实施方式的技术特征。其中,实施例中的各组件的配置为说明之用,并非用以限制本发明。且实施例中附图标号的部分重复,是为了简化说明,并非意指不同实施例之间的关联性。
本发明实施例披露了一种应用于刀锋伺服系统的错误检测方法与装置。
图2示出了本发明实施例的刀锋伺服系统的结构示意图。本发明实施例的刀锋伺服系统200至少包括4个I/O隔间211~214、一主要基板管理控制器(Baseboard Management Controller,以下简称为BMC)221、一从属BMC222、一KVM模块230以及多个刀锋服务器(未显示)。I/O隔间211~214分别可安插一输出入模块以做为网络联机之用。
在本发明实施例中,I/O模块的类型主要包括高速以太网络(GigabitEthernet,简称GbE)交换器(Switch,简称SW)模块、光纤信道穿透(FiberChannel Pass Through,FC-PT)模块、戴尔(Dell)动力连接高速以太网络(Power Connect GbE)模块、戴尔(Dell)实体电路板(PHY Board)模块、光纤信道交换器(Fiber Channel Switch,FC-SW)模块以及无限频带穿透(Infinite Band Pass Through,IB-PT)模块。
接下来,以下先分别针对在本文中可能会出现的硬件组件或软件单元进行解说,包括基板管理控制器(BMC)、子卡、光纤信道(Fiber Channel,以下简称为FC)模块、现场可替换单元(Field Replaceable Unit,以下简称为FRU)、KVM、模块管理刀锋(Modular Management Blade,以下简称为MMB)以及实体(Physical,以下简称为PHY)网络联机装置等六种网络通讯模块。
BMC整合于刀锋服务器中以支持智能平台管理接口(IntelligentPlatform Management Interface,以下简称为IPMI),其特色为具有嵌入式功能(embedded function)、多接口(multiple interfaces)以及大量的一般通用输出入(General Purpose I/O,GPIO)脚位(pin)。
子卡安插于刀锋服务器上,其与使用于机架式(rack)与直立式(tower)服务器中的协议控制数据(Protocol Control Information,以下简称为PCI)卡一样,差别只在于PCI卡是直接插在主机板上。子卡另外具有高速以太网络控制(PCI-X)或高速以太网络控制(PCI-Express)功能,并且可弹性使用于任何刀锋服务器中。
FC模块的运行速率为2.215Gigabits/每秒,其为一数据传输接口且兼容于数种传输协议,包括因特网协议(Internet Protocol,IP)与小型计算机系统接口(Small Computer System Interface,SCSI),并且具有整合单一网络连接的高速输出入与网络联机的功能。FC为一开放标准,其规范于美国国家标准学会(American National Standards Institute,ANSI)与开放系统互连(Open System Interconnection,OSI)标准中,其适用于铜线与光纤传输且有效传输距离可达10公里。
FRU为可移除或置换的硬件组件,其可为一电可擦除可编程只读存储器(Electrically Erasable Programmable Read Only Memory,EEPROM)。典型的交换器FRU记录交换器类型、产品名称以及媒体存取控制(Media AccessControl,MAC)等信息,而机箱(chassis)FRU记录机箱或MMB配置等信息。
KVM模块是利用一组PS2接口的键盘与鼠标以及显示(VGA)讯号来控制数个刀锋服务器,其中受控的刀锋服务器的输出系切换至KVB电路板并由MMB利用其对应的KVM控制电路进行控管。
MMB用以管理全部的刀锋机箱,并且提供一嵌入式网络服务器与其它网络服务以进行网络管理。
PHY网络联机装置为一以太网络穿透模块,其为一硬件联机装置,用以自刀锋服务器直接将数据讯号绕送至一外部网络联机装置。该穿透模块以一对一(one-to-one)的方式与刀锋服务器连接,如同利用网络线自一传统单机架服务器的网络卡连接至一外部网络装置。
本发明实施例的错误检测方法包括两阶段操作。第一阶段为MMB启动初始阶段,其包括两种状况,一为机箱以直流电源启动,另一为MMB启动或其自从属状态改变为主动状态。第二阶段为MMB一般操作阶段,其包括四种状况,包括移除I/O模块、插入I/O模块、移除配置子卡的刀锋服务器以及插入移除配置子卡的刀锋服务器。
接下来,定义在刀锋伺服系统中所使用到的子卡与I/O模块的类型,其是根据前述的六种网络通讯模块衍生而得,如下述表格所示。
类型1:高速以太网络(GbE)模块
  类型信息取得   类型
  候选I/O类型   自配置子卡的刀锋服务器   GbE
  I/O类型   自配置子卡的刀锋服务器   GbE
  I/O模块模型   无法取得   未知
类型2:高速以太网络交换器(GbE-SW)模块
  类型信息取得   类型
  候选I/O类型   自配置I/O模块的刀锋服务器   GbE-SW
  I/O类型   自配置I/O模块的刀锋服务器   GbE
  I/O模块模型   自配置I/O模块的刀锋服务器   SW
类型3:实体高速以太网络(GbE-PHY)模块
  类型信息取得   类型
  候选I/O类型   自配置I/O模块的刀锋服务器   GbE-PHY
  I/O类型   自配置I/O模块的刀锋服务器   GbE
  I/O模块模型   自配置I/O模块的刀锋服务器   PHY
类型4:光纤信道(FC)模块
  类型信息取得   类型
  候选I/O类型   自配置子卡的刀锋服务器   FC
  I/O类型   自配置子卡的刀锋服务器   FC
  I/O模块模型   尚未取得   未知
类型5:光纤信道交换器(FC-SW)模块
  类型信息取得   类型
  候选I/O类型   自配置I/O模块的刀锋服务器   FC-SW
  I/O类型   自配置I/O模块的刀锋服务器   FC
  I/O模块模型   自配置I/O模块的刀锋服务器   SW
类型6:光纤信道穿透(FC-PT)模块
  类型信息取得   类型
  候选I/O类型   自配置I/O模块的刀锋服务器   FC-PT
  I/O类型   自配置I/O模块的刀锋服务器   FC
  I/O模块模型   自配置I/O模块的刀锋服务器   PT
类型7:无限频带(IB)模块
  类型信息取得   类型
  候选I/O类型   自配置子卡的刀锋服务器   IB
  I/O类型   自配置子卡的刀锋服务器   IB
  I/O模块模型   尚未取得   未知
类型8:无限频带交换器(IB-SW)模块
  类型信息取得   类型
  候选I/O类型   自配置I/O模块的刀锋服务器   IB-SW
  I/O类型   自配置I/O模块的刀锋服务器   IB
  I/O模块模型   自配置I/O模块的刀锋服务器   SW
类型9:无限频带信道穿透(IB-PT)模块
  类型信息取得   类型
  候选I/O类型   自配置I/O模块的刀锋服务器   IB-PT
  I/O类型   自配置I/O模块的刀锋服务器   IB
  I/O模块模型   自配置I/O模块的刀锋服务器   PT
接下来,在叙述本发明实施例的错误检测方法前,先说明当发生错误配置的状况时需执行的错误配置操作,包括I/O模块错误配置操作、子卡错误配置操作以及机箱错误配置操作。I/O模块错误配置操作包括不允许启动I/O模块、I/O模块错误指示灯闪烁、令机箱错误指示灯闪烁以及产生MMB记录(log)。子卡错误配置操作包括不允许启动刀锋服务器、令刀锋服务器的错误指示灯闪烁与产生MMB记录(log),以及若刀锋服务器要求启动,则令其KVM指示灯闪烁,然后响应一错误讯息给BMC。机箱错误配置操作包括令机箱指示灯闪烁以及令所有配置子卡的刀锋服务器执行子卡错误配置操作。
根据上文的I/O模块类型定义与错误配置说明,以执行本发明实施例的错误检测方法。
图3A与3B示出了本发明实施例的应用于刀锋伺服系统的错误检测方法的步骤流程图。
刀锋伺服系统启动后,MMB即开始进行初始化的操作,等待30秒以确定所有I/O模块和刀锋服务器皆已被初始化(步骤S11)。在初始化过程须取得下列信息,包括自FRU取得所有I/O模块的类型信息、自智能平台管理总线(Intelligent Platform Management Bus,以下简称IPMB)取得所有刀锋服务器的电力消耗资讯以及自IPMB取得所有刀锋服务器的子卡信息。此外,当MMB重新启动(即重新启动刀锋伺服系统)或MMB自从属(slave)状态转换成为主要(master)状态(即主要MMB损坏或因其它原因而无法运作时),亦会执行步骤S11。
完成初始化后,判断是否启动配置子卡的刀锋服务器(步骤S12),若是,则执行步骤S13,否则执行步骤S22(如第3B图所示)。若所有配置子卡的刀锋服务器皆被启动,则取得子卡类型的相关信息(如GbE、FC或IB)并且指定为候选I/O类型。然后,自安插在刀锋伺服系统上的第一顺位的刀锋服务器开始,依序判断所有刀锋服务器上的子卡的类型是否皆相同(步骤S13)。若有其中一刀锋服务器配置不同类型的子卡,则会发生子卡错误配置(DCmis-configuration)的状况(步骤S14),并且执行前文所述的子卡错误配置操作。若皆配置同类型的子卡,然后启动所有刀锋服务器(步骤S15)。
接下来,判断安插于特定插槽(例如,插槽3(slot 3))的I/O模块类型是否与刀锋服务器上配置的子卡的类型相同(步骤S16)。若不同,则会发生I/O模块错误配置(I/O module mis-configuration)的状况(步骤S17),并且执行前文所述的I/O模块错误配置操作。若I/O模块的类型与子卡的类型相同,则取得该插槽3中的I/O模块类型的相关信息(如GbE-SW、FC-PT或IB-PT等)并且指定为候选I/O类型,然后启动安插于插槽3的I/O模块(步骤S18)。接下来,判断安插于插槽4(slot 4)的I/O模块类型是否与插槽3的I/O模块类型相同(步骤S19)。若不同,则会发生I/O模块错误配置的状况(步骤S20),并且执行前文所述的I/O模块错误配置操作。若安插于插槽3的I/O模块类型与安插于插槽4的I/O模块类型相同,则启动安插于插槽4的I/O模块(步骤S21)。
请参照第3B图,若不启动刀锋伺服系统中配置子卡的刀锋服务器,则接着判断所有刀锋服务器的子卡类型是否相同(步骤S22)。若有其中一刀锋服务器配置不同类型的子卡,则会发生机箱错误配置(chassismis-configuration)的状况(步骤S23),并且执行前文所述的机箱错误配置操作。若皆配置同类型的子卡,则取得所有子卡类型的相关信息(如GbE、FC或IB)并且指定为候选I/O类型,然后启动刀锋服务器(步骤S24)。接下来,判断安插于插槽3的I/O模块类型是否与刀锋服务器上配置的子卡的类型相同(步骤S25)。若不同,则会发生I/O模块错误配置的状况(步骤S26),并且执行前文所述的I/O模块错误配置操作。若I/O模块的类型与子卡的类型相同,则取得该插槽3中的I/O模块类型的相关信息(如GbE-SW、FC-PT或IB-PT)并且指定为候选I/O类型,然后启动安插于插槽3的I/O模块(步骤S27)。接下来,判断安插于插槽4的I/O模块类型是否与插槽3的I/O模块类型相同(步骤S28)。若不同,则会发生I/O模块错误配置的状况(步骤S29),并且执行前文所述的I/O模块错误配置操作。若安插于插槽3的I/O模块类型与安插于插槽4的I/O模块类型相同,则启动安插于插槽4的I/O模块(步骤S30)。
此外,当插槽3并无安插任何I/O模块而欲于插槽4安插任一I/O模块时,不论插槽4的I/O模块类型是否与子卡类型相同,皆无法启动该模块。并且,若安插于插槽4的I/O模块类型与子卡类型不同,则会发生I/O模块错误配置的状况,并且执行前文所述的I/O模块错误配置操作。
此外,当刀锋伺服系统中所有配置子卡的刀锋服务器皆被启动且插槽3与4并无安插任何I/O模块时,包含下列三种处理状况。若所有刀锋服务器的子卡类型皆相同,则取得子卡类型的相关信息并且指定为候选I/O类型,然后完成上述步骤11~步骤30的操作流程。若刀锋伺服系统中的刀锋服务器皆无配置子卡,则无法取得任何子卡类型的相关信息,故候选I/O类型为“未知”。若刀锋伺服系统中的刀锋服务器配置不同类型的子卡,则会发生机箱错误配置的状况,且候选I/O类型为“未知”,并且执行前文所述的子卡错误配置操作(如图3A所示)。
图4示出了本发明另一实施例的应用于刀锋伺服系统的错误检测方法的步骤流程图。
刀锋伺服系统的初始状态如下,刀锋伺服系统不具配置子卡的刀锋服务器,且插槽中无安插任何I/O模块(步骤S31)。当在插槽1或3安插任一I/O模块时(步骤S32),取得该插槽1或3中的I/O模块类型的相关信息(如GbE-SW、FC-PT或IB-PT)并且指定为候选I/O类型,然后启动安插于插槽1或3的I/O模块(步骤S33)。当在插槽2或4安插任一I/O模块时(步骤S34),因为此时插槽1或3并无安插任何I/O模块,故会发生I/O模块错误配置的状况(步骤S35),并且执行前文所述的I/O模块错误配置操作。当插入任一配置子卡的刀锋服务器(步骤S36),则取得子卡类型的相关信息(如GbE、FC或IB)并且指定为候选I/O类型,然后可启动该刀锋服务器(步骤S37)。
图5示出了本发明另一实施例的应用于刀锋伺服系统的错误检测方法的步骤流程图。
刀锋伺服系统的初始状态如下,刀锋伺服系统具有配置不同子卡类型的刀锋服务器,此时发生机箱错误配置的状况,故候选I/O类型为“未知”,且插槽中无安插任何I/O模块(步骤S41)。当安插任一I/O模块于插槽3时(步骤S42),则取得该插槽3中的I/O模块类型的相关信息(如GbE-SW、FC-PT或IB-PT)并且指定为候选I/O类型,然后启动插槽3中的I/O模块(步骤S43)。接下来,判断插槽3中的I/O模块类型是否与其中一子卡类型相同(步骤S44)。若不同,则机箱错误配置的状况依然存在(步骤S45)。若相同,则可启动配置与I/O模块类型相同的子卡类型的刀锋服务器(步骤S46),其它刀锋服务器则发生子卡错误配置的状况。
根据图4、5的实施流程图,下文将根据各种限定条件及其对应的实际操作状况做更详细的说明。
初始设定1,刀锋服务器无配置子卡且插槽1、3未安插I/O模块,故候选I/O类型为“未知”且无错误配置的状况发生。
当插槽2、4未安插I/O模块且欲安插一I/O模块至插槽2或4时,则发生I/O模块错误配置的状况,并且执行I/O模块错误配置操作。当安插一I/O模块至插槽1或3时,则将该模块类型指定为候选I/O类型并且启动之。当插入一配置子卡的刀锋服务器于刀锋伺服系统中时,则将该子卡类型指定为候选I/O类型。
初始设定2,刀锋伺服系统中具有配置不同类型子卡的刀锋服务器且插槽1、3未安插I/O模块,故候选I/O类型为“未知”且发生机箱错误配置的状况。
在移除一配置子卡的刀锋服务器后,若其它刀锋服务器皆配置相同类型的子卡,则取得该子卡类型以指定为候选I/O类型,且不再发生机箱错误配置的状况,并且可启动所有刀锋服务器。或是,在移除一配置子卡的刀锋服务器后,若仍有其中一刀锋服务器配置不同类型的子卡时,则机箱错误配置的状况依然存在。当插入一模块至插槽1或3,将该模块类型指定为候选I/O类型并且启动之。则与该候选I/O类型相同的刀锋服务器会被启动,而其它刀锋服务器则仍处于机箱错误配置状态。
初始设定3,刀锋伺服系统中具有配置相同类型子卡的刀锋服务器,故可取得子卡类型信息且指定为候选I/O类型,并且插槽1、2、3与4均未安插I/O模块。
当安插一与候选I/O类型相同的I/O模块至插槽1或3时,将该I/O模块类型指定为候选I/O类型。
当安插一I/O模块至插槽2或4时,由于此时插槽1或3并未安插任何I/O模块,故不论插槽2或4的I/O模块类型为何,皆会发生I/O模块错误配置的状况,并且须执行I/O模块错误配置操作。
当自刀锋伺服系统移除一配置子卡的刀锋服务器且使得目前无任何刀锋服务器安插于机箱上,则候选I/O类型变成“未知”。
当自刀锋伺服系统移除一配置子卡的刀锋服务器且目前仍有刀锋服务器安插于机箱上,则候选I/O类型不变。
当自刀锋伺服系统移除一配置子卡的刀锋服务器(其子卡类型为候选I/O类型),且所有现有的刀锋服务器配置相同类型但与候选I/O类型不同的子卡,故将现有刀锋服务器的子卡类型指定为候选I/O类型。
当自刀锋伺服系统移除一配置子卡的刀锋服务器(其子卡类型指定为候选I/O类型),且所有现有的刀锋服务器配置不同类型的子卡,则发生机箱错误配置的状况,故候选I/O类型改变为“未知”。
当安插一配置与候选I/O类型不同的子卡的刀锋服务器至刀锋伺服系统,则会发生子卡错误配置的状况,故执行子卡错误配置操作。
初始设定4,插槽3安插一I/O模块,且将该I/O模块类型指定为候选I/O类型。
状况1:若同时安插模块1与2(3与4),且没发生机箱错误配置的状况,则移除模块1或2(3或4)后候选I/O类型不变。
状况2:若同时安插模块1与2(3与4),但其中一模块发生机箱错误配置的状况,则移除未发生机箱错误配置状况的模块。
状况2-1:根据上述状况,若刀锋伺服系统仍有安插配置子卡的刀锋服务器且已启动,则将子卡类型指定为候选I/O类型。
状况2-1-1:根据上述状况,若插槽3中的I/O模块类型及子卡类型与候选I/O类型相同,则将该I/O模块类型指定为候选I/O类型。
状况2-1-2:根据上述状况,若插槽3中的I/O模块类型及子卡类型与候选I/O类型不同,则候选I/O类型不变。
状况2-1-3:根据上述状况,若安插任一I/O模块于插槽4(此时插槽3无安插任何I/O模块),则不论插槽4的I/O模块类型为何,皆会发生I/O模块错误配置的状况,且候选I/O类型不变。
状况2-2:若刀锋伺服系统有安插不同类型子卡的刀锋服务器且皆未启动,则会发生机箱错误配置的状况,且候选I/O类型变成“未知”。
状况2-3:若刀锋伺服系统有安插相同类型子卡的刀锋服务器,但子卡类型与候选I/O类型不同,则重新将该子卡类型指定为新的候选I/O类型。
状况2-4:刀锋伺服系统无安插任何配置子卡的刀锋服务器,
状况2-4-1:若有I/O模块安插于插槽3,则将该I/O模块类型指定为候选I/O类型。
状况2-4-2:若有I/O模块安插于插槽4(无I/O模块安插于插槽3),则发生I/O模块错误配置的状况,故候选I/O类型改变为“未知”。
状况3:若只安插I/O模块于插槽1或2(3或4)且未发生I/O模块错误配置的状况,则移除该安插的I/O模块。
状况4:若只安插I/O模块1或2(3或4)且没有发生I/O模块错误配置的状况,则移除该安插的I/O模块,且若刀锋伺服系统具有配置不同类型子卡的刀锋服务器且皆未启动,则会发生机箱错误配置的状况,故候选I/O类型不变。
状况5:若只安插I/O模块1或2(3或4),则移除该安插的I/O模块,且若刀锋伺服系统具有配置相同类型但与候选I/O类型不同的子卡的刀锋服务器,则重新将子卡类型指定为候选I/O类型。
状况6:若只安插I/O模块1或2(3或4),则移除该安插的I/O模块,且若无安插配置子卡的刀锋服务器,则候选I/O类型改变为“未知”。
状况7:若只安插I/O模块1或2(3或4),则插入与候选I/O类型不同的I/O类型的I/O模块,故发生I/O模块错误配置的状况且须执行I/O模块错误配置操作。
状况8:若插入与候选I/O类型不同的I/O构造类型的配置子卡的刀锋服务器,则发生子卡错误配置的状况且须执行子卡错误配置操作。
本发明实施例的应用于刀锋伺服系统的错误检测方法,可防止终端使用者安插与I/O模块不同类型的子卡,或者于刀锋服务器配置不同类型的子卡,其可在终端使用者使用错误类型的子卡或I/O模块时,发出警示讯息以警告终端使用者,并且执行相关的错误控制。
虽然本发明已以较佳实施例披露如上,然其并非用以限定本发明,本领域的技术人员在不脱离本发明的精神和范围的前提下,可作各种的更动与润饰,因此本发明的保护范围以本发明的权利要求为准。

Claims (20)

1.一种应用于刀锋伺服系统的错误检测方法,包括下列步骤:
提供一刀锋伺服系统,其配置多个刀锋服务器、一第一输出入模块、一第二输出入模块以及一第一管理模块,其中每一刀锋服务器皆配置一子卡;
当启动上述刀锋服务器时,上述第一管理模块判断每一子卡类型是否相同;
若每一子卡类型皆相同,则上述第一管理模块指定上述子卡类型为一第一候选输出入类型,并且启动上述刀锋服务器,否则会发生子卡错误配置的状况,并且执行一子卡错误配置操作;
上述第一管理模块判断上述第一输出入模块的类型是否与上述第一候选输出入类型相同;以及
若上述第一输出入模块类型与上述第一候选输出入类型相同,则上述第一管理模块指定上述第一输出入模块类型为一第二候选输出入类型,并且启动上述第一输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
2.如权利要求1所述的应用于刀锋伺服系统的错误检测方法,其还包括下列步骤:
上述第一管理模块判断上述第二输出入模块的类型是否与上述第二候选输出入类型相同;以及
若上述第二输出入模块的类型与上述第二候选输出入类型相同,则启动上述第二输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
3.如权利要求1所述的应用于刀锋伺服系统的错误检测方法,其中,上述子卡错误配置操作包括不允许启动上述刀锋服务器、令上述刀锋服务器的错误指示灯闪烁、产生一操作记录以及若当启动上述刀锋服务器时,令其键盘/显示/鼠标(KVM)指示灯闪烁并且响应一错误讯息。
4.如权利要求1所述的应用于刀锋伺服系统的错误检测方法,其中,上述输出入模块错误配置操作包括不允许启动上述输出入模块、令上述输出入模块的错误指示灯闪烁、令上述刀锋伺服系统的机箱上的错误指示灯闪烁以及产生一操作记录。
5.如权利要求1所述的应用于刀锋伺服系统的错误检测方法,其还包括下列步骤:
当上述刀锋服务器皆为非启动状态时,上述第一管理模块判断每一子卡类型是否相同;
若每一子卡类型皆相同,则上述第一管理模块指定上述子卡类型为一第三候选输出入类型,并且启动上述刀锋服务器,否则会发生机箱错误配置的状况,并且执行一机箱错误配置操作;
上述第一管理模块判断上述第一输出入模块的类型是否与上述第三候选输出入类型相同;以及
若上述第一输出入模块类型与上述第三候选输出入类型相同,则上述第一管理模块指定上述第一输出入模块类型为一第四候选输出入类型,并且启动上述第一输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
6.如权利要求5所述的应用于刀锋伺服系统的错误检测方法,其还包括下列步骤:
上述第一管理模块判断上述第二输出入模块的类型是否与上述第四候选输出入类型相同;以及
若上述第二输出入模块的类型与上述第四候选输出入类型相同,则启动上述第二输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
7.如权利要求5所述的应用于刀锋伺服系统的错误检测方法,其中,上述机箱错误配置操作包括令上述刀锋伺服系统的机箱上的指示灯闪烁以及令所有配置子卡的刀锋服务器执行子卡错误配置操作
8.如权利要求1所述的应用于刀锋伺服系统的错误检测方法,其更提供上述刀锋伺服系统一第二管理模块,其中上述第一管理模块为一主要模块,而上述第二管理模块为一从属模块,且当上述第一管理模块无法运作时,则上述第二管理模块改变成为上述主要模块。
9.一种应用于刀锋伺服系统的错误检测方法,包括下列步骤:
提供一刀锋伺服系统,其具有一第一插槽与一第二插槽且不具配置子卡的刀锋服务器,其中上述第一与第二插槽无安插任何输出入模块;以及
当安插一第一输出入模块于上述第一插槽时,指定上述第一输出入模块的类型为一第一候选输出入类型,并且启动上述第一输出入模块。
10.如权利要求9所述的应用于刀锋伺服系统的错误检测方法,其还包括当安插一第二输出入模块于上述第二插槽且上述第一插槽无安插任何输出入模块时,则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
11.如权利要求10所述的应用于刀锋伺服系统的错误检测方法,其中,上述输出入模块错误配置操作包括不允许启动上述输出入模块、令上述输出入模块的错误指示灯闪烁、令上述刀锋伺服系统的机箱上的错误指示灯闪烁以及产生一操作记录。
12.如权利要求9所述的应用于刀锋伺服系统的错误检测方法,其还包括当安插一配置子卡的刀锋服务器于上述刀锋伺服系统中时,将上述子卡的类型指定为一第二候选输出入类型,并且启动上述刀锋服务器。
13.一种应用于刀锋伺服系统的错误检测方法,包括下列步骤:
提供一刀锋伺服系统,其具有多设置不同子卡类型的刀锋服务器且发生机箱错误配置的状况;
安插一输出入模块于上述刀锋伺服系统,并且指定上述输出入模块的类型为一候选输出入类型;
启动上述输出入模块;
判断上述输出入模块类型是否与其中一子卡类型相同;
若上述输出入模块类型与其中一子卡类型相同,则可启动配置与上述输出入模块类型相同的上述子卡类型的刀锋服务器,且其它刀锋服务器发生子卡错误配置的状况;以及
若上述输出入模块类型与每一子卡类型不同,则上述机箱错误配置的状况依然存在。
14.一种应用于刀锋伺服系统的错误检测装置,包括:
多个刀锋服务器,其中每一刀锋服务器皆配置一子卡;
一第一输出入模块,耦接于上述刀锋服务器;
一第二输出入模块,耦接于上述刀锋服务器与上述第一输出入模块;以及
一第一管理模块,耦接于上述刀锋服务器、上述第一输出入模块与上述第二输出入模块,当执行一初始化操作时,判断每一子卡类型是否相同,若每一子卡类型皆相同,则指定上述子卡类型为一第一候选输出入类型,并且启动上述刀锋服务器,否则会发生子卡错误配置的状况,并且执行一子卡错误配置操作,判断上述第一输出入模块的类型是否与上述第一候选输出入类型相同,以及若上述第一输出入模块类型与上述第一候选输出入类型相同,则指定上述第一输出入模块类型为一第二候选输出入类型,并且启动上述第一输出入模块,否则会发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
15.如权利要求14所述的应用于刀锋伺服系统的错误检测装置,其中,若每一子卡类型非完全相同,则上述第一管理模块判断发生子卡错误配置的状况,并且执行一子卡错误配置操作。
16.如权利要求14所述的应用于刀锋伺服系统的错误检测装置,其中,若上述第一输出入模块类型与上述第一候选输出入类型不同,则上述第一管理模块判断发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
17.如权利要求14所述的应用于刀锋伺服系统的错误检测装置,其还包括上述第一管理模块判断上述第二输出入模块的类型是否与上述第二候选输出入类型相同,以及若上述第二输出入模块的类型与上述第二候选输出入类型相同,则启动上述第二输出入模块,否则判断发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
18.如权利要求14所述的应用于刀锋伺服系统的错误检测装置,其还包括当上述刀锋服务器皆为非启动状态时,上述第一管理模块判断每一子卡类型是否相同,若每一子卡类型皆相同,则指定上述子卡类型为一第三候选输出入类型,并且启动上述刀锋服务器,否则判断发生机箱错误配置的状况,并且执行一机箱错误配置操作,判断上述第一输出入模块的类型是否与上述第三候选输出入类型相同,以及若上述第一输出入模块类型与上述第三候选输出入类型相同,则指定上述第一输出入模块类型为一第四候选输出入类型,并且启动上述第一输出入模块,否则判断发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
19.如权利要求18所述的应用于刀锋伺服系统的错误检测装置,其还包括上述第一管理模块判断上述第二输出入模块的类型是否与上述第四候选输出入类型相同,以及若上述第二输出入模块的类型与上述第四候选输出入类型相同,则启动上述第二输出入模块,否则判断发生输出入模块错误配置的状况,并且执行一输出入模块错误配置操作。
20.如权利要求14所述的应用于刀锋伺服系统的错误检测装置,其还包括一第二管理模块,其中上述第一管理模块为一主要模块,而上述第二管理模块为一从属模块,且当上述第一管理模块无法运作时,则上述第二管理模块改变成为上述主要模块。
CNB2005100833529A 2005-07-12 2005-07-12 应用于刀锋伺服系统的错误检测方法与装置 Active CN100375961C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005100833529A CN100375961C (zh) 2005-07-12 2005-07-12 应用于刀锋伺服系统的错误检测方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005100833529A CN100375961C (zh) 2005-07-12 2005-07-12 应用于刀锋伺服系统的错误检测方法与装置

Publications (2)

Publication Number Publication Date
CN1896958A true CN1896958A (zh) 2007-01-17
CN100375961C CN100375961C (zh) 2008-03-19

Family

ID=37609486

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005100833529A Active CN100375961C (zh) 2005-07-12 2005-07-12 应用于刀锋伺服系统的错误检测方法与装置

Country Status (1)

Country Link
CN (1) CN100375961C (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102478905A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 数据中心
CN102478898A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 服务器整合系统
CN103544800A (zh) * 2012-07-10 2014-01-29 纬创资通股份有限公司 主动警示装置和用于服务器的主动警示装置的警示方法
CN104572360A (zh) * 2013-10-10 2015-04-29 英业达科技有限公司 电脑系统及服务器主板的验证方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1221904C (zh) * 2002-07-31 2005-10-05 广达电脑股份有限公司 刀锋型服务器的管理系统
US20040081104A1 (en) * 2002-10-29 2004-04-29 Weimin Pan Method and system for network switch configuration
US6931475B2 (en) * 2002-11-18 2005-08-16 Quanta Computer Inc. Blade server system with KVM switches
CN1257464C (zh) * 2002-12-18 2006-05-24 广达电脑股份有限公司 具有硬件备用结构的刀片型服务器管理系统
US6931458B2 (en) * 2003-04-03 2005-08-16 Dell Products, L.P. Apparatus and method for refreshing a terminal display in a multiple information handling system environment
US7035955B2 (en) * 2003-04-03 2006-04-25 Dell Products L.P. Blade server adapter card
US6915362B2 (en) * 2003-04-25 2005-07-05 Dell Products L.P. System to aggregate keyboard video mouse (KVM) control across multiple server blade chassis

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102478905A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 数据中心
CN102478898A (zh) * 2010-11-30 2012-05-30 英业达股份有限公司 服务器整合系统
CN102478905B (zh) * 2010-11-30 2014-06-11 英业达股份有限公司 数据中心
CN103544800A (zh) * 2012-07-10 2014-01-29 纬创资通股份有限公司 主动警示装置和用于服务器的主动警示装置的警示方法
CN103544800B (zh) * 2012-07-10 2015-08-19 纬创资通股份有限公司 主动警示装置和用于服务器的主动警示装置的警示方法
CN104572360A (zh) * 2013-10-10 2015-04-29 英业达科技有限公司 电脑系统及服务器主板的验证方法

Also Published As

Publication number Publication date
CN100375961C (zh) 2008-03-19

Similar Documents

Publication Publication Date Title
JP6515132B2 (ja) シャーシ管理システム及びシャーシ管理方法
TW591413B (en) A common boot environment for a modular server system
US20090024764A1 (en) Tracking The Physical Location Of A Server In A Data Center
CN1269033C (zh) 数据处理系统中逻辑分区之断电和/或再启动的方法和仪器
US8140871B2 (en) Wake on Lan for blade server
US8217531B2 (en) Dynamically configuring current sharing and fault monitoring in redundant power supply modules
CN101056205A (zh) 一种基于atca架构服务器管理方法、系统及其装置
TW201445325A (zh) 基板管理系統架構
CN1503946A (zh) 服务器阵列硬件结构和系统
US20120233452A1 (en) Reducing Current Draw Of A Plurality Of Solid State Drives At Computer Startup
EP2161647A1 (en) Power-on protection method, module and system
US20120134085A1 (en) Server integrating system
CN1896958A (zh) 应用于刀锋伺服系统的错误检测方法与装置
CN1937509A (zh) 一种获取单板框号的方法及系统
CN103138969B (zh) 服务器机架系统
CN111104359B (zh) 一种基板管理控制器访问方法与装置
CN1873586A (zh) 控制计算机系统中的能量消耗的计算机系统和方法
US7464257B2 (en) Mis-configuration detection methods and devices for blade systems
CN1783048A (zh) 对远程扩展设备的多主机支持
CN1700141A (zh) 集成式多单机系统
TW201327144A (zh) 雲端伺服系統的管理方法
WO2022078519A1 (zh) 一种计算机设备和管理方法
TW201407364A (zh) 伺服器啟動方法
CN1612540A (zh) 一种单板信息的配置方法及装置
CN114857069A (zh) 一种风扇冶具板

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant