CN101101558A - 用于在电力中断后进行初始化的方法和系统 - Google Patents

用于在电力中断后进行初始化的方法和系统 Download PDF

Info

Publication number
CN101101558A
CN101101558A CNA2007101268559A CN200710126855A CN101101558A CN 101101558 A CN101101558 A CN 101101558A CN A2007101268559 A CNA2007101268559 A CN A2007101268559A CN 200710126855 A CN200710126855 A CN 200710126855A CN 101101558 A CN101101558 A CN 101101558A
Authority
CN
China
Prior art keywords
primary processor
operating system
electric power
processor
described primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101268559A
Other languages
English (en)
Other versions
CN101101558B (zh
Inventor
B·W·雅各布斯
G·D·安德森
S·A·阿加
W·A·布里斯顿
W·T·特鲁斯克夫斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101101558A publication Critical patent/CN101101558A/zh
Application granted granted Critical
Publication of CN101101558B publication Critical patent/CN101101558B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy

Abstract

本发明提供了一种用于在电力中断后进行初始化的方法和系统。该方法包括:响应于在服务处理器处启动初始化序列,如果当操作系统在主处理器上执行的最近时刻,中断了到所述主处理器的电力,则接通到所述主处理器的电力,启动所述操作系统在所述主处理器上执行,向所述操作系统提供来自所述服务处理器的非易失性存储器的数据,并且重置所述服务处理器,其重新启动所述初始化序列。如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前正在所述主处理器上执行,则启动所述服务处理器中的监控功能,其对计算机系统处的错误进行监控。

Description

用于在电力中断后进行初始化的方法和系统
技术领域
本发明的实施例一般涉及计算机系统,并且更具体地,涉及在电力中断后通过服务处理器对计算机系统进行初始化。
背景技术
通常将1948年对EDVAC计算机系统的开发引用作为计算机时代的开端。从那时起,计算机系统就已经演进为非常复杂的设备,并且可以在很多不同的设置中发现计算机系统。计算机系统通常包括硬件(例如,半导体和电路板)和软件(也被称为计算机程序)的组合。软件在被称为处理器的一类硬件上执行。
现代计算机系统通常具有多于一个的处理器,并且一个或多个处理器可以是服务处理器,其是这样的辅助处理器,即该处理器执行专门化控制代码,以便管理系统初始程序装入(IPL)以及监控、诊断和配置计算机系统的硬件。在近几年,服务处理器的角色已经扩展到甚至提供更先进的RAS(可靠性、可用性和可服务性)和系统管理功能。
这些附加的功能通常增加了服务处理器实现其最基本的功能(为计算机系统通电并进行初始化)所需要的时间。在诸如临时电力故障的情况下,用户通常更希望尽快为计算机系统通电、初始化并运行,而附加的服务处理器功能则处于次要的优先级。在试图避免计算机系统失去电力以及需要重新初始化方面,当前技术试图通过减少服务处理器所提供的先进功能,或者通过在附加的备用电源上花费更多资金,来解决初始化时间增加这一问题。
因而,所需要的是这样的解决方案,即,以可接受的代价在减少初始化时间的同时仍然提供先进的服务处理器功能。
发明内容
提供了一种方法、装置、系统和信号承载介质。在实施例中,响应于对初始化序列的启动,如果当操作系统在主处理器上执行的最近时刻,中断了到计算机系统的所述主处理器的电力,则接通到所述主处理器的电力,启动所述操作系统在所述主处理器上执行,向所述操作系统提供来自服务处理器的非易失性存储器的数据,并且重置所述服务处理器,其重新启动所述初始化序列。如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前正在所述主处理器上执行,则启动所述服务处理器中的监控功能,其对所述计算机系统处的错误进行监控。如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则接通到所述主处理器的电力,启动所述操作系统在所述主处理器上执行,启动所述服务处理器处的监控功能,基于所述计算机系统的硬件来确定数据,并且将所述数据保存到所述服务处理器的非易失性存储器。以这样的方式,服务处理器不但可以提供在此期间启动了所述操作系统并且提供了所述服务处理器的全部功能的正常初始化序列,而且可以提供在电力中断后使用的替换初始化序列,其中启动了所述操作系统,但是所述服务处理器的全部功能被延迟直到所述操作系统执行之后。
附图说明
下文结合附图描述本发明的各种实施例,其中:
图1描述了用于实现本发明实施例的示例系统的高层级框图;
图2根据本发明的实施例描述了示例系统的所选组件的框图;
图3根据本发明的实施例描述了用于服务处理器初始化序列的示例处理的流程图;
图4根据本发明的实施例描述了用于启动操作系统的示例处理的流程图;
图5根据本发明的实施例描述了用于启动服务处理器的全部功能的示例处理的流程图;以及
图6描述了用于断开计算机系统电力的示例处理的流程图。
然而,要注意,附图仅仅阐明了本发明的示例实施例,并且由于本发明可以容许其它同样有效的实施例,因此并不认为对本发明的范围进行了限制。
具体实施方式
参照附图,其中在多个视图中,相同的数字表示相同的部分,图1根据本发明的实施例,描述了表示连接至网络130的计算机系统100的高层级框图。在实施例中,可以由纽约Armonk的国际商业机器(IBM)所提供的eServer iSeries计算机系统来实现计算机系统100的硬件组件。然而,本领域的技术人员可以理解,本发明实施例的机制和装置同样适用于任何适当的计算机系统。
计算机系统100的主要组件包括一个或多个主处理器101、主存储器102、存储器控制器106、终端接口111、存储接口112、I/O(输入/输出)设备接口113、通信/网络接口114和服务处理器115,它们全部通过存储器总线103、I/O总线104和I/O总线接口单元105相耦合,用于进行组件间通信。
计算机系统100含有一个或多个通用可编程中央处理器(CPU)101A、101B和101C,在这里总称为主处理器101。在实施例中,计算机系统100含有多个处理器101A、101B和101C,典型的是相对大的系统;但是,在另一实施例中,计算机系统100可选地可以是单个CPU系统。每个主处理器101执行存储在主存储器102中的指令,并且可以包括一级或多级单板高速缓存。
主存储器102是用于存储或编码数据和程序的随机访问半导体存储器。在另一实施例中,主存储器102代表计算机系统100的整个虚拟存储器,并且还可以包括耦合于计算机系统100或者通过网络130连接的其它计算机系统的虚拟存储器。主存储器102在概念上是单个的单片实体,但在其它实施例中,主存储器102是更复杂的配置,例如分级高速缓存和其它存储设备。例如,主存储器102可以存在于多级高速缓存中,并且这些高速缓存可以按照功能被进一步划分,因此一个高速缓存保存指令,而另一个则保存非指令数据,其由处理器使用。主存储器102可以进一步分布于不同的CPU或CPU组并且与其关联,如在各种所谓的非一致存储访问(NUMA)计算机体系结构中的任何一种中所知的。
主存储器102存储或解码操作系统170和应用172。尽管将操作系统170和应用172阐述为含于计算机系统100的主存储器102内,然而在其它实施例中,一些或者全部的操作系统170和应用172可以在不同的计算机系统上,并且可以被远程访问,例如通过网络130。计算机系统100可以使用虚拟寻址机制,其允许计算机系统100的程序运转就像其仅对大的单个存储实体进行访问,而不是对多个较小的存储实体进行访问。因而,虽然将操作系统170和应用172阐述为含于主存储器102内,但是,这些元件不必同时全部都完全含于相同的存储设备中。此外,尽管将操作系统170和应用172阐述为分离的实体,但是在其它实施例中,它们中的一些、它们中的一些的一部分,或者它们二者可以被封装在一起。
操作系统170是这样的程序,即当该程序被初始装入计算机系统100并且由服务处理器115启动在主处理器101上执行之后,其管理计算机系统100中所有的其它程序(例如,应用172)。应用172通过对服务进行请求(例如通过定义的应用程序接口(API))来利用操作系统170。在实施例中,用户还可能能够通过诸如命令语言或图形用户接口这样的用户接口(例如,通过终端121、122、123或124)来直接与操作系统170进行交互。操作系统170实现基本任务,例如,识别来自输入设备的输入、向输出设备发送输出、管理文件和目录,以及控制外围设备(例如,磁盘驱动器125、126和127以及打印机128)。在各种实施例中,操作系统170可以进一步管理多用户操作(多于一个的用户并发地访问计算机系统100)、多处理操作(在多于一个的处理器101上运行程序)、多任务操作(并发地运行多于一个的程序),以及多线程操作(并发地运行单个程序的不同部分)。在实施例中,计算机系统100可以包括多个操作系统170,其在不同时间执行或者通过受控于管理体的分区来并发地执行。
在实施例中,使用国际商业机器公司所提供的i5OS操作系统可以实现操作系统170,但在其它的实施例中,操作系统170可以是Linux、AIX、UNIX、微软视窗(Microsoft Windows)或者任何适当的操作系统。操作系统170和应用172包括能够在主处理器101上执行的指令,或是能够由在主处理器101上执行的指令解释的语句。在各种实施例中,应用172可以是用户应用或者第三方应用。
存储器总线103提供数据通信路径,用于在主处理器101、主存储器102(通过存储器控制器106)以及I/O总线接口单元105之间传送数据。I/O总线接口单元105进一步耦合于系统I/O总线104,系统I/O总线104用于向各种I/O单元传送数据和从各种I/O单元传送数据。I/O总线接口单元105通过系统I/O总线104与多个I/O接口单元111、112、113和114通信,该多个I/O接口单元也被称为I/O处理器(IOP)或I/O适配器(IOA)。系统I/O总线104可以是例如工业标准PCI(外设部件接口)总线,或者任何其它适当的总线技术。
I/O接口单元支持与各种存储器和I/O设备的通信。例如,终端接口单元111支持一个或多个用户终端121、122、123和124的附着。存储接口单元112支持一个或多个直接访问存储设备(DASD)125、126和127(它们通常是旋转式磁盘驱动存储设备,尽管它们也可以可选地是其它设备,包括被配置作为主机的单个大存储设备的磁盘驱动阵列(arrays of diskdrive))的附着。根据需要,主存储器102的内容可以存储到直接访问存储设备125、126和127,或者从直接访问存储设备125、126和127检索。
I/O设备接口113提供到任何一个各种其它的输入/输出设备或者其它类型的设备的接口。在图1的示例性实施例中示出了两种这样的设备,打印机128和传真机129,但在其它的实施例中,可以存在很多其它这样的设备,其可以是不同的类型。网络接口114提供从计算机系统100到其它数字设备和计算机系统的一个或多个通信路径;这样的路径包括例如一个或多个网络130。
尽管在图1中示出了存储器总线103作为相对简单的单总线结构,其在处理器101、主存储器102(通过存储器控制器106)和I/O总线接口105之间提供了直接通信路径,然而实际上,存储器总线103可以包括多个不同的总线或通信路径,可以以各种形式中的任何一种对其进行排列,例如在分级、星型或者Web配置中的点到点链路、多分级总线、平行和冗余路径,或者任何其它适当类型的配置。此外,虽然将I/O总线接口105和I/O总线104示为单个相应的单元,但是计算机系统100实际上可以含有多个I/O总线接口单元105和/或多个I/O总线104。虽然示出了多个I/O接口单元,其将系统I/O总线104从到达各种I/O设备的各种通信路径分离开来,但是在其它的实施例中,一些或者全部I/O设备直接连接至一个或多个系统I/O总线。
服务处理器115连接至I/O总线104。在其它实施例中,除了通过I/O总线104之外,服务处理器115可以以其它方式耦合于计算机100中的各种其它的硬件组件。服务处理器115是这样的辅助处理器,即其执行专门化控制代码,以便管理系统初始程序装入(IPL),以及监控、诊断和配置计算机系统100的硬件。例如,服务处理器115可以监控一个或多个主处理器101A、101B和101C及其关联子系统的环境和健康、装载固件映像(firmware image)、控制固件配置(例如,逻辑分区特性),以及连接至提供系统管理功能接口的终端(121、122、123或124)。如果主处理器101或子系统(例如,主存储器102、终端接口111、存储接口112、I/O设备接口113和通信/网络接口114)发生实际的或预测的问题,服务处理器115可以向系统管理员报警和/或纠正该问题。下面参照图2进一步描述服务处理器115。
图1中所描述的计算机系统100具有多个附属终端121、122、123和124,例如可以是典型的多用户“大型(mainframe)”计算机系统。尽管本发明并不限于任何特定大小的系统,然而通常,在这样的情况下,附属设备的实际数目大于图1所示的数目。可选地,计算机系统100可以是单用户系统,通常仅含有单个用户显示器和键盘输入,或者可以是服务器或这样的类似设备,即其具有少量或者不具有直接用户接口,但却接收来自其它计算机系统(客户机)的请求。在其它实施例中,计算机系统100可以作为个人计算机、便携式计算机、膝上型计算机或笔记本计算机、PDA(个人数字助理)、平板计算机(tablet computer)、袖珍计算机、电话、寻呼机、汽车、电话会议系统、器具(appliance)或者任何其它适当类型的电子设备来实现。
网络130可以是任何合适的网络或者网络的组合,并且可以支持任何适当的协议,该协议适于通往/来自计算机系统100的数据和/或代码的通信。在各种实施例中,网络130可以代表存储设备或者存储设备的组合,直接或者间接地连接至计算机系统100。在实施例中,网络130可以支持Infiniband体系结构。在另一实施例中,网络130可以支持无线通信。在另一实施例中,网络130可以支持硬连线通信,例如电话线路或电缆。在另一实施例中,网络130可以支持以太网IEEE(电气和电子工程师协会)802.3x规范。在另一实施例中,网络130可以是因特网并且可以支持IP(网际协议)。
在另一实施例中,网络130可以是局域网(LAN)或者广域网(WAN)。在另一实施例中,网络130可以是热点服务提供商网络。在另一实施例中,网络130可以是内联网。在另一实施例中,网络130可以是GPRS(通用分组无线服务)网络。在另一实施例中,网络130可以是FRS(家庭无线电服务)网络。在另一实施例中,网络130可以是任何适当的蜂窝数据网络或者基于单元(cell-based)的无线网络技术。在另一实施例中,网络130可以是IEEE 802.11B无线网络。在又一实施例中,网络130可以是任何合适的网络或者网络的组合。尽管示出了一个网络130,然而在其它实施例中,可以出现任意数目的(相同或者不同类型的)网络。
应当理解,图1旨在从高层级描述计算机系统100和网络130的代表性主要组件,单独的组件可以比图1中所表示的更复杂,可以出现不同于图1中所示的组件或者除了图1中所示的之外的组件,并且这样的组件的数目、类型和配置可以变化。在这里公开了这样的附加复杂性或附加变化的几个特定的例子;要理解,这些仅是作为示例,并且不一定只是这样的变体。
图2根据本发明的实施例描述了计算机系统100的所选组件的框图。计算机系统100的所选组件包括服务处理器115、电源225和230、风扇235和电子组件240。服务处理器115连接至电源225,并从电源225接收电力。电源225向服务处理器115提供备用电力,这意味着一将市电(utilitypower)应用于系统的电源线(line cord),服务处理器115就从电源225接收电力。服务处理器115进一步连接至电源230和风扇235并且控制它们。电源230连接至计算机系统100的电子组件240并且为其提供电力,如先前参照图1所描述的,该计算机系统100的电子组件240可以包括处理器101、主存储器102、存储器总线103、I/O总线104、I/O总线接口单元105、存储器控制器106、终端接口111、存储接口112、I/O设备接口113、通信/网络接口114、终端121、122、123和124、存储设备125、126和127、打印机128以及传真机129中的一些、任何一个或全部。风扇235为计算机系统100提供气流和冷却。
服务处理器115包括处理器201和非易失性存储器202。处理器201类似于主处理器101。非易失性存储器202是用于存储或编码数据和程序的随机访问半导体存储器。非易失性存储器202在没有电力的情况下保留其内容。非易失性存储器202包括控制代码205、关键数据210、替换模式(alternate mode)指示器215和系统电力指示器220。
在实施例中,控制代码205包括能够在处理器201上执行的指令或者能够由在处理器201上执行的指令解释的语句,以便实现以下参照图3、图4、图5和图6进一步描述的功能。在另一实施例中,可以用微码来实现控制代码205。在另一实施例中,可以通过逻辑门和/或其它适当的硬件技术来以硬件实现控制代码205。
在实施例中,关键数据210可以包括芯片初始化数据245、生存期产品数据(vital product data)250和系统配置数据255中的一些或全部。芯片初始化数据245是用于对芯片(例如,主处理器101、I/O总线接口105或存储器控制器106)的操作进行初始化的数据。生存期产品数据(VPD)250使得计算机系统100或计算机系统100的组件能够被标识、执行和/或管理。生存期产品数据250可以是关于计算机系统100本身的信息、关于主存储器102中所存储的组件(例如,应用172)的信息,或者关于电子设备这样的组件(例如,处理器101、主存储器102、存储器总线103、I/O总线104、I/O总线接口单元105、存储器控制器106、终端接口111、存储接口112、I/O设备接口113、通信/网络接口114、终端121、122、123和124、存储设备125、126和127、打印机128以及传真机129)的信息。典型的生存期产品数据信息包括产品型号、唯一序列号、产品发布级别、维护级别和/或对于产品或组件类型特定的其它信息。
系统配置数据255是由操作系统170或管理计算机系统100的分区的管理体所使用的数据,是描述操作系统170所使用的物理地址范围的数据,或者是用于系统策略(例如,固件更新策略,或者对计算机系统100是否由硬件管理控制台管理的指示)的用户定义的设置。
替换模式指示器215指示计算机系统100是否正在以正常模式执行,即操作系统170是否正在主处理器101上执行,以及服务处理器115的全部功能(包括监控功能)是否正在执行。系统电力指示器220指示是否正在向计算机系统100和主处理器101供应电力。因而,如果在服务处理器115的初始化序列启动的时候,替换模式指示器215和系统电力指示器220都打开,那么当操作系统170在主处理器101上执行的最近时刻(上次)电力中断了。如果当操作系统170还在主处理器101上执行的时候,失去了从电源230到电子组件240的电力,则电力中断。从电源230到电子组件240的电力中断意味着已经发生了对市电的失去,导致从电源225到服务处理器115的电力中断。电力中断不同于正常的断电序列,在正常的断电序列中,在切断电源230之前操作系统170就停止了执行。
可以采用多种方式来实现图1和图2中所阐述的各种软件组件以及实现的本发明的各种实施例,包括使用各种计算机软件应用、例程、组件、程序、对象、模块、数据结构等,在下文中称为“计算机程序”,或简称为“程序”。计算机程序通常包括一个或多个指令,其在各种时间驻留于计算机系统100内的各种存储器和存储设备中,并且,当计算机系统100中的一个或多个处理器101和/或201读取和执行该指令的时候,其使得计算机系统100实现这样的步骤,即该步骤是执行包括本发明实施例的各方面的步骤或元素所必需的步骤。
此外,虽然已经描述了本发明的实施例并且在下文中将在全功能计算机系统的情况下对其进行描述,但是本发明的各种实施例能够以各种形式分布为程序产品,并且不管用于实际实现该分布的信号承载介质的特定类型是什么,本发明也同样适用。通过可以在操作上或者在通信上(直接地或间接地)连接至处理器101和/或201的各种有形的信号承载介质,可以将定义该实施例的功能的程序传送给计算机系统100。信号承载介质可以包括但不限于:
(1)永久存储于不可重写存储介质(例如,附于计算机系统或在计算机系统内的只读存储设备,如可由CD-ROM驱动器读取的CD-ROM)上的信息;
(2)存储于可重写存储介质(例如,硬盘驱动器(例如DASD 125、126或127)、CD-RW、非易失性存储器202或磁盘)上的可变信息;或者
(3)由通信介质传送至计算机系统100的信息,例如通过计算机或电话网(例如,网络130)。
当这样的有形信号承载介质被编码具有或者携带了指引本发明的功能的计算机可读和可执行指令时,其代表了本发明的实施例。
还可以将本发明的实施例交付作为与客户公司、非盈利组织、政府实体、内部组织结构等的服务约定的一部分。这些实施例的方面可以包括:配置计算机系统以执行文中所描述的一些或全部方法,以及部署实现文中所描述的一些或全部方法的软件系统和Web服务。这些实施例的方面还可以包括:分析客户公司、创建对分析进行响应的建议、生成实现部分建议的软件、将软件集成到现有过程和基础设施中、计量对文中所描述的方法和系统的使用、向用户分配花费,以及针对用户对这些方法和系统的使用向用户计费。
此外,基于这样的应用可以标识在下文中所描述的各种程序,即为了该应用而在本发明的特定实施例中实现了所述各种程序。但是,以下任何特定的程序术语仅是出于方便而使用,并且因而本发明的实施倒不应当限于只是在由这样的术语所标识和/或暗指的任何特定应用中的使用。
图1和图2中所阐述的示例性环境并不旨在限制本发明。实际上,在不背离本发明范围的情况下,可以使用其它可选的硬件和/或软件环境。
图3根据本发明的实施例描绘了用于服务处理器初始化序列的示例处理的流程图。控制开始于块300。控制然后继续到块305,在这里,服务处理器115从电源225接收电力,并且从不接收电力的状态转移到接收电力的状态。控制然后继续到块310,在这里,控制代码205启动在处理器201上的执行,并且开始初始化或引导序列。控制然后继续到块315,在这里,通过确定替换模式指示器215和系统电力指示器220是否都是打开的,控制代码205确定:当操作系统170在主处理器101上执行的最近时刻,是否中断了或失去了到主处理器101的电力。在操作系统170关闭、结束执行或者完成其终止序列之前,如果失去了从电源230到主处理器101的电力,则中断或失去了电力。失去从电源230到主处理器101的电力还意味着失去了从电源225到服务处理器115的电力。
如果在块315处的确定为真,那么当操作系统170在主处理器101上执行的最近时刻,中断了到主处理器101的电力(替换模式指示器215和系统电力指示器220都打开),因此控制继续到块320,在这里,控制代码205接通电源230和风扇235。控制然后继续到块325,在这里,控制代码205开启系统电力指示器220,指示将电力供应给电子组件240,例如主处理器101。控制然后继续到块330,在这里,控制代码205从服务处理器115的非易失性存储器202读取关键数据210(芯片初始化数据245、生存期产品数据250和系统配置数据255),并且基于关键数据210对系统硬件(例如,电子组件240)进行初始化,例如通过将来自关键数据210的信息发送至系统硬件。
控制然后继续到块335,在这里,控制代码205启动在主处理器101上执行的操作系统170,并且向操作系统170提供关键数据210。操作系统170使用关键数据210来配置和控制系统硬件。控制然后继续到块340,在这里,控制代码205将替换模式指示器215设置为关,其指示完成替换模式初始化序列。控制然后继续到块345,在这里,控制代码205进行重置操作,其重置服务处理器并且使控制返回到块310,在那里,服务处理器115的初始化序列再次启动。因而,块320、325、330、335、340和345代表服务处理器115的替换模式初始化序列,其中,服务处理器115启动在主处理器101上执行的操作系统170,并且根据非易失性存储器202中所保存的关键数据210来对操作系统170进行初始化,但并未启动服务处理器115的全部功能。下面参照图6进一步描述,在电力中断(当操作系统170正在主处理器101上执行的时候,中断来自电源230的电力)之后是替换模式初始化序列,而不是正常的断电序列。
如果在块315处的确定为假,那么当操作系统170在主处理器101上执行的最近时刻,并没有中断到主处理器101的电力(替换模式指示器215和系统电力指示器220中的至少一个是关闭的),因此控制继续到块350,在这里,控制代码205确定操作系统170当前是否正执行于(已执行于)主处理器101上。如果服务处理器115先前实现了块320、325、330、335、340和345所表示的替换初始化序列,则操作系统170当前正在执行。
如果在块350处的确定为真,那么操作系统170当前正执行于(已执行于)主处理器101上,并且先前实现了替换初始化序列,因此控制继续到块355,在这里,控制代码205启动服务处理器115的全部功能(包括对计算机系统100处的错误进行监控的监控功能),如以下参照图5进一步描述的。控制然后继续到块399,在这里,图3的逻辑返回。因而,其后跟随块355的块350的操作表示跟随在替换模式初始化序列之后的正常模式初始化序列,其中,不需要启动操作系统170,因为其先前作为替换模式初始化序列的一部分被启动了。
如果在块350处的确定为假,那么操作系统170当前没有执行于(还未执行于)主处理器101上,因此控制继续到块360,在这里,控制代码205启动在主处理器101上执行的操作系统170,并且启动服务处理器的全部功能,包括对计算机系统100处的错误进行监控的监控功能,如以下参照图4进一步描述的。控制然后继续到块399,在这里,图3的逻辑返回。因而,其后跟随块360的块350的组合操作表示跟随在正常断电序列之后、但并不跟随在替换模式初始化序列之后的正常初始化序列(如以下参照图6进一步描述的)。(在块360)需要启动操作系统170,因为自从接收电力以来的时间内(如先前参照块305所描述的),先前并未实现替换模式初始化序列。
图4根据本发明的实施例描述了用于启动操作系统170的执行以及服务处理器115的全部功能的示例处理的流程图。控制开始于块400。控制然后继续到块405,在这里,控制代码205启动服务处理器115与网络接口114之间的通信接口。控制然后继续到块410,在这里,控制代码205向用户给出对计算机系统100通电的选项,例如,通过在经由终端121、122、123或124所呈现的用户接口上显示选项。在另一实施例中,通过网络130可以接收对系统通电的命令。控制然后继续到块415,在这里,控制代码205确定是否从用户接口接收到对系统通电的命令。
如果在块415处的确定为真,那么通过用户接口接收对系统通电的命令,因此控制继续到块420,在这里,控制代码205接通电源230(其供应电力给计算机系统100的电子组件240,包括主处理器101)和风扇235。控制然后继续到块425,在这里,控制代码205开启系统电力指示器220,指示对计算机系统100通电。
控制然后继续到块430,在这里,控制代码205启动控制代码205中的监控功能,其对计算机系统100处的电力和热量错误进行监控。控制然后继续到块435,在这里,控制代码205检查计算机系统100的硬件组件,基于对计算机系统硬件的检查来确定关键数据210,并且将关键数据210保存到非易失性存储器202,作为芯片初始化数据245、生存期产品数据250和系统配置数据255。控制然后继续到块440,在这里,控制代码205使用关键数据210来初始化计算机系统100的系统硬件。例如,控制代码205将芯片初始化数据245、生存期产品数据250和配置数据255中所指示的值存储到计算机系统100的系统硬件(电子组件240)中。
控制然后继续到块445,在这里,控制代码205启动控制代码205中的监控功能,其对来自主处理器101、I/O总线104和存储器控制器106的错误进行监控。控制然后继续到块450,在这里,控制代码205启动在主处理器101上执行的操作系统170,并且向操作系统170提供关键数据210(芯片初始化数据245、生存期产品数据250和配置数据255)。操作系统170使用关键数据210来控制计算机系统100。控制然后继续到块455,在这里,控制代码205建立与操作系统170的通信。控制然后继续到块460,在这里,控制代码205将替换模式指示器215设置为开,其指示操作系统170以及服务处理器115的全部功能正在执行。控制然后继续到块499,在这里,图4的逻辑返回。
如果在块415处的确定为假,那么通过用户接口并未接收到对系统通电的命令,因此控制返回到块410,如以上在先前所描述的。
图5根据本发明的实施例描述了用于启动服务处理器115的全部功能的示例处理的流程图。控制开始于块500。控制然后继续到块505,在这里,控制代码205启动服务处理器115与网络接口114之间的接口。控制然后继续到块510,在这里,控制代码205启动控制代码205中的监控功能,其对计算机系统100处的电力和热量错误进行监控。控制然后继续到块515,在这里,控制代码205启动控制代码205中的监控功能,其对来自主处理器101的错误进行监控。控制然后继续到块520,在这里,控制代码205启动控制代码205中的监控功能,其对来自I/O总线104的错误进行监控。控制然后继续到块525,在这里,控制代码205启动控制代码205中的监控功能,其对来自存储器控制器106的错误进行监控。控制然后继续到块530,在这里,控制代码205建立与操作系统170的通信。控制然后继续到块535,在这里,控制代码205将替换模式指示器215设置为开,其指示操作系统170以及服务处理器115的全部功能正在执行。控制然后继续到块599,在这里,图5的逻辑返回。
图6描述了用于断开计算机系统100的电力的示例处理的流程图。控制开始于块600。控制然后继续到块605,在这里,控制代码205接收断电命令,例如从在终端121、122、123或124上呈现的用户接口或者从网络130。控制然后继续到块610,在这里,控制代码205关闭操作系统170,使得操作系统170停止在主处理器101上执行。控制然后继续到块615,在这里,控制代码205将系统电力指示器220设置为关。控制然后继续到块620,在这里,控制代码205将替换模式指示器215设置为关。控制然后继续到块625,在这里,控制代码205切断风扇235和电源230,这停止了到主处理器101的电力。由于并未失去市电,因此电源225继续向服务处理器115供电。控制然后继续到块699,在这里,图6的逻辑返回。
在先前对本发明的示例性实施例的详细描述中,对附图进行了参照(其中,相同的数字代表相同的元件),附图形成了本文的一部分,并且其中通过图解,示出了可以实践本发明的特定的示例性实施例。对这些实施例进行了足够详尽的描述,从而使得本领域的技术人员能够实践本发明,但是在不背离本发明的范围的情况下,可以利用其它的实施例,并且可以进行逻辑的、机械的、电的以及其它的改变。在先前的描述中,陈述了许多特定的细节来提供对本发明的实施例的彻底理解。但是,可以不按照这些特定的细节来实践本发明。在其它的实例中,为了不模糊本发明,并未详细示出公知的电路、结构和技术。
在本说明书内所使用的“实施例”一词的不同实例并不一定指的是相同的实施例,但是它们可以指的是相同的实施例。文中所说明或描述的任何数据和数据结构仅仅作为例子,并且在其它的实施例中,可以使用不同数量的数据、数据类型、字段、许多字段和各类字段、字段名、许多行(row)和各类行、记录、条目或数据组织。此外,可以将任何数据与逻辑相结合,从而使得单独的数据结构并不是必须的。因此,不应在限制意义上感受先前的详细描述,并且本发明的范围由所附权利要求唯一限定。

Claims (20)

1.一种方法,其包括:
在服务处理器处启动初始化序列;
响应于所述启动,如果当操作系统在主处理器上执行的最近时刻,中断了到所述主处理器的电力,则接通到所述主处理器的电力,并且启动在所述主处理器上执行的所述操作系统;以及
如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前正在所述主处理器上执行,则启动在所述服务处理器处的监控功能,其中所述监控功能对错误进行监控。
2.根据权利要求1的方法,其进一步包括:
如果当所述操作系统在所述主处理器上执行的最近时刻,中断了到所述主处理器的电力,则在启动所述操作系统之后重置所述服务处理器,其中,响应于所述重置进行对所述初始化序列的启动。
3.根据权利要求1的方法,其进一步包括:
在所述服务处理器处接收电力,其中,响应于对所述电力的接收进行对所述初始化序列的启动。
4.根据权利要求1的方法,其进一步包括:
如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则
接通到所述主处理器的电力,并且启动在所述主处理器上执行的所述操作系统,以及
启动在所述服务处理器处的监控功能。
5.根据权利要求1的方法,其中,所述监控功能对计算机系统处的错误进行监控,所述计算机系统包括所述主处理器。
6.根据权利要求4的方法,其进一步包括:
如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则基于所述计算机系统的硬件来确定数据,并且将所述数据保存到所述服务处理器的非易失性存储器。
7.根据权利要求6的方法,其进一步包括:
如果当所述操作系统在所述主处理器上执行的最近时刻,中断了到所述主处理器的电力,则向所述操作系统提供来自所述服务处理器的非易失性存储器的数据。
8.一种系统,其包括:
用于在服务处理器处启动初始化序列的装置;
这样的装置,其用于响应于所述启动,如果当操作系统在主处理器上执行的最近时刻,中断了到所述主处理器的电力,则接通到所述主处理器的电力,并且启动在所述主处理器上执行的所述操作系统;以及
这样的装置,其用于如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前正在所述主处理器上执行,则启动所述服务处理器中的监控功能,其中所述监控功能对错误进行监控。
9.根据权利要求8的系统,其进一步包括:
这样的装置,其用于如果当所述操作系统在所述主处理器上执行的最近时刻,中断了到所述主处理器的电力,则在启动所述操作系统之后重置所述服务处理器,其中,响应于所述重置进行对所述初始化序列的启动。
10.根据权利要求8的系统,其进一步包括:
用于在所述服务处理器处接收电力的装置,其中,响应于对所述电力的接收进行对所述初始化序列的启动。
11.根据权利要求8的系统,其进一步包括:
这样的装置,其用于如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则
所述装置用于接通到所述主处理器的电力,并且启动在所述主处理器上执行的所述操作系统,以及
所述装置用于启动在所述服务处理器处的监控功能。
12.根据权利要求8的系统,其中,所述监控功能对计算机系统处的错误进行监控,所述计算机系统包括所述主处理器。
13.根据权利要求11的系统,其进一步包括:
这样的装置,其用于如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则基于所述计算机系统的硬件来确定数据,并且将所述数据保存到所述服务处理器的非易失性存储器。
14.根据权利要求13的系统,其进一步包括:
这样的装置,其用于如果当所述操作系统在所述主处理器上执行的最近时刻,中断了到所述主处理器的电力,则向所述操作系统提供来自所述服务处理器的非易失性存储器的数据。
15.一种用于配置计算机系统的方法,其包括:
配置所述计算机系统,以便在服务处理器处启动初始化序列;
配置所述计算机系统,以便:响应于对所述初始化序列的启动,如果当操作系统在主处理器上执行的最近时刻,中断了到所述主处理器的电力,则接通到所述主处理器的电力,并且启动在所述主处理器上执行的所述操作系统;以及
配置所述计算机系统,以便:如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前正在所述主处理器上执行,则启动所述服务处理器中的监控功能,其中,所述监控功能对所述计算机系统处的错误进行监控,其中所述计算机系统包括所述主处理器。
16.根据权利要求15的方法,其进一步包括:
配置所述计算机系统,以便:如果当所述操作系统在所述主处理器上执行的最近时刻,中断了到所述主处理器的电力,则在启动所述操作系统之后重置所述服务处理器,其中,响应于所述重置进行对所述初始化序列的启动。
17.根据权利要求15的方法,其进一步包括:
配置所述计算机系统,以便在所述服务处理器处接收电力,其中,响应于所述电力进行对所述初始化序列的启动。
18.根据权利要求15的方法,其进一步包括:
配置所述计算机系统,以便:如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则
接通到所述主处理器的电力,并且启动在所述主处理器上执行的所述操作系统,以及
启动在所述服务处理器处的监控功能。
19.根据权利要求18的方法,其进一步包括:
配置所述计算机系统,以便:如果当所述操作系统在所述主处理器上执行的最近时刻,并未中断到所述主处理器的电力,并且如果所述操作系统当前并未在所述主处理器上执行,则基于所述计算机系统的硬件来确定数据,并且将所述数据保存到所述服务处理器的非易失性存储器。
20.根据权利要求19的方法,其进一步包括:
配置所述计算机系统,以便:如果当所述操作系统在所述主处理器上执行的最近时刻,中断了到所述主处理器的电力,则向所述操作系统提供来自所述服务处理器的非易失性存储器的数据。
CN2007101268559A 2006-07-07 2007-06-29 用于在电力中断后进行初始化的方法和系统 Expired - Fee Related CN101101558B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/456,102 US7657730B2 (en) 2006-07-07 2006-07-07 Initialization after a power interruption
US11/456,102 2006-07-07

Publications (2)

Publication Number Publication Date
CN101101558A true CN101101558A (zh) 2008-01-09
CN101101558B CN101101558B (zh) 2010-06-02

Family

ID=38920342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101268559A Expired - Fee Related CN101101558B (zh) 2006-07-07 2007-06-29 用于在电力中断后进行初始化的方法和系统

Country Status (2)

Country Link
US (1) US7657730B2 (zh)
CN (1) CN101101558B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102447581A (zh) * 2011-12-31 2012-05-09 北京迈特安技术发展有限公司 一种网络接警机及告警实现方法
CN113495696A (zh) * 2020-04-08 2021-10-12 美光科技公司 用于对存储装置周期性地上电以避免数据丢失的计算机化系统和方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9342362B2 (en) * 2012-06-15 2016-05-17 Nvidia Corporation Service-processor-centric computer architecture and method of operation thereof

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5230074A (en) * 1991-01-25 1993-07-20 International Business Machines Corporation Battery operated computer power management system
US5414860A (en) * 1991-01-29 1995-05-09 International Business Machines Incorporated Power management initialization for a computer operable under a plurality of operating systems
US6051437A (en) * 1998-05-04 2000-04-18 American Research Corporation Of Virginia Optical chemical sensor based on multilayer self-assembled thin film sensors for aquaculture process control
US6681336B1 (en) * 1999-06-18 2004-01-20 Kabushiki Kaisha Toshiba System and method for implementing a user specified processing speed in a computer system and for overriding the user specified processing speed during a startup and shutdown process
KR100849296B1 (ko) * 2003-06-13 2008-07-29 삼성전자주식회사 주제어부와 보조제어부를 구비하는 시스템에서의보조제어부의 초기화 장치 및 방법
JP4066381B2 (ja) * 2005-03-01 2008-03-26 三菱電機株式会社 車載電子制御装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102447581A (zh) * 2011-12-31 2012-05-09 北京迈特安技术发展有限公司 一种网络接警机及告警实现方法
CN102447581B (zh) * 2011-12-31 2016-05-04 杭州海康威视系统技术有限公司 一种网络接警机及告警实现方法
CN113495696A (zh) * 2020-04-08 2021-10-12 美光科技公司 用于对存储装置周期性地上电以避免数据丢失的计算机化系统和方法

Also Published As

Publication number Publication date
US7657730B2 (en) 2010-02-02
CN101101558B (zh) 2010-06-02
US20080010445A1 (en) 2008-01-10

Similar Documents

Publication Publication Date Title
JP6532142B2 (ja) サーバシステムにおける最大ファンデューティの動的調整
US6460151B1 (en) System and method for predicting storage device failures
JP6530774B2 (ja) ハードウェア障害回復システム
KR100843495B1 (ko) 부착된 컴퓨터 시스템의 파워 오프시 rfid 태그로서비스 데이터를 전송하는 방법 및 이를 위한 컴퓨터시스템
US8560686B2 (en) Communicating with an in-band management application through an out-of-band communications channel
CN101350737B (zh) 智能平台管理界面系统、电子设备及存储器分享方法
US6691225B1 (en) Method and apparatus for deterministically booting a computer system having redundant components
US8918673B1 (en) Systems and methods for proactively evaluating failover nodes prior to the occurrence of failover events
KR100773004B1 (ko) 시스템 부팅시 하드웨어를 구성하는 동안 사용자의 상호작용을 없애기 위한 시스템 및 장치
US7269534B2 (en) Method to reduce IPMB traffic and improve performance for accessing sensor data
CN101202764B (zh) 确定虚拟以太网适配器的链路状态的方法和系统
US20130339714A1 (en) System and Method for Providing a Processing Node with Input/Output Functionality Provided by an I/O Complex Switch
CN109426613B (zh) 在uefi中检索调试数据的方法及其电脑系统
CN103201724A (zh) 在高可用性虚拟机环境中提供高可用性应用程序
US20030131039A1 (en) System, method, and computer program product for preserving trace data after partition crash in logically partitioned systems
US10572434B2 (en) Intelligent certificate discovery in physical and virtualized networks
US20040181708A1 (en) Policy-based response to system errors occuring during os runtime
US8423162B2 (en) Control method for information processing system, information processing system, and program
US7146515B2 (en) System and method for selectively executing a reboot request after a reset to power on state for a particular partition in a logically partitioned system
CN101159596A (zh) 用于布置服务器的方法和设备
CN111949320B (zh) 提供系统数据的方法、系统及服务器
US7904564B2 (en) Method and apparatus for migrating access to block storage
CN101101558B (zh) 用于在电力中断后进行初始化的方法和系统
US10721310B2 (en) Device redirection support at thin client
US20070294600A1 (en) Method of detecting heartbeats and device thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100602

Termination date: 20150629

EXPY Termination of patent right or utility model