JP5293412B2 - Computer system and computer system failure processing method - Google Patents
Computer system and computer system failure processing method Download PDFInfo
- Publication number
- JP5293412B2 JP5293412B2 JP2009132140A JP2009132140A JP5293412B2 JP 5293412 B2 JP5293412 B2 JP 5293412B2 JP 2009132140 A JP2009132140 A JP 2009132140A JP 2009132140 A JP2009132140 A JP 2009132140A JP 5293412 B2 JP5293412 B2 JP 5293412B2
- Authority
- JP
- Japan
- Prior art keywords
- device group
- computer system
- failure
- operating system
- service processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims abstract description 18
- 230000002093 peripheral effect Effects 0.000 claims 2
- 238000011084 recovery Methods 0.000 abstract description 6
- 230000010365 information processing Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- KGPLAWMZZGZTOA-UHFFFAOYSA-N NIC-10 Natural products C12OC2C2(O)CC=CC(=O)C2(C)C2C1C1=CC=C(C(=O)C)C=C1CC2 KGPLAWMZZGZTOA-UHFFFAOYSA-N 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
Images
Abstract
Description
本発明は、拡張デバイスの実装されるコンピュータシステム、及びその障害処理方法に関する。 The present invention relates to a computer system on which an expansion device is mounted and a failure processing method thereof.
CPU、ノースブリッジ、及びサウスブリッジなどを含む本体系装置に、機能を拡張するための拡張デバイス(例えば、PCIデバイス)を複数個実装したコンピュータシステムが知られている。このようなコンピュータシステムにおいて、障害が発生した場合、再起動(システムリブート)が行われる場合がある。 There is known a computer system in which a plurality of expansion devices (for example, PCI devices) for expanding functions are mounted on a main system apparatus including a CPU, a north bridge, a south bridge, and the like. In such a computer system, when a failure occurs, a restart (system reboot) may be performed.
図1は、障害発生による再起動時の動作を示すフローチャートである。図1に示されるように、コンピュータシステムに障害が発生すると(S101)、本体系装置において、DC OFF命令が実行され、オペレーティングシステム(以下、OS)がたち下げられる(S102)。DC OFF命令の実行が終了すると、電源が再投入される(ステップS103)。次に、Hand OFFが実行される(S104)。Hand OFFが終了すると、複数の拡張デバイス等のデバイスが初期化される(S105)。全ての拡張デバイスが初期化された後に、OSの立ち上げが開始される。OSの起動が完了し、OS Ready状態となった後に、障害復旧処理が開始される(S106)。 FIG. 1 is a flowchart showing the operation at the time of restart due to the occurrence of a failure. As shown in FIG. 1, when a failure occurs in the computer system (S101), a DC OFF command is executed in the main system apparatus, and the operating system (hereinafter referred to as OS) is lowered (S102). When the execution of the DC OFF command is completed, the power is turned on again (step S103). Next, Hand OFF is executed (S104). When the Hand OFF is completed, a plurality of devices such as expansion devices are initialized (S105). After all the expansion devices are initialized, OS startup is started. After the activation of the OS is completed and the OS Ready state is entered, a failure recovery process is started (S106).
障害が復旧するまで、コンピュータシステムを利用することはできない。従って、障害復旧に要する時間は、短い方が望ましい。 The computer system cannot be used until the failure is recovered. Therefore, it is desirable that the time required for failure recovery is shorter.
障害復旧時の動作を工夫した技術として、特許文献1に記載された情報処理装置が挙げられる。特許文献1の情報処理装置は、障害を検出する障害検出回路と、複数の障害のそれぞれをグループ分けして格納する障害テーブルと、障害検出回路にて検出された障害について障害情報テーブルに格納されるグループのいずれに属するかを判定し、判定したグループに関するハードウェアのみを初期化する制御装置と、を備える。これにより、必要最低限のハードウェアの初期化が可能となり、発生した障害とは無関係なハードウェアの初期化を行わなくてもよいため、再試行処理の性能が向上すると記載されている。
As a technique for devising the operation at the time of failure recovery, there is an information processing apparatus described in
また、特許文献2には、コアI/Oカードを2重化することによって、障害などにより使用していた一のコアI/Oカードが切り離された場合でも、他のコアI/Oカードを利用してリブートできることが記載されている。 Further, in Patent Document 2, even if one core I / O card used due to a failure is disconnected by duplicating the core I / O card, another core I / O card is not connected. It is described that it can be used and rebooted.
また、特許文献3には、オペレーティングシステムの初期化プロセスに、起動対象となるシステムの稼動に必要なドライブを検索したことを判定してドライブの検索処理を終了する処理手段を具備したことを特徴とする情報処理装置が開示されている。この特許文献3によれば、起動時におけるドライブ検索数を必要最小限に抑える事ができ、システム起動にかかる処理時間を短縮できると記載されている。 Further, Patent Document 3 includes a processing means for determining that a drive required for operating the system to be booted is searched for in the initialization process of the operating system and ending the drive search process. An information processing apparatus is disclosed. According to Patent Document 3, it is described that the number of drive searches at startup can be minimized, and the processing time required for system startup can be shortened.
また、特許文献4には、オペレーティングシステムを格納した記憶装置を含む情報処理装置において、第1スイッチ及び第1スイッチを本体に設けることが記載されている。第1スイッチの操作により本体の電源がオンされたときには、その記憶装置を含む複数のデバイスを初期化する処理を含む第1の起動処理が実行された後に、オペレーティングシステムが起動される。第2スイッチの操作により本体の電源がオンされたときには、第1の起動処理の所定の一部の処理の実行が省略された第2の起動処理が実行された後に、オペレーティングシステムが起動される。第2スイッチの操作により本体の電源がオンされた時には、オペレーティングシステムの起動のために必要とされない各デバイスの初期化処理の実行がスキップされ、電源オンからオペレーティングシステムが起動されるまでの時間を大幅に短縮できると記載されている。 Patent Document 4 describes that in an information processing apparatus including a storage device storing an operating system, a first switch and a first switch are provided in a main body. When the power of the main body is turned on by operating the first switch, the operating system is started after the first starting process including the process of initializing a plurality of devices including the storage device is executed. When the power of the main body is turned on by operating the second switch, the operating system is started after the second starting process in which the execution of a predetermined part of the first starting process is omitted is executed. . When the main unit is turned on by the operation of the second switch, the initialization process of each device that is not required for starting the operating system is skipped, and the time until the operating system is started after the power is turned on is skipped. It is described that it can be greatly shortened.
再起動時における拡張デバイスの初期化は、拡張デバイスを使用可能にするために不可欠な動作であるが、多くの時間を要する。例えば、PCIスロットにPCIデバイスが実装されている場合、初期化時には、このPCIスロットにOption ROMが存在するか否かが確認される。Option ROMが存在すれば、Option ROMのコードがメモリ上に展開される。コードの展開には、多くの時間を要する。 Initialization of the expansion device at the time of restart is an indispensable operation for enabling the expansion device, but takes a lot of time. For example, when a PCI device is mounted in a PCI slot, it is confirmed at initialization whether or not an Option ROM exists in the PCI slot. If the Option ROM exists, the code of the Option ROM is expanded on the memory. It takes a lot of time to deploy the code.
従って、本発明の目的は、OSが起動する前に拡張デバイスの初期化に要する時間を、短縮することのできる、コンピュータシステム及びコンピュータシステムの障害復旧方法を提供することにある。 Accordingly, an object of the present invention is to provide a computer system and a computer system failure recovery method that can reduce the time required for initialization of an expansion device before the OS is started.
以下に、[発明を実施するための形態]で使用する括弧付き符号を用いて、課題を解決するための手段を説明する。これらの符号は、[特許請求の範囲]の記載と[発明を実施するための形態]の記載との対応関係を明らかにするために付加されたものであるが、[特許請求の範囲]に記載されている発明の技術的範囲の解釈に用いてはならない。 Hereinafter, means for solving the problem will be described using the reference numerals in parentheses used in [Mode for Carrying Out the Invention]. These symbols are added to clarify the correspondence between the description of [Claims] and the description of [Mode for Carrying Out the Invention]. It should not be used to interpret the technical scope of the described invention.
本発明のコンピュータシステムは、CPU(11)を備える本体系装置(10)と、本体系装置(10)の機能を拡張するために前記本体系装置に実装された、複数の拡張デバイス(17〜19)と、CPU(11)とは独立に、本体系装置(10)の動作を制御するサービスプロセッサ(20)と、を具備する。サービスプロセッサ(20)は、障害発生により本体系装置(10)の電源が再投入されたときに、複数の拡張デバイス(17〜19)のうちでオペレーティングシステムの立ち上げに必要なデバイスである第1デバイス群(17)のみを初期化し、第1デバイス群(17)を初期化した後にオペレーティングシステムを起動させる。CPU(11)は、オペレーティングシステムの起動後に、オペレーティングシステム上で障害処理を実行する。サービスプロセッサ(20)は、CPU(11)による障害処理の実行が開始された後に、複数の拡張デバイス(17〜19)のうちの第1デバイス群(17)以外のデバイスである第2デバイス群(18、19)を初期化する。 The computer system of the present invention includes a main body apparatus (10) having a CPU (11) and a plurality of expansion devices (17 to 17) mounted on the main body apparatus to expand the functions of the main body apparatus (10). 19) and a service processor (20) for controlling the operation of the main system (10) independently of the CPU (11). The service processor (20) is a device necessary for starting up the operating system among the plurality of expansion devices (17 to 19) when the power of the main unit (10) is turned on again due to the occurrence of a failure. Only the one device group (17) is initialized, and after the first device group (17) is initialized, the operating system is started. The CPU (11) executes failure processing on the operating system after the operating system is started. The service processor (20) is a second device group that is a device other than the first device group (17) among the plurality of expansion devices (17 to 19) after the execution of the failure process by the CPU (11) is started. (18, 19) is initialized.
本発明によれば、OSが起動する前に拡張デバイスの初期化に要する時間を、短縮することのできる、コンピュータシステム及びコンピュータシステムの障害復旧方法が提供される。 According to the present invention, it is possible to provide a computer system and a computer system failure recovery method capable of reducing the time required for initializing an expansion device before the OS is started.
図面を参照しつつ、本発明の実施例について説明する。 Embodiments of the present invention will be described with reference to the drawings.
図2は、本実施例のコンピュータシステムの構成を示す概略ブロック図である。本実施例では、コンピュータシステムとして、サーバを例に挙げて説明する。このコンピュータシステムは、本体系装置10と、サービスプロセッサ20と、SNMP(Simple Network Management Protocol)マネージャ30と、カード情報記憶部40と、を備えている。
FIG. 2 is a schematic block diagram showing the configuration of the computer system of this embodiment. In this embodiment, a server will be described as an example of a computer system. The computer system includes a main system device 10, a
本体系装置10は、複数(4つ)のCPU(11−1〜11−4)と、ノースブリッジ12と、複数(2つ)のサウスブリッジ(13−1、13−2)と、主記憶装置14と、プロセッサバス15と、複数(2つ)のPCIバス(16−1、16−2)と、複数のPCIスロット17と、を備えている。4つのCPU(11−1〜11−4)は、プロセッサバス15を介してノースブリッジ12に接続されている。2つのサウスブリッジ(13−1、13−2)は、ノースブリッジ12に接続されている。サウスブリッジ(13−1、13−2)の配下には、それぞれ、PCIバス(16−1、16−2)が接続されている。PCIバス(16−1、16−2)の配下には、それぞれ、複数のPCIスロットが接続されている。
The system 10 includes a plurality (four) of CPUs (11-1 to 11-4), a
ノースブリッジ12は、ホスト−PCIブリッジを含むシステムコントローラである。ノースブリッジ12には、ホスト−PCIブリッジのほかにも、主記憶装置14のメモリコントローラなどが内蔵されている。
The
サウスブリッジ13は、配下に接続されているPCIバス16のインタフェース(PCIバスコントローラ)機能を有する。 The south bridge 13 has an interface (PCI bus controller) function of the PCI bus 16 connected thereto.
複数のPCIスロット17は、PCIボード(拡張デバイス)を実装するために設けられている。本実施例では、PCIバス16−1、16−2の配下に、それぞれ、8個のPCIスロットが設けられている。PCIバス16−1の配下のPCIスロットには、PCIボードとして、SCSI(Small Computer System Interface)17−1、FC(Fiber Channel)18−1、及びNIC(Network Interface Card)19−1が接続されている。また、PCIバス16−2の配下のPCIスロットにも、同様に、SCSI(17−2)、FC(18−2)、NIC(19−2)が接続されている。尚、本実施例では、PCIボードとして、NIC、SCSI、FCの3種のインタフェースを例に挙げたが、他のPCIスロットにも各種PCIボードのインタフェースが実装されていてもよい。 The plurality of PCI slots 17 are provided for mounting a PCI board (expansion device). In the present embodiment, eight PCI slots are respectively provided under the PCI buses 16-1 and 16-2. The PCI slots under the PCI bus 16-1 are connected to a PCI (Small Computer System Interface) 17-1, FC (Fiber Channel) 18-1, and NIC (Network Interface Card) 19-1 as PCI boards. ing. Similarly, SCSI (17-2), FC (18-2), and NIC (19-2) are also connected to the PCI slots under the PCI bus 16-2. In the present embodiment, three types of interfaces of NIC, SCSI, and FC are given as examples of PCI boards, but various PCI board interfaces may be mounted in other PCI slots.
本実施例では、SCSI(17−1、17−2)の配下に、それぞれ、OSを起動する際に用いるBoot Disk(1−1、1−2)が接続されているものとする。また、FC(18−1、18−2)の配下に、それぞれ、ディスク(2−1、2−2)が接続されているものとする。 In the present embodiment, it is assumed that Boot Disks (1-1, 1-2) used when starting up the OS are connected under the SCSI (17-1, 17-2). In addition, it is assumed that the disks (2-1, 2-2) are connected under the FC (18-1, 18-2), respectively.
サービスプロセッサ20は、本体系装置10のCPU(11−1〜11−4)とは独立して、本体系装置10の動作を制御するプロセッサである。詳細は後述するが、サービスプロセッサ20は、障害発生によりコンピュータシステムが再起動されるときに、本体系装置10の動作を制御する。
The
SNMPマネージャは、サービスプロセッサ20に接続されている。障害発生による再起動時には、SNMPマネージャからの指示により、サービスプロセッサ20が本体系装置10の動作を制御する。SNMPマネージャは、ネットワークを介してサービスプロセッサ20に接続されていてもよい。
The SNMP manager is connected to the
カード情報記憶部40には、予め、複数のPCIデバイスのうちでオペレーティングシステムの立ち上げに必要なデバイス(第1デバイス群)を特定するための情報が記憶されている。本実施例では、オペレーティングシステムの立ち上げに必要なデバイスは、SCSI(17−1、17−2)に接続されたBoot Disk(1−1、1−2)である。したがって、カード情報記憶部40には、SCSI(17−1、17−2)の接続されたPCIスロットを特定するための情報が記憶されている。カード情報記憶部40は、サービスプロセッサ20に接続されている。サービスプロセッサ20は、障害発生による再起動時に、カード情報記憶部40にアクセスし、カード情報記憶部40に記憶された情報に基づいて、本体系装置10の動作を制御する。カード情報記憶部40は、たとえば、ハードディスクなどで構成することができる。
The card
続いて、本実施例にかかるコンピュータシステムの障害処理方法について説明する。図3は、そのコンピュータシステムの障害処理方法の動作を示すフローチャートである。 Next, a failure processing method for the computer system according to the present embodiment will be described. FIG. 3 is a flowchart showing the operation of the failure processing method of the computer system.
コンピュータシステムの運用中に、コンピュータシステムを継続して運用できないような障害が発生するとする(ステップS10)。この場合、障害発生部位から、サービスプロセッサ20に、障害の発生が通知される。
It is assumed that a failure occurs that prevents the computer system from being operated continuously during operation of the computer system (step S10). In this case, the occurrence of the failure is notified to the
サービスプロセッサ20は、DC OFF命令を図示しない電源供給回路に発行し、本体系装置10に対する電源の供給を遮断する(ステップS20)。また、サービスプロセッサ20は、SNMPマネージャ30に対して、Reset pendingのtrapを送信する。また、どの部位に障害が発生したかを示す情報も、SNMPマネージャ30に送信される。SNMPマネージャ30は、取得した情報に基づいて、本体形装置10の一部を論理的に切り離して再立ち上げをすることで継続運用が可能であるかどうかを判断する。再立ち上げが可能である場合、SNMPマネージャは、サービスプロセッサ20に障害部位の切り離しを命令する。この場合、サービスプロセッサ20は、障害部位を、論理的に切り離す。例えば、障害部位が、サウスブリッジ8の配下のPCIバス16−1であった場合には、サウスブリッジ13−1を論理的に本体系装置10から切り離す。
The
本体系装置10に対する電源の供給停止と、障害部位の切り離しが終了した後に、SNMPマネージャ30は、サービスプロセッサ20に、コンピュータシステムの再立ち上げを命令する(ステップS30)。サービスプロセッサ20は、再立ち上げの命令を受けると、本体系装置10に電源供給を行うように、電源供給回路の動作を制御する。
After stopping the supply of power to the main system device 10 and disconnecting the faulty part, the
続いて、各装置のSDテスト、MEM14のテストなどが行われ、さらに、Hand offが行われる(ステップS40)。
Subsequently, an SD test of each device, a test of the
続いて、PCIデバイスの初期化が行われる。この際、サービスプロセッサ20は、カード情報記憶部40を参照して、OSの起動に必要なPCIデバイスを特定する。そして、まず、OSの起動に必要なPCIデバイスのみを初期化する(ステップS50)。本実施例では、Boot Diskの接続されたSCSI(17−1)のみを初期化する。サウスブリッジ13−1が論理的に切り離されている場合には、サウスブリッジ13−2の配下のSCSI(17−2)が初期化される。
Subsequently, the PCI device is initialized. At this time, the
OS立ち上げに必要なPCIデバイス(SCSI17−1)の初期化が終了すると、サービスプロセッサ20は、Boot DiskからOSのブートローダをMEM14に読み込み、OSの起動を開始する(ステップS60)。
When the initialization of the PCI device (SCSI 17-1) necessary for OS startup is completed, the
OSの起動が完了し、OS Ready状態となると(ステップS70)、CPU(11−1〜11−4)が、OS上において障害処理を開始する(ステップS80)。 When the activation of the OS is completed and the OS Ready state is set (step S70), the CPU (11-1 to 11-4) starts failure processing on the OS (step S80).
サービスプロセッサ20は、ステップS80で障害処理が開始された後に、ステップS50で初期化を行わなかった他のPCIデバイスを初期化する(ステップS90)。
The
全てのPCIデバイスの初期化が終了すると、本実施例における一連の動作が終了する(ステップS100)。 When the initialization of all the PCI devices is completed, a series of operations in this embodiment is completed (step S100).
PCIデバイスの初期化は、PCIデバイスを有効な状態とするのにあたり、不可欠な作業である。ただし、この過程で、例えば、Option ROMが存在するか否かを確認し、Option ROMが存在すればOption ROMのコードをメモリ上に展開する、といった動作を行うため、多くの時間を要する。 The initialization of the PCI device is an indispensable work for bringing the PCI device into an effective state. However, in this process, for example, it is necessary to check whether or not the Option ROM exists, and if the Option ROM exists, the operation of expanding the code of the Option ROM on the memory takes a lot of time.
そのため、全てのPCIデバイスを初期化した後に、OSの立ち上げを行う場合、コンピュータシステムの障害処理が開始される時間は遅くなってしまう。 Therefore, when the OS is started up after all the PCI devices are initialized, the time for starting the failure processing of the computer system is delayed.
これに対して、本実施例では、OS立ち上げに必要なPCIデバイスのみをまず初期化し、OSを立ち上げて障害処理が開始された後に他のPCIデバイスの初期化が行われるので、障害処理着手前にOS立ち上げに必要のないデバイスの初期化に要していた時間を省略することができる。PCIデバイスが多ければ多いほど、大幅に障害処理開始時間を早めることが可能である。 On the other hand, in this embodiment, only the PCI device necessary for starting up the OS is initialized first, and after the OS is started up and failure processing is started, other PCI devices are initialized. It is possible to omit the time required for device initialization that is not required for OS startup before the start. As the number of PCI devices increases, the failure processing start time can be greatly advanced.
すなわち、本実施例によれば、システムリブートを伴う障害が発生した場合、OS立ち上げに必要な最小限なPCIデバイスのみが初期化されるので、OS立ち上げに要する時間が短縮化され、素早く障害処理に着手することが可能となる。 That is, according to the present embodiment, when a failure accompanied by a system reboot occurs, only the minimum PCI device necessary for OS startup is initialized. It becomes possible to start failure processing.
1 ブートディスク
2 ディスク
11 CPU
12 ノースブリッジ
13 サウスブリッジ
14 主記憶メモリ
15 プロセッサバス
16 PCIバス
17 SCSI
18 FC
19 NIC
10 本体系装置
20 サービスプロセッサ
30 SNMPマネージャ
40 カード情報記憶部
1 Boot disk 2 Disk 11 CPU
12 North Bridge 13
18 FC
19 NIC
10
Claims (6)
前記本体系装置の機能を拡張するために前記本体系装置に実装された、複数の拡張デバイスと、
前記CPUとは独立に、前記本体系装置の動作を制御するサービスプロセッサと、
を具備し、
前記サービスプロセッサは、障害発生により前記本体系装置の電源が再投入されたときに、前記複数の拡張デバイスのうちでオペレーティングシステムの立ち上げに必要なデバイスである第1デバイス群のみを初期化し、前記第1デバイス群を初期化した後にオペレーティングシステムを起動させ、
前記CPUは、オペレーティングシステムの起動後に、オペレーティングシステム上で障害処理を実行し、
前記サービスプロセッサは、前記CPUによる障害処理の実行が開始された後に、前記複数の拡張デバイスのうちの前記第1デバイス群以外のデバイスである第2デバイス群を初期化する
コンピュータシステム。 A main system device including a CPU;
A plurality of expansion devices mounted on the main body device in order to extend the function of the main body device;
Independent of the CPU, a service processor that controls the operation of the main body device;
Comprising
The service processor initializes only the first device group which is a device necessary for starting up an operating system among the plurality of expansion devices when the power of the main body apparatus is turned on again due to the occurrence of a failure, After initializing the first device group, start an operating system,
The CPU executes failure processing on the operating system after the operating system is started,
The service processor is a computer system that initializes a second device group that is a device other than the first device group among the plurality of expansion devices after execution of failure processing by the CPU is started.
更に、
予め、前記第1デバイス群と前記第2デバイス群とを特定する情報が格納されたデバイス情報記憶部、
を具備し、
前記サービスプロセッサは、前記拡張デバイス記憶部を参照して前記第1デバイス群を特定し、前記第1デバイス群を初期化する
コンピュータシステム。 A computer system according to claim 1, comprising:
Furthermore,
A device information storage unit in which information for specifying the first device group and the second device group is stored in advance;
Comprising
The service processor refers to the expansion device storage unit, specifies the first device group, and initializes the first device group.
前記拡張デバイスは、PCI(Peripheral Component Interconnect)カードである
コンピュータシステム。 A computer system according to claim 1 or 2,
The expansion device is a computer system that is a PCI (Peripheral Component Interconnect) card.
前記電源再投入ステップの後に、第1デバイス群を初期化する第1デバイス群初期化ステップと、
前記第1デバイス群初期化ステップの後に、オペレーティングシステムを起動させるOS起動ステップと、
オペレーティングシステムの起動後に、前記CPUによって、オペレーティングシステム上で障害処理を実行するステップと、
障害処理の実行が開始された後に、第2デバイス群を初期化する第2デバイス群初期化ステップと、
を具備し、
前記第1デバイス群は、前記本体系装置の機能を拡張するために前記本体系装置に実装された複数の拡張デバイスのうちで、オペレーティングシステムの立ち上げに必要なデバイス群であり、
前記第2デバイス群は、前記複数の拡張デバイスのうちで、前記第1デバイス群以外のデバイス群であり、
前記第1デバイス群初期化ステップ、前記OS起動ステップ、及び前記第2デバイス群初期化ステップは、前記CPUとは独立に前記本体系装置の動作を制御するサービスプロセッサにより行われる
コンピュータシステムの障害処理方法。 In the event of a failure, a power-on step for restarting the main unit equipped with the CPU,
A first device group initialization step for initializing the first device group after the power-on step;
An OS startup step of starting an operating system after the first device group initialization step;
Executing a failure process on the operating system by the CPU after starting the operating system;
A second device group initialization step for initializing the second device group after the execution of the fault processing is started;
Comprising
The first device group is a device group necessary for starting up an operating system among a plurality of expansion devices mounted on the main body apparatus in order to expand the function of the main body apparatus.
The second device group, among the plurality of expansion devices, Ri device group der other than the first device group,
The first device group initialization step, the OS startup step, and the second device group initialization step are performed by a service processor that controls the operation of the main body apparatus independently of the CPU. System failure handling method.
更に、
予め、前記第1デバイス群と前記第2デバイス群とを特定する情報を記憶しておく記憶ステップ、
を具備し、
前記第1デバイス群初期化ステップにおいて、前記記憶ステップで記憶しておいた情報に基いて、前記第1デバイス群を特定し、前記第1デバイス群を初期化する
コンピュータシステムの障害処理方法。 A failure handling method for a computer system according to claim 4 ,
Furthermore,
A storage step of storing information for specifying the first device group and the second device group in advance;
Comprising
A failure processing method for a computer system, wherein in the first device group initialization step, the first device group is specified based on the information stored in the storage step, and the first device group is initialized.
前記拡張デバイスは、PCI(Peripheral Component Interconnect)カードである
コンピュータシステムの障害処理方法。 A fault handling method for a computer system according to claim 4 or 5 ,
The expansion device is a failure processing method for a computer system, which is a PCI (Peripheral Component Interconnect) card.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009132140A JP5293412B2 (en) | 2009-06-01 | 2009-06-01 | Computer system and computer system failure processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009132140A JP5293412B2 (en) | 2009-06-01 | 2009-06-01 | Computer system and computer system failure processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010277514A JP2010277514A (en) | 2010-12-09 |
JP5293412B2 true JP5293412B2 (en) | 2013-09-18 |
Family
ID=43424387
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009132140A Expired - Fee Related JP5293412B2 (en) | 2009-06-01 | 2009-06-01 | Computer system and computer system failure processing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5293412B2 (en) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09237198A (en) * | 1996-02-29 | 1997-09-09 | Nec Corp | Method for testing extended device at the time of starting computer system |
JPH10320080A (en) * | 1997-05-21 | 1998-12-04 | Nec Shizuoka Ltd | Reset circuit for information processor and resetting method |
JP5348813B2 (en) * | 2000-11-06 | 2013-11-20 | 株式会社アイ・オー・データ機器 | Boot ROM mounted board |
JP3644399B2 (en) * | 2001-03-27 | 2005-04-27 | ティーエム・ティーアンドディー株式会社 | PCI bus defective part isolation method and program thereof |
JP2007122653A (en) * | 2005-10-31 | 2007-05-17 | Toshiba Corp | Information processor and starting control method |
-
2009
- 2009-06-01 JP JP2009132140A patent/JP5293412B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010277514A (en) | 2010-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI337304B (en) | Method for fast system recovery via degraded reboot | |
CN101232397B (en) | Apparatus and method for renovating multi controller systems | |
EP1691281B1 (en) | Memory dump program boot method | |
US11314665B2 (en) | Information processing system, information processing device, BIOS updating method for information processing device, and BIOS updating program for information processing device | |
JP2009140194A (en) | Method for setting failure recovery environment | |
CN100492305C (en) | Fast restoration method of computer system and apparatus | |
US20130339718A1 (en) | Information processing device and method for controlling information processing device | |
TW200416544A (en) | Recovery method of multi-functional operating system and system thereof | |
CN102880527A (en) | Data recovery method of baseboard management controller | |
US10824517B2 (en) | Backup and recovery of configuration files in management device | |
WO2012149774A1 (en) | Method and apparatus for activating processor | |
JP6599725B2 (en) | Information processing apparatus, log management method, and computer program | |
JP2004302997A (en) | Device with high storage capacity and a plurality of bios backup copies | |
JP2006251945A (en) | Basic input/output control system | |
JP5387767B2 (en) | Update technology for running programs | |
JP5293412B2 (en) | Computer system and computer system failure processing method | |
JP2003186697A (en) | System and method for testing peripheral device | |
JP2002049509A (en) | Data processing system | |
TWI786871B (en) | Computer and system bootup method | |
JP2006072492A (en) | System control device, system control method and system control program | |
JP2004054616A (en) | Information processor with function to automatically restore firmware | |
JP2010146436A (en) | Monitoring system, control method and program | |
JP2009025967A (en) | Backup system of duplicated firmware, method and operating system | |
JP2007233667A (en) | Method of detecting fault | |
JPH09288590A (en) | Virtual computer system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120509 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130422 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130514 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5293412 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |