JP2005196351A - コンピュータシステムおよびその保守方法 - Google Patents

コンピュータシステムおよびその保守方法 Download PDF

Info

Publication number
JP2005196351A
JP2005196351A JP2004000403A JP2004000403A JP2005196351A JP 2005196351 A JP2005196351 A JP 2005196351A JP 2004000403 A JP2004000403 A JP 2004000403A JP 2004000403 A JP2004000403 A JP 2004000403A JP 2005196351 A JP2005196351 A JP 2005196351A
Authority
JP
Japan
Prior art keywords
maintenance
peripheral device
computer system
device group
cpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004000403A
Other languages
English (en)
Other versions
JP4066950B2 (ja
Inventor
Eiji Nakajima
英二 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004000403A priority Critical patent/JP4066950B2/ja
Publication of JP2005196351A publication Critical patent/JP2005196351A/ja
Application granted granted Critical
Publication of JP4066950B2 publication Critical patent/JP4066950B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

【課題】
CPUに接続して同時には動作させることができない2組(運用系と待機系)の周辺機器群を有するコンピュータシステムにおいて、オンラインでの保守(試験)を可能とする保守方法を提供する。
【解決手段】
システム立上げ、定期的試験、障害発生などの保守の開始をCPUの元にあるBIOSに対して指示する。BIOSは、CPUの割り込みリソースおよび入出力リソースが2組の内の一方の周辺機器群に向くようにルーティング機能を持った切替手段を動作させる。切替手段により選択された一方の周辺機器群の保守を行う。保守の結果に基づいて、有効な周辺機器群を接続し、OSの立上げ、外部へのエラー通知などの継続する処理を行う。
【選択図】
図1

Description

本発明は、コンピュータシステムおよびその保守方法に関し、特に周辺機器群を有するコンピュータシステムとその周辺機器群の保守方法に関する。
コンピュータシステムでは、信頼性を向上させるために、二重化した機器を備えることがよく行われる。プロセッサに接続される周辺デバイス、周辺機器等についても二重化する技術が開示されている。例えば、特許文献1において、プロセッサと、バスを経由して接続され、プロセッサからはそれぞれ一意の装置アドレスで識別、制御される二重化装置が開示されている。この二重化装置の基本装置に障害が発生し、プロセッサからのホルト指示を受けたとき、基本装置からのホルト通知信号を受けたバックアップ装置が、以降、自己の一意な装置アドレスを、基本装置の装置アドレスに変換して、プロセッサの制御に従うように構成される。
また、関連する技術として特許文献2において、2面の不揮発性記憶デバイスと、これらを切り替えるセレクタを備え、ブート処理プログラムの書き換えを行うコンピュータシステムが開示されている。このコンピュータシステムは、2面の不揮発性記憶デバイスを持つことで、片面においてブート処理プログラムの書き換えの途中で書き換えに失敗しても、もう片面には正常に動作するブート処理プログラムが書き込まれているため、ブート処理プログラムを安全に書き換えることができるものである。
特開平1−162942号公報 (図1) 特許第2940480号公報 (図1)
周辺デバイス、周辺機器等を二重化してプロセッサに接続することは、一般的に知られた技術である。しかしながら、単純に二重化できないものも存在する。例えば、コンピュータシステムのアーキテクチャで決まってしまい、一つのリソースでしか制御できない周辺機器等を配置するような場合がある。一つのリソースでしか制御できない例に、CPUの割り込みリソースや入出力リソースがある。このような場合に、運用系と待機系の二重化された周辺機器群を保守するには、先ず運用系の周辺機器群のみをCPUに接続する。そして、運用系の周辺機器群が故障した場合は、システムをシャット・ダウンして電源を落とした後、待機系の周辺機器群へ交換するといった手順が一般的に行われる。また、待機系の周辺機器群自身が故障していないことを確認するため、定期保守作業の中で、システムをシャット・ダウンして電源を落とした後、一時的に運用系の周辺機器群を取り外す。その上で、待機系の周辺機器群へ載せ変えて、待機系の周辺機器群を使ってシステムを立上げることで待機系の周辺機器群の試験を行うといった手順が行われる。
以上のように、従来のコンピュータ・システムにおいては、システムに一つしか接続することができない周辺機器群に関して、オンラインでの保守(試験)は容易ではなかった。
したがって、本発明の目的は、CPUに接続して同時には動作させることができない2組(運用系と待機系)の周辺機器群を有するコンピュータシステムにおいて、オンラインでの保守を可能とする保守方法を提供することにある。
前記目的を達成するために、本発明に係るコンピュータシステムの保守方法は、第1の視点によれば、CPUに接続して同時には動作させることができない2組の周辺機器群を有するコンピュータシステムの保守方法である。まず、保守の開始をCPUの元にあるBIOS(Basic Input Output System)に対して指示する。次に、BIOSによって、CPUの割り込みリソースおよび入出力リソースが2組の内の一方の周辺機器群に向くように切替手段を動作させる。さらに、切替手段により選択された一方の周辺機器群の保守を行い、保守の結果に基づいて継続する処理を行う。
本発明において、2組の周辺機器群は、運用系と待機系とに対応するものであってもよい。
また、保守の開始は、CPUへの割り込み通知によってなされてもよい。
さらに、保守の開始は、コンピュータシステムの立上げによってなされてもよい。
また、保守の開始は、外部からコンピュータシステムへの保守の指示に基づいてなされてもよい。
さらに、保守の指示に基づいて待機系の周辺機器群の保守を行う際に、待機系の周辺機器群から発生するエラー検出を防止するようにしてもよい。
また、保守の開始は、運用系の周辺機器群からのエラーの通知によるものであって、エラーの通知により、エラーログを収集するステップを含み、切替手段を動作させるステップは、運用系の周辺機器群を切り離し、待機系の周辺機器群を接続するステップであり、保守を行うステップは、待機系の周辺機器群の再初期化を行うステップであってもよい。
さらに、保守にあたって、切替手段の動作前に選択されている周辺機器群が持つ情報を、切替手段の動作後に選択される周辺機器群が持つ情報にコピーするようにしてもよい。
また、周辺機器群が持つ情報には、時刻情報、BIOSの設定情報およびOS(Operating System)の設定情報の少なくともいずれかが含まれていてもよい。
さらに、継続する処理は、CPUの元にあるOSの動作であってもよい。
また、継続する処理は、保守の結果が異常を示す場合におけるコンピュータシステムの外部への通知であってもよい。
本発明に係るコンピュータシステムの保守方法は、第2の視点によれば、CPUに接続して同時には動作させることができない運用系と待機系の2組の周辺機器群を有するコンピュータシステムの保守方法である。まず、コンピュータシステムの立上げによって、CPUの元にあるBIOS(Basic Input Output System)に対して指示する。次に、BIOSによって、CPUの割り込みリソースおよび入出力リソースが運用系の周辺機器群に向くように切替手段を動作させる。さらに、運用系の周辺機器群の保守を行い、保守の結果、エラーがある場合には運用系の周辺機器群を切り離す。また、BIOSによって、CPUの割り込みリソースおよび入出力リソースが待機系の周辺機器群に向くように切替手段を動作させる。さらに、待機系の周辺機器群の保守を行い、保守の結果、エラーがある場合には待機系の周辺機器群を切り離す。
本発明において、運用系の周辺機器群の保守の結果でエラーがない場合には、使用する周辺機器群を運用系の周辺機器群としてOS(Operating System)を立ち上げ、運用系の周辺機器群の保守の結果でエラーがあり、且つ待機系の周辺機器群の保守の結果でエラーがない場合には、使用する周辺機器群を待機系の周辺機器群としてOSを立ち上げるようにしてもよい。
本発明において、コンピュータシステムは、マルチプロセッサを含み、CPUは、マルチプロセッサから選択された一つのプロセッサであり、選択されていない他のプロセッサは、保守の処理を待ち合わせるようにしてもよい。
また、保守の開始を指示する割り込み通知の到来順序にしたがって、一つのプロセッサが選択されるようにしてもよい。
また、本発明に係るコンピュータシステムは、第3の視点によれば、CPUと、CPUの元にあるBIOSとを含む。また、CPUに接続して同時には動作させることができない2組の周辺機器群を含む。さらに、BIOSによって、CPUの割り込みリソースおよび入出力リソースが2組の内の一方の周辺機器群に向くように動作する切替手段を含む。
本発明において、切替手段は、2組の周辺機器群に対するルーティング機能を備える構成であってもよい。
また、切替手段は、2組の周辺機器群のいずれか一方への電源供給を行う手段を含む構成であってもよい。
本発明に係るコンピュータシステムの保守方法によれば、システムに一つしか接続することができない周辺機器群に関して、BIOSの元で制御される切替手段を備え、切替手段により接続される周辺機器群を保守するように動作するので、オンラインでの保守(試験)を容易に行うことができる。
次に、本発明の実施形態について図面を参照して説明する。図1は、本発明の実施形態に係るコンピュータシステムのブロック図である。図1において、コンピュータシステムは、CPU10、メモリ12、切替手段13および外部インタフェース16がバス18を介して接続される。また、CPU10は、BIOS11を有する。なお、BIOS11は、不図示のフラッシュメモリ等の上に格納しておき、メモリ12上に展開し、CPU10上で動作させるようにしてもよい。さらに、周辺機器群14、15は、CPU10に接続して同時には動作させることができない2組の周辺機器群であって、切替手段13により選択された一方の周辺機器群がCPU10に接続される。すなわち、CPU10の割り込みリソースおよび入出力リソースは、切替手段13によって選択された周辺機器群に対してのみ供給されるものであり、BIOS11によって選択される周辺機器群が決められる。
ここで切替手段13は、周辺機器群14、15に対するルーティング機能を備えていてもよい。また、切替手段13による周辺機器群の選択は、周辺機器群14、15のいずれか一方への電源供給によりなされるようにしてもよい。
また、メモリ12は、OSが動作するための領域、CPUの動作のためのワークエリア等に割り当てられ、各種データを記録保存するためのものである。
さらに、端末装置17は、コンピュータシステムの外部にあって、外部インタフェース16を介してCPU10に接続される装置である。端末装置17は、必ずしも外部にある必要はなく、また、端末装置に限るものでもなく、CPU10とは異なるプロセッサ(サービス・プロセッサと称する)であってもよい。端末装置17は、コンピュータシステムへの保守の指示を送り、あるいはコンピュータシステムから保守の結果の通知を受けとる機能をもつものである。
以上のような構成のコンピュータシステムにおいて、BIOS11は、システム立上げ時、システム運用中、あるいは周辺機器群における障害発生時に、周辺機器群14、15の保守(試験)の処理を実行する。次に、この保守方法について説明する。図2は、本発明の実施形態に係るコンピュータシステムの保守方法のフロー図であり、ステップS0において、スタートする。
ステップS1において、CPU10の元にあるBIOS11に対して保守の開始を指示する。保守の開始の例としては、コンピュータシステムの立上げがある。また、コンピュータシステムの立上げ時に周辺機器群14あるいは15の一方を試験した後、試験していない他方の周辺機器群の保守開始でもよい。さらに、コンピュータシステムの外部にある端末装置17からの保守の指示に基づくものでもよい。またさらに、周辺機器群からのエラーの通知によってもよい。なお、保守の開始は、CPU10への割り込み通知によりなされる。
ステップS2において、BIOS11は、CPU10の割り込みリソースおよび入出力リソースが2組の内の一方の周辺機器群に向くように切替手段13を動作させる。
ステップS3において、切替手段13により選択された一方の周辺機器群の保守を行う。保守にあたって、切替手段13の動作前に選択されている周辺機器群が持つ情報を、切替手段13の動作後に選択される周辺機器群が持つ情報にコピーする。この情報には、時刻情報、BIOS11の設定情報およびOSの設定情報等が含まれる。
ステップS4において、ステップS3における保守の結果に基づいて継続する処理を行う。継続する処理の例としては、CPU10の元にあるOSの立上げ、ステップS3における保守の結果が異常を示す場合における外部の端末装置17への通知などがある。
ステップS5において、一連の処理が終了する。
本発明の実施形態に係るコンピュータシステムは、以上の説明のように動作し、システムに一つしか接続することができない周辺機器群に関して、オンラインでの保守(試験)を行うことができる。
次に、本発明の実施例について図面を参照して説明する。図3は、本発明の第1の実施例に係るコンピュータシステムのブロック図である。図3は、図1のコンピュータシステムのブロック図中の切替手段13、周辺機器群14、15について詳しく表したものであり、これを中心に説明する。
図3において、切替手段13は、周辺機器群14、15に対する接続制御を行うルーティング部20を備える。また、ルーティング部20を介して周辺機器群14のバスをCPU10に接続するホスト・バス・ブリッジ部21を備える。さらに、ルーティング部20を介して周辺機器群15のバスをCPU10に接続するホスト・バス・ブリッジ部22を備える。
なお、切替手段13は、LSIのチップセットとして実現されていてもよく、CPU10、メモリ12などと共にコンピュータシステム内のマザーボード上に実装されてもよい。
周辺機器群14、15は、コア・デバイス群とも称され、例えば、キーボード、マウス、シリアルポート、パラレルポート、FDD(フロッピディスクドライバ)、RTC(real time clock、時刻情報)、NVRAM(nonvolatile RAM、 BIOS、OS設定情報を蓄えた不揮発性メモリ)、ATAPI(AT attachment packet interface、CD/DVD−ROMドライバなどの周辺機器の接続仕様)、USB(universal serial bus)などのデバイスを含むものである。なお、NVRAMには、BIOS11の設定情報、OSの設定情報等が書込まれている。
周辺機器群14は、運用系として通常接続されている機器群であり、ホスト・バス・ブリッジ部21により、CPU10の割り込みリソース、入出力リソースが周辺機器群14に向けられる。
周辺機器群15は、待機系として通常は接続されていない機器群であり、ホスト・バス・ブリッジ部22により、CPU10の割り込みリソース、入出力リソースが周辺機器群15に向けられる。
次にコンピュータシステムの保守方法について説明する。図4は、本発明の第1の実施例に係るコンピュータシステムの保守方法のフロー図である。コンピュータシステムの立上げ時に運用系の周辺機器群14と待機系の周辺機器群15とを保守(試験)するものであり、ステップS10において、スタートする。
ステップS11において、ルーティング部20は、CPU10の割り込みリソースおよび入出力リソースが運用系の周辺機器群14に向くようにルーティング部20を設定する。
ステップS12において、運用系の周辺機器群14が持つ情報、例えば時刻情報、NVRAM内の情報をメモリ12にコピーする。
ステップS13において、運用系の周辺機器群14を試験する。具体的には、コンピュータシステムのアーキテクチャで定められた入出力リソースを使ってデバイスを初期化し、制御して期待した結果が得られるか、またコンピュータシステムのアーキテクチャで定められた割り込みリソースをデバイスへ割り当てて、デバイスから割り込みが上がるかなどを試験する。
ステップS14において、ステップS12でメモリ12にコピーした情報を待機系の周辺機器群15が持つ情報にコピーする。これにより運用系の周辺機器群14が持つ情報、例えば時刻情報、NVRAM内の情報と待機系の周辺機器群15が持つ情報とが一致し、運用系の周辺機器群14と待機系の周辺機器群15とが同じ条件で動作することとなる。
ステップS15において、ルーティング部20は、CPU10の割り込みリソースおよび入出力リソースが待機系の周辺機器群15に向くようにルーティング部20を設定する。
ステップS16において、待機系の周辺機器群15を試験する。試験の内容は、ステップS13と同等のものである。
ステップS17において、BIOS11は、ステップS13においてエラーが検出されたか否か(試験が正常終了したか否か)を確認する。エラーが検出された場合(試験が異常終了した場合)にはステップS18に進み、エラーが検出されない場合(試験が正常終了した場合)にはステップS19に進む。
ステップS18において、運用系の周辺機器群14を切離す。すなわち、ホスト・バス・ブリッジ部21の働きを停止する。
ステップS19において、BIOS11は、ステップS16においてエラーが検出されたか否か(試験が正常終了したか否か)を確認する。エラーが検出された場合(試験が異常終了した場合)にはステップS20に進み、エラーが検出されない場合(試験が正常終了した場合)にはステップS21に進む。
ステップS20において、待機系の周辺機器群15を切離す。すなわち、ホスト・バス・ブリッジ部22の働きを停止する。
ステップS21において、保守に関する一連の処理を終了する。
次に、以上で説明した保守(試験)の結果に基づいて継続される処理について説明する。図5は、本発明の第1の実施例に係るコンピュータシステムの保守後に継続される処理のフロー図であり、ステップS30において、スタートする。
ステップS31において、BIOS11は、ステップS17と同様に、運用系の周辺機器群14でエラーが検出されたか否か(試験が正常終了したか否か)を確認する。エラーが検出された場合(試験が異常終了した場合)にはステップS33に進み、エラーが検出されない場合(試験が正常終了した場合)には、ステップS32において、運用系の周辺機器群14を使用する周辺機器群とし、OSを立ち上げる。
ステップS33において、BIOS11は、ステップS19と同様に、待機系の周辺機器群15でエラーが検出されたか否か(試験が正常終了したか否か)を確認する。エラーが検出されない場合(試験が正常終了した場合)には、ステップS34において、待機系の周辺機器群15を使用する周辺機器群とし、OSを立ち上げる。また、エラーが検出された場合(試験が異常終了した場合)には、ステップS35でOSの立上げを中止する。その際、BIOS11は、エラーが検出された旨を外部インタフェース16を介して端末装置17に通知するようにしてよい。
次に、コンピュータシステムのOSの運用中の保守方法について説明する。図6は、本発明の第2の実施例に係るコンピュータシステムの保守方法のフロー図である。コンピュータシステムのOSの運用中に待機系の周辺機器群15を保守(試験)するものであり、保守は、保守員が端末装置17を操作することによって行われてもよく、また、自動的に定期的に端末装置17が起動することで行われてもよい。端末装置17から外部インタフェース16を介してBIOSへ指示(割り込み)することによって、ステップS40において、スタートする。
ステップS41において、BIOSが動作開始する。
ステップS42において、運用系の周辺機器群14が持つ情報、例えば時刻情報、NVRAM内の情報をメモリ12にコピーする。
ステップS43において、ルーティング部20は、CPU10の割り込みリソースおよび入出力リソースが待機系の周辺機器群15に向くようにルーティング部20を設定する。
ステップS44において、待機系の周辺機器群15において生じるエラーがコンピュータシステム全体に波及しないように、ホスト・バス・ブリッジ部22が備えるエラー防止機能を用いてエラーをマスクする。
ステップS45において、ステップS42でメモリ12にコピーした情報を待機系の周辺機器群15が持つ情報にコピーする。
ステップS46において、待機系の周辺機器群15を試験する。試験の内容は、ステップS13と同等のものである。
ステップS47において、BIOS11は、ステップS46においてエラーが検出されたか否か(試験が正常終了したか否か)を確認する。エラーが検出された場合(試験が異常終了した場合)にはステップS48に進み、エラーが検出されない場合(試験が正常終了した場合)にはステップS49に進む。
ステップS48において、待機系の周辺機器群15を切離す。すなわち、ホスト・バス・ブリッジ部22の働きを停止させる。
ステップS49において、ルーティング部20は、CPU10の割り込みリソースおよび入出力リソースが運用系の周辺機器群14に向くようにルーティング部20を設定する。
ステップS50において、ホスト・バス・ブリッジ部22が備えるエラー防止機能のエラー検出を許可する(エラー・マスクを解除する)。
ステップS51において、OSに戻り、一連の処理を終了する。
次に、コンピュータシステムのOSの運用中に運用系の周辺機器群14が故障した場合の保守方法について説明する。図7は、本発明の第3の実施例に係るコンピュータシステムの保守方法のフロー図である。コンピュータシステムのOSの運用中に運用系の周辺機器群14が故障してエラーが発生するとBIOSへ指示(割り込み)が通知され、ステップS60において、スタートする。
ステップS61において、BIOSが動作開始する。
ステップS62において、エラー・ログを収集する。このエラー・ログには、運用系の周辺機器群14が故障する直前にOSが実行していた命令のアドレスなどのソフトウェア・エラー・ログと、故障原因と故障個所を特定するためのハードウェア・エラー・ログなどが含まれる。
ステップS63において、運用系の周辺機器群14を切離す。すなわち、ホスト・バス・ブリッジ部21の働きを停止させる。
ステップS64において、ルーティング部20は、CPU10の割り込みリソースおよび入出力リソースが待機系の周辺機器群15に向くようにルーティング部20を設定する。
ステップS65において、運用系の周辺機器群14が切離され、待機系の周辺機器群15に切り替わったことをOSに通知する。また、ステップS62において収集したエラー・ログをOSに渡す。
ステップS66において、OSおよびOSの元にあるデバイス・ドライバは、待機系の周辺機器群15中で再初期化が必要なデバイスの初期化を行う。なお、時刻情報、NVRAM内の情報に関しては、図4のステップS14、あるいは図6のステップS45において、運用系の周辺機器群14の時刻情報、NVRAM内の情報の内容が待機系の周辺機器群15にコピーされているので(内容が既に一致しているので)、OSはこれらデバイスを再初期化しない。そして、OSは、待機系の周辺機器群15を使ってシステムの運用を継続して行き、一連の処理を終了する(ステップS67)。その際、BIOS11は、エラー・ログを外部インタフェース16を介して端末装置17に通知するようにしてよい。
次に、コンピュータシステムがマルチプロセッサで構成される場合について説明する。図8は、本発明の第4の実施例に係るコンピュータシステムのブロック図である。図8において、CPU10a、10b、・・10n(それぞれがBIOS11a、11b、・・11nを有する)がマルチプロセッサとして構成される点が図1のコンピュータシステムと異なる。CPU(BIOS)以外は、図1と同等なので、その説明を省略する。
マルチプロセッサ構成の場合、実施例2で説明したような、端末装置17から外部インタフェース16を介してBIOSへ指示(割り込み)、あるいは実施例3で説明したような、OSの運用中に運用系の周辺機器群14が故障してエラーが発生した際のBIOSへ指示(割り込み)は、全てのCPU上のBIOS11a、11b、・・11nに通知される。
指示(割り込み)を受けた各CPUの中から待機系の周辺機器群15の試験を実行する一つのCPUが決定される。決定されたCPUをモナークCPUと呼ぶ。この決定方法に関しては、最初に指示(割り込み)を受けたCPUがモナークになるなどの方法がある。なお、シングル・プロセッサ構成の場合は、一つあるCPUそのものがモナークになる。
次に、コンピュータシステムがマルチプロセッサで構成される場合のOSの運用中の保守方法について説明する。図9は、本発明の第4の実施例に係るコンピュータシステムの保守方法のフロー図である。コンピュータシステムのOSの運用中に待機系の周辺機器群15を保守(試験)するものであり、端末装置17から外部インタフェース16を介してBIOSへ指示(割り込み)することによって、ステップS40において、スタートする。図9において、ステップS52、S53以外のステップは、図6と同等であり、その説明を省略する。
ステップS41において、BIOSが動作開始し、ステップS52において、指示(割り込み)を受けたCPUがモナークCPUであるか否かを判断する。モナークCPUであれば、以降、図6と同様の処理を行う。モナークCPUでない場合にはステップS53に進む。
ステップS53において、モナークCPU以外のCPU上のBIOSは、待機系の周辺機器群15における保守(試験)の終了を待合せて(ランデブー状態と呼ぶ)、ステップS51で一連の処理を終了する。
次に、コンピュータシステムがマルチプロセッサで構成される場合のOSの運用中に運用系の周辺機器群14が故障した場合の保守方法について説明する。図10は、本発明の第4の実施例に係るコンピュータシステムの他の保守方法のフロー図である。コンピュータシステムのOSの運用中に運用系の周辺機器群14が故障してエラーが発生するとBIOSへ指示(割り込み)が通知され、ステップS60において、スタートする。図10において、ステップS68、S69、S70以外のステップは、図7と同等であり、その説明を省略する。
ステップS61において、BIOSが動作開始し、ステップS68において、指示(割り込み)を受けたCPUがモナークCPUであるか否かを判断する。モナークCPUであれば、以降、図7と同様の処理を行う。モナークCPUでない場合にはステップS69に進む。
ステップS69において、モナークCPU以外のCPU上のBIOSは、モナークCPUと同じようにソフトウェア・エラー・ログを収集する。
ステップS70において、モナークCPU以外のCPU上のBIOSは、待機系の周辺機器群15への切り替えが終了するのを待合せ(ランデブー状態と呼ぶ)、ステップS67で一連の処理を終了する。
次に、切替手段13による周辺機器群の選択が電源供給によりなされる実施例について図面を参照して説明する。図11は、本発明の第5の実施例に係るコンピュータシステムのブロック図である。図11は、図1のコンピュータシステムのブロック図中の切替手段13、周辺機器群14、15について詳しく表したものであり、これを中心に説明する。
図11において、切替手段13aは、周辺機器群14、15に対する接続制御を行うルーティング部23を備えている。また、周辺機器群14、15のバスを接続するホスト・バス・ブリッジ部24を備え、周辺機器群14、15への電源供給を制御する電源供給部25を備える。
図11におけるルーティング部23は、電源供給部25を用いて、周辺機器群14または周辺機器群15のいずかに電源を供給することで、CPU10の割り込みリソース、入出力リソースが、ホスト・バス・ブリッジ部24を介して、周辺機器群14または周辺機器群15のいずれかに向くように制御する。
すなわち、コンピュータシステムのOSの通常の運用中、あるいは運用系の周辺機器群14の保守(試験)の際には、運用系の周辺機器群14の電源を供給する(組み込む)と共に、待機系の周辺機器群15の電源を落とす(切り離す)。また、待機系の周辺機器群15の保守(試験)の際には、待機系の周辺機器群15の電源を供給する(組み込む)と共に、運用系の周辺機器群14の電源を落とす(切り離す)。
以上の説明のように、切替手段13aの電源供給部25を動作させることで、図3において説明したルーティング部20と同じような機能を実現することができる。
オンラインでの保守の容易な周辺機器群を備えるコンピュータシステムが提供される。
本発明の実施形態に係るコンピュータシステムのブロック図である。 本発明の実施形態に係るコンピュータシステムの保守方法のフロー図である。 本発明の第1の実施例に係るコンピュータシステムのブロック図である。 本発明の第1の実施例に係るコンピュータシステムの保守方法のフロー図である。 本発明の第1の実施例に係るコンピュータシステムの保守後に継続される処理のフロー図である。 本発明の第2の実施例に係るコンピュータシステムの保守方法のフロー図である。 本発明の第3の実施例に係るコンピュータシステムの保守方法のフロー図である。 本発明の第4の実施例に係るコンピュータシステムのブロック図である。 本発明の第4の実施例に係るコンピュータシステムの保守方法のフロー図である。 本発明の第4の実施例に係るコンピュータシステムの他の保守方法のフロー図である。 本発明の第5の実施例に係るコンピュータシステムのブロック図である。
符号の説明
10、10a、10b、・・10n CPU
11、11a、11b、・・11n BIOS
12 メモリ
13、13a 切替手段
14、15 周辺機器群
16 外部インタフェース
17 端末装置
18 バス
20、23 ルーティング部
21、22、24 ホスト・バス・ブリッジ部
25 電源供給部

Claims (20)

  1. CPUに接続して同時には動作させることができない2組の周辺機器群を有するコンピュータシステムの保守方法であって、
    保守の開始を前記CPUの元にあるBIOS(Basic Input Output System)に対して指示するステップと、
    前記BIOSによって、前記CPUの割り込みリソースおよび入出力リソースが前記2組の内の一方の周辺機器群に向くように切替手段を動作させるステップと、
    前記切替手段により選択された前記一方の周辺機器群の保守を行うステップと、
    前記保守の結果に基づいて継続する処理を行うステップと、
    を含むことを特徴とするコンピュータシステムの保守方法。
  2. 前記2組の周辺機器群は、運用系と待機系とに対応するものであることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  3. 前記保守の開始は、前記CPUへの割り込み通知によることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  4. 前記保守の開始は、前記コンピュータシステムの立上げによることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  5. 前記保守の開始は、外部から前記コンピュータシステムへの保守の指示に基づくものであることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  6. 前記保守の指示に基づいて待機系の周辺機器群の保守を行う際に、前記待機系の周辺機器群から発生するエラー検出を防止することを特徴とする請求項5記載のコンピュータシステムの保守方法。
  7. 前記保守の開始は、運用系の周辺機器群からのエラーの通知によるものであって、
    前記エラーの通知により、エラーログを収集するステップを含み、
    前記切替手段を動作させるステップは、運用系の周辺機器群を切り離し、待機系の周辺機器群を接続するステップであり、
    前記保守を行うステップは、前記待機系の周辺機器群の再初期化を行うステップであることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  8. 前記保守にあたって、前記切替手段の動作前に選択されている周辺機器群が持つ情報を、前記切替手段の動作後に選択される周辺機器群が持つ情報にコピーすることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  9. 前記周辺機器群が持つ前記情報には、時刻情報、前記BIOSの設定情報およびOS(Operating System)の設定情報の少なくともいずれかが含まれることを特徴とする請求項8記載のコンピュータシステムの保守方法。
  10. 前記継続する処理は、前記CPUの元にあるOSの動作であることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  11. 前記継続する処理は、前記保守の結果が異常を示す場合における前記コンピュータシステムの外部への通知であることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  12. CPUに接続して同時には動作させることができない運用系と待機系の2組の周辺機器群を有するコンピュータシステムの保守方法であって、
    前記コンピュータシステムの立上げによって、前記CPUの元にあるBIOS(Basic Input Output System)に対して指示するステップと、
    前記BIOSによって、前記CPUの割り込みリソースおよび入出力リソースが前記運用系の周辺機器群に向くように切替手段を動作させるステップと、
    前記運用系の周辺機器群の保守を行い、保守の結果、エラーがある場合には前記運用系の周辺機器群を切り離すステップと、
    前記BIOSによって、前記CPUの割り込みリソースおよび入出力リソースが前記待機系の周辺機器群に向くように切替手段を動作させるステップと、
    前記待機系の周辺機器群の保守を行い、保守の結果、エラーがある場合には前記待機系の周辺機器群を切り離すステップと、
    を含むをことを特徴とするコンピュータシステムの保守方法。
  13. 前記運用系の周辺機器群の保守の結果でエラーがない場合には、使用する周辺機器群を前記運用系の周辺機器群としてOS(Operating System)を立ち上げるステップと、
    前記運用系の周辺機器群の保守の結果でエラーがあり、且つ前記待機系の周辺機器群の保守の結果でエラーがない場合には、使用する周辺機器群を前記待機系の周辺機器群としてOSを立ち上げるステップと、
    を含むをことを特徴とする請求項12記載のコンピュータシステムの保守方法。
  14. 前記コンピュータシステムは、マルチプロセッサを含み、前記CPUは、前記マルチプロセッサから選択された一つのプロセッサであり、選択されていない他のプロセッサは、前記保守の処理を待ち合わせることを特徴とする請求項1記載のコンピュータシステムの保守方法。
  15. 前記保守の開始を指示する割り込み通知の到来順序にしたがって、前記一つのプロセッサが選択されることを特徴とする請求項14記載のコンピュータシステムの保守方法。
  16. CPUと、
    前記CPUの元にあるBIOS(Basic Input Output System)と、
    前記CPUに接続して同時には動作させることができない2組の周辺機器群と、
    前記BIOSによって、前記CPUの割り込みリソースおよび入出力リソースが前記2組の内の一方の周辺機器群に向くように動作する切替手段と、
    を含むことを特徴とするコンピュータシステム。
  17. 前記切替手段は、前記2組の周辺機器群に対するルーティング機能を備える手段であることを特徴とする請求項16記載のコンピュータシステム。
  18. 前記切替手段は、前記2組の周辺機器群のいずれか一方への電源供給を行う手段を含むことを特徴とする請求項16記載のコンピュータシステム。
  19. 前記コンピュータシステムは、マルチプロセッサを含み、前記CPUは、前記マルチプロセッサから選択された一つのプロセッサであることを特徴とする請求項16記載のコンピュータシステム。
  20. 保守の開始を指示する割り込み通知の到来順序にしたがって、前記一つのプロセッサが選択されることを特徴とする請求項19記載のコンピュータシステム。
JP2004000403A 2004-01-05 2004-01-05 コンピュータシステムおよびその保守方法 Expired - Fee Related JP4066950B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004000403A JP4066950B2 (ja) 2004-01-05 2004-01-05 コンピュータシステムおよびその保守方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004000403A JP4066950B2 (ja) 2004-01-05 2004-01-05 コンピュータシステムおよびその保守方法

Publications (2)

Publication Number Publication Date
JP2005196351A true JP2005196351A (ja) 2005-07-21
JP4066950B2 JP4066950B2 (ja) 2008-03-26

Family

ID=34816250

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004000403A Expired - Fee Related JP4066950B2 (ja) 2004-01-05 2004-01-05 コンピュータシステムおよびその保守方法

Country Status (1)

Country Link
JP (1) JP4066950B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249761A (ja) * 2006-03-17 2007-09-27 Fujitsu Ltd コンピュータ装置、起動制御方法及び起動制御プログラム
JP2009116499A (ja) * 2007-11-05 2009-05-28 Toshiba Corp 医用機器及び医用機器ログ収集方法
JP2010231340A (ja) * 2009-03-26 2010-10-14 Hitachi Ltd 計算機およびその障害処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007249761A (ja) * 2006-03-17 2007-09-27 Fujitsu Ltd コンピュータ装置、起動制御方法及び起動制御プログラム
JP4746455B2 (ja) * 2006-03-17 2011-08-10 富士通株式会社 コンピュータ装置、起動制御方法及び起動制御プログラム
JP2009116499A (ja) * 2007-11-05 2009-05-28 Toshiba Corp 医用機器及び医用機器ログ収集方法
JP2010231340A (ja) * 2009-03-26 2010-10-14 Hitachi Ltd 計算機およびその障害処理方法
US8122285B2 (en) 2009-03-26 2012-02-21 Hitachi, Ltd. Arrangements detecting reset PCI express bus in PCI express path, and disabling use of PCI express device
US8365012B2 (en) 2009-03-26 2013-01-29 Hitachi, Ltd. Arrangements detecting reset PCI express bus in PCI express path, and disabling use of PCI express device

Also Published As

Publication number Publication date
JP4066950B2 (ja) 2008-03-26

Similar Documents

Publication Publication Date Title
JP3954088B2 (ja) 論理分割された(lpar)計算機でシステム・ファームウェア更新を安全に実行する機構
US7007192B2 (en) Information processing system, and method and program for controlling the same
EP1119809B1 (en) Process monitoring in a computer system
US7194614B2 (en) Boot swap method for multiple processor computer systems
WO2019156062A1 (ja) 情報処理システム、情報処理装置、情報処理装置のbios更新方法、及び情報処理装置のbios更新プログラム
US20050033952A1 (en) Dynamic scheduling of diagnostic tests to be performed during a system boot process
JP5716830B2 (ja) 情報処理装置及び方法、プログラム
JP4066950B2 (ja) コンピュータシステムおよびその保守方法
JP2009176232A (ja) 起動装置、起動方法、及び、起動プログラム
JP2002049509A (ja) データ処理システム
JP2005234744A (ja) マルチプロセッサシステム及び障害処理方法
JP4633553B2 (ja) デバッグシステム、デバッグ方法およびプログラム
JP2005122375A (ja) 動作試験装置および動作試験方法
JPH11120154A (ja) コンピュータシステムにおけるアクセス制御装置および方法
US20040162978A1 (en) Firmware developer user interface
JP4853620B2 (ja) マルチプロセッサシステムと初期立ち上げ方法およびプログラム
JP6090335B2 (ja) 情報処理装置
JP2006178688A (ja) 多重化装置及びレガシーデバイス多重化方法
JP2005157462A (ja) 系切り替え方法及び情報処理システム
JPH0764814A (ja) 多重構成システムによるプログラム実行方式
JP3340284B2 (ja) 冗長システム
JPH10149343A (ja) マルチプロセッサ立ち上げ管理装置
JP2005266948A (ja) コアi/oカードを実装したシステムボード
JP4494263B2 (ja) サービスシステムの冗長化方式
JP2000322397A (ja) 情報処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071231

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120118

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees