JP4068277B2 - ハードウェアシステム - Google Patents

ハードウェアシステム Download PDF

Info

Publication number
JP4068277B2
JP4068277B2 JP36769099A JP36769099A JP4068277B2 JP 4068277 B2 JP4068277 B2 JP 4068277B2 JP 36769099 A JP36769099 A JP 36769099A JP 36769099 A JP36769099 A JP 36769099A JP 4068277 B2 JP4068277 B2 JP 4068277B2
Authority
JP
Japan
Prior art keywords
module
hardware
switch
failure
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP36769099A
Other languages
English (en)
Other versions
JP2001184138A (ja
Inventor
承昊 申
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP36769099A priority Critical patent/JP4068277B2/ja
Publication of JP2001184138A publication Critical patent/JP2001184138A/ja
Application granted granted Critical
Publication of JP4068277B2 publication Critical patent/JP4068277B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Power Sources (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、計算機システム等のハードウェアシステムに関する。
【0002】
【従来の技術】
計算機システム等のハードウェアシステムに発生した一過性の障害のほとんどはシステム全体を再初期化(リセット)することによって解消される。ところが、一般にシステム全体のリセットはいくつもの工程を踏んで行われるため長い時間がかかる。そこで、チェックポイント/リカバリ方式のような短時間で障害を解消するための方式が存在する。
【0003】
このチェックポイント/リカバリ方式においては、あるハードウェアモジュール(機器)に障害が発生したとき、そのモジュールに電源を入れたままリセット信号を与えることによって障害状態からの回復を試みる。しかしながら、この方式はモジュールの障害がリセット回路にまでは及んでいないことを前提としており、モジュールの障害がリセット回路に波及していた場合、リセットが正しく働かず障害を回復することができない。
【0004】
【発明が解決しようとする課題】
このように計算機システム等のハードウェアシステムに障害が発生した場合の対策として、システム全体をリセットする方法と、障害を発生したモジュールを通電状態のままリセットさせる方法がある。ところが、システム全体をリセットする方法は確実であるもののリセット完了までに長い時間がかかり、また、障害を発生したモジュールを通電状態のままリセットさせる方法は確実性に欠くという課題があった。
【0005】
本発明は、このような課題を解決するためのもので、ハードウェアモジュールの障害に起因するシステムの問題をより迅速にかつ確実に解消することのできるハードウェアシステムの提供を目的とする。
【0006】
【課題を解決するための手段】
上記目的を達成するために、この発明のハードウェアシステムは、中央制御装置と、この中央制御装置によって運用される複数のハードウェアモジュールと、前記個々のハードウェアモジュールへの電源供給のオン/オフを個別に切り替えるスイッチ手段と、障害が検出された前記ハードウェアモジュールをリセットするように前記スイッチ手段を制御するスイッチ制御手段とを有し、前記スイッチ制御手段が、ハードウェアモジュール毎に決められた時間だけ電源供給をオフさせるように前記スイッチ手段を制御することを特徴とする。
【0007】
本発明は、障害が検出されたハードウェアモジュールだけをリセットするようにスイッチ手段を制御してそのハードウェアモジュールへの電源の供給を一旦停止した後、再度電源を供給することによって、システム全体をリセットする既知の方式に比べ高速にシステムを障害状態から回復させることができ、しかも障害発生モジュールを通電状態のままリセットさせる既知の方式よりも確実に障害を排除することができる。
【0008】
また、ハードウェアモジュール毎に最適な時間だけ電源供給をオフさせるようにスイッチ手段を制御する構成を付加することで、より一層確実性の高いハードウェアモジュールのリセットが可能になる。
【0009】
さらに、ハードウェアモジュールの識別情報を申告する識別情報申告手段と、各ハードウェアモジュールより申告された識別情報により各スイッチと各ハードウェアモジュールとの接続関係を管理するスイッチ接続管理手段を設けることで、ハードウェアモジュールを交換可能なシステムにおいても、各スイッチと各ハードウェアモジュールとの接続関係が明確になり、信頼性を維持することができる。
【0010】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照して説明する。
【0011】
図1に、本発明の実施形態に係るハードウェアシステムの構成を示す。
【0012】
このハードウェアシステムは、例えば、システム全体の制御を行う中央制御装置であるプロセッサ1と、このプロセッサ1による制御下で運用される複数のハードウェアモジュール2(以下、単にモジュール2と呼ぶ。)と、システムに必要な電源を供給する電源装置3と、電源装置3から個々のモジュール2への電源供給のオン/オフを個別に切り替える電源スイッチ4と、各モジュール2の設定情報を記憶しておくモジュール設定情報記憶装置5と、障害の発生したモジュール2を特定するモジュールチェック装置6と、モジュール設定情報記憶装置5に記憶された設定情報によりモジュール2の再設定を行うモジュール再設定装置7と、各電源スイッチ4を制御する電源スイッチ制御装置8とを備えて構成される。
【0013】
このハードウェアシステムは、モジュール2を各種I/Oデバイスとした計算機システムはもちろん、モジュール2を各種プロセス用の処理装置としたプロセスシステムなど、あらゆるシステムに適用することが可能である。
【0014】
モジュール設定情報記憶装置5、モジュールチェック装置6、モジュール再設定装置7はそれぞれプロセッサ1により実行されるプログラムにより実現されたものでもよいし、それぞれプロセッサ1の制御下にある専用ハードウェアによって実現されたものであってよい。
【0015】
次に、このハードウェアシステムの動作を説明する。
【0016】
このハードウェアシステムの通常の運用時は、各電源スイッチ4がオンの状態になるようプロセッサ1から電源スイッチ制御装置8に制御信号が与えられ、これにより、電源装置3から電源スイッチ4を通じて各モジュール2へ電源が供給される。
【0017】
いずれかのモジュール2に障害が発生した場合、プロセッサ1はモジュールチェック装置6により各モジュール2の状態のチェックを行う。モジュールチェック装置6によって障害の発生したモジュール2が判定されると、続いてプロセッサ1は、電源スイッチ制御装置8により、障害が発生したモジュール2への電源供給を切り替える電源スイッチ4をオフ状態に切り替えて当該モジュール2への電源供給を一定時間停止する。一定時間が経過した後、電源スイッチ制御装置8により電源スイッチ4をオン状態に切り替えて当該モジュール2への電源供給を再開する。
【0018】
モジュール2が起動されると、プロセッサ1はモジュール再設定装置7によりモジュール設定情報記憶装置5に記憶されている当該モジュール用の設定情報をモジュール2に設定する。以上により、障害が発生したモジュール2のリセットが完了する。
【0019】
このように、障害が発生したモジュール2への電源の供給だけを一旦停止した後再び電源供給を再開してそのモジュール2を単独にリセットすることによって、システム全体をリセットする既知の方式に比べ高速にシステムを障害状態から回復させることができ、しかも障害発生モジュール2を通電状態のままリセットさせる既知の方式よりも確実に障害を排除することができる。
【0020】
次に、このハードウェアシステムをパーソナルコンピュータなどの計算機システムに適用した場合の実施形態を説明する。
【0021】
図2に、この計算機システムの構成を示す。この計算機システムにおいて、図1のハードウェアシステムのモジュール設定情報記憶装置5、モジュールチェック装置6およびモジュール再設定装置7は、CPU11と、主記憶部12にロードされたプログラムによって実現される。また、モジュール2として、ハードディスクドライブや光ディスクドライブ等のドライブ類、ディスプレイ、モデムやネットワークアダプタ等の通信機器などのI/Oデバイス13と、このデバイス13を制御するI/Oコントローラ14が少なくとも存在している。
【0022】
I/Oデバイス13およびI/Oコントローラ14はそれぞれ別個の電源スイッチ4a,4bを通じて電源装置3と接続され、それぞれ個別に電源供給のオン/オフの切り替えが電源スイッチ制御装置8によって行われる。電源スイッチ制御装置8の制御はプロセッサバス15を通じてCPU11から送られる制御信号に基づいている。なお、図では、I/Oデバイス13とI/Oコントローラ14が一組しか示されていないが、これらは複数組存在する。
【0023】
システムに接続されているモジュール群のうちのあるI/Oデバイス13に障害が発生した場合を考える。I/Oデバイス13の障害の発生は、CPU11とI/Oデバイス13との間での通信において、I/Oデバイス13からの応答がなくなる、或いはI/Oデバイス13からエラー発生信号が応答される、などによって判定することが可能である。I/Oデバイス13に障害が発生したことが判定されると、CPU11から電源スイッチ制御装置8に、当該I/Oデバイス13への電源の供給を停止するための制御信号が送られる。電源スイッチ制御装置8はこの制御信号を受けて、I/Oデバイス13への電源供給を切り替えるスイッチ4bを制御することによってI/Oデバイス13への電源供給を一定時間停止し、一定時間経過後、再びスイッチ4bをオン状態に切り替えてI/Oデバイス13への電源供給を再開する。電源投入後、I/Oデバイス13の設定が行われ、これでI/Oデバイス13のリセットが完了する。
【0024】
I/Oデバイス13の障害はそのI/Oデバイス13のみならずこれを制御しているI/Oコントローラ14にも波及している場合がある。この場合、I/Oデバイス13だけをリセットしてもシステムの問題は解消されない。
【0025】
そこで、I/Oデバイス13のリセット後に障害が解消されなかった場合は、再びI/Oデバイス13への電源供給をオフするとともにこのI/Oデバイス13のI/Oコントローラ14への電源供給もオフし、一定時間が経過した後、I/Oデバイス13およびI/Oコントローラ14の両方の電源供給をオンにする。すなわち、I/Oデバイス13とI/Oコントローラ14の組をリセットする。これにより、I/Oデバイス13の障害がI/Oコントローラ14にも波及している場合でもシステムの障害を解消できる。さらに、I/Oデバイス13とI/Oコントローラ14との組をリセットしても障害が解消されない場合は、さらにその上位の制御系モジュールも合わせてリセットするようにしてもよい。システム全体のモジュールは木構造で接続されているから、問題が解消されるまで、リセットするモジュールの階層の範囲を末端側より広げて行くことで必要最小限の数のモジュールのリセットにより、効率的にかつ確実にシステムの問題を解消できる。
【0026】
ところで、モジュールはその種類によってリセットのための最適な電源オフ時間が異なる。例えば、ネットワークアダプタの場合は1s程度、SCSI機器の場合は5s程度である。そこで、モジュール毎の最適な電源オフ時間の情報を登録したテーブルを予め用意しておき、このテーブルを参照して電源オフ時間を選択するようにすることが好ましい。このテーブルはユーザが手入力により作成してもよいし、或いはモジュール2に電源オフ時間の情報を何らかのかたちで記録しておき、システムがテーブル作成時にモジュール2からその情報を読み込んでテーブルを自動作成するようにしてもよい。
【0027】
次に、モジュールとスイッチとの対応付けについて説明する。
【0028】
前提として、計算機システムは、現在どんなモジュール2が接続されており、どのモジュール2に障害が起きているのかを認識できる機能をもっているとする。障害を起こしたモジュール2が判定されると、CPU11から電源スイッチ制御装置8にその障害を起こしたモジュール2が通知されるので、電源スイッチ制御装置8は、そのモジュール2が接続されている電源スイッチ4を調べてそのスイッチの切り替えを制御する。ところが、モジュール2の交換が可能な計算機システムの場合、電源スイッチ制御装置8は現在個々の電源スイッチ4に何のモジュール2が接続されているかを知っている必要がある。
【0029】
そこで本実施形態では、図3に示すように、電源スイッチ制御装置8に電源スイッチ4とモジュール2との対応テーブル21を用意しておき、CPU11から電源スイッチ制御装置8に障害を起こしたモジュール2が通知されたときに、そのモジュール2に接続された電源スイッチ4を前記対応テーブルを参照して調べることができるようにしている。この対応テーブル21は、もちろん手入力によって作成することが可能であるが、本実施形態では自動的に対応テーブル21を作成する機能を採用している。
【0030】
図3に、この自動的なテーブル作成のための構成を示す。モジュール2にはID発生回路22が設けられている。このID発生回路22は、自モジュール2のID情報を含む高周波パルスによる変調信号を電源ライン23に乗せる。電源スイッチ4には、電源ライン23に乗せられた高周波パルスによる変調信号を電源スイッチ制御装置8のスイッチ制御ポート24に伝達できるもの例えばパワー用のトランジスタやFET等が使用されている。
【0031】
電源スイッチ制御装置8にはそれぞれのスイッチ制御ポート24毎にハイパスフィルタ25とデコーダ26が設けられている。ハイパスフィルタ25はスイッチ制御ポート24の信号から高周波成分を抽出してデコーダ26に導入し、デコーダ26はこれを復調して当該電源スイッチ4に接続されたモジュール2のID情報を得る。電源スイッチ制御装置8は、このようにして得られたモジュール2のID情報を用いて前記の対応テーブル21を作成する。なお、モジュール2にはID発生回路22から電源ライン23に乗せられた高周波パルスをカットして後段の主要回路に供給するためのローパスフィルタ27が必要である。
【0032】
ここでは、電源ライン23にモジュール2のID情報を高周波パルスとして乗せて電源スイッチ制御装置8に伝達する方法を説明したが、モジュール2から電源スイッチ制御装置8にID情報を通知できれば別の方法を用いても構わない。例えば、電源スイッチ4の番号をモジュール2の側で認識し、そのスイッチ番号とモジュール2のID情報をCPU11を経由してスイッチ制御装置8に伝達するようにしてもよい。
【0033】
さらに、本実施形態では、電源スイッチ制御装置8の中でスイッチ番号とモジュールのID情報との対応テーブルを管理するようにしたが、対応テーブルの管理はCPU11で行うようにしてもよい。
【0034】
【発明の効果】
以上説明したように、本発明によれば、システム全体をリセットする既知の方式に比べ高速にシステムを障害状態から回復させることができ、しかも障害発生モジュールを通電状態のままリセットさせる既知の方式よりも確実に障害を排除することができる。また、ハードウェアモジュール毎に最適な時間だけ電源供給をオフさせることで、より一層確実性の高いハードウェアモジュールのリセットが可能になる。さらに、各ハードウェアモジュールより申告された識別情報により各スイッチと各ハードウェアモジュールとの接続関係を管理することで、ハードウェアモジュールを交換可能なシステムにおいても、各スイッチと各ハードウェアモジュールとの接続関係が明確になり、信頼性を維持することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係るハードウェアシステムの構成を示す図
【図2】 図1のハードウェアシステムを計算機システムに適用した場合の実施形態を示す図
【図3】図2の計算機システムにおいて電源スイッチとモジュールとの対応テーブルを自動的に作成する構成を示す図
【符号の説明】
1…プロセッサ
2…ハードウェアモジュール
3…電源装置
4…電源スイッチ
5…モジュール設定情報記憶装置
6…モジュールチェック装置
7…モジュール再設定装置
8…電源スイッチ制御装置
11…CPU
12…主記憶部
13…I/Oデバイス
14…I/Oコントローラ
15…プロセッサバス

Claims (3)

  1. 中央制御装置と、
    この中央制御装置によって運用される複数のハードウェアモジュールと、
    前記個々のハードウェアモジュールへの電源供給のオン/オフを個別に切り替えるスイッチ手段と、
    障害が検出された前記ハードウェアモジュールをリセットするように前記スイッチ手段を制御するスイッチ制御手段とを有し、
    前記スイッチ制御手段が、ハードウェアモジュール毎に決められた時間だけ電源供給をオフさせるように前記スイッチ手段を制御することを特徴とするハードウェアシステム。
  2. 前記スイッチ手段が、個々の前記ハードウェアモジュール毎に電源との接続のオン/オフを切り替える複数のスイッチで構成されていることを特徴とする請求項1記載のハードウェアシステム。
  3. 前記各ハードウェアモジュールの識別情報を申告する識別情報申告手段と、
    前記各ハードウェアモジュールの前記識別情報申告手段よりそれぞれ申告された識別情報により前記各スイッチと前記各ハードウェアモジュールとの接続関係を管理するスイッチ接続管理手段とをさらに有し、
    前記スイッチ制御手段は、前記スイッチ接続管理手段により管理された前記各スイッチと前記各ハードウェアモジュールとの接続関係に基づいて前記スイッチ手段を制御することを特徴とする請求項2記載のハードウェアシステム。
JP36769099A 1999-12-24 1999-12-24 ハードウェアシステム Expired - Fee Related JP4068277B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36769099A JP4068277B2 (ja) 1999-12-24 1999-12-24 ハードウェアシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36769099A JP4068277B2 (ja) 1999-12-24 1999-12-24 ハードウェアシステム

Publications (2)

Publication Number Publication Date
JP2001184138A JP2001184138A (ja) 2001-07-06
JP4068277B2 true JP4068277B2 (ja) 2008-03-26

Family

ID=18489957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36769099A Expired - Fee Related JP4068277B2 (ja) 1999-12-24 1999-12-24 ハードウェアシステム

Country Status (1)

Country Link
JP (1) JP4068277B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764657B1 (ko) * 2012-10-26 2017-08-03 인텔 코포레이션 자동화된 선택적 전력 사이클링을 통한 컴퓨팅 서브시스템 하드웨어 복구

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015056764A (ja) * 2013-09-11 2015-03-23 東日本電信電話株式会社 通信装置
CN114237961A (zh) * 2021-12-20 2022-03-25 深信服科技股份有限公司 硬件故障隔离方法、装置及服务器

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101764657B1 (ko) * 2012-10-26 2017-08-03 인텔 코포레이션 자동화된 선택적 전력 사이클링을 통한 컴퓨팅 서브시스템 하드웨어 복구

Also Published As

Publication number Publication date
JP2001184138A (ja) 2001-07-06

Similar Documents

Publication Publication Date Title
US6952785B1 (en) Methods and apparatus for powering a data communications port
KR20010062749A (ko) 정보 처리 장치 등의 원격 전력 관리 시스템
KR19990023689A (ko) 구내 정보 통신망을 이용한 장해 통지 시스템 및 방법
US20240289243A1 (en) Server and control method therefor
JP2015035175A (ja) 情報処理装置、仮想マシン制御方法および仮想マシン制御プログラム
JP4068277B2 (ja) ハードウェアシステム
JP2002136000A (ja) 無停電電源システム
JP2001101034A (ja) 異種os間制御による障害復旧方法
JP3762389B2 (ja) ファイバチャネルの光回線に接続可能な電子機器、ファイバチャネルシステム、及び同システムにおける電源制御方法
JP2000020336A (ja) 二重化通信システム
JP4966610B2 (ja) 情報処理システム、情報処理システムの緊急時電源断方法
JP4098004B2 (ja) 電源連動制御方法
JP7557898B1 (ja) デバイスおよび制御方法
JP3794358B2 (ja) 電源制御方法
JP2658683B2 (ja) 相互スタンバイシステムにおけるシステムストール監視制御方式
JPS59148968A (ja) 自動運転装置
JP3475542B2 (ja) 給電システム
JP3107104B2 (ja) 待機冗長方式
JP2003157180A (ja) ディスクアレイシステム
JPH09198334A (ja) データ伝送システムの障害管理方法
JPH11202985A (ja) コンピュータの自動再起動方法
JP2000057017A (ja) 遠隔管理モジュール及びそれを用いた遠隔管理機能付コンピュータ
JPS5816497B2 (ja) システム共通部をそなえたデ−タ処理システム
JPH05224768A (ja) 計算機システムの自動立ち上げ監視機構
JPH10269087A (ja) リモートネットワークコンピュータシステム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050318

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070618

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080110

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110118

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120118

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130118

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140118

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees