JP2795246B2 - メモリ二重化システムにおける割り込み処理時の障害リカバリ装置 - Google Patents

メモリ二重化システムにおける割り込み処理時の障害リカバリ装置

Info

Publication number
JP2795246B2
JP2795246B2 JP8009108A JP910896A JP2795246B2 JP 2795246 B2 JP2795246 B2 JP 2795246B2 JP 8009108 A JP8009108 A JP 8009108A JP 910896 A JP910896 A JP 910896A JP 2795246 B2 JP2795246 B2 JP 2795246B2
Authority
JP
Japan
Prior art keywords
memory
control unit
fault
interrupt
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP8009108A
Other languages
English (en)
Other versions
JPH09198259A (ja
Inventor
敏和 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP8009108A priority Critical patent/JP2795246B2/ja
Publication of JPH09198259A publication Critical patent/JPH09198259A/ja
Application granted granted Critical
Publication of JP2795246B2 publication Critical patent/JP2795246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、メモリ二重化シス
テムにおける割り込み処理の障害リカバリ装置に関す
る。
【0002】
【従来の技術】従来のこの種の障害リカバリ技術を開示
するものとして、特公平05−061697,特公平0
2−135535,特公昭63−188243および特
公昭61−227454がある。これらの技術において
は、割り込み処理中に発生したハードウェア障害および
ソフトウェア障害に対し、オペレーティングシステムは
固定的な判定基準、例えばIF文の出現やパリティエラ
ーの発生に基づき、障害のリカバリが可能であるか、あ
るいは不可能であるかを判定して、システムをクラッシ
ュさせるか否かを決定している。
【0003】
【発明が解決しようとする課題】しかしながら、上述の
障害リカバリ技法では、割り込み処理中にハードウェア
障害、およびソフトウェア障害が発生した場合、オペレ
ーティングシステムの固有の判定基準にしたがってシス
テムのリカバリ可能、あるいは不可能が決定されるた
め、障害の発生したハードウェアコンポーネント、ある
いはソフトウェアコンポーネントの切り離し処理(縮退
処理)や、障害の発生した割り込み処理自体の切り捨て
処理を組み合わせることで、オペレーティングシステム
のリカバリが可能な場合であっても、コンピュータシス
テムはシステムクラッシュさせられてしまうという問題
点がある。
【0004】本発明は、縮退処理や、障害の発生した割
り込み処理自体の切り捨て処理を組み合わせる柔軟な対
応により、システムクラッシュの発生頻度を低減させ
て、システムの信頼性を向上させるとともに、迅速なシ
ステムのリカバリ可能にすることで、システムの特性と
してのハードウェア障害、あるいはソフトウェア障害に
対するリカバリ対応の高速化を実現することを目的とす
る。
【0005】
【課題を解決するための手段】本発明の装置は、コンポ
ーネントコードと障害コードの組合せごとに、割り込み
処理中の障害の発生時に実行する障害対応処理が登録さ
れている障害対応情報テーブルと、割り込み発生ごとに
発生直前のハードウェア情報を退避する領域であるハー
ドウェア情報退避領域とを格納するための障害コントロ
ールユニット用メモリと、該障害コントロールユニット
用メモリを制御する障害コントロールユニットと、二重
化されたメインメモリおよびスレーブメモリと、該2つ
のメモリを制御するメモリコントロールユニットとを有
するメモリ二重化システムにおける割り込み処理時の障
害リカバリ装置において、割り込み発生時に、割り込み
発生直前のシステム状態を退避するために、前記障害コ
ントロールユニットとメモリコントロールユニットに対
して割り込み発生直前の状態を退避する通知を上げる手
段(S11)を有し、前記障害コントロールユニット
は、前記通知を受け取ると、割り込み発生直前のハード
ウェア情報をハードウェア情報退避領域に退避する手段
(S21)を有し、前記メモリコントロールユニット
は、前記通知を受け取ると、割り込み発生直前のメモリ
状態を保持するためにメモリ二重化を停止する手段(S
31)を有し、前記オペレーティングシステムは、割り
込み処理からの復帰時に前記メモリコントロールユニッ
トに対してメモリ二重化の要求を通知する(S12)
と、割り込み処理中に障害が発生した場合には、障害が
発生したコンポーネントコードおよび障害コードから成
る障害情報を前記障害コントロールユニットに通知する
手段(S13)を有し、前記障害コントロールユニット
は、該受け取った障害情報に該当する障害対応処理、障
害対応情報テーブルを検索する手段(S22)と、実行
される障害対応処理では、まず現在実行中の割り込み処
理の切り捨てが可能な状況であるかどうかを判定する手
段(S23)と、該判定の結果、割り込み処理の切り捨
てが可能であると判定された場合には、システム状態を
割り込み発生直前の状態に戻すために、まず現在使用中
のメインメモリから、割り込み発生直前のメモリ状態を
保持しているスレーブメモリへの切り替え要求をメモリ
コントロールユニットに通知する手段(S24)と、該
通知後に、前記障害コントロールユニット用メモリ上の
ハードウェア情報退避領域に退避されている割り込み発
生直前のハードウェア情報を再設定する手段(S25)
とを有し、前記メモリコントロールユニットは、前記障
害コントロールユニットからメモリ切り替え要求の通知
を受け取った時に、メインメモリからスレーブメモリへ
切り替える手段(S32)と、前記切り替えられたスレ
ーブメモリをメインメモリとして、またメインメモリを
スレーブメモリとして再認識し、スレーブメモリの内容
をメインメモリにコピーする手段を含むメモリの再二重
化の手段(S33)とを有することを特徴とする。
【0006】[作用]本発明では、システムユーザが、
オペレーティングシステム経由で障害コントロールユニ
ットに、障害が発生したコンポーネントコード、発生し
た障害に対応する障害コードおよび障害の発生時に実行
する処理を含む障害対応情報を、障害コントロールユニ
ット用メモリ上に存在する障害対応情報テーブルに新規
登録、あるいは変更登録する手段(図2、図3のA1)
により、各割り込み処理での障害に対応する処理を柔軟
に設定する手段を有するが、これにより、オペレーティ
ングシステムは各既定の判定基準に基づき、障害のリカ
バリが可能であるか、あるいは不可能であるかを判定し
てシステムをクラッシュさせずに、運用形態を考慮した
上で、システムユーザが柔軟に割り込み処理での障害リ
カバリ対応を設定し、実施することが可能になる。
【0007】そして、システム運用中に割り込みが発生
した時には、オペレーティングシステムからの通知によ
り、障害コントロールユニット、およびメモリコントロ
ールユニットにて割り込み発生直前の状態を保存するた
めに必要となる情報を退避、およびメモリ二重化構成を
停止し、片方の運用系にて割り込み処理を行う手段(図
1のS11、S21、S31)と、割り込み処理中の障
害時に、障害情報に該当する障害対応処理を実行する手
段(図1のS13、S22)と、そこで実行される割り
込み処理の切り捨て可否判定により、割り込み処理の切
り捨てを実施した場合に、メモリコントロールユニッ
ト、および障害コントロールユニットに通知する(図1
のS23,S24)ことで、メモリの再二重化、および
割り込み発生直前のハードウェア情報を再設定する手段
(図1のS25、S32、S33)によって、システム
を割り込み発生直前の状態に復帰するが、これにより、
システムでの割り込み中のハードウェア障害、およびソ
フトウェア障害に対して迅速なリカバリ対応が可能にな
る。
【0008】
【発明の実施の形態】先ず、図2に本発明が適用される
コンピュータシステムを示す。本コンピュータシステム
は、メモリを二重化構成にするための2つのメモリ、す
なわちメインメモリD5およびスレーブメモリD6と、
この2つのメモリを制御するメモリコントロールユニッ
トD3を有する。また、本コンピュータシステムにおい
ては、ハードウェアおよびソフトウェアの全コンポーネ
ントを網羅し、一意に識別するためのコード(以下コン
ポーネントコードと記す)体系と、全障害に一意に対応
するコード(以下、障害コードと記す)体系が既定され
ており、割り込み処理中の障害発生の通知によって該当
する情報、すなわち、コンポーネントコードと障害コー
ドの組合せによって定まる、障害発生時に実行すべき障
害対応処理プログラム(以下、障害対応処理と記す)が
障害対応情報テーブルA1に登録されている。この障害
対応情報テーブルA1は、割り込み発生毎に発生直前の
ハードウェア情報を退避する領域であるハードウェア情
報退避領域A2とともに、障害コントロールユニット用
メモリD4に格納されており、障害コントロールユニッ
トD2の配下にある。
【0009】図3は、上述の障害対応情報テーブルA1
におけるコンポーネントコード,障害コードおよび障害
対応処理の登録状態を示す。
【0010】システムユーザは、システム立上げ後であ
れば、いつでもシステムコールを発行してオペレーティ
ングシステム経由で障害コントロールユニットD2に通
知を行い、システムオンライン中に障害が発生したコン
ポーネントコード、発生した障害に対応する障害コー
ド、および障害の発生時に実行する処理を含む障害対応
情報を障害対応情報テーブルA1に新規登録、あるいは
変更登録することが可能である。
【0011】以下、図1に示す処理フローに沿って、本
実施例の動作を説明する。
【0012】いま、本コンピュータシステム運用中に割
り込みが発生した時に、オペレーティングシステムは割
り込み発生の通知を受けた後、割り込み発生直前のシス
テム状態を退避するため、障害コントロールユニットD
2とメモリコントロールユニットD3に対して割り込み
発生直前の状態を退避する通知を上げる処理S11を実
行する。
【0013】障害コントロールユニットD2は、オペレ
ーティングシステムからこの通知を受け取ると、割り込
み発生直前のハードウェア情報をハードウェア情報退避
領域A2に退避する処理S21を実行する。
【0014】また、メモリコントロールユニットD3は
オペレーティングシステムから通知を受け取ると、割り
込み発生直前のメモリ状態を保持するために、メモリ二
重化を停止する処理S31を実行する。本処理S31に
よって、メインメモリD5は割り込み処理を継続するた
めのメモリとして使用され、スレーブメモリD6はメモ
リ二重化を停止されることにより、再びメモリ二重化の
要求があるまで割り込み発生直前のメモリ状態を保持す
ることができる。
【0015】そして、割り込み処理中に障害が発生しな
ければ、オペレーティングシステムは割り込み処理から
の復帰時にメモリコントロールユニットD3に対してメ
モリ二重化の要求を通知する処理S12を実行する。メ
モリコントロールユニットD3はオペレーティングシス
テムからこの通知を受け取ると、メインメモリD5の内
容をスレーブメモリD6にコピー処理し(S33)、再
びメモリ二重化でのシステム運用を開始する。
【0016】一方、前述の割り込み処理中に障害が発生
した場合には、オペレーティングシステムは障害が発生
したコンポーネントコードおよび障害コードから成る障
害情報を障害コントロールユニットD2に通知する処理
S13を実行する。障害コントロールユニットD2は、
受け取った障害情報によって障害対応情報テーブルA1
から該当する障害対応処理を検索する処理S22を実行
する。そして、検索された障害対応処理が以下のように
実行される。
【0017】この障害対応処理では、まず、現在実行中
の割り込み処理の切り捨てが可能な状況であるかどうか
の判定処理S23を実行する。本判定の基準は、コンピ
ュータシステムにて割り込み処理を切り捨てることによ
る影響、すなわち、システムクラッシュに至るほど重大
な割り込み処理であるかどうかにより設定されている。
本判定の結果、割り込み処理の切り捨てが不可能である
と判定した場合には、割り込み処理を続行するためにオ
ペレーティングシステムに処理を移行し、システム運用
を再開する。
【0018】一方、割り込み処理の切り捨てが可能であ
ると判定された場合には、システム状態を割り込み発生
直前の状態に戻すために、まず、現在使用中のメインメ
モリD5から、割り込み発生直前のメモリ状態を保持し
ているスレーブメモリD6への切り替え要求をメモリコ
ントロールユニットD3に通知する処理S24を実行す
る。
【0019】その後に、障害コントロールユニット用メ
モリD4上のハードウェア情報退避領域A2に退避され
ている割り込み発生直前のハードウェア情報を再設定す
る処理S25を実行する。メモリコントロールユニット
D3は、障害コントロールユニットD2からメモリ切り
替え要求の通知を受け取ると、メインメモリD5からス
レーブメモリD6への切り替え処理S32を実行する。
【0020】次に、切り替えられたスレーブメモリD6
をメインメモリとして、またメインメモリD5をスレー
ブメモリとして再認識し、スレーブメモリD6の内容を
メインメモリD5にコピーする処理を含むメモリの再二
重替処理S33を実行する。
【0021】その後に、オペレーティングシステムに処
理を移行することで、コンピュータシステムは割り込み
発生直前の状態に復帰することができる。
【0022】
【発明の効果】本発明によると、第1に、障害の発生し
た割り込み処理自体の切り捨てることにより、迅速に割
り込み直前の状態に復旧できるため、従来技術と比べて
割り込み処理時に発生した障害の迅速なリカバリ対応が
可能である。また、第2に、システムユーザはシステム
の使用状況に応じて、障害のリカバリ可能、あるいは不
可能の判定基準を柔軟に変更、あるいは新規設定するこ
とができるため、システムクラッシュの発生頻度が低減
されるという効果を有する。
【図面の簡単な説明】
【図1】本発明における割り込み処理時の障害リカバリ
の動作を示すフローチャートである。
【図2】本発明のコンピュータシステム全体を示す構成
図である。
【図3】本発明で使用される障害対応情報テーブルA1
における登録状態を示す図である。
【符号の説明】
A1 障害対応情報テーブル A2 ハードウェア情報退避領域 D1 中央処理ユニット D2 障害コントロールユニット D3 メモリコントロールユニット D4 障害コントロールユニット用メモリ D5 メインメモリ D6 スレーブメモリ
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06F 9/46 G06F 11/00 G06F 11/14 G06F 11/16 - 11/20

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】コンポーネントコードと障害コードの組合
    せごとに、割り込み処理中の障害の発生時に実行する障
    害対応処理が登録されている障害対応情報テーブルと、
    割り込み発生ごとに発生直前のハードウェア情報を退避
    する領域であるハードウェア情報退避領域とを格納する
    ための障害コントロールユニット用メモリと、該障害コ
    ントロールユニット用メモリを制御する障害コントロー
    ルユニットと、 二重化されたメインメモリおよびスレーブメモリと、該
    2つのメモリを制御するメモリコントロールユニットと
    を有するメモリ二重化システムにおける割り込み処理時
    の障害リカバリ装置において、 割り込み発生時に、割り込み発生直前のシステム状態を
    退避するために、前記障害コントロールユニットとメモ
    リコントロールユニットに対して割り込み発生直前の状
    態を退避する通知を上げる手段(S11)を有し、 前記障害コントロールユニットは、前記通知を受け取る
    と、割り込み発生直前のハードウェア情報をハードウェ
    ア情報退避領域に退避する手段(S21)を有し、 前記メモリコントロールユニットは、前記通知を受け取
    ると、割り込み発生直前のメモリ状態を保持するために
    メモリ二重化を停止する手段(S31)を有し、 前記オペレーティングシステムは、割り込み処理からの
    復帰時に前記メモリコントロールユニットに対してメモ
    リ二重化の要求を通知する(S12)と、割り込み処理
    中に障害が発生した場合には、障害が発生したコンポー
    ネントコードおよび障害コードから成る障害情報を前記
    障害コントロールユニットに通知する手段(S13)を
    有し、 前記障害コントロールユニットは、該受け取った障害情
    報に該当する障害対応処理、障害対応情報テーブルを検
    索する手段(S22)と、実行される障害対応処理で
    は、まず現在実行中の割り込み処理の切り捨てが可能な
    状況であるかどうかを判定する手段(S23)と、該判
    定の結果、割り込み処理の切り捨てが可能であると判定
    された場合には、システム状態を割り込み発生直前の状
    態に戻すために、まず現在使用中のメインメモリから、
    割り込み発生直前のメモリ状態を保持しているスレーブ
    メモリへの切り替え要求をメモリコントロールユニット
    に通知する手段(S24)と、該通知後に、前記障害コ
    ントロールユニット用メモリ上のハードウェア情報退避
    領域に退避されている割り込み発生直前のハードウェア
    情報を再設定する手段(S25)とを有し、 前記メモリコントロールユニットは、前記障害コントロ
    ールユニットからメモリ切り替え要求の通知を受け取っ
    た時に、メインメモリからスレーブメモリへ切り替える
    手段(S32)と、前記切り替えられたスレーブメモリ
    をメインメモリとして、またメインメモリをスレーブメ
    モリとして再認識し、スレーブメモリの内容をメインメ
    モリにコピーする手段を含むメモリの再二重化の手段
    (S33)とを有することを特徴とするメモリ二重化シ
    ステムにおける割り込み処理時の障害リカバリ装置。
  2. 【請求項2】前記障害対応情報テーブルへの障害対応情
    報の登録は、システムユーザによってオペレーティング
    システム経由で行われることを特徴とする請求項1記載
    のメモリ二重化システムにおける割り込み処理時の障害
    リカバリ装置。
  3. 【請求項3】前記障害対応情報テーブルへの障害対応情
    報の変更登録は、当該コンピュータシステムの使用状況
    に応じて、システムユーザによってオペレーティングシ
    ステム経由で行われることを特徴とする請求項1記載の
    メモリ二重化システムにおける割り込み処理時の障害リ
    カバリ装置。
JP8009108A 1996-01-23 1996-01-23 メモリ二重化システムにおける割り込み処理時の障害リカバリ装置 Expired - Fee Related JP2795246B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8009108A JP2795246B2 (ja) 1996-01-23 1996-01-23 メモリ二重化システムにおける割り込み処理時の障害リカバリ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8009108A JP2795246B2 (ja) 1996-01-23 1996-01-23 メモリ二重化システムにおける割り込み処理時の障害リカバリ装置

Publications (2)

Publication Number Publication Date
JPH09198259A JPH09198259A (ja) 1997-07-31
JP2795246B2 true JP2795246B2 (ja) 1998-09-10

Family

ID=11711440

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8009108A Expired - Fee Related JP2795246B2 (ja) 1996-01-23 1996-01-23 メモリ二重化システムにおける割り込み処理時の障害リカバリ装置

Country Status (1)

Country Link
JP (1) JP2795246B2 (ja)

Also Published As

Publication number Publication date
JPH09198259A (ja) 1997-07-31

Similar Documents

Publication Publication Date Title
US4823256A (en) Reconfigurable dual processor system
US6477663B1 (en) Method and apparatus for providing process pair protection for complex applications
KR100557399B1 (ko) 네트웍 매체 링크상태 기능을 이용한 컴퓨터 클러스터링시스템의 가용도 개선방법
JP2795246B2 (ja) メモリ二重化システムにおける割り込み処理時の障害リカバリ装置
JP3710649B2 (ja) マルチプロセッサシステム
JPH05314075A (ja) オンラインコンピュータ装置
JP3325785B2 (ja) 計算機の故障検出・回復方式
JP3394189B2 (ja) 任意プロセッサのプログラム・データ無中断更新システム
JP3022768B2 (ja) 仮想計算機システム
JP2002049509A (ja) データ処理システム
JPH10116261A (ja) 並列計算機システムのチェックポイントリスタート方法
JPH0879246A (ja) 分散型通信システムおよびその障害回復方法
JPH10207586A (ja) コンピュータの電源オフ制御方式
JPH07282022A (ja) マルチプロセッサシステム
JPH07177543A (ja) 無中断ファイル更新処理方式
KR930010952B1 (ko) 메모리 장애 처리 방법
JPS597982B2 (ja) 計算機システムのシステム障害時の再開始方式
JPH07200334A (ja) 二重化同期運転方式
JPH02238529A (ja) デュプレックスシステム
JP2000047893A (ja) 複数オンラインシステムにおける障害回復方法およびオンライン処理システム
JPH02196341A (ja) 情報処理装置の障害復旧方式
JPS62296264A (ja) デ−タ処理システムの構成制御方式
JPH06266478A (ja) 計算機システム
KR20000014053A (ko) 무선 가입자 망에서의 이중화시스템의 데이터 고속 백업 방법
JPH02121452A (ja) 電子交換機システム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980526

LAPS Cancellation because of no payment of annual fees