JP2000276364A - 障害復旧方法、中央処理装置及び中央処理システム - Google Patents

障害復旧方法、中央処理装置及び中央処理システム

Info

Publication number
JP2000276364A
JP2000276364A JP11079034A JP7903499A JP2000276364A JP 2000276364 A JP2000276364 A JP 2000276364A JP 11079034 A JP11079034 A JP 11079034A JP 7903499 A JP7903499 A JP 7903499A JP 2000276364 A JP2000276364 A JP 2000276364A
Authority
JP
Japan
Prior art keywords
address
central processing
fault
processing unit
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11079034A
Other languages
English (en)
Inventor
Keizo Akiyama
桂三 秋山
Toshio Sakurai
寿男 桜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP11079034A priority Critical patent/JP2000276364A/ja
Publication of JP2000276364A publication Critical patent/JP2000276364A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 障害の復旧のために、当該障害に不相応に多
大な影響がユーザにおよぶことを防ぐ。 【解決手段】 システムの正常な稼動を継続するための
重要度に応じて、第1及び第2のアドレス空間内の各ア
ドレスにアドレス指数を割り付け、中央処理装置に内蔵
されているマイクロプロセッサのアクセス先のアドレス
を、アドレス保持手段が保持し、障害の発生時には、ア
クセス先のアドレスを前記アドレス保持手段から得て、
少なくとも当該アドレスのアドレス指数に応じて異なる
障害復旧動作を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、中央処理システム
に関し、たとえばPBX(構内交換機)内の各機能ブロ
ックで障害が発生した場合のシステムバックアップ機能
などを提供する中央処理システムに適用し得るものであ
る。
【0002】また本発明は、かかる中央処理システムの
構成要素としての中央処理装置に関するものである。
【0003】さらに本発明は、かかる中央処理システム
において使用する障害復旧方法に関するものである。
【0004】
【従来の技術】割込みでMPU(マイクロプロセッサ)
に障害発生を通知するシステムにおいて、障害がシステ
ム中のどこで発生した場合でも、従来では同じ障害復旧
処理が行われていた。
【0005】
【発明が解決しようとする課題】ところでシステム内の
場所あるいは機能ブロックによって、システムの正常な
稼動を継続するための重要度は、軽重さまざまである。
たとえばPBX交換機システムの例では、現にシステム
の中央処理装置として動作している中央処理装置内の主
メモリや、交換(スイッチ)動作を行うIC(集積回
路)が搭載されている基板などは、交換動作を継続する
ために非常に重要な部分であるが、メモリに障害が発生
したときにIPL(イニシャルプログラムロード)する
ためのディスク装置が搭載されている基板や、二重化シ
ステムにおけるスタンバイ系の中央処理装置などは、重
要度が低く、障害が発生したとしてもただちにPBX交
換機の交換動作が正常に行えなくなるものでもない。
【0006】上述した従来のシステムでは、このディス
ク装置のような重要度の低い部分に障害が発生した場合
でも、ただちに交換動作を停止して障害復旧処理を行っ
ていたので、トラヒック密度の高い時間帯などでは新た
な呼処理などの多数の新たな操作に対するサービスが停
止して、多数のユーザに運用上の不具合をもたらしてい
た。
【0007】
【課題を解決するための手段】(A) かかる課題を解
決するため、第1および第2の発明では、中央処理装置
内のアドレス空間である第1のアドレス空間で発生した
障害、又は当該中央処理装置を含むシステム中で、この
第1のアドレス空間を除いたアドレス空間である第2の
アドレス空間で発生した障害の復旧方法において、以下
の各ステップを備えることを特徴とする。
【0008】すなわち第1の発明では、(1)当該シス
テムの正常な稼動を継続するための重要度に応じて、第
1及び第2のアドレス空間内の各アドレスにアドレス指
数を割り付け、(2)当該中央処理装置に内蔵されてい
るマイクロプロセッサのアクセス先のアドレスを、アド
レス保持手段が保持し、(3)前記障害の発生時には、
アクセス先のアドレスを前記アドレス保持手段から得
て、少なくとも当該アドレスのアドレス指数に応じて異
なる障害復旧動作を行うことを特徴とする。
【0009】また第2の発明では、(1)当該システム
の正常な稼動を継続するための重要度に応じて、前記障
害の各障害要因に障害要因指数を割り付けておき、
(2)前記障害の発生時には、障害要因判定手段が当該
障害要因を判定して保持し、(3)さらに、当該障害要
因を前記障害要因判定手段から得て、少なくともこの障
害要因の障害要因指数に応じて異なる障害復旧動作を行
うことを特徴とする。
【0010】(B) さらに第3および第4の発明で
は、中央処理装置内のアドレス空間である第1のアドレ
ス空間で発生した障害、又は当該中央処理装置を含むシ
ステム中で、この第1のアドレス空間を除いたアドレス
空間である第2のアドレス空間で発生した障害を復旧す
る中央処理装置において、以下の各手段を備えることを
特徴とする。
【0011】すなわち第3の発明では、(1)当該シス
テムの正常な稼動を継続するための重要度に応じて、第
1及び第2のアドレス空間内の各アドレスに割り付けた
アドレス指数を格納しているアドレス指数格納手段と、
(2)当該中央処理装置に内蔵されているマイクロプロ
セッサのアクセス先のアドレスを保持するアドレス保持
手段とを備え、(3)前記障害の発生時には、アクセス
先のアドレスを前記アドレス保持手段から得て、前記ア
ドレス指数格納手段を参照し、少なくとも当該アドレス
のアドレス指数に応じて異なる障害復旧動作を行うこと
を特徴とする。
【0012】また、第4の発明では、(1)当該システ
ムの正常な稼動を継続するための重要度に応じて、前記
障害の各障害要因に割り付けた障害要因指数を格納して
いる障害要因指数格納手段と、(2)前記障害の発生時
には、その障害要因を判定して保持する障害要因保持手
段とを備え、(3)前記障害の発生時には、障害要因を
障害要因保持手段から得て、前記障害要因指数格納手段
を参照し、少なくとも当該障害要因の障害要因指数に応
じて異なる障害復旧動作を行うことを特徴とする。
【0013】(C) さらに第5の発明では、請求項4
〜6のいずれかの中央処理装置を複数接続して構成され
ている中央処理システムにおいて、システムの中央処理
装置として機能しているアクト状態の中央処理装置のマ
イクロプロセッサが主体となって、前記アドレス指数又
は障害要因指数に応じて、異なる障害復旧動作を行うこ
とを特徴とする。
【0014】
【発明の実施の形態】(A)実施形態 以下、本発明にかかる障害復旧方法、中央処理装置及び
中央処理システムを、二重化構成のPBX交換機に適用
した場合を例に、一実施形態について説明する。
【0015】(A−1)実施形態の構成 実施形態にかかる中央処理システム10を図2に示す。
【0016】図2において、PBX交換機の中央処理シ
ステム10は中央処理装置10Aおよび10Bの2つの
パッケージから構成されている。これら2つのパッケー
ジはそれぞれ別の基板に搭載されて、当該PBX交換機
システムの一部をなしている。
【0017】この二重化構成のPBX交換機システムで
は、中央処理装置以外の機能をもつ基板、たとえば交換
動作を行うICが搭載されているスイッチ基板、メモリ
に障害が発生したときにIPLするためのディスク装置
が搭載されているディスク基板、外部のコンピュータ端
末と当該PBX交換機システムとのあいだで、情報を入
出力するI/O装置を搭載しているI/O基板などの各
機能をもつ基板が、それぞれ2つずつ存在する。
【0018】そして同一機能をもつ2つの基板のうち、
一方が当該PBX交換機のために現にその機能を発揮し
ているアクト系で、他方がその機能を発揮していないス
タンバイ系である。同一機能の2つの基板は、障害発生
時などにアクト系とスタンバイ系の系切替えを行うこと
で、交換動作を継続し、システムの信頼性を高めている
が、これらについては図示しない。
【0019】図2に示すように、前記中央処理装置10
Aのパッケージ外周には、この中央処理装置10Aの内
部バスのバス端子11A、12Aが設けられ、同様に中
央処理装置10Bのパッケージ外周には、バス端子11
B,12Bが設けられている。
【0020】中央処理装置10Aのバス端子11Aは、
外部で必要なバスバッファ(図示せず)を介して周辺I
Cなどに接続されている0系バスに、当該内部バスを接
続するためのピンである。
【0021】同様に、中央処理装置10Bのバス端子1
1Bは、必要なバスバッファを介して周辺ICなどに接
続されている1系バスに、中央処理装置10Bの内部バ
スを接続するためのピンである。
【0022】またバス端子12Aは、MPU18Aによ
る二重書き込み時や、アクト時のMPU18Bが後述す
るメート間通信用のデータを、共有メモリである第2メ
モリ13Aに書き込む場合などに使用されるピンで、中
央処理装置10Bの前記バス端子11Bに接続されてい
る。
【0023】同様に、バス端子12Bは、アクト状態の
MPU18Bによる二重書き込み時や、MPU18Aが
メート間通信用のデータを、共有メモリである第2メモ
リ13Bに書き込む場合などに使用されるピンで、中央
処理装置10Aの前記バス端子11Aに接続されてい
る。
【0024】このような接続関係によって、中央処理装
置10Aのバス端子11Aからゲート回路14A、主メ
モリ19Aにいたる内部バスと、中央処理装置10Bの
バス端子12Bからゲート回路16B、第2メモリ13
Bにいたる内部バスとは、前記0系のバスとなる。
【0025】同様に、中央処理装置10Bのバス端子1
1Bからゲート回路14B、主メモリ19Bにいたる内
部バスと、中央処理装置10Aのバス端子12Aからゲ
ート回路16A、第2メモリ13Aにいたる内部バスと
は、前記1系のバスとなる。
【0026】このほか中央処理装置10Aと10Bは、
緊急制御バス25を介して、バス端子22Aと22Bが
接続されている。
【0027】次に、中央処理装置10Aの内部構成を説
明する。この中央処理装置10Aは、障害が発生したア
クセス先が、PBX交換機システムの正常な稼動を継続
するためにどれほど重要であるかに応じて、異なる割込
みレベルでMPU18Aに割込みをかける割込み処理部
30Aを備え、当該割込みレベルに応じてMPU18A
に異なる割込み処理ルーチンを実行させる点に特徴を有
する。
【0028】二重化構成の中央処理装置10Aにおい
て、前記MPU18Aは自系の主メモリ19Aと他系の
主メモリ19Bに対し、同一サイクルで同一情報を書き
込む二重書き込みを行っている。
【0029】中央処理装置10A内には4つのゲート回
路14A〜17Aが設けられている。このうちゲート回
路14AはMPU18Aと主メモリ19Aのあいだに配
置され、ゲート回路16AはMPU18Aと第2メモリ
13Aのあいだに配置されている。またゲート回路15
Aは、主メモリ19Aと前記バス端子11Aのあいだに
配置され、ゲート回路17Aは第2メモリ13Aと前記
バス端子12Aのあいだに配置されている。
【0030】前記主メモリ19Aとは別個に、同じ中央
処理装置10A内に設けられた第2のメモリ13Aは、
自系の中央処理装置10Aのスタンバイ状態において、
MPU18Aによるアクセスと他系中央処理装置10B
によるアクセスとが、唯一の主メモリ上で衝突するこ
と、すなわち競合を避けるために考案されたRAM(ラ
ンダムアクセスメモリ)である。第2メモリ13Aによ
り競合が生じないため、アクセスタイミングの構成が簡
単になり、中央処理装置10A(、10B)の処理能力
が低下しない。
【0031】一般的に、二重化構成の中央処理システム
におけるスタンバイ状態の中央処理装置(10B)は、
当該PBX交換機の中央処理装置としては機能していな
いものの必ずしもまったく動作していないわけではな
い。たとえばメート間通信や障害復旧処理などのため
に、スタンバイ系のMPU(18B)が自系メモリ(図
2の主メモリ19Bに相当する)に対して書き込み、読
み出しアクセスを行うことがある。したがって、アクト
系のMPU18Aによる二重書き込みとこのMPU18
Bによるアクセスとが当該自系メモリ(19B)で衝突
して、処理能力が低下することをを避けるため、上述し
た第2メモリ(13B、13A)の必要性が生じる。
【0032】前記主メモリ19Aは、RAMの部分と、
プログラムを格納するためのEEPROM(フラッシュメモ
リ)の部分を含んでいる。
【0033】MPU18Aとデータバスおよびアドレス
バスで直接接続されているROM20Aは、必要最小限
のプログラムやデータを保持している。
【0034】MPU18Aに直接接続されているEMA
(緊急制御回路)21Aは、中央処理装置10A、10
B間の系切替えで重要な役割をはたす回路である。自系
のEMA21Aと他系のEMA21Bとは、信号を直接
やり取りするために、バス端子11Aや12Aとは別
の、上述したバス端子22A、22Bを介して緊急制御
バス25で直接接続されている。
【0035】これにより特別にゲート回路14A〜17
A、14B〜17Bを制御しなくてもEMA21A,2
1B同士で信号をやり取りでき、0系または1系の内部
バス周辺で障害が発生したような場合でも、EMA21
A,21B間の連絡は確保できる。緊急制御バス25を
用いて、自系と他系のEMA21Aと21Bは、いつで
も互いの状態をモニタし合っている。
【0036】中央処理装置10A内に二点鎖線で示した
割込み処理部30Aには、MPU18Aとアドレスバス
およびデータバス(すなわちMPU-BUS)で接続されている
MPU制御回路31Aと、このMPU制御回路31Aに
よって管理されるアドレス保持レジスタ32Aおよび障
害要因レジスタ33Aと、MPU制御回路31Aからの
指示に応じてMPU18Aに複数の割込みレベルで割込
み要求を送出する割込み制御回路34Aとから構成され
ている。
【0037】さらに詳しく説明すると、前記MPU制御
回路31Aは、二重書き込みアクセスごとに自系の主メ
モリ19Aと他系の主メモリ19Bからそれぞれ送信さ
れてくる応答信号の受信タイミングが、当該二重書き込
みアクセス開始から所定時間以内であるかどうかを検出
する回路や、当該応答信号のパリティチェックを行うた
めの回路など諸種の障害要因の発生を検出するハードウ
エアを備えている。
【0038】またMPU制御回路31Aは、MPU18
Aのアクセス先のアドレスを常にモニタしていて、当該
アドレスをアドレス保持レジスタ32Aに格納し、前記
応答信号の受信、または障害発生を検出するのに十分な
時間だけ、当該アドレスを保持させる。
【0039】そしてこのMPU制御回路31Aによって
検出されたアクセスタイムアウトエラー、パリティエラ
ーなどの障害の種別すなわち障害要因は、障害要因レジ
スタ33Aに格納される。
【0040】前記アドレス保持レジスタ32Aおよび障
害要因レジスタ33Aを備えたことにより、MPU18
Aが割込み処理ルーチンのなかで障害発生個所のアドレ
スや障害要因を判定する必要がなく、タイミング設計上
有利で、処理能力が低下しない。
【0041】一方でMPU制御回路31Aは、障害要因
と障害発生先のアドレスに応じて、MPU18Aに対す
る複数の割込みレベルの一つを対応付ける割込みテーブ
ルをもっている。そして割込み時には、前記アドレス保
持レジスタ32Aと障害要因レジスタ33Aとを参照
し、いずれかの割込みレベルでMPU18Aに対する割
込み要求を出すように割込み制御回路30Aに指示す
る。
【0042】割込み制御回路34Aは、この指示に応じ
た割込みレベルで割込み要求を送信するために、MPU
18Aと、たとえば2本の信号線からなる内部バス35
Aで接続されている。
【0043】また、前記応答信号に障害の発生を認めな
かった場合に応答通知信号を送出して、MPU18Aに
次のアクセスを促すため、MPU制御回路31AはMP
U18Aと信号線36Aで接続されている。
【0044】なお、この応答通知信号を用いずに、内部
バス35Aで割込み要求を受信するまでは、MPU18
AがPBX交換機の中央処理装置としての処理、すなわ
ちメインルーチンを進行するような構成にしてもよい。
その場合、信号線36Aは不要である。
【0045】一方、他系の中央処理装置10Bの内部構
成は、自系の中央処理装置10Aとまったく同一であ
り、対応する各構成要素に対応する符号を付してその詳
しい説明を省略する。
【0046】すなわち、第2メモリ13Bは前記第2メ
モリ13Aに対応し、ゲート回路14B〜17Bはそれ
ぞれ前記ゲート回路14A〜17Aに対応し、MPU1
8Bは前記MPU18Aに対応し、主メモリ19Bは前
記主メモリ19Aに対応し、ROM20Bは前記ROM
20Aに対応し、EMA21Bは前記EMA21Aに対
応し、割込み処理部30Bはその内部構成(図示せず)
もMPU18Bなどとの接続関係も含めて前記割込み処
理部30Aに対応する。
【0047】以下、上記のような構成を有する本実施形
態の動作について説明する。 (A−2)実施形態の動作 いま自系の中央処理装置10AがPBX交換機の中央処
理装置として動作しているアクト状態で、他系の中央処
理装置10Bはスタンバイ状態であるとする。アクト状
態の中央処理装置10A内のMPU18Aは、中央処理
装置としての動作すなわちメインルーチンの進行にとも
なって書き込みが必要になるプログラムワークやデータ
を、のルートで自系の主メモリ19Aに書き込むとと
もに、のルートを使って同一サイクルで他系の主メモ
リ19Bにも書き込んでいる。すなわち上述の二重書き
込みを行う通常運用モードで動作している。これによ
り、これらの情報を自系および他系の主メモリ19A、
19B上でミラー化している。
【0048】このとき他系のゲート回路14Bは閉じ
て、ゲート回路14Bの左右でアクセス先を制限し、バ
スに乗った信号が相互に影響しあうことを防止する。
【0049】したがって自系中央処理装置10Aによる
主メモリ19Bへのアクセスと同時に、MPU18Bは
のルートで第2メモリ13Bにアクセスすることがで
きる。
【0050】また、アクト状態の中央処理装置10A
が、スタンバイ状態の中央処理装置10Bの動作の正常
性を確認するためのメート間通信では、MPU18Aは
ルートで他系の第2メモリ13Bにアクセスし、メー
ト間通信用のデータを書き込む。このときゲート回路1
6Bは閉じている。
【0051】つづいてゲート回路16Bが開かれて、他
系のMPU18Bがこのデータを読み出すために第2メ
モリ13Bにアクセスする。当該データを読み出し、検
査したMPU18Bは、検査結果をふたたびのルート
で第2メモリ13Bに書き込む。このときゲート回路1
7Bは閉じている。
【0052】次いでゲート回路17Bを開き、ゲート回
路16Bは閉じて、自系のMPU18Aがこの検査結果
を読み出すために第2メモリ13Bに、ふたたびルート
でアクセスする。
【0053】このようにしてアクト状態の中央処理装置
10Aは、スタンバイ状態の中央処理装置10Bの動作
の正常性を確認することができる。
【0054】一方、当該メインルーチンを含む通常運用
モードの動作の進行にともなって、アクト系の中央処理
装置10Aは上述した各機能をもつ基板、たとえばスイ
ッチ基板、ディスク基板、I/O基板などのアクト系の
基板に、逐次アクセスしてゆく。
【0055】そしてこれらの基板から送信される応答信
号に対しても、MPU制御回路31Aによりアクセスタ
イムアウトエラー、パリティエラーなどの障害の検出が
行われる。
【0056】これらの各基板や、自系の主メモリ19
A、第2メモリ13A、他系の主メモリ19Bなど、当
該PBX交換機システム内の全アドレス空間は、メイン
ルーチンの進行を含むシステムの正常な稼動を継続する
ための重要度に応じて、重大空間、軽微空間、Don`t C
are空間などに分類することが可能で、この分類に応じ
て各アドレス番号にアドレス指数が割り付けられてい
る。
【0057】たとえば自系(ここではアクト系)の主メ
モリ19Aや、アクト系のスイッチ基板などはもっとも
重要度が高く、次に重要なのは自系の第2メモリ13A
などで、重要度が低いのは他系(ここではスタンバイ
系)の主メモリ19Bや第2メモリ13B、あるいはア
クト系のI/O基板やディスク基板などである。当然、
スタンバイ系のI/O基板やディスク基板などの重要度
はさらに低くなる。
【0058】また、メインルーチンの進行を含むシステ
ムの正常な稼動を継続するための重要度に応じて、各障
害要因には障害要因指数が割り付けられている。
【0059】たとえば障害要因アクセスタイムアウトエ
ラーは、もっとも重要な障害要因で、パリティエラーは
これに次ぐ重要度であるとする。
【0060】これら障害要因指数およびアドレス指数
と、3つの割込み処理ルーチン[1]〜[3]との関係を
図1に示す。ここでは前記複数の割込みレベルを3つの
レベルとし、各レベルに[1]〜[3]の割込み処理ル
ーチンが対応しているものとする。
【0061】図1において、横軸のA1〜ANはアドレ
ス指数で、このアドレス指数はA1に近いほど低く、A
Nに近いほど高い。すなわちA1<AJ<AK<AL<
AM<ANである。そして、当該PBX交換機システム
中の全アドレス空間中のすべてのアドレス番号は、A1
〜ANのいずれかのアドレス指数に、1対1または多対
1に対応付けられている。
【0062】また縦軸のB1〜BNは障害要因指数で、
この障害要因指数はB1に近いほど低く、BNに近いほ
ど高い。すなわちB1<BJ<BK<BL<BM<BN
である。そして、すべての障害要因は、B1〜BNのい
ずれかの障害要因指数に1対1または多対1に対応付け
られている。
【0063】アドレス指数がA1以上AJ以下で、障害
要因指数がB1以上BJ以下のハッチングを施した領域
[1]は、もっとも軽微な割込み処理ルーチン[1]に
対応する。この割込み処理ルーチン[1]には、たとえ
ばアクト系とスタンバイ系とを系切替えするだけの処理
や、あるいは系切替えを行わずに実行してもアクト系と
しての動作に影響を与えない程度の極めて簡単な障害復
旧処理や、なにもせずに放置する処理などが対応する。
このような処理でも、外部から到来する一時的なノイズ
が原因の障害など、極めて軽微な障害の場合などには復
旧する可能性がある。ただし放置するような場合でも、
中央処理装置10A(10B)は当該アドレスに障害が
ある旨の認識はもっている。
【0064】放置以外の割込み処理ルーチン[1]の処
理は、当該PBX交換機が処理するトラヒック密度の低
い閑散期を待って実行するようにするとよい。
【0065】アドレス指数がAK〜ALで、障害要因指
数がBK〜BLのハッチングを施していない領域[2]
は、中位の割込み処理ルーチン[2]に対応する。この
割込み処理ルーチン[2]には、たとえばメモリクリア
後、前記メインルーチンを含むプログラムのIPLを行
い、ふたたび当該プログラムを実行しはじめる処理など
が対応する。プログラムの書き込み操作に起因する障害
である場合、これによって復旧する可能性が高い。なお
このような処理は、系切替えでスタンバイ系となってか
ら行うようにした方が、ユーザに与える影響が少なくて
よい。
【0066】割込み処理ルーチン[2]にまつわる処理
は、系切替えも含めて、前記閑散期を待って実行するよ
うにするとよい。
【0067】アドレス指数がAM〜ANで、障害要因指
数がBM〜BNのハッチングを施した領域[3]は、割
込み処理ルーチン[3]に対応する。そしてこの割込み
処理ルーチン[3]には、たとえば中央処理装置10A
の主メモリ19内のフラッシュメモリに代えて前記ディ
スク基板を利用するために、前記プログラムをディスク
基板にロードする処理などが対応する。フラッシュメモ
リのハードウエア自体に起因する障害の場合などは、こ
れにより復旧する可能性が高い。なおこのような処理
も、系切替えでスタンバイ系となってから行うようにし
た方が、ユーザに与える影響が少なくてよい。
【0068】割込み処理ルーチン[3]にまつわる処理
は、その重大性から、障害を検出したとき即時に実行す
る必要がある。
【0069】いったん障害が検出されると、前記放置も
含めて割込み処理ルーチン[1]〜[3]で当該障害が
復旧したかどうかは、所定のプログラムによってたとえ
ば1秒〜1分周期でチェックされている。
【0070】複数の割込み処理ルーチンを用意すること
により、たとえばアドレス指数がAJ以下で障害要因指
数がBJ以下の場合など、前記割込み処理ルーチン
[1]が実行されて、単なる系切替え処理が実行され、
アクト系としての動作に影響を与えない程度の極めて簡
単な障害復旧処理が実行され、あるいは放置されるだけ
なので、当該PBX交換機の稼動は、実質的に停止しな
い。
【0071】(A−3)実施形態の効果 以上のように、本実施形態によれば、アドレス指数と障
害要因指数に基づいて実行する割込み処理ルーチンを変
更し、軽微な障害(アドレス指数および障害要因指数)
には簡単な割込み処理ルーチンで対応するので、従来の
ように重要度の低い部分に発生した障害の復旧処理のた
めにPBX交換機システムの稼動が停止するようなこと
がない。
【0072】すなわち、障害が発生しても、そのアドレ
ス指数、障害要因指数に応じて可能な限りシステムを連
続運用でき、障害の重要性に不相応な大きな影響(トラ
ヒック密度が高いときの稼動停止や、必要以上に長時間
の稼動停止などの影響)をユーザにおよぼすことがな
い。したがって、個々のユーザ側から見た場合、運用上
の不具合が生じることが従来にくらべて少なく、信頼性
が高い。
【0073】(B)他の実施形態 上記実施形態においては、障害要因指数は障害要因だけ
で決まったが、同一の障害要因でもアドレスに応じてそ
の重要度、すなわち障害要因指数が変化するようにして
もよい。すなわちあるアドレス、たとえば自系(アクト
系)の主メモリ19Aでは、アクセスタイムアウトエラ
ーの方が障害要因指数が高いが、アクト系のI/O基板
ではパリティエラーの方が障害要因指数が高いなどとす
る場合である。請求項でいうところのシステムの正常な
稼動を継続するための重要度は、同じ障害要因でも、障
害が発生した場所すなわちアドレスに応じて変化する可
能性があるからである。
【0074】また上記実施形態では、アドレス指数と障
害要因指数が決まれば、割込み処理ルーチンが決まるの
で、割込み処理ルーチン実行後も当該障害が復旧せず再
検出された場合、同じ割込み処理ルーチンを繰り返すこ
とになる。このような場合、繰り返しが所定回数に達し
たら、ひとつ上位のレベルの割込み処理ルーチンを実行
するようにするとよい。たとえば割込み処理ルーチン
[1]を所定回数繰り返したあとでも、同一アドレスで
同一障害要因が検出された場合には、割込み処理ルーチ
ン[2]を実行するのである。
【0075】さらに、各アドレスとアドレス指数の対応
関係は、必要に応じてソフトウエアで変更できるように
してもよい。同様に、各障害要因と障害要因指数の対応
関係も、ソフトウエアで変更できるようにしてもよい。
これによりシステムの障害処理の構成を柔軟に変更し
て、状況の変化に対応した障害処理を実行することが可
能になる。
【0076】なお、割込み処理ルーチンの数に対応する
上述した割込みレベルの数は上記の3より多くてもよ
く、少なくてもよい。
【0077】この割込みレベルをひとつだけにして、複
数の割込み処理ルーチンのなかからどの割込み処理ルー
チンを選択するかは、MPUが判定するようにしてもよ
い。この場合ソフトウエアの負担が増え処理能力の低下
は免れないが、内部バス35Aを1本の信号線に置換で
きるなどハードウエア上の利点がある。
【0078】また上記実施形態では、アドレス指数と障
害要因指数の双方に基づいて実行する割込み処理ルーチ
ンが変化したが、アドレス指数だけ、あるいは障害要因
指数だけに基づいて割込み処理ルーチンを変化させるよ
うにしてもよい。この場合、アドレス保持レジスタまた
は障害要因レジスタの一方を省略することができるな
ど、ハードウエア、ソフトウエアが簡略化できる。
【0079】さらに、前記割込み処理部30A、30B
をそっくり省略して、上述したような動作をいわゆる内
部割込み(トラップ)を利用して行うこともできる。こ
の場合、ソフトウエアの負荷が増して処理能力の低下は
免れないが、ハードウエアは簡略化される。またこの場
合には、前記アドレス保持レジスタ、障害要因レジスタ
の機能をMPU18A、18Bが内蔵している汎用レジ
スタに分担させてもよいが、アドレス保持レジスタおよ
び/または障害要因レジスタだけは省略せずに残すよう
にしてもよい。
【0080】なお、請求項で述べた障害復旧動作のなか
には、障害が発生したアドレスに対してなにもせず放置
することも含むものとする。
【0081】さらに上記実施形態では、二重化構成のP
BX交換機について本発明を適用したが、本発明の適用
範囲はPBX交換機に限定するものではないことは当然
である。PBX交換機以外でも、稼動停止することなく
動作しつづけることが求められるシステムなどに広く適
用でき、その信頼性を向上することができる。
【0082】また二重化構成にも限定せず、三重化以上
の多重化構成や、同じ機能の基板(あるいは機能ブロッ
ク)がシステム内にひとつしか存在しない一重化構成で
あっても本発明を適用することができる。
【0083】すなわち、本発明は、中央処理装置内のア
ドレス空間である第1のアドレス空間で発生した障害、
又は当該中央処理装置を含むシステム中で、この第1の
アドレス空間を除いたアドレス空間である第2のアドレ
ス空間で発生した障害を復旧する場合に、広く適用する
ことができる。
【0084】
【発明の効果】以上のように、第1〜第5の発明によれ
ば、アドレス指数および/または障害要因指数に応じて
異なる障害復旧動作を行うので、当該システムの正常な
稼動を継続するための重要度が低いアドレスで発生した
障害や、この重要度が低い障害要因の障害を復旧する場
合などに、当該障害に不相応に多大な影響をユーザにお
よぼすことを防止することが可能で、信頼性が高い。
【図面の簡単な説明】
【図1】実施形態にかかる中央処理システムのアドレス
指数、障害要因指数、および割込み処理ルーチンの関係
を示す概略図である。
【図2】実施形態にかかる中央処理システムの構成を示
すブロック図である。
【符号の説明】
10…中央処理システム、10A、10B…中央処理装
置、18A、18B…MPU、19A、19B…主メモ
リ、20A、20B…ROM、30A、30B…割込み
処理部、31A…MPU制御回路、32A…アドレス保
持レジスタ、33A…障害要因レジスタ、A1〜AN…
アドレス指数、B1〜BN…障害要因指数、[1]〜
[3]…割込み処理ルーチン。

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 中央処理装置内のアドレス空間である第
    1のアドレス空間で発生した障害、又は当該中央処理装
    置を含むシステム中で、この第1のアドレス空間を除い
    たアドレス空間である第2のアドレス空間で発生した障
    害の復旧方法において、 当該システムの正常な稼動を継続するための重要度に応
    じて、第1及び第2のアドレス空間内の各アドレスにア
    ドレス指数を割り付け、 当該中央処理装置に内蔵されているマイクロプロセッサ
    のアクセス先のアドレスを、アドレス保持手段が保持
    し、 前記障害の発生時には、アクセス先のアドレスを前記ア
    ドレス保持手段から得て、少なくとも当該アドレスのア
    ドレス指数に応じて異なる障害復旧動作を行うことを特
    徴とする障害復旧方法。
  2. 【請求項2】 中央処理装置内のアドレス空間である第
    1のアドレス空間で発生した障害、又は当該中央処理装
    置を含むシステム中で、この第1のアドレス空間を除い
    たアドレス空間である第2のアドレス空間で発生した障
    害の復旧方法において、 当該システムの正常な稼動を継続するための重要度に応
    じて、前記障害の各障害要因に障害要因指数を割り付け
    ておき、 前記障害の発生時には、障害要因判定手段が当該障害要
    因を判定して保持し、 さらに、当該障害要因を前記障害要因判定手段から得
    て、少なくともこの障害要因の障害要因指数に応じて異
    なる障害復旧動作を行うことを特徴とする障害復旧方
    法。
  3. 【請求項3】 請求項1又は2の障害復旧方法におい
    て、 前記アドレスとアドレス指数の対応関係、 又は前記障害要因と障害要因指数の対応関係を状況に応
    じて変更することを特徴とする障害復旧方法。
  4. 【請求項4】 中央処理装置内のアドレス空間である第
    1のアドレス空間で発生した障害、又は当該中央処理装
    置を含むシステム中で、この第1のアドレス空間を除い
    たアドレス空間である第2のアドレス空間で発生した障
    害を復旧する中央処理装置において、 当該システムの正常な稼動を継続するための重要度に応
    じて、第1及び第2のアドレス空間内の各アドレスに割
    り付けたアドレス指数を格納しているアドレス指数格納
    手段と、 当該中央処理装置に内蔵されているマイクロプロセッサ
    のアクセス先のアドレスを保持するアドレス保持手段と
    を備え、 前記障害の発生時には、アクセス先のアドレスを前記ア
    ドレス保持手段から得て、前記アドレス指数格納手段を
    参照し、少なくとも当該アドレスのアドレス指数に応じ
    て異なる障害復旧動作を行うことを特徴とする中央処理
    装置。
  5. 【請求項5】 中央処理装置内のアドレス空間である第
    1のアドレス空間で発生した障害、又は当該中央処理装
    置を含むシステム中で、この第1のアドレス空間を除い
    たアドレス空間である第2のアドレス空間で発生した障
    害を復旧する中央処理装置において、 当該システムの正常な稼動を継続するための重要度に応
    じて、前記障害の各障害要因に割り付けた障害要因指数
    を格納している障害要因指数格納手段と、 前記障害の発生時には、その障害要因を判定して保持す
    る障害要因保持手段とを備え、 前記障害の発生時には、障害要因を障害要因保持手段か
    ら得て、前記障害要因指数格納手段を参照し、少なくと
    も当該障害要因の障害要因指数に応じて異なる障害復旧
    動作を行うことを特徴とする中央処理装置。
  6. 【請求項6】 請求項4又は5の中央処理装置におい
    て、 前記アドレスとアドレス指数の対応関係、 又は前記障害要因と障害要因指数の対応関係を状況に応
    じて変更する指数変更手段を備えるることを特徴とする
    中央処理装置。
  7. 【請求項7】 請求項4〜6のいずれかの中央処理装置
    を複数接続して構成されている中央処理システムにおい
    て、 システムの中央処理装置として機能しているアクト状態
    の中央処理装置のマイクロプロセッサが主体となって、
    前記アドレス指数又は障害要因指数に応じて、異なる障
    害復旧動作を行うことを特徴とする中央処理システム。
JP11079034A 1999-03-24 1999-03-24 障害復旧方法、中央処理装置及び中央処理システム Pending JP2000276364A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11079034A JP2000276364A (ja) 1999-03-24 1999-03-24 障害復旧方法、中央処理装置及び中央処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11079034A JP2000276364A (ja) 1999-03-24 1999-03-24 障害復旧方法、中央処理装置及び中央処理システム

Publications (1)

Publication Number Publication Date
JP2000276364A true JP2000276364A (ja) 2000-10-06

Family

ID=13678648

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11079034A Pending JP2000276364A (ja) 1999-03-24 1999-03-24 障害復旧方法、中央処理装置及び中央処理システム

Country Status (1)

Country Link
JP (1) JP2000276364A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1703393A2 (en) 2005-03-17 2006-09-20 Fujitsu Limited Error notification method and apparatus for an information processing system carrying out mirror operation
WO2006134691A1 (ja) * 2005-06-17 2006-12-21 Nec Corporation 情報処理装置、復旧装置、プログラム及び復旧方法
WO2008004275A1 (fr) * 2006-07-04 2008-01-10 Fujitsu Limited Programme, procédé et dispositif de reprise sur sinistre

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1703393A2 (en) 2005-03-17 2006-09-20 Fujitsu Limited Error notification method and apparatus for an information processing system carrying out mirror operation
US7584388B2 (en) 2005-03-17 2009-09-01 Fujitsu Limited Error notification method and information processing apparatus
WO2006134691A1 (ja) * 2005-06-17 2006-12-21 Nec Corporation 情報処理装置、復旧装置、プログラム及び復旧方法
JPWO2006134691A1 (ja) * 2005-06-17 2009-01-08 日本電気株式会社 情報処理装置、復旧装置、プログラム及び復旧方法
JP4556144B2 (ja) * 2005-06-17 2010-10-06 日本電気株式会社 情報処理装置、復旧装置、プログラム及び復旧方法
US8365021B2 (en) 2005-06-17 2013-01-29 Nec Corporation Information processing device comprising a plurality of domains having a plurality of processors, recovery device, program and recovery method
WO2008004275A1 (fr) * 2006-07-04 2008-01-10 Fujitsu Limited Programme, procédé et dispositif de reprise sur sinistre

Similar Documents

Publication Publication Date Title
US7925817B2 (en) Computer system and method for monitoring an access path
EP0333593B1 (en) A data processing system capable of fault diagnosis
JP2006259869A (ja) マルチプロセッサシステム
EP1890439B1 (en) Data processing management apparatus, mode management apparatus and mode management method
US6745341B1 (en) Information processing apparatus having fault detection for multiplex storage devices
JPWO2006137223A1 (ja) デバッグシステム、デバッグ方法、およびプログラム
JP2000276364A (ja) 障害復旧方法、中央処理装置及び中央処理システム
WO2008004330A1 (fr) Système à processeurs multiples
WO2016101177A1 (zh) 计算机设备内存的检测方法和计算机设备
US20060195849A1 (en) Method for synchronizing events, particularly for processors of fault-tolerant systems
JP4787551B2 (ja) デバッグシステム、デバッグ方法およびプログラム
JP4137450B2 (ja) バックアップデータにより処理継続可能なデータ処理装置
US6829681B1 (en) Cache system which performs cache flash upon emergency and dual system
CN115686901B (zh) 内存故障分析方法及计算机设备
JP2600614B2 (ja) 障害情報収集可能な交換システム
JPH09293020A (ja) インターフェース回路
JP2002063047A (ja) 二重化系切替装置及びその切替方法
KR20020065188A (ko) 컴퓨터 시스템의 장애관리 방법
KR0176085B1 (ko) 병렬처리 컴퓨터 시스템에서의 프로세서 노드 및 노드연결망의 에러 검출방법
JP3273191B2 (ja) データ転送装置
CN117742932A (zh) 数据处理系统
WO2004079573A1 (ja) マルチプロセッサシステム
JPH0152774B2 (ja)
CN116302625A (zh) 故障上报方法、设备及存储介质
JPH02173852A (ja) バス診断装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050809

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051007

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060718