JP2555214B2 - 障害被疑装置の制御方法 - Google Patents

障害被疑装置の制御方法

Info

Publication number
JP2555214B2
JP2555214B2 JP2188365A JP18836590A JP2555214B2 JP 2555214 B2 JP2555214 B2 JP 2555214B2 JP 2188365 A JP2188365 A JP 2188365A JP 18836590 A JP18836590 A JP 18836590A JP 2555214 B2 JP2555214 B2 JP 2555214B2
Authority
JP
Japan
Prior art keywords
state
failure
standby
suspected
control method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2188365A
Other languages
English (en)
Other versions
JPH0477139A (ja
Inventor
康夫 小笠原
明美 田口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2188365A priority Critical patent/JP2555214B2/ja
Publication of JPH0477139A publication Critical patent/JPH0477139A/ja
Application granted granted Critical
Publication of JP2555214B2 publication Critical patent/JP2555214B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)

Description

【発明の詳細な説明】 [概要] メモリ,中央処理装置,スイッチ部等の各装置がそれ
ぞれ二重化された通信処理システムにおける障害被疑装
置の制御方法に関し, システム中の二重化した装置について救済可能な障害
に対して装置を切離しすることなく,またダブル障害
(運用中と待機中の両装置の障害)の発生を防止できる
障害被疑装置の制御方法を提供することを目的とし, 運用中の装置に障害が検出されると該当装置を不安定
な待機状態に移行させ,待機中の状態では,当該装置の
障害情報のロギング情報,リトライ動作の結果等の動作
状態に関する情報を求め,求められた情報が予め決めら
れた正常性を表す規定条件の範囲内か否かを判別し,規
定条件を外れると当該装置をシステムから切離して障害
中の状態に設定し,規定条件の範囲内であると運用中の
状態に移行するよう構成する。
[産業上の利用分野] 本発明はメモリ,中央処理装置,スイッチ部等の各装
置がそれぞれ二重化された通信処理システムにおける障
害被疑装置の制御方法に関する。
ディジタル交換機等の通信処理システムは,常時稼働
することが要求されているため,主要な装置は全て二重
化されて,一方が運用中の状態に、他方が待機中の状態
におかれ,運用中の装置に障害が発生した場合、再試行
を実行してもそれでも障害が発生すると直ちに運用中の
装置を障害状態としてシステムから切り離し,待機中の
装置を運用状態に切り換えることにより運用に支障をき
たさないようになっている。
[従来の技術] 第4図は通信処理システムの構成図,第5図は従来例
の処理フロー図,第6図は従来例による状態遷移の関係
説明図である。
第4図の通信処理システムは,具体的にはディジタル
交換機として構成される。
第4図において,CCは中央制御装置(Central Control
ler),CHCはチャンネル制御装置(Channel Signaling E
quipment),CSEは共通線信号(Common Channel Signali
ng Equipment),CSEIは共通線信号装置インタフェース
(CSEInterface),DSMはディジタルスイッチモジュール
(Digital Switch Module).DTはディジタル端末(Digi
tal Terminal),LCは集線装置(Line Concentrator),M
Mは主記憶装置(Main Memory),RSUはリモートスイッチ
ユニット(Remote Switching Unit),STPは信号中継点
(Signaling Transfer Point)を表し,図示されない
が,他に共通線信号装置CSEが接続されたバスにファイ
ル記憶装置や保守者用のコンソール装置等が設けられ
る。
第4図のシステムでは,中央制御装置CC,主記憶装置M
M,チャネル制御装置CHC,ディジタルスイッチモジュール
DSMや,複数の共通線信号装置CSE等はそれぞれ二重化さ
れており,一方が0系で,他方を1系としてそれぞれ番
号を付して表示する。
システムが動作している時は,それぞれ一方の装置が
運用中(アクト:ACT)の状態で動作し,他方が待機中
(スタンバイ:SBY)の状態に置かれて動作する場合,両
状態の装置は共にシステムに接続した状態であるのでIN
S(In Service)状態にあるという。また,二重化装置
が同時に運用中の状態で動作する場合があり,この時一
方の装置が,主(マスタ)で他方が従(スレーブ)とし
て機能し,誤りの際には直ちに一方から他方へ切り換え
ることができる。
システムに接続された装置に障害が発生した時,その
装置をシステム(中央制御装置やバス)から切り離した
状態をOUS(Out Of System)状態になるという。
中央制御装置CCは,通信路を構成するディジタルスイ
ッチメモリDSMの制御を行うと共に,チャネル制御装置C
HCを介して共通線信号装置CSE等の入出力装置を行う。
共通線信号装置は公知のように共通線信号方式における
レベル2(プロトコルのレベル2)の機能を内蔵するフ
ァームウェアにより実行する。
レベル3以上の機能は本体の主記憶装置MMに格納され
たオンラインソフトウェアが提供しており,共通線信号
装置CSEはチャネル制御装置CHC,共通バスを経由してダ
ウンロードにより運送される。また,中央制御装置CC
は,共通線信号装置CSEの動作を常に関ししており,障
害が発生した場合,即座に待機系に切り換えて安定した
サービスを提供している。障害と判定された装置は従来
は即座にシステムから切り離されて,通常人手を介せず
にシステムに復帰させることができなかった。
二重化された各装置に対する従来の処理フロー図を第
5図に,従来例による状態遷移の関係説明図を第6図に
示す。
第5図の処理フローを以下に説明する。
運用中の装置に障害が発生すると,障害発生装置に対
して主記憶装置のプログラムにより再試行が実行される
(第5図50,51)。この結果により固定障害か間歇障害
かを判断し(同52),正常であれば間歇障害として通常
の処理を続行し(同53),繰り返した再試行により障害
が発生すると固定障害として,障害装置を運用中の状態
から切離し(同54),更にOUSの状態で診断処理の起動
を行う(同55)。この診断では障害の状況に応じて装置
試験が必要か否かを判断して(人手による),不要なら
障害時に得られたデータの解析処理の起動(同60)を行
い,必要と判断されると,装置試験を実施する(同5
7)。
続いて当該試験で障害を検出したか否かを判断し,未
検出なら装置を待機中に移行し(同59),検出の場合,
その障害解析処理を起動し(同60),障害個所の表示
(同61)を行って,処理終了(該装置障害中として)す
る(同62)。この状態では装置が切離された状態である
から,保護者の介入によりコマンドを投入して装置を再
度システムに接続する必要がある(同63)。
第6図において,未実装の状態から工事中の状態にな
り(),装置の実装が行われ試験を行った後運用に移
行し(),その状態で障害になるとにより待機中の
状態か,により障害中の状態へ移行し(第5図の54に
対応),待機中の診断処理により障害と判断されると
を経て障害中の状態になる。また,障害中の状態で試験
で障害が発生しないと,保守者がコマンドを投入するこ
とにより待機中に移行()する。さらに別のコマンド
を投入することにより待機中()へ移行できる。
また,障害中でも必要ならコマンドを投入して運用中
の状態へ移行()することもできる。そして待機中か
ら各種のコマンドの投入(または)により運用中に
移行でき,待機中から障害中に移行()する場合があ
る。
このように運用中と待機中及び障害中の各状態の間の
移行は必要に応じて任意に実行することができる。
[発明が解決しようとする課題] 上記した従来例の方式によれば,固定障害と診断され
システムから切離されて診断処理が実行されて,固定障
害であると判定されると装置はシステムから切離された
ままとなって人手の介入なしにシステムに復帰すること
ができない。
ところが,固定障害と決定された装置でも部分的な機
能障害や,電源の瞬断などによる間歇障害またはファー
ムウェアのバグ等の障害の場合,所定の回復処理を施す
ことにより動作できる場合がある。特にその装置が本体
ソフトウェア(中央制御装置が主記憶装置から供給する
プログラム)からのダウン・ローディングにより機能が
提供されている装置等では間歇障害によるプログラム暴
走の可能性が高い。
このように従来の方式では殆ど動作できるかも知れな
い装置を障害としてシステムから切離してしまいという
問題があった。
本発明はシステム中の二重化した装置における救済可
能な障害に対して装置を切離しすることなく,またダブ
ル障害(運用中と待機中の両装置の障害)の発生を防止
できる障害被疑装置の制御方法を提供することを目的と
する。
[課題を解決するための手段] 第1図は本発明の原理説明図である。
この図には,二重化された通信処理システムの従装置
の運用状態の遷移が示されている。
第1図において,10は装置が運用中の状態,11は装置が
待機中の状態,111は規定条件判定手段,12は装置が障害
中の状態,121は障害中の規定条件判定手段を表す。
本発明は,運用中の状態から単純に障害中の状態に遷
移させずに,一旦不安定な待機(SBY)状態に移行し,
待機状態において障害中への移行または運用中への移行
について予め定めた条件を設けてその条件を満たすとそ
れぞれの状態に移行可能にするものである。
[作用] 通信処理システムの二重化された装置(中央制御装
置,メモリ,ディジタルスイッチメモリ,共通線信号装
置等)に対する本発明による制御の原理を第1図を参照
しながら説明する。
運用中の状態10にある装置(従装置)で障害が検出さ
れると,該装置を待機中の状態11に遷移する。この待機
中の状態11では,規定条件判定手段111によりリトライ
動作の結果や以前の障害内容の分析等が行われて動作状
態に関する情報(パラメータ)をチェックし,予め設定
された正常性を表す規定条件を満たすか否かを判断す
る。規定条件を外れている場合は待機中から障害中の状
態へ移行し,該規定条件の範囲内であると一定の時間内
に何も起きない場合運用中の状態10へ移行する(アクト
タイミングという)。
障害中の状態12の状態に移行すると,ここでも規定条
件判定手段121により動作状態に関する情報をチェック
して,設定された条件を満たすか否かを判定する。それ
ぞれの規定条件を満足する場合は,障害中の状態12から
待機中の状態11へ移行する。規定条件を外れたことが判
ると,装置を切離して診断動作が行われ,その結果良好
な状態であることが判ると,従来と同様に保守者の入力
装置により待機中を状態11,または運用中の状態10に戻
ることができる。
[実施例] 第2図は実施例の処理フロー図,第3図は本発明によ
る状態遷移の関係説明図である。
本発明は具体的には第4図に示す通信処理システムに
実施することができ,二重化された各装置はそれぞれ上
位の装置からの制御により状態管理が実行される。例え
ば,スレーブの入出力装置(第4図の共通線信号装置CS
E)は,上位のスレーブの中央制御装置CCにより状態遷
移の管理が行われる。
第2図の処理フローを説明する。
最初に運用中の装置に障害が発生すると,この状態の
まま同じ動作を上位の装置から再試行が実行される(第
2図20,21)。次に再試行の結果を見て,再試行で障害
が発生しない場合,間歇障害(例えば,電源の瞬断によ
り突発的に発生するような障害)としてそのまま通常の
処理を続行し(同23),再試行でも障害が発生したら固
定障害として当該装置を待機中に移行する(同24)。
待機中では,装置制御パラメータのチェックを行う。
この場合,装置制御パラメータとしては,当該装置の障
害情報のロギング情報を見て,時間に対する障害の発生
頻度,障害の内容(ハードウェア障害,パリティーエラ
ー,ソフトウェアエラー等),装置の性格(重要性,使
用頻度が低い等)等が用いられ,これらの情報はデータ
ベースとしてシステムが備えられ動作に応じて変化す
る。
その中の1つまたは複数の項目をチェック対象とし,
各チェック対象に対し予め規定された条件を越える(障
害状態に移行すべき状況)か否かを判断し,条件を越え
ると該装置を障害中に移行し(同27),越えないと該装
置の状況を保持して装置を待機中に保持する(同26)。
この待機中に保持された装置は,その後一定時間内に
何も生じないと運用中の状態に移行する。これをアクト
タイミングといい,この時は初期立ち上げと同様のレベ
ル(従装置の内部ソフトウェアのダウンローディング,
リセット,クリアスタート等の初期設定再開)により実
施される。
上記の装置制御パラメータの例としては、例えば障害
の発生頻度の規定条件として,「1時間に5回」に設定
されている場合,当該装置に障害が1時間に5回以上発
生すると,この装置は障害中に移行される。
障害中(この時は切離しされていない)に移行する
と,上記ステップ25と異なる規定条件を用いて装置制御
パラメータのチェックを行い(同27,28),規定条件を
満たす場合,装置の待機中への移行要求が発生して装置
は待機中に移行する(同29)。規定条件を越えた場合は
装置切り離しの指示(保守者による切離しコマンドの投
入による)が実行される(同30)。
このステップ30から最後のステップ39までは,従来例
の処理フロー(第5図参照)のステップ54乃至ステップ
63と同じ内容であるので以下のフローの説明を省略す
る。
次に本発明による状態遷移の関係を第3図を用いて説
明する。
未実装から,工事中の状態を経て,運用中の状態にな
った時,障害が発生するとAで示す判断が行われる。こ
れは第2図のステップ22に相当し,この結果経路によ
り待機中の状態になる。この状態ではBの判断(上記し
たアクトタイミングが成立するか否かの判断)での経
路により運用中の状態に移行する場合と,Cの判断(第2
図の25)を行っての経路により障害中の状態に移行す
る場合がある。障害中の状態になると,Dの判断(第2図
28)を行って条件を満たすとの経路で待機中に移行す
る。
第3図のは待機中の状態において,保守者により装
置を運用中の状態へ移行させるためのコマンド投入が行
われる場合を示す。同様に障害中の状態において,保守
者により装置を待機中の状態または運用中の状態へ移行
させるためのコマンド投入が行われる場合を示す。
第4図の通信処理システムの例により説明すると,中
央制御装置CCは共通線信号装置CSE等の入出力装置の動
作を監視して,従来は障害が発生すると待機系の装置を
運用系に切り換えて,障害を発生した装置はシステムか
ら切離していたが,障害の発生原因としてファームウェ
アのバグやプロセッサの間歇障害等のソフト障害も含ま
れており,そのような障害発生の時直ちに障害状態にせ
ずに本発明による待機状態にして,続けて再度ローディ
ング,初期設定及び再起動により運用中にすれば救済す
ることができる。
すなわち,CSEのような従装置に障害が発生した時に自
力で再生するチャンスを与えてシステムの信頼性を高め
ることができる。また,この共通線信号装置CSE等の入
出力装置の一部機能にバクがあり,そのために片方をシ
ステムから切離した場合,もう一方に同様の障害が発生
すると二重障害になってしまいシステムが停止し重大な
影響を与えてしまうが,本発明により一部のバグで直ち
にシステムから切離さないことによりこのような事態を
防止できる。
[発明の効果] 本発明によれば二重化装置における間歇障害により障
害状態へ移行することを防止し,各装置が備える全体の
中の影響が少ない一部の機能障害により直ちに障害状態
及びシステムからの切離し状態へ移行するのを防止する
ことができる。また,ファームウェアのバグに対する救
済を実現できる。さらに,二重障害に対するガードによ
るシステム信頼性の向上を実現することができる。
【図面の簡単な説明】
第1図は本発明の原理説明図,第2図は実施例の処理フ
ロー図,第3図は本発明による状態遷移の関係説明図,
第4図は通信処理システムの構成図,第5図従来例の処
理フロー図,第6図は従来例による状態遷移の関係説明
図である。 第1図中, 10:運用中の状態 11:待機中の状態 111:規定条件判定手段 12:障害中の状態 121:規定条件判定手段

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】メモリ,中央処理装置,スイッチ部等の各
    装置がそれぞれ二重化された通信処理システムにおい
    て, 運用中の装置に障害が検出されると該当装置を不安定な
    待機状態に移行し, 待機中の状態では,当該装置の障害情報のロギング情
    報,リトライ動作の結果等の動作状態に関する情報を求
    め,前記求められた状態が予め決められた正常性を表す
    規定条件の範囲内か否かを判別し, 前記規定条件を外れると当該装置をシステムから切離し
    て障害中の状態に設定し,前記規定条件の範囲内である
    と運用中の状態に移行することを特徴とする障害被疑装
    置の制御方法。
  2. 【請求項2】請求項1において, 前記障害中の状態に設定された装置に対し,診断を行っ
    て良好な結果が得られると待機中の状態に戻るよう制御
    することを特徴とする障害被疑装置の制御方法。
JP2188365A 1990-07-17 1990-07-17 障害被疑装置の制御方法 Expired - Fee Related JP2555214B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2188365A JP2555214B2 (ja) 1990-07-17 1990-07-17 障害被疑装置の制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2188365A JP2555214B2 (ja) 1990-07-17 1990-07-17 障害被疑装置の制御方法

Publications (2)

Publication Number Publication Date
JPH0477139A JPH0477139A (ja) 1992-03-11
JP2555214B2 true JP2555214B2 (ja) 1996-11-20

Family

ID=16222346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2188365A Expired - Fee Related JP2555214B2 (ja) 1990-07-17 1990-07-17 障害被疑装置の制御方法

Country Status (1)

Country Link
JP (1) JP2555214B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7412291B2 (en) * 2005-01-12 2008-08-12 Honeywell International Inc. Ground-based software tool for controlling redundancy management switching operations

Also Published As

Publication number Publication date
JPH0477139A (ja) 1992-03-11

Similar Documents

Publication Publication Date Title
EP0474058A2 (en) Problem analysis of a node computer with assistance from a central site
KR100484130B1 (ko) 원격장애치유기능을갖는컴퓨터시스템및그방법
US6192485B1 (en) Redundant apparatus
US5712967A (en) Method and system for graceful recovery from a fault in peripheral devices using a variety of bus structures
JP2555214B2 (ja) 障害被疑装置の制御方法
JPS6027041B2 (ja) ハイアラキ制御システムにおける下位制御装置の切換方法
JPH03139736A (ja) 情報処理システムにおける系切替方式
JPH0662114A (ja) プロセッサ間診断処理方式
JP3291729B2 (ja) 二重化計算機システム
KR100606888B1 (ko) 이동통신 시스템에서 디지털 송수신기 보드 제어 이중화장치 및 방법
JPS6113627B2 (ja)
KR200270668Y1 (ko) 제어부의 상태를 반영하는 이중화 장치
JPH03233734A (ja) 耐故障制御方式
JPS6213700B2 (ja)
JPS60105356A (ja) 予備装置の診断方式
JP2630100B2 (ja) プロセッサ間通信用バスの障害処理方式
JPH0454747A (ja) データ転送システム
JPH07117943A (ja) エレベータ制御装置
JPH03292024A (ja) 伝送装置の自己診断方式
JPH01156683A (ja) 電子回路パッケージ自己診断方式
JPS62539B2 (ja)
JPS5816497B2 (ja) システム共通部をそなえたデ−タ処理システム
JPS5927356A (ja) 2重化装置における障害切分方式
JPS617901A (ja) デイジタル制御装置
JPH0916498A (ja) 自動回線切替装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080822

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees