JPH09162976A - 分散処理システムのモジュール運転状態制御方法 - Google Patents

分散処理システムのモジュール運転状態制御方法

Info

Publication number
JPH09162976A
JPH09162976A JP31633095A JP31633095A JPH09162976A JP H09162976 A JPH09162976 A JP H09162976A JP 31633095 A JP31633095 A JP 31633095A JP 31633095 A JP31633095 A JP 31633095A JP H09162976 A JPH09162976 A JP H09162976A
Authority
JP
Japan
Prior art keywords
module
processing system
time
distributed processing
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP31633095A
Other languages
English (en)
Other versions
JP3232393B2 (ja
Inventor
Hidekazu Oka
英一 岡
Toshiro Nakamura
俊郎 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP31633095A priority Critical patent/JP3232393B2/ja
Publication of JPH09162976A publication Critical patent/JPH09162976A/ja
Application granted granted Critical
Publication of JP3232393B2 publication Critical patent/JP3232393B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Multi Processors (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)
  • Monitoring And Testing Of Exchanges (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

(57)【要約】 【課題】 分散処理システムのサービス品質を低下させ
ることなく、各モジュールの故障管理を行なうことがで
きない。 【解決手段】 分散処理システムを構成する各々のモジ
ュールで、他モジュールの運転可否状態の監視を行なう
モジュール運転状態制御方法であって、アクセス先のモ
ジュールB2によるモジュールA1からの処理要求に対
する応答時間を計測し、この時間が、アクセス信号毎に
予め定められた時間(T0)を越えるか否かを監視し、
時間(T0)を越えた場合(タイムアウト)、モジュー
ルB2を運転不可能な故障中状態(一時故障中)として
設定登録し、その後、予め別に定められた時間(監視満
了時間T1)の経過後、モジュールB2の故障中状態の
設定を解除する(運転中)と共に、その間、モジュール
B2に対するリトライ処理(代替処理要求)を、モジュ
ールB1等を選択して行なうことを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、分散処理システム
を構成する各モジュール(分散モジュール)の故障を監
視する技術に係り、特に、各モジュールをバックアップ
対応に冗長構成した大規模インテリジェントネットワー
クの性能を低下させることなく、故障の監視を行なうの
に好適な分散処理システムのモジュール運転状態制御方
法に関するものである。
【0002】
【従来の技術】従来、分散処理システムの各モジュール
の状態を監視する技術としては、各モジュールを統括管
理する集中制御モジュールを用いた集中管理方式と、各
モジュールが相互に他のモジュールの状態を監視する自
律分散管理方式等がある。集中管理方式においては、集
中制御モジュールが有するヘルスチェックを実行するこ
とにより、配下のモジュールの運転が可能であるか不可
能であるかを判定する方式や、各モジュールが具備する
自モジュールの再開起動を、集中制御モジュールに対し
て通知することにより、集中制御モジュールが、配下の
モジュールにおいて故障が発生したことを検出する方式
等がある。集中制御モジュールは、これらの方式のそれ
ぞれ、もしくは双方により収集した各構成モジュールの
状態変化を、故障していないその他のモジュールに対し
て分配する。そして、各モジュールにおいては、集中制
御モジュールから通知された故障モジュールの情報に応
じて、処理依頼先を選択する。
【0003】この集中管理方式においては、集中制御モ
ジュールに故障が発生すると、システム全体の状態制御
が不可能になる。このため、システム全体の信頼度を一
定以上向上させることが困難である。さらに、集中管理
モジュールがノード内に発生した故障を検出するまでに
遅延が伴い、故障が発生していから、各モジュールが故
障モジュールに対する処理要求を抑止するまでに発生し
た呼が異常終了し、サービス品質の低下につながる。
【0004】また、自律分散管理方式においては、シス
テムを構成する各モジュールが、自律的に、予め定めら
れた範囲にあるモジュール、ないしはシステムを構成す
る他の全モジュールに対して、周期的に、ヘルスチェッ
クを実行することにより、他モジュールの故障の有無の
状態を把握し、処理依頼先を選択する。このため、集中
管理方式における集中制御モジュールの故障発生に伴う
システム全体の状態制御が不可能となる状態や、故障検
出の遅延に伴うサービス品質の低下を回避することがで
きる。
【0005】しかし、この自律分散管理方式において
は、各モジュールが相互にヘルスチェックや全分散モジ
ュール群で個々のモジュール状態の整合性を保証するた
めの通信を行なう。その結果、通常の呼処理のためのモ
ジュール間通信を圧迫し、サービス品質の低下につなが
る。
【0006】
【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、分散モジュールシステムのサー
ビス品質を低下させることなく、各モジュールの故障管
理を行なうことができない点である。本発明の目的は、
これら従来技術の課題を解決し、分散モジュールをバッ
クアップ対応に冗長構成した大規模インテリジェントネ
ットワークの信頼性と性能を向上させることを可能とす
る分散処理システムのモジュール運転状態制御方法を提
供することである。
【0007】
【課題を解決するための手段】上記目的を達成するた
め、本発明の分散処理システムのモジュール運転状態制
御方法は、(イ)分散処理システムを構成する各々のモ
ジュールで、他モジュールの運転可否状態の監視を行な
う分散処理システムのモジュール運転状態制御方法であ
って、アクセス先の第1のモジュール(負荷分散モジュ
ールB2)による自モジュール(負荷分散モジュールA
1)からの処理要求に対する応答時間を計測し、この時
間が、アクセス信号毎に予め定められた時間(T0)を
越えるか否かを監視し、時間(T0)を越えた場合(タ
イムアウト)、第1のモジュールを運転不可能な故障中
状態(一時故障中)として設定登録することを特徴とす
る。また、(ロ)上記(イ)に記載の分散処理システム
のモジュール運転状態制御方法において、第1のモジュ
ールを故障中状態として設定登録した後、予め別に定め
られた時間(監視満了時間T1)の経過後、第1のモジ
ュールの故障中状態の設定を解除する(運転中)ことを
特徴とする。また、(ハ)上記(イ)、もしくは、
(ロ)のいずれかに記載の分散処理システムのモジュー
ル運転状態制御方法において、第1のモジュールを故障
中状態として設定登録している間、第1のモジュールに
対するリトライ処理(代替処理要求)を含み、以降のア
クセスを、代替可能な第2のモジュール(少なくとも負
荷分散モジュールB1を含むが、各アクセス毎に異なっ
て良い)を選択して行なうことを特徴とする。また、
(ニ)上記(ハ)に記載の分散処理システムのモジュー
ル運転状態制御方法において、第1のモジュールが、予
め規定された他のモジュール相互間でバックアップ関係
を有する機能分散モジュール(機能分散モジュールC
2)であれば、この機能分散モジュールとバックアップ
関係を有する機能分散モジュール(機能分散モジュール
C1)を、第2のモジュールとして選択することを特徴
とする。また、(ホ)上記(ニ)に記載の分散処理シス
テムのモジュール運転状態制御方法において、第2のモ
ジュールは、リトライ処理に対応する第1のモジュール
へのアクセスで、時間T0(タイムアウト)に基づく第
1のモジュールの故障中状態の設定登録を行なった場
合、バックアップを起動すると共に、第1のモジュール
が故障中であることを、接続先の全てのモジュール(他
モジュール)に通知し、この通知を受けた各モジュール
は、第1のモジュールに対して故障中状態の設定登録を
行なうことを特徴とする。また、(ヘ)上記(ホ)に記
載の分散処理システムのモジュール運転状態制御方法に
おいて、第2のモジュールは、上記予め別に定められた
時間T1(監視満了時間T1)後、第1のモジュールの
運転可否状態を判別し、この第1のモジュールが運転可
能な状態であれば、この第1のモジュールに対する故障
中状態の設定登録を解除すると共に、全てのモジュール
に、第1のモジュールに対する故障中状態の設定登録を
解除するよう通知することを特徴とする。
【0008】
【発明の実施の形態】本発明においては、分散モジュー
ルで発生した故障を、各モジュールが行なう通信サービ
スアクセスに対するタイムアウト(T0)の監視により
検出する。そして、タイムアウトが発生した場合、当該
モジュールに対する通信サービスアクセスを直ちに停止
する。さらに一定時間を経過した後に、タイムアウト発
生した当該モジュールへの通信サービスアクセスを回復
する。また、当該モジュールへのアクセスに対するリト
ライ処理が可能な場合は、代替モジュールとして、同種
モジュールに対してアクセスする。
【0009】また、通信サービスの実現上で必要な更新
系データを、予め規定されたモジュール相互間のバック
アップ関係を有する機能分散モジュールにおいて管理す
る場合、バックアップ関係にある機能分散モジュールが
相互の運転状態を管理し、相手側への通信サービスアク
セスがタイムアウトした場合、当該機能分散モジュール
が管理していた更新系データの管理権を引き継ぐ。そし
て、当該モジュールの運転のバックアップを開始すると
共に、その他のモジュールに対して、当該モジュールの
運転状態が運転不可能になったことを通知する。さら
に、一定時間(T1)経過した後に、当該モジュールか
ら引き継いでいた更新系データの管理権を返還すること
を試み、成功した場合は、他のモジュールに対して、当
該モジュールの状態が運転可能になったことを通知し、
失敗した場合は、再度、上述した一定時間(T1)が経
過するまでバックアップ運転を継続する。
【0010】このようにすることにより、分散処理シス
テムのモジュール運転状態制御処理において、従来の技
術と比較して以下の利点がある。 (a)集中制御モジュールによるモジュール状態の制御
が不要なため、集中制御モジュールの故障等の、システ
ム全体の信頼度の向上を阻害する要因を排除できる。 (b)集中制御モジュールが不要であり、集中制御モジ
ュールによる故障検出までの遅延を回避できる。 (c)ヘルスチェック用信号の発行を行なわないので、
通信量を圧迫することはない。 (d)全モジュール間での他のモジュールの状態整合保
証のための双方向通信を必要としないので、通信量を圧
迫することはない。
【0011】
【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の分散処理システムのモジュ
ール運転状態制御方法の本発明に係る処理の第1の実施
例を示す通信シーケンス図、図2は、本発明の分散処理
システムのモジュール運転状態制御方法の本発明に係る
処理の第2の実施例を示す通信シーケンス図、図3は、
本発明に係るモジュール運転状態制御を行なう分散処理
システムの構成例を示すブロック図である。
【0012】図3においては、本発明に係る分散処理シ
ステムとして、分散モジュール構成を利用した、インテ
リジェントネットワークサービスを提供するサービス制
御ノードの構成を示し、100は分散モジュール構成を
採用したサービス制御ノード、300は伝達ノード、2
01は伝達ノード300との通信制御を行なう負荷分散
モジュール群(以下、このタイプのモジュールをモジュ
ールAという)、202はサービス制御ロジックを保有
する負荷分散モジュール群(以下、このタイプのモジュ
ールをモジュールBという)、203はサービス制御ロ
ジックにより更新された更新系データをリアルタイムデ
ータベース上に保持する機能分散モジュール群(以下、
このタイプのモジュールをモジュールCという)であ
る。
【0013】サービス制御ノード100は、これらの分
散モジュール(モジュールA201、モジュールB20
2、モジュールC203)により構成されている。伝達
ノード300は、端末間の呼に対応する通話路の制御を
行なう。すなわち、伝達ノード300は、電話機等の端
末からのインテリジェントネットワークサービス呼を検
出すると、サービス制御ノード100に通知してくる。
サービス制御ノード100は、当該呼の制御を分散モジ
ュール群201〜203の連携により実施する。
【0014】図4は、図3におけるサービス制御ノード
の本発明に係る詳細構成例を示すブロック図である。本
例は、図3のサービス制御ノード100内の各分散モジ
ュール上へのモジュール運転状態制御のための機能配備
条件例を示し、モジュールA201,B202は、他モ
ジュール状態管理機構400、モジュール間通信機構4
03を有し、また、モジュールC203は、機能分散モ
ジュール他モジュール状態管理機構401、バックアッ
プ機構402、モジュール間通信機構403を有する。
以下、各機構の詳細を説明する。
【0015】(A)他モジュール状態管理機構400:
モジュールA201,B202では、他モジュール状態
管理機構400により、自モジュール以外の他モジュー
ルの状態を管理する。尚、モジュールC203において
は、各々のモジュール状態の他、バックアップ関係にあ
る機能分散モジュールのIDも合わせて管理する。そし
て、後述するモジュール間通信機構403からのタイム
アウト通知を受けると、当該モジュールの状態を故障中
に設定する。当該モジュールが負荷分散モジュールであ
る場合は、一定時間(T1)経過後、当該モジュールの
状態を運転可能な状態に再設定する。
【0016】さらに、後述するモジュールC203から
バックアップモジュールの故障通知を受信した場合は、
通知された機能分散モジュールの状態を故障中に設定
し、以後、当該機能分散モジュールの状態復旧が通知さ
れるまで、固定的に、当該機能分散モジュールの状態を
故障中とする。また、そのモジュールで実施されるサー
ビス処理において、他モジュールへのアクセスが必要な
場合、常に、他モジュール状態は事前に参照され、モジ
ュール状態が正常でない場合には、当該モジュールへの
アクセスを中止し、代替モジュールを選択してアクセス
する。代替モジュールの選択方法としては、故障モジュ
ールがモジュールA,Bである場合、すなわち負荷分散
モジュールの場合には、同種のモジュールを任意に選択
する。一方、アクセスモジュールの種別がモジュール
C、すなわち機能分散モジュールの場合は、相互バック
アップ関係にあるモジュールを選択することもできる。
【0017】(B)機能分散モジュール他モジュール状
態管理機構401:モジュールCに配備された機能分散
モジュール他モジュール状態管理機構401は、前述し
た他モジュール状態管理機構400が有する機能のほか
に、タイムアウトしたモジュールが自モジュールと相互
バックアップ関係にある機能分散モジュール(以後、こ
のようなモジュールをペアモジュールという)であった
場合、当該モジュールの状態を、直ちに、「故障中」と
設定すると共に、バックアップ機構402に対して、バ
ックアップ処理の開始を通知し、その他の全モジュール
に対して、ペアモジュールが故障したことを同報する。
その後、一定時間(T1)経過後、バックアップ機構4
02に対して、バックアップの切り戻し処理(以後、単
に切り戻し処理という)を指示し、この切り戻し処理が
正常に終了した場合は、ペアモジュールの状態を正常に
復帰させると共に、全モジュールに対して、当該モジュ
ールが復帰したことを同報する(復帰通知)。
【0018】(C)バックアップ機構402:バックア
ップ機構は、機能分散モジュール他モジュール状態管理
機構401からのバックアップ開始指示を契機に起動し
て、バックアップ関係にあるペアモジュールのサービス
処理を引き継ぎ、切り戻し指示を契機に切り戻し処理を
開始する。バックアップの切り戻し処理は、ペアモジュ
ールの故障がまだ復帰していないことにより成功しない
場合、その処理を中断し、切り戻し指示を発行した機能
分散モジュール他モジュール状態管理機構401に対し
て、切り戻し処理失敗を通知すると共に、バックアップ
運転を継続する。
【0019】(D)モジュール間通信機構403:全て
の分散モジュールでは、他モジュールとの通信を行なう
ために、モジュール間通信機能を有する。モジュール間
通信機構403は、他モジュールに対するアクセスに対
して、信号毎に予め定められている時間(T0)を経過
しても応答を受信しない場合、当該モジュールに対する
アクセスがタイムアウトしたことを直ちに他モジュール
状態管理機構400に通知する。モジュールCの場合
は、機能分散モジュール他モジュール状態管理機構40
1に通知する。
【0020】図5は、図3におけるサービス制御ノード
の各分散モジュールで管理する他モジュールの状態遷移
モデルを示す説明図である。本図5において、501は
「運転中」の状態を示し、502は「一時故障中」の状
態を示す。それぞれの状態において通信応答時間601
と監視時間602を監視する。運転中状態501と一時
故障中状態502の間の遷移は、遷移検出ポイントを通
過して行なわれる。遷移検出ポイント701は、運転中
状態にあったモジュールに対する通信応答時間601が
予め定められたタイムアウト時間(T0)を満了した場
合に満足される遷移検出ポイントであり、遷移検出ポイ
ント702は、故障中にあったモジュールが、故障中状
態になってからの監視時間602が別に定められた監視
満了時間(T1)を越えた場合に、満足される遷移検出
ポイントである。
【0021】図6は、図3におけるサービス制御ノード
のペアモジュール以外の分散モジュールで管理する機能
分散モジュールの状態遷移モデルを示す説明図である。
本図6において、501と502は図5で示したものと
同様に、「運転中」の状態と「一時故障中」の状態を示
す。503は、当該モジュールCが「故障中状態」であ
ることを示す。「運転中」状態における監視データであ
る通信応答時間601、「一時故障中」状態における監
視データである監視時間602、及び、遷移検出ポイン
ト701,702についても図5における説明と同様で
ある。遷移検出ポイント703は、本状態遷移図が示し
ているモジュールCのペアモジュールからの故障通知の
受信により、また、遷移検出ポイント704は、故障か
らの復帰通知の受信により、通過する遷移検出ポイント
を各々示している。
【0022】図7は、図3におけるサービス制御ノード
の機能分散モジュールが管理するペアモジュールの状態
遷移モデルを示す説明図である。運転中状態501、通
信応答時間601,監視時間602は図5,図6におけ
る説明と同様である。状態504は、図5における「一
時故障中」状態502と同様に、当該モジュールが「一
時故障中」の状態であることと共に、故障モジュールの
バックアップ運転を行なっている状態であることを示
す。遷移検出ポイント705は、運転中状態にあったペ
アモジュールに対するアクセスがタイムアウト(時間T
0経過)した場合に通過する遷移検出ポイントであり、
この遷移検出ポイントを通過した場合は、全モジュール
に対して、ペアモジュールの状態が「故障中」に遷移し
たことを同報する。
【0023】遷移検出ポイント706は、ペアモジュー
ルの状態が一時故障中状態502に遷移してからの監視
時間602が、予め定められた監視満了時間(T1)を
満了し、バックアップ運転の切り戻しが成功したため
に、ペアモジュールにおいて本来の運転が可能となった
ことを示す検出ポイントであり、この遷移検出ポイント
706を通過した場合は、全モジュールに対して、ペア
モジュールが「運転中」状態に復帰したことを同報す
る。遷移検出ポイント707は、切り戻し処理が正常に
終了できなかったため、バックアップ運転を継続して行
なう場合に通過する遷移検出ポイントである。
【0024】以下、図1に基づき、図3におけるシステ
ムの、負荷分散モジュールにおいて故障が発生した場合
のモジュール状態制御手順例を説明する。本図1に示す
例では、モジュールA1は、モジュールAに属するモジ
ュールであり、モジュールB1,B2は、それぞれモジ
ュールBに属するモジュールである。そして、ある通信
サービスを実現するために、モジュールAからモジュー
ルBへのアクセスが必要であることを前提としている。
【0025】故障発生時の本発明に係るモジュール状態
制御は、図1における(1)〜(5)に示す手順とな
る。すなわち、 (1)モジュールA1から、通信サービス実現のため、
モジュールBの1モジュールであるモジュールB2に対
してアクセスする。 (2)この時、モジュールB2において故障が発生して
いると、モジュールA1からのアクセス要求に対して応
答が発行できない。そのため、モジュールA1では、上
記アクセスは通信タイムアウトとなる。 (3)モジュールB2に対する通信タイムアウトを検出
したモジュールA1は、直ちに、モジュールB2の状態
を「一時故障中」に設定し、以後、モジュールBに対す
るアクセス先としてモジュールB2を選択しないように
する。
【0026】(4)当該アクセスに対するリトライ処理
が可能な場合は、モジュールB2の代替モジュールとし
て、同種モジュールであるモジュールB1に対してアク
セスすることも可能である。 (5)モジュールA1では、モジュールB2の状態を
「一時故障中」に設定してからの時間が、監視時間(T
1)を越えると、自律的にモジュールB2の状態を「運
転中」に戻し、以後、モジュールBに対するアクセス先
として、モジュールB2を選択の範囲に加える。このよ
うな(1)〜(5)の処理の後に、初めて、モジュール
B2に対してアクセスした場合、まだ、モジュールB2
の故障が回復していなかった場合は、(1)〜(5)の
手順を再度繰り返す。
【0027】次に、図2に基づき、図3におけるシステ
ムの、機能分散モジュールにおいて故障が発生した場合
のモジュール状態制御手順例を説明する。尚、本例で
は、モジュールA1は、図1と同様に、モジュールAに
属する1モジュールであり、モジュールC1,C2は、
それぞれモジュールCに属するモジュールであって、相
互にバックアップ関係が規定されている。また、通信サ
ービスを実現するために、モジュールAから、モジュー
ルC2が管理する更新系データへのアクセスが必要であ
ることを前提としている
【0028】このような条件での故障発生時の本発明に
係るモジュール状態制御は、図2における(1)〜(1
3)に示す手順となる。すなわち、 (1)モジュールA1から、通信サービス実現のためモ
ジュールC2に対してアクセスする。 (2)この時、モジュールC2において故障が発生して
いると、モジュールA1からのアクセス要求に対して応
答が発行できない。そのため、モジュールA1からのア
クセスは通信タイムアウトとなる。 (3)モジュールC2に対する通信タイムアウトを検出
したモジュールA1は、直ちに、モジュールC2の状態
を「一時故障中」に設定し、以後、モジュールC2に対
するアクセスは、モジュールC2との相互バックアップ
関係にあるモジュールC1に対して行なう。
【0029】(4)モジュールA1からの代替処理要求
を受け取ったモジュールC1では、アクセス要求されて
いる更新系データが相互バックアップ関係にあるモジュ
ールC2が管理しているデータであることを判定する
と、一旦、モジュールC2に対してアクセスの転送を行
なう。 (5)モジュールC2は故障中のため、モジュールC1
から中継されたアクセスに対しても応答できないため、
モジュールC1からのアクセスもタイムアウトする。
尚、この間、モジュールA1からの代替処理要求がタイ
ムアウトすることを防ぐために、適当なタイミングで、
中間応答をモジュールC1からモジュールA1に対して
返送することもある。
【0030】(6)モジュールC2に対する通信タイム
アウトを検出したモジュールC1は、直ちに、モジュー
ルC2の状態を「一時故障中(バックアップ起動中)」
に設定すると共に、バックアップ処理を起動する。 (7)モジュールC1は、モジュールC2が故障したこ
とを全モジュールに対して通知する。 (8)バックアップ処理の起動により可能となったモジ
ュールC2が管理していた更新系データへのアクセスを
実施し、アクセス要求元であるモジュールA1に対して
応答を返却する。 (9)モジュールC1からのモジュールC2の故障通知
を受信した全モジュールは、モジュールC2の状態を
「故障中」に設定する。
【0031】(10)モジュールC1では、モジュール
C2の状態を「一時故障中」に設定してから監視満了時
間(T1)が経過すると、バックアップ終了処理を起動
することにより、モジュールC2に対して、バックアッ
プ運転の切り戻しを試みる。この時、モジュールC2に
おける故障が回復していない場合、モジュールC1で
は、切り戻し処理が失敗する。この場合は、再度、監視
満了時間(T1)が経過するまで、バックアップ運転を
継続する。本図2における(ケース1)は、初回の切り
戻し処理が失敗した場合を示している。
【0032】(11)切り戻し処理が成功した場合、モ
ジュールC1は、モジュールC2の状態を「運転中」に
設定する。本図2における(ケース2)は、この切り戻
し処理が成功した場合を示している。 (12)モジュールC2の状態が「運転中」に設定され
ると、モジュールC1は、全モジュールに対して、モジ
ュールC2の復旧通知を発行する。 (13)モジュールC1からのモジュールC2の復旧通
知を受信した全モジュールでは、モジュールC2の状態
を「運転中」に設定し、以後、通常のアクセスを行な
う。
【0033】以上、図1〜図7を用いて説明したよう
に、本実施例の分散処理システムのモジュール運転状態
制御方法では、分散モジュール構成を採用したサービス
制御ノード100において、呼処理用アクセス信号のタ
イムアウト(時間T0経過)により、他モジュールの故
障を検出する。このことにより、故障検出のための専用
信号による呼処理用通信を圧迫することなしに故障発生
を素早く検出できる。また、故障モジュールの状態を自
律的にアクセスを抑止する状態に設定することにより、
故障モジュールを選択することによる呼損を減少させる
ことができると共に、従来技術における集中制御モジュ
ールからの制御を必要としないことから、特に、大規模
な分散システムにおける信頼度の決定要因から集中制御
モジュールの信頼度の影響を排除することが可能とな
る。
【0034】尚、本発明は、図1〜図7を用いて説明し
た実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能である。例えば、図1に
おける例ではモジュールB1のみが記載されており、手
順(4)での代替モジュールとしてのリトライ処理を含
むアクセス先は、このモジュールB1に対して行なわれ
ているが、リトライ処理以降のアクセス先は、モジュー
ルB1に限定されず、モジュールB1と同様にサービス
制御ロジックを保有する他の負荷分散モジュール群の各
モジュールでも良い。
【0035】
【発明の効果】本発明によれば、分散処理システムのサ
ービス品質を低下させることなく、各モジュールの故障
管理を行なうことができ、特に分散モジュールをバック
アップ対応に冗長構成した大規模インテリジェントネッ
トワークの信頼性と性能を向上させることが可能であ
る。
【図面の簡単な説明】
【図1】本発明の分散処理システムのモジュール運転状
態制御方法の本発明に係る処理の第1の実施例を示す通
信シーケンス図である。
【図2】本発明の分散処理システムのモジュール運転状
態制御方法の本発明に係る処理の第2の実施例を示す通
信シーケンス図である。
【図3】本発明に係るモジュール運転状態制御を行なう
分散処理システムの構成例を示すブロック図である。
【図4】図3におけるサービス制御ノードの本発明に係
る詳細構成例を示すブロック図である。
【図5】図3におけるサービス制御ノードの各分散モジ
ュールで管理する他モジュールの状態遷移モデルを示す
説明図である。
【図6】図3におけるサービス制御ノードのペアモジュ
ール以外の分散モジュールで管理する機能分散モジュー
ルの状態遷移モデルを示す説明図である。
【図7】図3におけるサービス制御ノードの機能分散モ
ジュールが管理するペアモジュールの状態遷移モデルを
示す説明図である。
【符号の説明】
100:サービス制御ノード、201:負荷分散モジュ
ールA、202:負荷分散モジュールB、203:機能
分散モジュールC、300:伝達ノード、400:他モ
ジュール状態管理機構、401:機能分散モジュール他
モジュール状態管理機構、402:バックアップ機構、
403:モジュール間通信機構、501:運転中状態、
502:一時故障中状態、503:故障中状態、50
4:一時故障中・バックアップ運転中、601:通信応
答時間、602:監視時間、701〜707:遷移検出
ポイント。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 15/16 470 G06F 15/16 470B H04L 12/24 9466−5K H04L 11/08 12/26

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 分散処理システムを構成する各々のモジ
    ュールで、他モジュールの運転可否状態の監視を行なう
    分散処理システムのモジュール運転状態制御方法であっ
    て、アクセス先の第1のモジュールによる自モジュール
    からの処理要求に対する応答時間を計測し、該計測中の
    時間が、アクセス信号毎に予め定められた時間(T0)
    を越えるか否かを監視し、上記計測中の時間が上記時間
    (T0)を越えた場合、上記第1のモジュールを運転不
    可能な故障中状態として設定登録することを特徴とする
    分散処理システムのモジュール運転状態制御方法。
  2. 【請求項2】 請求項1に記載の分散処理システムのモ
    ジュール運転状態制御方法において、上記第1のモジュ
    ールを故障中状態として設定登録した後、予め別に定め
    られた時間(T1)の経過後、上記第1のモジュールの
    故障中状態の設定を解除することを特徴とする分散処理
    システムのモジュール運転状態制御方法。
  3. 【請求項3】 請求項1、もしくは、請求項2のいずれ
    かに記載の分散処理システムのモジュール運転状態制御
    方法において、上記第1のモジュールを故障中状態とし
    て設定登録している間、上記第1のモジュールに対する
    リトライ処理を含み、以降のアクセスを、代替可能な第
    2のモジュールを選択して行なうことを特徴とする分散
    処理システムのモジュール運転状態制御方法。
  4. 【請求項4】 請求項3に記載の分散処理システムのモ
    ジュール運転状態制御方法において、上記第1のモジュ
    ールが、予め規定された他のモジュール相互間でバック
    アップ関係を有する機能分散モジュールであれば、該機
    能分散モジュールとバックアップ関係を有する機能分散
    モジュールを、上記第2のモジュールとして選択するこ
    とを特徴とする分散処理システムのモジュール運転状態
    制御方法。
  5. 【請求項5】 請求項4に記載の分散処理システムのモ
    ジュール運転状態制御方法において、上記第2のモジュ
    ールは、リトライ処理に対応する上記第1のモジュール
    へのアクセスで、上記時間(T0)に基づく上記第1の
    モジュールの故障中状態の設定登録を行なった場合、バ
    ックアップを起動すると共に、上記第1のモジュールが
    故障中であることを、接続先の全てのモジュールに通知
    し、該通知を受けた各モジュールは、上記第1のモジュ
    ールに対して上記故障中状態の設定登録を行なうことを
    特徴とする分散処理システムのモジュール運転状態制御
    方法。
  6. 【請求項6】 請求項5に記載の分散処理システムのモ
    ジュール運転状態制御方法において、上記第2のモジュ
    ールは、上記予め別に定められた時間(T1)後、上記
    第1のモジュールの運転可否状態を判別し、該第1のモ
    ジュールが運転可能な状態であれば、該第1のモジュー
    ルに対する故障中状態の設定登録を解除すると共に、上
    記全てのモジュールに、上記第1のモジュールに対する
    故障中状態の設定登録を解除するよう通知することを特
    徴とする分散処理システムのモジュール運転状態制御方
    法。
JP31633095A 1995-12-05 1995-12-05 分散処理システムのモジュール運転状態制御方法 Expired - Fee Related JP3232393B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31633095A JP3232393B2 (ja) 1995-12-05 1995-12-05 分散処理システムのモジュール運転状態制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31633095A JP3232393B2 (ja) 1995-12-05 1995-12-05 分散処理システムのモジュール運転状態制御方法

Publications (2)

Publication Number Publication Date
JPH09162976A true JPH09162976A (ja) 1997-06-20
JP3232393B2 JP3232393B2 (ja) 2001-11-26

Family

ID=18075933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31633095A Expired - Fee Related JP3232393B2 (ja) 1995-12-05 1995-12-05 分散処理システムのモジュール運転状態制御方法

Country Status (1)

Country Link
JP (1) JP3232393B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007516668A (ja) * 2003-11-21 2007-06-21 アバイア カナダ コーポレーション ネットワーク装置のバックアップ
JP2009278384A (ja) * 2008-05-14 2009-11-26 Nec Computertechno Ltd 通信装置のヘルスチェック装置
JP2013041484A (ja) * 2011-08-18 2013-02-28 Mitsubishi Electric Corp プログラム監視システム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7979862B2 (en) 2004-12-21 2011-07-12 Hewlett-Packard Development Company, L.P. System and method for replacing an inoperable master workload management process

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007516668A (ja) * 2003-11-21 2007-06-21 アバイア カナダ コーポレーション ネットワーク装置のバックアップ
JP4713492B2 (ja) * 2003-11-21 2011-06-29 アバイア カナダ コーポレーション ネットワーク装置のバックアップ
JP2009278384A (ja) * 2008-05-14 2009-11-26 Nec Computertechno Ltd 通信装置のヘルスチェック装置
JP2013041484A (ja) * 2011-08-18 2013-02-28 Mitsubishi Electric Corp プログラム監視システム

Also Published As

Publication number Publication date
JP3232393B2 (ja) 2001-11-26

Similar Documents

Publication Publication Date Title
CN101150430B (zh) 一种通过心跳机制实现网络接口板倒换的方法
US20060085669A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
JP3620527B2 (ja) ループ状インタフェースの障害解析方法及び障害解析機能を有するシステム
CN112181660A (zh) 一种基于服务器集群的高可用方法
JP2636179B2 (ja) コモンコントロール冗長系切替方法
US20080301489A1 (en) Multi-agent hot-standby system and failover method for the same
JP2000181890A (ja) マルチプロセッサ交換機及びその主プロセッサ切替方法
CN104717077B (zh) 一种管理数据中心的方法、装置及系统
US6618819B1 (en) Sparing system and method to accommodate equipment failures in critical systems
US6522732B1 (en) System and method of preserving stable calls during a split mode operation of telecommunications equipment
EP2456163B1 (en) Registering an internet protocol phone in a dual-link architecture
US5461609A (en) Packet data network switch having internal fault detection and correction
JPH06214906A (ja) 冗長性を有する通信システムとその方法
JPH09162976A (ja) 分散処理システムのモジュール運転状態制御方法
CN111262745A (zh) 信息处理平台冗余系统设计
CN116346582A (zh) 一种实现主备双网冗余方法、装置、设备及存储介质
JPH07141308A (ja) 情報処理システムにおけるバックアップ方法
JPH09274575A (ja) 統合システム管理方式
JP2833969B2 (ja) 利用者障害監視制御方法
JP2907198B1 (ja) プライベートlanを利用した無停電電源装置における電源制御方式
KR100237370B1 (ko) 이중화된 운용 워크스테이션 포트의 절체방법
WO2024119777A1 (zh) 框式设备通信链路异常处理方法、框式设备及介质
CN100499651C (zh) 一种对同步数字系列保护协议进行保护的方法
JP3582647B2 (ja) 通信制御冗長システム、及び、通信制御冗長方法
EP1107510A2 (en) Method and system of collecting and reporting statistical and status data in telecommunications equipment

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070921

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees