JP3232393B2 - Module operating state control method for distributed processing system - Google Patents

Module operating state control method for distributed processing system

Info

Publication number
JP3232393B2
JP3232393B2 JP31633095A JP31633095A JP3232393B2 JP 3232393 B2 JP3232393 B2 JP 3232393B2 JP 31633095 A JP31633095 A JP 31633095A JP 31633095 A JP31633095 A JP 31633095A JP 3232393 B2 JP3232393 B2 JP 3232393B2
Authority
JP
Japan
Prior art keywords
module
state
failure
modules
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31633095A
Other languages
Japanese (ja)
Other versions
JPH09162976A (en
Inventor
英一 岡
俊郎 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP31633095A priority Critical patent/JP3232393B2/en
Publication of JPH09162976A publication Critical patent/JPH09162976A/en
Application granted granted Critical
Publication of JP3232393B2 publication Critical patent/JP3232393B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、分散処理システム
を構成する各モジュール(分散モジュール)の故障を監
視する技術に係り、特に、各モジュールをバックアップ
対応に冗長構成した大規模インテリジェントネットワー
クの性能を低下させることなく、故障の監視を行なうの
に好適な分散処理システムのモジュール運転状態制御方
法に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technology for monitoring the failure of each module (distributed module) constituting a distributed processing system, and more particularly, to the performance of a large-scale intelligent network in which each module is redundantly configured for backup. The present invention relates to a method for controlling a module operation state of a distributed processing system suitable for monitoring a failure without lowering the module operation state.

【0002】[0002]

【従来の技術】従来、分散処理システムの各モジュール
の状態を監視する技術としては、各モジュールを統括管
理する集中制御モジュールを用いた集中管理方式と、各
モジュールが相互に他のモジュールの状態を監視する自
律分散管理方式等がある。集中管理方式においては、集
中制御モジュールが有するヘルスチェックを実行するこ
とにより、配下のモジュールの運転が可能であるか不可
能であるかを判定する方式や、各モジュールが具備する
自モジュールの再開起動を、集中制御モジュールに対し
て通知することにより、集中制御モジュールが、配下の
モジュールにおいて故障が発生したことを検出する方式
等がある。集中制御モジュールは、これらの方式のそれ
ぞれ、もしくは双方により収集した各構成モジュールの
状態変化を、故障していないその他のモジュールに対し
て分配する。そして、各モジュールにおいては、集中制
御モジュールから通知された故障モジュールの情報に応
じて、処理依頼先を選択する。
2. Description of the Related Art Conventionally, as a technique for monitoring the state of each module of a distributed processing system, a centralized management system using a centralized control module for centrally managing each module, and each module mutually checking the state of other modules. There is an autonomous distributed management method for monitoring, and the like. In the centralized management system, the health check of the centralized control module is executed to determine whether the operation of the subordinate modules is possible or not, and the restart of the own module of each module is started. Is notified to the centralized control module so that the centralized control module detects that a failure has occurred in a subordinate module. The central control module distributes the status change of each component module collected by each of these methods or both to other modules that are not faulty. Then, in each module, a processing request destination is selected according to the information of the failed module notified from the central control module.

【0003】この集中管理方式においては、集中制御モ
ジュールに故障が発生すると、システム全体の状態制御
が不可能になる。このため、システム全体の信頼度を一
定以上向上させることが困難である。さらに、集中管理
モジュールがノード内に発生した故障を検出するまでに
遅延が伴い、故障が発生してから、各モジュールが故障
モジュールに対する処理要求を抑止するまでに発生した
呼が異常終了し、サービス品質の低下につながる。
In this centralized management system, if a failure occurs in the centralized control module, it becomes impossible to control the state of the entire system. For this reason, it is difficult to improve the reliability of the entire system by a certain amount or more. Furthermore, there is a delay until the centralized management module detects a failure that has occurred in the node, and the call that occurred before the failure occurred and before each module suppressed the processing request for the failed module terminated abnormally. It leads to quality deterioration.

【0004】また、自律分散管理方式においては、シス
テムを構成する各モジュールが、自律的に、予め定めら
れた範囲にあるモジュール、ないしはシステムを構成す
る他の全モジュールに対して、周期的に、ヘルスチェッ
クを実行することにより、他モジュールの故障の有無の
状態を把握し、処理依頼先を選択する。このため、集中
管理方式における集中制御モジュールの故障発生に伴う
システム全体の状態制御が不可能となる状態や、故障検
出の遅延に伴うサービス品質の低下を回避することがで
きる。
In the autonomous decentralized management system, each module constituting the system is autonomously periodically assigned to a module within a predetermined range or to all other modules constituting the system. By executing the health check, the status of the failure of the other module is grasped, and the processing request destination is selected. For this reason, it is possible to avoid a state in which the state control of the entire system becomes impossible due to the occurrence of a failure in the centralized control module in the centralized management system, and a decrease in service quality due to a delay in failure detection.

【0005】しかし、この自律分散管理方式において
は、各モジュールが相互にヘルスチェックや全分散モジ
ュール群で個々のモジュール状態の整合性を保証するた
めの通信を行なう。その結果、通常の呼処理のためのモ
ジュール間通信を圧迫し、サービス品質の低下につなが
る。
However, in this autonomous decentralized management system, each module performs a health check and communication for guaranteeing consistency of individual module states in all distributed module groups. As a result, communication between modules for normal call processing is squeezed, leading to a decrease in service quality.

【0006】[0006]

【発明が解決しようとする課題】解決しようとする問題
点は、従来の技術では、分散モジュールシステムのサー
ビス品質を低下させることなく、各モジュールの故障管
理を行なうことができない点である。本発明の目的は、
これら従来技術の課題を解決し、分散モジュールをバッ
クアップ対応に冗長構成した大規模インテリジェントネ
ットワークの信頼性と性能を向上させることを可能とす
る分散処理システムのモジュール運転状態制御方法を提
供することである。
The problem to be solved is that in the conventional technique, failure management of each module cannot be performed without deteriorating the service quality of the distributed module system. The purpose of the present invention is
An object of the present invention is to provide a method for controlling the operation state of a module of a distributed processing system which can solve the problems of the conventional technology and improve the reliability and performance of a large-scale intelligent network in which distributed modules are redundantly configured for backup. .

【0007】[0007]

【課題を解決するための手段】上記目的を達成するた
め、本発明の分散処理システムのモジュール運転状態制
御方法は、分散処理システムを構成する各々のモジュー
ルで、他モジュールの運転可否状態の監視を行なう分散
処理システムのモジュール運転状態制御方法であって、
アクセス先の第1のモジュール(負荷分散モジュールB
2)よる自モジュール(負荷分散モジュールA1)から
の処理要求に対する応答時間を計測し、この時間が、ア
クセス信号毎に予め定められた時間(T0)を越えるか
否かを監視し、時間(T0)を越えた場合(タイムアウ
ト)、第1のモジュールを運転不可能な故障中状態(一
時故障中)として設定登録するか、もしくは上記第1の
モジュールを故障中状態として設定登録した後、予め別
に設定められた時間(T1)の経過後、上記第1のモジ
ュールの故障中状態の設定を解除する方法において、上
記第1のモジュールを故障中状態として設定登録してい
る間、上記第1のモジュールに対するリトライ処理を含
み、以降のアクセスを、代替可能な第2のモジュールを
選択して行ない、かつ上記第1のモジュールが、予め規
定された他のモジュール相互間でバックアップ関係を有
する機能分散モジュールであれば、該機能分散モジュー
ルとバックアップ関係を有する機能分散モジュールを、
上記第2のモジュールとして選択し、また上記第2モジ
ュールは、リトライ処理に対応する上記第1のモジュー
ルへのアクセスで、上記時間(T0)に基づく上記第1
のモジュールの故障中状態の設定登録を行なった場合、
バックアップを起動すると共に、上記第1のモジュール
が故障中であることを、接続先の全てのモジュールに通
知し、該通知を受けた各モジュールは、上記第1のモジ
ュールに対して上記故障中状態の設定登録を行ない、さ
らに上記第2のモジュールは、上記予め別に設定められ
た時間(T1)後、上記第1のモジュールの運転可否状
態を判別し、該第1のモジュールが運転可能な状態であ
れば、該第1のモジュールに対する故障中状態の設定登
録を解除すると共に、上記全てのモジュールに、上記第
1のモジュールに対する故障中状態の設定登録を解除す
るよう通知することを特徴とする。
To achieve the above object, according to an aspect of the module operation state control method of a distributed processing system of the present invention, in each of the modules constituting the distributed processing system, the monitoring of the operating state for or other modules A module operation state control method for a distributed processing system that performs
Access destination first module (load distribution module B
2) The response time to the processing request from the own module (load distribution module A1) is measured, and it is monitored whether or not this time exceeds a predetermined time (T0) for each access signal. If) exceeds the (time-out), either by setting registered as first an inoperable fault in status module (transient faults in), or the first
After setting and registering the module as faulty,
After the lapse of the time (T1) set in the first module, the first module
In the method for canceling the setting of the fault state of the module,
The first module is set and registered as faulty.
The retry process for the first module
Only the second module that can be replaced
Selected and the first module is specified in advance.
There is a backup relationship between other specified modules.
Function distribution module, the function distribution module
Function distribution module that has a backup relationship with
Selected as the second module and the second module
The first module corresponding to the retry processing is
Access to the first device based on the time (T0).
When the setting registration of the failure status of the module of
Activate the backup and execute the first module
To all connected modules that the
Each of the modules notified and notified of the
Register the setting of the above failure status to the
Further, the second module is separately set in advance.
After the elapsed time (T1), the operation availability of the first module
The first module is in an operable state.
Then, the setting registration of the faulty state for the first module is performed.
The recording is canceled and all the modules are
Cancels the registration of the faulty state setting for the module 1
Is notified .

【0008】[0008]

【発明の実施の形態】本発明においては、分散モジュー
ルで発生した故障を、各モジュールが行なう通信サービ
スアクセスに対するタイムアウト(T0)の監視により
検出する。そして、タイムアウトが発生した場合、当該
モジュールに対する通信サービスアクセスを直ちに停止
する。さらに一定時間を経過した後に、タイムアウト発
生した当該モジュールへの通信サービスアクセスを回復
する。また、当該モジュールへのアクセスに対するリト
ライ処理が可能な場合は、代替モジュールとして、同種
モジュールに対してアクセスする。
DESCRIPTION OF THE PREFERRED EMBODIMENTS In the present invention, a failure occurring in a distributed module is detected by monitoring a timeout (T0) for a communication service access performed by each module. When a timeout occurs, the communication service access to the module is immediately stopped. After a certain period of time has elapsed, the communication service access to the module in which the timeout has occurred is restored. If retry processing for access to the module is possible, access is made to a module of the same type as a substitute module.

【0009】また、通信サービスの実現上で必要な更新
系データを、予め規定されたモジュール相互間のバック
アップ関係を有する機能分散モジュールにおいて管理す
る場合、バックアップ関係にある機能分散モジュールが
相互の運転状態を管理し、相手側への通信サービスアク
セスがタイムアウトした場合、当該機能分散モジュール
が管理していた更新系データの管理権を引き継ぐ。そし
て、当該モジュールの運転のバックアップを開始すると
共に、その他のモジュールに対して、当該モジュールの
運転状態が運転不可能になったことを通知する。さら
に、一定時間(T1)経過した後に、当該モジュールか
ら引き継いでいた更新系データの管理権を返還すること
を試み、成功した場合は、他のモジュールに対して、当
該モジュールの状態が運転可能になったことを通知し、
失敗した場合は、再度、上述した一定時間(T1)が経
過するまでバックアップ運転を継続する。
In the case where update data required for realizing a communication service is managed in a function distribution module having a backup relationship between predetermined modules, the function distribution modules in the backup relationship are in a mutual operation state. When the communication service access to the other party times out, the management right of the update data managed by the function distribution module is taken over. Then, the backup of the operation of the module is started, and the other modules are notified that the operation state of the module has become inoperable. Further, after a lapse of a predetermined time (T1), an attempt is made to return the management right of the update data taken over from the module, and if successful, the status of the module becomes operable with respect to other modules. Notification that
In the case of failure, the backup operation is continued again until the above-mentioned fixed time (T1) elapses.

【0010】このようにすることにより、分散処理シス
テムのモジュール運転状態制御処理において、従来の技
術と比較して以下の利点がある。 (a)集中制御モジュールによるモジュール状態の制御
が不要なため、集中制御モジュールの故障等の、システ
ム全体の信頼度の向上を阻害する要因を排除できる。 (b)集中制御モジュールが不要であり、集中制御モジ
ュールによる故障検出までの遅延を回避できる。 (c)ヘルスチェック用信号の発行を行なわないので、
通信量を圧迫することはない。 (d)全モジュール間での他のモジュールの状態整合保
証のための双方向通信を必要としないので、通信量を圧
迫することはない。
By doing so, there are the following advantages in the module operation state control processing of the distributed processing system as compared with the conventional technique. (A) Since it is not necessary to control the module state by the centralized control module, it is possible to eliminate factors such as failure of the centralized control module that hinder the improvement of the reliability of the entire system. (B) No centralized control module is required, and a delay until failure detection by the centralized control module can be avoided. (C) Since the health check signal is not issued,
There is no pressure on traffic. (D) Since there is no need for bidirectional communication between all modules for guaranteeing the state matching of other modules, the communication amount is not reduced.

【0011】[0011]

【実施例】以下、本発明の実施例を、図面により詳細に
説明する。図1は、本発明の分散処理システムのモジュ
ール運転状態制御方法の本発明に係る処理の第1の実施
例を示す通信シーケンス図、図2は、本発明の分散処理
システムのモジュール運転状態制御方法の本発明に係る
処理の第2の実施例を示す通信シーケンス図、図3は、
本発明に係るモジュール運転状態制御を行なう分散処理
システムの構成例を示すブロック図である。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 is a communication sequence diagram showing a first embodiment of a process according to the present invention of a method for controlling a module operating state of a distributed processing system according to the present invention, and FIG. 2 is a method for controlling a module operating state of a distributed processing system according to the present invention. FIG. 3 is a communication sequence diagram showing a second embodiment of the process according to the present invention.
It is a block diagram showing the example of composition of the distributed processing system which performs module operation state control concerning the present invention.

【0012】図3においては、本発明に係る分散処理シ
ステムとして、分散モジュール構成を利用した、インテ
リジェントネットワークサービスを提供するサービス制
御ノードの構成を示し、100は分散モジュール構成を
採用したサービス制御ノード、300は伝達ノード、2
01は伝達ノード300との通信制御を行なう負荷分散
モジュール群(以下、このタイプのモジュールをモジュ
ールAという)、202はサービス制御ロジックを保有
する負荷分散モジュール群(以下、このタイプのモジュ
ールをモジュールBという)、203はサービス制御ロ
ジックにより更新された更新系データをリアルタイムデ
ータベース上に保持する機能分散モジュール群(以下、
このタイプのモジュールをモジュールCという)であ
る。
FIG. 3 shows a configuration of a service control node that provides an intelligent network service using a distributed module configuration as a distributed processing system according to the present invention. 300 is a transmission node, 2
01 denotes a load distribution module group for controlling communication with the transmission node 300 (hereinafter, this type of module is referred to as module A), and 202 denotes a load distribution module group having service control logic (hereinafter, this type of module is referred to as module B). 203, a function distribution module group (hereinafter, referred to as a group of functions) that holds updated data updated by the service control logic on a real-time database.
This type of module is referred to as module C).

【0013】サービス制御ノード100は、これらの分
散モジュール(モジュールA201、モジュールB20
2、モジュールC203)により構成されている。伝達
ノード300は、端末間の呼に対応する通話路の制御を
行なう。すなわち、伝達ノード300は、電話機等の端
末からのインテリジェントネットワークサービス呼を検
出すると、サービス制御ノード100に通知してくる。
サービス制御ノード100は、当該呼の制御を分散モジ
ュール群201〜203の連携により実施する。
The service control node 100 is provided with these distributed modules (module A201, module B20
2, module C203). The transmission node 300 controls a communication path corresponding to a call between terminals. That is, upon detecting an intelligent network service call from a terminal such as a telephone, the transmission node 300 notifies the service control node 100 of the call.
The service control node 100 controls the call by cooperation of the distributed module groups 201 to 203.

【0014】図4は、図3におけるサービス制御ノード
の本発明に係る詳細構成例を示すブロック図である。本
例は、図3のサービス制御ノード100内の各分散モジ
ュール上へのモジュール運転状態制御のための機能配備
条件例を示し、モジュールA201,B202は、他モ
ジュール状態管理機構400、モジュール間通信機構4
03を有し、また、モジュールC203は、機能分散モ
ジュール他モジュール状態管理機構401、バックアッ
プ機構402、モジュール間通信機構403を有する。
以下、各機構の詳細を説明する。
FIG. 4 is a block diagram showing a detailed configuration example according to the present invention of the service control node in FIG. This example shows an example of function allocation conditions for module operation state control on each distributed module in the service control node 100 in FIG. 3. Modules A201 and B202 include another module state management mechanism 400 and an inter-module communication mechanism. 4
The module C203 includes a function distribution module / other module state management mechanism 401, a backup mechanism 402, and an inter-module communication mechanism 403.
Hereinafter, details of each mechanism will be described.

【0015】(A)他モジュール状態管理機構400:
モジュールA201,B202では、他モジュール状態
管理機構400により、自モジュール以外の他モジュー
ルの状態を管理する。尚、モジュールC203において
は、各々のモジュール状態の他、バックアップ関係にあ
る機能分散モジュールのIDも合わせて管理する。そし
て、後述するモジュール間通信機構403からのタイム
アウト通知を受けると、当該モジュールの状態を故障中
に設定する。当該モジュールが負荷分散モジュールであ
る場合は、一定時間(T1)経過後、当該モジュールの
状態を運転可能な状態に再設定する。
(A) Other module status management mechanism 400:
In the modules A201 and B202, the states of other modules other than the own module are managed by the other module state management mechanism 400. In the module C203, in addition to the status of each module, the IDs of the function distribution modules in a backup relationship are also managed. When a timeout notification is received from the inter-module communication mechanism 403, which will be described later, the status of the module is set to failure. If the module is a load balancing module, the state of the module is reset to an operable state after a lapse of a predetermined time (T1).

【0016】さらに、後述するモジュールC203から
バックアップモジュールの故障通知を受信した場合は、
通知された機能分散モジュールの状態を故障中に設定
し、以後、当該機能分散モジュールの状態復旧が通知さ
れるまで、固定的に、当該機能分散モジュールの状態を
故障中とする。また、そのモジュールで実施されるサー
ビス処理において、他モジュールへのアクセスが必要な
場合、常に、他モジュール状態は事前に参照され、モジ
ュール状態が正常でない場合には、当該モジュールへの
アクセスを中止し、代替モジュールを選択してアクセス
する。代替モジュールの選択方法としては、故障モジュ
ールがモジュールA,Bである場合、すなわち負荷分散
モジュールの場合には、同種のモジュールを任意に選択
する。一方、アクセスモジュールの種別がモジュール
C、すなわち機能分散モジュールの場合は、相互バック
アップ関係にあるモジュールを選択することもできる。
Further, when a failure notification of the backup module is received from a module C 203 described later,
The state of the notified function distribution module is set to failure, and thereafter, the state of the function distribution module is fixed to failure until the state restoration of the function distribution module is notified. In the service processing performed by the module, when access to another module is required, the status of the other module is always referred to in advance, and when the module status is not normal, access to the module is stopped. , Select an alternative module to access. As a method of selecting an alternative module, when the failed modules are the modules A and B, that is, in the case of the load distribution module, the same type of module is arbitrarily selected. On the other hand, when the type of the access module is the module C, that is, the function distribution module, the modules having a mutual backup relationship can be selected.

【0017】(B)機能分散モジュール他モジュール状
態管理機構401:モジュールCに配備された機能分散
モジュール他モジュール状態管理機構401は、前述し
た他モジュール状態管理機構400が有する機能のほか
に、タイムアウトしたモジュールが自モジュールと相互
バックアップ関係にある機能分散モジュール(以後、こ
のようなモジュールをペアモジュールという)であった
場合、当該モジュールの状態を、直ちに、「故障中」と
設定すると共に、バックアップ機構402に対して、バ
ックアップ処理の開始を通知し、その他の全モジュール
に対して、ペアモジュールが故障したことを同報する。
その後、一定時間(T1)経過後、バックアップ機構4
02に対して、バックアップの切り戻し処理(以後、単
に切り戻し処理という)を指示し、この切り戻し処理が
正常に終了した場合は、ペアモジュールの状態を正常に
復帰させると共に、全モジュールに対して、当該モジュ
ールが復帰したことを同報する(復帰通知)。
(B) Function distribution module / other module status management mechanism 401: The function distribution module / other module status management mechanism 401 provided in the module C has timed out in addition to the functions of the aforementioned other module status management mechanism 400. If the module is a function distribution module having a mutual backup relationship with its own module (hereinafter, such a module is referred to as a pair module), the status of the module is immediately set to “failed” and the backup mechanism 402 , The start of the backup process is notified, and all other modules are notified that the pair module has failed.
Thereafter, after a lapse of a predetermined time (T1), the backup mechanism 4
02, a backup switchback process (hereinafter, simply referred to as a switchback process) is instructed. When the switchback process is completed normally, the state of the pair module is returned to a normal state, and all the modules are restored. Broadcasts that the module has returned (return notification).

【0018】(C)バックアップ機構402:バックア
ップ機構は、機能分散モジュール他モジュール状態管理
機構401からのバックアップ開始指示を契機に起動し
て、バックアップ関係にあるペアモジュールのサービス
処理を引き継ぎ、切り戻し指示を契機に切り戻し処理を
開始する。バックアップの切り戻し処理は、ペアモジュ
ールの故障がまだ復帰していないことにより成功しない
場合、その処理を中断し、切り戻し指示を発行した機能
分散モジュール他モジュール状態管理機構401に対し
て、切り戻し処理失敗を通知すると共に、バックアップ
運転を継続する。
(C) Backup mechanism 402: The backup mechanism is started upon a backup start instruction from the function distribution module / other module state management mechanism 401 to take over the service processing of the pair module in the backup relationship and issue a switchback instruction. The switchback processing is started with the trigger. If the backup switchback processing is not successful because the failure of the pair module has not yet recovered, the processing is interrupted, and the switchback processing is performed on the function distribution module / other module state management mechanism 401 that issued the switchback instruction. Notify the processing failure and continue the backup operation.

【0019】(D)モジュール間通信機構403:全て
の分散モジュールでは、他モジュールとの通信を行なう
ために、モジュール間通信機能を有する。モジュール間
通信機構403は、他モジュールに対するアクセスに対
して、信号毎に予め定められている時間(T0)を経過
しても応答を受信しない場合、当該モジュールに対する
アクセスがタイムアウトしたことを直ちに他モジュール
状態管理機構400に通知する。モジュールCの場合
は、機能分散モジュール他モジュール状態管理機構40
1に通知する。
(D) Inter-module communication mechanism 403: All distributed modules have an inter-module communication function in order to communicate with other modules. If no response is received after a predetermined time (T0) has elapsed for each signal with respect to access to another module, the inter-module communication mechanism 403 immediately notifies the other module that the access to the module has timed out. Notify the state management mechanism 400. In the case of module C, the function distribution module and other module state management mechanism 40
Notify 1.

【0020】図5は、図3におけるサービス制御ノード
の各分散モジュールで管理する他モジュールの状態遷移
モデルを示す説明図である。本図5において、501は
「運転中」の状態を示し、502は「一時故障中」の状
態を示す。それぞれの状態において通信応答時間601
と監視時間602を監視する。運転中状態501と一時
故障中状態502の間の遷移は、遷移検出ポイントを通
過して行なわれる。遷移検出ポイント701は、運転中
状態にあったモジュールに対する通信応答時間601が
予め定められたタイムアウト時間(T0)を満了した場
合に満足される遷移検出ポイントであり、遷移検出ポイ
ント702は、故障中にあったモジュールが、故障中状
態になってからの監視時間602が別に定められた監視
満了時間(T1)を越えた場合に、満足される遷移検出
ポイントである。
FIG. 5 is an explanatory diagram showing a state transition model of another module managed by each distributed module of the service control node in FIG. In FIG. 5, 501 indicates a state of “operating”, and 502 indicates a state of “temporary failure”. Communication response time 601 in each state
And the monitoring time 602 are monitored. The transition between the operating state 501 and the temporary failure state 502 is performed through a transition detection point. The transition detection point 701 is a transition detection point that is satisfied when the communication response time 601 for the module in the operating state has expired a predetermined time-out time (T0). Is a transition detection point that is satisfied when the monitoring time 602 after the module in the state of failure has exceeded the monitoring expiration time (T1) defined separately.

【0021】図6は、図3におけるサービス制御ノード
のペアモジュール以外の分散モジュールで管理する機能
分散モジュールの状態遷移モデルを示す説明図である。
本図6において、501と502は図5で示したものと
同様に、「運転中」の状態と「一時故障中」の状態を示
す。503は、当該モジュールCが「故障中状態」であ
ることを示す。「運転中」状態における監視データであ
る通信応答時間601、「一時故障中」状態における監
視データである監視時間602、及び、遷移検出ポイン
ト701,702についても図5における説明と同様で
ある。遷移検出ポイント703は、本状態遷移図が示し
ているモジュールCのペアモジュールからの故障通知の
受信により、また、遷移検出ポイント704は、故障か
らの復帰通知の受信により、通過する遷移検出ポイント
を各々示している。
FIG. 6 is an explanatory diagram showing a state transition model of a function distribution module managed by a distribution module other than the pair module of the service control node in FIG.
In FIG. 6, reference numerals 501 and 502 denote a “operating” state and a “temporary failure” state, similarly to the case shown in FIG. Reference numeral 503 indicates that the module C is in the “failure state”. The communication response time 601 that is the monitoring data in the “operating” state, the monitoring time 602 that is the monitoring data in the “temporary failure” state, and the transition detection points 701 and 702 are the same as those described in FIG. The transition detection point 703 is determined by receiving a failure notification from the pair module of the module C shown in the state transition diagram, and the transition detection point 704 is determined by passing a transition detection point passing by receiving a recovery notification from the failure. Each is shown.

【0022】図7は、図3におけるサービス制御ノード
の機能分散モジュールが管理するペアモジュールの状態
遷移モデルを示す説明図である。運転中状態501、通
信応答時間601,監視時間602は図5,図6におけ
る説明と同様である。状態504は、図5における「一
時故障中」状態502と同様に、当該モジュールが「一
時故障中」の状態であることと共に、故障モジュールの
バックアップ運転を行なっている状態であることを示
す。遷移検出ポイント705は、運転中状態にあったペ
アモジュールに対するアクセスがタイムアウト(時間T
0経過)した場合に通過する遷移検出ポイントであり、
この遷移検出ポイントを通過した場合は、全モジュール
に対して、ペアモジュールの状態が「故障中」に遷移し
たことを同報する。
FIG. 7 is an explanatory diagram showing a state transition model of a pair module managed by the function distribution module of the service control node in FIG. The operating state 501, the communication response time 601, and the monitoring time 602 are the same as those described with reference to FIGS. The state 504 indicates that the module is in the “temporary failure” state and is in the state of performing the backup operation of the failed module, similarly to the “temporary failure” state 502 in FIG. The transition detection point 705 indicates that the access to the pair module in the operating state has timed out (time T
0), which is a transition detection point that passes when
If this transition detection point has been passed, the fact that the state of the pair module has transitioned to "failure" is broadcast to all modules.

【0023】遷移検出ポイント706は、ペアモジュー
ルの状態が一時故障中状態502に遷移してからの監視
時間602が、予め定められた監視満了時間(T1)を
満了し、バックアップ運転の切り戻しが成功したため
に、ペアモジュールにおいて本来の運転が可能となった
ことを示す検出ポイントであり、この遷移検出ポイント
706を通過した場合は、全モジュールに対して、ペア
モジュールが「運転中」状態に復帰したことを同報す
る。遷移検出ポイント707は、切り戻し処理が正常に
終了できなかったため、バックアップ運転を継続して行
なう場合に通過する遷移検出ポイントである。
At the transition detection point 706, the monitoring time 602 after the state of the pair module transits to the temporary failure state 502 expires the predetermined monitoring expiration time (T1), and the backup operation is switched back. This is a detection point indicating that the original operation has become possible in the pair module due to success. When the transition detection point 706 is passed, the pair module returns to the “operating” state for all modules. Broadcast what you did. The transition detection point 707 is a transition detection point that passes when the backup operation is continuously performed because the switchback processing has not been completed normally.

【0024】以下、図1に基づき、図3におけるシステ
ムの、負荷分散モジュールにおいて故障が発生した場合
のモジュール状態制御手順例を説明する。本図1に示す
例では、モジュールA1は、モジュールAに属するモジ
ュールであり、モジュールB1,B2は、それぞれモジ
ュールBに属するモジュールである。そして、ある通信
サービスを実現するために、モジュールAからモジュー
ルBへのアクセスが必要であることを前提としている。
Hereinafter, an example of a module state control procedure when a failure occurs in the load distribution module of the system in FIG. 3 will be described with reference to FIG. In the example shown in FIG. 1, the module A1 is a module belonging to the module A, and the modules B1 and B2 are modules belonging to the module B. Then, it is assumed that access to module B from module A is necessary to realize a certain communication service.

【0025】故障発生時の本発明に係るモジュール状態
制御は、図1における(1)〜(5)に示す手順とな
る。すなわち、 (1)モジュールA1から、通信サービス実現のため、
モジュールBの1モジュールであるモジュールB2に対
してアクセスする。 (2)この時、モジュールB2において故障が発生して
いると、モジュールA1からのアクセス要求に対して応
答が発行できない。そのため、モジュールA1では、上
記アクセスは通信タイムアウトとなる。 (3)モジュールB2に対する通信タイムアウトを検出
したモジュールA1は、直ちに、モジュールB2の状態
を「一時故障中」に設定し、以後、モジュールBに対す
るアクセス先としてモジュールB2を選択しないように
する。
The module state control according to the present invention at the time of occurrence of a failure is performed by the procedures shown in (1) to (5) in FIG. That is, (1) From module A1, to realize a communication service,
An access is made to the module B2, which is one of the modules B. (2) At this time, if a failure has occurred in the module B2, a response to the access request from the module A1 cannot be issued. Therefore, in module A1, the above access results in a communication timeout. (3) The module A1 that has detected the communication timeout for the module B2 immediately sets the state of the module B2 to “temporary failure”, and thereafter does not select the module B2 as an access destination for the module B.

【0026】(4)当該アクセスに対するリトライ処理
が可能な場合は、モジュールB2の代替モジュールとし
て、同種モジュールであるモジュールB1に対してアク
セスすることも可能である。 (5)モジュールA1では、モジュールB2の状態を
「一時故障中」に設定してからの時間が、監視時間(T
1)を越えると、自律的にモジュールB2の状態を「運
転中」に戻し、以後、モジュールBに対するアクセス先
として、モジュールB2を選択の範囲に加える。このよ
うな(1)〜(5)の処理の後に、初めて、モジュール
B2に対してアクセスした場合、まだ、モジュールB2
の故障が回復していなかった場合は、(1)〜(5)の
手順を再度繰り返す。
(4) If retry processing for the access is possible, it is also possible to access module B1, which is a module of the same kind, as a substitute module for module B2. (5) In the module A1, the time after setting the state of the module B2 to “temporary failure” is the monitoring time (T
When the value exceeds 1), the state of the module B2 is autonomously returned to "operating", and thereafter, the module B2 is added to the selection range as an access destination for the module B. When the module B2 is accessed for the first time after the processes (1) to (5), the module B2 is still accessed.
If the failure has not been recovered, the steps (1) to (5) are repeated again.

【0027】次に、図2に基づき、図3におけるシステ
ムの、機能分散モジュールにおいて故障が発生した場合
のモジュール状態制御手順例を説明する。尚、本例で
は、モジュールA1は、図1と同様に、モジュールAに
属する1モジュールであり、モジュールC1,C2は、
それぞれモジュールCに属するモジュールであって、相
互にバックアップ関係が規定されている。また、通信サ
ービスを実現するために、モジュールAから、モジュー
ルC2が管理する更新系データへのアクセスが必要であ
ることを前提としている
Next, an example of a module state control procedure when a failure occurs in the function distribution module of the system in FIG. 3 will be described with reference to FIG. In this example, the module A1 is one module belonging to the module A as in FIG. 1, and the modules C1 and C2 are:
Each of the modules belongs to the module C, and a backup relationship between the modules is defined. It is also assumed that the module A needs access to the update data managed by the module C2 in order to realize the communication service.

【0028】このような条件での故障発生時の本発明に
係るモジュール状態制御は、図2における(1)〜(1
3)に示す手順となる。すなわち、 (1)モジュールA1から、通信サービス実現のためモ
ジュールC2に対してアクセスする。 (2)この時、モジュールC2において故障が発生して
いると、モジュールA1からのアクセス要求に対して応
答が発行できない。そのため、モジュールA1からのア
クセスは通信タイムアウトとなる。 (3)モジュールC2に対する通信タイムアウトを検出
したモジュールA1は、直ちに、モジュールC2の状態
を「一時故障中」に設定し、以後、モジュールC2に対
するアクセスは、モジュールC2との相互バックアップ
関係にあるモジュールC1に対して行なう。
The module state control according to the present invention at the time of occurrence of a failure under such conditions is described in (1) to (1) in FIG.
The procedure shown in 3) is performed. That is, (1) The module A1 accesses the module C2 to realize a communication service. (2) At this time, if a failure has occurred in the module C2, a response to the access request from the module A1 cannot be issued. Therefore, the access from the module A1 results in a communication timeout. (3) The module A1, upon detecting a communication timeout for the module C2, immediately sets the state of the module C2 to "temporary failure", and thereafter, the access to the module C2 is restricted to the module C1 having a mutual backup relationship with the module C2. Perform for

【0029】(4)モジュールA1からの代替処理要求
を受け取ったモジュールC1では、アクセス要求されて
いる更新系データが相互バックアップ関係にあるモジュ
ールC2が管理しているデータであることを判定する
と、一旦、モジュールC2に対してアクセスの転送を行
なう。 (5)モジュールC2は故障中のため、モジュールC1
から中継されたアクセスに対しても応答できないため、
モジュールC1からのアクセスもタイムアウトする。
尚、この間、モジュールA1からの代替処理要求がタイ
ムアウトすることを防ぐために、適当なタイミングで、
中間応答をモジュールC1からモジュールA1に対して
返送することもある。
(4) When the module C1 that has received the substitute processing request from the module A1 determines that the update data requested to be accessed is data managed by the module C2 in a mutual backup relationship, the module C1 once determines , And transfers the access to the module C2. (5) Since module C2 is out of order, module C1
Can not respond to access relayed from
Access from module C1 also times out.
During this time, at an appropriate timing, in order to prevent the alternative processing request from the module A1 from timing out,
An intermediate response may be returned from module C1 to module A1.

【0030】(6)モジュールC2に対する通信タイム
アウトを検出したモジュールC1は、直ちに、モジュー
ルC2の状態を「一時故障中(バックアップ起動中)」
に設定すると共に、バックアップ処理を起動する。 (7)モジュールC1は、モジュールC2が故障したこ
とを全モジュールに対して通知する。 (8)バックアップ処理の起動により可能となったモジ
ュールC2が管理していた更新系データへのアクセスを
実施し、アクセス要求元であるモジュールA1に対して
応答を返却する。 (9)モジュールC1からのモジュールC2の故障通知
を受信した全モジュールは、モジュールC2の状態を
「故障中」に設定する。
(6) The module C1, upon detecting a communication timeout for the module C2, immediately changes the state of the module C2 to "temporary failure (backup starting)".
And start backup processing. (7) The module C1 notifies all the modules that the module C2 has failed. (8) Access to the update data managed by the module C2 enabled by the start of the backup process is performed, and a response is returned to the module A1 that is the access request source. (9) All the modules that have received the failure notification of the module C2 from the module C1 set the state of the module C2 to “under failure”.

【0031】(10)モジュールC1では、モジュール
C2の状態を「一時故障中」に設定してから監視満了時
間(T1)が経過すると、バックアップ終了処理を起動
することにより、モジュールC2に対して、バックアッ
プ運転の切り戻しを試みる。この時、モジュールC2に
おける故障が回復していない場合、モジュールC1で
は、切り戻し処理が失敗する。この場合は、再度、監視
満了時間(T1)が経過するまで、バックアップ運転を
継続する。本図2における(ケース1)は、初回の切り
戻し処理が失敗した場合を示している。
(10) In the module C1, when the monitoring expiration time (T1) elapses after the state of the module C2 is set to "temporary failure", the backup ending process is started, so that the module C2 Attempt to switch back to backup operation. At this time, if the failure in the module C2 has not been recovered, the switchback processing fails in the module C1. In this case, the backup operation is continued until the monitoring expiration time (T1) elapses again. (Case 1) in FIG. 2 shows a case where the first switchback processing has failed.

【0032】(11)切り戻し処理が成功した場合、モ
ジュールC1は、モジュールC2の状態を「運転中」に
設定する。本図2における(ケース2)は、この切り戻
し処理が成功した場合を示している。 (12)モジュールC2の状態が「運転中」に設定され
ると、モジュールC1は、全モジュールに対して、モジ
ュールC2の復旧通知を発行する。 (13)モジュールC1からのモジュールC2の復旧通
知を受信した全モジュールでは、モジュールC2の状態
を「運転中」に設定し、以後、通常のアクセスを行な
う。
(11) If the switchback processing is successful, the module C1 sets the state of the module C2 to "operating". (Case 2) in FIG. 2 shows a case where the switchback processing is successful. (12) When the state of the module C2 is set to “operating”, the module C1 issues a recovery notification of the module C2 to all modules. (13) In all the modules that have received the notification of the recovery of the module C2 from the module C1, the state of the module C2 is set to “operating”, and thereafter, normal access is performed.

【0033】以上、図1〜図7を用いて説明したよう
に、本実施例の分散処理システムのモジュール運転状態
制御方法では、分散モジュール構成を採用したサービス
制御ノード100において、呼処理用アクセス信号のタ
イムアウト(時間T0経過)により、他モジュールの故
障を検出する。このことにより、故障検出のための専用
信号による呼処理用通信を圧迫することなしに故障発生
を素早く検出できる。また、故障モジュールの状態を自
律的にアクセスを抑止する状態に設定することにより、
故障モジュールを選択することによる呼損を減少させる
ことができると共に、従来技術における集中制御モジュ
ールからの制御を必要としないことから、特に、大規模
な分散システムにおける信頼度の決定要因から集中制御
モジュールの信頼度の影響を排除することが可能とな
る。
As described above with reference to FIGS. 1 to 7, in the method of controlling the module operation state of the distributed processing system according to the present embodiment, the service control node 100 adopting the distributed module configuration uses the call processing access signal. (Time T0 has elapsed), a failure of another module is detected. As a result, the occurrence of a failure can be quickly detected without suppressing communication for call processing using a dedicated signal for failure detection. Also, by setting the state of the failed module to a state in which access is autonomously suppressed,
Since the call loss due to the selection of the faulty module can be reduced and the control from the centralized control module in the prior art is not required, the centralized control module is particularly used because of the determinants of reliability in a large-scale distributed system. Can eliminate the influence of reliability.

【0034】尚、本発明は、図1〜図7を用いて説明し
た実施例に限定されるものではなく、その要旨を逸脱し
ない範囲において種々変更可能である。例えば、図1に
おける例ではモジュールB1のみが記載されており、手
順(4)での代替モジュールとしてのリトライ処理を含
むアクセス先は、このモジュールB1に対して行なわれ
ているが、リトライ処理以降のアクセス先は、モジュー
ルB1に限定されず、モジュールB1と同様にサービス
制御ロジックを保有する他の負荷分散モジュール群の各
モジュールでも良い。
The present invention is not limited to the embodiment described with reference to FIGS. 1 to 7, and can be variously modified without departing from the gist thereof. For example, in the example of FIG. 1, only the module B1 is described, and the access destination including the retry processing as the substitute module in the procedure (4) is performed for the module B1, but the access destination after the retry processing is performed. The access destination is not limited to the module B1, but may be each module of another load balancing module group having service control logic like the module B1.

【0035】[0035]

【発明の効果】本発明によれば、分散処理システムのサ
ービス品質を低下させることなく、各モジュールの故障
管理を行なうことができ、特に分散モジュールをバック
アップ対応に冗長構成した大規模インテリジェントネッ
トワークの信頼性と性能を向上させることが可能であ
る。
According to the present invention, failure management of each module can be performed without deteriorating the service quality of the distributed processing system. In particular, the reliability of a large-scale intelligent network in which distributed modules are redundantly configured for backup can be improved. It is possible to improve performance and performance.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の分散処理システムのモジュール運転状
態制御方法の本発明に係る処理の第1の実施例を示す通
信シーケンス図である。
FIG. 1 is a communication sequence diagram showing a first embodiment of a process according to the present invention of a method for controlling a module operating state of a distributed processing system according to the present invention.

【図2】本発明の分散処理システムのモジュール運転状
態制御方法の本発明に係る処理の第2の実施例を示す通
信シーケンス図である。
FIG. 2 is a communication sequence diagram showing a second embodiment of the process according to the present invention of the module operating state control method of the distributed processing system of the present invention.

【図3】本発明に係るモジュール運転状態制御を行なう
分散処理システムの構成例を示すブロック図である。
FIG. 3 is a block diagram illustrating a configuration example of a distributed processing system that performs module operation state control according to the present invention.

【図4】図3におけるサービス制御ノードの本発明に係
る詳細構成例を示すブロック図である。
FIG. 4 is a block diagram showing a detailed configuration example according to the present invention of the service control node in FIG. 3;

【図5】図3におけるサービス制御ノードの各分散モジ
ュールで管理する他モジュールの状態遷移モデルを示す
説明図である。
FIG. 5 is an explanatory diagram showing a state transition model of another module managed by each distributed module of the service control node in FIG. 3;

【図6】図3におけるサービス制御ノードのペアモジュ
ール以外の分散モジュールで管理する機能分散モジュー
ルの状態遷移モデルを示す説明図である。
FIG. 6 is an explanatory diagram showing a state transition model of a function distribution module managed by a distribution module other than the pair module of the service control node in FIG. 3;

【図7】図3におけるサービス制御ノードの機能分散モ
ジュールが管理するペアモジュールの状態遷移モデルを
示す説明図である。
FIG. 7 is an explanatory diagram showing a state transition model of a pair module managed by the function distribution module of the service control node in FIG. 3;

【符号の説明】[Explanation of symbols]

100:サービス制御ノード、201:負荷分散モジュ
ールA、202:負荷分散モジュールB、203:機能
分散モジュールC、300:伝達ノード、400:他モ
ジュール状態管理機構、401:機能分散モジュール他
モジュール状態管理機構、402:バックアップ機構、
403:モジュール間通信機構、501:運転中状態、
502:一時故障中状態、503:故障中状態、50
4:一時故障中・バックアップ運転中、601:通信応
答時間、602:監視時間、701〜707:遷移検出
ポイント。
100: Service control node, 201: Load distribution module A, 202: Load distribution module B, 203: Function distribution module C, 300: Transmission node, 400: Other module state management mechanism, 401: Function distribution module other module state management mechanism , 402: backup mechanism,
403: inter-module communication mechanism, 501: operating state,
502: Temporary failure state, 503: Failure state, 50
4: Temporary failure / backup operation, 601: Communication response time, 602: Monitoring time, 701 to 707: Transition detection point.

フロントページの続き (56)参考文献 特開 昭55−8134(JP,A) 特開 平2−277336(JP,A) 特開 平6−187270(JP,A) 特開 昭56−122595(JP,A) 特開 昭55−97647(JP,A) 特開 昭55−37643(JP,A) 特開 昭54−115008(JP,A) 特開 昭63−102434(JP,A) 特開 昭60−89255(JP,A) 実開 昭62−71755(JP,U) (58)調査した分野(Int.Cl.7,DB名) H04M 3/22 Continuation of the front page (56) References JP-A-55-8134 (JP, A) JP-A-2-277336 (JP, A) JP-A-6-187270 (JP, A) JP-A-56-122595 (JP) JP-A-55-97647 (JP, A) JP-A-55-37643 (JP, A) JP-A-54-115008 (JP, A) JP-A-63-102434 (JP, A) 60-89255 (JP, A) Japanese Utility Model Showa 62-71755 (JP, U) (58) Field surveyed (Int. Cl. 7 , DB name) H04M 3/22

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 分散処理システムを構成する各々のモジ
ュールで、他モジュールの運転可否状態の監視を行なう
分散処理システムのモジュール運転状態制御方法であっ
て、アクセス先の第1のモジュールによる自モジュール
からの処理要求に対する応答時間を計測し、該計測中の
時間が、アクセス信号毎に予め定められた時間(T0)
を越えるか否かを監視し、上記計測中の時間が上記時間
(T0)を越えた場合、上記第1のモジュールを運転不
可能な故障中状態として設定登録するか、もしくは上記
第1のモジュールを故障中状態として設定登録した後、
予め別に設定められた時間(T1)の経過後、上記第1
のモジュールの故障中状態の設定を解除する方法におい
て、上記第1のモジュールを故障中状態として設定登録
している間、上記第1のモジュールに対するリトライ処
理を含み、以降のアクセスを、代替可能な第2のモジュ
ールを選択して行ない、かつ上記第1のモジュールが、
予め規定された他のモジュール相互間でバックアップ関
係を有する機能分散モジュールであれば、該機能分散モ
ジュールとバックアップ関係を有する機能分散モジュー
ルを、上記第2のモジュールとして選択し、また上記第
2モジュールは、リトライ処理に対応する上記第1のモ
ジュールへのアクセスで、上記時間(T0)に基づく上
記第1のモジュールの故障中状態の設定登録を行なった
場合、バックアップを起動すると共に、上記第1のモジ
ュールが故障中であることを、接続先の全てのモジュー
ルに通知し、該通知を受けた各モジュールは、上記第1
のモジュールに対して上記故障中状態の設定登録を行な
い、さらに上記第2のモジュールは、上記予め別に設定
められた時間(T1)後、上記第1のモジュールの運転
可否状態を判別し、該第1のモジュールが運転可能な状
態であれば、該第1のモジュールに対する故障中状態の
設定登録を解除すると共に、上記全てのモジュールに、
上記第1のモジュールに対する故障中状態の設定登録を
解除するよう通知することを特徴とする分散処理システ
ムのモジュール運転状態制御方法。
1. A module operation state control method for a distributed processing system, in which each module constituting the distributed processing system monitors the operation availability of another module, comprising: The response time to the processing request is measured, and the time during the measurement is a predetermined time (T0) for each access signal.
Monitors whether or not exceeding, the case where the time during the measurement exceeds the time (T0), to set registers the first module as a state in impossible operation failure Luke, or the
After setting and registering the first module as a failure state,
After the elapse of a time (T1) set separately in advance, the first
How to cancel the setting of the module's fault status
The first module as a faulty state
While retrying the first module,
A second module that includes
And the first module comprises:
Backup functions between other predefined modules
If the function distribution module has a function
Function distribution module with backup relationship with module
Selected as the second module, and
The two modules correspond to the first module corresponding to the retry processing.
Access to Joule, based on the above time (T0)
Registered the setting of the failure status of the first module
In this case, start the backup and
That all modules to which the
Module that has received the notification,
Register the setting of the above-mentioned fault status for the module of
And the second module is separately set in advance.
After the set time (T1), the operation of the first module is performed.
Determining whether the first module is operable;
State, a faulty state for the first module
In addition to canceling the setting registration, all the above modules
Register the setting of the faulty state for the first module.
A method for controlling a module operation state of a distributed processing system, wherein a notification is given to cancel the operation.
JP31633095A 1995-12-05 1995-12-05 Module operating state control method for distributed processing system Expired - Fee Related JP3232393B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP31633095A JP3232393B2 (en) 1995-12-05 1995-12-05 Module operating state control method for distributed processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP31633095A JP3232393B2 (en) 1995-12-05 1995-12-05 Module operating state control method for distributed processing system

Publications (2)

Publication Number Publication Date
JPH09162976A JPH09162976A (en) 1997-06-20
JP3232393B2 true JP3232393B2 (en) 2001-11-26

Family

ID=18075933

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31633095A Expired - Fee Related JP3232393B2 (en) 1995-12-05 1995-12-05 Module operating state control method for distributed processing system

Country Status (1)

Country Link
JP (1) JP3232393B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7979862B2 (en) 2004-12-21 2011-07-12 Hewlett-Packard Development Company, L.P. System and method for replacing an inoperable master workload management process

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1894936B (en) * 2003-11-21 2010-12-22 尼姆凯特网络公司 Back up of network devices
JP4812133B2 (en) * 2008-05-14 2011-11-09 エヌイーシーコンピュータテクノ株式会社 Health check device for communication devices
JP5737055B2 (en) * 2011-08-18 2015-06-17 三菱電機株式会社 Program monitoring system

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7979862B2 (en) 2004-12-21 2011-07-12 Hewlett-Packard Development Company, L.P. System and method for replacing an inoperable master workload management process

Also Published As

Publication number Publication date
JPH09162976A (en) 1997-06-20

Similar Documents

Publication Publication Date Title
KR100575497B1 (en) Fault tolerant computer system
JP3620527B2 (en) Failure analysis method for loop interface and system having failure analysis function
EP0343630A2 (en) Terminal apparatus for resetting by remote control
JPH0576654B2 (en)
US20080288812A1 (en) Cluster system and an error recovery method thereof
JP2636179B2 (en) Common control redundant system switching method
US20080301489A1 (en) Multi-agent hot-standby system and failover method for the same
JP3232393B2 (en) Module operating state control method for distributed processing system
JP3587250B2 (en) Communication apparatus for performing automatic failure recovery and automatic failure recovery method
JP3447347B2 (en) Failure detection method
JP3025732B2 (en) Control method of multiplex computer system
JP4706106B2 (en) Territory optimization method in monitoring system
JPH07262042A (en) Detecting method for fault of processor
CN100490343C (en) A method and device for realizing switching between main and backup units in communication equipment
JP2833969B2 (en) User fault monitoring control method
JP3547308B2 (en) Subscriber line switching method
KR0132955B1 (en) Method of mutual back-up duplicaion in local management
JP3100464B2 (en) Packet switch
US20040083279A1 (en) Method for backup wireless area network
JPS58182359A (en) Self-control system switching system of electronic exchange
JPH06301658A (en) Recovery system in loose coupling electronic computer system
JPS63285053A (en) Fault processing system for network management equipment
KR100391810B1 (en) Method for controlling of alarm in billing mediation system
JPH02216931A (en) Fault information reporting system
JPH07297825A (en) Data switching system and data switching network

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070921

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080921

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees