JPH029368B2 - - Google Patents

Info

Publication number
JPH029368B2
JPH029368B2 JP60104887A JP10488785A JPH029368B2 JP H029368 B2 JPH029368 B2 JP H029368B2 JP 60104887 A JP60104887 A JP 60104887A JP 10488785 A JP10488785 A JP 10488785A JP H029368 B2 JPH029368 B2 JP H029368B2
Authority
JP
Japan
Prior art keywords
data processing
maintenance
maintenance operation
devices
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60104887A
Other languages
Japanese (ja)
Other versions
JPS61262854A (en
Inventor
Hiroshi Sunaga
Katsuji Noguchi
Masaya Ookubo
Zenichi Yashiro
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP60104887A priority Critical patent/JPS61262854A/en
Publication of JPS61262854A publication Critical patent/JPS61262854A/en
Publication of JPH029368B2 publication Critical patent/JPH029368B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、再開処理方式に関し、特にシステム
の信頼度を低下させることなく、予備系装置の台
数を減少させることができる分散形データ処理シ
ステムの再開処理方式に関するものである。
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a restart processing method, and in particular to a distributed data processing system that can reduce the number of standby devices without reducing system reliability. The present invention relates to a restart processing method.

〔発明の概要〕[Summary of the invention]

本発明は、複数の小中型コンピユータと、それ
らの代替となる予備系装置と、システムの保守運
転を行い、コンピユータが障害のとき予備系装置
に切替える保守運転装置からなる分散形のデータ
処理システムにおいて、1台の予備系装置をコン
ピユータの代替のみならず、保守運転装置の代替
にもなり得るように改造し、かつ予備系装置の使
用の際に保守運転装置に優先度を持たせることに
より、保守運転装置の信頼度を低下させることな
く、予備系装置の使用台数を減小させることがで
きるようにしたものである。
The present invention is directed to a distributed data processing system consisting of a plurality of small and medium-sized computers, a standby device that replaces them, and a maintenance operation device that performs system maintenance and switches to the standby device when a computer fails. By modifying one backup system device so that it can be used not only as a replacement for a computer but also as a replacement for maintenance and operation equipment, and by giving priority to the maintenance and operation equipment when using the backup system, This makes it possible to reduce the number of backup systems used without reducing the reliability of the maintenance and operation equipment.

〔従来の技術〕[Conventional technology]

コンピユータによる情報処理は、従来のホスト
集中型から、ローカル処理の比重を高めた分散処
理型へと転換の傾向にある。分散処理のデータ処
理装置としては、ホスト・コンピユータ、通信プ
ロセツサ、リモートジヨブ・エントリ端末等の機
能を総合した小中規模のコンピユータである。デ
ータ処理装置が多数設けられる場合には、保守運
転処理機能を持つ装置が設置される。
Information processing by computers is shifting from the conventional host-intensive type to a distributed processing type with an increased emphasis on local processing. A data processing device for distributed processing is a small to medium-sized computer that integrates functions such as a host computer, a communication processor, and a remote job entry terminal. When a large number of data processing devices are provided, a device having a maintenance operation processing function is installed.

複数のデータ処理装置とシステム全体の保守運
転機能を持つ複数の保守運転装置が、共通バスを
介して接続されるように分散形データ処理システ
ムとしては、第2図に示すような構成のものが知
られている。
A distributed data processing system with the configuration shown in Figure 2 is one in which multiple data processing devices and multiple maintenance and operation devices that have maintenance and operation functions for the entire system are connected via a common bus. Are known.

第2図において、1は保守運転装置、20は保
守運転装置の予備系装置、31〜3Nはデータ処
理装置、30はデータ処理装置の予備系装置、4
はこれらの各装置を共通に接続するためのバス、
50は保守運転装置1が障害となり、システムの
保守運転機能が停止した場合に、保守運転装置の
予備系装置20を保守運転装置1に替つて再開さ
せる動作を行う緊急制御回路である。このよう
に、第2図では、保守運転装置1の台数が1台の
場合である。このようなシステムにおいて、保守
運転装置1の障害後の再開処理の動作を説明す
る。
In FIG. 2, 1 is a maintenance operation device, 20 is a backup system of the maintenance and operation device, 31 to 3N are data processing devices, 30 is a backup system of the data processing device, 4
is a bus for commonly connecting each of these devices,
Reference numeral 50 denotes an emergency control circuit that operates to restart the backup system device 20 of the maintenance operation device in place of the maintenance operation device 1 when the maintenance operation device 1 becomes a failure and the maintenance operation function of the system stops. In this way, FIG. 2 shows a case where the number of maintenance and operation devices 1 is one. In such a system, the operation of restart processing after a failure of the maintenance operation device 1 will be explained.

保守運転装置1が障害となつた場合には、緊急
制御回路20の動作により保守運転装置の予備系
装置20に切替えることによつて運転を再開す
る。また、データ処理装置31〜3Nのうちいず
れか1台が障害のときには、保守運転装置1の動
作により予備系装置30に切替えることによつ
て、それぞれの装置の運転を再開する。このよう
に、保守運転装置1またはデータ処理装置31〜
3Nのいずれか1台が障害の場合には、システム
全体をダウンさせることなく、再開処理すること
ができる。しかし、保守運転装置1と保守運転装
置の予備系装置20との2重障害の場合には、シ
ステム全体が不稼動となる。また、第2図のシス
テムは、保守運転装置1とデータ処理装置31〜
3Nごとに専用の予備系装置を備えているため、
それぞれの装置の信頼度は高くすることができる
が、経済性に劣るという問題がある。
When the maintenance operation device 1 becomes in trouble, operation is restarted by switching to the backup system device 20 of the maintenance operation device by operation of the emergency control circuit 20. Further, when any one of the data processing devices 31 to 3N has a failure, the maintenance operation device 1 operates to switch to the standby device 30, thereby restarting the operation of each device. In this way, the maintenance operation device 1 or the data processing device 31 to
In the event that any one of the 3N units has a failure, restart processing can be performed without bringing down the entire system. However, in the case of double failure in the maintenance operation device 1 and the backup system device 20 of the maintenance operation device, the entire system becomes inoperable. The system shown in FIG. 2 also includes a maintenance operation device 1 and data processing devices 31 to 31.
Since each 3N is equipped with a dedicated standby system,
Although the reliability of each device can be increased, there is a problem in that it is less economical.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

このように、従来の分散形データ処理システム
では、保守運転装置とデータ処理装置の両方にそ
れぞれ予備装置を備えているため、予備系装置の
台数が多くなり、その分だけコストアツプを招く
ことになる。
In this way, in conventional distributed data processing systems, both the maintenance operation equipment and the data processing equipment are equipped with their own standby equipment, which increases the number of standby equipment, leading to an increase in costs. .

本発明の目的は、このような従来の問題を改善
し、複数のデータ処理装置と保守運転装置を有す
る分散形データ処理システムにおいて、システム
の信頼性を低下させることなく、予備系装置の台
数を低減することが可能な再開処理方式を提供す
ることにある。
The purpose of the present invention is to improve such conventional problems, and to reduce the number of standby devices in a distributed data processing system having a plurality of data processing devices and maintenance/operation devices without reducing system reliability. The object of the present invention is to provide a restart processing method that can reduce the number of problems.

〔問題点を解決するための手段〕[Means for solving problems]

上記目的を達成するため、本発明の再開処理方
式は、複数のデータ処理装置と該データ処理装置
の保守運転処理を行う1台以上の保守運転装置が
共通バスに接続された分散形データ処理システム
において、上記保守運転装置およびデータ処理装
置の両方の代替となり得る予備系装置と、上記保
守運転装置の障害を監視し、障害になつたときに
は上記予備系装置を切替え起動させる緊急制御手
段とを設け、データ処理装置が障害となり、上記
予備系装置を用いて再開している間に、上記保守
運転装置の障害を検出した場合には、上記緊急制
御手段により、障害となつた保守運転装置の代替
として上記予備系装置を強制的に切替えて、シス
テムの運転を再開させることに特徴がある。
In order to achieve the above object, the restart processing method of the present invention provides a distributed data processing system in which a plurality of data processing devices and one or more maintenance and operation devices that perform maintenance and operation processing of the data processing devices are connected to a common bus. A standby system device that can substitute for both the maintenance operation device and the data processing device, and an emergency control means that monitors failures in the maintenance operation device and switches and starts the standby system when a failure occurs. If the data processing device has a failure and a failure of the maintenance operation device is detected while restarting using the backup system device, the emergency control means replaces the failed maintenance operation device. The feature is that the above-mentioned standby system device is forcibly switched to resume operation of the system.

〔作用〕[Effect]

本発明においては、保守運転装置の予備系装置
とデータ処理装置の予備系装置を共用することに
より、予備系装置の台数を削減し、かつ予備系装
置の使用順序に関しては、保守運転装置に優先使
用権を与えることにより、保守運転装置の信頼度
の低下を防止する。
In the present invention, by sharing the backup system device of the maintenance operation equipment and the backup system device of the data processing device, the number of backup system devices is reduced, and the use order of the backup system equipment is given priority over the maintenance operation equipment. By granting usage rights, the reliability of maintenance and operation equipment is prevented from decreasing.

〔実施例〕〔Example〕

以下、本発明の実施例を、第1図により詳細に
説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to FIG.

第1図aはデータ処理装置の1台が障害とな
り、予備系装置に切替えて再開する場合を示す図
であり、第1図bは障害となつたデータ処理装置
の代りに予備系装置を使用している状態で(つま
り第1図aの状態で)、保守運転装置が障害とな
つた場合を示す図である。
Figure 1a is a diagram showing a case where one of the data processing devices becomes a failure and restarts by switching to a backup system, and Figure 1b shows a case where the backup system is used in place of the failed data processing device. 1 is a diagram illustrating a case where the maintenance operation device becomes a failure while the maintenance operation device is in the state shown in FIG. 1(a).

第1図においても、保守運転装置1の台数が1
台の場合を説明するが、2台以上の場合でも動作
は同じである。
Also in Figure 1, the number of maintenance operation devices 1 is 1.
Although the case of one machine will be explained, the operation is the same even if there are two or more machines.

1は保守運転装置、21は保守運転装置および
データ処理装置の両方に対して、いずれの代替に
もなり得る予備系装置、31〜3Nは複数台のデ
ータ処理装置、4は各装置間で情報を転送するた
めのバス、51は緊急制御回路である。
1 is a maintenance operation device, 21 is a standby device that can be used as a substitute for both the maintenance operation device and the data processing device, 31 to 3N are multiple data processing devices, and 4 is information exchange between each device. 51 is an emergency control circuit.

本発明の緊急制御回路51は、保守運転装置1
が障害となり、システムの保守運転機能が停止し
た際に、予備系装置21がすでにデータ処理装置
の代替として使用されていても、当該予備系装置
21の強制的に保守運転装置として再開させるも
のである。
The emergency control circuit 51 of the present invention includes the maintenance operation device 1
When the maintenance operation function of the system is stopped due to a failure, even if the backup system device 21 is already being used as a substitute for the data processing device, the backup system device 21 is forcibly restarted as the maintenance operation device. be.

本実施例では、先ずデータ処理装置32が障害
となつて、予備系装置21をデータ処理装置32
の代替として再開している時に、保守運転装置1
が障害となつた場合の再開処理について、動作を
説明する。
In this embodiment, first, the data processing device 32 becomes a failure, and the backup system device 21 is transferred to the data processing device 32.
maintenance operation equipment 1 when restarting as a substitute for
The following describes the operation of the restart process when a problem occurs.

(イ) 先ず、第1図aにおいて、システムが正常運
転中に、データ処理装置32が障害となつた場
合、保守運転装置1の動作により、予備系装置
21をデータ処理装置32の代替として再開す
る。ただし、予備系装置21がすでに他に使用
されている場合には、切替えない。
(b) First, in FIG. 1a, if the data processing device 32 becomes malfunctioning while the system is operating normally, the maintenance operation device 1 operates to restart the backup system device 21 as a substitute for the data processing device 32. do. However, if the standby system device 21 is already being used by another device, it will not be switched.

(ロ) 次に、第1図bにおいて、第1図aの状態で
運転中に、今度は保守運転装置1が障害となつ
た場合、緊急制御回路51により、データ処理
装置32の代替として運転を行つている予備系
装置21を強制的に切断し、予備系装置21を
強制的に保守運転装置1の代替として再開させ
る。この時、データ処理装置32は系から切り
離され、その機能は停止するが、保守運転装置
は予備系装置21によつて運転を継続できるの
で、システム全体の運転停止を防止することが
できる。
(b) Next, in FIG. 1 b, if the maintenance operation device 1 becomes in trouble during operation in the state shown in FIG. The standby system device 21 that is performing this is forcibly disconnected, and the standby system device 21 is forcibly restarted as a substitute for the maintenance operation device 1. At this time, the data processing device 32 is disconnected from the system and its functions are stopped, but the maintenance operation device can continue operating with the backup system device 21, thereby preventing the entire system from stopping.

(ハ) 第1図のシステムは、保守運転装置1に予備
系装置21を優先的に使用する権利を与えてい
るので、システム不稼働率、すなわち保守運転
装置の不稼働率は、第2図に示すように、保守
運転装置1に専用の予備系装置を持たせた場合
と同じになる。詳しく述べると、保守運転装置
1および予備系装置21の障害発生間隔が平均
1/λ1、データ処理装置の障害発生間隔が平均
1/λ2であり、かつ修理時間が平均1/μの指
数分布に従うものとし、λ1/μ、λ2/μ≪1と
した場合には、本実施例によるシステム不稼働
率、および第2図に示す従来のシステム不稼働
率は、いずれもデータ処理装置の台数、障害発
生間隔に関係なく、(λ1/μ)2となる。
(c) Since the system shown in Figure 1 gives the maintenance operation equipment 1 the right to preferentially use the standby equipment 21, the system unavailability rate, that is, the unavailability rate of the maintenance operation equipment, is as shown in Figure 2. As shown in FIG. 2, this is the same as when the maintenance operation device 1 is provided with a dedicated standby device. Specifically, the failure occurrence interval of the maintenance operation device 1 and the backup system device 21 is an average of 1/λ 1 , the failure occurrence interval of the data processing device is an average of 1/λ 2 , and the repair time is an index of an average of 1/μ. distribution, and when λ 1 /μ and λ 2 /μ≪1, the system unavailability rate according to this embodiment and the conventional system unavailability rate shown in FIG. (λ 1 /μ) 2 regardless of the number of units or the interval between failure occurrences.

本発明においては、ハードウエア的に、予備系
装置をデータ処理装置の代替および保守運転装置
の代替として使用可能なように改造するととも
に、緊急制御回路の起動論理を変更する。すなわ
ち、第2図の緊急制御回路50においては、保守
運転装置1が障害状態になつたことを検出するの
みで、直ちに予備系装置20にトリガー信号を送
出してこれを起動させればよいのに対し、第1図
の緊急制御回路51においては、保守運転装置1
の障害状態と予備系装置21の空き状態の論理積
でトリガーを送出して、予備系装置21を起動
し、また保守運転装置1の障害状態と予備系装置
21の起動状態の論理積では切替えのためのトリ
ガーを送出して、予備系装置21を一旦中断させ
た後、保守運転装置1の代替として起動させる。
In the present invention, in terms of hardware, the standby system equipment is modified so that it can be used as a replacement for the data processing equipment and maintenance operation equipment, and the startup logic of the emergency control circuit is changed. That is, in the emergency control circuit 50 of FIG. 2, it is sufficient to simply detect that the maintenance operation device 1 has entered a failure state and immediately send a trigger signal to the backup system device 20 to start it. On the other hand, in the emergency control circuit 51 of FIG.
A trigger is sent based on the logical product of the failure state of the maintenance operation device 1 and the idle state of the backup system device 21 to start the backup system device 21, and a switch is made based on the logical product of the failure state of the maintenance operation device 1 and the activation state of the backup system device 21. After the backup system device 21 is temporarily suspended by sending out a trigger for the maintenance operation device 1, the backup system device 21 is activated as a substitute for the maintenance operation device 1.

なお、システム全体の保守運転機能を有する保
守運転装置が1台のみならず、複数台接続されて
いる分散形処理システムにおいても、保守運転装
置とデータ処理装置の両方の代替となり得る予備
系装置を設けるとともに、複数の保守運転装置を
監視する機能と障害の保守運転装置を上記予備系
装置へ優先的に切替える機能を有する緊急制御回
路を設けることにより、第1図の実施例と全く同
じ効果が得られる。
In addition, in a distributed processing system where there is not only one maintenance operation device that has the maintenance operation function for the entire system, but also multiple maintenance operation devices connected, it is necessary to have a standby device that can replace both the maintenance operation device and the data processing device. By providing an emergency control circuit having a function of monitoring a plurality of maintenance and operation devices and a function of preferentially switching a malfunctioning maintenance and operation device to the above-mentioned backup system, exactly the same effect as the embodiment shown in FIG. 1 can be obtained. can get.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、複数の
データ処理装置と、システム全体の保守運転機能
を持つ1台以上の保守運転装置と、それらのいず
れの装置にも代替となり得る予備系装置とを有す
る分散形データ処理システムにおいて、予備系装
置の使用について、保守運転装置に優先度を持た
せることにより、従来の方式に比べて、保守運転
装置の信頼度を低下させずに、予備系装置の台数
を減少させることができ、コストダウンを計るこ
とが可能である。
As explained above, according to the present invention, there are a plurality of data processing devices, one or more maintenance operation devices that have a maintenance operation function for the entire system, and a standby device that can be substituted for any of these devices. In a distributed data processing system with It is possible to reduce the number of units and reduce costs.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す分散形データ
処理システムの構成図、第2図は従来の分散形デ
ータ処理システムの構成図である。 1:保守運転装置、20:保守運転装置の予備
系装置、30:データ処理装置の予備系装置、2
1:保守運転装置およびデータ処理装置の両方に
対して代替となり得る予備系装置、31〜3N:
データ処理装置、4:情潤の転送を行う共通バ
ス、50,51:緊急制御回路。
FIG. 1 is a block diagram of a distributed data processing system showing an embodiment of the present invention, and FIG. 2 is a block diagram of a conventional distributed data processing system. 1: Maintenance operation device, 20: Backup system device of maintenance operation device, 30: Backup system device of data processing device, 2
1: Backup system equipment that can be substituted for both maintenance operation equipment and data processing equipment, 31 to 3N:
Data processing device, 4: Common bus for transferring information, 50, 51: Emergency control circuit.

Claims (1)

【特許請求の範囲】[Claims] 1 複数のデータ処理装置と該データ処理装置の
保守運転処理を行う1台以上の保守運転装置が共
通バスに接続された分散形データ処理システムに
おいて、上記保守運転装置およびデータ処理装置
の両方の代替となり得る予備系装置と、上記保守
運転装置の障害を監視し、障害になつたときには
上記予備系装置を切替え起動させる緊急制御手段
とを設け、データ処理装置が障害となり、上記予
備系装置を用いて再開している間に、上記保守運
転装置の障害を検出した場合には、上記緊急制御
手段により、障害となつた保守運転装置の代替と
して上記予備系装置を強制的に切替えて、システ
ムの運転を再開させることを特徴とする再開処理
方式。
1. In a distributed data processing system in which a plurality of data processing devices and one or more maintenance and operation devices that perform maintenance and operation processing for the data processing devices are connected to a common bus, a substitute for both the maintenance and operation devices and the data processing device A backup system device that can become a failure, and an emergency control means that monitors failures in the maintenance operation device and switches and activates the backup system device when a failure occurs, so that if the data processing device becomes a failure, the backup system device can be used. If a failure is detected in the maintenance operation equipment while restarting the system, the emergency control means will forcefully switch over the backup equipment as a substitute for the failed maintenance operation equipment, and the system will be restarted. A restart processing method characterized by restarting operation.
JP60104887A 1985-05-16 1985-05-16 Resumptive processing system Granted JPS61262854A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60104887A JPS61262854A (en) 1985-05-16 1985-05-16 Resumptive processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60104887A JPS61262854A (en) 1985-05-16 1985-05-16 Resumptive processing system

Publications (2)

Publication Number Publication Date
JPS61262854A JPS61262854A (en) 1986-11-20
JPH029368B2 true JPH029368B2 (en) 1990-03-01

Family

ID=14392685

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60104887A Granted JPS61262854A (en) 1985-05-16 1985-05-16 Resumptive processing system

Country Status (1)

Country Link
JP (1) JPS61262854A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2503663B2 (en) * 1989-07-07 1996-06-05 日本電気株式会社 Hot standby system

Also Published As

Publication number Publication date
JPS61262854A (en) 1986-11-20

Similar Documents

Publication Publication Date Title
US5155729A (en) Fault recovery in systems utilizing redundant processor arrangements
US20080307254A1 (en) Information-processing equipment and system therefor
JP3537281B2 (en) Shared disk type multiplex system
JPS59106056A (en) Failsafe type data processing system
JP3806600B2 (en) System switching method for multi-system
CN110740066B (en) Seat-invariant cross-machine fault migration method and system
JP2002136000A (en) Uninterruptible power supply system
JPH029368B2 (en)
JPH0683657A (en) Service processor switching system
JPH10116261A (en) Check point restarting method for parallel computer system
JPH05314075A (en) On-line computer system
JPH04268643A (en) Information processing system
JPH07141308A (en) Back-up method in information processing system
CN110752955A (en) Seat invariant fault migration system and method
JPH06195318A (en) Distributed processing system
JP3363579B2 (en) Monitoring device and monitoring system
JPH04239831A (en) Inter processor backup system
KR100228306B1 (en) Hot-standby multiplexer and implementation method
JPS60222945A (en) Backup system for abnormality or the like
JPS6139138A (en) Multiplexing system
JP2606144B2 (en) Redundant device
JP2611549B2 (en) Elevator group control device
JPH10187473A (en) Duplex information processor
JPS61194939A (en) Communication controller
JPS61100037A (en) Communication line controller

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees