JPH029368B2 - - Google Patents
Info
- Publication number
- JPH029368B2 JPH029368B2 JP60104887A JP10488785A JPH029368B2 JP H029368 B2 JPH029368 B2 JP H029368B2 JP 60104887 A JP60104887 A JP 60104887A JP 10488785 A JP10488785 A JP 10488785A JP H029368 B2 JPH029368 B2 JP H029368B2
- Authority
- JP
- Japan
- Prior art keywords
- data processing
- maintenance
- maintenance operation
- devices
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000012423 maintenance Methods 0.000 claims description 74
- 238000012545 processing Methods 0.000 claims description 55
- 238000003672 processing method Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、再開処理方式に関し、特にシステム
の信頼度を低下させることなく、予備系装置の台
数を減少させることができる分散形データ処理シ
ステムの再開処理方式に関するものである。[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to a restart processing method, and in particular to a distributed data processing system that can reduce the number of standby devices without reducing system reliability. The present invention relates to a restart processing method.
本発明は、複数の小中型コンピユータと、それ
らの代替となる予備系装置と、システムの保守運
転を行い、コンピユータが障害のとき予備系装置
に切替える保守運転装置からなる分散形のデータ
処理システムにおいて、1台の予備系装置をコン
ピユータの代替のみならず、保守運転装置の代替
にもなり得るように改造し、かつ予備系装置の使
用の際に保守運転装置に優先度を持たせることに
より、保守運転装置の信頼度を低下させることな
く、予備系装置の使用台数を減小させることがで
きるようにしたものである。
The present invention is directed to a distributed data processing system consisting of a plurality of small and medium-sized computers, a standby device that replaces them, and a maintenance operation device that performs system maintenance and switches to the standby device when a computer fails. By modifying one backup system device so that it can be used not only as a replacement for a computer but also as a replacement for maintenance and operation equipment, and by giving priority to the maintenance and operation equipment when using the backup system, This makes it possible to reduce the number of backup systems used without reducing the reliability of the maintenance and operation equipment.
コンピユータによる情報処理は、従来のホスト
集中型から、ローカル処理の比重を高めた分散処
理型へと転換の傾向にある。分散処理のデータ処
理装置としては、ホスト・コンピユータ、通信プ
ロセツサ、リモートジヨブ・エントリ端末等の機
能を総合した小中規模のコンピユータである。デ
ータ処理装置が多数設けられる場合には、保守運
転処理機能を持つ装置が設置される。
Information processing by computers is shifting from the conventional host-intensive type to a distributed processing type with an increased emphasis on local processing. A data processing device for distributed processing is a small to medium-sized computer that integrates functions such as a host computer, a communication processor, and a remote job entry terminal. When a large number of data processing devices are provided, a device having a maintenance operation processing function is installed.
複数のデータ処理装置とシステム全体の保守運
転機能を持つ複数の保守運転装置が、共通バスを
介して接続されるように分散形データ処理システ
ムとしては、第2図に示すような構成のものが知
られている。 A distributed data processing system with the configuration shown in Figure 2 is one in which multiple data processing devices and multiple maintenance and operation devices that have maintenance and operation functions for the entire system are connected via a common bus. Are known.
第2図において、1は保守運転装置、20は保
守運転装置の予備系装置、31〜3Nはデータ処
理装置、30はデータ処理装置の予備系装置、4
はこれらの各装置を共通に接続するためのバス、
50は保守運転装置1が障害となり、システムの
保守運転機能が停止した場合に、保守運転装置の
予備系装置20を保守運転装置1に替つて再開さ
せる動作を行う緊急制御回路である。このよう
に、第2図では、保守運転装置1の台数が1台の
場合である。このようなシステムにおいて、保守
運転装置1の障害後の再開処理の動作を説明す
る。 In FIG. 2, 1 is a maintenance operation device, 20 is a backup system of the maintenance and operation device, 31 to 3N are data processing devices, 30 is a backup system of the data processing device, 4
is a bus for commonly connecting each of these devices,
Reference numeral 50 denotes an emergency control circuit that operates to restart the backup system device 20 of the maintenance operation device in place of the maintenance operation device 1 when the maintenance operation device 1 becomes a failure and the maintenance operation function of the system stops. In this way, FIG. 2 shows a case where the number of maintenance and operation devices 1 is one. In such a system, the operation of restart processing after a failure of the maintenance operation device 1 will be explained.
保守運転装置1が障害となつた場合には、緊急
制御回路20の動作により保守運転装置の予備系
装置20に切替えることによつて運転を再開す
る。また、データ処理装置31〜3Nのうちいず
れか1台が障害のときには、保守運転装置1の動
作により予備系装置30に切替えることによつ
て、それぞれの装置の運転を再開する。このよう
に、保守運転装置1またはデータ処理装置31〜
3Nのいずれか1台が障害の場合には、システム
全体をダウンさせることなく、再開処理すること
ができる。しかし、保守運転装置1と保守運転装
置の予備系装置20との2重障害の場合には、シ
ステム全体が不稼動となる。また、第2図のシス
テムは、保守運転装置1とデータ処理装置31〜
3Nごとに専用の予備系装置を備えているため、
それぞれの装置の信頼度は高くすることができる
が、経済性に劣るという問題がある。 When the maintenance operation device 1 becomes in trouble, operation is restarted by switching to the backup system device 20 of the maintenance operation device by operation of the emergency control circuit 20. Further, when any one of the data processing devices 31 to 3N has a failure, the maintenance operation device 1 operates to switch to the standby device 30, thereby restarting the operation of each device. In this way, the maintenance operation device 1 or the data processing device 31 to
In the event that any one of the 3N units has a failure, restart processing can be performed without bringing down the entire system. However, in the case of double failure in the maintenance operation device 1 and the backup system device 20 of the maintenance operation device, the entire system becomes inoperable. The system shown in FIG. 2 also includes a maintenance operation device 1 and data processing devices 31 to 31.
Since each 3N is equipped with a dedicated standby system,
Although the reliability of each device can be increased, there is a problem in that it is less economical.
このように、従来の分散形データ処理システム
では、保守運転装置とデータ処理装置の両方にそ
れぞれ予備装置を備えているため、予備系装置の
台数が多くなり、その分だけコストアツプを招く
ことになる。
In this way, in conventional distributed data processing systems, both the maintenance operation equipment and the data processing equipment are equipped with their own standby equipment, which increases the number of standby equipment, leading to an increase in costs. .
本発明の目的は、このような従来の問題を改善
し、複数のデータ処理装置と保守運転装置を有す
る分散形データ処理システムにおいて、システム
の信頼性を低下させることなく、予備系装置の台
数を低減することが可能な再開処理方式を提供す
ることにある。 The purpose of the present invention is to improve such conventional problems, and to reduce the number of standby devices in a distributed data processing system having a plurality of data processing devices and maintenance/operation devices without reducing system reliability. The object of the present invention is to provide a restart processing method that can reduce the number of problems.
上記目的を達成するため、本発明の再開処理方
式は、複数のデータ処理装置と該データ処理装置
の保守運転処理を行う1台以上の保守運転装置が
共通バスに接続された分散形データ処理システム
において、上記保守運転装置およびデータ処理装
置の両方の代替となり得る予備系装置と、上記保
守運転装置の障害を監視し、障害になつたときに
は上記予備系装置を切替え起動させる緊急制御手
段とを設け、データ処理装置が障害となり、上記
予備系装置を用いて再開している間に、上記保守
運転装置の障害を検出した場合には、上記緊急制
御手段により、障害となつた保守運転装置の代替
として上記予備系装置を強制的に切替えて、シス
テムの運転を再開させることに特徴がある。
In order to achieve the above object, the restart processing method of the present invention provides a distributed data processing system in which a plurality of data processing devices and one or more maintenance and operation devices that perform maintenance and operation processing of the data processing devices are connected to a common bus. A standby system device that can substitute for both the maintenance operation device and the data processing device, and an emergency control means that monitors failures in the maintenance operation device and switches and starts the standby system when a failure occurs. If the data processing device has a failure and a failure of the maintenance operation device is detected while restarting using the backup system device, the emergency control means replaces the failed maintenance operation device. The feature is that the above-mentioned standby system device is forcibly switched to resume operation of the system.
本発明においては、保守運転装置の予備系装置
とデータ処理装置の予備系装置を共用することに
より、予備系装置の台数を削減し、かつ予備系装
置の使用順序に関しては、保守運転装置に優先使
用権を与えることにより、保守運転装置の信頼度
の低下を防止する。
In the present invention, by sharing the backup system device of the maintenance operation equipment and the backup system device of the data processing device, the number of backup system devices is reduced, and the use order of the backup system equipment is given priority over the maintenance operation equipment. By granting usage rights, the reliability of maintenance and operation equipment is prevented from decreasing.
以下、本発明の実施例を、第1図により詳細に
説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to FIG.
第1図aはデータ処理装置の1台が障害とな
り、予備系装置に切替えて再開する場合を示す図
であり、第1図bは障害となつたデータ処理装置
の代りに予備系装置を使用している状態で(つま
り第1図aの状態で)、保守運転装置が障害とな
つた場合を示す図である。 Figure 1a is a diagram showing a case where one of the data processing devices becomes a failure and restarts by switching to a backup system, and Figure 1b shows a case where the backup system is used in place of the failed data processing device. 1 is a diagram illustrating a case where the maintenance operation device becomes a failure while the maintenance operation device is in the state shown in FIG. 1(a).
第1図においても、保守運転装置1の台数が1
台の場合を説明するが、2台以上の場合でも動作
は同じである。 Also in Figure 1, the number of maintenance operation devices 1 is 1.
Although the case of one machine will be explained, the operation is the same even if there are two or more machines.
1は保守運転装置、21は保守運転装置および
データ処理装置の両方に対して、いずれの代替に
もなり得る予備系装置、31〜3Nは複数台のデ
ータ処理装置、4は各装置間で情報を転送するた
めのバス、51は緊急制御回路である。 1 is a maintenance operation device, 21 is a standby device that can be used as a substitute for both the maintenance operation device and the data processing device, 31 to 3N are multiple data processing devices, and 4 is information exchange between each device. 51 is an emergency control circuit.
本発明の緊急制御回路51は、保守運転装置1
が障害となり、システムの保守運転機能が停止し
た際に、予備系装置21がすでにデータ処理装置
の代替として使用されていても、当該予備系装置
21の強制的に保守運転装置として再開させるも
のである。 The emergency control circuit 51 of the present invention includes the maintenance operation device 1
When the maintenance operation function of the system is stopped due to a failure, even if the backup system device 21 is already being used as a substitute for the data processing device, the backup system device 21 is forcibly restarted as the maintenance operation device. be.
本実施例では、先ずデータ処理装置32が障害
となつて、予備系装置21をデータ処理装置32
の代替として再開している時に、保守運転装置1
が障害となつた場合の再開処理について、動作を
説明する。 In this embodiment, first, the data processing device 32 becomes a failure, and the backup system device 21 is transferred to the data processing device 32.
maintenance operation equipment 1 when restarting as a substitute for
The following describes the operation of the restart process when a problem occurs.
(イ) 先ず、第1図aにおいて、システムが正常運
転中に、データ処理装置32が障害となつた場
合、保守運転装置1の動作により、予備系装置
21をデータ処理装置32の代替として再開す
る。ただし、予備系装置21がすでに他に使用
されている場合には、切替えない。(b) First, in FIG. 1a, if the data processing device 32 becomes malfunctioning while the system is operating normally, the maintenance operation device 1 operates to restart the backup system device 21 as a substitute for the data processing device 32. do. However, if the standby system device 21 is already being used by another device, it will not be switched.
(ロ) 次に、第1図bにおいて、第1図aの状態で
運転中に、今度は保守運転装置1が障害となつ
た場合、緊急制御回路51により、データ処理
装置32の代替として運転を行つている予備系
装置21を強制的に切断し、予備系装置21を
強制的に保守運転装置1の代替として再開させ
る。この時、データ処理装置32は系から切り
離され、その機能は停止するが、保守運転装置
は予備系装置21によつて運転を継続できるの
で、システム全体の運転停止を防止することが
できる。(b) Next, in FIG. 1 b, if the maintenance operation device 1 becomes in trouble during operation in the state shown in FIG. The standby system device 21 that is performing this is forcibly disconnected, and the standby system device 21 is forcibly restarted as a substitute for the maintenance operation device 1. At this time, the data processing device 32 is disconnected from the system and its functions are stopped, but the maintenance operation device can continue operating with the backup system device 21, thereby preventing the entire system from stopping.
(ハ) 第1図のシステムは、保守運転装置1に予備
系装置21を優先的に使用する権利を与えてい
るので、システム不稼働率、すなわち保守運転
装置の不稼働率は、第2図に示すように、保守
運転装置1に専用の予備系装置を持たせた場合
と同じになる。詳しく述べると、保守運転装置
1および予備系装置21の障害発生間隔が平均
1/λ1、データ処理装置の障害発生間隔が平均
1/λ2であり、かつ修理時間が平均1/μの指
数分布に従うものとし、λ1/μ、λ2/μ≪1と
した場合には、本実施例によるシステム不稼働
率、および第2図に示す従来のシステム不稼働
率は、いずれもデータ処理装置の台数、障害発
生間隔に関係なく、(λ1/μ)2となる。(c) Since the system shown in Figure 1 gives the maintenance operation equipment 1 the right to preferentially use the standby equipment 21, the system unavailability rate, that is, the unavailability rate of the maintenance operation equipment, is as shown in Figure 2. As shown in FIG. 2, this is the same as when the maintenance operation device 1 is provided with a dedicated standby device. Specifically, the failure occurrence interval of the maintenance operation device 1 and the backup system device 21 is an average of 1/λ 1 , the failure occurrence interval of the data processing device is an average of 1/λ 2 , and the repair time is an index of an average of 1/μ. distribution, and when λ 1 /μ and λ 2 /μ≪1, the system unavailability rate according to this embodiment and the conventional system unavailability rate shown in FIG. (λ 1 /μ) 2 regardless of the number of units or the interval between failure occurrences.
本発明においては、ハードウエア的に、予備系
装置をデータ処理装置の代替および保守運転装置
の代替として使用可能なように改造するととも
に、緊急制御回路の起動論理を変更する。すなわ
ち、第2図の緊急制御回路50においては、保守
運転装置1が障害状態になつたことを検出するの
みで、直ちに予備系装置20にトリガー信号を送
出してこれを起動させればよいのに対し、第1図
の緊急制御回路51においては、保守運転装置1
の障害状態と予備系装置21の空き状態の論理積
でトリガーを送出して、予備系装置21を起動
し、また保守運転装置1の障害状態と予備系装置
21の起動状態の論理積では切替えのためのトリ
ガーを送出して、予備系装置21を一旦中断させ
た後、保守運転装置1の代替として起動させる。 In the present invention, in terms of hardware, the standby system equipment is modified so that it can be used as a replacement for the data processing equipment and maintenance operation equipment, and the startup logic of the emergency control circuit is changed. That is, in the emergency control circuit 50 of FIG. 2, it is sufficient to simply detect that the maintenance operation device 1 has entered a failure state and immediately send a trigger signal to the backup system device 20 to start it. On the other hand, in the emergency control circuit 51 of FIG.
A trigger is sent based on the logical product of the failure state of the maintenance operation device 1 and the idle state of the backup system device 21 to start the backup system device 21, and a switch is made based on the logical product of the failure state of the maintenance operation device 1 and the activation state of the backup system device 21. After the backup system device 21 is temporarily suspended by sending out a trigger for the maintenance operation device 1, the backup system device 21 is activated as a substitute for the maintenance operation device 1.
なお、システム全体の保守運転機能を有する保
守運転装置が1台のみならず、複数台接続されて
いる分散形処理システムにおいても、保守運転装
置とデータ処理装置の両方の代替となり得る予備
系装置を設けるとともに、複数の保守運転装置を
監視する機能と障害の保守運転装置を上記予備系
装置へ優先的に切替える機能を有する緊急制御回
路を設けることにより、第1図の実施例と全く同
じ効果が得られる。 In addition, in a distributed processing system where there is not only one maintenance operation device that has the maintenance operation function for the entire system, but also multiple maintenance operation devices connected, it is necessary to have a standby device that can replace both the maintenance operation device and the data processing device. By providing an emergency control circuit having a function of monitoring a plurality of maintenance and operation devices and a function of preferentially switching a malfunctioning maintenance and operation device to the above-mentioned backup system, exactly the same effect as the embodiment shown in FIG. 1 can be obtained. can get.
以上説明したように、本発明によれば、複数の
データ処理装置と、システム全体の保守運転機能
を持つ1台以上の保守運転装置と、それらのいず
れの装置にも代替となり得る予備系装置とを有す
る分散形データ処理システムにおいて、予備系装
置の使用について、保守運転装置に優先度を持た
せることにより、従来の方式に比べて、保守運転
装置の信頼度を低下させずに、予備系装置の台数
を減少させることができ、コストダウンを計るこ
とが可能である。
As explained above, according to the present invention, there are a plurality of data processing devices, one or more maintenance operation devices that have a maintenance operation function for the entire system, and a standby device that can be substituted for any of these devices. In a distributed data processing system with It is possible to reduce the number of units and reduce costs.
第1図は本発明の一実施例を示す分散形データ
処理システムの構成図、第2図は従来の分散形デ
ータ処理システムの構成図である。
1:保守運転装置、20:保守運転装置の予備
系装置、30:データ処理装置の予備系装置、2
1:保守運転装置およびデータ処理装置の両方に
対して代替となり得る予備系装置、31〜3N:
データ処理装置、4:情潤の転送を行う共通バ
ス、50,51:緊急制御回路。
FIG. 1 is a block diagram of a distributed data processing system showing an embodiment of the present invention, and FIG. 2 is a block diagram of a conventional distributed data processing system. 1: Maintenance operation device, 20: Backup system device of maintenance operation device, 30: Backup system device of data processing device, 2
1: Backup system equipment that can be substituted for both maintenance operation equipment and data processing equipment, 31 to 3N:
Data processing device, 4: Common bus for transferring information, 50, 51: Emergency control circuit.
Claims (1)
保守運転処理を行う1台以上の保守運転装置が共
通バスに接続された分散形データ処理システムに
おいて、上記保守運転装置およびデータ処理装置
の両方の代替となり得る予備系装置と、上記保守
運転装置の障害を監視し、障害になつたときには
上記予備系装置を切替え起動させる緊急制御手段
とを設け、データ処理装置が障害となり、上記予
備系装置を用いて再開している間に、上記保守運
転装置の障害を検出した場合には、上記緊急制御
手段により、障害となつた保守運転装置の代替と
して上記予備系装置を強制的に切替えて、システ
ムの運転を再開させることを特徴とする再開処理
方式。1. In a distributed data processing system in which a plurality of data processing devices and one or more maintenance and operation devices that perform maintenance and operation processing for the data processing devices are connected to a common bus, a substitute for both the maintenance and operation devices and the data processing device A backup system device that can become a failure, and an emergency control means that monitors failures in the maintenance operation device and switches and activates the backup system device when a failure occurs, so that if the data processing device becomes a failure, the backup system device can be used. If a failure is detected in the maintenance operation equipment while restarting the system, the emergency control means will forcefully switch over the backup equipment as a substitute for the failed maintenance operation equipment, and the system will be restarted. A restart processing method characterized by restarting operation.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60104887A JPS61262854A (en) | 1985-05-16 | 1985-05-16 | Resumptive processing system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP60104887A JPS61262854A (en) | 1985-05-16 | 1985-05-16 | Resumptive processing system |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS61262854A JPS61262854A (en) | 1986-11-20 |
JPH029368B2 true JPH029368B2 (en) | 1990-03-01 |
Family
ID=14392685
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP60104887A Granted JPS61262854A (en) | 1985-05-16 | 1985-05-16 | Resumptive processing system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61262854A (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2503663B2 (en) * | 1989-07-07 | 1996-06-05 | 日本電気株式会社 | Hot standby system |
-
1985
- 1985-05-16 JP JP60104887A patent/JPS61262854A/en active Granted
Also Published As
Publication number | Publication date |
---|---|
JPS61262854A (en) | 1986-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5155729A (en) | Fault recovery in systems utilizing redundant processor arrangements | |
US20080307254A1 (en) | Information-processing equipment and system therefor | |
JP3537281B2 (en) | Shared disk type multiplex system | |
JPS59106056A (en) | Failsafe type data processing system | |
JP3806600B2 (en) | System switching method for multi-system | |
CN110740066B (en) | Seat-invariant cross-machine fault migration method and system | |
JP2002136000A (en) | Uninterruptible power supply system | |
JPH029368B2 (en) | ||
JPH0683657A (en) | Service processor switching system | |
JPH10116261A (en) | Check point restarting method for parallel computer system | |
JPH05314075A (en) | On-line computer system | |
JPH04268643A (en) | Information processing system | |
JPH07141308A (en) | Back-up method in information processing system | |
CN110752955A (en) | Seat invariant fault migration system and method | |
JPH06195318A (en) | Distributed processing system | |
JP3363579B2 (en) | Monitoring device and monitoring system | |
JPH04239831A (en) | Inter processor backup system | |
KR100228306B1 (en) | Hot-standby multiplexer and implementation method | |
JPS60222945A (en) | Backup system for abnormality or the like | |
JPS6139138A (en) | Multiplexing system | |
JP2606144B2 (en) | Redundant device | |
JP2611549B2 (en) | Elevator group control device | |
JPH10187473A (en) | Duplex information processor | |
JPS61194939A (en) | Communication controller | |
JPS61100037A (en) | Communication line controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |