JPH04362744A - System switch controller for duplex system - Google Patents

System switch controller for duplex system

Info

Publication number
JPH04362744A
JPH04362744A JP3165084A JP16508491A JPH04362744A JP H04362744 A JPH04362744 A JP H04362744A JP 3165084 A JP3165084 A JP 3165084A JP 16508491 A JP16508491 A JP 16508491A JP H04362744 A JPH04362744 A JP H04362744A
Authority
JP
Japan
Prior art keywords
abnormality
power
active
standby
power supply
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3165084A
Other languages
Japanese (ja)
Inventor
Naohiko Kaseda
悴田 直彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP3165084A priority Critical patent/JPH04362744A/en
Publication of JPH04362744A publication Critical patent/JPH04362744A/en
Pending legal-status Critical Current

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Multi Processors (AREA)

Abstract

PURPOSE:To prevent the breakage of a switch controller and also to easily specify the area of abnormality even after occurrence of the abnormality. CONSTITUTION:When the abnormality occurs in a working system, an abnormality occurrence frequency storage means 101a stores the abnormality occurrence frequency of the working system in a nonvolatile memory 102. At the same time, a power cut-off means 101b cuts off the power supply of the working system and an abnormality informing means 101c informs a stand-by system of the occurrence of abnormality. In the stand-by system, an operation continuing means 101d turns on a power supply to start the stand-by system with the received information of the abnormality to carry on the processing of the working system as long as its own system is not abnormal. Then an operation deciding means 101e checks the abnormality occurrence frequency by reference to the memory 102. Then the means 101e turns off the power supply after the switch to the counter system when the abnormality occurrence frequency is less than a prescribed level and then turns off the power supply with no switch of systems when the abnormality occurrence frequency exceeds the prescribed level respectively.

Description

【発明の詳細な説明】[Detailed description of the invention]

【0001】0001

【産業上の利用分野】本発明は、同一システムの一方の
系と他方の系とを有し、いずれかの系に異常が発生した
場合、待機系の運用に切替える二重化システムの系切替
え装置に関する。
[Field of Industrial Application] The present invention relates to a system switching device for a redundant system that has one system and the other system of the same system, and switches to standby system operation when an abnormality occurs in either system. .

【0002】0002

【従来の技術】計算機システムにおいて、ハードウェア
の故障や異常が生じても、システムを停止させず、運用
を継続できるようにするため、同一システムを二つ備え
た二重化システムを構築する方法がある。このような二
重化システムには、運用系で故障あるいは異常を検出し
た場合、待機系でこの運用を直ちに引き継げるように待
機系の電源も運用系と同様に入れておき、即運用可能な
状態にしておく、ホットスタンバイ方式と、待機系は電
源を入れず、運用系での故障あるいは異常を検出後、速
やかに待機系の電源を入れて立ち上げ、運用系での処理
を引き継ぐコールドスタンバイ方式がある。
[Background Art] In order to enable continuous operation without stopping the system even if a hardware failure or abnormality occurs in a computer system, there is a method of constructing a redundant system with two identical systems. . In such a redundant system, if a failure or abnormality is detected in the active system, the standby system is powered on in the same way as the active system, so that the standby system can immediately take over the operation, making it ready for immediate operation. There is a hot standby method, and a cold standby method in which the standby system is not powered on, but after a failure or abnormality is detected in the active system, the standby system is immediately turned on and started up, and takes over the processing on the active system. .

【0003】通常、故障あるいは異常により運用が中断
する時間、即ち系切替え時間は短いほど良いため、一般
にはホットスタンバイ方式で両系とも電源を投入した状
態で運用することが多い。また、運用中の系の故障ある
いは異常を検出し、もう一方の系に切替える方法には、
両系にそれぞれシステム監視制御装置を備え、これら装
置がそれぞれの系を監視し、運用系の故障あるいは異常
を検出すると待機系システムにその旨を通知、または立
ち上げを指示し、系を切替える方法や、待機系のシステ
ムが運用系を監視し、故障あるいは異常を検出すると、
運用系の処理を引き継ぐ方法等がある。
[0003] Normally, the shorter the time during which operation is interrupted due to a failure or abnormality, that is, the system switching time, the better; therefore, in general, both systems are operated in a hot standby manner with power turned on. In addition, there are methods for detecting failures or abnormalities in an operating system and switching to the other system.
A method in which both systems are equipped with system monitoring and control devices, and when these devices monitor each system and detect a failure or abnormality in the active system, they notify the standby system or instruct it to start up, and switch the system. The standby system monitors the active system, and if a failure or abnormality is detected,
There are methods to take over the processing of the active system.

【0004】0004

【発明が解決しようとする課題】ところで、上述した常
に両系の電源をオン状態にしておくホットスタンバイ方
式の二重化システムにおいては、単なるハードウェアの
故障では、待機系を新運用系に切替えて処理を継続し、
後にオペレータ・保守員が故障原因の調査、故障箇所の
特定を行い、故障箇所の修理・交換を行っている。
[Problem to be Solved by the Invention] By the way, in the above-mentioned redundant hot standby system where both systems are always powered on, if there is a simple hardware failure, the standby system is switched over to the new active system and the process is handled. continue,
Operators and maintenance personnel then investigate the cause of the failure, identify the failure location, and repair or replace the failure location.

【0005】しかしながら、上記のホットスタンバイ方
式において、異常原因が装置内の温度異常や冷却用ファ
ンの停止、あるいは電源の異常等の環境異常であった場
合、待機系への切替え後、旧運用系の電源をオン状態の
ままにしておくと、装置の破壊や最悪の場合は火災等の
可能性もあり、危険であるという問題があった。また、
安全面から系切替え後、異常の発生した系の電源を自動
的にオフとした場合には、異常原因や故障箇所が容易に
特定できなくなってしまうという問題があった。本発明
は、上記従来の問題点を解決するためになされたもので
、異常発生系の装置破壊や火災等を防止し、かつ異常発
生系の異常原因を容易に特定することのできる二重化シ
ステムの系切替え制御装置を提供することを目的とする
However, in the hot standby method described above, if the cause of the abnormality is an environmental abnormality such as an abnormal temperature inside the device, a cooling fan stopping, or an abnormality in the power supply, after switching to the standby system, the old operating system If the power of the device is left on, there is a risk of damage to the device or, in the worst case, a fire, which is dangerous. Also,
For safety reasons, when the power of a system in which an abnormality has occurred is automatically turned off after system switching, there is a problem in that the cause of the abnormality or the location of the failure cannot be easily identified. The present invention has been made in order to solve the above-mentioned conventional problems, and provides a redundant system that can prevent equipment destruction and fires in the abnormality system and easily identify the cause of the abnormality in the abnormality system. The purpose is to provide a system switching control device.

【0006】[0006]

【課題を解決するための手段】本発明の二重化システム
の系切替え制御装置は、同一システムの一方の系と他方
の系とを有し、運用系に異常が発生した場合、待機系の
運用に切替える二重化システムの系切替え装置において
、前記運用系において異常が発生した場合、その異常発
生情報を規定回数まで不揮発メモリにセーブする異常発
生回数記憶手段と、前記不揮発メモリにセーブ後、運用
系の電源をオフする電源遮断手段と、前記運用系の異常
を前記待機系に通知する異常通知手段と、前記待機系に
おいて前記運用系の異常が通知され、かつ、自系が異常
でなかった場合、自系の電源をオンし、旧運用系の処理
を継続する運用継続手段と、前記待機系において前記運
用系の異常が通知され、かつ、自系も異常であった場合
、前記不揮発メモリを参照して、この異常が規定回数以
内か否かを判定し、規定回数以内であった場合は、前記
旧運用系に系切替えを行うと共に自系の電源をオフし、
規定回数を超えていた場合は、前記系切替えを行うこと
なく自系の電源をオフする運用判断手段とを備えたもの
である。
[Means for Solving the Problems] A system switching control device for a duplex system of the present invention has one system and the other system of the same system, and when an abnormality occurs in the active system, the standby system is operated. In a system switching device of a redundant system to be switched, when an abnormality occurs in the active system, an abnormality occurrence number storage means that saves the abnormality occurrence information in a non-volatile memory up to a specified number of times, and after saving in the non-volatile memory, a power supply of the active system. an abnormality notification means for notifying the standby system of an abnormality in the active system; an operation continuation means that turns on the power of the system and continues processing of the old active system; and when the standby system is notified of an abnormality in the active system and its own system is also abnormal, refers to the nonvolatile memory. Then, it is determined whether this abnormality occurs within the specified number of times, and if it is within the specified number of times, the system is switched to the old operating system and the power of the own system is turned off.
If the number of times exceeds a predetermined number, the system is equipped with an operation judgment means that turns off the power of the own system without performing the system switching.

【0007】[0007]

【作用】本発明の二重化システムの系切替え制御装置に
おいては、運用系で異常が発生した場合、異常発生回数
記憶手段はその回数を不揮発メモリに記憶すると共に、
電源遮断手段はその系の電源をオフし、更に異常通知手
段は待機系に異常を通知する。待機系においては、運用
系の異常発生通知によって、運用継続手段が、自系の電
源をオンして立ち上げを行うと共に、自系が異常でなか
った場合は、運用系の処理を継続し、自系も異常であっ
た場合は、運用判断手段が、不揮発メモリを参照して異
常発生回数を調べ、規定回数以内の場合は、相手系への
系切替え後に電源をオフし、規定回数を超えていた場合
は系切替えを行うことなく電源をオフする。従って、装
置破壊等を防止することができると共に、異常発生後で
あっても異常箇所を容易に特定することができる。
[Operation] In the system switching control device for a duplex system of the present invention, when an abnormality occurs in the active system, the abnormality occurrence number storage means stores the number of times in the nonvolatile memory, and
The power cutoff means turns off the power to the system, and the abnormality notification means notifies the standby system of the abnormality. In the standby system, upon notification of the occurrence of an error in the active system, the operation continuation means turns on the power of the own system to start up, and if the own system is not abnormal, continues the processing of the active system, If the own system is also abnormal, the operation judgment means refers to the non-volatile memory to check the number of times the abnormality has occurred, and if it is within the specified number of times, it switches off the power after switching to the other system and determines whether the specified number of times has been exceeded. If so, turn off the power without performing system switching. Therefore, damage to the device can be prevented, and the location of the abnormality can be easily identified even after the abnormality has occurred.

【0008】[0008]

【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。図2は本発明の二重化システムの系切替え制
御装置を適用した二重化システム構成例を示すブロック
図である。図のシステムは、1系では、システム監視制
御装置11、プロセッサ12、メモリ13、入出力制御
装置14、15、電源16、センサ17、18、システ
ムバス19からなり、また、この1系と同様のシステム
が2系として、システム監視制御装置21、プロセッサ
22、メモリ23、入出力制御装置24、25、電源2
6、センサ27、28、システムバス29からなり、こ
れら1系と2系により二重化システムを構成している。 また、システム監視制御装置11とシステム監視制御装
置21は、1系の異常を2系に通知する1系異常通知線
31と、2系の異常を1系に通知する2系異常通知線3
2とで接続されている。
Embodiments Hereinafter, embodiments of the present invention will be explained in detail with reference to the drawings. FIG. 2 is a block diagram showing an example of a duplex system configuration to which a system switching control device for a duplex system according to the present invention is applied. The system shown in the figure consists of a system supervisory control device 11, a processor 12, a memory 13, input/output control devices 14, 15, a power supply 16, sensors 17, 18, and a system bus 19. The system has two systems, a system monitoring control device 21, a processor 22, a memory 23, input/output control devices 24 and 25, and a power supply 2.
6, sensors 27, 28, and a system bus 29, and these 1st and 2nd systems constitute a duplex system. Additionally, the system monitoring and control device 11 and the system monitoring and control device 21 have a system 1 abnormality notification line 31 that notifies the 2nd system of an abnormality in the 1st system, and a 2nd system abnormality notification line 3 that notifies the 1st system of an abnormality in the 2nd system.
It is connected with 2.

【0009】システム監視制御装置11、21は、それ
ぞれ各系の異常発生を監視する装置で、後述する系切替
え制御装置や不揮発メモリ等から構成されている。また
、プロセッサ12、22は、計算機システム全体の制御
を行う装置、メモリ13、23は、ランダム・アクセス
・メモリ等からなり、計算機システムのプログラムや各
種データを格納する主記憶装置である。入出力制御装置
14、15、24、25はそれぞれ計算機システムに接
続される入出力装置の制御を行う装置で、これらシステ
ム監視制御装置11、21〜入出力制御装置15、25
はシステムバス19、29に接続され、プロセッサ11
、21によって制御されるよう構成されている。また、
電源16、26は、1系、2系それぞれに電源を供給す
る装置で、システム監視制御装置11、21によって制
御されるよう構成されている。更に、センサ17、18
、27、28は計算機システム各部の故障や異常を検出
するためのセンサである。
The system monitoring and control devices 11 and 21 are devices that monitor the occurrence of abnormalities in each system, and are comprised of a system switching control device, a nonvolatile memory, etc., which will be described later. Further, the processors 12 and 22 are devices that control the entire computer system, and the memories 13 and 23 are composed of random access memories and the like, and are main storage devices that store programs and various data of the computer system. The input/output control devices 14, 15, 24, and 25 are devices that control input/output devices connected to the computer system, respectively, and these system monitoring and control devices 11, 21 to input/output control devices 15, 25
are connected to the system buses 19 and 29, and the processor 11
, 21. Also,
The power supplies 16 and 26 are devices that supply power to the first and second systems, respectively, and are configured to be controlled by the system monitoring and control devices 11 and 21. Furthermore, sensors 17 and 18
, 27 and 28 are sensors for detecting failures and abnormalities in various parts of the computer system.

【0010】図1にシステム監視制御装置11の具体的
な構成を示す。図の装置は、系切替え制御装置101 
と、不揮発メモリ102 と、アラーム保持リレー回路
103 と、電源オン/オフ制御回路104 とからな
る。系切替え制御装置101 は、異常発生回数記憶手
段101aと、電源遮断手段101bと、異常通知手段
101cと、運用継続手段101dと、運用判断手段1
01eとからなる。
FIG. 1 shows a specific configuration of the system monitoring and control device 11. As shown in FIG. The device in the figure is a system switching control device 101.
, a nonvolatile memory 102 , an alarm holding relay circuit 103 , and a power on/off control circuit 104 . The system switching control device 101 includes an abnormality occurrence count storage means 101a, a power cutoff means 101b, an abnormality notification means 101c, an operation continuation means 101d, and an operation judgment means 1.
It consists of 01e.

【0011】異常発生回数記憶手段101aは、1系で
故障や異常が発生し、センサ17、18によりその異常
が検出された場合、不揮発メモリ102 に、その異常
原因詳細情報を規定回数までセーブする機能を有してい
る。電源遮断手段101bは、異常発生回数記憶手段1
01aにより、不揮発メモリ102 に異常原因詳細情
報がセーブされると、電源オン/オフ制御回路104 
を制御し、異常発生系(ここでは1系とする)の電源を
オフ状態とする機能を有している。異常通知手段101
cは、1系で異常を検出した場合、アラーム保持リレー
回路103 を制御し、これを2系に通知する手段であ
る。運用継続手段101dは、1系を待機系とし、2系
を運用系として異常が発生した場合、2系から異常が通
知され、かつ、1系が異常でなかった場合、電源オン/
オフ制御回路104 を制御して1系の電源をオンし、
2系の運用を継続する手段である。また、運用判断手段
101eは、2系から異常が通知され、かつ1系も異常
であった場合、不揮発メモリ102 を参照し、何回の
異常が記憶されているかを調べ、この異常記憶回数が規
定回数以内か否かを判定し、これが規定回数を超えてい
た場合は、1系の電源をオフにする手段である。
[0011] When a failure or abnormality occurs in the first system and the abnormality is detected by the sensors 17 and 18, the abnormality occurrence count storage means 101a saves detailed information on the cause of the abnormality in the non-volatile memory 102 up to a predetermined number of times. It has a function. The power cutoff means 101b includes the abnormality occurrence number storage means 1
01a, when detailed information on the cause of the abnormality is saved in the non-volatile memory 102, the power on/off control circuit 104
It has the function of controlling the system in which an abnormality has occurred (here, system 1) is turned off. Abnormality notification means 101
c is means for controlling the alarm holding relay circuit 103 and notifying the second system when an abnormality is detected in the first system. The operation continuation means 101d sets the 1st system as a standby system and the 2nd system as the active system, and when an abnormality occurs, the 2nd system notifies the abnormality and the 1st system is not abnormal, turns on the power.
Controls the off control circuit 104 to turn on the power of system 1,
This is a means to continue the operation of the second system. Further, when an abnormality is notified from the second system and the first system is also abnormal, the operation judgment means 101e refers to the non-volatile memory 102, checks how many abnormalities have been stored, and calculates the number of abnormalities stored. This is a means for determining whether or not the number of times is within a specified number of times, and if it exceeds the specified number of times, turning off the power of the 1 system.

【0012】不揮発メモリ102 はバッテリバックア
ップメモリ等からなり、異常発生回数記憶手段101a
によって規定回数の異常原因詳細情報が格納されるよう
構成されている。図3に不揮発メモリのメモリ状態図を
示す。即ち、第1ワード目が異常を検出して系を切替え
た回数(系切替えカウンタ)を示し、切替え回数(ダウ
ン回数)Nに対応したN番目の領域がそのシステムダウ
ンの異常原因詳細情報を示している。
[0012] The nonvolatile memory 102 consists of a battery backup memory, etc., and has abnormality occurrence count storage means 101a.
The detailed information on the cause of abnormality is stored a specified number of times. FIG. 3 shows a memory state diagram of the nonvolatile memory. That is, the first word indicates the number of times the system was switched after detecting an error (system switching counter), and the Nth area corresponding to the number of switches (number of downs) N indicates detailed information on the cause of the error in the system down. ing.

【0013】アラーム保持リレー回路103 は、1系
異常通知線31に接続されたリレー接点103aと、電
源オン/オフ制御回路104 に接続されたリレー接点
103bと、回路部103cとを有し、1系で異常が発
生した場合は、リレー接点103aおよび103bをオ
ンし、その異常を2系に通知するよう構成されている。 電源オン/オフ制御回路104 は、電源16を制御す
る回路で、系切替え制御装置101 によって制御され
る。尚、ここでは図示省略したが、2系のシステム監視
制御装置21もこのシステム監視制御装置11と全く同
様に構成されている
The alarm holding relay circuit 103 has a relay contact 103a connected to the 1-system abnormality notification line 31, a relay contact 103b connected to the power on/off control circuit 104, and a circuit section 103c. When an abnormality occurs in the system, relay contacts 103a and 103b are turned on to notify the second system of the abnormality. The power on/off control circuit 104 is a circuit that controls the power supply 16, and is controlled by the system switching control device 101. Although not shown here, the system monitoring and control device 21 of the second system is also configured in exactly the same way as the system monitoring and control device 11.

【0014】次に、上記構成の二重化システムの系切替
え制御動作について説明する。図3、4は、その切替え
動作を示すフローチャートであり、図3が運用系を、図
4が待機系の動作を示している。ここで運用系を1系、
待機系を2系とし、1系において異常が発生したと仮定
する。また、運用開始時では、不揮発メモリ102 の
内容はクリアされ、かつアラーム保持リレー回路103
 のリレー接点103a、103bはオフ状態であると
する。
Next, the system switching control operation of the duplex system having the above configuration will be explained. 3 and 4 are flowcharts showing the switching operation, with FIG. 3 showing the operation of the active system and FIG. 4 showing the operation of the standby system. Here, the operational system is 1 system,
It is assumed that the standby system is the second system and that an abnormality has occurred in the first system. Furthermore, at the start of operation, the contents of the nonvolatile memory 102 are cleared and the alarm holding relay circuit 103 is cleared.
It is assumed that the relay contacts 103a and 103b are in the off state.

【0015】先ず1系は、2系異常通知信号線32がオ
ンであるか否かを判定する(ステップS101 )。こ
こでは、2系も異常が発生していないため、2系異常通
知信号線32はオフであり、この状態で1系に異常が発
生しない場合は、1系により通常の運用がなされる。し
かし、この状態で1系に異常が発生した場合、即ち、セ
ンサ17、18、または電源16から、温度異常や冷却
用のファンの停止または電源の異常、あるいは他のハー
ドウェアの異常等を検出すると、系切替え制御装置10
1 は、アラーム保持リレー回路103 の、1系の異
常(システムダウン)が発生したことを保持するリレー
接点103aをオンし(ステップS102 )、このリ
レー接点103aのオンにより、1系異常通知信号線3
1を介して2系にアラームを通知する(ステップS10
3 )。そして、異常発生回数記憶手段101aは、温
度異常やファンの停止等のシステム異常原因の詳細情報
を不揮発メモリ102 にセーブし(ステップS104
 )、その後、電源遮断手段101bは、電源オン/オ
フ制御回路104 を介して1系の電源をオフ状態とす
る(ステップS105)。
First, the 1st system determines whether the 2nd system abnormality notification signal line 32 is on (step S101). Here, since no abnormality has occurred in the 2nd system, the 2nd system abnormality notification signal line 32 is off, and if no abnormality occurs in the 1st system in this state, normal operation is performed by the 1st system. However, if an abnormality occurs in the first system in this state, that is, the sensor 17, 18 or the power supply 16 detects a temperature abnormality, cooling fan stoppage, power supply abnormality, or other hardware abnormality. Then, the system switching control device 10
1 turns on the relay contact 103a of the alarm holding relay circuit 103 that holds that a system 1 abnormality (system down) has occurred (step S102), and by turning on this relay contact 103a, the system 1 abnormality notification signal line is turned on. 3
1 to notify the 2nd system of the alarm (step S10
3). Then, the abnormality occurrence count storage means 101a saves detailed information on the causes of system abnormalities such as temperature abnormalities and fan stoppages in the nonvolatile memory 102 (step S104).
), then the power cutoff means 101b turns off the power of the 1 system via the power on/off control circuit 104 (step S105).

【0016】一方、待機系である2系は、相手系(運用
系)である1系の異常を通知する1系異常通知信号線3
1がオン状態になると、これを検知し(ステップS20
1 )、2系の電源をオン状態とし、自動立ち上げを行
う(ステップS202 )。そして、自系の異常を保持
しているアラームリレー接点203b(図1の接点10
3bに対応する)がオンか否かを判断し(ステップS2
03 )、オンでない、即ち自系が異常でなければ旧運
用系で行っていた処理を引き継いで、継続運用を行う(
ステップS204 )。また、ステップS203 にお
いて、アラーム保持リレー接点203bがオン状態、即
ち自系も異常の場合、自系のリレー接点203a、20
3bを一旦オフ(リセット)し(ステップS205 )
、不揮発メモリ202 内に格納されている系切替えカ
ウンタを参照する(ステップS206 )。その結果、
系の切替え(ダウン)回数が規定回数以上であった場合
は、リレー接点203aは、自系の異常要因が発生して
いても再びオンせず、系の切替えを抑止し、かつ自系の
電源をオフする(ステップS211 )。即ち、両系と
も電源をオフし、両系ともシステム停止(両系ダウン)
させる。
On the other hand, the 2nd system, which is the standby system, uses the 1st system abnormality notification signal line 3 to notify the 1st system, which is the other system (active system), of an abnormality.
1 is turned on, this is detected (step S20
1) The power of the 2nd system is turned on and automatic startup is performed (step S202). Then, the alarm relay contact 203b (contact 10 in FIG.
3b) is on (step S2).
03), if it is not on, that is, if there is no abnormality in the own system, continue the operation by taking over the processing that was being performed on the old active system (
Step S204). Further, in step S203, if the alarm holding relay contact 203b is in the on state, that is, the own system is also abnormal, the relay contacts 203a, 20 of the own system
3b is temporarily turned off (reset) (step S205).
, refer to the system switching counter stored in the nonvolatile memory 202 (step S206). the result,
If the number of system switching (down) times exceeds the specified number, the relay contact 203a does not turn on again even if an abnormality factor occurs in the own system, suppresses system switching, and turns off the power to the own system. is turned off (step S211). In other words, both systems are powered off and both systems are stopped (both systems down).
let

【0017】一方、ステップS207 において、系の
切替え回数が規定回数以内ならば、再度リレー接点20
3a、203bをオンし(ステップS208 )、相手
系(1系)の立ち上げを指示し(ステップS209 )
、更に不揮発メモリ202 に異常原因詳細情報を格納
すると共に系切替えカウンタをカウントアップし(ステ
ップS210 )、自系の電源をオフする(ステップS
211 )。
On the other hand, in step S207, if the number of times the system has been switched is within the specified number of times, the relay contact 20 is turned on again.
3a and 203b (step S208), and instructs to start up the other system (system 1) (step S209).
Furthermore, detailed information on the cause of the abnormality is stored in the non-volatile memory 202, the system switching counter is counted up (step S210), and the power of the own system is turned off (step S210).
211).

【0018】1系に、相手系の異常が通知されると、ス
テップS101 の2系異常通知信号線32はオン状態
のため、今度は1系の電源がオンされる(ステップS1
06 )。そして、上述した2系の動作と同様に、アラ
ーム保持リレー回路103 のリレー接点103bはオ
ンか否かを判定し(ステップS107 )、ここで故障
回復等により、リレー接点103a、103bがオフ状
態、即ち1系が正常であった場合は、相手系の運用を継
続する(ステップS108 )。例えば、上述した1系
の異常発生内容が温度上昇であって、それが1系の運用
の一旦停止によって規定の温度に戻っていた場合や、ノ
イズ等による誤動作であった場合は、1系の立ち上げ動
作によって正常な状態となる。
When the first system is notified of the abnormality in the other system, the second system abnormality notification signal line 32 in step S101 is in the on state, so the power of the first system is turned on (step S101).
06). Then, similarly to the operation of the second system described above, it is determined whether the relay contact 103b of the alarm holding relay circuit 103 is on or not (step S107), and here, due to failure recovery etc., the relay contacts 103a and 103b are in the off state. That is, if the first system is normal, the operation of the other system is continued (step S108). For example, if the abnormality in system 1 mentioned above was a temperature rise, but the temperature returned to the specified temperature by temporarily stopping the operation of system 1, or if it was a malfunction due to noise etc., The startup operation returns it to a normal state.

【0019】また、リレー接点103a、103bがオ
ン状態であった場合は、一旦リレー接点103a、10
3bをリセットし(ステップS109 )、系切替えカ
ウンタを参照して(ステップS110 )、これが規定
回数以内であればステップS102 に戻り、リレー接
点103a、103bのオンからの動作を繰り返す。ま
た、規定回数を超えていた場合はステップS105 に
進んで電源をオフする。即ち、規定回数の範囲で系を切
替え、立ち上げを繰り返し、それでも両系とも異常が発
生している場合は、両系ともシステムダウンとするもの
である。例えば、異常原因が上述した温度上昇等でなく
、系切替えを繰り返しても回復しない故障等の場合は、
規定回数の範囲での切替えの後、両系ともシステムダウ
ンする。
Further, when the relay contacts 103a and 103b are in the ON state, the relay contacts 103a and 103b are temporarily turned on.
3b is reset (step S109), the system switching counter is referred to (step S110), and if this is within the specified number of times, the process returns to step S102 and the operation from turning on the relay contacts 103a and 103b is repeated. If the number of times exceeds the specified number, the process proceeds to step S105 and the power is turned off. That is, if the systems are switched and started up repeatedly within a specified number of times, and an abnormality still occurs in both systems, both systems are brought down. For example, if the cause of the abnormality is not the temperature rise mentioned above, but a failure that does not recover even after repeated system switching,
After switching within the specified number of times, both systems go down.

【0020】尚、上記実施例では、自系の異常が発生し
た場合、アラーム保持リレー回路103 および203
 の接点103a、103bおよび203a、203b
がオン状態となるよう構成したが、この構成に限定され
るものではなく、自系の異常状態が判別できれば、これ
ら接点103a、103bおよび203a、203bの
オン/オフ状態は、どちらであっても同様の効果を奏す
る。
In the above embodiment, when an abnormality occurs in the own system, the alarm holding relay circuits 103 and 203
Contact points 103a, 103b and 203a, 203b
Although the configuration is configured such that the contacts 103a, 103b and 203a, 203b are in the on state, the present invention is not limited to this configuration. It has a similar effect.

【0021】[0021]

【発明の効果】以上説明したように、本発明の二重化シ
ステムの系切替え制御装置によれば、運用系で異常が発
生した場合、その原因を規定回数まで不揮発メモリに記
憶して、異常発生系の電源をオフし、かつ異常発生によ
り待機系の電源をオンして立ち上げを行い、待機系では
、自系が異常でなかった場合は異常発生系の運用を継続
し、自系も異常であった場合は、系切替えが規定回数以
内であるか否かを判定して、規定回数を超えていた場合
は自系の電源をオフし、規定回数以内の場合は相手系と
の切替えを規定回数になるまで繰り返し行うようにした
ので、異常発生後は装置の電源がオフとなるため、装置
の破壊や火災に至る等の問題を防止することができ、ま
た、異常原因が不揮発メモリで保存されるため、後にそ
の異常原因情報を基に異常箇所を容易に特定することが
できる。
As explained above, according to the system switching control device for a redundant system of the present invention, when an abnormality occurs in the active system, the cause is stored in the non-volatile memory up to a specified number of times, and If an error occurs, turn on the power to the standby system to start up the system.If the own system is not abnormal, the standby system continues to operate the abnormal system, and if the own system is also abnormal. If there is, it is determined whether system switching has occurred within the specified number of times, and if the number of system switching has exceeded the specified number, the power to the own system is turned off, and if it is within the specified number of times, switching with the other system is specified. Since the process is repeated until the number of times the error occurs, the power to the device is turned off after an error occurs, which prevents problems such as device destruction or fire.Also, the cause of the error can be stored in non-volatile memory. Therefore, the location of the abnormality can be easily identified later based on the abnormality cause information.

【図面の簡単な説明】[Brief explanation of drawings]

【図1】本発明の二重化システムの系切替え制御装置を
含むシステム監視制御装置のブロック図である。
FIG. 1 is a block diagram of a system monitoring and control device including a system switching control device for a duplex system according to the present invention.

【図2】本発明の二重化システムの系切替え制御装置を
適用した計算機システムのブロック図である。
FIG. 2 is a block diagram of a computer system to which a system switching control device for a duplex system of the present invention is applied.

【図3】不揮発メモリのメモリ状態図である。FIG. 3 is a memory state diagram of a nonvolatile memory.

【図4】本発明の二重化システムの系切替え制御装置に
おける異常発生系の系切替え制御のフローチャートであ
る。
FIG. 4 is a flowchart of system switching control for an abnormal system in the system switching control device of the duplex system of the present invention.

【図5】本発明の二重化システムの系切替え制御装置に
おける待機系の系切替え制御のフローチャートである。
FIG. 5 is a flowchart of standby system switching control in the system switching control device of the duplex system of the present invention.

【符号の説明】[Explanation of symbols]

101   系切替え制御装置 101a  異常発生回数記憶手段 101b  電源遮断手段 101c  異常通知手段 101d  運用継続手段 101e  運用判断手段 101 System switching control device 101a Abnormality occurrence count storage means 101b Power cutoff means 101c Abnormality notification means 101d Means for continuing operation 101e Operation judgment means

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】  同一システムの一方の系と他方の系と
を有し、運用系に異常が発生した場合、待機系の運用に
切替える二重化システムの系切替え装置において、前記
運用系において異常が発生した場合、その異常発生情報
を規定回数まで不揮発メモリにセーブする異常発生回数
記憶手段と、前記不揮発メモリにセーブ後、運用系の電
源をオフする電源遮断手段と、前記運用系の異常を前記
待機系に通知する異常通知手段と、前記待機系において
前記運用系の異常が通知され、かつ、自系が異常でなか
った場合、自系の電源をオンし、旧運用系の処理を継続
する運用継続手段と、前記待機系において前記運用系の
異常が通知され、かつ、自系も異常であった場合、前記
不揮発メモリを参照して、この異常が規定回数以内か否
かを判定し、規定回数以内であった場合は、前記旧運用
系に系切替えを行うと共に自系の電源をオフし、規定回
数を超えていた場合は、前記系切替えを行うことなく自
系の電源をオフする運用判断手段とを備えた二重化シス
テムの系切替え制御装置。
Claim 1: In a system switching device of a redundant system that has one system and the other system of the same system and switches to standby system operation when an abnormality occurs in the active system, an abnormality occurs in the active system. an abnormality occurrence count storage means for saving the abnormality occurrence information in a nonvolatile memory up to a predetermined number of times when the abnormality occurs; a power cutoff means for turning off the power of the active system after saving the abnormality information in the nonvolatile memory; an abnormality notification means for notifying the system; and an operation for turning on the power of the own system and continuing processing of the old active system when the standby system is notified of an abnormality in the active system and there is no abnormality in the own system. and a continuation means, when the standby system is notified of an abnormality in the active system and its own system is also abnormal, refers to the nonvolatile memory to determine whether or not this abnormality has occurred within a specified number of times, and If the number of times is within the specified number of times, the system is switched to the old active system and the power of the own system is turned off. If the number of times exceeds the specified number of times, the power of the own system is turned off without performing the system switch. A system switching control device for a redundant system, comprising a determination means.
JP3165084A 1991-06-10 1991-06-10 System switch controller for duplex system Pending JPH04362744A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3165084A JPH04362744A (en) 1991-06-10 1991-06-10 System switch controller for duplex system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3165084A JPH04362744A (en) 1991-06-10 1991-06-10 System switch controller for duplex system

Publications (1)

Publication Number Publication Date
JPH04362744A true JPH04362744A (en) 1992-12-15

Family

ID=15805575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3165084A Pending JPH04362744A (en) 1991-06-10 1991-06-10 System switch controller for duplex system

Country Status (1)

Country Link
JP (1) JPH04362744A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230710A (en) * 2008-03-25 2009-10-08 Nec Corp Device, method and program for switching processor
WO2011061828A1 (en) * 2009-11-19 2011-05-26 富士通株式会社 Information processing apparatus, method for controlling information processing apparatus, and control program
JP5682703B2 (en) * 2011-03-28 2015-03-11 富士通株式会社 Information processing system and information processing system processing method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009230710A (en) * 2008-03-25 2009-10-08 Nec Corp Device, method and program for switching processor
WO2011061828A1 (en) * 2009-11-19 2011-05-26 富士通株式会社 Information processing apparatus, method for controlling information processing apparatus, and control program
JP5682703B2 (en) * 2011-03-28 2015-03-11 富士通株式会社 Information processing system and information processing system processing method
US9547567B2 (en) 2011-03-28 2017-01-17 Fujitsu Limited Information processing system and processing method for information processing system

Similar Documents

Publication Publication Date Title
JP4655718B2 (en) Computer system and control method thereof
JPH04362744A (en) System switch controller for duplex system
US5679985A (en) Power supply with automatic recovery system
JP2001034495A (en) Dual system
JP2016095770A (en) Controller and redundancy control system using the same
JPH04332009A (en) Temperature abnormality detection system for computer system
JPH0612154A (en) Battery backup system
JP2002032152A (en) Wind speed monitoring method
JP3107104B2 (en) Standby redundancy method
JPH02280636A (en) Power consumption control system for electronic exchange
JPH11191016A (en) Degenerative switching method for multiple processors
JP2744113B2 (en) Computer system
JPH1124800A (en) System and method for power source backup and storage medium stored with power backup control program
JP2002032239A (en) Multiplexing system
JPS61169036A (en) System supervisory device
JP2606144B2 (en) Redundant device
JPH02173831A (en) Duplex central processing unit
JP2000044154A (en) Escalator remote monitoring device
JP2713134B2 (en) Automatic system selection method and communication system therefor
JP3843388B2 (en) Process control device
JPH0535517A (en) Switching device for duplexing system
JPS61125634A (en) System for monitoring and controlling abnormality
JP4957068B2 (en) Redundant system switching method
JPS63269234A (en) System switching device
JPS5920056A (en) Setting system of unit in use in duplicated constituting device