JP4465824B2 - Controller system - Google Patents

Controller system Download PDF

Info

Publication number
JP4465824B2
JP4465824B2 JP2000204874A JP2000204874A JP4465824B2 JP 4465824 B2 JP4465824 B2 JP 4465824B2 JP 2000204874 A JP2000204874 A JP 2000204874A JP 2000204874 A JP2000204874 A JP 2000204874A JP 4465824 B2 JP4465824 B2 JP 4465824B2
Authority
JP
Japan
Prior art keywords
cpu
state
cpus
standby
request message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000204874A
Other languages
Japanese (ja)
Other versions
JP2002024050A (en
Inventor
敏之 西脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Systems Co Ltd filed Critical Fuji Electric Systems Co Ltd
Priority to JP2000204874A priority Critical patent/JP4465824B2/en
Publication of JP2002024050A publication Critical patent/JP2002024050A/en
Application granted granted Critical
Publication of JP4465824B2 publication Critical patent/JP4465824B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明はCPUを1対1のペア構成により冗長性を持たせた情報処理装置に関し、更に詳しくはCPUの稼働/待機切替えの制御に関する。
【0002】
【従来の技術】
図6にプログラマブルコントローラ等のコントローラシステムの一般的な構成を示す。
【0003】
この様なコントローラシステムは、CPUやメモリ等によって構成される1乃至複数のCPUモジュール、制御を行う機器と接続され測定値や制御命令等を機器とやり取りするI/O(入出力)モジュール、不図示の通信モジュール等がベースボード100に実装される構成を持ち、CPUが入力データを取込んで計算を行い、結果をI/Oモジュールに送信してI/Oモジュールに接続されている機器の制御を行う。同図の場合ベースボード100−1〜100−3の3つのベースボード上にCPUモジュールCPU0〜CPU7の8つのCPUモジュールとI/OモジュールI/O0〜I/O3の4つのI/Oモジュールが実装されている。
【0004】
ベースボード100は実装されている各モジュールに電源を供給するもので、また同一ベースボード100上に実装された各モジュールをパラレルバス101により接続する。またシステムを構成する全モジュールはシリアルバス102によりシリアル接続されている。コントローラシステムでは、このシリアルバス102により、モジュール間のI/Oデータ転送機能及びメッセージ通信機能、また各パラレルバス101により物理アクセス機能による高速データ転送を可能としている。
【0005】
ところでこの様なコントローラシステムでは、信頼性向上の為、2つのCPUモジュールを1組にしてシステムに冗長化を持たせた構成とする場合がある。
例えば図6の構成において、8つのCPUモジュールのうちCPU0とCPU1、CPU2とCPU3、CPU4とCPU5、CPU6とCPU7とでペアを構成して2重化を行う。またこの場合のシステムはデュプレックス構成で、初期状態としてCPU0、CPU2、CPU4、CPU6が稼働状態、CPU1、CPU3、CPU5、CPU7が待機状態となっている。
【0006】
図6の構成において、システムが稼動中の時は稼動CPU間では主にパラレルバス101を用いてデータのやり取りが行われるが、このパラレルバス101を使用してデータの受け渡しができるCPUモジュールの組合わせは限定される。図6の場合、CPU0はベースボード100−1上の他のCPUモジュールCPU1〜CPU3とはパラレルバス101−1を介してやり取りを行えるが、ベースボード100−2上のCPU4〜CPU7とはパラレルバス101による通信は行えない。
【0007】
この点に対処するものとして、図7の構成のように、全CPUモジュールを1つのベースボード100−4上に実装してCPUモジュール間を1つのパラレルバス101−4によって接続する構成がある。この場合、全CPUモジュール間でこのパラレルバス101−4によってデータ転送が可能となる。
【0008】
あるいは図8の様な構成とすることも出来る。この図8の構成は、全ての稼動CPUを1つのベースボード上に実装した構成で、稼動CPU0、CPU2、CPU4、CPU6間ではパラレルバス101−5を介して互いにデータ転送を行える。
【0009】
【発明が解決しようとする課題】
一般的にベースボード100は、コスト等の問題により、モジュール電源スイッチやモジュールの活線脱着機能などは備えていない。その為、例えば図7に示した構成の場合、初期状態からCPU0が故障となった時にシステムを稼動したまま故障したCPU0を交換しようとしても、ベースボード100−4上には4台のCPUモジュールが稼動運用中である為、電源をオフにして、CPU0の交換保守をすることはできない。
【0010】
さらに図8のような構成にした場合、上述したシステム稼動中に故障CPUモジュールの交換が行えない問題に加え、例えば初期状態からCPU0が故障してCPU1が稼働CPUに切り替った場合、CPU1と他の稼働状態にあるCPU2、CPU4、CPU6との間でパラレルバスによるデータ転送が行うことが出来ない。
【0011】
更に上記図7及び図8の構成の場合、ペアとなっているCPUの両方、例えばCPU0とCPU1が共に故障した場合、3台の稼働CPUで運用することになり本来の性能を発揮できなくなってしまう。
【0012】
上記問題点を鑑み、本発明は、稼働CPU間にて、ソフトウエア処理が無く高速データ転送が可能なパラレルバスを常時使用でき、更にシステムを稼動させて制御を継続させたまま故障したCPUを交換保守することが可能なコントローラシステムを提供することを目的とする。
【0013】
【課題を解決するための手段】
上記問題点を解決するため、本発明によるコントローラシステムは、複数のCPUを備え、該CPUを多重化して冗長化を持たせる構成を前提とし、各CPUは、待機切替え要求メッセージ発行手段及び状態切替え手段を備える。
【0014】
待機切替え要求メッセージ発行手段は、稼働CPUに対して、待機切替え要求メッセージを発行する。
状態切替え手段は、上記待機切替え要求メッセージを受取ると、稼働状態から待機状態に切替える。
【0015】
上記各CPUは、例えば、複数の連動グループに連動グループ分けされ、各CPUは自己がどの連動グループに属するかを連動グループ記憶手段に記憶する。そして上記状態切替え手段は、自己が多重化しているCPUが待機状態に入ると、待機状態から稼動状態に切替え、上記待機切替え要求メッセージ発行手段は、自己が多重化するCPUが故障するなど稼働/待機切替え要因が発生して自CPUが新たに稼働状態となった時、自CPUと異なる連動グループに属するCPUに対し、上記要求メッセージを発行する。
【0016】
またCPUが故障し、該故障したCPUを多重化しているCPUも全て故障状態にある時、コントローラシステムは運用停止状態に入る。
本発明によれば、自己が多重化しているCPUの故障等により新たに稼動状態となったCPUは、他の稼動状態にあるCPUに待機切替えメッセージを発行することによりそのCPUを待機状態にすることが出来る。従って、例えば、自己と同一のベースボード上に実装されているCPU等任意のCPUを稼動状態にするように設定することが出来る。
【0017】
【発明の実施の形態】
以下に本発明の一実施形態を説明する。
図1は、本実施形態のコントローラシステムの基本構成を示す図である。同図のシステムは従来例と比較の為8つのCPUと4つのI/Oを備え、システムが動作中そのうちの4つが稼動状態にある構成としており、この場合、基本接続構成は図8と同じになる。
【0018】
同図のコントローラシステムは、システムを構成する各モジュールが3つのベースボード10に実装される構成で、ベースボード10−1にはCPUモジュールCPU0、CPU2、CPU4及びCPU6が、またベースボード10−2にCPUモジュールCPU1、CPU3、CPU5及びCPU7が、更にベースボード10−3にI/OモジュールI/O0、I/O1、I/O2及びI/O3が実装されており、各モジュールにはベースボード10から電力が供給されている。また同一ベースボード10内の各モジュールを接続するパラレルバス11(11−1〜11−3)と、全モジュールをシリアル接続するシリアルバス12を備え、このシリアルバス12を介して後述するステータス情報をやり取りしている。
【0019】
システムを構成する8つCPUモジュールは図1に示すように、ベースボード10−1に実装されているCPU0、CPU2、CPU4及びCPU6を連動グループ1、ベースボード10−2に実装されているCPU1、CPU3、CPU5及びCPU7を連動グループ2として定義されており、各CPUは自己や他のCPUがどの連動グループに属するか記憶している。そして各CPUは、CPU0とCPU1、CPU2とCPU3、CPU4とCPU5及びPU6とCPU7と連動グループ1のCPUと連動グループ2のCPUの組合わせにより2重化されており、初期状態として、連動グループ1側のCPUが全て稼働状態、連動グループ2側のCPUが全て待機状態となっている。
【0020】
コントローラシステムが稼動状態に入ると、各CPUモジュールはシリアルバス12からサイクリックにステータス情報を送信する。
図2は、このステータス情報の構成例を示すものである。
【0021】
図2の例の場合、このステータス情報は8ビットのデータで、各ビットは送信元となっているCPUモジュールの状態をそれぞれ表す。例えば図2の場合ビット7はそのCPUモジュール上でアプリケーションソフトが稼動中か否か、又ビット6はハードウエア故障等の致命的故障である重故障であることを、ビット5は一時的な故障である軽故障であることを示すフラグとなっている。又ビット4は、そのCPUモジュールが現在稼動中であるのか待機中であるのかを示す。
【0022】
CPUモジュールは、シリアルバス12上を定周期で送信されてくるステータス情報をサイクリックに受信することにより他のCPUモジュールの状態を監視し、正常に動作しているかどうかをチェックする。このステータス情報により、各CPUモジュールは他のCPUモジュールの故障状態、稼動/待機状態を認識することが出来る。
【0023】
図3及び図4は、システムが稼動中にCPUモジュールに異常が発生した時の処理を示す図である。
稼働状態にあるCPU0に異常が発生すると、その異常内容に基づいてビット6又はビット7を1としたステータス情報をシリアルバス12上に送信する。CPU0を2重化してペアとなっているCPU1はこのステータス情報からCPU0の故障を検知し、図3に示すように、待機状態から稼働状態に切替る。
【0024】
この図3の状態では、CPU1、CPU2、CPU4及びCPU6が稼動状態にあり、このままではCPU1と他の稼動CPUとではパラレルバス11によるデータ転送は行えない。また、CPU2、CPU4、CPU6が稼働状態である為、故障したモジュールCPU0の交換保守の為にベースボード10−1の電源をオフにすることは出来ない。
【0025】
よって、稼働状態に切り替ったCPU1は、まずシリアルバス12上の各CPUモジュールのステータス情報から他のCPU0、CPU2、CPU3、CPU4、CPU5、CPU6、CPU7の稼働/待機状態を調べる。その結果、CPU0は故障状態、CPU2、CPU4、CPU6が稼働状態、CPU3、CPU5、CPU7は待機状態であることを認識する。
【0026】
CPU1は自己と同じ連動グループ2に属さないCPUは、連動切替えグループ設定と不一致であると判断し、シリアルバス12から待機切替え要求メッセージを発行する。
【0027】
図4にCPU1による待機切替え要求メッセージの発行を示す。
CPU1は自己が連動グループ2に属するので、連動グループ2に属さず連動切替えグループ設定と不一致であると判断した、CPU2、CPU4、CPU6を連動グループ2のCPU3、CPU5、CPU7と切替えるため、図4に示すように、シリアルバス12からこれらのCPUモジュールに待機切替え要求メッセージを発行する。このメッセージを受信した稼働CPUは、強制的に待機CPUに切替る。
【0028】
待機切替え要求メッセージを受信したCPU2、CPU4、CPU6は稼働状態から待機状態に移行する。また待機状態になったCPUを2重化してペアとなっているCPU3、CPU5、CPU7は、シリアルバス12上のステータス情報からペアとなっているCPUが待機状態になったことを検出すると、自己を待機状態から稼働状態に移行する。
【0029】
この様に稼動CPUが全て連動グループ2に属するものに切り替った後の状態では、稼働CPU間ではパラレルバス11−2によるデータ転送が可能となる。また、故障したCPU0と同じベースボード10−1上のCPU2、CPU4、CPU6は全て待機状態となっている為、ベースボード10−1の電源をオフにして故障したCPU0のモジュールを交換保守することが出来る。
【0030】
次にペアとなっているCPUが共に故障した場合について説明する。
図5のように、CPU0とCPU1が共に故障状態になった場合、連動グループ1、及び連動グループ2共に4台の稼働CPUによる運用を行うことは出来ない。
【0031】
他のCPUの稼働/待機状態を監視している各CPUは、シリアルバス上のステータス情報から、CPU0及びCPU1が故障状態にあることを検出し、連動CPUグループ動作が実行できないことを認識すると、各CPUは運用停止状態となる。この運用停止状態に入るとCPUモジュールは、アプリケーションプログラムの実行やI/Oデータの転送を停止してシステムを停止状態にする。また、CPUモジュールにあるアラームLEDを点灯し、またアプリケーションプログラム実行LEDを消灯して、運用者に通知する。これにより、運用者は、コントローラシステムが故障によって停止状態に入ったことが判り、直ちに保守を行うことが出来る。
【0032】
尚上記した実施形態では、CPUを2重化したコントローラシステムについて記載しているが、本発明はこれに限らず、連動グループ3、4・・と拡張することによりCPUを3重化以上にした構成にも適用することが出来る。この場合、待機状態にある連動グループのうち稼動状態に切替えるものの選択方法は様々な手法が考えられるが、例えば、連動グループに稼動状態になる優先順位を設定(連動グループ1、連動グループ2、..の順に稼動等)しておいたり、或はネットワークアドレス順(ネットワークアドレスの大きな(小さな)順)に稼動状態に切替える。
【0033】
又本実施形態では、各CPUが自己及び他のCPUがどの連動グループに属するかを記憶しておき、この記憶を元に他のCPUが自己と同じ連動グループに属するかを判断していたが、この様な連動グループへの所属を記憶しておく方式のほか、例えば各CPUのネットワークアドレスから自己と同じ連動グループに属するかどうかを判断する構成として実現することも出来る。
【0034】
更に本実施形態では連動グループを同一のベースボードに実装されているグループとして設定したが、本発明はこの様な連動グループの設定だけに限らず、故障等の稼働/待機切替え要因の発生により新たに稼動させたいCPUの組合わせにより任意に連動グループを設定することが出来る。
【0035】
【発明の効果】
本発明に基づいたコントローラシステムによれば、故障したCPUが生じた場合に於ても、稼働CPU間でのパラレルバスによるデータ転送を可能とする。
【0036】
また、故障CPUモジュールに対して一旦ベースボードの電源を切ってから故障CPUモジュールを交換保守することが出来る。
【図面の簡単な説明】
【図1】本実施形態のコントローラシステムの基本構成を示す図である。
【図2】ステータス情報の構成を示す図である。
【図3】故障CPU発生時の待機CPUの切替えを示す図である。
【図4】CPU1による待機切替え要求メッセージの発行を示す図である。
【図5】ペアCPUが同時に故障した時の状態を示す図である。
【図6】コントローラシステムの一般的な構成を示す図である。
【図7】全CPUモジュールを1つのベースボード上に実装した構成のコントローラシステムを示す図である。
【図8】全ての稼動CPUモジュールを1つのベースボード上に実装した構成を示す図である。
【符号の説明】
10、100 ベースボード
11、101 パラレルバス
12、102 シリアルバス
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information processing apparatus in which CPUs have redundancy by a one-to-one pair configuration, and more particularly to control of CPU operation / standby switching.
[0002]
[Prior art]
FIG. 6 shows a general configuration of a controller system such as a programmable controller.
[0003]
Such a controller system includes one or more CPU modules constituted by a CPU, a memory, etc., an I / O (input / output) module that is connected to a control device and exchanges measurement values and control commands with the device, A communication module or the like shown in the figure is mounted on the base board 100. The CPU takes in input data and performs calculation, and transmits the result to the I / O module to connect the device connected to the I / O module. Take control. In the case of the figure, eight CPU modules CPU modules CPU0 to CPU7 and four I / O modules I / O modules I / O0 to I / O3 are provided on three baseboards 100-1 to 100-3. Has been implemented.
[0004]
The base board 100 supplies power to each mounted module, and each module mounted on the same base board 100 is connected by a parallel bus 101. All modules constituting the system are serially connected by a serial bus 102. In the controller system, the serial bus 102 enables I / O data transfer function and message communication function between modules, and each parallel bus 101 enables high-speed data transfer by a physical access function.
[0005]
By the way, in such a controller system, in order to improve reliability, there is a case where two CPU modules are combined into one set to make the system redundant.
For example, in the configuration of FIG. 6, CPU8 and CPU1, CPU2 and CPU3, CPU4 and CPU5, and CPU6 and CPU7 among the eight CPU modules are paired to perform duplication. Further, the system in this case has a duplex configuration, and CPU0, CPU2, CPU4, and CPU6 are in an operating state and CPU1, CPU3, CPU5, and CPU7 are in a standby state as an initial state.
[0006]
In the configuration of FIG. 6, when the system is in operation, data is exchanged between the active CPUs mainly using the parallel bus 101. A set of CPU modules that can exchange data using the parallel bus 101. Matching is limited. In the case of FIG. 6, the CPU 0 can communicate with the other CPU modules CPU1 to CPU3 on the baseboard 100-1 via the parallel bus 101-1, but the CPU4 to CPU7 on the baseboard 100-2 have a parallel bus. Communication by 101 cannot be performed.
[0007]
In order to deal with this point, there is a configuration in which all CPU modules are mounted on one base board 100-4 and the CPU modules are connected by one parallel bus 101-4 as in the configuration of FIG. In this case, data can be transferred between all the CPU modules by the parallel bus 101-4.
[0008]
Alternatively, a configuration as shown in FIG. The configuration of FIG. 8 is a configuration in which all the operating CPUs are mounted on one base board, and data can be transferred between the operating CPUs 0, 2, 2, and 6 via the parallel bus 101-5.
[0009]
[Problems to be solved by the invention]
In general, the base board 100 does not have a module power switch or a module hot-swap function due to problems such as cost. For this reason, for example, in the case of the configuration shown in FIG. 7, even if an attempt is made to replace the failed CPU 0 while the system is operating when the CPU 0 has failed from the initial state, four CPU modules are mounted on the base board 100-4. Since the CPU is in operation, the CPU 0 cannot be replaced and maintained with the power turned off.
[0010]
Further, in the case of the configuration as shown in FIG. 8, in addition to the problem that the failed CPU module cannot be replaced while the system is operating, for example, when CPU 0 fails from the initial state and CPU 1 switches to the active CPU, Data transfer by the parallel bus cannot be performed between the CPU 2, CPU 4, and CPU 6 in other operating states.
[0011]
Furthermore, in the case of the configuration shown in FIGS. 7 and 8, if both of the CPUs in the pair, for example, CPU0 and CPU1 both fail, the operation is performed with three operating CPUs, and the original performance cannot be exhibited. End up.
[0012]
In view of the above problems, the present invention can always use a parallel bus capable of high-speed data transfer without any software processing between active CPUs, and further, a failed CPU while operating the system and continuing control. An object of the present invention is to provide a controller system that can be replaced and maintained.
[0013]
[Means for Solving the Problems]
In order to solve the above problems, a controller system according to the present invention is premised on a configuration in which a plurality of CPUs are provided and the CPUs are multiplexed to provide redundancy, and each CPU has a standby switching request message issuing means and state switching. Means.
[0014]
The standby switching request message issuing means issues a standby switching request message to the active CPU.
When receiving the standby switching request message, the state switching means switches from the operating state to the standby state.
[0015]
Each of the CPUs is, for example, divided into a plurality of linked groups, and each CPU stores in the linked group storage means which linked group it belongs to. The state switching means switches from the standby state to the operating state when the CPU multiplexed by itself enters the standby state, and the standby switching request message issuing means operates such as a failure of the CPU multiplexed by itself. When a standby switching factor occurs and the own CPU becomes a new operating state, the request message is issued to a CPU belonging to an interlocking group different from the own CPU.
[0016]
Further, when the CPU fails and all the CPUs that have multiplexed the failed CPUs are also in the failure state, the controller system enters the operation stop state.
According to the present invention, a CPU that is newly in operation due to a failure of a CPU that is multiplexed by itself, etc., places that CPU in a standby state by issuing a standby switching message to another CPU that is in an operating state. I can do it. Therefore, for example, an arbitrary CPU such as a CPU mounted on the same base board as itself can be set to be in an operating state.
[0017]
DETAILED DESCRIPTION OF THE INVENTION
An embodiment of the present invention will be described below.
FIG. 1 is a diagram showing a basic configuration of a controller system of the present embodiment. For comparison with the conventional example, the system shown in FIG. 8 includes eight CPUs and four I / Os, and four of them are in operation while the system is in operation. In this case, the basic connection configuration is the same as in FIG. become.
[0018]
The controller system shown in the figure has a configuration in which each module constituting the system is mounted on three base boards 10. The base board 10-1 includes CPU modules CPU 0, CPU 2, CPU 4 and CPU 6, and the base board 10-2. CPU modules CPU1, CPU3, CPU5 and CPU7 are mounted on the base board 10-3, and I / O modules I / O0, I / O1, I / O2 and I / O3 are mounted on the baseboard 10-3. Power is supplied from 10. In addition, a parallel bus 11 (11-1 to 11-3) for connecting each module in the same base board 10 and a serial bus 12 for serially connecting all the modules are provided, and status information to be described later is sent via the serial bus 12. Communicating.
[0019]
As shown in FIG. 1, the eight CPU modules constituting the system are CPU0, CPU2, CPU4 and CPU6 mounted on the base board 10-1, the interlocking group 1, and the CPU1 mounted on the baseboard 10-2. CPU3, CPU5 and CPU7 are defined as the interlocking group 2, and each CPU stores which interlocking group it belongs to. Each CPU is duplicated by a combination of CPU0 and CPU1, CPU2 and CPU3, CPU4 and CPU5, PU6 and CPU7, CPU of interlocking group 1 and CPU of interlocking group 2, and as an initial state, interlocking group 1 All the CPUs on the side are in the operating state and all the CPUs on the interlocking group 2 side are in the standby state.
[0020]
When the controller system enters the operating state, each CPU module cyclically transmits status information from the serial bus 12.
FIG. 2 shows a configuration example of this status information.
[0021]
In the case of the example of FIG. 2, this status information is 8-bit data, and each bit represents the state of the CPU module that is the transmission source. For example, in the case of FIG. 2, bit 7 indicates whether or not application software is running on the CPU module, bit 6 is a fatal failure such as a hardware failure, and bit 5 is a temporary failure. It is a flag indicating a minor failure. Bit 4 indicates whether the CPU module is currently operating or waiting.
[0022]
The CPU module cyclically receives status information transmitted on the serial bus 12 at regular intervals, thereby monitoring the status of other CPU modules and checking whether they are operating normally. From this status information, each CPU module can recognize the failure state and the active / standby state of other CPU modules.
[0023]
3 and 4 are diagrams showing processing when an abnormality occurs in the CPU module while the system is operating.
When an abnormality occurs in CPU 0 in the operating state, status information with bit 6 or bit 7 set to 1 is transmitted on serial bus 12 based on the content of the abnormality. The CPU 1 that is paired with the CPU 0 detects the failure of the CPU 0 from the status information, and switches from the standby state to the operating state as shown in FIG.
[0024]
In the state of FIG. 3, CPU1, CPU2, CPU4, and CPU6 are in an operating state, and data transfer through the parallel bus 11 cannot be performed between the CPU1 and other operating CPUs. Further, since CPU2, CPU4, and CPU6 are in an operating state, the power of the base board 10-1 cannot be turned off for replacement maintenance of the failed module CPU0.
[0025]
Therefore, the CPU 1 that has been switched to the operating state first checks the operating / standby states of the other CPU0, CPU2, CPU3, CPU4, CPU5, CPU6, and CPU7 from the status information of each CPU module on the serial bus 12. As a result, CPU 0 recognizes that it is in a failure state, CPU 2, CPU 4 and CPU 6 are in an operating state, and CPU 3, CPU 5 and CPU 7 are in a standby state.
[0026]
The CPU 1 that does not belong to the same interlocking group 2 as the CPU 1 determines that it does not match the interlocking switching group setting, and issues a standby switching request message from the serial bus 12.
[0027]
FIG. 4 shows the issuance of a standby switching request message by the CPU 1.
Since the CPU 1 belongs to the interlocking group 2, the CPU 2, the CPU 4, and the CPU 6 that are determined not to belong to the interlocking group 2 and are inconsistent with the interlock switching group setting are switched to the CPU 3, CPU 5, and CPU 7 of the interlocking group 2. As shown in FIG. 4, a standby switching request message is issued from the serial bus 12 to these CPU modules. The active CPU that has received this message forcibly switches to the standby CPU.
[0028]
The CPU 2, CPU 4, and CPU 6 that have received the standby switching request message shift from the operating state to the standby state. When the CPUs 3, 5, and 7 that are paired by duplicating the CPUs that are in the standby state detect that the paired CPUs are in the standby state from the status information on the serial bus 12, Is shifted from the standby state to the operating state.
[0029]
Thus, in a state after all the operating CPUs are switched to those belonging to the interlocking group 2, data transfer by the parallel bus 11-2 is possible between the operating CPUs. Since all of CPU2, CPU4, and CPU6 on the same baseboard 10-1 as the failed CPU0 are in a standby state, the power supply of the baseboard 10-1 is turned off to replace and maintain the failed CPU0 module. I can do it.
[0030]
Next, a case where both paired CPUs fail will be described.
As shown in FIG. 5, when both CPU 0 and CPU 1 are in a failure state, both the interlocking group 1 and the interlocking group 2 cannot be operated by four operating CPUs.
[0031]
When each CPU that monitors the operation / standby state of other CPUs detects that the CPU 0 and CPU 1 are in a failure state from the status information on the serial bus and recognizes that the linked CPU group operation cannot be executed, Each CPU enters an operation stop state. When entering the operation stop state, the CPU module stops the execution of the application program and the transfer of I / O data to put the system in the stop state. Further, the alarm LED in the CPU module is turned on, and the application program execution LED is turned off to notify the operator. As a result, the operator knows that the controller system has been stopped due to a failure, and can immediately perform maintenance.
[0032]
In the above-described embodiment, a controller system with a dual CPU is described. However, the present invention is not limited to this, and the CPU is tripled or more by expanding to interlocking groups 3, 4,. It can also be applied to configurations. In this case, various methods can be considered for selecting one of the linked groups in the standby state to be switched to the operating state. For example, the priority order of the linked group to enter the operating state is set (linked group 1, linked group 2,. , Etc.) or switch to the operating state in the order of network addresses (in order of large (small) network addresses).
[0033]
Further, in this embodiment, each CPU stores which linked group it belongs to and the other CPU, and based on this storage, it is determined whether the other CPU belongs to the same linked group as itself. In addition to such a method of storing the affiliation to the interlocking group, for example, it can be realized as a configuration for determining whether or not it belongs to the same interlocking group from its own network address from each CPU.
[0034]
Furthermore, in this embodiment, the interlocking group is set as a group mounted on the same base board. However, the present invention is not limited to such a setting of the interlocking group. An interlocking group can be arbitrarily set depending on the combination of CPUs to be operated.
[0035]
【The invention's effect】
According to the controller system based on the present invention, even when a failed CPU occurs, data can be transferred between the active CPUs by the parallel bus.
[0036]
Further, the failed CPU module can be replaced and maintained after the base board is powered off.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a basic configuration of a controller system according to an embodiment.
FIG. 2 is a diagram illustrating a configuration of status information.
FIG. 3 is a diagram illustrating switching of a standby CPU when a failed CPU occurs.
FIG. 4 is a diagram showing issuance of a standby switching request message by CPU 1;
FIG. 5 is a diagram showing a state when paired CPUs fail at the same time.
FIG. 6 is a diagram showing a general configuration of a controller system.
FIG. 7 is a diagram showing a controller system having a configuration in which all CPU modules are mounted on one base board.
FIG. 8 is a diagram showing a configuration in which all active CPU modules are mounted on one base board.
[Explanation of symbols]
10, 100 Base board 11, 101 Parallel bus 12, 102 Serial bus

Claims (2)

複数のCPUと、1つ以上の前記CPUを搭載し、該搭載したCPUに電力を供給する複数のベースボードを備え、前記CPUを前記ベースボード単位で多重化して冗長化を持たせる構成のコントローラシステムにおいて、
各CPUは、
前記各CPUのうち同一の前記ベースボードに搭載されているものを同一のグループとし、自己がどの連動グループに属するかを記憶する連動グループ記憶手段と、
稼働CPUに対して、待機切替え要求メッセージを発行する待機切替え要求メッセージ発行手段と、
前記待機切替え要求メッセージを受取ると、稼働状態から待機状態に切替える状態切替え手段と
を備え、
前記状態切替え手段は、自己が多重化しているCPUが待機状態に入ると、待機状態から稼動状態に切替え、前記待機切替え要求メッセージ発行手段は、稼働/待機切替え要因が発生して自CPUが新たに稼働状態となった時、自CPUと異なる連動グループに属するCPUに対し、前記要求メッセージを発行することによって、前記連動グループ単位で稼働系/待機系を切替えることを特徴とするコントローラシステム。
A controller having a plurality of CPUs and one or more CPUs, a plurality of base boards for supplying power to the mounted CPUs, and multiplexing the CPUs in units of the base boards to provide redundancy In the system,
Each CPU
Interlocking group storage means for storing what is mounted on the same base board among the CPUs as the same group and which interlocking group the self belongs to;
A standby switching request message issuing means for issuing a standby switching request message to the active CPU;
Upon receipt of the standby switching request message, a state switching means for switching from the operating state to the standby state, and
The state switching means switches from the standby state to the active state when the CPU that is multiplexed into the standby state enters the standby state, and the standby switching request message issuing means causes the operation / standby switching factor to occur and The controller system is characterized in that when the system is in an operating state, the active system / standby system is switched in units of the interlocking group by issuing the request message to a CPU belonging to an interlocking group different from the own CPU.
前記CPUが故障し、該故障したCPUを多重化しているCPUも全て故障状態にある時、システムを運用停止状態とすることを特徴とする請求項1に記載のコントローラシステム。  2. The controller system according to claim 1, wherein when the CPU fails and all the CPUs that multiplex the failed CPUs are also in a failure state, the system is put into an operation stop state.
JP2000204874A 2000-07-06 2000-07-06 Controller system Expired - Lifetime JP4465824B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000204874A JP4465824B2 (en) 2000-07-06 2000-07-06 Controller system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000204874A JP4465824B2 (en) 2000-07-06 2000-07-06 Controller system

Publications (2)

Publication Number Publication Date
JP2002024050A JP2002024050A (en) 2002-01-25
JP4465824B2 true JP4465824B2 (en) 2010-05-26

Family

ID=18702061

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000204874A Expired - Lifetime JP4465824B2 (en) 2000-07-06 2000-07-06 Controller system

Country Status (1)

Country Link
JP (1) JP4465824B2 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3606281B2 (en) * 2002-06-07 2005-01-05 オムロン株式会社 Programmable controller, CPU unit, special function module, and duplex processing method
JP4591149B2 (en) * 2005-03-29 2010-12-01 日本電気株式会社 Cluster system, blade server power control method and program thereof
JP4591185B2 (en) * 2005-04-28 2010-12-01 株式会社日立製作所 Server device
JP2007172334A (en) * 2005-12-22 2007-07-05 Internatl Business Mach Corp <Ibm> Method, system and program for securing redundancy of parallel computing system
JP4516933B2 (en) * 2006-05-09 2010-08-04 キリンエンジニアリング株式会社 Control system and control device group updating method
JP4755968B2 (en) * 2006-12-07 2011-08-24 株式会社東芝 Duplex control device and automatic repair method for multi-bit error in memory section thereof
JP4788597B2 (en) * 2006-12-26 2011-10-05 株式会社明電舎 Programmable controller redundant system
JP6175958B2 (en) * 2013-07-26 2017-08-09 富士通株式会社 MEMORY DUMP METHOD, PROGRAM, AND INFORMATION PROCESSING DEVICE

Also Published As

Publication number Publication date
JP2002024050A (en) 2002-01-25

Similar Documents

Publication Publication Date Title
US4984240A (en) Distributed switching architecture for communication module redundancy
EP1768320A2 (en) Information processing apparatuses, communication method, communication load decentralizing method and communication system
WO2005101732A1 (en) Interchangeable power over ethernet module
JP4465824B2 (en) Controller system
JP2004054907A (en) Programmable controller and cpu unit, and communication unit and method for controlling communication unit
JP2002073221A (en) Uninteruptible power supply system
CN111628944B (en) Switch and switch system
KR100195065B1 (en) Data network matching device
JP3908596B2 (en) Call server and its port switching method
JP2002136000A (en) Uninterruptible power supply system
JP2009075710A (en) Redundant system
JP2003186578A (en) Method and apparatus for supplying redundant power
JP2002247017A (en) Communication line switching device
KR100440588B1 (en) Status Recognition and Alarm Device of Serial Bus Type Supporting hierarchical Structure
JPH08149145A (en) Lan system
CN1286014C (en) Method of recovery from acting module failure
KR960003784B1 (en) Interconnection and its operation of processor unit communication
JPH0427239A (en) Control method for lan connecting device
CN115037674B (en) Single-machine and multi-equipment redundancy backup method for central control system
JPH09305494A (en) Data transfer control circuit for extended storage device
JP2004159205A (en) Network connection system, method therefor, and backplane for server
JP2737480B2 (en) Method and apparatus for switching redundant communication control device
KR100431203B1 (en) IPC Dual Redundancy Scheme using Ethernet HUB board
JPH1165867A (en) System doubling method for load decentralized type system
JPH0441857B2 (en)

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040218

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070702

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080919

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20080919

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080919

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090421

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090428

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090622

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091124

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100202

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100215

R150 Certificate of patent or registration of utility model

Ref document number: 4465824

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130305

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140305

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term