JP5370222B2 - Communication device having redundant configuration and operation standby switching method thereof - Google Patents
Communication device having redundant configuration and operation standby switching method thereof Download PDFInfo
- Publication number
- JP5370222B2 JP5370222B2 JP2010056125A JP2010056125A JP5370222B2 JP 5370222 B2 JP5370222 B2 JP 5370222B2 JP 2010056125 A JP2010056125 A JP 2010056125A JP 2010056125 A JP2010056125 A JP 2010056125A JP 5370222 B2 JP5370222 B2 JP 5370222B2
- Authority
- JP
- Japan
- Prior art keywords
- communication
- health check
- unit
- board
- communication unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
本発明は、1+1冗長構成等の冗長構成を有する通信装置及びその稼働待機切替方法に関するものである。 The present invention relates to a communication apparatus having a redundant configuration such as a 1 + 1 redundant configuration and an operation standby switching method thereof.
通信装置では、実装規格としてCompactPCI(cPCI)或いはAdvancedTCA(ATCA)等が使用される。これらの規格に従った実装の場合には、目的別の機能と共に通信機能を有する通信ボードが装着されるが、2つ以上の同一の通信ボードで、1+1(ACTIVE(稼働)/STANDBY(待機)、又はACTIVE/ACTIVE)冗長構成や、N+1(ACTIVE/STANDBY)冗長構成を取ることが多い。 In the communication apparatus, CompactPCI (cPCI) or AdvancedTCA (ATCA) is used as a mounting standard. In the case of mounting in accordance with these standards, a communication board having a communication function as well as a function for each purpose is mounted, but 1 + 1 (ACTIVE (operation) / STANDBY (standby) with two or more identical communication boards. , Or ACTIVE / ACTIVE) redundant configuration or N + 1 (ACTIVE / STANDBY) redundant configuration.
一般に、このような冗長構成を有する通信装置の内、特に、ACTIVE/STADBYの1+1冗長構成をとる通信装置においては、ACTIVE状態の通信ボード及びSTANDBY状態の通信ボードが各々相手の異常状態をヘルスチェックによって検出し、異常検出時にはACTIVE/STANDBYの状態を切替制御する(特許文献1参照)。 In general, among communication devices having such a redundant configuration, particularly in communication devices having an ACTIVE / STADBY 1 + 1 redundant configuration, the communication board in the ACTIVE state and the communication board in the STANDBY state each check the abnormal state of the other party. When an abnormality is detected, the state of ACTIVE / STANDBY is switched (see Patent Document 1).
また、装置外部及び内部の通信用のスイッチ機能を持ったスイッチボードが2つ装着され、ACTIVE/ACTIVEの1+1冗長構成をとり、通信装置内のボード間通信は、スイッチボードを経由する構成となっている。更に、各ボードには1つのスイッチボードと物理的に接続するインターフェースが2つ以上実装される。例えば、2つの物理インターフェースをACTIVE/STANDBYで1つの冗長経路とし、2つのスイッチボードに各々接続する構成をとることが多い。 In addition, two switch boards having a switch function for communication outside and inside the apparatus are mounted, and a 1 + 1 redundant configuration of ACTIVE / ACTIVE is taken, and inter-board communication in the communication apparatus is configured via the switch board. ing. Further, two or more interfaces that are physically connected to one switch board are mounted on each board. For example, in many cases, two physical interfaces are configured as one redundant path by ACTIVE / STANDBY and connected to two switch boards, respectively.
図1は1+1冗長構成の通信装置を示している。この通信装置は通信機能を有する冗長構成の通信部である2つの通信ボード100及び200と、2つのスイッチボード300及び400とを有している。通信ボード100はボードコントローラ101、IF(インターフェース)コントローラ111、及び2つのポート121,122を備えている。ボードコントローラ101はIFコントローラ111に接続され、IFコントローラ111はポート121,122に個別に接続されている。同様に、通信ボード200はボードコントローラ201、IFコントローラ211、及び2つのポート221,222を備え、同様に接続されている。
FIG. 1 shows a communication apparatus having a 1 + 1 redundant configuration. This communication apparatus includes two
ボードコントローラ101は通信ボード100内の各デバイスのヘルスチェック、及び冗長構成のうちの他ボードとなるボード200のヘルスチェック、並びに自ボード100のACTIVE(稼働)/STANDBY(待機)状態を切り替え制御する機能を持つ。同様に、ボードコントローラ201は通信ボード200内の各デバイスのヘルスチェック、冗長構成のうちの他ボードとなるボード100のヘルスチェック、及び自ボード200のACTIVE/STANDBY状態を切り替え制御する機能を持つ。図1の通信装置では、通信ボード100がACTIVE状態にされ、通信ボード200がSTANBY状態にされた場合を示している。IFコントローラ111はボード間通信の際にポート121,122を制御し、IFコントローラ211はボード間通信の際にポート221,222を制御する。ポート121,122及び221,222は外部通信インターフェースポートであり、通信ボード内でACTIVE/STANDBYの冗長構成をとっている。図1の通信装置ではポート121,221がACTIVE状態にされ、ポート122,222がSTANBY状態にされた場合を示している。
The
通信ボード100,200各々はスイッチボード300又は400を経由して外部網であるIP(インターネットプロトコル)網800と接続可能にされている。また、通信ボード100,200間の通信はスイッチボード300又は400を経由して行われる。スイッチボード300及び400はIP網800を介した装置外部との通信及び通信ボード間の通信を中継するためのスイッチ機能を備えている。スイッチボード300はポート121及び221に各々接続され、スイッチボード400はポート122及び222に各々接続されている。
Each of the
図1の通信装置では、スイッチボード300及び400は共にACTIVE状態にされた場合を示している。ヘルスチェックの際には図2に太線Aで示すように、通信ボード100,200間の通信ではスイッチボード300を介した通信経路がACTIVE経路として優先的に使用される。一方、スイッチボード400を介した通信経路は、ACTIVE経路が異常状態であるときに切り替えて使用されるSTANDBY経路とされる。
In the communication apparatus of FIG. 1, the
ヘルスチェック処理において、図3に示すように、通信ボード100のボードコントローラ101及び通信ボード200のボードコントローラ201各々は、自ボード内ヘルスチェックのために自ボード内の各デバイスに対してヘルスチェック要求を生成し(ステップS1)、それに対する応答を受信したか否かを判別する(ステップS2)。各デバイスはヘルスチェック要求を受信すると、それに対する応答をボードコントローラに送信する機能を有している。ボードコントローラ101,201はヘルスチェック要求の送信後、所定時間に亘って応答受信がないデバイスを異常状態と判断する(ステップS3)。異常状態とされたデバイスがボード内で冗長構成であるか否かを判別し(ステップS4)、冗長構成でない場合には自ボードがACTIVE状態にあるか否かを判別する(ステップS5)。ACTIVE状態にあるならば、自ボードと共に冗長構成をなす他ボードにACTIVEへの切り替えを指示し(ステップS6)、自ボードをSTANDBY状態に切り替え設定する共に異常状態としての記憶を残す(ステップS7)。
In the health check process, as shown in FIG. 3, the
ステップS2で各デバイスから応答受信があり各デバイスが正常状態であった場合、ステップS4で異常状態とされたデバイスがボード内で冗長構成である場合、或いはステップS5で自ボードがSTANDBY状態にある場合には、他ボードヘルスチェック処理が開始される。 If a response is received from each device in step S2 and each device is in a normal state, if the device in an abnormal state in step S4 has a redundant configuration in the board, or the own board is in a STANDBY state in step S5 In this case, the other board health check process is started.
他ボードヘルスチェック処理では、ボード100のボードコントローラ101及びボード200のボードコントローラ201各々は、図4に示すように、現在のACTIVE経路を介して冗長構成をなす他ボードに対してヘルスチェック要求を送信する(ステップS8)。そして、そのヘルスチェック要求に対する応答を受信したか否かを判別する(ステップS9)。ボードコントローラ101,201各々はヘルスチェック要求を受信すると、それに対する応答を他ボードのボードコントローラに送信する機能を有している。ボードコントローラ101,201はヘルスチェック要求の送信後、所定時間に亘って応答受信がないときには現在のACTIVE経路を異常状態と判断して現在のACTIVE経路をSTANDBY経路に切り替え設定し(ステップS10)、現在のSTANDBY経路をACTIVE経路に切り替え設定する(ステップS11)。その後、新たに設定されたACTIVE経路を介して冗長構成をなす他ボードに対してヘルスチェック要求を送信し(ステップS12)、そのヘルスチェック要求に対する応答を受信したか否かを判別する(ステップS13)。ボードコントローラ101,201はヘルスチェック要求の送信後、所定時間に亘って応答受信がないときには現在のACTIVE経路を異常状態と判断して冗長構成をなす他ボードを異常状態と判断する(ステップS14)。そして、自ボードがACTIVE状態にあるか否かを判別する(ステップS15)。ACTIVE状態になくSTANDBY状態にあるならば、自ボードをACTIVE状態への切り替え設定し(ステップS16)、冗長構成の他ボードをSTANDBY状態と設定する(ステップS17)。
In the other board health check process, each of the
ここで、通信ボード100の非冗長デバイスであるIFコントローラ111が図5に符号Bで示すように故障した場合について説明する。ボードコントローラ101は、ステップS1及びS2による通信ボード100内のヘルスチェックによりIFコントローラ111の異常をステップS3で検出する。そうすると、ステップS4でIFコントローラ111は冗長構成でないと判別されるので、ACTIVE状態の通信ボード100のボードコントローラ101は、ステップS6及びS7を実行して通信ボード200にACTIVEへの切り替えを指示し、通信ボード100をSTANDBY状態に制御することが行われる。ただし、IFコントローラ111が故障であるので、ステップS6の指示が通信ボード200に到達せず通信ボード200のACTIVE状態への切り替えは実行されない。
Here, a case where the
一方、通信ボード200のボードコントローラ201は、IFコントローラ111が故障した場合には、ステップS1及びS2による自ボードである通信ボード200内のヘルスチェック処理によりその結果が正常と判断するので、直ちに、他ボードヘルスチェック処理を開始する。他ボードヘルスチェック処理でボードコントローラ201は、ステップS8及びS9の実行により通信ボード200の他ボードである通信ボード100への現在のACTIVE経路(ポート221からスイッチボード300を介した通信ボード100への経路)が異常であると判断する。そこで、ステップS10で現在のACTIVE経路をSTANDBY経路に切り替え設定し、ステップS11で現在のSTANDBY経路(ポート222からスイッチボード400を介した通信ボード100への経路)をACTIVE経路に切り替え設定する。その後、ステップS12及びS13の実行により通信ボード200から通信ボード100への新たなACTIVE経路(ポート222からスイッチボード400を介した通信ボード100への経路)でも他ボードヘルスチェックの受信応答が得られないために通信ボード100が異常であると判断する。更に、ボードコントローラ201は、ステップS16で自ボード200をACTIVE状態への切り替え設定し、ステップS17で他ボード100をSTANDBY状態と設定する。
On the other hand, when the
よって、IFコントローラ111が故障した場合には通信ボード200がACTIVE状態となってスイッチボード300又は400を介して装置外部との通信が可能とされる。
Therefore, when the
次に、通信ボード100の冗長構成のポート121,122のうちのポート121が図6に符号Cで示すように故障した場合の処理を説明する。ボードコントローラ101は、ステップS1及びS2による通信ボード100内のヘルスチェックによりポート121の異常をステップS3で検出する。そうすると、ステップS4でポート121は冗長構成であると判別されるので、直ちに、他ボードヘルスチェック処理を開始する。他ボードヘルスチェック処理でボードコントローラ101は、ステップS8及びS9の実行により通信ボード100の他ボードである通信ボード200への現在のACTIVE経路(ポート121からスイッチボード300を介した通信ボード200への経路)が異常であると判断する。そこで、ステップS10で現在のACTIVE経路をSTANDBY経路に切り替え設定し、ステップS11で現在のSTANDBY経路(ポート122からスイッチボード400を介した通信ボード200への経路)をACTIVE経路に切り替え設定する。その後、ステップS12及びS13の実行により通信ボード100から通信ボード200への新たなACTIVE経路(ポート122からスイッチボード400を介した通信ボード200への経路)では他ボードヘルスチェックの受信応答が得られるので、通信ボード200が正常であることが判断される。
Next, processing when the
よって、ポート121が故障した場合には通信ボード10はポート122をACTIVEとして、スイッチボード400を介して装置外部又はボード200との通信が可能とされる。
Therefore, when the
しかしながら、上記構成の従来の通信装置においては、自ボード内でデバイスが異常であってもそのデバイスの異常を検出できない、いわゆるサイレント故障に対応していないという欠点があった。例えば、デバイスとして例えば、IFコントローラ111に対してヘルスチェック要求を送信すると、それに対して応答があってもIFコントローラ111が正常なIFコントロール動作をなし得ない場合である。そのようなサイレント故障の場合には自ボードではいずれのポートを介した経路でもヘルスチェック結果が異常となり、よって自ボードと共に冗長構成をなす他ボードの異常と判断することが行われてしまうので、自ボード及び他ボード共にACTIVE状態となるという不具合が生じ、通信装置が外部網を介した適切な通信を維持提供することができなくなる。
However, the conventional communication apparatus having the above-described configuration has a drawback in that it cannot cope with a so-called silent failure in which an abnormality of the device cannot be detected even if the device is abnormal in the board. For example, when a health check request is transmitted to the
本発明の目的は、冗長構成の少なくとも2つの通信部内のデバイスでサイレント故障が起きた場合にも適切な通信状態を維持することができる冗長構成を有する通信装置及びその稼働待機切替方法を提供することである。 An object of the present invention is to provide a communication device having a redundant configuration capable of maintaining an appropriate communication state even when a silent failure occurs in devices in at least two communication units having a redundant configuration, and an operation standby switching method thereof. That is.
本発明の通信装置は、各々が通信機能を備えた少なくとも第1及び第2の通信部を有する冗長構成部と、前記第1の通信部と前記第2の通信部と装置外部網とのうちのいずれか2つの間を第1の通信経路を介して切り替え接続する第1のスイッチ部と、前記第1の通信部と前記第2の通信部と前記装置外部網とののいずれか2つの間を前記第1の通信経路とは異なる第2の通信経路を介して切り替え接続する第2のスイッチ部と、を備える通信装置であって、前記第1のスイッチ部は前記第1の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第1のスイッチヘルスチェック手段を有し、前記第2のスイッチ部は前記第2の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第2のスイッチヘルスチェック手段を有し、前記第1及び第2の通信部各々は、自身の通信部から前記第1及び第2の通信経路のうちのいずれか一方の通信経路を介して他方の通信部のヘルスチェックを行う第1のヘルスチェック手段と、前記第1のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記自身の通信部から前記第1及び第2の通信経路のうちの他方の通信経路を介して前記他方の通信部のヘルスチェックを行う第2のヘルスチェック手段と、前記第2のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記第1及び第2のスイッチヘルスチェック手段のうちの少なくとも一方から前記自身の通信部についての前記ヘルスチェック結果を得る確認手段と、前記自身の通信部について前記確認手段によって得られた前記ヘルスチェック結果が正常であるとき前記自身の通信部を稼働状態に設定し、前記自身の通信部について前記確認手段によって得られた前記ヘルスチェック結果が正常でないとき前記自身の通信部を待機状態に設定する設定手段と、を有することを特徴としている。 The communication device of the present invention includes a redundant configuration unit having at least first and second communication units each having a communication function, and the first communication unit, the second communication unit, and the device external network. Any one of the first switch unit that switches between the two via the first communication path, the first communication unit, the second communication unit, and the device external network A second switch unit that switches between and connects via a second communication path that is different from the first communication path, wherein the first switch unit is the first communication path. A first switch health check means for performing a health check on each of the first and second communication units via the network and storing the health check result, and the second switch unit includes the second communication unit. Each of the first and second communication units via a path A second switch health check unit that performs health check and stores the health check result, and each of the first and second communication units communicates with the first and second communication paths from its own communication unit. A first health check unit that performs a health check of the other communication unit via any one of the communication paths, and the result of the first health check unit is an abnormality of the other communication unit A second health check unit that performs a health check of the other communication unit from the communication unit via the other communication path of the first and second communication paths; and a second health check unit When the result is an abnormality in the other communication unit, the health check result for the own communication unit from at least one of the first and second switch health check means. And when the health check result obtained by the confirmation unit is normal for the own communication unit, the own communication unit is set to an operating state, and the own communication unit is set by the confirmation unit. Setting means for setting the communication unit of the device to a standby state when the obtained health check result is not normal.
本発明の稼働待機切替方法は、各々が通信機能を備えた少なくとも第1及び第2の通信部を有する冗長構成部と、前記第1の通信部と前記第2の通信部と装置外部網とのうちのいずれか2つの間を第1の通信経路を介して切り替え接続する第1のスイッチ部と、前記第1の通信部と前記第2の通信部と前記装置外部網とののいずれか2つの間を前記第1の通信経路とは異なる第2の通信経路を介して切り替え接続する第2のスイッチ部と、を備える通信装置の稼働待機切替方法であって、前記第1のスイッチ部において前記第1の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第1のスイッチヘルスチェックステップと、前記第2のスイッチ部において前記第2の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第2のスイッチヘルスチェックステップと、を備え、前記第1及び第2の通信部各々において、自身の通信部から前記第1及び第2の通信経路のうちのいずれか一方の通信経路を介して他方の通信部のヘルスチェックを行う第1のヘルスチェックステップと、前記第1のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記自身の通信部から前記第1及び第2の通信経路のうちの他方の通信経路を介して前記他方の通信部のヘルスチェックを行う第2のヘルスチェックステップと、前記第2のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記第1及び第2のスイッチヘルスチェック手段のうちの少なくとも一方から前記自身の通信部についての前記ヘルスチェック結果を得る確認ステップと、前記自身の通信部について前記確認ステップによって得られた前記ヘルスチェック結果が正常であるとき前記自身の通信部を稼働状態に設定し、前記自身の通信部について前記確認ステップによって得られた前記ヘルスチェック結果が正常でないとき前記自身の通信部を待機状態に設定する設定ステップと、を備えることを特徴としている。 The operation standby switching method of the present invention includes a redundant configuration unit having at least first and second communication units each having a communication function, the first communication unit, the second communication unit, and an apparatus external network. Any one of the first switch unit that switches and connects between any two of the two through the first communication path, the first communication unit, the second communication unit, and the device external network A second switch unit that switches between and connects two via a second communication path that is different from the first communication path, wherein the first switch unit A first switch health check step for performing a health check of each of the first and second communication units via the first communication path and storing the health check result; and in the second switch unit Said second communication path A second switch health check step for performing a health check on each of the first and second communication units and storing the health check result via each of the first and second communication units, A first health check step for performing a health check of the other communication unit from one of the communication units via one of the first and second communication paths; and the first health check unit A second health check of the other communication unit from the own communication unit via the other communication path of the first and second communication paths when the result is an abnormality of the other communication unit. Of the first and second switch health check means when the result of the second health check means is an abnormality in the other communication unit. Both the confirmation step for obtaining the health check result for the communication unit from one side and the health check result obtained by the confirmation step for the communication unit is normal when the health check result is normal. And a setting step for setting the communication unit in a standby state when the health check result obtained by the confirmation step is not normal for the communication unit.
本発明の通信装置及びその稼働待機切替方法によれば、冗長構成をなす第1及び第2の通信部のうちの稼働状態にある通信部内のデバイスがサイレント故障した場合に、その通信部の異常を判断し、また正常な通信部を判断し、正常な通信部を稼働状態にするので、サイレント故障時であっても正常な通信機能を確保することができ、外部網を介した通信サービスを提供し続けることができる。 According to the communication apparatus and the operation standby switching method of the present invention, when a device in the communication unit in the operating state among the first and second communication units having a redundant configuration fails silently, the communication unit is abnormal. In addition, the normal communication unit is determined and the normal communication unit is put into operation, so that a normal communication function can be ensured even during a silent failure, and communication services via an external network can be secured. You can continue to provide.
以下、本発明の実施例を図面を参照しつつ詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図7は本発明の実施例として他ボードヘルスチェック処理を示している。この他ボードヘルスチェック処理は図1に示した通信装置に適用され、その通信装置内のボードコントローラ101,201各々によって実行される。また、他ボードヘルスチェック処理は図3に示したヘルスチェック処理のステップS2で自ボード内の各デバイスからヘルスチェック要求に対して応答受信があった場合に実行される。
FIG. 7 shows another board health check process as an embodiment of the present invention. This other board health check process is applied to the communication apparatus shown in FIG. 1, and is executed by each of the
なお、通信ボード100が第1の通信部に相当し、通信ボード200が第2の通信部に相当し、スイッチボード300が第1のスイッチ部に相当し、スイッチボード400が第2のスイッチ部に相当する。通信ボード100,200とスイッチボード300との間の経路が第1の通信経路に相当し、通信ボード100,200とスイッチボード400との間の経路が第2の通信経路に相当する。また、自ボードが自身の通信部に対応し、他ボードが他方の通信部に対応する。
The
他ボードヘルスチェック処理において、通信ボード100のボードコントローラ101及び通信ボード200のボードコントローラ201各々は、現在のACTIVE経路を介して冗長構成の他ボードに対してヘルスチェック要求を送信する(ステップS21)。そして、そのヘルスチェック要求に対する応答を受信したか否かを判別する(ステップS22)。ボードコントローラ101,201各々はヘルスチェック要求を受信すると、それに対する応答を他ボードのボードコントローラに送信する機能を有している。よって、ヘルスチェック要求の送信後、所定時間に亘って応答受信がないときには現在のACTIVE経路を異常状態と判断することができるので、ボードコントローラ101,201は現在のACTIVE経路をSTANDBY経路に切り替え設定し(ステップS23)、現在のSTANDBY経路をACTIVE経路に切り替え設定する(ステップS24)。その後、新たに設定されたACTIVE経路を介して冗長構成の他ボードに対してヘルスチェック要求を送信し(ステップS25)、そのヘルスチェック要求に対する応答を受信したか否かを判別する(ステップS26)。所定時間に亘って応答受信がないときには現在のACTIVE経路を異常状態と判断することができるので、ボードコントローラ101,201は次に、スイッチボード300,400のヘルスチェックの結果を確認する(ステップS27)。このスイッチボード300,400のヘルスチェックは後述のスイッチボードヘルスチェック処理で実行され、ステップS27ではその結果の獲得が行われる。
In the other board health check process, each of the
なお、ステップS21及びS22の実行が第1のヘルスチェック手段に相当し、ステップS23〜S26の実行が第2のヘルスチェック手段に相当する。また、ステップS27の実行が確認手段に相当する。 The execution of steps S21 and S22 corresponds to the first health check means, and the execution of steps S23 to S26 corresponds to the second health check means. Moreover, execution of step S27 corresponds to a confirmation means.
ステップS27の実行後、スイッチボード300,400のヘルスチェックの結果に応じて自ボードが正常であるか否かを判別する(ステップS28)。スイッチボードヘルスチェック処理で自ボードが正常状態と判別されたならば、他ボードの異常状態と判断し(ステップS29)、自ボードが異常状態と判別されたならば、自ボードの異常状態と判断する(ステップS30)。
After execution of step S27, it is determined whether or not the own board is normal according to the result of the health check of the
ステップS29で他ボードの異常状態と判断した場合には、自ボードがACTIVE状態にあるか否かを判別する(ステップS31)。ACTIVE状態になくSTANDBY状態にあるならば、自ボードをACTIVE状態への切り替え設定し(ステップS32)、冗長構成の他ボードをSTANDBY状態と設定する(ステップS33)。 If it is determined in step S29 that the other board is in an abnormal state, it is determined whether or not the own board is in the ACTIVE state (step S31). If it is not in the ACTIVE state but is in the STANDBY state, the own board is set to be switched to the ACTIVE state (step S32), and the other board in the redundant configuration is set to the STANDBY state (step S33).
ステップS30で自ボードの異常状態と判断した場合には、自ボードがACTIVE状態にあるか否かを判別する(ステップS34)。ACTIVE状態にあるならば、自ボードをSTANDBY状態と設定する(ステップS35)。上記のステップS28〜S35の実行が設定手段に対応する。 If it is determined in step S30 that the board is in an abnormal state, it is determined whether or not the board is in the ACTIVE state (step S34). If it is in the ACTIVE state, the own board is set to the STANDBY state (step S35). The execution of the above steps S28 to S35 corresponds to the setting means.
スイッチボード300,400各々は自身でヘルスチェックを実行してその結果を保持する機能を有している。また、スイッチボード300,400各々は上記のステップS27では通信ボード100,200のいずれからのヘルスチェック結果確認要求に応答してその結果を送信する。
Each of the
スイッチボード300,400各々のスイッチボードヘルスチェック処理は図示しない内部コントローラによって実行される。図8に示すように、先ず、通信ボード100に対してヘルスチェック要求を生成し(ステップS41)、それに対する応答を受信したか否かを判別する(ステップS42)。ヘルスチェック要求の送信後、所定時間に亘って応答受信がないときには通信ボード100が異常状態にあるとみなすことができるので、スイッチボード300,400各々の内部コントローラは通信ボード100の異常状態を記憶する(ステップS43)。このステップS41〜S43の実行が第1のスイッチヘルスチェック手段に相当する。
The switch board health check process for each of the
通信ボード100に対するヘルスチェック後、同様に、通信ボード200に対してヘルスチェック要求を生成し(ステップS44)、それに対する応答を受信したか否かを判別する(ステップS45)。ヘルスチェック要求の送信後、所定時間に亘って応答受信がないときには通信ボード200が異常状態にあるとみなすことができるので、スイッチボード300,400各々の内部コントローラは通信ボード200の異常状態を記憶する(ステップS46)。このステップS44〜S46の実行が第2のスイッチヘルスチェック手段に相当する。
After the health check for the
ここで、通信ボード100の非冗長デバイスであるIFコントローラ111が上記したサイレント故障した場合について説明する。なお、図1に示したように通信ボード100がACTIVE状態であり、通信ボード200がSTANDBY状態である。
Here, a case will be described in which the
ボードコントローラ101は、ステップS1及びS2による自ボードである通信ボード100内のヘルスチェック処理によりその結果が正常と判断するので、直ちに、他ボードヘルスチェック処理を開始する。すなわち、ステップS1でデバイスの1つであるIFコントローラ111に対してヘルスチェック要求を送信すると、それに対してはIFコントローラ111からの応答があるので、このステップS1及びS2ではIFコントローラ111の異常を判断することができない。
Since the
他ボードヘルスチェック処理でボードコントローラ101は、ステップS21及びS22の実行により通信ボード100の他ボードである通信ボード200への現在のACTIVE経路(ポート121からスイッチボード300を介した通信ボード200への経路)が異常であると判断する。そこで、ステップS23で現在のACTIVE経路をSTANDBY経路に切り替え設定し、ステップS24で現在のSTANDBY経路(ポート122からスイッチボード400を介した通信ボード200への経路)をACTIVE経路に切り替え設定する。その後、ステップS25及びS26の実行により通信ボード100から通信ボード200への新たなACTIVE経路(ポート122からスイッチボード400を介した通信ボード200への経路)でも他ボードヘルスチェック要求の受信応答が得られないために異常であると判断する。次いで、ボードコントローラ101は、ステップS27にて現在のACTIVE経路を介してスイッチボード400にヘルスチェック結果確認要求を行うので、その結果、所定時間に亘って応答無しのためにステップS30で自ボードが異常であると判断する。よって、通信ボード100はACTIVE状態であるので、ステップS35でボードコントローラ101は、自ボードである通信ボード100をSTANDBY状態に切り替え設定する。
In the other board health check process, the
一方、ボードコントローラ201は、ステップS1及びS2による自ボードである通信ボード200内のヘルスチェック処理によりその結果が正常と判断するので、直ちに、他ボードヘルスチェック処理を開始する。
On the other hand, since the
他ボードヘルスチェック処理でボードコントローラ201は、ステップS21及びS22の実行により通信ボード200の他ボードである通信ボード100への現在のACTIVE経路(ポート221からスイッチボード300を介した通信ボード100への経路)が異常であると判断する。そこで、ステップS23で現在のACTIVE経路をSTANDBY経路に切り替え設定し、ステップS24で現在のSTANDBY経路(ポート222からスイッチボード400を介した通信ボード100への経路)をACTIVE経路に切り替え設定する。その後、ステップS25及びS26の実行により通信ボード100への新たなACTIVE経路(ポート122からスイッチボード400を介した通信ボード200への経路)でも他ボードヘルスチェック要求の受信応答が得られないために異常であると判断する。次いで、ボードコントローラ201は、ステップS27にて現在のACTIVE経路を介してスイッチボード400にヘルスチェック結果確認要求を行うので、その結果、通信ボード100の異常であるという応答を獲得し、ステップS29では他ボードの異常と断定する。よって、通信ボード200はSTANDBY状態であるので、ステップS32でボードコントローラ201は、自ボードである通信ボード200をACTIVE状態に切り替え設定する。
In the other board health check process, the
従って、IFコントローラ111がサイレント故障した場合には、通信ボード100がACTIVE状態からSTANDBY状態に切り替わり、一方、通信ボード200がSTANDBY状態からACTIVE状態に切り替わるので、サイレント故障時であっても通信ボード100に代わって通信ボード200がACTIVE状態となることにより正常な通信機能を確保することができ、外部網800を介した通信サービスを提供し続けることができる。
Therefore, when the
なお、ステップS27ではACTIVE経路をポート121からスイッチボード300への経路に切り替えてスイッチボード300に対してもヘルスチェック結果確認要求を行ってその応答無し又はボード100の異常結果を得ても良い。また、ポート121,122のうちのいずれか一方がサイレント故障している場合にも対処することができる。例えば、図6に示したようにポート121がサイレント故障している場合にはステップS26でYESとなるので、ポート122からスイッチボード400への経路をACTIVE経路に切り替えた状態で正常な通信が維持される。
In step S27, the ACTIVE path may be switched to the path from the
また、本発明は通信ボードをcPCIやATCAで構成する場合に限らない。冗長構成をとるボード間でヘルスチェックを行うものであれば本発明を適用することができる。 Further, the present invention is not limited to the case where the communication board is configured by cPCI or ATCA. The present invention can be applied if the health check is performed between boards having a redundant configuration.
更に、上記した実施例おいては、第1及び第2の通信部が通信ボード100,200から構成されているが、特に、共通バスにコネクタを介して接続されるようにされたボードである必要はない。また、少なくとも2つの通信部が回路として形成されているならばボード以外のものであっても良い。
Further, in the above-described embodiment, the first and second communication units are configured by the
100,200 通信ボード
101,201 ボードコントローラ
111,211 IFコントローラ
121,122,221,222 ポート
300,400 スイッチボード
100, 200
Claims (7)
前記第1のスイッチ部は前記第1の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第1のスイッチヘルスチェック手段を有し、
前記第2のスイッチ部は前記第2の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第2のスイッチヘルスチェック手段を有し、
前記第1及び第2の通信部各々は、自身の通信部から前記第1及び第2の通信経路のうちのいずれか一方の通信経路を介して他方の通信部のヘルスチェックを行う第1のヘルスチェック手段と、
前記第1のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記自身の通信部から前記第1及び第2の通信経路のうちの他方の通信経路を介して前記他方の通信部のヘルスチェックを行う第2のヘルスチェック手段と、
前記第2のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記第1及び第2のスイッチヘルスチェック手段のうちの少なくとも一方から前記自身の通信部についての前記ヘルスチェック結果を得る確認手段と、
前記自身の通信部について前記確認手段によって得られた前記ヘルスチェック結果が正常であるとき前記自身の通信部を稼働状態に設定し、前記自身の通信部について前記確認手段によって得られた前記ヘルスチェック結果が正常でないとき前記自身の通信部を待機状態に設定する設定手段と、を有することを特徴とする通信装置。 A redundant component having at least first and second communication units each having a communication function, and between any two of the first communication unit, the second communication unit, and the device external network The first communication between any two of the first switch unit that is switched and connected via the first communication path, the first communication unit, the second communication unit, and the device external network. A second switch unit that switches and connects via a second communication path different from the path,
The first switch unit includes first switch health check means for performing a health check on each of the first and second communication units via the first communication path and storing the health check result. ,
The second switch unit includes a second switch health check unit that performs a health check of each of the first and second communication units via the second communication path and stores the health check result. ,
Each of the first and second communication units performs a health check on the other communication unit from one of the communication units via one of the first and second communication paths. Health check means,
When the result of the first health check means is an abnormality of the other communication unit, the other communication unit from the own communication unit via the other communication path of the first and second communication paths A second health check means for performing health check,
When the result of the second health check unit is an abnormality of the other communication unit, the health check result for the communication unit is obtained from at least one of the first and second switch health check units. Confirmation means;
When the health check result obtained by the confirmation means for the own communication section is normal, the own communication section is set to an operating state, and the health check obtained by the confirmation means for the own communication section And a setting unit configured to set the communication unit of the device to a standby state when a result is not normal.
前記第2のヘルスチェック手段は前記他方の通信経路を介して前記他方の通信部に第2のヘルスチェック要求を送信し、前記第2のヘルスチェック要求に対する応答がその送信から前記所定時間内にあるとき前記他方の通信部を正常とし、前記第2のヘルスチェック要求に対する応答がその送信から前記所定時間内にないとき前記他方の通信部を異常とすることを特徴とする請求項1記載の通信装置。 The first health check means transmits a first health check request to the other communication unit via the one communication path, and a response to the first health check request is within a predetermined time from the transmission. When the other communication unit is normal, when the response to the first health check request is not within the predetermined time from the transmission, the other communication unit is abnormal,
The second health check means transmits a second health check request to the other communication unit via the other communication path, and a response to the second health check request is received within the predetermined time from the transmission. 2. The communication unit according to claim 1, wherein the other communication unit is set to be normal at a certain time and the other communication unit is set to be abnormal when a response to the second health check request is not within the predetermined time from the transmission. Communication device.
前記第2の通信部に第4のヘルスチェック要求を送信し、前記第4のヘルスチェック要求に対する応答がその送信から前記所定時間内にあるとき前記第2の通信部を正常とし、前記第4のヘルスチェック要求に対する応答がその送信から前記所定時間内にないとき前記第2の通信部を異常とすることを特徴とする請求項1記載の通信装置。 The first and second switch health check means transmit a third health check request to the first communication unit, and when a response to the third health check request is within the predetermined time from the transmission When the first communication unit is normal, and the response to the third health check request is not within the predetermined time from the transmission, the first communication unit is abnormal,
A fourth health check request is transmitted to the second communication unit, and when the response to the fourth health check request is within the predetermined time from the transmission, the second communication unit is set to be normal, 2. The communication apparatus according to claim 1, wherein when the response to the health check request is not within the predetermined time from the transmission, the second communication unit is abnormal.
前記第1のスイッチ部において前記第1の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第1のスイッチヘルスチェックステップと、
前記第2のスイッチ部において前記第2の通信経路を介して前記第1及び前記第2の通信部各々のヘルスチェックを行ってそのヘルスチェック結果を記憶する第2のスイッチヘルスチェックステップと、を備え、
前記第1及び第2の通信部各々において、
自身の通信部から前記第1及び第2の通信経路のうちのいずれか一方の通信経路を介して他方の通信部のヘルスチェックを行う第1のヘルスチェックステップと、
前記第1のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記自身の通信部から前記第1及び第2の通信経路のうちの他方の通信経路を介して前記他方の通信部のヘルスチェックを行う第2のヘルスチェックステップと、
前記第2のヘルスチェック手段の結果が前記他方の通信部の異常であるとき前記第1及び第2のスイッチヘルスチェック手段のうちの少なくとも一方から前記自身の通信部についての前記ヘルスチェック結果を得る確認ステップと、
前記自身の通信部について前記確認ステップによって得られた前記ヘルスチェック結果が正常であるとき前記自身の通信部を稼働状態に設定し、前記自身の通信部について前記確認ステップによって得られた前記ヘルスチェック結果が正常でないとき前記自身の通信部を待機状態に設定する設定ステップと、を備えることを特徴とする稼働待機切替方法。 A redundant component having at least first and second communication units each having a communication function, and between any two of the first communication unit, the second communication unit, and the device external network The first communication between any two of the first switch unit that is switched and connected via the first communication path, the first communication unit, the second communication unit, and the device external network. A second switch unit that switches and connects via a second communication path different from the path, and a communication device operation standby switching method,
A first switch health check step of performing a health check of each of the first and second communication units via the first communication path in the first switch unit and storing the health check result;
A second switch health check step of performing a health check of each of the first and second communication units via the second communication path in the second switch unit and storing the health check result; Prepared,
In each of the first and second communication units,
A first health check step of performing a health check of the other communication unit from one's own communication unit via one of the first and second communication paths;
When the result of the first health check means is an abnormality of the other communication unit, the other communication unit from the own communication unit via the other communication path of the first and second communication paths A second health check step for performing a health check;
When the result of the second health check unit is an abnormality of the other communication unit, the health check result for the communication unit is obtained from at least one of the first and second switch health check units. A confirmation step;
When the health check result obtained by the confirmation step for the own communication unit is normal, the own communication unit is set to an operating state, and the health check obtained by the confirmation step for the own communication unit An operation standby switching method comprising: a setting step of setting the communication unit of the own device to a standby state when a result is not normal.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010056125A JP5370222B2 (en) | 2010-03-12 | 2010-03-12 | Communication device having redundant configuration and operation standby switching method thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010056125A JP5370222B2 (en) | 2010-03-12 | 2010-03-12 | Communication device having redundant configuration and operation standby switching method thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011193119A JP2011193119A (en) | 2011-09-29 |
JP5370222B2 true JP5370222B2 (en) | 2013-12-18 |
Family
ID=44797621
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010056125A Active JP5370222B2 (en) | 2010-03-12 | 2010-03-12 | Communication device having redundant configuration and operation standby switching method thereof |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5370222B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6653250B2 (en) * | 2016-12-28 | 2020-02-26 | 株式会社日立製作所 | Computer system |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5104417B2 (en) * | 2008-03-07 | 2012-12-19 | 沖電気工業株式会社 | Communication management system, communication management method, and communication apparatus |
JP2009253408A (en) * | 2008-04-02 | 2009-10-29 | Oki Electric Ind Co Ltd | Redundant gateway system |
-
2010
- 2010-03-12 JP JP2010056125A patent/JP5370222B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011193119A (en) | 2011-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20070270984A1 (en) | Method and Device for Redundancy Control of Electrical Devices | |
CN103246213A (en) | Alternative synchronisation connections between redundant control units | |
US9614753B2 (en) | Method and device for bidirectional forwarding detection under condition of parameter update | |
EP2629469A2 (en) | Wireless gateway apparatus | |
JP2007067540A (en) | Dual system switch | |
US20080095063A1 (en) | Relay Apparatus and Failure Monitoring Method | |
JP5370222B2 (en) | Communication device having redundant configuration and operation standby switching method thereof | |
JP5104417B2 (en) | Communication management system, communication management method, and communication apparatus | |
JP4372078B2 (en) | Gateway device | |
JP2018129612A (en) | Communication device having redundant configuration and operation standby switching method thereof | |
JP2007334484A (en) | Communication equipment and physical interface switching method for communication equipment | |
JP5169346B2 (en) | Relay device and system switching method | |
JP2012075009A (en) | Redundancy device and redundancy program | |
JP4692419B2 (en) | Network device, redundant switching method used therefor, and program thereof | |
JP2010146363A (en) | System switching system of duplex programmable controller | |
JP2010136038A (en) | Transmitter, and method for switching system in redundant configuration | |
JP5755352B1 (en) | Monitoring and control apparatus, communication system, and system switching method | |
JP7452872B2 (en) | Communication devices, methods and programs | |
JP2006020202A (en) | Communication equipment, method, and program for controlling communication | |
JP2019075768A (en) | Power supply control device, control method, control program, and control system | |
JP2004213412A (en) | Duplex controller | |
KR101133716B1 (en) | Apparatus for stabilizing router in building automatic control system which uses bacnet | |
JP2009232000A (en) | Transmission line terminating apparatus | |
JP2010035104A (en) | Plant monitor/control system, and method of bypassing communication channel | |
JP2007214746A (en) | Duplex communication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20120813 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130902 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5370222 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |