JP5548160B2 - Fault monitoring node device and fault detection and recovery method - Google Patents
Fault monitoring node device and fault detection and recovery method Download PDFInfo
- Publication number
- JP5548160B2 JP5548160B2 JP2011088509A JP2011088509A JP5548160B2 JP 5548160 B2 JP5548160 B2 JP 5548160B2 JP 2011088509 A JP2011088509 A JP 2011088509A JP 2011088509 A JP2011088509 A JP 2011088509A JP 5548160 B2 JP5548160 B2 JP 5548160B2
- Authority
- JP
- Japan
- Prior art keywords
- node device
- node
- unit
- ring network
- processing unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Small-Scale Networks (AREA)
Description
本発明は、複数のノード装置がリング状のネットワークに接続されて構成されたリングネットワークシステムにおいて、障害を検知し、障害からの回復を行う障害監視用ノード装置および障害検知回復方法に関する。 The present invention relates to a failure monitoring node device and a failure detection / recovery method for detecting a failure and recovering from a failure in a ring network system configured by connecting a plurality of node devices to a ring network.
従来、複数のノード装置がリング状のネットワークに接続されて構成されたリングネットワークシステムにおいては、例えば、隣接するノード装置間で健全性チェック用のフレームを交換し合ったり、あるいは、監視用のノード装置が他のノード装置から健全性チェック用のフレームに対する応答フレームを収集したりすることによって、ノード装置の障害やネットワークの障害を検知することが行われている。 2. Description of the Related Art Conventionally, in a ring network system configured by connecting a plurality of node devices to a ring network, for example, a frame for health check is exchanged between adjacent node devices, or a monitoring node The device collects response frames for soundness check frames from other node devices, thereby detecting node device failures and network failures.
そして、このような方法によって検知された障害が単一ノード装置の障害または伝送経路上の局所的な単一箇所の障害(以下、単一障害という)であった場合には、リングネットワークのループ経路を切断するための、いわゆる、ブロッキングを再設定する技術を応用することによって、その障害ノード装置または障害伝送経路部分を容易に当該リングネットワークから隔離し、障害のないノード装置および障害のないネットワーク部分を用いて、正常なネットワーク動作を回復させることができる(例えば、特許文献1などを参照)。 If the failure detected by such a method is a failure of a single node device or a failure at a single local location on the transmission path (hereinafter referred to as a single failure), a loop of the ring network By applying a so-called blocking resetting technology for disconnecting the path, the faulty node device or faulty transmission path portion is easily isolated from the ring network, and there is no faulty node device and no faulty network. The normal network operation can be recovered by using the portion (see, for example, Patent Document 1).
しかしながら、単一障害であるにもかかわらず、以上のような方法では、検知されず、隔離もされない障害が存在する。その理由は、その障害が多重障害として検知されるからである。 However, despite the single failure, there is a failure that is not detected or isolated by the above method. The reason is that the failure is detected as a multiple failure.
例えば、リングネットワークに接続されたある1つのノード装置において、フレーム送信回路がCRC(Cyclic Redundancy Check code)などの検査符号を必ず誤って付加する障害が発生し、そのノード装置が誤った検査符号を付加したフレームを、他のノード装置へ送信(ブロードキャスト)したことを想定する。その場合には、その誤った検査符号が付加されたフレームを受信した他のノード装置は、検査符号の検査に失敗する。一方、誤った検査符号が付加されたフレームを送信したノード装置は、ループ経路切断用のブロッキングが設定されているために、その誤った検査符号が付加されたフレームを受信することはなく、従って、検査符号の検査に失敗することはない。その結果、誤った検査符号が付加されたフレームを送信したノード装置は、正常に動作し、誤った検査符号が付加されたフレームを受信した他のすべてのノード装置は、障害が発生した、と判断されることになる。 For example, in one node device connected to the ring network, a failure occurs that the frame transmission circuit always adds a check code such as CRC (Cyclic Redundancy Check code) in error, and the node device generates an incorrect check code. Assume that the added frame is transmitted (broadcast) to another node device. In that case, the other node device that has received the frame with the erroneous check code added fails the check code check. On the other hand, the node device that has transmitted the frame with the wrong check code does not receive the frame with the wrong check code because the blocking for loop path disconnection is set. The check code check will not fail. As a result, the node device that transmitted the frame with the wrong check code is operating normally, and all other node devices that have received the frame with the wrong check code have failed. Will be judged.
同様の障害の例として、ある1つのノード装置以外のノード装置において、受信バッファビジーのエラーが表示されたままになるという障害がある。このような障害は、ある1つのノード装置のフレーム送信回路が誤動作し、リングネットワークに接続されているノード装置の受信処理能力以上の大量のフレームを送信(ブロードキャスト)し続けることなどによって引き起こされる。この場合、大量のフレームを送信したノード装置は、その大量のフレームを受信することがないので、受信バッファビジーのエラーは生じない。 As an example of a similar failure, there is a failure in which a reception buffer busy error remains displayed in a node device other than one node device. Such a failure is caused by a malfunction of a frame transmission circuit of a certain node device, and transmission (broadcasting) of a large number of frames exceeding the reception processing capability of the node device connected to the ring network. In this case, since the node device that has transmitted a large number of frames does not receive the large number of frames, an error of reception buffer busy does not occur.
以上のような障害は、本来は単一障害であるにもかかわらず、従来の技術では、多重障害として検知される。従って、単一障害の隔離を前提としたブロッキングを再設定する技術の適用はされず、障害からの回復を図ることが困難であった。また、一般に、多重障害の原因の解析や障害回復の処置は、容易ではなく、ほとんどの場合、ネットワーク管理者など人手に頼って、その障害回復を図らざるを得なかった。 Although the above failure is originally a single failure, it is detected as a multiple failure in the conventional technique. Therefore, the technology for resetting the blocking based on the isolation of a single failure is not applied, and it is difficult to recover from the failure. In general, analysis of the cause of multiple faults and recovery from faults are not easy, and in most cases, it has been necessary to rely on human resources such as a network administrator to recover the faults.
以上に説明した従来技術の現状に鑑み、本発明が解決しようとする課題は、リングネットワークシステムにおいて多重障害として検知される障害のうち、本来単一障害である障害について、その障害の検知および障害からの回復の容易化を図ることが可能な障害監視用ノード装置および障害検知回復方法を提供することにある。 In view of the current state of the prior art described above, the problem to be solved by the present invention is to detect and detect a failure that is originally a single failure among failures detected as multiple failures in a ring network system. It is an object of the present invention to provide a failure monitoring node device and a failure detection / recovery method capable of facilitating recovery from a failure.
前記課題を解決するために、本発明に係る障害監視用ノード装置は、リングネットワークと、それぞれがデータ処理部およびそのデータ処理部を前記リングネットワークに接続するとともに、前記リングネットワークでのフレーム伝送に係る動作エラーを検知する伝送制御部を少なくとも有する複数のノード装置と、を含んで構成されたリングネットワークシステムにおいて、障害を検知し、障害からの回復を行うノード装置である障害監視用ノード装置であって、そのデータ処理部は、
リングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、そのそれぞれのノード装置からの動作状態情報を収集するノードエラー情報収集部と、
その収集されたそれぞれのノード装置からの動作状態情報が、当該リングネットワークに接続されたノード装置のうち、ある1つのノード装置にフレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置にフレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知部と、
障害ノード装置として検知されたノード装置に当該リングネットワークを介して隣接したノード装置に対して、その障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示部と、
を備えることを特徴とする。
In order to solve the above-mentioned problems, a failure monitoring node device according to the present invention includes a ring network, each of which connects a data processing unit and the data processing unit to the ring network, and transmits frames on the ring network. In a ring network system configured to include at least a plurality of node devices having a transmission control unit that detects such an operation error , a failure monitoring node device that is a node device that detects a failure and recovers from the failure. And the data processor is
Receiving operation state information including information on operation errors related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the ring network, A node error information collection unit that collects operation state information from the node devices of
The collected operation status information from each node device indicates that an operation error related to frame transmission does not occur in one node device among the node devices connected to the ring network, and excludes the node device. all when operation error according to the frame transmission is information indicating that it has generated to the node device, the node device operation error according to the frame transmission has not occurred, the faulty node device for detecting a failure node apparatus A detection unit;
Instructing a node device that is detected as a failed node device to the adjacent node device via the ring network, and instructing a blocking setting to block communication with the node device detected as the failed node device, A network reconfiguration instruction unit that transmits instruction information for instructing the cancellation of the set blocking to the node device for which blocking is set at that time;
It is characterized by providing.
この障害監視用ノード装置において、障害ノード装置検知部は、ある1つのノード装置に動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に動作エラーが発生したことを検知している。これは、多重障害として検知された障害のうち、本来単一障害である障害を抽出して検知していることを意味する。従って、このようにして検知された障害ノード装置については、ネットワーク再構成指示部によるブロッキングの再設定によって、当該リングネットワークから除外することが可能となる。従って、該障害ノード装置が除外されたリングネットワーク再構成され、その際構成されたリングネットワークでは、動作エラーのない通信動作が回復される。 In this failure monitoring node device, the failure node device detection unit detects that an operation error has not occurred in one node device and an operation error has occurred in all other node devices except the node device. Yes. This means that out of the faults detected as multiple faults, a fault that is originally a single fault is extracted and detected. Therefore, the failed node device detected in this way can be excluded from the ring network by resetting the blocking by the network reconfiguration instruction unit. Therefore, the ring network is reconfigured from which the failed node device is excluded, and the communication operation without an operation error is recovered in the ring network configured at that time.
本発明によれば、リングネットワークシステムにおいて多重障害として検知される障害のうち、本来単一障害である障害について、その障害の検知および障害からの回復の容易化を図ることが可能な障害監視用ノード装置および障害検知回復方法を提供することすることができる。 According to the present invention, among faults detected as multiple faults in a ring network system, faults that are originally single faults can be easily detected and recovered from faults. A node device and a failure detection and recovery method can be provided.
以下、本発明の実施形態について、図面を参照して詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
<第1の実施形態>
図1は、本発明の第1の実施形態に係るリングネットワークシステムの構成の例を示した図である。図1に示すように、リングネットワークシステム1は、複数のノード装置2がリングネットワーク3に接続されて構成される。そして、その複数のノード装置2のうち1台は、障害ノード装置を検知する目的などために用いられ、本実施形態では、そのノード装置2を、とくに、障害監視用ノード装置2aという。なお、図1では、障害監視用ノード装置2aを含め、6台のノード装置2が描かれているが、ノード装置2の数は、6台に限定されない。
<First Embodiment>
FIG. 1 is a diagram showing an example of the configuration of a ring network system according to the first embodiment of the present invention. As shown in FIG. 1, the
ここで、それぞれのノード装置2(障害監視用ノード装置2aを含む)は、伝送制御部4とデータ処理部5(ただし、障害監視用ノード装置2aの場合は、データ処理部5a)とを含んで構成される。なお、ノード装置2および障害監視用ノード装置2aの構成の詳細については、次に、図2および図3を参照して詳しく説明する。
Here, each node device 2 (including the failure
また、リングネットワーク3は、それぞれが右回りおよび左回りの2本の伝送路(ただし、図1では、1本の線で描かれている)によって構成され、各ノード装置2から送信される通信フレーム(以下、フレームという)は、右回りまたは左回りの伝送路を介して、通信可能な伝送路の範囲の終端であるブロッキング31の手前のノード装置2まで伝送される。
In addition, the
図2は、本発明の第1の実施形態に係るノード装置の構成の例を示した図である。図1でも示したように、ノード装置2は、伝送制御部4とデータ処理部5とを含んで構成される。ここで、伝送制御部4は、3つの通信ポート41(#1)〜(#3)、フレーム伝送制御部42、フレームバッファ43、エラー検査部44などを含んで構成される。
FIG. 2 is a diagram illustrating an example of the configuration of the node device according to the first embodiment of the present invention. As shown in FIG. 1, the
通信ポート41(#1)〜(#3)は、それぞれ、図示しない受信ポートおよび送信ポートを備えている。そして、通信ポート41(#1),(#2)の受信ポートおよび送信ポートは、リングネットワーク3の2本の伝送路にそれぞれ接続される。また、通信ポート41(#3)の図示しない受信ポートおよび送信ポートは、データ処理部5に設けられた通信ポート51の送信ポートおよび受信ポートに接続される。
Each of the communication ports 41 (# 1) to (# 3) includes a reception port and a transmission port (not shown). The reception ports and transmission ports of the communication ports 41 (# 1) and (# 2) are connected to the two transmission paths of the
フレーム伝送制御部42は、リングネットワーク3の伝送路またはデータ処理部5から送信されるフレームを、通信ポート41(#1)〜(#3)の受信ポートを介して受信し、適宜、フレームバッファ43に一時記憶しつつ、その受信したフレームを、そのフレームに含まれる宛先に応じて、他の通信ポート41(#1)〜(#3)の送信ポートを介して、リングネットワーク3の伝送路またはデータ処理部5へ送信する。
The frame
また、フレーム伝送制御部42は、後記するネットワーク再構成指示フレームを受信した場合には、そのネットワーク再構成指示フレームによって指示された終端すべき送信側の通信ポートを閉塞する機能、すなわち、ブロッキング31を設定する機能を有する。
In addition, when receiving a network reconfiguration instruction frame to be described later, the frame
エラー検査部44は、フレーム伝送制御部42によって受信されて、フレームバッファ43に一時記憶されたフレームについて、そのフレームに含まれる検査符号(CRC、ECC(Error Correcting Code)など)を検査し、フレームの伝送エラーを検知する。また、エラー検査部44は、フレーム伝送制御部42によって受信されるフレーム量がフレームバッファ43に一時記憶される量を超過したことを検知した場合には、受信バッファビジーなどのエラー状態フラグをフレーム伝送制御部42に通知する。
The
以上のように、伝送制御部4は、ノード装置2の中にありながらも、リングネットワーク3の伝送路の一部を形成し、フレームが伝送される経路の切り替えを行うネットワークスイッチとして機能する。それに対し、データ処理部5は、リングネットワーク3の伝送路からは独立した構成要素である。
As described above, the
図2に示すように、データ処理部5は、通信インタフェース部50(以下、通信IF部50と略称)、CPU(Central Processing Unit)部55などを含んで構成される。なお、ここでいうCPU 部55は、いわゆる演算処理装置部分だけを指すのではなく、演算処理装置および記憶装置を少なくとも含んだ部分を指すものとする。
As shown in FIG. 2, the
すなわち、本実施形態では、データ処理部5は、いわゆるコンピュータそのものであるか、または、コンピュータを応用した各種の制御装置に相当する。そして、CPU部55は、そのコンピュータまたは各種制御装置の中枢処理部であり、通信IF部50は、その中枢部であるCPU部55に、伝送制御部4を介してリングネットワーク3を接続するためのインタフェースである。
In other words, in the present embodiment, the
ここで、通信IF部50は、通信ポート51、フレーム送受信制御部52、フレームバッファ53、エラー検査部54などを含んで構成される。そして、その通信ポート51は、伝送制御部4に設けられた通信ポート41(#3)に接続される。また、フレーム送受信制御部52は、CPU部55の指示を受けて、通信ポート51を介して送受信されるフレームの送受信を制御するとともに、送受信されるフレームをフレームバッファ53に一時記憶させる。
Here, the communication IF
また、エラー検査部54は、送受信されるフレームに含まれる検査符号(CRC,ECCなど)を検査し、フレームの伝送エラーを検知する。さらに、エラー検査部44は、フレーム送受信制御部52によって受信されるフレーム量がフレームバッファ53に一時記憶される量を超過したことを検知した場合には、受信バッファビジーなどのエラー状態フラグをフレーム送受信制御部52に通知する。
The
これに対し、CPU部55は、受信処理部56、送信処理部57、アプリケーション処理部58などにより構成される。ここで、受信処理部56および送信処理部57は、フレーム送受信制御部52にフレームの送信指示または受信指示を出力し、フレーム送受信制御部52にフレームの送信動作または受信動作を実行させる。これら受信処理部56および送信処理部57の機能は、CPU部55の図示しない記憶装置に格納されたオペレーティングシステムのプログラムによって実現される。
On the other hand, the CPU unit 55 includes a
また、アプリケーション処理部58は、当該ノード装置2の機能に応じてユーザが作成し、記憶装置に格納したプログラムを処理する。すなわち、ノード装置2は、アプリケーション処理部58で処理されるプログラムに応じて、様々なデータ処理機能や制御機能が実現されることになる。
The
図3は、本発明の第1の実施形態に係る障害監視用ノード装置2aの構成の例を示した図である。障害監視用ノード装置2aは、当該リングネットワークシステム1におけるノード装置2であって、特別に障害監視を行う機能を有するノード装置2である。
FIG. 3 is a diagram showing an example of the configuration of the failure
図3に示すように、障害監視用ノード装置2aは、伝送制御部4とデータ処理部5aとを含んで構成され、また、データ処理部5aは、通信IF部50、CPU部55a、表示装置部80などを含んで構成される。障害監視用ノード装置2aの構成は、図2に示したノード装置2の構成とほとんど同じであり、その相違は、CPU部55aの内部構成、および、データ処理部5aが表示装置部80を含むことだけである。
As shown in FIG. 3, the failure
ただし、表示装置部80は、例えば、LCD(Liquid Crystal Display)などで構成されるものであるが、障害監視用ノード装置2aで新たに追加されたものというわけではなく、ノード装置2にも必要に応じて設けられていてもよい。
However, the
以下、ノード装置2の場合と相違するCPU部55aの内部構成について説明する。図3に示すように、障害監視用ノード装置2aのCPU部55aは、受信処理部56、送信処理部57、ノードエラー情報収集部71、障害ノード装置検知部72、ネットワーク再構成指示部73および障害ノード情報表示部74を含んで構成される。
Hereinafter, an internal configuration of the
このうち、受信処理部56および送信処理部57は、図2におけるノード装置2に含まれる受信処理部56および送信処理部57と実質的に同じものである。また、ノードエラー情報収集部71、障害ノード装置検知部72、ネットワーク再構成指示部73および障害ノード情報表示部74は、ノード装置2に含まれるアプリケーション処理部58に対応する構成要素であり、障害監視用ノード装置2aを特徴付ける構成要素である。
Among these, the
ノードエラー情報収集部71は、当該リングネットワーク3に接続された各ノード装置2から、各ノード装置2における動作エラー情報を収集する。すなわち、ノードエラー情報収集部71は、リングネットワーク3を経由して、各ノード装置2から送信される動作状態報告フレームを、伝送制御部4、通信IF部50および受信処理部56を介して受信し、その受信した動作状態報告フレームに含まれる情報から各ノード装置2における動作エラー情報を取得する。
The node error
なお、動作状態報告フレームは、各ノード装置2がフレームの通信動作などにおいて動作エラーを検知したとき、あるいは、所定の時間(例えば、1秒)ごとに、検知した動作エラーの情報などを障害監視用ノード装置2aへ送信するためのフレームである。従って、動作状態報告フレームは、そのフレームを送信するノード装置2における動作エラー情報などの動作状態情報を含んで構成される。なお、動作状態報告フレームの詳細な構成については、後記にて説明する。
Note that the operation status report frame is used to monitor the information of the detected operation error when each
障害ノード装置検知部72は、ノードエラー情報収集部71によって収集された各ノード装置2の動作エラー情報に基づき、障害ノード装置を検知する。すなわち、障害ノード装置検知部72は、各ノード装置2の動作エラー情報に基づく情報が、当該リングネットワーク3に接続された全N台のノード装置2(障害監視用ノード装置2aを含む)のうち、N−1台のノード装置2に動作エラーが発生し、1台のノード装置に動作エラーが発生していないことを表すものであるか否かを判定する。そして、その判定の結果、N−1台のノード装置2に動作エラーが発生し、1台のノード装置に動作エラーが発生していなかった場合には、動作エラーが発生していない1台のノード装置2に何らかの障害が発生していると判断する。そして、その動作エラーが発生していない1台のノード装置2を、障害ノード装置として検知する。
The failure node
なお、N−1台のノード装置2にエラーが発生し、1台のノード装置2に動作エラーが発生するような場合の動作エラーとしては、例えば、フレームバッファ43,53において受信バッファビジーが発生する場合や、エラー検査部44,54でCRCエラーやECCエラーが発生する場合などが考えられる。このような動作エラーは、多くの場合、動作エラーが発生していないノード装置2における伝送制御部4または通信IF部50の送信回路などに障害が発生し、フレームが過剰にあるいは際限なく送信される状態になっていたり、CRCやECCの生成回路などに障害が発生し、誤って生成されたCRCやECCがフレームに付加されていたりすることによって引き起こされる。
As an operation error when an error occurs in N-1
なお、障害ノード装置検知部72は、以上のような動作エラーによる障害に限定されず、通常の単一障害や多重障害による障害ノード装置を、さらに、検知するものであってもよい。ただし、ここでは、その種の障害の障害検知については、詳細な説明を省略する。
The failure node
ネットワーク再構成指示部73は、障害ノード装置検知部72によって障害ノード装置が検知されたとき、当該リングネットワーク3に接続されたノード装置2にネットワーク再構成指示フレームをブロードキャストし、当該リングネットワーク3の構成、つまり、ブロッキング31の位置の変更を指示する。すなわち、ネットワーク再構成指示部73は、送信処理部57、通信IF部50、伝送制御部4を介して、リングネットワーク3に、障害ノード装置を識別するノード装置番号などを含んだネットワーク再構成指示フレームを送信(ブロードキャスト)する。なお、ネットワーク再構成指示フレームの構成については、後記にて説明する。
The network
一方、各ノード装置2は、当該ネットワーク再構成指示フレームを受信すると、自身が障害ノード装置にリングネットワーク3を介して隣接するノード装置2であるか否かを判定する。そして、自身が障害ノード装置に隣接するノード装置2であった場合には、障害ノード装置に隣接する側の通信ポート41を閉塞する、すなわち、障害ノード装置に接続されたリングネットワーク3の伝送路上にブロッキング31を設定する。また、そのときまでにブロッキング31を設定していたノード装置2は、当該ネットワーク再構成指示フレームを受信すると、その設定していたブロッキング31を解除する。
On the other hand, when each
以上のようにして、当該リングネットワーク3におけるブロッキング31の位置が変更され、リングネットワーク3が再構成されると、障害ノード装置は、変更後のブロッキング31によってリングネットワーク3の通信可能な範囲から除外されることになる。その結果、障害ノード装置で発生しているフレームが過剰にあるいは際限なく送信されるフレームや、誤ったCRCやECCが付加されたフレームは、リングネットワーク3の通信可能な範囲に入らなくなるので、N−1台のノード装置2に生じていたエラー動作は、多くの場合、消滅する。
As described above, when the position of the blocking 31 in the
障害ノード情報表示部74は、障害ノード装置検知部72によって検知された障害ノード装置を識別する情報(ノード装置番号など)や、ノードエラー情報収集部71によって収集された各ノード装置2で発生した動作エラーについての情報を、表示装置部80のLCDなどに表示する。なお、その表示例については、別途、図5を参照して詳しく説明する。
The failure node
図4は、本発明の第1の実施形態に係るリングネットワークシステム1において、各ノード装置2から障害監視用ノード装置2aへ送信される動作状態報告フレーム、および、障害監視用ノード装置2aから各ノード装置2へ送信されるネットワーク再構成指示フレームの構成の例を示した図である。
FIG. 4 shows an operation status report frame transmitted from each
図4(a)に示すように、動作状態報告フレームは、宛先アドレス、送信元アドレスなどからなるヘッダ部と、当該フレームのデータ種別(すなわち、動作状態報告フレームであることを示す情報)、報告元ノード装置のノード装置番号、動作エラー情報を含んだ動作状態情報、検査符号などからなるデータ部と、によって構成される。 As shown in FIG. 4A, the operation status report frame includes a header portion including a destination address, a transmission source address, etc., a data type of the frame (that is, information indicating that it is an operation status report frame), a report And a data unit including a node device number of the original node device, operation state information including operation error information, and a check code.
また、図4(b)に示すように、ネットワーク再構成指示フレームは、宛先アドレス、送信元アドレスなどからなるヘッダ部と、当該フレームのデータ種別(すなわち、ネットワーク再構成指示フレームであることを示す情報)、障害ノード装置のノード装置番号、検査符号などからなるデータ部と、によって構成される。 Further, as shown in FIG. 4B, the network reconfiguration instruction frame indicates a header portion including a destination address, a transmission source address, and the like, and a data type of the frame (that is, a network reconfiguration instruction frame). Information), a node unit number of the failed node device, and a data part including a check code.
図5は、本発明の第1の実施形態に係る障害監視用ノード装置2aのCPU部55aによって実行される障害ノード装置検知処理の処理フローの例を示した図である。なお、この処理フローの例には、障害ノード装置検知部72の動作に相当する処理だけでなく、ノードエラー情報収集部71、ネットワーク再構成指示部73、障害ノード情報表示部74などの動作に相当する処理も含まれている。
FIG. 5 is a diagram illustrating an example of a processing flow of a failure node device detection process executed by the
図5に示すように(適宜、図1も参照)、CPU部55aは、まず、各ノード装置2から送信される動作状態報告フレームを受信し、各ノード装置2における動作エラー情報を収集する(ステップS11)。次に、CPU部55aは、その収集したエラー情報に基づき、当該リングネットワーク3に接続された全ノード装置N台のうち少なくとも1台に動作エラーがあったか否かを判定する(ステップS12)。そして、その判定の結果、全ノード装置N台のうち1台にも動作エラーがなかった場合には(ステップS12でNo)、障害ノード装置の検知は必要でないので、CPU部55aは、当該障害ノード装置検知処理を終了する。
As shown in FIG. 5 (see also FIG. 1 as appropriate), the
一方、ステップS12の判定で、全ノード装置N台のうち少なくとも1台に動作エラーがあった場合には(ステップS12でYes)、CPU部55aは、さらに、全ノード装置N台のうちN−1台に動作エラーがあったか否かを判定する(ステップS13)。そして、その判定の結果、N−1台には動作エラーがなかった場合、つまり、1台ないしN−2台に動作エラーがあった場合には(ステップS13でNo)、CPU部55aは、動作エラーありの動作エラー情報を送信した1台ないしN−2台のノード装置2の動作エラー情報に基づき、障害ノード装置を検知する(ステップS17)。
On the other hand, if it is determined in step S12 that at least one of the N node devices has an operation error (Yes in step S12), the
なお、その場合の障害ノード装置検知の方法については、ここでは、とくに説明をしないが、動作エラー情報を送信したノード装置2が1台の場合には、通常、そのノード装置2が障害ノード装置となる。また、動作エラー情報を送信したノード装置2が2台ないしN−1台の場合には、その全部が障害ノード装置である場合もあり、また、その一部のみが障害ノード装置である場合もあり、そのいずれであるかを弁別するのは、必ずしも容易ではない。
In this case, the fault node device detection method is not particularly described here, but when there is one
次に、ステップS13の判定で、全ノード装置N台のうちN−1台に動作エラーがあった場合には(ステップS13でYes)、CPU部55aは、動作エラーがない動作エラー情報を送信したノード装置2を、障害ノード装置として検知する(ステップS14)。そして、CPU部55aは、ステップS11で収集した各ノード装置2のエラー情報およびステップS14で検知した障害ノード装置の識別情報を表示装置部80に表示するともに(ステップS15)、図4(b)に示したネットワーク再構成指示フレームを全ノード装置2にブロードキャストする(ステップS16)。
Next, when it is determined in step S13 that there is an operation error in N-1 of all the node devices N (Yes in step S13), the
以上の処理により、全ノード装置N台のうち、N−1台から送信された動作状態報告フレームに含まれる動作状態情報が動作エラーありを示し、1台から送信された動作状態報告フレームに含まれる動作状態情報が動作エラーなしを示すものであった場合には、動作エラーなしの動作状態報告フレームを送信したノード装置2は、障害ノード装置であると判定される。そして、その障害ノード装置と判定されたノード装置2は、ネットワーク再構成指示フレームによって、再設定されるブロッキング31によって、当該リングネットワーク3の通信可能範囲から除外される。その結果、N−1台のノード装置2に生じていたエラー動作は、多くの場合、消滅する。
As a result of the above processing, the operation state information included in the operation state report frame transmitted from N-1 of all N node devices indicates that there is an operation error and is included in the operation state report frame transmitted from one unit. If the operation state information indicates that there is no operation error, the
図6は、本発明の第1の実施形態に係る障害監視用ノード装置2aの障害ノード情報表示部74によって表示装置部80に表示される障害ノード検知処理結果表示画面の例を示した図である。図6に示すように、障害ノード検知処理結果表示画面には、障害ノード装置のノード装置番号だけでなく、各ノード装置2における動作エラー情報(エラーの有無、エラーコード、エラー名称など)が表示される。
FIG. 6 is a diagram showing an example of a failure node detection processing result display screen displayed on the
このような表示画面により、当該リングネットワークシステム1のシステム管理者は、1台を除く、N−1台に動作エラーが発生したことを知ることができる。多くの場合、このようなエラー動作は、障害監視用ノード装置2aによるネットワーク再構成指示フレームの送信によって解消されるが、当然ながら、解消されない場合もあり得る。その場合には、システム管理者は、このような表示画面に表示される情報に基づき、各ノード装置2における動作エラーの原因を解析して、障害ノード装置を特定する。
From such a display screen, the system administrator of the
以上、本発明の第1の実施形態によれば、障害監視用ノード装置2aは、リングネットワーク3に接続された全ノード装置N台のうち、1台を除くN−1台に動作エラーが発生したことを検知するとともに、そのとき動作エラーが発生していない1台のノード装置を障害ノード装置と判定し、各ノード装置2に対し、ネットワーク再構成指示フレームを送信する。各ノード装置2は、そのネットワーク再構成指示フレームを受信すると、リングネットワーク3におけるブロッキング31を再設定し、障害ノード装置と判定されたノード装置2を、そのリングネットワーク3の通信可能な範囲から除外する。その結果、各ノード装置2における動作エラーは解消され、リングネットワーク3における正常な通信動作が回復される。
As described above, according to the first embodiment of the present invention, the failure
従って、本実施形態では、多重障害として検知された障害のうち、本来単一障害である障害については、その障害ノード装置の検知が容易に行えるようになり、障害からの回復を容易に行えるようになる。 Therefore, in the present embodiment, among the faults detected as multiple faults, a fault that is originally a single fault can be easily detected and the recovery from the fault can be easily performed. become.
<第2の実施形態>
図7は、本発明の第2の実施形態に係る2重化リングネットワークシステムの構成の例を示した図である。なお、図7以降の図において、第1の実施形態と同じ構成要素については、同じ符号を付し、その説明省略する。
<Second Embodiment>
FIG. 7 is a diagram showing an example of the configuration of a duplex ring network system according to the second embodiment of the present invention. In FIG. 7 and subsequent figures, the same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof is omitted.
図7に示すように、2重化リングネットワークシステム1dは、複数のノード装置2dが互いに独立した2重のリングネットワーク3に接続されて構成される。そして、その複数のノード装置2dのうち1台は、障害ノード装置を検知する目的などために用いられ、そのノード装置2dを、とくに、障害監視用ノード装置2daという。なお、図7では、障害監視用ノード装置2daを含め、6台のノード装置2dが描かれているが、ノード装置2dの数は、6台に限定されない。
As shown in FIG. 7, a duplex ring network system 1d is configured by connecting a plurality of
ここで、それぞれのノード装置2d(障害監視用ノード装置2daを含む)は、2重の伝送制御部4と、2重のデータ処理部5d(ただし、障害監視用ノード装置2daの場合は、データ処理部5da)と、2重の伝送制御部4を2重のデータ処理部5dのうちの一方のデータ処理部5dに接続する経路切替部6と、を含んで構成される。そして、2重の伝送制御部4のうち一方の伝送制御部4は、2重のリングネットワーク3のうちの一方のリングネットワーク3(伝送路#1)に接続され、他方の伝送制御部4は、2重のリングネットワーク3のうちの他方のリングネットワーク3(伝送路#2)に接続される。
Here, each
すなわち、第2の実施形態に係る2重化リングネットワークシステム1dの各ノード装置2d(障害監視用ノード装置2daを含む)においては、2重のデータ処理部5d(5da)のうちの一方のデータ処理部5d(5da)が稼働状態にあり、他方のデータ処理部5d(5da)が待機状態にある形態で用いられる。一方、2重の伝送制御部4および2重のリングネットワーク3は、いずれも常に稼働状態にあるものとして用いられる。このとき、稼働状態のデータ処理部5d(5da)は、経路切替部6を介して、2重の伝送制御部4の両方に接続され、待機状態のデータ処理部5d(5da)は、経路切替部6によって2重の伝送制御部4の間の接続が切断される。
In other words, in each
なお、図7において、経路切替部6に描かれている実線は、稼働状態のデータ処理部5d(#1)(5da(#1))と2重の伝送制御部4とが接続されていることを表し、破線は、待機状態のデータ処理部5d(#2)(5da(#2))と2重の伝送制御部4とが切断されていることを表している。なお、データ処理部5d(5da)の状態切り替えは、それぞれのノード装置2d(2da)ごとに独立に行うことができ、稼働状態のデータ処理部5d(5da)が、一方から他方へ切り替えられたときには、2重のデータ処理部5d(5da)と2重の伝送制御部4との接続関係も併せて切り替えられる。
In FIG. 7, the solid line drawn in the
図8は、発明の第2の実施形態に係る障害監視用ノード装置2daの構成の例を示した図である。なお、ノード装置2dの構成は、障害監視用ノード装置2daの構成とは、障害監視用ノード装置2daが障害監視に係る機能を実現するブロックを余分に含んでいることを除けば、ほとんど同じであるので、ノード装置2dの構成も、ここで併せて、付加的に説明する。
FIG. 8 is a diagram showing an example of the configuration of the failure monitoring node device 2da according to the second embodiment of the present invention. The configuration of the
第2の実施形態では、リングネットワーク3が2重に設けられているため、障害監視用ノード装置2da(ノード装置2d)は、その2重のリングネットワーク3にそれぞれ接続される2重の伝送制御部4を有している。そして、その伝送制御部4の内部の構成は、図2に示した伝送制御部4の構成と同じである。
In the second embodiment, since the
また、障害監視用ノード装置2da(ノード装置2d)は、2重の伝送制御部4を稼働状態のデータ処理部5da(5d)に接続するとともに、待機状態のデータ処理部5da(5d)との接続を切断する経路切替部6を有している。経路切替部6は、2重の伝送制御部4を、一方のデータ処理部5da(5d)に接続するとともに、他方のデータ処理部5da(5d)との接続を切断するためのスイッチSW61〜64を有している。さらに、経路切替部6は、データ処理部5da(5d)からの指示に従って、スイッチSW61〜SW64の切り替えを制御するSW制御部60を有している。
In addition, the failure monitoring node device 2da (
また、障害監視用ノード装置2da(ノード装置2d)は、2重のデータ処理部5da(5d)を有している。そして、2重のデータ処理部5da(5d)のうち、経路切替部6によって2重の伝送制御部4に接続されているデータ処理部5da(5d)は、稼働状態にあり、また、経路切替部6によって2重の伝送制御部4との接続が切断されているデータ処理部5da(5d)は、待機状態にある。
The failure monitoring node device 2da (
データ処理部5da(5d)は、通信IF部50と、CPU部55da(55d:なお、55dは、データ処理部5dのCPU部を表す符号であるが、図示されていない)と、を含んで構成される。ここでは、図8を参照して、障害監視用ノード装置2daのCPU部55daの構成について説明する。
The data processing unit 5da (5d) includes a communication IF
図8に示すように、障害監視用ノード装置2daのCPU部55daは、受信処理部56、送信処理部57、稼働系切替処理部59、ノードエラー情報収集部71、障害ノード装置検知部72、ネットワーク再構成指示部73および障害ノード情報表示部74、稼働系切替指示部75などを含んで構成される。なお、図8では、表示装置部80の図示が省略されている。
As shown in FIG. 8, the CPU unit 55da of the failure monitoring node device 2da includes a
図8に示したCPU部55daの構成は、図3に示した障害監視用ノード装置2aのCPU部55aの構成とは、稼働系切替処理部59および稼働系切替指示部75が追加されている点でのみ相違している。他の構成要素については、CPU部55aの場合と同じであるので、ここでは、その説明を省略する。
The configuration of the CPU unit 55da illustrated in FIG. 8 is different from the configuration of the
稼働系切替処理部59は、自身が含まれるデータ処理部5daの状態を、稼働状態から待機状態へ、または、待機状態から稼働状態へ切り替える処理を行うとともに、切り替えたことを経路切替部6のSW制御部60へ通知する。なお、稼働系切替処理部59は、通常のノード装置2dのCPU部55dにも含まれる構成要素である。
The active system switching
稼働系切替指示部75は、障害ノード装置検知部72によって障害ノード装置が検知されたとき、その検知された障害ノード装置に対して、データ処理部5dにおける稼働系の切替を行うことを指示する稼働系切替指示情報を含んで構成された稼働系切替指示フレームの送信を、送信処理部57に指示する。送信処理部57は、その送信指示された稼働系切替指示フレームを通信IF部50、経路切替部6、伝送制御部4、リングネットワーク3を介して、障害ノード装置として検知されたノード装置2dへ送信する。
When the failure node
なお、送信指示された稼働系切替指示フレームを受信した障害ノード装置(ノード装置2dの1つ)の稼動状態のデータ処理部5dに含まれるCPU部55dは、稼働系切替処理部59の処理により自身の状態を稼動状態から待機状態へと切り替え、また、待機状態のデータ処理部5dの状態を待機状態から稼動状態へと切り替える。
The CPU unit 55d included in the
図9は、本発明の第2の実施形態に係る障害監視用ノード装置2daのCPU部55daによって実行される2重化リングネットワークシステム1dにおける障害ノード装置検知処理の処理フローの例を示した図である。この第2の実施形態では、各ノード装置2dの動作エラーの解消を図るために、第1の対応処理(ステップS15b)および第2の対応処理(ステップS16)を用意しておき、第1の対応処理で各ノード装置2dの動作エラーの解消ができなかった場合には、第2の対応処理で各ノード装置2dの動作エラーの解消を図る。
FIG. 9 is a diagram showing an example of a processing flow of a failure node device detection process in the redundant ring network system 1d executed by the CPU unit 55da of the failure monitoring node device 2da according to the second embodiment of the present invention. It is. In the second embodiment, in order to eliminate the operation error of each
図9に示すように、CPU部55daは、まず、各ノード装置2dから送信される動作状態報告フレームを受信し、各ノード装置2dにおける動作エラー情報を収集する(ステップS11)。次に、CPU部55daは、その収集した動作エラー情報に基づき、当該2重のリングネットワーク3に接続された全ノード装置N台のうち少なくとも1台に動作エラーがあったか否かを判定する(ステップS12)。そして、その判定の結果、全ノード装置N台のうち1台にも動作エラーがなかった場合には(ステップS12でNo)、障害ノード装置の検知は必要でないので、CPU部55daは、当該障害ノード装置検知処理を終了する。
As shown in FIG. 9, the CPU section 55da first receives an operation state report frame transmitted from each
一方、ステップS12の判定で、全ノード装置N台のうち少なくとも1台に動作エラーがあった場合には(ステップS12でYes)、CPU部55daは、さらに、全ノード装置N台のうちN−1台に動作エラーがあったか否かを判定する(ステップS13)。そして、その判定の結果、N−1台には動作エラーなかった場合、つまり、1台ないしN−2台に動作エラーがあった場合には(ステップS13でNo)、CPU部55daは、動作エラーありの動作エラー情報を送信した1台ないしN−2台のノード装置2の動作エラー情報に基づき、障害ノード装置を検知する(ステップS17)。
On the other hand, if it is determined in step S12 that there is an operation error in at least one of the N node devices (Yes in step S12), the CPU unit 55da further determines N− of the N node devices. It is determined whether or not one unit has an operation error (step S13). As a result of the determination, if there is no operation error in N-1 units, that is, if there is an operation error in one or N-2 units (No in step S13), the CPU section 55da A faulty node device is detected based on the operation error information of the one or N-2
次に、ステップS13の判定で、全ノード装置N台のうちN−1台に動作エラーがあった場合には(ステップS13でYes)、CPU部55daは、動作エラーがない動作エラー情報を送信したノード装置を、障害ノード装置として検知する(ステップS14)。そして、CPU部55daは、ステップS11で収集した各ノード装置2dのエラー情報およびステップS14で検知した障害ノード装置の識別情報を表示装置部80に表示する(ステップS15)。なお、その表示内容は、図6に示した表示内容に準ずる。
Next, when it is determined in step S13 that there is an operation error in N-1 of all the node devices N (Yes in step S13), the CPU unit 55da transmits operation error information with no operation error. The detected node device is detected as a failed node device (step S14). Then, the CPU unit 55da displays the error information of each
以上、ここまでの処理は、図5に示した第1の実施形態における障害ノード装置検知処理と同じである。 The processing so far is the same as the failure node device detection processing in the first embodiment shown in FIG.
次に、CPU部55daは、ステップS14において障害ノード装置として検知されたノード装置2dが、再度、障害ノード装置として検知されたか否かを判定し(ステップS15a)、初回の検知であった場合には(ステップS15aでNo)、第1の対応処理として、障害ノード装置として検知されたノード装置2dへ、稼働系切替指示フレームを送信する(ステップS15b)。
Next, the CPU unit 55da determines whether or not the
このとき、稼働系切替指示フレームを受信した、障害ノード装置と判定されたノード装置2dは、自身における稼動状態のデータ処理部5dの状態を稼動状態から待機状態へと切り替え、また、待機状態のデータ処理部5dの状態を待機状態から稼動状態へと切り替える。ここで、障害ノード装置と判定されたノード装置2d以外のノード装置2dで生じた動作エラーの原因が、障害ノード装置と判定されたノード装置2dの切り替え前の稼動状態のデータ処理部5dにあった場合(例えば、通信IF部50の送信回路が過剰にまたは際限なくフレームを送信した場合や、CRCやECCの生成回路が誤ったCRCやECCを付加した場合)には、この稼動系の切り替えによって、障害ノード装置とされたノード装置2d以外のノード装置2dにおける動作エラーは解消する。
At this time, the
一方、ステップS15aにおける判定で、障害ノード装置として検知されたノード装置2dが、再度、障害ノード装置として検知された場合(ステップS15aでYes)、これは、前記した第1の対応処理では、障害ノード装置と判定されたノード装置2d以外のノード装置2dで生じた動作エラーが解消しなかったことを意味するので、第2の対応処理として、CPU部55daは、図4(b)に示したネットワーク再構成指示フレームを全ノード装置2dにブロードキャストする(ステップS16)。
On the other hand, when the
この第2の対応処理は、第1の実施形態で説明したブロッキング31を再設定する処理であり、そのブロッキング31の再設定によって、障害ノード装置と判定されたノード装置2dは、当該2重のリングネットワーク3の通信可能範囲から除外される。その結果、障害ノード装置と判定されたノード装置2d以外のノード装置2dに生じていたエラー動作は、消滅する。
This second handling process is a process for resetting the blocking 31 described in the first embodiment, and the
以上、本発明の第2の実施形態によれば、障害監視用ノード装置2daは、2重のリングネットワーク3に接続された全ノード装置N台のうち、1台を除くN−1台に動作エラーが発生したことを検知するとともに、そのとき動作エラーが発生していない1台のノード装置2dを障害ノード装置として検知する。そして、障害回復のための第1の対応処理として、まず、障害ノード装置と判定したノード装置2dに対し、稼働系切替指示フレームを送信する。また、その第1の対応処理を行っても、それまでと同様の動作エラーが発生する場合には、第2の対応処理として、2重のリングネットワーク3におけるブロッキング31を再設定し、障害ノード装置と判定されたノード装置2dを、そのリングネットワーク3の通信可能な範囲から除外する。その結果、障害ノード装置と判定されたノード装置2d以外のノード装置2dにおける動作エラーが解消し、2重のリングネットワーク3における正常な通信動作が回復される。
As described above, according to the second embodiment of the present invention, the failure monitoring node device 2da operates on N-1 of all the node devices N connected to the
従って、第2の実施形態においても、多重障害として検知された障害のうち、本来単一障害である障害については、その障害ノード装置の検知が容易に行えるようになり、障害からの回復を容易に行えるようになる。 Therefore, also in the second embodiment, among the faults detected as multiple faults, faults that are originally single faults can be easily detected by the faulty node device, and recovery from faults is easy. Will be able to do.
1 リングネットワークシステム
1d 2重化リングネットワークシステム
2,2d ノード装置
2a,2da 障害監視用ノード装置
3 リングネットワーク
4 伝送制御部
5,5a,5d,5da データ処理部
6 経路切替部
31 ブロッキング
41,51 通信ポート
42 フレーム伝送制御部
43,53 フレームバッファ
44,54 エラー検査部
50 通信IF部(通信インタフェース部)
52 フレーム送受信制御部
55,55a,55d,55da CPU部
56 受信処理部
57 送信処理部
58 アプリケーション処理部
59 稼働系切替処理部
60 SW制御部
71 ノードエラー情報収集部
72 障害ノード装置検知部
73 ネットワーク再構成指示部
74 障害ノード情報表示部
75 稼働系切替指示部
80 表示装置部
DESCRIPTION OF
52 frame transmission /
Claims (10)
前記データ処理部は、
前記リングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集部と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記リングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知部と、
前記障害ノード装置として検知されたノード装置に前記リングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示部と、
を備えること
を特徴とする障害監視用ノード装置。 A ring network, and a plurality of node devices each having a data processing unit and a data processing unit connected to the ring network, and at least a transmission control unit for detecting an operation error related to frame transmission in the ring network, In a ring network system configured to include a failure monitoring node device that is a node device that detects a failure and recovers from the failure,
The data processing unit
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the ring network; A node error information collection unit that collects operation state information from each node device;
The collected operation status information from each node device is a node device connected to the ring network, and an operation error related to the frame transmission does not occur in one node device, and excludes the node device. When the information indicates that an operation error related to the frame transmission has occurred in all other node devices, the node device in which the operation error related to the frame transmission has not occurred is detected as a failed node device. A failure node device detection unit;
Instructing the node device detected as the failed node device to the adjacent node device via the ring network, and instructing the setting of blocking to block communication with the node device detected as the failed node device A network reconfiguration instruction unit that transmits instruction information for instructing the cancellation of the set blocking to the node device for which blocking is set at that time;
A node device for fault monitoring characterized by comprising:
前記障害ノード装置検知部によって障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害情報表示部
を、さらに、備えること
を特徴とする請求項1に記載の障害監視用ノード装置。 The data processing unit
The failure information display unit further includes a failure information display unit configured to display information for identifying the detected failed node device on a display device when the failed node device is detected by the failed node device detection unit. The failure monitoring node device according to 1.
前記データ処理部は、
前記2重のリングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集部と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記2重のリングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知部と、
前記障害ノード装置として検知されたノード装置に対し、そのノード装置において、前記稼働状態のデータ処理部を、その時点で稼働状態となっているデータ処理部から、他方のデータ処理部に切り替えることを指示する稼働系切替指示情報を送信する稼働系切替指示部と、
を備えること
を特徴とする障害監視用ノード装置。 And dual ring network, each double data processing unit, which is connected respectively to the dual ring network Rutotomoni, double transmission control unit for detecting an operation error of the frame transmission in the ring network, And a plurality of node devices having at least a path switching unit that connects the duplex transmission control unit to an active data processing unit of the duplex data processing unit. In a link network system, a failure monitoring node device that is a node device that detects a failure and recovers from the failure,
The data processing unit
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the double ring network; A node error information collection unit for collecting operation state information from each of the node devices;
The collected operation status information from each node device indicates that an operation error related to the frame transmission does not occur in one node device among the node devices connected to the double ring network. If it is information indicating that an operation error related to the frame transmission has occurred in all other node devices except the device, the node device in which the operation error related to the frame transmission has not occurred is designated as a failed node device. A failure node device detection unit to detect as,
For the node device detected as the failed node device, in the node device, switching the data processing unit in the operating state from the data processing unit in the operating state at that time to the other data processing unit An active system switching instruction unit for transmitting operating system switching instruction information to be instructed;
A node device for fault monitoring characterized by comprising:
前記障害ノード装置検知部によって前記障害ノード装置として検知されたノード装置に前記2重のリングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示部と、
を、さらに、備えること
を特徴とする請求項3に記載の障害監視用ノード装置。 The data processing unit
Communication with the node device detected as the failed node device with respect to the node device adjacent to the node device detected as the failed node device by the failed node device detection unit via the double ring network A network reconfiguration instruction unit that sends instruction information for instructing the cancellation of the set blocking to the node device for which blocking is set at that time,
The failure monitoring node device according to claim 3, further comprising:
前記障害ノード装置検知部によって障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害情報表示部
を、さらに、備えること
を特徴とする請求項3または請求項4に記載の障害監視用ノード装置。 The data processing unit
The failure information display unit further includes a failure information display unit configured to display information for identifying the detected failed node device on a display device when the failed node device is detected by the failed node device detection unit. The node device for fault monitoring according to claim 3 or claim 4.
前記1のノード装置のデータ処理部は、
前記リングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集処理と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記リングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知処理と、
前記障害ノード装置として検知されたノード装置に前記リングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示処理と、
を実行すること
を特徴とする障害検知回復方法。 A ring network, and a plurality of node devices each having a data processing unit and a data processing unit connected to the ring network, and at least a transmission control unit for detecting an operation error related to frame transmission in the ring network, In the ring network system configured to include a failure detection and recovery method performed by one of the plurality of node devices,
The data processing unit of the one node device is
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the ring network; Node error information collection processing for collecting operation state information from each node device;
The collected operation status information from each node device is a node device connected to the ring network, and an operation error related to the frame transmission does not occur in one node device, and excludes the node device. When the information indicates that an operation error related to the frame transmission has occurred in all other node devices, the node device in which the operation error related to the frame transmission has not occurred is detected as a failed node device. Fault node device detection processing,
Instructing the node device detected as the failed node device to the adjacent node device via the ring network, and instructing the setting of blocking to block communication with the node device detected as the failed node device Network reconfiguration instruction processing for transmitting instruction information for instructing the cancellation of the set blocking to the node apparatus for which blocking is set at that time;
A failure detection and recovery method characterized by executing
前記障害ノード装置検知処理によって障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害ノード情報表示処理
を、さらに、実行すること
を特徴とする請求項6に記載の障害検知回復方法。 The data processing unit of the one node device is
When a failed node device is detected by the failed node device detection process, a failure node information display process for displaying information for identifying the detected failed node device on a display device is further executed. The failure detection and recovery method according to claim 6.
前記1のノード装置のデータ処理部は、
前記2重のリングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集処理と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記2重のリングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知処理と、
前記障害ノード装置として検知されたノード装置に対し、そのノード装置において、前記稼働状態のデータ処理部を、その時点で稼働状態となっているデータ処理部から、他方のデータ処理部に切り替えることを指示する稼働系切替指示情報を送信する稼働系切替指示処理と、
を実行すること
を特徴とする障害検知回復方法。 And dual ring network, each double data processing unit, which is connected respectively to the dual ring network Rutotomoni, double transmission control unit for detecting an operation error of the frame transmission in the ring network, And a plurality of node devices having at least a path switching unit that connects the duplex transmission control unit to an active data processing unit of the duplex data processing unit. In a link network system, a failure detection and recovery method performed by one of the plurality of node devices,
The data processing unit of the one node device is
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the double ring network; Node error information collection processing for collecting operation state information from each of the node devices;
The collected operation status information from each node device indicates that an operation error related to the frame transmission does not occur in one node device among the node devices connected to the double ring network. If it is information indicating that an operation error related to the frame transmission has occurred in all other node devices except the device, the node device in which the operation error related to the frame transmission has not occurred is designated as a failed node device. Fault node device detection processing to detect as,
For the node device detected as the failed node device, in the node device, switching the data processing unit in the operating state from the data processing unit in the operating state at that time to the other data processing unit Active system switching instruction processing for transmitting operating system switching instruction information to be instructed;
A failure detection and recovery method characterized by executing
前記障害ノード装置として検知されたノード装置に前記2重のリングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示処理
を、さらに、実行すること
を特徴とする請求項8に記載の障害検知回復方法。 The data processing unit of the one node device is
Blocking setting is made to block communication between the node device detected as the failed node device and the node device adjacent to the node device detected as the failed node device via the double ring network. A network reconfiguration instruction process for transmitting instruction information for instructing the release of the set blocking to the node apparatus for which blocking has been set at the time. The failure detection and recovery method according to claim 8.
前記障害ノード装置検知ステップで障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害ノード装置情報表示処理
を、さらに、実行すること
を特徴とする請求項8または請求項9に記載の障害検知回復方法。 The data processing unit of the one node device is
When a failed node device is detected in the failed node device detection step, a failed node device information display process for displaying information for identifying the detected failed node device on a display device is further executed. The fault detection and recovery method according to claim 8 or 9.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011088509A JP5548160B2 (en) | 2011-04-12 | 2011-04-12 | Fault monitoring node device and fault detection and recovery method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011088509A JP5548160B2 (en) | 2011-04-12 | 2011-04-12 | Fault monitoring node device and fault detection and recovery method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012222700A JP2012222700A (en) | 2012-11-12 |
JP5548160B2 true JP5548160B2 (en) | 2014-07-16 |
Family
ID=47273724
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011088509A Active JP5548160B2 (en) | 2011-04-12 | 2011-04-12 | Fault monitoring node device and fault detection and recovery method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5548160B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017085249A (en) * | 2015-10-23 | 2017-05-18 | ホーチキ株式会社 | Disaster preventive monitoring system |
JP6637287B2 (en) * | 2015-10-28 | 2020-01-29 | ホーチキ株式会社 | Disaster prevention monitoring system |
CN107181661A (en) * | 2016-03-11 | 2017-09-19 | 西门子公司 | Real-time fault protecting method, master node, slave node and loop-type network system |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61121633A (en) * | 1984-11-19 | 1986-06-09 | Fujitsu Ltd | Network supervisory system |
JPH01240048A (en) * | 1988-03-22 | 1989-09-25 | Mitsubishi Electric Corp | Packet switching network supervising system |
JPH11145997A (en) * | 1997-11-11 | 1999-05-28 | Omron Corp | Communication system |
-
2011
- 2011-04-12 JP JP2011088509A patent/JP5548160B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012222700A (en) | 2012-11-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP2243255B1 (en) | Method and system for dynamic link failover management | |
US20040001449A1 (en) | System and method for supporting automatic protection switching between multiple node pairs using common agent architecture | |
US6868067B2 (en) | Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes | |
JP2009303092A (en) | Network equipment and line switching method | |
JP5548160B2 (en) | Fault monitoring node device and fault detection and recovery method | |
JP5480778B2 (en) | Duplex computer network system, network connection device, and fault detection and coping method | |
EP2613477A1 (en) | Method for triggering route switching and service provider-end provider edge device | |
US20170070410A1 (en) | System and method for providing redundant ethernet network connections | |
US8111625B2 (en) | Method for detecting a message interface fault in a communication device | |
CN109039761B (en) | Method and device for processing fault link in cluster control channel | |
JP2024108417A (en) | Network interface card and transmission performance monitoring method | |
JP4024607B2 (en) | Optical cross-connect device | |
CN105553735A (en) | Stacking system fault handling method, equipment and stacking system | |
JP4190170B2 (en) | Detour route setting system | |
JP6052150B2 (en) | Relay device | |
US11954509B2 (en) | Service continuation system and service continuation method between active and standby virtual servers | |
JP2012075009A (en) | Redundancy device and redundancy program | |
JP2005268889A (en) | Transmission path switching system and operating method of the transmission path switching system | |
WO2014010021A1 (en) | Information processing device, information processing system, method for controlling information processing device, and program for controlling information processing device | |
JP4692419B2 (en) | Network device, redundant switching method used therefor, and program thereof | |
JP2013121095A (en) | Communication device | |
JP7120678B1 (en) | Communication processing device, communication processing system, failure notification method and failure notification program | |
JP4623001B2 (en) | Fault isolation system, fault isolation method, and program | |
JP4232737B2 (en) | Network equipment | |
KR100751643B1 (en) | Method for monitoring an abnormal operation of a mobile communication subscriber processing unit |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130516 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140107 |
|
A521 | Written amendment |
Effective date: 20140310 Free format text: JAPANESE INTERMEDIATE CODE: A523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Effective date: 20140507 Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140516 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 5548160 Free format text: JAPANESE INTERMEDIATE CODE: R150 Country of ref document: JP |