JP5548160B2 - Fault monitoring node device and fault detection and recovery method - Google Patents

Fault monitoring node device and fault detection and recovery method Download PDF

Info

Publication number
JP5548160B2
JP5548160B2 JP2011088509A JP2011088509A JP5548160B2 JP 5548160 B2 JP5548160 B2 JP 5548160B2 JP 2011088509 A JP2011088509 A JP 2011088509A JP 2011088509 A JP2011088509 A JP 2011088509A JP 5548160 B2 JP5548160 B2 JP 5548160B2
Authority
JP
Japan
Prior art keywords
node device
node
unit
ring network
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011088509A
Other languages
Japanese (ja)
Other versions
JP2012222700A (en
Inventor
隆史 吉永
義弘 中野
久徳 沖林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2011088509A priority Critical patent/JP5548160B2/en
Publication of JP2012222700A publication Critical patent/JP2012222700A/en
Application granted granted Critical
Publication of JP5548160B2 publication Critical patent/JP5548160B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Small-Scale Networks (AREA)

Description

本発明は、複数のノード装置がリング状のネットワークに接続されて構成されたリングネットワークシステムにおいて、障害を検知し、障害からの回復を行う障害監視用ノード装置および障害検知回復方法に関する。   The present invention relates to a failure monitoring node device and a failure detection / recovery method for detecting a failure and recovering from a failure in a ring network system configured by connecting a plurality of node devices to a ring network.

従来、複数のノード装置がリング状のネットワークに接続されて構成されたリングネットワークシステムにおいては、例えば、隣接するノード装置間で健全性チェック用のフレームを交換し合ったり、あるいは、監視用のノード装置が他のノード装置から健全性チェック用のフレームに対する応答フレームを収集したりすることによって、ノード装置の障害やネットワークの障害を検知することが行われている。   2. Description of the Related Art Conventionally, in a ring network system configured by connecting a plurality of node devices to a ring network, for example, a frame for health check is exchanged between adjacent node devices, or a monitoring node The device collects response frames for soundness check frames from other node devices, thereby detecting node device failures and network failures.

そして、このような方法によって検知された障害が単一ノード装置の障害または伝送経路上の局所的な単一箇所の障害(以下、単一障害という)であった場合には、リングネットワークのループ経路を切断するための、いわゆる、ブロッキングを再設定する技術を応用することによって、その障害ノード装置または障害伝送経路部分を容易に当該リングネットワークから隔離し、障害のないノード装置および障害のないネットワーク部分を用いて、正常なネットワーク動作を回復させることができる(例えば、特許文献1などを参照)。   If the failure detected by such a method is a failure of a single node device or a failure at a single local location on the transmission path (hereinafter referred to as a single failure), a loop of the ring network By applying a so-called blocking resetting technology for disconnecting the path, the faulty node device or faulty transmission path portion is easily isolated from the ring network, and there is no faulty node device and no faulty network. The normal network operation can be recovered by using the portion (see, for example, Patent Document 1).

特開2007−129606号公報JP 2007-129606 A

しかしながら、単一障害であるにもかかわらず、以上のような方法では、検知されず、隔離もされない障害が存在する。その理由は、その障害が多重障害として検知されるからである。   However, despite the single failure, there is a failure that is not detected or isolated by the above method. The reason is that the failure is detected as a multiple failure.

例えば、リングネットワークに接続されたある1つのノード装置において、フレーム送信回路がCRC(Cyclic Redundancy Check code)などの検査符号を必ず誤って付加する障害が発生し、そのノード装置が誤った検査符号を付加したフレームを、他のノード装置へ送信(ブロードキャスト)したことを想定する。その場合には、その誤った検査符号が付加されたフレームを受信した他のノード装置は、検査符号の検査に失敗する。一方、誤った検査符号が付加されたフレームを送信したノード装置は、ループ経路切断用のブロッキングが設定されているために、その誤った検査符号が付加されたフレームを受信することはなく、従って、検査符号の検査に失敗することはない。その結果、誤った検査符号が付加されたフレームを送信したノード装置は、正常に動作し、誤った検査符号が付加されたフレームを受信した他のすべてのノード装置は、障害が発生した、と判断されることになる。   For example, in one node device connected to the ring network, a failure occurs that the frame transmission circuit always adds a check code such as CRC (Cyclic Redundancy Check code) in error, and the node device generates an incorrect check code. Assume that the added frame is transmitted (broadcast) to another node device. In that case, the other node device that has received the frame with the erroneous check code added fails the check code check. On the other hand, the node device that has transmitted the frame with the wrong check code does not receive the frame with the wrong check code because the blocking for loop path disconnection is set. The check code check will not fail. As a result, the node device that transmitted the frame with the wrong check code is operating normally, and all other node devices that have received the frame with the wrong check code have failed. Will be judged.

同様の障害の例として、ある1つのノード装置以外のノード装置において、受信バッファビジーのエラーが表示されたままになるという障害がある。このような障害は、ある1つのノード装置のフレーム送信回路が誤動作し、リングネットワークに接続されているノード装置の受信処理能力以上の大量のフレームを送信(ブロードキャスト)し続けることなどによって引き起こされる。この場合、大量のフレームを送信したノード装置は、その大量のフレームを受信することがないので、受信バッファビジーのエラーは生じない。   As an example of a similar failure, there is a failure in which a reception buffer busy error remains displayed in a node device other than one node device. Such a failure is caused by a malfunction of a frame transmission circuit of a certain node device, and transmission (broadcasting) of a large number of frames exceeding the reception processing capability of the node device connected to the ring network. In this case, since the node device that has transmitted a large number of frames does not receive the large number of frames, an error of reception buffer busy does not occur.

以上のような障害は、本来は単一障害であるにもかかわらず、従来の技術では、多重障害として検知される。従って、単一障害の隔離を前提としたブロッキングを再設定する技術の適用はされず、障害からの回復を図ることが困難であった。また、一般に、多重障害の原因の解析や障害回復の処置は、容易ではなく、ほとんどの場合、ネットワーク管理者など人手に頼って、その障害回復を図らざるを得なかった。   Although the above failure is originally a single failure, it is detected as a multiple failure in the conventional technique. Therefore, the technology for resetting the blocking based on the isolation of a single failure is not applied, and it is difficult to recover from the failure. In general, analysis of the cause of multiple faults and recovery from faults are not easy, and in most cases, it has been necessary to rely on human resources such as a network administrator to recover the faults.

以上に説明した従来技術の現状に鑑み、本発明が解決しようとする課題は、リングネットワークシステムにおいて多重障害として検知される障害のうち、本来単一障害である障害について、その障害の検知および障害からの回復の容易化を図ることが可能な障害監視用ノード装置および障害検知回復方法を提供することにある。   In view of the current state of the prior art described above, the problem to be solved by the present invention is to detect and detect a failure that is originally a single failure among failures detected as multiple failures in a ring network system. It is an object of the present invention to provide a failure monitoring node device and a failure detection / recovery method capable of facilitating recovery from a failure.

前記課題を解決するために、本発明に係る障害監視用ノード装置は、リングネットワークと、それぞれがデータ処理部およびそのデータ処理部を前記リングネットワークに接続するとともに、前記リングネットワークでのフレーム伝送に係る動作エラーを検知する伝送制御部を少なくとも有する複数のノード装置と、を含んで構成されたリングネットワークシステムにおいて、障害を検知し、障害からの回復を行うノード装置である障害監視用ノード装置であって、そのデータ処理部は、
リングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、そのそれぞれのノード装置からの動作状態情報を収集するノードエラー情報収集部と、
その収集されたそれぞれのノード装置からの動作状態情報が、当該リングネットワークに接続されたノード装置のうち、ある1つのノード装置にフレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置にフレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知部と、
障害ノード装置として検知されたノード装置に当該リングネットワークを介して隣接したノード装置に対して、その障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示部と、
を備えることを特徴とする。
In order to solve the above-mentioned problems, a failure monitoring node device according to the present invention includes a ring network, each of which connects a data processing unit and the data processing unit to the ring network, and transmits frames on the ring network. In a ring network system configured to include at least a plurality of node devices having a transmission control unit that detects such an operation error , a failure monitoring node device that is a node device that detects a failure and recovers from the failure. And the data processor is
Receiving operation state information including information on operation errors related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the ring network, A node error information collection unit that collects operation state information from the node devices of
The collected operation status information from each node device indicates that an operation error related to frame transmission does not occur in one node device among the node devices connected to the ring network, and excludes the node device. all when operation error according to the frame transmission is information indicating that it has generated to the node device, the node device operation error according to the frame transmission has not occurred, the faulty node device for detecting a failure node apparatus A detection unit;
Instructing a node device that is detected as a failed node device to the adjacent node device via the ring network, and instructing a blocking setting to block communication with the node device detected as the failed node device, A network reconfiguration instruction unit that transmits instruction information for instructing the cancellation of the set blocking to the node device for which blocking is set at that time;
It is characterized by providing.

この障害監視用ノード装置において、障害ノード装置検知部は、ある1つのノード装置に動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に動作エラーが発生したことを検知している。これは、多重障害として検知された障害のうち、本来単一障害である障害を抽出して検知していることを意味する。従って、このようにして検知された障害ノード装置については、ネットワーク再構成指示部によるブロッキングの再設定によって、当該リングネットワークから除外することが可能となる。従って、該障害ノード装置が除外されたリングネットワーク再構成され、その際構成されたリングネットワークでは、動作エラーのない通信動作が回復される。   In this failure monitoring node device, the failure node device detection unit detects that an operation error has not occurred in one node device and an operation error has occurred in all other node devices except the node device. Yes. This means that out of the faults detected as multiple faults, a fault that is originally a single fault is extracted and detected. Therefore, the failed node device detected in this way can be excluded from the ring network by resetting the blocking by the network reconfiguration instruction unit. Therefore, the ring network is reconfigured from which the failed node device is excluded, and the communication operation without an operation error is recovered in the ring network configured at that time.

本発明によれば、リングネットワークシステムにおいて多重障害として検知される障害のうち、本来単一障害である障害について、その障害の検知および障害からの回復の容易化を図ることが可能な障害監視用ノード装置および障害検知回復方法を提供することすることができる。   According to the present invention, among faults detected as multiple faults in a ring network system, faults that are originally single faults can be easily detected and recovered from faults. A node device and a failure detection and recovery method can be provided.

本発明の第1の実施形態に係るリングネットワークシステムの構成の例を示した図。The figure which showed the example of the structure of the ring network system which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係るノード装置の構成の例を示した図。The figure which showed the example of a structure of the node apparatus which concerns on the 1st Embodiment of this invention. 発明の第1の実施形態に係る障害監視用ノード装置の構成の例を示した図。The figure which showed the example of a structure of the node apparatus for fault monitoring which concerns on the 1st Embodiment of invention. 本発明の第1の実施形態に係るリングネットワークシステムにおいて、各ノード装置から障害監視用ノード装置へ送信される動作状態報告フレーム、および、障害監視用ノード装置から各ノード装置へ送信されるネットワーク再構成指示フレームの構成の例を示した図。In the ring network system according to the first embodiment of the present invention, the operation status report frame transmitted from each node device to the failure monitoring node device, and the network re-transmission transmitted from the failure monitoring node device to each node device. The figure which showed the example of the structure of the structure instruction | indication frame. 本発明の第1の実施形態に係る障害監視用ノード装置のCPU部によって実行される障害ノード装置検知処理の処理フローの例を示した図。The figure which showed the example of the processing flow of the failure node apparatus detection process performed by the CPU part of the failure monitoring node apparatus which concerns on the 1st Embodiment of this invention. 本発明の第1の実施形態に係る障害監視用ノード装置の障害ノード情報表示部によって表示装置部に表示される障害ノード検知処理結果表示画面の例を示した図。The figure which showed the example of the failure node detection process result display screen displayed on a display apparatus part by the failure node information display part of the failure monitoring node apparatus which concerns on the 1st Embodiment of this invention. 本発明の第2の実施形態に係る2重化リングネットワークシステムの構成の例を示した図。The figure which showed the example of the structure of the duplex ring network system which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る障害監視用ノード装置の構成の例を示した図。The figure which showed the example of a structure of the node apparatus for fault monitoring which concerns on the 2nd Embodiment of this invention. 本発明の第2の実施形態に係る障害監視用ノード装置のCPU部によって実行される2重化リングネットワークシステムにおける障害ノード装置検知処理の処理フローの例を示した図。The figure which showed the example of the processing flow of the failure node apparatus detection process in the double ring network system performed by CPU part of the node apparatus for failure monitoring which concerns on the 2nd Embodiment of this invention.

以下、本発明の実施形態について、図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

<第1の実施形態>
図1は、本発明の第1の実施形態に係るリングネットワークシステムの構成の例を示した図である。図1に示すように、リングネットワークシステム1は、複数のノード装置2がリングネットワーク3に接続されて構成される。そして、その複数のノード装置2のうち1台は、障害ノード装置を検知する目的などために用いられ、本実施形態では、そのノード装置2を、とくに、障害監視用ノード装置2aという。なお、図1では、障害監視用ノード装置2aを含め、6台のノード装置2が描かれているが、ノード装置2の数は、6台に限定されない。
<First Embodiment>
FIG. 1 is a diagram showing an example of the configuration of a ring network system according to the first embodiment of the present invention. As shown in FIG. 1, the ring network system 1 is configured by connecting a plurality of node devices 2 to a ring network 3. One of the plurality of node devices 2 is used for the purpose of detecting the failed node device, and in this embodiment, the node device 2 is particularly referred to as a failure monitoring node device 2a. In FIG. 1, six node devices 2 including the failure monitoring node device 2 a are illustrated, but the number of node devices 2 is not limited to six.

ここで、それぞれのノード装置2(障害監視用ノード装置2aを含む)は、伝送制御部4とデータ処理部5(ただし、障害監視用ノード装置2aの場合は、データ処理部5a)とを含んで構成される。なお、ノード装置2および障害監視用ノード装置2aの構成の詳細については、次に、図2および図3を参照して詳しく説明する。   Here, each node device 2 (including the failure monitoring node device 2a) includes a transmission control unit 4 and a data processing unit 5 (however, in the case of the failure monitoring node device 2a, the data processing unit 5a). Consists of. Details of the configuration of the node device 2 and the failure monitoring node device 2a will be described in detail with reference to FIGS.

また、リングネットワーク3は、それぞれが右回りおよび左回りの2本の伝送路(ただし、図1では、1本の線で描かれている)によって構成され、各ノード装置2から送信される通信フレーム(以下、フレームという)は、右回りまたは左回りの伝送路を介して、通信可能な伝送路の範囲の終端であるブロッキング31の手前のノード装置2まで伝送される。   In addition, the ring network 3 is configured by two clockwise and counterclockwise transmission paths (however, illustrated by one line in FIG. 1), and is transmitted from each node device 2. The frame (hereinafter referred to as a frame) is transmitted to the node device 2 before the blocking 31 that is the end of the range of the communicable transmission path via the clockwise or counterclockwise transmission path.

図2は、本発明の第1の実施形態に係るノード装置の構成の例を示した図である。図1でも示したように、ノード装置2は、伝送制御部4とデータ処理部5とを含んで構成される。ここで、伝送制御部4は、3つの通信ポート41(#1)〜(#3)、フレーム伝送制御部42、フレームバッファ43、エラー検査部44などを含んで構成される。   FIG. 2 is a diagram illustrating an example of the configuration of the node device according to the first embodiment of the present invention. As shown in FIG. 1, the node device 2 includes a transmission control unit 4 and a data processing unit 5. Here, the transmission control unit 4 includes three communication ports 41 (# 1) to (# 3), a frame transmission control unit 42, a frame buffer 43, an error checking unit 44, and the like.

通信ポート41(#1)〜(#3)は、それぞれ、図示しない受信ポートおよび送信ポートを備えている。そして、通信ポート41(#1),(#2)の受信ポートおよび送信ポートは、リングネットワーク3の2本の伝送路にそれぞれ接続される。また、通信ポート41(#3)の図示しない受信ポートおよび送信ポートは、データ処理部5に設けられた通信ポート51の送信ポートおよび受信ポートに接続される。   Each of the communication ports 41 (# 1) to (# 3) includes a reception port and a transmission port (not shown). The reception ports and transmission ports of the communication ports 41 (# 1) and (# 2) are connected to the two transmission paths of the ring network 3, respectively. In addition, a reception port and a transmission port (not shown) of the communication port 41 (# 3) are connected to a transmission port and a reception port of the communication port 51 provided in the data processing unit 5.

フレーム伝送制御部42は、リングネットワーク3の伝送路またはデータ処理部5から送信されるフレームを、通信ポート41(#1)〜(#3)の受信ポートを介して受信し、適宜、フレームバッファ43に一時記憶しつつ、その受信したフレームを、そのフレームに含まれる宛先に応じて、他の通信ポート41(#1)〜(#3)の送信ポートを介して、リングネットワーク3の伝送路またはデータ処理部5へ送信する。   The frame transmission control unit 42 receives a frame transmitted from the transmission path of the ring network 3 or the data processing unit 5 via the reception ports of the communication ports 41 (# 1) to (# 3), and appropriately executes a frame buffer. 43, while temporarily storing the received frame in accordance with the destination included in the frame, the transmission path of the ring network 3 via the transmission ports of the other communication ports 41 (# 1) to (# 3) Alternatively, the data is transmitted to the data processing unit 5.

また、フレーム伝送制御部42は、後記するネットワーク再構成指示フレームを受信した場合には、そのネットワーク再構成指示フレームによって指示された終端すべき送信側の通信ポートを閉塞する機能、すなわち、ブロッキング31を設定する機能を有する。   In addition, when receiving a network reconfiguration instruction frame to be described later, the frame transmission control unit 42 functions to block the transmission side communication port to be terminated, which is instructed by the network reconfiguration instruction frame, that is, blocking 31. Has the function of setting.

エラー検査部44は、フレーム伝送制御部42によって受信されて、フレームバッファ43に一時記憶されたフレームについて、そのフレームに含まれる検査符号(CRC、ECC(Error Correcting Code)など)を検査し、フレームの伝送エラーを検知する。また、エラー検査部44は、フレーム伝送制御部42によって受信されるフレーム量がフレームバッファ43に一時記憶される量を超過したことを検知した場合には、受信バッファビジーなどのエラー状態フラグをフレーム伝送制御部42に通知する。   The error checking unit 44 checks the check code (CRC, ECC (Error Correcting Code), etc.) included in the frame received by the frame transmission control unit 42 and temporarily stored in the frame buffer 43, and the frame Detects transmission errors. When the error checking unit 44 detects that the amount of frames received by the frame transmission control unit 42 exceeds the amount temporarily stored in the frame buffer 43, the error checking unit 44 sets an error status flag such as reception buffer busy. The transmission control unit 42 is notified.

以上のように、伝送制御部4は、ノード装置2の中にありながらも、リングネットワーク3の伝送路の一部を形成し、フレームが伝送される経路の切り替えを行うネットワークスイッチとして機能する。それに対し、データ処理部5は、リングネットワーク3の伝送路からは独立した構成要素である。   As described above, the transmission control unit 4 functions as a network switch that forms a part of the transmission path of the ring network 3 and switches a path through which a frame is transmitted while being in the node device 2. On the other hand, the data processing unit 5 is a component independent of the transmission path of the ring network 3.

図2に示すように、データ処理部5は、通信インタフェース部50(以下、通信IF部50と略称)、CPU(Central Processing Unit)部55などを含んで構成される。なお、ここでいうCPU 部55は、いわゆる演算処理装置部分だけを指すのではなく、演算処理装置および記憶装置を少なくとも含んだ部分を指すものとする。   As shown in FIG. 2, the data processing unit 5 includes a communication interface unit 50 (hereinafter, abbreviated as a communication IF unit 50), a CPU (Central Processing Unit) unit 55, and the like. Here, the CPU unit 55 does not indicate only a so-called arithmetic processing device part, but indicates a part including at least the arithmetic processing device and the storage device.

すなわち、本実施形態では、データ処理部5は、いわゆるコンピュータそのものであるか、または、コンピュータを応用した各種の制御装置に相当する。そして、CPU部55は、そのコンピュータまたは各種制御装置の中枢処理部であり、通信IF部50は、その中枢部であるCPU部55に、伝送制御部4を介してリングネットワーク3を接続するためのインタフェースである。   In other words, in the present embodiment, the data processing unit 5 is a so-called computer itself or corresponds to various control devices to which the computer is applied. The CPU unit 55 is a central processing unit of the computer or various control devices, and the communication IF unit 50 connects the ring network 3 to the central CPU unit 55 via the transmission control unit 4. Interface.

ここで、通信IF部50は、通信ポート51、フレーム送受信制御部52、フレームバッファ53、エラー検査部54などを含んで構成される。そして、その通信ポート51は、伝送制御部4に設けられた通信ポート41(#3)に接続される。また、フレーム送受信制御部52は、CPU部55の指示を受けて、通信ポート51を介して送受信されるフレームの送受信を制御するとともに、送受信されるフレームをフレームバッファ53に一時記憶させる。   Here, the communication IF unit 50 includes a communication port 51, a frame transmission / reception control unit 52, a frame buffer 53, an error check unit 54, and the like. The communication port 51 is connected to a communication port 41 (# 3) provided in the transmission control unit 4. The frame transmission / reception control unit 52 controls the transmission / reception of a frame transmitted / received via the communication port 51 in response to an instruction from the CPU unit 55 and temporarily stores the transmitted / received frame in the frame buffer 53.

また、エラー検査部54は、送受信されるフレームに含まれる検査符号(CRC,ECCなど)を検査し、フレームの伝送エラーを検知する。さらに、エラー検査部44は、フレーム送受信制御部52によって受信されるフレーム量がフレームバッファ53に一時記憶される量を超過したことを検知した場合には、受信バッファビジーなどのエラー状態フラグをフレーム送受信制御部52に通知する。   The error checking unit 54 checks a check code (CRC, ECC, etc.) included in the transmitted / received frame and detects a frame transmission error. Further, when the error checking unit 44 detects that the frame amount received by the frame transmission / reception control unit 52 exceeds the amount temporarily stored in the frame buffer 53, the error checking unit 44 sets an error status flag such as reception buffer busy to the frame. The transmission / reception control unit 52 is notified.

これに対し、CPU部55は、受信処理部56、送信処理部57、アプリケーション処理部58などにより構成される。ここで、受信処理部56および送信処理部57は、フレーム送受信制御部52にフレームの送信指示または受信指示を出力し、フレーム送受信制御部52にフレームの送信動作または受信動作を実行させる。これら受信処理部56および送信処理部57の機能は、CPU部55の図示しない記憶装置に格納されたオペレーティングシステムのプログラムによって実現される。   On the other hand, the CPU unit 55 includes a reception processing unit 56, a transmission processing unit 57, an application processing unit 58, and the like. Here, the reception processing unit 56 and the transmission processing unit 57 output a frame transmission instruction or reception instruction to the frame transmission / reception control unit 52, and cause the frame transmission / reception control unit 52 to perform a frame transmission operation or reception operation. The functions of the reception processing unit 56 and the transmission processing unit 57 are realized by an operating system program stored in a storage device (not shown) of the CPU unit 55.

また、アプリケーション処理部58は、当該ノード装置2の機能に応じてユーザが作成し、記憶装置に格納したプログラムを処理する。すなわち、ノード装置2は、アプリケーション処理部58で処理されるプログラムに応じて、様々なデータ処理機能や制御機能が実現されることになる。   The application processing unit 58 processes a program created by the user according to the function of the node device 2 and stored in the storage device. That is, the node device 2 implements various data processing functions and control functions according to the program processed by the application processing unit 58.

図3は、本発明の第1の実施形態に係る障害監視用ノード装置2aの構成の例を示した図である。障害監視用ノード装置2aは、当該リングネットワークシステム1におけるノード装置2であって、特別に障害監視を行う機能を有するノード装置2である。   FIG. 3 is a diagram showing an example of the configuration of the failure monitoring node device 2a according to the first embodiment of the present invention. The failure monitoring node device 2a is a node device 2 in the ring network system 1, and is a node device 2 that has a special function of performing failure monitoring.

図3に示すように、障害監視用ノード装置2aは、伝送制御部4とデータ処理部5aとを含んで構成され、また、データ処理部5aは、通信IF部50、CPU部55a、表示装置部80などを含んで構成される。障害監視用ノード装置2aの構成は、図2に示したノード装置2の構成とほとんど同じであり、その相違は、CPU部55aの内部構成、および、データ処理部5aが表示装置部80を含むことだけである。   As shown in FIG. 3, the failure monitoring node device 2a includes a transmission control unit 4 and a data processing unit 5a. The data processing unit 5a includes a communication IF unit 50, a CPU unit 55a, and a display device. Part 80 and the like. The configuration of the failure monitoring node device 2a is almost the same as the configuration of the node device 2 shown in FIG. 2 except for the internal configuration of the CPU unit 55a and the data processing unit 5a including the display device unit 80. It is only that.

ただし、表示装置部80は、例えば、LCD(Liquid Crystal Display)などで構成されるものであるが、障害監視用ノード装置2aで新たに追加されたものというわけではなく、ノード装置2にも必要に応じて設けられていてもよい。   However, the display device unit 80 is composed of, for example, an LCD (Liquid Crystal Display), but is not newly added in the failure monitoring node device 2a, and is also necessary for the node device 2. It may be provided according to.

以下、ノード装置2の場合と相違するCPU部55aの内部構成について説明する。図3に示すように、障害監視用ノード装置2aのCPU部55aは、受信処理部56、送信処理部57、ノードエラー情報収集部71、障害ノード装置検知部72、ネットワーク再構成指示部73および障害ノード情報表示部74を含んで構成される。   Hereinafter, an internal configuration of the CPU unit 55a different from the case of the node device 2 will be described. As shown in FIG. 3, the CPU unit 55a of the failure monitoring node device 2a includes a reception processing unit 56, a transmission processing unit 57, a node error information collection unit 71, a failure node device detection unit 72, a network reconfiguration instruction unit 73, and A failure node information display unit 74 is included.

このうち、受信処理部56および送信処理部57は、図2におけるノード装置2に含まれる受信処理部56および送信処理部57と実質的に同じものである。また、ノードエラー情報収集部71、障害ノード装置検知部72、ネットワーク再構成指示部73および障害ノード情報表示部74は、ノード装置2に含まれるアプリケーション処理部58に対応する構成要素であり、障害監視用ノード装置2aを特徴付ける構成要素である。   Among these, the reception processing unit 56 and the transmission processing unit 57 are substantially the same as the reception processing unit 56 and the transmission processing unit 57 included in the node device 2 in FIG. The node error information collection unit 71, the failed node device detection unit 72, the network reconfiguration instruction unit 73, and the failed node information display unit 74 are components corresponding to the application processing unit 58 included in the node device 2, and It is a component that characterizes the monitoring node device 2a.

ノードエラー情報収集部71は、当該リングネットワーク3に接続された各ノード装置2から、各ノード装置2における動作エラー情報を収集する。すなわち、ノードエラー情報収集部71は、リングネットワーク3を経由して、各ノード装置2から送信される動作状態報告フレームを、伝送制御部4、通信IF部50および受信処理部56を介して受信し、その受信した動作状態報告フレームに含まれる情報から各ノード装置2における動作エラー情報を取得する。   The node error information collection unit 71 collects operation error information in each node device 2 from each node device 2 connected to the ring network 3. That is, the node error information collection unit 71 receives the operation state report frame transmitted from each node device 2 via the ring network 3 via the transmission control unit 4, the communication IF unit 50, and the reception processing unit 56. Then, the operation error information in each node device 2 is acquired from the information included in the received operation state report frame.

なお、動作状態報告フレームは、各ノード装置2がフレームの通信動作などにおいて動作エラーを検知したとき、あるいは、所定の時間(例えば、1秒)ごとに、検知した動作エラーの情報などを障害監視用ノード装置2aへ送信するためのフレームである。従って、動作状態報告フレームは、そのフレームを送信するノード装置2における動作エラー情報などの動作状態情報を含んで構成される。なお、動作状態報告フレームの詳細な構成については、後記にて説明する。   Note that the operation status report frame is used to monitor the information of the detected operation error when each node device 2 detects an operation error in the communication operation of the frame or every predetermined time (for example, 1 second). This is a frame for transmission to the network node device 2a. Therefore, the operation state report frame is configured to include operation state information such as operation error information in the node apparatus 2 that transmits the frame. The detailed configuration of the operation status report frame will be described later.

障害ノード装置検知部72は、ノードエラー情報収集部71によって収集された各ノード装置2の動作エラー情報に基づき、障害ノード装置を検知する。すなわち、障害ノード装置検知部72は、各ノード装置2の動作エラー情報に基づく情報が、当該リングネットワーク3に接続された全N台のノード装置2(障害監視用ノード装置2aを含む)のうち、N−1台のノード装置2に動作エラーが発生し、1台のノード装置に動作エラーが発生していないことを表すものであるか否かを判定する。そして、その判定の結果、N−1台のノード装置2に動作エラーが発生し、1台のノード装置に動作エラーが発生していなかった場合には、動作エラーが発生していない1台のノード装置2に何らかの障害が発生していると判断する。そして、その動作エラーが発生していない1台のノード装置2を、障害ノード装置として検知する。   The failure node device detection unit 72 detects the failure node device based on the operation error information of each node device 2 collected by the node error information collection unit 71. That is, the failure node device detection unit 72 includes information based on operation error information of each node device 2 among all N node devices 2 (including the failure monitoring node device 2a) connected to the ring network 3. , It is determined whether or not an operation error has occurred in the N−1 node devices 2 and no operation error has occurred in one node device. As a result of the determination, if an operation error has occurred in the N-1 node devices 2 and no operation error has occurred in one node device, one operation device in which no operation error has occurred. It is determined that some kind of failure has occurred in the node device 2. Then, one node device 2 in which no operation error has occurred is detected as a failed node device.

なお、N−1台のノード装置2にエラーが発生し、1台のノード装置2に動作エラーが発生するような場合の動作エラーとしては、例えば、フレームバッファ43,53において受信バッファビジーが発生する場合や、エラー検査部44,54でCRCエラーやECCエラーが発生する場合などが考えられる。このような動作エラーは、多くの場合、動作エラーが発生していないノード装置2における伝送制御部4または通信IF部50の送信回路などに障害が発生し、フレームが過剰にあるいは際限なく送信される状態になっていたり、CRCやECCの生成回路などに障害が発生し、誤って生成されたCRCやECCがフレームに付加されていたりすることによって引き起こされる。   As an operation error when an error occurs in N-1 node devices 2 and an operation error occurs in one node device 2, for example, reception buffer busy occurs in the frame buffers 43 and 53. Or a case where a CRC error or an ECC error occurs in the error checking units 44 and 54. In many cases, such an operation error causes a failure in the transmission circuit of the transmission control unit 4 or the communication IF unit 50 in the node device 2 in which no operation error has occurred, and frames are transmitted excessively or indefinitely. This is caused by a failure in the CRC or ECC generation circuit or the like, and the erroneously generated CRC or ECC being added to the frame.

なお、障害ノード装置検知部72は、以上のような動作エラーによる障害に限定されず、通常の単一障害や多重障害による障害ノード装置を、さらに、検知するものであってもよい。ただし、ここでは、その種の障害の障害検知については、詳細な説明を省略する。   The failure node device detection unit 72 is not limited to the failure due to the operation error as described above, and may further detect a failure node device due to a normal single failure or multiple failures. However, here, detailed description of the failure detection of that type of failure is omitted.

ネットワーク再構成指示部73は、障害ノード装置検知部72によって障害ノード装置が検知されたとき、当該リングネットワーク3に接続されたノード装置2にネットワーク再構成指示フレームをブロードキャストし、当該リングネットワーク3の構成、つまり、ブロッキング31の位置の変更を指示する。すなわち、ネットワーク再構成指示部73は、送信処理部57、通信IF部50、伝送制御部4を介して、リングネットワーク3に、障害ノード装置を識別するノード装置番号などを含んだネットワーク再構成指示フレームを送信(ブロードキャスト)する。なお、ネットワーク再構成指示フレームの構成については、後記にて説明する。   The network reconfiguration instruction unit 73 broadcasts a network reconfiguration instruction frame to the node device 2 connected to the ring network 3 when the failed node device detection unit 72 detects the failed node device. The configuration, that is, the change of the position of the blocking 31 is instructed. That is, the network reconfiguration instruction unit 73 sends a network reconfiguration instruction including a node device number for identifying a failed node device to the ring network 3 via the transmission processing unit 57, the communication IF unit 50, and the transmission control unit 4. Send (broadcast) the frame. The configuration of the network reconfiguration instruction frame will be described later.

一方、各ノード装置2は、当該ネットワーク再構成指示フレームを受信すると、自身が障害ノード装置にリングネットワーク3を介して隣接するノード装置2であるか否かを判定する。そして、自身が障害ノード装置に隣接するノード装置2であった場合には、障害ノード装置に隣接する側の通信ポート41を閉塞する、すなわち、障害ノード装置に接続されたリングネットワーク3の伝送路上にブロッキング31を設定する。また、そのときまでにブロッキング31を設定していたノード装置2は、当該ネットワーク再構成指示フレームを受信すると、その設定していたブロッキング31を解除する。   On the other hand, when each node device 2 receives the network reconfiguration instruction frame, each node device 2 determines whether or not the node device 2 is a node device 2 adjacent to the failed node device via the ring network 3. If the node device 2 is adjacent to the failed node device, the communication port 41 on the side adjacent to the failed node device is blocked, that is, on the transmission path of the ring network 3 connected to the failed node device. Blocking 31 is set in Further, when receiving the network reconfiguration instruction frame, the node device 2 that has set the blocking 31 until that time releases the blocking 31 that has been set.

以上のようにして、当該リングネットワーク3におけるブロッキング31の位置が変更され、リングネットワーク3が再構成されると、障害ノード装置は、変更後のブロッキング31によってリングネットワーク3の通信可能な範囲から除外されることになる。その結果、障害ノード装置で発生しているフレームが過剰にあるいは際限なく送信されるフレームや、誤ったCRCやECCが付加されたフレームは、リングネットワーク3の通信可能な範囲に入らなくなるので、N−1台のノード装置2に生じていたエラー動作は、多くの場合、消滅する。   As described above, when the position of the blocking 31 in the ring network 3 is changed and the ring network 3 is reconfigured, the failed node device is excluded from the communicable range of the ring network 3 by the changed blocking 31. Will be. As a result, a frame in which an excessive number of frames generated in the failed node device are transmitted excessively or indefinitely, or a frame with an erroneous CRC or ECC added does not fall within the communicable range of the ring network 3. The error operation that has occurred in the one node device 2 disappears in many cases.

障害ノード情報表示部74は、障害ノード装置検知部72によって検知された障害ノード装置を識別する情報(ノード装置番号など)や、ノードエラー情報収集部71によって収集された各ノード装置2で発生した動作エラーについての情報を、表示装置部80のLCDなどに表示する。なお、その表示例については、別途、図5を参照して詳しく説明する。   The failure node information display unit 74 is generated in each node device 2 collected by the node error information collection unit 71 and information for identifying the failure node device detected by the failure node device detection unit 72 (node device number, etc.) Information about the operation error is displayed on the LCD of the display unit 80 or the like. The display example will be described in detail separately with reference to FIG.

図4は、本発明の第1の実施形態に係るリングネットワークシステム1において、各ノード装置2から障害監視用ノード装置2aへ送信される動作状態報告フレーム、および、障害監視用ノード装置2aから各ノード装置2へ送信されるネットワーク再構成指示フレームの構成の例を示した図である。   FIG. 4 shows an operation status report frame transmitted from each node device 2 to the failure monitoring node device 2a and each of the failure monitoring node devices 2a in the ring network system 1 according to the first embodiment of the present invention. 6 is a diagram showing an example of the configuration of a network reconfiguration instruction frame transmitted to the node device 2. FIG.

図4(a)に示すように、動作状態報告フレームは、宛先アドレス、送信元アドレスなどからなるヘッダ部と、当該フレームのデータ種別(すなわち、動作状態報告フレームであることを示す情報)、報告元ノード装置のノード装置番号、動作エラー情報を含んだ動作状態情報、検査符号などからなるデータ部と、によって構成される。   As shown in FIG. 4A, the operation status report frame includes a header portion including a destination address, a transmission source address, etc., a data type of the frame (that is, information indicating that it is an operation status report frame), a report And a data unit including a node device number of the original node device, operation state information including operation error information, and a check code.

また、図4(b)に示すように、ネットワーク再構成指示フレームは、宛先アドレス、送信元アドレスなどからなるヘッダ部と、当該フレームのデータ種別(すなわち、ネットワーク再構成指示フレームであることを示す情報)、障害ノード装置のノード装置番号、検査符号などからなるデータ部と、によって構成される。   Further, as shown in FIG. 4B, the network reconfiguration instruction frame indicates a header portion including a destination address, a transmission source address, and the like, and a data type of the frame (that is, a network reconfiguration instruction frame). Information), a node unit number of the failed node device, and a data part including a check code.

図5は、本発明の第1の実施形態に係る障害監視用ノード装置2aのCPU部55aによって実行される障害ノード装置検知処理の処理フローの例を示した図である。なお、この処理フローの例には、障害ノード装置検知部72の動作に相当する処理だけでなく、ノードエラー情報収集部71、ネットワーク再構成指示部73、障害ノード情報表示部74などの動作に相当する処理も含まれている。   FIG. 5 is a diagram illustrating an example of a processing flow of a failure node device detection process executed by the CPU unit 55a of the failure monitoring node device 2a according to the first embodiment of the present invention. This example of the processing flow includes not only processing corresponding to the operation of the failed node device detection unit 72 but also operations of the node error information collection unit 71, the network reconfiguration instruction unit 73, the failed node information display unit 74, and the like. Corresponding processing is also included.

図5に示すように(適宜、図1も参照)、CPU部55aは、まず、各ノード装置2から送信される動作状態報告フレームを受信し、各ノード装置2における動作エラー情報を収集する(ステップS11)。次に、CPU部55aは、その収集したエラー情報に基づき、当該リングネットワーク3に接続された全ノード装置N台のうち少なくとも1台に動作エラーがあったか否かを判定する(ステップS12)。そして、その判定の結果、全ノード装置N台のうち1台にも動作エラーがなかった場合には(ステップS12でNo)、障害ノード装置の検知は必要でないので、CPU部55aは、当該障害ノード装置検知処理を終了する。   As shown in FIG. 5 (see also FIG. 1 as appropriate), the CPU unit 55a first receives an operation state report frame transmitted from each node device 2 and collects operation error information in each node device 2 (see FIG. 5). Step S11). Next, based on the collected error information, the CPU unit 55a determines whether or not at least one of the N node devices connected to the ring network 3 has an operation error (step S12). As a result of the determination, if there is no operation error in one of all the N node devices (No in step S12), since the detection of the failed node device is not necessary, the CPU unit 55a The node device detection process is terminated.

一方、ステップS12の判定で、全ノード装置N台のうち少なくとも1台に動作エラーがあった場合には(ステップS12でYes)、CPU部55aは、さらに、全ノード装置N台のうちN−1台に動作エラーがあったか否かを判定する(ステップS13)。そして、その判定の結果、N−1台には動作エラーがなかった場合、つまり、1台ないしN−2台に動作エラーがあった場合には(ステップS13でNo)、CPU部55aは、動作エラーありの動作エラー情報を送信した1台ないしN−2台のノード装置2の動作エラー情報に基づき、障害ノード装置を検知する(ステップS17)。   On the other hand, if it is determined in step S12 that at least one of the N node devices has an operation error (Yes in step S12), the CPU unit 55a further determines that N− of all N node devices. It is determined whether or not one unit has an operation error (step S13). As a result of the determination, if there is no operation error in N-1 units, that is, if there is an operation error in one or N-2 units (No in step S13), the CPU unit 55a Based on the operation error information of the one or N-2 node devices 2 that transmitted the operation error information with an operation error, the faulty node device is detected (step S17).

なお、その場合の障害ノード装置検知の方法については、ここでは、とくに説明をしないが、動作エラー情報を送信したノード装置2が1台の場合には、通常、そのノード装置2が障害ノード装置となる。また、動作エラー情報を送信したノード装置2が2台ないしN−1台の場合には、その全部が障害ノード装置である場合もあり、また、その一部のみが障害ノード装置である場合もあり、そのいずれであるかを弁別するのは、必ずしも容易ではない。   In this case, the fault node device detection method is not particularly described here, but when there is one node device 2 that has transmitted the operation error information, the node device 2 is usually the fault node device. It becomes. Further, when there are two or N-1 node devices 2 that have transmitted the operation error information, all of them may be failed node devices, or only some of them may be failed node devices. It is not always easy to discriminate which one is present.

次に、ステップS13の判定で、全ノード装置N台のうちN−1台に動作エラーがあった場合には(ステップS13でYes)、CPU部55aは、動作エラーがない動作エラー情報を送信したノード装置2を、障害ノード装置として検知する(ステップS14)。そして、CPU部55aは、ステップS11で収集した各ノード装置2のエラー情報およびステップS14で検知した障害ノード装置の識別情報を表示装置部80に表示するともに(ステップS15)、図4(b)に示したネットワーク再構成指示フレームを全ノード装置2にブロードキャストする(ステップS16)。   Next, when it is determined in step S13 that there is an operation error in N-1 of all the node devices N (Yes in step S13), the CPU unit 55a transmits operation error information with no operation error. The detected node device 2 is detected as a failed node device (step S14). The CPU unit 55a displays the error information of each node device 2 collected in step S11 and the identification information of the failed node device detected in step S14 on the display device unit 80 (step S15), and FIG. Is broadcast to all the node devices 2 (step S16).

以上の処理により、全ノード装置N台のうち、N−1台から送信された動作状態報告フレームに含まれる動作状態情報が動作エラーありを示し、1台から送信された動作状態報告フレームに含まれる動作状態情報が動作エラーなしを示すものであった場合には、動作エラーなしの動作状態報告フレームを送信したノード装置2は、障害ノード装置であると判定される。そして、その障害ノード装置と判定されたノード装置2は、ネットワーク再構成指示フレームによって、再設定されるブロッキング31によって、当該リングネットワーク3の通信可能範囲から除外される。その結果、N−1台のノード装置2に生じていたエラー動作は、多くの場合、消滅する。   As a result of the above processing, the operation state information included in the operation state report frame transmitted from N-1 of all N node devices indicates that there is an operation error and is included in the operation state report frame transmitted from one unit. If the operation state information indicates that there is no operation error, the node device 2 that has transmitted the operation state report frame without operation error is determined to be a failed node device. Then, the node device 2 determined as the failed node device is excluded from the communicable range of the ring network 3 by the resetting blocking 31 by the network reconfiguration instruction frame. As a result, the error operation that has occurred in the N−1 node devices 2 is often eliminated.

図6は、本発明の第1の実施形態に係る障害監視用ノード装置2aの障害ノード情報表示部74によって表示装置部80に表示される障害ノード検知処理結果表示画面の例を示した図である。図6に示すように、障害ノード検知処理結果表示画面には、障害ノード装置のノード装置番号だけでなく、各ノード装置2における動作エラー情報(エラーの有無、エラーコード、エラー名称など)が表示される。   FIG. 6 is a diagram showing an example of a failure node detection processing result display screen displayed on the display device unit 80 by the failure node information display unit 74 of the failure monitoring node device 2a according to the first embodiment of the present invention. is there. As shown in FIG. 6, the failure node detection processing result display screen displays not only the node device number of the failed node device but also operation error information (the presence / absence of an error, error code, error name, etc.) in each node device 2. Is done.

このような表示画面により、当該リングネットワークシステム1のシステム管理者は、1台を除く、N−1台に動作エラーが発生したことを知ることができる。多くの場合、このようなエラー動作は、障害監視用ノード装置2aによるネットワーク再構成指示フレームの送信によって解消されるが、当然ながら、解消されない場合もあり得る。その場合には、システム管理者は、このような表示画面に表示される情報に基づき、各ノード装置2における動作エラーの原因を解析して、障害ノード装置を特定する。   From such a display screen, the system administrator of the ring network system 1 can know that an operation error has occurred in N-1 units except for one unit. In many cases, such an error operation is eliminated by transmission of a network reconfiguration instruction frame by the failure monitoring node device 2a, but of course, it may not be eliminated. In this case, the system administrator analyzes the cause of the operation error in each node device 2 based on the information displayed on such a display screen, and identifies the failed node device.

以上、本発明の第1の実施形態によれば、障害監視用ノード装置2aは、リングネットワーク3に接続された全ノード装置N台のうち、1台を除くN−1台に動作エラーが発生したことを検知するとともに、そのとき動作エラーが発生していない1台のノード装置を障害ノード装置と判定し、各ノード装置2に対し、ネットワーク再構成指示フレームを送信する。各ノード装置2は、そのネットワーク再構成指示フレームを受信すると、リングネットワーク3におけるブロッキング31を再設定し、障害ノード装置と判定されたノード装置2を、そのリングネットワーク3の通信可能な範囲から除外する。その結果、各ノード装置2における動作エラーは解消され、リングネットワーク3における正常な通信動作が回復される。   As described above, according to the first embodiment of the present invention, the failure monitoring node device 2a generates an operation error in N-1 of all the node devices N connected to the ring network 3, except for one. At this time, one node device in which no operation error has occurred is determined as a failed node device, and a network reconfiguration instruction frame is transmitted to each node device 2. Upon receipt of the network reconfiguration instruction frame, each node device 2 resets the blocking 31 in the ring network 3 and excludes the node device 2 determined as the failed node device from the communicable range of the ring network 3. To do. As a result, the operation error in each node device 2 is eliminated, and normal communication operation in the ring network 3 is restored.

従って、本実施形態では、多重障害として検知された障害のうち、本来単一障害である障害については、その障害ノード装置の検知が容易に行えるようになり、障害からの回復を容易に行えるようになる。   Therefore, in the present embodiment, among the faults detected as multiple faults, a fault that is originally a single fault can be easily detected and the recovery from the fault can be easily performed. become.

<第2の実施形態>
図7は、本発明の第2の実施形態に係る2重化リングネットワークシステムの構成の例を示した図である。なお、図7以降の図において、第1の実施形態と同じ構成要素については、同じ符号を付し、その説明省略する。
<Second Embodiment>
FIG. 7 is a diagram showing an example of the configuration of a duplex ring network system according to the second embodiment of the present invention. In FIG. 7 and subsequent figures, the same components as those in the first embodiment are denoted by the same reference numerals, and the description thereof is omitted.

図7に示すように、2重化リングネットワークシステム1dは、複数のノード装置2dが互いに独立した2重のリングネットワーク3に接続されて構成される。そして、その複数のノード装置2dのうち1台は、障害ノード装置を検知する目的などために用いられ、そのノード装置2dを、とくに、障害監視用ノード装置2daという。なお、図7では、障害監視用ノード装置2daを含め、6台のノード装置2dが描かれているが、ノード装置2dの数は、6台に限定されない。   As shown in FIG. 7, a duplex ring network system 1d is configured by connecting a plurality of node devices 2d to a duplex ring network 3 independent of each other. One of the plurality of node devices 2d is used for the purpose of detecting a failure node device, and the node device 2d is particularly referred to as a failure monitoring node device 2da. In FIG. 7, six node devices 2 d including the failure monitoring node device 2 da are illustrated, but the number of node devices 2 d is not limited to six.

ここで、それぞれのノード装置2d(障害監視用ノード装置2daを含む)は、2重の伝送制御部4と、2重のデータ処理部5d(ただし、障害監視用ノード装置2daの場合は、データ処理部5da)と、2重の伝送制御部4を2重のデータ処理部5dのうちの一方のデータ処理部5dに接続する経路切替部6と、を含んで構成される。そして、2重の伝送制御部4のうち一方の伝送制御部4は、2重のリングネットワーク3のうちの一方のリングネットワーク3(伝送路#1)に接続され、他方の伝送制御部4は、2重のリングネットワーク3のうちの他方のリングネットワーク3(伝送路#2)に接続される。   Here, each node device 2d (including the failure monitoring node device 2da) includes a double transmission control unit 4 and a double data processing unit 5d (however, in the case of the failure monitoring node device 2da, data And a path switching unit 6 that connects the double transmission control unit 4 to one data processing unit 5d of the double data processing units 5d. One transmission control unit 4 of the double transmission control units 4 is connected to one ring network 3 (transmission path # 1) of the double ring network 3, and the other transmission control unit 4 is It is connected to the other ring network 3 (transmission path # 2) of the double ring networks 3.

すなわち、第2の実施形態に係る2重化リングネットワークシステム1dの各ノード装置2d(障害監視用ノード装置2daを含む)においては、2重のデータ処理部5d(5da)のうちの一方のデータ処理部5d(5da)が稼働状態にあり、他方のデータ処理部5d(5da)が待機状態にある形態で用いられる。一方、2重の伝送制御部4および2重のリングネットワーク3は、いずれも常に稼働状態にあるものとして用いられる。このとき、稼働状態のデータ処理部5d(5da)は、経路切替部6を介して、2重の伝送制御部4の両方に接続され、待機状態のデータ処理部5d(5da)は、経路切替部6によって2重の伝送制御部4の間の接続が切断される。   In other words, in each node device 2d (including the failure monitoring node device 2da) of the duplex ring network system 1d according to the second embodiment, one of the data in the double data processing unit 5d (5da). The processing unit 5d (5da) is in an operating state, and the other data processing unit 5d (5da) is in a standby state. On the other hand, the double transmission control unit 4 and the double ring network 3 are both used as always operating. At this time, the data processing unit 5d (5da) in the operating state is connected to both of the double transmission control units 4 via the path switching unit 6, and the data processing unit 5d (5da) in the standby state is switched to the path switching unit. The connection between the double transmission control units 4 is disconnected by the unit 6.

なお、図7において、経路切替部6に描かれている実線は、稼働状態のデータ処理部5d(#1)(5da(#1))と2重の伝送制御部4とが接続されていることを表し、破線は、待機状態のデータ処理部5d(#2)(5da(#2))と2重の伝送制御部4とが切断されていることを表している。なお、データ処理部5d(5da)の状態切り替えは、それぞれのノード装置2d(2da)ごとに独立に行うことができ、稼働状態のデータ処理部5d(5da)が、一方から他方へ切り替えられたときには、2重のデータ処理部5d(5da)と2重の伝送制御部4との接続関係も併せて切り替えられる。   In FIG. 7, the solid line drawn in the path switching unit 6 is connected to the data processing unit 5d (# 1) (5da (# 1)) in operation and the double transmission control unit 4. The broken line represents that the data processing unit 5d (# 2) (5da (# 2)) in the standby state and the double transmission control unit 4 are disconnected. The state switching of the data processing unit 5d (5da) can be performed independently for each node device 2d (2da), and the data processing unit 5d (5da) in the operating state is switched from one to the other. Sometimes, the connection relationship between the double data processing unit 5d (5da) and the double transmission control unit 4 is also switched.

図8は、発明の第2の実施形態に係る障害監視用ノード装置2daの構成の例を示した図である。なお、ノード装置2dの構成は、障害監視用ノード装置2daの構成とは、障害監視用ノード装置2daが障害監視に係る機能を実現するブロックを余分に含んでいることを除けば、ほとんど同じであるので、ノード装置2dの構成も、ここで併せて、付加的に説明する。   FIG. 8 is a diagram showing an example of the configuration of the failure monitoring node device 2da according to the second embodiment of the present invention. The configuration of the node device 2d is almost the same as the configuration of the failure monitoring node device 2da except that the failure monitoring node device 2da includes an extra block for realizing a function related to failure monitoring. Therefore, the configuration of the node device 2d will be additionally described here.

第2の実施形態では、リングネットワーク3が2重に設けられているため、障害監視用ノード装置2da(ノード装置2d)は、その2重のリングネットワーク3にそれぞれ接続される2重の伝送制御部4を有している。そして、その伝送制御部4の内部の構成は、図2に示した伝送制御部4の構成と同じである。   In the second embodiment, since the ring network 3 is provided in duplicate, the failure monitoring node device 2da (node device 2d) is configured to perform double transmission control connected to the double ring network 3 respectively. Part 4. The internal configuration of the transmission control unit 4 is the same as the configuration of the transmission control unit 4 shown in FIG.

また、障害監視用ノード装置2da(ノード装置2d)は、2重の伝送制御部4を稼働状態のデータ処理部5da(5d)に接続するとともに、待機状態のデータ処理部5da(5d)との接続を切断する経路切替部6を有している。経路切替部6は、2重の伝送制御部4を、一方のデータ処理部5da(5d)に接続するとともに、他方のデータ処理部5da(5d)との接続を切断するためのスイッチSW61〜64を有している。さらに、経路切替部6は、データ処理部5da(5d)からの指示に従って、スイッチSW61〜SW64の切り替えを制御するSW制御部60を有している。   In addition, the failure monitoring node device 2da (node device 2d) connects the double transmission control unit 4 to the active data processing unit 5da (5d) and communicates with the standby data processing unit 5da (5d). A path switching unit 6 that disconnects the connection is provided. The path switching unit 6 connects the double transmission control unit 4 to one data processing unit 5da (5d) and switches SW61 to SW64 for disconnecting the connection to the other data processing unit 5da (5d). have. Furthermore, the path switching unit 6 includes a SW control unit 60 that controls switching of the switches SW61 to SW64 in accordance with an instruction from the data processing unit 5da (5d).

また、障害監視用ノード装置2da(ノード装置2d)は、2重のデータ処理部5da(5d)を有している。そして、2重のデータ処理部5da(5d)のうち、経路切替部6によって2重の伝送制御部4に接続されているデータ処理部5da(5d)は、稼働状態にあり、また、経路切替部6によって2重の伝送制御部4との接続が切断されているデータ処理部5da(5d)は、待機状態にある。   The failure monitoring node device 2da (node device 2d) has a double data processing unit 5da (5d). Of the double data processing units 5da (5d), the data processing unit 5da (5d) connected to the double transmission control unit 4 by the path switching unit 6 is in an operating state, and the path switching is performed. The data processing unit 5da (5d) in which the connection with the double transmission control unit 4 is disconnected by the unit 6 is in a standby state.

データ処理部5da(5d)は、通信IF部50と、CPU部55da(55d:なお、55dは、データ処理部5dのCPU部を表す符号であるが、図示されていない)と、を含んで構成される。ここでは、図8を参照して、障害監視用ノード装置2daのCPU部55daの構成について説明する。   The data processing unit 5da (5d) includes a communication IF unit 50 and a CPU unit 55da (55d: 55d is a code representing the CPU unit of the data processing unit 5d, but is not illustrated). Composed. Here, the configuration of the CPU unit 55da of the failure monitoring node device 2da will be described with reference to FIG.

図8に示すように、障害監視用ノード装置2daのCPU部55daは、受信処理部56、送信処理部57、稼働系切替処理部59、ノードエラー情報収集部71、障害ノード装置検知部72、ネットワーク再構成指示部73および障害ノード情報表示部74、稼働系切替指示部75などを含んで構成される。なお、図8では、表示装置部80の図示が省略されている。   As shown in FIG. 8, the CPU unit 55da of the failure monitoring node device 2da includes a reception processing unit 56, a transmission processing unit 57, an active system switching processing unit 59, a node error information collection unit 71, a failure node device detection unit 72, The network reconfiguration instruction unit 73, the failure node information display unit 74, and the active system switching instruction unit 75 are included. In FIG. 8, the display unit 80 is not shown.

図8に示したCPU部55daの構成は、図3に示した障害監視用ノード装置2aのCPU部55aの構成とは、稼働系切替処理部59および稼働系切替指示部75が追加されている点でのみ相違している。他の構成要素については、CPU部55aの場合と同じであるので、ここでは、その説明を省略する。   The configuration of the CPU unit 55da illustrated in FIG. 8 is different from the configuration of the CPU unit 55a of the failure monitoring node device 2a illustrated in FIG. 3 in that an operating system switching processing unit 59 and an operating system switching instruction unit 75 are added. It differs only in the point. The other components are the same as in the case of the CPU unit 55a, and thus description thereof is omitted here.

稼働系切替処理部59は、自身が含まれるデータ処理部5daの状態を、稼働状態から待機状態へ、または、待機状態から稼働状態へ切り替える処理を行うとともに、切り替えたことを経路切替部6のSW制御部60へ通知する。なお、稼働系切替処理部59は、通常のノード装置2dのCPU部55dにも含まれる構成要素である。   The active system switching processing unit 59 performs a process of switching the state of the data processing unit 5da including itself from the operating state to the standby state, or from the standby state to the operating state. The SW control unit 60 is notified. The active system switching processing unit 59 is a component included in the CPU unit 55d of the normal node device 2d.

稼働系切替指示部75は、障害ノード装置検知部72によって障害ノード装置が検知されたとき、その検知された障害ノード装置に対して、データ処理部5dにおける稼働系の切替を行うことを指示する稼働系切替指示情報を含んで構成された稼働系切替指示フレームの送信を、送信処理部57に指示する。送信処理部57は、その送信指示された稼働系切替指示フレームを通信IF部50、経路切替部6、伝送制御部4、リングネットワーク3を介して、障害ノード装置として検知されたノード装置2dへ送信する。   When the failure node device detection unit 72 detects a failure node device, the operation system switching instruction unit 75 instructs the detected failure node device to switch the operation system in the data processing unit 5d. The transmission processing unit 57 is instructed to transmit an active system switching instruction frame including the active system switching instruction information. The transmission processing unit 57 sends the operating system switching instruction frame instructed to be transmitted to the node device 2d detected as the failed node device via the communication IF unit 50, the path switching unit 6, the transmission control unit 4, and the ring network 3. Send.

なお、送信指示された稼働系切替指示フレームを受信した障害ノード装置(ノード装置2dの1つ)の稼動状態のデータ処理部5dに含まれるCPU部55dは、稼働系切替処理部59の処理により自身の状態を稼動状態から待機状態へと切り替え、また、待機状態のデータ処理部5dの状態を待機状態から稼動状態へと切り替える。   The CPU unit 55d included in the data processing unit 5d in the operating state of the failed node device (one of the node devices 2d) that has received the operating system switching instruction frame that has been instructed to transmit is processed by the operating system switching processing unit 59. The own state is switched from the active state to the standby state, and the state of the data processing unit 5d in the standby state is switched from the standby state to the active state.

図9は、本発明の第2の実施形態に係る障害監視用ノード装置2daのCPU部55daによって実行される2重化リングネットワークシステム1dにおける障害ノード装置検知処理の処理フローの例を示した図である。この第2の実施形態では、各ノード装置2dの動作エラーの解消を図るために、第1の対応処理(ステップS15b)および第2の対応処理(ステップS16)を用意しておき、第1の対応処理で各ノード装置2dの動作エラーの解消ができなかった場合には、第2の対応処理で各ノード装置2dの動作エラーの解消を図る。   FIG. 9 is a diagram showing an example of a processing flow of a failure node device detection process in the redundant ring network system 1d executed by the CPU unit 55da of the failure monitoring node device 2da according to the second embodiment of the present invention. It is. In the second embodiment, in order to eliminate the operation error of each node device 2d, the first corresponding process (step S15b) and the second corresponding process (step S16) are prepared, and the first If the handling process fails to eliminate the operation error of each node device 2d, the second handling process attempts to eliminate the operation error of each node device 2d.

図9に示すように、CPU部55daは、まず、各ノード装置2dから送信される動作状態報告フレームを受信し、各ノード装置2dにおける動作エラー情報を収集する(ステップS11)。次に、CPU部55daは、その収集した動作エラー情報に基づき、当該2重のリングネットワーク3に接続された全ノード装置N台のうち少なくとも1台に動作エラーがあったか否かを判定する(ステップS12)。そして、その判定の結果、全ノード装置N台のうち1台にも動作エラーがなかった場合には(ステップS12でNo)、障害ノード装置の検知は必要でないので、CPU部55daは、当該障害ノード装置検知処理を終了する。   As shown in FIG. 9, the CPU section 55da first receives an operation state report frame transmitted from each node device 2d and collects operation error information in each node device 2d (step S11). Next, based on the collected operation error information, the CPU unit 55da determines whether or not at least one of the N node devices connected to the dual ring network 3 has an operation error (Step S55). S12). As a result of the determination, if there is no operation error in one of all the node devices N (No in step S12), the detection of the failed node device is not necessary, so the CPU unit 55da The node device detection process is terminated.

一方、ステップS12の判定で、全ノード装置N台のうち少なくとも1台に動作エラーがあった場合には(ステップS12でYes)、CPU部55daは、さらに、全ノード装置N台のうちN−1台に動作エラーがあったか否かを判定する(ステップS13)。そして、その判定の結果、N−1台には動作エラーなかった場合、つまり、1台ないしN−2台に動作エラーがあった場合には(ステップS13でNo)、CPU部55daは、動作エラーありの動作エラー情報を送信した1台ないしN−2台のノード装置2の動作エラー情報に基づき、障害ノード装置を検知する(ステップS17)。   On the other hand, if it is determined in step S12 that there is an operation error in at least one of the N node devices (Yes in step S12), the CPU unit 55da further determines N− of the N node devices. It is determined whether or not one unit has an operation error (step S13). As a result of the determination, if there is no operation error in N-1 units, that is, if there is an operation error in one or N-2 units (No in step S13), the CPU section 55da A faulty node device is detected based on the operation error information of the one or N-2 node devices 2 that transmitted the operation error information with an error (step S17).

次に、ステップS13の判定で、全ノード装置N台のうちN−1台に動作エラーがあった場合には(ステップS13でYes)、CPU部55daは、動作エラーがない動作エラー情報を送信したノード装置を、障害ノード装置として検知する(ステップS14)。そして、CPU部55daは、ステップS11で収集した各ノード装置2dのエラー情報およびステップS14で検知した障害ノード装置の識別情報を表示装置部80に表示する(ステップS15)。なお、その表示内容は、図6に示した表示内容に準ずる。   Next, when it is determined in step S13 that there is an operation error in N-1 of all the node devices N (Yes in step S13), the CPU unit 55da transmits operation error information with no operation error. The detected node device is detected as a failed node device (step S14). Then, the CPU unit 55da displays the error information of each node device 2d collected in step S11 and the identification information of the failed node device detected in step S14 on the display device unit 80 (step S15). Note that the display contents conform to the display contents shown in FIG.

以上、ここまでの処理は、図5に示した第1の実施形態における障害ノード装置検知処理と同じである。   The processing so far is the same as the failure node device detection processing in the first embodiment shown in FIG.

次に、CPU部55daは、ステップS14において障害ノード装置として検知されたノード装置2dが、再度、障害ノード装置として検知されたか否かを判定し(ステップS15a)、初回の検知であった場合には(ステップS15aでNo)、第1の対応処理として、障害ノード装置として検知されたノード装置2dへ、稼働系切替指示フレームを送信する(ステップS15b)。   Next, the CPU unit 55da determines whether or not the node device 2d detected as the failed node device in step S14 is detected again as the failed node device (step S15a). (No in step S15a), as the first handling process, the active system switching instruction frame is transmitted to the node device 2d detected as the failed node device (step S15b).

このとき、稼働系切替指示フレームを受信した、障害ノード装置と判定されたノード装置2dは、自身における稼動状態のデータ処理部5dの状態を稼動状態から待機状態へと切り替え、また、待機状態のデータ処理部5dの状態を待機状態から稼動状態へと切り替える。ここで、障害ノード装置と判定されたノード装置2d以外のノード装置2dで生じた動作エラーの原因が、障害ノード装置と判定されたノード装置2dの切り替え前の稼動状態のデータ処理部5dにあった場合(例えば、通信IF部50の送信回路が過剰にまたは際限なくフレームを送信した場合や、CRCやECCの生成回路が誤ったCRCやECCを付加した場合)には、この稼動系の切り替えによって、障害ノード装置とされたノード装置2d以外のノード装置2dにおける動作エラーは解消する。   At this time, the node device 2d that has received the active system switching instruction frame and has been determined to be a failed node device switches the state of the data processing unit 5d in its active state from the active state to the standby state, The state of the data processing unit 5d is switched from the standby state to the operating state. Here, the cause of the operation error occurring in the node device 2d other than the node device 2d determined as the failed node device is in the data processing unit 5d in the operating state before the switching of the node device 2d determined as the failed node device. In this case (for example, when the transmission circuit of the communication IF unit 50 transmits frames excessively or indefinitely, or when the CRC or ECC generation circuit adds an incorrect CRC or ECC), this operation system switching is performed. As a result, the operation error in the node device 2d other than the node device 2d determined as the failed node device is eliminated.

一方、ステップS15aにおける判定で、障害ノード装置として検知されたノード装置2dが、再度、障害ノード装置として検知された場合(ステップS15aでYes)、これは、前記した第1の対応処理では、障害ノード装置と判定されたノード装置2d以外のノード装置2dで生じた動作エラーが解消しなかったことを意味するので、第2の対応処理として、CPU部55daは、図4(b)に示したネットワーク再構成指示フレームを全ノード装置2dにブロードキャストする(ステップS16)。   On the other hand, when the node device 2d detected as the failed node device is detected again as the failed node device in the determination in step S15a (Yes in step S15a), this is a failure in the first handling process described above. Since this means that an operation error occurred in the node device 2d other than the node device 2d determined to be a node device has not been resolved, as a second corresponding process, the CPU unit 55da has shown in FIG. A network reconfiguration instruction frame is broadcast to all the node devices 2d (step S16).

この第2の対応処理は、第1の実施形態で説明したブロッキング31を再設定する処理であり、そのブロッキング31の再設定によって、障害ノード装置と判定されたノード装置2dは、当該2重のリングネットワーク3の通信可能範囲から除外される。その結果、障害ノード装置と判定されたノード装置2d以外のノード装置2dに生じていたエラー動作は、消滅する。   This second handling process is a process for resetting the blocking 31 described in the first embodiment, and the node apparatus 2d determined as the failed node apparatus by the resetting of the blocking 31 It is excluded from the communicable range of the ring network 3. As a result, the error operation that has occurred in the node devices 2d other than the node device 2d determined as the failed node device disappears.

以上、本発明の第2の実施形態によれば、障害監視用ノード装置2daは、2重のリングネットワーク3に接続された全ノード装置N台のうち、1台を除くN−1台に動作エラーが発生したことを検知するとともに、そのとき動作エラーが発生していない1台のノード装置2dを障害ノード装置として検知する。そして、障害回復のための第1の対応処理として、まず、障害ノード装置と判定したノード装置2dに対し、稼働系切替指示フレームを送信する。また、その第1の対応処理を行っても、それまでと同様の動作エラーが発生する場合には、第2の対応処理として、2重のリングネットワーク3におけるブロッキング31を再設定し、障害ノード装置と判定されたノード装置2dを、そのリングネットワーク3の通信可能な範囲から除外する。その結果、障害ノード装置と判定されたノード装置2d以外のノード装置2dにおける動作エラーが解消し、2重のリングネットワーク3における正常な通信動作が回復される。   As described above, according to the second embodiment of the present invention, the failure monitoring node device 2da operates on N-1 of all the node devices N connected to the double ring network 3, except for one. While detecting that an error has occurred, one node device 2d in which no operation error has occurred is detected as a failed node device. Then, as the first response processing for failure recovery, first, an active system switching instruction frame is transmitted to the node device 2d determined to be the failed node device. Further, if the same operation error as before occurs even if the first handling process is performed, the blocking 31 in the double ring network 3 is reset as the second handling process, and the failed node The node device 2d determined to be a device is excluded from the communicable range of the ring network 3. As a result, the operation error in the node device 2d other than the node device 2d determined as the failed node device is eliminated, and the normal communication operation in the double ring network 3 is recovered.

従って、第2の実施形態においても、多重障害として検知された障害のうち、本来単一障害である障害については、その障害ノード装置の検知が容易に行えるようになり、障害からの回復を容易に行えるようになる。   Therefore, also in the second embodiment, among the faults detected as multiple faults, faults that are originally single faults can be easily detected by the faulty node device, and recovery from faults is easy. Will be able to do.

1 リングネットワークシステム
1d 2重化リングネットワークシステム
2,2d ノード装置
2a,2da 障害監視用ノード装置
3 リングネットワーク
4 伝送制御部
5,5a,5d,5da データ処理部
6 経路切替部
31 ブロッキング
41,51 通信ポート
42 フレーム伝送制御部
43,53 フレームバッファ
44,54 エラー検査部
50 通信IF部(通信インタフェース部)
52 フレーム送受信制御部
55,55a,55d,55da CPU部
56 受信処理部
57 送信処理部
58 アプリケーション処理部
59 稼働系切替処理部
60 SW制御部
71 ノードエラー情報収集部
72 障害ノード装置検知部
73 ネットワーク再構成指示部
74 障害ノード情報表示部
75 稼働系切替指示部
80 表示装置部
DESCRIPTION OF SYMBOLS 1 Ring network system 1d Duplex ring network system 2, 2d Node apparatus 2a, 2da Fault monitoring node apparatus 3 Ring network 4 Transmission control part 5, 5a, 5d, 5da Data processing part 6 Path switching part 31 Blocking 41, 51 Communication port 42 Frame transmission control unit 43, 53 Frame buffer 44, 54 Error inspection unit 50 Communication IF unit (communication interface unit)
52 frame transmission / reception control unit 55, 55a, 55d, 55da CPU unit 56 reception processing unit 57 transmission processing unit 58 application processing unit 59 active system switching processing unit 60 SW control unit 71 node error information collection unit 72 fault node device detection unit 73 network Reconfiguration instruction unit 74 Fault node information display unit 75 Active system switching instruction unit 80 Display device unit

Claims (10)

リングネットワークと、それぞれがデータ処理部およびそのデータ処理部を前記リングネットワークに接続するとともに、前記リングネットワークでのフレーム伝送に係る動作エラーを検知する伝送制御部を少なくとも有する複数のノード装置と、を含んで構成されたリングネットワークシステムにおいて、障害を検知し、障害からの回復を行うノード装置である障害監視用ノード装置であって、
前記データ処理部は、
前記リングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集部と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記リングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知部と、
前記障害ノード装置として検知されたノード装置に前記リングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示部と、
を備えること
を特徴とする障害監視用ノード装置。
A ring network, and a plurality of node devices each having a data processing unit and a data processing unit connected to the ring network, and at least a transmission control unit for detecting an operation error related to frame transmission in the ring network, In a ring network system configured to include a failure monitoring node device that is a node device that detects a failure and recovers from the failure,
The data processing unit
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the ring network; A node error information collection unit that collects operation state information from each node device;
The collected operation status information from each node device is a node device connected to the ring network, and an operation error related to the frame transmission does not occur in one node device, and excludes the node device. When the information indicates that an operation error related to the frame transmission has occurred in all other node devices, the node device in which the operation error related to the frame transmission has not occurred is detected as a failed node device. A failure node device detection unit;
Instructing the node device detected as the failed node device to the adjacent node device via the ring network, and instructing the setting of blocking to block communication with the node device detected as the failed node device A network reconfiguration instruction unit that transmits instruction information for instructing the cancellation of the set blocking to the node device for which blocking is set at that time;
A node device for fault monitoring characterized by comprising:
前記データ処理部は、
前記障害ノード装置検知部によって障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害情報表示部
を、さらに、備えること
を特徴とする請求項1に記載の障害監視用ノード装置。
The data processing unit
The failure information display unit further includes a failure information display unit configured to display information for identifying the detected failed node device on a display device when the failed node device is detected by the failed node device detection unit. The failure monitoring node device according to 1.
2重のリングネットワークと、それぞれが2重のデータ処理部、前記2重のリングネットワークにそれぞれ接続されるとともに、前記リングネットワークでのフレーム伝送に係る動作エラーを検知する2重の伝送制御部、および、前記2重の伝送制御部を前記2重のデータ処理部のうちの稼働状態のデータ処理部に接続する経路切替部を少なくとも有する複数のノード装置と、を含んで構成された2重化リンクネットワークシステムにおいて、障害を検知し、障害からの回復を行うノード装置である障害監視用ノード装置であって、
前記データ処理部は、
前記2重のリングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集部と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記2重のリングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知部と、
前記障害ノード装置として検知されたノード装置に対し、そのノード装置において、前記稼働状態のデータ処理部を、その時点で稼働状態となっているデータ処理部から、他方のデータ処理部に切り替えることを指示する稼働系切替指示情報を送信する稼働系切替指示部と、
を備えること
を特徴とする障害監視用ノード装置。
And dual ring network, each double data processing unit, which is connected respectively to the dual ring network Rutotomoni, double transmission control unit for detecting an operation error of the frame transmission in the ring network, And a plurality of node devices having at least a path switching unit that connects the duplex transmission control unit to an active data processing unit of the duplex data processing unit. In a link network system, a failure monitoring node device that is a node device that detects a failure and recovers from the failure,
The data processing unit
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the double ring network; A node error information collection unit for collecting operation state information from each of the node devices;
The collected operation status information from each node device indicates that an operation error related to the frame transmission does not occur in one node device among the node devices connected to the double ring network. If it is information indicating that an operation error related to the frame transmission has occurred in all other node devices except the device, the node device in which the operation error related to the frame transmission has not occurred is designated as a failed node device. A failure node device detection unit to detect as,
For the node device detected as the failed node device, in the node device, switching the data processing unit in the operating state from the data processing unit in the operating state at that time to the other data processing unit An active system switching instruction unit for transmitting operating system switching instruction information to be instructed;
A node device for fault monitoring characterized by comprising:
前記データ処理部は、
前記障害ノード装置検知部によって前記障害ノード装置として検知されたノード装置に前記2重のリングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示部と、
を、さらに、備えること
を特徴とする請求項3に記載の障害監視用ノード装置。
The data processing unit
Communication with the node device detected as the failed node device with respect to the node device adjacent to the node device detected as the failed node device by the failed node device detection unit via the double ring network A network reconfiguration instruction unit that sends instruction information for instructing the cancellation of the set blocking to the node device for which blocking is set at that time,
The failure monitoring node device according to claim 3, further comprising:
前記データ処理部は、
前記障害ノード装置検知部によって障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害情報表示部
を、さらに、備えること
を特徴とする請求項3または請求項4に記載の障害監視用ノード装置。
The data processing unit
The failure information display unit further includes a failure information display unit configured to display information for identifying the detected failed node device on a display device when the failed node device is detected by the failed node device detection unit. The node device for fault monitoring according to claim 3 or claim 4.
リングネットワークと、それぞれがデータ処理部およびそのデータ処理部を前記リングネットワークに接続するとともに、前記リングネットワークでのフレーム伝送に係る動作エラーを検知する伝送制御部を少なくとも有する複数のノード装置と、を含んで構成されたリングネットワークシステムにおいて、前記複数のノード装置のうちの1のノード装置によって行われる障害検知回復方法であって、
前記1のノード装置のデータ処理部は、
前記リングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集処理と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記リングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知処理と、
前記障害ノード装置として検知されたノード装置に前記リングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示処理と、
を実行すること
を特徴とする障害検知回復方法。
A ring network, and a plurality of node devices each having a data processing unit and a data processing unit connected to the ring network, and at least a transmission control unit for detecting an operation error related to frame transmission in the ring network, In the ring network system configured to include a failure detection and recovery method performed by one of the plurality of node devices,
The data processing unit of the one node device is
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the ring network; Node error information collection processing for collecting operation state information from each node device;
The collected operation status information from each node device is a node device connected to the ring network, and an operation error related to the frame transmission does not occur in one node device, and excludes the node device. When the information indicates that an operation error related to the frame transmission has occurred in all other node devices, the node device in which the operation error related to the frame transmission has not occurred is detected as a failed node device. Fault node device detection processing,
Instructing the node device detected as the failed node device to the adjacent node device via the ring network, and instructing the setting of blocking to block communication with the node device detected as the failed node device Network reconfiguration instruction processing for transmitting instruction information for instructing the cancellation of the set blocking to the node apparatus for which blocking is set at that time;
A failure detection and recovery method characterized by executing
前記1のノード装置のデータ処理部は、
前記障害ノード装置検知処理によって障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害ノード情報表示処理
を、さらに、実行すること
を特徴とする請求項6に記載の障害検知回復方法。
The data processing unit of the one node device is
When a failed node device is detected by the failed node device detection process, a failure node information display process for displaying information for identifying the detected failed node device on a display device is further executed. The failure detection and recovery method according to claim 6.
2重のリングネットワークと、それぞれが2重のデータ処理部、前記2重のリングネットワークにそれぞれ接続されるとともに、前記リングネットワークでのフレーム伝送に係る動作エラーを検知する2重の伝送制御部、および、前記2重の伝送制御部を前記2重のデータ処理部のうちの稼働状態のデータ処理部に接続する経路切替部を少なくとも有する複数のノード装置と、を含んで構成された2重化リンクネットワークシステムにおいて、前記複数のノード装置のうちの1のノード装置によって行われる障害検知回復方法であって、
前記1のノード装置のデータ処理部は、
前記2重のリングネットワークに接続されたそれぞれのノード装置から送信される、そのそれぞれのノード装置の前記伝送制御部で検知されたフレーム伝送に係る動作エラーの情報を含んだ動作状態情報を受信して、前記それぞれのノード装置からの動作状態情報を収集するノードエラー情報収集処理と、
前記収集されたそれぞれのノード装置からの動作状態情報が、前記2重のリングネットワークに接続されたノード装置のうち、ある1つのノード装置に前記フレーム伝送に係る動作エラーが発生せず、そのノード装置を除く他のすべてのノード装置に前記フレーム伝送に係る動作エラーが発生したことを示す情報であった場合には、前記フレーム伝送に係る動作エラーが発生していないノード装置を、障害ノード装置として検知する障害ノード装置検知処理と、
前記障害ノード装置として検知されたノード装置に対し、そのノード装置において、前記稼働状態のデータ処理部を、その時点で稼働状態となっているデータ処理部から、他方のデータ処理部に切り替えることを指示する稼働系切替指示情報を送信する稼働系切替指示処理と、
を実行すること
を特徴とする障害検知回復方法。
And dual ring network, each double data processing unit, which is connected respectively to the dual ring network Rutotomoni, double transmission control unit for detecting an operation error of the frame transmission in the ring network, And a plurality of node devices having at least a path switching unit that connects the duplex transmission control unit to an active data processing unit of the duplex data processing unit. In a link network system, a failure detection and recovery method performed by one of the plurality of node devices,
The data processing unit of the one node device is
Receiving operation state information including information on an operation error related to frame transmission detected by the transmission control unit of each node device transmitted from each node device connected to the double ring network; Node error information collection processing for collecting operation state information from each of the node devices;
The collected operation status information from each node device indicates that an operation error related to the frame transmission does not occur in one node device among the node devices connected to the double ring network. If it is information indicating that an operation error related to the frame transmission has occurred in all other node devices except the device, the node device in which the operation error related to the frame transmission has not occurred is designated as a failed node device. Fault node device detection processing to detect as,
For the node device detected as the failed node device, in the node device, switching the data processing unit in the operating state from the data processing unit in the operating state at that time to the other data processing unit Active system switching instruction processing for transmitting operating system switching instruction information to be instructed;
A failure detection and recovery method characterized by executing
前記1のノード装置のデータ処理部は、
前記障害ノード装置として検知されたノード装置に前記2重のリングネットワークを介して隣接したノード装置に対して、前記障害ノード装置として検知されたノード装置との間の通信を閉塞させるブロッキングの設定を指示するとともに、その時点でブロッキングが設定されているノード装置に対して、その設定されているブロッキングの解除を指示する指示情報を送信するネットワーク再構成指示処理
を、さらに、実行すること
を特徴とする請求項8に記載の障害検知回復方法。
The data processing unit of the one node device is
Blocking setting is made to block communication between the node device detected as the failed node device and the node device adjacent to the node device detected as the failed node device via the double ring network. A network reconfiguration instruction process for transmitting instruction information for instructing the release of the set blocking to the node apparatus for which blocking has been set at the time. The failure detection and recovery method according to claim 8.
前記1のノード装置のデータ処理部は、
前記障害ノード装置検知ステップで障害ノード装置が検知された場合に、その検知された障害ノード装置を識別する情報を表示装置に表示する障害ノード装置情報表示処理
を、さらに、実行すること
を特徴とする請求項8または請求項9に記載の障害検知回復方法。
The data processing unit of the one node device is
When a failed node device is detected in the failed node device detection step, a failed node device information display process for displaying information for identifying the detected failed node device on a display device is further executed. The fault detection and recovery method according to claim 8 or 9.
JP2011088509A 2011-04-12 2011-04-12 Fault monitoring node device and fault detection and recovery method Active JP5548160B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011088509A JP5548160B2 (en) 2011-04-12 2011-04-12 Fault monitoring node device and fault detection and recovery method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011088509A JP5548160B2 (en) 2011-04-12 2011-04-12 Fault monitoring node device and fault detection and recovery method

Publications (2)

Publication Number Publication Date
JP2012222700A JP2012222700A (en) 2012-11-12
JP5548160B2 true JP5548160B2 (en) 2014-07-16

Family

ID=47273724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011088509A Active JP5548160B2 (en) 2011-04-12 2011-04-12 Fault monitoring node device and fault detection and recovery method

Country Status (1)

Country Link
JP (1) JP5548160B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017085249A (en) * 2015-10-23 2017-05-18 ホーチキ株式会社 Disaster preventive monitoring system
JP6637287B2 (en) * 2015-10-28 2020-01-29 ホーチキ株式会社 Disaster prevention monitoring system
CN107181661A (en) * 2016-03-11 2017-09-19 西门子公司 Real-time fault protecting method, master node, slave node and loop-type network system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61121633A (en) * 1984-11-19 1986-06-09 Fujitsu Ltd Network supervisory system
JPH01240048A (en) * 1988-03-22 1989-09-25 Mitsubishi Electric Corp Packet switching network supervising system
JPH11145997A (en) * 1997-11-11 1999-05-28 Omron Corp Communication system

Also Published As

Publication number Publication date
JP2012222700A (en) 2012-11-12

Similar Documents

Publication Publication Date Title
US20090249115A1 (en) Method and system for dynamic link failover management
US6868067B2 (en) Hybrid agent-oriented object model to provide software fault tolerance between distributed processor nodes
WO2004004158A1 (en) System and method for supporting automatic protection switching between multiple node pairs using common agent architecture
JP2009303092A (en) Network equipment and line switching method
JP5548160B2 (en) Fault monitoring node device and fault detection and recovery method
JP5480778B2 (en) Duplex computer network system, network connection device, and fault detection and coping method
JP6409812B2 (en) Redundancy apparatus, redundancy system, and redundancy method
US9960985B2 (en) System and method for providing redundant Ethernet network connections
US8111625B2 (en) Method for detecting a message interface fault in a communication device
CN109039761B (en) Method and device for processing fault link in cluster control channel
JP4024607B2 (en) Optical cross-connect device
CN105553735A (en) Stacking system fault handling method, equipment and stacking system
JP4190170B2 (en) Detour route setting system
JP6052150B2 (en) Relay device
US11954509B2 (en) Service continuation system and service continuation method between active and standby virtual servers
JP2012075009A (en) Redundancy device and redundancy program
JP2005268889A (en) Transmission path switching system and operating method of the transmission path switching system
WO2014010021A1 (en) Information processing device, information processing system, method for controlling information processing device, and program for controlling information processing device
JP4692419B2 (en) Network device, redundant switching method used therefor, and program thereof
JP2013121095A (en) Communication device
JP7120678B1 (en) Communication processing device, communication processing system, failure notification method and failure notification program
JP4623001B2 (en) Fault isolation system, fault isolation method, and program
JP4232737B2 (en) Network equipment
KR100751643B1 (en) Method for monitoring an abnormal operation of a mobile communication subscriber processing unit
JP5215337B2 (en) LINK CONTROL DEVICE, LINK CONTROL SYSTEM, AND LINK CONTROL METHOD

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130516

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140107

A521 Written amendment

Effective date: 20140310

Free format text: JAPANESE INTERMEDIATE CODE: A523

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20140507

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140516

R150 Certificate of patent (=grant) or registration of utility model

Ref document number: 5548160

Free format text: JAPANESE INTERMEDIATE CODE: R150

Country of ref document: JP