JP5752646B2 - Fault monitoring apparatus and fault monitoring method - Google Patents

Fault monitoring apparatus and fault monitoring method Download PDF

Info

Publication number
JP5752646B2
JP5752646B2 JP2012145304A JP2012145304A JP5752646B2 JP 5752646 B2 JP5752646 B2 JP 5752646B2 JP 2012145304 A JP2012145304 A JP 2012145304A JP 2012145304 A JP2012145304 A JP 2012145304A JP 5752646 B2 JP5752646 B2 JP 5752646B2
Authority
JP
Japan
Prior art keywords
network connection
connection device
status signal
network
status
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012145304A
Other languages
Japanese (ja)
Other versions
JP2014011542A (en
Inventor
篤史 丹治
篤史 丹治
中野 義弘
義弘 中野
泰昌 阿部
泰昌 阿部
安達 広典
広典 安達
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Hitachi Industry and Control Solutions Co Ltd
Original Assignee
Hitachi Ltd
Hitachi Industry and Control Solutions Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd, Hitachi Industry and Control Solutions Co Ltd filed Critical Hitachi Ltd
Priority to JP2012145304A priority Critical patent/JP5752646B2/en
Publication of JP2014011542A publication Critical patent/JP2014011542A/en
Application granted granted Critical
Publication of JP5752646B2 publication Critical patent/JP5752646B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、障害監視装置、および、障害監視方法に関する。   The present invention relates to a failure monitoring apparatus and a failure monitoring method.

特許文献1には、通信制御装置を冗長構成としたコンピュータシステムにおいて、複数の現用通信制御装置の一つに障害が発生した時に、障害が発生した通信制御装置から予備通信制御装置への切替の自動化を可能にするシステムが、記載されている。これにより、予備通信制御装置を介して障害発生後も通信サービスを提供できる。   In Patent Document 1, in a computer system having a redundant configuration of communication control devices, when a failure occurs in one of a plurality of active communication control devices, switching from the communication control device in which the failure has occurred to a standby communication control device is performed. A system that allows automation is described. Thereby, a communication service can be provided even after the occurrence of a failure via the standby communication control device.

特開平6−282510号公報JP-A-6-282510

特許文献1などの障害時切替システムでは、通信制御装置の通信不通を検知すると、その要因を一時的な保守作業中か、恒久的な障害発生中かを区別せずに、ともに障害発生として切替処理を起動させる。
よって、障害発生中の切替処理により、通信サービスを提供できるメリットがあるものの、副作用として、保守作業中の切替処理により、予備通信制御装置に対して不要な通信負荷を与えてしまうデメリットも存在する。
In the switching system at the time of failure such as Patent Document 1, when communication failure of the communication control device is detected, the cause is switched as a failure occurrence without distinguishing whether the cause is a temporary maintenance work or a permanent failure occurrence. Start the process.
Therefore, although there is a merit that the communication service can be provided by the switching process during the occurrence of the failure, there is a demerit that an unnecessary communication load is given to the standby communication control device due to the switching process during the maintenance work as a side effect. .

そこで、本発明は、前記した問題を解決し、保守作業中に余分な負荷を与えずに、障害発生中の切替処理を実現することを、主な目的とする。   SUMMARY OF THE INVENTION Accordingly, it is a main object of the present invention to solve the above-described problems and realize a switching process during occurrence of a failure without applying an extra load during maintenance work.

前記課題を解決するために、本発明の障害監視装置は、
ネットワーク接続装置を介してネットワーク接続機器と接続され、
前記ネットワーク接続機器に送信する機器状態用信号への応答が未着であるときに、前記機器状態用信号を中継する前記ネットワーク接続装置に対して接続状態用信号を送信し、その接続状態用信号の応答に含まれる前記ネットワーク接続装置内部の複数のインタフェースを接続する接続スイッチの状態情報を取得し、
前記接続スイッチの状態情報がONであるときには、前記接続状態用信号を送信した前記ネットワーク接続装置から別のネットワーク接続装置へと系切替を実行することを特徴とする。
その他の手段は、後記する。
In order to solve the above-described problem, the fault monitoring apparatus of the present invention provides:
It is connected to the network connection device via the network connection device,
When a response to the device status signal to be transmitted to the network connection device has not arrived, the connection status signal is transmitted to the network connection device that relays the device status signal, and the connection status signal Obtaining status information of a connection switch that connects a plurality of interfaces inside the network connection device included in the response of
When the state information of the connection switch is ON, system switching is performed from the network connection device that has transmitted the connection state signal to another network connection device.
Other means will be described later.

本発明によれば、保守作業中に余分な負荷を与えずに、障害発生中の切替処理を実現することができる。   According to the present invention, it is possible to realize switching processing during the occurrence of a failure without applying an extra load during maintenance work.

本発明の一実施形態に関する障害監視システムを示す構成図である。It is a block diagram which shows the failure monitoring system regarding one Embodiment of this invention. 本発明の一実施形態に関する機器状態テーブルの状態収集処理を示す説明図である。It is explanatory drawing which shows the status collection process of the apparatus status table regarding one Embodiment of this invention. 本発明の一実施形態に関する接続状態テーブルの状態収集処理を示す説明図である。It is explanatory drawing which shows the status collection process of the connection status table regarding one Embodiment of this invention. 本発明の一実施形態に関する第1の障害監視処理を示すフローチャートである。It is a flowchart which shows the 1st failure monitoring process regarding one Embodiment of this invention. 本発明の一実施形態に関する機器状態テーブルの片系異常状態を示す説明図である。It is explanatory drawing which shows the one-system abnormal state of the apparatus state table regarding one Embodiment of this invention. 本発明の一実施形態に関する機器状態テーブルの両系異常状態を示す説明図である。It is explanatory drawing which shows the both-systems abnormal state of the apparatus state table regarding one Embodiment of this invention. 本発明の一実施形態に関する機器状態テーブルの全機器無応答状態を示す説明図である。It is explanatory drawing which shows all the apparatus non-response states of the apparatus state table regarding one Embodiment of this invention. 本発明の一実施形態に関する系切替後の経路を示す説明図である。It is explanatory drawing which shows the path | route after the system switch regarding one Embodiment of this invention. 本発明の一実施形態に関する第2の障害監視処理を示すフローチャートである。It is a flowchart which shows the 2nd failure monitoring process regarding one Embodiment of this invention.

以下、本発明の一実施形態を、図面を参照して詳細に説明する。   Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

図1は、障害監視システムを示す構成図である。障害監視システムのネットワークは、2系統の冗長構成のLAN(Local Area Network)で構成されており、図1では、1系ネットワークの回線を実線で表記し、2系ネットワークの回線を破線で表記する。
障害監視計算機1(障害監視装置)は、基幹LAN(1系基幹LAN31、2系基幹LAN32)を介してネットワーク接続装置2と接続される。ネットワーク接続装置2は、支線LAN(1系支線LAN33、2系支線LAN34)を介して監視対象のネットワーク接続機器4と接続される。
これらの障害監視システムの各装置は、制御部(CPU:Central Processing Unit)、記憶部(メモリ、ハードディスクなど)、および、通信部(ネットワークインタフェース)を備えるコンピュータとして構成される。
FIG. 1 is a configuration diagram illustrating a failure monitoring system. The network of the fault monitoring system is composed of two redundant LANs (Local Area Networks). In FIG. 1, the lines of the first system network are indicated by solid lines and the lines of the second system network are indicated by broken lines. .
The failure monitoring computer 1 (failure monitoring device) is connected to the network connection device 2 via a backbone LAN (system 1 trunk LAN 31, system 2 backbone LAN 32). The network connection device 2 is connected to the network connection device 4 to be monitored via a branch line LAN (system 1 branch line LAN 33, system 2 branch line LAN 34).
Each device of these fault monitoring systems is configured as a computer including a control unit (CPU: Central Processing Unit), a storage unit (memory, hard disk, etc.), and a communication unit (network interface).

障害監視計算機1は、ネットワーク接続機器4を監視する管理用の計算機である。障害監視計算機1は、機器状態テーブル11と、接続状態テーブル12とを有する。
機器状態テーブル11は、機器状態用信号により取得した各ネットワーク接続機器4までの通信状態を記憶するためのテーブルである。
機器状態用信号は、障害監視計算機1からネットワーク接続機器4に対して送信される要求信号と、その要求信号への応答信号である。機器状態用信号は、例えば、ping(Packet Internet Groper)が使用される。機器状態用信号の要求信号には、ネットワーク接続機器4のIP(Internet Protocol)アドレスが指定される。
The failure monitoring computer 1 is a management computer that monitors the network connection device 4. The failure monitoring computer 1 has a device status table 11 and a connection status table 12.
The device state table 11 is a table for storing the communication state to each network connection device 4 acquired by the device state signal.
The device status signal is a request signal transmitted from the failure monitoring computer 1 to the network connection device 4 and a response signal to the request signal. For example, ping (Packet Internet Groper) is used as the device status signal. The IP (Internet Protocol) address of the network connection device 4 is specified in the request signal for the device status signal.

接続状態テーブル12は、接続状態用信号により取得した各ネットワーク接続装置2の保守状態を記憶するためのテーブルである。
接続状態用信号は、障害監視計算機1からネットワーク接続装置2に対して送信される要求信号と、その要求信号への応答信号である。接続状態用信号は、例えば、UDP(User Datagram Protocol)/IPが使用される。
The connection status table 12 is a table for storing the maintenance status of each network connection device 2 acquired by the connection status signal.
The connection state signal is a request signal transmitted from the failure monitoring computer 1 to the network connection device 2 and a response signal to the request signal. As the connection state signal, for example, UDP (User Datagram Protocol) / IP is used.

ネットワーク接続装置2も、LANと同様に、2系統の冗長構成である。一方のネットワーク接続装置2aをデータ中継等を行う現用系とし、もう一方のネットワーク接続装置2bを待機系とする。
障害監視計算機1は、機器状態用信号の応答信号が未着であるときに、自身からネットワーク接続機器4までの経路の通信障害を検知する。障害監視計算機1は、通信障害が発生した場合は、ネットワーク接続装置2の系切替により、通信途絶の回復を試みる。ネットワーク接続装置2の系切替とは、現在の現用系のネットワーク接続装置2aを次回の待機系に変更するとともに、現在の待機系のネットワーク接続装置2bを次回の現用系へと変更することである。
Similarly to the LAN, the network connection device 2 has a two-system redundant configuration. One network connection device 2a is an active system that performs data relay and the other network connection device 2b is a standby system.
The failure monitoring computer 1 detects a communication failure in the path from itself to the network connection device 4 when the response signal of the device state signal has not arrived. When a communication failure occurs, the failure monitoring computer 1 attempts to recover from the communication interruption by switching the network connection device 2. The system switching of the network connection device 2 means changing the current active network connection device 2a to the next standby system and changing the current standby network connection device 2b to the next active system. .

ネットワーク接続装置2は、接続スイッチ21を有し、他のネットワーク接続装置2と通信するための制御線22が接続されている。
接続スイッチ21は、各ネットワーク(1系基幹LAN31、2系基幹LAN32、1系支線LAN33、2系支線LAN34)をネットワーク接続装置2内で接続するためのスイッチであり、この接続スイッチ21がON(接続状態)のときにはデータの中継を行う。
制御線22は、ネットワーク接続装置2aとネットワーク接続装置2bとを接続し、この制御線22を介して、系切替のための制御信号を送受信する。
The network connection device 2 has a connection switch 21 and is connected to a control line 22 for communicating with other network connection devices 2.
The connection switch 21 is a switch for connecting each network (system 1 trunk LAN 31, system 2 trunk LAN 32, system 1 branch LAN 33, system 2 branch LAN 34) within the network connection device 2, and the connection switch 21 is turned on ( In the connection state), data is relayed.
The control line 22 connects the network connection apparatus 2a and the network connection apparatus 2b, and transmits / receives a control signal for system switching via the control line 22.

図2は、機器状態テーブル11の状態収集処理を示す説明図である。この図では、4つの機器状態用信号P1〜P4を例示する。1つの機器状態用信号(例えば、P1)による収集結果が、機器状態テーブル11内の1つのレコード(例えば、第1行)に書き込まれる。   FIG. 2 is an explanatory diagram showing the state collection process of the device state table 11. In this figure, four device status signals P1 to P4 are illustrated. A collection result by one device state signal (for example, P1) is written in one record (for example, the first row) in the device state table 11.

機器状態テーブル11は、機器状態用信号を示す「信号」と、その機器状態用信号の送信先として指定されるネットワーク接続機器4を示す「機器」と、機器状態用信号の送受信に使用されるネットワークの系統を示す「LAN」と、機器状態用信号の応答信号の到着(○)/未着(×)を示す「状態」とを対応付ける。
例えば、機器状態テーブル11の第1行は、1系LAN(1系基幹LAN31、1系支線LAN33)を経由してネットワーク接続機器4aへと送信される機器状態用信号の応答信号が障害監視計算機1に到着(状態=○)したことを示す。
The device status table 11 is used for transmission / reception of a “signal” indicating a device status signal, a “device” indicating a network connection device 4 designated as a transmission destination of the device status signal, and a device status signal. The “LAN” indicating the network system is associated with the “state” indicating the arrival (O) / not-arrival (×) of the response signal of the device status signal.
For example, the first row of the device status table 11 indicates that the response signal of the device status signal transmitted to the network connection device 4a via the 1-system LAN (1-system trunk LAN 31, 1-system branch LAN 33) is a fault monitoring computer. 1 indicates that it has arrived (state = ◯).

図3は、接続状態テーブルの状態収集処理を示す説明図である。
図3(a)は、ネットワーク接続装置2a内の接続スイッチ21aを示す。接続スイッチ21aは、1系用スイッチ(1系基幹LAN31と1系支線LAN33を接続)と、2系用スイッチ(2系基幹LAN32と2系支線LAN34を接続)とから構成される。図3(a)では、2つのスイッチがともにON(状態=○)である。
FIG. 3 is an explanatory diagram illustrating a state collection process of the connection state table.
FIG. 3A shows the connection switch 21a in the network connection device 2a. The connection switch 21a is composed of a 1-system switch (connecting the 1-system trunk LAN 31 and the 1-system branch LAN 33) and a 2-system switch (connecting the 2-system backbone LAN 32 and the 2-system branch LAN 34). In FIG. 3A, both the two switches are ON (state = ◯).

ネットワーク接続装置2aは、障害監視計算機1からの接続状態用信号(要求信号)を受けると、自身の接続スイッチ21a内の各スイッチの状態(ONかOFFか)を取得し、その取得結果を接続状態用信号(応答信号)として障害監視計算機1に通知する。
障害監視計算機1は、通知された接続スイッチ21a内の各スイッチの状態を、接続状態テーブル12へと書き出す。接続状態テーブル12は、接続状態用信号の送信先として指定されるネットワーク接続装置2を示す「装置」と、その装置内の接続スイッチ21のネットワークの系統を示す「LAN」と、スイッチの状態として、「ON=○」または「OFF=×」を示す「状態」とを対応付ける。
When receiving the connection status signal (request signal) from the failure monitoring computer 1, the network connection device 2a acquires the status (ON or OFF) of each switch in its own connection switch 21a and connects the acquisition result. The failure monitoring computer 1 is notified as a status signal (response signal).
The failure monitoring computer 1 writes the notified state of each switch in the connection switch 21 a to the connection state table 12. The connection status table 12 includes “device” indicating the network connection device 2 specified as the transmission destination of the connection status signal, “LAN” indicating the network system of the connection switch 21 in the device, and the switch status. , “State” indicating “ON = ◯” or “OFF = ×” is associated.

図3(b)は、図3(a)と同様に、ネットワーク接続装置2a内の接続スイッチ21aを示すが、両スイッチがOFFになっている。これにより、1系基幹LAN31と1系支線LAN33との間の通信や、2系基幹LAN32と2系支線LAN34との間の通信が切断される。
なお、ネットワーク接続装置2は、スイッチの状態を変更する(ONからOFFへ、OFFからONへ)手段を、物理的な切替用スイッチや論理的なコマンド入力などにより管理者などに提供する。スイッチをOFFにする要因は、例えば、ネットワーク接続装置2の保守点検である。
FIG. 3B shows the connection switch 21a in the network connection device 2a as in FIG. 3A, but both switches are OFF. Thereby, the communication between the 1-system trunk LAN 31 and the 1-system branch LAN 33 and the communication between the 2-system trunk LAN 32 and the 2-system branch LAN 34 are disconnected.
Note that the network connection device 2 provides means for changing the switch state (from ON to OFF, from OFF to ON) to the administrator or the like by a physical switching switch or logical command input. The factor for turning off the switch is, for example, maintenance and inspection of the network connection device 2.

図4は、第1の障害監視処理を示すフローチャートである。
S101において、障害監視計算機1は、図2で示したように、機器状態用信号を用いて各ネットワーク接続機器4の状態の収集し、その結果を機器状態テーブル11に格納する。
FIG. 4 is a flowchart showing the first failure monitoring process.
In S <b> 101, the failure monitoring computer 1 collects the status of each network connection device 4 using the device status signal as shown in FIG. 2, and stores the result in the device status table 11.

S102において、障害監視計算機1は、S101で格納した機器状態テーブル11から1つの機器を選択し(例えば、ネットワーク接続機器4a)、その機器の状態列を参照して以下のように分岐する。
同じ機器の状態列が全て「○」なら、両系正常であり、そのときには障害対策は不要なので、処理を終了する。
同じ機器の状態列が1つだけ「×」なら、片系異常であり、そのときには障害対策をするため、S106へ進む。
同じ機器の状態列が全て「×」なら、両系異常であり、そのときには保守作業中か、障害発生中かをさらに調査するため、S103へ進む。
In S102, the fault monitoring computer 1 selects one device from the device status table 11 stored in S101 (for example, the network connection device 4a), and branches as follows with reference to the status column of the device.
If all the status columns of the same device are “◯”, both systems are normal. At that time, no trouble countermeasure is required, so the processing ends.
If there is only one “X” in the status column of the same device, it is a one-system abnormality, and in this case, the process proceeds to S106 to take a countermeasure against the failure.
If all the status columns of the same device are “x”, it is an abnormality in both systems, and the process proceeds to S103 to further investigate whether maintenance work or failure has occurred.

S103において、障害監視計算機1は、S102で判定した所定機器についての障害が発生したか否かを判定する。この判定では、所定機器とは別機器の状態列で「○」が存在するときは、所定機器についての障害が発生した(別機器は障害が発生していない)とし、S103,Yesから処理を終了する。
このケースでは、所定機器(ネットワーク接続機器4a)の装置障害であるため、その装置へ向かう経路を切り替えても、所定機器との間の通信は復旧しないことが明らかである。つまり、障害発生中であるものの、系切替によってその障害に対処できないので、あきらめる。
In S103, the failure monitoring computer 1 determines whether or not a failure has occurred for the predetermined device determined in S102. In this determination, if “○” is present in the status column of a device different from the predetermined device, it is determined that a failure has occurred in the predetermined device (no failure has occurred in the other device), and the processing from S103, Yes is performed. finish.
In this case, since it is a device failure of the predetermined device (network connection device 4a), it is clear that communication with the predetermined device is not restored even if the route to the device is switched. That is, although a failure has occurred, it cannot be dealt with by system switching, so it gives up.

S104において、障害監視計算機1は、図3で示したように、接続状態用信号を用いて各ネットワーク接続装置2の状態を収集し、その結果を接続状態テーブル12に格納する。
S105において、障害監視計算機1は、S104で格納した接続状態テーブル12の状態から、S101の機器状態用信号が通過するネットワーク接続装置2の状態が保守中か否かを判定する。
つまり、ネットワーク接続装置2の状態列が全て「×(スイッチOFF)」であるときには、保守中であるので、S105のYesから、処理を終了する。これにより、保守作業における通信不通を障害と誤検出せず、現用系ネットワーク接続装置2aの切り替え処理(S106)を防止し、保守性の高いネットワークシステムを構築することができる。
In S104, the failure monitoring computer 1 collects the status of each network connection device 2 using the connection status signal and stores the result in the connection status table 12, as shown in FIG.
In S105, the failure monitoring computer 1 determines from the state of the connection state table 12 stored in S104 whether or not the state of the network connection device 2 through which the device state signal in S101 passes is under maintenance.
That is, when all the status columns of the network connection device 2 are “× (switch OFF)”, the maintenance is being performed, and thus the process ends from Yes in S105. As a result, communication failure in maintenance work is not erroneously detected as a failure, switching processing (S106) of the active network connection device 2a can be prevented, and a highly maintainable network system can be constructed.

S106において、障害監視計算機1は、S105の判定により保守作業中でないことにより、障害発生中であるので、その障害への対処としてネットワーク接続装置2の系切替を実行する。つまり、ネットワーク接続装置2aの役割を現用系から待機系に変更し、ネットワーク接続装置2bの役割を待機系から現用系に変更する。   In S106, the failure monitoring computer 1 is performing a system switching of the network connection device 2 as a response to the failure because the failure is occurring because the maintenance operation is not being performed as determined in S105. That is, the role of the network connection device 2a is changed from the active system to the standby system, and the role of the network connection device 2b is changed from the standby system to the active system.

図5は、機器状態テーブルの片系異常状態を示す説明図である。機器状態用信号P1は応答なし(点線矢印)であるものの、他の機器状態用信号P2〜P4は応答あり(実線矢印)である。
この図5では、S102で片系異常と判断され、S106の系切替が実行される。
FIG. 5 is an explanatory diagram showing a one-system abnormal state in the device state table. The device status signal P1 has no response (dotted arrow), but the other device status signals P2 to P4 have a response (solid arrow).
In FIG. 5, it is determined in S102 that a one-system abnormality has occurred, and system switching in S106 is executed.

図6は、機器状態テーブルの両系異常状態を示す説明図である。機器状態用信号P1,P2は応答なし(点線矢印)であるものの、他の機器状態用信号P3,P4は応答あり(実線矢印)である。
この図6では、S102で両系異常と判断され、S103で所定機器障害(Yes)と判断されて終了するので、S106の系切替は実行されない。
FIG. 6 is an explanatory diagram showing both system abnormal states in the device state table. The device status signals P1 and P2 have no response (dotted arrow), while the other device status signals P3 and P4 have a response (solid arrow).
In FIG. 6, since it is determined that both systems are abnormal in S102, and it is determined that the predetermined device failure (Yes) is determined in S103, the system switching in S106 is not executed.

図7は、機器状態テーブルの全機器無応答状態を示す説明図である。全ての機器状態用信号P1〜P4は応答なし(点線矢印)である。
この図7では、S102で両系異常と判断され、S103で所定機器障害でない(No)と判断される。その後、S105で保守中か否かが判断され、保守中でない(No)ときには、S106の系切替が実行される。
FIG. 7 is an explanatory diagram showing all device non-response states in the device state table. All the device status signals P1 to P4 are unresponsive (dotted line arrows).
In FIG. 7, it is determined in S102 that both systems are abnormal, and it is determined in S103 that there is no predetermined device failure (No). Thereafter, in S105, it is determined whether or not maintenance is in progress. When maintenance is not in progress (No), system switching in S106 is executed.

図8は、S106の系切替後の経路を示す説明図である。図2の系切替前の経路と比較すると、ネットワーク接続装置2aからネットワーク接続装置2bへと通信経路が変更されている。   FIG. 8 is an explanatory diagram showing the route after the system switching in S106. Compared to the path before system switching in FIG. 2, the communication path is changed from the network connection apparatus 2a to the network connection apparatus 2b.

図9は、第2の障害監視処理を示すフローチャートである。このフローチャートは、図4と比較すると、障害対処処理が装置単位の系切替(S106)から、装置を含むネットワークシステム単位の経路切替(S207)に置き換わっている。   FIG. 9 is a flowchart showing the second failure monitoring process. Compared with FIG. 4, in this flowchart, the failure handling processing is replaced from system switching in units of devices (S106) to path switching in units of network systems including devices (S207).

S201において、障害監視計算機1は、S101と同様に、ネットワーク接続機器4の状態を収集する。
S202において、障害監視計算機1は、S203で未選択の経路がないときには(No)、処理を終了する。
S203において、障害監視計算機1は、S201で収集した機器状態テーブル11の未選択のレコード(経路)を1つ選択する。
S204において、障害監視計算機1は、S203の選択経路の状態が正常(○)であるときには(Yes)、別の選択経路を選択するために、S202に戻る。
In S201, the failure monitoring computer 1 collects the status of the network connection device 4 as in S101.
In S202, the failure monitoring computer 1 ends the process when there is no unselected route in S203 (No).
In S203, the failure monitoring computer 1 selects one unselected record (path) in the device status table 11 collected in S201.
In S204, when the state of the selected route in S203 is normal (O) (Yes), the failure monitoring computer 1 returns to S202 to select another selected route.

S205において、障害監視計算機1は、S203の選択経路上の(選択経路が通過する各ネットワーク接続装置2の)接続状態をS104と同様の処理で収集して、接続状態テーブル12に格納する。
S206において、障害監視計算機1は、S205で収集した接続状態が保守中(×)であるネットワーク接続装置2が1台以上存在するか否かを判定する。保守中のネットワーク接続装置2が存在するときには、経路切替が不要なのでS202に戻る。
In S205, the failure monitoring computer 1 collects connection states on the selected route in S203 (of each network connection device 2 through which the selected route passes) by the same processing as in S104 and stores it in the connection state table 12.
In S206, the failure monitoring computer 1 determines whether or not there is at least one network connection device 2 whose connection state collected in S205 is under maintenance (x). If there is a network connection device 2 under maintenance, the path switching is unnecessary, and the process returns to S202.

S207において、障害監視計算機1は、S203の選択経路上のいずれかの地点で障害が発生しており、かつ、選択経路上のどの地点でも保守作業が行われていないので、選択経路から代替経路へ経路切替する。これにより、障害発生中の選択経路が今後の通信に使われなくなり、代替経路へと迂回することで、通信サービスを継続できる。
ここで、経路切替とは、選択経路が通過するネットワーク接続装置2だけでなく、選択経路が通過するネットワークも含めて、その選択経路上の通信路を使用しないようにする制御処理である。例えば、選択経路へのデータ流入が起きないように、各ネットワーク接続装置2の転送テーブル内の選択経路への経路コストを非常に大きな値としたり、転送テーブル内の選択経路を示すエントリを削除したりする処理である。
In S207, the failure monitoring computer 1 has a failure at any point on the selected route in S203 and no maintenance work is being performed at any point on the selected route. Switch route to. As a result, the selected route in which the failure has occurred is not used for future communication, and the communication service can be continued by detouring to the alternative route.
Here, the path switching is a control process that prevents the use of the communication path on the selected path including not only the network connection device 2 through which the selected path passes but also the network through which the selected path passes. For example, in order to prevent data from flowing into the selected route, the route cost to the selected route in the transfer table of each network connection device 2 is set to a very large value, or the entry indicating the selected route in the transfer table is deleted. Process.

以上説明した本実施形態により、ネットワーク接続機器4の障害の可能性があると判断後、ネットワーク接続装置2の動作状態を取得する通信を行い、ネットワーク接続装置2の動作状態が保守状態であった場合、ネットワーク接続装置2の系切替を行わず、障害誤検出を防止する。
これにより、保守作業が容易に実施でき、保守性の高いネットワークシステムを提供することができる。
According to the present embodiment described above, after determining that there is a possibility of failure of the network connection device 4, communication for acquiring the operation state of the network connection device 2 is performed, and the operation state of the network connection device 2 is in the maintenance state. In this case, the system switching of the network connection device 2 is not performed, and failure detection is prevented.
Thereby, maintenance work can be easily performed, and a highly maintainable network system can be provided.

なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
In addition, this invention is not limited to an above-described Example, Various modifications are included. For example, the above-described embodiments have been described in detail for easy understanding of the present invention, and are not necessarily limited to those having all the configurations described.
Further, a part of the configuration of one embodiment can be replaced with the configuration of another embodiment, and the configuration of another embodiment can be added to the configuration of one embodiment.
Further, it is possible to add, delete, and replace other configurations for a part of the configuration of each embodiment. Each of the above-described configurations, functions, processing units, processing means, and the like may be realized by hardware by designing a part or all of them with, for example, an integrated circuit.
Each of the above-described configurations, functions, and the like may be realized by software by interpreting and executing a program that realizes each function by the processor.

各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVDなどの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。
Information such as programs, tables, and files for realizing each function is stored in a recording device such as a memory, a hard disk, an SSD (Solid State Drive), or a recording medium such as an IC (Integrated Circuit) card, an SD card, or a DVD. be able to.
Further, the control lines and information lines indicate what is considered necessary for the explanation, and not all the control lines and information lines on the product are necessarily shown. Actually, it may be considered that almost all the components are connected to each other.

1 障害監視計算機(障害監視装置)
11 機器状態テーブル
12 接続状態テーブル
31 1系基幹LAN
32 2系基幹LAN
33 1系支線LAN
34 2系支線LAN
2 ネットワーク接続装置
2a ネットワーク接続装置(現用系)
2b ネットワーク接続装置(待機系)
21 接続スイッチ
21a 接続スイッチ(現用系)
21b 接続スイッチ(待機系)
22 制御線
4 ネットワーク接続機器
4a ネットワーク接続機器
4b ネットワーク接続機器
1 Fault monitoring computer (Fault monitoring device)
11 Device status table 12 Connection status table 31 1-system trunk LAN
32 2 system backbone LAN
33 1st branch LAN
34 2 branch LAN
2 Network connection device 2a Network connection device (current system)
2b Network connection device (standby system)
21 connection switch 21a connection switch (current system)
21b Connection switch (standby system)
22 Control line 4 Network connection device 4a Network connection device 4b Network connection device

Claims (6)

ネットワーク接続装置を介してネットワーク接続機器と接続され、
前記ネットワーク接続機器に送信する機器状態用信号への応答が未着であるときに、前記機器状態用信号を中継する前記ネットワーク接続装置に対して接続状態用信号を送信し、その接続状態用信号の応答に含まれる前記ネットワーク接続装置内部の複数のインタフェースを接続する接続スイッチの状態情報を取得し、
前記接続スイッチの状態情報がONであるときには、前記接続状態用信号を送信した前記ネットワーク接続装置から別のネットワーク接続装置へと系切替を実行することを特徴とする
障害監視装置。
It is connected to the network connection device via the network connection device,
When a response to the device status signal to be transmitted to the network connection device has not arrived, the connection status signal is transmitted to the network connection device that relays the device status signal, and the connection status signal Obtaining status information of a connection switch that connects a plurality of interfaces inside the network connection device included in the response of
When the status information of the connection switch is ON, the failure monitoring device is characterized in that system switching is performed from the network connection device that has transmitted the connection status signal to another network connection device.
ネットワーク接続装置を介してネットワーク接続機器と接続され、
前記ネットワーク接続機器に送信する機器状態用信号への応答が未着であるときに、前記機器状態用信号を中継する前記ネットワーク接続装置に対して接続状態用信号を送信し、その接続状態用信号の応答に含まれる前記ネットワーク接続装置内部の複数のインタフェースを接続する接続スイッチの状態情報を取得し、
前記接続スイッチの状態情報がONであるときには、前記機器状態用信号が通過する自身から前記ネットワーク接続機器までの経路上に位置する前記ネットワーク接続装置およびネットワークを使用不可にするように制御することを特徴とする
障害監視装置。
It is connected to the network connection device via the network connection device,
When a response to the device status signal to be transmitted to the network connection device has not arrived, the connection status signal is transmitted to the network connection device that relays the device status signal, and the connection status signal Obtaining status information of a connection switch that connects a plurality of interfaces inside the network connection device included in the response of
When the status information of the connection switch is ON, control is performed so that the network connection device and the network located on the path from the device status signal passing through to the network connection device are disabled. Characteristic fault monitoring device.
前記障害監視装置は、前記機器状態用信号として、前記ネットワーク接続機器のIPアドレスを送信先に指定するping(Packet Internet Groper)を用いることを特徴とする
請求項1または請求項2に記載の障害監視装置。
The failure according to claim 1 or 2, wherein the failure monitoring device uses ping (Packet Internet Groper) that specifies an IP address of the network connection device as a transmission destination as the device status signal. Monitoring device.
前記障害監視装置は、前記接続状態用信号として、UDP(User Datagram Protocol)/IPを用いることを特徴とする
請求項1または請求項2に記載の障害監視装置。
The fault monitoring apparatus according to claim 1, wherein the fault monitoring apparatus uses UDP (User Datagram Protocol) / IP as the connection state signal.
ネットワーク接続装置を介してネットワーク接続機器と接続される障害監視装置が、
前記ネットワーク接続機器に送信する機器状態用信号への応答が未着であるときに、前記機器状態用信号を中継する前記ネットワーク接続装置に対して接続状態用信号を送信し、その接続状態用信号の応答に含まれる前記ネットワーク接続装置内部の複数のインタフェースを接続する接続スイッチの状態情報を取得し、
前記接続スイッチの状態情報がONであるときには、前記接続状態用信号を送信した前記ネットワーク接続装置から別のネットワーク接続装置へと系切替を実行することを特徴とする
障害監視方法。
The fault monitoring device connected to the network connection device via the network connection device
When a response to the device status signal to be transmitted to the network connection device has not arrived, the connection status signal is transmitted to the network connection device that relays the device status signal, and the connection status signal Obtaining status information of a connection switch that connects a plurality of interfaces inside the network connection device included in the response of
A fault monitoring method, wherein when the status information of the connection switch is ON, system switching is executed from the network connection device that has transmitted the connection status signal to another network connection device.
ネットワーク接続装置を介してネットワーク接続機器と接続される障害監視装置が、
前記ネットワーク接続機器に送信する機器状態用信号への応答が未着であるときに、前記機器状態用信号を中継する前記ネットワーク接続装置に対して接続状態用信号を送信し、その接続状態用信号の応答に含まれる前記ネットワーク接続装置内部の複数のインタフェースを接続する接続スイッチの状態情報を取得し、
前記接続スイッチの状態情報がONであるときには、前記機器状態用信号が通過する自身から前記ネットワーク接続機器までの経路上に位置する前記ネットワーク接続装置およびネットワークを使用不可にするように制御することを特徴とする
障害監視方法。
The fault monitoring device connected to the network connection device via the network connection device
When a response to the device status signal to be transmitted to the network connection device has not arrived, the connection status signal is transmitted to the network connection device that relays the device status signal, and the connection status signal Obtaining status information of a connection switch that connects a plurality of interfaces inside the network connection device included in the response of
When the status information of the connection switch is ON, control is performed so that the network connection device and the network located on the path from the device status signal passing through to the network connection device are disabled. Characteristic fault monitoring method.
JP2012145304A 2012-06-28 2012-06-28 Fault monitoring apparatus and fault monitoring method Active JP5752646B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012145304A JP5752646B2 (en) 2012-06-28 2012-06-28 Fault monitoring apparatus and fault monitoring method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012145304A JP5752646B2 (en) 2012-06-28 2012-06-28 Fault monitoring apparatus and fault monitoring method

Publications (2)

Publication Number Publication Date
JP2014011542A JP2014011542A (en) 2014-01-20
JP5752646B2 true JP5752646B2 (en) 2015-07-22

Family

ID=50107882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012145304A Active JP5752646B2 (en) 2012-06-28 2012-06-28 Fault monitoring apparatus and fault monitoring method

Country Status (1)

Country Link
JP (1) JP5752646B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019087849A1 (en) * 2017-10-31 2019-05-09 村田機械株式会社 Communication system, apparatus to be controlled, and communication system control method
CN115229988B (en) * 2022-08-04 2023-08-15 徐州徐工施维英机械有限公司 Monitoring method and system for aggregate feeding process of concrete stirring machine

Also Published As

Publication number Publication date
JP2014011542A (en) 2014-01-20

Similar Documents

Publication Publication Date Title
US9141493B2 (en) Isolating a PCI host bridge in response to an error event
JP4520802B2 (en) Storage network management server, storage network management method, storage network management program, and storage network management system
WO2009090723A1 (en) Packet transmission device and its control circuit
JP2006195821A (en) Method for controlling information processing system, information processing system, direct memory access controller, and program
JP2017010390A (en) Storage control device, storage control program, and storage control method
JP2014138407A (en) Node device, communication system, and method for switching virtual switch
TW201640243A (en) Control system and relay device
JP5531831B2 (en) Communication apparatus and communication method
CN103036701A (en) Network segment crossing N+1 backup method and network segment crossing N+1 backup device
JP6429188B2 (en) Relay device
JP5752646B2 (en) Fault monitoring apparatus and fault monitoring method
JP5930029B2 (en) Management device and log collection method
JP6604336B2 (en) Information processing apparatus, information processing method, and program
JP4344333B2 (en) Packet transfer apparatus, packet transfer network system, and packet transfer method
JP2012104967A (en) Duplexed computer network system, network connection device, and failure detection and coping method
JP4806382B2 (en) Redundant system
JP2017011480A (en) Device, system and method for route control
JP5653947B2 (en) Network management system, network management device, network management method, and network management program
JP5651004B2 (en) Computer switching system, computer switching program, and computer switching method
JP2016206898A (en) Information processing device, fault detection method, and computer program
JP6179981B2 (en) Information processing system, information processing apparatus, information processing method, and program
JP2015053555A (en) Data transfer device and data transfer method
JP6160151B2 (en) Relay device and routing control method
JP2006313406A (en) System for collecting failure information
JP2015035678A (en) Network system, monitoring method for route, and relay device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140821

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150512

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150520

R150 Certificate of patent or registration of utility model

Ref document number: 5752646

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150