WO2023188232A1 - ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 - Google Patents
ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 Download PDFInfo
- Publication number
- WO2023188232A1 WO2023188232A1 PCT/JP2022/016399 JP2022016399W WO2023188232A1 WO 2023188232 A1 WO2023188232 A1 WO 2023188232A1 JP 2022016399 W JP2022016399 W JP 2022016399W WO 2023188232 A1 WO2023188232 A1 WO 2023188232A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- network
- network monitoring
- network device
- abnormality
- console
- Prior art date
Links
- 238000012806 monitoring device Methods 0.000 title claims abstract description 48
- 238000012544 monitoring process Methods 0.000 title claims description 26
- 238000000034 method Methods 0.000 title claims description 6
- 230000005856 abnormality Effects 0.000 claims description 59
- 238000001514 detection method Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 10
- 239000000284 extract Substances 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 238000005259 measurement Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000015654 memory Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000004378 air conditioning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
Definitions
- the present disclosure relates to a network monitoring device, a network monitoring system, a network monitoring method, and a recording medium.
- Patent Document 1 discloses a monitoring device that constantly monitors console output information output from a computer for display on a console, detects an abnormality from the console output information, and notifies a monitoring center of the occurrence of an abnormality. ing.
- An example of the purpose of the present disclosure is to provide a network monitoring device that can detect an abnormality that occurs in a network device even when console output information of the network device is not monitored.
- a network monitoring device includes a non-operation detection means for detecting that a network device to be monitored becomes non-operational, and a communication terminal for communicating with a management terminal for the network device that has become non-operational.
- Work instruction means for instructing work including console connection.
- a network monitoring system is a network monitoring system that includes a management terminal connected to a console to a network device that is in an inactive state, and the network monitoring device described above.
- the apparatus further includes an abnormality detection means for detecting abnormality information indicating a firmware abnormality in the console output information output from the network device.
- a computer detects that a network device to be monitored has become inactive, and establishes a console connection with a management terminal to the network device that has become inactive. Instruct the work involved.
- a recording medium detects that a network device to be monitored has become inactive, and instructs the network device that has become inactive to perform work including console connection with a management terminal. Stores a program that causes a computer to do something.
- One example of the effects of the present disclosure is that it is possible to provide a network monitoring device that can detect an abnormality that occurs in a network device even when console output information of the network device is not being monitored.
- FIG. 1 is a block diagram showing the configuration of a network monitoring device in the first embodiment.
- FIG. 2 is a diagram showing a hardware configuration in which the network monitoring device according to the first embodiment is realized by a computer device and its peripheral devices.
- FIG. 3 is an example of a work instruction output by the work instruction unit in the first embodiment.
- FIG. 4 is another example of the work instruction output by the work instruction unit in the first embodiment.
- FIG. 5 is a flowchart showing the operation of the network monitoring device in the first embodiment.
- FIG. 6 is a block diagram showing the configuration of a network monitoring system in the second embodiment.
- FIG. 7 is a flowchart showing the operation of the network monitoring system in the second embodiment.
- FIG. 1 is a block diagram showing the configuration of a network monitoring device 100 in the first embodiment.
- a network monitoring device 100 is connected to a network device to be monitored via a network.
- the network device is a device for relaying or transferring data on a network, such as a router, hub, gateway, or switch.
- the number of network devices to be monitored is not particularly limited.
- the network monitoring device 100 includes an inactivity detection section 101 , a work instruction section 102 , and a startup control section 103 .
- the activation control unit 103 is not an essential component.
- FIG. 2 is a diagram illustrating an example of a hardware configuration in which the network monitoring device 100 according to the first embodiment of the present disclosure is realized by a computer device 500 including a processor.
- the network monitoring device 100 includes a CPU (Central Processing Unit) 501, a ROM (Read Only Memory) 502, a RAM (Random Access Memory) 503, and other memories, and a hard disk that stores a program 504. It includes a device 505, a communication interface 508 for network connection, and an input/output interface 511 for inputting and outputting data.
- a CPU Central Processing Unit
- ROM Read Only Memory
- RAM Random Access Memory
- the CPU 501 operates an operating system to control the entire network monitoring device 100 according to the first embodiment of the present invention. Further, the CPU 501 reads programs and data from a recording medium 506 attached to, for example, a drive device 507 to a memory. Further, the CPU 501 functions as the non-operation detection unit 101, the work instruction unit 102, the start-up control unit 103, and a part thereof in the first embodiment, and performs processing or processing in the flowchart shown in FIG. 5, which will be described later, based on the program. Execute commands.
- the recording medium 506 is, for example, an optical disk, a flexible disk, a magneto-optical disk, an external hard disk, or a semiconductor memory.
- Some recording media of the storage device are non-volatile storage devices, and programs are recorded therein. Further, the program may be downloaded from an external computer (not shown) connected to a communication network.
- the input device 509 is realized by, for example, a mouse, a keyboard, a built-in key button, etc., and is used for input operations.
- the input device 509 is not limited to a mouse, a keyboard, or a built-in key button, but may be a touch panel, for example.
- the output device 510 is implemented as a display, for example, and is used to confirm the output.
- the first embodiment shown in FIG. 1 is realized by the computer hardware shown in FIG. 2.
- the implementation means of each part included in the network monitoring device 100 of FIG. 1 is not limited to the configuration described above.
- the network monitoring device 100 may be realized by one physically coupled device, or may be realized by two or more physically separated devices connected by wire or wirelessly. Good too.
- input device 509 and output device 510 may be connected to computer device 500 via a network.
- the network monitoring device 100 in the first embodiment shown in FIG. 1 can also be configured using cloud computing or the like.
- the non-operation detection unit 101 is means for detecting that a network device to be monitored has become non-operational.
- the non-operating state is a state in which the device is no longer operating normally due to component failure, software defect, lack of network device resources, or the like.
- Various methods can be used for the non-operation detection unit 101 to detect that the network device is in the non-operation state.
- the non-operation detection unit 101 may detect based on information regarding the operating status of the network device, such as power consumption, CPU, or memory usage rate, or may periodically send a specific command such as Ping to the network device. It may also be detected by sending a message and checking whether there is a response.
- the non-operating detection unit 101 detects that the network device is in the non-operating state, it outputs information specifying the network device that has become non-operating to the work instruction unit 102.
- the work instruction unit 102 is a means for instructing the network device to perform work including a console connection with a management terminal when detecting that the network device is in an inactive state.
- console connection means connecting a console cable such as a serial cable to a console port of a network device and connecting it to a management terminal.
- the work instruction unit 102 receives information specifying a network device that is in an inactive state from the inactivity detection unit 101, the work instruction unit 102 outputs the content of the work to be performed on the network device to the output device 510 or the like.
- the work instruction unit 102 instructs, for example, to connect the monitoring device to the network device as a console.
- the work instruction unit 102 may instruct the network device to be restarted.
- the work instruction unit 102 may select the work to be instructed to the network device based on the log information of the network device immediately before it becomes non-operational. For example, when the work instruction unit 102 determines that the non-operation state of the network device is temporary based on the log information of the immediately preceding network device, the work instruction unit 102 instructs the restart of the network device.
- a temporary non-operating state is, for example, a state in which the memory is exhausted, which can be recovered by turning on the power again, or a state in which temperature abnormality occurs due to a temporary stoppage of air conditioning.
- the work instruction unit 102 acquires log information of the network device immediately before it becomes inactive, obtained from a log collection means such as syslog or SNMP (Simple Network Management Protocol). Then, for example, if the log information includes log information about memory exhaustion of the network device, the work instruction unit 102 determines that the non-operating state of the network device is temporary and instructs the restart of the network device. do. If the non-operational state of the network device cannot be determined to be temporary based on the log information of the immediately preceding network device, the work instruction unit 102 performs a communication with the management terminal for the network device that is in the non-operational state. Instructs console connection.
- a log collection means such as syslog or SNMP (Simple Network Management Protocol). Then, for example, if the log information includes log information about memory exhaustion of the network device, the work instruction unit 102 determines that the non-operating state of the network device is temporary and instructs the restart of the network device. do. If
- the startup control unit 103 is a means for controlling the power of the network device.
- the activation control unit 103 restarts the network device, for example, when the work instruction unit 102 instructs the network device that has become inactive to restart.
- FIG. 3 is an example of a work instruction output by the work instruction unit 102 in the first embodiment.
- the work instruction unit 102 displays the network device name, the detection time when the operating state was detected, and the operating state.
- device A is shown to be in a non-operating state
- device B and device N are shown to be in an operating state.
- the work instruction unit 102 detects that a button for displaying detailed information on the operating state has been pressed, it displays log information etc. immediately before the non-operating state. I don't mind.
- FIG. 4 is another example of the work instruction output by the work instruction unit 102 in the first embodiment.
- the activation control unit 103 detects that the restart button in FIG. 4 has been pressed, it may restart the network device that has become inactive.
- FIG. 5 is a flowchart showing an overview of the operation of the network monitoring device 100 in the first embodiment. Note that the processing according to this flowchart may be executed based on program control by the processor described above.
- the non-operation detection unit 101 detects that the network device to be monitored has become non-operational (step S101).
- the work instruction unit 102 determines whether the non-operational state of the network device is temporary based on the log information of the network device immediately before the non-operational state (step S102). If the work instruction unit 102 determines that the non-operational state of the network device is temporary (S102; YES), the work instruction unit 102 instructs the network device that has become non-operational to restart (step S103), and performs startup control.
- the unit 103 executes restart (step S104).
- step S105 The network monitoring device 100 repeats the process according to this flowchart every time it detects a non-operating state of any network device. With this, the network monitoring device 100 ends its operation.
- the work instruction unit 102 when a non-operating state of a network device is detected, instructs the network device that is in the non-operating state to perform work including a console connection with a management terminal. Instruct. Thereby, it is possible to detect an abnormality occurring in a network device even when the console output information of the network device is not being monitored. Note that in a configuration where the network monitoring device 100 does not include the startup control unit 103, if the work instruction unit 102 instructs a network device that has become inactive to restart, the administrator must turn the power switch of the network device You will have to operate it to reboot.
- FIG. 6 is a block diagram showing the configuration of the network monitoring system 11 in the second embodiment.
- the network monitoring system 11 includes a network monitoring device 110 that connects to network devices to be monitored via a business network A, and a management terminal 210 that connects to the network monitoring device 110 via a management network B. and. Further, the network device A that is in an inactive state and the management terminal 210 are connected by a console cable such as a serial cable.
- Each component of the network monitoring device 110 and the management terminal 210 in each embodiment of the present disclosure is not only capable of realizing its functions in terms of hardware, but also a computer device based on program control, similar to the computer device shown in FIG. , can be realized with software.
- the management terminal 210 in this embodiment is, for example, a portable terminal device such as a notebook PC. Even if the management terminal 210 is a stationary type, it is not configured to constantly relay the console output of the network device, but is a device that has the function of relaying the console output of the network device to the network by the operation of the administrator or the monitoring device. It may be.
- the console output information of network device A which is output to the management terminal 210, on an output device such as a display, the administrator of the network device can grasp abnormalities and tampering with the firmware of network device A. become.
- the management terminal 210 transmits console output information of the network device A to the network monitoring device 110 via the management network B.
- the administrator connects the network device A to the management terminal 210 and the console. Assume a connected situation. If network device A fails to start up while network device A is connected to the management terminal 210 via console, log information indicating the failure will be output to the console output information, even if the cause of the failure is not an abnormality caused by the power supply, etc. be done. In particular, if an abnormality or tampering with firmware or the like is detected at startup, information regarding the abnormality is output to console output information, and the firmware is not read or executed.
- the network monitoring device 110 includes an inoperation detection section 111 , a work instruction section 112 , a startup control section 113 , an abnormality detection section 114 , an analysis section 115 , and an output section 116 .
- the non-working detection unit 111, the work instruction unit 112, and the activation control unit 113 are the same as the non-working detection unit 101, the work instruction unit 102, and the activation control unit 103 of the first embodiment, respectively, so a description thereof will be omitted.
- the abnormality detection unit 114 is a means for detecting abnormality information indicating a firmware abnormality from the console output information output from the network device.
- the abnormality detection unit 114 detects a firmware abnormality based on whether or not the console output information includes, for example, a character string indicating that startup has failed.
- the abnormality detection unit 114 detects an abnormality in the firmware, it outputs a signal indicating this to the analysis unit 115.
- the analysis unit 115 is a means for analyzing a portion of the console output information indicating the cause of the abnormality when the console output information includes abnormality information.
- the location indicating the cause of the abnormality is, for example, a location indicating the reason why the network device A did not load or execute the firmware.
- the analysis unit 115 analyzes a portion indicating the cause of the abnormality.
- the analysis unit 115 analyzes the cause of the abnormality by comparing it with a pre-held character string to be compared. Examples of the character string to be verified include a character string indicating that the electronic signatures of the firmware do not match.
- the analysis unit 115 extracts the measured value.
- the measured value is the state or configuration of the network device, program, and data calculated using characters and numbers when the network device is started, and is, for example, a hash value of firmware.
- the network monitoring system 11 stores, in the storage device 505, character strings that appear before and after a location in which a measurement value is written in console output information in order to extract the location.
- the analysis unit 115 collates the same character string with the console output information, identifies the position of the measured value, and extracts it as a measured value. Note that if the analysis unit 115 holds the regular measured values in the storage device 505 in advance, the analyzing unit 115 may compare the regular values and the measured values.
- the measured value of the console output information is abnormal, for example, if the measured value is a hash value of firmware, tampering with the firmware can be detected.
- the measured value is other than the hash value of the firmware, for example, the network device may have an abnormality (such as replacing some parts) and will not start up, or the non-firmware part such as the network device's configuration file may have occurred. It is also possible to detect if the data has been tampered with.
- the output unit 116 is a means for outputting the analysis results by the analysis unit 115 to the output device 510 or the like.
- the output unit 116 outputs the cause of the abnormality when the part indicating the cause of the abnormality is a character string. For example, if the electronic signatures of the firmware do not match, the output unit 116 outputs an analysis result indicating this fact. When the location indicating the cause of the abnormality is a measured value, the output unit 116 outputs the extracted measured value. When the normal value and the measured value are compared, the output unit 116 may output the comparison result.
- the management terminal 210 includes a console port, a console relay unit 211 that relays network connection with the network monitoring device 110, and a work instruction unit 112, an abnormality detection unit 114, an analysis unit 115, or an output unit 116 in the network monitoring device 110. and a remote management unit 212 having at least one of the following functions.
- the remote management unit 212 If the remote management unit 212 has the function of the work instruction unit 112, it outputs to the output device 510 of the management terminal 210 instructions for the work to be performed on the network device that has become inactive. Further, if the remote management unit 212 has the function of the abnormality detection unit 114 or the analysis unit 115, it analyzes console output information of the network device that has become inactive on the management terminal 210. Further, if the remote management unit 212 has the function of the output unit 116, it outputs the analysis result by the analysis unit 115 to the output device 510 of the management terminal 210.
- the remote management unit 212 may be connected to the network monitoring device 110 and may be able to control the startup control unit 113 of the network monitoring device 110.
- the administrator needs to go to the location of the network device that has become non-operational and connect it to the management terminal 210 through a console. Therefore, by providing or controlling the functions of these components in the management terminal 210, an administrator can work near a network device that is in an inactive state.
- FIG. 7 is a flowchart showing an overview of the operation of the network monitoring system 11 in the second embodiment. Note that the processing according to this flowchart may be executed based on program control by the processor described above. This flowchart assumes a situation after the administrator connects the network monitoring device 110 that is in an inactive state and the management terminal 210 with a console cable, and then restarts the network device.
- the abnormality detection unit 114 detects abnormality information indicating a firmware abnormality from console output information of a network device in an inactive state (step S201).
- the analysis unit 115 analyzes a portion of the console output information that indicates the cause of the abnormality (step S202). If the location indicating the cause of the abnormality is a measured value (S203; YES), the analysis unit 115 extracts the measured value of the abnormal location (Step S204). If the part indicating the cause of the abnormality is a character string (S203; NO), the analysis unit 115 analyzes the cause of the abnormality by comparing the character string to be compared (Step S205). Finally, the output unit 116 outputs the extracted measurement value or cause of the abnormality (step S206). With this, the network monitoring system 11 ends its operation.
- the analysis unit 115 analyzes the location indicating the cause of the abnormality based on the console output information. This allows the administrator to understand the cause of the abnormality in the network device.
- the order of the description does not limit the order in which the plurality of operations are executed. Therefore, when implementing each embodiment, the order of the plurality of operations can be changed within a range that does not interfere with the content.
- the remote management unit 212 in the management terminal 210 may have the function of the non-operation detection unit 111. However, in this case, the management terminal 210 needs to be connected to the network device to be monitored.
- Network monitoring system 100 110 Network monitoring device 101, 111 Non-operation detection unit 102, 112 Work instruction unit 103, 113 Start-up control unit 114 Abnormality detection unit 115 Analysis unit 116 Output unit 210 Management terminal 212 Remote management unit
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本開示のネットワーク監視装置は、監視対象のネットワーク装置が非稼働状態になったことを検出する、非稼働検出手段と、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する、作業指示手段と、を備える。
Description
本開示は、ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体に関する。
装置の異常発生をコンソール出力情報により、遠隔で監視する技術がある。
例えば、特許文献1には、電子計算機よりコンソールへ表示させるために出力されるコンソール出力情報を常時監視し、異常をコンソール出力情報より検出し、異常発生通知を監視センターに行なう監視装置が開示されている。
しかしながら、コンソール出力情報を監視するためには、監視対象のネットワーク装置と管理端末とを常にコンソールケーブルで接続しておく必要があり、ネットワーク装置の配線の管理が煩雑になる。
本開示の目的の一例は、ネットワーク装置のコンソール出力情報を監視していない状態であっても、ネットワーク装置に発生した異常を検出できるネットワーク監視装置を提供することにある。
本開示の一態様におけるネットワーク監視装置は、監視対象のネットワーク装置が非稼働状態になったことを検出する、非稼働検出手段と、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する、作業指示手段と、を備える。
本開示の一態様におけるネットワーク監視システムは、非稼働状態になったネットワーク装置に対してコンソール接続した管理端末と、上述のネットワーク監視装置と、を備えた、ネットワーク監視システムであって、ネットワーク監視装置は、ネットワーク装置から出力されたコンソール出力情報に、ファームウェアの異常を示す異常情報を検出する、異常検出手段を更に備える。
本開示の一態様におけるネットワーク監視方法は、コンピュータが、監視対象のネットワーク装置が非稼働状態になったことを検出し、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する。
本開示の一態様における記録媒体は、監視対象のネットワーク装置が非稼働状態になったことを検出し、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する、ことをコンピュータに実行させるプログラムを格納する。
本開示による効果の一例は、ネットワーク装置のコンソール出力情報を監視していない状態であっても、ネットワーク装置に発生した異常を検出できるネットワーク監視装置を提供できることにある。
次に、実施形態について図面を参照して詳細に説明する。
[第一の実施形態]
図1は、第一の実施形態におけるネットワーク監視装置100の構成を示すブロック図である。図1を参照すると、ネットワーク監視装置100は、監視対象のネットワーク装置とネットワークを介して接続している。本実施形態において、ネットワーク装置とは、ルータやハブ、ゲートウェイ又はスイッチ等のネットワーク上でデータを中継や転送等するための装置である。監視対象のネットワーク装置の数は、特に制限されない。ネットワーク監視装置100は、非稼働検出部101と作業指示部102と起動制御部103を備える。但し、本実施形態において、起動制御部103は必須の構成部ではない。
図1は、第一の実施形態におけるネットワーク監視装置100の構成を示すブロック図である。図1を参照すると、ネットワーク監視装置100は、監視対象のネットワーク装置とネットワークを介して接続している。本実施形態において、ネットワーク装置とは、ルータやハブ、ゲートウェイ又はスイッチ等のネットワーク上でデータを中継や転送等するための装置である。監視対象のネットワーク装置の数は、特に制限されない。ネットワーク監視装置100は、非稼働検出部101と作業指示部102と起動制御部103を備える。但し、本実施形態において、起動制御部103は必須の構成部ではない。
図2は、本開示の第一の実施形態におけるネットワーク監視装置100を、プロセッサを含むコンピュータ装置500で実現したハードウェア構成の一例を示す図である。図2に示されるように、ネットワーク監視装置100は、CPU(Central Processing Unit)501、ROM(Read Only Memory)502、RAM(Random Access Memory)503等のメモリ、プログラム504を格納するハードディスク等の記憶装置505、ネットワーク接続用の通信インタフェース508、データの入出力を行う入出力インタフェース511を含む。
CPU501は、オペレーティングシステムを動作させて本発明の第一の実施の形態に係るネットワーク監視装置100の全体を制御する。また、CPU501は、例えばドライブ装置507等に装着された記録媒体506からメモリにプログラムやデータを読み出す。また、CPU501は、第一の実施の形態における非稼働検出部101、作業指示部102、起動制御部103及びこれらの一部として機能し、プログラムに基づいて後述する図5に示すフローチャートにおける処理または命令を実行する。
記録媒体506は、例えば光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク、または半導体メモリ等である。記憶装置の一部の記録媒体は、不揮発性記憶装置であり、そこにプログラムを記録する。また、プログラムは、通信網に接続されている図示しない外部コンピュータからダウンロードされてもよい。
入力装置509は、例えば、マウスやキーボード、内蔵のキーボタン等で実現され、入力操作に用いられる。入力装置509は、マウスやキーボード、内蔵のキーボタンに限らず、例えばタッチパネルでもよい。出力装置510は、例えばディスプレイで実現され、出力を確認するために用いられる。
以上のように、図1に示す第一の実施形態は、図2に示されるコンピュータ・ハードウェアによって実現される。ただし、図1のネットワーク監視装置100が備える各部の実現手段は、以上説明した構成に限定されない。また、ネットワーク監視装置100は、物理的に結合した一つの装置により実現されてもよいし、物理的に分離した二つ以上の装置を有線または無線で接続し、これら複数の装置により実現されてもよい。たとえば、入力装置509及び出力装置510は、コンピュータ装置500とネットワークを経由して接続されていてもよい。また、図1に示す第一の実施形態におけるネットワーク監視装置100は、クラウドコンピューティング等で構成することもできる。
図1において、非稼働検出部101は、監視対象のネットワーク装置が非稼働状態になったことを検出する手段である。非稼働状態とは、部品の故障、ソフトウェアの欠陥、ネットワーク装置の資源不足等により、正常に動作しなくなった状態である。非稼働検出部101がネットワーク装置の非稼働状態になったことを検出する方法としては、種々の方法を用いることができる。非稼働検出部101は、例えば、ネットワーク装置の消費電力、CPU、又は、メモリの使用率等の稼働状況に関する情報に基づいて検出しても構わないし、Ping等の特定のコマンドをネットワーク装置に定期的に送信し、レスポンスの有無を確認することで検出しても構わない。非稼働検出部101は、非稼働状態となったことを検出した場合は、非稼働状態となったネットワーク装置を特定する情報を作業指示部102に出力する。
作業指示部102は、非稼働状態になったことを検出した場合、当該ネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する手段である。本実施形態において、コンソール接続とは、ネットワーク装置のコンソールポートに、シリアルケーブル等のコンソールケーブルを接続し、管理端末と接続することである。作業指示部102は、非稼働検出部101から非稼働状態になったネットワーク装置を特定する情報が入力されると、当該ネットワーク装置に対して行う作業内容を出力装置510等に出力する。作業指示部102は、例えば、ネットワーク装置に監視装置をコンソール接続することを指示する。作業指示部102は、ネットワーク装置を再起動することを指示しても構わない。
また、作業指示部102は、非稼働状態になる直前のネットワーク装置のログ情報に基づいて、ネットワーク装置に対して指示する作業を選択してもよい。作業指示部102は、例えば、直前のネットワーク装置のログ情報に基づき、ネットワーク装置の非稼働状態が一時的なものであると判定する場合、ネットワーク装置の再起動を指示する。非稼働状態が一時的なものとは、例えば、メモリ枯渇等の電源の再投入で復旧すると考えられる状態又は一時的な空調の停止による温度異常が生じた状態である。
より具体的には、作業指示部102は、syslog、又は、SNMP(Simple Network Management Protocol)等のログ収集手段から得られた、非稼働状態になる直前のネットワーク装置のログ情報を取得する。そして、作業指示部102は、例えば、ログ情報にネットワーク装置のメモリ枯渇のログ情報が含まれる場合、ネットワーク装置の非稼働状態は一時的なものであると判定し、ネットワーク装置の再起動を指示する。作業指示部102は、直前のネットワーク装置のログ情報に基づいて、ネットワーク装置の非稼働状態は一時的なものとは判定できない場合、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を指示する。
起動制御部103は、ネットワーク装置の電源を制御する手段である。起動制御部103は、例えば、作業指示部102により非稼働状態になったネットワーク装置に対して再起動が指示された場合、ネットワーク装置の再起動をする。
図3は、第一の実施形態において、作業指示部102により出力される作業指示の例である。図3に示すように、作業指示部102は、ネットワーク装置名と、稼働状態を検出した検出時間と、稼働状態を表示する。図3中、装置Aは、非稼働状態であることを示しており、装置B及び装置Nは、稼働状態であることを示している。また、図3の例で示すように、作業指示部102は、稼働状態の詳細情報を表示するボタンが押下操作されたことを検出すると、非稼働状態となる直前のログ情報等を表示しても構わない。
図4は、第一の実施形態において、作業指示部102により出力される作業指示の他の例である。起動制御部103は、図4中の再起動のボタンが押下操作されたことを検出すると、非稼働状態になったネットワーク装置に対して再起動を行っても構わない。
以上のように構成されたネットワーク監視装置100の動作について、図5のフローチャートを参照して説明する。
図5は、第一の実施形態におけるネットワーク監視装置100の動作の概要を示すフローチャートである。尚、このフローチャートによる処理は、前述したプロセッサによるプログラム制御に基づいて、実行されてもよい。
図5に示すように、まず、非稼働検出部101は、監視対象のネットワーク装置が非稼働状態になったことを検出する(ステップS101)。次に、作業指示部102は、非稼働状態になる直前のネットワーク装置のログ情報に基づいて、ネットワーク装置の非稼働状態が一時的であるか否かを判定する(ステップS102)。作業指示部102は、ネットワーク装置の非稼働状態が一時的であると判定した場合(S102;YES)、非稼働状態になったネットワーク装置に対して再起動を指示し(ステップS103)、起動制御部103が再起動を実行する(ステップS104)。一方、作業指示部102は、ネットワーク装置の非稼働状態は一時的であると判定しなかった場合(S102;NO)、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を指示する(ステップS105)。ネットワーク監視装置100は、いずれかのネットワーク装置の非稼働状態を検出する度に、このフローチャートによる処理を繰り返す。以上で、ネットワーク監視装置100は、動作を終了する。
第一の実施形態におけるネットワーク監視装置100は、ネットワーク装置の非稼働状態を検出すると、作業指示部102が、非稼働状態になったネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する。これにより、ネットワーク装置のコンソール出力情報を監視していない状態であっても、ネットワーク装置に発生した異常を検出することが可能である。なお、ネットワーク監視装置100が起動制御部103を含まない構成において、作業指示部102が非稼働状態になったネットワーク装置に対して再起動を指示した場合は、管理者が、ネットワーク装置の電源スイッチを操作して再起動を実行させることになる。
[第二の実施形態]
次に、本開示の第二の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。第二の実施形態では、非稼働状態になったネットワーク装置に対して、管理端末210とコンソール接続させた状態でネットワーク装置を起動させた後の場面を想定する。
次に、本開示の第二の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。第二の実施形態では、非稼働状態になったネットワーク装置に対して、管理端末210とコンソール接続させた状態でネットワーク装置を起動させた後の場面を想定する。
図6は、第二の実施形態におけるネットワーク監視システム11の構成を示すブロック図である。図6を参照すると、ネットワーク監視システム11は、監視対象のネットワーク装置と業務用ネットワークAを介して接続するネットワーク監視装置110と、ネットワーク監視装置110と管理用ネットワークBを介して接続する管理端末210と、を備える。また、非稼働状態になったネットワーク装置Aと管理端末210とは、シリアルケーブル等のコンソールケーブルで接続されている。
本開示の各実施形態におけるネットワーク監視装置110及び管理端末210の各構成要素は、図2に示すコンピュータ装置と同様に、その機能をハードウェア的に実現することはもちろん、プログラム制御に基づくコンピュータ装置、ソフトウェアで実現することができる。
本実施形態における管理端末210は、例えば、ノートPCのような携帯型の端末装置である。管理端末210は、据え置き型であっても、常時ネットワーク装置のコンソール出力を中継する構成となっておらず、管理者や監視装置の操作によりネットワーク装置のコンソール出力をネットワークに中継する機能を有する装置であってもよい。ネットワーク装置の管理者は、管理端末210に出力された、ネットワーク装置Aのコンソール出力情報をディスプレイ等の出力装置に表示することで、ネットワーク装置Aのファームウェア等の異常や改ざんを把握することが可能になる。本実施形態において、管理端末210は、管理用ネットワークBを介して、ネットワーク装置Aのコンソール出力情報をネットワーク監視装置110に送信する。
本実施形態では、第一の実施形態のネットワーク監視装置100の構成によって、ネットワーク装置Aを管理端末210とコンソール接続することが指示された後、管理者が、ネットワーク装置Aを管理端末210とコンソール接続した場面を想定する。ネットワーク装置Aを管理端末210とコンソール接続した状態で、ネットワーク装置Aが起動に失敗すると、失敗の原因が電源等に起因する異常でない場合に、コンソール出力情報に失敗したことを示すログ情報が出力される。特に、起動時にファームウェア等の異常や改ざんが検出された場合には、その異常に関する情報がコンソール出力情報に出力され、ファームウェアが読み込まれない、又は、実行されないという動作がなされる。
(ネットワーク監視装置110)
図6に戻って、第二の実施形態に係るネットワーク監視システム11のネットワーク監視装置110について、第一の実施形態に係るネットワーク監視装置100と異なる部分を中心に説明する。ネットワーク監視装置110は、非稼働検出部111と作業指示部112と起動制御部113と異常検出部114と分析部115と出力部116を備える。非稼働検出部111と作業指示部112と起動制御部113は、第一の実施形態の非稼働検出部101と作業指示部102と起動制御部103とそれぞれ同様のため、説明を省略する。
図6に戻って、第二の実施形態に係るネットワーク監視システム11のネットワーク監視装置110について、第一の実施形態に係るネットワーク監視装置100と異なる部分を中心に説明する。ネットワーク監視装置110は、非稼働検出部111と作業指示部112と起動制御部113と異常検出部114と分析部115と出力部116を備える。非稼働検出部111と作業指示部112と起動制御部113は、第一の実施形態の非稼働検出部101と作業指示部102と起動制御部103とそれぞれ同様のため、説明を省略する。
異常検出部114は、ネットワーク装置から出力されたコンソール出力情報から、ファームウェアの異常を示す異常情報を検出する手段である。異常検出部114は、コンソール出力情報に、例えば、起動失敗したことを示す文字列が含まれているか否かにより、ファームウェアの異常を検出する。異常検出部114は、ファームウェアの異常を検出した場合は、そのことを示す信号を分析部115に出力する。
分析部115は、コンソール出力情報に異常情報が含まれている場合、コンソール出力情報の異常原因を示す箇所を分析する手段である。異常原因を示す箇所とは、例えば、ネットワーク装置Aがファームウェアを読み込まなかった、又は、実行しなかった理由を示す箇所である。分析部115は、異常検出部114がファームウェアの異常を検出すると、異常原因を示す箇所を分析する。分析部115は、異常原因を示す箇所が文字列である場合、予め保持された照合対象の文字列と照合することにより、異常原因を分析する。照合対象の文字列には、例えば、ファームウェアの電子署名が一致しなかったことを示す文字列等が挙げられる。
分析部115は、異常原因を示す箇所が測定値の場合、その測定値を抽出する。測定値とは、ネットワーク装置の起動時に、ネットワーク装置、プログラム及びデータの状態又はこれらの構成を文字と数値で算出したものであって、例えば、ファームウェアのハッシュ値である。ネットワーク監視システム11は、例えば、コンソール出力情報の測定値の記載箇所を抽出するために、その前後に現れる文字列を記憶装置505内に保持している。分析部115は、同文字列とコンソール出力情報を照合し、測定値の位置を識別したうえ、測定値として抽出する。なお、分析部115は、あらかじめ記憶装置505内に正規の測定値を保持している場合には、正規の値と測定値を照合してもよい。コンソール出力情報のうち、測定値が異常である場合は、例えば、測定値がファームウェアのハッシュ値であれば、ファームウェアの改ざんを検知することができる。また、測定値がファームウェアのハッシュ値以外であれば、例えば、ネットワーク装置本体に異常(一部の部品をすり替えるなど)があって起動しなった時や、ネットワーク装置の設定ファイルなどファームウェアでない部分が改ざんされていたことも検知できる。
出力部116は、分析部115による分析結果を出力装置510等に出力する手段である。出力部116は、異常原因を示す箇所が文字列の場合、異常原因を出力する。出力部116は、例えば、ファームウェアの電子署名が一致しなかった場合、その旨を示す分析結果を出力する。出力部116は、異常原因を示す箇所が測定値の場合、抽出した測定値を出力する。出力部116は、正規の値と測定値を照合した場合は、照合した結果を出力してもよい。
(管理端末210)
管理端末210は、コンソールポートと、ネットワーク監視装置110とのネットワーク接続を中継するコンソール中継部211と、ネットワーク監視装置110における作業指示部112、異常検出部114、分析部115、又は、出力部116の少なくともいずれかの機能を備える遠隔管理部212と、を備える。
管理端末210は、コンソールポートと、ネットワーク監視装置110とのネットワーク接続を中継するコンソール中継部211と、ネットワーク監視装置110における作業指示部112、異常検出部114、分析部115、又は、出力部116の少なくともいずれかの機能を備える遠隔管理部212と、を備える。
遠隔管理部212は、作業指示部112の機能を備える場合は、管理端末210の出力装置510に、非稼働状態になったネットワーク装置に対して行う作業の指示を出力する。また、遠隔管理部212は、異常検出部114又は分析部115の機能を備える場合は、非稼働状態になったネットワーク装置のコンソール出力情報を管理端末210上で分析等する。また、遠隔管理部212は、出力部116の機能を備える場合は、分析部115による分析結果を管理端末210の出力装置510に出力する。
更に、遠隔管理部212は、ネットワーク監視装置110に接続し、ネットワーク監視装置110の起動制御部113を制御可能とさせてもよい。監視対象のいずれかのネットワーク装置が非稼働状態になると、管理者は、非稼働状態になったネットワーク装置の場所に行き、管理端末210とコンソール接続させる必要がある。よって、これらの構成部の機能を管理端末210が備える又は制御可能とすることにより、非稼働状態になったネットワーク装置の近傍で管理者が作業することができる。
以上のように構成されたネットワーク監視システム11の動作について、図7のフローチャートを参照して説明する。図7は、第二の実施形態におけるネットワーク監視システム11の動作の概要を示すフローチャートである。尚、このフローチャートによる処理は、前述したプロセッサによるプログラム制御に基づいて、実行されてもよい。本フローチャートは、管理者が、非稼働状態になったネットワーク監視装置110と管理端末210とをコンソールケーブルで接続させてから、ネットワーク装置を再起動させた後の場面を想定している。
図7に示すように、まず、異常検出部114は、非稼働状態のネットワーク装置のコンソール出力情報から、ファームウェアの異常を示す異常情報を検出する(ステップS201)。次に、分析部115は、コンソール出力情報のうち、異常原因を示す箇所を分析する(ステップS202)。分析部115は、異常原因を示す箇所が測定値の場合(S203;YES)、異常箇所の測定値を抽出する(ステップS204)。分析部115は、異常原因を示す箇所が文字列の場合(S203;NO)、照合対象の文字列を照合して、異常原因を分析する(ステップS205)。最後に、出力部116が抽出した測定値又は異常原因を出力する(ステップS206)。以上で、ネットワーク監視システム11は、動作を終了する。
本開示の第二の実施形態のネットワーク監視システム11では、分析部115は、コンソール出力情報に基づいて異常原因を示す箇所を分析する。これにより、管理者は、ネットワーク装置の異常原因を把握することができる。
以上、各実施の形態を参照して本発明を説明したが、本発明は上記実施の形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえる様々な変更をすることができる。
例えば、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。本実施形態において、管理端末210における遠隔管理部212が、非稼働検出部111の機能を備えていても構わない。但し、この場合、管理端末210が、監視対象のネットワーク装置とネットワーク接続されている必要がある。
11 ネットワーク監視システム
100、110 ネットワーク監視装置
101、111 非稼働検出部
102、112 作業指示部
103、113 起動制御部
114 異常検出部
115 分析部
116 出力部
210 管理端末
212 遠隔管理部
100、110 ネットワーク監視装置
101、111 非稼働検出部
102、112 作業指示部
103、113 起動制御部
114 異常検出部
115 分析部
116 出力部
210 管理端末
212 遠隔管理部
Claims (10)
- 監視対象のネットワーク装置が非稼働状態になったことを検出する、非稼働検出手段と、
非稼働状態になった前記ネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する、作業指示手段と、を備える、
ネットワーク監視装置。 - 前記作業指示手段は、非稼働状態になる直前の前記ネットワーク装置のログ情報に基づいて、前記ネットワーク装置に対して指示する作業を選択する、
請求項1に記載のネットワーク監視装置。 - 前記作業指示手段は、前記ネットワーク装置に対して、管理端末とのコンソール接続する作業を指示する、
請求項1又は2に記載のネットワーク監視装置。 - 非稼働状態になった前記ネットワーク装置に対してコンソール接続された管理端末と、
請求項1~3のいずれか一項に記載の前記ネットワーク監視装置と、を備えた、ネットワーク監視システムであって、
前記ネットワーク監視装置は、前記ネットワーク装置から出力されたコンソール出力情報から、ファームウェアの異常を示す異常情報を検出する、異常検出手段を更に備える、
ネットワーク監視システム。 - 前記ネットワーク監視装置は、前記コンソール出力情報に前記異常情報が含まれている場合、前記コンソール出力情報の異常原因を示す箇所を分析する、分析手段と、
前記異常原因を示す箇所の分析結果を出力する、出力手段と、を更に備える、
請求項4に記載のネットワーク監視システム。 - 前記分析手段は、前記異常原因を示す箇所が文字列の場合、予め保持された照合対象の文字列と照合することにより、前記異常原因を分析し、
前記出力手段は、前記異常原因を出力する、
請求項5に記載のネットワーク監視システム。 - 前記分析手段は、前記異常原因を示す箇所が測定値の場合、異常箇所の測定値を抽出し、
前記出力手段は、抽出した前記測定値を出力する、
請求項5に記載のネットワーク監視システム。 - 前記管理端末は、遠隔管理手段を備え、
前記遠隔管理手段は、前記作業指示手段、前記異常検出手段、前記分析手段、又は、前記出力手段の少なくともいずれかの機能を備える、
請求項5~7のいずれか一項に記載のネットワーク監視システム。 - コンピュータが、
監視対象のネットワーク装置が非稼働状態になったことを検出し、
非稼働状態になった前記ネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する、ネットワーク監視方法。 - 監視対象のネットワーク装置が非稼働状態になったことを検出し、
非稼働状態になった前記ネットワーク装置に対して、管理端末とのコンソール接続を含む作業を指示する、ことをコンピュータに実行させるプログラムを格納する記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/016399 WO2023188232A1 (ja) | 2022-03-31 | 2022-03-31 | ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/016399 WO2023188232A1 (ja) | 2022-03-31 | 2022-03-31 | ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2023188232A1 true WO2023188232A1 (ja) | 2023-10-05 |
Family
ID=88199871
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2022/016399 WO2023188232A1 (ja) | 2022-03-31 | 2022-03-31 | ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
WO (1) | WO2023188232A1 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05191494A (ja) * | 1992-01-09 | 1993-07-30 | Toshiba Corp | 監視装置 |
JPH05282180A (ja) * | 1992-03-30 | 1993-10-29 | Toshiba Corp | リモート監視装置 |
JP2008022271A (ja) * | 2006-07-12 | 2008-01-31 | Yamaha Corp | ネットワーク機器 |
-
2022
- 2022-03-31 WO PCT/JP2022/016399 patent/WO2023188232A1/ja unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05191494A (ja) * | 1992-01-09 | 1993-07-30 | Toshiba Corp | 監視装置 |
JPH05282180A (ja) * | 1992-03-30 | 1993-10-29 | Toshiba Corp | リモート監視装置 |
JP2008022271A (ja) * | 2006-07-12 | 2008-01-31 | Yamaha Corp | ネットワーク機器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8806278B2 (en) | Method and device for autonomously diagnosing and remotely controlling a computer or computer-aided system | |
JP4746455B2 (ja) | コンピュータ装置、起動制御方法及び起動制御プログラム | |
CN104639380A (zh) | 服务器监控方法 | |
KR101712172B1 (ko) | 컴퓨터 장애 증상의 사전 진단 및 분석 복구 시스템 및 방법 | |
JPWO2009110111A1 (ja) | サーバ装置及びサーバ装置の異常検知方法及びサーバ装置の異常検知プログラム | |
WO2018095107A1 (zh) | 一种bios程序的异常处理方法及装置 | |
US8112518B2 (en) | Redundant systems management frameworks for network environments | |
WO2015104841A1 (ja) | 多重系システムおよび多重系システム管理方法 | |
US7953016B2 (en) | Method and system for telecommunication apparatus fast fault notification | |
US7861112B2 (en) | Storage apparatus and method for controlling the same | |
JP2007299213A (ja) | Raid制御装置および障害監視方法 | |
JP4973205B2 (ja) | 情報処理装置及びログ取得方法並びにプログラム | |
WO2023188232A1 (ja) | ネットワーク監視装置、ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 | |
WO2024119787A1 (zh) | Amd服务器系统安装断电处理方法、装置、设备及介质 | |
JP2001005692A (ja) | 計算機システムおよびその保守管理システム並びに障害通知方法 | |
KR20150116020A (ko) | 무선 네트워크를 이용한 컴퓨터 진단 및 복구 장치와 그 방법 | |
WO2015194651A1 (ja) | 障害通知装置、障害通知方法及びプログラム | |
CN115599617A (zh) | 总线检测方法、装置、服务器及电子设备 | |
WO2023188231A1 (ja) | ネットワーク監視システム、ネットワーク監視方法、及び記録媒体 | |
JP2008040750A (ja) | 遠隔監視制御装置及びシステム | |
TWI494754B (zh) | 伺服器監控裝置和其操作方法 | |
JP5268820B2 (ja) | 監視装置用プログラムの書き換え方法 | |
JP4194602B2 (ja) | 無停電電源装置、コンピュータシステム、および無停電電源装置によるコンピュータの起動段階監視方法 | |
CN113722185B (zh) | 一种国产化计算机远程管理系统 | |
CN112084074B (zh) | 远程连线控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 22935377 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2024510995 Country of ref document: JP Kind code of ref document: A |