JP2014007666A - Correspondence specification device, correspondence specification method and correspondence specification program - Google Patents
Correspondence specification device, correspondence specification method and correspondence specification program Download PDFInfo
- Publication number
- JP2014007666A JP2014007666A JP2012143443A JP2012143443A JP2014007666A JP 2014007666 A JP2014007666 A JP 2014007666A JP 2012143443 A JP2012143443 A JP 2012143443A JP 2012143443 A JP2012143443 A JP 2012143443A JP 2014007666 A JP2014007666 A JP 2014007666A
- Authority
- JP
- Japan
- Prior art keywords
- information
- difference
- contract
- storage unit
- connection state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
この発明は、複数の機器が接続されたネットワークシステムで障害が検出された場合の対応方法を特定する技術に関する。 The present invention relates to a technique for specifying a response method when a failure is detected in a network system in which a plurality of devices are connected.
サーバ、ルータ、スイッチ等の複数の機器が接続されたネットワークシステムにおける障害の発生を監視する監視システムがある。この監視システムでは、各機器に対してPING(Packet INternet Groper)コマンドを実行することや、SNMP(Simple Network Management Protocol)の情報を収集することにより、各機器が稼動していることの確認を行う。そして、稼働していることが確認できなかった機器には、障害が発生しているとし、その機器に障害が発生したことをシステム管理者等へ通知する。
しかし、多くの機器が接続された大規模なネットワークシステムでは、ある機器が稼働していないことが原因となり、他の機器が稼働していることを確認できない場合もある。この場合、実際には障害の発生していない機器までも障害が発生しているとされてしまう。その結果、1つの機器が稼働していないことが原因となり、多数の機器に障害が発生していると通知されてしまう。
There is a monitoring system that monitors the occurrence of a failure in a network system in which a plurality of devices such as servers, routers, and switches are connected. In this monitoring system, a PING (Packet Internet Grouper) command is executed for each device, and SNMP (Simple Network Management Protocol) information is collected to confirm that each device is operating. . Then, it is assumed that a failure has occurred in the device that could not be confirmed to be operating, and the system administrator or the like is notified that the failure has occurred in the device.
However, in a large-scale network system in which many devices are connected, a certain device may not be operating, and it may not be possible to confirm that another device is operating. In this case, it is assumed that a failure has occurred even in a device that has not actually failed. As a result, a single device is not in operation, and a number of devices are notified that a failure has occurred.
特許文献1には、各機器の稼働状態の組合せ毎に、障害の発生している機器を定めたパターンを用意しておき、稼働が確認できない機器がある場合に、用意したパターンに基づき障害が発生している機器を特定することについての記載がある。
In
特許文献1では、各機器の稼働状態の組合せ毎に、障害が発生している機器を定めたパターンを予め用意しておく必要がある。大規模なネットワークシステムの場合、網目状に接続された機器の全ての組合せに対して、障害が発生している機器を洗い出して設定するのは困難である。また、ネットワークシステムには、機器が増設されたり、交換されたりする場合もあり、ネットワークシステムの構成は随時変更される。ネットワークシステムの構成が変更される度に、パターンを更新するのも困難である。
この発明は、システムの管理者に負担をかけることなく、障害発生時に適切な対応をとることを目的とする。
In
An object of the present invention is to take an appropriate response when a failure occurs without imposing a burden on a system administrator.
この発明に係る対応特定装置は、
複数の機器が接続されたネットワークシステムで障害が検出された場合の対応方法を特定する対応特定装置であり、
前記ネットワークシステムの障害が発生していない正常時における機器間の接続状態を示す接続情報を記憶する接続情報記憶部と、
障害が検出された場合に、隣接する機器間の接続状態を確認する確認部と、
前記接続情報記憶部が記憶した接続情報が示す接続状態と、前記確認部が確認した接続状態との差異を示す差異情報を生成する差異情報生成部と、
監視契約毎に、監視対象の機器を記憶する契約記憶部と、
監視契約を特定する特定情報と、対応方法との複数の組を記憶する対応方法記憶部と、
前記対応方法記憶部が記憶した各組について、その組の特定情報が特定する監視契約に対して前記契約記憶部が記憶した監視対象の機器の接続状態に、前記差異情報生成部が生成した差異情報が示す差異があるか否かを判定する判定部と、
差異があると前記判定部が判定した組の対応方法を、検出された障害に対する対応方法として特定する特定部と
を備えることを特徴とする。
The correspondence specifying device according to the present invention is:
A response identification device that identifies a response method when a failure is detected in a network system in which multiple devices are connected.
A connection information storage unit for storing connection information indicating a connection state between devices in a normal state in which a failure of the network system has not occurred;
A confirmation unit for confirming the connection state between adjacent devices when a failure is detected;
A difference information generation unit that generates difference information indicating a difference between a connection state indicated by the connection information stored in the connection information storage unit and a connection state confirmed by the confirmation unit;
For each monitoring contract, a contract storage unit that stores the device to be monitored,
A corresponding method storage unit for storing a plurality of sets of specific information for specifying a monitoring contract and a corresponding method;
For each pair stored by the handling method storage unit, the difference information generation unit generates a difference generated by the monitoring target device stored in the contract storage unit with respect to the monitoring contract specified by the pair specific information. A determination unit for determining whether there is a difference indicated by the information;
And a identifying unit that identifies a pair of handling methods determined by the judging unit as having a difference as a handling method for the detected failure.
この発明に係る対応特定装置によれば、接続情報記憶部が記憶した正常時の接続状態と、確認部が確認した障害発生時の接続状態と、契約記憶部が記憶した監視契約とから、適切な対応方法を特定することができる。
例えば、ネットワーク構成が変わった場合や、監視契約が変わった場合には、変更された内容を接続情報記憶部や契約記憶部に記憶するだけで、引き続き適切な対応方法を特定することが可能である。
According to the correspondence specifying apparatus according to the present invention, the connection information storage unit stored in the normal state, the connection state at the time of failure confirmed by the confirmation unit, and the monitoring contract stored in the contract storage unit are appropriately selected. Can be identified.
For example, when the network configuration changes or the monitoring contract changes, it is possible to continue to specify an appropriate response method simply by storing the changed contents in the connection information storage unit or contract storage unit. is there.
実施の形態1.
実施の形態1では、複数の機器が接続されたネットワークシステム20で障害が検出された場合の対応方法を特定する対応特定装置10について説明する。
In the first embodiment, a
図1は、実施の形態1に係る対応特定装置10の構成図である。
対応特定装置10は、機器情報記憶部11、接続情報記憶部12、契約記憶部13、対応方法記憶部14、確認部15、差異情報生成部16、判定部17、特定部18を備える。
機器情報記憶部11は、ネットワークシステム20に接続された機器についての情報を記憶した記憶装置である。接続情報記憶部12は、ネットワークシステム20に接続された機器間の(正常時の)接続関係を示す接続情報を記憶した記憶装置である。契約記憶部13は、監視契約毎に、監視対象の機器を示す契約情報を記憶した記憶装置である。対応方法記憶部14は、監視契約の識別情報である契約ID(特定情報)と、対応方法との複数の組を記憶した記憶装置である。
確認部15は、ネットワークシステム20に接続された機器のうち、監視対象の機器と隣接する機器とについて機器間の接続状態を確認する。差異情報生成部16は、接続情報記憶部12が記憶した接続情報が示す接続状態と、確認部15が確認した接続状態との差異を示す差異情報を生成する。判定部17は、対応方法記憶部14が記憶した各組について、その組の特定情報が特定する監視契約に対して契約記憶部13が記憶した監視対象の機器の接続状態に、差異情報生成部16が生成した差異情報が示す差異があるか否かを判定する。特定部18は、差異があると判定部17が判定した組の対応方法を、検出された障害に対する対応方法として特定する。
FIG. 1 is a configuration diagram of a
The
The device
The
図2は、実施の形態1に係るネットワークシステム20の構成図である。
ネットワークシステム20は、プローブ21、IaaS機器22、監視装置23、顧客機器A24、顧客機器A25、顧客機器B26、顧客機器B27、顧客機器B28、顧客機器N29、顧客機器N30、顧客機器N31、顧客機器N32を備える。
FIG. 2 is a configuration diagram of the
プローブ21、IaaS機器22、監視装置23は、システム運用会社の自社機器である。プローブ21は、ネットワークシステム20に接続された各機器から、PINGやSNMPにより情報を収集するサーバである。IaaS機器22は、仮想環境により、複数の顧客へサービスを提供するサーバである。監視装置23は、プローブ21が収集した情報や、顧客機器A24等から直接収集した情報に基づき、アラームを発生させるサーバである。監視装置23は、例えば、監視対象の機器の稼働が確認できない場合、CPUの使用率が閾値を超えた場合、CPUの温度が閾値を超えた場合等にアラームを発生させる。
顧客機器A24、顧客機器A25は、顧客Aの機器であり、例えば顧客機器A24がルータ、顧客機器A25がスイッチである。
顧客機器B26、顧客機器B27、顧客機器B28は、顧客Bの機器であり、例えば顧客機器B26、顧客機器B27がルータ、顧客機器B28がスイッチである。
顧客機器N29、顧客機器N30、顧客機器N31、顧客機器N32は、顧客A、B以外の顧客の機器である。
The probe 21, the IaaS
Customer device A24 and customer device A25 are devices of customer A, for example, customer device A24 is a router, and customer device A25 is a switch.
Customer device B26, customer device B27, and customer device B28 are devices of customer B, for example, customer device B26 and customer device B27 are routers, and customer device B28 is a switch.
The customer device N29, the customer device N30, the customer device N31, and the customer device N32 are customer devices other than the customers A and B.
ここでは、自社機器が自社の監視範囲であり、顧客Aの機器とIaaS機器22とが顧客Aの監視範囲であり、顧客Bの機器とIaaS機器22とが顧客Bの監視範囲であるとする。
この場合、障害情報の取得範囲には、監視範囲に含まれる機器と、監視範囲に含まれる機器に隣接した機器とが含まれる。つまり、ここでは、障害情報の取得範囲には、監視範囲に含まれる機器(プローブ21、IaaS機器22、監視装置23、顧客機器A24、顧客機器A25、顧客機器B26、顧客機器B27、顧客機器B28)と、顧客機器A25に隣接した顧客機器N29と、顧客機器B28に隣接した顧客機器N31とが含まれる。
Here, it is assumed that the company's device is its own monitoring range, the customer A's device and the
In this case, the failure information acquisition range includes devices included in the monitoring range and devices adjacent to the devices included in the monitoring range. That is, here, the failure information acquisition range includes devices included in the monitoring range (probe 21,
図3は、実施の形態1に係る機器情報記憶部11が記憶する機器情報を示す図である。
機器情報には、機器の識別情報である機器ID、機器の名称である機器名、機器の種別を示す機器タイプ、機器の監視レベルを示すレベル等が含まれる。
FIG. 3 is a diagram illustrating device information stored in the device
The device information includes a device ID that is device identification information, a device name that is the name of the device, a device type that indicates the type of device, a level that indicates the monitoring level of the device, and the like.
図4は、実施の形態1に係る接続情報記憶部12が記憶する接続情報を示す図である。
接続情報には、機器間の接続の識別情報である接続ID、一方の機器の機器IDが格納されるEnd1、他方の機器の機器IDが格納されるEnd2等が含まれる。
FIG. 4 is a diagram illustrating connection information stored in the connection
The connection information includes a connection ID that is identification information for connection between devices, End1 in which the device ID of one device is stored, End2 in which the device ID of the other device is stored, and the like.
図5は、実施の形態1に係る契約記憶部13が記憶する契約情報を示す図である。
契約情報には、監視契約の識別情報である契約ID、監視契約の契約相手の名称である顧客名、契約の種別を示す契約タイプ、監視対象機器の機器IDが格納される監視対象、契約相手への連絡方法が含まれる。
FIG. 5 is a diagram showing contract information stored in the
The contract information includes the contract ID that is identification information of the monitoring contract, the customer name that is the name of the contract partner of the monitoring contract, the contract type that indicates the type of the contract, the monitoring target that stores the device ID of the monitored device, the contract partner How to contact is included.
図6は、実施の形態1に係る対応方法記憶部14が記憶する組を示す図である。
各組には、組の識別情報である組ID、契約ID、連絡先が含まれる。ここでは、障害発生時の対応方法として、顧客への連絡としている。
FIG. 6 is a diagram illustrating pairs stored in the handling
Each group includes a group ID, a contract ID, and a contact address, which are group identification information. Here, as a response method when a failure occurs, the customer is contacted.
図7は、実施の形態1に係る対応特定装置10の動作を示すフローチャートである。
対応特定装置10は、監視装置23がアラームを発生させた場合に動作を開始する。
(S1:確認ステップ)
確認部15は、プローブ21が収集した情報や、監視装置23が収集した情報に基づき、監視対象の機器と隣接する機器とについて機器間の接続状態を確認する。確認部15は、他の情報や、他の方法により接続状態を確認してもよい。
FIG. 7 is a flowchart showing the operation of the
The
(S1: Confirmation step)
The
(S2:差異情報生成ステップ)
差異情報生成部16は、接続情報記憶部12が記憶した接続情報が示す接続状態と、確認部15が確認した接続状態との差異を示す差異情報を生成する。
具体的には、まず、差異情報生成部16は、1が接続有を示し、0が接続無を示すとして、各機器間の接続状態を表した隣接行列(ビット情報)により、接続情報が示す接続状態と、確認部15が確認した接続状態とを表す。そして、接続情報が示す接続状態を表す隣接行列(正常時の隣接行列)と、確認部15が確認した接続状態を表す隣接行列(障害発生時の隣接行列)との排他的論理和を計算して、得られた行列を差異情報とする。
(S2: Difference information generation step)
The difference
Specifically, first, the difference
図8は、正常時の隣接行列の例を示す図である。
隣接行列において、Pはプローブ21、IはIaaS機器22、Mは監視装置23、A1は顧客機器A24、A2は顧客機器A25、B1は顧客機器B26、B2は顧客機器B27、B3は顧客機器B28、N1は顧客機器N29、N3は顧客機器N31を示す。
隣接行列は、障害情報の取得範囲に含まれる機器を、行、列に割り当てて、交差する要素の値により、接続状態を表す。例えば、プローブ21(P)と、IaaS機器22(I)とは接続されているので、P行I列の要素の値は“1”になる。同様に、I行P列の要素の値も“1”になる。また、プローブ21(P)と、顧客機器A24(A1)とは接続されていないので、P行A1列の要素の値は“0”になる。同様に、A1行P列の要素の値も“0”になる。
FIG. 8 is a diagram illustrating an example of an adjacency matrix in a normal state.
In the adjacency matrix, P is the probe 21, I is the
The adjacency matrix assigns devices included in the failure information acquisition range to rows and columns, and represents the connection state by the values of intersecting elements. For example, since the probe 21 (P) and the IaaS device 22 (I) are connected, the value of the element in the P row and the I column is “1”. Similarly, the value of the element in the I row and the P column is also “1”. In addition, since the probe 21 (P) and the customer device A24 (A1) are not connected, the value of the element in the P row A1 column is “0”. Similarly, the value of the element in the A1 row and P column is also “0”.
図9は、障害発生時の隣接行列の例を示す図である。
図9では、顧客機器A24(A1)に障害が発生した場合の隣接行列を示す。
顧客機器A24に障害が発生しているため、顧客機器A24と隣接する機器との間の接続がされていない状態になる。そのため、隣接行列のうち、網掛部分の要素の値が“0”になる。
FIG. 9 is a diagram illustrating an example of an adjacency matrix when a failure occurs.
FIG. 9 shows an adjacency matrix when a failure occurs in the customer device A24 (A1).
Since a failure has occurred in the customer device A24, the customer device A24 is not connected to the adjacent device. Therefore, the value of the element in the shaded part of the adjacency matrix is “0”.
図10は、差異情報の例を示す図である。
図8に示す正常時の隣接行列と、図9に示す障害発生時の隣接行列との排他的論理和を計算する。すると、正常時の隣接行列と障害発生時の隣接行列とで値の異なる要素、つまり、正常時には接続があるが障害発生時には接続がない要素(網掛部分)の値だけが“1”になる。
FIG. 10 is a diagram illustrating an example of difference information.
The exclusive OR of the normal adjacency matrix shown in FIG. 8 and the fault adjacency matrix shown in FIG. 9 is calculated. Then, only the value of an element having a different value between the adjacency matrix at the time of normality and the adjacency matrix at the time of the failure, that is, the value of an element that is connected when normal (but is not connected when a failure occurs) (shaded portion) is “1”.
(S3:フィルター生成ステップ)
判定部17は、対応方法記憶部14から1つの組を読み出し、読み出した組の情報に基づき、差異情報から一部の値を抽出するフィルターを生成する。
具体的には、まず、判定部17は、対応方法記憶部14から1つの組を読み出し、契約記憶部13が記憶した契約情報に基づき、読み出した組の契約IDが示す監視契約において監視対象となっている機器を特定する。そして、判定部17は、特定した機器間のみが接続されたことを示す隣接行列をフィルターとして生成する。
(S3: Filter generation step)
The
Specifically, first, the
図11は、フィルターの例を示す図である。
図11では、契約ID“001”の組が読み出された場合のフィルターを示す。
図5に示すように、契約ID“001”は、顧客Aに関する契約であり、監視対象となっているのは、IaaS機器22(I)、顧客機器A24(A1)、顧客機器A25(A2)である。そのため、IaaS機器22、顧客機器A24、顧客機器A25間のみが接続されたことを示す隣接行列がフィルターとして生成される。
FIG. 11 is a diagram illustrating an example of a filter.
FIG. 11 shows a filter when a set of contract ID “001” is read.
As shown in FIG. 5, the contract ID “001” is a contract related to the customer A, and the monitoring targets are the IaaS device 22 (I), the customer device A24 (A1), and the customer device A25 (A2). It is. Therefore, an adjacency matrix indicating that only the
図12は、監視対象となっている機器を特定するSQLの例を示す図である。
判定部17は、図12に示すSQLを用いて、監視対象となっている機器を特定することができる。
図12に示すSQLにおける契約IDの値に、読み出された組の契約IDを代入することにより、監視対象の機器の機器IDを特定することができる。つまり、契約ID“001”を代入すれば、IaaS機器22、顧客機器A24、顧客機器A25の機器IDを特定できる。
FIG. 12 is a diagram illustrating an example of SQL that identifies a device to be monitored.
The
By substituting the read set of contract IDs into the contract ID value in the SQL shown in FIG. 12, the device ID of the device to be monitored can be specified. That is, by substituting the contract ID “001”, the device IDs of the
(S4:差異判定ステップ)
判定部17は、S3で生成したフィルターで差異情報から情報を抽出し、抽出した情報に基づき、監視対象の機器の接続状態に差異があったか否か判定する。
具体的には、判定部17は、差異情報とフィルターとの論理積を計算して、得られた行列の要素の値に“1”が含まれているか否かを判定する。判定部17は、“1”が含まれていると判定した場合に、監視対象の機器の接続状態に差異があったと判定する。
(S4: Difference determination step)
The
Specifically, the
図13は、フィルターで差異情報から抽出した情報の例を示す図である。
図13では、図11に示すフィルターで、図10に示す差異情報から抽出した情報を示す。
図13に示すように、図11に示すフィルターを用いた場合、行列の要素の値に“1”が含まれている。したがって、図11に示すフィルターの元となっている契約ID“001”の監視対象の機器の接続状態に差異があると判定される。
FIG. 13 is a diagram illustrating an example of information extracted from difference information by a filter.
13 shows information extracted from the difference information shown in FIG. 10 by the filter shown in FIG.
As shown in FIG. 13, when the filter shown in FIG. 11 is used, “1” is included in the value of the matrix element. Therefore, it is determined that there is a difference in the connection state of the monitoring target devices with the contract ID “001” that is the source of the filter illustrated in FIG.
(S5:特定ステップ)
特定部18は、S4で差異があると判定された場合、S3で読み出した組の対応方法を、検出された障害に対する対応方法として特定する。
契約ID“001”の組については、S4で差異があると判定された。そのため、特定部18は、契約ID“001”の組の対応方法である「顧客Aへ連絡」を、検出された障害に対する対応方法として特定する。
なお、特定部18は、特定した対応方法を表示装置に表示して、対応特定装置10の管理者等に対応させてもよいし、特定した対応方法を、対応を実行する装置へ送信してもよいし、特定した対応方法で自ら対応を実行してもよい。
(S5: specific step)
When it is determined that there is a difference in S4, the specifying
Regarding the set of contract ID “001”, it was determined in S4 that there is a difference. Therefore, the identifying
The specifying
(S6:終了判定ステップ)
判定部17は、S3で全ての組を対応方法記憶部14から読み出したか否かを判定する。
判定部17は、全ての組を読み出した場合(S6で済)、処理を終了し、読み出していない組が残っている場合(S6で未)、処理をS3へ戻して、次の組についての処理を行う。
(S6: End determination step)
The
The
図5の場合であれば、契約ID“001”の他に、契約ID“002”等がある。そのため、契約ID“002”以降の組についても順次処理が実行される。その結果、S5で特定される対応方法が複数になる場合もある。 In the case of FIG. 5, there is a contract ID “002” in addition to the contract ID “001”. For this reason, the processing is sequentially executed for the sets after the contract ID “002”. As a result, there may be a plurality of handling methods specified in S5.
実施の形態1に係る対応特定装置10では、接続情報記憶部12が記憶した正常時の接続状態と、確認部15が確認した障害発生時の接続状態と、契約記憶部13が記憶した監視契約とから、適切な対応方法を特定することができる。
例えば、ネットワーク構成が変わった場合や、監視契約が変わった場合には、変更された内容を接続情報記憶部12や契約記憶部13に記憶するだけで、引き続き適切な対応方法を特定することが可能である。接続情報記憶部12や契約記憶部13に記憶される情報は、ネットワークシステムでは一般に管理される情報である。そのため、変更された内容を接続情報記憶部12や契約記憶部13に記憶することにより、新たな負荷が対応特定装置10の管理者にかかることもない。
In the
For example, when the network configuration changes or the monitoring contract changes, it is possible to continue to specify an appropriate response method simply by storing the changed contents in the connection
実施の形態2.
実施の形態1では、差異情報から監視契約に基づいて情報を抽出して、適切な対応方法を特定した。実施の形態2では、差異情報から監視契約と他の条件とに基づいて情報を抽出して、適切な対応方法を特定することについて説明する。
実施の形態2では、実施の形態1と異なる部分を説明する。
In the first embodiment, information is extracted from the difference information based on the monitoring contract, and an appropriate handling method is specified. In the second embodiment, description will be given of extracting information from the difference information based on the monitoring contract and other conditions and specifying an appropriate response method.
In the second embodiment, parts different from the first embodiment will be described.
図14は、実施の形態2に係る対応方法記憶部14が記憶する組を示す図である。
各組には、契約ID、連絡先に加え、条件が含まれる。条件としては、ここでは、機器の監視レベルが設定されている。
FIG. 14 is a diagram illustrating pairs stored in the handling
Each set includes conditions in addition to the contract ID and contact information. Here, the monitoring level of the device is set as the condition.
実施の形態2に係る対応特定装置10の動作について説明する。
実施の形態2に係る対応特定装置10の動作は、実施の形態1に係る対応特定装置10の動作とS3の処理が異なる。
S3では、まず、判定部17は、対応方法記憶部14から1つの組を読み出し、契約記憶部13が記憶した契約情報に基づき、読み出した組の特定情報が特定する監視契約において監視対象となっている機器を特定する。さらに、判定部17は、監視対象となっている機器のうち、読み出した組で指定された条件を満たす機器を特定する。つまり、監視対象となっている機器のうち、読み出した組で指定された監視レベルの機器を特定する。そして、判定部17は、特定した機器間のみが接続されたことを示す隣接行列をフィルターとして生成する。
Operation | movement of the corresponding |
The operation of the
In S3, first, the
図15は、フィルターの例を示す図である。
図15では、契約ID“001”の組が読み出された場合のフィルターを示す。
図5に示すように、契約ID“001”は、顧客Aに関する契約であり、監視対象となっているのは、IaaS機器22、顧客機器A24、顧客機器A25である。契約ID“001”の組では、条件として監視レベル高が指定されている。そのため、図3に示す監視レベルを参照して、監視対象となっているIaaS機器22、顧客機器A24、顧客機器A25のうち、監視レベル高のIaaS機器22、顧客機器A24が条件を満たす機器として特定される。
そのため、IaaS機器22、顧客機器A24間のみが接続されたことを示す隣接行列がフィルターとして生成される。
FIG. 15 is a diagram illustrating an example of a filter.
FIG. 15 shows a filter when a set of contract ID “001” is read.
As shown in FIG. 5, the contract ID “001” is a contract related to the customer A, and the monitoring target is the
Therefore, an adjacency matrix indicating that only the connection between the
図16は、対象となる機器を特定するSQLの例を示す図である。
図16に示すSQLにおける契約IDの値に、読み出された組の契約IDを代入し、監視レベルの値に、読み出された組の監視レベルを代入することにより、対象の機器の機器IDを特定することができる。
つまり、契約ID“001”を代入し、監視レベル“高”すれば、IaaS機器22、顧客機器A24の機器IDを特定できる。
FIG. 16 is a diagram illustrating an example of SQL that identifies a target device.
By substituting the read contract ID of the set into the contract ID value in SQL shown in FIG. 16, and substituting the read monitoring level of the set into the monitoring level value, the device ID of the target device. Can be specified.
That is, if the contract ID “001” is substituted and the monitoring level is “high”, the device IDs of the
以上のように、実施の形態2に係る対応特定装置10では、差異情報から監視契約と他の条件とに基づいて情報を抽出して、適切な対応方法を特定することができる。そのため、実施の形態1と同様に、対応特定装置10の管理者に負荷をかけることなく、実施の形態1よりも細かく対応方法を指定することができる。
As described above, the
なお、上記説明では、監視対象の機器であって、条件を満たす機器についての情報を差異情報から抽出するフィルターを生成した。しかし、監視対象の機器についての情報を差異情報から抽出するフィルターと、条件を満たす機器についての情報を差異情報から抽出するフィルターとの2つのフィルターを別々に生成してもよい。この場合、S4にて、差異情報と一方のフィルターとの論理積を計算して行列を生成した後、生成した行列と他方のフィルターとの論理積を計算すればよい。 In the above description, a filter is generated that extracts information about a device to be monitored that satisfies a condition from difference information. However, two filters may be generated separately: a filter that extracts information about devices to be monitored from difference information, and a filter that extracts information about devices that satisfy a condition from difference information. In this case, in S4, after calculating the logical product of the difference information and one of the filters to generate a matrix, the logical product of the generated matrix and the other filter may be calculated.
また、上記説明では、条件として監視レベルが設定されていた。しかし、条件は、これに限らず、機器のタイプ等、他の情報により指定されていてもよい。 In the above description, the monitoring level is set as a condition. However, the condition is not limited to this, and may be specified by other information such as a device type.
また、上記説明では、監視契約は顧客毎にされていた。しかし、監視契約は、これに限らず、顧客の担当者毎等、他の単位でされていてもよい。例えば、監視契約が顧客の担当者毎にされている場合、監視契約で監視対象となっている機器で障害が発生した場合、その監視契約の担当者へ連絡するように設定することができる。 In the above description, the monitoring contract is made for each customer. However, the monitoring contract is not limited to this, and may be made in other units such as for each person in charge of the customer. For example, when a monitoring contract is made for each person in charge of a customer, when a failure occurs in a device to be monitored in the monitoring contract, it can be set to contact the person in charge of the monitoring contract.
図17は、対応特定装置10のハードウェア構成の一例を示す図である。
図17に示すように、対応特定装置10は、プログラムを実行するCPU911(Central・Processing・Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。CPU911は、バス912を介してROM913、RAM914、LCD901(Liquid Crystal Display)、キーボード902(K/B)、通信ボード915、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。磁気ディスク装置920(固定ディスク装置)の代わりに、光ディスク装置、メモリカード読み書き装置などの記憶装置でもよい。磁気ディスク装置920は、所定の固定ディスクインタフェースを介して接続される。
FIG. 17 is a diagram illustrating an example of a hardware configuration of the
As shown in FIG. 17, the
磁気ディスク装置920又はROM913などには、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。プログラム群923のプログラムは、CPU911、オペレーティングシステム921、ウィンドウシステム922により実行される。
An operating system 921 (OS), a
プログラム群923には、上記の説明において「確認部15」、「差異情報生成部16」、「判定部17」、「特定部18」等として説明した機能を実行するソフトウェアやプログラムやその他のプログラムが記憶されている。プログラムは、CPU911により読み出され実行される。
ファイル群924には、上記の説明において「機器情報記憶部11」、「接続情報記憶部12」、「契約記憶部13」、「対応方法記憶部14」に格納される情報やデータや信号値や変数値やパラメータが、データベースの各項目として記憶される。データベースは、ディスクやメモリなどの記録媒体に記憶される。ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出され、抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示などのCPU911の動作に用いられる。抽出・検索・参照・比較・演算・計算・処理・出力・印刷・表示のCPU911の動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリやキャッシュメモリやバッファメモリに一時的に記憶される。
The
The
また、上記の説明におけるフローチャートの矢印の部分は主としてデータや信号の入出力を示し、データや信号値は、RAM914のメモリ、その他光ディスク等の記録媒体やICチップに記録される。また、データや信号は、バス912や信号線やケーブルその他の伝送媒体や電波によりオンライン伝送される。
また、上記の説明において「〜部」として説明するものは、「〜回路」、「〜装置」、「〜機器」、「〜手段」、「〜機能」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。また、「〜装置」として説明するものは、「〜回路」、「〜機器」、「〜手段」、「〜機能」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。すなわち、「〜部」として説明するものは、ROM913に記憶されたファームウェアで実現されていても構わない。或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組合せ、さらには、ファームウェアとの組合せで実施されても構わない。ファームウェアとソフトウェアは、プログラムとして、ROM913等の記録媒体に記憶される。プログラムはCPU911により読み出され、CPU911により実行される。すなわち、プログラムは、上記で述べた「〜部」としてコンピュータ等を機能させるものである。あるいは、上記で述べた「〜部」の手順や方法をコンピュータ等に実行させるものである。
In the above description, the arrows in the flowchart mainly indicate input / output of data and signals, and the data and signal values are recorded in a memory of the
In addition, what is described as “to part” in the above description may be “to circuit”, “to device”, “to device”, “to means”, and “to function”. It may be “step”, “˜procedure”, “˜processing”. In addition, what is described as “˜device” may be “˜circuit”, “˜device”, “˜means”, “˜function”, and “˜step”, “˜procedure”, “ ~ Process ". That is, what is described as “˜unit” may be realized by firmware stored in the
10 対応特定装置、11 機器情報記憶部、12 接続情報記憶部、13 契約記憶部、14 対応方法記憶部、15 確認部、16 差異情報生成部、17 判定部、18 特定部、20 ネットワークシステム、21 プローブ、22 IaaS機器、23 監視装置、24,25 顧客機器A、26,27,28 顧客機器B、29,30,31,32 顧客機器N。
DESCRIPTION OF
Claims (6)
前記ネットワークシステムの障害が発生していない正常時における機器間の接続状態を示す接続情報を記憶する接続情報記憶部と、
障害が検出された場合に、隣接する機器間の接続状態を確認する確認部と、
前記接続情報記憶部が記憶した接続情報が示す接続状態と、前記確認部が確認した接続状態との差異を示す差異情報を生成する差異情報生成部と、
監視契約毎に、監視対象の機器を記憶する契約記憶部と、
監視契約を特定する特定情報と、対応方法との複数の組を記憶する対応方法記憶部と、
前記対応方法記憶部が記憶した各組について、その組の特定情報が特定する監視契約に対して前記契約記憶部が記憶した監視対象の機器の接続状態に、前記差異情報生成部が生成した差異情報が示す差異があるか否かを判定する判定部と、
差異があると前記判定部が判定した組の対応方法を、検出された障害に対する対応方法として特定する特定部と
を備えることを特徴とする対応特定装置。 A response identification device that identifies a response method when a failure is detected in a network system in which multiple devices are connected.
A connection information storage unit for storing connection information indicating a connection state between devices in a normal state in which a failure of the network system has not occurred;
A confirmation unit for confirming the connection state between adjacent devices when a failure is detected;
A difference information generation unit that generates difference information indicating a difference between a connection state indicated by the connection information stored in the connection information storage unit and a connection state confirmed by the confirmation unit;
For each monitoring contract, a contract storage unit that stores the device to be monitored,
A corresponding method storage unit for storing a plurality of sets of specific information for specifying a monitoring contract and a corresponding method;
For each pair stored by the handling method storage unit, the difference information generation unit generates a difference generated by the monitoring target device stored in the contract storage unit with respect to the monitoring contract specified by the pair specific information. A determination unit for determining whether there is a difference indicated by the information;
A correspondence identifying apparatus comprising: a identifying unit that identifies a pair of handling methods determined by the determining unit as having a difference as a handling method for a detected failure.
前記判定部は、前記監視対象の機器についてのビットのみを抽出するフィルターを生成し、生成したフィルターで抽出されたビットに1が含まれる場合に、前記監視対象の機器の接続状態に差異があったと判定する
ことを特徴とする請求項1に記載の対応特定装置。 The difference information generation unit uses the bit information in which values are arranged in a predetermined order from a connection state between predetermined devices, assuming that one of values 0 and 1 indicates connection and the other indicates no connection. Each of the connection state indicated by the information and the connection state confirmed by the confirmation unit is indicated, and the bit information regarding the connection state indicated by the connection information and the bit information regarding the connection state confirmed by the confirmation unit are exclusive. Calculating a logical sum and generating the obtained bit information as the difference information;
The determination unit generates a filter that extracts only the bits for the monitored device, and when the extracted bits include 1 in the connection state of the monitored device, there is a difference. The correspondence identifying device according to claim 1, wherein the correspondence identifying device is determined.
ことを特徴とする請求項2に記載の対応特定装置。 The determination unit generates bit information which is bit information in which values are arranged in the predetermined order, and sets only the bit regarding the connection state of the monitored device as 1, and generates the difference information and the difference information. 3. The response according to claim 2, wherein a logical product with the filter is calculated and it is determined that there is a difference in the connection state of the monitored device when 1 is included in the obtained bit information. Specific device.
前記判定部は、前記条件が記憶された組については、その組の特定情報が特定する監視契約に対して前記契約記憶部が記憶した監視対象の機器を、その組の条件で絞り込んで、絞り込んだ機器の接続状態に、前記差異情報が差異を示すか否かを判定する
ことを特徴とする請求項1に記載の対応特定装置。 The handling method storage unit further stores conditions for narrowing down the devices for at least some of the sets,
For the group in which the condition is stored, the determination unit narrows down the devices to be monitored stored by the contract storage unit with respect to the monitoring contract specified by the specific information of the group, by the group condition. The correspondence identifying apparatus according to claim 1, wherein it is determined whether or not the difference information indicates a difference in a connection state of a device.
処理装置が、障害が検出された場合に、隣接する機器間の接続状態を確認する確認工程と、
処理装置が、前記接続情報記憶部に記憶した接続情報が示す接続状態と、前記確認工程で確認した接続状態との差異を示す差異情報を生成する差異情報生成工程と、
処理装置が、前記対応方法記憶部に記憶した各組について、その組の特定情報が特定する監視契約に対して前記契約記憶部に記憶した監視対象の機器の接続状態に、前記差異情報生成工程で生成した差異情報が示す差異があるか否かを判定する判定工程と、
処理装置が、差異があると前記判定工程で判定した組の対応方法を、検出された障害に対する対応方法として特定する特定工程と
を備えることを特徴とする対応特定方法。 A response specifying method for specifying a response method when a failure is detected in a network system to which a plurality of devices are connected, and indicating a connection state between devices in a normal state in which no failure of the network system has occurred A connection information storage unit that stores information; a contract storage unit that stores a device to be monitored for each monitoring contract; a correspondence method storage unit that stores a plurality of sets of specific information and a corresponding method for specifying a monitoring contract; Is a response identification method using
When the processing device detects a failure, a confirmation process for confirming a connection state between adjacent devices;
A difference information generating step for generating difference information indicating a difference between the connection state indicated by the connection information stored in the connection information storage unit and the connection state confirmed in the confirmation step;
For each set stored in the handling method storage unit by the processing device, the difference information generating step changes to the connection state of the monitoring target device stored in the contract storage unit with respect to the monitoring contract specified by the specific information of the set. A determination step of determining whether there is a difference indicated by the difference information generated in
A handling specifying method, comprising: a specifying step of specifying, as a handling method for a detected fault, a handling method of a set determined in the determining step when the processing apparatus has a difference.
障害が検出された場合に、隣接する機器間の接続状態を確認する確認処理と、
前記接続情報記憶部に記憶した接続情報が示す接続状態と、前記確認処理で確認した接続状態との差異を示す差異情報を生成する差異情報生成処理と、
前記対応方法記憶部に記憶した各組について、その組の特定情報が特定する監視契約に対して前記契約記憶部に記憶した監視対象の機器の接続状態に、前記差異情報生成処理で生成した差異情報が示す差異があるか否かを判定する判定処理と、
差異があると前記判定処理で判定した組の対応方法を、検出された障害に対する対応方法として特定する特定処理と
をコンピュータに実行させることを特徴とする対応特定プログラム。 A correspondence specifying program for specifying a response method when a failure is detected in a network system to which a plurality of devices are connected, and indicating a connection state between devices in a normal state in which no failure has occurred in the network system A connection information storage unit that stores information; a contract storage unit that stores a device to be monitored for each monitoring contract; a correspondence method storage unit that stores a plurality of sets of specific information and a corresponding method for specifying a monitoring contract; It is a correspondence specific program using
Confirmation process to confirm the connection status between adjacent devices when a failure is detected,
A difference information generation process for generating difference information indicating a difference between the connection state indicated by the connection information stored in the connection information storage unit and the connection state confirmed in the confirmation process;
For each set stored in the handling method storage unit, the difference generated by the difference information generation process in the connection state of the monitoring target device stored in the contract storage unit with respect to the monitoring contract specified by the specific information of the set A determination process for determining whether there is a difference indicated by the information;
A correspondence specifying program that causes a computer to execute a specific process for specifying a correspondence method determined in the determination process as a response method for a detected failure when there is a difference.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012143443A JP2014007666A (en) | 2012-06-26 | 2012-06-26 | Correspondence specification device, correspondence specification method and correspondence specification program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012143443A JP2014007666A (en) | 2012-06-26 | 2012-06-26 | Correspondence specification device, correspondence specification method and correspondence specification program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014007666A true JP2014007666A (en) | 2014-01-16 |
Family
ID=50105015
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012143443A Pending JP2014007666A (en) | 2012-06-26 | 2012-06-26 | Correspondence specification device, correspondence specification method and correspondence specification program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014007666A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016025549A (en) * | 2014-07-23 | 2016-02-08 | 日本電気株式会社 | Network management server, canalization determination method and program |
-
2012
- 2012-06-26 JP JP2012143443A patent/JP2014007666A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016025549A (en) * | 2014-07-23 | 2016-02-08 | 日本電気株式会社 | Network management server, canalization determination method and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8645769B2 (en) | Operation management apparatus, operation management method, and program storage medium | |
JP6373482B2 (en) | Interface for controlling and analyzing computer environments | |
TW202009705A (en) | Method and system for automatically managing a fault event occurring in a datacenter system | |
JP5684946B2 (en) | Method and system for supporting analysis of root cause of event | |
US9619314B2 (en) | Management system and management program | |
JP5432867B2 (en) | Computer system management method and management system | |
CN109189627B (en) | Hard disk fault monitoring and detecting method, device, terminal and storage medium | |
US10204004B1 (en) | Custom host errors definition service | |
US10185614B2 (en) | Generic alarm correlation by means of normalized alarm codes | |
CN106502814B (en) | Method and device for recording error information of PCIE (peripheral component interface express) equipment | |
US20140143768A1 (en) | Monitoring updates on multiple computing platforms | |
JP2019028891A (en) | Information processing device, information processing method and information processing program | |
US20150370619A1 (en) | Management system for managing computer system and management method thereof | |
TW201502771A (en) | System and method for managing mainboard based on baseboard management controller | |
JP5208324B1 (en) | Information system management apparatus, information system management method, and program | |
JP5419819B2 (en) | Computer system management method and management system | |
JP2014007666A (en) | Correspondence specification device, correspondence specification method and correspondence specification program | |
WO2017072904A1 (en) | Computer system and failure detection method | |
JPWO2017169949A1 (en) | Log analysis apparatus, log analysis method, and program | |
JP2017211806A (en) | Communication monitoring method, security management system, and program | |
WO2015019488A1 (en) | Management system and method for analyzing event by management system | |
WO2018138793A1 (en) | Attack/abnormality detection device, attack/abnormality detection method, and attack/abnormality detection program | |
JP2018136882A (en) | Information processing device, information processing system, and method of controlling information processing device | |
JP6972735B2 (en) | Display control program, display control method and display control device | |
CN112306831A (en) | Computing cluster error prediction method and related equipment |