JP5501278B2 - Filtering device, filtering method, filtering program - Google Patents

Filtering device, filtering method, filtering program Download PDF

Info

Publication number
JP5501278B2
JP5501278B2 JP2011073957A JP2011073957A JP5501278B2 JP 5501278 B2 JP5501278 B2 JP 5501278B2 JP 2011073957 A JP2011073957 A JP 2011073957A JP 2011073957 A JP2011073957 A JP 2011073957A JP 5501278 B2 JP5501278 B2 JP 5501278B2
Authority
JP
Japan
Prior art keywords
message
rule
storage unit
correspondence
correspondence result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011073957A
Other languages
Japanese (ja)
Other versions
JP2012208736A (en
Inventor
亮生 葛西
喜隆 桑田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Data Corp
Original Assignee
NTT Data Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Data Corp filed Critical NTT Data Corp
Priority to JP2011073957A priority Critical patent/JP5501278B2/en
Publication of JP2012208736A publication Critical patent/JP2012208736A/en
Application granted granted Critical
Publication of JP5501278B2 publication Critical patent/JP5501278B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、仮想環境における異常を示すメッセージをフィルタリングする技術に関する。   The present invention relates to a technique for filtering a message indicating an abnormality in a virtual environment.

ネットワークを介して情報通信を行うサーバ装置やルータなどのコンピュータ装置を設置し、設置したコンピュータ装置の管理、保守、運用などを行う施設であるデータセンタが利用されている。図13は、このようなデータセンタが備えるコンピュータ装置の例を示す図である。監視対象である複数の監視対象システム110(監視対象システム110−1、監視対象システム110−2、監視対象システム110−3、・・・)のそれぞれに対して、定期的にPingを送信するなどして状態を監視し、異常が発生した場合にその監視対象システム110から異常の内容を示すメッセージを取得する監視システム120(監視システム120−1、監視システム120−2、監視システム120−3、・・・)が接続される。監視システム120が監視対象システム110から取得したメッセージは、フィルタリング装置160によって、予め定められたルールに基づいてフィルタリングされ、通知の必要があると判定されたメッセージのみがメッセージ通知装置130(メッセージ通知装置130−1、メッセージ通知装置130−2、メッセージ通知装置130−3、・・・)に通知され、通知の必要がないと判定されたメッセージは破棄される。メッセージ通知装置130に通知されたメッセージは、メッセージ通知装置130内に記憶され、運用者端末140(運用者端末140−1、運用者端末140−2、運用者端末140−3、・・・)に送信されて表示される。運用者は、運用者端末140に表示されたメッセージを確認し、必要があればメッセージの内容に応じた対応を行う。特許文献1には、このようなメッセージのフィルタリングを行う技術が記載されている。
ところで、ユーザからの要求を受けて、予め用意した物理マシンのコンピュータリソースを仮想化して仮想マシンを起動させ、起動した仮想マシンを、ネットワークを介してユーザに利用させるコンピュータリソースの利用形態が一般的になりつつある。
A data center, which is a facility for installing a computer device such as a server device or a router that performs information communication via a network and managing, maintaining, and operating the installed computer device, is used. FIG. 13 is a diagram illustrating an example of a computer device included in such a data center. Ping is periodically transmitted to each of a plurality of monitoring target systems 110 (monitoring target system 110-1, monitoring target system 110-2, monitoring target system 110-3,...) That are monitoring targets. The monitoring system 120 (monitoring system 120-1, monitoring system 120-2, monitoring system 120-3, monitoring system 120-1, which acquires a message indicating the content of the abnormality from the monitored system 110 when an abnormality occurs) ...) are connected. The message acquired from the monitoring target system 110 by the monitoring system 120 is filtered by the filtering device 160 based on a predetermined rule, and only the message that is determined to be required to be notified is the message notification device 130 (message notification device). 130-1, the message notification device 130-2, the message notification device 130-3,...), And the message determined not to be notified is discarded. The message notified to the message notification device 130 is stored in the message notification device 130 and the operator terminal 140 (operator terminal 140-1, operator terminal 140-2, operator terminal 140-3,...). Sent to and displayed. The operator confirms the message displayed on the operator terminal 140, and takes action according to the content of the message if necessary. Patent Document 1 describes a technique for performing such message filtering.
By the way, in response to a request from a user, a computer resource usage form in which a virtual machine is started by virtualizing a computer resource of a physical machine prepared in advance and the started virtual machine is used by a user via a network is common. It is becoming.

特開2009−64098号公報JP 2009-64098 A

しかしながら、上述のような仮想化機能を有する物理マシンによるデータセンタを運用する場合、物理マシンと、その物理マシンのコンピュータリソースに起動される仮想マシンとの双方を監視する必要があり、監視対象が多様化する。また、監視対象の異常を示すメッセージも多様化、複雑化することが考えられる。ここで、監視対象から送信されるメッセージのうちから対応の必要なメッセージを抽出するフィルタリングのルールは、管理者等によって予め定められるものであるが、このような多様化、複雑化するメッセージのうちから、必要なメッセージを抽出するルールを生成することは手間がかかり、困難である。そこで、このようなデータセンタの監視対象からのメッセージをフィルタリングするルールを、効率良く生成することが望ましい。   However, when operating a data center with a physical machine having a virtualization function as described above, it is necessary to monitor both the physical machine and the virtual machine activated by the computer resource of the physical machine. Diversify. In addition, messages indicating abnormalities to be monitored may be diversified and complicated. Here, filtering rules for extracting messages that need to be dealt with from messages sent from the monitoring target are predetermined by an administrator or the like. Among such diversified and complicated messages, Therefore, it is time-consuming and difficult to generate a rule for extracting a necessary message. Therefore, it is desirable to efficiently generate rules for filtering messages from such data center monitoring targets.

本発明は、このような状況に鑑みてなされたもので、仮想環境における異常を示すメッセージをフィルタリングするルールを効率良く生成するフィルタリング装置、フィルタリング方法、フィルタリングプログラムを提供する。   The present invention has been made in view of such a situation, and provides a filtering device, a filtering method, and a filtering program that efficiently generate a rule for filtering a message indicating an abnormality in a virtual environment.

上述した課題を解決するために、本発明は、自身のコンピュータリソースに仮想マシンを起動させる複数の物理マシンまたは物理マシンに起動された仮想マシンに異常が発生すると、異常が発生した物理マシンまたは仮想マシンから異常の内容を示すメッセージを取得する監視装置に接続されたフィルタリング装置であって、メッセージが定められた内容を示すものであるか否かを判定するルールが記憶されているルール記憶部と、メッセージと、メッセージが示す内容に応じて行われた対応を示す対応結果とが対応付けられて記憶される対応結果記憶部と、監視装置から送信されるメッセージを受信する受信部と、ルール記憶部に記憶されているルールを読み出し、読み出したルールに基づいて、受信部が受信したメッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合にメッセージを出力し、定められた内容を示さないと判定した場合にメッセージを破棄するフィルタリング部と、フィルタリング部が出力したメッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された対応結果をメッセージに対応付けて対応結果記憶部に記憶させる対応結果登録部と、対応結果記憶部から読み出した対応結果に基づいて、ルールを生成してルール記憶部に記憶させるルール生成部と、を備えることを特徴とする。   In order to solve the above-described problems, the present invention provides a physical machine or virtual machine in which an abnormality has occurred when an abnormality occurs in a plurality of physical machines that activate the virtual machine in its own computer resource or a virtual machine that is activated in the physical machine. A rule storage unit that is connected to a monitoring device that acquires a message indicating the content of an abnormality from a machine, and that stores rules for determining whether the message indicates a predetermined content; A correspondence result storage unit that stores a message and a correspondence result indicating a correspondence performed according to the content indicated by the message, a reception unit that receives a message transmitted from the monitoring device, and a rule storage The rules stored in the receiver are read, and the message received by the receiver is determined based on the read rules. A filtering unit that determines whether or not the content is indicated, outputs a message when it is determined that the content is determined, and discards the message when it is determined that the content is not indicated, and filtering A correspondence result registration unit that accepts input of a correspondence result indicating correspondence performed in response to the message output by the unit, stores the inputted correspondence result in association with the message in the correspondence result storage unit, and a correspondence result storage unit A rule generation unit configured to generate a rule based on the read correspondence result and store the rule in a rule storage unit.

また、本発明は、物理マシンと、物理マシンのコンピュータリソースに起動された仮想マシンとの関係を示す構成情報が記憶されている構成情報記憶部を備え、ルール生成部は、構成情報記憶部に記憶されている構成情報を読み出し、読み出した構成情報に基づいてルールを生成することを特徴とする。   In addition, the present invention includes a configuration information storage unit that stores configuration information indicating a relationship between a physical machine and a virtual machine activated by a computer resource of the physical machine, and the rule generation unit is included in the configuration information storage unit. The stored configuration information is read, and a rule is generated based on the read configuration information.

また、本発明は、ルール生成部は、物理マシンからの異常を示すメッセージを受信した後に、物理マシンのコンピュータリソースに起動された仮想マシンからの異常を示すメッセージを受信した場合、仮想マシンからのメッセージを破棄するルールを生成することを特徴とする。   In addition, according to the present invention, when the rule generation unit receives a message indicating an abnormality from a physical machine after receiving a message indicating an abnormality from the physical machine, the rule generation unit receives a message from the virtual machine. A rule for discarding a message is generated.

また、本発明は、物理マシンは、自身のコンピュータリソースに起動された仮想マシンを、他の物理マシンに移動させる機能を有し、ルール生成部は、物理マシンからの異常を示すメッセージを受信した後に、物理マシンに起動されていた仮想マシンが他の物理マシンに移動した場合、仮想マシンからの異常を示すメッセージを破棄するルールを生成することを特徴とする。   Further, according to the present invention, a physical machine has a function of moving a virtual machine activated by its own computer resource to another physical machine, and the rule generation unit receives a message indicating an abnormality from the physical machine. Later, when a virtual machine started up on a physical machine moves to another physical machine, a rule for discarding a message indicating an abnormality from the virtual machine is generated.

また、本発明は、物理マシンは、自身のコンピュータリソースに起動された仮想マシンを、他の物理マシンに移動させる機能を有し、ルール生成部は、物理マシンが移動処理を行っている間に物理マシンから処理負荷が上昇したことを示すメッセージを受信した場合、メッセージを破棄するルールを生成することを特徴とする。   Further, according to the present invention, a physical machine has a function of moving a virtual machine activated by its own computer resource to another physical machine, and the rule generation unit performs a movement process while the physical machine is performing a movement process. When a message indicating that the processing load has increased from a physical machine is received, a rule for discarding the message is generated.

また、本発明は、対応結果記憶部には、メッセージを受信した受信時刻に対応付けて、対応結果が記憶され、ルール生成部は、一定時刻の間に対応付けられた複数の対応結果が、対応するメッセージに応じた対応を行わなかったことを示す場合、一定時刻の間に受信したメッセージを破棄するルールを生成することを特徴とする。   Further, according to the present invention, the correspondence result storage unit stores a correspondence result in association with the reception time when the message is received, and the rule generation unit has a plurality of correspondence results associated with each other during a certain time. A rule for discarding a message received during a predetermined time is generated when it is indicated that no response corresponding to the corresponding message has been performed.

また、本発明は、自身のコンピュータリソースに仮想マシンを起動させる複数の物理マシンまたは物理マシンに起動された仮想マシンに異常が発生すると、異常が発生した物理マシンまたは仮想マシンから異常の内容を示すメッセージを取得する監視装置に接続され、メッセージが定められた内容を示すものであるか否かを判定するルールが記憶されているルール記憶部と、メッセージと、メッセージが示す内容に応じて行われた対応を示す対応結果とが対応付けられて記憶される対応結果記憶部とを備えたフィルタリング装置のフィルタリング方法であって、監視装置から送信されるメッセージを受信するステップと、ルール記憶部に記憶されているルールを読み出し、読み出したルールに基づいて、受信したメッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合にメッセージを出力し、定められた内容を示さないと判定した場合にメッセージを破棄するステップと、出力したメッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された対応結果をメッセージに対応付けて対応結果記憶部に記憶させるステップと、対応結果記憶部から読み出した対応結果に基づいて、ルールを生成してルール記憶部に記憶させるステップと、を備えることを特徴とする。   In addition, when an abnormality occurs in a plurality of physical machines that start a virtual machine on its own computer resource or a virtual machine started on a physical machine, the present invention indicates the contents of the abnormality from the physical machine or virtual machine in which the abnormality occurred. A rule storage unit connected to a monitoring device for acquiring a message and storing a rule for determining whether or not the message indicates a predetermined content, a message, and a message and the content indicated by the message The filtering method of the filtering device includes a correspondence result storage unit that stores a correspondence result indicating correspondence with each other, the step of receiving a message transmitted from the monitoring device, and the rule storage unit The received message is read based on the read rule. A message is output when it is determined that the specified content is indicated, a message is discarded when it is determined that the predetermined content is not indicated, and the output message In response to the input of the correspondence result indicating the correspondence performed according to the step, the input correspondence result is associated with the message and stored in the correspondence result storage unit, and the correspondence result read from the correspondence result storage unit, Generating a rule and storing the rule in a rule storage unit.

また、本発明は、自身のコンピュータリソースに仮想マシンを起動させる複数の物理マシンまたは物理マシンに起動された仮想マシンに異常が発生すると、異常が発生した物理マシンまたは仮想マシンから異常の内容を示すメッセージを取得する監視装置に接続され、メッセージが定められた内容を示すものであるか否かを判定するルールが記憶されているルール記憶部と、メッセージと、メッセージが示す内容に応じて行われた対応を示す対応結果とが対応付けられて記憶される対応結果記憶部とを備えたフィルタリング装置のコンピュータに、監視装置から送信されるメッセージを受信するステップと、ルール記憶部に記憶されているルールを読み出し、読み出したルールに基づいて、受信したメッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合にメッセージを出力し、定められた内容を示さないと判定した場合にメッセージを破棄するステップと、出力したメッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された対応結果をメッセージに対応付けて対応結果記憶部に記憶させるステップと、対応結果記憶部から読み出した対応結果に基づいて、ルールを生成してルール記憶部に記憶させるステップと、を実行させるフィルタリングプログラムである。   In addition, when an abnormality occurs in a plurality of physical machines that start a virtual machine on its own computer resource or a virtual machine started on a physical machine, the present invention indicates the contents of the abnormality from the physical machine or virtual machine in which the abnormality occurred. A rule storage unit connected to a monitoring device for acquiring a message and storing a rule for determining whether or not the message indicates a predetermined content, a message, and a message and the content indicated by the message A filtering device having a correspondence result storage unit that stores a correspondence result indicating correspondence is stored in the rule storage unit; a step of receiving a message transmitted from the monitoring device; A rule is read, and the received message indicates the specified content based on the read rule. A message is output when it is determined that the specified content is indicated, and a message is discarded when it is determined that the predetermined content is not indicated. A rule is generated based on the step of accepting the input of the correspondence result indicating the correspondence, the step of storing the inputted correspondence result in the correspondence result storage unit in association with the message, and the correspondence result read from the correspondence result storage unit And a step of storing in the rule storage unit.

以上説明したように、本発明によれば、監視装置から送信されるメッセージを受信し、定められたルールに基づいて、受信したメッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合にメッセージを出力し、定められた内容を示さないと判定した場合にメッセージを破棄し、出力したメッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された対応結果をメッセージに対応付けて記憶し、対応結果に基づいて、ルールを生成して記憶するようにしたので、仮想環境における異常を示すメッセージをフィルタリングするルールを効率良く生成することができる。   As described above, according to the present invention, a message transmitted from a monitoring device is received, and whether or not the received message indicates a predetermined content is determined based on a predetermined rule. If it is determined that the specified content is indicated, a message is output. If it is determined that the specified content is not indicated, the message is discarded, and the response result indicating the correspondence performed according to the output message is displayed. Accepting the input, storing the input correspondence result in association with the message, and generating and storing the rule based on the correspondence result, so the rule for filtering the message indicating abnormality in the virtual environment can be efficiently Can be generated.

本発明の一実施形態によるデータセンタが備えるコンピュータ装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the computer apparatus with which the data center by one Embodiment of this invention is provided. 本発明の一実施形態による対応結果記憶部に記憶されるデータ例を示す図である。It is a figure which shows the example of data memorize | stored in the response result memory | storage part by one Embodiment of this invention. 本発明の一実施形態による構成情報記憶部に記憶されるデータ例を示す図である。It is a figure which shows the example of data memorize | stored in the structure information storage part by one Embodiment of this invention. 本発明の一実施形態による対応結果の一例を示す図である。It is a figure which shows an example of the response result by one Embodiment of this invention. 本発明の一実施形態による対応結果の一例を示す図である。It is a figure which shows an example of the response result by one Embodiment of this invention. 本発明の一実施形態による対応結果の一例を示す図である。It is a figure which shows an example of the response result by one Embodiment of this invention. 本発明の一実施形態による対応結果の一例を示す図である。It is a figure which shows an example of the response result by one Embodiment of this invention. 本発明の一実施形態による対応結果の一例を示す図である。It is a figure which shows an example of the response result by one Embodiment of this invention. 本発明の一実施形態による対応結果の一例を示す図である。It is a figure which shows an example of the response result by one Embodiment of this invention. 本発明の一実施形態による処理結果の一例を示す図である。It is a figure which shows an example of the process result by one Embodiment of this invention. 本発明の一実施形態によるフィルタリング装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the filtering apparatus by one Embodiment of this invention. 本発明の一実施形態によるフィルタリング装置の動作例を示すフローチャートである。It is a flowchart which shows the operation example of the filtering apparatus by one Embodiment of this invention. 従来技術によるデータセンタが備えるコンピュータ装置の構成例を示す図である。It is a figure which shows the structural example of the computer apparatus with which the data center by a prior art is provided.

以下、本発明の一実施形態について、図面を参照して説明する。
図1は、本実施形態によるデータセンタが備えるコンピュータ装置の構成を示すブロック図である。データセンタは、複数の物理マシン10(物理マシン10−1、物理マシン10−2、物理マシン10−3、・・・)と、監視システム20と、メッセージ通知装置30と、運用者端末40と、管理者端末50と、フィルタリング装置60とのコンピュータ装置を備えている。ここで、複数の物理マシン10は同様の構成であるので、特に区別しない場合には「−1」、「−2」等の表記を省略して物理マシン10として説明する。ここでは、3台の物理マシン10を示しているが、データセンタは任意の台数の物理マシン10を備えていて良い。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
FIG. 1 is a block diagram showing a configuration of a computer device provided in the data center according to the present embodiment. The data center includes a plurality of physical machines 10 (physical machine 10-1, physical machine 10-2, physical machine 10-3,...), A monitoring system 20, a message notification device 30, and an operator terminal 40. The computer device includes an administrator terminal 50 and a filtering device 60. Here, since the plurality of physical machines 10 have the same configuration, the description of “−1”, “−2”, etc. is omitted as a physical machine 10 unless otherwise distinguished. Here, three physical machines 10 are shown, but the data center may include an arbitrary number of physical machines 10.

物理マシン10は、自身のコンピュータリソースを仮想化し、複数の仮想マシンを起動させる仮想化機能を備えるコンピュータ装置である。また、物理マシン10は、自身のコンピュータリソースに起動された仮想マシンを、他の物理マシンに移動させるマイグレーションの機能を有する。   The physical machine 10 is a computer device having a virtualization function that virtualizes its computer resources and activates a plurality of virtual machines. Further, the physical machine 10 has a migration function for moving a virtual machine activated by its own computer resource to another physical machine.

監視システム20は、複数の物理マシン10または物理マシン10に起動された仮想マシン等のノードに異常が発生すると、異常が発生した物理マシン10または仮想マシンから異常の内容を示すメッセージを取得し、フィルタリング装置60に送信する。ここでは、監視システム20の監視対象をノードという。例えば、監視システム20は、ICMP(Internet Control Message Protocol)に基づくPingコマンドによる応答要求を定期的に物理マシン10および仮想マシンに送信するポーリング処理を行う。そして、送信した応答要求に対する応答を送信先から受信しない場合、送信先に異常が発生したと判定し、pingダウンを示すメッセージをフィルタリング装置60に送信する。また、pingダウンの後に送信した応答要求に対する応答を送信先から受信した場合、pingアップを示すメッセージをフィルタリング装置60に送信する。あるいは、監視システム20は、物理マシン10および仮想マシンとの間でSNMP(Simple Network Management Protocol)に基づく通信を行い、物理マシン10および仮想マシンのCPU(Central Processing Unit)負荷の上昇やプロセスダウン、ログ検知などの状態を示す情報を取得し、取得した状態の内容を示すメッセージをフィルタリング装置60に送信する。   When an abnormality occurs in a node such as a plurality of physical machines 10 or virtual machines activated on the physical machine 10, the monitoring system 20 acquires a message indicating the content of the abnormality from the physical machine 10 or virtual machine in which the abnormality has occurred, Transmit to the filtering device 60. Here, the monitoring target of the monitoring system 20 is called a node. For example, the monitoring system 20 performs a polling process for periodically transmitting a response request based on a Ping command based on ICMP (Internet Control Message Protocol) to the physical machine 10 and the virtual machine. When a response to the transmitted response request is not received from the transmission destination, it is determined that an abnormality has occurred in the transmission destination, and a message indicating ping down is transmitted to the filtering device 60. Further, when a response to the response request transmitted after ping down is received from the transmission destination, a message indicating ping up is transmitted to the filtering device 60. Alternatively, the monitoring system 20 performs communication based on the Simple Network Management Protocol (SNMP) between the physical machine 10 and the virtual machine, and the CPU (Central Processing Unit) load of the physical machine 10 and the virtual machine is increased or the process is reduced. Information indicating a state such as log detection is acquired, and a message indicating the content of the acquired state is transmitted to the filtering device 60.

メッセージ通知装置30は、フィルタリング装置60によってフィルタリングされたメッセージをフィルタリング装置60から受信し、自身の記憶領域に記憶する。そして、運用者端末40からの要求に応じて運用者端末40にメッセージを送信し、運用者端末40にメッセージを表示させる。   The message notification device 30 receives the message filtered by the filtering device 60 from the filtering device 60 and stores it in its storage area. Then, a message is transmitted to the operator terminal 40 in response to a request from the operator terminal 40, and the message is displayed on the operator terminal 40.

運用者端末40は、データセンタにおける物理マシン10または仮想マシンに異常が発生した場合に、異常の内容に応じた対応を行う運用者のコンピュータ装置である。運用者端末40は、メッセージ通知装置30から送信されるメッセージを受信し、自身が備えるディスプレイに表示させる。運用者は、運用者端末40に表示されたメッセージの内容に応じて対応を行う。ここで、運用者は、メッセージの内容に基づいて、対応の必要がないと判断した場合には対応を行わない。例えば、運用者は、メッセージの受信時刻が3:00〜4:00の間であるような場合には、メッセージに対する対応を行わないと判断することがある。運用者端末40は、このように、メッセージに応じて対応が行われたか、対応が行われなかったか(無視されたか)を示す対応結果の入力を受け付け、入力された対応結果をフィルタリング装置60に送信する。   The operator terminal 40 is an operator's computer device that responds according to the content of the abnormality when an abnormality occurs in the physical machine 10 or the virtual machine in the data center. The operator terminal 40 receives the message transmitted from the message notification device 30 and displays it on the display provided in the operator terminal 40. The operator responds according to the content of the message displayed on the operator terminal 40. Here, if the operator determines that no response is necessary based on the content of the message, the operator does not respond. For example, the operator may determine not to respond to the message when the message reception time is between 3:00 and 4:00. In this way, the operator terminal 40 receives an input of a correspondence result indicating whether or not a correspondence has been performed according to the message, and whether or not the correspondence has been performed (ignored), and the inputted correspondence result is input to the filtering device 60. Send.

管理者端末50は、データセンタにおける物理マシン10のコンピュータリソースにおいて起動された仮想マシンにより構成されるシステムの管理者のコンピュータ装置である。管理者端末50は、フィルタリング装置60によって生成された新規ルール候補を受信して自身が備えるディスプレイに表示させ、その新規ルール候補をルールとして採用するか否かを選択する情報の入力を受け付ける。管理者端末50は、入力された選択結果を、フィルタリング装置60に送信する。   The administrator terminal 50 is a computer device of an administrator of a system configured by virtual machines activated on computer resources of the physical machine 10 in the data center. The administrator terminal 50 receives the new rule candidate generated by the filtering device 60, displays the new rule candidate on the display provided therein, and receives input of information for selecting whether or not to adopt the new rule candidate as a rule. The administrator terminal 50 transmits the input selection result to the filtering device 60.

フィルタリング装置60は、監視システム20によって取得されたメッセージを、予め定められたルールに基づいてフィルタリングするコンピュータ装置である。フィルタリング装置60は、ルール記憶部61と、対応結果記憶部62と、通信部63と、フィルタリング部64と、対応結果登録部65と、構成情報記憶部66と、ルール生成部67とを備えている。   The filtering device 60 is a computer device that filters a message acquired by the monitoring system 20 based on a predetermined rule. The filtering device 60 includes a rule storage unit 61, a correspondence result storage unit 62, a communication unit 63, a filtering unit 64, a correspondence result registration unit 65, a configuration information storage unit 66, and a rule generation unit 67. Yes.

ルール記憶部61には、監視システム20から送信されたメッセージが定められた内容を示すものであるか否かを判定するルールが記憶されている。このようなルールは、フィルタリング部64によって読み出され、メッセージが定められた内容を示すものであると判定された場合にメッセージが出力され、定められた内容を示さないと判定された場合にメッセージが破棄される。ルールは、例えば、以下のようなものが考えられる。
(1)監視無視フィルタ:条件に一致するメッセージを破棄する。
(2)繰り返しフィルタ:繰り返し発生するメッセージを破棄する。あるいは、同じメッセージを、一定時間内に一定回数以上受信したら出力する。
(3)リソース瞬間超過フィルタ:CPUなどのリソースが一定時間閾値を超えたときにだけメッセージを出力し、それ以外のリソース超過メッセージを破棄する。
(4)重点ノードフィルタ:事前に設定したネットワークトポロジに基づき、親ノードがダウンしている場合、子ノードのメッセージを破棄する。
(5)依存関係フィルタ:ノードがダウンした場合、そのノードで稼働するプロセス監視やポート監視などのメッセージを破棄する。
The rule storage unit 61 stores a rule for determining whether or not the message transmitted from the monitoring system 20 indicates a predetermined content. Such a rule is read by the filtering unit 64, and a message is output when it is determined that the message indicates a predetermined content, and a message is output when it is determined that the message does not indicate the predetermined content. Is destroyed. For example, the following rules can be considered.
(1) Monitor ignore filter: Discards messages that match the conditions.
(2) Repeat filter: Discards messages that occur repeatedly. Alternatively, if the same message is received a certain number of times within a certain time, it is output.
(3) Instantaneous resource excess filter: A message is output only when a resource such as a CPU exceeds a threshold for a certain time, and other resource excess messages are discarded.
(4) Important node filter: If the parent node is down based on the network topology set in advance, the message of the child node is discarded.
(5) Dependency filter: When a node goes down, discard messages such as process monitoring and port monitoring that operate on that node.

対応結果記憶部62には、メッセージ通知装置30に出力したメッセージと、そのメッセージが示す内容に応じて運用者により行われた対応を示す対応結果とが対応付けられて記憶される。ここでは、対応結果には、フィルタリング装置60が監視システム20からメッセージを受信した受信時刻が対応付けられて記憶される。図2は、対応結果記憶部62に記憶される対応結果のデータ例を示す図である。対応結果記憶部62には、ノード名と、メッセージ内容と、受信時刻と、対応時刻と、対応結果と、システムIDと、作業者との情報が対応付けられて記憶される。ノード名は、監視システム20による監視対象であり、異常を示すメッセージの送信元を識別する情報である。メッセージ内容は、ノードにおいて発生した異常の内容を示す情報である。受信時刻は、フィルタリング装置60が監視システム20からメッセージを受信した時刻を示す情報である。対応時刻は、運用者によってメッセージに応じた対応が行われた時刻、または行わないと判断された時刻を示す情報である。対応結果は、対応が行われたか否かを示す情報である。対応された場合には「対応」と記憶され、対応されなかった場合には「無視」と記憶される。システムIDは、ノードが利用されているシステムを識別する情報であり、例えば異なる利用者の要求に応じて起動されたノードには異なるシステムIDが付与される。例えば、同一のシステムを動作させるためのウェブサーバ、アプリケーションサーバ、データベースサーバなどが異なる仮想マシンとして起動している場合、これらの仮想マシンには同一のシステムIDが付与されて管理される。   The correspondence result storage unit 62 stores a message output to the message notification device 30 and a correspondence result indicating a correspondence performed by the operator according to the content indicated by the message in association with each other. Here, the reception result is stored in association with the reception time when the filtering device 60 receives the message from the monitoring system 20. FIG. 2 is a diagram illustrating a data example of the correspondence result stored in the correspondence result storage unit 62. The correspondence result storage unit 62 stores node names, message contents, reception times, correspondence times, correspondence results, system IDs, and worker information in association with each other. The node name is information to be monitored by the monitoring system 20 and identifies the transmission source of a message indicating an abnormality. The message content is information indicating the content of the abnormality that has occurred in the node. The reception time is information indicating the time when the filtering device 60 receives a message from the monitoring system 20. The response time is information indicating a time at which a response according to a message is performed by an operator or a time when it is determined not to be performed. The correspondence result is information indicating whether or not a correspondence has been performed. When it corresponds, “correspondence” is stored, and when it does not correspond, “ignore” is stored. The system ID is information for identifying a system in which a node is used. For example, a different system ID is assigned to a node activated in response to a request from a different user. For example, when a web server, an application server, a database server, and the like for operating the same system are activated as different virtual machines, the same system ID is assigned to these virtual machines and managed.

通信部63は、接続された他のコンピュータ装置と通信を行う。例えば、通信部63は、監視システム20から送信されるメッセージを受信する。
フィルタリング部64は、ルール記憶部61に記憶されているルールを読み出し、読み出したルールに基づいて、通信部63が受信したメッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合にメッセージを出力し、定められた内容を示さないと判定した場合にメッセージを破棄する。ここで、フィルタリング部64は、メッセージが定められた内容を示すものであると判定した場合、そのメッセージを通信部63を介してメッセージ通知装置30に送信することにより出力する。
The communication unit 63 communicates with other connected computer devices. For example, the communication unit 63 receives a message transmitted from the monitoring system 20.
The filtering unit 64 reads out the rules stored in the rule storage unit 61, and determines whether the message received by the communication unit 63 indicates a predetermined content based on the read rules. A message is output when it is determined that the predetermined content is indicated, and the message is discarded when it is determined that the predetermined content is not indicated. Here, when the filtering unit 64 determines that the message indicates the determined content, the filtering unit 64 outputs the message by transmitting the message to the message notification device 30 via the communication unit 63.

対応結果登録部65は、フィルタリング部64が出力したメッセージに応じて運用者によって行われた対応を示す対応結果の入力を受け付け、入力された対応結果を、そのメッセージに対応付けて対応結果記憶部62に記憶させる。例えば、対応結果登録部65は、通信部63がメッセージ通知装置30に送信したメッセージの履歴を自身の記憶領域に記憶し、それぞれのメッセージについての対応結果を入力する入力画面を運用者端末40に送信する。そして、運用者端末40によって入力された対応結果を受信し、受信した対応結果を対応結果記憶部62に記憶させる。   The response result registration unit 65 receives an input of a response result indicating the response performed by the operator in response to the message output from the filtering unit 64, and the response result storage unit correlates the input response result with the message. 62 is stored. For example, the correspondence result registration unit 65 stores the history of the message transmitted from the communication unit 63 to the message notification device 30 in its own storage area, and displays an input screen for inputting the correspondence result for each message on the operator terminal 40. Send. Then, the response result input by the operator terminal 40 is received, and the received response result is stored in the response result storage unit 62.

構成情報記憶部66には、複数の物理マシン10と、その物理マシンのコンピュータリソースに起動された仮想マシンとの関係を示す構成情報が記憶されている。図3は、構成情報記憶部66に記憶される構成情報のデータ例を示す図である。構成情報には、ノード名と、マシンの種類と、親ノードと、ハイパーバイザと、OS(Operating System)と、システムIDとの情報が対応付けられる。対応結果記憶部62に記憶された情報と同名の項目については、同様の情報である。マシンの種類には、対応するノードの種類を示す情報であり、例えば「ルータ」、「物理マシン」、「仮想マシン」等の種類が対応付けられる。親ノードは、ノード間のネットワークトポロジにおける親子関係を示す情報である。ここでは、ノード名が「Node01」であるルータを親ノードとして、ノード名が「Node02」である物理マシン10と、ノード名が「Node03」である物理マシン10とが接続されていることが示されている。ハイパーバイザには、マシンの種類が仮想マシンである場合に、その仮想マシンが起動されている物理マシン10を示すノード名が対応付けられる。OSは、対応するノードのOSを示す。   The configuration information storage unit 66 stores configuration information indicating the relationship between a plurality of physical machines 10 and virtual machines activated by computer resources of the physical machines. FIG. 3 is a diagram illustrating a data example of configuration information stored in the configuration information storage unit 66. In the configuration information, information on a node name, a machine type, a parent node, a hypervisor, an OS (Operating System), and a system ID is associated. The items having the same names as the information stored in the correspondence result storage unit 62 are the same information. The type of machine is information indicating the type of the corresponding node, and for example, types such as “router”, “physical machine”, and “virtual machine” are associated. The parent node is information indicating a parent-child relationship in the network topology between nodes. Here, it is shown that the router with the node name “Node01” is the parent node, and the physical machine 10 with the node name “Node02” and the physical machine 10 with the node name “Node03” are connected. Has been. When the type of machine is a virtual machine, the hypervisor is associated with a node name indicating the physical machine 10 in which the virtual machine is activated. OS indicates the OS of the corresponding node.

ルール生成部67は、対応結果記憶部62から読み出した対応結果に基づいて、ルールを生成してルール記憶部61に記憶させる。また、ルール生成部67は、構成情報記憶部66に記憶されている構成情報を読み出し、読み出した構成情報に基づいてルールを生成してルール記憶部61に記憶させる。ここで、ルール生成部67が行うルール生成処理は、例えば、一定期間毎に周期的に行うようにしても良いし、管理者からの要求に応じて行うようにしても良い。あるいは、例えば対応結果記憶部62に記憶されている対応結果のデータ量が一定件数以上になった場合や、構成情報記憶部66に記憶されている構成情報が更新された場合等に行うようにしても良い。   The rule generation unit 67 generates a rule based on the correspondence result read from the correspondence result storage unit 62 and stores the rule in the rule storage unit 61. Further, the rule generation unit 67 reads the configuration information stored in the configuration information storage unit 66, generates a rule based on the read configuration information, and stores the rule in the rule storage unit 61. Here, the rule generation processing performed by the rule generation unit 67 may be performed periodically, for example, at regular intervals, or may be performed in response to a request from the administrator. Alternatively, for example, it is performed when the data amount of the correspondence results stored in the correspondence result storage unit 62 exceeds a certain number or when the configuration information stored in the configuration information storage unit 66 is updated. May be.

例えば、ルール生成部67は、構成情報と対応履歴とを参照して、物理マシン10からの異常を示すメッセージを受信した後に、その物理マシン10のコンピュータリソースに起動された仮想マシンからの異常を示すメッセージを受信した場合、その仮想マシンからのメッセージを破棄するルールを生成する。この場合、物理マシン10に異常が発生しているので、その物理マシン10の異常に基づいて、そのコンピュータリソースに起動された仮想マシンに異常が発生していることが考えられるためである。   For example, the rule generation unit 67 refers to the configuration information and the correspondence history, and after receiving a message indicating an abnormality from the physical machine 10, the rule generation unit 67 detects an abnormality from the virtual machine activated by the computer resource of the physical machine 10. If a message is received, a rule for discarding the message from the virtual machine is generated. In this case, because an abnormality has occurred in the physical machine 10, it is considered that an abnormality has occurred in the virtual machine activated by the computer resource based on the abnormality in the physical machine 10.

また、ルール生成部67は、一定時刻の間に対応付けられた複数の対応結果が、対応するメッセージに応じた対応を行わなかったことを示す場合、その一定時刻の間に受信したメッセージを破棄するルールを生成する。例えば、図4に示すように、ノード名が「Node01」であるノードから受信したメッセージのうち、3:00〜4:00の時間帯に送信されたメッセージについては全て無視されていることを検出すると、その時間帯(3:00と4:00との間)に受信したメッセージを破棄するルールを生成する。このような場合、例えばその時間帯は管理者によるメンテナンスが行われる時間帯であり、異常が発生しても対応する必要がないこと等が考えられるためである。   In addition, the rule generation unit 67 discards the message received during the certain time when the plurality of correspondence results associated during the certain time indicate that the correspondence according to the corresponding message has not been performed. Generate a rule to For example, as shown in FIG. 4, among messages received from a node whose node name is “Node01”, it is detected that all messages transmitted in the time zone from 3:00 to 4:00 are ignored. Then, a rule for discarding the message received during that time period (between 3:00 and 4:00) is generated. In such a case, for example, the time zone is a time zone during which maintenance by the administrator is performed, and it is considered that it is not necessary to cope with the occurrence of an abnormality.

また、ルール生成部67は、対応結果が、一定時間の間に同様の内容を示す一定回数以上のメッセージを受信した場合にのみ、そのメッセージに応じた対応を行ったことを示す場合、その一定時間の間に同様の内容を示すメッセージを一定回数以上受信した場合に、メッセージを出力するルールを生成する。例えば、図5に示すような対応結果から、メッセージ内容が「プロセスダウン」である場合には、10分以内に3回以上通知されたときにのみ対応されていたことが検出できる。   In addition, when the rule generation unit 67 indicates that a response corresponding to the message has been performed only when the response result has received a message of a certain number of times or more indicating the same content during a certain time, the rule generation unit 67 A rule for outputting a message is generated when a message indicating the same content is received a certain number of times or more during the time. For example, from the correspondence result as shown in FIG. 5, when the message content is “process down”, it can be detected that the correspondence has been made only when notified three times or more within 10 minutes.

また、ルール生成部67は、メッセージの内容が特定のものである場合、その後一定時間内に対応する内容のメッセージを受信した場合には、そのメッセージを破棄するルールを生成する。例えば、図6に示すような対応結果から、pingダウンのメッセージが送信された場合にも、そのメッセージから5分以内にpingアップのメッセージを受信した場合には、そのメッセージが無視されていることが検出できる。   In addition, when the content of the message is specific, the rule generation unit 67 generates a rule for discarding the message when a message with a corresponding content is received within a certain time thereafter. For example, even if a ping-down message is transmitted from the correspondence result shown in FIG. 6, if the ping-up message is received within 5 minutes from the message, the message is ignored. Can be detected.

また、ルール生成部67は、仮想マシンにオートスケール設定がされている場合、その仮想マシンからのCPU使用率超過のメッセージを破棄するルールを生成する。オートスケールとは、物理マシン10の仮想化機能により、仮想マシンのCPU使用率が一定以上になった状態が一定時間以上続く場合には、自動的にコンピュータリソースの追加を行うことを示す。この場合、対応結果記憶部62の対応結果には、ノード毎にオートスケール設定がされているか否かを示す情報を対応付けて記憶しておく。例えば、図7に示すような対応結果から、ノードからCPU使用率超過のメッセージが送信された場合にも、そのノードにオートスケール設定がされている場合にはメッセージが無視されていることが検出できる。   Further, the rule generation unit 67 generates a rule for discarding the CPU usage rate excess message from the virtual machine when auto scaling is set for the virtual machine. The auto scale indicates that the computer resource is automatically added when the virtual machine CPU usage rate exceeds a certain level for a certain time or longer due to the virtualization function of the physical machine 10. In this case, the correspondence result stored in the correspondence result storage unit 62 stores information indicating whether or not autoscale is set for each node in association with each other. For example, from the correspondence result shown in FIG. 7, even when a message indicating that the CPU usage rate is exceeded is transmitted from a node, it is detected that the message is ignored if auto-scaling is set for that node. it can.

また、ルール生成部67は、物理マシン10が移動(マイグレーション)処理を行っている間にその物理マシン10から処理負荷が上昇したことを示すメッセージを受信した場合、そのメッセージを破棄するルールを生成する。この場合、対応結果記憶部62には、物理マシン10からメッセージを受信した場合に、その物理マシン10が移動処理を行っていたか否かを示す情報を対応付けて記憶しておく。例えば、図8に示すような対応結果から、物理マシン10からメッセージが送信された場合にも、その物理マシン10が移動処理を行っている間である場合にはメッセージが無視されていることが検出できる。   Further, when the rule generation unit 67 receives a message indicating that the processing load has increased from the physical machine 10 while the physical machine 10 is performing migration (migration) processing, the rule generation unit 67 generates a rule for discarding the message. To do. In this case, when the message is received from the physical machine 10, the correspondence result storage unit 62 stores information indicating whether or not the physical machine 10 has performed the movement process in association with each other. For example, from the correspondence result shown in FIG. 8, even when a message is transmitted from the physical machine 10, the message is ignored if the physical machine 10 is performing the movement process. It can be detected.

また、ルール生成部67は、物理マシン10が移動処理を行っている間にその物理マシン10に起動された仮想マシンからpingダウンのメッセージを受信した場合、そのメッセージを破棄するルールを生成する。例えば、図9に示すような対応結果から、仮想マシンからメッセージが送信された場合にも、その仮想マシンが移動処理を行っている間である場合にはメッセージが無視されていることが検出できる。この場合、移動処理を原因とする瞬断が発生していることが考えられるためである。   Further, when the rule generation unit 67 receives a ping-down message from a virtual machine started up by the physical machine 10 while the physical machine 10 is performing the migration process, the rule generation unit 67 generates a rule for discarding the message. For example, even if a message is transmitted from a virtual machine, it can be detected from the correspondence result shown in FIG. 9 that the message is ignored if the virtual machine is performing a migration process. . In this case, it is considered that a momentary interruption caused by the movement process has occurred.

また、ルール生成部67は、物理マシン10からの異常を示すメッセージを受信した後に、その物理マシン10に起動されていた仮想マシンが他の物理マシン10に移動した場合、その仮想マシンからの異常を示すメッセージを破棄するルールを生成する。この場合、物理マシン10からのこの場合、物理マシン10に異常が発生していることを原因として仮想マシンに異常が発生していることが考えられ、仮想マシンが他の物理マシン10に移動したことにより異常が発生しなくなると考えられるためである。   In addition, when the rule generation unit 67 receives a message indicating an abnormality from the physical machine 10 and the virtual machine started on the physical machine 10 moves to another physical machine 10, the rule generation unit 67 detects an abnormality from the virtual machine 10. Generate a rule to discard the message indicating. In this case, in this case from the physical machine 10, it is considered that an abnormality has occurred in the virtual machine due to an abnormality occurring in the physical machine 10, and the virtual machine has moved to another physical machine 10. This is because it is considered that no abnormality occurs.

また、ルール生成部67は、このように生成したルールを、即座にルール記憶部61に記憶させるのではなく、例えば生成したルールを新規ルール候補として管理者端末50に送信して管理者端末50に表示させ、生成した新規ルールのうち管理者によって選択されたルールのみをルール記憶部61に記憶させるようにしても良い。
また、ルール生成部67は、フィルタリング装置60が監視システム20から送信されたが、フィルタリングの処理結果により破棄したメッセージの一覧を管理者端末50に送信するようにしても良い。そして、管理者が本来想定している処理結果と異なる場合には、そのことを示す情報の入力を受け付け、ルールを修正することができる。例えば、図10に示すように、本来想定している処理結果は破棄ではなく通知であったことを示す情報の入力を受け付け、そのメッセージについては通知を行うルールを生成する。
In addition, the rule generation unit 67 does not immediately store the generated rule in the rule storage unit 61, but transmits the generated rule to the administrator terminal 50 as a new rule candidate, for example. Only the rule selected by the administrator among the generated new rules may be stored in the rule storage unit 61.
In addition, the rule generation unit 67 may transmit a list of messages discarded by the filtering system 60 from the monitoring system 20 to the administrator terminal 50 according to the filtering processing result. If the result is different from the processing result originally assumed by the administrator, it is possible to accept input of information indicating that and correct the rule. For example, as illustrated in FIG. 10, an input of information indicating that the originally assumed processing result is not a discard but a notification is accepted, and a rule for notifying the message is generated.

次に、本実施形態によるフィルタリング装置60の動作例を説明する。図11は、フィルタリング装置60が、対応結果に基づいてルールを生成する動作例を示すフローチャートである。フィルタリング装置60のルール生成部67は、対応結果記憶部62に記憶されている対応結果を読み出す(ステップS1)。そして、対応結果に基づいて新規ルール候補を生成する(ステップS2)。そして、ルール生成部67は、管理者端末50に新規ルール候補を送信する(ステップS3)。管理者端末50は、送信された新規ルール候補をディスプレイに表示させ、表示させた新規ルール候補のうちからルールとして採用するルールの選択を受け付け、選択結果をフィルタリング装置60に送信する。フィルタリング装置60のルール生成部67は、管理者端末50から送信された選択結果を受信し、受信した選択結果が、採用することが選択されたことを示す場合(ステップS4:YES)、その新規ルール候補をルール記憶部61に記憶させる(ステップS5)。一方、受信した選択結果が、採用することが選択されていないことを示す場合(ステップS4:NO)、その新規ルール候補をルール記憶部61に記憶させず、処理を終了する。   Next, an operation example of the filtering device 60 according to the present embodiment will be described. FIG. 11 is a flowchart illustrating an operation example in which the filtering device 60 generates a rule based on the correspondence result. The rule generation unit 67 of the filtering device 60 reads out the correspondence result stored in the correspondence result storage unit 62 (step S1). Then, a new rule candidate is generated based on the correspondence result (step S2). And the rule production | generation part 67 transmits a new rule candidate to the administrator terminal 50 (step S3). The administrator terminal 50 displays the transmitted new rule candidate on the display, accepts selection of a rule to be adopted as a rule from the displayed new rule candidates, and transmits the selection result to the filtering device 60. The rule generation unit 67 of the filtering device 60 receives the selection result transmitted from the administrator terminal 50, and when the received selection result indicates that the adoption is selected (step S4: YES), the new result Rule candidates are stored in the rule storage unit 61 (step S5). On the other hand, when the received selection result indicates that adoption is not selected (step S4: NO), the new rule candidate is not stored in the rule storage unit 61, and the process ends.

図12は、フィルタリング装置60が、構成情報に基づいてルールを生成する動作例を示すフローチャートである。フィルタリング装置60のルール生成部67は、構成情報記憶部66に記憶されている構成情報を読み出す(ステップS11)。そして、構成情報に基づいて新規ルール候補を生成する(ステップS12)。そして、ルール生成部67は、生成した新規ルール候補をルール記憶部61に記憶させる(ステップS13)。   FIG. 12 is a flowchart illustrating an operation example in which the filtering device 60 generates a rule based on the configuration information. The rule generation unit 67 of the filtering device 60 reads the configuration information stored in the configuration information storage unit 66 (Step S11). Then, a new rule candidate is generated based on the configuration information (step S12). And the rule production | generation part 67 memorize | stores the produced | generated new rule candidate in the rule memory | storage part 61 (step S13).

以上説明したように、本実施形態によれば、メッセージに対する運用者の対応結果や、物理マシンと仮想マシンとの関係を示す構成情報等に基づいてルールを学習し、自動的に生成するようにしたので、管理者等が自身でルールを作成する必要がなく、仮想環境における異常を示すメッセージをフィルタリングするルールを効率良く生成することが可能となる。これにより、管理者がルールを作成する手間が省けるとともに、人為的なミスにより適切でないルールが生成されることを防ぐことができる。
また、従来は、監視対象システム毎に物理的なハードウェアが分かれており、監視対象システム毎に対応する運用管理システムが設けられ、それぞれに運用者が割り当てられている場合が多かったが、仮想環境においては、ひとつの物理マシン10に複数の仮想マシンが起動するため、1人の運用者が複数のシステムを監視することが有り得る。このような場合でも、最適なルールが作成されてフィルタリングされたメッセージが運用者端末40に表示されるため、運用者は効率良くメッセージの対応を行うことができる。これにより、運用者の負担が軽くなるとともに、運用のための費用を削減することができる。
As described above, according to the present embodiment, a rule is learned and automatically generated based on an operator response result to a message, configuration information indicating a relationship between a physical machine and a virtual machine, and the like. Therefore, it is not necessary for an administrator or the like to create a rule by himself / herself, and it is possible to efficiently generate a rule for filtering a message indicating an abnormality in the virtual environment. As a result, it is possible to save the administrator from creating rules, and to prevent generation of inappropriate rules due to human error.
Conventionally, physical hardware is divided for each monitored system, and an operation management system corresponding to each monitored system is provided, and an operator is assigned to each system. In the environment, since a plurality of virtual machines are started on one physical machine 10, one operator may monitor a plurality of systems. Even in such a case, since an optimum rule is created and the filtered message is displayed on the operator terminal 40, the operator can efficiently deal with the message. As a result, the burden on the operator is reduced and the cost for operation can be reduced.

なお、本発明における処理部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによりルールの生成を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、ホームページ提供環境(あるいは表示環境)を備えたWWWシステムも含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(RAM)のように、一定時間プログラムを保持しているものも含むものとする。   A program for realizing the function of the processing unit in the present invention is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system and executed to generate a rule. You may go. Here, the “computer system” includes an OS and hardware such as peripheral devices. The “computer system” includes a WWW system having a homepage providing environment (or display environment). The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Further, the “computer-readable recording medium” refers to a volatile memory (RAM) in a computer system that becomes a server or a client when a program is transmitted via a network such as the Internet or a communication line such as a telephone line. In addition, those holding programs for a certain period of time are also included.

また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, what is called a difference file (difference program) may be sufficient.

10 物理マシン
20 監視システム
30 メッセージ通知装置
40 運用者端末
50 管理者端末
60 フィルタリング装置
61 ルール記憶部
62 対応結果記憶部
63 通信部
64 フィルタリング部
65 対応結果登録部
66 構成情報記憶部
67 ルール生成部
DESCRIPTION OF SYMBOLS 10 Physical machine 20 Monitoring system 30 Message notification apparatus 40 Operator terminal 50 Administrator terminal 60 Filtering apparatus 61 Rule storage part 62 Corresponding result storage part 63 Communication part 64 Filtering part 65 Corresponding result registration part 66 Configuration information storage part 67 Rule generation part

Claims (8)

自身のコンピュータリソースに仮想マシンを起動させる複数の物理マシンまたは当該物理マシンに起動された前記仮想マシンに異常が発生すると、異常が発生した当該物理マシンまたは仮想マシンから異常の内容を示すメッセージを取得する監視装置に接続されたフィルタリング装置であって、
前記メッセージが定められた内容を示すものであるか否かを判定するルールが記憶されているルール記憶部と、
前記メッセージと、当該メッセージが示す内容に応じて行われた対応を示す対応結果とが対応付けられて記憶される対応結果記憶部と、
前記監視装置から送信される前記メッセージを受信する受信部と、
前記ルール記憶部に記憶されている前記ルールを読み出し、読み出した当該ルールに基づいて、前記受信部が受信した前記メッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合に当該メッセージを出力し、定められた内容を示さないと判定した場合に当該メッセージを破棄するフィルタリング部と、
前記フィルタリング部が出力した前記メッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された当該対応結果を当該メッセージに対応付けて前記対応結果記憶部に記憶させる対応結果登録部と、
前記対応結果記憶部から読み出した前記対応結果に基づいて、前記ルールを生成して前記ルール記憶部に記憶させるルール生成部と、
を備えることを特徴とするフィルタリング装置。
When an error occurs in multiple physical machines that start a virtual machine on its own computer resource or the virtual machine started on the physical machine, a message indicating the content of the error is obtained from the physical machine or virtual machine where the error occurred A filtering device connected to the monitoring device,
A rule storage unit storing a rule for determining whether or not the message indicates a predetermined content;
A correspondence result storage unit in which the message and a correspondence result indicating correspondence performed according to the content indicated by the message are associated and stored;
A receiving unit for receiving the message transmitted from the monitoring device;
The rule stored in the rule storage unit is read, and based on the read rule, it is determined whether or not the message received by the receiving unit indicates a predetermined content. A filtering unit that outputs the message when it is determined that the content is determined, and discards the message when it is determined that the content is not determined,
A correspondence result registration unit that accepts input of a correspondence result indicating correspondence performed in response to the message output by the filtering unit, and stores the input correspondence result in association with the message in the correspondence result storage unit; ,
A rule generation unit that generates the rule based on the correspondence result read from the correspondence result storage unit and stores the rule in the rule storage unit;
A filtering device comprising:
前記物理マシンと、当該物理マシンのコンピュータリソースに起動された前記仮想マシンとの関係を示す構成情報が記憶されている構成情報記憶部を備え、
前記ルール生成部は、前記構成情報記憶部に記憶されている前記構成情報を読み出し、読み出した当該構成情報に基づいて前記ルールを生成する
ことを特徴とする請求項1に記載のフィルタリング装置。
A configuration information storage unit that stores configuration information indicating a relationship between the physical machine and the virtual machine started by a computer resource of the physical machine;
The filtering device according to claim 1, wherein the rule generation unit reads the configuration information stored in the configuration information storage unit, and generates the rule based on the read configuration information.
前記ルール生成部は、前記物理マシンからの異常を示すメッセージを受信した後に、当該物理マシンのコンピュータリソースに起動された前記仮想マシンからの異常を示すメッセージを受信した場合、当該仮想マシンからのメッセージを破棄するルールを生成する
ことを特徴とする請求項2に記載のフィルタリング装置。
When the rule generation unit receives a message indicating an abnormality from the physical machine and then receives a message indicating an abnormality from the virtual machine activated on the computer resource of the physical machine, the rule generation unit receives a message from the virtual machine. The filtering apparatus according to claim 2, wherein a rule for discarding is generated.
前記物理マシンは、自身のコンピュータリソースに起動された仮想マシンを、他の物理マシンに移動させる機能を有し、
前記ルール生成部は、前記物理マシンからの異常を示すメッセージを受信した後に、当該物理マシンに起動されていた前記仮想マシンが他の物理マシンに移動した場合、当該仮想マシンからの異常を示すメッセージを破棄するルールを生成する
ことを特徴とする請求項2または請求項3に記載のフィルタリング装置。
The physical machine has a function of moving a virtual machine started by its own computer resource to another physical machine,
When the rule generation unit receives a message indicating an abnormality from the physical machine, and the virtual machine started on the physical machine moves to another physical machine, the message indicating an abnormality from the virtual machine The filtering apparatus according to claim 2, wherein a rule for discarding the rule is generated.
前記物理マシンは、自身のコンピュータリソースに起動された仮想マシンを、他の物理マシンに移動させる機能を有し、
前記ルール生成部は、前記物理マシンが前記移動処理を行っている間に当該物理マシンから処理負荷が上昇したことを示すメッセージを受信した場合、当該メッセージを破棄するルールを生成する
ことを特徴とする請求項1から請求項4までのいずれか1項に記載のフィルタリング装置。
The physical machine has a function of moving a virtual machine started by its own computer resource to another physical machine,
The rule generation unit generates a rule for discarding the message when receiving a message indicating that the processing load has increased from the physical machine while the physical machine is performing the movement process. The filtering device according to any one of claims 1 to 4.
前記対応結果記憶部には、前記メッセージを受信した受信時刻に対応付けて、前記対応結果が記憶され、
前記ルール生成部は、一定時刻の間に対応付けられた複数の前記対応結果が、対応する前記メッセージに応じた対応を行わなかったことを示す場合、当該一定時刻の間に受信した前記メッセージを破棄するルールを生成する
ことを特徴とする請求項1から請求項5までのいずれか1項に記載のフィルタリング装置。
The correspondence result storage unit stores the correspondence result in association with the reception time when the message is received,
When the plurality of correspondence results associated during a certain time indicate that the correspondence according to the corresponding message has not been performed, the rule generation unit may receive the message received during the certain time. The filtering device according to any one of claims 1 to 5, wherein a rule to be discarded is generated.
自身のコンピュータリソースに仮想マシンを起動させる複数の物理マシンまたは当該物理マシンに起動された前記仮想マシンに異常が発生すると、異常が発生した当該物理マシンまたは仮想マシンから異常の内容を示すメッセージを取得する監視装置に接続され、前記メッセージが定められた内容を示すものであるか否かを判定するルールが記憶されているルール記憶部と、前記メッセージと、当該メッセージが示す内容に応じて行われた対応を示す対応結果とが対応付けられて記憶される対応結果記憶部とを備えたフィルタリング装置のフィルタリング方法であって、
前記監視装置から送信される前記メッセージを受信するステップと、
前記ルール記憶部に記憶されている前記ルールを読み出し、読み出した当該ルールに基づいて、受信した前記メッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合に当該メッセージを出力し、定められた内容を示さないと判定した場合に当該メッセージを破棄するステップと、
出力した前記メッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された当該対応結果を当該メッセージに対応付けて前記対応結果記憶部に記憶させるステップと、
前記対応結果記憶部から読み出した前記対応結果に基づいて、前記ルールを生成して前記ルール記憶部に記憶させるステップと、
を備えることを特徴とするフィルタリング方法。
When an error occurs in multiple physical machines that start a virtual machine on its own computer resource or the virtual machine started on the physical machine, a message indicating the content of the error is obtained from the physical machine or virtual machine where the error occurred Connected to a monitoring device, and a rule storage unit that stores a rule for determining whether or not the message indicates a predetermined content, the message, and the message and the content indicated by the message. A filtering method of a filtering device comprising a correspondence result storage unit that stores correspondence results indicating correspondences associated with each other,
Receiving the message transmitted from the monitoring device;
The rule stored in the rule storage unit is read, and based on the read rule, it is determined whether or not the received message indicates a predetermined content, and the predetermined content is indicated. Outputting the message when it is determined, and discarding the message when it is determined that the predetermined content is not indicated;
Receiving an input of a correspondence result indicating correspondence performed in response to the output message, and storing the input correspondence result in association with the message in the correspondence result storage unit;
Generating the rule based on the correspondence result read from the correspondence result storage unit and storing the rule in the rule storage unit;
A filtering method comprising:
自身のコンピュータリソースに仮想マシンを起動させる複数の物理マシンまたは当該物理マシンに起動された前記仮想マシンに異常が発生すると、異常が発生した当該物理マシンまたは仮想マシンから異常の内容を示すメッセージを取得する監視装置に接続され、前記メッセージが定められた内容を示すものであるか否かを判定するルールが記憶されているルール記憶部と、前記メッセージと、当該メッセージが示す内容に応じて行われた対応を示す対応結果とが対応付けられて記憶される対応結果記憶部とを備えたフィルタリング装置のコンピュータに、
前記監視装置から送信される前記メッセージを受信するステップと、
前記ルール記憶部に記憶されている前記ルールを読み出し、読み出した当該ルールに基づいて、受信した前記メッセージが、定められた内容を示すものであるか否かを判定し、定められた内容を示すと判定した場合に当該メッセージを出力し、定められた内容を示さないと判定した場合に当該メッセージを破棄するステップと、
出力した前記メッセージに応じて行われた対応を示す対応結果の入力を受け付け、入力された当該対応結果を当該メッセージに対応付けて前記対応結果記憶部に記憶させるステップと、
前記対応結果記憶部から読み出した前記対応結果に基づいて、前記ルールを生成して前記ルール記憶部に記憶させるステップと、
を実行させるフィルタリングプログラム。
When an error occurs in multiple physical machines that start a virtual machine on its own computer resource or the virtual machine started on the physical machine, a message indicating the content of the error is obtained from the physical machine or virtual machine where the error occurred Connected to a monitoring device, and a rule storage unit that stores a rule for determining whether or not the message indicates a predetermined content, the message, and the message and the content indicated by the message. In the computer of the filtering device provided with a correspondence result storage unit in which correspondence results indicating correspondence are stored in association with each other,
Receiving the message transmitted from the monitoring device;
The rule stored in the rule storage unit is read, and based on the read rule, it is determined whether or not the received message indicates a predetermined content, and the predetermined content is indicated. Outputting the message when it is determined, and discarding the message when it is determined that the predetermined content is not indicated;
Receiving an input of a correspondence result indicating correspondence performed in response to the output message, and storing the input correspondence result in association with the message in the correspondence result storage unit;
Generating the rule based on the correspondence result read from the correspondence result storage unit and storing the rule in the rule storage unit;
Filtering program that executes
JP2011073957A 2011-03-30 2011-03-30 Filtering device, filtering method, filtering program Active JP5501278B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011073957A JP5501278B2 (en) 2011-03-30 2011-03-30 Filtering device, filtering method, filtering program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011073957A JP5501278B2 (en) 2011-03-30 2011-03-30 Filtering device, filtering method, filtering program

Publications (2)

Publication Number Publication Date
JP2012208736A JP2012208736A (en) 2012-10-25
JP5501278B2 true JP5501278B2 (en) 2014-05-21

Family

ID=47188400

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011073957A Active JP5501278B2 (en) 2011-03-30 2011-03-30 Filtering device, filtering method, filtering program

Country Status (1)

Country Link
JP (1) JP5501278B2 (en)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6111209B2 (en) * 2014-02-04 2017-04-05 西日本電信電話株式会社 Virtual machine management system, virtual machine management method, environment management server, and program
JP7034139B2 (en) * 2017-03-29 2022-03-11 京セラ株式会社 Equipment management method, equipment management equipment and equipment management system
JP7026298B2 (en) * 2017-09-29 2022-02-28 積水ハウス株式会社 A system that can selectively switch between secure mode and non-secure mode
JP6922835B2 (en) * 2018-05-10 2021-08-18 日本電信電話株式会社 Service linkage device and notification method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08221295A (en) * 1995-02-13 1996-08-30 Mitsubishi Electric Corp Fault supporting device
JPH11120036A (en) * 1997-10-20 1999-04-30 Fujitsu Ltd Fault message output control system
JP5360000B2 (en) * 2010-06-22 2013-12-04 日本電気株式会社 Virtual server management system and method, and management server device

Also Published As

Publication number Publication date
JP2012208736A (en) 2012-10-25

Similar Documents

Publication Publication Date Title
EP2979183B1 (en) Method and arrangement for fault management in infrastructure as a service clouds
EP3089505A1 (en) Method for processing network service faults, service management system and system management module
JP5477047B2 (en) Information processing apparatus, virtual machine connection method, program, and recording medium
JP4851719B2 (en) Peripheral device management system and method
JP5501278B2 (en) Filtering device, filtering method, filtering program
JP2010063058A (en) Device, method and program for monitoring network
JP4616020B2 (en) Network monitoring program and network system
CN108632106A (en) System for monitoring service equipment
JP2016536920A (en) Apparatus and method for network performance monitoring
JP5880315B2 (en) System management apparatus, system management method, and system management program
JP6665503B2 (en) Data collection system, data collection device and data collection method
CN111343016A (en) Cloud server cluster management method and device
JP2010198491A (en) Virtual machine server, and virtual machine network monitoring system using the same
JP2019219983A (en) Operation device, and operation method
JP6269199B2 (en) Management server, failure recovery method, and computer program
KR101590590B1 (en) Control apparatus and method thereof in software defined network
JP6476853B2 (en) Network monitoring system and method
JP6269004B2 (en) Monitoring support program, monitoring support method, and monitoring support apparatus
CN103001832A (en) Detection method and device for nodes in distributed file system
JP2012249250A (en) Monitoring device and program
JP5475736B2 (en) Operation management system and monitoring setting method thereof
JP2015026154A (en) Apparatus information management device, apparatus monitoring system, apparatus information management method, apparatus monitoring method, apparatus information management program, and apparatus monitoring program
JP2010087834A (en) Network monitoring system
JP2018142092A (en) Operation checking device, operation checking program, operation checking method, and operation checking system
JP6394620B2 (en) Server management system, server, server management method, and service processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130328

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20130515

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20130816

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140311

R150 Certificate of patent or registration of utility model

Ref document number: 5501278

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250