JP2016057683A - イベント監視コンピュータシステム及びイベント監視方法 - Google Patents

イベント監視コンピュータシステム及びイベント監視方法 Download PDF

Info

Publication number
JP2016057683A
JP2016057683A JP2014181454A JP2014181454A JP2016057683A JP 2016057683 A JP2016057683 A JP 2016057683A JP 2014181454 A JP2014181454 A JP 2014181454A JP 2014181454 A JP2014181454 A JP 2014181454A JP 2016057683 A JP2016057683 A JP 2016057683A
Authority
JP
Japan
Prior art keywords
event
monitoring
monitoring system
unit
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014181454A
Other languages
English (en)
Inventor
洋次 川嶋
Hirotsugu Kawashima
洋次 川嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Systems Ltd
Original Assignee
Hitachi Systems Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Systems Ltd filed Critical Hitachi Systems Ltd
Priority to JP2014181454A priority Critical patent/JP2016057683A/ja
Publication of JP2016057683A publication Critical patent/JP2016057683A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】イベント処理遅延を防止するイベント監視コンピュータシステムの提供。
【解決手段】イベント監視システム400のイベント処理監視部403が、イベント受信数監視機能とイベント処理時間監視機能とイベント処理待件数監視機能を用いて情報システム100からのイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが閾値を超えたと判定し、監視システム間通信部405を用いてイベント監視システム500のイベント処理量が閾値を下回ると判定したとき、イベント処理監視部403を用いて閾値を越えたイベントをイベント通知先指示部404に通知し、イベント通知先指示部404を用いて閾値を越えたイベントを発した情報システム100のイベント通知先管理部103にイベント通知先をイベント監視システム500へ変更するイベント監視コンピュータシステム。
【選択図】図1

Description

本発明は、監視対象の情報システムからの異常を知らせるイベントを監視するイベント監視コンピュータシステム及びイベント監視方法に係り、特に、特定の情報システムからの継続的なイベント多発時であっても他システムのイベント処理の遅延を防止することができるイベント監視コンピュータシステム及びイベント監視方法に関する。
近年の情報システムにおいては、複数の情報システムに接続され、該情報システムからの異常他を通知するイベントを受け取り、該受け取ったイベントが異常かどうかの判断を行うイベント監視システムを設け、該イベント監視システムが情報システムの稼働を監視する技術が採用され、通常では、複数台の監視対象の情報システムに接続された一台のイベント監視システムで監視する場合が多い。
なお、本出願で述べる情報システムとは、自己機器の障害をイベントとしてメッセージなどを出力する機能を有する機器、例えば、物理的なサーバや仮想サーバやネットワーク機器やストレージ機器等が挙げられる。
このイベント監視システムに関する技術が記載された文献としては、下記の特許文献1が挙げられる。この該特許文献1には、監視クライアントより得られる情報をもとに機器構成情報管理とログ情報保存と各種情報表示と監視クライアントに対するヘルスチェックと音声出力サーバに対する音声出力要求を行う手段を有する監視サーバと、業務システムから得られる情報をもとに監視サーバに対して各種イベントログの通知を行う監視クライアントを設け、負荷や情報量の集中によるオーバーフローを防止する技術が記載されている。
特開2000−20427号公報
前述の特許文献1記載の技術は、負荷や情報量の集中によるオーバーフローを防止することができるものの、監視対象からのイベントを順次受け付け、順次異常かの判断を行っている。このため、情報システムが複数台あり且つ一台の情報システムがハードウェア障害により多種多様のイベントが継続して多発した場合、イベント監視システムは発生順にイベント処理を実行するため他の情報システムのイベント処理が遅延するという課題があった。
この課題を回避するために閾値以上のイベント多発時に情報システムからのイベント通知を抑止する手法がある。しかし、この手法は、複数の情報システムそれぞれのシステムのイベント発生数が閾値までは達していないが複数の情報システムのイベント数を合わせるとイベント監視システムの処理性能以上のイベント数となった場合、イベントの処理遅延が発生する課題があった。また、この課題を回避するためには異常時のイベント発生数を考慮した処理能力を持つイベント監視システムを構築することも考えられるが、通常発生するイベント数が少ないため高性能なイベント監視システムを構築することはコスト上昇を招く課題があった。
また、従来技術においては、複数台の情報システムを監視する主イベント監視システムに予備イベント監視システムを設け、主イベント監視システムに障害が発生した場合に予備イベント監視システムが監視するように切り替えるものも提案されている。しかしながら、この従来技術においても、特定の情報システムに多数のイベントが継続して発生した場合、他情報システムのイベント処理が遅延するという課題があった。
本発明の目的は、前述の従来技術による課題を解決しようとするものであり、特定の情報システムからイベントが継続して多発した場合であっても他情報システムのイベント処理の遅延を防止することができるイベント監視コンピュータシステム及びイベント監視方法を提供することである。
前記目的を達成するために本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
一方のイベント監視システムが、特定の情報システムから通知されるイベントの単位時間あたりのイベント受信数とイベント受信後からイベント処理完了までのイベント処理時間とイベント処理待件数の何れかが予め定めた閾値を越えていると判定し、且つ、他方のイベント監視システムがイベント受信数とイベント処理時間とイベント処理待件数の何れも予め定めた閾値を越えていないと判定したとき、前記特定の情報システムに対してイベント通知先を他方のイベント監視システムに変更させることを第1の特徴とし、該第1の特徴のイベント監視コンピュータシステムにおいて、前記一方のイベント監視システムが、オペレータ端末からイベント通知先を変更する指示を受けたとき、一方のイベント監視システムが監視している情報システムにイベント通知先のイベント監視システムを変更させることを第2の特徴とする。
また、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、一方のイベント監視システムが、他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを第3の特徴とし、
該第3の特徴のイベント監視コンピュータシステムにおいて、前記一方のイベント監視システムが、他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを第4の特徴とする。
また、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
前記情報システムは、
前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを備え、
前記イベント監視システムは、
前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
前記イベント受信部で受信したイベントの単位時間当たりの受信数を情報システム単位で管理し、特定の情報システムから規定値以上のイベント受信数を監視するイベント受信数監視機能と、イベント受信部によるイベント受信後からイベント処理部によるイベント処理完了までの処理時間を監視するイベント処理時間監視機能と、イベント処理部の処理待件数を監視するイベント処理待件数監視機能と、前記何れかの監視機能により監視したイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたとき、該当イベントの内容をイベント通知先指示部に通知する機能を有するイベント処理監視部とを備え、
一方のイベント監視システムが、
前記イベント処理監視部のイベント受信数監視機能とイベント処理時間監視機能とイベント処理待件数監視機能を用いて特定の情報システムからのイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたか否かを判定する第1工程と、
該第1工程により予め定められた閾値を超えたと判定したとき、前記監視システム間通信部を用いて他方のイベント監視システムのイベント処理量が閾値を越えているか否かを確認する第2工程と、
該第2工程により他方のイベント監視システムのイベント処理量が閾値を越えていないと判定したとき、イベント処理監視部を用いて前記閾値を越えたイベントをイベント通知先指示部に通知する第3工程と、
前記イベント通知先指示部を用いて前記第3工程により通知されたイベントを発した情報システムのイベント通知先管理部にイベント通知先を前記他方のイベント監視システムに変更する通知を発する第4工程を実行することを第5の特徴とする。
また、本発明は、第5の特徴のイベント監視コンピュータシステムにおいて、前記複数のイベント監視システムのイベント処理監視部が、オペレータ端末からの指示を受け付け、イベント通知先指示部に対して任意の情報システムに対してイベント通知先のイベント監視システムを指示するオペレータ指示部を備え、該オペレータ指示部がオペレータの指示によりイベント通知先を変更する指示を受けたとき、イベント通知先指示部にイベント通知先を任意のイベント監視システムに変更する通知を発する第5工程を実行することを第6の特徴とする。
また、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
前記情報システムは、
前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを備え、
前記イベント監視システムは、
前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
前記イベント受信部で受信したイベントによる負荷を監視する監視機能を有するイベント処理監視部とを備え、
一方のイベント監視システムが、前記監視システム間通信部を用いて他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、前記イベント通知先指示部を用いて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを第7の特徴とする。
また、本発明は、第7の特徴のイベント監視コンピュータシステムにおいて、前記一方のイベント監視システムのイベント処理監視部が、前記監視システム間通信部を介して他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを第8の特徴とする。
さらに、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
一方のイベント監視システムが、特定の情報システムから通知されるイベントのイベント受信数とイベント処理時間とイベント処理待件数の何れかが予め定めた閾値を越えていると判定し、且つ、他方のイベント監視システムがイベント受信数とイベント処理時間とイベント処理待件数の何れも予め定めた閾値を越えていないと判定したとき、前記特定の情報システムに対してイベント通知先を他方のイベント監視システムに変更させることを第9の特徴とし、
該第9の特徴のイベント監視方法において、前記一方のイベント監視システムが、オペレータ端末からイベント通知先を変更する指示を受けたとき、一方のイベント監視システムが監視している情報システムにイベント通知先のイベント監視システムを変更させることを第10の特徴とする。
また、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
一方のイベント監視システムが、他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを第11の特徴とし、該第11の特徴のイベント監視方法において、前記一方のイベント監視システムが、他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを第12の特徴とする。
また、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
前記情報システムに、
前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを設け、
前記イベント監視システムに、
前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
前記イベント受信部で受信したイベントの単位時間当たりの受信数を情報システム単位で管理し、特定の情報システムから規定値以上のイベント受信数を監視するイベント受信数監視機能と、イベント受信部によるイベント受信後からイベント処理部によるイベント処理完了までの処理時間を監視するイベント処理時間監視機能と、イベント処理部の処理待件数を監視するイベント処理待件数監視機能と、前記何れかの監視機能により監視したイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたとき、該当イベントの内容をイベント通知先指示部に通知する機能を有するイベント処理監視部を設け、
一方のイベント監視システムに、
前記イベント処理監視部のイベント受信数監視機能とイベント処理時間監視機能とイベント処理待件数監視機能を用いて特定の情報システムからのイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたか否かを判定する第1工程と、
該第1工程により予め定められた閾値を超えたと判定したとき、前記監視システム間通信部を用いて他方のイベント監視システムのイベント処理量が閾値を越えているか否かを確認する第2工程と、
該第2工程により他方のイベント監視システムのイベント処理量が閾値を越えていないと判定したとき、イベント処理監視部を用いて前記閾値を越えたイベントをイベント通知先指示部に通知する第3工程と、
前記イベント通知先指示部を用いて前記第3工程により通知されたイベントを発した情報システムのイベント通知先管理部にイベント通知先を前記他方のイベント監視システムに変更する通知を発する第4工程を実行させることを第13の特徴とする。
また、本発明は、該第13の特徴のイベント監視方法において、前記複数のイベント監視システムのイベント処理監視部に、オペレータ端末からの指示を受け付け、イベント通知先指示部に対して任意の情報システムに対してイベント通知先のイベント監視システムを指示するオペレータ指示部を設け、該オペレータ指示部がオペレータの指示によりイベント通知先を変更する指示を受けたとき、イベント通知先指示部にイベント通知先を任意のイベント監視システムに変更する通知を発する第5工程を実行させることを第14の特徴とする。
また、本発明は、障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
前記情報システムに、
前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを設け、
前記イベント監視システムに、
前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
前記イベント受信部で受信したイベントによる負荷を監視する監視機能を有するイベント処理監視部とを設け、
一方のイベント監視システムに、前記監視システム間通信部を用いて他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、前記イベント通知先指示部を用いて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを第15の特徴とする。
また、本発明は、第15の特徴のイベント監視方法において、前記一方のイベント監視システムのイベント処理監視部に、前記監視システム間通信部を介して他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを第16の特徴とする。
本発明によるイベント監視コンピュータシステム及びイベント監視方法は、一方のイベント監視システムのイベント処理監視部がイベント受信数監視機能とイベント処理時間監視機能とイベント処理待件数監視機能を用いて特定の情報システムからのイベント受信数又はイベント処理時間又はイベント処理待件数が予め定められた閾値を超えたと判定したとき、イベント処理監視部を用いて前記閾値を越えたイベントをイベント通知先指示部に通知し、前記監視システム間通信部を用いて他方のイベント監視システムのイベント処理量が閾値を下回るとき、前記イベント通知先指示部を用いて前記閾値を越えたイベントを発した情報システムのイベント通知先管理部にイベント通知先を前記他方のイベント監視システムへ変更することによって、他方のイベント監視システムへイベントが多発している情報システムのイベント通知先を切り替え、イベント処理遅延を防止することができる。
本発明の実施形態によるイベント監視コンピュータシステムを示す図。 本実施形態によるイベント監視システムの動作を示すフロー図。
以下、本発明によるイベント監視方法を採用したイベント監視コンピュータシステムの一実施形態を詳細に説明する。
[構成]
本実施形態によるイベント監視コンピュータシステムは、図1に示す如く、監視対象である仮想サーバ等の情報システム100〜300と、該情報システム100〜300とネットワーク10を介して接続される複数のイベント監視システム400及び500とを備え、イベント監視システム400とイベント監視システム500はネットワーク20を介して接続されている。図示の例では、情報システムを3台とし、イベント監視システムを2台とする例であるが、本発明におけるこれら台数は任意であり制限はない。
前記情報システム100〜300は、自システムで発生したイベントを管理しイベント監視システム400及び500に通知を要するイベントを判定するイベント管理部101と、該イベント管理部101により通知要と判定されたイベントをイベント監視システム400及び500に通知するイベント送信部102と、該イベント送信部102の送信先を管理するイベント通知先管理部103とを備える。該イベント通知先管理部103は、自己のイベント送信部102に対して通知先のイベント監視システムを指示しイベントの送信先を動的に変更する機能を有する。
前記イベント監視システム400及び500は、イベント受信部401と、イベント処理部402と、イベント処理監視部403と、イベント通知先指示部404と、監視システム間通信部405を備える。
前記イベント受信部401は、前記情報システム100〜300のイベント送信部102から送信されたイベントを受信する機能を有し、前記イベント処理部402は、該イベント受信部401が受信したイベントの処理(イベントに対するインシデントを生成しその後の処理ができるように加工する処理他)を行う機能を有する。
前記イベント処理監視部403は、前記イベント受信部401で受信したイベントの単位時間当たりの受信数を対象監視情報システム単位で管理し、特定の情報システムから閾値以上のイベントを受信したか否かを監視するイベント受信数監視機能と、イベント受信部401による特定の情報システムからのイベント受信後からイベント処理部402でイベント処理完了までの処理時間を監視するイベント処理時間監視機能と、イベント受信部401で受信され特定の情報システムからのイベント処理部402の処理待件数を監視するイベント処理待件数監視機能と、前記何れかの監視機能により監視した特定の情報システムからのイベント受信数又は処理時間又は処理待件数が予め定められた閾値を超えた場合はその内容をイベント通知先指示部404に通知する機能を有する。
イベント通知先指示部404は、監視対象の情報システム100〜300のイベント通知先管理部103に対してイベント通知先の監視システムを指示することにより、この指示を受けたイベント通知先管理部103に通知先のイベント監視システムを指示しイベントの送信先を動的に変更させる機能を有する。
前記監視システム間通信部405は、ネットワーク20を介して他方のイベント監視システムの監視システム間通信部405と通信し、他監視システムのイベント処理監視部403で得た監視システムの処理状況(前述のイベント受信数又は処理時間又は処理待件数)を得る機能を有する。
また、本実施形態によるイベント監視システム400及び500は、図示しないオペレータ端末からの指示を受け付け、イベント通知先指示部404に対して任意の情報システムに対してイベント通知先のイベント監視システムを指示するオペレータ指示部を設けても良い。
[動作]
次に本実施形態によるイベント監視システムを含むコンピュータシステムの動作を説明する。このコンピュータシステムは、イベント監視システム400が、情報システム100〜300に対する本番系のイベント監視を行い、イベント監視システム500がイベント監視システム400に異常が発生した場合の待機系として常時稼働するものとし、このような状況において情報システム100にハードウェア障害等による多数多種のイベントが多発し、監視対象システム100のイベント送信部102からイベント監視システム400のイベント受信部401に大量イベントが継続的に送信された状態を想定する。
この状態において、イベント監視システム400は、情報システム100からの多数イベントが順次イベント受信部401を介してイベント処理部402に伝えられ、該イベント処理部402がイベント処理を順次実行するが、イベント監視システム400のイベント処理性能以上のイベントが受信されているため、イベント受信部401とイベント処理部402の間でイベントが滞留する。
この状態において本実施形態によるイベント監視システム400は、図2に示す如く、次の処理を実行する。
(1)イベント処理監視部403が、前述の受信数監視機能を用いて特定の情報システム100からのイベント受信数が閾値を越えているか否かを判定し、閾値を越えていると判定したとき、ステップ205に移行するステップ201。
(2)該ステップ201によりイベント受信数が閾値を越えていると判定したとき、監視システム間通信部405を経由してイベント監視システム500のイベント処理量を確認するステップ204。
(3)イベント処理監視部403が、前記ステップ201により特定の情報システム100からのイベント受信数が閾値を越えていないと判定したとき、前述のイベント処理時間監視機能を用いて特定情報システム100からのイベント受信後からイベント処理完了までの時間が規定値以上か否かを判定し、閾値を越えていると判定したとき、前記ステップ205に移行するステップ202。
(4)イベント処理監視部403が、前記ステップ202により特定の情報システム100からの処理時間が閾値を越えていないと判定したとき、前述のイベント処理待件数監視機能を用いて特定情報システム100からの処理待ちイベント数(処理待件数)が閾値を越えているか否かを判定し、閾値を越えていると判定したとき、前記ステップ205に移行し、閾値を越えていないと判定したとき、前記ステップ201に戻るステップ203。
(5)前記ステップ204により確認したイベント監視システム500のイベント処理量が閾値を越えているか否かを判定するステップ205。
(6)前記ステップ205により、閾値を越えていないと判定したとき、イベント通知先指示部404を経由して情報システム100にイベント通知先をイベント監視システム500に変更するよう通知するステップ207。
(7)該ステップ205によりイベント監視システム500のイベント処理量が閾値を越えていると判定したとき、管理者への通知等のエラー処理を行うステップ206。本例においては、イベント監視システム500が待機系のためイベント処理量は「0」であり、閾値を越えていないと判定し、イベント監視システム500にイベント処理を移すように動作する。
このように本実施形態によるイベント監視コンピュータシステム及びイベント監視方法は、特定の情報システムからのイベント受信数又は処理時間又は処理待件数が予め定められた閾値を超えている判定し、且つ他方のイベント監視システムの処理量が閾値を越えていないと判定したとき、予備のイベント監視システムへイベントが多発している情報システムのイベント通知先を切り替えることにより、特定の情報システムから継続した多数イベント発生によるイベント処理遅延を防止することができる。
また、本実施形態によるイベント監視コンピュータシステム及びイベント監視方法は、イベント処理監視部403が前述のオペレータ指示部を用い、該オペレータ指示部がオペレータ端末からの指示を受け付けたとき、イベント通知先指示部404に対して任意の情報システムに対してイベント通知先のイベント監視システムを指示するように構成することにより、監視状態を初期状態に戻すことや、メンテナンス時に任意のイベント監視システムから監視対象情報システムを切り離すこともできる。
さらに、本実施形態によるイベント監視コンピュータシステム及びイベント監視方法は、イベント処理監視部403が、監視システム間通信部405を用いて複数のイベント監視システム間で通信を行い、一方のイベント監視システムが他方のイベント監視システムがダウンしたことを判定したとき、他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させるように情報システムに通知するように構成しても良い。
また、本実施形態によるイベント監視コンピュータシステム及びイベント監視方法は、一方のイベント監視システムのイベント処理監視部403が、他方のイベント監視システムが管理している情報システムを監視し、例えば他方のイベント監視システムが監視している情報システムが増加し、他方のイベント監視システムの負荷が閾値以上に増大したことを判定したとき、一方のイベント監視システムが監視する情報システムを割り当てることによって、他方のイベント監視システムに負荷が集中することを防止し、この状態から他方のイベント監視システムの監視対象の情報システムが減少したことを判定したとき、一方のイベント監視システムに割り当てた情報システムを他方のイベント監視システムの監視対象に戻すように構成することもできる。
このように本実施形態によるイベント監視コンピュータシステム及びイベント監視方法は、複数の情報システムに複数のイベント監視システムが監視している状態において、イベント監視システム同士が互いに他方のイベント監視システムの稼働状態を監視し、イベント処理監視部がイベント通知先指定部を用いて任意の情報システムに対してイベント通知先を動的に変更させるように構成したことによって、イベント発生状況やシステム構成状況に応じて監視対象の情報システムを動的に変更させることができる。
10 ネットワーク、20 ネットワーク、100 情報システム、
101 イベント管理部、102 イベント送信部、
103 イベント通知先管理部、400 イベント監視システム、
401 イベント受信部、402 イベント処理部、403 イベント処理監視部
404 イベント通知先指示部、405 監視システム間通信部、
500 イベント監視システム

Claims (16)

  1. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
    一方のイベント監視システムが、特定の情報システムから通知されるイベントのイベント受信数とイベント処理時間とイベント処理待件数の何れかが予め定めた閾値を越えていると判定し、且つ、他方のイベント監視システムがイベント受信数とイベント処理時間とイベント処理待件数の何れも予め定めた閾値を越えていないと判定したとき、前記特定の情報システムに対してイベント通知先を他方のイベント監視システムに変更させることを特徴とするイベント監視コンピュータシステム。
  2. 前記一方のイベント監視システムが、オペレータ端末からイベント通知先を変更する指示を受けたとき、一方のイベント監視システムが監視している情報システムにイベント通知先のイベント監視システムを変更させることを特徴とする請求項1記載のイベント監視コンピュータシステム。
  3. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
    一方のイベント監視システムが、他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを特徴とするイベント監視コンピュータシステム。
  4. 前記一方のイベント監視システムが、他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを特徴とする請求項3記載のイベント監視コンピュータシステム。
  5. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
    前記情報システムは、
    前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを備え、
    前記イベント監視システムは、
    前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
    該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
    任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
    他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
    前記イベント受信部で受信したイベントの単位時間当たりの受信数を情報システム単位で管理し、特定の情報システムから規定値以上のイベント受信数を監視するイベント受信数監視機能と、イベント受信部によるイベント受信後からイベント処理部によるイベント処理完了までの処理時間を監視するイベント処理時間監視機能と、イベント処理部の処理待件数を監視するイベント処理待件数監視機能と、前記何れかの監視機能により監視したイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたとき、該当イベントの内容をイベント通知先指示部に通知する機能を有するイベント処理監視部とを備え、
    一方のイベント監視システムが、
    前記イベント処理監視部のイベント受信数監視機能とイベント処理時間監視機能とイベント処理待件数監視機能を用いて特定の情報システムからのイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたか否かを判定する第1工程と、
    該第1工程により予め定められた閾値を超えたと判定したとき、前記監視システム間通信部を用いて他方のイベント監視システムのイベント処理量が閾値を越えているか否かを確認する第2工程と、
    該第2工程により他方のイベント監視システムのイベント処理量が閾値を越えていないと判定したとき、イベント処理監視部を用いて前記閾値を越えたイベントをイベント通知先指示部に通知する第3工程と、
    前記イベント通知先指示部を用いて前記第3工程により通知されたイベントを発した情報システムのイベント通知先管理部にイベント通知先を前記他方のイベント監視システムに変更する通知を発する第4工程を実行することを特徴とするイベント監視コンピュータシステム。
  6. 前記複数のイベント監視システムのイベント処理監視部が、オペレータ端末からの指示を受け付け、イベント通知先指示部に対して任意の情報システムに対してイベント通知先のイベント監視システムを指示するオペレータ指示部を備え、該オペレータ指示部がオペレータの指示によりイベント通知先を変更する指示を受けたとき、イベント通知先指示部にイベント通知先を任意のイベント監視システムに変更する通知を発する第5工程を実行することを特徴とする請求項5記載のイベント監視コンピュータシステム。
  7. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うイベント監視コンピュータシステムであって、
    前記情報システムは、
    前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを備え、
    前記イベント監視システムは、
    前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
    該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
    任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
    他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
    前記イベント受信部で受信したイベントによる負荷を監視する監視機能を有するイベント処理監視部とを備え、
    一方のイベント監視システムが、前記監視システム間通信部を用いて他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、前記イベント通知先指示部を用いて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを特徴とするイベント監視コンピュータシステム。
  8. 前記一方のイベント監視システムのイベント処理監視部が、前記監視システム間通信部を介して他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを特徴とする請求項7記載のイベント監視コンピュータシステム。
  9. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
    一方のイベント監視システムが、特定の情報システムから通知されるイベントのイベント受信数とイベント処理時間とイベント処理待件数の何れかが予め定めた閾値を越えていると判定し、且つ、他方のイベント監視システムがイベント受信数とイベント処理時間とイベント処理待件数の何れも予め定めた閾値を越えていないと判定したとき、前記特定の情報システムに対してイベント通知先を他方のイベント監視システムに変更させることを特徴とするイベント監視方法。
  10. 前記一方のイベント監視システムが、オペレータ端末からイベント通知先を変更する指示を受けたとき、一方のイベント監視システムが監視している情報システムにイベント通知先のイベント監視システムを変更させることを特徴とする請求項9記載のイベント監視方法。
  11. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
    一方のイベント監視システムが、他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを特徴とするイベント監視方法。
  12. 前記一方のイベント監視システムが、他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを特徴とする請求項11記載のイベント監視方法。
  13. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
    前記情報システムに、
    前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを設け、
    前記イベント監視システムに、
    前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
    該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
    任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
    他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
    前記イベント受信部で受信したイベントの単位時間当たりの受信数を情報システム単位で管理し、特定の情報システムから規定値以上のイベント受信数を監視するイベント受信数監視機能と、イベント受信部によるイベント受信後からイベント処理部によるイベント処理完了までの処理時間を監視するイベント処理時間監視機能と、イベント処理部のイベント処理待件数を監視するイベント処理待件数監視機能と、前記何れかの監視機能により監視したイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたとき、該当イベントの内容をイベント通知先指示部に通知する機能を有するイベント処理監視部を設け、
    一方のイベント監視システムに、
    前記イベント処理監視部のイベント受信数監視機能とイベント処理時間監視機能とイベント処理待件数監視機能を用いて特定の情報システムからのイベント受信数又はイベント処理時間又はイベント処理待件数の何れかが予め定められた閾値を超えたか否かを判定する第1工程と、
    該第1工程により予め定められた閾値を超えたと判定したとき、前記監視システム間通信部を用いて他方のイベント監視システムのイベント処理量が閾値を越えているか否かを確認する第2工程と、
    該第2工程により他方のイベント監視システムのイベント処理量が閾値を越えていないと判定したとき、イベント処理監視部を用いて前記閾値を越えたイベントをイベント通知先指示部に通知する第3工程と、
    前記イベント通知先指示部を用いて前記第3工程により通知されたイベントを発した情報システムのイベント通知先管理部にイベント通知先を前記他方のイベント監視システムに変更する通知を発する第4工程を実行させることを特徴とするイベント監視方法。
  14. 前記複数のイベント監視システムのイベント処理監視部に、オペレータ端末からの指示を受け付け、イベント通知先指示部に対して任意の情報システムに対してイベント通知先のイベント監視システムを指示するオペレータ指示部を設け、該オペレータ指示部がオペレータの指示によりイベント通知先を変更する指示を受けたとき、イベント通知先指示部にイベント通知先を任意のイベント監視システムに変更する通知を発する第5工程を実行させることを特徴とする請求項13記載のイベント監視方法。
  15. 障害情報をイベントとして送信する複数の情報システムと、該複数の情報システムとネットワークを介して接続される複数のイベント監視システムとを備え、該複数のイベント監視システムが複数の情報システムに発生したイベント処理を行うコンピュータシステムのイベント監視方法であって、
    前記情報システムに、
    前記イベント監視システムに通知を必要とするイベントを判定するイベント管理部と、該イベント管理部により通知要と判定されたイベントの送信先を指定するイベント通知先管理部と、該イベント通知先管理部により指定されたイベント監視システムに通知要と判定されたイベントを送信するイベント送信部とを設け、
    前記イベント監視システムに、
    前記情報システムのイベント送信部から送信されたイベントを受信する機能を有するイベント受信部と、
    該イベント受信部が受信したイベントの処理を行う機能を有するイベント処理部と、
    任意の情報システムのイベント通知先管理部にイベントの送信先のイベント監視システムを指示する機能を有するイベント通知先指示部と、
    他方のイベント監視システム及び複数の情報システムとの間で通信を行う機能を有する監視システム間通信部と、
    前記イベント受信部で受信したイベントによる負荷を監視する監視機能を有するイベント処理監視部とを設け、
    一方のイベント監視システムに、前記監視システム間通信部を用いて他方のイベント監視システムとの間で通信を行い、他方のイベント監視システムがダウンしたことを判定したとき、前記イベント通知先指示部を用いて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先を一方のイベント監視システムに変更させることを特徴とするイベント監視方法。
  16. 前記一方のイベント監視システムのイベント処理監視部に、前記監視システム間通信部を介して他方のイベント監視システムが管理している情報システムの増減又は他方のイベント監視システムの負荷を監視し、情報システムの増減又は他方のイベント監視システムの負荷に応じて他方のイベント監視システムが監視対象としている情報システムに対してイベント通知先のイベント監視システムを変更させることを特徴とする請求項15記載のイベント監視方法。
JP2014181454A 2014-09-05 2014-09-05 イベント監視コンピュータシステム及びイベント監視方法 Pending JP2016057683A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014181454A JP2016057683A (ja) 2014-09-05 2014-09-05 イベント監視コンピュータシステム及びイベント監視方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014181454A JP2016057683A (ja) 2014-09-05 2014-09-05 イベント監視コンピュータシステム及びイベント監視方法

Publications (1)

Publication Number Publication Date
JP2016057683A true JP2016057683A (ja) 2016-04-21

Family

ID=55756605

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014181454A Pending JP2016057683A (ja) 2014-09-05 2014-09-05 イベント監視コンピュータシステム及びイベント監視方法

Country Status (1)

Country Link
JP (1) JP2016057683A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017217305A1 (ja) * 2016-06-13 2017-12-21 日本電気株式会社 ログ出力制御装置、ログ分析システム、ログ出力制御方法、ログ分析方法、および、記録媒体
CN111862508A (zh) * 2020-06-22 2020-10-30 深圳中兴网信科技有限公司 监控方法、监控设备和计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017217305A1 (ja) * 2016-06-13 2017-12-21 日本電気株式会社 ログ出力制御装置、ログ分析システム、ログ出力制御方法、ログ分析方法、および、記録媒体
CN111862508A (zh) * 2020-06-22 2020-10-30 深圳中兴网信科技有限公司 监控方法、监控设备和计算机可读存储介质

Similar Documents

Publication Publication Date Title
US9582305B2 (en) Virtualization congestion control framework for modifying execution of applications on virtual machine based on mass congestion indicator in host computing system
US9430259B2 (en) Virtualization congestion control framework for modifying execution of applications on virtual machine based on mass congestion indicator in host computing system
US9515955B2 (en) Global server load balancing with queued messaging
US10911295B2 (en) Server apparatus, cluster system, cluster control method and program
CN113254205A (zh) 负载均衡系统、方法、装置、电子设备及存储介质
CN110677358A (zh) 一种报文处理方法及一种网络设备
JP2016057683A (ja) イベント監視コンピュータシステム及びイベント監視方法
JP2014041404A (ja) ターミナルサービス監視装置
JP6233141B2 (ja) データベースシステム、データベースサーバ、データベースサーバプログラム、データベースクライアント及びデータベースクライアントプログラム
CN110213364B (zh) 快递柜监控方法、系统、存储介质和设备
JP2013009139A (ja) ネットワーク監視システム、ネットワーク監視方法およびネットワーク監視プログラム
JP2006178851A (ja) 障害監視方法、障害監視システムおよびプログラム
JP5631285B2 (ja) 障害監視システムおよび障害監視方法
JP2012221040A (ja) 呼処理制御装置および呼処理制御方法
JP5884918B2 (ja) ネットワーク管理装置、システム、および方法
WO2019075137A1 (en) AUTOMATIC SCALING FOR ACCESS TO A COMMUNICATION EVENT THROUGH A STATE INTERFACE
JP6022948B2 (ja) 通信ネットワークの制御装置の管理装置及びプログラム
JP6647234B2 (ja) 通信サービスシステム及び輻輳回避方法
JP6745767B2 (ja) 通信サービスシステムおよび系切り戻し方法
CN110505115B (zh) 一种监控交换机跑高风险的方法和装置
JP2011077711A (ja) ネットワーク制御装置及び方法
JP5915297B2 (ja) サーバ装置、呼損低減方法及び通信システム
JP6369255B2 (ja) 情報処理システム、情報処理装置、情報処理方法、及び、プログラム
JPWO2020105619A1 (ja) 保守作業指示システム、保守作業指示方法及びプログラム
KR101136401B1 (ko) 무손실 절체 가능한 플랜트 다중화 통신 시스템 및 그 방법