JP2007183904A - イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム - Google Patents

イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム Download PDF

Info

Publication number
JP2007183904A
JP2007183904A JP2006096405A JP2006096405A JP2007183904A JP 2007183904 A JP2007183904 A JP 2007183904A JP 2006096405 A JP2006096405 A JP 2006096405A JP 2006096405 A JP2006096405 A JP 2006096405A JP 2007183904 A JP2007183904 A JP 2007183904A
Authority
JP
Japan
Prior art keywords
event
event message
message
processing
state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006096405A
Other languages
English (en)
Other versions
JP4760491B2 (ja
Inventor
Futoshi Haga
太 羽賀
Yutaka Kudo
裕 工藤
Tomohiro Morimura
知弘 森村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2006096405A priority Critical patent/JP4760491B2/ja
Priority to US11/471,480 priority patent/US20070150571A1/en
Publication of JP2007183904A publication Critical patent/JP2007183904A/ja
Application granted granted Critical
Publication of JP4760491B2 publication Critical patent/JP4760491B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)

Abstract

【課題】イベントメッセージに対応した処理を確実に実行することができると共に、イベントメッセージの処理効率を向上させることができるイベント処理システム23を提供する。
【解決手段】本発明のイベント処理システム23は、IT業務システム40の状態の遷移に応じて受信したイベントメッセージを、その発行順にイベントメッセージ保持部233内に保持し、イベントメッセージ保持部233内のイベントメッセージの中から、イベントメッセージが発行された後のIT業務システム40の状態が、イベントメッセージ保持部233内の最も古いイベントメッセージが発行される前のIT業務システム40の状態と一致するイベントメッセージを検索し、当該イベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該検索できたイベントメッセージまでの各イベントメッセージをイベントメッセージ保持部233から削除する。
【選択図】 図6

Description

本発明は、監視対象の状態の遷移に応じて出力されるイベントメッセージを処理するシステムおよび方法に関する。
近年のITシステムは、複数のIT機器から構成される等、大規模化・複雑化が進み、その運用管理には、イベントドリブンのIT管理システムを用いることが多い。イベントドリブンのIT管理システムでは、複数の監視システムが、管理対象となるIT機器等の障害情報や性能情報、状態遷移等の動的管理情報を監視し、管理情報に有意な変化があれば、それをイベントとして捕らえ、イベントメッセージを自身もしくは別のIT管理システムに通知する。イベントメッセージを受信したIT管理システムでは、受信したイベントメッセージに応じた適切な対処をすることで、運用管理業務を円滑に遂行するような処理がなされるのが通常である。
例えば、大規模な計算センターにおいては、Webサービスプログラムなどの複数の業務アプリケーションのそれぞれを、少なくとも一つのコンピュータで稼動させ、ある業務アプリケーションに対するリクエストを、その業務アプリケーションが稼動しているコンピュータに振り分けて処理するシステムが構築されている。
このようなシステムでは、リソース量(コンピュータ資源)の増減により、処理要求の多い業務アプリケーションを、円滑に処理している。つまり、業務アプリケーションが割り当てられていないコンピュータを待機させ、処理要求の多い業務アプリケーションに対して、待機していたコンピュータを割り当て、そのコンピュータで業務アプリケーションを稼動させることにより、処理要求に対応させている。
特許文献2には、あるサービス(業務アプリケーション)を稼働させている計算機リソースを、別のサービスに割り当て直すための技術が開示されている。ここでは、待機系計算機リソースは、アプリケーションがインストールされていないデッドスタンバイ状態を持ち、このデッドスタンバイ状態の計算機リソースを複数サービス又は複数ユーザで共有することで、遊休計算機リソースの使用率の向上およびサーバ統合を実現し、計算機リソース維持に必要なコストを削減している。また、個々のサービスに関し過去の稼動履歴を用いて負荷予測を行い、予測結果に応じて、余剰の出るサービスから、当該サービスが保有していた遊休計算機リソースを、他のサービスへ再配置する。
このようにすることで、処理要求の多い業務アプリケーションのサービスレベルの低下を防止している。ここで、サービスレベルとは、サービス提供者からサービス利用者に対して提供されるサービスのレベルのことである。例えば、サービス利用者の端末がリクエストを送信してから、該リクエストに対する結果を該端末が受信するまでの時間で表される。
上述の大規模なITシステムを管理する場合でも、イベントドリブンのIT管理手法が用いられる。上述の例では、処理要求の多い業務アプリケーションを特定するため、業務アプリケーションが稼動している、一以上のコンピュータに、性能監視プログラムを配備し、そのコンピュータ資源、そこで稼動する業務アプリケーションの性能・状況を監視する。性能監視プログラムは、監視対象の計測値(処理要求、サービスレベル、負荷など)が、予め設定した閾値を越えると、IT管理システムにイベントメッセージにより通知する。こうして、業務アプリケーションに対して割り当てるリソース量(計算機資源)を増減することで、処理要求の多い業務アプリケーションを円滑に処理できる。
このようなイベントドリブンのIT管理システムでは、イベントメッセージの数量が膨大になった場合に、管理システムの処理能力に不足が生じてしまい、処理に遅延が生じる場合がある。
このような問題を解決するための技術として、例えば特許文献1には、イベントキューに滞留するイベントメッセージのタイムスタンプを比較し、予め定められた時間間隔を超過して通知されたイベントメッセージのみをイベント処理部における対処処理の対象とすることによって、短期間に連続して到着するイベントメッセージに対する処理を省略してイベントメッセージの処理を高速化する技術が開示されている。
特開2004−287755号公報 特開2005−141605号公報
しかし、特許文献1に記載されたイベント制御装置は、イベントの内容に関わらず、イベントのタイムスタンプのみに基づいて一律にイベントを破棄することにより、短期間に連続して到着するイベントメッセージに対する処理を省略してイベントメッセージの処理を高速化している。そのため、当該イベント制御装置は、処理が必要なイベントであっても破棄する場合があり、システム全体が正しく動作できない場合がある。
つまり、サービスレベルに応じて、業務アプリケーションに対して割り当てる計算機リソースを動的に変更するようなIT管理システムにおいては、計算機リソースの増減処理に要する時間に比べて、リソースの増減を指示するイベントメッセージが短期間に頻発する場合が有る。このようなシステムの現象に特許文献1のイベント制御を行うと、システムに必要な計算機リソースの増減が為されない可能性が有る。
イベントメッセージが短期間に頻発することは、監視対象の計測値に関する閾値の設定が不適切であった場合、監視項目が多岐にわたっている場合、計測値に関する閾値の設定が適切であっても、Webサービスのように負荷の想定が困難である業務アプリケーションを運用している場合などに起こり得る。かかる場合に通知されるイベントメッセージは、サービスレベルの変化に伴い、監視項目の種別によって様々な内容となるため、短期間に複数の種類のイベントメッセージが通知され得る。
更に、計算機リソースの変更に、数十分(分単位)から数時間(時間単位)の移行時間を要する場合に、その間に通知される複数のイベントメッセージの中で、相反する動作を計算機システムに要求するものがあったときは、変更動作が不安定となるなど、短期間に集中したイベントメッセージのみを扱う特許文献1記載の従来技術では、かかる事態に対応しきれない。
本発明は上記事情を鑑みてなされたものであり、本発明の目的は、イベントメッセージに対応した処理を確実に実行すると共に、イベントメッセージの処理効率を向上させることができるようにすることにある。
上記課題を解決するために、本発明のイベント処理システムは、監視対象システムの状態の遷移に応じて発行されたイベントメッセージを、イベントメッセージ保持手段内に保持し、イベントメッセージ保持手段に保持されているイベントメッセージの中から、イベントメッセージが発行された後の監視対象システムの状態が、イベントメッセージ保持手段に格納されている、最も古いイベントメッセージが発行される前の監視対象システムの状態と一致するイベントメッセージを検索し、当該イベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該検索できたイベントメッセージまでの各イベントメッセージを、イベントメッセージ保持手段から削除する。
つまり、例えば、「CPU使用率:高」のイベントメッセージの後に、「CPU使用率:中」、「CPU使用率:低」、「CPU使用率:中」、「CPU使用率:高」、「CPU使用率:中」、…のイベントメッセージが通知される場合(図5)に、最初の「CPU使用率:高」のイベントメッセージの後、はじめて「CPU使用率:高」のイベントメッセージが出現するまでの、イベントメッセージを無視する機能を設け、不要な計算機リソースの変更動作を抑止する。
例えば、本発明は、監視対象システムの状態が遷移する都度、その遷移内容を特定するイベントメッセージを監視システムから受信し、受信したイベントメッセージに応じて当該監視対象システムを制御するイベント処理システムであって、監視システムによって発行されたイベントメッセージを保持して、発行された順に出力するイベントメッセージ保持手段と、イベントメッセージ保持手段から出力されたイベントメッセージを処理することにより、監視対象システムを制御するイベント処理手段と、イベントメッセージ保持手段内のイベントメッセージの中で、処理が必要なイベントメッセージを選択してイベント処理手段へ供給するイベントフィルタリング手段とを備え、イベントフィルタリング手段は、イベントメッセージ保持手段に保持されているイベントメッセージの中から、イベントメッセージが発行された後の監視対象システムの状態が、イベントメッセージ保持手段に格納されている、最も古いイベントメッセージが発行される前の監視対象システムの状態と一致するイベントメッセージを検索し、当該イベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該検索できたイベントメッセージまでの各イベントメッセージを、イベントメッセージ保持手段から削除するフィルタリング処理を実行することを特徴とするイベント処理システムを提供する。
本発明のイベント処理システムによれば、イベントメッセージに対応した処理を確実に実行することができると共に、イベントメッセージの処理効率を向上させることができる。
以下に、本発明の実施の形態について説明する。
図1は、本発明の一実施形態に係るサービス提供システム10の構成を示す。サービス提供システム10は、監視対象制御システム20、監視システム30、および複数のIT業務システム40a〜cを備える。
図12は、監視対象制御システム20、監視システム30、又は、IT業務システム40におけるサーバ、これら各々のハードウェア構成例を示す図である。各システム等は、CPU1201と、メモリ1202と、HDD等の外部記憶装置1203と、CD−ROMやDVD−ROMやICカードなどの記憶媒体からデータを読み取る読取装置1204と、キーボードやマウスなどの入力装置1206と、モニタやプリンタなどの出力装置1207と、管理ネットワーク11や業務ネットワーク12に接続するための通信装置1208と、これらの各装置を接続するバス1209と、を備えた一般的なコンピュータにおいて、CPU1201がメモリ1202上にロードされたプログラムを実行することで実現される。かかるプログラムは、読取装置1204を介して記憶媒体から、あるいは、通信装置1208を介して管理ネットワーク11や業務ネットワーク12から、外部記憶装置1203にダウンロードされ、それから、メモリ1202上にロードされてCPU1201により実行されるようにしてもよい。あるいは外部記憶装置1203を経由せずに、メモリ1202上に直接ロードされ、CPU1201により実行されるようにしてもよい。
それぞれのIT業務システム40は、ロードバランサ41、DBサーバ44、および複数のWebサーバ42、43を有し、業務ネットワーク12を介して顧客等の情報通信機器13に接続されている。IT業務システム40は業務アプリケーションを稼動させており、情報通信機器13からのリクエストに対してレスポンスを返すことにより、例えばオンラインでのチケット販売等のサービスを情報通信機器13のユーザに提供する。また、それぞれのIT業務システム40は、管理ネットワーク11を介して、監視対象制御システム20および監視システム30に接続されている。
なお、それぞれのIT業務システム40は、本図に示した構成に限定されるものではなく、業務ネットワーク12を介して顧客等の情報通信機器13へサービスを提供するものであればどのような構成であってもよい。また、それぞれのIT業務システム40は、1台の装置であってもよく、複数の装置を組み合わせたシステムであってもよい。また、情報通信機器13は、情報通信端末に限られず、サーバ等であってもよい。また、管理ネットワーク11と業務ネットワーク12とは、物理的に異なるネットワークとして構成されてもよく、物理的に同一のネットワークを、論理的に異なるネットワークとして構成されてもよい。
監視システム30は、レスポンスタイム監視部31、CPU使用率監視部32、およびディスク使用率監視部33等を有し、管理ネットワーク11を介して監視対象制御システム20およびそれぞれのIT業務システム40に接続されている。監視システム30は、それぞれのIT業務システム40の状態を監視し、IT業務システム40の状態に有意な変化がある都度、その変化の内容を示すイベントメッセージを、管理ネットワーク11を介して監視対象制御システム20へ送信する。
レスポンスタイム監視部31は、それぞれのIT業務システム40のレスポンスタイムを常に監視しており、情報通信機器13からのリクエストに対して、予め定められた期間(例えば10秒)以内にレスポンスがあるか否かを監視する。そして、情報通信機器13からのリクエストが多くなってIT業務システム40にかかる処理負荷が大きくなり、IT業務システム40が予め定められた期間以内にレスポンスを返すことができなくなった場合に、レスポンスタイム監視部31は、IT業務システム40の状態が、レスポンスタイムが10秒未満の状態から10秒以上かかる状態へ遷移した旨を示すイベントメッセージを、管理ネットワーク11を介して監視対象制御システム20へ送信する。その後、IT業務システム40が予め定められた期間以内にレスポンスを返すことがでるようになった場合には、レスポンスタイム監視部31は、レスポンスタイムが10秒以上かかる状態から10秒未満の状態へ遷移した旨を示すイベントメッセージを管理ネットワーク11を介して監視対象制御システム20へ送る。
CPU使用率監視部32やディスク使用率監視部33も、レスポンスタイム監視部31と同様に、CPU使用率やディスク使用率等のIT業務システム40の状態を示すそれぞれのパラメータを監視する。そして、IT業務システム40の状態が、予め設定された閾値を上回った場合または下回った場合に、CPU使用率監視部32やディスク使用率監視部33は、IT業務システム40の状態が遷移した旨を示すイベントメッセージを管理ネットワーク11を介して監視対象制御システム20へ送る。
なお、監視システム30の監視項目は、レスポンスタイムやCPU使用率、ディスク使用率等に限られず、単位時間あたりの処理件数等であってもよい。また、本実施形態では、監視システム30は、それぞれのIT業務システム40と別個の装置として表現しているが、本発明はこれに限られず、それぞれのIT業務システム40内の機能の一部として実現されていてもよい。これら監視システム30のその他の機能は、IT管理システムにおける一般的な監視システムと同様であり、その詳細は省略する。
監視対象制御システム20は、管理ネットワーク11を介して監視システム30およびIT業務システム40に接続されており、監視システム30からのイベントメッセージを受信し、受信したイベントメッセージに応じて、それぞれのIT業務システム40を制御する。ここで、監視対象制御システム20によって実行される、イベントメセージに応じた制御とは、例えば、Webサーバ42aのCPU使用率が予め定められた閾値を超えた旨を示すイベントメッセージを監視システム30から受信した場合に、Webサーバ43aのCPU使用率に余裕があれば、ロードバランサ41aを制御して、負荷分散比率を変更する、もしくはどのWebサーバのCPU利用率にも余裕が無ければ、新たにWebサーバを追加して負荷分散を拡張し、負荷の低減を図る等である。イベントメセージに応じた制御には、顧客に提供するサービスレベルを改善するための対処処理や、業務アプリケーションが使用するリソース量を節約するための対処処理などがある。これらはIT管理システムで実行可能な一般的な制御であるので、その詳細は省略する。
監視対象制御システム20は、イベントメッセージ供給部21、イベントメッセージキュー22、イベントログ収集部24、および複数のイベント処理システム23a〜cを有する。イベント処理システム23a〜cのそれぞれは、イベントメッセージに対応した処理を実行する。例えば、イベント処理システム23aは、レスポンスタイムの悪化を示すイベントメセージに対して、予備系のWebサーバを新たに稼動させることにより、レスポンスタイムの改善を図る処理を実行し、イベント処理システム23bは、Webサーバ42aのCPU使用率が予め定められた閾値を超えた旨を示すイベントメッセージに対して、Webサーバ43aのCPU使用率に余裕があれば、ロードバランサ41aを制御して、負荷分散比率を変更する処理を実行する。もし、どのWebサーバのCPU利用率にも余裕が無ければ、新たにWebサーバを追加し、ロードバランサ41aの設定を変更して負荷分散先を追加する。
イベントメッセージキュー22は、監視システム30から発行されたイベントメッセージを格納し、格納したイベントメッセージを、発行された順番でイベントメッセージ供給部21へ出力する。イベントメッセージ供給部21は、イベントメッセージキュー22から取得したイベントメッセージを、イベントログ収集部24およびそれぞれのイベントメッセージを処理するイベント処理システム23に供給する。イベントログ収集部24は、イベントメッセージキュー22に格納されたイベントメッセージを、発行された順番で全てログとして記録する。イベントログ収集部24は、イベントドリブンのIT管理システムにおける、イベントログを保存する一般的な機能と同様であり、その詳細は省略する。
なお、イベントメッセージキュー22は、既存の一般的なイベントドリブンのIT管理システムにおいて、イベントメッセージを受信する機能が一般的に持つ機能である。イベントメッセージキュー22が受信したイベントメッセージの保持方法や、図示しない他の機能部がイベントメッセージキュー22からイベントメッセージを取得する方法について、イベントメッセージキュー22は何ら制限を課すものではない。イベントメッセージキュー22は、受信したイベントメッセージを、メモリその他の一般的な記憶装置に、単に任意の並び順序で一時的に保存する。イベントメッセージキュー22は、他の機能部がイベントメッセージキュー22からイベントメッセージを取得する際には、少なくともイベントメッセージが発行された順番で取得することができるよう機能する。
本実施例では、イベントメッセージキュー22は、図1に示したように監視対象制御システム20において、管理ネットワーク11を介して通知されたイベントメッセージの受け口に配置される。イベントメッセージキュー22は、イベント処理システム23a〜cの内部に配置することも可能である。より具体的には、後述する図3におけるイベントメッセージ保持部233aの機能の一部として実現することも可能である。
監視システム30から供給されるイベントメセージには、少なくとも、図2に示すように、それぞれのイベントメッセージを識別するイベントID50が含まれている。図2では、一般的なイベントメッセージが保持する情報の例として、イベントID50の他にイベント発行時刻51及び状態遷移機器ID52を示した。イベント発行時刻51、状態遷移機器ID52は、イベントID50の一部として表現してもよい。また、イベント発行時刻51の代わりに、イベントメッセージ発行順の通し番号であってもよい。さらに、付加的情報として、監視対象のIT業務システム40で動作している業務アプリケーションの識別子や、業務アプリケーションのイベントメッセージを発行するに至った原因となる処理の識別子を含んでもよい。イベントメッセージの形式は、既存の監視システム30の実装により決定される。
イベントメッセージの例として、CPU使用率監視イベントメッセージ、ディスク使用率監視イベントメッセージ、レスポンスタイム監視イベントメッセージその他監視システム30の機能に応じたイベントメッセージが存在する。イベントID50は、少なくともCPU使用率その他監視項目と、これに対応する上限70%などの閾値その他監視対象値の組を、監視対象制御システム20において一意に識別するものである。
イベントメッセージ供給部21は、イベント処理システム23a〜cのそれぞれに供給すべきイベントメッセージのIDを特定するためのテーブル(図8)を格納しており、当該テーブルに基づいて、イベントメッセージキュー22から取得したイベントメッセージを、イベント処理システム23a〜cのそれぞれに供給する。
図8は、イベントメッセージとイベント処理システム23の対応を示す、イベントメッセージ供給部21が保持しているイベントメッセージ供給テーブルの例である。イベント処理システム識別子801は、監視対象制御システム20が備える複数のイベント処理システム23を、監視対象制御システム20内で識別するための識別子である。それらのイベント処理システム23は、それぞれ監視対象に対する制御内容が異なるため、処理対象とするイベントIDが異なり、その対応を示すのが処理対象イベントID802である。例えば、イベント処理システム23aについては、処理対象イベントID802として、M−001_O、M−001_R、M−002_O、M−002_Rがあることがわかる。これに基づきイベントメッセージ供給部21はイベントメッセージキュー22内にあるイベントメッセージを対応するイベント処理システム23aに供給することができる。
これらイベントメッセージとイベント処理システム23の対応を示す情報は、監視対象制御システム20の利用者が、又は、外部の別のIT管理システムが、規定する。監視対象制御システム20が起動される前に、イベントメッセージ供給部21に与えられればよい。なお、イベント処理システム23とイベントIDの対応関係は、様々な場合があり得る。例えば、一つのイベントIDが複数のイベント処理システム23の処理対象である場合も考えられる。その場合は、イベントメッセージ供給部21にてイベントメッセージを複製し、それぞれのイベント処理システム23に供給する。
図12は監視対象制御システム20のハードウェア構成例を示す図である。図示するように、本実施形態の監視対象制御システム20は、CPU1201と、メモリ1202と、HDD等の外部記憶装置1203と、CD−ROMやDVD−ROMやICカードなどの記憶媒体からデータを読み取る読取装置1204と、キーボードやマウスなどの入力装置1206と、モニタやプリンタなどの出力装置1207と、管理用ネットワーク11に接続するための通信装置1208と、これらの各装置を接続するバス1209と、を備えた一般的なコンピュータにおいて、CPU1201がメモリ1202上にロードされたプログラムを実行することで実現できる。このプログラムは、読取装置1204を介して記憶媒体から、あるいは、通信装置1208を介して管理用ネットワーク11から、外部記憶装置1203にダウンロードされ、それから、メモリ1202上にロードされてCPU1201により実行されるようにしてもよい。あるいは外部記憶装置1203を経由せずに、メモリ1202上に直接ロードされ、CPU1201により実行されるようにしてもよい。
図3は、イベント処理システム23の詳細な機能構成の一例を示す。それぞれのイベント処理システム23は、イベント対応表格納部230、イベントフィルタリング部231、イベント処理部232、およびイベントメッセージ保持部233を備える。
イベント対応表格納部230は、図4に示すように、イベントメッセージが発行される前のIT業務システム40の状態を識別する情報である発行前状態2301、および、イベントメッセージが発行された後のIT業務システム40の状態を識別する情報である発行後状態2302を、イベントメッセージを識別する情報であるイベントID2300に対応付けて格納する。
図4の例では、イベントID2300がM−001_Rであるイベントメッセージの発行前状態2301はS−001、発行後状態2302はS−002となっている。これはイベントメッセージM−001_Rを通知した監視システム30のいずれかの監視部の監視対象について、その状態がS−001からS−002に遷移したことを示している。
これらの監視対象の状態を示す識別子は、図5で後述するように、監視対象の特定の監視項目について、監視閾値を設定することで監視対象の状態を複数、定義でき、それらに機械的に識別子を与えることで決めることができる。これら監視対象の状態を示す識別子も、イベントIDと同様、監視対象制御システム20において一意に識別されるものであれば十分である。かかる識別子は、監視対象制御システム20の利用者が、又は、外部の別のIT管理システムが規定することができ、監視対象制御システム20が起動される前にイベント対応表格納部230に与えられればよい。
イベントメッセージ保持部233は、イベントメッセージ供給部21から供給されたイベントメッセージを、発行された順番に保持する。イベント処理部232は、イベントフィルタリング部231から供給されたイベントメッセージを処理することによりIT業務システム40を制御する。
例えば、イベント処理部232aの機能が、業務アプリケーションが稼動するWebサーバのCPU使用率に応じて、負荷を分散するWebサーバの数を変更する機能であった場合には、WebサーバのCPU使用率が予め定められた閾値を超えた旨を示すイベントメッセージが、イベントフィルタリング部231aを介して、イベント処理部232aに供給される。すると、供給されたイベントメッセージの情報を手がかりに、イベント処理部232aが処理を実行する。
一般に、イベントメッセージには、そのイベントメッセージを発行したWebサーバや業務アプリケーションに関する情報が含まれるか、それらの情報を管理するデータベースから必要な情報を取得するために必要な識別子などが含まれている。これらの情報に基づき、未使用のWebサーバを特定し、場合によりそのサーバの追加の必要性を検証し、Webサーバの追加とロードバランサの設定変更を実行する。イベント処理部232が必要とする情報や、そこで実行される処理は、一般的なイベント処理機能のものと同様であり、詳細は省略する。
イベントフィルタリング部231は、イベントメッセージ保持部233内のイベントメッセージおよびイベント対応表格納部230を参照し、イベントメッセージ保持部233内の最も古いイベントメッセージが発行される前のIT業務システム40の状態をイベント対応表格納部230から抽出する。そして、イベントフィルタリング部231は、イベントメッセージ保持部233内の2番目に古いイベントメッセージ以降のそれぞれについて、当該イベントメッセージが発行された後のIT業務システム40の状態をイベント対応表格納部230から抽出する。
そして、イベントフィルタリング部231は、イベントメッセージが発行された後のIT業務システム40の状態が、最も古いイベントメッセージが発行される前のIT業務システム40の状態と一致するイベントメッセージを、イベントメッセージ保持部233内で検索する。処理の詳細は、図6を用いて後述する。
イベントメッセージが発行された後のIT業務システム40の状態が、イベントメッセージ保持部233内の最も古いイベントメッセージが発行される前のIT業務システム40の状態と一致するイベントメッセージを検索できなかった場合、イベントフィルタリング部231は、当該最も古いイベントメッセージをイベント処理部232へ供給するイベントメッセージとして選択するイベント選択処理を実行する。そして、イベントフィルタリング部231は、イベント処理部232が処理中でない場合に、イベント選択処理において選択したイベントメッセージをイベント処理部232に供給する。
一方、イベントメッセージが発行された後のIT業務システム40の状態が、イベントメッセージ保持部233内の最も古いイベントメッセージが発行される前のIT業務システム40の状態と一致するイベントメッセージを検索できた場合、イベントフィルタリング部231は、当該最も古いイベントメッセージから当該検索できたイベントメッセージまでの各イベントメッセージをイベントメッセージ保持部233から削除する削除処理を実行する。イベントフィルタリング部231は、イベントメッセージがイベントメッセージ保持部233内に1個以下になるか、または上記のイベント選択処理を実行するまで、上記削除処理を繰り返し実行する。
以下に、図5および図6を参照しながら、イベントフィルタリング部231の処理を詳細に説明する。
例えば、図5に示すように、IT業務システム40内のCPU(Central Processing Unit)の使用率が予め定められた閾値を上回ったり、下回ったりすることによって、IT業務システム40の状態が遷移する場合について説明する。
サービスレベルに応じて業務アプリケーションに対して割り当てるリソース量を動的に制御するようなIT管理システムの場合を考える。
例えば、負荷分散構成を取るWebサーバのCPU使用率を監視対象の一つとする。いずれかのWebサーバで、そのCPU使用率が上限70%を超えると、IT管理システムは、そのWebサーバが高負荷状態に在ると判断する。そして、別のWebサーバを追加し、ロードバランサの設定を変更し、負荷を分散させ、当該Webサーバの負荷の低減を図る。逆に、いずれかのWebサーバで、そのCPU使用率が下限50%を下回ると、IT管理システムは、そのWebサーバが低負荷状態に在ると判断する。そしてロードバランサの設定を変更し、負荷を縮退させ、余剰のWebサーバを切り離す。これにより、計算機リソースの有効活用を図ることができる。
図5に示す例では、CPU使用率が70%以上の状態であるS−001から、CPU使用率が50%以上かつ70%未満の状態であるS−002の状態へ遷移した場合に、監視システム30は、イベント60を監視対象制御システム20へ送信する。その後、IT業務システム40の状態が、S−002から、CPU使用率が50%未満の状態であるS−003へ遷移した場合、監視システム30は、イベント61を監視対象制御システム20へ送信する。
その後、IT業務システム40の状態が、S−002、S−001、S−002へと遷移する都度、監視システム30は、イベント62、イベント63、イベント64を監視対象制御システム20へ送信する。
図9に、このときのイベントメッセージが、図2に示した形式で、イベントメッセージキュー22に、一時的に保持された状態を示す。イベントメッセージキュー22内で、イベントメッセージの並び順には、特に制限は無い。ここでは便宜上、イベント発行時刻順に並んでいる状態で示す。イベントメッセージキュー22には、図5で示したCPU使用率に関するイベントメッセージに限らず、監視システム30で監視可能な、複数の監視項目に関する各種イベントメッセージが蓄積されている。イベントメッセージ供給部21は、図8で示したイベントメッセージ供給テーブルを参照して、このイベントメッセージキュー22から、各イベント処理システム23に、イベントメッセージを供給する。
サービスレベルに応じて、業務アプリケーションに対して割り当てる計算機リソース量を、動的に変更するようなIT管理システムの場合で考える。簡単のため、CPU利用率に関するイベントメッセージだけで考える。すると本実施例では、イベントメッセージが60〜64まで順番に、イベント処理システム23へ到達することになる。
これらのイベントメッセージを本発明によらないで逐次処理した場合は、IT管理システムは、イベントメッセージ60を受けて安定状態と判断した後、イベントメッセージ61を受けて低負荷状態と判断してWebサーバを削減し、次いでイベントメッセージ62を受けて安定状態と判断し、またイベントメッセージ63を受けて高負荷状態と判断してWebサーバを追加し、イベントメッセージ64を受けて安定状態を判断して一連の処理を終了することになる。
このように図5のような例で本発明を適用せずに、イベントメッセージを逐次、処理した場合には、一定の期間にWebサーバの削除と追加を連続して行う処理が発生し、IT管理システム全体では、処理の無駄が生じる。実際には、Webサーバの追加削減処理には、相当の移行時間(分単位から時間単位)を要するため、イベントメッセージの受信に、Webサーバの追加削減処理が間に合わず、管理対象(本実施例におけるIT業務システム40)の実態とIT管理システム(本実施例における監視対象制御システム20)で把握する状態に不整合が生じてしまうことになる。そこで、次に説明するイベント処理システム23での処理が重要になる。
イベント処理部232が、前回供給されたイベントメッセージ(イベントメッセージ60の前のイベントメッセージ)を処理している間に、IT業務システム40の状態が図5に示したように遷移したと仮定すると、イベントメッセージ保持部233内には、例えば図6に示すように、イベント60〜64が格納される。図6に示す例では、説明を簡単にするために、それぞれのイベントメッセージは、発行された順でイベントメッセージ保持部233内に格納されているものと仮定している。なお、それぞれのイベントメッセージは、番号やタイムスタンプ等が付加されることにより発行された順番がわかるようにイベントメッセージ保持部233内に格納されていればよく、必ずしも発行された順番でイベントメッセージ保持部233内に格納されている必要はない。
次に、イベントフィルタリング部231は、イベント対応表格納部230を参照して、イベントメッセージ保持部233内の最も古いイベントメッセージ(図6ではイベント60)の発行前状態65を取得する。この状態S−001は、イベント60を発行する前の状態であり、図5ではCPU使用率が70%を超えていた状態に相当する。つまり、前回供給されたイベントメッセージが到着した後の状態を意味している。そして、イベントフィルタリング部231は、イベント対応表格納部230を参照して、イベントメッセージ保持部233内の2番目に古いイベントメッセージ以降(図6の例ではイベント61〜64)について、当該イベントメッセージが発行された後のIT業務システム40の状態(図6の例では発行後状態66〜69)をそれぞれ取得する。
そして、イベントフィルタリング部231は、発行前状態65と発行後状態66〜69とをそれぞれ比較する。図6に示す例では、イベントフィルタリング部231は、発行前状態65と発行後状態68との一致を検出し、発行前状態65および発行後状態66〜68に対応するイベントメッセージ60〜63をイベントメッセージ保持部233から削除する。
ここで、イベントメッセージ60〜63を削除することの意味を、図5を用いて説明する。イベントメッセージ60〜63、それぞれの監視対象の状態は、S−001からS−002へ、S−002からS−003へ、S−003からS−002へ、S−002からS−001へ、S−001からS−002へと遷移する。現状(最終状態)はS−002であることから、CPU使用率の状態が、初期状態65(イベントメッセージ60発行前)のS−001から最終状態のS−002に、直接、遷移したものとして扱っても、イベント処理上は問題が無い。システムは、計算機リソースの不要な増減処理を行わずに済む。つまり途中の状態であるS−002、S−003、S−002、S−001への対処処理を省略できる。このことは、初期状態65に続く4つの遷移状態に対応する4つのイベントメッセージ60〜63を、イベント処理部の処理対象から削除したことに等しい。
イベントメッセージ60の発行後の状態は、S−002である。これは一致不一致の検証に含めていない(図6)。この状態についての削除の可否は、イベントメッセージ60を削除できるか否かに関係する。イベントメッセージ60発行前のシステムの初期状態S−001を、別途、検証することにより一義的に決まるため、イベントメッセージ60を削除できるか否か、図6の検証で行う必要はない。また、イベントメッセージ60の発行前後で、システムの状態は異なるのが通常であり、図6で、一致不一致の検証をする必要は無い。
その後、図6に示す例では、イベントメッセージ保持部233内に残っているイベントメッセージがイベントメッセージ64の1個になるので、イベントフィルタリング部231はこれ以上のイベントメッセージの削除は不要と判断し、この残ったイベントメッセージ64を、次回イベント処理部232へ供給するイベントメッセージとして選択する。なお、イベントメッセージを削除した後に、イベントメッセージ保持部233内に複数のイベントメッセージが残っている場合、イベントフィルタリング部231は、イベントメッセージ保持部233内の残りのイベントメッセージについて、イベントメッセージが発行された後のIT業務システム40の状態が、イベントメッセージ保持部233内の最も古いイベントメッセージが発行される前のIT業務システム40の状態と一致するイベントメッセージを検索する処理を再び実行する。
このように、IT業務システム40の状態が遷移したことによってイベントメッセージが発行されたものの、そのイベントメッセージに対応する処理を実行するより前に、IT業務システム40の状態が、そのイベントメッセージが発行される前の状態に既に遷移してしまった場合に、イベント処理システム23は、その間に発行されたイベントメッセージに対応する処理を実行しない。これにより、イベント処理システム23は、短時間に発行された多くのイベントメッセージを迅速に処理できると共に、それぞれのイベントメッセージに対応して実行すべきIT業務システム40の制御を確実に実行することができる。
サービスレベルに応じて、業務アプリケーションに対して割り当てる計算機リソースを動的に変更するようなIT管理システムにおいては、イベントメッセージ61やイベントメッセージ63に対応した、無駄な対処処理を抑制できる。対処処理に長時間を要するWebサーバの不要な追加・削減処理を排除できる。
図7は、監視対象制御システム20の動作の一例を示すフローチャートである。例えば、監視対象制御システム20の稼動が開始することにより、監視対象制御システム20は、本フローチャートに示す処理を開始する。なお、以下では、説明を簡単にするために、イベント処理システム23が1つの場合について説明する。
まず、イベントメッセージ供給部21は、イベントメッセージキュー22内にイベントメセージが格納されているか否かを判定する(S100)。イベントメッセージキュー22内にイベントメッセージが格納されていない場合(S100:No)、イベントフィルタリング部231は、ステップS102に示す処理を実行する。
イベントメッセージキュー22内にイベントメッセージが格納されている場合(S100:Yes)、イベントメッセージ供給部21は、イベントメッセージキュー22からイベントメッセージを取得し、取得したそれぞれのイベントメッセージのイベントIDを参照して、当該イベントメッセージを処理するイベント処理システム23へ、当該イベントメッセージを、発行された順番に供給する。イベント処理システム23内のイベントメッセージ保持部233は、イベントメッセージ供給部21から供給されたイベントメッセージを、取得して保持する(S101)。
次に、イベントフィルタリング部231は、イベント処理部232がイベントメッセージの処理中であるか否かを判定する(S102)。イベント処理部232がイベントメッセージの処理中である場合(S102:Yes)、イベントメッセージ供給部21は、再びステップS100に示した処理を実行する。
イベント処理部232がイベントメッセージの処理中でない場合(S102:No)、イベントフィルタリング部231は、イベントメッセージ保持部233内に未処理のイベントメッセージが存在するか否かを判定する(S103)。未処理のイベントメッセージがイベントメッセージ保持部233内に存在しない場合(S103:No)、イベントメッセージ供給部21は、再びステップS100に示した処理を実行する。
なお、以上のS100〜101のステップは、イベントメッセージキュー22を有する実施例での処理ステップであり、その本質は、監視システム30からのイベントメッセージの通知待ちの処理である。
イベントメッセージキュー22を有しない実施例では、監視システム30から監視対象制御システム20にイベントメッセージの通知があると、イベントメッセージ供給部21は、受信したイベントメッセージをイベント処理システム23に供給し、S100〜101のステップを省略して、S102のステップ以降を実行する。この方法の詳細は、管理対象制御システム20がイベントメッセージを受信する処理の実装方法に依存する。
本発明は、イベントメッセージキュー22の有無に拘わらず適用可能であり、その効果も同様に得られる。
未処理のイベントメッセージがイベントメッセージ保持部233内に存在する場合(S103:Yes)、イベントフィルタリング部231は、イベントメッセージ保持部233内の最も古いイベントメッセージの発行前状態をイベント対応表格納部230から取得する(S104)。そして、イベントフィルタリング部231は、2番目に古いイベントメッセージを選択し(S105)、選択したイベントメッセージの発行後状態をイベント対応表格納部230から取得する(S106)。S104の詳細フローを図10に、S106の詳細を図11に示す。
監視対象制御システム20は、最も古いイベントメッセージが発行される前のIT業務システム40の状態を取得するステップ(図7、S104)で、イベントメッセージ保持部233から最も古いイベントメッセージを取得し(図10、S1001)、そのイベントメッセージからイベントIDを取得し(S1002)、イベント対応表格納部230に格納されたイベント対応表(図4)から、取得したイベントIDに対応する発行後状態を取得する(S1003)。
監視対象制御システム20は、選択したイベントメッセージが発行された後のIT業務システム40の状態を取得するステップ(図7、S106)で、選択したイベントメッセージからイベントIDを取得し(図11、S1101)、イベント対応表格納部230に格納されたイベント対応表(図4)から、取得したイベントIDに対応する発行後状態を取得する(S1102)。
監視対象制御システム20は、ステップS104(図7)で、M−001_Rに対応するイベントメッセージ60の発行前状態65(図6)、つまりS−001を取得し、ステップS105で、M−002_Rに対応する2番目に古いイベントメッセージ61の発行後状態66、つまりS−003を取得する。
次に、イベントフィルタリング部231は、ステップS104において取得した発行前状態と、ステップS106において取得した発行後状態とが一致したか否かを判定する(S107)。ステップS104において取得した発行前状態と、ステップS106において取得した発行後状態とが一致した場合(S107:Yes)、イベントフィルタリング部231は、イベントメッセージ保持部233内の最も古いイベントメッセージ、発行後状態がステップS104で取得した発行前状態と一致したイベントメッセージ、およびこれらのイベントメセージの間に発行されたイベントメッセージを、イベントメッセージ保持部233から削除する(S108)。
ステップS104で取得したイベントメッセージ60の発行前状態65(図6)と、ステップS106で取得したイベントメッセージ63の発行後状態68とが、ステップS107の3度目の処理で一致し、この結果、ステップS107がYesとなり、イベントメッセージ60〜63を削除する(ステップS108)。
次に、イベントフィルタリング部231は、イベントメッセージ保持部233内に2個以上のイベントメッセージが残っているか否かを判定する(S109)。2個以上のイベントメッセーがイベントメッセージ保持部233内に残っている場合(S109:Yes)、イベントフィルタリング部231は、再びステップS104に示した処理を実行する。
図6の例では、ステップS108で、イベントメッセージ60〜63が削除され、イベントメッセージ保持部233に残存するのは、イベントメッセージ64のみになった。もし、ステップS108の削除の結果、2以上のイベントメッセージが残存する場合は、S104からのステップを繰り返すことで、さらに削除できるイベントメッセージがないか、処理を繰り返す(S109)。
2個以上のイベントメッセーがイベントメッセージ保持部233内に残っていない場合(S109:No)、イベントフィルタリング部231は、イベントメッセージ保持部233内にイベントメッセージが残っているか否かを判定する(S110)。イベントメッセージ保持部233内にイベントメッセージが残っていない場合(S110:No)、イベントメッセージ供給部21は、再びステップS100に示した処理を実行する。イベントメッセージ保持部233内にイベントメッセージが残っている場合(S110:Yes)、イベントフィルタリング部231は、残っているイベントメッセージをイベント処理部232に供給し(S111)、イベントメッセージ供給部21は、再びステップS100に示した処理を実行する。
図6の例では、ステップS108で、イベントメッセージ60〜63が削除され、イベントメッセージ保持部233には、イベントメッセージ64だけが残っている。このため、ステップS109:NoかつステップS110:Yesとなるので、ステップS111で、イベントフィルタリング部231は、イベントメッセージ64をイベント処理部232に供給する。監視対象制御システム20は、ステップS111までには必ずステップS109の検証を行うので、ステップS110:Yesとなる場合に、イベントメッセージ保持部233に残存するイベントメッセージの数は、常に1つとなる。
ステップS104において取得した発行前状態と、ステップS106において取得した発行後状態とが一致しなかった場合(S107:No)、イベントフィルタリング部231は、イベントメッセージ保持部233内において、最も古いイベントメッセージ以外の全てのイベントメッセージについてステップS107の比較処理を実行したか否かを判定する(S112)。
図6の例では、ステップS104(図7)で取得した、最古のイベントメッセージ発行前のIT業務システムの状態65と、ステップS106で取得した、イベントメッセージ発行後の状態66〜67との比較がこれに相当する。最初のステップS106で取得される、イベントメッセージ61発行後の状態66はS−003であり、これと最古のイベントメッセージ発行前の状態65(S−001)を比較すると一致せず、ステップS107がNoとなり、次のステップへと進む。
イベントメッセージ保持部233内において、最も古いイベントメッセージ以外の全てのイベントメッセージについてステップS107の比較処理を実行した場合(S112:Yes)、イベントフィルタリング部231は、イベントメッセージ保持部233内の最も古いイベントメッセージをイベント処理部232へ供給し(S113)、イベントメッセージ供給部21は、再びステップS100に示した処理を実行する。
つまり、最古のイベントメッセージ発行前の状態65(図6、S−001)と一致する、イベントメッセージ発行後の状態が見つからず(図7、S107、No)、全てのイベントメッセージについての処理が終了した(S112、Yes)ならば、監視対象制御システム20は、最古のイベントメッセージ60をイベント処理部232に供給する。
イベントメッセージ保持部233内において、最も古いイベントメッセージ以外の全てのイベントメッセージについてステップS107の比較処理を実行していない場合(S112:No)、イベントフィルタリング部231は、次のイベントメッセージを選択して(S114)、再びステップS106に示した処理を実行する。
上記説明から明らかなように、本実施形態のイベント処理システム23によれば、イベントメッセージに対応した処理を確実に実行することができると共に、イベントメッセージの処理効率を向上させることができる。つまり、本発明をイベントドリブンのIT管理システムに用いることで、管理対象の実態とIT管理システムで把握する状態との間の不整合を防ぎ、不要な対処処理を回避することができる。
特に、サービスレベルに応じて、業務アプリケーションに対して割り当てる計算機リソースを動的に変更するようなIT管理システムにおいては、計算機リソースの追加と削減を連続して実行するような、不要な、かつ、処理に長時間を要する対処処理を省略できる。
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記した実施の形態に記載の範囲には限定されない。また、上記した実施の形態に、多様な変更または改良を加えることが可能であることが当業者にとって明らかである。さらに、そのような変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
本発明の一実施形態に係るサービス提供システム10の構成を示す。 イベントメッセージに含まれる情報の一例を示す。 イベント処理システム23の詳細な機能構成の一例を示す。 イベント対応表格納部230に格納されるデータの構造の一例を示す。 IT業務システム40の状態の遷移により発行されるイベントメッセーの一例を説明するための概念図である。 イベントフィルタリング部231によってイベントメッセージが削除される過程を説明するための概念図である。 監視対象制御システム20の動作の一例を示すフローチャートである。 イベントメッセージ供給部21に格納されるデータの構造を例示する図である。 イベントメッセージキュー22に、一時的に保持される情報を例示する図である。 イベントフィルタリング部231によってイベントメッセージが削除される過程のうち、最も古いイベントメッセージが発行される前のIT業務システム40の状態を取得する過程を説明するための概念図である。 イベントフィルタリング部231によってイベントメッセージが削除される過程のうち、選択したイベントメッセージが発行された後のIT業務システム40の状態を取得する過程を説明するための概念図である。 監視対象制御システム20等のハードウェア構成例を示す図である。
符号の説明
10・・・サービス提供システム、11・・・管理ネットワーク、12・・・業務ネットワーク、13・・・情報通信機器、20・・・監視対象制御システム、21・・・イベントメッセージ供給部、22・・・イベントメッセージキュー、23・・・イベント処理システム、230・・・イベント対応表格納部、2300、50・・・イベントID、2301・・・発行前状態、2302・・・発行後状態、231・・・イベントフィルタリング部、232・・・イベント処理部、233・・・イベントメッセージ保持部、24・・イベントログ収集部、30・・・監視システム、31・・・レスポンスタイム監視部、32・・・CPU使用率監視部、33・・・ディスク使用率監視部、40・・・IT業務システム、41・・・ロードバランサ、42、43・・・Webサーバ、44・・・DBサーバ、51・・・イベント発行時刻、52・・・状態遷移機器ID、60、61、62、63、64・・・イベント、65・・・発行前状態、66、67、68、69・・・発行後状態。

Claims (15)

  1. 監視対象システムの状態が遷移する都度、その遷移内容を特定するイベントメッセージを監視システムから受信し、受信したイベントメッセージに応じて当該監視対象システムを制御するイベント処理システムであって、
    前記監視システムによって発行されたイベントメッセージを保持して、発行された順に出力するイベントメッセージ保持手段と、
    前記イベントメッセージ保持手段から出力されたイベントメッセージを処理することにより、前記監視対象システムを制御するイベント処理手段と、
    前記イベントメッセージ保持手段内のイベントメッセージの中で、処理が必要なイベントメッセージを選択して前記イベント処理手段へ供給するイベントフィルタリング手段とを備え、
    前記イベントフィルタリング手段は、
    前記イベントメッセージ保持手段に保持されているイベントメッセージの中から、イベントメッセージが発行された後の前記監視対象システムの状態が、前記イベントメッセージ保持手段に格納されている、最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するイベントメッセージを検索し、
    当該イベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該検索できたイベントメッセージまでの各イベントメッセージを、前記イベントメッセージ保持手段から削除するフィルタリング処理を実行すること
    を特徴とするイベント処理システム。
  2. 請求項1に記載のイベント処理システムであって、
    前記イベントフィルタリング手段は、
    前記イベントメッセージ保持手段に保持されたn個のイベントメッセージについて、イベントメッセージが発行された後の前記監視対象システムの状態が、前記イベントメッセージ保持手段に格納されている、最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するk(1<k≦n)番目のイベントメッセージを検索できた場合、当該最も古いイベントメッセージからk番目のイベントメッセージまでを前記イベントメッセージ保持手段から削除し、前記イベントメッセージ保持手段内の残りのイベントメッセージについて、前記フィルタリング処理を再度実行すること
    を特徴とするイベント処理システム。
  3. 請求項1または2に記載のイベント処理システムであって、
    前記イベントフィルタリング手段は、
    前記イベント処理手段による、前回供給されたイベントメッセージの処理が終了した場合に、前記フィルタリング処理を実行すること
    を特徴とするイベント処理システム。
  4. 請求項1から3のいずれか1項に記載のイベント処理システムであって、
    前記イベントメッセージには、少なくともそれぞれのイベントメッセージを識別するイベント識別子が含まれ、
    前記イベント処理システムは、
    イベントメッセージが発行される前の前記対象システムの状態である発行前状態およびイベントメッセージが発行された後の前記対象システムの状態である発行後状態を、それぞれのイベントメッセージのイベント識別子に対応付けて格納するイベント対応表格納手段をさらに備え、
    前記イベントフィルタリング手段は、
    前記イベントメッセージ保持手段内のイベントメッセージに含まれるイベント識別子に基づいて前記イベント対応表格納手段を参照して、イベントメッセージが発行される前の前記監視対象システムの状態、および、イベントメッセージが発行された後の前記監視対象システムの状態を取得することを特徴とするイベント処理システム。
  5. 監視対象システムの状態が遷移する都度、その遷移内容を特定するイベントメッセージを監視システムから受信し、受信したイベントメッセージに応じて当該監視対象システムを制御するイベント処理システムにおけるイベント処理方法であって、
    前記イベント処理システムが、
    前記監視システムによって発行されたイベントメッセージをイベントメッセージ保持手段に保持するステップと、
    前記イベントメッセージ保持手段に保持されているイベントメッセージの中から、イベントメッセージが発行された後の前記監視対象システムの状態が、前記イベントメッセージ保持手段に格納されている、最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するイベントメッセージを検索するステップと、
    当該イベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該検索できたイベントメッセージまでの各イベントメッセージを、前記イベントメッセージ保持手段から削除するステップと
    を実行することを特徴とするイベント処理方法。
  6. 監視対象システムの状態が遷移する都度、その遷移内容を特定するイベントメッセージを監視システムから受信し、受信したイベントメッセージに応じて当該監視対象システムを制御するイベント処理システムにおけるイベント処理方法であって、
    前記イベント処理システムが、
    前記監視システムによって発行されたイベントメッセージをイベントメッセージ保持手段に保持する第1のステップと、
    前記イベントメッセージ保持手段に保持されたn個のイベントメッセージについて、イベントメッセージが発行された後の前記監視対象システムの状態が、前記イベントメッセージ保持手段に格納されている、最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するk(1<k≦n)番目のイベントメッセージを検索する第2のステップと、
    第2のステップでk番目のイベントメッセージを検索できた場合に、前記最も古いイベントメッセージから当該k番目のイベントメッセージまでを、前記イベントメッセージ保持手段から削除する第3のステップと、
    前記イベントメッセージ保持手段内の残りのイベントメッセージについて、前記第1のステップないし第3のステップを繰り返す第4のステップと、
    を実行することを特徴とするイベント処理方法。
  7. 請求項6に記載のイベント処理方法あって、
    第3のステップないし第4のステップで、前記最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するイベントメッセージが検索されなかった場合には、前記イベントメッセージ保持手段内の残りのイベントメッセージのうち、最も古いイベントメッセージに応じて、前記監視対象システムを制御する第5のステップと、
    を実行するイベント処理方法。
  8. 監視対象システムの状態が遷移する都度、その遷移内容を特定するイベントメッセージを監視システムから受信し、受信したイベントメッセージに応じて当該監視対象システムを制御するイベント処理装置であって、
    前記監視システムによって発行されたイベントメッセージを保持して、発行された順に出力するイベントメッセージ保持部と、
    前記イベントメッセージ保持部から出力されたイベントメッセージを処理することにより、前記監視対象システムを制御するイベント処理部と、
    前記イベントメッセージ保持部のイベントメッセージの中で、処理が必要なイベントメッセージを選択して前記イベント処理部へ供給するイベントフィルタリング部とを備え、
    前記イベントフィルタリング部は、
    前記イベントメッセージ保持部に保持されたn個のイベントメッセージについて、イベントメッセージが発行された後の前記監視対象システムの状態が、前記イベントメッセージ保持部に格納されている、最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するk(1<k≦n)番目のイベントメッセージを検索し、
    当該k番目のイベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該k番目のイベントメッセージまでを前記イベントメッセージ保持部から削除するフィルタリング処理を実行すること
    を特徴とするイベント処理装置。
  9. 請求項8に記載のイベント処理装置であって、
    前記イベントフィルタリング部は、
    前回のフィルタリング処理の終了後、前記イベントメッセージ保持部にイベントメッセージが残っている場合、当該残っているイベントメッセージについて、前記フィルタリング処理を繰り返し実行すること
    を特徴とするイベント処理装置。
  10. 請求項8に記載のイベント処理装置であって、
    前記イベントフィルタリング部は、
    前記最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するイベントメッセージが検索されなかった場合には、前記フィルタリング処理を終了し、
    前記イベントメッセージ保持部に残っているイベントメッセージのうち、最も古いイベントメッセージを前記イベント処理部に供給すること
    を特徴とするイベント処理装置。
  11. 請求項8に記載のイベント処理装置であって、
    前記イベントフィルタリング部は、
    前記イベント処理部により、前回、供給されたイベントメッセージの処理が終了した場合に、前記イベントメッセージ保持部にイベントメッセージが1つ残っているときは、当該残っているイベントメッセージについて、前記フィルタリング処理を実行すること
    を特徴とするイベント処理装置。
  12. 監視対象システムの状態が遷移する都度、その遷移内容を特定するイベントメッセージを監視システムから受信し、受信したイベントメッセージに応じて当該監視対象システムを制御するイベント処理装置を動作させる、イベント処理プログラムであって、
    前記監視システムによって発行されたイベントメッセージを保持して、発行された順に出力するイベントメッセージ保持モジュールと、
    前記イベントメッセージ保持モジュールから出力されたイベントメッセージを処理することにより、前記監視対象システムを制御するイベント処理モジュールと、
    前記イベントメッセージ保持モジュールのイベントメッセージの中で、処理が必要なイベントメッセージを選択して前記イベント処理モジュールへ供給するイベントフィルタリングモジュールとを備え、
    前記イベントフィルタリングモジュールは、
    前記イベントメッセージ保持モジュールに保持されたn個のイベントメッセージについて、イベントメッセージが発行された後の前記監視対象システムの状態が、前記イベントメッセージ保持モジュールに格納されている、最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するk(1<k≦n)番目のイベントメッセージを検索し、
    当該k番目のイベントメッセージを検索できた場合に、当該最も古いイベントメッセージから当該k番目のイベントメッセージまでを前記イベントメッセージ保持モジュールから削除するフィルタリング処理を実行すること
    を特徴とするイベント処理プログラム。
  13. 請求項12に記載のイベント処理プログラムであって、
    前記イベントフィルタリングモジュールは、
    前回のフィルタリング処理の終了後、前記イベントメッセージ保持モジュールにイベントメッセージが残っている場合、当該残っているイベントメッセージについて、前記フィルタリング処理を繰り返し実行すること
    を特徴とするイベント処理プログラム。
  14. 請求項12に記載のイベント処理プログラムであって、
    前記イベントフィルタリングモジュールは、
    前記最も古いイベントメッセージが発行される前の前記監視対象システムの状態と一致するイベントメッセージが検索されなかった場合には、前記フィルタリング処理を終了し、
    前記イベントメッセージ保持モジュールに残っているイベントメッセージのうち、最も古いイベントメッセージを前記イベント処理モジュールに供給すること
    を特徴とするイベント処理プログラム。
  15. 請求項12に記載のイベント処理プログラムであって、
    前記イベントフィルタリングモジュールは、
    前記イベント処理モジュールにより、前回、供給されたイベントメッセージの処理が終了した場合に、前記イベントメッセージ保持モジュールにイベントメッセージが1つ残っているときは、当該残っているイベントメッセージについて、前記フィルタリング処理を実行すること
    を特徴とするイベント処理プログラム。
JP2006096405A 2005-12-08 2006-03-31 イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム Expired - Fee Related JP4760491B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006096405A JP4760491B2 (ja) 2005-12-08 2006-03-31 イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム
US11/471,480 US20070150571A1 (en) 2005-12-08 2006-06-21 System, method, apparatus and program for event processing

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005354487 2005-12-08
JP2005354487 2005-12-08
JP2006096405A JP4760491B2 (ja) 2005-12-08 2006-03-31 イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム

Publications (2)

Publication Number Publication Date
JP2007183904A true JP2007183904A (ja) 2007-07-19
JP4760491B2 JP4760491B2 (ja) 2011-08-31

Family

ID=38195221

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006096405A Expired - Fee Related JP4760491B2 (ja) 2005-12-08 2006-03-31 イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム

Country Status (2)

Country Link
US (1) US20070150571A1 (ja)
JP (1) JP4760491B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015092420A (ja) * 2015-02-17 2015-05-14 株式会社日立製作所 監視計算機及び方法

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8347268B2 (en) * 2006-10-13 2013-01-01 Infosys Limited Automated performance monitoring
KR100849066B1 (ko) * 2007-02-06 2008-07-30 주식회사 하이닉스반도체 실린더형 엠아이엠 캐패시터 형성방법
US8984133B2 (en) 2007-06-19 2015-03-17 The Invention Science Fund I, Llc Providing treatment-indicative feedback dependent on putative content treatment
US20090063585A1 (en) * 2007-08-31 2009-03-05 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Using party classifiability to inform message versioning
US9374242B2 (en) 2007-11-08 2016-06-21 Invention Science Fund I, Llc Using evaluations of tentative message content
US20080320088A1 (en) * 2007-06-19 2008-12-25 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Helping valuable message content pass apparent message filtering
US20090063632A1 (en) * 2007-08-31 2009-03-05 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Layering prospective activity information
US20090063631A1 (en) * 2007-08-31 2009-03-05 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Message-reply-dependent update decisions
US8763006B2 (en) 2007-12-28 2014-06-24 International Business Machines Corporation Dynamic generation of processes in computing environments
US8346931B2 (en) * 2007-12-28 2013-01-01 International Business Machines Corporation Conditional computer runtime control of an information technology environment based on pairing constructs
US8677174B2 (en) * 2007-12-28 2014-03-18 International Business Machines Corporation Management of runtime events in a computer environment using a containment region
US8826077B2 (en) * 2007-12-28 2014-09-02 International Business Machines Corporation Defining a computer recovery process that matches the scope of outage including determining a root cause and performing escalated recovery operations
US8751283B2 (en) 2007-12-28 2014-06-10 International Business Machines Corporation Defining and using templates in configuring information technology environments
US20090171731A1 (en) * 2007-12-28 2009-07-02 International Business Machines Corporation Use of graphs in managing computing environments
US8341014B2 (en) * 2007-12-28 2012-12-25 International Business Machines Corporation Recovery segments for computer business applications
US20090172149A1 (en) 2007-12-28 2009-07-02 International Business Machines Corporation Real-time information technology environments
US8682705B2 (en) 2007-12-28 2014-03-25 International Business Machines Corporation Information technology management based on computer dynamically adjusted discrete phases of event correlation
US8326910B2 (en) * 2007-12-28 2012-12-04 International Business Machines Corporation Programmatic validation in an information technology environment
US8365185B2 (en) 2007-12-28 2013-01-29 International Business Machines Corporation Preventing execution of processes responsive to changes in the environment
US8868441B2 (en) * 2007-12-28 2014-10-21 International Business Machines Corporation Non-disruptively changing a computing environment
US8375244B2 (en) * 2007-12-28 2013-02-12 International Business Machines Corporation Managing processing of a computing environment during failures of the environment
US20090172669A1 (en) * 2007-12-28 2009-07-02 International Business Machines Corporation Use of redundancy groups in runtime computer management of business applications
US8447859B2 (en) * 2007-12-28 2013-05-21 International Business Machines Corporation Adaptive business resiliency computer system for information technology environments
US9558459B2 (en) 2007-12-28 2017-01-31 International Business Machines Corporation Dynamic selection of actions in an information technology environment
US8782662B2 (en) * 2007-12-28 2014-07-15 International Business Machines Corporation Adaptive computer sequencing of actions
US8428983B2 (en) * 2007-12-28 2013-04-23 International Business Machines Corporation Facilitating availability of information technology resources based on pattern system environments
US8990810B2 (en) * 2007-12-28 2015-03-24 International Business Machines Corporation Projecting an effect, using a pairing construct, of execution of a proposed action on a computing environment
US8352609B2 (en) 2009-09-29 2013-01-08 Amazon Technologies, Inc. Dynamically modifying program execution capacity
US8689225B2 (en) 2009-09-29 2014-04-01 Amazon Technologies, Inc. Attributing causality to program execution capacity modifications
US8880679B2 (en) * 2009-12-07 2014-11-04 Oracle International Corporation Techniques for web server management
US9954718B1 (en) * 2012-01-11 2018-04-24 Amazon Technologies, Inc. Remote execution of applications over a dispersed network
JP5924073B2 (ja) * 2012-03-30 2016-05-25 富士通株式会社 制御プログラム、制御方法および制御装置
US10555145B1 (en) 2012-06-05 2020-02-04 Amazon Technologies, Inc. Learned configuration of modification policies for program execution capacity
US8989367B2 (en) * 2012-09-12 2015-03-24 Genesys Telecommunications Laboratories, Inc. System and method for monitoring health of deployment states for a contact center
US9912812B2 (en) 2012-11-21 2018-03-06 Genesys Telecommunications Laboratories, Inc. Graphical user interface for configuring contact center routing strategies
US9912813B2 (en) 2012-11-21 2018-03-06 Genesys Telecommunications Laboratories, Inc. Graphical user interface with contact center performance visualizer
US20160036985A1 (en) * 2014-07-30 2016-02-04 Nir Koren Real-time rule-based recovery platform
US10599478B1 (en) * 2016-03-29 2020-03-24 Amazon Technologies, Inc. Automated reconfiguration of real time data stream processing
CN112907406B (zh) * 2021-02-07 2022-04-08 北京科技大学 一种基于云端融合多模态分析的在线学习系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02247745A (ja) * 1989-03-20 1990-10-03 Fujitsu Ltd ロギング処理方式
JP2000278361A (ja) * 1999-03-23 2000-10-06 Nec Corp ネットワーク管理システム及びその方法
JP2002091837A (ja) * 2000-09-18 2002-03-29 Nec Eng Ltd 監視データ処理方法、監視データ処理装置及び監視データ処理プログラムを記録した記録媒体
JP2002149472A (ja) * 2000-08-29 2002-05-24 Fujitsu Ltd 情報管理装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0816877B2 (ja) * 1991-06-10 1996-02-21 インターナショナル・ビジネス・マシーンズ・コーポレイション データ処理システム用資源データの実時間捕獲及び減縮方法及びシステム
US6145009A (en) * 1997-05-20 2000-11-07 Kabushiki Kaisha Toshiba Event controlling system for integrating different event driven systems
US6374367B1 (en) * 1997-11-26 2002-04-16 Compaq Computer Corporation Apparatus and method for monitoring a computer system to guide optimization
US6862732B1 (en) * 1998-02-25 2005-03-01 Metaserver, Inc. Method and apparatus for event-driven processing of data
GB2372671B (en) * 2001-02-27 2003-04-30 3Com Corp Processing network events to reduce the number of events to be displayed
US7289988B2 (en) * 2003-07-08 2007-10-30 Hewlett-Packard Development Company, L.P. Method and system for managing events
US20060064481A1 (en) * 2004-09-17 2006-03-23 Anthony Baron Methods for service monitoring and control

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02247745A (ja) * 1989-03-20 1990-10-03 Fujitsu Ltd ロギング処理方式
JP2000278361A (ja) * 1999-03-23 2000-10-06 Nec Corp ネットワーク管理システム及びその方法
JP2002149472A (ja) * 2000-08-29 2002-05-24 Fujitsu Ltd 情報管理装置
JP2002091837A (ja) * 2000-09-18 2002-03-29 Nec Eng Ltd 監視データ処理方法、監視データ処理装置及び監視データ処理プログラムを記録した記録媒体

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015092420A (ja) * 2015-02-17 2015-05-14 株式会社日立製作所 監視計算機及び方法

Also Published As

Publication number Publication date
JP4760491B2 (ja) 2011-08-31
US20070150571A1 (en) 2007-06-28

Similar Documents

Publication Publication Date Title
JP4760491B2 (ja) イベント処理システム、イベント処理方法、イベント処理装置、及び、イベント処理プログラム
CN108376118B (zh) 服务发布系统、方法、设备及存储介质
US8838674B2 (en) Plug-in accelerator
US9870269B1 (en) Job allocation in a clustered environment
CN106817408B (zh) 一种分布式服务器集群调度方法及装置
US9367261B2 (en) Computer system, data management method and data management program
WO2007142053A1 (ja) 監視装置、監視システム、監視方法およびプログラム
JP2009288836A (ja) 仮想サーバのシステム障害回復方法及びそのシステム
JP2012079242A (ja) 複合イベント分散装置、複合イベント分散方法および複合イベント分散プログラム
US20080115128A1 (en) Method, system and computer program product for implementing shadow queues for recovery of messages
CN110858194A (zh) 一种数据库扩容的方法和装置
US8930518B2 (en) Processing of write requests in application server clusters
CN110727508A (zh) 一种任务调度系统和调度方法
CN111897643B (zh) 线程池配置系统、方法、装置和存储介质
CN110519354A (zh) 一种分布式对象存储系统及其业务处理方法和存储介质
US7313657B1 (en) Conflict avoidance in data store replication
CN109951551B (zh) 一种容器镜像管理系统及方法
WO2017157111A1 (zh) 防止内存数据丢失的的方法、装置和系统
US9853933B2 (en) Message queue replication with message ownership migration
US20070174836A1 (en) System for controlling computer and method therefor
CN111625344B (zh) 应用系统中的资源调度系统、方法及装置
CN109962941B (zh) 通信方法、装置以及服务器
CN116055499A (zh) 基于redis的集群任务智能化调度方法、设备、介质
CN115858499A (zh) 一种数据库分区处理方法、装置、计算机设备和存储介质
CN112685157B (zh) 任务处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081212

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110328

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110523

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4760491

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees