JP6878984B2 - 監視プログラム、監視方法および監視装置 - Google Patents
監視プログラム、監視方法および監視装置 Download PDFInfo
- Publication number
- JP6878984B2 JP6878984B2 JP2017058207A JP2017058207A JP6878984B2 JP 6878984 B2 JP6878984 B2 JP 6878984B2 JP 2017058207 A JP2017058207 A JP 2017058207A JP 2017058207 A JP2017058207 A JP 2017058207A JP 6878984 B2 JP6878984 B2 JP 6878984B2
- Authority
- JP
- Japan
- Prior art keywords
- event
- monitoring
- pattern
- server
- events
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Description
図1は、実施例1にかかるシステムの全体構成例を示す図である。図1に示すように、このシステムは、業務サーバ群1と監視装置10と運用管理装置50とがネットワークNを介して接続される。なお、ネットワークNは、有線や無線を問わず、インターネットや専用線などの各種ネットワークを採用することができる。また、監視装置10と運用管理装置50とは、別々の筐体で実現することもでき、同じ筐体で実現することもできる。
図4は、実施例1にかかる監視装置の機能構成を示す機能ブロック図である。図4に示すように、監視装置10は、通信部11、記憶部12、制御部15を有する。
図6は、実施例1にかかる運用管理装置の機能構成を示す機能ブロック図である。図6に示すように、運用管理装置50は、通信部51、記憶部52、制御部70を有する。
ワークフロー実行部71は、ワークフローを実行する処理部である。具体的には、ワークフロー実行部71は、予め定めた時間に到達した場合やメンテナンス実行者によって開始が指示された場合、図7に示すワークフロー管理DB53に記憶されるワークフローの中から、該当するワークフローをStartノードからENDノードまで順に実行する。
フィルタリング処理部80は、ワークフローの実行を起因とする監視イベントの出力を抑制するフィルタを生成する処理部である。フィルタリング処理部80は、イベントパターン読込部81、イベントパターン生成部82、突合処理部83、信頼度判定部84、一致判定部85、フィルタリング更新部86を、イベントパターン更新部87を有する。
イベントパターン読込部81は、イベントパターン管理DB57からイベントパターンの読み込みを実行する処理部である。具体的には、イベントパターン読込部81は、指定されたワークフローNoとインスタンスNoとノード位置から、インスタンス管理DB55および変数管理DB54を検索して、ノードの遷移ルートや設定された変数(対象サーバや制御対象のリソースなど)を取得する。
イベントパターン生成部82は、イベントパターン読込部81が読み込む対象のイベントパターンがない場合の初回時に、イベントパターンを生成する処理部である。具体的には、イベントパターン生成部82は、ワークフローの開始から終了までに発生した監視イベントをグループ化するイベントグループの生成と、過去のワークフロー実行時に発生した監視イベントに基づくイベントグループの生成とを実行する。
図6に戻り、突合処理部83は、イベントパターン読込部81によってイベントパターンが読み込まれた場合に、ワークフロー管理DB53に記憶される情報と監視イベント管理DB56に記憶される情報を突き合せ、運用操作実行中に発生した監視イベント一覧を取得する処理部である。具体的には、突合処理部83は、運用操作を行った日時をスタートして、ワークフローと発生した監視イベントとの突合を行い、イベントグループを生成する。
信頼度判定部84は、イベントパターン読込部81で読み込まれたイベントパターンの信頼度が閾値以上か否かを判定する処理部である。具体的には、信頼度判定部84は、該当するイベントパターンに設定されるデータNoを特定する。続いて、信頼度判定部84は、特定したデータNoに該当するパターンデータをパターンデータ管理DB59から検索する。そして、信頼度判定部84は、検索されたパターンデータに設定される信頼度が閾値以上か否かを判定する。
一致判定部85は、イベントパターン読込部81によって新たに生成されたイベントグループと、イベントパターン読込部81によってイベントパターン管理DB57から読み込まれたイベントパターンとの一致判定を行い、類似度を計算する処理部である。具体的には、一致判定部85は、ワークフローの実行によって発生したイベントグループと、イベントパターン管理DB57に登録されるイベントパターンとを照合し、過去の運用操作によって発生したイベントを検出する。イベントグループはノードごとに分割されているので、一致判定部85は、各ノードの運用操作部品のイベントグループとそれぞれ一致判定をする。一致判定部85は、この判定の確からしさは類似度として計算する。過去のデータと一致しない場合、類似度は低くなる。
図6に戻り、フィルタリング更新部86は、一致判定によって運用操作に伴って発生した監視イベントの表示抑制を実行するフィルタリングデータ(フィルタ)を作成または更新する処理部である。具体的には、フィルタリング更新部86は、信頼度判定部84によって信頼度が閾値以上と判定され、一致判定部85によって類似度が閾値以上と判定された監視イベントのイベントパターンの表示を抑制するためのフィルタルールを生成したり、既存のフィルタに当該フィルタルールを追加したりする。
イベントパターン更新部87は、今回のワークフローの対象としたイベントグループの情報を用いて、イベントパターンを更新する処理部である。イベントパターンは、必ずしもワークフローの開始に伴って再作成しなくてもよい。あらかじめ作成済みのイベントパターンは、イベントパターン管理DB57に登録してあるので、これを更新することで計算量や計算時間を低減することができる。このような差分アップデートの場合、作成済みのイベントパターンと発生したイベントグループの比較または統合によって、イベントパターンを更新する。なお、 通常は登録済みイベントパターンを用いて計算し、これとは別に定期的にイベントパターンを再作成することで、「過去に発生していた監視イベント」を最新に保つことができる。
イベントパターン更新部87は、ワークフローの実行に依存することなく、予め指定した間隔や管理者が指定した間隔で、イベントパターン管理DB57に記憶されるイベントパターンの再作成を実行する処理部である。
運用管理装置50は、メンテナンスなどの運用操作によって発生する監視イベントをパターン化して、イベントパターンとして記録できる。運用管理装置50は、上記イベントパターンの信頼度および、イベントパターンとの相関を示す類似度によって運用管理特有の情報の不確かさを表現することができる。運用管理装置50は、上記イベントパターンに基づいて、事前定義なしに指定のワークフローによって発生する監視イベントを抑制するフィルタリングルールを生成することができる。
一般的に、ワークフローで運用操作を行った場合、発生する監視イベントは、対象サーバから操作後すぐに発生するものだけでなく、関連するサーバやある程度時間が経ってから発生するものがある。部品の実行によって直接的に発生する監視イベントについては、操作と現象が明らかであることから、オペレータの負担も少なく、監視対象外と判定することができるが、部品の実行によって間接的に発生する監視イベントについては、オペレータで判断することが難しい。運用管理装置50では、イベントグループとして判定することで、監視イベントを統合的に判断するが、それでもまだ、ワークフローを実行するごとに異なるイベントグループが発生する可能性もある。
上記実施例では、信頼度を用いる例を説明したが、これに限定されるものではなく、例えば過去の実行回数などを用いることもでき、信頼度等の情報を用いずに、イベントパターンだけで判定することもできる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。なお、監視装置10と運用管理装置50は1つの筐体で実現することもできる。
運用管理装置50と監視装置10は、同様のハードウェア構成を有するので、ここでは、情報処理装置100として説明する。図26は、ハードウェア構成例を示す図である。図26に示すように、情報処理装置100は、通信インタフェース100a、HDD(Hard Disk Drive)100b、メモリ100c、プロセッサ100dを有する。
51 通信部
52 記憶部
53 ワークフロー管理DB
54 変数管理DB
55 インスタンス管理DB
56 監視イベント管理DB
57 イベントパターン管理DB
58 遷移ルート管理DB
59 パターンデータ管理DB
60 フィルタリング管理DB
71 ワークフロー実行部
80 フィルタリング処理部
81 イベントパターン読込部
82 イベントパターン生成部
83 突合処理部
84 信頼度判定部
85 一致判定部
86 フィルタリング更新部
87 イベントパターン更新部
Claims (6)
- サーバの監視に関するイベントを取得すると、取得した前記イベントに関する情報を端末に通知する監視プログラムにおいて、
前記サーバの運用に関する処理の識別情報と、該サーバの監視に関するイベントのうち該サーバの運用に関する処理の実行中に発生したイベントと、を取得し、
前記サーバの運用に関する処理で発生するイベントの発生パターンを示すイベントパターンごとに、当該イベントパターンに含まれる前記サーバの運用に関する処理に起因して発生したイベントと該処理の識別情報と前記イベントパターンの信頼度とを対応付けて記憶する記憶部を参照して、取得された各識別情報に対応付けられた各イベントの発生順に基づいて、前記イベントの通知判定に利用する該当イベントパターンを特定し、
前記該当イベントパターンの信頼度が閾値未満である場合には、取得された前記各イベントに関する情報の通知を実行し、前記該当イベントパターンの信頼度が閾値以上である場合には、取得した前記各イベントのうち、前記該当イベントパターンに含まれるイベントに関する情報の通知を抑制する、
処理をコンピュータに実行させることを特徴とする監視プログラム。 - 前記サーバの運用に関する処理である運用処理が過去に実行されたときに出力された複数のイベントを収集し、
収集された前記複数のイベントの種別および発生時刻にしたがって、前記運用処理に起因して発生するイベントの出力パターンを生成して前記記憶部に格納する処理を前記コンピュータにさらに実行させ、
前記特定する処理は、前記記憶部に記憶される複数のイベントパターンのうち、前記出力パターンに該当する前記該当イベントパターンを特定することを特徴とする請求項1に記載の監視プログラム。 - 前記格納する処理は、前記出力パターンに含まれる各イベントに対して、前記運用処理が過去に実行されたときに当該イベントが出力された出力回数に基づく信頼度を算出し、算出した信頼度を前記出力パターンの各イベントに対応付けて前記記憶部に格納し、
前記抑制する処理は、取得した前記運用処理の識別情報に対応付けられたイベントのうち、前記出力パターンに含まれる閾値以上の信頼度を有するイベントと一致するイベントに関する情報の通知を抑制することを特徴とする請求項2に記載の監視プログラム。 - 前記運用処理を新たに実行するたびに、前記運用処理の実行中に発生した複数のイベントを取得し、取得した前記複数のイベントの種別および発生時刻にしたがって、前記運用処理に起因して発生するイベントの出力パターンを生成し、
生成した前記出力パターンが前記記憶部に記憶されていない場合、前記運用処理を起因とするイベントの新たな出力パターンとして登録する処理を前記コンピュータにさらに実行させることを特徴とする請求項2または3に記載の監視プログラム。 - サーバの監視に関するイベントを取得すると、取得した前記イベントに関する情報を端末に通知する監視方法において、
前記サーバの運用に関する処理の識別情報と、該サーバの監視に関するイベントのうち該サーバの運用に関する処理の実行中に発生したイベントと、を取得し、
前記サーバの運用に関する処理で発生するイベントの発生パターンを示すイベントパターンごとに、当該イベントパターンに含まれる前記サーバの運用に関する処理に起因して発生したイベントと該処理の識別情報と前記イベントパターンの信頼度とを対応付けて記憶する記憶部を参照して、取得された各識別情報に対応付けられた各イベントの発生順に基づいて、前記イベントの通知判定に利用する該当イベントパターンを特定し、
前記該当イベントパターンの信頼度が閾値未満である場合には、取得された前記各イベントに関する情報の通知を実行し、前記該当イベントパターンの信頼度が閾値以上である場合には、取得した前記各イベントのうち、前記該当イベントパターンに含まれるイベントに関する情報の通知を抑制する、
処理をコンピュータが実行することを特徴とする監視方法。 - サーバの監視に関するイベントを取得すると、取得した前記イベントに関する情報を端末に通知する監視装置において、
前記サーバの運用に関する処理の識別情報と、該サーバの監視に関するイベントのうち該サーバの運用に関する処理の実行中に発生したイベントと、を取得する取得部と、
前記サーバの運用に関する処理で発生するイベントの発生パターンを示すイベントパターンごとに、当該イベントパターンに含まれる前記サーバの運用に関する処理に起因して発生したイベントと該処理の識別情報と前記イベントパターンの信頼度とを対応付けて記憶する記憶部を参照して、取得された各識別情報に対応付けられた各イベントの発生順に基づいて、前記イベントの通知判定に利用する該当イベントパターンを特定する特定部と、
前記該当イベントパターンの信頼度が閾値未満である場合には、取得された前記各イベントに関する情報の通知を実行し、前記該当イベントパターンの信頼度が閾値以上である場合には、取得した前記各イベントのうち、前記該当イベントパターンに含まれるイベントに関する情報の通知を抑制する抑制部と
を有することを特徴とする監視装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017058207A JP6878984B2 (ja) | 2017-03-23 | 2017-03-23 | 監視プログラム、監視方法および監視装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017058207A JP6878984B2 (ja) | 2017-03-23 | 2017-03-23 | 監視プログラム、監視方法および監視装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018160186A JP2018160186A (ja) | 2018-10-11 |
JP6878984B2 true JP6878984B2 (ja) | 2021-06-02 |
Family
ID=63796736
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017058207A Active JP6878984B2 (ja) | 2017-03-23 | 2017-03-23 | 監視プログラム、監視方法および監視装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6878984B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7003874B2 (ja) * | 2018-08-09 | 2022-01-21 | 日本電信電話株式会社 | リソース予約管理装置、リソース予約管理方法およびリソース予約管理プログラム |
CN110069378A (zh) * | 2019-03-16 | 2019-07-30 | 平安城市建设科技(深圳)有限公司 | 数据监控方法、装置、终端及计算机可读存储介质 |
JP7436002B2 (ja) | 2019-12-12 | 2024-02-21 | Necソリューションイノベータ株式会社 | 検出装置、検出方法、プログラム、及び記録媒体 |
WO2021152698A1 (ja) * | 2020-01-28 | 2021-08-05 | 三菱電機株式会社 | インシデント対応効率化システム、インシデント対応効率化方法およびインシデント対応効率化プログラム |
JP7012778B2 (ja) * | 2020-05-14 | 2022-01-28 | 株式会社日立製作所 | 監視システム、監視装置及び監視方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001125808A (ja) * | 1999-10-27 | 2001-05-11 | Nec Software Chubu Ltd | 障害識別方式 |
JP4944391B2 (ja) * | 2005-05-11 | 2012-05-30 | 富士通株式会社 | メッセージ異常自動判別装置、方法、及びプログラム |
WO2010131746A1 (ja) * | 2009-05-15 | 2010-11-18 | 日本電気株式会社 | 障害原因推定システム、障害原因推定方法、及び障害原因推定プログラム |
JP5541130B2 (ja) * | 2010-12-10 | 2014-07-09 | 富士通株式会社 | 管理装置、管理方法および管理用プログラム |
JP5609637B2 (ja) * | 2010-12-28 | 2014-10-22 | 富士通株式会社 | プログラム、情報処理装置、及び情報処理方法 |
US20120260251A1 (en) * | 2011-04-05 | 2012-10-11 | International Business Machines Corporation | Prevention of event flooding |
JP2014010666A (ja) * | 2012-06-29 | 2014-01-20 | Fujitsu Ltd | 情報出力装置、方法及びプログラム |
JP5983102B2 (ja) * | 2012-07-02 | 2016-08-31 | 富士通株式会社 | 監視プログラム、方法及び装置 |
-
2017
- 2017-03-23 JP JP2017058207A patent/JP6878984B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018160186A (ja) | 2018-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6878984B2 (ja) | 監視プログラム、監視方法および監視装置 | |
US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
US8984360B2 (en) | Data quality analysis and management system | |
JP5684946B2 (ja) | イベントの根本原因の解析を支援する方法及びシステム | |
US11157343B2 (en) | Systems and methods for real time computer fault evaluation | |
US20120278663A1 (en) | Operation management apparatus, operation management method, and program storage medium | |
JP4458493B2 (ja) | ログ通知条件定義支援装置とログ監視システムおよびプログラムとログ通知条件定義支援方法 | |
CN109614283B (zh) | 分布式数据库集群的监控系统 | |
CN105095056A (zh) | 一种数据仓库数据监控的方法 | |
JP4598065B2 (ja) | 監視シミュレーション装置,方法およびそのプログラム | |
CN106844145A (zh) | 一种服务器硬件故障预警方法和装置 | |
JP6141471B2 (ja) | システムの可用性を解析するための方法、装置、当該装置を含むシステム、並びに、上記方法を実施するためのコンピュータプログラム | |
US9355005B2 (en) | Detection apparatus and detection method | |
US10360090B2 (en) | Determination method, determination apparatus, and recording medium | |
CN105404581A (zh) | 一种数据库的评测方法和装置 | |
US11165668B2 (en) | Quality assessment and decision recommendation for continuous deployment of cloud infrastructure components | |
WO2015171860A1 (en) | Automatic alert generation | |
JPWO2019049523A1 (ja) | リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム | |
JP6574533B2 (ja) | リスク評価装置、リスク評価システム、リスク評価方法、及び、リスク評価プログラム | |
US9690639B2 (en) | Failure detecting apparatus and failure detecting method using patterns indicating occurrences of failures | |
JP2010152539A (ja) | 障害発見システム検証装置、障害発見システム検証方法及び障害発見システム検証制御プログラム | |
JP2006331026A (ja) | メッセージ分析システム及びメッセージ分析プログラム | |
JP4575020B2 (ja) | 障害解析装置 | |
JP6142881B2 (ja) | 不具合通知システム、不具合通知方法、不具合通知装置、不具合通知プログラム及び記録媒体 | |
US20220342788A1 (en) | Anomaly location estimating apparatus, method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210330 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6878984 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |