JP2012168687A - 情報処理装置及び情報処理方法及びプログラム - Google Patents
情報処理装置及び情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2012168687A JP2012168687A JP2011028350A JP2011028350A JP2012168687A JP 2012168687 A JP2012168687 A JP 2012168687A JP 2011028350 A JP2011028350 A JP 2011028350A JP 2011028350 A JP2011028350 A JP 2011028350A JP 2012168687 A JP2012168687 A JP 2012168687A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- status
- information
- fault
- handling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】障害の発生原因において関連のある障害を正確に判定し、障害状態の設定を自動的に更新する。
【解決手段】障害関連性情報記憶部4015は、情報システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する障害関連性情報を記憶している。解析結果情報記憶部4012は、情報システムで発生した障害と、障害状態とを示す解析結果情報を記憶している。クライアントI/F部4013が、障害状態が変化した障害と、新たな障害状態が示される更新要求を入力し、障害関連性判定部4014が、解析結果情報において当該障害の障害情報を新たな障害状態に更新するとともに、障害関連性情報において当該障害に関連障害が定義されている場合に、解析結果情報において当該関連障害の障害状態を新たな障害状態に更新する。
【選択図】図2
【解決手段】障害関連性情報記憶部4015は、情報システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する障害関連性情報を記憶している。解析結果情報記憶部4012は、情報システムで発生した障害と、障害状態とを示す解析結果情報を記憶している。クライアントI/F部4013が、障害状態が変化した障害と、新たな障害状態が示される更新要求を入力し、障害関連性判定部4014が、解析結果情報において当該障害の障害情報を新たな障害状態に更新するとともに、障害関連性情報において当該障害に関連障害が定義されている場合に、解析結果情報において当該関連障害の障害状態を新たな障害状態に更新する。
【選択図】図2
Description
本発明は、データ処理システムにおいて、発生した障害の関連性を判定する技術に関する。
近年、業務プロセス管理などの考えに基づき、業務プロセスの変更に対して、柔軟に対応できる情報システムが求められており、サービス指向アーキテクチャ(SOA:Service Oriented Architecture)が注目されている。
SOAとは、アプリケーションやソフトウェアが提供する機能を、業務の視点でサービスという機能単位に部品化し、これらを必要に応じて組み合わせることによって、業務プロセスの変更に対しても迅速かつ柔軟に対応可能な情報システムを構築する手法である。
SOAでは、自社だけでなく他社が提供するサービスを組み合わせることによって情報システムを構築する(特許文献1)。
SOAシステムを実現するためのSOA基盤を提供するミドルウェア製品として、ESB(Enterprise Service Bus)と呼ばれるものがある。
ESBは、要求元からサービスの要求を受け付け、その要求を該当サービスへ割り振り、結果を要求元に返却する。
SOAによって構築された情報システムでは、自社だけでなく他社のサービスを利用したり、ESBなどのミドルウェアの機能によりサービスを振り分ける。
そのため、サービスの依存関係(呼び出し関係)が複雑になっている。
SOAとは、アプリケーションやソフトウェアが提供する機能を、業務の視点でサービスという機能単位に部品化し、これらを必要に応じて組み合わせることによって、業務プロセスの変更に対しても迅速かつ柔軟に対応可能な情報システムを構築する手法である。
SOAでは、自社だけでなく他社が提供するサービスを組み合わせることによって情報システムを構築する(特許文献1)。
SOAシステムを実現するためのSOA基盤を提供するミドルウェア製品として、ESB(Enterprise Service Bus)と呼ばれるものがある。
ESBは、要求元からサービスの要求を受け付け、その要求を該当サービスへ割り振り、結果を要求元に返却する。
SOAによって構築された情報システムでは、自社だけでなく他社のサービスを利用したり、ESBなどのミドルウェアの機能によりサービスを振り分ける。
そのため、サービスの依存関係(呼び出し関係)が複雑になっている。
SOAで構築された情報システムでは、障害が単独で発生することや、1件の障害が原因となって複数のサービスで障害が検出されることがある。
SOAにより構築された情報システムで100件の障害が検出された場合を考える。
この時、該当システムの運用管理業務を行っている運用監視者が、検出された100件のうちの1件である障害Aに対する処置を実施し、その障害を回復させたとする。
この時、残り99件の障害は、(1)回復した障害が原因で障害と検出された障害、(2)全く異なる原因で障害と検出された障害の2種類に分けられる。
(1)の障害は障害Aが原因で障害と検出されていたため、障害Aの回復と同時に回復するが、(2)の障害は異なる原因で障害と検出されたため回復しないはずである。
SOAで構築された情報システムで発生した障害では、サービスの依存関係が複雑であるため、障害の因果関係も複雑となっており、(1)と(2)を自動的に判定することは難しい。
SOAにより構築された情報システムで100件の障害が検出された場合を考える。
この時、該当システムの運用管理業務を行っている運用監視者が、検出された100件のうちの1件である障害Aに対する処置を実施し、その障害を回復させたとする。
この時、残り99件の障害は、(1)回復した障害が原因で障害と検出された障害、(2)全く異なる原因で障害と検出された障害の2種類に分けられる。
(1)の障害は障害Aが原因で障害と検出されていたため、障害Aの回復と同時に回復するが、(2)の障害は異なる原因で障害と検出されたため回復しないはずである。
SOAで構築された情報システムで発生した障害では、サービスの依存関係が複雑であるため、障害の因果関係も複雑となっており、(1)と(2)を自動的に判定することは難しい。
一般的な運用管理業務では、検出された障害情報とともに、その障害状態(例えば障害発生、処置中、回復済、処置不要など)の管理を行う必要がある。
多くの運用管理装置が、このような障害管理を行う機能を備えている。
多くの運用管理装置が、このような障害管理を行う機能を備えている。
図10は運用管理装置の運用管理画面の一例を示す。
画面には、障害状態を設定するためのボタン(処置中、回復済、処置不要)と、検出された障害情報の一覧が表示されている。
障害情報の一覧では、1行が1件の障害を示しており、障害状態、障害発生日時、障害の検出されたサービス名と業務名、セッション名、障害名称などを表示する。
従来の運用管理装置では、運用監視者が、図10のような画面から、一覧表示された障害情報の1件1件に対して、手動で障害状態を設定していた。
画面には、障害状態を設定するためのボタン(処置中、回復済、処置不要)と、検出された障害情報の一覧が表示されている。
障害情報の一覧では、1行が1件の障害を示しており、障害状態、障害発生日時、障害の検出されたサービス名と業務名、セッション名、障害名称などを表示する。
従来の運用管理装置では、運用監視者が、図10のような画面から、一覧表示された障害情報の1件1件に対して、手動で障害状態を設定していた。
障害が発生した場合にその影響を自動で判定する技術として、管理対象の依存関係を利用した障害影響判定方法がよく用いられている(特許文献2)。
この方法では、管理対象を包含関係(親子関係)として管理することで影響の有無を判定する。
図11に例を示す。
図11は、ある会社の支社のサーバ構成を表しており、関東支社にはサーバA、B、Cがあり、関東支社(親)とサーバ(子)が包含関係にあることを示している。
管理対象がこのような従来の包含関係では、サーバ(子)に障害が発生した場合、子の障害を親に伝搬させることにより、親にも影響があることを示す。
子の障害を親に伝搬させる時には、一定の伝搬係数をかけて伝搬する。
伝搬係数の決め方は様々であるが、例えば子の重要度を考慮にいれた伝搬係数を事前に定義ファイルに定義しておき、その値を参照する方法が考えられる。
親は障害が発生した子ノードとその伝搬係数をかけたものの総和から、あらかじめ定義しておいた親の障害閾値と比較して、障害影響を表示する。
図11では、サーバBで障害が発生し、その影響として関東支社が部分障害と判定された例を示している。
この方法では、管理対象を包含関係(親子関係)として管理することで影響の有無を判定する。
図11に例を示す。
図11は、ある会社の支社のサーバ構成を表しており、関東支社にはサーバA、B、Cがあり、関東支社(親)とサーバ(子)が包含関係にあることを示している。
管理対象がこのような従来の包含関係では、サーバ(子)に障害が発生した場合、子の障害を親に伝搬させることにより、親にも影響があることを示す。
子の障害を親に伝搬させる時には、一定の伝搬係数をかけて伝搬する。
伝搬係数の決め方は様々であるが、例えば子の重要度を考慮にいれた伝搬係数を事前に定義ファイルに定義しておき、その値を参照する方法が考えられる。
親は障害が発生した子ノードとその伝搬係数をかけたものの総和から、あらかじめ定義しておいた親の障害閾値と比較して、障害影響を表示する。
図11では、サーバBで障害が発生し、その影響として関東支社が部分障害と判定された例を示している。
サービス運用管理においても、一般的な運用管理業務と同様に、障害状態を管理する必要がある。
SOAで構築された情報システムは、一般的な情報システムよりも障害の因果関係が複雑になるため、運用監視者は、サービスの依存関係や障害内容、障害の発生順序など様々な情報から障害の因果関係を判定した上で、障害状態を判断し、障害を管理する必要がある。
従来通り、運用監視者が障害1件1件に対して手動で障害状態を設定する場合、障害の関連性判定には、手間や時間がかかり、運用監視者の負荷が高くなるという課題がある。
SOAで構築された情報システムは、一般的な情報システムよりも障害の因果関係が複雑になるため、運用監視者は、サービスの依存関係や障害内容、障害の発生順序など様々な情報から障害の因果関係を判定した上で、障害状態を判断し、障害を管理する必要がある。
従来通り、運用監視者が障害1件1件に対して手動で障害状態を設定する場合、障害の関連性判定には、手間や時間がかかり、運用監視者の負荷が高くなるという課題がある。
この課題を解決するために、上述の従来の障害影響判定方法を適用し、障害の関連性判定を自動化することを考える。
障害影響判定方法を、サービスの障害回復時における障害の関連性判定にそのまま適用した場合、サービスの親子関係のみで障害の関連性を判定することになる。
そのため、親子の障害が独立して発生している場合に、誤った判定をしてしまうという課題がある。
障害影響判定方法を、サービスの障害回復時における障害の関連性判定にそのまま適用した場合、サービスの親子関係のみで障害の関連性を判定することになる。
そのため、親子の障害が独立して発生している場合に、誤った判定をしてしまうという課題がある。
本発明は、上記のような課題を解決することを主な目的としており、障害の発生原因において関連のある障害を正確に判定し、障害に対する対処状況の設定を自動的に更新する構成を実現することを主な目的とする。
本発明に係る情報処理装置は、
管理対象システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する関連障害情報を記憶する関連障害情報記憶部と、
前記管理対象システムで発生した障害と、発生した障害に対する対処状況とを示す対処状況情報を記憶する対処状況情報記憶部と、
対処状況が変化した障害を状況変化障害として示すとともに、前記状況変化障害の新たな対処状況を示す更新要求を入力する入力部と、
前記対処状況情報において前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記関連障害情報において前記状況変化障害に関連障害が定義されている場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新する対処状況更新部とを有することを特徴とする。
管理対象システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する関連障害情報を記憶する関連障害情報記憶部と、
前記管理対象システムで発生した障害と、発生した障害に対する対処状況とを示す対処状況情報を記憶する対処状況情報記憶部と、
対処状況が変化した障害を状況変化障害として示すとともに、前記状況変化障害の新たな対処状況を示す更新要求を入力する入力部と、
前記対処状況情報において前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記関連障害情報において前記状況変化障害に関連障害が定義されている場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新する対処状況更新部とを有することを特徴とする。
本発明によれば、障害発生原因において関連のある障害を関連障害として定義し、状況変化障害に関連障害が存在する場合に、状況変化障害とともに関連障害の対処状況を新たな対処状況に更新するため、運用監視者が、障害の因果関係を判定し、関連障害を抽出し、関連障害の対処状況を手動で更新する必要がなくなる。これにより、運用監視者の負荷の軽減が見込める。
実施の形態1.
本実施の形態では、障害の関連性判定を正確に行うことを可能とし、障害状態の設定を自動化する構成を説明する。
より具体的には、障害の関連性を判定するための障害関連性情報を保管し、障害関連性情報を元に、発生している障害と障害の関連性を判定する手段を備える構成を説明する。
そして、本実施の形態に係る構成によれば、回復したある障害に対して障害状態を手動で設定すると、回復した障害と関連して発生した障害が特定され、その障害の障害状態が、回復済や処置不要などに自動的に設定される。
そのため運用監視者は、ある障害が回復した時に、回復した障害と他の障害との因果関係を判定し、関連する障害を検出し、関連する障害の障害状態を手動で設定する必要がなくなる。
これにより、運用監視者の負荷軽減による作業時間の短縮の効果が期待できる。
本実施の形態では、障害の関連性判定を正確に行うことを可能とし、障害状態の設定を自動化する構成を説明する。
より具体的には、障害の関連性を判定するための障害関連性情報を保管し、障害関連性情報を元に、発生している障害と障害の関連性を判定する手段を備える構成を説明する。
そして、本実施の形態に係る構成によれば、回復したある障害に対して障害状態を手動で設定すると、回復した障害と関連して発生した障害が特定され、その障害の障害状態が、回復済や処置不要などに自動的に設定される。
そのため運用監視者は、ある障害が回復した時に、回復した障害と他の障害との因果関係を判定し、関連する障害を検出し、関連する障害の障害状態を手動で設定する必要がなくなる。
これにより、運用監視者の負荷軽減による作業時間の短縮の効果が期待できる。
図1は、本実施の形態に係るシステム構成例を示す。
本実施の形態に係るシステムは、業務用クライアント装置101と情報システム20、管理用クライアント装置301と運用管理装置40の4つの装置から構成される。
本実施の形態に係るシステムは、業務用クライアント装置101と情報システム20、管理用クライアント装置301と運用管理装置40の4つの装置から構成される。
業務用クライアント装置101は、システム利用者が業務を行うために利用するクライアント装置である。
情報システム20は、SOAで構築された情報システムである。
情報システム20は、管理対象システムの例である。
情報システム20は、SOAで構築された情報システムである。
情報システム20は、管理対象システムの例である。
管理用クライアント装置301は、システム運用監視者が運用管理のために利用するクライアント装置である。
運用管理装置40はサービスの運用管理を行う装置であり、サービス運用管理サーバ装置401及び情報記憶装置402で構成される。
サービス運用管理サーバ装置401は、情報処理装置の例である。
サービス運用管理サーバ装置401は、情報処理装置の例である。
情報システム20において、業務サーバ装置201は、業務用クライアント装置101からの要求を受け付け、業務フローに従い、ESB(Enterprise Services Bus)サーバ装置202に対してサービスの呼び出しを行い、業務を実行するサーバ装置である。
ESBサーバ装置202は、業務サーバ装置201から要求を受け付け、適切なサービスを呼び出す機能を搭載したサーバ装置である。
ESBサーバ装置202は、業務サーバ装置201から要求を受け付け、適切なサービスを呼び出す機能を搭載したサーバ装置である。
実行ログ2021は、ESBサーバ装置202で記録されるサービスに関連する実行ログである。
実行ログ2021には、業務サーバ装置201がどのサービスを呼び出し、呼び出したサービスが正常に値を返したか、異常があったか、などの情報が記録されている。
実行ログ2021には、業務サーバ装置201がどのサービスを呼び出し、呼び出したサービスが正常に値を返したか、異常があったか、などの情報が記録されている。
ネットワーク203は、各サーバ装置が接続されているインターネットやイントラネットなどのネットワークである。
サーバ装置A204やサーバ装置B205は、自社または他社にあるサービスを提供しているサーバ装置である。
サービスA1(2041)、サービスA2(2042)、サービスB1(2051)、サービスB2(2052)はデータ処理サービスの実体である。
各サービスは、ESBサーバ装置202を介して業務サーバ装置201から利用可能となるようインタフェースを公開しているソフトウェアである。
サービスA1(2041)、サービスA2(2042)、サービスB1(2051)、サービスB2(2052)はデータ処理サービスの実体である。
各サービスは、ESBサーバ装置202を介して業務サーバ装置201から利用可能となるようインタフェースを公開しているソフトウェアである。
運用管理装置40において、サービス運用管理サーバ装置401は、実行ログ2021を受け取り、情報記憶装置402内の障害定義情報4021を元に、実行ログ2021から障害を検出し、管理用クライアント装置301に検出した結果を表示する。
また、表示した画面から障害状態の入力を受け付け、管理を行う。
画面から障害状態が入力された時には、情報記憶装置402内の障害関連性情報4022を利用して、現在発生している障害の関連性を判定し、関連障害の障害状態も合わせて設定する。
また、表示した画面から障害状態の入力を受け付け、管理を行う。
画面から障害状態が入力された時には、情報記憶装置402内の障害関連性情報4022を利用して、現在発生している障害の関連性を判定し、関連障害の障害状態も合わせて設定する。
情報記憶装置402は、障害定義情報4021および障害関連性情報4022を記憶している。
障害定義情報4021は、サービス運用管理サーバ装置401が障害を検出する時に使用する情報である。
障害定義情報4021には、検出対象のサービス名と検出する障害名、障害検出条件などの情報が格納される。
障害関連性情報4022は、サービス運用管理サーバ装置401が障害の関連性を判定する時に使用する情報である。
障害関連性情報4022には、関連して発生することのある障害に対して、対象障害と関連障害および関連性の判定条件などの情報が格納される。
つまり、障害関連性情報4022は、情報システム20で発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する情報である。
障害関連性情報4022は、関連障害情報の例である。
障害定義情報4021は、サービス運用管理サーバ装置401が障害を検出する時に使用する情報である。
障害定義情報4021には、検出対象のサービス名と検出する障害名、障害検出条件などの情報が格納される。
障害関連性情報4022は、サービス運用管理サーバ装置401が障害の関連性を判定する時に使用する情報である。
障害関連性情報4022には、関連して発生することのある障害に対して、対象障害と関連障害および関連性の判定条件などの情報が格納される。
つまり、障害関連性情報4022は、情報システム20で発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する情報である。
障害関連性情報4022は、関連障害情報の例である。
本実施の形態では、障害関連性情報4022に、障害の関連性を判定するための情報が格納されており、この情報を元に、サービス運用管理サーバ装置401が障害の関連性を判定する。
サービス運用管理サーバ装置401は、ESBサーバ装置202からサービスの実行状況を示す実行ログ2021を入力として受け取り、障害定義情報4021を元に実行ログ2021の解析を行い、サービスに障害が発生したと検知する。
検知した障害に対し、運用監視者が処置を実施し、回復した場合には、障害関連性情報4022を元に、まだ処置を実施していない障害に対して障害の関連性判定条件に合致するか否かを判定し、関連障害を特定する。
障害関連性情報の判定条件に合致しない障害については、回復した障害と関連のない障害と判定でき、合致した障害については、回復した障害が原因となって発生した障害であると判定することができる。
サービス運用管理サーバ装置401は、ESBサーバ装置202からサービスの実行状況を示す実行ログ2021を入力として受け取り、障害定義情報4021を元に実行ログ2021の解析を行い、サービスに障害が発生したと検知する。
検知した障害に対し、運用監視者が処置を実施し、回復した場合には、障害関連性情報4022を元に、まだ処置を実施していない障害に対して障害の関連性判定条件に合致するか否かを判定し、関連障害を特定する。
障害関連性情報の判定条件に合致しない障害については、回復した障害と関連のない障害と判定でき、合致した障害については、回復した障害が原因となって発生した障害であると判定することができる。
図2は、サービス運用管理サーバ装置401の詳細な構成例を示す図である。
図2において、解析部4011は、実行ログ2021を受け取り、情報記憶装置402内の障害定義情報4021を元に実行ログを解析し、実行時に障害が発生したサービスを障害発生サービスとして検出する。
検出した障害情報は解析結果情報として解析結果情報記憶部4012に保管する。
検出した障害情報は解析結果情報として解析結果情報記憶部4012に保管する。
解析結果情報記憶部4012は、解析部4011が実行ログを解析した結果、障害として検出された情報(解析結果情報)を保管するための記憶装置である。
解析結果情報が、サービス運用管理において管理対象となる障害情報である。
検出された障害は全て解析結果情報記憶部4012に保管され、障害1件1件に対して、障害に対する対処状況である障害状態が付けられ、管理される。
解析部4011にて検出された障害には、例えば、障害状態のデフォルト値(例えば、障害発生)が設定され、解析結果情報記憶部4012に保管される。
デフォルト値である「障害発生」は、障害に対して未対処の状態であることを示している。
運用監視者によってある障害の状態が「回復済」に設定された場合には、解析結果情報記憶部4012に保管されている該当障害の障害状態が「回復済」に更新される。
解析結果情報は、このように、情報システム20で発生した障害と、発生した障害に対する対処状況とを示す情報であり、対処状況情報の例である。
また、解析結果情報記憶部4012は、対処状況情報記憶部の例である。
解析結果情報が、サービス運用管理において管理対象となる障害情報である。
検出された障害は全て解析結果情報記憶部4012に保管され、障害1件1件に対して、障害に対する対処状況である障害状態が付けられ、管理される。
解析部4011にて検出された障害には、例えば、障害状態のデフォルト値(例えば、障害発生)が設定され、解析結果情報記憶部4012に保管される。
デフォルト値である「障害発生」は、障害に対して未対処の状態であることを示している。
運用監視者によってある障害の状態が「回復済」に設定された場合には、解析結果情報記憶部4012に保管されている該当障害の障害状態が「回復済」に更新される。
解析結果情報は、このように、情報システム20で発生した障害と、発生した障害に対する対処状況とを示す情報であり、対処状況情報の例である。
また、解析結果情報記憶部4012は、対処状況情報記憶部の例である。
図8は、本実施の形態に係る解析結果情報の例を示す。
図8において、「障害状態」の欄には、発生した障害に対する対処状況が示され、例えば、「障害発生」、「処置中」、「処置不要」、「回復済」等が示される。
「障害発生日時」の欄には、障害が発生した日時が示される。
「サービス名」の欄は、障害が発生したサービスの名称が示される。
「業務名」の欄は、「サービス名」に示されるサービスが実施されていた業務の名称が示される。
「セッション」の欄には、「サービス名」に示されるサービスが実施されていたセッションが示される。
セッションとは、情報システム20において複数のデータ処理を対応付けて管理する単位であり、例えば、業務用クライアント装置101が業務サーバ装置201に接続/ログインしてから、切断/ログオフするまでの一連の操作、データ処理、通信をまとめて1セッションという。
「障害ID」の欄は、障害の識別子である障害ID(Identification)が示される。
「障害ID」の欄に示されるIDは、後述する図3に示す障害ID、図4に示す対象障害ID及び関連障害IDに対応する。
障害IDの詳細は、図3及び図4とともに説明する。
図8において、「障害状態」の欄には、発生した障害に対する対処状況が示され、例えば、「障害発生」、「処置中」、「処置不要」、「回復済」等が示される。
「障害発生日時」の欄には、障害が発生した日時が示される。
「サービス名」の欄は、障害が発生したサービスの名称が示される。
「業務名」の欄は、「サービス名」に示されるサービスが実施されていた業務の名称が示される。
「セッション」の欄には、「サービス名」に示されるサービスが実施されていたセッションが示される。
セッションとは、情報システム20において複数のデータ処理を対応付けて管理する単位であり、例えば、業務用クライアント装置101が業務サーバ装置201に接続/ログインしてから、切断/ログオフするまでの一連の操作、データ処理、通信をまとめて1セッションという。
「障害ID」の欄は、障害の識別子である障害ID(Identification)が示される。
「障害ID」の欄に示されるIDは、後述する図3に示す障害ID、図4に示す対象障害ID及び関連障害IDに対応する。
障害IDの詳細は、図3及び図4とともに説明する。
クライアントI/F(インタフェース)部4013は、解析部4011の解析結果である解析結果情報を受け取り、表示するための画面を提供する。
また、クライアントI/F部4013は、表示した障害に対して、障害状態を手動で設定するためのインタフェースを持つ。
例えば、図10のように解析結果情報記憶部4012に対応する障害情報を管理用クライアント装置301に一覧表示する。
運用監視者は、この情報1件1件に対して、障害状態を設定して障害管理を行う。
また、クライアントI/F部4013は、管理用クライアント装置301から更新要求を入力する。
更新要求は、障害状態が変化した障害(状況変化障害)が示されるとともに、当該障害の新たな障害状態が示される。
例えば、図10の1行目に示されている障害(障害状態:障害発生、障害発生日時:10/09/29 09:50、サービス名:サービスB1)に対して処置が行われ、障害状態が「処置中」に変化した場合に、更新要求には、図1の1行目に示されている障害を識別するための情報と、新たな障害状態である「処置中」が管理用クライアント装置301からクライアントI/F部4013に入力される。
クライアントI/F部4013は、入力部及び出力部の例である。
また、クライアントI/F部4013は、表示した障害に対して、障害状態を手動で設定するためのインタフェースを持つ。
例えば、図10のように解析結果情報記憶部4012に対応する障害情報を管理用クライアント装置301に一覧表示する。
運用監視者は、この情報1件1件に対して、障害状態を設定して障害管理を行う。
また、クライアントI/F部4013は、管理用クライアント装置301から更新要求を入力する。
更新要求は、障害状態が変化した障害(状況変化障害)が示されるとともに、当該障害の新たな障害状態が示される。
例えば、図10の1行目に示されている障害(障害状態:障害発生、障害発生日時:10/09/29 09:50、サービス名:サービスB1)に対して処置が行われ、障害状態が「処置中」に変化した場合に、更新要求には、図1の1行目に示されている障害を識別するための情報と、新たな障害状態である「処置中」が管理用クライアント装置301からクライアントI/F部4013に入力される。
クライアントI/F部4013は、入力部及び出力部の例である。
障害関連性判定部4014は、クライアントI/F部4013から入力されたある障害に対する障害状態と、解析結果情報記憶部4012と、情報記憶装置402内の障害関連性情報4022を元に、障害の関連性を判定し、関連して発生した障害を特定する。
障害関連性判定部4014は、運用監視者が処置を実施して回復した障害に対して、クライアントI/F部4013へ更新要求を入力することがトリガとなって動作する。
運用監視者から更新要求が入力された際に、対象となる障害、当該障害の新たな障害状態(回復済み等)、当該障害のセッション等の情報が障害関連性判定部4014に入力される。
障害関連性判定部4014は、情報記憶装置402から障害関連性情報4022を読み出し、障害の関連性判定条件に合致するか否かを判定し、関連障害を特定する。
障害の関連性判定条件に合致しない障害については、回復した障害と関連のない障害と判定できる。
合致した障害については、回復した障害が原因となって発生した障害であると判定することができる。
関連性があると判定された障害に対しては、障害関連性判定部4014が自動的に解析結果情報記憶部4012に対して、障害状態の更新を行う。
このように、障害関連性判定部4014は、更新要求に示される障害(状況変化障害)の障害状態を解析結果情報において更新要求に示される新たな障害状態に更新するとともに、障害関連性情報4022において当該障害(状況変化障害)に関連障害が定義されている場合に、解析結果情報において当該関連障害の障害状態を更新要求に示される新たな障害状態に更新する。
なお、障害関連性判定部4014は、対処状況更新部の例である。
障害関連性判定部4014は、運用監視者が処置を実施して回復した障害に対して、クライアントI/F部4013へ更新要求を入力することがトリガとなって動作する。
運用監視者から更新要求が入力された際に、対象となる障害、当該障害の新たな障害状態(回復済み等)、当該障害のセッション等の情報が障害関連性判定部4014に入力される。
障害関連性判定部4014は、情報記憶装置402から障害関連性情報4022を読み出し、障害の関連性判定条件に合致するか否かを判定し、関連障害を特定する。
障害の関連性判定条件に合致しない障害については、回復した障害と関連のない障害と判定できる。
合致した障害については、回復した障害が原因となって発生した障害であると判定することができる。
関連性があると判定された障害に対しては、障害関連性判定部4014が自動的に解析結果情報記憶部4012に対して、障害状態の更新を行う。
このように、障害関連性判定部4014は、更新要求に示される障害(状況変化障害)の障害状態を解析結果情報において更新要求に示される新たな障害状態に更新するとともに、障害関連性情報4022において当該障害(状況変化障害)に関連障害が定義されている場合に、解析結果情報において当該関連障害の障害状態を更新要求に示される新たな障害状態に更新する。
なお、障害関連性判定部4014は、対処状況更新部の例である。
障害関連性情報記憶部4015は、障害関連性判定部4014により情報記憶装置402から読み出された障害関連性情報4022を記憶する記憶領域である。
障害関連性情報記憶部4015は、関連障害情報記憶部の例である。
障害関連性情報記憶部4015は、関連障害情報記憶部の例である。
次に、障害定義情報4021、障害関連性情報4022の詳細を説明する。
これらの情報はそれぞれ図3、図4に示すデータ構造を持っている。
なお、図3、図4において、「(ア)項目の説明」は、各データの項目名および各項目の内容を説明しており、「(イ)データの例」は、実際のデータの内容例を示している。
これらの情報はそれぞれ図3、図4に示すデータ構造を持っている。
なお、図3、図4において、「(ア)項目の説明」は、各データの項目名および各項目の内容を説明しており、「(イ)データの例」は、実際のデータの内容例を示している。
図3の障害定義情報4021の障害サービス関連表は、障害とサービスの関連を示す表である。
図3の(ア)に示す通り、障害サービス関連表の項目は、障害ID、障害を検出する対象サービス名、検出する障害名、検出する際に使用する障害検出条件から構成される。
実行ログ2021が障害検出条件に該当する場合、障害として検出する。
障害IDは、障害サービス関連表の情報を一意に決めるIDであり、障害関連性情報4022でも使用する。
図3の(イ)にデータ例を示す。
例えば1行目のデータは、サービスBでサービス応答なしの障害を検出するための条件は検出条件1であることを示している。
検出条件は、正規表現や式など、いろいろな形で表現できる。
解析部4011は、サービスBの実行ログ2021を受け取った時に、この障害定義情報4021を取得し、検出条件1に該当する実行ログだった場合は、サービス応答なしの障害が発生していると解析し、その解析結果を解析結果情報に書き込む。
図3の(ア)に示す通り、障害サービス関連表の項目は、障害ID、障害を検出する対象サービス名、検出する障害名、検出する際に使用する障害検出条件から構成される。
実行ログ2021が障害検出条件に該当する場合、障害として検出する。
障害IDは、障害サービス関連表の情報を一意に決めるIDであり、障害関連性情報4022でも使用する。
図3の(イ)にデータ例を示す。
例えば1行目のデータは、サービスBでサービス応答なしの障害を検出するための条件は検出条件1であることを示している。
検出条件は、正規表現や式など、いろいろな形で表現できる。
解析部4011は、サービスBの実行ログ2021を受け取った時に、この障害定義情報4021を取得し、検出条件1に該当する実行ログだった場合は、サービス応答なしの障害が発生していると解析し、その解析結果を解析結果情報に書き込む。
図4は障害関連性情報4022を示している。
障害関連性情報は、(1)関連性対応表と(2)関連性判定条件表の2つがある。
(1)関連性対応表は、障害状態が変化した(例えば、回復した)障害(対象障害)と障害発生原因において関連のある障害(関連障害)、障害間の関連性を判定するための判定条件の対応を示す表である。
対象障害と関連障害のサービスの依存関係は、業務やサービスの構成情報やフロー情報からほぼ一意に決まるため、(1)関連性対応表では、サービスの依存関係を考慮した上で、判定条件を定義する。
障害関連性情報は、(1)関連性対応表と(2)関連性判定条件表の2つがある。
(1)関連性対応表は、障害状態が変化した(例えば、回復した)障害(対象障害)と障害発生原因において関連のある障害(関連障害)、障害間の関連性を判定するための判定条件の対応を示す表である。
対象障害と関連障害のサービスの依存関係は、業務やサービスの構成情報やフロー情報からほぼ一意に決まるため、(1)関連性対応表では、サービスの依存関係を考慮した上で、判定条件を定義する。
図4(1)の(ア)に示す通り、(1)関連性対応表の項目は、対象障害ID、対象障害のサービス名、対象障害の業務名、関連障害ID、関連障害のサービス名、関連障害の業務名と、判定条件IDである。
判定条件ID以外の項目がプライマリキーとなるため、対象障害と関連障害の種類、障害発生サービス、障害発生業務ごとに関連性判定条件を設定することが出来る。
対象障害ID、関連障害IDは、図3の障害定義情報で示した障害IDである。
図4(1)の(イ)にデータ例を示す。
このデータ例で想定しているサービスの依存関係は図5である。
図5は、業務X1がサービスA、B、Cの3つのサービスから構成されており、サービスBに関しては、ESBによるサービスの振り分けにより、実際にはサービスB1とB2が呼び出されていることを示している。
ここで、ESBによるサービスの呼び出し関係を親子関係、その他の呼び出し関係は兄弟関係と呼ぶことにする。
例えば、サービスBにとってサービスB1、B2は子であり、サービスB1、B2にとってサービスBは親である。
サービスA、B、Cは兄弟関係であり、サービスB1、サービスB2も兄弟関係である。
図4(1)の(イ)の1行目のデータは、業務X1のサービスBでeid1(図3よりサービス応答なし)の障害が発生した場合、業務X1のサービスB1のeid3(図3よりサービス応答なし)は、関連性判定条件cid2を満たせば、関連性があることを示している。
これは、図5より親子関係の場合の関連性を表している。
関連性は、障害が兄弟関係の場合や、他業務の同じサービスで障害発生した場合も、親子関係の時と同様に定義することが出来る。
図4(1)の(イ)の2行目のデータは、兄弟関係の場合のデータ例であり、業務X1のサービスBでeid2(図3より値不正)の障害が発生した場合、業務X1のサービスCのeid5(図3より値不正)は、判定条件cid1を満たせば、関連性があることを示している。
図4(1)の(イ)の3行目のデータは、他業務の同じサービスで障害発生した場合のデータ例であり、業務X1のサービスBでeid1(図3よりサービス応答なし)の障害が発生した場合、業務X2のサービスBのeid1(図3よりサービス応答なし)は、判定条件cid1を満たせば、関連性があることを示している。
判定条件ID以外の項目がプライマリキーとなるため、対象障害と関連障害の種類、障害発生サービス、障害発生業務ごとに関連性判定条件を設定することが出来る。
対象障害ID、関連障害IDは、図3の障害定義情報で示した障害IDである。
図4(1)の(イ)にデータ例を示す。
このデータ例で想定しているサービスの依存関係は図5である。
図5は、業務X1がサービスA、B、Cの3つのサービスから構成されており、サービスBに関しては、ESBによるサービスの振り分けにより、実際にはサービスB1とB2が呼び出されていることを示している。
ここで、ESBによるサービスの呼び出し関係を親子関係、その他の呼び出し関係は兄弟関係と呼ぶことにする。
例えば、サービスBにとってサービスB1、B2は子であり、サービスB1、B2にとってサービスBは親である。
サービスA、B、Cは兄弟関係であり、サービスB1、サービスB2も兄弟関係である。
図4(1)の(イ)の1行目のデータは、業務X1のサービスBでeid1(図3よりサービス応答なし)の障害が発生した場合、業務X1のサービスB1のeid3(図3よりサービス応答なし)は、関連性判定条件cid2を満たせば、関連性があることを示している。
これは、図5より親子関係の場合の関連性を表している。
関連性は、障害が兄弟関係の場合や、他業務の同じサービスで障害発生した場合も、親子関係の時と同様に定義することが出来る。
図4(1)の(イ)の2行目のデータは、兄弟関係の場合のデータ例であり、業務X1のサービスBでeid2(図3より値不正)の障害が発生した場合、業務X1のサービスCのeid5(図3より値不正)は、判定条件cid1を満たせば、関連性があることを示している。
図4(1)の(イ)の3行目のデータは、他業務の同じサービスで障害発生した場合のデータ例であり、業務X1のサービスBでeid1(図3よりサービス応答なし)の障害が発生した場合、業務X2のサービスBのeid1(図3よりサービス応答なし)は、判定条件cid1を満たせば、関連性があることを示している。
(2)関連性判定条件表は、(1)関連性対応表の判定条件IDに対応する評価式を示している。
図4(2)の(ア)に示す通り、(2)関連性判定条件表の項目は、判定条件ID、判定を行う評価項目、条件、評価値である。
評価項目、条件、評価値に当てはまる場合、障害の関連性があると判定する。
図4(2)の(イ)にデータ例を示す。
例えば1行目のデータは、対象障害の発生日時が、関連障害の発生日時よりも前(過去)であったら関連性があることを示している。
ここでは、障害発生日時による比較条件しか例として記述していないが、これに限らない。
図4(2)の(ア)に示す通り、(2)関連性判定条件表の項目は、判定条件ID、判定を行う評価項目、条件、評価値である。
評価項目、条件、評価値に当てはまる場合、障害の関連性があると判定する。
図4(2)の(イ)にデータ例を示す。
例えば1行目のデータは、対象障害の発生日時が、関連障害の発生日時よりも前(過去)であったら関連性があることを示している。
ここでは、障害発生日時による比較条件しか例として記述していないが、これに限らない。
障害定義情報4021のデータは、システム管理者などにより人手で登録・更新を行うことを想定している。
新規の業務やサービスが登場した場合に、システム管理者が業務フローを定義し、業務サーバ装置201に登録することになるわけだが、これと同時に情報記憶装置402にも情報を登録する。
障害関連性情報4022についても同様に人手で登録・更新を行う。
障害関連性情報4022は、業務とサービスの構成情報や、サービスの外部仕様などの情報から障害の関連性を洗い出すことが出来ると考えられるため、新しい業務が業務サーバ装置201に登録されるタイミングで障害関連性情報4022に登録する。
あるいは、実際にサービスの障害管理を行っていくなかで、実際の障害管理で培ったノウハウから障害関連性情報4022に蓄積していくという運用方法も考えられる。
新規の業務やサービスが登場した場合に、システム管理者が業務フローを定義し、業務サーバ装置201に登録することになるわけだが、これと同時に情報記憶装置402にも情報を登録する。
障害関連性情報4022についても同様に人手で登録・更新を行う。
障害関連性情報4022は、業務とサービスの構成情報や、サービスの外部仕様などの情報から障害の関連性を洗い出すことが出来ると考えられるため、新しい業務が業務サーバ装置201に登録されるタイミングで障害関連性情報4022に登録する。
あるいは、実際にサービスの障害管理を行っていくなかで、実際の障害管理で培ったノウハウから障害関連性情報4022に蓄積していくという運用方法も考えられる。
次に動作について説明する。
図2において、障害関連性判定部4014は、運用監視者が、クライアントI/F部4013が提供する画面を利用して、管理用クライアント装置301から、ある障害についての更新要求を入力した時に、この動作がトリガとなって動作する。
例えば、運用監視者が図10に例示されている画面のいずれかの行を指定し、「処置中」、「回復済」、「処置不要」のうちのいずれかのボタンを押すことにより、管理用クライアント装置301から更新要求がサービス運用管理サーバ装置401に送信される。
更新要求には、例えば、対象となっているレコードを特定する情報(何行目であるかを示す情報)と、新たな障害状態(運用監視者がボタンを押した障害状態)の情報が含まれる。
このため、サービス運用管理サーバ装置401では、障害状態の更新の対象となる障害、当該障害の新たな障害状態、当該障害が発生したサービス名、業務名、セッションを特定することができる。
図2において、障害関連性判定部4014は、運用監視者が、クライアントI/F部4013が提供する画面を利用して、管理用クライアント装置301から、ある障害についての更新要求を入力した時に、この動作がトリガとなって動作する。
例えば、運用監視者が図10に例示されている画面のいずれかの行を指定し、「処置中」、「回復済」、「処置不要」のうちのいずれかのボタンを押すことにより、管理用クライアント装置301から更新要求がサービス運用管理サーバ装置401に送信される。
更新要求には、例えば、対象となっているレコードを特定する情報(何行目であるかを示す情報)と、新たな障害状態(運用監視者がボタンを押した障害状態)の情報が含まれる。
このため、サービス運用管理サーバ装置401では、障害状態の更新の対象となる障害、当該障害の新たな障害状態、当該障害が発生したサービス名、業務名、セッションを特定することができる。
サービス運用管理サーバ装置401では、クライアントI/F部4013が更新要求を受信し、受信した更新要求を障害関連性判定部4014に渡す。
障害関連性判定部4014は、更新要求に基づき、解析結果情報において対象障害の障害状態を更新するとともに、障害の関連性の判定と関連性があると判定された障害に対する障害状態の更新を行う。
SOAで構築された情報システムで発生する障害は、業務、セッションなどの一連の処理の流れの中で発生すると考えられるため、障害をセッション単位に分類し、関連性の判定を行う。
セッションとは、前述したように、ユーザが情報システム内で行う一連の行動をまとめた単位である。
障害関連性判定部4014は、更新要求に基づき、解析結果情報において対象障害の障害状態を更新するとともに、障害の関連性の判定と関連性があると判定された障害に対する障害状態の更新を行う。
SOAで構築された情報システムで発生する障害は、業務、セッションなどの一連の処理の流れの中で発生すると考えられるため、障害をセッション単位に分類し、関連性の判定を行う。
セッションとは、前述したように、ユーザが情報システム内で行う一連の行動をまとめた単位である。
図6及び図7のフローチャートを用いて、障害関連性判定部4014の動作について説明する。
なお、図6及び図7のフローチャートに示す手順の開始前に、障害関連性判定部4014は、障害関連性情報4022を情報記憶装置402から読み出し、障害関連性情報記憶部4015に格納しておく(関連障害情報読み出しステップ)。
なお、図6及び図7のフローチャートに示す手順の開始前に、障害関連性判定部4014は、障害関連性情報4022を情報記憶装置402から読み出し、障害関連性情報記憶部4015に格納しておく(関連障害情報読み出しステップ)。
クライアントI/F部4013が管理用クライアント装置301からの更新要求を受信した際に(入力ステップ)、障害関連性判定部4014は、クライアントI/F部4013から更新要求を取得し、S01において、取得した更新要求に基づき、処置が実施された障害(例えば、セッションCのサービスBで発生した障害eid1)に対して、新たな障害状態(例えば、回復済)を解析結果情報記憶部4012の解析結果情報に設定する(対処状況更新ステップ)。
S02では、障害関連性判定部4014は、障害の関連性をセッション単位で判定するため、回復した障害と同じセッション(ここではセッションC)で発生している障害を解析結果情報において検索する。
S03では、障害関連性判定部4014は、S02で検索した結果、該当する障害があるかどうかを確認する。
該当する障害がある場合(S03でYES)はS04に進む。
該当する障害がない場合(S03でNO)は、同じセッション内で障害が発生していないため、S09に進む。
S02では、障害関連性判定部4014は、障害の関連性をセッション単位で判定するため、回復した障害と同じセッション(ここではセッションC)で発生している障害を解析結果情報において検索する。
S03では、障害関連性判定部4014は、S02で検索した結果、該当する障害があるかどうかを確認する。
該当する障害がある場合(S03でYES)はS04に進む。
該当する障害がない場合(S03でNO)は、同じセッション内で障害が発生していないため、S09に進む。
S04では、障害関連性判定部4014は、S01で障害状態を設定した障害(ここではサービスBで発生した障害eid1)とS02の検索によって取得した障害に該当する障害関連性情報4022を図4(1)の関連性対応表から検索する。
S05では、障害関連性判定部4014は、S04で検索した結果、該当する障害関連性情報があるかどうかを確認する。
つまり、S01で障害状態を設定した障害の障害ID(ここでは障害eid1)が対象障害IDとして示され、S02の検索によって取得した障害の障害IDが関連障害IDとして示され、また、業務名やサービスIDが一致しているレコードが(1)関連性対応表に存在するかを確認する。
該当する障害関連性情報がある場合(S05でYES)はS06に進む。
該当する障害関連性情報がない場合(S05でNO)はS03に戻り、同じセッション内で発生している障害のうち、まだ関連性の判定をしていない障害があるかどうかを確認する。
例えば、S02の検索によって取得した障害の障害IDがeid3であり、業務名やサービスIDが一致していれば、図4(1)の(イ)の1行目に対応しており、S05でYESとなる。
S05では、障害関連性判定部4014は、S04で検索した結果、該当する障害関連性情報があるかどうかを確認する。
つまり、S01で障害状態を設定した障害の障害ID(ここでは障害eid1)が対象障害IDとして示され、S02の検索によって取得した障害の障害IDが関連障害IDとして示され、また、業務名やサービスIDが一致しているレコードが(1)関連性対応表に存在するかを確認する。
該当する障害関連性情報がある場合(S05でYES)はS06に進む。
該当する障害関連性情報がない場合(S05でNO)はS03に戻り、同じセッション内で発生している障害のうち、まだ関連性の判定をしていない障害があるかどうかを確認する。
例えば、S02の検索によって取得した障害の障害IDがeid3であり、業務名やサービスIDが一致していれば、図4(1)の(イ)の1行目に対応しており、S05でYESとなる。
S06では、障害関連性判定部4014は、障害関連性情報記憶部4015から該当する判定条件を取得し、評価式によって回復の判定を行う。
S07では、障害関連性判定部4014は、S06の判定結果より、関連性があるかどうかを確認する。
関連性がある場合(S07のYES)はS08に進む。
関連性がない場合(S07のNO)はS03に戻る。
S07では、障害関連性判定部4014は、S06の判定結果より、関連性があるかどうかを確認する。
関連性がある場合(S07のYES)はS08に進む。
関連性がない場合(S07のNO)はS03に戻る。
S08では、障害関連性判定部4014は、関連すると判定された障害の障害状態を設定する(対処状況更新ステップ)。
つまり、解析結果情報において、関連すると判定された障害の障害状態を、S01で設定した障害状態に更新する。
その後、障害関連性判定部4014は、S03に戻り、同じセッション内で発生している障害のうち、まだ関連性の判定をしていない障害があるかどうかを確認する。
そして、障害関連性判定部4014は、同じセッション内で発生している全ての障害に対して、S01で障害状態を設定した障害(ここではサービスBで発生した障害eid1)との関連性判定が終わるまで、上述した処理を繰り返す。
つまり、解析結果情報において、関連すると判定された障害の障害状態を、S01で設定した障害状態に更新する。
その後、障害関連性判定部4014は、S03に戻り、同じセッション内で発生している障害のうち、まだ関連性の判定をしていない障害があるかどうかを確認する。
そして、障害関連性判定部4014は、同じセッション内で発生している全ての障害に対して、S01で障害状態を設定した障害(ここではサービスBで発生した障害eid1)との関連性判定が終わるまで、上述した処理を繰り返す。
S09では、障害関連性判定部4014は、別セッションに対して、障害状態を設定した障害と同じサービス(ここではサービスB)で発生している障害(例えば、セッションC以外のセッションで発生したサービスBの障害eid1)を、解析結果情報から検索する。
S10では、障害関連性判定部4014は、S09で検索した結果、該当する障害があるかどうかを確認する。
該当する障害がある場合(S10でYES)はS11に進む。
該当する障害がない場合(S10でNO)は関連する障害がないため終了する。
S10では、障害関連性判定部4014は、S09で検索した結果、該当する障害があるかどうかを確認する。
該当する障害がある場合(S10でYES)はS11に進む。
該当する障害がない場合(S10でNO)は関連する障害がないため終了する。
S11では、障害関連性判定部4014は、障害状態を設定した障害(ここではセッションCのサービスBで発生した障害eid1)とS09の検索によって取得した障害(例えば、セッションDのサービスBで発生した障害eid1)に該当する障害関連性情報4022を(1)関連性対応表から検索する。
S12では、障害関連性判定部4014は、S11で検索した結果、該当する障害関連性情報があるかどうかを確認する。
つまり、S01で障害状態を設定した障害の障害ID(ここでは障害eid1)が対象障害IDとして示され、S09の検索によって取得した障害の障害ID(ここでは障害eid1)が関連障害IDとして示されるレコードが(1)関連性対応表に存在するかを確認する。
該当する障害関連性情報がある場合(S12でYES)はS13に進む。
該当する障害関連性情報がない場合(S12のNO)はS10に戻り、他セッションに該当する障害があるかどうかを確認する。
この場合、図4(1)の(イ)の3行目に示す業務名が一致していれば、S12でYESとなる。
S12では、障害関連性判定部4014は、S11で検索した結果、該当する障害関連性情報があるかどうかを確認する。
つまり、S01で障害状態を設定した障害の障害ID(ここでは障害eid1)が対象障害IDとして示され、S09の検索によって取得した障害の障害ID(ここでは障害eid1)が関連障害IDとして示されるレコードが(1)関連性対応表に存在するかを確認する。
該当する障害関連性情報がある場合(S12でYES)はS13に進む。
該当する障害関連性情報がない場合(S12のNO)はS10に戻り、他セッションに該当する障害があるかどうかを確認する。
この場合、図4(1)の(イ)の3行目に示す業務名が一致していれば、S12でYESとなる。
S13では、障害関連性判定部4014は、障害関連性情報記憶部4015の(2)関連性判定条件表から該当する判定条件を取得し、評価式によって回復の判定を行う。
S14では、障害関連性判定部4014は、S13の判定結果より、関連性があるかどうかを確認する。
関連性がある場合(S14のYES)はS01に戻り、関連すると判定された障害の障害状態を設定する(対処状況更新ステップ)。
関連性がない場合(S14のNO)は終了する。
S14では、障害関連性判定部4014は、S13の判定結果より、関連性があるかどうかを確認する。
関連性がある場合(S14のYES)はS01に戻り、関連すると判定された障害の障害状態を設定する(対処状況更新ステップ)。
関連性がない場合(S14のNO)は終了する。
S09以降では、処置を実施した障害とは別のセッションに対して障害状態の設定を行うため、そのセッション内でも、発生した障害を取得し、関連性を判定する処理を繰り返す必要がある。
最初に障害状態を設定した障害(セッションCで発生したサービスBの障害eid1)と同じサービスで発生した障害(例えば、セッションDで発生したサービスBの障害eid1)と、その障害が発生したセッション(ここではセッションD)内で発生した他の障害に対して、関連性の判定が全て終わると処理が終了となる。
最初に障害状態を設定した障害(セッションCで発生したサービスBの障害eid1)と同じサービスで発生した障害(例えば、セッションDで発生したサービスBの障害eid1)と、その障害が発生したセッション(ここではセッションD)内で発生した他の障害に対して、関連性の判定が全て終わると処理が終了となる。
そして、障害状態が更新された最新の解析結果は、図10に例示する画面により、図2のクライアントI/F部4013によって運用監視者に表示される。
以上のように、本実施の形態により、処置を実施した障害に対して、運用監視者が、クライアントI/F部を介して障害状態を手動で設定することにより、障害状態を設定された障害と関連して発生した障害が特定され、その障害の障害状態が自動的に設定される。
そのため運用監視者は、障害状態設定のたびに、障害の因果関係を判定し、全ての障害状態を手動で設定する必要がなくなる。
これにより、運用監視者の負荷軽減による作業時間の短縮の効果が期待できる。
クライアントI/F部においては、処置を必要としない障害(例えば、障害状態が回復済や処置不要)を非表示にすることにより、より効率的なサービスの運用管理が可能となる。
障害関連性情報を定義し、セッション毎に障害の関連性を判定することにより、親子などのサービス依存関係のみによる関連性の判定よりも、より正確な判定が可能となる。
そのため運用監視者は、障害状態設定のたびに、障害の因果関係を判定し、全ての障害状態を手動で設定する必要がなくなる。
これにより、運用監視者の負荷軽減による作業時間の短縮の効果が期待できる。
クライアントI/F部においては、処置を必要としない障害(例えば、障害状態が回復済や処置不要)を非表示にすることにより、より効率的なサービスの運用管理が可能となる。
障害関連性情報を定義し、セッション毎に障害の関連性を判定することにより、親子などのサービス依存関係のみによる関連性の判定よりも、より正確な判定が可能となる。
以上、本実施の形態では、
ESBの実行ログを入力とし、実行ログから障害を検出して解析結果を出力する解析部と、解析部の解析結果を表示し、表示した障害情報に対して手動による障害状態の設定を行うインタフェースを提供するクライアントI/F部と、クライアントI/F部から設定された障害状態と解析結果、障害関連性情報を入力とし、障害の関連性を判定し、自動で障害状態を設定する障害関連性判定部を備えるサービス運用管理サーバ装置、サービス運用管理方法及びサービス運用管理プログラムを説明した。
ESBの実行ログを入力とし、実行ログから障害を検出して解析結果を出力する解析部と、解析部の解析結果を表示し、表示した障害情報に対して手動による障害状態の設定を行うインタフェースを提供するクライアントI/F部と、クライアントI/F部から設定された障害状態と解析結果、障害関連性情報を入力とし、障害の関連性を判定し、自動で障害状態を設定する障害関連性判定部を備えるサービス運用管理サーバ装置、サービス運用管理方法及びサービス運用管理プログラムを説明した。
最後に、本実施の形態に示したサービス運用管理サーバ装置401のハードウェア構成例について説明する。
図9は、本実施の形態に示すサービス運用管理サーバ装置401のハードウェア資源の一例を示す図である。
なお、図9の構成は、あくまでもサービス運用管理サーバ装置401のハードウェア構成の一例を示すものであり、サービス運用管理サーバ装置401のハードウェア構成は図9に記載の構成に限らず、他の構成であってもよい。
図9は、本実施の形態に示すサービス運用管理サーバ装置401のハードウェア資源の一例を示す図である。
なお、図9の構成は、あくまでもサービス運用管理サーバ装置401のハードウェア構成の一例を示すものであり、サービス運用管理サーバ装置401のハードウェア構成は図9に記載の構成に限らず、他の構成であってもよい。
図9において、サービス運用管理サーバ装置401は、プログラムを実行するCPU911(Central Processing Unit、中央処理装置、処理装置、演算装置、マイクロプロセッサ、マイクロコンピュータ、プロセッサともいう)を備えている。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、SSD(Solid State Drive)、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
本実施の形態で説明した解析結果情報記憶部4012及び障害関連性情報記憶部4015は、例えば、RAM914により実現される。
また、本実施の形態で説明した情報記憶装置402は、例えば、磁気ディスク装置920により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力装置の一例である。
CPU911は、バス912を介して、例えば、ROM(Read Only Memory)913、RAM(Random Access Memory)914、通信ボード915、表示装置901、キーボード902、マウス903、磁気ディスク装置920と接続され、これらのハードウェアデバイスを制御する。
更に、CPU911は、FDD904(Flexible Disk Drive)、コンパクトディスク装置905(CDD)、プリンタ装置906、スキャナ装置907と接続していてもよい。また、磁気ディスク装置920の代わりに、SSD(Solid State Drive)、光ディスク装置、メモリカード(登録商標)読み書き装置などの記憶装置でもよい。
RAM914は、揮発性メモリの一例である。ROM913、FDD904、CDD905、磁気ディスク装置920の記憶媒体は、不揮発性メモリの一例である。これらは、記憶装置の一例である。
本実施の形態で説明した解析結果情報記憶部4012及び障害関連性情報記憶部4015は、例えば、RAM914により実現される。
また、本実施の形態で説明した情報記憶装置402は、例えば、磁気ディスク装置920により実現される。
通信ボード915、キーボード902、マウス903、スキャナ装置907、FDD904などは、入力装置の一例である。
また、通信ボード915、表示装置901、プリンタ装置906などは、出力装置の一例である。
通信ボード915は、例えば、LAN(ローカルエリアネットワーク)、インターネット、WAN(ワイドエリアネットワーク)、SAN(ストレージエリアネットワーク)などに接続されている。
磁気ディスク装置920には、オペレーティングシステム921(OS)、ウィンドウシステム922、プログラム群923、ファイル群924が記憶されている。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
プログラム群923のプログラムは、CPU911がオペレーティングシステム921、ウィンドウシステム922を利用しながら実行する。
また、RAM914には、CPU911に実行させるオペレーティングシステム921のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
また、RAM914には、CPU911による処理に必要な各種データが格納される。
また、ROM913には、BIOS(Basic Input Output System)プログラムが格納され、磁気ディスク装置920にはブートプログラムが格納されている。
サービス運用管理サーバ装置401の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
サービス運用管理サーバ装置401の起動時には、ROM913のBIOSプログラム及び磁気ディスク装置920のブートプログラムが実行され、BIOSプログラム及びブートプログラムによりオペレーティングシステム921が起動される。
上記プログラム群923には、本実施の形態の説明において「〜部」(「解析結果情報記憶部4012及び障害関連性情報記憶部4015」以外、以下同様)として説明している機能を実行するプログラムが記憶されている。
プログラムは、CPU911により読み出され実行される。
プログラムは、CPU911により読み出され実行される。
ファイル群924には、本実施の形態の説明において、「〜の判断」、「〜の判定」、「〜の検索」、「〜の比較」、「〜の抽出」、「〜の更新」、「〜の設定」、「〜の選択」、「〜の入力」、「〜の受信」等として説明している処理の結果を示す情報やデータや信号値や変数値やパラメータが、「〜ファイル」や「〜データベース」の各項目として記憶されている。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。
ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出される。
そして、読み出された情報やデータや信号値や変数値やパラメータは、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、本実施の形態で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示す。
データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。
また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
「〜ファイル」や「〜データベース」は、ディスクやメモリなどの記録媒体に記憶される。
ディスクやメモリなどの記憶媒体に記憶された情報やデータや信号値や変数値やパラメータは、読み書き回路を介してCPU911によりメインメモリやキャッシュメモリに読み出される。
そして、読み出された情報やデータや信号値や変数値やパラメータは、抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示などのCPUの動作に用いられる。
抽出・検索・参照・比較・演算・計算・処理・編集・出力・印刷・表示のCPUの動作の間、情報やデータや信号値や変数値やパラメータは、メインメモリ、レジスタ、キャッシュメモリ、バッファメモリ等に一時的に記憶される。
また、本実施の形態で説明しているフローチャートの矢印の部分は主としてデータや信号の入出力を示す。
データや信号値は、RAM914のメモリ、FDD904のフレキシブルディスク、CDD905のコンパクトディスク、磁気ディスク装置920の磁気ディスク、その他光ディスク、ミニディスク、DVD等の記録媒体に記録される。
また、データや信号は、バス912や信号線やケーブルその他の伝送媒体によりオンライン伝送される。
また、本実施の形態の説明において「〜部」として説明しているものは、「〜回路」、「〜装置」、「〜機器」であってもよく、また、「〜ステップ」、「〜手順」、「〜処理」であってもよい。
すなわち、本実施の形態で説明したフローチャートに示すステップ、手順、処理により、本発明に係る「情報処理方法」を実現することができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。
或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。
プログラムはCPU911により読み出され、CPU911により実行される。
すなわち、プログラムは、本実施の形態の「〜部」としてコンピュータを機能させるものである。あるいは、本実施の形態の「〜部」の手順や方法をコンピュータに実行させるものである。
すなわち、本実施の形態で説明したフローチャートに示すステップ、手順、処理により、本発明に係る「情報処理方法」を実現することができる。
また、「〜部」として説明しているものは、ROM913に記憶されたファームウェアで実現されていても構わない。
或いは、ソフトウェアのみ、或いは、素子・デバイス・基板・配線などのハードウェアのみ、或いは、ソフトウェアとハードウェアとの組み合わせ、さらには、ファームウェアとの組み合わせで実施されても構わない。
ファームウェアとソフトウェアは、プログラムとして、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVD等の記録媒体に記憶される。
プログラムはCPU911により読み出され、CPU911により実行される。
すなわち、プログラムは、本実施の形態の「〜部」としてコンピュータを機能させるものである。あるいは、本実施の形態の「〜部」の手順や方法をコンピュータに実行させるものである。
このように、本実施の形態に示すサービス運用管理サーバ装置401は、処理装置たるCPU、記憶装置たるメモリ、磁気ディスク等、入力装置たるキーボード、マウス、通信ボード等、出力装置たる表示装置、通信ボード等を備えるコンピュータである。
そして、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
そして、上記したように「〜部」として示された機能をこれら処理装置、記憶装置、入力装置、出力装置を用いて実現するものである。
20 情報システム、40 運用管理装置、101 業務用クライアント装置、201 業務サーバ装置、202 ESBサーバ装置、203 ネットワーク、204 サーバ装置A、205 サーバ装置B、301 管理用クライアント装置、401 サービス運用管理サーバ装置、402 情報記憶装置、2021 実行ログ、2041 サービスA1、2042 サービスA2、2051 サービスB1、2052 サービスB2、4011 解析部、4012 解析結果情報記憶部、4013 クライアントI/F部、4014 障害関連性判定部、4015 障害関連性情報記憶部、4021 障害定義情報、4022 障害関連性情報。
Claims (13)
- 管理対象システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する関連障害情報を記憶する関連障害情報記憶部と、
前記管理対象システムで発生した障害と、発生した障害に対する対処状況とを示す対処状況情報を記憶する対処状況情報記憶部と、
対処状況が変化した障害を状況変化障害として示すとともに、前記状況変化障害の新たな対処状況を示す更新要求を入力する入力部と、
前記対処状況情報において前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記関連障害情報において前記状況変化障害に関連障害が定義されている場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新する対処状況更新部とを有することを特徴とする情報処理装置。 - 前記関連障害情報記憶部は、
関連障害の対処状況の更新を行うか否かの判定条件を関連性判定条件として定義する関連障害情報を記憶しており、
前記対処状況更新部は、
前記対処状況情報において前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記状況変化障害の関連障害について関連性判定条件が成立するか否かを判定し、
関連性判定条件が成立する場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項1に記載の情報処理装置。 - 前記対処状況情報記憶部は、
前記管理対象システムにおいて複数のデータ処理を対応付けて管理する単位であるセッションごとに、セッションにて発生した障害と、発生した障害に対する対処状況とを示す対処状況情報を記憶し、
前記入力部は、
前記状況変化障害と、前記状況変化障害の新たな対処状況とを示すとともに、前記状況変化障害が発生したセッションを更新対象セッションとして示す更新要求を入力し、
前記対処状況更新部は、
前記対処状況情報において前記更新対象セッションに対応する前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記関連障害情報において前記状況変化障害の関連障害が定義されている場合に、前記対処状況情報において前記更新対象セッションに対応する当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項1又は2に記載の情報処理装置。 - 前記関連障害情報記憶部は、
関連障害の対処状況の更新を行うか否かの判定条件を関連性判定条件として定義する関連障害情報を記憶しており、
前記対処状況更新部は、
前記状況変化障害の関連障害について関連性判定条件が成立するか否かを判定し、
関連性判定条件が成立する場合に、前記対処状況情報において前記更新対象セッションに対応する当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項3に記載の情報処理装置。 - 前記対処状況更新部は、
前記更新対象セッション以外の他のセッションで発生したいずれかの障害が前記関連障害情報において前記状況変化障害の関連障害と定義されている場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項3又は4に記載の情報処理装置。 - 前記対処状況更新部は、
前記更新対象セッション以外の他のセッションで発生した障害が前記関連障害情報において前記状況変化障害の関連障害と定義されており、当該関連障害に対する関連障害が前記関連障害情報において定義されている場合に、後者の関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項5に記載の情報処理装置。 - 前記関連障害情報記憶部は、
関連障害の対処状況の更新を行うか否かの判定条件を関連性判定条件として定義する関連障害情報を記憶しており、
前記対処状況更新部は、
関連障害について関連性判定条件が成立するか否かを判定し、
関連性判定条件が成立する場合に、前記対処状況情報において前記他のセッションで発生した関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項5又は6に記載の情報処理装置。 - 前記情報処理装置は、
サービスを提供するシステムを管理対象システムとしており、
前記関連障害情報記憶部は、
関連障害を、サービスと対応付けて定義する関連障害情報を記憶し、
前記対処状況情報記憶部は、
前記管理対象システムで発生した障害を、障害が発生した際に実行中であったサービスと対応付けて管理する対処状況情報を記憶し、
前記対処状況更新部は、
前記関連障害情報において前記状況変化障害の関連障害が定義されている場合に、当該関連障害が発生した際に実行中であったサービスが前記関連障害情報において当該関連障害に対応付けられているサービスと一致するか否かを前記対処状況情報に基づいて判定し、
両サービスが一致する場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項1〜7のいずれかに記載の情報処理装置。 - 前記情報処理装置は、
業務を支援するサービスを提供するシステムを管理対象システムとしており、
前記関連障害情報記憶部は、
関連障害を、業務と対応付けて定義する関連障害情報を記憶し、
前記対処状況情報記憶部は、
前記管理対象システムで発生した障害を、障害が発生した際に実行中であったサービスが対象とする業務と対応付けて管理する対処状況情報を記憶し、
前記対処状況更新部は、
前記関連障害情報において前記状況変化障害の関連障害が定義されている場合に、当該関連障害が発生した際に実行中であったサービスが対象とする業務が前記関連障害情報において当該関連障害に対応付けられている業務と一致するか否かを前記対処状況情報に基づいて判定し、
両業務が一致する場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新することを特徴とする請求項1〜8のいずれかに記載の情報処理装置。 - 前記情報処理装置は、
SOA(Service Oriented Architecture)技術により構築されたシステムを管理対象システムとすることを特徴とする請求項8又は9に記載の情報処理装置。 - 前記情報処理装置は、
所定の端末装置に接続されており、
前記情報処理装置は、更に、
前記対処状況更新部により更新された後の対処状況を障害の名称とともに前記端末装置に出力する出力部を有することを特徴とする請求項1〜10のいずれかに記載の情報処理装置。 - 管理対象システムで発生した障害と、発生した障害に対する対処状況とを示す対処状況情報を管理するコンピュータが行う情報処理方法であって、
前記管理対象システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する関連障害情報を、前記コンピュータが所定の記憶領域から読み出す関連障害情報読み出しステップと、
前記コンピュータが、対処状況が変化した障害を状況変化障害として示すとともに、前記状況変化障害の新たな対処状況を示す更新要求を入力する入力ステップと、
前記コンピュータが、前記対処状況情報において前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記関連障害情報において前記状況変化障害に関連障害が定義されている場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新する対処状況更新ステップとを有することを特徴とする情報処理方法。 - 管理対象システムで発生した障害と、発生した障害に対する対処状況とを示す対処状況情報を管理するコンピュータに、
前記管理対象システムで発生する障害に対して、障害発生原因において関連のある障害を関連障害として定義する関連障害情報を、所定の記憶領域から読み出す関連障害情報読み出しステップと、
対処状況が変化した障害を状況変化障害として示すとともに、前記状況変化障害の新たな対処状況を示す更新要求を入力する入力ステップと、
前記対処状況情報において前記状況変化障害の対処状況を前記更新要求に示される新たな対処状況に更新するとともに、前記関連障害情報において前記状況変化障害に関連障害が定義されている場合に、前記対処状況情報において当該関連障害の対処状況を前記更新要求に示される新たな対処状況に更新する対処状況更新ステップとを実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011028350A JP2012168687A (ja) | 2011-02-14 | 2011-02-14 | 情報処理装置及び情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011028350A JP2012168687A (ja) | 2011-02-14 | 2011-02-14 | 情報処理装置及び情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2012168687A true JP2012168687A (ja) | 2012-09-06 |
Family
ID=46972795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011028350A Withdrawn JP2012168687A (ja) | 2011-02-14 | 2011-02-14 | 情報処理装置及び情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2012168687A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019036194A (ja) * | 2017-08-18 | 2019-03-07 | 富士通株式会社 | 監視制御プログラム、監視制御方法、および情報処理装置 |
-
2011
- 2011-02-14 JP JP2011028350A patent/JP2012168687A/ja not_active Withdrawn
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019036194A (ja) * | 2017-08-18 | 2019-03-07 | 富士通株式会社 | 監視制御プログラム、監視制御方法、および情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7721158B2 (en) | Customization conflict detection and resolution | |
US8898178B2 (en) | Solution monitoring system | |
JP5684946B2 (ja) | イベントの根本原因の解析を支援する方法及びシステム | |
US9336259B1 (en) | Method and apparatus for historical analysis analytics | |
JP5325981B2 (ja) | 管理サーバ及び管理システム | |
US10592325B2 (en) | Enabling symptom verification | |
US8677194B2 (en) | Method and system for site configurable error reporting | |
US20110314138A1 (en) | Method and apparatus for cause analysis configuration change | |
US10476768B2 (en) | Diagnostic and recovery signals for disconnected applications in hosted service environment | |
US11074119B2 (en) | Automatic root cause analysis for web applications | |
US20190121717A1 (en) | Dynamic, crowd-sourced error and crash resolution for computer programs | |
US20080126283A1 (en) | Method of capturing Problem Resolution for Subsequent Use in Managed Distributed Computer Systems | |
WO2013124947A1 (ja) | 情報システム管理装置及び情報システム管理方法及びプログラム | |
JP2011113122A (ja) | 障害影響分析装置及び業務システム及び障害影響分析方法 | |
JP5417264B2 (ja) | 分析情報提供方法 | |
JP7538272B2 (ja) | 機械学習モデル運用管理システム、運用管理方法及びコンピュータプログラム | |
JP6579995B2 (ja) | 静観候補特定装置、静観候補特定方法及び静観候補特定プログラム | |
JP2012168687A (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP4445750B2 (ja) | 因果関係推定プログラム及び因果関係推定方法 | |
JP5197128B2 (ja) | 依存関係推定装置及び依存関係推定プログラム及び記録媒体 | |
JP6580535B2 (ja) | 開発支援システム及び方法 | |
JP2011141789A (ja) | 情報処理装置及び情報処理方法及びプログラム | |
JP2011227789A (ja) | 情報処理装置及びプログラム | |
JP7167749B2 (ja) | 情報処理装置、情報処理システム、及び情報処理プログラム | |
US11645137B2 (en) | Exception management in heterogenous computing environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20140513 |