WO2011083750A1

WO2011083750A1 - 情報処理装置、サービス管理方法、並びにサービス管理プログラム

Info

Publication number: WO2011083750A1
Application number: PCT/JP2010/073874
Authority: WO
Inventors: 悠吉田
Original assignee: 日本電気株式会社
Priority date: 2010-01-07
Filing date: 2010-12-24
Publication date: 2011-07-14
Also published as: US20130073912A1; JPWO2011083750A1

Abstract

（課題）　提供サービスに問題が発生した場合に、その問題の影響度を総合評価すること。（解決手段）　本発明の情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、違反値を用いて、条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。

Description

情報処理装置、サービス管理方法、並びにサービス管理プログラム

　本発明は、サービスを管理する技術に関する。

　近年、情報システムをビジネスに活用する組織や企業が、増えてきている。それらの組織や企業へ情報サービスを提供するサービス提供者は、そのサービス受容者に対するサービス品質を管理する必要がある。
　具体的には、システム運用管理者は、システムの不具合や故障、劣化に基づいて引き起こされるサービス障害（品質レベル低下）を検知し、早急に問題箇所と原因とを特定し対処する。システムが大規模になると、同時に発生するサービス障害が多くなり、そういった場合、システム運用管理者は、サービス受容者への影響が最小限に抑えられるよう、各障害に対するサービス受容者への影響度を正確に把握し、対処順序を判断する必要性が生じる。特に、システム運用管理者は、サービス受容者との同意に反することがないよう対処順序を決定し、障害に基づいて受ける金銭的ダメージを可能な限り抑えるような判断を下すことが望ましい。
　このような状況下において、特許文献１には、サービスの契約情報に対する充足度を判定する技術が、開示されている。一方、特許文献２には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。ここ（特許文献２）では、同一サービスに対してサービス受容者ごとに異なる複数のサービスレベル目標が設定され、特許文献２に記載のＳＬＯ（ｓｅｒｖｉｃｅ　ｌｅｖｅｌ　ｏｂｊｅｃｔｉｖｅｓ）アナライザが、修正が必要なサービス構成要素を特定する。
　また、特許文献３には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。特に複数のサービス受容者へサービスを提供する場合において、特許文献３に記載の満足度算出部は、同一サービス内で、満足度が１００％実現されているサービス受容者と実現されていないサービス受容者とを検出する。そして、特許文献３には、過剰な満足度を実現しているサービス受容者へのサービスを制限することで、満足度が不足しているサービス受容者へのサービス品質を向上させる方式が、記載されている。

特開２００１−３２０３７０号公報特開２００８−１０８２６２号公報特開平０９−２４４９７３号公報

　しかし、上記の関連する技術では、提供サービスに問題が発生した場合、異なるサービス受容者に対する影響を総合したサービス全体の状態を示す指標がなかったため、その問題の影響度を総合評価することができない問題点があった。
　本発明の目的は、上述の課題を解決する情報処理装置を提供することにある。
（課題を解決するための手段）
　上記目的を達成するため、本発明に係る情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。
　上記目的を達成するため、本発明に係るサービス管理方法は、情報サービスに関連する監視対象項目について、測定値を取得し、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する。
　上記目的を達成するため、本発明に係るサービス管理プログラムは、コンピュータに、情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理とを実行させる。
（発明の効果）
　本発明によれば、提供サービスに問題が発生した場合に、その問題の影響度を総合評価できる。

本発明における第１実施形態に係る影響度算出装置において影響度を算出する処理を示すフローチャートである。本発明の第１実施形態に係る影響度算出装置の構成例を示すブロック図である。本発明の第１実施形態に係る影響度算出装置の記憶部に登録されているデータの一例を示す図である。本発明の第１実施形態に係る影響度算出装置の取得部が出力するデータの一例を示す図である。本発明の第１実施形態に係る影響度算出装置の生成部が生成する画像例を示す図である。本発明の第１実施形態に係る生成部が生成する画像例を示す図である。本発明の第１実施形態に係る生成部が生成する画像例を示す図である。本発明の第１実施形態に係る生成部が生成する画像例を示す図である。本発明の第１実施形態に係る生成部が生成する画像例を示す図である。本発明の第１実施形態に係る影響度算出装置で取得又は算出されるデータを示す図である。本発明の第２実施形態に係る影響度算出装置の構成例を示す図である。本発明の第２実施形態に係る影響度算出装置の記憶部に登録されているデータの一例を示す図である。本発明の第２実施形態に係る生成部が生成する画像例を示す図である。本発明の第２実施形態に係る生成部が生成する画像例を示す図である。本発明の第２実施形態に係る生成部が生成する画像例を示す図である。本発明の第２実施形態に係る生成部が生成する画像例を示す図である。本発明の第２実施形態に係る影響度算出装置において影響度を算出する処理を示すフローチャートである。本発明の第１実施形態の係る情報処理装置の構成例を示すブロック図である。

　以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらに限定する趣旨のものではない。
　（用語の定義）
　まず、本発明の実施形態について説明する前に、必要な用語を定義する。
　「ＩＴサービス（情報サービス）」は、ＩＴ（Ｉｎｆｏｒｍａｔｉｏｎ　Ｔｅｃｈｎｏｌｏｇｙ）を利用するサービス受容者を支援するＩＴ機能の集合体で、監視指標に基づき品質についての評価が可能である。例えば、ＩＴサービスは、メールシステムの導入管理サービスや業務システムの導入管理サービスを含む。
　「ＣＩ（Ｃｏｎｆｉｇｕｒａｔｉｏｎ　Ｉｔｅｍ）」は、ＩＴサービスに含まれるＩＴ機能を実現するための構成要素である。例えば、サーバ、ＶＭ（Ｖｉｒｔｕａｌ　Ｍａｃｈｉｎｅ、仮想機械）、ＮＷ（Ｎｅｔｗｏｒｋ）機器、アプリケーション、プロセスなどを含む。
　「障害」とは、ＣＩの故障、不具合、及びそれに基づくＩＴサービスの停止、監視指標レベル低下の現象とする。
　「ＳＬＡ（Ｓｅｒｖｉｃｅ　Ｌｅｖｅｌ　Ａｇｒｅｅｍｅｎｔ）」とは、ＩＴサービスレベルに関して、ＩＴサービス提供者とサービス受容者との間で同意のある条件を指す。ＳＬＡは、ＩＴサービスの可用性や信頼性、性能等に関する項目が一般的で、「ＩＴサービス提供期間中、ＴＡＴ（Ｔｕｒｎ　Ａｒｏｕｎｄ　Ｔｉｍｅ）は５秒以下を保証する」といった条件が数値化されたものである。本実施形態で扱うＳＬＡは、同意レベルが数値表現可能な項目とする。項目の例は、ＴＡＴ、冗長ＨＷ（Ｈａｒｄｗａｒｅ）数などである。また、ここ（実施形態）でのＳＬＡは、規約（条件）名にＳＬＡという言葉が明示されている場合に限るものではなく、ＩＴサービスの品質レベルの保証に関する数値規約が含まれた同意条件をすべて含むものとする。つまり、本実施形態では、ＳＬＡは、監視対象項目に関して要求される条件をいう。
　なお、ＳＬＡは、ＩＴサービス提供者と複数のサービス受容者との間で、別々に同意があったＩＴサービスレベルについて、異なる条件である場合も含む。
　（第１実施形態）
　本発明の第１実施形態は、ＩＴサービスの提供状態を把握するための技術、すなわち障害発生時のＩＴサービスへの影響度を算出するサービス管理技術に関する。本発明の第１実施形態は、特に、ＩＴサービスや、ＩＴサービス提供のための監視対象項目となる機器や、ＩＴサービスの提供を受けるサービス受容者を大量に備える大規模システムで有効な技術である。複数のサービス契約情報に対する閾値違反を一つの指標に集約することで、本発明の第１実施形態は、当該サービスの品質を算定する。本発明の第１実施形態は、複数の契約情報に対する評価を算出する。
　＜構成＞
　図２は、本発明の第１実施形態に係る情報処理装置としての影響度算出装置の構成例を表すブロック図である。図２に示す影響度算出装置は、入出力部１と、取得部３と、算出部４と、生成部５と、記憶部２とを含む。
　まず、入出力部１は、マウスやキーボードなどの入力デバイスと、ディスプレイなどの出力デバイスとを含む。
　記憶部２は、システムのＣＩとＩＴサービスとの紐（関連）付け、ＩＴサービスとＳＬＡとの紐（関連）付け、各ＳＬＡの項目とその数値条件（例えば、ＳＬＡのひとつであるＳＬＡ＿０１では、ＴＡＴ項目は５秒以内を保障する、といった条件）の情報を登録している。
　取得部３は、監視対象であるシステムを構成するＣＩ及びＩＴサービスに関して、取得設定された監視指標の測定値をリアルタイムで収集し、その情報を算出部４へ出力する。
　算出部４は、記憶部２へ登録されているＣＩに紐（関連）付けられたＳＬＡについて、取得部３で取得した監視指標の測定値と比較して、条件違反の度合いを示す違反値を算出する。言い換えれば、算出部４は、どのＳＬＡに対してどの程度違反しているかを、定量的に違反値として算出する。そして、算出部４は、各ＩＴサービスについて、ＳＬＡ違反が与える影響の度合いを影響度として算出する。具体的には、算出部４は、ＩＴサービスに紐（関連）付けられた複数のＳＬＡの違反値の総和を算出し、これを「影響度」とする。また、算出部４は、ＳＬＡで、現状の監視指標の測定では違反となっていないが、将来的に監視指標が最悪になった場合の影響度についても最悪影響度として算出する。
　ＳＬＡはＩＴサービスに紐（関連）付けられており、ＩＴサービスがそれ（ＩＴサービス）を構成するＣＩへ紐（関連）付けられていることが多い。しかし、ＣＩに直接ＳＬＡが紐（関連）付けられている場合もある。それらデータの構成は、記憶部２への登録情報に依存する。
　生成部５は、算出部４において算出されたＣＩ及びＩＴサービス障害についての影響度あるいは最悪影響度、又はその両方を、グラフ等で視覚的に表示するための画像データを生成する画像生成手段である。生成部５がこのような画像データを生成すれば、システム全体としての問題有無や深刻度といったものが、一見して把握できるようになる。
　図３は、本実施の形態における記憶部２に登録された登録データ３０１の一例を示す図である。各々のＳＬＡ＿ＩＤ（識別子）は、ＩＴサービスＩＤと紐（関連）付けられており、さらに具体的な指標の項目とその数値条件が設定されている。例えば、ＳＬＡ＿００１は、ＩＴサービス０１に関するＳＬＡであり、応答時間は５秒以内を、可用性は９９．９％以上を保証する内容である。一方、ＳＬＡ＿００２も、やはりＩＴサービス０１に関するＳＬＡであるが、このＳＬＡでは、応答時間は１０秒以内を、可用性は９９．０％以上を保証する内容である。さらに、ＳＬＡ＿００３は、ＩＴサービス０２に関するＳＬＡであり、このＳＬＡでは、応答時間は５秒以内を、可用性は９９．９％以上を保証する内容である。このように、記憶部２を参照すれば、算出部４は、特定のＳＬＡについて、どのような条件を満足できるかを導き出せる。一方、算出部４は、特定のＩＴサービスについて、応答時間や可用性などの数値が与えられれば、どのＳＬＡに対してどの程度問題となるのかも、導き出せる。
　なお、本実施の形態のおける影響度算出装置は、それぞれのＳＬＡに対して重みを付けても良い。例えば、影響度算出装置は、図３には示していないが、記憶部２内に、ＳＬＡごとの重要度を設定してもよい。例えば、影響度算出装置は、ＳＬＡ＿００１の重要度を１として、ＳＬＡ＿００２の重要度が０．５、ＳＬＡ＿００３の重要度が０．３など、サービス受容者の規模などに応じてＳＬＡに相対的な重要度を設定すればよい。そのようにしておけば、影響度算出装置は、ＩＴサービスの不具合に対する重要性を総合的に正確に導ける。さらには、ＳＬＡは、それぞれの指標の項目に重み付けされていても良い。
　図４は、取得部３が収集し算出部４へ出力する測定データ４０１の一例を示す。測定データ４０１は、一例として、ある測定タイムスタンプにおける各監視対象ＣＩについての応答時間、可用性を測定対象の指標としている。なお、可用性は、ＩＴサービスの実稼動時間と計画稼働時間との比率を用いて求めることが一般的である。例では各ＩＴサービスにおける計画稼働時間が予め設定されているものとして、取得部３は、測定に基づく稼働状況判定後、実稼働時間を算出し、そこから可用性を算出している。
　図３を参照するとＳＬＡ＿００１は、ＩＴサービス０１の応答時間が遵守する条件として、５秒以内を規定している。これに対し、図４の測定データ４０１は、ＩＴサービス０１に関する応答時間の測定値が、７秒となっており、ＳＬＡ＿００１に違反している。この場合、７秒が５秒の１４０％であることから４０％超過であるため、算出部４は、応答時間に関する違反値を「４０」と算出できる。
　図３を参照すると、ＳＬＡ＿００１は、ＩＴサービス０１の可用性で遵守する条件として９９．９％以上を規定している。これに対し、図４の測定データ４０１は、ＩＴサービス０１に関する可用性が１００％となっており、ＳＬＡ＿００１に違反していない。すなわち、（ＳＬＡ値）≦（実測値）となっているため、算出部４は、可用性に関する違反値を「０」と算出できる。仮に、測定データにおいてＩＴサービス０１に関する可用性が９０％であった場合、（ＳＬＡ値）≦（実測値）が成り立たない。そのため、算出部４は、違反値を「０」ではなく、９０％が９９．９％の９０．１≒９０％であり１０％不足であるため、違反値を「１０」と算出できる。
　一方、算出部４は、各指標項目について最悪の測定値を予め規定しておくことで、最悪影響度を算出できる。例えば、ＩＴサービス０１、ＩＴサービス０２、ＩＴサービス０３の最悪応答時間がそれぞれ２０秒だとすると、ＳＬＡ＿００１の最悪違反値は「３００」（２０秒は、５秒の３００％超過）、ＳＬＡ＿００２の最悪違反値は「１００」、ＳＬＡ＿００３の最悪違反値は「３００」となる。そして、算出部４は、各ＳＬＡの重要度を違反値に乗算してその総和を影響度として算出する。図３に示したＩＴサービス０１の影響度は、そこ（ＩＴサービス０１）に紐（関連）付けられているＳＬＡの影響度の総和とすると、４０＋０＝４０となる。また、最悪影響度は、最悪影響度の総和として、３００＋１００＝４００となる。
　また、記憶部２に、ＩＴサービスとＣＩとの関連情報が登録されている場合は、それら情報を用いて関連するＩＴサービス、ＳＬＡをたどることで、算出部４は、ＣＩに対する影響度及び最悪影響度を算出することもできる。生成部５は、算出部４から出力された算出結果を画面へ表示する。
　図５は、生成部５に基づいて生成されたグラフ画像の一例を示す図である。この棒グラフは、各ＩＴサービスに関する影響度及び最悪影響度を示している。全体が最悪影響度、ハッチング部分が現状の影響度を示す。図５では、生成部５は、最悪影響度の大きさに基づいてＩＴサービスをソートして表示している。なお、生成部５は、用途に応じて、現状の影響度又は最悪影響度を表示してもよい。図６では、生成部５は、ＩＴサービスの枠組みを超えて、すべてのＩＴサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、現状の影響度をハッチングで表示している。このような表示に基づき、生成部５は、監視対象のすべてのＳＬＡにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
　グラフ表示の場合、生成部５は、応答時間、可用性といった監視指標ごとの影響度を図７のように個別にグラフ表示してもよいし、これら複数の監視指標における影響度を組み合わせて（例えば重み付け平均などを用いて）統一的にグラフ表示してもよい。図７では、生成部５は、あるＩＴサービスに関する項目影響度を時系列に表示している。生成部５は、算出部４から出力されたデータをタイムスタンプに基づき集計し表示する。表示対象は、複数のＩＴサービスであってもよいし、すべてのＩＴサービスにおける影響度の総和であっても良い。
　図８では、生成部５は、図５と同様の情報を円グラフ表示している。図５と同様、生成部５は、最悪影響度に対する現状の影響度（ハッチング部）の割合（占有率）を、ＩＴサービスごとに示しており、現状影響度のあるＩＴサービスを表示対象としている。また、図９では、生成部５は、そのＩＴサービス提供者が守るべき全ＳＬＡに対し、違反のあるＳＬＡの割合を円グラフ表示している。
　＜処理＞
　次に、図１及び図１０を用いて、本実施形態の処理について説明する。図１は、算出部４におけるＩＴサービスの影響度算出処理の一例を表すフローチャートである。図１０は、図１のフローチャートで参照及び算出されるデータをまとめた表である。まず、算出部４は、影響度を取得したいＩＴサービスを特定し、そのＩＴサービスに必要とするＣＩの中で、影響度の算出に必要な監視対象項目について情報を記憶部２から読み出し、さらに、その監視対象項目についての測定値を取得部３から取得する（Ｓ１０１）。図１０では、算出部４は、サービス１００１として、ＩＴサービス０１、ＩＴサービス０２を特定している。算出部４は、これらサービスに対する、監視対象１００２、重要度１００３、最悪測定値１００４を記憶部２から読み出し、測定値１００５を取得部３から取得する。
　次に、算出部４は、特定したＩＴサービスに関連するＳＬＡについての情報を記憶部２から読み出す。読み出すＳＬＡは、図１０における、ＳＬＡ１００６、条件１００７、重要度１００８に相当する。そして、算出部４は、各ＳＬＡの条件１００７と測定値１００５とを照らし合わせて、各ＳＬＡの違反値１００９を算出する（Ｓ１０２）。算出部４は、違反値１００９を、各指標のＳＬＡ契約値と測定値との差分や割合から算出しても良いし、違反（×）、遵守（○）といった二値で表現しても良い。
　次に、ＩＴサービスのすべてのＳＬＡの違反値に基づいて、算出部４は、ＩＴサービスの影響度を算出する（Ｓ１０４）。ＩＴサービスの影響度は、各ＳＬＡの重要度に基づいて違反値に重みを付与した重み付け総和を用いる。図１０では、例として、ＳＬＡ００１及びＳＬＡ００２は「１」、ＳＬＡ００３は「０．８」という重要度１００８が定義されている。算出部４は、各違反値をこれらの値に乗算して総和を取ることに基づき、まず、監視対象項目ごとの影響度（項目影響度１０１０）を算出できる。そして、算出部４は、項目影響度１０１０を合算することでＩＴサービスの影響度（サービス影響度１０１１）を算出できる。重要度が全ＳＬＡについて「１」であれば、影響度は、違反値の単純な総和となる。
　サービス影響度１０１１を算出後、算出部４は、読み出した最悪測定値１００４を用いて、各ＳＬＡの最悪違反値１０１２を算出し、最悪違反値１０１２を基に項目ごとの最悪影響度１０１３及びＩＴサービス全体の最悪影響度１０１４を算出する（Ｓ１０５）。最後に、生成部５が、Ｓ１０４及びＳ１０５で算出したＩＴサービス影響度及びＩＴサービス最悪影響度の結果を示す画像（図５~図９を例とした形式）を生成し、入出力部１に表示する（Ｓ１０６）。
　（変形例）
　なお、本実施の形態に係る情報処理装置（影響度算出装置）の各構成は、複数の構成に分かれても良い。例えば、算出部４は、１つの構成に限られず、複数の構成、例えば、違反値を算出する構成と、影響度を算出する構成に分かれても良い。また、各構成は、１つの装置に含まれず、別装置として構成してもよい。例えば、記憶部２は、ネットワークを介して接続した別の記憶装置としてもよい。また、生成部５及び入出力部１を別装置としてもよい。
　図１８は、本実施に形態に係る情報処理装置（影響度算出装置）の別の構成の一例を示す図である。図１８において図２と同じ構成には同じ番号を付し、詳細な説明は省略する。
　図１８に示す情報処理装置は、図２と同様の取得部３と、違反値を算出する違反値算出部４２と、影響度を算出する影響度算出部４３とを含んでいる。なお、違反値算出部４２と影響度算出部４３とは、合わせて、図２に示す算出部４と同様に動作する。
　また、図１８に示す情報処理装置は、記憶部２と、生成部５と、入出力部１とを、ネットワークを介して接続した別ユニットとしている。そのため、図１８では、ネットワークを介して接続されたユニットを点線で示している。ＣＩも、ネットワーク介して接続しているため、点線で示した。
　このように構成した情報処理装置（影響度算出装置）も、ネットワークを介して各ユニットと情報をやり取りし、図２に示す影響度算出装置と同様に動作できる。
　なお、図１８に示す情報処理装置は、本発明の最小構成である。
　＜第１実施形態の効果＞
　これまで説明した情報処理装置（影響度算出装置）は、ＩＴサービス提供者に、障害若しくは不具合等に基づいたＩＴサービス及びＣＩに問題が発生した場合、ＳＬＡ違反への影響をＩＴサービス、ＣＩ、若しくは、ＩＴシステムごとに確認するための表示を提供できる。また、情報処理装置は、このままＩＴサービス及びＣＩの問題が放置されると、それぞれに対して影響度がどのくらい拡大するかの可能性をサービス提供者へ分かりやすく提示できる。
　以上のように、本実施形態の情報処理装置は、障害及び不具合等に基づくＩＴサービス又はＣＩのＳＬＡ違反に関する影響を、ＩＴサービス提供者に、知らせることができる。また、情報処理装置は、影響度算出結果をグラフ等で表示することで、ＩＴサービス提供者に、優先的に対処するＩＴサービス及びＣＩの順序を、容易に把握させることができる。特に、ＩＴサービスにおける監視指標に関する閾値をＳＬＡから決定する場合、本実施形態における情報処理装置は、サービス受容者ごとのＩＴサービスに対する影響を違反値に直接的に反映することができ、影響度算出の正確さについて大きな効果が期待できる。
　つまり、あるＩＴサービスに問題が発生した場合、本実施形態の情報処理装置は、その問題が及ぼすサービス受容者の観点での影響の大きさを算出できる。
　また、複数のＩＴサービスに問題が発生し対処が必要となった場合に、本実施形態の情報処理装置は、ＩＴサービスごとのＳＬＡへの影響の大きさを算出できるため、ＩＴサービス提供者が対処の優先順位付けをする際の参考を提供できる。
　（第２実施形態）
　図１１は、第２実施形態としての影響度算出装置の構成を示すブロック図である。本実施形態は、図２に示す第１実施形態と比べて、算出部４が警告値算出部４１を含む点で異なる。
　図１２に本実施形態に係る記憶部２に登録されたデータの一例を示す。図３に示す第１実施形態における記憶部２の登録データ３０１との違いは、ＳＬＡの各指標（応答時間、可用性）において違反範囲に加えて警告範囲がデータとして存在することである。この警告範囲とは、サービス受容者とのＳＬＡ上は違反とはならないが、このまま対処なく放置しておけば違反となる可能性が高い値の範囲である。指標の性質に基づき異なるが、図１２に示す例は、違反になる一つ前の段階の数値を警告範囲としている。例えば、ＳＬＡ＿００１の応答時間は、３秒未満であれば正常、３秒以上５秒未満であれば警告（危険）、５秒以上であれば違反である。なお、ＳＬＡの違反以外の閾値は、警告を表す閾値以外に、警告に対しもう少し対処緊急度の低い危険レベルの範囲を表す危険値など、運用の状況に応じて自由に設定できる。
　算出部４は、警告値算出部４１において、各ＳＬＡで設定されている警告範囲と取得部３から取得した測定値とから警告値を算出する。警告値算出部４１は、測定値が警告範囲に入っているか否かを警告範囲内（○）、警告範囲外（×）の２値で表現しても良いし、警告範囲のどの位置かを２５％警告等の連続値で表現しても良い。例えば、ＩＴサービス０１の応答時間が７秒であるという測定値が取得された場合、ＳＬＡ＿００２について、警告範囲が５秒以上、１０秒未満なので、警告値は、警告範囲内（○）、若しくは、（７−５）÷（１０−５）×１００＝２／５×１００＝４０％となる。
　各々のＳＬＡについて、第１実施形態で求めた違反値に加えて、警告値算出部４１で算出した警告値も参照することで、算出部４は、ＩＴサービスごとに影響値を算出する。例えば、算出部４は、違反値と警告値とを重み付けをした総和を算出する。重みを、違反値は「１０」、警告値は「２」、として、ＳＬＡ＿００１及びＳＬＡ＿００２の違反値及び警告値を用いると、算出部４は、第１の実施形態のＳＬＡ＿００１の結果から、ＩＴサービス０１の影響度を、４０×１０＋４０×２＝４８０と算出できる。
　図１３は、第２実施形態での影響度算出の結果を表示した図である。生成部５は、各ＩＴサービスに対して、違反値と警告値の大きさが分かるように表示する。例えば、生成部５は、違反値であるＳＬＡが数の上では少しであっても強調し、表示に反映されやすくする。
　図１４は、すべてのＩＴサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、違反値に基づく影響度及び警告値に基づく影響度をハッチングで表示した例を示す図である。生成部５は、このような表示に基づき、全サービスにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
　図１５は、第２実施形態での影響度算出の結果を表示した例を示す図である。生成部５は、全体のＳＬＡ数を円グラフで表現し、違反値を持つＳＬＡの数、警告値を持つＳＬＡの数をそれぞれ斜線、格子模様で表示する。この表示に基づき、影響度算出装置は、全ＳＬＡのうち対処の必要なＳＬＡがどの程度存在するかを、ＩＴサービス提供者に把握させることができる。
　図１６は、第２実施形態での影響度算出の結果を表示した例を示す図である。生成部５は、違反値又は警告値が存在するＩＴサービスを抽出し、それら違反値及び警告値の内訳を円グラフで表現している。
　図１７を参照すると、本実施形態の動作は、第１の実施形態の動作と、ステップＳ１０２でＳＬＡ違反値を算出した後の動作が異なる。第２実施形態では、ステップＳ１０２でＳＬＡ違反値を算出した後、ステップＳ２０３で警告値算出部４１においてＳＬＡ警告値を算出する。
　＜処理＞
　本実施形態における処理の流れについて、図１７を用いて説明する。第１実施形態で示した図１との違いは、ステップＳ２０３及びステップＳ２０４であり、その他の処理は第１実施形態と同様であるので、ここでは説明を省略する。ステップＳ２０３では、警告値算出部４１が、各ＳＬＡの条件と取得した測定値とを照らし合わせ、各ＳＬＡの警告値を算出する（ステップＳ２０３）。算出部４は、違反値、警告値から影響度を算出する（ステップＳ２０４）。
　＜第２実施形態の効果＞
　違反値に加えて警告値を設けてＩＴサービス及びＣＩごとの影響度に反映させてサービス提供者へ提示することで、本実施形態の情報処理装置（影響度算出装置）は、現状のＳＬＡの遵守状態のさらなる詳細な理解と、障害対処の順序を正確に判断することを支援できる。
　（他の実施形態）
　以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴をどのように組み合わせたシステム又は装置も、本発明の範囲に含まれる。
　また、本発明の実施の形態は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するサービス管理プログラムが、システム又は装置に、直接又は遠隔から供給されて実行される場合にも適用可能である。したがって、前述した本発明の実施の形態の各ユニットにおける機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、そのプログラムを格納した媒体、又は、そのプログラムをダウンロードさせるＷＷＷサーバも、本発明の範囲に含まれる。また、プログラムを格納する媒体は、図２、図１１、図１８における記憶部であってもよい。
　この出願は、２０１０年１月７日に出願された日本出願２０１０−００１９６８を基礎とする優先権を主張し、その開示をすべてここに取り込む。
　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　本発明は、運用監視分野における障害状況を正確に把握し、障害対処する用途に、好適に適用可能である。本発明は、特に、大規模システム環境下で複数の障害が同時に発生する場合に有用となる。

　１　入出力部
　２　記憶部
　３　取得部
　４　算出部
　５　生成部
　４１　警告値算出部

Claims

　情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、
　前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、
　前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段と
　を含む情報処理装置。
　前記影響度算出手段は、前記複数の条件の各々に設定された重要度を参照して、前記違反値から前記影響度を算出することを特徴とする請求項１に記載の情報処理装置。
　前記複数の条件は、前記情報サービスの提供者と複数の受容者との間で、別々に同意があったサービスレベルについての異なる条件であることを特徴とする請求項１又は２に記載の情報処理装置。
　前記監視対象項目に関して警告の対象となる複数の条件を前記測定値と比較して、条件違反になる可能性の高さを示す警告値を算出する警告値算出手段を更に備え、
　前記影響度算出手段は、前記違反値及び前記警告値を用いて、前記影響度を算出することを特徴とする請求項１乃至３のいずれかに記載の情報処理装置。
　前記影響度算出手段で出力された前記影響度を表すグラフ画像を生成する画像生成手段を更に備えることを特徴とする請求項１乃至４のいずれかに記載の情報処理装置。
　前記影響度算出手段は、
　前記測定値として考えられる最悪の値を最悪測定値とした場合に、前記複数の条件と前記最悪測定値とを比較して算出した最悪違反値を用いて、前記情報サービスが取り得る最悪の影響の度合いを最悪影響度として算出することを特徴とする請求項１乃至５のいずれかに記載の情報処理装置。
　前記影響度算出手段で出力された前記影響度と前記最悪影響度とを比較したグラフ画像を生成する画像生成手段を更に備えることを特徴とする請求項６に記載の情報処理装置。
　情報サービスに関連する監視対象項目について、測定値を取得し、
　前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、
　前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する
　サービス管理方法。
　情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、
　前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、
　前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理と
　をコンピュータに実行させるサービス管理プログラムを含む記憶媒体。