JPWO2011083750A1 - 情報処理装置、サービス管理方法、並びにサービス管理プログラム - Google Patents
情報処理装置、サービス管理方法、並びにサービス管理プログラム Download PDFInfo
- Publication number
- JPWO2011083750A1 JPWO2011083750A1 JP2011548980A JP2011548980A JPWO2011083750A1 JP WO2011083750 A1 JPWO2011083750 A1 JP WO2011083750A1 JP 2011548980 A JP2011548980 A JP 2011548980A JP 2011548980 A JP2011548980 A JP 2011548980A JP WO2011083750 A1 JPWO2011083750 A1 JP WO2011083750A1
- Authority
- JP
- Japan
- Prior art keywords
- influence
- value
- service
- violation
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06395—Quality analysis or management
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Debugging And Monitoring (AREA)
Abstract
(課題)提供サービスに問題が発生した場合に、その問題の影響度を総合評価すること。(解決手段)本発明の情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、違反値を用いて、条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。
Description
本発明は、サービスを管理する技術に関する。
近年、情報システムをビジネスに活用する組織や企業が、増えてきている。それらの組織や企業へ情報サービスを提供するサービス提供者は、そのサービス受容者に対するサービス品質を管理する必要がある。
具体的には、システム運用管理者は、システムの不具合や故障、劣化に基づいて引き起こされるサービス障害(品質レベル低下)を検知し、早急に問題箇所と原因とを特定し対処する。システムが大規模になると、同時に発生するサービス障害が多くなり、そういった場合、システム運用管理者は、サービス受容者への影響が最小限に抑えられるよう、各障害に対するサービス受容者への影響度を正確に把握し、対処順序を判断する必要性が生じる。特に、システム運用管理者は、サービス受容者との同意に反することがないよう対処順序を決定し、障害に基づいて受ける金銭的ダメージを可能な限り抑えるような判断を下すことが望ましい。
このような状況下において、特許文献1には、サービスの契約情報に対する充足度を判定する技術が、開示されている。一方、特許文献2には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。ここ(特許文献2)では、同一サービスに対してサービス受容者ごとに異なる複数のサービスレベル目標が設定され、特許文献2に記載のSLO(service level objectives)アナライザが、修正が必要なサービス構成要素を特定する。
また、特許文献3には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。特に複数のサービス受容者へサービスを提供する場合において、特許文献3に記載の満足度算出部は、同一サービス内で、満足度が100%実現されているサービス受容者と実現されていないサービス受容者とを検出する。そして、特許文献3には、過剰な満足度を実現しているサービス受容者へのサービスを制限することで、満足度が不足しているサービス受容者へのサービス品質を向上させる方式が、記載されている。
具体的には、システム運用管理者は、システムの不具合や故障、劣化に基づいて引き起こされるサービス障害(品質レベル低下)を検知し、早急に問題箇所と原因とを特定し対処する。システムが大規模になると、同時に発生するサービス障害が多くなり、そういった場合、システム運用管理者は、サービス受容者への影響が最小限に抑えられるよう、各障害に対するサービス受容者への影響度を正確に把握し、対処順序を判断する必要性が生じる。特に、システム運用管理者は、サービス受容者との同意に反することがないよう対処順序を決定し、障害に基づいて受ける金銭的ダメージを可能な限り抑えるような判断を下すことが望ましい。
このような状況下において、特許文献1には、サービスの契約情報に対する充足度を判定する技術が、開示されている。一方、特許文献2には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。ここ(特許文献2)では、同一サービスに対してサービス受容者ごとに異なる複数のサービスレベル目標が設定され、特許文献2に記載のSLO(service level objectives)アナライザが、修正が必要なサービス構成要素を特定する。
また、特許文献3には、サービスを提供する複数のコンポーネントを備えるコンピュータインフラストラクチャを解析する方法が、開示されている。特に複数のサービス受容者へサービスを提供する場合において、特許文献3に記載の満足度算出部は、同一サービス内で、満足度が100%実現されているサービス受容者と実現されていないサービス受容者とを検出する。そして、特許文献3には、過剰な満足度を実現しているサービス受容者へのサービスを制限することで、満足度が不足しているサービス受容者へのサービス品質を向上させる方式が、記載されている。
しかし、上記の関連する技術では、提供サービスに問題が発生した場合、異なるサービス受容者に対する影響を総合したサービス全体の状態を示す指標がなかったため、その問題の影響度を総合評価することができない問題点があった。
本発明の目的は、上述の課題を解決する情報処理装置を提供することにある。
(課題を解決するための手段)
上記目的を達成するため、本発明に係る情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。
上記目的を達成するため、本発明に係るサービス管理方法は、情報サービスに関連する監視対象項目について、測定値を取得し、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する。
上記目的を達成するため、本発明に係るサービス管理プログラムは、コンピュータに、情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理とを実行させる。
(発明の効果)
本発明によれば、提供サービスに問題が発生した場合に、その問題の影響度を総合評価できる。
本発明の目的は、上述の課題を解決する情報処理装置を提供することにある。
(課題を解決するための手段)
上記目的を達成するため、本発明に係る情報処理装置は、情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段とを含む。
上記目的を達成するため、本発明に係るサービス管理方法は、情報サービスに関連する監視対象項目について、測定値を取得し、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する。
上記目的を達成するため、本発明に係るサービス管理プログラムは、コンピュータに、情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理とを実行させる。
(発明の効果)
本発明によれば、提供サービスに問題が発生した場合に、その問題の影響度を総合評価できる。
以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらに限定する趣旨のものではない。
(用語の定義)
まず、本発明の実施形態について説明する前に、必要な用語を定義する。
「ITサービス(情報サービス)」は、IT(Information Technology)を利用するサービス受容者を支援するIT機能の集合体で、監視指標に基づき品質についての評価が可能である。例えば、ITサービスは、メールシステムの導入管理サービスや業務システムの導入管理サービスを含む。
「CI(Configuration Item)」は、ITサービスに含まれるIT機能を実現するための構成要素である。例えば、サーバ、VM(Virtual Machine、仮想機械)、NW(Network)機器、アプリケーション、プロセスなどを含む。
「障害」とは、CIの故障、不具合、及びそれに基づくITサービスの停止、監視指標レベル低下の現象とする。
「SLA(Service Level Agreement)」とは、ITサービスレベルに関して、ITサービス提供者とサービス受容者との間で同意のある条件を指す。SLAは、ITサービスの可用性や信頼性、性能等に関する項目が一般的で、「ITサービス提供期間中、TAT(Turn Around Time)は5秒以下を保証する」といった条件が数値化されたものである。本実施形態で扱うSLAは、同意レベルが数値表現可能な項目とする。項目の例は、TAT、冗長HW(Hardware)数などである。また、ここ(実施形態)でのSLAは、規約(条件)名にSLAという言葉が明示されている場合に限るものではなく、ITサービスの品質レベルの保証に関する数値規約が含まれた同意条件をすべて含むものとする。つまり、本実施形態では、SLAは、監視対象項目に関して要求される条件をいう。
なお、SLAは、ITサービス提供者と複数のサービス受容者との間で、別々に同意があったITサービスレベルについて、異なる条件である場合も含む。
(第1実施形態)
本発明の第1実施形態は、ITサービスの提供状態を把握するための技術、すなわち障害発生時のITサービスへの影響度を算出するサービス管理技術に関する。本発明の第1実施形態は、特に、ITサービスや、ITサービス提供のための監視対象項目となる機器や、ITサービスの提供を受けるサービス受容者を大量に備える大規模システムで有効な技術である。複数のサービス契約情報に対する閾値違反を一つの指標に集約することで、本発明の第1実施形態は、当該サービスの品質を算定する。本発明の第1実施形態は、複数の契約情報に対する評価を算出する。
<構成>
図2は、本発明の第1実施形態に係る情報処理装置としての影響度算出装置の構成例を表すブロック図である。図2に示す影響度算出装置は、入出力部1と、取得部3と、算出部4と、生成部5と、記憶部2とを含む。
まず、入出力部1は、マウスやキーボードなどの入力デバイスと、ディスプレイなどの出力デバイスとを含む。
記憶部2は、システムのCIとITサービスとの紐(関連)付け、ITサービスとSLAとの紐(関連)付け、各SLAの項目とその数値条件(例えば、SLAのひとつであるSLA_01では、TAT項目は5秒以内を保障する、といった条件)の情報を登録している。
取得部3は、監視対象であるシステムを構成するCI及びITサービスに関して、取得設定された監視指標の測定値をリアルタイムで収集し、その情報を算出部4へ出力する。
算出部4は、記憶部2へ登録されているCIに紐(関連)付けられたSLAについて、取得部3で取得した監視指標の測定値と比較して、条件違反の度合いを示す違反値を算出する。言い換えれば、算出部4は、どのSLAに対してどの程度違反しているかを、定量的に違反値として算出する。そして、算出部4は、各ITサービスについて、SLA違反が与える影響の度合いを影響度として算出する。具体的には、算出部4は、ITサービスに紐(関連)付けられた複数のSLAの違反値の総和を算出し、これを「影響度」とする。また、算出部4は、SLAで、現状の監視指標の測定では違反となっていないが、将来的に監視指標が最悪になった場合の影響度についても最悪影響度として算出する。
SLAはITサービスに紐(関連)付けられており、ITサービスがそれ(ITサービス)を構成するCIへ紐(関連)付けられていることが多い。しかし、CIに直接SLAが紐(関連)付けられている場合もある。それらデータの構成は、記憶部2への登録情報に依存する。
生成部5は、算出部4において算出されたCI及びITサービス障害についての影響度あるいは最悪影響度、又はその両方を、グラフ等で視覚的に表示するための画像データを生成する画像生成手段である。生成部5がこのような画像データを生成すれば、システム全体としての問題有無や深刻度といったものが、一見して把握できるようになる。
図3は、本実施の形態における記憶部2に登録された登録データ301の一例を示す図である。各々のSLA_ID(識別子)は、ITサービスIDと紐(関連)付けられており、さらに具体的な指標の項目とその数値条件が設定されている。例えば、SLA_001は、ITサービス01に関するSLAであり、応答時間は5秒以内を、可用性は99.9%以上を保証する内容である。一方、SLA_002も、やはりITサービス01に関するSLAであるが、このSLAでは、応答時間は10秒以内を、可用性は99.0%以上を保証する内容である。さらに、SLA_003は、ITサービス02に関するSLAであり、このSLAでは、応答時間は5秒以内を、可用性は99.9%以上を保証する内容である。このように、記憶部2を参照すれば、算出部4は、特定のSLAについて、どのような条件を満足できるかを導き出せる。一方、算出部4は、特定のITサービスについて、応答時間や可用性などの数値が与えられれば、どのSLAに対してどの程度問題となるのかも、導き出せる。
なお、本実施の形態のおける影響度算出装置は、それぞれのSLAに対して重みを付けても良い。例えば、影響度算出装置は、図3には示していないが、記憶部2内に、SLAごとの重要度を設定してもよい。例えば、影響度算出装置は、SLA_001の重要度を1として、SLA_002の重要度が0.5、SLA_003の重要度が0.3など、サービス受容者の規模などに応じてSLAに相対的な重要度を設定すればよい。そのようにしておけば、影響度算出装置は、ITサービスの不具合に対する重要性を総合的に正確に導ける。さらには、SLAは、それぞれの指標の項目に重み付けされていても良い。
図4は、取得部3が収集し算出部4へ出力する測定データ401の一例を示す。測定データ401は、一例として、ある測定タイムスタンプにおける各監視対象CIについての応答時間、可用性を測定対象の指標としている。なお、可用性は、ITサービスの実稼動時間と計画稼働時間との比率を用いて求めることが一般的である。例では各ITサービスにおける計画稼働時間が予め設定されているものとして、取得部3は、測定に基づく稼働状況判定後、実稼働時間を算出し、そこから可用性を算出している。
図3を参照するとSLA_001は、ITサービス01の応答時間が遵守する条件として、5秒以内を規定している。これに対し、図4の測定データ401は、ITサービス01に関する応答時間の測定値が、7秒となっており、SLA_001に違反している。この場合、7秒が5秒の140%であることから40%超過であるため、算出部4は、応答時間に関する違反値を「40」と算出できる。
図3を参照すると、SLA_001は、ITサービス01の可用性で遵守する条件として99.9%以上を規定している。これに対し、図4の測定データ401は、ITサービス01に関する可用性が100%となっており、SLA_001に違反していない。すなわち、(SLA値)≦(実測値)となっているため、算出部4は、可用性に関する違反値を「0」と算出できる。仮に、測定データにおいてITサービス01に関する可用性が90%であった場合、(SLA値)≦(実測値)が成り立たない。そのため、算出部4は、違反値を「0」ではなく、90%が99.9%の90.1≒90%であり10%不足であるため、違反値を「10」と算出できる。
一方、算出部4は、各指標項目について最悪の測定値を予め規定しておくことで、最悪影響度を算出できる。例えば、ITサービス01、ITサービス02、ITサービス03の最悪応答時間がそれぞれ20秒だとすると、SLA_001の最悪違反値は「300」(20秒は、5秒の300%超過)、SLA_002の最悪違反値は「100」、SLA_003の最悪違反値は「300」となる。そして、算出部4は、各SLAの重要度を違反値に乗算してその総和を影響度として算出する。図3に示したITサービス01の影響度は、そこ(ITサービス01)に紐(関連)付けられているSLAの影響度の総和とすると、40+0=40となる。また、最悪影響度は、最悪影響度の総和として、300+100=400となる。
また、記憶部2に、ITサービスとCIとの関連情報が登録されている場合は、それら情報を用いて関連するITサービス、SLAをたどることで、算出部4は、CIに対する影響度及び最悪影響度を算出することもできる。生成部5は、算出部4から出力された算出結果を画面へ表示する。
図5は、生成部5に基づいて生成されたグラフ画像の一例を示す図である。この棒グラフは、各ITサービスに関する影響度及び最悪影響度を示している。全体が最悪影響度、ハッチング部分が現状の影響度を示す。図5では、生成部5は、最悪影響度の大きさに基づいてITサービスをソートして表示している。なお、生成部5は、用途に応じて、現状の影響度又は最悪影響度を表示してもよい。図6では、生成部5は、ITサービスの枠組みを超えて、すべてのITサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、現状の影響度をハッチングで表示している。このような表示に基づき、生成部5は、監視対象のすべてのSLAにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
グラフ表示の場合、生成部5は、応答時間、可用性といった監視指標ごとの影響度を図7のように個別にグラフ表示してもよいし、これら複数の監視指標における影響度を組み合わせて(例えば重み付け平均などを用いて)統一的にグラフ表示してもよい。図7では、生成部5は、あるITサービスに関する項目影響度を時系列に表示している。生成部5は、算出部4から出力されたデータをタイムスタンプに基づき集計し表示する。表示対象は、複数のITサービスであってもよいし、すべてのITサービスにおける影響度の総和であっても良い。
図8では、生成部5は、図5と同様の情報を円グラフ表示している。図5と同様、生成部5は、最悪影響度に対する現状の影響度(ハッチング部)の割合(占有率)を、ITサービスごとに示しており、現状影響度のあるITサービスを表示対象としている。また、図9では、生成部5は、そのITサービス提供者が守るべき全SLAに対し、違反のあるSLAの割合を円グラフ表示している。
<処理>
次に、図1及び図10を用いて、本実施形態の処理について説明する。図1は、算出部4におけるITサービスの影響度算出処理の一例を表すフローチャートである。図10は、図1のフローチャートで参照及び算出されるデータをまとめた表である。まず、算出部4は、影響度を取得したいITサービスを特定し、そのITサービスに必要とするCIの中で、影響度の算出に必要な監視対象項目について情報を記憶部2から読み出し、さらに、その監視対象項目についての測定値を取得部3から取得する(S101)。図10では、算出部4は、サービス1001として、ITサービス01、ITサービス02を特定している。算出部4は、これらサービスに対する、監視対象1002、重要度1003、最悪測定値1004を記憶部2から読み出し、測定値1005を取得部3から取得する。
次に、算出部4は、特定したITサービスに関連するSLAについての情報を記憶部2から読み出す。読み出すSLAは、図10における、SLA1006、条件1007、重要度1008に相当する。そして、算出部4は、各SLAの条件1007と測定値1005とを照らし合わせて、各SLAの違反値1009を算出する(S102)。算出部4は、違反値1009を、各指標のSLA契約値と測定値との差分や割合から算出しても良いし、違反(×)、遵守(○)といった二値で表現しても良い。
次に、ITサービスのすべてのSLAの違反値に基づいて、算出部4は、ITサービスの影響度を算出する(S104)。ITサービスの影響度は、各SLAの重要度に基づいて違反値に重みを付与した重み付け総和を用いる。図10では、例として、SLA001及びSLA002は「1」、SLA003は「0.8」という重要度1008が定義されている。算出部4は、各違反値をこれらの値に乗算して総和を取ることに基づき、まず、監視対象項目ごとの影響度(項目影響度1010)を算出できる。そして、算出部4は、項目影響度1010を合算することでITサービスの影響度(サービス影響度1011)を算出できる。重要度が全SLAについて「1」であれば、影響度は、違反値の単純な総和となる。
サービス影響度1011を算出後、算出部4は、読み出した最悪測定値1004を用いて、各SLAの最悪違反値1012を算出し、最悪違反値1012を基に項目ごとの最悪影響度1013及びITサービス全体の最悪影響度1014を算出する(S105)。最後に、生成部5が、S104及びS105で算出したITサービス影響度及びITサービス最悪影響度の結果を示す画像(図5〜図9を例とした形式)を生成し、入出力部1に表示する(S106)。
(変形例)
なお、本実施の形態に係る情報処理装置(影響度算出装置)の各構成は、複数の構成に分かれても良い。例えば、算出部4は、1つの構成に限られず、複数の構成、例えば、違反値を算出する構成と、影響度を算出する構成に分かれても良い。また、各構成は、1つの装置に含まれず、別装置として構成してもよい。例えば、記憶部2は、ネットワークを介して接続した別の記憶装置としてもよい。また、生成部5及び入出力部1を別装置としてもよい。
図18は、本実施に形態に係る情報処理装置(影響度算出装置)の別の構成の一例を示す図である。図18において図2と同じ構成には同じ番号を付し、詳細な説明は省略する。
図18に示す情報処理装置は、図2と同様の取得部3と、違反値を算出する違反値算出部42と、影響度を算出する影響度算出部43とを含んでいる。なお、違反値算出部42と影響度算出部43とは、合わせて、図2に示す算出部4と同様に動作する。
また、図18に示す情報処理装置は、記憶部2と、生成部5と、入出力部1とを、ネットワークを介して接続した別ユニットとしている。そのため、図18では、ネットワークを介して接続されたユニットを点線で示している。CIも、ネットワーク介して接続しているため、点線で示した。
このように構成した情報処理装置(影響度算出装置)も、ネットワークを介して各ユニットと情報をやり取りし、図2に示す影響度算出装置と同様に動作できる。
なお、図18に示す情報処理装置は、本発明の最小構成である。
<第1実施形態の効果>
これまで説明した情報処理装置(影響度算出装置)は、ITサービス提供者に、障害若しくは不具合等に基づいたITサービス及びCIに問題が発生した場合、SLA違反への影響をITサービス、CI、若しくは、ITシステムごとに確認するための表示を提供できる。また、情報処理装置は、このままITサービス及びCIの問題が放置されると、それぞれに対して影響度がどのくらい拡大するかの可能性をサービス提供者へ分かりやすく提示できる。
以上のように、本実施形態の情報処理装置は、障害及び不具合等に基づくITサービス又はCIのSLA違反に関する影響を、ITサービス提供者に、知らせることができる。また、情報処理装置は、影響度算出結果をグラフ等で表示することで、ITサービス提供者に、優先的に対処するITサービス及びCIの順序を、容易に把握させることができる。特に、ITサービスにおける監視指標に関する閾値をSLAから決定する場合、本実施形態における情報処理装置は、サービス受容者ごとのITサービスに対する影響を違反値に直接的に反映することができ、影響度算出の正確さについて大きな効果が期待できる。
つまり、あるITサービスに問題が発生した場合、本実施形態の情報処理装置は、その問題が及ぼすサービス受容者の観点での影響の大きさを算出できる。
また、複数のITサービスに問題が発生し対処が必要となった場合に、本実施形態の情報処理装置は、ITサービスごとのSLAへの影響の大きさを算出できるため、ITサービス提供者が対処の優先順位付けをする際の参考を提供できる。
(第2実施形態)
図11は、第2実施形態としての影響度算出装置の構成を示すブロック図である。本実施形態は、図2に示す第1実施形態と比べて、算出部4が警告値算出部41を含む点で異なる。
図12に本実施形態に係る記憶部2に登録されたデータの一例を示す。図3に示す第1実施形態における記憶部2の登録データ301との違いは、SLAの各指標(応答時間、可用性)において違反範囲に加えて警告範囲がデータとして存在することである。この警告範囲とは、サービス受容者とのSLA上は違反とはならないが、このまま対処なく放置しておけば違反となる可能性が高い値の範囲である。指標の性質に基づき異なるが、図12に示す例は、違反になる一つ前の段階の数値を警告範囲としている。例えば、SLA_001の応答時間は、3秒未満であれば正常、3秒以上5秒未満であれば警告(危険)、5秒以上であれば違反である。なお、SLAの違反以外の閾値は、警告を表す閾値以外に、警告に対しもう少し対処緊急度の低い危険レベルの範囲を表す危険値など、運用の状況に応じて自由に設定できる。
算出部4は、警告値算出部41において、各SLAで設定されている警告範囲と取得部3から取得した測定値とから警告値を算出する。警告値算出部41は、測定値が警告範囲に入っているか否かを警告範囲内(○)、警告範囲外(×)の2値で表現しても良いし、警告範囲のどの位置かを25%警告等の連続値で表現しても良い。例えば、ITサービス01の応答時間が7秒であるという測定値が取得された場合、SLA_002について、警告範囲が5秒以上、10秒未満なので、警告値は、警告範囲内(○)、若しくは、(7−5)÷(10−5)×100=2/5×100=40%となる。
各々のSLAについて、第1実施形態で求めた違反値に加えて、警告値算出部41で算出した警告値も参照することで、算出部4は、ITサービスごとに影響値を算出する。例えば、算出部4は、違反値と警告値とを重み付けをした総和を算出する。重みを、違反値は「10」、警告値は「2」、として、SLA_001及びSLA_002の違反値及び警告値を用いると、算出部4は、第1の実施形態のSLA_001の結果から、ITサービス01の影響度を、40×10+40×2=480と算出できる。
図13は、第2実施形態での影響度算出の結果を表示した図である。生成部5は、各ITサービスに対して、違反値と警告値の大きさが分かるように表示する。例えば、生成部5は、違反値であるSLAが数の上では少しであっても強調し、表示に反映されやすくする。
図14は、すべてのITサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、違反値に基づく影響度及び警告値に基づく影響度をハッチングで表示した例を示す図である。生成部5は、このような表示に基づき、全サービスにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
図15は、第2実施形態での影響度算出の結果を表示した例を示す図である。生成部5は、全体のSLA数を円グラフで表現し、違反値を持つSLAの数、警告値を持つSLAの数をそれぞれ斜線、格子模様で表示する。この表示に基づき、影響度算出装置は、全SLAのうち対処の必要なSLAがどの程度存在するかを、ITサービス提供者に把握させることができる。
図16は、第2実施形態での影響度算出の結果を表示した例を示す図である。生成部5は、違反値又は警告値が存在するITサービスを抽出し、それら違反値及び警告値の内訳を円グラフで表現している。
図17を参照すると、本実施形態の動作は、第1の実施形態の動作と、ステップS102でSLA違反値を算出した後の動作が異なる。第2実施形態では、ステップS102でSLA違反値を算出した後、ステップS203で警告値算出部41においてSLA警告値を算出する。
<処理>
本実施形態における処理の流れについて、図17を用いて説明する。第1実施形態で示した図1との違いは、ステップS203及びステップS204であり、その他の処理は第1実施形態と同様であるので、ここでは説明を省略する。ステップS203では、警告値算出部41が、各SLAの条件と取得した測定値とを照らし合わせ、各SLAの警告値を算出する(ステップS203)。算出部4は、違反値、警告値から影響度を算出する(ステップS204)。
<第2実施形態の効果>
違反値に加えて警告値を設けてITサービス及びCIごとの影響度に反映させてサービス提供者へ提示することで、本実施形態の情報処理装置(影響度算出装置)は、現状のSLAの遵守状態のさらなる詳細な理解と、障害対処の順序を正確に判断することを支援できる。
(他の実施形態)
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴をどのように組み合わせたシステム又は装置も、本発明の範囲に含まれる。
また、本発明の実施の形態は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するサービス管理プログラムが、システム又は装置に、直接又は遠隔から供給されて実行される場合にも適用可能である。したがって、前述した本発明の実施の形態の各ユニットにおける機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、そのプログラムを格納した媒体、又は、そのプログラムをダウンロードさせるWWWサーバも、本発明の範囲に含まれる。また、プログラムを格納する媒体は、図2、図11、図18における記憶部であってもよい。
この出願は、2010年1月7日に出願された日本出願2010−001968を基礎とする優先権を主張し、その開示をすべてここに取り込む。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
(用語の定義)
まず、本発明の実施形態について説明する前に、必要な用語を定義する。
「ITサービス(情報サービス)」は、IT(Information Technology)を利用するサービス受容者を支援するIT機能の集合体で、監視指標に基づき品質についての評価が可能である。例えば、ITサービスは、メールシステムの導入管理サービスや業務システムの導入管理サービスを含む。
「CI(Configuration Item)」は、ITサービスに含まれるIT機能を実現するための構成要素である。例えば、サーバ、VM(Virtual Machine、仮想機械)、NW(Network)機器、アプリケーション、プロセスなどを含む。
「障害」とは、CIの故障、不具合、及びそれに基づくITサービスの停止、監視指標レベル低下の現象とする。
「SLA(Service Level Agreement)」とは、ITサービスレベルに関して、ITサービス提供者とサービス受容者との間で同意のある条件を指す。SLAは、ITサービスの可用性や信頼性、性能等に関する項目が一般的で、「ITサービス提供期間中、TAT(Turn Around Time)は5秒以下を保証する」といった条件が数値化されたものである。本実施形態で扱うSLAは、同意レベルが数値表現可能な項目とする。項目の例は、TAT、冗長HW(Hardware)数などである。また、ここ(実施形態)でのSLAは、規約(条件)名にSLAという言葉が明示されている場合に限るものではなく、ITサービスの品質レベルの保証に関する数値規約が含まれた同意条件をすべて含むものとする。つまり、本実施形態では、SLAは、監視対象項目に関して要求される条件をいう。
なお、SLAは、ITサービス提供者と複数のサービス受容者との間で、別々に同意があったITサービスレベルについて、異なる条件である場合も含む。
(第1実施形態)
本発明の第1実施形態は、ITサービスの提供状態を把握するための技術、すなわち障害発生時のITサービスへの影響度を算出するサービス管理技術に関する。本発明の第1実施形態は、特に、ITサービスや、ITサービス提供のための監視対象項目となる機器や、ITサービスの提供を受けるサービス受容者を大量に備える大規模システムで有効な技術である。複数のサービス契約情報に対する閾値違反を一つの指標に集約することで、本発明の第1実施形態は、当該サービスの品質を算定する。本発明の第1実施形態は、複数の契約情報に対する評価を算出する。
<構成>
図2は、本発明の第1実施形態に係る情報処理装置としての影響度算出装置の構成例を表すブロック図である。図2に示す影響度算出装置は、入出力部1と、取得部3と、算出部4と、生成部5と、記憶部2とを含む。
まず、入出力部1は、マウスやキーボードなどの入力デバイスと、ディスプレイなどの出力デバイスとを含む。
記憶部2は、システムのCIとITサービスとの紐(関連)付け、ITサービスとSLAとの紐(関連)付け、各SLAの項目とその数値条件(例えば、SLAのひとつであるSLA_01では、TAT項目は5秒以内を保障する、といった条件)の情報を登録している。
取得部3は、監視対象であるシステムを構成するCI及びITサービスに関して、取得設定された監視指標の測定値をリアルタイムで収集し、その情報を算出部4へ出力する。
算出部4は、記憶部2へ登録されているCIに紐(関連)付けられたSLAについて、取得部3で取得した監視指標の測定値と比較して、条件違反の度合いを示す違反値を算出する。言い換えれば、算出部4は、どのSLAに対してどの程度違反しているかを、定量的に違反値として算出する。そして、算出部4は、各ITサービスについて、SLA違反が与える影響の度合いを影響度として算出する。具体的には、算出部4は、ITサービスに紐(関連)付けられた複数のSLAの違反値の総和を算出し、これを「影響度」とする。また、算出部4は、SLAで、現状の監視指標の測定では違反となっていないが、将来的に監視指標が最悪になった場合の影響度についても最悪影響度として算出する。
SLAはITサービスに紐(関連)付けられており、ITサービスがそれ(ITサービス)を構成するCIへ紐(関連)付けられていることが多い。しかし、CIに直接SLAが紐(関連)付けられている場合もある。それらデータの構成は、記憶部2への登録情報に依存する。
生成部5は、算出部4において算出されたCI及びITサービス障害についての影響度あるいは最悪影響度、又はその両方を、グラフ等で視覚的に表示するための画像データを生成する画像生成手段である。生成部5がこのような画像データを生成すれば、システム全体としての問題有無や深刻度といったものが、一見して把握できるようになる。
図3は、本実施の形態における記憶部2に登録された登録データ301の一例を示す図である。各々のSLA_ID(識別子)は、ITサービスIDと紐(関連)付けられており、さらに具体的な指標の項目とその数値条件が設定されている。例えば、SLA_001は、ITサービス01に関するSLAであり、応答時間は5秒以内を、可用性は99.9%以上を保証する内容である。一方、SLA_002も、やはりITサービス01に関するSLAであるが、このSLAでは、応答時間は10秒以内を、可用性は99.0%以上を保証する内容である。さらに、SLA_003は、ITサービス02に関するSLAであり、このSLAでは、応答時間は5秒以内を、可用性は99.9%以上を保証する内容である。このように、記憶部2を参照すれば、算出部4は、特定のSLAについて、どのような条件を満足できるかを導き出せる。一方、算出部4は、特定のITサービスについて、応答時間や可用性などの数値が与えられれば、どのSLAに対してどの程度問題となるのかも、導き出せる。
なお、本実施の形態のおける影響度算出装置は、それぞれのSLAに対して重みを付けても良い。例えば、影響度算出装置は、図3には示していないが、記憶部2内に、SLAごとの重要度を設定してもよい。例えば、影響度算出装置は、SLA_001の重要度を1として、SLA_002の重要度が0.5、SLA_003の重要度が0.3など、サービス受容者の規模などに応じてSLAに相対的な重要度を設定すればよい。そのようにしておけば、影響度算出装置は、ITサービスの不具合に対する重要性を総合的に正確に導ける。さらには、SLAは、それぞれの指標の項目に重み付けされていても良い。
図4は、取得部3が収集し算出部4へ出力する測定データ401の一例を示す。測定データ401は、一例として、ある測定タイムスタンプにおける各監視対象CIについての応答時間、可用性を測定対象の指標としている。なお、可用性は、ITサービスの実稼動時間と計画稼働時間との比率を用いて求めることが一般的である。例では各ITサービスにおける計画稼働時間が予め設定されているものとして、取得部3は、測定に基づく稼働状況判定後、実稼働時間を算出し、そこから可用性を算出している。
図3を参照するとSLA_001は、ITサービス01の応答時間が遵守する条件として、5秒以内を規定している。これに対し、図4の測定データ401は、ITサービス01に関する応答時間の測定値が、7秒となっており、SLA_001に違反している。この場合、7秒が5秒の140%であることから40%超過であるため、算出部4は、応答時間に関する違反値を「40」と算出できる。
図3を参照すると、SLA_001は、ITサービス01の可用性で遵守する条件として99.9%以上を規定している。これに対し、図4の測定データ401は、ITサービス01に関する可用性が100%となっており、SLA_001に違反していない。すなわち、(SLA値)≦(実測値)となっているため、算出部4は、可用性に関する違反値を「0」と算出できる。仮に、測定データにおいてITサービス01に関する可用性が90%であった場合、(SLA値)≦(実測値)が成り立たない。そのため、算出部4は、違反値を「0」ではなく、90%が99.9%の90.1≒90%であり10%不足であるため、違反値を「10」と算出できる。
一方、算出部4は、各指標項目について最悪の測定値を予め規定しておくことで、最悪影響度を算出できる。例えば、ITサービス01、ITサービス02、ITサービス03の最悪応答時間がそれぞれ20秒だとすると、SLA_001の最悪違反値は「300」(20秒は、5秒の300%超過)、SLA_002の最悪違反値は「100」、SLA_003の最悪違反値は「300」となる。そして、算出部4は、各SLAの重要度を違反値に乗算してその総和を影響度として算出する。図3に示したITサービス01の影響度は、そこ(ITサービス01)に紐(関連)付けられているSLAの影響度の総和とすると、40+0=40となる。また、最悪影響度は、最悪影響度の総和として、300+100=400となる。
また、記憶部2に、ITサービスとCIとの関連情報が登録されている場合は、それら情報を用いて関連するITサービス、SLAをたどることで、算出部4は、CIに対する影響度及び最悪影響度を算出することもできる。生成部5は、算出部4から出力された算出結果を画面へ表示する。
図5は、生成部5に基づいて生成されたグラフ画像の一例を示す図である。この棒グラフは、各ITサービスに関する影響度及び最悪影響度を示している。全体が最悪影響度、ハッチング部分が現状の影響度を示す。図5では、生成部5は、最悪影響度の大きさに基づいてITサービスをソートして表示している。なお、生成部5は、用途に応じて、現状の影響度又は最悪影響度を表示してもよい。図6では、生成部5は、ITサービスの枠組みを超えて、すべてのITサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、現状の影響度をハッチングで表示している。このような表示に基づき、生成部5は、監視対象のすべてのSLAにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
グラフ表示の場合、生成部5は、応答時間、可用性といった監視指標ごとの影響度を図7のように個別にグラフ表示してもよいし、これら複数の監視指標における影響度を組み合わせて(例えば重み付け平均などを用いて)統一的にグラフ表示してもよい。図7では、生成部5は、あるITサービスに関する項目影響度を時系列に表示している。生成部5は、算出部4から出力されたデータをタイムスタンプに基づき集計し表示する。表示対象は、複数のITサービスであってもよいし、すべてのITサービスにおける影響度の総和であっても良い。
図8では、生成部5は、図5と同様の情報を円グラフ表示している。図5と同様、生成部5は、最悪影響度に対する現状の影響度(ハッチング部)の割合(占有率)を、ITサービスごとに示しており、現状影響度のあるITサービスを表示対象としている。また、図9では、生成部5は、そのITサービス提供者が守るべき全SLAに対し、違反のあるSLAの割合を円グラフ表示している。
<処理>
次に、図1及び図10を用いて、本実施形態の処理について説明する。図1は、算出部4におけるITサービスの影響度算出処理の一例を表すフローチャートである。図10は、図1のフローチャートで参照及び算出されるデータをまとめた表である。まず、算出部4は、影響度を取得したいITサービスを特定し、そのITサービスに必要とするCIの中で、影響度の算出に必要な監視対象項目について情報を記憶部2から読み出し、さらに、その監視対象項目についての測定値を取得部3から取得する(S101)。図10では、算出部4は、サービス1001として、ITサービス01、ITサービス02を特定している。算出部4は、これらサービスに対する、監視対象1002、重要度1003、最悪測定値1004を記憶部2から読み出し、測定値1005を取得部3から取得する。
次に、算出部4は、特定したITサービスに関連するSLAについての情報を記憶部2から読み出す。読み出すSLAは、図10における、SLA1006、条件1007、重要度1008に相当する。そして、算出部4は、各SLAの条件1007と測定値1005とを照らし合わせて、各SLAの違反値1009を算出する(S102)。算出部4は、違反値1009を、各指標のSLA契約値と測定値との差分や割合から算出しても良いし、違反(×)、遵守(○)といった二値で表現しても良い。
次に、ITサービスのすべてのSLAの違反値に基づいて、算出部4は、ITサービスの影響度を算出する(S104)。ITサービスの影響度は、各SLAの重要度に基づいて違反値に重みを付与した重み付け総和を用いる。図10では、例として、SLA001及びSLA002は「1」、SLA003は「0.8」という重要度1008が定義されている。算出部4は、各違反値をこれらの値に乗算して総和を取ることに基づき、まず、監視対象項目ごとの影響度(項目影響度1010)を算出できる。そして、算出部4は、項目影響度1010を合算することでITサービスの影響度(サービス影響度1011)を算出できる。重要度が全SLAについて「1」であれば、影響度は、違反値の単純な総和となる。
サービス影響度1011を算出後、算出部4は、読み出した最悪測定値1004を用いて、各SLAの最悪違反値1012を算出し、最悪違反値1012を基に項目ごとの最悪影響度1013及びITサービス全体の最悪影響度1014を算出する(S105)。最後に、生成部5が、S104及びS105で算出したITサービス影響度及びITサービス最悪影響度の結果を示す画像(図5〜図9を例とした形式)を生成し、入出力部1に表示する(S106)。
(変形例)
なお、本実施の形態に係る情報処理装置(影響度算出装置)の各構成は、複数の構成に分かれても良い。例えば、算出部4は、1つの構成に限られず、複数の構成、例えば、違反値を算出する構成と、影響度を算出する構成に分かれても良い。また、各構成は、1つの装置に含まれず、別装置として構成してもよい。例えば、記憶部2は、ネットワークを介して接続した別の記憶装置としてもよい。また、生成部5及び入出力部1を別装置としてもよい。
図18は、本実施に形態に係る情報処理装置(影響度算出装置)の別の構成の一例を示す図である。図18において図2と同じ構成には同じ番号を付し、詳細な説明は省略する。
図18に示す情報処理装置は、図2と同様の取得部3と、違反値を算出する違反値算出部42と、影響度を算出する影響度算出部43とを含んでいる。なお、違反値算出部42と影響度算出部43とは、合わせて、図2に示す算出部4と同様に動作する。
また、図18に示す情報処理装置は、記憶部2と、生成部5と、入出力部1とを、ネットワークを介して接続した別ユニットとしている。そのため、図18では、ネットワークを介して接続されたユニットを点線で示している。CIも、ネットワーク介して接続しているため、点線で示した。
このように構成した情報処理装置(影響度算出装置)も、ネットワークを介して各ユニットと情報をやり取りし、図2に示す影響度算出装置と同様に動作できる。
なお、図18に示す情報処理装置は、本発明の最小構成である。
<第1実施形態の効果>
これまで説明した情報処理装置(影響度算出装置)は、ITサービス提供者に、障害若しくは不具合等に基づいたITサービス及びCIに問題が発生した場合、SLA違反への影響をITサービス、CI、若しくは、ITシステムごとに確認するための表示を提供できる。また、情報処理装置は、このままITサービス及びCIの問題が放置されると、それぞれに対して影響度がどのくらい拡大するかの可能性をサービス提供者へ分かりやすく提示できる。
以上のように、本実施形態の情報処理装置は、障害及び不具合等に基づくITサービス又はCIのSLA違反に関する影響を、ITサービス提供者に、知らせることができる。また、情報処理装置は、影響度算出結果をグラフ等で表示することで、ITサービス提供者に、優先的に対処するITサービス及びCIの順序を、容易に把握させることができる。特に、ITサービスにおける監視指標に関する閾値をSLAから決定する場合、本実施形態における情報処理装置は、サービス受容者ごとのITサービスに対する影響を違反値に直接的に反映することができ、影響度算出の正確さについて大きな効果が期待できる。
つまり、あるITサービスに問題が発生した場合、本実施形態の情報処理装置は、その問題が及ぼすサービス受容者の観点での影響の大きさを算出できる。
また、複数のITサービスに問題が発生し対処が必要となった場合に、本実施形態の情報処理装置は、ITサービスごとのSLAへの影響の大きさを算出できるため、ITサービス提供者が対処の優先順位付けをする際の参考を提供できる。
(第2実施形態)
図11は、第2実施形態としての影響度算出装置の構成を示すブロック図である。本実施形態は、図2に示す第1実施形態と比べて、算出部4が警告値算出部41を含む点で異なる。
図12に本実施形態に係る記憶部2に登録されたデータの一例を示す。図3に示す第1実施形態における記憶部2の登録データ301との違いは、SLAの各指標(応答時間、可用性)において違反範囲に加えて警告範囲がデータとして存在することである。この警告範囲とは、サービス受容者とのSLA上は違反とはならないが、このまま対処なく放置しておけば違反となる可能性が高い値の範囲である。指標の性質に基づき異なるが、図12に示す例は、違反になる一つ前の段階の数値を警告範囲としている。例えば、SLA_001の応答時間は、3秒未満であれば正常、3秒以上5秒未満であれば警告(危険)、5秒以上であれば違反である。なお、SLAの違反以外の閾値は、警告を表す閾値以外に、警告に対しもう少し対処緊急度の低い危険レベルの範囲を表す危険値など、運用の状況に応じて自由に設定できる。
算出部4は、警告値算出部41において、各SLAで設定されている警告範囲と取得部3から取得した測定値とから警告値を算出する。警告値算出部41は、測定値が警告範囲に入っているか否かを警告範囲内(○)、警告範囲外(×)の2値で表現しても良いし、警告範囲のどの位置かを25%警告等の連続値で表現しても良い。例えば、ITサービス01の応答時間が7秒であるという測定値が取得された場合、SLA_002について、警告範囲が5秒以上、10秒未満なので、警告値は、警告範囲内(○)、若しくは、(7−5)÷(10−5)×100=2/5×100=40%となる。
各々のSLAについて、第1実施形態で求めた違反値に加えて、警告値算出部41で算出した警告値も参照することで、算出部4は、ITサービスごとに影響値を算出する。例えば、算出部4は、違反値と警告値とを重み付けをした総和を算出する。重みを、違反値は「10」、警告値は「2」、として、SLA_001及びSLA_002の違反値及び警告値を用いると、算出部4は、第1の実施形態のSLA_001の結果から、ITサービス01の影響度を、40×10+40×2=480と算出できる。
図13は、第2実施形態での影響度算出の結果を表示した図である。生成部5は、各ITサービスに対して、違反値と警告値の大きさが分かるように表示する。例えば、生成部5は、違反値であるSLAが数の上では少しであっても強調し、表示に反映されやすくする。
図14は、すべてのITサービスの監視対象項目が最悪測定値である場合の最悪影響度の総和を棒グラフの全長とし、違反値に基づく影響度及び警告値に基づく影響度をハッチングで表示した例を示す図である。生成部5は、このような表示に基づき、全サービスにおいて、どの程度の問題が発生しているのかを直感的に表示できる。
図15は、第2実施形態での影響度算出の結果を表示した例を示す図である。生成部5は、全体のSLA数を円グラフで表現し、違反値を持つSLAの数、警告値を持つSLAの数をそれぞれ斜線、格子模様で表示する。この表示に基づき、影響度算出装置は、全SLAのうち対処の必要なSLAがどの程度存在するかを、ITサービス提供者に把握させることができる。
図16は、第2実施形態での影響度算出の結果を表示した例を示す図である。生成部5は、違反値又は警告値が存在するITサービスを抽出し、それら違反値及び警告値の内訳を円グラフで表現している。
図17を参照すると、本実施形態の動作は、第1の実施形態の動作と、ステップS102でSLA違反値を算出した後の動作が異なる。第2実施形態では、ステップS102でSLA違反値を算出した後、ステップS203で警告値算出部41においてSLA警告値を算出する。
<処理>
本実施形態における処理の流れについて、図17を用いて説明する。第1実施形態で示した図1との違いは、ステップS203及びステップS204であり、その他の処理は第1実施形態と同様であるので、ここでは説明を省略する。ステップS203では、警告値算出部41が、各SLAの条件と取得した測定値とを照らし合わせ、各SLAの警告値を算出する(ステップS203)。算出部4は、違反値、警告値から影響度を算出する(ステップS204)。
<第2実施形態の効果>
違反値に加えて警告値を設けてITサービス及びCIごとの影響度に反映させてサービス提供者へ提示することで、本実施形態の情報処理装置(影響度算出装置)は、現状のSLAの遵守状態のさらなる詳細な理解と、障害対処の順序を正確に判断することを支援できる。
(他の実施形態)
以上、本発明の実施形態について詳述したが、それぞれの実施形態に含まれる別々の特徴をどのように組み合わせたシステム又は装置も、本発明の範囲に含まれる。
また、本発明の実施の形態は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するサービス管理プログラムが、システム又は装置に、直接又は遠隔から供給されて実行される場合にも適用可能である。したがって、前述した本発明の実施の形態の各ユニットにおける機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、そのプログラムを格納した媒体、又は、そのプログラムをダウンロードさせるWWWサーバも、本発明の範囲に含まれる。また、プログラムを格納する媒体は、図2、図11、図18における記憶部であってもよい。
この出願は、2010年1月7日に出願された日本出願2010−001968を基礎とする優先権を主張し、その開示をすべてここに取り込む。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
本発明は、運用監視分野における障害状況を正確に把握し、障害対処する用途に、好適に適用可能である。本発明は、特に、大規模システム環境下で複数の障害が同時に発生する場合に有用となる。
1 入出力部
2 記憶部
3 取得部
4 算出部
5 生成部
41 警告値算出部
2 記憶部
3 取得部
4 算出部
5 生成部
41 警告値算出部
Claims (9)
- 情報サービスに関連する監視対象項目について、測定値を取得する取得手段と、
前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出手段と、
前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出手段と
を含む情報処理装置。 - 前記影響度算出手段は、前記複数の条件の各々に設定された重要度を参照して、前記違反値から前記影響度を算出することを特徴とする請求項1に記載の情報処理装置。
- 前記複数の条件は、前記情報サービスの提供者と複数の受容者との間で、別々に同意があったサービスレベルについての異なる条件であることを特徴とする請求項1又は2に記載の情報処理装置。
- 前記監視対象項目に関して警告の対象となる複数の条件を前記測定値と比較して、条件違反になる可能性の高さを示す警告値を算出する警告値算出手段を更に備え、
前記影響度算出手段は、前記違反値及び前記警告値を用いて、前記影響度を算出することを特徴とする請求項1乃至3のいずれかに記載の情報処理装置。 - 前記影響度算出手段で出力された前記影響度を表すグラフ画像を生成する画像生成手段を更に備えることを特徴とする請求項1乃至4のいずれかに記載の情報処理装置。
- 前記影響度算出手段は、
前記測定値として考えられる最悪の値を最悪測定値とした場合に、前記複数の条件と前記最悪測定値とを比較して算出した最悪違反値を用いて、前記情報サービスが取り得る最悪の影響の度合いを最悪影響度として算出することを特徴とする請求項1乃至5のいずれかに記載の情報処理装置。 - 前記影響度算出手段で出力された前記影響度と前記最悪影響度とを比較したグラフ画像を生成する画像生成手段を更に備えることを特徴とする請求項6に記載の情報処理装置。
- 情報サービスに関連する監視対象項目について、測定値を取得し、
前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出し、
前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する
サービス管理方法。 - 情報サービスに関連する監視対象項目について、測定値を取得する取得処理と、
前記監視対象項目に関して要求される複数の条件を前記測定値と比較して、条件違反の度合いを示す違反値を算出する違反値算出処理と、
前記違反値を用いて、前記条件違反が前記情報サービスに与える影響の度合いを影響度として算出する影響度算出処理と
をコンピュータに実行させるサービス管理プログラムを含む記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010001968 | 2010-01-07 | ||
JP2010001968 | 2010-01-07 | ||
PCT/JP2010/073874 WO2011083750A1 (ja) | 2010-01-07 | 2010-12-24 | 情報処理装置、サービス管理方法、並びにサービス管理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2011083750A1 true JPWO2011083750A1 (ja) | 2013-05-13 |
Family
ID=44305486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011548980A Pending JPWO2011083750A1 (ja) | 2010-01-07 | 2010-12-24 | 情報処理装置、サービス管理方法、並びにサービス管理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20130073912A1 (ja) |
JP (1) | JPWO2011083750A1 (ja) |
WO (1) | WO2011083750A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013015292A1 (ja) * | 2011-07-25 | 2013-01-31 | 日本電気株式会社 | 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体 |
JP2013200864A (ja) * | 2012-02-22 | 2013-10-03 | Ricoh Co Ltd | 機器管理装置、機器管理システム及びプログラム |
WO2015186342A1 (ja) * | 2014-06-03 | 2015-12-10 | 日本電気株式会社 | 要因順序推定装置、要因順序推定方法、及び、要因順序推定プログラムが格納された記録媒体 |
JP6926646B2 (ja) * | 2017-05-08 | 2021-08-25 | 日本電信電話株式会社 | 事業者間一括サービス管理装置および事業者間一括サービス管理方法 |
JP7436146B2 (ja) * | 2019-02-07 | 2024-02-21 | 日本電信電話株式会社 | 障害情報周知装置及び障害情報周知方法 |
JP7411512B2 (ja) * | 2020-06-25 | 2024-01-11 | 株式会社日立製作所 | 生産計画システム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003242228A (ja) * | 2002-01-31 | 2003-08-29 | Currie & Brown Japan Ltd | 施設運営管理システム |
JP2005092886A (ja) * | 2003-09-18 | 2005-04-07 | Internatl Business Mach Corp <Ibm> | ユーティリティ・コンピューティング環境の、自動アラートおよび率先リベートを伴うリアルタイム・サービス・レベル・パフォーマンス、違反、および保証された均一性を表示する方法。 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120462A (ja) * | 1997-10-14 | 1999-04-30 | Fujitsu Ltd | アラーム管理装置 |
EP1213895B1 (en) * | 2000-12-08 | 2007-09-05 | Sony Deutschland GmbH | High-level interface for QoS-based mobile multimedia applications |
US7313533B2 (en) * | 2003-07-11 | 2007-12-25 | International Business Machines Corporation | Systems and methods for monitoring and controlling business level service level agreements |
US7313568B2 (en) * | 2004-03-31 | 2007-12-25 | International Business Machines Corporation | Generating and analyzing business process-aware modules |
US7673040B2 (en) * | 2005-10-06 | 2010-03-02 | Microsoft Corporation | Monitoring of service provider performance |
US20070180061A1 (en) * | 2006-02-02 | 2007-08-02 | International Business Machines Corporation | Methods and apparatus for interactive specification of context-sensitive sevice level agreements; for provisioning of resources required during service delivery events regulated by service level agreements; and for monitoring compliance with service level agreements during service delivery events |
US7885842B1 (en) * | 2006-04-28 | 2011-02-08 | Hewlett-Packard Development Company, L.P. | Prioritizing service degradation incidents based on business objectives |
US8108250B1 (en) * | 2007-01-05 | 2012-01-31 | Intelligent Business Tools | Method and apparatus for providing a business tool |
US8423955B2 (en) * | 2007-08-31 | 2013-04-16 | Red Hat, Inc. | Method and apparatus for supporting multiple business process languages in BPM |
US8103535B2 (en) * | 2008-01-29 | 2012-01-24 | International Business Machines Corporation | Evaluation of fitness for a contractual agreement related to provisioning information technology services |
-
2010
- 2010-12-24 WO PCT/JP2010/073874 patent/WO2011083750A1/ja active Application Filing
- 2010-12-24 JP JP2011548980A patent/JPWO2011083750A1/ja active Pending
- 2010-12-24 US US13/520,835 patent/US20130073912A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003242228A (ja) * | 2002-01-31 | 2003-08-29 | Currie & Brown Japan Ltd | 施設運営管理システム |
JP2005092886A (ja) * | 2003-09-18 | 2005-04-07 | Internatl Business Mach Corp <Ibm> | ユーティリティ・コンピューティング環境の、自動アラートおよび率先リベートを伴うリアルタイム・サービス・レベル・パフォーマンス、違反、および保証された均一性を表示する方法。 |
Also Published As
Publication number | Publication date |
---|---|
US20130073912A1 (en) | 2013-03-21 |
WO2011083750A1 (ja) | 2011-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2011083750A1 (ja) | 情報処理装置、サービス管理方法、並びにサービス管理プログラム | |
CN112162878A (zh) | 数据库故障发现方法、装置、电子设备及存储介质 | |
US8781865B2 (en) | Handling consolidated tickets | |
JP2017126363A (ja) | 運用管理装置、運用管理方法、及びプログラム | |
US20140177430A1 (en) | Recovery from multiple faults in a communications network | |
US20200104774A1 (en) | Cognitive user interface for technical issue detection by process behavior analysis for information technology service workloads | |
US11610136B2 (en) | Predicting the disaster recovery invocation response time | |
CN113704065A (zh) | 监控方法、装置、设备及计算机存储介质 | |
JP5768983B2 (ja) | 契約違反予測システム、契約違反予測方法および契約違反予測プログラム | |
JP6109662B2 (ja) | 運用管理装置、運用管理方法およびプログラム | |
CN109992473A (zh) | 应用系统的监控方法、装置、设备及存储介质 | |
CN109240863A (zh) | 一种cpu故障定位方法、装置、设备及存储介质 | |
JP6002856B2 (ja) | 監視システム、及び、監視方法 | |
JP2009181496A (ja) | ジョブ処理システムおよびジョブ管理方法 | |
JP5271761B2 (ja) | 障害対処方法及び装置 | |
WO2012070475A1 (ja) | 情報処理装置、情報処理方法、並びに情報処理プログラム | |
EP2634746A1 (en) | Maintenance management system, and maintenance management method | |
CN113537519B (zh) | 一种识别异常设备的方法和装置 | |
JP2012174079A (ja) | 機器管理システム | |
CN109766243B (zh) | 一种基于幂函数的多核主机性能监控方法 | |
JP2013003896A (ja) | 情報提供装置、情報提供方法およびプログラム | |
Wang et al. | Research on Strategies for Improving the Operation and Maintenance Capacity of Hydropower Plant Informatization Projects | |
Aitiddir et al. | Cloud Infrastructure Monitoring Using Splunk: Expectations and Challenges | |
US8706454B2 (en) | Transmission evaluation | |
Hofmann et al. | Vulnerability indicators for electric power grids |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140909 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20150224 |