JPWO2013015292A1 - 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体 - Google Patents

品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JPWO2013015292A1
JPWO2013015292A1 JP2013525732A JP2013525732A JPWO2013015292A1 JP WO2013015292 A1 JPWO2013015292 A1 JP WO2013015292A1 JP 2013525732 A JP2013525732 A JP 2013525732A JP 2013525732 A JP2013525732 A JP 2013525732A JP WO2013015292 A1 JPWO2013015292 A1 JP WO2013015292A1
Authority
JP
Japan
Prior art keywords
monitoring
sla
violation
allowable range
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013525732A
Other languages
English (en)
Inventor
遼介 外川
遼介 外川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2013525732A priority Critical patent/JPWO2013015292A1/ja
Publication of JPWO2013015292A1 publication Critical patent/JPWO2013015292A1/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management

Landscapes

  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Debugging And Monitoring (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本発明は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能にする、品質評価装置を提供する。その品質評価装置は、監視対象の違反動作の条件を規定する違反条件と、その違反条件に対応する監視データの取得間隔及び監視期間に基づいて算出した全監視数と、に基づいて、その監視データの基準値である監視基準値を満たさない監視データの量の、許容範囲を算出する許容範囲算出手段と、その監視データとその許容範囲とに基づいて、その監視期間途中における任意の時点の、違反条件に対する遵守率を算出する遵守率算出手段と、を備える。

Description

本発明は、サービスの品質を評価する品質評価装置、品質評価方法及びそのためのプログラムに関する。
IT(Information Technology)分野において、SaaS(Software as a Service)などに代表される、サービスを中心とした契約が増加しつつある。
こうした契約においては、サービスの品質を保証する手段として、SLA(Service Level Agreement、サービスレベル契約)が用いられる。SLAは、サービスの提供者と利用者との間の、1つ以上のサービスレベル項目それぞれについての、サービス水準(例えば、サービスの内容、範囲及び品質)に対する定量的かつ明示的な合意の契約である。
SLAにおけるサービスレベル項目のサービス水準は、例えば、「サービス稼働率が99.9%以上であること」、「障害発生時の平均復旧時間が12時間以内であること」である。
非特許文献1は、SaaSに関するSLAを交わす際に、サービスレベル項目及びそのサービス水準を決定するための参考となる情報を示す。
また、SLAで交わされる各サービスレベル項目のサービス水準は、サービスの品質を評価するために用いられることもある。
特許文献1は、サービス評価システムの一例を開示する。
特許文献1のサービス評価システムは、まず、予め与えられたSLA定義情報を、監視項目に変換する。ここで、SLA定義情報は、サービスレベル項目とそのサービス水準の定義情報である。また、監視項目は、設定値及び監視方法である。
次に、サービス評価システムは、ソフトウェアサービスプロバイダのソフトウェアサービスにおける個別の項目(例えば、稼動状況、応答状況及び接続ユーザ数)について監視を行い、履歴を記録する。
次に、サービス評価システムは、記録した履歴を解析し、予め定められた期間(例えば、前日の0時から24時)の履歴に基づいて解析した結果を利用実績として記録する。
次に、サービス評価システムは、設定値と利用実績とを比較して、SLA違反の可能性の有無を判定する。
特開2010−257272号広報
経済産業省作成、「SaaS向けSLAガイドライン」、平成20年1月21日、http://www.meti.go.jp/press/20080121004/03_guide_line_set.pdf
上述した特許文献1に記載されたサービス評価システムは、監視対象システムのSLA遵守状況を示すことができないという問題点を有していた。ここで、SLA遵守状況は、監視対象システムが、サービス提供中の特定の時点において、SLA違反発生に対してどの程度近づいているのかを示し、また、SLAをどの程度違反しているかを示す、情報である。
その理由は、特許文献1のサービス評価システムは、予め定めた期間(監視期間)の実績とSLA定義に対応する設定値とを比較して、SLA違反があったか否かを判定していたためである。
具体的には、特許文献1のサービス評価システムにおいて、SLA定義情報が、例えば「24時間毎の監視期間において、全体の応答時間の内98%で、サービスレベル項目の基準値である、1つの応答時間が3秒以内を遵守する。」であったとする。ここで、その応答時間は、例えば、あるサービス利用端末があるサービスプロバイダにある要求を送信してから、その要求への応答を得るまでの、1回の動作の時間である。即ち、「全体の応答時間の内98%」とは、「100回の要求(応答)に対応する100個の応答時間の内、98個の応答時間」を示す。
この場合、例えば監視開始から11時間の時点において、基準値違反(応答時間が3秒を超えること)の発生回数が応答の回数全体の内1.5%であった場合と、0.5%であった場合とでは、前者の方がよりSLA違反発生に近づいている。即ち、監視途中の基準値違反の発生回数あるいはその発生率は、SLA遵守状況を示す情報である。しかし、特許文献1のサービス評価システムは、このような情報を示すことができない。
[発明の目的]
本発明の目的は、上述した問題点を解決する品質評価装置、品質評価方法及びそのためのプログラムを提供することにある。
本発明の品質評価装置は、監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する許容範囲算出手段と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する遵守率算出手段と、を含む。
本発明の品質評価方法は、コンピュータが、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力し、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する。
本発明の不揮発性記憶媒体に記録されたプログラムは、コンピュータに、
監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する処理と、
前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する処理とを実行させる。
本発明は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能にする効果がある。
図1は、本発明の第1の実施形態に係る品質評価装置の構成を表すブロック図である。 図2は、本発明の第1の実施形態におけるSLA定義の例を示す図である。 図3は、本発明の第1の実施形態における監視ログの例を示す図である。 図4は、本発明の第1の実施形態における監視ログ集計記録の例を示す図である。 図5は、本発明の第1の実施形態におけるSLA定義記憶部1021にSLA定義2100を記録する動作を示すフローチャートである。 図6は、本発明の第1の実施形態における品質評価装置の全体の動作を示すフローチャートである。 図7は、本発明の第1の実施形態における監視部の動作を示すフローチャートである。 図8は、本発明の第1の実施形態におけるSLA許容範囲算出部の動作を示すフローチャートである。 図9は、本発明の第1の実施形態におけるSLA遵守率算出部の動作を示すフローチャートである。 図10は、本発明の第2の実施形態の装置の構成を表すブロック図である。 図11は、本発明の第3の実施形態の装置の構成を表すブロック図である。 図12は、本発明の第3の実施形態におけるSLA定義の例を示す図である。 図13は、本発明の第3の実施形態における監視ログ集計記録の例を示す図である。 図14は、本発明の第3の実施形態の全監視数推定部の動作を示すフローチャート図である。 図15は、本発明の第4の実施形態に係る品質評価装置の構成を表すブロック図である。 図16は、本発明の第4の実施形態のSLA違反予測部の動作を示すフローチャート図である。 図17は、本発明の第5の実施形態に係る品質評価装置の構成を表すブロック図である。 図18は、本発明の第5の実施形態のSLA遵守率集約部の動作を示すフローチャート図である。 図19は、本発明のプログラムにより所定の処理をコンピュータに実行させる品質評価装置の構成を示すブロック図である。 図20は、プログラムを記録した不揮発性記憶媒体の例を示すブロック図である。
[第1の実施形態]
図1は、本発明の第1の実施形態に係る品質評価装置1000の構成を示すブロック図である。
図1に示すように、第1の実施形態に係る品質評価装置1000は、監視部1011と、SLA定義記憶部1021と、ログ記憶部1022と、SLA違反範囲算出部1031と、SLA遵守率算出部1032とを備えている。
監視部1011は、SLA定義に基づいて、監視対象システム(不図示)に対する監視を実行し、その監視の結果である監視データを取得する。
図2は、SLA定義2100の例を示す図である。図2を参照すると、SLA定義2100は、1以上のSLA定義レコード2107で構成される。SLA定義レコード2107は、サービスレベル項目2101、監視基準値2102、SLA違反条件(違反条件とも呼ばれる)2103、監視方法2104、監視間隔(取得間隔とも呼ばれる)2105及び監視期間2106を含む。
サービスレベル項目2101は、SLAとして監視する項目を示す。監視基準値2102は、対応するサービスレベル項目2101の満たすべき値を示す。SLA違反条件2103は、対応するサービスレベル項目2101がSLA違反と判定される条件を示す。監視方法2104は、対応するサービスレベル項目2101を監視するための方法(手段)を示す。監視間隔2105は、対応するサービスレベル項目2101の監視を実行する間隔を示す。監視期間2106は、SLA違反の有無を判定する監視期間を示す。
監視対象システムは、例えば、サーバ単体や複数のサーバで構成されるWEB三層システム、及びデータセンターである。
監視対象システムに対して実行する監視の項目(サービスレベル項目2101)は、例えば、サービス時間、稼働率などの可用性、平均復旧時間や障害通知時間などの信頼性、及び、応答時間やCPU使用率やバッチ処理時間などの性能に関する情報である。
即ち、監視部1011は、SLA定義レコード2107の情報に基づいて、サービスレベル項目2101に対する監視動作を実行する。具体的には、監視部1011は、あるサービスレベル項目2101に対応する監視方法2104で示される監視方法を用いて、及び対応する監視間隔2105の時間間隔で監視動作を実行し、監視データを取得する。例えば、監視部1011は、サービスレベル項目2101が「サービス稼働率」に対応する、監視方法2104で示される「ping」を用いて、監視間隔2105で示される「5分毎」に、監視動作を実行し、監視データを取得する。
また、監視部1011は、監視動作を実行するたびに、取得した監視データに基づいて、サービスレベル項目2101に係る監視ログを生成し、ログ記憶部1022へ出力する。尚、その監視データは、その1回の監視動作の実行で取得した監視データである。
また、監視部1011は、監視期間2106の区切り毎に、取得した監視データに基づいて、サービスレベル項目2101についての監視ログ集計記録を生成し、ログ記憶部1022へ出力する。尚、その監視データは、監視期間2106の前回の区切りから今回の区切りまでの間に取得した全ての監視データである。
尚、監視部1011は、監視ログレコード2206をSLA許容範囲算出部1031及びSLA遵守率算出部1032へ出力してもよい。同様に、監視部1011は、監視ログ集計レコード2307をSLA許容範囲算出部1031及びSLA遵守率算出部1032へ出力してもよい。この場合、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、監視ログ2200及び監視ログ集計記録2300を、図示しない記憶手段に記憶してもよい。
図3は、監視ログ2200の例を示す図である。図3を参照すると、監視ログ2200は、監視日時2201、監視項目2202、監視結果2203及び基準値違反の有無2204を少なくとも含む、監視ログレコード2206によって構成される。
監視日時2201は、監視部1011が監視動作を実行した日時を示す。
監視項目2202は、監視部1011が実行した監視動作の項目を示す。監視項目2202の内容がサービスレベル項目2101の内容と一致する場合、その監視項目2202を含む監視ログレコード2206は、そのサービスレベル項目2101を含むSLA定義レコード2107に対応する。即ち、その監視ログレコード2206は、そのSLA定義レコード2107に基づいて、監視部1011が実行した監視動作についての監視ログレコード2206である。
監視結果2203は、監視部1011が、監視動作を実行して取得した監視データに基づいて、生成した、監視動作の結果を示す情報である。
例えば、図3を参照すると、監視項目2202が「サービス時間」である監視ログレコード2206に含まれる監視結果2203は、「○」である。これは、監視部1011による監視動作の結果が、正常であったことを示す。即ち、監視結果2203は、「○」である場合、監視間隔2105に示される時間間隔の間(例えば、2010/2/15,14:59から2010/2/15,15:00まで)、監視対象システムのサービスが正常に稼働していたとすること、を示す。
一方、監視対象システムのサービスの稼働が正常でない時間があった場合、監視結果2203は、例えば、その稼働が確認されなかった時間に対応する100%未満の値である。
また、監視項目2202が「サービス稼働率」の監視ログレコード2206に含まれる監視結果2203は、「100%」である。これは、監視部1011が、監視期間2106に基づく監視開始の時刻からサービス稼働率を算出する時刻までに発生した予定外停止時間に基づき、算出したサービス稼働率である。例えば、監視期間2106に基づく監視開始の時刻が「2010/2/15,14:00」、サービス稼働率を算出する時刻が「2010/2/15,15:20」の場合、監視期間2106に基づく監視開始の時刻からサービス稼働率を算出する時刻まで監視時間は、100分である。例えば、監視開始の時刻からサービス稼働率を算出する時刻までの監視時間が100分であって、そのうち予定外停止時間が10分であった場合、監視結果2203は、「90%」である。
また、監視項目2202が「応答時間」の監視ログレコード2206に含まれる監視結果2203は、「5秒」である。ここで、監視項目2202が「応答時間」の監視ログレコード2206は、サービスレベル項目2101が「応答時間」であるSLA定義レコード2107に対応する。即ち、この監視結果2203の「5秒」は、監視部1011が、対応するSLA定義レコード2107に含まれる監視方法2104の「ping」に基づき、pingを利用して計測した応答時間である。
また、監視項目2202が「トランザクション数」の監視ログレコード2206に含まれる監視結果2203は、「300」である。これは、監視部1011が計数した、例えば、サービス稼働率の監視時間中に発生した、トランザクション数である。
基準値違反の有無2204は、対応する監視結果2203が対応する監視基準値2102に違反したか(この場合、「有」)、違反していないか(この場合、「無」)を示す。
尚、基準値違反の有無2204が「有」である監視ログレコード2206は、監視基準を満たさない監視データに対応する。例えば、図3に示す監視項目2202が「応答時間」の監視結果2203である「5秒」は、図2に示すサービスレベル項目2101が「応答時間」の監視基準値2102である「3秒以内」を満たさない。したがって、図3に示す監視項目2202が「応答時間」の基準値違反の有無2204は、「有」である。
図4は、監視ログ集計記録2300の例を示す図である。図4を参照すると、監視ログ集計記録2300は、監視期間2302、報告日時2303及びSLA維持状況2306を少なくとも含む、監視ログ集計レコード2307により構成される。
SLA維持状況2306は、「○」である場合、図2に示すようなSLA定義2100で定義された全てのSLA定義レコード2107において、SLA違反条件2103に該当するサービスレベル項目2101が1つもないことを示す。また、SLA維持状況2306は、「×」である場合、サービスレベル項目2101のうちいずれか1つ以上がSLA違反条件2103に該当していることを示す。
SLA定義記憶部1021は、SLA定義2100を記憶する。
ログ記憶部1022は、監視ログ2200及び監視ログ集計記録2300を記憶する。
SLA許容範囲算出部1031は、SLA定義2100の監視間隔2105及び監視期間2106に基づいて全監視数を算出する。続けて、SLA許容範囲算出部1031は算出した全監視数と、対応するSLA違反条件2103とに基づいて、SLA許容範囲(許容範囲とも呼ばれる)を生成し、SLA遵守率算出部1032に出力する。SLA許容範囲は、SLAにおいて許容可能な、即ち発生してもSLA違反とはならない、監視基準値2102に対する違反の量(基準値違反の量)の範囲を示す情報である。監視基準値2102に対する違反の量は、即ち、監視基準値2102を満たさない監視データの量に対応するものであり、違反の回数あるいは時間で示される。尚、監視基準値2102に対する違反の量は、その違反の回数あるいは時間の、監視基準値2102に対する比率で示されてもよい。また、例えば、監視データが情報処理量や通信量である場合、監視基準値2102に対する違反の量は、不足しているまたは超過した情報処理量や通信量で示されてもよい。あるいは、監視基準値2102に対する違反の量は、その不足しているまたは超過した情報処理量や通信量の、監視基準値2102に対する比率で示されてもよい。
SLA遵守率算出部1032は、監視装置1011が出力する図3に示す監視ログレコード2206に含まれる基準値違反の有無2204に基づいて、基準値違反の発生回数を算出する。
SLA遵守率算出部1032は、例えば、監視期間2106の開始時刻(例えば、毎日午前0時)からSLA遵守率を算出する時刻までの範囲の、基準値違反の発生回数を算出する。また、SLA遵守率算出部1032は、品質評価装置1000に接続された入力手段(不図示)から入力された、特定の範囲の基準値違反の発生回数を算出してもよい。
次に、SLA遵守率算出部1032は、算出した基準値違反の発生回数と、SLA許容範囲算出部1031から取得したSLA許容範囲に基づいて、SLA遵守率を算出し、出力する。
SLA遵守率は、SLA許容範囲で示される基準値違反の量の範囲に対する、既に発生した基準値違反の量の比率である。ここで、既に発生した基準値違反の量は、例えば、ある特定の時点(例えば、監視開始時刻)から他の特定の時点(例えば、サービス提供中の現在時刻)までに発生している基準値違反の量である。即ち、SLA遵守率は、サービス提供中の特定の時点において、どの程度SLA違反に近いか、あるいはSLAをどの程度違反しているかを示す。
次に、図1〜図9を参照して、本実施形態の動作について詳細に説明する。
まず、SLA定義記憶部1021にSLA定義2100を記録する動作について説明する。図5は、本実施形態における、SLA定義記憶部1021にSLA定義2100を記録する動作を示すフローチャートである。
品質評価装置1000の図示しない入力手段は、SLA定義2100の入力を受け付ける(ステップA101)。
次に、入力手段は、受け付けたSLA定義2100をSLA定義記憶部1021へ記録する。(ステップA102)
以上が、SLA定義記憶部1021にSLA定義2100を記録する動作の説明である。
次に、監視を実行し、SLA遵守率を算出する品質評価装置1000全体の動作について説明する。図6は、監視を実行し、SLA遵守率を算出する品質評価装置1000全体の動作を示すフローチャートである。
まず、監視部1011は、SLA定義2100に基づき、監視対象システムの監視を実行する(ステップB101)。
次に、監視部1011は、実行した監視に基づいて、監視ログレコード2206及び監視ログ集計レコード2307を生成する。(ステップB102)。
具体的な、監視の実行と生成される監視ログレコード2206の例を、以下の(1)−(3)に説明する。
(1)監視部1011は、例えば、サービスレベル項目2101が「サービス時間」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、毎分00秒に監視対象システムに対してping(ピン)を送信する。尚、毎分00秒は、監視間隔2105で示される「1分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信した場合、対応する監視区間において、サービスが稼働していると判断する。尚、対応する監視区間は、pingに対する応答の受信時刻から、監視間隔2105で示される時間(例えば、1分)だけ遡った時刻の区間である。
即ち、監視部1011は、その監視区間の、例えば1分間は、監視対象システムにおいてサービスの停止がなく、稼働状態にあったと見なす。そして、監視部1011は、監視結果2203として“○”及び基準値違反の有無2204として「無」を含む監視ログレコード2206を生成する。
一方、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信しなかった場合、監視対象システムにおいて、サービスが停止している、あるいは異常が発生しているなど、正常な稼働状態にないと判断する。すなわち、監視部1011は、その監視区間の、例えば1分間は、監視対象システムが停止状態にあったと見なす。そして、監視部1011は、監視結果2203として“×”及び基準値違反の有無2204として「有」を含む監視ログレコード2206を生成する。
(2)監視部1011は、例えば、サービスレベル項目2101が「サービス稼働率」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、5分毎の00秒に監視対象システムに対してping(ピン)を送信する。尚、5分毎の00秒は、監視間隔2105で示される「5分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信した場合、対応する監視区間において、サービスが稼働していると判断する。尚、対応する監視区間は、pingに対する応答の受信時刻から、監視間隔2105で示される時間(例えば、5分)だけ遡った時刻の区間である。
すなわち、監視部1011は、その監視区間中(例えば5分間)、監視対象システムにおけるサービスの停止がなく、稼働状態にあったと見なす。そして、監視部1011は、監視部1011内のメモリ(不図示)に、監視対象システムがその監視区間中においては正常に稼働していたことを記録する。
一方、監視部1011は、監視対象システムから所定の時間内に、pingに対する応答を受信しなかった場合、監視対象システムにおいて、サービスが停止している、あるいは異常が発生しているなど、正常な稼働状態にないと判断する。すなわち、監視部1011は、その監視区間中、監視対象システムが停止状態にあったと見なす。そして、監視部1011は、監視部1011内のメモリに、監視対象システムがその監視区間中においては正常に稼働していなかったことを記録する。
次に、監視部1011は、監視結果2203として区間稼働率と、監視基準値2102に基づいて決定した基準値違反の有無2204とを含む監視ログレコード2206を生成する。尚、区間稼働率は、監視開始時刻から算出時刻までの時間に対する、正常に稼働していた時間の割合である。監視部1011は、例えば監視部1011内のメモリに記録された、監視対象システムの稼働の記録に基づいて算出する。
また、監視部1011は、算出した区間監視率と監視基準値2102とを比較して基準値違反の有無2204を決定する。即ち、監視部1011は、算出した区間監視率が監視基準値2102の「99.9%」に満たない場合、基準値違反の有無2204を「有」と決定する。
(3)監視部1011は、例えば、サービスレベル項目2101が「応答時間」であるSLA定義レコード2107に対応して、以下のように監視を実行する。
まず、監視部1011は、例えば、5分毎の00秒に監視対象システムに対してpingを送信する。尚、5分毎の00秒は、監視間隔2105で示される「5分毎」に基づいている。また、pingを送信することは、監視方法2104で示される「ping」に基づいている。
次に、監視部1011は、監視結果2203として監視対象システムからのpingに対する応答時間と、監視基準値2102に基づいて決定した基準値違反の有無2204とを含む監視ログレコード2206を生成する。
尚、監視対象システムから所定時間内にpingに対する応答がない場合、監視部1011は、監視結果2203を「測定不能」、あるいはSLA定義2100に別途定義された例外値とする。
また、監視部1011は、その応答時間と監視基準値2102とを比較して基準値違反の有無2204を決定する。即ち、監視部1011は、その応答時間が監視基準値2102の「3秒以内」でなかった場合、基準値違反の有無2204を「有」と決定する。
以上が、具体的な、監視の実行と生成される監視ログレコード2206の例である。
次に、監視部1011は、生成した監視ログレコード2206を監視ログ2200に、生成した監視ログ集計レコード2307を監視ログ集計記録2300に、記録する(ステップB103)。
次に、SLA許容範囲算出部1031は、SLA定義記憶部1021に記録されたSLA定義2100に基づいて、SLA許容範囲を算出し、SLA遵守率算出部1032に出力する(ステップB104)。
次に、SLA遵守率算出部1032は、監視ログ2200とSLA許容範囲算出部1031から取得したSLA許容範囲とに基づいて、SLA遵守率を算出し、出力する(ステップB105)。
次に、通信手段(不図示)は、SLA遵守率算出部1032からSLA遵守率を取得した、ネットワーク(不図示)を経由して、端末装置(不図示)にSLA遵守率を送信する(ステップB106)。また、例えばSLA遵守率表示手段(不図示)が、SLA遵守率算出部1032からSLA遵守率を取得して、ディスプレイ(不図示)に表示するようにしてもよい。
以上が、監視を実行し、SLA遵守率を算出する、品質評価装置1000全体の動作の説明である。
次に、図7を参照して、図6のステップB101、ステップB102及びステップB103に対応する、監視動作について詳細に説明する。図7は、監視部1011の動作を示すフローチャートである。
まず、監視部1011は、SLA定義記憶部1021からSLA定義2100を取得する(ステップC101)。
次に、監視部1011は、取得したSLA定義記憶部1021の各SLA定義レコード2107に含まれるサービスレベル項目2101について、対応する監視間隔2105及び監視方法2104に基づいて、監視対象システムの監視を実行する。続けて、監視部1011は、監視を実行した結果に基づいて対応する監視結果2203を生成する。(ステップC102)。
次に、監視部1011は、生成した監視結果2203と、監視結果2203及び監視基準値2102に基づいて決定した基準値違反の有無2204とを含む、監視ログレコード2206を生成する(ステップC103)。
次に、監視部1011は、生成した監視ログレコード2206を、ログ記憶部1022へ記録する(ステップC104)。
次に、監視部1011は、監視ログ集計レコード2307を生成する(ステップC105)。
次に、監視部1011は、生成した監視ログ集計レコード2307をログ記憶部1022へ出力する(C106)
尚、監視部1011は、ステップC105において、各監視期間2106の完了時であるかを判定する。そして、各監視期間2106の完了時である場合に、監視部1011は監視ログ集計レコード2307を生成する。更に、ログ集計レコード2307を生成した場合に、監視部1011は、この監視ログ集計レコード2307を出力する。
また、監視部1011は、ステップC105において、常に監視ログ集計レコード2307を生成するようにしてもよい。この場合、生成したSLA維持状況2306が「×」である場合に、監視部1011は、生成した監視ログ集計レコード2307を出力するようにしてもよい。
以上が、監視部1011の動作についての説明である。
次に、図8を参照して、図6のステップB104に対応する、SLA許容範囲算出部1031の動作について詳細に説明する。図8は、SLA許容範囲算出部1031の動作を示すフローチャートである。
まず、SLA許容範囲算出部1031は、SLA定義記憶部1021より、SLA許容範囲を算出するサービスレベル項目2101に対応するSLA定義レコード2107の監視間隔2105を取得する(ステップD101)。
次に、SLA許容範囲算出部1031は、対応するSLA定義レコード2107から、監視期間2106を取得する(ステップD102)。
次に、SLA許容範囲算出部1031は、取得した監視期間2106と監視間隔2105とに基づいて、監視期間2106の期間内の全監視数を算出する(ステップD103)。例えば、監視期間2106が1日、監視間隔2105が1分ならば、SLA許容範囲算出部1031は、全監視数Callを「1440」((24×60)分÷1分)と算出する。
次に、SLA許容範囲算出部1031は、対応するSLA定義レコード2107からSLA違反条件2103を取得する(ステップD104)。
次に、SLA許容範囲算出部1031は、取得したSLA違反条件2103と、算出した全監視数Callとに基づいて、SLA許容範囲を算出し、出力する(ステップD105)。
例えば、監視基準値2102が98%である場合、2%までは基準値違反が許容される。したがって、例えば全監視数Callが「1440」回である場合、SLA許容範囲算出部1031は、SLA許容範囲を「28.8」(1440×0.02)回と算出する。また、SLA許容範囲として時間を用いる場合、全監視数Callが「1」日、すなわち、「1440」分である場合、「28.8」分がSLA許容範囲となる。
以上が、SLA許容範囲算出部1031の動作についての説明である。
次に、図9を参照して、図6のステップB105に対応する、SLA遵守率算出部1032の動作について詳細に説明する。図9は、SLA遵守率算出部1032の動作を示すフローチャートである。
まず、SLA遵守率算出部1032は、ログ記憶部1022に記録された、図3に示すような監視ログ2200における基準値違反の有無2204に基づいて、基準値違反量(基準値違反の回数あるいは時間)を算出する(ステップE101)。
次に、SLA遵守率算出部1032は、SLA許容範囲算出部1031が出力したSLA許容範囲を取得する。(ステップE102)
次に、SLA遵守率算出部1032は、算出した基準値違反量と、取得したSLA許容範囲とに基づき、SLA遵守率を算出し、出力する(ステップE103)。SLA遵守率は、SLA許容範囲に対する基準値違反量の比率として算出される。
例えば、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が10回であり、基準値違反のSLA許容範囲が「28.8≒29回」であるとする。この場合、SLA遵守率算出部1032は、SLA遵守率を「66%((29−10)/29*100)」と算出する。
また、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が2回であり、基準値違反のSLA許容範囲が「28.8≒29分」であるとする。
ここで、上述したとおり、監視部1011は、SLA定義2100に定義された監視間隔2105に基づき、対応するサービスレベル項目2101に対応する監視動作を実行する。そして、基準値違反が発生した場合、監視部1011は、その違反が監視間隔2105の時間間隔の間(例えば1分間)継続したものと見なす。したがって、基準値違反の発生時間は、基準値違反の発生回数と、監視間隔2105の積として求めることができる。例えば、基準値違反の発生回数が2回、監視間隔2105が「5分」の場合、基準値違反の時間は10分である。
この場合、SLA遵守率算出部1032は、SLA遵守率を「66%((29−10)/29*100)」と算出する。
また、基準値違反の回数がSLA許容範囲を超過した場合、SLA遵守率算出部1032は、以下のようにSLA遵守率を算出する。例えば、監視期間開始時点からSLA遵守率を算出する時点までの、基準値違反の回数が35回であり、基準値違反のSLA許容範囲が「28.8≒29回」であるとする。
この場合、SLA遵守率算出部1032は、SLA遵守率を「−17%((29−35)/29*100」と算出する。即ち、SLA遵守率算出部1032は、基準値違反の回数がSLA許容範囲を超過した場合、SLA遵守率を負の値として算出し、SLA違反の程度を絶対値の大きさとして算出する。
また、SLA許容範囲が時間で示され、基準値違反の時間がSLA許容範囲を超過した場合についても同様である。
以上が、SLA遵守率算出部1032の動作についての説明である。
尚、本実施形態では、図6のフローチャートで示すように監視部1011による監視の実行と、SLA許容範囲算出部1031によるSLA許容範囲の算出と、SLA遵守率算出部1032によるSLA遵守率の算出とが、同期して一連の動作として動作する。これは、一例であり、例えば、以下のようにしてもよい。
SLA許容範囲算出部1031は、品質評価装置1000のSLA定義2100の内容が更新された時に、SLA許容範囲を算出し、記憶手段(不図示、例えばSLA定義の構造にSLA許容範囲の項目を追加するようにしてもよい)に記録する。監視部1011及びSLA遵守率算出部1032それぞれは、SLA定義2100に基づいて必要なタイミングで割り込みが通知されるようにタイマー(不図示)を設定し、通知された割り込みを契機として動作する。
また、SLA遵守率表示手段(不図示)は、SLA遵守率算出部1032から取得したSLA遵守率を、時系列的にディスプレイ(不図示)に表示するようにしてもよい。これにより、SLA違反に至るまでのサービスレベル項目2101の状態変化を詳細に監視することが可能である。
また、SLA遵守率表示手段(不図示)は、SLA遵守率算出部1032から取得したSLA遵守率が0%となった場合に、暫定的にSLA違反が発生したと見なして警告を表示するようにしてもよい。こうすることで、監視期間2106の途中であっても監視期間終了時に高い確率でSLA違反と判定される可能性を早期に検出し、警告を行うことが可能となる。
また、本実施形態では、監視部1011が、監視動作を実行した結果に基づいて生成した、監視結果2203を含む監視ログレコード2206を出力する。これは、本実施形態の一例であり、例えば、以下のようにしてもよい。
まず、監視部1011は、監視動作を実行した結果を、SLA許容範囲算出部1031及びSLA遵守率算出部1032の内の少なくともいずれか一方へ、直接出力する。
次に、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、受け取った監視動作を実行した結果に基づき、監視結果2203を生成する。次に、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、生成した監視結果2203と、監視基準値2102とに基づき、基準値違反の有無を判定する。次に、SLA遵守率算出部1032は、判定した基準値違反の有無に基づき、基準値違反の値を算出する。
このように算出した監視結果2203及び基準値違反の値に基づき、SLA許容範囲算出部1031及びSLA遵守率算出部1032は、図8及び図9のフローチャートに示す動作と、実質的に同様の動作を行う。
本実施形態の第1の効果は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、SLA許容範囲算出部1031は、監視期間2106で示される期間内の全監視数を算出し、この全監視数とSLA違反条件2103とに基づいてSLA許容範囲を算出する。次に、SLA遵守率算出部1032は、SLA許容範囲と監視期間開始時点から特定の時点までの基準値違反量とに基づいて、SLA遵守率を算出する。
本実施形態の第2の効果は、SLA違反に至るまでのサービスレベル項目2101の状態変化を詳細に監視することが可能になることである。
その理由は、監視部1011が監視を実行するたびに、即ち、監視対象システムの可用性、信頼性などの稼働情報及び性能情報を取得するたびに、SLA遵守率算出部1032がSLA遵守率を算出し、出力するようにしたからである。
本実施形態の第3の効果は、SLA遵守率が0%となった場合に暫定的にSLA違反が発生したと見なし、監視期間2106の途中であっても監視期間終了時に高い確率でSLA違反と判定される事例を素早く検出し、警告を行うことが可能となることである。
その理由は、SLA違反が発生していない場合(SLA遵守率0%の場合)でも、SLA遵守率算出部1032がSLA遵守率を算出し、出力するようにしたからである。
本実施形態の第4の効果は、許容範囲が変化する場合、例えば、電力消費制限で、時間帯によって違反基準を変えるような場合でも、継続してSLA遵守状況を示すことができる。
その理由は、監視部1011による監視の実行と、SLA許容範囲算出部1031によるSLA許容範囲の算出と、SLA遵守率算出部1032によるSLA遵守率の算出とが、同期して一連の動作として動作するようにしたからである。
[第2の実施形態]
次に、本発明の第2の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図10は、本発明の第2の実施形態に係る品質評価装置3000の構成を示すブロック図である。
図10に示すように、第2の実施形態に係る品質評価装置3000は、SLA許容範囲算出部1031と、SLA遵守率算出部1032とを含む。
SLA許容範囲算出部1031は、対応する監視間隔2105及び監視期間2106に基づいて、全監視数を算出する。続けて、SLA許容範囲算出部1031は、算出した全監視数と、対応するSLA違反条件2103とに基づいて、監視データの基準値である監視基準値2102を満たさない監視データの量の、許容可能な範囲を示すSLA許容範囲を算出し、出力する。
SLA遵守率算出部1032は、監視データの記録とSLA許容範囲算出部1031が出力するSLA許容範囲とに基づいて、監視期間2106の期間途中における任意の時点の、SLA違反条件2103に対する遵守率を示すSLA遵守率を算出し、出力する。具体的には、SLA遵守率は、SLA許容範囲に対する、監視基準値2102を満たさない監視データの量の、比である。尚、SLA遵守率算出部1032は、例えば、SLA遵守率を算出しようとする期間の、監視データの記録に基づいて、監視基準値2102を満たさない監視データの量を算出する。また、SLA遵守率を算出しようとする期間は、例えば、監視開始時点の時刻から現在時刻までの期間である。
本実施形態の効果は、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、SLA許容範囲算出部1031は、監視期間2106で示される期間内の全監視数を算出し、この全監視数とSLA違反条件2103とに基づいてSLA許容範囲を算出する。次に、SLA遵守率算出部1032は、監視データの記録とSLA許容範囲とに基づいてSLA遵守率を算出する。
[第3の実施形態]
次に、本発明の第3の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図11は、本発明の第3の実施形態に係る品質評価装置4000の構成を示すブロック図である。
図11に示すように、第3の実施形態に係る品質評価装置4000は、第2の実施形態の品質評価装置3000と比べて全監視数推定部4011を更に含む。
図12は、SLA定義2400の例を示す図である。SLA定義2400は、監視間隔2105が「不定期」を示す、SLA定義レコード2401を少なくとも1つ含む。尚、SLA定義2400は、図4のSLA定義2100と同様のSLA定義レコード2107を含んでよい。
全監視数推定部4011は、図12に示すSLA定義レコード2401の監視間隔2105に示されるような、監視間隔2105が不定期であるサービスレベル項目2101について、全監視数を算出し、出力する。具体的には、全監視数推定部4011は、例えば図13に示す監視ログ集計4300のトランザクション数4305に基づき、図2に示す監視期間2106における全監視数を算出し、出力する。
図13は、監視ログ集計記録(動作履歴とも呼ばれる)4300の例を示す図である。図13を参照すると、監視ログ集計記録4300は、監視期間2302、報告日時2303、SLA維持状況2306及びトランザクション数4305を少なくとも含む、監視ログ集計レコード4307により構成される。
トランザクション数4305は、対応する監視期間2302で示される期間に、監視対象システムに対して発生した、トランザクションの合計数を示す。
尚、監視期間2302、報告日時2303及びSLA維持状況2306は、図4に示すものと同様である。
次に、図14を参照して本実施形態の動作について説明する。図14は、本実施形態の全監視数推定部4011の動作を示すフローチャートである。
全監視数推定部4011は、SLA定義2400の各SLA定義レコード2401に含まれる監視間隔2105を取得する(ステップF101)。
次に、全監視数推定部4011は、監視間隔2105が不定期を示しているか否かを判定する
(ステップF102)。不定期を示していない場合(ステップF102でNO)、処理は、図8のD102へ進む。
不定期を示している場合(ステップF102でYES)、全監視数推定部4011は、図13に示す、過去の監視期間2302毎の全監視数を取得する(ステップF103)。例えば、全監視数推定部4011は、過去の監視期間2302毎の全監視数として、ログ記憶部1022に記録されている図13に示すような監視ログ集計記録4300から、トランザクション数4305を取得する。
尚、ステップF103において全監視数推定部4011が取得する、過去の監視期間2302毎の全監視数は、例えば、図12に示すSLA定義レコード2401のSLA違反条件2103及び監視間隔2105のいずれかにおいて定義される。本実施形態においては、図12に示すSLA監視レコード2401の監視間隔2105が「トランザクション毎(不定期)」であることに基づいて、全監視数推定部4011は、過去の監視期間2302毎の全監視数として、トランザクション数4305を取得する。
具体的には、全監視数推定部4011は、監視間隔2105が例えば「トランザクション毎(不定期)」である場合、図13に示す監視ログ集計記録4300を参照して、トランザクション数4305を取得する。この場合、トランザクション数4305は、過去の監視期間2302における監視回数を示す。
尚、全監視数推定部4011は、監視部1011から出力される図3に示す監視ログ(動作履歴とも呼ばれる)2200に基づき、過去の監視期間2302における監視回数を直接算出してもよい。この場合、監視部1011は、監視対象システムにおけるトランザクションの処理件数を含む監視ログレコード2206を、全監視数推定部4011に出力する。
また、品質評価装置4000は、次のように過去の監視期間2302における監視回数を算出してもよい。まず、監視部1011が、監視対象システムにおけるトランザクション数を含む、監視ログレコード(動作履歴とも呼ばれる)2206を監視ログ2200に出力する。次に、全監視数推定部4011が、監視ログ2200に記録された、監視項目2202が「トランザクション数」である監視ログレコード2206に基づき、一定期間(過去の監視期間2302)の全トランザクション数を直接算出してもよい。
再び図14において、全監視数推定部4011は、取得した過去の監視期間2302毎の全監視数(トランザクション数4305)に基づいて、対象期間の全監視数の推定値を算出する(ステップF104)。ここで、その対象期間は、SLA遵守率算出の対象時刻を含む、図12に示す監視期間2106の監視期間開始時点から監視期間終了時点までの期間である。
具体的には、全監視数推定部4011は、例えば、以下のようにして全監視数の推定値を算出する。
まず、全監視数推定部4011は、過去の複数の監視期間2302における全監視数のデータC={C1,C2,・・・,Ck}が正規分布であると仮定し、信頼区間を設定する。ここで、C1、C2、及びCkは、過去の監視期間2302毎の全監視数を示す。kは、過去の監視期間2302の全監視数の個数である。
信頼区間は、全監視数の推定値をCallとし、t分布を用いて、全監視数Callの範囲として表すと、式1に示すとおりである。
Figure 2013015292
ここで、Caveは、過去の複数の監視期間2302における全監視数のデータCの平均値であり、式2に示すとおりである。
Figure 2013015292
また、「σの2乗」は、過去の複数の監視期間2302における全監視数のデータCの分散であり、式3に示すとおりである。
Figure 2013015292
また、tは、平均が0、標準偏差が1のt分布から得られる値である。tは、設定する信頼区間により値が異なる。例えば、95%信頼区間の場合、t=2.262であり、99%信頼区間の場合t=3.250である。尚、95%信頼区間とは、サンプルから推定される母集団のうち95%が含まれる区間のことである。また、99%信頼区間の方は、95%信頼区間に比べて、より精度(信頼度)が高い。尚、t分布の値は、例えば、表として全監視数推定部4011内の記憶手段(不図示)に記録されている。
例えば、平均値Cave=1400、分散「σの2乗」=19544、サンプル数k=10の過去の分布があった場合、95%信頼区間を用いると、t=2.262より、Callの上限値及び下限値は、式4に示すとおりとなる。
Figure 2013015292
したがって、1300<Call<1500である。
以上のように、全監視数推定部4011は、全監視数Callの範囲を算出する。
次に、上述の説明のように、全監視数推定部4011が全監視数Callの範囲を算出した場合の、SLA許容範囲算出部1031が算出する許容範囲CP及びSLA遵守率算出部1032が算出するSLA遵守率αの例を、具体的に説明する。
例えば、図12のSLA定義レコード2401の場合、SLA違反条件2103は、「基準値を守れない場合の率が2%以上」である。この場合、基準値違反の量は、2%未満まで許容される。したがって、1300≦Call≦1500の場合では、1300×0.02=26、1500×0.02=30より、基準値違反回数の許容範囲CPは、24<CP<30となる。これは基準値違反を時間で記述した場合においても同様である。
このとき、監視期間開始時点から計算時点までの基準値違反の回数が、10回であったとすると、基準値違反の許容範囲24<CP<30より、SLA遵守率算出部1032は、SLA遵守率αを以下のように算出する。
(25−10)÷25×100=60%、(29−10)÷29×100=66%であり、したがって、61%≦α≦66%。
尚、これは、基準値違反の値を時間で表す場合においても同様である。
本実施形態の全監視数推定部4011は、第1の実施形態に適用してもよい。
本実施形態の第1の効果は、監視数が確定していないサービスレベル項目2101についても、サービス提供中の特定の時点におけるSLA遵守状況を示すことを可能とすることができる点である。
その理由は、全監視数推定部4011が監視期間2106中の全監視数が確定していないサービスレベル項目2101に対し、監視ログ集計記録4300に基づき全監視数の推定値(全監視数の範囲)を算出するようにしたからである。
本実施形態の第2の効果は、監視ログ集計記録4300の監視ログ集計レコード4307の数が比較的少ない場合(10以下)であっても、信頼度の高い、第1の効果のSLA遵守状況を示すことを可能とすることができる点である。
その理由は、以下の要素を含むように構成したからである。まず、全監視数推定部4011が、t分布を用いた信頼区間を設定し、この信頼区間に対応する全監視数の推定値を算出する。次に、SLA許容範囲算出部1031が、その全監視数の推定値に基づいて、許容範囲を算出する。次に、SLA遵守率算出部1032が、その許容範囲に基づいてSLA遵守率を算出する。
[第4の実施形態]
次に、本発明の第4の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図15は、本発明の第4の実施形態に係る品質評価装置5000の構成を示すブロック図である。
図15に示すように、第4の実施形態に係る品質評価装置5000は、第2の実施形態の品質評価装置3000に比べて、SLA違反予測部5011を更に含む。
SLA違反予測部5011は、SLA遵守率算出部1032より出力されるSLA遵守率に基づき、SLA違反の発生が予測される時刻を算出し、出力する。また、SLA違反予測部5011は、予測される時刻が現在の監視期間が終了する前の時刻内であった場合に、SLA違反が発生する危険があることを示す情報を出力する。
監視開始からの経過時刻t、SLA違反の予測発生時刻Te、SLA遵守率αとすると、SLA違反予測部5011は、Te=100×t÷(100−α)を算出する。続けて、SLA違反予測部5011は、算出した予測発生時刻Teを出力する。
例えば、監視開始から1時間経過した時点での遵守率αが95%である場合、SLA違反予測部5011は、Te=100×1÷(100−95)=20を算出する。即ち、この場合のSLA違反の予想発生時刻は、監視開始から20時間後である。
更に、例えば、あるSLA定義レコード2107の監視期間2106が24時間であった場合、監視期間2106内にSLA違反が発生する可能性があるため、その危険があることを示す情報(警告)を出力する。ここで、「監視期間2106内にSLA違反が発生する」とは、「SLA違反の発生する時刻が、現在の監視期間2106が終了する前の時刻内である、監視開始から21時間後である」ことを示す。
SLA違反予測部5011は、例えば、SLA違反表示部(不図示)を経由して、SLA違反の予想発生時刻、あるいは予想発生時刻と警告とを、ディスプレイ(不図示)に出力する。また、SLA違反予測部5011は、例えば、通信手段(不図示)及びネットワーク(不図示)を経由して、端末装置(不図示)に、SLA違反の予想発生時刻、あるいは予想発生時刻と警告とを送信するようにしてもよい。
次に、図16を参照して、SLA違反予測部5011の動作を説明する。図16は、SLA違反予測部5011の動作を示すフローチャートである。
SLA違反予測部5011は、SLA遵守率算出部1032からSLA遵守率を取得する(ステップI101)。
次に、SLA違反予測部5011は、取得したSLA遵守率に基づいて、SLA違反予想発生時刻を算出する(ステップI102)。SLA違反予測部5011は、例えば、以下の式を用いて、SLA違反の予想発生時刻Teを算出する。Te=100×t÷(100−α)。ここで、tは監視時点の時刻、αはSLA遵守率である。
更に、SLA違反予測部5011は、算出したSLA違反の予想発生時刻Teが現在の監視期間2106内に含まれるか否かの判定を行う(ステップI103)。現在の監視期間2106内に含まれない場合(ステップI103でNO)、処理はステップI105へ進む。
現在の監視期間2106内に含まれる場合(ステップI103でYES)、SLA違反予測部5011は、図示しない出力手段へSLA違反が発生する危険があることを示す警告を出力する(ステップI104)。
ステップI105において、SLA違反予測部5011は、算出したSLA違反の予想発生時刻を図示しない出力手段へ出力する(ステップI105)。
以上が、SLA違反予測部5011の動作についての説明である。
尚、本実施形態のSLA違反予測部5011は、第1の実施形態及び第3の実施形態に適用してもよい。
本実施形態の効果は、SLA違反の予想発生時刻を出力することが可能になる点である。
その理由は、SLA違反予測部5011が、SLA遵守率に基づき、SLA違反予想発生時刻を算出するようにしたからである。
[第5の実施形態]
次に、本発明の第5の実施形態について図面を参照して詳細に説明する。以下、本実施形態の説明が不明確にならない範囲で、前述の説明と重複する内容については説明を省略する。
図17は、本発明の第5の実施形態に係る品質評価装置6000の構成を示すブロック図である。
図17に示すように、第5の実施形態に係る品質評価装置6000は、第2の実施形態の品質評価装置3000と比べて、SLA遵守率集約部6011を更に含む。
SLA遵守率集約部6011は、SLA遵守率算出部1032より出力される各サービスレベル項目2101のSLA遵守率に基づき、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を出力する。
SLA遵守率集約部6011は、例えば、監視対象システムがサーバA、サーバB、サーバCを含む場合、監視対象システムの全体的なSLA遵守状況を以下のように算出する。
例えば、サーバA、サーバB、サーバCそれぞれのサービスレベル項目2101が「応答時間」のSLA遵守率として、70%、30%、50%という値がそれぞれ出力されたとする。この場合、SLA遵守率集約部6011は、最大値を70%、最小値を30%、平均値を50%((70+30+50)÷3)と、算出する。
即ち、全体的なSLA遵守状況として平均値を出力することを予め定められている場合、SLA遵守率集約部6011は、全体的なSLA遵守状況は50%となる。また、最小値を出力することを予め定められている場合は、全体的なSLA遵守状況は30%となる。更に、SLA遵守率が最小値をとる項目をSLA維持におけるボトルネックとなっている項目とする。
また、SLA遵守率集約部6011は、ボトルネックとなっているサービスレベル項目2101の情報として、サーバAの応答時間のSLA遵守率が30%であり、サーバAの応答時間がボトルネックであることを出力する。
SLA遵守率集約部6011は、SLA違反表示部(不図示)を経由して、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を、ディスプレイ(不図示)に表示する。また、SLA遵守率集約部6011は、例えば、通信手段(不図示)及びネットワーク(不図示)を経由して、端末装置(不図示)に、監視対象システムの全体的なSLA遵守状況、及びボトルネックとなっているサービスレベル項目2101の情報を送信するようにしてもよい。
次に、SLA遵守率集約部6011の動作について説明する。図18は、SLA遵守率集約部6011の動作を示すフローチャートである。
まず、SLA遵守率集約部6011は、SLA遵守率算出部1032より出力される複数のSLA遵守率を取得する(ステップK101)。
次に、SLA遵守率集約部6011は、取得した複数のSLA遵守率を集約し、最大値、最小値及び平均値を算出し、出力する(ステップK102)。
尚、SLA遵守率の最小値は、複数のサービスレベル項目2101の内で最小値をとったサービスレベル項目2101のSLA遵守状況が、SLA違反にどの程度近づいているかを示している。また、SLA遵守率の平均値は、監視対象システムにおいて、複数のサービスレベル項目2101がどの程度遵守されているかを示す指標となる。
次に、SLA遵守率集約部6011は、平均値や最小値、最大値などの全体的なSLA遵守状況に加え、ボトルネックとなっているサービスレベル項目2101の情報を出力する(ステップK103)。ボトルネックとなっているサービスレベル項目2101は、複数のSLA遵守率の内の最小値のSLA遵守率をとるサービスレベル項目2101である。
以上が、SLA遵守率集約部6011の動作についての説明である。
本実施形態の第1の効果は、複数のサービスレベル項目2101それぞれに対するSLA遵守状況を、まとめて監視することが容易になる点である。
その理由は、SLA遵守率集約部6011が複数のSLA遵守率を集約した結果を出力するようにしたからである。
本実施形態の第2の効果は、ボトルネックとなっているサービスレベル項目2101がSLA違反となることを防止する対策をとることが可能となる点である。
その理由は、SLA遵守率集約部6011がボトルネックとなっているサービスレベル項目2101の情報を出力するようにしたからである。
本実施形態のSLA遵守率集約部6011は、第1の実施形態、第3の実施形態及び第4の実施形態に適用してもよい。
以上の各実施形態で説明した各構成要素は、例えば、図19に示すように、プログラムにより所定の処理をコンピュータに実行させてもよい。
図19は、プログラムにより所定の処理をコンピュータに実行させる品質評価装置7000の構成を示すブロック図である。図19を参照すると、品質評価装置7000は、CPU(Central Processing Unit)7100、ディスク装置7200、記憶部7300、通信部7500、入力部7600及び出力部7700を含む。
CPU7100は、ディスク装置7200に格納されたプログラムを、例えば記憶部7300に展開し、展開したプログラムに基づいて所定の処理を実行する。
ディスク装置7200は、例えば、光ディスク、フレキシブルディスク、磁気光ディスク、外付けハードディスク及び半導体メモリであって、不揮発性の記憶媒体を含む。ディスク装置7200は、上述の各実施形態における通信制御装置の処理の一部をコンピュータに実行させるプログラムを記憶する。また、ディスク装置7200は、SLA定義記憶部1021及びログ記憶部1022として、SLA定義、監視ログ、監視ログ集計記録を記憶してもよい。
記憶部7300は、そのプログラム及び上述の各実施形態において生成、参照されるデータを記憶する。
CPU7100、ディスク装置7200及び記憶部7300は、SLA許容範囲算出部1031、SLA遵守率算出部1032、全監視数推定部4011、SLA違反予測部5011及びSLA遵守率集約部6011に対応する。
通信部7500は、例えばネットワークとのインタフェースを実現する。通信部7500は、SLA許容範囲算出部1031及びSLA遵守率算出部1032の一部として含まれてよい。
入力部7600は、例えばマウスやキーボード、内蔵のキーボタンなどで実現され、入力操作に用いられる。入力部3073は、マウスやキーボード、内蔵のキーボタンに限らず、例えばタッチパネル、加速度計、ジャイロセンサ、カメラなどでもよい。
出力部7700は、例えばディスプレイで実現され、出力を確認するために用いられる。
図20は、プログラムを記録した不揮発性記憶媒体の例を示すブロック図である。記録媒体7400は、情報を非一時的に記憶する不揮発性記録媒体であってよい。
品質評価装置7000は、外部から供給される記録媒体7400を含むようにしてもよい。CPU7100は、記録媒体7400に格納されたプログラムのコードを読み出して実行するようにしてもよい。あるいは、CPU7100は、記録媒体7400に格納されたプログラムのコードを、記憶部7300、ディスク装置7200またはその両方に格納するようにしてもよい。すなわち、本実施形態は、品質評価装置7000(CPU7100)が実行するプログラム(ソフトウェア)を、一時的にまたは非一時的に、記憶する記録媒体7400の実施形態を含む。
以上、各実施形態及び実施例を参照して本発明を説明したが、本発明は上記実施形態及び実施例に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しえるさまざまな変更をすることができる。
以上の各実施形態で説明した各構成要素は、必ずしも個々に独立した存在である必要はない。例えば、各構成要素は、複数の構成要素が1個のモジュールとして実現されたり、1つの構成要素が複数のモジュールで実現されたりしてもよい。また、各構成要素は、ある構成要素が他の構成要素の一部であったり、ある構成要素の一部と他の構成要素の一部とが重複していたり、といったような構成であってもよい。
以上説明した各実施形態における各構成要素及び各構成要素を実現するモジュールは、必要に応じ可能であれば、ハードウェア的に実現されても良いし、コンピュータ及びプログラムで実現されても良いし、ハードウェア的なモジュールとコンピュータ及びプログラムとの混在により実現されても良い。プログラムは、磁気ディスクや半導体メモリなど、不揮発性のコンピュータ可読記録媒体に記録されて提供され、コンピュータの立ち上げ時などにコンピュータに読み取られる。この読み取られたプログラムは、そのコンピュータの動作を制御することにより、そのコンピュータを前述した各実施形態における構成要素として機能させる。
また、以上説明した各実施形態では、複数の動作をフローチャートの形式で順番に記載してあるが、その記載の順番は複数の動作を実行する順番を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の順番は内容的に支障しない範囲で変更することができる。
更に、以上説明した各実施形態では、複数の動作は個々に相違するタイミングで実行されることに限定されない。例えば、ある動作の実行中に他の動作が発生したり、ある動作と他の動作との実行タイミングが部分的に乃至全部において重複していたりしていてもよい。
更に、以上説明した各実施形態では、ある動作が他の動作の契機になるように記載しているが、その記載はある動作と他の動作の全ての関係を限定するものではない。このため、各実施形態を実施するときには、その複数の動作の関係は内容的に支障のない範囲で変更することができる。また各構成要素の各動作の具体的な記載は、各構成要素の各動作を限定するものではない。このため、各構成要素の具体的な各動作は、各実施形態を実施する上で機能的、性能的、その他の特性に対して支障をきたさない範囲内で変更されて良い。
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2011年7月25日に出願された日本出願特願2011−162312を基礎とする優先権を主張し、その開示の全てをここに取り込む。
本発明によれば、運用管理におけるサービスレベル違反の発生監視、予測といった用途に適用できる。
1000 品質評価装置
1011 監視部
1021 SLA定義記憶部
1022 ログ記憶部
1031 SLA許容範囲算出部
1032 SLA遵守率算出部
2100 SLA定義
2101 サービスレベル項目
2102 監視基準値
2103 SLA違反条件
2104 監視方法
2105 監視間隔
2106 監視期間
2107 SLA定義レコード
2200 監視ログ
2201 監視日時
2202 監視項目
2203 監視結果
2204 基準値違反の有無
2206 監視ログレコード
2300 監視ログ集計記録
2302 監視期間
2303 報告日時
2306 SLA維持状況
2307 監視ログ集計レコード
2400 SLA定義
2401 SLA定義レコード
3000 品質評価装置
4000 品質評価装置
4011 全監視数推定部
5000 品質評価装置
5011 SLA違反予測部
6000 品質評価装置
6011 SLA遵守率集約部

Claims (10)

  1. 監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する許容範囲算出手段と、
    前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する遵守率算出手段と、を含む
    品質評価装置。
  2. 前記監視対象の動作履歴に基づいて、前記監視期間における全監視回数の推定値を算出し、出力する全監視数推定手段を更に含む、
    ことを特徴とする請求項1記載の品質評価装置。
  3. 前記全監視数推定手段は、前記動作履歴に含まれる複数の監視期間の監視数に基づいて、ティー分布(t分布)に基づいた特定の信頼区間に対応する、前記全監視数の範囲を算出し、算出した前記全監視数の範囲を前記全監視回数の推定値として出力する
    ことを特徴とする請求項2記載の品質評価装置。
  4. 前記遵守率に基づき、前記違反動作の発生が予測される時刻を算出し、出力する違反予測手段を更に含む
    ことを特徴とする請求項1乃至3のいずれかに記載の品質評価装置
  5. 複数の前記遵守率を集約した情報を生成し、出力する遵守率集約手段を更に含む
    ことを特徴とする請求項1乃至4のいずれかに記載の品質評価装置。
  6. コンピュータが、
    監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力し、
    前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する
    品質評価方法。
  7. コンピュータが、
    前記監視対象の動作履歴に基づいて、前記監視期間における全監視回数の推定値を算出し、出力する
    ことを特徴とする請求項6記載の品質評価方法。
  8. 前記全監視回数の推定値の算出は、前記動作履歴に含まれる複数の監視期間の監視数に基づいて、ティー分布(t分布)に基づいた特定の信頼区間に対応する、前記全監視数の範囲を算出し、算出した前記全監視数の範囲を前記全監視回数の推定値として出力する
    ことを特徴とする請求項7記載の品質評価方法。
  9. コンピュータが、
    前記遵守率に基づき、前記違反動作の発生が予測される時刻を算出し、出力する
    ことを特徴とする請求項6乃至8のいずれかに記載の品質評価方法
  10. コンピュータに、
    監視対象の違反動作の条件を規定する違反条件と、前記違反条件に対応する監視データの取得間隔及び前記違反条件に対応する監視期間に基づいて算出した全監視数と、に基づいて、前記監視データの基準値である監視基準値を満たさない監視データの量の、許容可能な範囲を示す許容範囲を算出し、出力する処理と、
    前記監視データと前記許容範囲とに基づいて、前記監視期間途中における任意の時点の、前記違反条件に対する遵守率を算出し、出力する処理とを実行させる
    プログラムを記録した不揮発性記録媒体。
JP2013525732A 2011-07-25 2012-07-18 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体 Pending JPWO2013015292A1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013525732A JPWO2013015292A1 (ja) 2011-07-25 2012-07-18 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011162312 2011-07-25
JP2011162312 2011-07-25
JP2013525732A JPWO2013015292A1 (ja) 2011-07-25 2012-07-18 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPWO2013015292A1 true JPWO2013015292A1 (ja) 2015-02-23

Family

ID=47601133

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013525732A Pending JPWO2013015292A1 (ja) 2011-07-25 2012-07-18 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体

Country Status (2)

Country Link
JP (1) JPWO2013015292A1 (ja)
WO (1) WO2013015292A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5571230B1 (ja) * 2013-06-07 2014-08-13 日本電信電話株式会社 評価システムおよび評価方法
WO2023171382A1 (ja) * 2022-03-07 2023-09-14 ソニーグループ株式会社 情報処理システム、情報処理装置及びデータ生成方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4720295B2 (ja) * 2005-06-02 2011-07-13 日本電気株式会社 異常検出システムおよび保全システム
JP5155699B2 (ja) * 2008-03-07 2013-03-06 新日鉄住金ソリューションズ株式会社 情報処理装置、情報処理方法及びプログラム
GB2473970A (en) * 2008-05-27 2011-03-30 Fujitsu Ltd system operation management support system, method and apparatus
US20130073912A1 (en) * 2010-01-07 2013-03-21 Nec Corporation Information processing device, service management method, and service management program

Also Published As

Publication number Publication date
WO2013015292A1 (ja) 2013-01-31

Similar Documents

Publication Publication Date Title
US12013680B2 (en) Adaptive distributed analytics system
US9893963B2 (en) Dynamic baseline determination for distributed transaction
US11533238B2 (en) Capacity management of computing resources based on time series analysis
US10558545B2 (en) Multiple modeling paradigm for predictive analytics
US9491247B2 (en) Automatic capture of detailed analysis information based on remote server analysis
US10230611B2 (en) Dynamic baseline determination for distributed business transaction
CN107704387B (zh) 用于系统预警的方法、装置、电子设备及计算机可读介质
Neukirchner et al. Monitoring arbitrary activation patterns in real-time systems
US20160110653A1 (en) Method and apparatus for predicting a service call for digital printing equipment from a customer
US20140281741A1 (en) Method, user interface and apparatus for cloud service confidence level generation and display
WO2013015292A1 (ja) 品質評価装置、品質評価方法及びそのためのプログラムを記録した記録媒体
US20160050101A1 (en) Real-Time Network Monitoring and Alerting
GB2514833A (en) Portable computer monitoring
JP6018024B2 (ja) 変化検知装置、変化検知システム、変化検知方法及びプログラム
CN110245120A (zh) 流式计算系统及流式计算系统的日志数据处理方法
CN113329128B (zh) 话务数据预测方法及装置、电子设备、存储介质
JP2020035297A (ja) 機器状態監視装置及びプログラム
JP2019219743A (ja) 負荷テストシステム
JP2013003896A (ja) 情報提供装置、情報提供方法およびプログラム
US11526381B2 (en) System and method for infrastructure resource optimization
CN108255669A (zh) 监视计算机基础设施中执行的应用的批处理的方法和系统
US20210026755A1 (en) Method for analyzing the resource consumption of a computing infrastructure, alert and sizing
CN114756433A (zh) 一种数据处理方法、装置、设备以及存储介质
JP2019219744A (ja) 負荷テストシステム
TWM596408U (zh) 資料庫資源預警系統