JP2015215672A - 分析装置およびコンピュータプログラム - Google Patents

分析装置およびコンピュータプログラム Download PDF

Info

Publication number
JP2015215672A
JP2015215672A JP2014096770A JP2014096770A JP2015215672A JP 2015215672 A JP2015215672 A JP 2015215672A JP 2014096770 A JP2014096770 A JP 2014096770A JP 2014096770 A JP2014096770 A JP 2014096770A JP 2015215672 A JP2015215672 A JP 2015215672A
Authority
JP
Japan
Prior art keywords
information
operator
unit
evaluation
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014096770A
Other languages
English (en)
Other versions
JP6436644B2 (ja
Inventor
誠明 木村
Masaaki Kimura
誠明 木村
山田 誠
Makoto Yamada
誠 山田
真 青木
Makoto Aoki
真 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nomura Research Institute Ltd
Original Assignee
Nomura Research Institute Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nomura Research Institute Ltd filed Critical Nomura Research Institute Ltd
Priority to JP2014096770A priority Critical patent/JP6436644B2/ja
Publication of JP2015215672A publication Critical patent/JP2015215672A/ja
Application granted granted Critical
Publication of JP6436644B2 publication Critical patent/JP6436644B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Computer And Data Communications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】情報システムの運用実績を可視化した有用な情報を得ることを支援する。
【解決手段】分析装置20は、監視対象システム10の動作状態を監視する運用監視装置12に保持された監視対象システム10に関する情報を取得する。分析装置20は、監視対象システム10で発生したエラーであり、運用監視装置12が検出したエラーに対応すべきオペレータを支援するサービスデスク装置14に保持されたオペレータに関する情報を取得する。分析装置20は、運用監視装置12から取得した情報にもとづいて特定される監視対象システム10の運用規模と、サービスデスク装置14から取得した情報にもとづいて特定されるオペレータの人数にしたがって、監視対象システム10の運用効率を示す情報を生成する。
【選択図】図1

Description

本発明はデータ処理技術に関し、特に情報システムの運用状況を分析する技術に関する。
情報システムの運用管理をアウトソーシングすることが普及しており、情報システムの利用者と運用者との間でサービスレベルアグリーメント(以下「SLA」と呼ぶ。)が定められることがある(例えば特許文献1参照)。
国際公開第2012/144204号
近年、情報システムの運用コストに対する圧縮要請が強まってきており、運用コストの説明能力向上も求められている。本発明の主な目的は、情報システムの運用実績を可視化した有用な情報を得るための技術を提供することにある。
上記課題を解決するために、本発明のある態様の分析装置は、所定のシステムの動作状態を監視する運用監視装置に保持されたシステムに関する情報を取得する第1取得部と、システムで発生し、運用監視装置が検出したエラーに対応すべきオペレータを支援するサービスデスク装置に保持されたオペレータに関する情報を取得する第2取得部と、第1取得部により取得された情報にもとづいて特定されるシステムの運用規模と、第2取得部により取得された情報にもとづいて特定されるオペレータの人数にしたがって、システムの運用効率を示す情報を生成する評価部と、を備える。
なお、以上の構成要素の任意の組合せ、本発明の表現を、方法、システム、プログラム、プログラムを格納した記録媒体などの間で変換したものもまた、本発明の態様として有効である。
本発明によれば、情報システムの運用実績を可視化した有用な情報を得ることを支援できる。
情報システムの運用に関わる装置群を示す図である。 図1の分析装置の機能構成を示すブロック図である。 図3(a)はシステム定義情報を示す図であり、図3(b)はエラーメッセージログを示す図である。 図4(a)はオペレータ基本情報を示す図であり、図4(b)は作業実績情報を示す図であり、図4(c)は定義申請情報を示す図である。 運用効率情報の構成を示す図である。 オペレータ評価情報の構成を示す図である。 サービスレベル情報の構成を示す図である。 運用効率情報画面を示す図である。 オペレータ評価情報画面を示す図である。 サービスレベル情報画面を示す図である。 図11(a)は第1回帰分析に用いる各システムの情報を示す図であり、図11(b)は第2回帰分析に用いる各システムの情報を示す図である。 図12(a)は第1回帰分析の結果を示し、図12(b)は第2回帰分析の結果を示し、図12(c)は第3回帰分析の結果を示す図である。 予測処理における入力値と予測結果の例を示す図である。
実施の形態の分析装置の構成を説明する前に概要を説明する。
近年、情報システムの運用コストの圧縮要請は強まる傾向にあるが、運用対象となるシステムの規模はむしろ増大傾向にあり、運用コストの圧縮は容易でない状況である。このような背景を踏まえ、本発明者は、運用コストを顧客へ説明する際の説明能力の向上が必要であると認識し、(1)情報システムの運用実績の可視化と、(2)運用コスト見積の精度向上、が必要であると考えた。
(1)情報システムの運用実績の可視化について:
これまで、運用実績の集計は運用担当者による手作業でなされ、集計者の作業負荷も大きかった。また、運用に関する少数の情報しか集計できず、集計した情報が既に古い内容になっていることもあった。また、運用実務の要員(以下「オペレータ」とも呼ぶ。)の評価基準も限られており、例えば勤続年数等による評価に留まるものであった。
そこで実施の形態の分析装置は、運用監視装置からシステム定義とシステムエラーログを自動的に収集し、また、運用サービスデスク装置から運用のオペレーションログを自動的に収集する。分析装置は、これらのデータを集計して、運用規模とオペレーション実績に整形し紐付けて蓄積し、運用効率・サービスレベル・オペレータ評価のビューを提供する。これにより、情報システムの運用に関する広範囲な情報を可視化し、また情報鮮度の向上を実現し、運用部門での情報活用、また顧客への説明能力向上を支援する。
(2)運用コスト見積もりの精度向上について:
これまで、情報システムの運用コストの見積は運用担当者の経験や勘に頼る部分が大きく、その精度は必ずしも高くなかった。本発明者は、実際にシステム運用業務に携わる中で、現実の情報システムの運用におけるオペレータの業務量および運用能力と、オペレータの運用実績との間に相関があることに想到した。
実施の形態の分析装置は、現実の情報システムの運用におけるオペレータの業務量および運用能力と、オペレータの運用実績との間の回帰関係を示す回帰モデルを生成し、新規システムの運用コスト見積にその回帰モデルを適用する。これにより、新規システムの運用コスト見積に、現実のシステム運用実績を反映し、見積もりの精度向上を実現する。
なお、回帰分析の前提となるオペレータの業務量の数値化は、以下の本発明者の着想にもとづく。すなわち、オペレータ業務は、予め定められた業務フローで規定されており、誰がオペレータの場合でも同じやり方で同じ結果が返るという特徴を持つ。例えば、オペレータでなく後述するシステム担当者の場合、システムの障害に対して個人毎に異なるアプローチをとることがある。具体例として複数のサーバで作業する際に、1台ずつログインして作業する者もいれば、リモートシェルで対応する者もいる。このように各システム担当者の業務のやり方が異なるため時間を計っても無意味であり、複数のシステム担当者に亘って共通の基準で業務量を数値化することは困難である。しかしオペレータ業務は誰がオペレータでも同じ作業になるという特徴があるため、複数のオペレータに亘って共通の基準で業務量を数値化することができる。したがって、複数のオペレータが運用に携わる複数の情報システムの運用実績にもとづく回帰分析が可能になる。
図1は、情報システムの運用に関わる装置群を示す。監視対象システム10で総称される監視対象システム10a、監視対象システム10b、監視対象システム10c、監視対象システム10d、監視対象システム10eのそれぞれは、企業等の様々な業務を支援する情報処理を実行するサーバ群である。例えば、1つの監視対象システム10は、1台のサーバで実現されるものから、数百台のサーバが連携するものまで含む。
運用監視装置12で総称される運用監視装置12a、運用監視装置12bは、公知の運用監視ソフトウェアがインストールされた情報処理装置である。運用監視装置12aは、監視対象システム10a、監視対象システム10b、監視対象システム10cに対する運用監視処理を実行し、運用監視装置12bは、監視対象システム10d、監視対象システム10eに対する運用監視処理を実行する。
運用監視装置12が実行する運用監視処理は、監視対象システム10の動作状態監視、監視対象システム10に発生したエラーの検出、サービスデスク装置14へのエラー通知を含む。また、監視対象システム10に対するジョブの設定とジョブの実行制御、監視対象システム10へのコマンド送信を含む。なお実施の形態におけるエラーは、各種の障害や動作停止、動作異常、正常状態からの逸脱等を含む。運用監視装置12は、複数の監視対象システム10のそれぞれに関するシステム定義情報(後述の図3(a))、エラーメッセージログ(後述の図3(b))を保持する。
サービスデスク装置14は、公知のサービスデスクソフトウェアがインストールされた情報処理装置である。サービスデスク装置14は、運用監視装置12で検出されたエラーに対応すべきオペレータの業務を支援する。オペレータは、例えば、システム運用のアウトソーシングサービスを提供するSIerの運用部門の担当者であり、オペレータ端末16を操作する。
またサービスデスク装置14は、オペレータに関する種々の情報を保持する。例えば、オペレータの基本的な属性を示すオペレータ基本情報(後述の図4(a))、オペレータによる作業実績を示す作業実績情報(後述の図4(b))、オペレータによる運用監視装置12への種々の登録内容を示す定義申請情報(後述の図4(c))を保持する。
監視対象システム10でエラーが発生すると、監視対象システム10はエラーメッセージを運用監視装置12へ送信し、または、運用監視装置12が自律的にエラーの発生を検出する。運用監視装置12は、エラーメッセージをサービスデスク装置14へ送信する。サービスデスク装置14は、予め定められた切り分け条件にしたがって、エラー内容をオペレータ端末16へ通知し、表示させる。このとき、ナビゲーションメッセージとして、エラー内容に応じたオペレータが実施すべき作業内容や、システム担当者(エラーの解析やバグの修正を実施すべき開発者等)の連絡先もオペレータ端末16へ通知する。
オペレータは、オペレータ端末16に表示されたエラー内容に応じて、影響範囲を識別し、システム担当者へのコール(電話連絡)を行い、適宜障害復旧作業を実施する。サービスデスク装置14は、エラーメッセージを逐次記録する。また、オペレータの作業内容や、エラー対応に要した時間、エラー対応におけるミスの有無等をオペレータ端末16から取得して逐次記録する。
管理者端末18は、運用部門の管理者により操作される情報端末である。後述のオペレータ評価の一部は、管理者により入力され、管理者端末18から分析装置20へ登録される。
分析装置20は、LAN・WAN・インターネット等を含む通信網を介して運用監視装置12、サービスデスク装置14、オペレータ端末16、管理者端末18と接続される。分析装置20は、運用監視装置12およびサービスデスク装置14から取得したデータにもとづいて、(1)監視対象システム10に対する運用実績の可視化処理、(2)運用コストの見積支援処理を実行する。
図2は、図1の分析装置20の機能構成を示すブロック図である。分析装置20は、各種データ処理を実行する制御部50と、制御部50により参照または更新されるデータの記憶領域であるデータ保持部30を備える。また図2には不図示だが、分析装置20は、所定の通信プロトコルにしたがい通信網22を介して外部装置と通信する通信部と、キーボードやマウス等の入力装置を介した操作入力を検出する操作検出部と、ディスプレイ26の表示内容を制御する表示制御部を備える。図2の各機能ブロックは、通信部を介して外部装置とデータを送受し、操作検出部を介して操作者による入力情報を受け付け、表示制御部を介してディスプレイに画像を表示させる。
本明細書のブロック図で示す各ブロックは、ハードウェア的には、コンピュータのCPUやメモリをはじめとする素子や機械装置で実現でき、ソフトウェア的にはコンピュータプログラム等によって実現されるが、ここでは、それらの連携によって実現される機能ブロックを描いている。したがって、これらの機能ブロックはハードウェア、ソフトウェアの組合せによっていろいろなかたちで実現できることは、当業者には理解されるところである。
例えば、制御部50の各機能ブロックに対応するソフトウェアモジュールを備える分析アプリケーションが分析装置20のストレージへインストールされてもよい。分析装置20のCPUは、各ソフトウェアモジュールをメインメモリへ読み出して実行することにより、制御部50の各機能ブロックの機能が発揮されてもよい。また、データ保持部30の各機能ブロックは、ストレージやメモリ等の記憶装置がデータを記憶することにより実現されてもよい。
データ保持部30は、実システム情報保持部32、運用実績保持部34、運用効率情報保持部36、評価基準保持部38、オペレータ評価保持部40、SLA情報保持部41、サービスレベル保持部42、回帰モデル保持部44、新規システム情報保持部46、予測結果保持部48を含む。
実システム情報保持部32は、現在運用中の複数の監視対象システム10(「実システム」とも呼ぶ。)のそれぞれについて、各システムに関する属性情報であるシステム定義情報を保持する。また、各システムで発生したエラーを示すエラーメッセージの蓄積情報であるエラーメッセージログを保持する。図3(a)はシステム定義情報を示し、図3(b)はエラーメッセージログを示す。図3(a)の監視対象サーバID、サーバ設定情報、監視内容は、1つの監視対象システム10内のサーバ単位に設定される。
図2に戻り、運用実績保持部34は、現在運用実務に携わっている複数のオペレータのそれぞれについて、各オペレータに関する属性情報であるオペレータ基本情報を保持する。また、各オペレータによるエラー対応作業の実績を示す作業実績情報と、各オペレータによる定義申請作業の実績を示す定義申請情報を保持する。図4(a)はオペレータ基本情報を示し、図4(b)は作業実績情報を示し、図4(c)は定義申請情報を示す。
図4(b)の作業実績情報の発生時刻は、監視対象システム10で発生したエラーを監視対象システム10または運用監視装置12が検出した日時であってもよい。また対応時刻は、オペレータからシステム担当者へのコール、例えば電話等の所定の連絡手段を用いた障害発生の連絡が完了した日時であってもよい。また対応記録におけるコールミスは、適切なコールができなかったことを意味し、連絡先の間違い、連絡内容の間違い、予め定められた時間内に連絡ができなかったこと等を含む。
定義申請情報の「定義」は、監視対象システム10の運用において、監視対象システム10や運用監視装置12に対して指示する1単位の情報を意味する。「定義申請」は、監視対象システム10の運用のための各種情報を監視対象システム10や運用監視装置12に対して登録することを意味する。例えば、監視対象システム10に実行させるべきジョブを運用監視装置12へ新規登録し、また変更することを含む。また、監視対象システム10の監視項目を新規登録し、また変更することを含む。また、監視対象システム10の各サーバの設定変更を含む。オペレータは、オペレータ端末16から、監視対象システム10や運用監視装置12へアクセスし、定義申請の作業を実施する。
図2に戻り、運用効率情報保持部36は、後述の運用効率評価部62により生成された運用効率情報(図5)を保持する。評価基準保持部38は、オペレータの運用実績を評価する際の基準を示すデータを保持する。例えば、オペレータによる作業実績にもとづき導出された値と、複数段階の評価値との対応関係を保持する。オペレータ評価保持部40は、後述のオペレータ評価部64により生成されたオペレータ評価情報(図6)を保持する。
SLA情報保持部41は、複数の監視対象システム10のそれぞれで定められたSLA情報を保持する。例えば、平均コール時間やコールミス回数の上限等、運用状態の目標を示す値を保持する。サービスレベル保持部42は、後述のサービスレベル評価部66により生成されたサービスレベル評価情報(図7)を保持する。
回帰モデル保持部44は、後述の回帰分析部74により生成された回帰モデル、すなわち回帰係数および回帰式を示すデータを保持する。新規システム情報保持部46は、新規システムの運用コスト見積のための基礎情報となる新規システムに関する属性情報を保持する。例えば、新規システムについて想定される運用規模、仮に定められたオペレータの運用能力(例えば人数やスキルレベル)を保持する。また、新規システムで予定されるSLA情報(例えば平均コール時間、コールミス割合)を保持する。予測結果保持部48は、新規システムについて回帰モデルによる予測結果・推定結果を示す情報を保持する。
制御部50は、実システム情報取得部52、運用実績取得部54、新規システム情報取得部56、運用状況可視化部60、予測部70を含む。実システム情報取得部52は、複数の監視対象システム10のそれぞれに関するシステム定義情報とエラーメッセージログを運用監視装置12aおよび運用監視装置12bから取得して実システム情報保持部32へ格納する。運用実績取得部54は、複数人のオペレータのそれぞれに関するオペレータ基本情報、作業実績情報、定義申請情報をサービスデスク装置14から取得して運用実績保持部34へ格納する。
新規システム情報取得部56は、入力装置24から入力された新規システムの属性情報を取得し、また、オペレータや運用部門管理者が入力してオペレータ端末16や管理者端末18から送信された新規システムの属性情報を取得する。新規システム情報取得部56は、新規システムの属性情報を新規システム情報保持部46へ格納する。
運用状況可視化部60は、監視対象システム10に対する運用実績の可視化処理を実行する。運用状況可視化部60は、運用効率評価部62、オペレータ評価部64、サービスレベル評価部66、分析結果表示部68を含む。
運用効率評価部62は、実システム情報保持部32に格納されたデータと、運用実績保持部34に格納されたデータの両方を参照して、複数の監視対象システム10のそれぞれに対する運用の効率性を示す運用効率情報を生成する。運用効率情報は、運用コストの単位量あたりの運用実績を示す情報とも言え、運用コスト効率情報とも言える。運用効率評価部62は、生成した運用効率情報を運用効率情報保持部36へ格納する。
図5は運用効率情報の構成を示す。図5の情報項目欄の値は、運用効率情報保持部36に格納される運用効率情報の項目を示している。図5の情報ソース欄の値は、運用効率評価部62が、各項目へマッピングする元情報を示し、また、各項目の情報を生成するためのアルゴリズムを示している。
運用効率評価部62は、実システム情報保持部32に格納されたシステム定義情報の監視対象システムIDを、運用効率情報のシステムIDとして識別する。以下では1つの監視対象システム10に割当てられたIDを特定システムIDと呼び、1つの監視対象システム10についての運用効率情報の設定方法を説明する。
運用効率評価部62は、システム定義情報において特定システムIDに対応付けられた監視対象サーバIDの個数をカウントし、その個数を運用効率情報の対象サーバ数として識別する。また、運用実績保持部34に格納されたオペレータ基本情報において特定システムIDに対応付けられたオペレータIDの個数をカウントし、その個数を運用効率情報のオペレータ数として識別する。また、対象サーバ数をオペレータ数で除算した結果を、運用効率情報の1人あたりサーバ数として識別する。
また運用効率評価部62は、実システム情報保持部32に格納されたエラーメッセージログ(運用実績保持部34に格納された作業実績情報でもよい)において特定システムIDに対応付けられたメッセージIDの個数をカウントする。そして、その個数をオペレータ数で除算した結果を、運用効率情報の1人あたりメッセージ数として識別する。また、運用実績保持部34に格納された定義申請情報において特定システムIDに対応付けられた申請IDの個数(ただし対応ステータスが「済」のレコードに限る)をカウントする。そして、その個数をオペレータ数で除算した結果を、運用効率情報の1人あたり定義登録数として識別する。
以下では特に言及しないが、運用状況可視化部60および予測部70の処理では、エラーメッセージログ、作業実績情報、定義申請情報のレコードのうち、所定の単位期間内(例えば一箇月)に記録されたレコードが集計対象となる。したがって、後述の平均コール時間、コールミス回数、定義登録期限超過数等は、直近の一箇月の値である。
ここで、監視対象システム10におけるサーバの台数やメッセージの総数(エラー発生数とも言える)が大きくなるほど、監視対象システム10の運用に要する作業量は増大する。したがって、これらの値は監視対象システム10の運用に要する作業量、すなわち運用規模を示す指標値と言える。1人あたりサーバ数、1人あたりメッセージ数(すなわち1人あたりエラー対応数)、1人あたり定義登録数は、1人のオペレータのコストでまかなわれる運用作業量と言え、監視対象システム10の運用効率を示す指標値と言える。また、1人のオペレータの業務量を示す指標値とも言え、1人のオペレータの繁忙度合いを示す指標値とも言える。
図2に戻り、オペレータ評価部64は、運用実績保持部34に格納されたデータを参照して、複数のオペレータのそれぞれに関するオペレータ評価情報を生成する。オペレータ評価情報は、各オペレータによるオペレーション実績にもとづいて各オペレータの運用能力を可視化した情報と言える。オペレータ評価部64は、生成したオペレータ評価情報をオペレータ評価保持部40へ格納する。
図6はオペレータ評価情報の構成を示す。図6の情報項目欄の値は、オペレータ評価保持部40に格納されるオペレータ評価情報の項目を示している。図6の情報ソース欄の値は、オペレータ評価部64が、各項目の情報にマッピングする元情報を示し、また、各項目の情報を生成するためのアルゴリズムを示している。
例えば、オペレータ評価部64は、運用実績保持部34に格納されたオペレータ基本情報のオペレータIDを、オペレータ評価情報のオペレータIDとして識別する。以下では1人のオペレータに割当てられたオペレータIDを特定オペレータIDと呼び、1人のオペレータについてのオペレータ評価情報の設定方法を説明する。
オペレータ評価部64は、運用実績保持部34に格納された作業実績情報のレコードのうち特定オペレータIDに対応付けられたレコード(「特定レコード」と呼ぶ。)を識別する。そして、各特定レコードに記録された発生時刻から対応時刻までの対応所要時間を合計し、その合計時間を特定レコードの数(特定オペレータIDに対応付けられたメッセージIDの個数とも言える)で除算した結果を平均コール時間として算出する。また、その平均コール時間と対応付けられた評価値を評価基準保持部38から取得する。
またオペレータ評価部64は、対応記録にミスが記録された特定レコード数を識別し、そのレコード数をオペレータ評価情報のコールミス件数として識別する。また、ミスのないコール件数(特定レコード総数からコールミス件数を減算した値)を特定レコード総数で除算した結果を、オペレータ評価情報の正確なコール割合として識別する。そして、その割合と対応付けられた評価値を評価基準保持部38から取得する。
またオペレータ評価部64は、運用実績保持部34に格納された定義申請情報のレコードのうち特定オペレータIDに対応付けられたレコード(「特定レコード」と呼ぶ。)を識別する。そして、その特定レコード数をオペレータ評価情報の定義登録数として識別する。また、特定レコードのうち対応期限超過有が記録されたレコード数をオペレータ評価情報の期限超過数として識別する。また、定義登録数または期限超過数、もしくはそれらの組み合わせと対応付けられた評価値を評価基準保持部38から取得する。
またオペレータ評価部64は、管理者端末18から送信された、各オペレータについての開発部門との適切な協業の評価値、業務改善力の評価値、評価者コメントを取得し、それぞれをオペレータ評価保持部40へ記録する。これらのデータは、ローカルの入力装置24から入力されてもよいことはもちろんである。
またオペレータ評価部64は、コールの迅速性評価値、コールの正確性評価値、定義登録数評価値、開発部門との適切な協業の評価値、業務改善力の評価値の合計を、オペレータ評価情報の総合得点として識別する。各項目の評価値が5点満点の場合、総合得点は25点満点となる。オペレータ評価部64は、総合得点を評価項目数(例えば5)で除算した結果である平均評価値をオペレータ評価情報のスキルとして識別する。
またオペレータ評価部64は、複数のオペレータそれぞれの総合得点を比較し、各オペレータのランキングを識別する。また、所定の記憶領域に格納された、総合得点とランキングの組み合わせと、オペレータに割当てるべき架空の称号との対応関係を参照して、各オペレータの総合得点とランキングに応じて各オペレータの称号を識別する。称号は、運用実務能力の相対的な高低を示す呼び名とする。予め定められた仮想世界における身分や階級を示す呼び名であってもよい。例えばランクが低い方から「タマゴ」「見習い」「職人」「達人」「英雄」等の称号が定められてもよい。
オペレータ評価保持部40は、各オペレータの過去の評価情報を評価日時に対応付けて蓄積する。オペレータ評価部64は、前回の評価情報と今回の評価情報の差分を識別し、その差分を示すデータを前回との差分としてオペレータ評価情報へ記録する。評価情報の差分は、平均コール時間や定義登録数等の作業実績の変化量や、評価値やランキングの変化量であってもよい。
図2に戻り、サービスレベル評価部66は、実システム情報保持部32、運用実績保持部34、オペレータ評価保持部40、SLA情報保持部41のデータを参照して、複数の監視対象システム10それぞれのサービスレベル情報を生成する。サービスレベル情報は、各監視対象システム10に対するオペレーション実績にもとづいてシステムを単位としたサービスレベルを評価し、可視化した情報と言える。基本的には、オペレータ評価情報をシステム単位に集計し、SLAの観点から評価したものである。サービスレベル評価部66は、生成したサービスレベル情報をサービスレベル保持部42へ格納する。
図7はサービスレベル情報の構成を示す。図7の情報項目欄の値は、サービスレベル保持部42に格納されるサービスレベル情報の項目を示している。図7の情報ソース欄の値は、サービスレベル評価部66が、各項目へマッピングする元情報を示し、また、各項目の情報を生成するためのアルゴリズムを示している。
サービスレベル評価部66は、実システム情報保持部32に格納されたシステム定義情報の監視対象システムIDを、サービスレベル情報のシステムIDとして識別する。以下では、1つの監視対象システム10に割当てられたIDを特定システムIDと呼び、1つの監視対象システム10についてのサービスレベル情報の設定方法を説明する。
サービスレベル評価部66は、運用実績保持部34に格納されたオペレータ基本情報を参照して、特定システムIDに対応付けられたオペレータのID(「特定オペレータID」と呼ぶ。)を識別する。1つの監視対象システム10の運用を複数のオペレータが担当する場合、複数の特定オペレータIDを識別する。サービスレベル評価部66は、オペレータ評価保持部40に格納されたオペレータ評価情報のうち特定オペレータIDに対応付けられた複数のオペレータ評価情報を識別し、各オペレータの平均コール時間の平均値を、コール実績時間として識別する。また、そのコール実績時間を、SLA情報保持部41に格納されたコール目標時間と比較し、目標の達成有無を判定する。
またサービスレベル評価部66は、特定オペレータIDに対応付けられた複数のオペレータ評価情報に記録されたコールミス回数の合計を、コールの全回数で除算した結果をオペレーションミス発生率として識別する。コールの全回数は、実システム情報保持部32に格納されたエラーメッセージログにおける特定システムIDに対応付けられたレコード数をカウントしてもよく、運用実績保持部34に格納された作業実績情報における特定システムIDに対応付けられたレコード数をカウントしてもよい。またサービスレベル評価部66は、オペレーションミス発生率を、SLA情報保持部41に格納されたオペレーションミス発生率の目標値と比較し、目標の達成有無を判定する。
またサービスレベル評価部66は、特定オペレータIDに対応付けられた複数のオペレータ評価情報に記録された定義登録数の合計を定義登録実績として識別する。また、その定義登録実績を、SLA情報保持部41に格納された定義登録の目標値と比較し、目標の達成有無を判定する。
図2に戻り、分析結果表示部68は、運用効率情報保持部36に格納された運用効率情報を配置した運用効率情報画面を生成する。また、オペレータ評価保持部40に保持されたオペレータ評価情報を配置したオペレータ評価情報画面を生成し、サービスレベル保持部42に保持されたサービスレベル情報を配置したサービスレベル情報画面を生成する。分析結果表示部68は、オペレータ端末16、管理者端末18から分析情報の提供要求を受け付けると、オペレータや管理者が指定した画面のデータをオペレータ端末16、管理者端末18へ送信して表示させる。また、入力装置24からの表示要求に応じて、各画面をディスプレイ26に表示させる。
分析結果表示部68は、ウェブサーバとして機能してもよく、運用効率情報画面、オペレータ評価情報画面、サービスレベル情報画面それぞれのウェブページをオペレータ端末16、管理者端末18へ送信してもよい。
図8は運用効率情報画面80を示す。図8のオペレーション規模は、運用効率情報のオペレータ数を示している。また図8で示すように、分析結果表示部68は、運用効率情報保持部36に保持された過去から現在まで複数回生成された運用効率情報にしたがって、運用効率の推移を示すグラフを運用効率情報画面80に設定する。図8では、運用規模(ここではサーバ数)、オペレーション規模(ここではオペレータ数)、オペレーション効率(ここでは1人あたりサーバ数)の推移を示すグラフを設定している。
変形例として、監視対象システム10のメッセージ数や定義登録数を運用規模としてもよく、これらとサーバ数との組み合わせにより特定される指標値を運用規模としてもよい。また、監視対象システム10の運用を担当する1人以上のオペレータの人件費をオペレーション規模としてもよい。
図9はオペレータ評価情報画面82を示す。図9の平均オペレーションレベルは、オペレータ評価情報に記録されたスキルの値を示している。また図9で示すように、分析結果表示部68は、オペレータ評価保持部40に保持された複数項目の評価値(ここでは5点満点)を示すレーダチャートをオペレータ評価情報画面82に設定する。
図10はサービスレベル情報画面84を示す。図10で示すように、分析結果表示部68は、SLA遵守状況エリア86に、複数の目標それぞれの達成有無を表示させる。またSLA未達成状況詳細エリア88に、目標が未達成の項目について、その目標値と実績値とを対応付けて表示させる。
図2に戻り、予測部70は回帰分析による運用コストの見積支援処理を実行する。予測部70は、変数取得部72、回帰分析部74、推定部76、予測結果表示部78を含む。
変数取得部72は、現実のシステムの運用に要するオペレータの業務量を示す情報と、オペレータの運用能力を示す情報と、現実のシステムに対するオペレータによる運用実績を示す情報をそれぞれ取得する。具体的には、オペレータの業務量を示す情報として、監視対象システム10に配置された監視対象サーバ数、監視対象システム10に関するエラーメッセージ数(監視対象システム10で発生し、運用監視装置12が検出したエラー数とも言える)、定義登録数を取得する。また、オペレータの運用能力を示す情報として、監視対象システム10の運用に携わるオペレータ人数、オペレータのスキル値を取得する。また、オペレータによる運用実績を示す情報として、平均コール時間、コールミス回数、定義登録期限超過数を取得する。
回帰分析部74は、オペレータの業務量を示す情報と、オペレータの運用能力を示す情報にもとづいて説明変数を識別し、オペレータによる運用実績を示す情報にもとづいて目的変数を識別する。そして説明変数と目的変数との間の回帰係数を公知の回帰分析手法により導出する。回帰分析部74は、導出した回帰係数および回帰式を示すデータを回帰モデル保持部44へ格納する。
以下では3種類の回帰分析を提案し、それぞれを第1回帰分析、第2回帰分析、第3回帰分析と呼ぶ。図11(a)は第1回帰分析および第2回帰分析に用いる各システムの情報を示し、図11(b)は第3回帰分析に用いる各システムの情報を示す。また図12(a)は第1回帰分析の結果を示し、図12(b)は第2回帰分析の結果を示し、図12(c)は第3回帰分析の結果を示す。
図11(a)を参照して第1回帰分析について説明する。
変数取得部72は、各監視対象システム10における監視対象サーバ数とメッセージ数(すなわちエラー発生数)を実システム情報保持部32のシステム定義情報とエラーメッセージログからから取得する。また、各監視対象システム10の運用に携わるオペレータ数を運用実績保持部34のオペレータ基本情報から取得する。また、各監視対象システム10の運用に携わる複数のオペレータそれぞれのスキル値と平均コール時間をオペレータ評価保持部40から取得する。特に断らない場合、変数取得部72は、運用状況可視化部60と同様の方法でデータ保持部30から必要な情報を取得してもよい。なお以降の例では、オペレータのスキル値を10段階(10点満点)に調整している。
回帰分析部74は、監視対象サーバ数とメッセージ数(すなわちエラー発生数)を積算した結果を運用規模(コール)として識別する。監視対象サーバ数とメッセージ数は監視対象システム10における複数のオペレータの業務量全体と正相関する。したがって、運用規模(コール)もまた監視対象システム10における複数のオペレータの業務量全体と正相関するものであり、運用規模(コール)は業務量の多さを示す指標値である。すなわち回帰分析部74は、監視対象システム10における監視対象サーバ数が多いほど、または、監視対象システム10で発生したエラー数が多いほど、オペレータの業務量を大きく判定する。
回帰分析部74は、運用規模(コール)を、(オペレータ数×複数のオペレータのスキル平均値)で除算した結果を説明変数(ここでは「運用能力基礎数値(コール)」と呼ぶ。)として識別する。運用能力基礎数値(コール)は、オペレータ1人あたりの業務量の多さであり、各オペレータの業務の繁忙度合いを示す指標値である。監視対象システム10における監視対象サーバ数が多いほど、監視対象システム10で発生したエラー数が多いほど、オペレータ数が少ないほど、各オペレータのスキル値が低いほど、運用能力基礎数値(コール)は大きく算出される。また回帰分析部74は、複数のオペレータの平均コール時間を平均し、その平均値を目的変数として識別する。
図12(a)で示すように、回帰分析部74は、複数の監視対象システム10について識別した運用能力基礎数値(コール)と平均コール時間の間の回帰係数を回帰分析により導出する。図12(a)では単回帰分析により導出した回帰式を示し、傾き「0.7897」、切片「10.683」の回帰係数を導出したことを示している。
図11(a)を参照して、第2回帰分析について説明する。第2回帰分析は、目的変数だけが第1回帰分析と異なり、第1回帰分析と重複する説明は省略する。変数取得部72は、各監視対象システム10の運用に携わる複数のオペレータそれぞれのコールミス回数をオペレータ評価保持部40の作業実績情報から取得する。回帰分析部74は、複数のオペレータのコールミス回数を平均し、その平均値を目的変数として識別する。
図12(b)で示すように、回帰分析部74は、複数の監視対象システム10について識別した運用能力基礎数値(コール)と平均コールミス回数の間の回帰係数を回帰分析により導出する。図12(b)では単回帰分析により導出した回帰式を示し、傾き「0.0367」、切片「−3.278」の回帰係数を導出したことを示している。
図11(b)を参照して、第3回帰分析について説明する。第3回帰分析は、説明変数と目的変数の両方が第1回帰分析と異なり、第1回帰分析と重複する説明は省略する。
変数取得部72は、各監視対象システム10における定義登録数を運用実績保持部34の定義申請情報から取得し、運用規模(定義登録)として識別する。例えば、定義申請情報のレコードのうち各監視対象システム10のIDが記録されたレコード数を定義登録数として取得してもよい。定義登録数は監視対象システム10における複数のオペレータの業務量全体と正相関する。したがって運用規模(コール)と同様に運用規模(定義登録)も、監視対象システム10における複数のオペレータの業務量全体と正相関するものであり、業務量の多さを示す指標値である。
変数取得部72は、各監視対象システム10の運用に携わる複数のオペレータそれぞれの定義登録期限超過数を運用実績保持部34から取得する。例えば、定義申請情報のレコードのうち対応期限超過有りのレコード数をカウントしてもよい。回帰分析部74は、運用規模(定義登録)を、(オペレータ数×複数のオペレータのスキルの平均値)で除算した結果を説明変数(ここでは「運用能力基礎数値(定義登録)」と呼ぶ。)として識別する。また回帰分析部74は、複数のオペレータの定義登録期限超過数の平均値を目的変数として識別する。
図12(c)で示すように、回帰分析部74は、複数の監視対象システム10について識別した運用能力基礎数値(定義登録)と定義登録期限超過数の平均値の間の回帰係数を回帰分析により導出する。図12(c)では単回帰分析により導出した回帰式を示し、傾き「0.1564」、切片「−0.993」の回帰係数を導出したことを示している。
図2に戻り、推定部76は、回帰分析部74が生成した回帰モデルを使用して、予測対象システムの運用に関する予測処理を実行する。推定部76は、予測処理の結果を示すデータを予測結果保持部48へ格納する。以下、第1予測処理と第2予測処理を説明する。実施の形態では、予測対象システムを新規に運用が開始される新規システムとし、新規システムの運用コストの見積を支援する処理を実行する。
第1予測処理の説明:
推定部76は、第1予測処理として、新規システムで想定されるオペレータの業務量と、仮に定められたオペレータの運用能力と、回帰モデル保持部44に格納された回帰係数にしたがって、新規システムに対するオペレータによる運用状態を推定する。推定対象とする運用状態は、システム運用のサービスレベルを示すものであり、具体的にはオペレータによるコール時間やコールミス回数である。
図13は、予測処理における入力値と予測結果の例を示す。同図では、網掛けで示す領域の値が入力値を示し、下線を付した値が予測結果を示している。
図13(a)を参照して第1予測処理の例を説明する。推定部76は、新規システム情報保持部46に予め格納された、新規システムで想定されるオペレータの業務量を示す指標値であり、この例では監視対象サーバ数とメッセージ数の積である運用規模(コール)の想定値を取得する。新規システム情報保持部46には、監視対象サーバ数とメッセージ数の想定値が格納されてもよく、推定部76は、これらの想定値を積算し、その結果を運用規模(コール)として識別してもよい。また推定部76は、新規システム情報保持部46に予め格納されたオペレータの予定人数および予定スキルを取得する。
なお、これらの想定値や予定値は、オペレータ端末16や管理者端末18から通信網22を介して分析装置20へ入力されてもよく、入力装置24から分析装置20へ入力されてもよい。
推定部76は、運用規模(コール)の想定値を、オペレータの予定人数と予定スキルの積で除算し、運用能力基礎数値(コール)を算出する。そして、その値を第1回帰分析で導出された回帰モデル(例えば図12(a)の回帰式のx)へ入力することにより、コール時間(例えば図12(a)の回帰式のy)を算出する。このコール時間は、新規システムにおいてエラーメッセージが出力された場合に、オペレータがシステム担当者へコールを完了するまでに要する平均コール時間の推定値である。
また推定部76は、運用能力基礎数値(コール)を第2回帰分析で導出された回帰モデル(例えば図12(b)の回帰式のx)へ入力することにより、コールミス回数(例えば図12(b)の回帰式のy)を算出する。このコールミス回数は、所定の単位期間(例えば一箇月)において新規システムでエラーが発生した場合に、1人のオペレータがコールミスを行う回数の推定値である。推定部76は、予測処理の入力値と予測結果を含む情報(例えば図13(a)の情報)を予測結果保持部48へ格納する。
次に図13(b)を参照して第1予測処理の例を説明する。推定部76は、新規システム情報保持部46に予め格納された、新規システムで想定されるオペレータの業務量を示す指標値であり、この例では所定の運用期間(例えば一箇月)においてオペレータが実施すべき定義登録数を示す運用規模(定義登録)の想定値を取得する。また、新規システム情報保持部46に予め格納されたオペレータの予定人数および予定スキルを取得する。
推定部76は、運用規模(定義登録)の想定値を、オペレータの予定数と予定スキルの積で除算し、運用能力基礎数値(定義登録)を算出する。そして、その値を第3回帰分析で導出された回帰モデル(例えば図12(c)の回帰式のx)へ入力することにより、定義登録期限超過数(例えば図12(c)の回帰式のy)を算出する。この定義登録期限超過数は、所定の単位期間(例えば一箇月)において1人のオペレータが定義登録作業の期限を超過してしまう回数の推定値である。推定部76は、予測処理の入力値と予測結果を含む情報(例えば図13(b)の情報)を予測結果保持部48へ格納する。
第2予測処理の説明:
推定部76は、第2予測処理として、新規システムで想定されるオペレータの業務量と、新規システムに要求されるオペレータによる運用状態と、回帰モデル保持部44に格納された回帰係数にしたがって、新規システムで必要となるオペレータの運用能力を推定する。新規システムに要求されるオペレータの運用状態は、新規システムに要求されるサービスレベルとも言え、SLAで定められた情報であってもよい。具体的には、オペレータによる平均コール時間やコールミス回数の許容値である。また、推定対象とするオペレータの運用能力は、具体的にはオペレータの人数および/またはオペレータのスキルである。
図13(c)を参照して第2予測処理の例を説明する。ここでは第1回帰分析で導出された回帰モデル(具体的には図12(a)の回帰式)を使用する例を示すが、第2回帰分析または第3回帰分析で導出された回帰モデルを使用して第2予測処理を実行してもよいことはもちろんである。
推定部76は、新規システム情報保持部46に予め格納された、運用規模(コール)の想定値を取得する。この例ではオペレータの必要スキル(予定スキル)も格納されていることとし、推定部76はオペレータの必要スキルも取得する。さらに推定部76は、新規システム情報保持部46に予め格納された新規システムに要求されるサービスレベル、ここでは平均コール時間の要求値を取得する。
推定部76は、第1回帰分析で導出された回帰モデル(例えば図12(a)の回帰式のy)へ平均コール時間の要求値を入力することにより、運用能力基礎数値(コール)の必要値(例えば図12(a)の回帰式のx)を算出する。この運用能力基礎数値(コール)は、運用規模(コール)を、オペレータの必要人数と必要スキルの積で除算したものであるため、推定部76は、算出した運用能力基礎数値(コール)と所与の必要スキルによりオペレータの必要人数を算出する。
推定部76は、所定の記憶領域に格納されたスキル単価であり、所定の単位期間(例えば一箇月)におけるスキル毎のオペレータの人件費を規定した情報にしたがって、新規システムの運用に携わるオペレータの人件費を算出する。図13(c)の例では、スキル5のオペレータが7.5人(8人としてもよい)であるため、オペレータの人件費を750と算出している。このオペレータの人件費は、所定の単位期間における新規システムの運用コストの推定値と言える。推定部76は、予測処理の入力値と予測結果を含む情報(例えば図13(c)の情報)を予測結果保持部48へ格納する。
図2に戻り、予測結果表示部78は、推定部76による予測処理の結果を運用の管理者、オペレータ、外部装置へ提供する。具体的には、予測結果表示部78は、予測結果保持部48に格納された新規システムの運用に関する予測結果情報を配置した予測結果画面を生成し、この画面データをオペレータ端末16、管理者端末18へ送信し、またディスプレイ26に表示させる。
予測結果表示部78は、新規システムの運用に関する想定値(予定値)と予測結果の両方を含む情報であり、例えば図13(a)(b)(c)それぞれの情報を示す予測結果画面を生成してもよい。予測結果表示部78は、ウェブサーバとして機能してもよく、予測結果画面を示すウェブページをオペレータ端末16、管理者端末18へ送信し、またディスプレイ26に表示させてもよい。
なお上記の例では、オペレータの必要スキルが事前に定められていることとしたが、これに代えてオペレータの必要人数(予定人数)が事前に定められてもよい。この場合、推定部76は、オペレータの必要スキル、すなわち複数のオペレータのスキルの平均値を推定してもよい。また推定部76は、オペレータの必要人数と必要スキルが不定の場合に、運用能力基礎数値(コール)を推定結果として記録してもよい。運用能力基礎数値の推定値を、必要なオペレータの運用能力として運用部門の担当者へ提示することにより、その運用基礎数値を満たすオペレータ数とスキルを担当者に検討させてもよい。
以上の構成による分析装置20の動作を以下説明する。
先の分析処理から所定期間(例えば一箇月)が経過したことを検出すると、実システム情報取得部52は、監視対象システム10に対する運用監視処理を実行中の運用監視装置12から、運用監視装置12が管理するシステム定義情報とエラーメッセージログを取得する。運用実績取得部54は、運用監視装置12と連携してオペレータ支援処理を実行中のサービスデスク装置14から、サービスデスク装置14が管理するオペレータ基本情報、作業実績情報、定義申請情報を取得する。運用効率評価部62、オペレータ評価部64、サービスレベル評価部66は、運用監視装置12で管理された情報と、サービスデスク装置14で管理された情報にもとづいて、運用効率情報、オペレータ評価情報、サービスレベル情報を生成する。
分析結果表示部68は、管理者端末18等の外部装置から特定のシステムIDを指定した運用効率情報画面の提供要求を受け付けると、図8で示した運用効率情報画面を外部装置へ送信し、外部装置で表示させる。また分析結果表示部68は、オペレータ端末16や管理者端末18等の外部装置から特定のオペレータIDを指定したオペレータ評価情報の提供要求を受け付けると、図9で示したオペレータ評価情報画面を外部装置へ送信し、外部装置で表示させる。また分析結果表示部68は、管理者端末18等の外部装置から特定のシステムIDを指定したサービスレベル情報画面の提供要求を受け付けると、図10で示したサービスレベル情報画面を外部装置へ送信し、外部装置で表示させる。
このように実施の形態の分析装置20によると、運用監視装置12による管理データと、サービスデスク装置14による管理データとを対応付けて、最新の運用状況にもとづく運用効率・サービスレベル・オペレータ評価のビューを提供することができる。これにより、情報システムの運用に関する広範囲な情報を可視化し、また情報鮮度の向上を実現する。また、運用実績にもとづく客観的なオペレータ評価結果を提供でき、また、称号の付与というゲーミフィケーションの導入により、運用業務に対するオペレータのモチベーションを維持、喚起することを支援できる。
管理者端末18や入力装置24から所定の分析指示が入力された場合、もしくは定期的に、変数取得部72は、運用監視装置12が管理する情報にもとづく現実のシステムの運用でのオペレータの業務量を示す情報を取得する。また、サービスデスク装置14が管理する情報にもとづくオペレータの運用能力を示す情報を取得し、サービスデスク装置14が管理する情報にもとづくオペレータの運用実績を示す情報を取得する。回帰分析部74は、オペレータの業務量と運用能力を説明変数とし、オペレータの運用実績を目的変数とした回帰分析を実行し、両者の回帰関係を示す回帰式を導出する。
新規システムの運用コストを見積もるべき担当者(例えば新規システムの開発者や運用部門の管理者等)は、新規システムの運用に関する前提条件(例えば監視対象サーバ数やSLA情報等)を分析装置20へ入力する。新規システムの運用に関する前提条件として、オペレータの業務量の想定値とオペレータの運用能力の予定値が指定され、予測処理の開始指示が入力されると、推定部76は、その前提条件と回帰分析部74が導出した回帰式にしたがって、新規システムにおけるオペレータの運用状態を推定する。予測結果表示部78は、新規システムにおけるオペレータの運用状態の予測結果を示す情報(例えば図13(a)(b))を担当者の端末へ送信して表示させる。
また、新規システムの運用に関する前提条件として、オペレータの業務量の想定値と新規システムで要求されるサービスレベルが指定され、予測処理の開始指示が入力されると、推定部76は、その前提条件と回帰分析部74が導出した回帰式にしたがって、新規システムで必要となるオペレータの運用能力、例えばオペレータの人数やスキル、人件費を推定する。予測結果表示部78は、新規システムで必要となるオペレータの運用能力の予測結果を示す情報(例えば図13(c))を担当者の端末へ送信して表示させる。
このように実施の形態の分析装置20によると、現実のシステム運用で、オペレータの業務量および運用能力と、オペレータの運用実績との間に存在する回帰関係を反映した、新規システムにおけるオペレータの運用状態を推定する。担当者は、推定されたオペレータの運用状態(例えば平均コール時間やコールミス回数等)が許容範囲内かを検討することで、新規システムの前提条件としたオペレータの運用能力の予定値が妥当か否かを判断することができる。
また分析装置20によると、現実のシステム運用で、オペレータの業務量および運用能力と、オペレータの運用実績との間に存在する回帰関係を反映した、必要となるオペレータの運用能力を推定する。これにより、新規システムの運用で要求されるサービスレベルの充足に必要となるオペレータの運用能力、例えばオペレータの人数やスキル、人件費を担当者へ提示でき、妥当な運用コストの見積りを支援できる。
また、監視対象システム10に対する運用監視処理を実行中の運用監視装置12と、運用監視装置12と連携してオペレータ支援処理を実行中のサービスデスク装置14で管理された情報にもとづいて回帰式を導出することで、現実の運用状態、かつ最新の運用状態を反映した回帰式を導出する。また、監視対象システム10における監視対象サーバ数が多いほどオペレータの業務量を示す指標値を大きくし、また、監視対象システム10のエラー発生回数が多いほどオペレータの業務量を示す指標値を大きくすることで、現実のシステム運用に即した回帰式を導出する。
以上、本発明を実施の形態をもとに説明した。この実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。以下変形例を示す。
第1変形例:
上記実施の形態では言及していないが、本変形例の分析装置20は、複数の監視対象システム10のそれぞれで発生しうる複数種類のエラーについて、各エラーに関する属性情報を各監視対象システム10のIDに対応付けて保持するエラー属性保持部をさらに備える。以下、特定の監視対象システム10について説明する。エラー属性情報は、特定の監視対象システム10で発生しうる複数種類のエラーそれぞれの識別情報と、各エラーの重大度に応じた重み値を含む。具体的には、エラーが引き起こす結果が重大であるほど、またエラーの影響範囲が大きいほど、エラーの解決コストが大きいほど、またエラーの解決までの時間が長いほど、大きい重み値が設定される。例えば、(1)Java例外:重み1、(2)タイムアウトエラー:重み2、(3)サーバA停止エラー:重み3、と予め定められてもよい(「Java」は登録商標)。
運用効率評価部62は、1つの監視対象システム10に関する運用効率情報の生成において、1人あたりメッセージ数の算出に際し、各メッセージが示すエラーの重み値をエラー属性保持部から取得する。そして、割られる数であるメッセージ総数(すなわちエラー総数)を、各メッセージが示すエラーの重み値に応じて調整する。具体的には、メッセージが示すエラーの重み値が大きいほどメッセージ数を多くカウントする。例えば、Java例外を示すメッセージが5個、タイムアウトエラーを示すメッセージが2個、サーバA停止エラーを示すメッセージが1個ある場合、メッセージ総数を単に8個(=5+2+1)とするのではなく、メッセージ総数を12(=5×1+2×2+1×3)と判定する。この結果、各メッセージが示すエラーが重大であるほど1人あたりメッセージ数の値は大きく算出され、すなわち運用の効率性をより高く評価する。このように重大なエラーに対応した事実を運用効率情報へ反映する。
またオペレータ評価部64は、1人のオペレータに関するオペレータ評価情報の生成において、平均コール時間(コールの迅速性)の算出に際し、各メッセージが示すエラーの重み値をエラー属性保持部から取得する。そして、対応所要時間の合計を割る数であるメッセージ総数(すなわちエラー総数)を、各メッセージが示すエラーの重み値に応じて調整する。具体的には上記と同様に、メッセージが示すエラーの重み値が大きいほどメッセージ数を多くカウントする。この結果、各メッセージが示すエラーが重大であるほど、平均コール時間の値は小さくなり、オペレータの運用能力をより高く評価する。なお、各オペレータの平均コール時間を集約したサービスレベル情報のコール実績時間も小さくなり、サービスレベルもより高い評価となる。このように重大なエラーに対応した事実をオペレータ評価情報およびサービスレベル情報へ反映する。
エラーの個数としては同じ1件であっても、エラーの重大度が異なればオペレータ作業の難易度や煩雑さが異なるという現実がある。第1変形例によると、より現実に即して運用実績を評価することができる。
第2変形例:
上記第1変形例ではエラーの重大度を運用実績評価に反映させる手法を提案したが、第2変形例ではエラーの重大度を運用コストの見積支援処理に反映させる手法を提案する。第2変形例の分析装置20も、第1変形例と同様のエラー属性保持部を備える。
回帰分析部74(変数取得部72でもよい)は、オペレータの業務量を示す運用規模(コール)の実績値を算出する際に、各メッセージが示すエラーの重み値をエラー属性保持部から取得する。そして、各メッセージが示すエラーの重み値に応じてメッセージ総数を調整する。具体的には、第1変形例と同様に、メッセージが示すエラーの重み値が大きいほどメッセージ数を多くカウントする。この結果、各メッセージが示すエラーが重大であるほどメッセージ総数が大きくなり、運用規模(コール)の値が大きくなる。既述したように、エラーの個数としては同じ1件であっても、エラーの重大度が異なればオペレータ作業の難易度や煩雑さが異なるという現実があり、第2変形例によると、より現実に即した回帰モデルを生成することができる。
なお、第2変形例においては、新規システムで想定される複数種類のエラーの発生割合が勘案され、新規システムの運用規模(コール)の想定値が設定されてもよい。推定部76は、エラーの重大度を勘案して設定された運用規模(コール)の想定値を使用して、第1予測処理と第2予測処理を実行してもよい。より現実に即した精度の高い予測結果を導出することができる。
第3変形例:
上記実施の形態では回帰分析部74が、運用能力基礎数値を説明変数とする単回帰分析を実行する例を示したが、複数の説明変数を用いた重回帰分析を実行してもよい。例えば、複数の監視対象システム10のそれぞれについて、監視対象サーバ数、メッセージ数(エラー発生数)、システム担当チーム数、オペレータ数、オペレータスキル等の複数項目を説明変数とし、サービスレベルの実績値(平均コール時間等)を目的変数とした重回帰分析を実行してもよい。
第4変形例:
上記実施の形態では、運用未開始の新規システムを運用コストの予測対象システムとしたが、変形例として、運用開始済の既存システムを予測対象システムとしてもよい。この場合、予測対象システムの前提条件として、運用規模(コール)、運用規模(定義登録)、オペレータ人数、オペレータスキルの実績値が入力されてもよい。不図示のサービスレベル比較部は、第1予測処理で出力された予測サービスレベルと、サービスレベル評価部66が出力した現実のサービスレベルとを比較し、その差分を示す比較結果をデータ保持部30へ格納してもよい。予測サービスレベルよりも現実のサービスレベルが悪い場合、例えばコール時間が長い、コールミス回数が多い、定義登録期限超過数が多い場合、他の既存システムと比べて予測対象の既存システムの運用に問題があることが分かる。
また不図示の運用能力比較部は、第2予測処理で出力されたオペレータの運用能力と、運用効率評価部62が出力したオペレータ数やオペレータスキルの平均値を比較し、現実のオペレータの運用能力が過多の場合、例えばオペレータ数が多い場合、他の既存システムと比べて予測対象の既存システムの運用効率が悪いことが分かる。このように、運用開始済の既存システムを予測対象システムとする場合にも有用な情報を獲得できる。
第5変形例:
1人のオペレータが複数のシステム運用に携わる場合、オペレータの稼働実績に応じて運用効率の算出基準となるオペレータ数を調整してもよい。本変形例の運用効率評価部62は、1つの監視対象システム10(特定システムと呼ぶ)の運用効率情報を生成する際に、特定システムのIDに対応付けられた各オペレータが実際に特定システムの運用に従事した稼働量、言い換えれば、各オペレータの稼働量全体に占める特定システムの運用に従事した割合に応じてオペレータ数を算出してもよい。
例えば、1人のオペレータ(特定オペレータと呼ぶ)のIDに対応付けられた作業実績情報のレコード数に占める、特定システムのIDと特定オペレータのIDの両方に対応付けられたレコード数の割合を算出してもよい。その割合が0.4であれば、特定オペレータの分として0.4をオペレータ数に加算してもよい。作業実績情報に代えて定義申請情報のレコードにおける上記割合を算出してもよく、作業実績情報と定義申請情報の両方における上記割合の平均値を算出してもよい。なお、所定の勤務管理装置から、特定オペレータが複数のシステムそれぞれの運用業務にどれだけ携わったかを示す情報を取得できる場合は、その情報を使用してオペレータ数を算出してもよい。第5変形例によると、より現実に即した運用効率情報を生成することができる。
第6変形例:
第5変形例と同様に、1人のオペレータが複数のシステム運用に携わる場合、オペレータの稼働実績に応じて、運用コスト予測のための回帰分析の説明変数とするオペレータ数を調整してもよい。具体的には、第5変形例の運用効率評価部62と同様に、変数取得部72は、特定システムのIDに対応付けられた各オペレータが実際に特定システムの運用に従事した稼働量、言い換えれば、各オペレータの稼働量全体に占める特定システムの運用に従事した割合に応じてオペレータ数を算出してもよい。第6変形例によると、より現実に即した回帰モデルを生成し、より現実に即した精度の高い予測結果を導出することができる。
上述した実施の形態および変形例の任意の組み合わせもまた本発明の実施の形態として有用である。組み合わせによって生じる新たな実施の形態は、組み合わされる実施の形態および変形例それぞれの効果をあわせもつ。また、請求項に記載の各構成要件が果たすべき機能は、実施の形態および変形例において示された各構成要素の単体もしくはそれらの連携によって実現されることも当業者には理解されるところである。
10 監視対象システム、 12 運用監視装置、 14 サービスデスク装置、 20 分析装置、 52 実システム情報取得部、 54 運用実績取得部、 62 運用効率評価部、 64 オペレータ評価部、 66 サービスレベル評価部、 72 変数取得部、 74 回帰分析部、 76 推定部。

Claims (3)

  1. 所定のシステムの動作状態を監視する運用監視装置に保持された前記システムに関する情報を取得する第1取得部と、
    前記システムで発生し、前記運用監視装置が検出したエラーに対応すべきオペレータを支援するサービスデスク装置に保持されたオペレータに関する情報を取得する第2取得部と、
    前記第1取得部により取得された情報にもとづいて特定される前記システムの運用規模と、前記第2取得部により取得された情報にもとづいて特定されるオペレータの人数にしたがって、前記システムの運用効率を示す情報を生成する評価部と、
    を備えることを特徴とする分析装置。
  2. 前記システムで発生しうる複数種類のエラーそれぞれの重大度を示す情報を保持するエラー属性保持部をさらに備え、
    前記第1取得部は、前記運用監視装置に保持された前記システムで発生したエラーを示す情報を取得し、
    前記評価部は、前記システムで発生したエラーおよびその重大度と、前記オペレータの人数にしたがって、前記システムで発生したエラーの重大度を反映した前記システムの運用効率を示す情報を生成することを特徴とする請求項1に記載の分析装置。
  3. 所定のシステムの動作状態を監視する運用監視装置に保持された前記システムに関する情報を取得する第1取得機能と、
    前記システムで発生し、前記運用監視装置が検出したエラーに対応すべきオペレータを支援するサービスデスク装置に保持されたオペレータに関する情報を取得する第2取得機能と、
    前記第1取得機能により取得された情報にもとづいて特定される前記システムの運用規模と、前記第2取得機能により取得された情報にもとづいて特定されるオペレータの人数にしたがって、前記システムの運用効率を示す情報を生成する機能と、
    をコンピュータに実現させるためのコンピュータプログラム。
JP2014096770A 2014-05-08 2014-05-08 分析装置およびコンピュータプログラム Active JP6436644B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014096770A JP6436644B2 (ja) 2014-05-08 2014-05-08 分析装置およびコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014096770A JP6436644B2 (ja) 2014-05-08 2014-05-08 分析装置およびコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2015215672A true JP2015215672A (ja) 2015-12-03
JP6436644B2 JP6436644B2 (ja) 2018-12-12

Family

ID=54752529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014096770A Active JP6436644B2 (ja) 2014-05-08 2014-05-08 分析装置およびコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP6436644B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020155025A (ja) * 2019-03-22 2020-09-24 三菱電機インフォメーションネットワーク株式会社 サービス量可視化システムおよびサービス量可視化プログラム
JP2020177454A (ja) * 2019-04-18 2020-10-29 ダイキン工業株式会社 目標未達情報提示システム及び目標未達情報提示プログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221410A (ja) * 2005-02-10 2006-08-24 Seiko Epson Corp 生産効率解析システムと生産効率解析プログラムと記録媒体と生産効率解析方法
WO2012060040A1 (ja) * 2010-11-05 2012-05-10 日本電気株式会社 運用状況可視化装置、運用状況可視化方法およびプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006221410A (ja) * 2005-02-10 2006-08-24 Seiko Epson Corp 生産効率解析システムと生産効率解析プログラムと記録媒体と生産効率解析方法
WO2012060040A1 (ja) * 2010-11-05 2012-05-10 日本電気株式会社 運用状況可視化装置、運用状況可視化方法およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
社団法人日本情報システム・ユーザー協会: "システム・リファレンス・マニュアル", オンライン, JPN6018014082, 6 April 2018 (2018-04-06), pages 3 - 6 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020155025A (ja) * 2019-03-22 2020-09-24 三菱電機インフォメーションネットワーク株式会社 サービス量可視化システムおよびサービス量可視化プログラム
JP7256662B2 (ja) 2019-03-22 2023-04-12 三菱電機インフォメーションネットワーク株式会社 サービス量可視化システムおよびサービス量可視化プログラム
JP2020177454A (ja) * 2019-04-18 2020-10-29 ダイキン工業株式会社 目標未達情報提示システム及び目標未達情報提示プログラム

Also Published As

Publication number Publication date
JP6436644B2 (ja) 2018-12-12

Similar Documents

Publication Publication Date Title
JP5719974B2 (ja) 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム
JP5605476B2 (ja) システム運用管理装置、システム運用管理方法、及びプログラム記憶媒体
CN103548009B (zh) 用于跨云管理和故障查找的方法和系统
US10360216B2 (en) Dynamic streaming of results of multi-leveled queries
CN103547994B (zh) 用于容量管理和灾难恢复的跨云计算的方法和系统
JP5267736B2 (ja) 障害検出装置、障害検出方法およびプログラム記録媒体
JP4980581B2 (ja) 性能監視装置、性能監視方法及びプログラム
US20120197686A1 (en) Predictive deconstruction of dynamic complexity
WO2017189012A1 (en) Dynamic streaming of query responses
JPWO2014162595A1 (ja) 管理システム及び管理プログラム
CN104956331A (zh) 管理计算机系统的管理系统及其管理方法
JP6436644B2 (ja) 分析装置およびコンピュータプログラム
JP6275542B2 (ja) 分析装置およびコンピュータプログラム
US9356848B2 (en) Monitoring apparatus, monitoring method, and non-transitory storage medium
JP5475602B2 (ja) 非同期処理サービス管理システム
JP5200678B2 (ja) サービシステム、サービスシステム管理方法、及びプログラム
US20150120921A1 (en) Techniques for workload toxic mapping
JP7466479B2 (ja) 業務改善支援装置、プログラムおよびプログラムを格納した記憶媒体
CN109274533A (zh) 一种基于规则引擎的Web服务故障的定位装置和方法
JP2020035297A (ja) 機器状態監視装置及びプログラム
JP5141788B2 (ja) システム使用率管理装置及びそれに用いるシステム使用率管理方法並びにそのプログラム
WO2023013045A1 (ja) 保全対応時期提案装置、保全対応時期方法、及び、保全対応時期提案プログラム
JP7012778B2 (ja) 監視システム、監視装置及び監視方法
JP5993052B2 (ja) 複数の監視対象デバイスを有する計算機システムの管理を行う管理システム
JP2023101205A (ja) 保全改善支援装置および保全改善支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170303

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20181016

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20181113

R150 Certificate of patent or registration of utility model

Ref document number: 6436644

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250