JP7131132B2 - 表示制御方法、表示制御プログラム、および表示制御装置 - Google Patents

表示制御方法、表示制御プログラム、および表示制御装置 Download PDF

Info

Publication number
JP7131132B2
JP7131132B2 JP2018124455A JP2018124455A JP7131132B2 JP 7131132 B2 JP7131132 B2 JP 7131132B2 JP 2018124455 A JP2018124455 A JP 2018124455A JP 2018124455 A JP2018124455 A JP 2018124455A JP 7131132 B2 JP7131132 B2 JP 7131132B2
Authority
JP
Japan
Prior art keywords
incident
ticket
identification information
display control
coping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018124455A
Other languages
English (en)
Other versions
JP2020004198A (ja
Inventor
慎之介 長倉
剛志 前田
端和 高宮
光希 有賀
貴史 昆野
冴子 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018124455A priority Critical patent/JP7131132B2/ja
Publication of JP2020004198A publication Critical patent/JP2020004198A/ja
Application granted granted Critical
Publication of JP7131132B2 publication Critical patent/JP7131132B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、表示制御方法、表示制御プログラム、および表示制御装置に関する。
従来、ユーザにサービスを提供するシステムで何らかのインシデントが発生したことに起因してサービスに何らかの問題が発生すると、システム運用側の作業者は、インシデントに対処し、インシデントを解決することになる。
先行技術としては、例えば、コンポーネントの識別子に基づき、指定時刻における業務システムの構成と監視情報を特定して出力するものがある。また、例えば、監視対象の構成の変化または状態の変化を数値化し、表示する技術がある。
特開2015-115018号公報 国際公開第2013/001609号
しかしながら、従来技術では、インシデントに対処することが難しい場合がある。例えば、対処に関する知識や経験の浅いような作業者は、インシデントにどのように対処すればよいのかを判断できず、どのように対処するかを調べることになり、インシデントに対処する作業にかかる作業時間および作業負担の増大化を招く。
1つの側面では、本発明は、インシデントに対処する作業負荷を軽減する技術を提供することを目的とする。
一つの実施形態によれば、監視対象の監視データと、前記監視対象の識別情報とを取得し、取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付けられたインシデント管理情報を生成し、生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力し、前記特定する処理は、前記識別情報に対応付けられた対処方法を特定した後、前記監視データが前記基準を満たさなくなるまで待機し、再び前記監視データが前記基準を満たす場合、前記識別情報に対応付けられた対処方法を特定する、表示制御方法、表示制御プログラム、および表示制御装置が提案される。
一態様によれば、インシデントに対処する作業負荷を軽減する技術を提供することが可能になる。
図1は、実施の形態にかかる表示制御方法の一実施例を示す説明図である。 図2は、インシデント管理システム200の一例を示す説明図である。 図3は、表示制御装置100のハードウェア構成例を示すブロック図である。 図4は、ナレッジチケットDB400の記憶内容の一例を示す説明図である。 図5は、閾値チケットDB500の記憶内容の一例を示す説明図である。 図6は、性能情報DB600の記憶内容の一例を示す説明図である。 図7は、監視装置202のハードウェア構成例を示すブロック図である。 図8は、管理装置203のハードウェア構成例を示すブロック図である。 図9は、端末装置204のハードウェア構成例を示すブロック図である。 図10は、表示制御装置100の機能的構成例を示すブロック図である。 図11は、インシデント管理システム200の具体的な機能的構成例を示すブロック図である。 図12は、各種チケットの対応付け状況の一例を示す説明図である。 図13は、閾値チケットを生成する一例を示す説明図である。 図14は、インシデントチケットを発行する一例を示す説明図である。 図15は、インシデントチケットの一覧を表示させる一例を示す説明図である。 図16は、インシデントチケットの内容を表示させる一例を示す説明図である。 図17は、性能情報を表示させる一例を示す説明図である。 図18は、チケット作成処理手順の一例を示すフローチャートである。 図19は、対応付け追加処理手順の一例を示すフローチャートである。 図20は、チケット収集処理手順の一例を示すフローチャートである。 図21は、性能情報収集処理手順の一例を示すフローチャートである。 図22は、管理情報発行処理手順の一例を示すフローチャート(その1)である。 図23は、管理情報発行処理手順の一例を示すフローチャート(その2)である。 図24は、管理情報発行処理手順の一例を示すフローチャート(その3)である。 図25は、対処終了処理手順の一例を示すフローチャートである。
以下に、図面を参照して、本発明にかかる表示制御方法、表示制御プログラム、および表示制御装置の実施の形態を詳細に説明する。
(実施の形態にかかる表示制御方法の一実施例)
図1は、実施の形態にかかる表示制御方法の一実施例を示す説明図である。図1において、表示制御装置100は、インシデントに対処する作業負荷の軽減化を図ることを可能にすることができるコンピュータである。
インシデントは、何らかのシステムで発生する事象である。システムは、例えば、ユーザにサービスを提供する。システムは、仮想化またはクラウド化され、大規模化する傾向がある。システムは、例えば、数百台~数千台のサーバまたは仮想マシンを含むことがある。インシデントの一例は、具体的には、システムに含まれるサーバの性能値が閾値を超えることである。性能値は、例えば、CPU(Central Processing Unit)使用率である。
システムでインシデントが発生すると、ユーザに提供されるサービスに問題が発生することがあり、ユーザが不利益を受ける可能性がある。問題は、例えば、スローダウンである。このため、システム運用側の作業者は、システムを監視し、インシデントが発生したことを発見し、インシデントに対処し、インシデントを解決するようにすることが望まれる。
ここで、システムの大規模化に伴い、1日あたりに発生するインシデントの数や種類が増大しやすくなる。例えば、1日あたり、システムに含まれる数百台~数千台のサーバのうち、3%ほどのサーバで性能値が閾値を超えるというインシデントが発生することがある。このため、もしもシステムに2千台のサーバが含まれれば、1日あたり60台ほどのサーバでインシデントが発生する。
また、1日あたりに発生するインシデントの数や種類が増大しやすいため、システム運用側の作業者は複数いることが好ましい。しかしながら、すべての作業者が、すべてのインシデントに対処可能であるとは限らない。例えば、サーバの性能値が閾値を超えるというインシデントに対処することが容易な作業者は、システム運用側の作業者のうち、10%ほどの一部の作業者であることがある。一部の作業者は、例えば、サーバの性能に関する知識を十分に有する有識者である。
これらのことから、システム運用側の作業者にかかる作業負担や作業時間が増大しやすいという問題がある。例えば、インシデントの種類が増大すれば、システムを監視する作業者の作業負担や作業時間が増大してしまう。また、例えば、一部の作業者が、相対的に多くのインシデントに対処することになり、一部の作業者の作業時間および作業負担が増大してしまう。また、例えば、有識者ではない作業者が、サーバの性能値が閾値を超えるというインシデントに対処しようとすると、サーバの性能に関する情報を調べることになり、有識者ではない作業者の作業時間および作業負担が増大してしまう。
このため、インシデントが解決するまでにかかる所要時間が増大しやすい。結果として、インシデントに起因してサービスに重大な問題が発生する前に、膨大なインシデントを解決しきれない可能性が高まり、インシデントに起因してサービスに重大な問題が発生する可能性が高まることになる。
これに対し、インシデントが発生したことを自動で検出して、どのようなインシデントが発生したかを示すインシデント管理情報を、システム運用側の作業者が参照可能に登録しておき、インシデントに対処する作業を支援する技術が考えられる。かかる技術でも、1日あたりに発生するインシデントの数が増大していると、インシデントが解決するまでにかかる所要時間の増大化を抑制することは困難である。
そこで、本実施の形態では、インシデントに対処する作業を支援し、システム運用側の作業者のうち、インシデントに対処する作業を実施することが容易な作業者の割合の増大化を図り、サービスに問題が発生しにくくする表示制御方法について説明する。
図1において、表示制御装置100は、記憶部110を有する。記憶部110は、監視対象120に関するインシデントへの対処方法160を、監視対象120の識別情報に対応付けて記憶する。監視対象120は、所定のシステム130の何らかの性能である。監視対象120は、例えば、所定のシステム130に含まれるサーバの性能である。性能は、例えば、CPU使用率、メモリ使用率、ネットワーク送受信速度などのいずれかである。監視対象120の識別情報は、例えば、監視対象120の名称である。
表示制御装置100は、監視対象120の監視データ140と、監視対象120の識別情報とを取得する。監視データ140は、例えば、監視対象120の性能を示すデータである。監視データ140は、例えば、所定のシステム130に含まれるサーバのCPU使用率、メモリ使用率、ネットワーク送受信速度などのいずれかの値を示すデータである。
表示制御装置100は、取得した監視データ140が、取得した監視対象120の識別情報に対応付けられた基準150を満たすか否かの判定を行う。基準150は、インシデントが発生したと判断する条件である。基準150は、例えば、監視対象120の性能が一定以上悪いことを示す。基準150は、例えば、後述する閾値チケットを用いて、監視対象120の識別情報と対応付けられる。基準150は、具体的には、CPU使用率が閾値を超えたことである。
表示制御装置100は、監視データ140が基準150を満たす場合、記憶部110を参照して、取得した識別情報に対応付けられた対処方法160を特定する。表示制御装置100は、取得した監視データ140および監視対象120の識別情報に基づき、特定した対処方法160に対応付けられたインシデント管理情報170を生成する。インシデント管理情報170は、発生したインシデントを示す。インシデント管理情報170は、例えば、監視データ140と監視対象120の識別情報とにより、発生したインシデントを示す。インシデント管理情報170は、発生したインシデントについての対処方法160を特定可能に、対処方法160が対応付けられる。
これにより、表示制御装置100は、発生したインシデントを示すインシデント管理情報170を、作業者が参照可能に蓄積することができる。表示制御装置100は、例えば、インシデント管理情報170の一覧180の、表示端末190への表示指示を出力することができる。このため、作業者は、インシデント管理情報170の一覧180を参照し、所定のシステム130において発生しているインシデントを把握することができる。また、作業者が複数いる場合、複数の作業者は、それぞれ、所定のシステム130において発生しているインシデントを把握することができ、インシデントに対処する作業を分担することができる。
表示制御装置100は、生成したインシデント管理情報170の指定を受け付けると、特定した対処方法160の表示端末190への表示指示を出力する。これにより、表示制御装置100は、作業者がインシデントへの対処方法160を参照可能にし、インシデントに対処する作業の容易化を図ることができ、作業者にかかる作業負担や作業時間の低減化を図ることができる。このため、表示制御装置100は、所定のシステム130において発生しているインシデントに対処する作業を実施することが容易な作業者の割合の増大化を図ることができる。
結果として、表示制御装置100は、インシデントが解決するまでにかかる所要時間の低減化を図ることができ、インシデントに起因してサービスに重大な問題が発生する可能性の低減化を図ることができる。また、表示制御装置100は、インシデントの種類が増大しても、所定のシステム130を監視するための作業負担や作業時間の増大化を抑制することができる。
例えば、従来では、作業者は、システムにおいて発生しているインシデントのうち、自身で対処可能なインシデントを選択して対処する傾向がある。このため、10%ほどの一部の作業者が、相対的に多くのインシデントに対処することになり、一部の作業者の作業時間および作業負担が増大してしまうことがある。これに対し、表示制御装置100は、すべての作業者が、すべてのインシデントに対処可能になるように、インシデントに対処する作業を支援することができ、作業者の作業時間および作業負担の増大化を抑制することができる。
ここでは、作業者が、インシデントに対処する作業を実施する場合について説明したが、これに限らない。例えば、対処方法160を自動で実施可能であれば、表示制御装置100が、インシデントに対処する作業を自動で実施し、作業者の作業負担や作業時間の低減化を図る場合があってもよい。
ここでは、表示制御装置100が、表示端末190とは別の装置である場合について説明したが、これに限らない。例えば、表示制御装置100が、表示端末190としても動作可能である場合があってもよい。
(インシデント管理システム200の一例)
次に、図2を用いて、図1に示した表示制御装置100を適用した、インシデント管理システム200の一例について説明する。
図2は、インシデント管理システム200の一例を示す説明図である。図2において、インシデント管理システム200は、表示制御装置100と、ユーザシステム201と、監視装置202と、管理装置203と、1以上の端末装置204とを含む。
インシデント管理システム200において、表示制御装置100と監視装置202とは、例えば、直接接続される。表示制御装置100と監視装置202とは、例えば、有線または無線のネットワーク210を介して接続されてもよい。ネットワーク210は、例えば、LAN(Local Area Network)、WAN(Wide Area Network)、インターネットなどである。また、表示制御装置100と管理装置203とは、例えば、直接接続される。表示制御装置100と管理装置203とは、例えば、ネットワーク210を介して接続されてもよい。管理装置203と端末装置204とは、例えば、ネットワーク210を介して接続される。
表示制御装置100は、ユーザシステム201で発生したインシデントに対処する作業を支援する。表示制御装置100は、例えば、図4~図6に後述する各種DB(DataBase)を有する。表示制御装置100は、例えば、管理装置203からナレッジチケットや閾値チケットを収集し、図4に後述するナレッジチケットDB400や図5に後述する閾値チケットDB500に保存する。閾値チケットは、インシデントが発生したと判断する条件を示す情報である。ナレッジチケットは、インシデントへの対処方法を示す情報である。対処方法は、作業者により手動で実施される。対処方法は、自動で実行可能であってもよい。ここで、閾値チケットは、いずれかのナレッジチケットと対応付けられる。
表示制御装置100は、例えば、監視装置202から性能情報を収集し、図6に後述する性能情報DB600に保存する。性能情報は、ユーザシステム201の性能値を示す。性能情報は、例えば、ユーザシステム201に含まれるサーバの性能値を示す。表示制御装置100は、例えば、閾値チケットを参照し、性能情報に基づいて、インシデントが発生したと判断すると、インシデントへの対処方法を示すナレッジチケットを特定する。表示制御装置100は、例えば、特定したナレッジチケットと対応付けたインシデントチケットを発行する。インシデントチケットは、インシデントが発生したことを示す情報である。また、表示制御装置100は、例えば、特定したナレッジチケットが自動で実行可能な対処方法を示す場合、対処方法を自動で実行し、対処方法を実行中であることを示すようにしたインシデントチケットを発行してもよい。
表示制御装置100は、例えば、インシデントに対処する作業者がインシデントチケットを参照可能に、管理装置203を介して、インシデントチケットを端末装置204に表示させる。表示制御装置100は、例えば、いずれかのインシデントチケットが指定されると、指定のインシデントチケットに対応付けられたナレッジチケットが示す対処方法を、管理装置203を介して、端末装置204に表示させる。表示制御装置100は、例えば、サーバやPC(Personal Computer)などである。
ユーザシステム201は、ユーザにサービスを提供するシステムである。ユーザシステム201は、例えば、複数のサーバを含む。ユーザシステム201は、インシデントが発生した場合、作業者によりインシデントに対処する作業が行われる。監視装置202は、ユーザシステム201の性能値を計測し、性能情報を蓄積するコンピュータである。監視装置202は、蓄積した性能情報を、表示制御装置100に送信する。監視装置202は、例えば、サーバやPCなどである。
管理装置203は、端末装置204と通信し、ナレッジチケットや閾値チケットを生成するコンピュータである。管理装置203は、生成したナレッジチケットや閾値チケットを、表示制御装置100に送信する。また、管理装置203は、端末装置204と通信し、インシデントチケットを、端末装置204に表示させる。また、管理装置203は、端末装置204と通信し、インシデントチケットに対応付けられたナレッジチケットを、端末装置204に表示させる。管理装置203は、例えば、サーバやPCなどである。
端末装置204は、作業者によって利用されるコンピュータである。端末装置204は、管理装置203と通信し、管理装置203においてナレッジチケットや閾値チケットを生成させる。また、端末装置204は、管理装置203と通信し、インシデントチケットを表示する。また、端末装置204は、管理装置203と通信し、インシデントチケットに対応付けられたナレッジチケットを表示する。端末装置204は、例えば、PC、タブレット端末、または、スマートフォンなどである。端末装置204は、例えば、図1に示した表示端末190に対応する。
ここでは、表示制御装置100が、監視装置202とは別の装置である場合について説明したが、これに限らない。例えば、表示制御装置100が、監視装置202と一体である場合があってもよい。また、ここでは、表示制御装置100が、管理装置203とは別の装置である場合について説明したが、これに限らない。例えば、表示制御装置100が、管理装置203と一体である場合があってもよい。
(表示制御装置100のハードウェア構成例)
次に、図3を用いて、図2に示したインシデント管理システム200に含まれる表示制御装置100のハードウェア構成例について説明する。
図3は、表示制御装置100のハードウェア構成例を示すブロック図である。図3において、表示制御装置100は、CPU301と、メモリ302と、通信I/F(Interface)303と、記録媒体I/F304と、記録媒体305とを有する。また、各構成部は、バス300によってそれぞれ接続される。
ここで、CPU301は、表示制御装置100の全体の制御を司る。メモリ302は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)およびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU301のワークエリアとして使用される。メモリ302に記憶されるプログラムは、CPU301にロードされることで、コーディングされている処理をCPU301に実行させる。メモリ302は、例えば、図4~図6に後述する各種DBを記憶する。
通信I/F303は、通信回線を通じて他のコンピュータに接続される。通信I/F303は、例えば、監視装置202および管理装置203に接続される。通信I/F303は、例えば、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して監視装置202および管理装置203に接続されてもよい。そして、通信I/F303は、例えば、監視装置202および管理装置203と内部のインターフェースを司り、監視装置202および管理装置203からのデータの入出力を制御する。通信I/F303は、例えば、モデムやLANアダプタなどである。
記録媒体I/F304は、CPU301の制御に従って記録媒体305に対するデータのリード/ライトを制御する。記録媒体I/F304は、例えば、ディスクドライブ、SSD(Solid State Drive)、USB(Universal Serial Bus)ポートなどである。記録媒体305は、記録媒体I/F304の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体305は、例えば、図4~図6に後述する各種DBを記憶してもよい。記録媒体305は、例えば、ディスク、半導体メモリ、USBメモリなどである。記録媒体305は、表示制御装置100から着脱可能であってもよい。
表示制御装置100は、上述した構成部の他、例えば、キーボード、マウス、ディスプレイ、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、表示制御装置100は、記録媒体I/F304や記録媒体305を複数有していてもよい。また、表示制御装置100は、記録媒体I/F304や記録媒体305を有していなくてもよい。
(ナレッジチケットDB400の記憶内容)
次に、図4を用いて、ナレッジチケットDB400の記憶内容の一例について説明する。ナレッジチケットDB400は、例えば、図3に示した表示制御装置100のメモリ302や記録媒体305などの記憶領域により実現される。
図4は、ナレッジチケットDB400の記憶内容の一例を示す説明図である。図4に示すように、ナレッジチケットDB400は、ナレッジIDと、現象と、対処と、自動実行プロセスとのフィールドを有する。ナレッジチケットDB400は、インシデントへの対処方法ごとに各フィールドに情報を設定することにより、ナレッジチケットがレコードとして記憶される。
ナレッジIDのフィールドには、ナレッジチケットを識別するナレッジIDが設定される。現象のフィールドには、インシデントとなる現象の内容が設定される。対処のフィールドには、作業者が手動で実施可能な、インシデントへの対処方法が設定される。自動実行プロセスのフィールドには、自動で実行可能な、インシデントへの対処方法が設定される。
(閾値チケットDB500の記憶内容)
次に、図5を用いて、閾値チケットDB500の記憶内容の一例について説明する。閾値チケットDB500は、例えば、図3に示した表示制御装置100のメモリ302や記録媒体305などの記憶領域により実現される。
図5は、閾値チケットDB500の記憶内容の一例を示す説明図である。図5に示すように、閾値チケットDB500は、閾値チケットIDと、条件Noと、曜日と、開始時刻と、終了時刻と、性能データ名と、閾値と、比較と、ホスト名と、リソースIDとのフィールドを有する。また、閾値チケットDB500は、さらに、関連ParentChildと、関連AutomationOfDealとのフィールドを有する。閾値チケットDB500は、インシデントが発生したと判断する条件ごとに各フィールドに情報を設定することにより、閾値チケットがレコードとして記憶される。
閾値チケットIDのフィールドには、閾値チケットを識別する閾値チケットIDが設定される。条件Noのフィールドには、閾値チケットが示す1以上の条件に割り振られる番号が設定される。曜日のフィールドには、条件判定を実行する曜日が設定される。開始時刻のフィールドには、条件判定を実行する期間の開始時刻が設定される。終了時刻のフィールドには、条件判定を実行する期間の終了時刻が設定される。
性能データ名のフィールドには、条件判定に利用する性能値の種類を示す性能データ名が設定される。閾値のフィールドには、条件判定に利用する閾値が設定される。比較のフィールドには、性能値と閾値との比較に利用する比較演算子が設定される。ホスト名のフィールドには、条件判定に利用する性能値を、いずれかのサーバの性能値に限定する場合、いずれかのサーバを識別するホスト名が設定される。リソースIDのフィールドには、条件判定に利用する性能値を、いずれかのリソースの性能値に限定する場合、いずれかのリソースを識別するリソースIDが設定される。リソースは、例えば、CドライブやDドライブなどである。
関連ParentChildのフィールドには、インシデントが発生した場合に作業者が手動で実施可能である対処方法を示すナレッジチケットを識別するナレッジIDが設定される。関連ParentChildのフィールドには、複数のナレッジIDが設定されてもよい。関連AutomationOfDealのフィールドには、インシデントが発生した場合に自動で実行可能である対処方法を示すナレッジチケットを識別するナレッジIDが設定される。関連AutomationOfDealのフィールドには、複数のナレッジIDが設定されてもよい。
(性能情報DB600の記憶内容)
次に、図6を用いて、性能情報DB600の記憶内容の一例について説明する。性能情報DB600は、例えば、図3に示した表示制御装置100のメモリ302や記録媒体305などの記憶領域により実現される。
図6は、性能情報DB600の記憶内容の一例を示す説明図である。図6に示すように、性能情報DB600は、時刻と、性能データ名と、値と、ホスト名と、リソースIDとのフィールドを有する。性能情報DB600は、時刻ごとに各フィールドに情報を設定することにより、性能情報がレコードとして記憶される。
時刻のフィールドには、性能値を計測した時刻が設定される。性能データ名のフィールドには、性能値の種類を示す性能データ名が設定される。値のフィールドには、性能値が設定される。ホスト名のフィールドには、性能値が計測されたサーバを識別するホスト名が設定される。リソースIDのフィールドには、性能値が計測されたリソースを識別するリソースIDが設定される。リソースは、例えば、CドライブやDドライブなどである。
(監視装置202のハードウェア構成例)
次に、図7を用いて、図2に示したインシデント管理システム200に含まれる監視装置202のハードウェア構成例について説明する。
図7は、監視装置202のハードウェア構成例を示すブロック図である。図7において、監視装置202は、CPU701と、メモリ702と、通信I/F703と、記録媒体I/F704と、記録媒体705とを有する。また、各構成部は、バス700によってそれぞれ接続される。
ここで、CPU701は、監視装置202の全体の制御を司る。メモリ702は、例えば、ROM、RAMおよびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU701のワークエリアとして使用される。メモリ702に記憶されるプログラムは、CPU701にロードされることで、コーディングされている処理をCPU701に実行させる。メモリ702は、例えば、性能情報を記憶する。メモリ702は、具体的には、図6に示した性能情報DB600と同様のDBを用いて性能情報を記憶する。
通信I/F703は、通信回線を通じて他のコンピュータに接続される。通信I/F703は、例えば、表示制御装置100およびユーザシステム201に接続される。通信I/F703は、例えば、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して表示制御装置100およびユーザシステム201に接続されてもよい。そして、通信I/F703は、例えば、表示制御装置100およびユーザシステム201と内部のインターフェースを司り、表示制御装置100およびユーザシステム201からのデータの入出力を制御する。通信I/F703は、例えば、モデムやLANアダプタなどである。
記録媒体I/F704は、CPU701の制御に従って記録媒体705に対するデータのリード/ライトを制御する。記録媒体I/F704は、例えば、ディスクドライブ、SSD、USBポートなどである。記録媒体705は、記録媒体I/F704の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体705は、例えば、性能情報を記憶してもよい。記録媒体705は、例えば、ディスク、半導体メモリ、USBメモリなどである。記録媒体705は、監視装置202から着脱可能であってもよい。
監視装置202は、上述した構成部の他、例えば、キーボード、マウス、ディスプレイ、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、監視装置202は、記録媒体I/F704や記録媒体705を複数有していてもよい。また、監視装置202は、記録媒体I/F704や記録媒体705を有していなくてもよい。
(管理装置203のハードウェア構成例)
次に、図8を用いて、図2に示したインシデント管理システム200に含まれる管理装置203のハードウェア構成例について説明する。
図8は、管理装置203のハードウェア構成例を示すブロック図である。図8において、管理装置203は、CPU801と、メモリ802と、通信I/F803と、記録媒体I/F804と、記録媒体805とを有する。また、各構成部は、バス800によってそれぞれ接続される。
ここで、CPU801は、管理装置203の全体の制御を司る。メモリ802は、例えば、ROM、RAMおよびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU801のワークエリアとして使用される。メモリ802に記憶されるプログラムは、CPU801にロードされることで、コーディングされている処理をCPU801に実行させる。メモリ802は、例えば、ナレッジチケットを記憶する。メモリ802は、具体的には、図4に示したナレッジチケットDB400と同様のDBを用いて、ナレッジチケットを記憶する。メモリ802は、例えば、閾値チケットを記憶する。メモリ802は、具体的には、図5に示した閾値チケットDB500と同様のDBを用いて、閾値チケットを記憶する。
通信I/F803は、通信回線を通じて他のコンピュータに接続される。通信I/F803は、例えば、表示制御装置100に接続される。通信I/F803は、例えば、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して端末装置204に接続される。そして、通信I/F803は、例えば、表示制御装置100および端末装置204と内部のインターフェースを司り、表示制御装置100および端末装置204からのデータの入出力を制御する。通信I/F803は、例えば、モデムやLANアダプタなどである。
記録媒体I/F804は、CPU801の制御に従って記録媒体805に対するデータのリード/ライトを制御する。記録媒体I/F804は、例えば、ディスクドライブ、SSD、USBポートなどである。記録媒体805は、記録媒体I/F804の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体805は、例えば、ナレッジチケットを記憶してもよい。記録媒体805は、例えば、閾値チケットを記憶してもよい。記録媒体805は、例えば、ディスク、半導体メモリ、USBメモリなどである。記録媒体805は、管理装置203から着脱可能であってもよい。
管理装置203は、上述した構成部の他、例えば、キーボード、マウス、ディスプレイ、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、管理装置203は、記録媒体I/F804や記録媒体805を複数有していてもよい。また、管理装置203は、記録媒体I/F804や記録媒体805を有していなくてもよい。
(端末装置204のハードウェア構成例)
次に、図9を用いて、図2に示したインシデント管理システム200に含まれる端末装置204のハードウェア構成例について説明する。
図9は、端末装置204のハードウェア構成例を示すブロック図である。図9において、端末装置204は、CPU901と、メモリ902と、通信I/F903と、記録媒体I/F904と、記録媒体905と、ディスプレイ906と、入力装置907とを有する。また、各構成部は、バス900によってそれぞれ接続される。
ここで、CPU901は、端末装置204の全体の制御を司る。メモリ902は、例えば、ROM、RAMおよびフラッシュROMなどを有する。具体的には、例えば、フラッシュROMやROMが各種プログラムを記憶し、RAMがCPU901のワークエリアとして使用される。メモリ902に記憶されるプログラムは、CPU901にロードされることで、コーディングされている処理をCPU901に実行させる。
通信I/F903は、通信回線を通じてネットワーク210に接続され、ネットワーク210を介して他のコンピュータに接続される。他のコンピュータは、例えば、管理装置203である。そして、通信I/F903は、ネットワーク210と内部のインターフェースを司り、他のコンピュータからのデータの入出力を制御する。通信I/F903は、例えば、モデムやLANアダプタなどである。
記録媒体I/F904は、CPU901の制御に従って記録媒体905に対するデータのリード/ライトを制御する。記録媒体I/F904は、例えば、ディスクドライブ、SSD、USBポートなどである。記録媒体905は、記録媒体I/F904の制御で書き込まれたデータを記憶する不揮発メモリである。記録媒体905は、例えば、ディスク、半導体メモリ、USBメモリなどである。記録媒体905は、端末装置204から着脱可能であってもよい。
ディスプレイ906は、カーソル、アイコンあるいはツールボックスをはじめ、文書、画像、機能情報などのデータを表示する。ディスプレイ906は、例えば、CRT(Cathode Ray Tube)、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイなどである。入力装置907は、文字、数字、各種指示などの入力のためのキーを有し、データの入力を行う。入力装置907は、キーボードやマウスなどであってもよく、また、タッチパネル式の入力パッドやテンキーなどであってもよい。
端末装置204は、上述した構成部の他、例えば、プリンタ、スキャナ、マイク、スピーカーなどを有してもよい。また、端末装置204は、記録媒体I/F904や記録媒体905を複数有していてもよい。また、端末装置204は、記録媒体I/F904や記録媒体905を有していなくてもよい。
(表示制御装置100の機能的構成例)
次に、図10を用いて、表示制御装置100の機能的構成例について説明する。
図10は、表示制御装置100の機能的構成例を示すブロック図である。図10に示すように、表示制御装置100は、記憶部1000と、取得部1001と、判定部1002と、特定部1003と、生成部1004と、出力部1005とを含む。
記憶部1000は、例えば、図3に示したメモリ302や記録媒体305などの記憶領域によって実現される。以下では、記憶部1000が、表示制御装置100に含まれる場合について説明するが、これに限らない。例えば、記憶部1000が、表示制御装置100とは異なる装置に含まれ、記憶部1000の記憶内容が表示制御装置100から参照可能である場合があってもよい。
取得部1001~出力部1005は、制御部の一例として機能する。取得部1001~出力部1005は、具体的には、例えば、図3に示したメモリ302や記録媒体305などの記憶領域に記憶されたプログラムをCPU301に実行させることにより、または、通信I/F303により、その機能を実現する。各機能部の処理結果は、例えば、図3に示したメモリ302や記録媒体305などの記憶領域に記憶される。
記憶部1000は、各機能部の処理において参照され、または更新される各種情報を記憶する。記憶部1000は、例えば、監視対象に関するインシデントへの対処方法を、該監視対象の識別情報に対応付けて記憶する。監視対象は、ユーザシステム201の性能である。監視対象は、例えば、ユーザシステム201に含まれるサーバの性能である。性能は、例えば、CPU使用率、メモリ使用率、ネットワーク送受信速度などのいずれかである。監視対象の識別情報は、例えば、監視対象の名称である。監視対象の名称は、具体的には、性能データ名である。対処方法は、例えば、過去に実施されたことがある方法である。対処方法は、例えば、FAQ(Frequently Asked Questions)であってもよい。
記憶部1000は、具体的には、クローズ済みのインシデントチケットを、ナレッジチケットとして、ナレッジチケットDB400に記憶する。クローズは、インシデントチケットが示すインシデントに対処済みであり、インシデントが解決済みであることを示す。クローズ済みのインシデントチケットは、実際に実施され、インシデントを解決することができた対処方法が対応付けられる。ナレッジチケットは、インシデントへの対処方法が対応付けられる。ナレッジチケットは、インシデントの内容または原因をさらに対応付けられてもよい。また、記憶部1000は、具体的には、FAQチケットを、ナレッジチケットとして、ナレッジチケットDB400に記憶する。FAQチケットは、FAQの内容を示す。
また、記憶部1000は、例えば、監視対象に関するインシデントへの対処方法と、該インシデントの内容または原因とを、該監視対象の識別情報に対応付けて記憶してもよい。インシデントの内容は、インシデントとなる現象の内容である。インシデントの原因は、インシデントが発生した原因である。記憶部1000は、具体的には、ナレッジチケットを、ナレッジチケットDB400に記憶する。
記憶部1000は、例えば、監視対象の監視データを記憶する。監視データは、例えば、監視対象の性能を示す。監視データは、具体的には、性能情報である。性能情報は、ユーザシステム201の性能値を示す。性能情報は、例えば、ユーザシステム201に含まれるサーバの性能値を示す。性能値は、例えば、CPU使用率、メモリ使用率、ネットワーク送受信速度などのいずれかの値である。記憶部1000は、具体的には、性能情報DB600を記憶する。
記憶部1000は、例えば、監視対象の識別情報に対応付けられた基準を記憶する。基準は、インシデントが発生したと判断する条件である。基準は、例えば、監視対象の性能が一定以上悪いことを示す。基準は、例えば、閾値チケットに含まれる。基準は、例えば、閾値チケットを用いて、監視対象の識別情報と対応付けられる。基準は、具体的には、CPU使用率が閾値を超えたことである。記憶部1000は、具体的には、閾値チケットDB500を記憶する。
記憶部1000は、例えば、インシデント管理情報を記憶する。インシデント管理情報は、発生したインシデントを示す。インシデント管理情報は、例えば、クローズされていないインシデントチケットである。
取得部1001は、各機能部の処理に用いられる各種情報を取得する。取得部1001は、取得した各種情報を、記憶部1000に記憶し、または、各機能部に出力する。また、取得部1001は、記憶部1000に記憶しておいた各種情報を、各機能部に出力してもよい。取得部1001は、例えば、ユーザの操作入力に基づき、各種情報を取得する。取得部1001は、例えば、表示制御装置100とは異なる装置から、各種情報を受信してもよい。
取得部1001は、具体的には、インシデントへの対処方法を示す情報を取得する。取得部1001は、より具体的には、ナレッジチケットとして、クローズ済みのインシデントチケットやFAQチケットなどを、管理装置203から受信する。取得部1001は、具体的には、監視対象の識別情報に対応付けられた基準を取得する。取得部1001は、より具体的には、閾値チケットを、管理装置203から受信する。取得部1001は、具体的には、監視対象の監視データと、監視対象の識別情報とを取得する。取得部1001は、より具体的には、性能情報を、監視装置202から受信する。
判定部1002は、取得した監視データが、取得した識別情報に対応付けられた基準を満たすか否かの判定を行う。判定部1002は、例えば、サーバのCPU使用率に関する閾値チケットに基づいて、サーバのCPU使用率が閾値を超えたか否かを判定する。そして、判定部1002は、サーバのCPU使用率が閾値を超えると、基準を満たすと判定する。これにより、判定部1002は、インシデントが発生したことを検出することができる。
特定部1003は、監視データが基準を満たす場合、記憶部1000を参照して、取得した識別情報に対応付けられた対処方法を特定する。特定部1003は、例えば、サーバのCPU使用率に関する閾値チケットに対応付けられた、対処方法が記載されたナレッジチケットを特定する。特定部1003は、具体的には、サーバのCPU使用率に関する閾値チケットのParentChildのフィールドに設定されたナレッジIDが示し、作業者が手動で実施可能な対処方法が記載されたナレッジチケットを特定する。
また、特定部1003は、具体的には、サーバのCPU使用率に関する閾値チケットのAutomationOfDealのフィールドに設定されたナレッジIDが示し、自動で実行可能な対処方法が記載されたナレッジチケットを特定してもよい。これにより、特定部1003は、作業者がインシデントに対処する際に有用な情報になりうる、作業者が手動で実施可能な対処方法を特定することができる。また、特定部1003は、作業者を介さずに、対処方法を自動で実行可能にすることができる。
特定部1003は、監視データが基準を満たす場合、さらに、記憶部1000を参照して、取得した識別情報に対応付けられたインシデントの内容または原因を特定してもよい。特定部1003は、例えば、サーバのCPU使用率に関する閾値チケットに対応付けられた、対処方法の他にインシデントの内容または原因が記載されたナレッジチケットを特定する。特定部1003は、具体的には、サーバのCPU使用率に関する閾値チケットのParentChildのフィールドに設定されたナレッジIDが示し、対処方法の他にインシデントの内容または原因が記載されたナレッジチケットを特定する。
また、特定部1003は、具体的には、サーバのCPU使用率に関する閾値チケットのAutomationOfDealのフィールドに設定されたナレッジIDが示し、対処方法の他にインシデントの内容や原因が記載されたナレッジチケットを特定してもよい。これにより、特定部1003は、作業者がインシデントに対処する際に有用な情報になりうる、対処方法により解決可能なインシデントの内容または原因を特定することができる。対処方法により解決可能なインシデントは、例えば、過去に対処方法が実施されたことがあるインシデントである。
特定部1003は、取得した識別情報に対応付けられた対処方法が複数ある場合、所定の条件を満たす対処方法を特定する。所定の条件は、例えば、対処方法が実施される対象についての条件である。所定の条件は、具体的には、対処方法が過去に実施されたことがあるサーバについての条件である。所定の条件は、例えば、対処方法が実施された時期、または、対処方法が作成された時期についての条件であってもよい。所定の条件は、例えば、対処方法を過去に実施した作業者、または、対処方法を作成した作業者についての条件であってもよい。
特定部1003は、例えば、複数の対処方法のうち、今回監視データが基準を満たしたサーバについて過去に実施されたことがある対処方法を特定する。また、特定部1003は、例えば、複数の対処方法のうち、過去に実施された時期が新しい順に、所定数の対処方法を特定してもよい。また、特定部1003は、例えば、複数の対処方法のうち、有識者である作業者によって過去に実施されたことがある対処方法を特定してもよい。これにより、特定部1003は、作業者によって有用性が高いと判断される対処方法を特定することができる。
特定部1003は、識別情報に対応付けられた対処方法を特定した後、監視データが基準を満たさなくなるまで待機し、再び監視データが基準を満たす場合、識別情報に対応付けられた対処方法を特定する。これにより、特定部1003は、監視データが基準を満たしている間、連続して対処方法を特定してしまうことを防止し、1つのインシデントに対して複数のインシデントチケットが生成されてしまうことを防止することができる。
生成部1004は、取得した監視データおよび識別情報に基づき、特定した対処方法に対応付けられたインシデント管理情報を生成する。生成部1004は、例えば、取得した性能情報および性能データ名に基づき、発生したインシデントの内容を示すインシデントチケットを生成し、特定したナレッジチケットに対応付ける。ここでは、ナレッジチケットは、少なくとも対処方法を示す。これにより、生成部1004は、発生したインシデントを作業者が把握可能にインシデントチケットを蓄積することができ、発生したインシデントへの対処方法を特定可能にしておくことができる。
生成部1004は、特定した対処方法と、特定したインシデントの内容または原因とに対応付けられたインシデント管理情報を生成してもよい。生成部1004は、例えば、取得した性能情報および性能データ名に基づき、発生したインシデントの内容を示すインシデントチケットを生成し、特定したナレッジチケットに対応付ける。ここでは、ナレッジチケットは、対処方法の他に、インシデントの内容または原因を示す。これにより、生成部1004は、対処方法がどのような内容または原因のインシデントに有効であるかを、作業者が把握可能にすることができる。
生成部1004は、自動実行可能な対処方法を特定した場合、対処方法と対応付けずにインシデント管理情報を生成してもよい。生成部1004は、例えば、自動で実行可能な対処方法が記載されたナレッジチケットが特定され、対処方法が自動実行された場合、ナレッジチケットと対応付けず、対処方法を実行中であることを対応付けたインシデントチケットを生成する。これにより、生成部1004は、対処方法を実行中であることを作業者が把握可能にすることができる。
出力部1005は、生成したインシデント管理情報の表示端末への表示指示を出力する。表示端末は、例えば、端末装置204である。出力部1005は、例えば、生成したインシデントチケットの一覧の表示指示を、管理装置203を介して端末装置204に送信する。これにより、出力部1005は、発生しているインシデントを作業者が把握可能にすることができ、いずれかのインシデントを示すインシデントチケットを作業者が指定可能にすることができる。
出力部1005は、生成したインシデント管理情報の指定を受け付けると、特定した対処方法の表示端末への表示指示を出力する。出力部1005は、例えば、インシデントチケットの指定を受け付ける。そして、出力部1005は、指定されたインシデントチケットに対応付けられたナレッジチケットに記載された手動で実施可能な対処方法の表示指示を、管理装置203を介して端末装置204に送信する。これにより、出力部1005は、発生したインシデントについて実施可能な対処方法の候補を、作業者が把握可能にすることができる。
出力部1005は、生成したインシデント管理情報の指定を受け付けると、特定した対処方法と、特定した内容または原因との、表示端末への表示指示を出力する。出力部1005は、例えば、インシデントチケットの指定を受け付ける。そして、出力部1005は、指定されたインシデントチケットに対応付けられたナレッジチケットに記載された手動で実施可能な対処方法と、インシデントの内容または原因との表示指示を、管理装置203を介して端末装置204に送信する。これにより、出力部1005は、発生したインシデントについて実施可能な対処方法の候補が、どのような内容または原因のインシデントに有効であるかを、作業者が把握可能にすることができる。
出力部1005は、特定した対処方法を自動実行する実行指示を出力する。出力部1005は、自動で実行可能な対処方法が記載されたナレッジチケットが特定された場合、自動で実行可能な対処方法を自動実行する実行指示を出力する。出力先は、例えば、監視装置202やユーザシステム201である。これにより、出力部1005は、インシデントに自動で対処することができ、作業者の作業時間や作業負担の低減化を図ることができる。
(インシデント管理システム200の具体的な機能的構成例)
次に、図11を用いて、インシデント管理システム200の具体的な機能的構成例について説明する。
図11は、インシデント管理システム200の具体的な機能的構成例を示すブロック図である。図11に示すように、管理装置203は、端末装置204と通信し、閾値チケット1111やナレッジチケット1112を生成し、閾値チケット1111とナレッジチケット1112とを対応付けて記憶する。ナレッジチケット1112は、過去のクローズ済みのインシデントチケットやFAQチケットである。
表示制御装置100は、図4~図6に示した各種DBと、診断結果DB1100と、エージェント1101と、評価部1102と、通知部1103とを含む。エージェント1101は、管理装置203から閾値チケット1111を収集し、閾値チケットDB500に記憶する。エージェント1101は、管理装置203からナレッジチケット1112を収集し、ナレッジチケットDB400に記憶する。
評価部1102は、閾値チケットDB500と性能情報DB600とに基づいて、性能情報が、閾値チケット1111が示す閾値条件を満たすか否かを判定し、判定結果をエージェント1101に送信する。閾値条件は、インシデントが発生したと判断する条件である。閾値条件は、例えば、性能情報を閾値とどのように比較するかを示す。
閾値チケット1111は、いずれの性能情報を閾値と比較するかを示す時間条件や資源条件を示してもよい。時間条件は、閾値を、いずれの期間に計測された性能情報と比較するかを示す。資源条件は、閾値を、いずれの資源についての性能情報と比較するかを示す。資源は、例えば、サーバやリソースである。評価部1102は、例えば、閾値チケット1111が示す時間条件および資源条件に合致する性能情報が、閾値チケット1111が示す閾値条件を満たすか否かを判定し、判定結果をエージェント1101に送信する。
エージェント1101は、評価部1102から受信した判定結果を、診断結果DB1100に蓄積する。エージェント1101は、診断結果DB1100に蓄積した判定結果を、通知部1103に送信する。通知部1103は、判定結果に基づいて、対処方法を対応付けたオープンなインシデントチケット1113を発行し、管理装置203に送信し、閾値チケット1111に対応付けさせる。オープンは、インシデントチケット1113が示すインシデントにまだ対処していないことを示す。対処方法を対応付けたインシデントチケット1113は、リコメンドとも呼ばれる。
(各種チケットの対応付け状況の一例)
次に、図12を用いて、図11に示したインシデント管理システム200における各種チケットの対応付け状況の一例について説明する。
図12は、各種チケットの対応付け状況の一例を示す説明図である。図12に示すように、管理装置203は、閾値チケット1200を有する。また、管理装置203は、ナレッジチケットとして自動対処インシデントチケット1210と自動対処FAQチケット1211とを有する。自動対処インシデントチケット1210は、クローズ済みであり、自動で実行可能な対処方法が記載されたインシデントチケットである。自動対処FAQチケット1211は、自動で実行可能な対処方法となる回答文を含むFAQが記載されたFAQチケットである。
また、管理装置203は、ナレッジチケットとして手動対処インシデントチケット1220と手動対処FAQチケット1221とを有する。手動対処インシデントチケット1220は、クローズ済みであり、手動で実施可能な対処方法が記載されたインシデントチケットである。手動対処FAQチケット1221は、手動で実施可能な対処方法となる回答文を含むFAQが記載されたFAQチケットである。
管理装置203において、自動対処インシデントチケット1210と自動対処FAQチケット1211とは、AutomationOfDealとして閾値チケット1200に対応付けられる。また、管理装置203において、手動対処インシデントチケット1220と手動対処FAQチケット1221とは、ParentChildとして閾値チケット1200に対応付けられる。
表示制御装置100は、閾値チケット1200を有する。また、表示制御装置100は、インシデントチケットとして、自動対処リコメンド1230と手動対処リコメンド1240とを有する。自動対処リコメンド1230は、発生したインシデントを示し、自動で実行された対処方法を示すインシデントチケットである。手動対処リコメンド1240は、発生したインシデントを示し、手動で実施可能な対処方法を示すインシデントチケットである。また、表示制御装置100は、ナレッジチケットとして、手動対処インシデントチケット1241や手動対処FAQチケット1242を有する。
表示制御装置100において、自動対処リコメンド1230は、AutomationOfDealとして閾値チケット1200に対応付けられる。また、表示制御装置100において、手動対処リコメンド1240は、ParentChildとして閾値チケット1200に対応付けられる。また、表示制御装置100において、手動対処インシデントチケット1241と手動対処FAQチケット1242とは、ReferenceOfDealとして手動対処リコメンド1240に対応付けられる。結果として、手動対処リコメンド1240は、手動で実施可能な対処方法を示すようになる。自動対処リコメンド1230と手動対処リコメンド1240とは、管理装置203も有することになる。
自動対処リコメンド1230は、対処方法が実行終了すると、管理装置203において、AnswerOfDealとして閾値チケット1200とさらに対応付けられる。また、手動対処リコメンド1240は、いずれかの対処方法が実施終了すると、管理装置203において、AnswerOfDealとして閾値チケット1200と対応付けられる。
また、手動で実施された対処方法を示す手動対処インシデントチケット1241または手動対処FAQチケット1242は、管理装置203において、AnswerOfDealとして閾値チケット1200と対応付けられる。このように、各種チケットが対応付けられることにより、発生したインシデントと、発生したインシデントへの対処方法とが対応付けられる。また、解決されたインシデントと、インシデントを解決した対処方法とが対応付けられる。
(インシデント管理システム200の動作例)
次に、図13~図17を用いて、インシデント管理システム200の動作例について説明する。まず、図13を用いて、管理装置203が、閾値チケットを生成する一例について説明する。
図13は、閾値チケットを生成する一例を示す説明図である。図13において、管理装置203は、閾値条件定義画面1300を、端末装置204のディスプレイ906に表示させる。端末装置204は、作業者の操作入力に基づき、閾値条件、時間条件、資源条件などの入力を受け付け、管理装置203に送信する。閾値条件は、例えば、「閾値条件1」の入力欄を用いて入力される。時間条件は、例えば、「評価期間(曜日)」、「評価期間1」の入力欄を用いて入力される。資源条件は、例えば、「フィルター対象1」の入力欄を用いて入力される。また、端末装置204は、作業者の操作入力に基づき、閾値チケットに対応付けるナレッジチケットの指定を、管理装置203に送信する。ナレッジチケットは、例えば、「閾値超過アクション引数1」の入力欄を用いて指定される。
管理装置203は、受信した閾値条件、時間条件、資源条件などに基づいて、閾値チケットを生成する。そして、管理装置203は、生成した閾値チケットを、指定されたナレッジチケットと対応付ける。これにより、管理装置203は、閾値条件を満たすインシデントへの対処方法として、自動で実行可能な対処方法または手動で実施可能な対処方法を特定可能にすることができる。
次に、図14を用いて、表示制御装置100が、図13で生成された閾値チケット、および、閾値チケットに対応付けられたナレッジチケットに基づいて、インシデントチケットを発行する一例について説明する。
図14は、インシデントチケットを発行する一例を示す説明図である。図14において、(14-1)エージェント1101は、あるタイミングで、端末装置204から、閾値チケットと、閾値チケットに対応付けられたナレッジチケットとを収集し、評価部1102を起動する。
その後、エージェント1101は、10分ごとに、端末装置204から、閾値チケットと、閾値チケットに対応付けられたナレッジチケットとを収集し、評価部1102を起動する。この際、エージェント1101は、前回収集した時点以降に新たに生成された閾値チケットとナレッジチケットとを選択的に収集してもよい。
(14-2)評価部1102は、起動すると、性能情報DB600から、性能情報を取得する。性能情報は、例えば、10分データである。10分データは、10分間の性能値の統計的なデータである。評価部1102は、性能情報を取得すると、性能タイムスタンプファイルを生成しておく。性能タイムスタンプファイルは、性能情報を取得した時点を示すファイルである。
評価部1102は、例えば、性能情報DB600から、所定の評価期間における性能情報を取得する。評価部1102は、具体的には、評価タイムスタンプファイルが存在する場合、評価期間=(評価タイムスタンプファイルに記載された日時-30分)~(性能タイムスタンプファイルに記載された日時-30分)を設定する。評価タイムスタンプファイルは、評価部1102が、後述のように、性能情報が閾値チケットが示す閾値条件を満たすか否かを判定した時点を示すファイルである。
また、評価部1102は、評価タイムスタンプファイルが存在しない場合、評価期間=(性能タイムスタンプファイルに記載された日時-30分-3日)~(性能タイムスタンプファイルに記載された日時-30分)を設定する。
評価部1102は、閾値チケットに基づいて、所定の評価期間における性能情報のうち、評価対象とする性能情報を特定し、閾値チケットが示す閾値条件を満たすか否かを判定する。ここで、評価部1102は、判定を終えると、評価タイムスタンプファイルを生成しておく。
評価部1102は、例えば、時間条件と資源条件とを満たす性能情報を、評価対象とする性能情報として特定する。評価部1102は、具体的には、評価開始日時=20:00、評価終了日時=06:30の場合、20:00から次の日の06:30までの性能情報を特定する。評価部1102は、具体的には、評価期間(曜日)=金曜日、評価開始日時=20:00、評価終了日時=06:30の場合、金曜日の20:00から土曜日の06:30までの性能情報を特定する。
評価部1102は、特定した性能情報が、閾値チケットに記載されたすべての閾値条件を満たす場合、インシデントが発生しており異常があると判定する。評価部1102は、異常があると判定した場合、閾値チケットと対応付けた判定結果をエージェント1101に送信する。
(14-3)エージェント1101は、通知部1103を起動し、受信した閾値チケットと対応付けた判定結果を、通知部1103に送信する。
(14-4)通知部1103は、受信した閾値チケットに対応付けられたナレッジチケットに基づいて、自動対処リコメンドまたは手動対処リコメンドを生成する。通知部1103は、例えば、閾値チケットに対応付けられたナレッジチケットから、利用するナレッジチケットを選択する。
通知部1103は、具体的には、自動対処インシデントチケットや自動対処FAQチケットを、手動対処インシデントチケットや手動対処FAQチケットよりも優先して選択する。また、通知部1103は、具体的には、自動対処FAQチケットを、自動対処インシデントチケットよりも優先して選択する。また、通知部1103は、インシデントの発生元に関するホスト名やリソースIDが記載された各種チケットを優先して選択する。また、通知部1103は、閾値チケットに新しく対応付けられた各種チケットを優先して選択する。
ここで、例えば、閾値チケットにAutomationOfDealとして対応付けられた自動対処FAQチケットがある場合について説明する。この場合、通知部1103は、インシデントの発生元に関するホスト名やリソースIDが記載された自動対処FAQチケットを優先して選択する。また、通知部1103は、該自動対処FAQチケットがなければ、インシデントの発生元に関するホスト名が記載された自動対処FAQチケットを優先して選択する。
また、通知部1103は、該自動対処FAQチケットがなければ、最新の自動対処FAQチケットを優先して選択する。そして、通知部1103は、選択した自動対処FAQチケットが示す対処方法を自動で実行し、実行した対処方法を対応付け、対処状況を対処中に設定した自動対処リコメンドを発行する。通知部1103は、具体的には、管理装置203に、RBA(RunBook Automation)プロセスを用いて、選択した自動対処FAQチケットが示す対処方法を自動で実行させる。通知部1103は、発行した手動対処リコメンドを、管理装置203に送信する。
ここで、例えば、閾値チケットに対応付けられた自動対処FAQチケットがなく、かつ、閾値チケットにAutomationOfDealとして対応付けられた自動対処インシデントチケットがある場合について説明する。この場合、通知部1103は、インシデントの発生元に関するホスト名やリソースIDが記載された自動対処インシデントチケットを優先して選択する。また、通知部1103は、該自動対処インシデントチケットがなければ、インシデントの発生元に関するホスト名が記載された自動対処インシデントチケットを優先して選択する。
また、通知部1103は、該自動対処インシデントチケットがなければ、最新の自動対処インシデントチケットを優先して選択する。そして、通知部1103は、選択した自動対処インシデントチケットが示す対処方法を自動で実行し、実行した対処方法を対応付け、対処状況を対処中に設定した自動対処リコメンドを発行する。通知部1103は、具体的には、管理装置203に、RBAプロセスを用いて、選択した自動対処インシデントチケットが示す対処方法を自動で実行させる。通知部1103は、発行した手動対処リコメンドを、管理装置203に送信する。
ここで、例えば、閾値チケットに対応付けられた自動対処FAQチケットや自動対処インシデントチケットがなく、かつ、閾値チケットにParentChildとして対応付けられた手動対処FAQチケットがある場合について説明する。この場合、通知部1103は、インシデントの発生元に関するホスト名やリソースIDが記載された手動対処FAQチケットを優先して、選択した手動対処FAQチケットが5つになるまで、手動対処FAQチケットを選択する。また、通知部1103は、選択した手動対処FAQチケットが5つ未満であれば、さらに、最新の手動対処FAQチケットを優先して、選択した手動対処FAQチケットが5つになるまで、手動対処FAQチケットを選択する。
また、通知部1103は、インシデントの発生元に関するホスト名やリソースIDが記載された手動対処インシデントチケットを優先して、選択した手動対処インシデントチケットが5つになるまで、手動対処インシデントチケットを選択する。また、通知部1103は、選択した手動対処インシデントチケットが5つ未満であれば、最新の手動対処インシデントチケットを優先して、選択した手動対処インシデントチケットが5つになるまで、手動対処インシデントチケットを選択する。そして、通知部1103は、選択した手動対処FAQチケットおよび手動対処インシデントチケットを対応付け、対処状況を新規に設定した手動対処リコメンドを発行する。通知部1103は、発行した手動対処リコメンドを、管理装置203に送信する。
この際、通知部1103は、既に同じインシデントについてのオープンなインシデントチケットが発行済みであれば、新たに自動対処リコメンドまたは手動対処リコメンドを発行しなくてもよい。通知部1103は、例えば、インシデントの発生元に関するホスト名やリソースIDを含み、閾値チケットに対応付けられたオープンなインシデントチケットがあれば、新たに自動対処リコメンドまたは手動対処リコメンドを発行しなくてもよい。
次に、図15を用いて、管理装置203が、受信したインシデントチケットに基づいて、端末装置204に、インシデントチケットの一覧を表示させる一例について説明する。
図15は、インシデントチケットの一覧を表示させる一例を示す説明図である。図13において、管理装置203は、チケット一覧画面1500を、端末装置204のディスプレイ906に表示させる。
また、管理装置203は、チケット一覧画面1500の「新規」が指定されると、新規受付待ちチケット画面1510が、端末装置204のディスプレイ906に表示されるようにする。新規受付待ちチケット画面1510は、クローズしていない手動対処リコメンドが選択可能に表示される。管理装置203は、チケット一覧画面1500の「対処中」が指定されると、対処中チケット画面1520が、端末装置204のディスプレイ906に表示されるようにする。対処中チケット画面1520は、自動対処リコメンドが選択可能に表示される。
端末装置204は、作業者の操作入力に基づき、チケット一覧画面1500の「新規」または「対処中」の指定を受け付ける。端末装置204は、チケット一覧画面1500の「新規」が指定されると、新規受付待ちチケット画面1510を表示する。また、端末装置204は、チケット一覧画面1500の「対処中」が指定されると、対処中チケット画面1520を表示する。
これにより、作業者は、どのようなインシデントが発生しているかを把握することができ、インシデントの発生を発見するためにユーザシステム201の性能値を監視しなくてもよいため、作業負担の低減化を図ることができる。また、作業者は、自動で対処方法が実行されたインシデントについては対処しなくてよいことを把握することができ、作業負担の低減化を図ることができる。
次に、図16を用いて、管理装置203が、端末装置204に、インシデントチケットの内容を表示させる一例について説明する。
図16は、インシデントチケットの内容を表示させる一例を示す説明図である。端末装置204は、作業者の操作入力に基づいて、新規受付待ちチケット画面1510の手動対処リコメンド、または、対処中チケット画面1520の自動対処リコメンドの選択を受け付け、管理装置203に送信する。管理装置203は、選択された手動対処リコメンドや自動対処リコメンドなどのインシデントチケットの内容を、内容表示画面1600に表示する。
内容表示画面1600は、「概要」の表示欄に、インシデントチケットの内容を表示する。内容は、例えば、インシデントが発生した時刻や環境についての情報を含む。内容は、例えば、インシデントの発生判定に用いられた性能値や閾値を含む。また、内容表示画面1600は、インシデントチケットが自動対処リコメンドであれば、「回答/対処」の表示欄に、自動対処リコメンドに対応付けられたナレッジチケットに記載された対処方法を表示する。
また、内容表示画面1600は、インシデントチケットが手動対処リコメンドであれば、「対処候補」の表示欄に、手動対処リコメンドに対応付けられたナレッジチケットに記載された対処方法を表示する。これにより、作業者は、発生したインシデントへの対処方法を把握することができ、作業負担および作業時間の低減化を図ることができる。作業者は、実際にインシデントに対処すると、対処方法を「回答/対処」の表示欄に入力し、インシデントチケットをクローズしてもよい。
次に、図17を用いて、管理装置203が、端末装置204に、性能情報を表示させる一例について説明する。
図17は、性能情報を表示させる一例を示す説明図である。管理装置203は、内容表示画面1600の「概要」の表示欄のURL(Uniform Resource Locator)が指定されると、インシデントに関する性能情報を、端末装置204に表示させるようにしてもよい。端末装置204は、例えば、性能値をグラフ化して示す性能画面1700を表示する。これにより、作業者は、どのようなインシデントが発生したかを詳細に把握することができる。
以上により、インシデント管理システム200は、発生したインシデントを示し、発生したインシデントへの対処方法の候補を示す手動対処リコメンドを、作業者に参照させることができる。このため、作業者は、ユーザシステム201の性能を監視しなくても、ユーザシステム201において発生しているインシデントを把握することができ、インシデントに対処する作業を分担することができ、インシデントへの対処方法を容易に把握することができる。
このように、インシデント管理システム200は、インシデントに対処する作業の容易化を図ることができ、作業者にかかる作業負担や作業時間の低減化を図ることができる。そして、インシデント管理システム200は、インシデントに対処する作業を実施することが容易な作業者の割合の増大化を図ることができる。このため、インシデント管理システム200は、一部の作業者に作業が集中してしまうことを防止し、一部の作業者の作業時間および作業負担が増大してしまうことを防止することができる。
結果として、インシデント管理システム200は、ユーザシステム201が大規模化し、1日あたりに発生するインシデントの数や種類が増大しても、インシデントが解決するまでにかかる所要時間の低減化を図ることができる。また、インシデント管理システム200は、インシデントに起因してサービスに重大な問題が発生する前に、インシデントを解決しやすくすることができ、インシデントに起因してサービスに重大な問題が発生する可能性の低減化を図ることができる。また、インシデント管理システム200は、ユーザシステム201を監視するための作業負担や作業時間の増大化を抑制することができる。
また、インシデント管理システム200は、発生したインシデントに自動で対処可能であれば、自動で対処することができる。この際、インシデント管理システム200は、発生したインシデントを示し、発生したインシデントに自動で対処中であることを示す自動対処リコメンドを、作業者に参照させることができる。このため、作業者は、既に対処方法が判明しており、自動で対処可能なインシデントが繰り返し発生しても、インシデントに対処する作業を実施しなくて済み、作業負担や作業時間の低減化を図ることができる。
(チケット作成処理手順)
次に、図18を用いて、管理装置203が実行する、チケット作成処理手順の一例について説明する。チケット作成処理は、例えば、図7に示したCPU701と、メモリ702や記録媒体705などの記憶領域と、通信I/F703とによって実現される。
図18は、チケット作成処理手順の一例を示すフローチャートである。図18において、管理装置203は、端末装置204を介して、クローズ済みのインシデントチケットまたはFAQチケットの指定を受け付ける(ステップS1801)。
次に、管理装置203は、端末装置204を介して、閾値条件定義画面を表示する(ステップS1802)。そして、管理装置203は、閾値条件定義画面におけるユーザの操作入力に基づいて、閾値チケットを発行する(ステップS1803)。
次に、管理装置203は、指定されたインシデントチケットまたはFAQチケットに基づいて、ナレッジチケットを作成する(ステップS1804)。そして、管理装置203は、作成したナレッジチケットを、AutomationOfDealまたはParentChildとして、発行された閾値チケットに対応付ける(ステップS1805)。その後、管理装置203は、チケット作成処理を終了する。
(対応付け追加処理手順)
次に、図19を用いて、管理装置203が実行する、対応付け追加処理手順の一例について説明する。対応付け追加処理は、例えば、図7に示したCPU701と、メモリ702や記録媒体705などの記憶領域と、通信I/F703とによって実現される。
図19は、対応付け追加処理手順の一例を示すフローチャートである。図19において、管理装置203は、閾値チケットの指定を受け付ける(ステップS1901)。
次に、管理装置203は、クローズ済みのインシデントチケットまたはFAQチケットの指定を受け付ける(ステップS1902)。そして、管理装置203は、指定されたインシデントチケットまたはFAQチケットに基づいて、ナレッジチケットを作成する(ステップS1903)。
次に、管理装置203は、作成したナレッジチケットを、AutomationOfDealまたはParentChildとして、指定された閾値チケットに対応付ける(ステップS1904)。そして、管理装置203は、対応付け追加処理を終了する。
(チケット収集処理手順)
次に、図20を用いて、表示制御装置100が実行する、チケット収集処理手順の一例について説明する。チケット収集処理は、例えば、図3に示したCPU301と、メモリ302や記録媒体305などの記憶領域と、通信I/F303とによって実現される。
図20は、チケット収集処理手順の一例を示すフローチャートである。図20において、表示制御装置100のエージェント1101は、管理装置203と通信し、閾値チケットおよびナレッジチケットを収集する(ステップS2001)。
次に、エージェント1101は、収集した閾値チケットを、閾値チケットDB500に保存する(ステップS2002)。そして、エージェント1101は、収集したナレッジチケットを、ナレッジチケットDB400に保存する(ステップS2003)。その後、表示制御装置100は、チケット収集処理を終了する。
(性能情報収集処理手順)
次に、図21を用いて、表示制御装置100が実行する、性能情報収集処理手順の一例について説明する。性能情報収集処理は、例えば、図3に示したCPU301と、メモリ302や記録媒体305などの記憶領域と、通信I/F303とによって実現される。
図21は、性能情報収集処理手順の一例を示すフローチャートである。図21において、表示制御装置100のエージェント1101は、監視装置202と通信し、性能情報を収集する(ステップS2101)。
次に、エージェント1101は、収集した性能情報を、性能情報DB600に保存する(ステップS2102)。そして、エージェント1101は、最新の性能情報が得られた日時を、性能タイムスタンプファイルに記入する(ステップS2103)。その後、表示制御装置100は、性能情報収集処理を終了する。
(管理情報発行処理手順)
次に、図22~図24を用いて、表示制御装置100が実行する、管理情報発行処理手順の一例について説明する。管理情報発行処理は、例えば、図3に示したCPU301と、メモリ302や記録媒体305などの記憶領域と、通信I/F303とによって実現される。
図22~図24は、管理情報発行処理手順の一例を示すフローチャートである。図22において、表示制御装置100のエージェント1101は、所定の時間間隔で、表示制御装置100の評価部1102を起動する(ステップS2201)。
評価部1102は、起動すると、性能タイムスタンプファイルが存在するか否かを判定する(ステップS2202)。ここで、存在しない場合(ステップS2202:No)、表示制御装置100は、管理情報発行処理を終了する。一方で、存在する場合(ステップS2202:Yes)、評価部1102は、ステップS2203の処理に移行する。
ステップS2203では、評価部1102は、評価タイムスタンプファイルが存在するか否かを判定する(ステップS2203)。ここで、存在しない場合(ステップS2203:No)、評価部1102は、ステップS2205の処理に移行する。一方で、存在する場合(ステップS2203:Yes)、評価部1102は、ステップS2204の処理に移行する。
ステップS2204では、評価部1102は、評価開始時刻を、評価タイムスタンプファイルに記載された日時-30分に設定する(ステップS2204)。そして、評価部1102は、ステップS2206の処理に移行する。
ステップS2205では、評価部1102は、評価開始時刻を、性能タイムスタンプファイルに記載された日時-3日-30分に設定する(ステップS2205)。そして、評価部1102は、ステップS2206の処理に移行する。
ステップS2206では、評価部1102は、評価終了時刻を、性能タイムスタンプファイルに記載された日時-30分に設定する(ステップS2206)。そして、評価部1102は、図23のステップS2301の処理に移行する。ここで、図23の説明に移行する。
図23において、評価部1102は、未処理の閾値チケットを選択する(ステップS2301)。そして、評価部1102は、ステップS2302の処理に移行する。
ステップS2302では、評価部1102は、選択した閾値チケットに記載された閾値条件のうち、未処理の閾値条件を選択する(ステップS2302)。
次に、評価部1102は、選択した閾値チケットに記載された曜日や時刻などに基づく時間条件を満たした性能情報を特定する(ステップS2303)。そして、評価部1102は、特定した性能情報のうち、選択した閾値チケットに記載されたホスト名やリソースIDなどに基づく資源条件を満たす性能情報を特定する(ステップS2304)。
次に、評価部1102は、特定した性能情報が、選択した閾値条件を満たすか否かを評価する(ステップS2305)。そして、評価部1102は、評価結果を保存する(ステップS2306)。
次に、評価部1102は、すべての閾値条件を処理したか否かを判定する(ステップS2307)。ここで、未処理の閾値条件がある場合(ステップS2307:No)、評価部1102は、ステップS2302の処理に戻る。一方で、すべての閾値条件を処理している場合(ステップS2307:Yes)、評価部1102は、ステップS2308の処理に移行する。
ステップS2308では、評価部1102は、選択した閾値チケットに記載されたすべての閾値条件を満たすか否かを判定する(ステップS2308)。ここで、いずれかの閾値条件を満たさない場合(ステップS2308:No)、評価部1102は、ステップS2310の処理に移行する。一方で、すべての閾値条件を満たす場合(ステップS2308:Yes)、評価部1102は、ステップS2309の処理に移行する。
ステップS2309では、評価部1102は、選択した閾値チケットを、発行対象チケット一覧に追加する(ステップS2309)。そして、評価部1102は、ステップS2310の処理に移行する。
ステップS2310では、評価部1102は、すべての閾値チケットを処理したか否かを判定する(ステップS2310)。ここで、未処理の閾値チケットがある場合(ステップS2310:No)、評価部1102は、ステップS2301の処理に戻る。一方で、すべての閾値チケットを処理している場合(ステップS2310:Yes)、評価部1102は、ステップS2311の処理に移行する。
ステップS2311では、評価部1102は、発行対象チケット一覧を、エージェント1101に送信する(ステップS2311)。エージェント1101は、発行対象チケット一覧を受信すると、図24のステップS2401の処理に移行する。ここで、図24の説明に移行する。
図24において、エージェント1101は、発行対象チケット一覧に、閾値チケットが存在するか否かを判定する(ステップS2401)。ここで、存在しない場合(ステップS2401:No)、表示制御装置100は、管理情報発行処理を終了する。一方で、存在する場合(ステップS2401:Yes)、エージェント1101は、ステップS2402の処理に移行する。
ステップS2402では、エージェント1101は、表示制御装置100の通知部1103を起動し、発行対象チケット一覧を、通知部1103に送信する(ステップS2402)。
通知部1103は、発行対象チケット一覧から、未処理の閾値チケットを選択する(ステップS2403)。
次に、通知部1103は、選択した閾値チケットに、AutomationOfDealとして対応付けられたナレッジチケットがあるか否かを判定する(ステップS2404)。ここで、AutomationOfDealとして対応付けられたナレッジチケットがある場合(ステップS2404:Yes)、通知部1103は、ステップS2405の処理に移行する。
一方で、AutomationOfDealではなく、ParentChildとして対応付けられたナレッジチケットがある場合(ステップS2404:No)、通知部1103は、ステップS2407の処理に移行する。
ステップS2405では、通知部1103は、ナレッジチケットに基づいて、実行対象となる対処方法を特定して実行する(ステップS2405)。次に、通知部1103は、対処方法を対応付け、対処状況を対処中に設定したインシデントチケットを発行する(ステップS2406)。そして、通知部1103は、ステップS2409の処理に移行する。
ステップS2407では、通知部1103は、ナレッジチケットに基づいて、候補となる対処方法を特定する(ステップS2407)。次に、通知部1103は、対処方法を対応付け、対処状況を新規に設定したインシデントチケットを発行する(ステップS2408)。そして、通知部1103は、ステップS2409の処理に移行する。
ステップS2409では、通知部1103は、すべての閾値チケットを処理したか否かを判定する(ステップS2409)。ここで、未処理の閾値チケットがある場合(ステップS2409:No)、通知部1103は、ステップS2403の処理に戻る。一方で、すべての閾値チケットを処理している場合(ステップS2409:Yes)、通知部1103は、管理情報発行処理を終了する。
(対処終了処理手順)
次に、図25を用いて、表示制御装置100が実行する、対処終了処理手順の一例について説明する。対処終了処理は、例えば、図3に示したCPU301と、メモリ302や記録媒体305などの記憶領域と、通信I/F303とによって実現される。
図25は、対処終了処理手順の一例を示すフローチャートである。図25において、エージェント1101は、いずれかのインシデントチケットについて対処終了したことを検出する(ステップS2501)。
次に、エージェント1101は、インシデントチケットの対処状況を対処終了に設定し、インシデントチケットをクローズする(ステップS2502)。そして、エージェント1101は、ナレッジチケットを作成する(ステップS2503)。
次に、エージェント1101は、作成したナレッジチケットを、AnswerOfDealとして、インシデントチケットに対応する閾値チケットに対応付ける(ステップS2504)。そして、表示制御装置100は、対処終了処理を終了する。
以上説明したように、表示制御装置100によれば、監視対象の監視データと、監視対象の識別情報とを取得し、取得した監視データが、取得した識別情報に対応付けられた基準を満たすか否かの判定を行うことができる。表示制御装置100によれば、監視データが基準を満たす場合、記憶部1000を参照して、取得した識別情報に対応付けられた対処方法を特定し、特定した対処方法に対応付けられたインシデント管理情報を生成することができる。表示制御装置100によれば、生成したインシデント管理情報の指定を受け付けると、特定した対処方法の表示端末への表示指示を出力することができる。これにより、表示制御装置100は、インシデントへの対処方法を作業者が把握可能にすることができ、インシデントに対処する作業の作業負担および作業時間の低減化を図ることができる。
表示制御装置100によれば、記憶部1000を参照して、取得した識別情報に対応付けられた対処方法と、内容または原因とを特定し、特定した対処方法と、特定した内容または原因とに対応付けられたインシデント管理情報を生成することができる。表示制御装置100によれば、生成したインシデント管理情報の指定を受け付けると、特定した対処方法と、特定した内容または原因との、表示端末への表示指示を出力することができる。これにより、表示制御装置100は、インシデントの内容や原因を作業者が把握可能にすることができ、インシデントに対処する作業の作業負担および作業時間の低減化を図ることができる。
表示制御装置100によれば、特定した対処方法を自動実行することができる。これにより、表示制御装置100は、自動で実行可能な対処方法を自動実行することにより、作業者の作業負担および作業時間の低減化を図ることができる。
表示制御装置100によれば、取得した識別情報に対応付けられた対処方法が複数ある場合、条件を満たす対処方法を特定することができる。これにより、表示制御装置100は、作業者にとって有用である可能性が高い対処方法を、作業者が把握しやすいようにすることができる。
表示制御装置100によれば、識別情報に対応付けられた対処方法を特定した後、監視データが基準を満たさなくなるまで待機し、再び監視データが基準を満たす場合、識別情報に対応付けられた対処方法を特定することができる。これにより、表示制御装置100は、監視データが基準を満たしている間、連続して対処方法を特定してしまうことを防止し、1つのインシデントに対して複数のインシデント管理情報が生成されてしまうことを防止することができる。
表示制御装置100によれば、監視データとして、監視対象の性能を示すデータを利用し、基準として、監視対象の性能が一定以上悪いことを示す条件を利用することができる。これにより、表示制御装置100は、インシデントを発見することができる。
なお、本実施の形態で説明した表示制御方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。本実施の形態で説明した表示制御プログラムは、ハードディスク、フレキシブルディスク、CD-ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。また、本実施の形態で説明した表示制御プログラムは、インターネット等のネットワークを介して配布してもよい。
上述した実施の形態に関し、さらに以下の付記を開示する。
(付記1)監視対象の監視データと、前記監視対象の識別情報とを取得し、
取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、
前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、
取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付けられたインシデント管理情報を生成し、
生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力する、
処理をコンピュータが実行することを特徴とする表示制御方法。
(付記2)前記記憶部は、監視対象に関するインシデントへの対処方法と、該インシデントの内容または原因とを、該監視対象の識別情報に対応付けて記憶し、
前記特定する処理は、前記記憶部を参照して、取得した前記識別情報に対応付けられた対処方法と、内容または原因とを特定し、
前記生成する処理は、特定した前記対処方法と、特定した前記内容または前記原因とに対応付けられたインシデント管理情報を生成し、
前記出力する処理は、生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法と、特定した前記内容または前記原因との、前記表示端末への表示指示を出力する、ことを特徴とする付記1に記載の表示制御方法。
(付記3)特定した前記対処方法を自動実行する、処理を前記コンピュータが実行することを特徴とする付記1または2に記載の表示制御方法。
(付記4)前記特定する処理は、取得した前記識別情報に対応付けられた対処方法が複数ある場合、条件を満たす対処方法を特定する、ことを特徴とする付記1~3のいずれか一つに記載の表示制御方法。
(付記5)前記特定する処理は、前記識別情報に対応付けられた対処方法を特定した後、前記監視データが前記基準を満たさなくなるまで待機し、再び前記監視データが前記基準を満たす場合、前記識別情報に対応付けられた対処方法を特定する、ことを特徴とする付記1~4のいずれか一つに記載の表示制御方法。
(付記6)前記監視データは、前記監視対象の性能を示し、
前記基準は、前記監視対象の性能が一定以上悪いことを示す、ことを特徴とする付記1~5のいずれか一つに記載の表示制御方法。
(付記7)監視対象の監視データと、前記監視対象の識別情報とを取得し、
取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、
前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、
取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付けられたインシデント管理情報を生成し、
生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力する、
処理をコンピュータに実行させることを特徴とする表示制御プログラム。
(付記8)監視対象の監視データと、前記監視対象の識別情報とを取得し、
取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、
前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、
取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付けられたインシデント管理情報を生成し、
生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力する、
制御部を有することを特徴とする表示制御装置。
100 表示制御装置
110,1000 記憶部
120 監視対象
130 システム
140 監視データ
150 基準
160 対処方法
170 インシデント管理情報
180 一覧
190 表示端末
200 インシデント管理システム
201 ユーザシステム
202 監視装置
203 管理装置
204 端末装置
210 ネットワーク
300,700,800,900 バス
301,701,801,901 CPU
302,702,802,902 メモリ
303,703,803,903 通信I/F
304,704,804,904 記録媒体I/F
305,705,805,905 記録媒体
400 ナレッジチケットDB
500 閾値チケットDB
600 性能情報DB
906 ディスプレイ
907 入力装置
1001 取得部
1002 判定部
1003 特定部
1004 生成部
1005 出力部
1100 診断結果DB
1101 エージェント
1102 評価部
1103 通知部
1111,1200 閾値チケット
1112 ナレッジチケット
1113 インシデントチケット
1210 自動対処インシデントチケット
1211 自動対処FAQチケット
1220,1241 手動対処インシデントチケット
1221,1242 手動対処FAQチケット
1230 自動対処リコメンド
1240 手動対処リコメンド
1300 閾値条件定義画面
1500 チケット一覧画面
1510 チケット画面
1520 対処中チケット画面
1600 内容表示画面
1700 性能画面

Claims (7)

  1. 監視対象の監視データと、前記監視対象の識別情報とを取得し、
    取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、
    前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、
    取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付けられたインシデント管理情報を生成し、
    生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力し、
    前記特定する処理は、前記識別情報に対応付けられた対処方法を特定した後、前記監視データが前記基準を満たさなくなるまで待機し、再び前記監視データが前記基準を満たす場合、前記識別情報に対応付けられた対処方法を特定する、
    処理をコンピュータが実行することを特徴とする表示制御方法。
  2. 前記監視データは、前記監視対象の性能を示し、
    前記基準は、前記監視対象の性能が一定以上悪いことを示す、ことを特徴とする請求項1に記載の表示制御方法。
  3. 前記記憶部は、監視対象に関するインシデントへの対処方法と、該インシデントの内容または原因とを、該監視対象の識別情報に対応付けて記憶し、
    前記特定する処理は、前記記憶部を参照して、取得した前記識別情報に対応付けられた対処方法と、内容または原因とを特定し、
    前記生成する処理は、特定した前記対処方法と、特定した前記内容または前記原因とに対応付けられたインシデント管理情報を生成し、
    前記出力する処理は、生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法と、特定した前記内容または前記原因との、前記表示端末への表示指示を出力する、ことを特徴とする請求項1または2に記載の表示制御方法。
  4. 特定した前記対処方法を自動実行する、処理を前記コンピュータが実行することを特徴とする請求項1~3のいずれか一つに記載の表示制御方法。
  5. 前記特定する処理は、取得した前記識別情報に対応付けられた対処方法が複数ある場合、条件を満たす対処方法を特定する、ことを特徴とする請求項1~4のいずれか一つに記載の表示制御方法。
  6. 監視対象の監視データと、前記監視対象の識別情報とを取得し、
    取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、
    前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、
    取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付けられたインシデント管理情報を生成し、
    生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力し、
    前記特定する処理は、前記識別情報に対応付けられた対処方法を特定した後、前記監視データが前記基準を満たさなくなるまで待機し、再び前記監視データが前記基準を満たす場合、前記識別情報に対応付けられた対処方法を特定する、
    処理をコンピュータに実行させることを特徴とする表示制御プログラム。
  7. 監視対象の監視データと、前記監視対象の識別情報とを取得し、
    取得した前記監視データが、取得した前記識別情報に対応付けられた基準を満たすか否かの判定を行い、
    前記監視データが前記基準を満たす場合、監視対象に関するインシデントへの対処方法を該監視対象の識別情報に対応付けて記憶する記憶部を参照して、取得した前記識別情報に対応付けられた対処方法を特定し、
    取得した前記監視データ及び前記識別情報に基づき、特定した前記対処方法に対応付け
    られたインシデント管理情報を生成し、
    生成した前記インシデント管理情報の指定を受け付けると、特定した前記対処方法の表示端末への表示指示を出力し、
    前記特定する処理は、前記識別情報に対応付けられた対処方法を特定した後、前記監視データが前記基準を満たさなくなるまで待機し、再び前記監視データが前記基準を満たす場合、前記識別情報に対応付けられた対処方法を特定する、
    制御部を有することを特徴とする表示制御装置。
JP2018124455A 2018-06-29 2018-06-29 表示制御方法、表示制御プログラム、および表示制御装置 Active JP7131132B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018124455A JP7131132B2 (ja) 2018-06-29 2018-06-29 表示制御方法、表示制御プログラム、および表示制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018124455A JP7131132B2 (ja) 2018-06-29 2018-06-29 表示制御方法、表示制御プログラム、および表示制御装置

Publications (2)

Publication Number Publication Date
JP2020004198A JP2020004198A (ja) 2020-01-09
JP7131132B2 true JP7131132B2 (ja) 2022-09-06

Family

ID=69100105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018124455A Active JP7131132B2 (ja) 2018-06-29 2018-06-29 表示制御方法、表示制御プログラム、および表示制御装置

Country Status (1)

Country Link
JP (1) JP7131132B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023073834A (ja) * 2021-11-16 2023-05-26 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 管理システム、管理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076161A (ja) 2009-09-29 2011-04-14 Nomura Research Institute Ltd インシデント管理システム
JP2014032598A (ja) 2012-08-06 2014-02-20 Hitachi Systems Ltd インシデント管理システム及びその方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011076161A (ja) 2009-09-29 2011-04-14 Nomura Research Institute Ltd インシデント管理システム
JP2014032598A (ja) 2012-08-06 2014-02-20 Hitachi Systems Ltd インシデント管理システム及びその方法

Also Published As

Publication number Publication date
JP2020004198A (ja) 2020-01-09

Similar Documents

Publication Publication Date Title
US11693723B2 (en) Query watchdog
JP5708262B2 (ja) 予測プログラム、予測装置および予測方法
US8396815B2 (en) Adaptive business process automation
WO2013128555A1 (ja) タスク管理方法及びタスク管理装置
JP4927448B2 (ja) 時系列パターン生成システム及び時系列パターン生成方法
US9389916B1 (en) Job scheduling management
US20170351989A1 (en) Providing supply chain information extracted from an order management system
US20090216874A1 (en) Monitoring asynchronous transactions within service oriented architecture
US8850314B2 (en) Context driven help function
US11163735B2 (en) Database capacity estimation for database sizing
JP7131132B2 (ja) 表示制御方法、表示制御プログラム、および表示制御装置
JP5062896B2 (ja) バッチ処理監視装置、バッチ処理監視方法及びプログラム
US5826104A (en) Batch program status via tape data set information for dynamically determining the real time status of a batch program running in a main frame computer system
KR20130132260A (ko) 업무 과제 분석 지원 시스템
JP2009169756A (ja) 分散処理プログラム、分散処理装置、および分散処理方法
JP7412938B2 (ja) 情報分析装置、情報分析方法、情報分析システムおよびプログラム
JP2006018529A (ja) ワークフローシステムおよびワークフローシステムの制御方法およびプログラムおよび記録媒体
US6938219B2 (en) Method and system for displaying actions and historical content in an output view
JP2006268334A (ja) プロジェクト管理システム
JP5772973B2 (ja) 情報提供装置、方法、およびプログラム
CN116136794A (zh) 信息处理系统、信息处理方法及存储有信息处理程序的记录介质
CN115718658A (zh) 一种时效优化方法及装置
US9183388B2 (en) Injustice detecting system, injustice detecting device and injustice detecting method
JP4471196B2 (ja) 営業業務支援システムのサーバ及びプログラム、並びに営業支援装置及びプログラム
JP2009043188A (ja) 運用管理サポートシステム、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210310

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220420

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220726

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220808

R150 Certificate of patent or registration of utility model

Ref document number: 7131132

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150