JP2020067780A - 運用支援装置、運用支援方法及び運用支援プログラム - Google Patents

運用支援装置、運用支援方法及び運用支援プログラム Download PDF

Info

Publication number
JP2020067780A
JP2020067780A JP2018199470A JP2018199470A JP2020067780A JP 2020067780 A JP2020067780 A JP 2020067780A JP 2018199470 A JP2018199470 A JP 2018199470A JP 2018199470 A JP2018199470 A JP 2018199470A JP 2020067780 A JP2020067780 A JP 2020067780A
Authority
JP
Japan
Prior art keywords
incident
unit
operation support
procedure
operation supporting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018199470A
Other languages
English (en)
Inventor
淳 宮津
Atsushi Miyazu
淳 宮津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MUFG Bank Ltd
Original Assignee
MUFG Bank Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MUFG Bank Ltd filed Critical MUFG Bank Ltd
Priority to JP2018199470A priority Critical patent/JP2020067780A/ja
Publication of JP2020067780A publication Critical patent/JP2020067780A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】障害発生時における初期対応を迅速に行う運用支援装置、運用支援方法及び運用支援プログラムを提供する。【解決手段】運用支援システムにおいて、運用支援サーバ200は、複数の業務システムのそれぞれにおいてインシデントとされる条件と、インシデントに対する対応手順とが対応付けられた条件情報が登録された記憶部と、業務システムにおいてインシデントが発生した場合に、発生したインシデントに対応した対応手順を示す情報を端末装置に出力する出力部とを有する。【選択図】図2

Description

本発明は、運用支援装置、運用支援方法及び運用支援プログラムに関する。
金融機関には勘定系システムをはじめとする多数のシステムが存在しており、これらのシステムで発生する障害(インシデント)に対する対応は、運用業務を行うサービスデスク等によって行われる。
特開2016−76133号公報
従来では、システムでインシデントが発生した場合、オペレータが手順書を検索する、障害内容を担当者に連絡して対応を仰ぐ、といった方法で対応しており、障害発生時の初期対応に時間がかかる。
上述した問題点を鑑み、本発明の課題は、障害発生時における初期対応を迅速に行う技術を提供することを目的としている。
上記課題を解決するため、本発明の一態様は、複数の業務システムのそれぞれにおいてインシデントとされる条件と、前記インシデントに対する対応手順とが対応付けられた条件情報が登録された記憶部と、前記業務システムにおいてインシデントが発生した場合に、発生したインシデントに対応した対応手順を示す情報を端末装置に出力する出力部と、を有する運用支援装置に関する。
本発明によると、障害発生時における初期対応を迅速に行うことができる。
運用支援システムのシステム構成の一例を示す図である。 運用支援サーバのハードウェア構成の一例を示す図である。 インシデント記憶部の一例を示す図である。 手順記憶部の一例を示す図である。 運用支援サーバの有する運用支援部の機能を説明する図である。 運用支援サーバの動作を説明する第一のフローチャートである。 運用支援サーバの動作を説明する第二のフローチャートである。 運用支援サーバの動作を説明する第三のフローチャートである。 オペレータの端末装置の表示例を示す図である。
以下に図面を参照して、実施形態について説明する。図1は、運用支援システムのシステム構成の一例を示す図である。
本実施形態の運用支援システム100は、運用支援サーバ200と、端末装置300と、を有し、運用支援サーバ200と端末装置300とは、ネットワーク等を介して接続される。
また、本実施形態の運用支援システム100は、ネットワーク等を介して、複数の業務システム400−1、400−2、・・・、400−nと通信を行う。
本実施形態の業務システム400−1、400−2、・・・、400−nは、例えば、金融機関に導入されている勘定系システムの一部を含んでいても良い。以下の説明では、業務システム400−1、400−2、・・・、400−nのそれぞれを区別しない場合には、業務システム400と呼ぶ。
本実施形態の運用支援システム100において、運用支援サーバ200は、イベント記憶部210、インシデント記憶部220、手順記憶部230、運用支援部240を有する。
イベント記憶部210は、業務システム400で発生したイベントの内容を示すイベントデータが格納される。
インシデント記憶部220は、各業務システム400におけるインシデントに関するインシデント情報が格納される。本実施形態のインシデントとは、例えば、中断・阻害、損失、緊急事態、危機、になり得るまたはそれらを引き起こし得る状況を示すものであり、サービスデスク等において解決すべき事柄である。また、本実施形態のインシデント情報は、イベントデータに、イベントデータを受信した日時や、受信元となる業務システム400を特定する情報等を対応付けた情報である。
手順記憶部230は、インシデント毎に、インシデントに対応する手順を示す情報が格納される。対応手順とは、発生したインシデントを解決するための行う操作の手順等を示す。
運用支援部240は、インシデント記憶部220を参照し、業務システム400から通知されたイベントデータに基づきインシデントが発生したか否かを検知し、手順記憶部230を参照して、検知されたインシデントと対応する手順を示す情報を出力する。
端末装置300は、例えば、運用業務を行うサービスデスクのオペレータが使用する端末等である。本実施形態では、インシデントと対応する手順を示す情報は、端末装置300に出力されても良い。
このように、本実施形態では、各業務システム400におけるインシデントの発生を自動的に検知し、発生したインシデントに対応する手順をオペレータに通知することができる。
したがって、本実施形態によれば、オペレータが手順書を検索する、障害内容を担当者に連絡して対応を仰ぐ、といった作業を行う必要がなく、障害発生時における初期対応を迅速に行うことができる。
次に、図2を参照して、本実施形態の運用支援サーバ200について説明する。図2は、運用支援サーバのハードウェア構成の一例を示す図である。
本実施形態の運用支援サーバ200は、それぞれバスBで相互に接続されている入力装置21、出力装置22、ドライブ装置23、補助記憶装置24、メモリ装置25、演算処理装置26及びインターフェース装置27を含む情報処理装置である。
入力装置21は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等により実現される。出力装置22は、各種の情報の出力を行うためものであり、例えばディスプレイ等により実現される。インターフェース装置27は、LANカード等を含み、ネットワークに接続する為に用いられる。
本実施形態の運用支援プログラムは、運用支援サーバ200を制御する各種プログラムの少なくとも一部である。運用支援プログラムは、例えば、記憶媒体28の配布やネットワークからのダウンロード等によって提供される。運用支援プログラムを記録した記憶媒体28は、CD−ROM、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ROM、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。
また、運用支援プログラムは、運用支援プログラムを記録した記憶媒体28がドライブ装置23にセットされると、記憶媒体28からドライブ装置23を介して補助記憶装置24にインストールされる。ネットワークからダウンロードされた運用支援プログラムは、インターフェース装置27を介して補助記憶装置24にインストールされる。
次に、図3及び図4を参照して、本実施形態の運用支援サーバ200の有する各記憶部について説明する。尚、本実施形態では、インシデント記憶部220と手順記憶部230は、運用支援サーバ200に設けられるものとしたが、これに限定されない。インシデント記憶部220と手順記憶部230は、運用支援サーバ200の外部の装置に設けられていても良い。
図3は、インシデント記憶部の一例を示す図である。本実施形態のインシデント記憶部220には、各業務システム400におけるインシデントに関するインシデント情報が格納される。
インシデント情報は、情報の項目として、インシデントNo、重要度、障害発生日時、概要、システム名、リソース名/ホスト名等を含む。尚、図3は、インシデント情報の一例を示すものであり、インシデント情報は、図3に示す項目以外の項目が含まれていても良い。
項目「インシデントNo」の値は、インシデントを特定するための識別情報である。項目「重要度」の値は、インシデントの重要度を示す。項目「障害発生日時」の値は、対応するインシデントが発生した日付と時刻を含む。
項目「概要」の値は、インシデントの内容を示す。インシデントの内容とは、言い換えれば、業務システム400において、インシデントとされる条件を示す。項目「システム名」の値は、インシデントが発生したシステムの名称を示す。尚、項目「システム名」の値は、インシデントが発生したシステムを特定するための情報であれば、システム名でなく、例えばシステムID等であっても良い。
図4は、手順記憶部の一例を示す図である。本実施形態の手順記憶部230に格納された手順情報は、業務システム400毎に、インシデントと対応の手順とが対応付けられている。
図4に示す手順情報は、例えば、インシデントNoと、インシデントNoが示すインシデントと対応する手順を表示させるためのURL(Uniform Resource Locator)とが対応付けられている。尚、インシデントNoには、インシデントと対応する手順を示すメッセージ等が対応付けられていても良い。
このように、本実施形態では、インシデント記憶部220と手順記憶部230とは、各業務システム400について、インシデントとなる条件と、インシデントの対応手順を示す情報とが対応付けられた条件情報が記憶された記憶部の一例となる。
次に、図5を参照して、本実施形態の運用支援サーバ200の有する運用支援部240の機能について説明する。図5は、運用支援サーバの有する運用支援部の機能を説明する図である。尚、本実施形態の運用支援部240は、運用支援サーバ200の演算処理装置26がメモリ装置25に格納された運用支援プログラムを読みだして実行することで実現される。
本実施形態の運用支援部240は、イベント集約部250、手順検索部260、自動化処理部270を有する。
イベント集約部250は、業務システム400から送信されるイベントデータを集約してインシデント情報とし、インシデント記憶部220に格納する。イベント集約部250の処理は、例えば、自動化処理部270の処理の前処理として実行されても良い。
また、イベント集約部250は、自動化抑止判定部251、除外判定部252を有する。自動化抑止判定部251は、イベントデータに対して、自動化処理部270による制御を行うか否かを判定する。除外判定部252は、受信したイベントデータが、集約の対象外であるか否かを判定する。
手順検索部260は、業務システム400から受信したイベントデータが、インシデント情報と合致する場合に、手順記憶部230を検索して、インシデントと対応する手順を特定する。
自動化処理部270は、インシデントの発生をオペレータに通知するか否かを判定し、通知する場合には、オペレータへインシデントと対応した手順を通知する。
また、本実施形態の自動化処理部270は、相関判定部271を有する。本実施形態の相関判定部271は、他に発生しているイベントとの関係に応じて、発生したインシデントに対する対応が必要であるか否かを判定する。
次に、図6乃至図8を参照して、本実施形態の運用支援サーバ200の動作について説明する。図6は、運用支援サーバの動作を説明する第一のフローチャートである。図6では、イベント集約部250による処理を示している。尚、図6の処理は、運用支援サーバ200がイベントデータを受信する度に実行されても良いし、定期的に実行されても良い。
本実施形態のイベント集約部250は、業務システム400からイベントデータを受信する(ステップS601)。尚、このときイベント集約部250は、受信したイベントデータに付与されている連番より1つ前の番号が付与されたイベントデータが、イベント記憶部210に格納されているか否か判定しても良い。
続いて、イベント集約部250は、受信したイベントデータの重要度に基づき、イベントデータがインフォメーションメッセージであるか否かを判定する(ステップS602)。つまり、ここでは、イベント集約部250は、受信したイベントデータがインシデントの発生を通信するものであるか否かを判定している。
ステップS602において、イベントデータがインフォメーションデータであった場合、イベント集約部250は、処理を終了する。
ステップS602において、イベントデータがインフォメーションデータでない場合、イベント集約部250は、自動化抑止判定部251により、単位時間あたりに受信したイベントデータの数が閾値以上であるか否かを判定する(ステップS603)。
ステップS603において、閾値以上である場合、自動化抑止判定部251は、自動化処理部270による処理を行わない状態(自動化処理抑止状態)とし(ステップS604)、処理を終了する。
尚、本実施形態では、イベントデータの受信によって自動化処理抑止状態とされた場合には、その旨を示す通知がオペレータの端末装置300に送信されても良い。また、自動化抑止状態は、オペレータ等によって、手動で解除されても良い。
ステップS603において、閾値以上でない場合、つまり、単位時間あたりに受信したイベントデータの数が閾値未満である場合、イベント集約部250は、除外判定部252により、受信したイベントデータが集約の除外の対象であるか否かを判定する(ステップS605)。
尚、除外判定部252は、除外の対象となるイベントデータの条件を保持しており、この条件に基づき判定を行っても良い。具体的には、例えば、除外判定部252は、特定のシステムIDが付与されたイベントデータを集約の対象から除外するようにしても良い。
ステップS605において、受信したイベントデータが除外の対象である場合、イベント集約部250は、後述するステップS608へ進む。
ステップS605において、受信したイベントデータが除外の対象でない場合、イベント集約部250は、受信したイベントデータの集約を行う(ステップS606)。具体的には、イベント集約部250は、ステップS601で特定したイベントデータに、受信したイベントデータを紐付けて、受信したイベントデータを集約させる。
続いて、イベント集約部250は、集約したイベントデータに基づきインシデント情報を作成してインシデント記憶部220へ格納し(ステップS607)、処理を終了する。このとき、具体的には、イベント集約部250は、イベント記憶部210に格納されたイベントデータのうち、受信したイベントデータに含まれるシステムIDや、ホストIDが同一のイベントデータに、受信したイベントデータを紐付けることで、受信したイベントデータを集約する。
続いて、イベント集約部250は、集約されたインシデント情報に基づくインシデント処理の起票を行い(ステップS608)、処理を終了する。インシデント処理の起票とは、言い換えれば、イベント集約部250の後段の手順検索部260、自動化処理部270による処理の実行指示である。
つまり、イベント集約部250は、受信したイベントデータが、インシデントの発生を示す通知であることを検知している。
図7は、運用支援サーバの動作を説明する第二のフローチャートである。図7では、手順検索部260による処理を示している。
本実施形態の運用支援部240において、手順検索部260は、イベント集約部250によってインシデント処理の起票が行われると、呼び出されて起動する(ステップS701)。
続いて、手順検索部260は、インシデント記憶部220を検索し、インシデントと対応する手順を特定する(ステップS702)。具体的には、手順検索部260は、インシデント情報に含まれるインシデントNoで手順記憶部230を検索し、対応する手順を特定する。
続いて、手順検索部260は、特定された手順に、このインシデントが優先すべきインシデントであることを示す情報が含まれるか否かを判定する(ステップS703)。該当する情報が含まれる場合には、インシデントが発生したことをオペレータの端末装置300へ通知する(ステップS704)。
該当する情報が含まれない場合、手順検索部260は、この手順を表示させるためのリンク(URL)を保持し(ステップS705)、処理を終了する。尚、手順検索部260は、このとき、自動化処理部270に対して処理の実行指示を通知しても良い。
図8は、運用支援サーバの動作を説明する第三のフローチャートである。図8では、自動化処理部270による処理を示している。
本実施形態の運用支援部240において、自動化処理部270は、相関判定部271を呼び出し(ステップS801)、相関判定部271により、特定のメッセージを含む他のイベントが発生しているか否かを判定する(ステップS802)。
具体的には、例えば、相関判定部271は、インシデントの発生した時刻を含む所定時間内に、このインシデントと同様のインシデントが発生したことを示すメッセージを含むイベントが発生したか否かを判定しても良い。
ステップS802において、該当する他のイベントが発生している場合、自動化処理部270は、処理を終了する。
ステップS802において、該当する他のイベントが発生していない場合、自動化処理部270は、インシデントが発生したことをオペレータに通知する(ステップS803)。より具体的には、自動化処理部270は、手順検索部260が保持しているURLを端末装置300に出力しても良い。つまり、本実施形態の自動化処理部270は、業務システム400において発生したインシデントと対応する手順を示す情報を出力する出力部の一例である。
図9は、オペレータの端末装置の表示例を示す図である。図9に示す画面91は、例えば、オペレータが使用する端末装置300に表示される画面である。
画面91では、メッセージ92と、リンク93とが表示されている。メッセージ92は、インシデントが発生したことと、URLに対応手順が示されていることをオペレータに通知するメッセージである。リンク93は、発生したインシデントの対応手順を示す情報の格納先を示すURLである。
本実施形態では、オペレータがリンク93を選択する操作を行うことで、発生したインシデントの対応手順が端末装置300の画面に表示される。
このように、本実施形態によれば、業務システム400から通知されるイベントデータに基づき、インシデントの発生を検知し、対応手順をオペレータに通知することができる。したがって、本実施形態によれば、障害等のインシデントが発生した場合の初動対応を迅速に行わせることができる。
また、本実施形態では、業務システム400から受信する多数のイベントデータを、システムID等によって関連付けて集約することができる。したがって、本実施形態によれば、運用支援サーバ200の処理を軽減させることができる。
また、本実施形態では、業務システム400から単位時間内に一定数以上のイベントデータを受信した場合には、自動化処理部270による処理を行わない状態とすることできる。したがって、本実施形態では、短時間で多数のイベントデータが集中的に受信した場合等に、運用支援サーバ200の負荷が増大することを抑制できる。
また、本実施形態では、インシデントが発生した時刻を含む所定時間の間に、同じような他のインシデントが発生しているか否かを判定し、該当する他のインシデントが発生している場合には、オペレータへの通知を行わない。本実施形態では、これにより、同様の内容の手順がオペレータに対して複数回通知されることを抑制できる。
以上、本発明の実施例について詳述したが、本発明は上述した特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
100 運用支援システム
200 運用支援サーバ
210 イベント記憶部
220 インシデント記憶部
230 手順記憶部
240 運用支援部
250 イベント集約部
260 手順検索部
270 自動化処理部
300 端末装置

Claims (4)

  1. 複数の業務システムのそれぞれにおいてインシデントとされる条件と、前記インシデントに対する対応手順とが対応付けられた条件情報が登録された記憶部と、
    前記業務システムにおいてインシデントが発生した場合に、発生したインシデントに対応した対応手順を示す情報を端末装置に出力する出力部と、を有する運用支援装置。
  2. 前記出力部は、
    前記端末装置に、前記対応手順を示す情報の格納先を示すURLを表示させる、請求項1記載の運用支援装置。
  3. コンピュータによる運用支援方法であって、前記コンピュータが、
    複数の業務システムのそれぞれにおいてインシデントとされる条件と、前記インシデントに対する対応手順とが対応付けられた条件情報を記憶部に登録し、
    前記業務システムにおいてインシデントが発生した場合に、発生したインシデントに対応した対応手順を示す情報を端末装置に出力する、を運用支援方法。
  4. 複数の業務システムのそれぞれにおいてインシデントとされる条件と、前記インシデントに対する対応手順とが対応付けられた条件情報を記憶部に登録する処理と、
    前記業務システムにおいてインシデントが発生した場合に、発生したインシデントに対応した対応手順を示す情報を端末装置に出力する処理と、をコンピュータに実行させる運用支援プログラム。
JP2018199470A 2018-10-23 2018-10-23 運用支援装置、運用支援方法及び運用支援プログラム Pending JP2020067780A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018199470A JP2020067780A (ja) 2018-10-23 2018-10-23 運用支援装置、運用支援方法及び運用支援プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018199470A JP2020067780A (ja) 2018-10-23 2018-10-23 運用支援装置、運用支援方法及び運用支援プログラム

Publications (1)

Publication Number Publication Date
JP2020067780A true JP2020067780A (ja) 2020-04-30

Family

ID=70390396

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018199470A Pending JP2020067780A (ja) 2018-10-23 2018-10-23 運用支援装置、運用支援方法及び運用支援プログラム

Country Status (1)

Country Link
JP (1) JP2020067780A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010061569A (ja) * 2008-09-05 2010-03-18 Toshiba Corp 障害対策管理サーバ及び障害対策管理プログラム
JP2011076161A (ja) * 2009-09-29 2011-04-14 Nomura Research Institute Ltd インシデント管理システム
WO2014136956A1 (ja) * 2013-03-08 2014-09-12 日立建機株式会社 作業機械の管理サーバ及び作業機械の管理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010061569A (ja) * 2008-09-05 2010-03-18 Toshiba Corp 障害対策管理サーバ及び障害対策管理プログラム
JP2011076161A (ja) * 2009-09-29 2011-04-14 Nomura Research Institute Ltd インシデント管理システム
WO2014136956A1 (ja) * 2013-03-08 2014-09-12 日立建機株式会社 作業機械の管理サーバ及び作業機械の管理方法

Similar Documents

Publication Publication Date Title
CN100405311C (zh) 用于计算机系统中的多个分区的错误监视的方法
CN110399260B (zh) 用于预测性地服务和支持解决方案的系统和方法
US7987450B2 (en) Stack-based problem identification for a software component
US20170302524A1 (en) Efficiently determining network topology
WO2018135254A1 (ja) 影響範囲特定プログラム、影響範囲特定方法、および影響範囲特定装置
US11165665B2 (en) Apparatus and method to improve precision of identifying a range of effects of a failure in a system providing a multilayer structure of services
JP6048957B2 (ja) 情報処理装置、プログラム、及び情報処理方法
JP2012094049A (ja) インシデント管理システムおよびインシデント管理プログラム
JP2011145824A (ja) 情報処理装置、障害解析方法及び障害解析プログラム
JP2012230451A (ja) ネットワーク端末故障対応システム、端末装置、サーバ装置、ネットワーク端末故障対応方法及びプログラム
CN109034668B (zh) Etl任务调度方法、装置、计算机设备及存储介质
JP2020067780A (ja) 運用支援装置、運用支援方法及び運用支援プログラム
US20120254675A1 (en) Method and system for distributed processing of alerts
US10817365B2 (en) Anomaly detection for incremental application deployments
JP4865511B2 (ja) サービス管理装置
JP2013114437A (ja) システム構築支援方法
US10438011B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2017068691A (ja) 診断プログラム、診断方法および診断装置
US7188093B2 (en) Methods and systems for determining circular dependency
JP5613570B2 (ja) バッチジョブ遅延警告自動発報システムおよび自動発報方法、ならびにそのためのプログラム
JP5586322B2 (ja) プラント監視システムおよびプラント監視方法
JP2019159984A (ja) 情報処理装置およびプログラム
JP2017162337A (ja) 情報処理装置および制御プログラム
JP2015215739A (ja) 障害切り分けサポートシステムおよび障害対応管理方法
US20230367932A1 (en) Adaptive density estimation with multi-layered histograms

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220908

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20221220