JP7073766B2

JP7073766B2 - 情報処理プログラム、情報処理方法及び情報処理装置

Info

Publication number: JP7073766B2
Application number: JP2018022262A
Authority: JP
Inventors: 直幸田中; 昌俊溝口; 健柿崎
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2018-02-09
Filing date: 2018-02-09
Publication date: 2022-05-24
Anticipated expiration: 2038-02-09
Also published as: JP2019139506A

Description

本発明は、情報処理プログラム、情報処理方法及び情報処理装置に関する。

従来から、メガバンク等の金融機関で運用される勘定系システムが知られている。この勘定系システムは、他の多様なシステム（全国銀行データ通信システム、ネット決済、国内為替等）と連携しており、ビジネスや社会におけるシステムの立ち位置は年々重要なものになりつつある。

また、勘定系システムを用いて行われる業務には、外国為替といった海外の金融機関と関わりのある業務も存在する。さらに、勘定系システムは、外部要因（為替の終了時刻等）により、制限された時間内にサービスの提供を完了させる必要がある。

特開２００９－２８９２２１号公報

近年では、勘定系システムは、年々巨大化及び複雑化している。そのような状況において、例えば、システムの動作中に何らかの障害（事象）が発生した場合、この障害の発生を検知して状態を把握し、影響の範囲を見極めることは困難である。

１つの側面では、本発明は、事象がシステムに及ぼす影響を可視化することを目的としている。

一つの態様では、複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のある、事象の予兆を特定し、特定した前記事象の予兆に基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する、処理をコンピュータに実行させる。

上記各処理は、上記各処理を実現する機能部、各処理を実現する手順としても良く、各処理をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記憶媒体とすることもできる。

事象がシステムに及ぼす影響を可視化できる。

第一の実施形態の監視装置について説明する第一の図である。第一の実施形態の監視装置について説明する第二の図である。第一の実施形態の監視装置のハードウェア構成の一例を示す図である。第一の実施形態の状態管理データベースの一例を示す図である。第一の実施形態のシナリオデータベースの一例を示す図である。第一の実施形態の予兆管理データベースの一例を示す図である。第一の実施形態のシナリオ影響データベースの一例を示す図である。第一の実施形態のサービス構成データベースの一例を示す図である。第一の実施形態のサービス閾値データベースの一例を示す図である。第一の実施形態の予兆検知処理部の機能を説明する図である。第一の実施形態の監視装置の処理を説明する第一のフローチャートである。第一の実施形態の監視装置の処理を説明する第二のフローチャートである。第一の実施形態の端末装置の表示例を示す図である。第二の実施形態の監視装置を説明する図である。第二の実施形態の影響管理データベースの一例を示す図である。第二の実施形態のサービス間関係データベースの一例を示す図である。第二の実施形態のメッセージデータベースの一例を示す図である。第二の実施形態の予兆検知処理部の機能を説明する図である。第二の実施形態の監視装置の処理を説明する第一のフローチャートである。第二の実施形態の監視装置の処理を説明する第二のフローチャートである。第二の実施形態の端末装置の表示例を示す図である。

（第一の実施形態）
以下に図面を参照して、第一の実施形態について説明する。図１は、第一の実施形態の監視装置について説明する第一の図である。

本実施形態の監視装置１００は、勘定系システム２００を監視し、障害の予兆を検知すると、予兆が検知された障害が、勘定系システム２００に及ぼす影響の範囲を特定し、端末装置３００に表示させる。

図１に示す勘定系システム２００は、一例である。勘定系システム２００は、例えば、システム２０１～２０６を含み、主に企業（銀行）や行政機関において会計勘定処理を行う。システム２０１～２０６は、例えば、外国為替システムや国内為替システム、営業店システム、自動機システム、各システムを接続させるハブシステム等を含む。

システム２０１～２０６は、それぞれがサービス（業務）を提供するためのサーバ（情報処理装置）や、各システムにおいて参照されるデータが格納されたデータベース等を有し、それぞれが連携して動作する。

つまり、本実施形態の勘定系システム２００は、複数の情報処理装置が連携して、複数種類の業務を処理するシステムと言える。

本実施形態の監視装置１００は、勘定系システム２００のシステム２０１～２０６のそれぞれから、各システムの状態を示す状態情報を取得する。そして、監視装置１００は、取得した状態情報が、予め障害の予兆とされた状態に合致することを検知すると、該当する障害が勘定系システム２００全体に及ぼす影響の範囲を特定し、端末装置３００に表示させる。

したがって、本実施形態野監視装置１００によれば、障害が勘定系システム２００全体に及ぼす影響の範囲を可視化できる。尚、本実施形態の端末装置３００は、例えば、勘定系システム２００の管理者等によって利用されても良い。

図２は、第一の実施形態の監視装置について説明する第二の図である。本実施形態の監視装置１００は、状態管理データベース１１０、シナリオデータベース１２０、予兆管理データベース１３０、シナリオ影響データベース１４０、サービス構成データベース１５０、サービス閾値データベース１６０を有する。また、本実施形態の監視装置１００は、監視処理部１７０、状態解析部１７５、予兆検知処理部１８０、通知処理部１９０を有する。

状態管理データベース１１０は、勘定系システム２００の各システムのサーバの状態を示す状態情報が格納される。サーバの状態を示す状態情報とは、具体的には、サーバの負荷状態を示す情報を含む。

シナリオデータベース１２０は、障害の予兆とされる勘定系システム２００の状態を示す情報が格納される。以下の説明では、障害（事象）の予兆を、シナリオと呼び、障害の予兆とされる勘定系システム２００の状態を示す情報をシナリオ情報と呼ぶ。

予兆管理データベース１３０は、勘定系システム２００に、状態情報がシナリオ情報と合致するシステムが存在する場合に、このシナリオ情報が格納される。

シナリオ影響データベース１４０は、シナリオ毎に、障害が勘定系システム２００に及ぼす影響を示すシナリオ影響情報が格納される。サービス構成データベース１５０は、勘定系システム２００に含まれる各システムが正常に稼働した場合の、各システムのサーバの負荷状態を示す情報が格納される。

サービス閾値データベース１６０は、勘定系システム２００の各システムのサーバの負荷状態が正常であるか否かを判定するための閾値となる情報が格納されている。

監視処理部１７０は、勘定系システム２００の状態を監視する。具体的には、監視処理部１７０は、勘定系システム２００の各サーバから、状態情報を取得し、状態管理データベース１１０に格納する。つまり、監視処理部１７０は、勘定系システム２００の本番環境を監視し、勘定系システム２００の各サーバから状態情報を取得する。

また、本実施形態の監視処理部１７０は、勘定系システム２００のテスト環境（開発環境）２００Ｔを動作させて各サーバを監視し、状態情報を取得して状態管理データベース１１０に格納する。具体的には、例えば、監視処理部１７０は、テスト環境２００Ｔにおいて、様々な障害を発生させ、その時の状態情報を取得しても良い。

本実施形態の状態解析部１７５は、勘定系システム２００やテスト環境２００Ｔにおいて、障害が発生した場合に、状態管理データベース１１０に格納された状態情報を解析する。そして、状態解析部１７５は、発生した障害の予兆となる状態情報をシナリオ情報としてシナリオデータベース１２０に格納する。さらに、状態解析部１７５は、テスト環境２００Ｔにおいて、障害が発生したときの他のサーバの状態情報を取得し、シナリオ影響データベース１４０に格納しても良い。

尚、本実施形態では、監視処理部１７０により、テスト環境２００Ｔから状態情報を収集して状態管理データベース１１０に格納する処理は、予兆検知処理部１８０による処理が行われる前に、予め実行されていても良い。また、本実施形態の状態解析部１７５による状態管理データベース１１０の解析と、シナリオデータベース１２０へのシナリオ情報の格納は、予兆検知処理部１８０による処理が行われる前に、予め実行されていても良い。

つまり、本実施形態のシナリオデータベース１２０は、予め生成されて、監視装置１００に与えられていても良い。また、本実施形態のシナリオ影響データベース１４０は、シナリオデータベース１２０と共に、予め生成されて、監視装置１００に与えられていても良い。

予兆検知処理部１８０は、状態管理データベース１１０に格納された状態情報から、勘定系システム２００の障害の予兆を検知し、予兆が検知された障害が勘定系システム２００に及ぼす影響を示す情報を出力する。予兆検知処理部１８０の詳細は後述する。

通知処理部１９０は、勘定系システム２００において、障害の発生が明らかな場合に、端末装置３００に障害の発生を通知する。

尚、図２の例では、監視装置１００に各データベースが設けられるものとしたが、これに限定されない。上述した各データベースは、監視装置１００以外の装置に設けられていても良いし、上述した各データベースの一部が監視装置１００以外の装置に設けられていても良い。

次に、図３を参照して、本実施形態の監視装置１００のハードウェア構成について説明する。図３は、第一の実施形態の監視装置のハードウェア構成の一例を示す図である。

本実施形態の監視装置１００は、それぞれバスＢで相互に接続されている入力装置１１、出力装置１２、ドライブ装置１３、補助記憶装置１４、メモリ装置１５、演算処理装置１６及びインターフェース装置１７を含む。

入力装置１１は、各種の情報の入力を行うための装置であり、例えばキーボードやポインティングデバイス等により実現される。出力装置１２は、各種の情報の出力を行うためものであり、例えばディスプレイ等により実現される。インターフェース装置１７は、ＬＡＮカード等を含み、ネットワークに接続する為に用いられる。

予兆検知処理部１８０等を実現する監視プログラムは、監視装置１００を制御する各種プログラムの少なくとも一部である。監視プログラムは例えば記憶媒体１８の配布やネットワークからのダウンロード等によって提供される。監視プログラムを記録した記憶媒体１８は、ＣＤ－ＲＯＭ、フレキシブルディスク、光磁気ディスク等の様に情報を光学的、電気的或いは磁気的に記録する記憶媒体、ＲＯＭ、フラッシュメモリ等の様に情報を電気的に記録する半導体メモリ等、様々なタイプの記憶媒体を用いることができる。

また、監視プログラムは、監視プログラムを記録した記憶媒体１８がドライブ装置１３にセットされると、記憶媒体１８からドライブ装置１３を介して補助記憶装置１４にインストールされる。ネットワークからダウンロードされた監視プログラムは、インターフェース装置１７を介して補助記憶装置１４にインストールされる。

補助記憶装置１４は、インストールされた監視プログラムを格納すると共に、上述した各データベース等の必要なファイル、データ等を格納する。メモリ装置１５は、監視装置１００の起動時に補助記憶装置１４から監視プログラムを読み出して格納する。そして、演算処理装置１６はメモリ装置１５に格納された監視プログラムに従って、後述するような各種処理を実現している。

次に、図４乃至図９を参照して、監視装置１００の有する各データベースについて説明する。

図４は、第一の実施形態の状態管理データベースの一例を示す図である。本実施形態の状態管理データベース１１０は、予兆検知処理部１８０によって、定期的に収集される勘定系システム２００のシステム２０１～２０６の状態を示す状態情報が格納される。

本実施形態の状態管理データベース１１０は、情報の項目として、システム、サーバ、サービス、ＣＰＵ使用率、メモリ、ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、流量、時刻を有する。状態管理データベース１１０において、項目「システム」、「サーバ」、「サービス」と、その他の項目とは対応付けられており、状態管理データベース１１０において各項目の値を含む情報を状態情報と呼ぶ。

項目「システム」の値は、勘定系システム２００に含まれるシステムを特定する情報を示すものであり、具体的には、例えば、システムの名称等である。項目「サーバ」の値は、システムに含まれるサーバを特定する情報であり、具体的には、例えば、サーバの名称等である。項目「サービス」の値は、システムが提供するサービスを特定する情報であり、具体的には、サービスの名称等である。

項目「ＣＰＵ使用率」の値は、サーバがサービスを提供するため使用しているＣＰＵの使用率を示す。項目「メモリ」には、項目「メモリ使用率」、「物理メモリ」、「仮想メモリ」を含む。項目「メモリ使用率」の値は、サーバがサービスを提供するために使用しているメモリの使用率を示す。項目「物理メモリ」、「仮想メモリ」の値は、対応するサーバがサービスを提供するために使用する物理メモリ、仮想メモリの容量である。

項目「ＩＯ」の値は、対応するサーバとデータのやりとりをしている他の装置の数を示す。項目「ロードアベレージ」の値は、システム全体の負荷を示す値である。項目「ネットワーク本数」の値は、対応するサーバと接続されているネットワークの本数を示す。

項目「ファイルアクセス数」の値は、サーバがアクセスしてイルファイルの数を示す。項目「レスポンス」の値は、サーバの応答速度を示す。項目「スループット」の値は、一定時間に処理できる情報量を示す。項目「流量」の値は、実行されている処理数（処理量）を示す。項目「時刻」の値は、状態情報が取得された時刻を示す。

尚、本実施形態では、項目「ＣＰＵ使用率」、「メモリ」、「ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）」、「ロードアベレージ」、「ネットワーク本数」、「ファイルアクセス数」、「レスポンス」、「スループット」、「流量」の値は、対応するサービスを提供する場合におけるサーバの負荷状態を示す情報である。

したがって、本実施形態の状態情報は、システム、サービス及びサーバを示す情報と、このシステムがサービスを提供する際のサーバの負荷状態を示す情報と、を含む情報である。

図５は、第一の実施形態のシナリオデータベースの一例を示す図である。本実施形態のシナリオデータベース１２０は、予め監視装置１００に与えられていても良い。

本実施形態のシナリオデータベース１２０は、情報の項目として、Ｎｏ．、シナリオ番号、シナリオ名、システム、サーバ、サービス、ＣＰＵ使用率、メモリ、ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、流量、影響、対処を有する。

ここで、シナリオデータベース１２０における、項目「システム」、「サーバ」、「サービス」、「ＣＰＵ使用率」、「メモリ」、「ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）」、「ロードアベレージ」、「ネットワーク本数」、「ファイルアクセス数」、「レスポンス」、「スループット」、「流量」は状態情報に含まれる項目と同様である。

シナリオデータベース１２０において、項目「シナリオ番号」と、その他の項目とが対応付けられており、項目「シナリオ番号」の値と、その他の項目の値とを含む情報がシナリオ情報である。

項目「Ｎｏ．」の値は、シナリオ情報としてのレコード毎に付与される番号である。項目「シナリオ番号」の値は、シナリオ情報を特定するための識別子である。項目「シナリオ名」の値は、シナリオの名称を示す。

項目「影響」の値は、対応するシナリオ名が示すシナリオが発生した場合の勘定系システム２００に対する影響を示す情報である。項目「対処」の値は、対応するシナリオ名が示すシナリオが発生した場合に推奨される対処法を示す情報である。

例えば、図５の例では、シナリオ番号「００００１」の「振り込み大量バッチ処理」というシナリオが発生した場合、勘定系システム２００には、「連携先サービス遅延により他行受付の遅れが発生する」と言う影響がでることがわかる。また、このときの対処として、「顧客優先度の低い振り込みデータを翌日処理とする」ことが推奨されることがわかる。

図６は、第一の実施形態の予兆管理データベースの一例を示す図である。本実施形態の予兆管理データベース１３０は、状態管理データベース１１０において、シナリオデータベース１２０に示すシナリオ情報と類似する状態情報が検出されると、この状態情報を含む予兆管理情報が格納される。

本実施形態の予兆管理データベース１３０は、情報の項目として、Ｎｏ．、発生日時、シナリオ番号、シナリオ名、システム、サーバ、サービス、ＣＰＵ使用率、メモリ、ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、流量、影響、対処を有する。

予兆管理データベース１３０では、項目「Ｎｏ．」及び項目「発生時刻」と、その他の項目とが対応付けられており、予兆管理データベース１３０において、各項目の値を含む情報を、予兆管理情報と呼ぶ。

予兆管理情報において、項目「発生日時」は、状態管理データベース１１０に格納された状態情報の項目「時刻」と対応している。また、予兆管理情報において、項目「システム」、「サーバ」、「サービス」、「ＣＰＵ使用率」、「メモリ」、「ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）」、「ロードアベレージ」、「ネットワーク本数」、「ファイルアクセス数」、「レスポンス」、「スループット」、「流量」は状態情報に含まれる、負荷状態を示す情報である。

したがって、予兆管理情報は、状態情報に含まれる負荷状態を示す情報と、状態情報と類似していると判定されたシナリオ番号及びシナリオ名とを対応付けた情報である。

図７は、第一の実施形態のシナリオ影響データベースの一例を示す図である。本実施形態のシナリオ影響データベース１４０は、予め監視装置１００に与えられており、シナリオ（障害の予兆）が発生した後の所定時間後の勘定系システム２００の状態を示すシナリオ影響情報が格納される。

シナリオ影響データベース１４０は、情報の項目として、シナリオ番号、発生後時間、システム、サーバ、サービス、ＣＰＵ使用率、メモリ、ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、流量を有する。シナリオ影響データベース１４０において、各項目は互いに対応付けられており、シナリオ影響データベース１４０において、各項目の値を含む情報をシナリオ影響情報と呼ぶ。

項目「発生後時間」の値は、シナリオ番号と対応するシナリオが発生してから経過した時間を示す。本実施形態では、項目「発生後時間」の値は、１時間後、２時間後、というように示す。

シナリオ影響データベース１４０において、項目「システム」、「サーバ」、「サービス」、「ＣＰＵ使用率」、「メモリ」、「ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）」、「ロードアベレージ」、「ネットワーク本数」、「ファイルアクセス数」、「レスポンス」、「スループット」、「流量」は状態管理データベース１１０の有する項目と同様である。

図７に示すシナリオ影響データベース１４０では、例えば、シナリオ番号「００００１」で特定されるシナリオが発生した場合、シナリオの発生から１時間後のシステム２０１の状態、システム２０２の状態、シナリオの発生から２時間後のシステム２０１の状態、システム２０２の状態を示している。

図８は、第一の実施形態のサービス構成データベースの一例を示す図である。本実施形態のサービス構成データベース１５０は、予め監視装置１００に設けられており、勘定系システム２００の各システムが正常に動作しているときの状態を示す情報が格納される。

サービス構成データベース１５０は、情報の項目として、システム、サーバ、サービス、時限、業務優先度、ＣＰＵ使用率、メモリ、ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、最大流量を有する。サービス構成データベース１５０において、各項目は、互いに対応付けられており、サービス構成データベース１５０において、各項目の値を含む情報をサービス構成情報と呼ぶ。

項目「時限」の値は、対応するサービスを提供すべき時間を示す。項目「業務優先度」の値は、対応するサービスの業務における優先度を示す。

例えば、システム２０１のオンラインサービスと対応する項目「時限」の値は、８：００－１５：３０である。したがって、システム２０１のオンラインサービスは、８：００－１５：３０の間は、クライアント側が受けることができるサービスであり、業務優先度が高いことがわかる。

項目「最大流量」の値は、正常な状態において、一度に実行される処理数の最大値を示す。本実施形態では、状態情報において、項目「流量」の値が、項目「最大流量」の値よりも大きくなると、対応するサーバが過負荷であるものと見なされる。

この他の項目は、状態管理データベース１１０の有する項目と同様である。

図９は、第一の実施形態のサービス閾値データベースの一例を示す図である。本実施形態のサービス閾値データベース１６０は、監視装置１００に予め設けられているものであり、サーバが正常な状態であるか否か等を判定する際に参照される。

サービス閾値データベース１６０は、情報の項目として、システム、サーバ、サービス、程度、ＣＰＵ使用率、メモリ、ＩＯ（Ｉｎｐｕｔ／Ｏｕｔｐｕｔ）、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、流量を有する。サービス閾値データベース１６０において、各項目は、互いに対応付けられており、サービス閾値データベース１６０において、各項目の値を含む情報を閾値情報と呼ぶ。

項目「程度」の値は、サービスを提供するシステムの状態の程度を示す。その他の項目は、状態管理データベース１１０の有する項目と同様であり、各項目の値は、程度を判定するための閾値を示す。

本実施形態では、例えば、システム２０１のオンラインサーバによって提供される業務共通サービスでは、ＣＰＵ使用率が１２５％以上となった場合等には、システム２０１の状態の程度は、「相当悪い」と評価される。

尚、本実施形態では、状態情報に含まれる項目「ＣＰＵ使用率」、「メモリ」、「ＩＯ」、「ロードアベレージ」、「ネットワーク本数」、「ファイルアクセス数」、「レスポンス」、「スループット」、「流量」のうち、複数の項目の値が、閾値情報に含まれる閾値以上となったときに、サービスの進捗を対応する程度としても良い。

したがって、本実施形態では、例えば、システム２０１のオンラインサーバによって提供される業務共通サービスと対応するＣＰＵ使用率、メモリ使用率、流量の全てが、程度「悪い」を含む閾値情報に含まれる閾値以上となった場合に、システム２０１の状態の程度は、「悪い」と評価されても良い。

尚、システムの状態の程度とは、例えば、システムによるサービスの提供状況を示すものであっても良い。例えば、本実施形態では、システムの状態の程度が正常である場合には、サービスを滞りなく提供できる状態を示し、システムの状態の程度が悪い場合や相当悪い場合は、サービスの提供が滞る状態を示す。

また、図９では示していないが、サービス閾値データベース１６０には、システムの状態の程度に応じて、システムが提供するサービスに対する影響の程度を示す画像の画像データが格納されていてもよい。

次に、図１０を参照して、本実施形態の監視装置１００の予兆検知処理部１８０の機能について説明する。

図１０は、第一の実施形態の予兆検知処理部の機能を説明する図である。本実施形態の予兆検知処理部１８０は、監視装置１００の演算処理装置１６が、補助記憶装置１４やメモリ装置１５等に格納された監視プログラムを実行することで実現される。

本実施形態の予兆検知処理部１８０は、情報取得部１８１、シナリオ特定部１８２、性能取得部１８３、影響程度評価部１８４、出力部１８５を有する、
本実施形態の情報取得部１８１は、状態管理データベース１１０から状態情報を取得する。シナリオ特定部１８２は、シナリオデータベース１２０を参照し、情報取得部１８１が取得した状態情報と類似するシナリオ情報が存在するか否か判定し、該当するシナリオ情報が存在する場合には、該当するシナリオ情報を特定する。また、シナリオ特定部１８２は、類似するシナリオ情報が存在した場合、この状態情報を含む予兆管理情報を予兆管理データベース１３０に格納する。

性能取得部１８３は、サービス構成データベース１５０を参照し、予兆管理情報に含まれるシステムの正常な状態を示すサービス構成情報を取得する。

影響程度評価部１８４は、予兆管理情報から予兆が検知されたシナリオのシナリオ影響情報を抽出する。そして、影響程度評価部１８４は、シナリオ影響情報と、サービス構成情報と、サービス閾値データベース１６０とから、予兆が検知されたシナリオが発生した場合の勘定系システム２００に対する影響を、サービス毎に評価する。影響程度評価部１８４の処理の詳細は後述する。

出力部１８５は、影響程度評価部１８４による評価結果を端末装置３００等に出力する。

以下に、図１１を参照して、本実施形態の監視装置１００の処理について説明する。図１１は、第一の実施形態の監視装置の処理を説明する第一のフローチャートである。図１１に示す処理は、予兆管理データベース１３０に予兆管理情報を格納する処理であり、予兆検知処理部１８０は、勘定系システム２００が起動している場合は、図１１に示す処理を定期的に実行する。

本実施形態の予兆検知処理部１８０は、情報取得部１８１により、勘定系システム２００に含まれる各システムによって提供されるサービス毎に、システムの状態情報を取得し、状態管理データベース１１０に格納する（ステップＳ１１０１）。

続いて、予兆検知処理部１８０は、シナリオ特定部１８２により、状態管理データベース１１０に状態情報が格納されたあるサービスを選択する（ステップＳ１１０２）。続いて、シナリオ特定部１８２は、状態情報において、選択したサービスと、このサービスと対応するシステム、サーバと、をキーとしてシナリオデータベース１２０を検索する（ステップＳ１１０３）。

続いて、シナリオ特定部１８２は、シナリオデータベース１２０に、選択されたサービスと対応する状態情報と一致率が所定の値以上となるシナリオ情報が存在するか否かを判定する（ステップＳ１１０４）。

具体的には、シナリオ特定部１８２は、状態情報に含まれる複数の項目の値と、シナリオ情報における対応する項目の値との差分が、所定の範囲内であった場合に、この状態情報とシナリオ情報との一致率が所定の値以上であるものとしてもよい。

また、シナリオ特定部１８２は、例えば、状態情報に含まれるサーバの負荷状態を示す全ての項目の値と、シナリオ情報に含まれる対応する項目の値との差分が所定の範囲内である場合に、この状態情報とシナリオ情報の一致率が所定の値以上と判定して良い。また、一致率は、例えば、シナリオ情報に含まれる負荷状態を示す項目の値と、状態情報に含まれる負荷状態を示す項目の値と、の差分の大きさによって算出されても良い。一致率の算出の方法は、状態情報とシナリオ情報とに基づき算出される方法であれば、どのような方法で合っても良い。

ステップＳ１１０４において、一致率が所定の値以上のシナリオ情報が存在しない場合、予兆検知処理部１８０は、後述するステップＳ１１０６へ進む。

ステップＳ１１０４において、一致率が所定の値以上のシナリオ情報が存在する場合、シナリオ特定部１８２は、状態情報とシナリオ情報とから、予兆管理情報を生成し、予兆管理データベース１３０に格納する（ステップＳ１１０５）。

より具体的には、シナリオ特定部１８２は、状態情報に含まれる負荷状態を示す情報と、状態情報と類似していると判定されたシナリオ情報に含まれるシナリオ番号及びシナリオ名とを対応付けて予兆管理情報とし、予兆管理データベース１３０に格納する。

続いて、予兆検知処理部１８０は、ステップＳ１１０１で状態情報を取得して全てのサービスについて、ステップＳ１１０２以降の処理を実行したか否かを判定する（ステップＳ１１０６）。ステップＳ１１０６において、全てのサービスについて処理を実行していない場合、予兆検知処理部１８０は、ステップＳ１１０２に戻り、次のサービスを選択する。

ステップＳ１１０６において、全てのサービスについて処理を実行した場合、予兆検知処理部１８０は、勘定系システム２００の停止指示を受け付けたか否かを判定する（ステップＳ１１０７）。ステップＳ１１０７において、停止指示を受け付けていない場合、予兆検知処理部１８０は、ステップＳ１１０１へ戻る。ステップＳ１１０７において、停止指示を受け付けた場合、予兆検知処理部１８０は、処理を終了する。

このように、本実施形態では、状態情報とシナリオ情報の一致率が所定の値以上となることを所定の条件とし、勘定系システム２００に含まれる各システムのサーバの負荷状態が所定の条件と合致することを検知する。

次に、図１２を参照して、影響程度評価部１８４の処理について説明する。図１２は、第一の実施形態の監視装置の処理を説明する第二のフローチャートである。

図１２に示す処理は、影響程度評価部１８４の処理を説明するフローチャートであり、予兆管理データベース１３０に予兆管理情報が格納される度に実行されても良いし、定期的に実行されても良い。また、図１２の処理は、評価結果の出力要求を受けて、実行されても良い。

本実施形態の予兆検知処理部１８０は、影響程度評価部１８４により、予兆管理データベース１３０に格納された予兆管理情報を取得する（ステップＳ１２０１）。続いて、影響程度評価部１８４は、シナリオ影響データベース１４０を参照し、予兆管理情報に含まれるシナリオ番号と一致するシナリオ番号を含むシナリオ影響情報を抽出する（ステップＳ１２０２）。

続いて、影響程度評価部１８４は、抽出したシナリオ影響情報に含まれるサービスを選択する（ステップＳ１２０３）。具体的には、影響程度評価部１８４は、例えば、異なるサービスの名称を含む複数のシナリオ影響情報が抽出された場合、あるサービスの名称を含むシナリオ影響情報を選択する。また、影響程度評価部１８４は、抽出されたシナリオ影響情報のうち、発生後時間が短いものから順に、シナリオ影響情報を選択しても良い。

続いて、影響程度評価部１８４は、サービス構成データベース１５０から、選択されたサービスと対応するサービス構成情報を取得する（ステップＳ１２０４）。続いて、影響程度評価部１８４は、選択されたサービスの名称を含むシナリオ影響情報と、サービス構成情報とを比較し、さらにサービス閾値データベース１６０を参照して、選択されたサービスを提供するためのサーバの負荷状態の程度を評価する（ステップＳ１２０５）。

続いて、影響程度評価部１８４は、ステップＳ１２０２で抽出されたシナリオ影響情報のうち、項目「発生後時間」の値が同一のシナリオ影響情報に含まれる全てのサービスについて、ステップＳ１２０３からステップＳ１２０５までの処理を行ったか否かを判定する（ステップＳ１２０６）。ステップＳ１２０６において、該当する処理を実行していない場合、影響程度評価部１８４は、ステップＳ１２０３に戻る。

ステップＳ１２０６において、該当する処理が実行された場合、影響程度評価部１８４は、シナリオ影響情報に含まれる発生後時間毎に、ステップＳ１２０６までの処理を実行したか否かを判定する（ステップＳ１２０７）。

ステップＳ１２０７において、該当する処理を実行していない場合、影響程度評価部１８４は、抽出されたシナリオ影響情報のうち、次の発生後時間のシナリオ影響情報を抽出し（ステップＳ１２０８）、ステップＳ１２０３へ戻る。

ステップＳ１２０７において、該当する処理が実行された場合、予兆検知処理部１８０は、出力部１８５により、評価結果を出力し（ステップＳ１２０９）、処理を終了する。具体的には、出力部１８５は、評価結果を示す画面を表示させるための情報を端末装置３００に出力しても良い。

以下に、本実施形態の影響程度評価部１８４の処理を具体的に説明する。以下の説明では、状態管理データベース１１０に格納されたシステム２０２のバッチサーバにより提供されるファイル取り込みサービスと対応する状態情報４１（図４参照）が、シナリオデータベース１２０に格納されたシナリオ情報５１（図５参照）との一致率が所定の値以上であるものとして、説明する。言い換えれば、状態情報４１に含まれる負荷状態を示す情報は、シナリオ情報５１のシナリオ番号とシナリオ名と対応付けられて、予兆管理情報６１（図６参照）として、予兆管理データベース１３０に格納されている。

この場合、影響程度評価部１８４は、シナリオ影響データベース１４０を参照し、シナリオ情報５１に含まれるシナリオ番号「００００１」を含むシナリオ影響情報を抽出する。ここでは、例えば、シナリオ番号「００００１」を含むシナリオ影響情報として、項目「発生後時間」の値が１時間のシナリオ影響情報群７１と、項目「発生後時間」の値が２時間のシナリオ影響情報群７２と、が抽出される（図７参照）。

次に、影響程度評価部１８４は、シナリオ影響情報群７１に含まれる、あるサービスの名称を含むシナリオ影響情報を選択する。ここでは、例えば、システム２０１のオンラインサーバにより提供されるホスト連携サービスと対応したシナリオ影響情報が選択される。

次に、影響程度評価部１８４は、サービス構成データベース１５０を参照し、システム２０１のオンラインサーバにより提供されるホスト連携サービスのサービス構成情報８１を抽出する（図８参照）。

続いて、影響程度評価部１８４は、選択されたシナリオ影響情報と、サービス構成情報８１とを比較する。そして、影響程度評価部１８４は、サービス閾値データベース１６０に格納された、システム２０１のオンラインサーバにより提供されるホスト連携サービスの閾値情報９１を参照し（図９参照）、シナリオ番号「００００１」のシナリオ（事象）が発生後１時間経過したときの、システム２０１のオンラインサーバにより提供されるホスト連携サービスの状態の程度を示す情報を取得する。

影響程度評価部１８４は、この処理を、シナリオ影響情報群７１に含まれる全てのシナリオ影響情報に行うと、次に、シナリオ影響情報群７２を抽出し、同様の処理を行う。

そして、予兆検知処理部１８０は、抽出された全てのシナリオ影響情報に対して、サービスの状態の程度を取得すると、出力部１８５により、取得した情報を時間帯毎の予測結果として端末装置３００に表示させる。

以下に、図１３を参照して、端末装置３００の表示例について説明する。図１３は、第一の実施形態の端末装置の表示例を示す図である。

図１３（Ａ）の画面１３１は、シナリオ番号「００００１」のシナリオ（事象）の予兆が検知された場合の勘定系システム２００の影響の予測結果が表示された画面の例である。また、図１３（Ｂ）に示す画面１３１Ａは、予兆が検知されたシナリオに対する対処法が表示された画面の例である。

画面１３１は、表示欄１３２、１３３、１３４を有する。表示欄１３２は、予兆検知処理部１８０による予測結果が表示される。表示欄１３３は、予兆が検知されたシナリオを通知するメッセージが表示される。表示欄１３４は、勘定系システム２００の各システムのログを示す情報が表示される。

表示欄１３２には、勘定系システム２００に含まれる各システムについて、所定時間毎の各システムが提供するサービスの状態の程度を示す画像が表示される。具体的には、表示欄１３２には、表示欄１３５、１３６が含まれる。

表示欄１３５は、システム２０１によって提供される各サービスの所定時間毎の状態の程度を示す画像が表示されており、表示欄１３６には、システム２０２によって提供される各サービスの所定時間毎の状態の程度を示す画像が表示されている。尚、本実施形態では、所定時間毎を１時間毎としている。この所定時間の区切り方は、発生後時間の区切り方と一致している。つまり、シナリオ影響データベース１４０において、項目「発生後時間」の値が１時間毎とされていた場合、表示欄１３２に表示される所定時間毎は、１時間毎となる。

画面１３１の表示欄１３５、１３６では、それぞれに、システム２０１とシステム２０２によって提供される３つのサービスについて、所定時間毎の状態の程度を示す画像が表示されている。本実施形態では、例えば、システムの状態が正常であり、サービスの提供に影響を及ぼさない場合には、笑顔の画像を表示させる。サービスの提供に影響を及ぼさない場合とは、言い換えれば、システムによってサービスが滞りなく提供される場合である。

また、本実施形態では、例えば、システムの状態の程度が「悪い」と評価された場合、無表情の顔の画像を表示させ、システムの状態の程度が「相当悪い」と評価された場合、怒った顔の画像を表示させる。

また、表示欄１３５、１３６では、発生後時間が最も短い時間と対応する画像を、発生後時間が長い時間と対応する画像より大きく表示させる。

画面１３１の表示欄１３５によれば、システム２０１によって提供される３つのサービスは、シナリオ番号「００００１」のシナリオが発生してから１時間後と対応する画像は、笑顔の画像である。したがって、これらのサービスは、シナリオ発生から１時間後までは、滞りなく提供されることがわかる。

また、システム２０１によって提供される３つのサービスは、シナリオが発生してから２時間後から４時間後までは各発生後時間と対応する画像が、無表情の顔の画像が表示されている。したがって、これらのサービスは、シナリオ発生から２時間後には、提供が滞りはじめることがわかる。つまり、これらのサービスは、シナリオ番号「００００１」のシナリオが発生した２時間後から影響が出始めることがわかる。

また、システム２０１によって提供される３つのサービスは、シナリオが発生してから５時間後と対応する画像は、怒った顔の画像となっている。つまり、これらのサービスは、シナリオ番号「００００１」のシナリオが発生した５時間後には、影響画大きくなることがわかる。

つまり、画面１３１では、勘定系システム２００の有する各システムによって処理される複数の業務（サービス）毎に、予測される各業務の進捗状況と対応する画像が表示される。

同様に、表示欄１３６によれば、システム２０２によって提供される３つのサービスのうち、ファイル取り込みサービス以外の２つのサービスは、シナリオが発生してから２時間後までは、各発生後時間と対応する画像は笑顔のマークである。よって、これらのサービスは、シナリオが発生してから２時間後までは、滞りなく提供されることがわかる。

また、システム２０２によって提供されるファイル取り込みサービスでは、シナリオが発生してから１時間後と対応する画像が、怒った顔のマークとなっている。したがって、ファイル取り込みサービスは、シナリオ番号「００００１」のシナリオが発生すると、直ちに大きな影響を受けることがわかる。

さらに、表示欄１３６では、シナリオの発生から４時間後には、システム２０２が提供する３つのサービスの全てにおいて、発生後時間と対応する画像画怒った顔の画像となっている。したがって、システム２０２は、シナリオ番号「００００１」のシナリオが発生した場合、システム２０１よりも状態の程度が悪くなり、サービスの提供が滞ることがわかる。

また、本実施形態では、表示欄１３３に表示されたメッセージが選択されると、画面１３１が画面１３１Ａに遷移する。画面１３１Ａでは、表示欄１３３のメッセージにより通知されたシナリオに対する対処法が表示される表示欄１３７が表示される。

具体的には、画面１３１において表示欄１３３がクリックやタップ等の操作により選択されると、出力部１８５は、予兆管理データベース１３０において、シナリオ番号と対応する項目「対処」の値を表示した表示欄１３７を表示させる。

また、図１３では図示していないが、本実施形態では、例えば、表示欄１３３が選択されたとき、予兆管理データベース１３０における項目「影響」の値を表示させてもよい。

このように、本実施形態によれば、勘定系システム２００において、シナリオ番号「００００１」のシナリオが発生すると、システム２０１では、発生から２時間が経過した頃から影響がではじめ、状態の程度が悪化することがわかる。また、本実施形態によれば、システム２０２は、発生から１時間経過した頃には、状態の程度が相当悪化することがわかる。

さらに、本実施形態では、シナリオ番号「００００１」のシナリオが発生した場合に、「顧客優先度の低い振り込みデータを翌日の処理にする」と言う対処法が推奨されていることがわかる。

尚、画面１３１Ａの表示欄１３７では、１つの対処法が表示されているが、対処法が複数存在する場合には、優先度の高い対処法から順に表示されても良い。対処法の優先度は、例えば、シナリオデータベース１２０の項目「対処」において、対処法毎に付与されていても良い。

尚、本実施形態では、勘定系システム２００の有する各システムの状態の程度を示す画像を、顔の表情を示すマークとしたが、これに限定されない。本実施形態では、各システムの状態の程度に応じて、程度の良し悪しが判別できるような画像を発生後時間と対応付けて表示させれば良い。

言い換えれば、本実施形態では、システムのサーバの負荷が適正であり、滞りなくサービスが提供される場合と、システムのサーバの負荷が大きく、サービスの提供が滞る場合とで、対応づける画像の表示態様を異ならせれば良い。

このように、本実施形態では、シナリオの予兆が検知されると、このシナリオが発生した後に、このシナリオが勘定系システム２００に含まれる各システムによるサービスの提供が、どのように滞っていくかを通知することができる。したがって、本実施形態によれば、事象がシステムに及ぼす影響の範囲を可視化することができる。

（第二の実施形態）
以下に図面を参照して、第二の実施形態について説明する。第二の実施形態では、システムの状態が正常な状態とは異なる状態となることをシナリオ（事象）として検知する点が、第一の実施形態と相違する。よって、以下の第二の実施形態の説明では、第一の実施形態との相違点について説明し、第一の実施形態と同様の機能構成を有するものには、第一の実施形態の説明で用いた符号と同様の符号を付与し、その説明を省略する。

図１４は、第二の実施形態の監視装置を説明する図である。本実施形態の監視装置１００Ａは、状態管理データベース１１０、サービス構成データベース１５０、サービス閾値データベース１６０、影響管理データベース２１０、サービス間関係データベース２２０、メッセージデータベース２３０、監視処理部１７０、状態解析部１７５、予兆検知処理部１８０Ａ、通知処理部１９０を有する。

影響管理データベース２１０は、システムの状態がサービス構成データベース１５０に格納されたサービス構成情報が示す状態と異なる状態となった場合に、このシステムのサーバの負荷状態を示す情報が影響管理情報として格納される。

サービス間関係データベース２２０は、サービス間の関係を示す関係情報が格納される。メッセージデータベース２３０は、事象に応じて表示させるメッセージが格納される。

本実施形態の予兆検知処理部１８０Ａは、状態管理データベース１１０に格納された状態情報と、サービス構成データベース１５０に格納されたサービス構成情報とを比較し、システムの状態が正常であるか否かを判定する。そして、予兆検知処理部１８０Ａは、状態が正常でないシステムが存在する場合に、そのシステムの状態が勘定系システム２００に及ぼす影響の範囲を可視化する。

以下に、図１５乃至図１７を参照し、影響管理データベース２１０、サービス間関係データベース２２０、メッセージデータベース２３０について説明する。

図１５は、第二の実施形態の影響管理データベースの一例を示す図である。本実施形態の影響管理データベース２１０は、情報の項目として、シナリオ番号、発生後時間、システム、サーバ、サービス、ＣＰＵ使用率、メモリ、ＩＯ、ロードアベレージ、ネットワーク本数、ファイルアクセス数、レスポンス、スループット、流量、事象（シナリオ）、リソースを有する。

項目「シナリオ番号」、「発生後時間」、「システム」、「サーバ」、「サービス」、「ＣＰＵ使用率」、「メモリ」、「ＩＯ」、「ロードアベレージ」、「ネットワーク本数」、「ファイルアクセス数」、「レスポンス」、「スループット」、「流量」は、図７のシナリオ影響データベース１４０が有する項目と同様である。

項目「事象」の値は、対応付けられた各項目の値が示すサーバの負荷状態と対応する事象を示す。項目「リソース」の値は、対応する事象を解消させるために必要とされるリソースを示す。

以下の説明では、影響管理データベース２１０において、各項目の値を含む情報を、影響管理情報と呼ぶ。影響管理情報は、例えば、状態情報が示す負荷情報が、サービス構成情報が示す負荷状態を超えると判定された場合等において、状態情報に含まれる負荷状態を示す情報に、シナリオ番号と発生後時間と事象とを対応付けて生成され、影響管理データベース２１０に格納される。

図１６は、第二の実施形態のサービス間関係データベースの一例を示す図である。本実施形態のサービス間関係データベース２２０は、情報の項目として、Ｎｏ．、システム、サーバ、サービス、後続システム、後続サーバ、後続サービス、連携方法、連携割合、タイムラグを有する。

項目「Ｎｏ．」の値は、レコード毎に付与される識別子である。項目「システム」、「サーバ」、「サービス」の値は、他のデータベースと同様である。

項目「後続システム」の値は、項目「システム」の値が示すシステムの後段で処理を実行するシステムを示す。項目「後続サーバ」の値は、項目「サーバ」の値が示すサーバの後段で処理を実行するサーバを示す。言い換えれば、項目「後続サーバ」の値は、後続システムが有するサーバの一つである。

項目「後続サービス」の値は、項目「サービス」の値が示すサービスの後段に提供されるサービスを示す。

項目「連携方法」の値は、項目「システム」の値が示すシステムと、項目「後続システム」の値が示すシステムとを連携させる方法を示す。

項目「連携割合」の値は、項目「システム」の値が示すシステムが実行する処理数二対する、項目「後続システム」の値が示すシステムによる処理が後段で実行される処理数の割合を示す。

項目「タイムラグ」の値は、項目「システム」の値が示すシステムと、項目「後続システム」の値が示すシステムとの連携にかかる時間を示す。言い換えれば、項目「タイムラグ」の値は、項目「システム」の値が示すシステムによって処理が実行されてから、項目「後続システム」の値が示すシステムで、この処理の後段の処理の実行が開始されるまでの時間を示す。

図１６の例では、システム２０１のオンラインサーバによって提供される外部連携サービスは、同じシステム２０１のオンラインサーバにより提供される営業店連携サービスと連携される。言い換えれば、システム２０１のオンラインサーバは、外部連携サービスを実現する処理を実行した後に、営業店連携サービスを実現する処理を実行する。

図１７は、第二の実施形態のメッセージデータベースの一例を示す図である。本実施形態のメッセージデータベース２３０は、情報の項目として、事象とメッセージとを有する。項目「事象」の値は、影響管理情報に含まれる負荷状態を示す情報と対応する事象を示す。項目「メッセージ」の値は、事象と対応して表示させるメッセージを示す。

次に、図１８を参照して、本実施形態の予兆検知処理部１８０Ａの機能について説明する。図１８は、第二の実施形態の予兆検知処理部の機能を説明する図である。

本実施形態の予兆検知処理部１８０Ａは、情報取得部１８１、性能取得部１８３、影響程度評価部１８４、出力部１８５、性能比較部１９１、終了時間算出部１９２、後続サービス特定部１９３、タイムラグ算出部１９４、流量算出部１９５、リソース算出部１９６、情報保持部１９７を有する。

性能比較部１９１は、状態情報とサービス構成情報とを比較する。終了時間算出部１９２は、性能比較部１９１による比較結果に基づき、サービスや後続サービスの提供の終了時間を算出する。後続サービス特定部１９３は、サービス間関係データベース２２０を参照し、サービス構成情報と比較された状態情報が示すサービスの後続サービスを特定する。

タイムラグ算出部１９４は、特定された後続サービスによりサービスを提供する場合の発生後時間毎のタイムラグを算出する。流量算出部１９５は、後続サービスの現在の流量を算出する。

リソース算出部１９６は、終了時間算出部１９２により、サービス構成データベース１５０において予め決められた時限内にサービスの提供を終了するために必要なリソースを算出する。情報保持部１９７は、後続サービスについて算出した情報を保持する。

次に、図１９及び図２０を参照して、本実施形態の監視装置１００Ａの動作について説明する。

図１９は、第二の実施形態の監視装置の処理を説明する第一のフローチャートである。

本実施形態の予兆検知処理部１８０Ａは、情報取得部１８１により、状態管理データベース１１０より、監視対象のシステムの状態情報を抽出する（ステップＳ１９０１）。続いて、予兆検知処理部１８０Ａは、性能取得部１８３により、抽出した状態情報に含まれるサービスを選択する（ステップＳ１９０２）。

次に、性能取得部１８３は、サービス構成データベース１５０を参照し（ステップＳ１９０３）、性能比較部１９１により、ステップＳ１９０２で選択されたサービスを含む状態情報が、このサービスのサービス構成情報が示す状態を超えるか否かを判定する（ステップＳ１９０４）。言い換えれば、性能比較部１９１は、選択されたサービスと対応する状態情報が示すサーバの負荷が、選択されたサービスと対応するサービス構成情報が示すサーバの負荷よりも大きいか否かを判定する。

ステップＳ１９０４において、状態情報が示すサーバの負荷が、サービス構成情報が示すサーバの負荷以下である場合、性能比較部１９１は、サーバの負荷状態が正常であると判定し、予兆検知処理部１８０Ａは、後述するステップＳ１９１８へ進む。

つまり、本実施形態では、勘定系システム２００に含まれる各システムのサーバの負荷状態が、正常の状態を示す負荷状態よりも過負荷となることを所定の条件とし、各システムのサーバの負荷状態が所定の条件と合致することを検知する。

ステップＳ１９０４において、状態情報が示すサーバの負荷が、サービス構成情報が示すサーバの負荷より大きい場合、予兆検知処理部１８０Ａは、終了時間算出部１９２により、選択されたサービスと対応する状態情報に含まれる現在の流量から、サービスの提供が終了する時間を算出する（ステップＳ１９０５）。

より具体的には、終了時間算出部１９２は、状態情報の項目「流量」の値から、サーバがサービスを提供するために実行すべき全ての処理の実行を完了するときの時間を算出する。

そして、終了時間算出部１９２は、サーバが提供すべきサービスが、予め決められた時限内に完了するか否かを判定する（ステップＳ１９０６）。具体的には、終了時間算出部１９２は、現在時刻と、算出された時間とから、サーバが全ての処理の実行が完了する時刻が、サービス構成情報に含まれる項目「時限」の値が示す時限内であるか否かを判定する。

ステップＳ１９０６において、時限内にサービスの提供が終了する場合、予兆検知処理部１８０Ａは、後述するステップＳ１９１８へ進む。

ステップＳ１９０６において、時限内にサービスの提供が終了しない場合、予兆検知処理部１８０Ａは、この状態情報に、項目「シナリオ番号」、「発生後時間」、「事象」の値を対応付けて影響管理情報とし、影響管理データベース２１０に格納する（ステップＳ１９０７）。

尚、本実施形態では、例えば、状態情報とサービス構成情報との比較結果と、事象と、を対応付けたデータベースを参照して、影響管理情報に含める事象を特定しても良い。

続いて、予兆検知処理部１８０Ａは、後続サービス特定部１９３により、サービス間関係データベース２２０を参照し、影響管理データベース２１０に格納された影響管理情報に含まれるサービスの後続サービスを特定する（ステップＳ１９０８）。ここで、後続サービス特定部１９３は、エンドポイントになるまでの後続サービスを特定する。したがって、影響管理情報に含まれるサービスの次にあるサービスが後続し、さらに、あるサービスに続くサービスが存在する場合、後続サービス特定部１９３は、あるサービスと、あるサービスに続くサービスとを後続サービスとして特定する。

続いて、予兆検知処理部１８０Ａは、タイムラグ算出部１９４により、サービス間関係データベース２２０を参照し、所定時間毎の後続サービスのタイムラグを算出する（ステップＳ１９０９）。

尚、ここでの所定時間は、影響管理データベース２１０における項目「発生後時間」の単位と同様である。例えば、影響管理データベース２１０における項目「発生後時間」の値を１時間毎とする場合、ここでの所定時間は１時間となる。

タイムラグ算出部１９４は、具体的には、例えば、所定時間の間に後続サービスへ渡される処理数を算出する。そして、タイムラグ算出部１９４は、サービス間関係データベース２２０の関係情報に含まれる項目「タイムラグ」の値と、後続サービスへ渡される処理数とから、所定時間毎のタイムラグを算出する。

続いて、予兆検知処理部１８０Ａは、流量算出部１９５により、サービス間関係データベース２２０を参照し、特定された後続サービスの流量を算出する（ステップＳ１９１０）。具体的には、流量算出部１９５は、ステップＳ１９０２で選択されたサービスと対応する状態情報に含まれる流量と、関係情報に含まれる連携割合とを用いて、現在の後続サービスの流量を算出する。

続いて、流量算出部１９５は、サービス構成データベース１５０を参照し、後続サービスと対応するサービス構成情報から流量の値を取得する（ステップＳ１９１１）。言い換えれば、流量算出部１９５は、後続サービスと対応するサービス構成情報から、後続サービスを提供するサーバにおいて、想定される流量の値を取得する。

続いて、予兆検知処理部１８０Ａは、終了時間算出部１９２により、後続サービスの提供が設定された時限内に終了するか否かを判定する（ステップＳ１９１２）。具体的には、終了時間算出部１９２は、ステップＳ１９０９で算出された所定時間毎のタイムラグと、ステップＳ１９１０で算出された後続サービスの流量と、ステップＳ１９１１で取得された後続サービスの流量と、に基づき、後続サービスの提供が時限内に完了するか否かを判定する。

後続サービスの提供が時限内に終了する場合（ステップＳ１９１３）、予兆検知処理部１８０Ａは、後述するステップＳ１９１８へ進む。

ステップＳ１９１３において、後続サービスの提供が時限内に終了しない場合、予兆検知処理部１８０Ａは、リソース算出部１９６により、時限内に後続サービスの提供を完了させるために必要となるリソースを算出する（ステップＳ１９１４）。具体的には、リソース算出部１９６は、例えば、後続サービスの状態情報とサービス構成情報とを参照し、後続サービスの提供を時限内に終了させるために要求されるサーバのハードウェアの性能を算出したりする。また、リソース算出部１９６は、ハードウェアのリソースを向上させても、後続サービスの提供を時限内に終了させることができない場合には、人的なリソースも含めたリソースを算出する。

続いて、予兆検知処理部１８０Ａは、情報保持部１９７により算出されたリソースを保持しておく（ステップＳ１９１５）。

続いて、予兆検知処理部１８０Ａは、後続サービス特定部１９３により特定された全ての後続サービスについて、ステップＳ１９１５までの処理を実行したか否かを判定する（ステップＳ１９１６）。ステップＳ１９１６において、全ての後続サービスについて処理を行っていない場合、予兆検知処理部１８０Ａは、ステップＳ１９０８へ戻る。

ステップＳ１９１６において、全ての後続サービスについて処理を行った場合、予兆検知処理部１８０Ａは、情報保持部１９７により、保持しているリソースを、影響管理データベース２１０に格納された影響管理情報の項目「リソース」の値として格納する（ステップＳ１９１７）。

続いて、予兆検知処理部１８０Ａは、ステップＳ１９０１で抽出された状態情報と対応する全てにサービスについて、ステップＳ１９１７までの処理を実行したか否かを判定する（ステップＳ１９１８）。ステップＳ１９１８において、全てのサービスについて処理が実行されていない場合、予兆検知処理部１８０Ａは、ステップＳ１９０２に戻る。

ステップＳ１９１８について、全てのサービスについて処理が実行されていた場合、予兆検知処理部１８０Ａは、処理の停止指示を受け付けたか否かを判定する（ステップＳ１９１９）。ステップＳ１９１９において、処理の停止指示を受け付けない場合、予兆検知処理部１８０Ａは、ステップＳ１９０１へ戻る。

ステップＳ１９１９において、処理の停止指示を受け付けた場合、予兆検知処理部１８０Ａは、処理を終了する。

本実施形態の予兆検知処理部１８０Ａでは、以上のようにして、影響管理データベース２１０に格納される影響管理情報を生成して格納している。

尚、本実施形態の予兆検知処理部１８０Ａは、発生後時間毎に、影響管理情報を生成して影響管理データベース２１０に格納しても良い。つまり、本実施形態の影響管理データベース２１０には、シナリオ番号が同一であり、発生後時間が異なる影響管理情報が格納されていても良い。

次に、図２０を参照して、本実施形態の影響程度評価部１８４の処理について説明する。図２０は、第二の実施形態の監視装置の処理を説明する第二のフローチャートである。

本実施形態の予兆検知処理部１８０Ａは、影響程度評価部１８４により、影響管理データベース２１０を参照し、影響管理情報を抽出する（ステップＳ２００１）。

図２０のステップＳ２００２からステップＳ２００４までの処理は、図１２のステップＳ１２０３からステップＳ１２０５までの処理と同様であるから、説明を省略する。

ステップＳ２００４に続いて、影響程度評価部１８４は、ステップＳ２００１で抽出され影響管理情報のうち、項目「発生後時間」の値が同一の影響管理情報に含まれる全てのサービスについて、ステップＳ２００２からステップＳ２００４までの処理を行ったか否かを判定する（ステップＳ２００５）。ステップＳ２００５において、該当する処理を実行していない場合、影響程度評価部１８４は、ステップＳ２００２に戻る。

ステップＳ２００５において、該当する全ての処理を実行した場合、影響程度評価部１８４は、影響管理情報に含まれる発生後時間毎に、ステップＳ２００５までの処理を実行したか否かを判定する（ステップＳ２００６）。

ステップＳ２００６において、該当する処理を実行していない場合、影響程度評価部１８４は、次の発生後時間の影響管理情報を抽出し（ステップＳ２００７）、ステップＳ２００２へ戻る。

ステップＳ２００６において、該当する処理が実行された場合、予兆検知処理部１８０Ａは、出力部１８５により、評価結果を出力し（ステップＳ２００８）、処理を終了する。

図２１は、第二の実施形態の端末装置の表示例を示す図である。図２１（Ａ）の画面２１１は、システム２０１の負荷が正常の状態よりも大きくなった場合の勘定系システム２００の影響の予測結果が表示された画面の例である。また、図２１（Ｂ）に示す画面２１１Ａは、対処法が表示された画面の例である。

画面２１１は、表示欄２１２、２１３、２１４を有する。表示欄２１２は、予兆検知処理部１８０Ａによる予測結果が表示される。表示欄２１３は、検知された事象を通知するメッセージが表示される。表示欄２１４は、勘定系システム２００の各システムのログを示す情報が表示される。

表示欄２１２には、図１３の表示欄１３２と同様に、勘定系システム２００に含まれる各システムについて、所定時間毎の各システムが提供するサービスの状態の程度を示す画像が表示される。また、表示欄２１２には、表示欄２１５、２１６が含まれる。

表示欄２１５は、システム２０１によって提供される各サービスの所定時間毎の状態の程度を示す画像が表示されており、表示欄２１６には、システム２０２によって提供される各サービスの所定時間毎の状態の程度を示す画像が表示されている。

画面２１１の表示欄２１５、２１６では、図１３の表示欄１３５、１３６と同様に、それぞれに、システム２０１とシステム２０２によって提供される３つのサービスについて、所定時間毎の状態の程度を示す画像が表示されている。

画面２１１によれば、表示欄１３６において、システム２０２によって提供される３つのサービスのうち、外部連携サービス以外の２つのサービスは、システム２０２の負荷が正常よりも大きくなったことが検知されてから２時間後までは、各発生後時間と対応する画像は笑顔のマークである。よって、これらのサービスは、シナリオが発生してから２時間後までは、滞りなく提供されることがわかる。

また、システム２０２によって提供される外部連携サービスではシステム２０２の負荷が正常よりも大きくなったことが検知されてから１時間後と対応する画像が、怒った顔のマークとなっている。したがって、外部連携サービスは、シナリオ番号「００００１」の事象が発生すると、直ちに大きな影響を受けることがわかる。

また、本実施形態では、表示欄２１３に表示されたメッセージが選択されると、画面２１１が画面２１１Ａに遷移する。画面２１１Ａでは、表示欄２１３のメッセージにより通知された事象に対する対処法が表示される表示欄２１７が表示される。

具体的には、画面２１１において表示欄２１３がクリックやタップ等の操作により選択されると、出力部１８５は、メッセージ２１７ａとメッセージ２１７ｂとが表示された表示欄２１７を表示させる。

メッセージ２１７ａは、メッセージデータベース２３０において、影響管理情報のシナリオ番号と対応する項目「事象」と対応するメッセージである。また、メッセージ２１７ｂは、影響管理情報に含まれる項目「リソース」の値を示すメッセージである。

本実施形態では、表示欄２１７に、２つのメッセージを表示させることで、現在、勘定系システム２００において発生している事象と、その事象に対する対処法を通知することができる。

以上のように、本実施形態では、勘定系システム２００に含まれるシステムがサービスを提供する際のサーバの負荷が、正常とされる状態における負荷よりも大きくなる、という事象が検知されると、この事象が勘定系システム２００に及ぼす影響を可視化できる。言い換えれば、本実施形態では、勘定系システム２００に含まれるシステムのサーバのうち、少なくとも１つのサーバにおいて、所定の条件に合致する負荷状態を検知した場合、負荷状態を検知した時刻と検知した負荷状態に基づき、発生する可能性のある障害シナリオ（事象）を特定する。そして、特定されたシナリオが勘定系システム２００に与える影響を予測し、所定の時間毎の勘定系システム２００に含まれる各システムが提供するサービス毎に、影響を予測した結果を出力している。

また、本実施形態では、検知された事象と、事象に対する対処法を通知することができる。

開示の技術では、以下に記載する付記のような形態が考えられる。
（付記１）
複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のあるシナリオを特定し、
特定した前記時刻と前記シナリオに基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する、処理をコンピュータに実行させることを特徴とする情報処理プログラム。
（付記２）
前記所定の条件を示す負荷状態と、前記シナリオとが対応付けられた記憶部を参照し、
前記記憶部を参照して、前記負荷状態が前記所定の条件を満たしたときの前記シナリオを特定する、処理を前記コンピュータに実行させる、ことを特徴とする付記１記載の情報処理プログラム。
（付記３）
前記システムにおける前記複数種類の業務毎に、前記複数の情報処理装置の負荷状態を示す情報が格納された記憶部を参照し、
前記複数の情報処理装置の少なくとも１つの情報処理装置の負荷が、前記記憶部に格納された前記情報が示す負荷よりも大きくなったとき、前記所定の条件を満たす負荷状態を検知したものとする、処理を前記コンピュータに実行させる、ことを特徴とする付記１記載の情報処理プログラム。
（付記４）
前記障害予測の結果は、
前記時刻からの時間帯毎に、前記システムで処理する前記複数種類の業務について、各業務の予測される進捗状況と対応する画像として表示される、ことを特徴とする付記１乃至３の何れか一項に記載の情報処理プログラム。
（付記５）
前記画像は、前記進捗状況に応じて表示態様が異なる画像である、ことを特徴とする付記４記載の情報処理プログラム。
（付記６）
前記障害予測の結果と共に、特定された前記シナリオの表示させる、処理を前記コンピュータに実行させる、ことを特徴とする付記４又は５記載の情報処理プログラム。
（付記７）
前記障害予測の結果が表示された画面において、前記シナリオが選択されると、前記シナリオと対応する対処法を示す情報を表示させる、処理を前記コンピュータに実行させる、ことを特徴とする付記６記載の情報処理プログラム。
（付記８）
コンピュータによる情報処理方法であって、前記コンピュータが、
複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のあるシナリオを特定し、
特定した前記時刻と前記シナリオに基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する、ことを特徴とする情報処理方法。
（付記９）
複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のあるシナリオを特定する特定部と、
特定した前記時刻と前記シナリオに基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する出力部と、を有することを特徴とする情報処理装置。

本発明は、具体的に開示された実施形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

１００、１００Ａ監視装置
１１０状態管理データベース
１２０シナリオデータベース
１３０予兆管理データベース
１４０シナリオ影響データベース
１５０サービス構成データベース
１６０サービス閾値データベース
１７０監視処理部
１８０、１８０Ａ予兆検知処理部
１８１情報取得部
１８２シナリオ特定部
１８３性能取得部
１８４影響程度評価部
１８５出力部
１９０通知処理部
２００勘定系システム
２１０影響管理データベース
２２０サービス間関係データベース
２３０メッセージデータベース
３００端末装置

Claims

複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のある、事象の予兆を特定し、
特定した前記事象の予兆に基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する、処理をコンピュータに実行させることを特徴とする情報処理プログラム。
前記所定の条件を示す負荷状態と、前記事象の予兆とが対応付けられた記憶部を参照し、
前記記憶部を参照して、前記負荷状態が前記所定の条件を満たしたときの前記事象の予兆を特定する、処理を前記コンピュータに実行させる、ことを特徴とする請求項１記載の情報処理プログラム。
前記システムにおける前記複数種類の業務毎に、前記複数の情報処理装置の負荷状態を示す情報が格納された記憶部を参照し、
前記複数の情報処理装置の少なくとも１つの情報処理装置の負荷が、前記記憶部に格納された前記情報が示す負荷よりも大きくなったとき、前記所定の条件を満たす負荷状態を検知したものとする、処理を前記コンピュータに実行させる、ことを特徴とする請求項１記載の情報処理プログラム。
前記障害予測の結果は、
前記時刻からの時間帯毎に、前記システムで処理する前記複数種類の業務について、各業務の予測される進捗状況と対応する画像として表示される、ことを特徴とする請求項１乃至３の何れか一項に記載の情報処理プログラム。
前記障害予測の結果と共に、特定された前記事象の予兆の表示させる、処理を前記コンピュータに実行させる、ことを特徴とする請求項４記載の情報処理プログラム。
前記障害予測の結果が表示された画面において、前記事象の予兆が選択されると、前記事象の予兆と対応する対処法を示す情報を表示させる、処理を前記コンピュータに実行させる、ことを特徴とする請求項５記載の情報処理プログラム。
コンピュータによる情報処理方法であって、前記コンピュータが、
複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のある、事象の予兆を特定し、
特定した前記時刻と前記事象の予兆に基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する、ことを特徴とする情報処理方法。
複数の情報処理装置が連携して複数種類の業務を処理するシステムにおいて前記複数の情報処理装置を監視して、前記複数の情報処理装置の少なくとも１つの情報処理装置で、所定の条件を満たす負荷状態を検知した場合、前記負荷状態を検知した時刻、及び検出した前記負荷状態に基づき発生する可能性のある、事象の予兆を特定する特定部と、
特定した前記事象の予兆に基づいて、前記システムで処理する前記複数種類の業務それぞれに対する障害予測の結果を出力する出力部と、を有することを特徴とする情報処理装置。