<第1の実施形態>
以下、図面を参照して、第1の実施形態について説明する。図1は、情報処理システム1の一例を示している。情報処理システム1は、複数の情報処理装置を備えている。情報処理装置としては、例えばサーバやコンピュータ等がある。情報処理装置は他の情報処理装置と通信することができ、アプリケーションを実行することが可能である。
情報処理システム1は、各アプリケーションが連携して所定の処理を行うように運用されている。「処理」の一例として「業務」がある。例えば、情報処理システム1は、会計処理や財務処理等の業務を行うように運用される。
図1の第1の物理サーバ2および第2の物理サーバ3は、情報処理装置の一例である。図1の情報処理システム1は一例であり、情報処理システム1は、第1の物理サーバ2および第2の物理サーバ3以外の情報処理装置を備えていてもよい。
情報処理システム1は、システム監視サーバ4に接続されている。システム監視サーバ4は、情報処理システム1を構成するアプリケーションの稼働状況を監視する。システム監視サーバ4は、情報処理システム1の中にあってもよい。システム監視サーバ4は、監視支援装置の一例である。
第1の物理サーバ2は、アプリケーションA1とミドルウェアM1と情報収集エージェントY1とを備えている。アプリケーションA1は業務を行うためのソフトウェアである。ミドルウェアM1は、第1の物理サーバ2で動作するソフトウェアである。情報収集エージェントY1は、第1の物理サーバ2の各種情報を収集して、システム監視サーバ4に収集した情報を送信する。
第2の物理サーバ3は、仮想サーバV1と仮想サーバV2と仮想サーバV3とを有している。仮想サーバV1の上では、ミドルウェアM2が動作しており、ミドルウェアM2の上でアプリケーションA2が動作している。アプリケーションA2は業務を行うためのソフトウェアの一種である。
仮想サーバV2の上では、ミドルウェアM3およびM4が動作しており、ミドルウェアM3およびM4の上で、アプリケーションA3が動作している。アプリケーションA3は業務を行うためのソフトウェアの一種である。
仮想サーバV3の上では、ミドルウェアM5が動作しており、ミドルウェアM5の上で、アプリケーションA4が動作している。アプリケーションA4は業務を行うためのソフトウェアの一種である。情報収集エージェントY2は、第2の物理サーバ3の各種情報を収集して、システム監視サーバ4に収集した情報を送信する。
アプリケーションA1とA2とA3とA4とは同じ業務を行うアプリケーションであってもよいし、それぞれ異なる業務を行うアプリケーションであってもよい。一例として、アプリケーションA1とA2とは、連携して会計業務を行うアプリケーションであり、アプリケーションA3とA4とは、連携して財務業務を行うソフトウェアであってもよい。
システム監視サーバ4は、情報処理システム1の稼働状況を監視する。第1の実施形態では、システム監視サーバ4は、業務に関連する複数のアプリケーションの稼働状況を監視する。
情報収集エージェントY1は、第1の物理サーバ2を構成する要素に関する情報(要素情報)をシステム監視サーバ4に送信する機能を有する。第1の物理サーバ2の要素情報の一例としては、第1の物理サーバ2とミドルウェアM1とアプリケーションA1とが含まれる。
情報収集エージェントY2は、第2の物理サーバ3の要素情報をシステム監視サーバ4に送信する機能を有する。第2の物理サーバ3の要素情報の一例としては、第2の物理サーバ3と仮想サーバV1〜V3とミドルウェアM2〜M5とアプリケーションA2〜A4とが含まれる。
情報処理システム1の情報処理装置が情報収集エージェントを有していない場合には、SNMP(Simple Network Management Protocol)やエージェントレス機構を用いて、要素情報がシステム監視サーバ4に送信されてもよい。
図2は、システム監視サーバ4の一例を示している。図2に一例として示すシステム監視サーバ4は、受信部11とデータ記憶制御部12と構成管理データベース13と通信経路情報生成部14と業務構成情報生成部15と影響度判定部16と監視画面作成部17と表示部18とを備えている。
受信部11は、情報収集エージェントY1、Y2が送信した情報を受信する。データ記憶制御部12は、受信部11が受信した情報を構成管理データベース13に記憶する。図2に示した一例では、構成管理データベース13は、機器情報とソフトウェア管理情報と通信経路情報と業務構成情報とを含む情報を記憶している。
機器情報は、機器に関する情報である。機器の一例として、情報処理装置がある。図3(A)に機器情報の一例を示す。図3(A)の機器情報の一例は、機器名称と種別とIPアドレスとの項目を有している。機器情報の項目は、図3(A)に示した一例には限定されない。例えば、機器名称が「Server A」の機器の種別は「仮想サーバ」であり、IPアドレスは「192.168.1.25」である。機器情報は機器ごとに構成管理データベース13に記憶される。
ソフトウェア管理情報は、機器上で動作するソフトウェアを管理する情報である。図3(B)にソフトウェア管理情報の一例を示す。図3(B)のソフトウェア管理情報は、名称と種別と配置場所と使用ポートとの情報を有している。ソフトウェア管理情報の項目は、図3(B)に示した一例には限定されない。
例えば、ソフトウェアの名称が「アプリケーションA1」のソフトウェアは、種別が「アプリケーション」であり、配置場所が「192.168.1.25/24」であり、使用ポートが「53242」である。配置場所のうち「192.168.1.25」の部分はIPアドレスを示す。従って、アプリケーションA2はIPアドレスが「192.168.1.25」の情報処理装置のポート番号が「53242」を使用していることが認識できる。
ソフトウェア管理情報が管理するソフトウェアはアプリケーションだけでなく、ミドルウェアやデータベース、OS(Operating System)等の任意のソフトウェアであってよい。ソフトウェア管理情報は、これらのソフトウェアに関する情報を管理する。
図3(B)に一例として示したソフトウェア管理情報のうち、使用ポートに関する情報は、任意の手法で取得することができる。一例として、使用ポートに関する情報は、情報処理装置のOSの所定のコマンドを実行することで取得することができる。
次に、通信経路情報について説明する。通信経路情報は、アプリケーションの通信状況を示す情報である。図4に通信経路情報の一例を示す。図4の通信経路情報は、通信元配置場所と通信元ポートと通信先配置場所と通信先ポートとパケット数とプロトコルとデータ形式との項目を有している。通信経路情報の項目は、図4に示した一例には限定されない。通信元ポートおよび通信先ポートは、ポート番号を示している。
例えば、通信元ポートが「80」のアプリケーションは、通信先ポートが「49210」のアプリケーションと通信を行っている。通信されたパケット数は「100」であり、プロトコルは「HTTP」、データ形式は「HTML」である。なお、上述したように、通信元配置場所および通信先配置場所は、IPアドレスを含んでいる。
通信経路情報生成部14は、上述した通信経路情報を生成する。通信経路情報生成部14は、図1に示した情報収集エージェントY1やY2が収集した要素情報に基づいて、通信経路情報生成部14は通信経路情報を生成し、構成管理データベース13に通信経路情報を記憶する。詳細については後述する。
業務構成情報は、業務に関連する要素を特定する情報である。第1の実施形態では、業務構成情報は、業務に関連するアプリケーションを特定する。業務構成情報生成部15は、構成管理データベース13に記憶されているソフトウェア管理情報および通信経路情報に基づいて、業務構成情報を生成する。業務構成情報生成部15は、関連性特定部の一例である。詳細については後述する。
影響度判定部16は、情報処理システム1の要素のうち何れかの要素に異常等の事象が発生した場合、事象を発生した要素の業務と関連する要素にどの程度の影響が及ぼされるかを判定する。
監視画面作成部17は、監視画面を作成する。監視画面は、業務構成情報により特定される複数のアプリケーションの関連性を可視化した画面である。情報処理システム1が複数の業務を運用している場合、監視画面に表示する業務を選択可能にしてもよい。監視画面作成部17が作成した画面は表示部18に表示される。監視画面作成部17は、画面作成部の一例である。
次に、図5のフローチャートを参照して、第1の実施形態の処理の一例について説明する。システム監視サーバ4は情報処理システム1の各要素に関する要素情報を収集する(ステップS1)。第1の物理サーバ2の情報収集エージェントY1は、第1の物理サーバ2の各要素に関する要素情報を収集する。そして、情報収集エージェントY1は、収集した要素情報をシステム監視サーバ4に送信する。
同様に、第2の物理サーバ3の情報収集エージェントY2は、第2の物理サーバ3の各要素に関する要素情報を収集する。そして、情報収集エージェントY2は、収集した要素情報をシステム監視サーバ4に送信する。情報処理システム1に他の情報収集エージェントがあれば、他の情報収集エージェントは、収集した要素情報をシステム監視サーバ4に送信する。
システム監視サーバ4の受信部11は、情報収集エージェントY1、Y2が送信した要素情報を受信する。データ記憶制御部12は、情報収集エージェントY1、Y2が送信した要素情報を構成管理データベース13に記憶する(ステップS2)。要素情報には機器情報が含まれているものとする。従って、構成管理データベース13に機器情報が記憶される。
一例として、データ記憶制御部12は、第1の物理サーバ2の名称、種別(物理サーバ)および第1の物理サーバ2のIPアドレスを要素情報から抽出する。そして、データ記憶制御部12は、抽出した情報を第1の物理サーバ2の機器情報として構成管理データベース13に記憶する。
情報収集エージェントY2が収集した機器情報としては、第2の物理サーバ3と仮想サーバV1〜V3とがある。従って、データ記憶制御部12は、要素情報から、これらの機器の名称、種別およびIPアドレスを抽出して、第2の物理サーバ3の機器情報として構成管理データベース13に記憶する。
また、情報収集エージェントY1、Y2がシステム監視サーバ4に送信する要素情報には、上述したような機器上で動作するミドルウェアやアプリケーション等の情報も含まれている。データ記憶制御部12は、情報収集エージェントY1からミドルウェアやアプリケーション等の情報を抽出して、ソフトウェア管理情報として構成管理データベース13に記憶する。
情報収集エージェントY1が送信した要素情報には、アプリケーションA1およびミドルウェアM1の情報が含まれている。一例として、要素情報に、名称と種別と配置場所と使用ポートとの情報が含まれているとする。データ記憶制御部12は、これらの情報を要素情報から抽出して、図3(C)で一例として示したソフトウェア管理情報を構成管理データベース13に記憶する。
情報収集エージェントY2が送信した要素情報には、ミドルウェアM2〜M5、アプリケーションA2〜A4の情報が含まれている。データ記憶制御部12は、要素情報に基づいて、これらのミドルウェアおよびアプリケーションの名称と種別と配置場所と使用ポートとの情報を抽出して、構成管理データベース13に記憶する。
以上により、情報収集エージェントY1、Y2が送信した要素情報に基づいて、構成管理データベース13の機器情報およびソフトウェア管理情報が記憶される。情報処理システム1の要素に変更があった場合、例えば1つの情報処理装置が追加された場合等には、構成管理データベース13の機器情報およびソフトウェア管理情報も更新される。
次に、通信経路情報の生成について説明する。情報処理システム1の情報収集エージェントY1は、アプリケーションA1の通信状況に関する情報(以下、通信情報と称する)を収集する(ステップS3)。また、情報収集エージェントY2は、アプリケーションA2、A3およびA4の通信情報を収集する。
第1の物理サーバ2が、アプリケーションA1の通信ログを保持している場合には、情報収集エージェントY1は、通信ログを取得する。この通信ログは通信情報の一例である。情報収集エージェントY1は、取得した通信ログをシステム監視サーバ4に送信する。通信ログには、少なくとも通信時の通信元ポート番号および通信先ポート番号の情報が含まれている。
また、情報収集エージェントY1は、アプリケーションA1が通信しているパケットを取得する。情報収集エージェントY1は、パケットからプロトコルやデータ形式等の通信情報を取得し、取得した通信情報をシステム監視サーバ4に送信する(ステップS4)。
第1の物理サーバ2が、アプリケーションA1の通信ログを保持していない場合には、情報収集エージェントY1は、アプリケーションA1が通信しているパケットを監視して、通信元ポート番号および通信先ポート番号を取得する。情報収集エージェントY1は、取得した通信元ポート番号および通信先ポート番号をシステム監視サーバ4に送信する。
情報収集エージェントY2も同様であり、第2の物理サーバ3が通信ログを保持している場合には、通信ログを収集する。第2の物理サーバ3が通信ログを保持していない場合、情報収集エージェントY2は、アプリケーションA2〜A4が通信しているパケットを監視して、通信元ポート番号および通信先ポート番号を取得する。情報収集エージェントY2は、取得した通信元ポート番号および通信先ポート番号をシステム監視サーバ4に送信する。
情報収集エージェントY2は、収集した通信ログをシステム監視サーバ4に送信する。また、情報収集エージェントY2は、パケットからプロトコルやデータ形式等の通信情報を取得し、取得した通信情報をシステム監視サーバ4に送信する。
通信ログは、第1の物理サーバ2、第2の物理サーバ3が行った一定期間の通信履歴である。よって、第1の物理サーバ2、第2の物理サーバ3の通信情報が通信ログには多く含まれている。このため、第1の物理サーバ2、第2の物理サーバ3が通信ログを保持している場合には、通信ログをシステム監視サーバ4に送信することが好ましい。
一方、上述したように、第1の物理サーバ2、第2の物理サーバ3が通信ログを保持していない場合には、第1の物理サーバ2、第2の物理サーバ3は一定期間、パケットの監視を行う。そして、情報収集エージェントY1、Y2は、取得した通信元ポート番号および通信先ポート番号をシステム監視サーバ4に送信する。
システム監視サーバ4の通信経路情報生成部14は、情報収集エージェントY1、Y2が送信した通信ログ等の通信情報に基づいて、通信経路情報を生成する(ステップS5)。通信経路情報は、情報収集エージェントY1、Y2が送信した通信情報に基づいて生成することができる。
図4に一例で示した通信経路情報では、通信元ポート番号のアプリケーションから通信先ポート番号のアプリケーションに通信が行われたことを示している。これにより、2つのアプリケーションの間で通信が行われたことを認識することができる。
また、上述したように、情報収集エージェントY1、Y2が送信した通信情報にパケット数とプロトコルとデータ形式とが含まれている場合、通信経路情報生成部14は、図4に一例として示すような通信経路情報を生成する。つまり、通信経路情報生成部14は、通信元ポート番号および通信先ポート番号に対応して、パケット数、プロトコルおよびデータ形式を示す通信経路情報を生成する。
通信経路情報生成部14は、生成した通信経路情報を構成管理データベース13に記憶する(ステップS6)。次に、業務構成情報生成部15は、業務構成情報を生成する(ステップS7)。図6の一例を参照して、業務構成情報の生成について説明する。
業務構成情報は、業務に関連する複数のアプリケーションを特定する情報であり、ソフトウェア管理情報と通信経路情報とに基づいて生成される。図6では、通信経路情報は、通信元ポート「53242」から通信先ポート「49210」に向けて通信が行われたことを示している。
一方、ソフトウェア管理情報は、アプリケーションA1は使用ポートが「53242」であり、アプリケーションA2は使用ポートが「49210」であることを示している。従って、通信経路情報とソフトウェア管理情報とをマッチングすると、アプリケーションA1とA2とが通信を行って1つの業務を行っていることを認識することができる。図6に示した一例では、マッチングして得られた結果を業務Aとして示している。
つまり、アプリケーションA1とA2とは1つの業務に関連していることが特定できる。情報処理システム1では1つの業務が行われているとは限らず、複数の業務が行われていることもある。その場合、業務構成情報生成部15は複数の業務について業務構成情報を生成してもよい。
業務構成情報生成部15は、生成した業務構成情報を構成管理データベース13に記憶する(ステップS8)。これより、業務と当該業務に関連する全てのアプリケーションが関連付けられる。監視画面作成部17は、監視画面を作成する(ステップS9)。監視画面は、業務と当該業務に関連する全てのアプリケーションを識別する情報を可視化した画面である。
図7は、監視画面の一例を示している。図7において、アプリケーションは「アプリ」と略して示している。図7において、アプリケーションA1〜A5は1つのグループ18Aを形成しており、アプリケーションA6〜A9は1つのグループ18Bを形成している。一例として、グループ18Aと18Bとは離間した場所にあってもよい。
監視画面作成部17は、構成管理データベース13に記憶された各種情報を参照する。一例として、業務構成情報は、業務Aに関連するアプリケーションがアプリケーションA1〜A9であることを示しているものとする。
また、一例として、通信経路情報は、アプリケーションA1はアプリケーションA2〜A6と通信を行っていること、およびアプリケーションA6はアプリケーションA7〜A9と通信を行っていることを示しているものとする。
従って、アプリケーションA1〜A9により1つの業務が運用される。監視画面作成部17が作成した監視画面は、表示部18に表示される(ステップS10)。システム管理者は、表示部18に表示されている監視画面を視認することにより、1つの業務に関連する全てのアプリケーションA1〜A9を認識し易くなる。
また、通信経路情報は、2つのアプリケーションの間の通信に関する情報を含んでいる。従って、各アプリケーションがそれぞれ何れのアプリケーションと通信を行っているかが特定できる。よって、監視画面作成部17が作成する監視画面は、各アプリケーションがそれぞれ何れのアプリケーションと通信しているかを明示した画面としてもよい。
図7は、1つの業務に関連する全てのアプリケーションA1〜A9が正常に稼動している状態における監視画面を示している。一方、図8は、アプリケーションA1に異常等の事象が発生している場合の監視画面を示している。図8において、「×」のアイコンで示されるエラーマークが監視画面のアプリケーションA1の位置に表示される。
エラーマークは「×」のアイコンに限定されず、アプリケーションA1に何らかの事象が発生したことを視覚的に認識できれば、任意の形状を適用することができる。また、エラーマークを強調して表示するために、エラーマークを点滅させてもよい。
この場合、アプリケーションA1は正常に動作することができないため、業務の運用に影響を及ぼす。システム管理者は、表示部18に表示されている、図8に一例として示す監視画面を視認することで、アプリケーションA1に何らかの事象が発生していることを認識することができる。
そして、監視画面は、アプリケーションA1の異常により影響を及ぼされる範囲がアプリケーションA1〜A9であることを視覚的に示している。つまり、アプリケーションA1に関連性のあるアプリケーションがアプリケーションA2〜A8であることを識別している。この監視画面は、システム管理者ではなく、システム監視サーバ4が自律的に作成するものである。
従って、システム管理者のスキルに依存することなく、複数のアプリケーションの中から業務に関連する複数のアプリケーションを容易に認識することができる。これにより、安定した監視品質で情報処理システム1を監視することができる。また、業務に関連する複数のアプリケーションが視覚的に表示部18に表示されるため、業務に関連するアプリケーションを特定するために長い時間を要することもない。これにより、情報処理システム1で動作する各アプリケーションの監視を支援することができる。
システム管理者が、事象に対して対処をするときに、業務に関連する複数のアプリケーションを表示するだけでは不十分な場合も想定される。そこで、アプリケーション間の通信の有無だけではなく、通信の方向性を明示した監視画面を作成してもよい。
通信経路情報に基づいて、通信元のアプリケーションと通信先のアプリケーションとを特定することができる。そこで、監視画面作成部17は、アプリケーション間の通信の方向を明示した監視画面を作成してもよい。
図9の監視画面の一例は、矢印を使用して、アプリケーション間の通信の方向を示している。片方向の矢印の場合は、アプリケーション間の通信が片方向であることを示している。双方向の矢印の場合は、アプリケーション間の通信が双方向であることを示している。
図6の一例で示したように、通信元ポート番号「53242」のアプリケーションA1から通信先ポート番号「49210」のアプリケーションA2に対して通信が行われていることが認識される。監視画面作成部17は、アプリケーションA1を識別するアイコンからアプリケーションA2を識別するアイコンに対して矢印の線を描画するようにしてもよい。
従って、監視画面作成部17は、通信の方向を明示した監視画面を作成することで、システム管理者は、アプリケーション間の通信の方向性を容易に認識することができる。これにより、アプリケーションに生じた事象に対して対処し易くなる。
また、情報収集エージェントY1、Y2は、定期的に各種情報をシステム監視サーバ4に送信してもよい。そして、業務構成情報生成部15は、定期的に業務構成情報を更新し、監視画面作成部17は定期的に監視画面を作成してもよい。これにより、監視画面が定期的に更新されるため、業務に関連する複数のアプリケーションの最新の情報を表示部18に表示することができる。
<第2の実施形態>
次に、第2の実施形態について説明する。情報処理システム1を構成する要素としては、アプリケーションだけではなく、物理サーバや仮想サーバ、OS、ミドルウェア等がある。これらの要素の何れかに異常が発生すると、アプリケーションは動作することができない。従って、業務に関連する要素として、アプリケーションだけでなく、業務に関連する各要素を監視画面に表示することは有効である。
また、業務に関連する要素の何れかに異常等の事象が発生した場合に、各要素に対して及ぼされる影響度の度合いには差異がある。そこで、各要素間の影響度を監視画面に表示することも有効である。影響度についても、システム監視サーバ4が自律的に判定することで、システム管理者は、監視画面に表示されている影響度に基づいて、異常に対する対処を行うことができる。
第2の実施形態の処理の一例について、図10のフローチャートを参照して、説明する。図10のフローチャートは、図5で示したフローチャートのステップS1〜S6までは、第1の実施形態の処理と同じである。
業務構成情報生成部15は、第1の業務構成情報を生成する(ステップS21)。生成された第1の業務構成情報は、構成管理データベース13に記憶される(ステップS22)。
第1の業務構成情報は、第1の実施形態で説明した業務構成情報と同様に、業務に関連するアプリケーションを特定した情報である。図11に、第1の業務構成情報の一例を示す。図11の第1の業務構成情報は、図6で一例として示した業務構成情報にIPアドレスが付加されている。
図6の一例に示されるように、アプリケーションごとのIPアドレスは、ソフトウェア管理情報から得ることができる。業務構成情報生成部15は、業務名と構成要素とIPアドレスとの項目を有する第1の業務構成情報を生成する。例えば、業務名が「A」の業務は、アプリケーションA1を用いている。そして、アプリケーションA1の機器のIPアドレスは「192.168.1.25」である。また、業務Aに関連するアプリケーションA2の機器のIPアドレスは「192.168.10.3」である。
業務構成情報生成部15は、アプリケーションA1およびA2が業務Aに関連すると認識する。また、業務構成情報生成部15は、機器情報を参照して、アプリケーションA1またはA2のIPアドレスとマッチングする機器があるか否かを検出する。
図11に示した一例では、「Server A」はIPアドレスが「192.168.1.25」であるため、業務構成情報生成部15は、「Server A」が業務Aに関連すると認識する。また、業務構成情報生成部15は、「Server B」のIPアドレスが「192.168.10.3」であるため、「Server B」が業務Aに関連すると認識する。
業務構成情報生成部15は、ソフトウェア管理情報を参照して、アプリケーションA1またはA2のIPアドレスとマッチングするソフトウェアがあるか否かを検出する。図11に示した一例では、「DB1(Database)」のIPアドレスが「192.168.10.3」であるため、DB1が業務に関連すると認識する。
従って、業務構成情報生成部15は、業務に関連する各要素を示す第2の業務構成情報を生成する。この第2の業務構成情報は、業務に関連する複数のアプリケーションだけでなく、当該複数のアプリケーションの動作に関連する要素を特定した情報になる。
業務構成情報生成部15は、生成した第2の業務構成情報を構成管理データベース13に記憶する(ステップS24)。従って、業務構成情報生成部15は、業務に関連する要素として、アプリケーションだけでなく、物理サーバ等のハードウェアやミドルウェア等も認識することができる。
次に、影響度について説明する。図6で一例として示したように、通信経路情報の通信元ポート「53242」、通信先ポート「49210」の通信のパケット数は「10000」となっている。一方、通信元ポートが「25」、通信先「40」の通信のパケット数は「10」となっている。よって、要素間の通信によって、通信量が異なる。
通信量が多い場合に、通信を行っている要素に何らかの事象が発生すると、業務に対する影響度が高くなる。一方、通信量が少なければ、通信を行っている要素に何らかの事象が発生したとしても、業務に対する影響度は低い。
業務に関連する要素に事象が発生すると、事象に対してシステム管理者が対処を行う。このとき、業務に対する影響度が高いか低いかによって、事象に対する優先順位が異なる。つまり、影響度が高い業務は影響度の低い業務よりも、事象に対する優先順位が高い。
影響度判定部16は、上述した影響度の判定を行う(ステップS25)。影響度は、通信量以外にも、通信頻度に基づいて判定することができる。通信頻度に基づいて判定する場合、影響度判定部16は、通信頻度が高ければ、影響度も高いと判定し、通信頻度が低ければ、影響度も低いと判定してもよい。
影響度判定部16は、要素間の通信の種別に基づいて、影響度を判定してもよい。一例として、要素間の通信が冗長化回線を用いている場合、影響度判定部16は、影響度が高いものとして判定する。また、要素間の通信がクラスタ構成となっているような場合、影響度判定部16は、影響度が高いものとして判定する。
上述したように、要素間の通信には影響度の高低がある。そこで、第2の実施形態では、監視画面作成部17は影響度を反映した監視画面を作成する。このときに、監視画面作成部17は、影響度を可視化した監視画面を作成する(ステップS26)。図12を参照して、監視画面の作成について説明する。
図12(A)〜(D)は、全て要素Mと要素Nとの間で行われる通信を示している。要素Mおよび要素Nとしては、例えばアプリケーションを適用することができる。図12(A)に示した一例は、要素Mと要素Nとの間の通信の通信量を示している。
監視画面作成部17は、要素Mと要素Nとの間の通信量が少ないときには、要素Mと要素Nとを接続する線を細くする。一方、監視画面作成部17は、要素Mと要素Nとの間の通信量が多いときには、要素Mと要素Nとを接続する線を太くする。これにより、視覚的に通信量の多少が見易くなる。
図12(B)に示した一例は、要素Mと要素Nとの間の通信の通信頻度を示している。監視画面作成部17は、要素Mと要素Nとの間の通信頻度が少ないときには、要素Mと要素Nとを接続する線の線種を細かい破線とする。一方、監視画面作成部17は、要素Mと要素Nとの間の通信頻度が多いときには、要素Mと要素Nとを接続する線の線種を実線にする。これにより、視覚的に通信頻度が多いか少ないかが見易くなる。
図12(C)に示した一例は、要素Mと要素Nとの間で行われる通信の方向性を示している。例えば、通信の方向が片方向であれば、システム管理者は、データの転送等であることを認識し易くなる。一方、通信の方向が双方向であれば、オンライン処理やデータベースアクセス等であると認識し易くなる。
図12(D)に示した一例は、通信種別を示している。要素Mと要素Nとが2本の並列した矢印で接続されている例は、冗長化回線であることを示している。要素Mと要素Nとが2つの長方形で接続されている例は、クラスタ構成であることを示している。
図12(A)〜(D)に示した通信量、通信頻度、通信方向および通信種別はあくまでも一例である。通信量、通信頻度、通信方向および通信種別の表示態様は、図12(A)〜(D)の例には限定されない。
監視画面作成部17が作成した監視画面は表示部18に表示される(ステップS27)。図13は、監視画面の一例を示す。図13の監視画面の一例で示すように、業務に関連する要素を識別する情報が視覚的に表示されている。業務に関連する要素としては、業務に関連する複数のアプリケーションを動作させる要素が含まれる。
図13に一例として示す監視画面では、サーバS10とサーバS14とが双方向の冗長化回線となっている。また、サーバS15とサーバS16とはクラスタ構成となっている。同様に、サーバS17とサーバS18とはクラスタ構成となっている。そして、サーバS14とミドルウェアM10との間の通信量は多くなっている。
システム管理者は、表示部18に表示された監視画面を視認することで、各要素の通信状況を容易に認識することができる。一例として、図14に示すように、サーバS10に何らかの事象が発生したとする。サーバS10は、サーバS11、サーバS12、サーバS13およびサーバS14と接続されている。
これらのうち、サーバS11、サーバS12およびサーバS13とサーバS10との間の通信の通信量はそれほど多くない。一方、サーバS10とサーバS14との間は冗長化回線で接続されている。従って、システム管理者は、表示部18に表示されている監視画面に基づいて、サーバS14に対する影響度が大きいことを認識することができる。
つまり、監視画面に表示されている通信量、通信頻度および通信種別と、事象が発生した要素を識別する情報(例えば、エラーマーク)とに基づいて、情報処理システム1の要素の影響度を明示することができる。
従って、業務に関連するアプリケーションだけでなく、業務に関連する要素を監視画面に表示することで、システム管理者は容易に各要素の通信状況を認識することができる。これにより、システム管理者の監視を支援することができる。また、影響度を可視化することで、システム管理者は影響度を認識し易くなるため、システム管理者の監視を支援することができる。
次に、情報処理システム1の要素に何らかの事象が発生した場合の対処について説明する。情報処理システム1の要素に何らかの事象が発生した場合には、発生した事象に対して対処を行う必要がある。要素に何らかの事象が発生した場合、事象の発生をシステム管理者に通知する必要がある。
図15は、事象が発生したときの処理を示す一例である。まず、情報収集エージェントY1、Y2等が、アプリケーション等に何らかの事象が発生したことを検出する(ステップS31)。次に、システム監視サーバ4は、事象の通知を受けて、事象が警告以上であるか否かを判定する(ステップS32)。
要素に生じた事象には、上述したような影響度がある。要素に生じた事象の影響度が大きい場合には、早期に対処が必要である。一方、要素に生じた事象の影響度が小さい場合には、早期に対処を行わなくてもよい場合がある。ただし、事象に対する対処は必要である。つまり、要素に生じた事象の影響度に応じて、事象に対する対処の緊急性が変化する。
要素に生じた事象の影響度が警告以上でない場合(ステップS32でNO)、事象に対して早期の対処を要しない場合が多い。影響度が警告以上であるか否かを判定するために、予め警告のレベルを閾値としてシステム監視サーバ4に設定することができる。一例として、影響度が複数のレベルに分けられるとき、警告の閾値を任意のレベルに設定することができる。また、影響度が数値化される場合、警告の閾値も数値化してもよい。
ステップS32でNOと判定された場合、事象が冗長構成で発生したか否かが判定される(ステップS33)。冗長構成の一例としては、上述した冗長化回線がある。発生した事象が冗長構成に関するものでなければ(ステップS33でNO)、事象に対する対処は必要であるが、事象に対して早期の対処を要しない場合が多い。この場合、事象を生じた要素が複数の要素と関連しているか否かが判定される(ステップS34)。
一例として、アプリケーションが2つ以上のアプリケーションと通信を行っている場合には、事象に対して早期の対処を要する場合が多い。一方、アプリケーションが1つのアプリケーションと通信を行っている場合には、事象に対して早期に対処を要しない場合が多い。
事象を生じた要素が複数の要素と関連していない場合(ステップS34でNO)、事象に対する対処は必要であるが、事象に対して早期の対処を要しない場合が多い。この場合、ステップS32、ステップS33およびステップS34における判定が全てNOになる。従って、システム監視サーバ4は、業務に関連する影響度が小さいものと判定する。
システム監視サーバ4は、業務に関連する影響度が小さいと判定した場合、システム管理者に対して軽微な事象が発生したことを通報する(ステップS35)。システム管理者は、この通報に基づいて、情報処理システム1に軽微な事象が生じたことを認識する。そして、システム管理者は、監視画面に基づいて、発生した事象を特定し、事象に対する対処を行う。
一方、要素に生じた事象が警告以上の場合(ステップS32でYES)、発生した事象に対して早期に対処を行う必要がある。また、発生した事象が冗長構成に関する場合(ステップS33でYES)、発生した事象に対して早期に対処を行う必要がある。同様に、事象を発生した要素が複数の要素と通信している場合(ステップS34でYES)、業務に大きな影響を及ぼす可能性が高い。よって、この場合も、発生した事象に対して緊急に対処を行う必要がある。
ステップS32、ステップS33またはステップS34における判定のうち何れかがYESの場合、システム監視サーバ4は、システム管理者に対して、早期に対処することが必要な影響度の高い事象が発生したことを通報する(ステップS36)。この通報に基づいて、システム管理者は、早期対処が必要な事象が発生したことを認識する。
そして、システム管理者は、監視画面に基づいて、発生した事象を特定し、事象に対する対処を早期に行う。つまり、発生した事象の影響度に応じた通報をシステム管理者に対して行うことで、システム管理者は、事象に対する対処の緊急性や優先順位を認識することができる。
一例として、システム監視サーバ4は、ステップS36において、早期対処が必要な事象が発生したと判定したときには、システム管理者だけではなく、事象を発生した要素に関連する業務の関係者全員に通報してもよい。また、警告ランプを点灯し、または警告音を鳴動させる等してもよい。
一例として、システム監視サーバ4は、ステップS35において、軽微な事象が発生したと判定したときには、システム管理者には通報を行うが、上述した関係者全員には通報しないようにしてもよい。また、警告ランプや警告音等を作動させなくてもよい。
要素に事象が発生した場合、システム監視サーバ4は、異なる基準で早期対処が必要か否かを判定してもよい。一例として、通信の方向性を基準にして、早期対処が必要か否かを判定してもよい。
また、一例として、通信量が多いアプリケーションに事象が発生した場合には、早期対処が必要と判定し、通信量が少ないアプリケーションに事象が発生した場合には、早期対処は必要でないと判定してもよい。システム監視サーバ4は予め設定された閾値を基準として、通信量が多いか少ないかを判定してもよい。
一例として、通信頻度が高いアプリケーションに事象が発生した場合には、早期対処が必要と判定し、通信頻度が低いアプリケーションに事象が発生した場合には、早期対処が必要でないと判定してもよい。システム監視サーバ4は予め設定された閾値を基準として、通信頻度が高いか低いかを判定してもよい。
また、一例として、通信種別が冗長化回線やクラスタ構成等を使用する場合には、早期対処が必要と判定し、それ以外の場合には、早期対処が必要でないと判定してもよい。そして、通信量と通信頻度と通信種別とのうち1つを基準として影響度を判定してもよく、2つ以上を基準として影響度を判定してもよい。
また、一例として、プロトコルを基準に影響度を判定してもよい。業務構成情報生成部15は、第1の業務構成情報を通信経路情報に基づいて生成している。通信経路情報は、図6に一例として示したように、プロトコルを含んでいる。また、プロトコルの一例として、「全銀」、「HTTP」および「FTP」が図6に示されている。
「全銀」は金融機関の間で通信を行うときに使用されるプロトコルである。従って、通信経路情報に基づいて、「全銀」のプロトコルを使用する要素に事象が発生したときには、迅速な対処が必要になる。この場合、システム監視サーバ4は、影響度が高いとして、早期対処が必要であると判定する。
「全銀」のプロトコルを使用する要素に事象が発生したときには、緊急な対処が必要な場合が多い。従って、図15のステップS36(早期対処)よりも高いレベルの通報を行うようにしてもよい。一方、「HTTP」のプロトコルの場合には、早期対処が必要でない場合がある。この場合には、図15のステップS35の処理を行うようにしてもよい。
<システム監視サーバのハードウェア構成>
次に、システム監視サーバ4のハードウェア構成の一例について説明する。図16に示すように、システム監視サーバ4は、バス20に対して、プロセッサ21とRAM(Random Access Memory)22とROM(Read Only Memory)23と補助記憶装置24と通信インタフェース25と可搬型記憶装置接続部26とが接続されている。
プロセッサ21はCPU(Central Processing Unit)のような任意の処理回路である。プロセッサ21はRAM22に展開されたプログラムを実行する。ROM23はRAM22に展開されるプログラムを記憶する不揮発性の記憶装置である。RAM22に展開されるプログラムは補助記憶装置24に記憶されていてもよい。記憶装置の一例としては、フラッシュメモリやハードディスクドライブ等を適用することができる。
通信インタフェース25は、情報処理システム1の物理サーバ等と通信を行うインタフェースである。可搬型記憶装置接続部26は、可搬型記憶装置27と接続可能に設けられている。可搬型記憶装置27としては、可搬型のメモリや光学式ディスク(例えば、CD(Compact Disk)やDVD(Digital Video Disk)等)を適用することができる。
RAM22、ROM23および補助記憶装置24は、何れもコンピュータ読み取り可能な有形の記憶媒体の一例である。これらの有形な記憶媒体は、信号搬送波のような一時的な媒体ではない。
一例として、受信部11は、通信インタフェース25により実現されてもよい。データ記憶制御部12、通信経路情報生成部14、業務構成情報生成部15、影響度判定部16および監視画面作成部17は、プロセッサ21により実現されてもよい。構成管理データベース13は、補助記憶装置24により実現されてもよい。
上述してきた、第1の実施形態および第2の実施形態の各処理は、監視支援プログラムとして実現することができる。監視支援プログラムは、ROM23や補助記憶装置24、可搬型記憶装置27に記憶されていてもよい。
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
以上の実施形態に関し、更に以下の付記を開示する。
(付記1)
コンピュータに、
複数の情報処理装置の間で行われる通信の通信元ポート番号と通信先ポート番号と前記複数の情報処理装置で動作する複数のアプリケーションのそれぞれのポート番号を取得し、
前記通信元ポート番号と前記通信先ポート番号と前記複数のアプリケーションのそれぞれのポート番号とに基づいて、前記複数のアプリケーションのうち関連性のある複数のアプリケーションを特定し、
前記関連性のある複数のアプリケーションを識別する情報を画面に表示する、
処理を実行させる監視支援プログラム。
(付記2)
前記関連性のある複数のアプリケーションの動作に関連する複数の要素を特定し、
前記複数の要素を識別する情報を前記画面に表示する、
処理を実行させる付記1記載の監視支援プログラム。
(付記3)
前記複数のアプリケーションのそれぞれのポート番号のうち、前記通信元ポート番号または前記通信先ポート番号と一致するポート番号のアプリケーションが関連していると判定する、
処理を実行させる付記1記載の監視支援プログラム。
(付記4)
前記関連性のある複数のアプリケーションのうち2つのアプリケーションの間の通信の方向を識別可能に前記画面に表示する、
処理を実行させる付記1記載の監視支援プログラム。
(付記5)
前記関連性のある複数のアプリケーションのうち2つのアプリケーションの間の通信量と通信頻度と通信種別とのうち少なくとも1つを識別可能に前記画面に表示する、
処理を実行させる付記1記載の監視支援プログラム。
(付記6)
前記通信量と前記通信頻度と前記通信種別とのうち何れか1つまたは複数に基づいて、前記関連性のある複数のアプリケーションが行う処理に対する影響度を判定する、
処理を実行させる付記4記載の監視支援プログラム。
(付記7)
前記アプリケーションが通信しているアプリケーションが複数であるか否かに基づいて、前記関連性のある複数のアプリケーションが行う処理に対する影響度を判定する、
処理を実行させる付記1記載の監視支援プログラム。
(付記8)
前記アプリケーションが通信しているプロトコルに応じて、前記関連性のある複数のアプリケーションが行う処理に対する影響度を判定する、
処理を実行させる付記1記載の監視支援プログラム。
(付記10)
前記アプリケーションに事象が発生したときに、前記影響度に応じた通報を行う、
処理を実行させる付記1記載の監視支援プログラム。
(付記11)
前記複数の情報処理装置が保持する通信ログに基づいて、前記通信元ポート番号と前記通信先ポート番号と前記複数の情報処理装置で動作する複数のアプリケーションのそれぞれのポート番号とを取得する、
処理を実行させる付記1記載の監視支援プログラム。
(付記12)
前記通信元ポート番号と前記通信先ポート番号と前記複数の情報処理装置で動作する複数のアプリケーションのそれぞれのポート番号とを定期的に取得し、
定期的に前記画面を更新する、
処理を実行させる付記1記載の監視支援プログラム。
(付記13)
複数の情報処理装置の間で行われる通信の通信元ポート番号と通信先ポート番号と前記複数の情報処理装置で動作する複数のアプリケーションのそれぞれのポート番号を取得し、
前記通信元ポート番号と前記通信先ポート番号と前記複数のアプリケーションのそれぞれのポート番号とに基づいて、前記複数のアプリケーションのうち関連性のある複数のアプリケーションを特定し、
前記関連性のある複数のアプリケーションを識別する情報を画面に表示する、
監視支援方法。
(付記14)
複数の情報処理装置の間で行われる通信の通信元ポート番号と通信先ポート番号と前記複数の情報処理装置で動作する複数のアプリケーションのそれぞれのポート番号を受信する受信部と、
前記通信元ポート番号と前記通信先ポート番号と前記複数のアプリケーションのそれぞれのポート番号とに基づいて、前記複数のアプリケーションのうち関連性のある複数のアプリケーションを特定する関連性特定部と、
前記関連性のある複数のアプリケーションを識別する情報を画面に表示する表示部と、
を備える監視支援装置。