JP2009266031A - 計算機システム及び計算機 - Google Patents

計算機システム及び計算機 Download PDF

Info

Publication number
JP2009266031A
JP2009266031A JP2008116147A JP2008116147A JP2009266031A JP 2009266031 A JP2009266031 A JP 2009266031A JP 2008116147 A JP2008116147 A JP 2008116147A JP 2008116147 A JP2008116147 A JP 2008116147A JP 2009266031 A JP2009266031 A JP 2009266031A
Authority
JP
Japan
Prior art keywords
module
log
information
output request
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008116147A
Other languages
English (en)
Inventor
Ken Ueno
賢 上野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2008116147A priority Critical patent/JP2009266031A/ja
Publication of JP2009266031A publication Critical patent/JP2009266031A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】ログ解析に十分なログ情報を出力することが可能となる。
【解決手段】計算機11は、計算機11のサーバ処理モジュールの障害の発生が検出された場合、モジュール情報を含むログ出力要求をログ出力要請マネージャー20に送信する。ログ出力要請マネージャー20は、ログ出力要求に含まれるモジュール情報によって示される計算機11のサーバ処理モジュールと関連のある計算機12のサーバ処理モジュールを、関連モジュールデータベースを参照して特定する。ログ出力要請マネージャー20は、特定された計算機12のサーバ処理モジュールに詳細ログ出力要請を送信する。計算機12のサーバ処理モジュールは、当該サーバ処理モジュールのログ情報を生成し、メモリに書き込む。計算機12のサーバ処理モジュールは、詳細ログ出力要請が受信された場合、予め定められた量のログ情報をメモリから抽出し、ログファイルに出力する。
【選択図】 図1

Description

本発明は、ログ解析に用いられるログ情報を出力する計算機システム及び計算機に関する。
一般的に、例えば各種サーバとして動作する計算機が有するモジュールの履歴情報としてログ情報がログファイルに出力される。このログファイルでは、出力されたログ情報が記録(保存)される。
例えば計算機が有するモジュールに障害が発生した場合には、ログファイルに記録されているログ情報を解析(ログ解析)することによって当該障害の原因を究明することができる。
ここで、上記したログファイルへのログ情報の出力量(ログ情報出力量)に関しては、例えば計算機を利用するユーザによって任意のログレベル(ログ情報の出力条件)が設定される。これにより、ユーザによって設定されたログレベルの範囲でログ情報の出力が行われる。
ところで、例えば計算機が有するモジュールに障害が発生した場合に上記したように当該障害の原因究明のために十分な(量の)ログ情報を残す(ログファイルに記録する)ためには、当該ログファイルへのログ情報出力量を多くする必要がある。この場合には、ログファイルのために多くのディスク領域を要することとなる。
また、例えばログファイルのディスク領域を低減させるために、当該ログファイルがリサイクリックに管理されている場合を想定する。この場合において、上記したように障害の原因究明のために十分な量のログ情報がログファイルに出力されるようにすると、障害が発生していない状態(通常時)においても多くのログ情報が出力されるため、ログファイルに残るログ情報の期間が短くなる。このため、障害発生時のログ解析において十分なログ情報が得られない場合がある。
上記したように、例えばログファイルに要するディスク領域を低減するためにログ情報の出力量を抑制(つまり、ログ情報の粒度を粗く)すると、障害の原因究明に必要な量のログ情報が得られない場合がある。一方、障害の原因究明のために十分な量のログ情報を出力(つまり、ログ情報の粒度を細かく)すると、当該ログ情報の出力先であるログファイルのディスク領域が大きくなる。
また、上記したログレベル以外にユーザが設定するログ出力量の内容には、例えばログファイルのサイズ、ログ情報保管期間等がある。これらを例えばログ情報取得の目的に応じて調整することが好ましいが、物理的制約等からバランスのよい設定を取ることは困難である。
そこで、例えば重要度の低いログデータは一旦メモリに記憶しておき、情報処理システム(計算機)に異常が発生したことを検知した場合に、記憶装置(ログファイル)に出力する技術(以下、先行技術と表記)が開示されている(例えば、特許文献1を参照)。この先行技術によれば、情報処理システムに異常が発生した場合、異常発生から過去のある時点までの全てのログデータ(ログ情報)が出力されるので当該異常発生の原因究明に役立たせることが可能となる。また、情報処理システムに異常が発生しない場合には、メモリ上に記憶されたログデータは古いものから順次廃棄されるため、不要なログデータが記憶されることはない。
特開2004−264970号公報
上記したように計算機が有するモジュールに障害が発生した場合には、当該モジュールの十分な量のログ情報(以下、詳細ログ情報と表記)を解析することにより、当該障害の原因を究明することができる。
ところで、例えば特定のモジュールに障害が発生したことが検出された場合であっても、当該特定のモジュール以外の当該特定のモジュールと連動して動作するモジュール(以下、関連モジュールと表記)に当該障害の原因がある場合がある。
この場合には、上記した特定のモジュールのみの詳細ログ情報では、障害原因究明のためのログ解析に十分でないことがある。この場合には、関連モジュールの詳細ログ情報が必要になる可能性がある。
しかしながら、上記した先行技術においては、障害(異常)発生時に、当該障害が発生したモジュールの詳細ログ情報のみが出力される。つまり、上記したように特定のモジュールに障害が発生したことが検出された場合には、当該特定のモジュール以外の関連モジュールに障害の原因がある場合であっても当該関連モジュールの詳細ログ情報を出力させることはできない。これにより、ログ解析のための十分なログ情報を得ることができず、障害の原因を究明することができない可能性がある。
そこで、本発明の目的は、ログ解析に十分なログ情報を出力することが可能な計算機システム及び計算機を提供することにある。
本発明の1つの態様によれば、各種処理を実行する第1のモジュールを有する第1の計算機と、当該第1のモジュールに関連のある第2のモジュール及びメモリを有する第2の計算機と、前記第1の計算機及び前記第2の計算機と接続されたマネージャーとを具備し、前記第1の計算機は、前記第1のモジュールの障害の発生を検出する検出手段と、前記第1のモジュールの障害の発生が検出された場合に、当該第1のモジュールを示すモジュール情報を含むログ出力要求を前記マネージャーに送信する第1の送信手段とを含み、前記マネージャーは、前記第1のモジュール及び第2のモジュールが互いに関連があることを示す関連モジュール情報が予め格納される関連モジュール格納手段と、前記送信されたログ出力要求を受信する第1の受信手段と、前記受信されたログ出力要求に含まれるモジュール情報によって示される第1のモジュールに関連のある第2のモジュールを、前記関連モジュール格納手段に格納されている関連モジュール情報に基づいて特定する特定手段と、前記特定された第2のモジュール情報によって示される第2のモジュールに詳細ログ出力要請を送信する第2の送信手段とを含み、前記第2のモジュールは、前記第2のモジュールによって実行された処理に応じた当該第2のモジュールのログ情報を生成するログ情報生成手段と、前記生成された第2のモジュールのログ情報を前記メモリに書き込むメモリ書込み手段と、前記第2の送信手段によって送信された詳細ログ出力要請を受信する第2の受信手段と、前記詳細ログ出力要請が受信された場合に、予め定められた量の前記第2のモジュールのログ情報を前記メモリから抽出する抽出手段と、前記抽出されたログ情報を出力する出力手段とを含むことを特徴とする計算機システムが提供される。
本発明によれば、ログ解析に十分なログ情報を出力することを可能とする。
以下、図面を参照して、本発明の実施形態について説明する。
図1は、本実施形態に係る計算機システムの構成を示すブロック図である。図1に示すように、計算機システムは、複数の計算機を備える。この複数の計算機は、計算機11〜14を含む。また、計算機システムは、複数の計算機とは異なる装置であるログ出力要請マネージャー20を備える。計算機11〜14及びログ出力要請マネージャー20は、それぞれ互いに接続されている。
本実施形態においては、計算機11〜14は、例えばデータベース(DB)サーバ、アプリケーションサーバまたはWebサーバのような各種サーバとして動作する。計算機11〜14の各々は、各種処理を実行するモジュール(各種サーバとして動作するためのサーバ処理モジュール)及び各種データを格納するメモリを有する。このサーバ処理モジュールは、例えば計算機11〜14のメモリに格納されたプログラムを、当該計算機11〜14のCPUが実行することにより実現される。
図2は、図1に示す計算機11の主として機能構成を示すブロック図である。図2に示すように、計算機11は、モニター部111、サーバ処理モジュール112及びログファイル113を有する。
モニター部111は、監視部111a及びログ出力要求送信部111bを含む。監視部111aは、監視の対象となるモジュール(監視対象モジュール)であるサーバ処理モジュール112の状態を確認する機能を有する。監視部111aは、サーバ処理モジュール112の状態を確認することによって、当該サーバ処理モジュール112の障害の発生を検出する。この場合、監視部111aは、サーバ処理モジュール112が例えばデータベースにアクセスする等の処理を実行できるか否かに応じて当該サーバ処理モジュール112の状態を確認(監視)する。
ログ出力要求送信部111bは、監視部111aによってサーバ処理モジュール112の障害の発生が検出された場合に、ログ出力要求をログ出力要請マネージャー20に送信する。このログ出力要求には、監視部111aによって障害の発生が検出されたサーバ処理モジュール112を示すモジュール情報が含まれる。このモジュール情報には、例えばサーバ処理モジュール112のモジュール名(ログ出力要求発行モジュール名)及び当該サーバ処理モジュール112が動作する計算機(つまり、サーバ処理モジュール112を有する計算機11)を特定するための情報等が含まれる。なお、ログ出力要求の送信先については、例えば計算機11を利用するユーザによって予め設定されている。
サーバ処理モジュール112には、上記した各種サーバとして動作するための処理を行う以外に、例えばログ情報の出力部として以下に説明する各部(機能)が組み込まれている。つまり、サーバ処理モジュール112は、当該サーバ処理モジュール112において実行された各種処理に応じたログ情報を出力する機能を有する。
サーバ処理モジュール112は、ログ情報生成部112a、メモリ書込み部112b、ログレベル判定部112c、ログファイル出力部112d、詳細ログ出力要請スイッチ112e及び詳細ログ抽出部112fを含む。
ログ情報生成部112aは、上記したサーバ処理モジュール112による例えば計算機11が各種サーバとして動作するために実行された各種処理の内容を表すログメッセージを取得する。ログ情報生成部112aは、取得されたログメッセージに基づいて、サーバ処理モジュール112によって実行された処理に応じた当該サーバ処理モジュール112のログ情報を生成する。ログ情報生成部112aは、最も詳細なログ情報(最詳細ログ情報)を生成する。
このログ情報には、ログ情報生成部112aによって取得されたログメッセージ及びログレベルに関する情報が含まれる。ログ情報に含まれるログレベルに関する情報は、当該ログ情報のログレベルを判別するための情報(例えば数値)である。
メモリ書込み部112bは、ログ情報生成部112aによって生成されたログ情報(最詳細ログ情報)を、上記した計算機11が有するメモリに書き込む。このとき、メモリ書込み部12bは、例えばサーバ処理モジュール112によって確保されているメモリ領域112gにログ情報を書き込む。メモリ領域112gにおいては、ログ情報はリサイクリックに管理される。
なお、このメモリ領域112gとしては、上記したようにログ情報生成部112aによって最詳細ログ情報が生成された場合(最詳細のログ情報が出力されるように設定されている場合)であっても、例えばサーバ処理モジュール112に発生した障害の原因究明のための解析(ログ解析)に十分な時間分のログ情報を保存することができる領域が確保されている。
ログレベル判定部112cは、ログ情報生成部112aによって生成されたログ情報に含まれるログレベルに関する情報及び計算機11のユーザによって任意に設定されたログレベルとの比較を行う。ここで、ログレベルとは、ログ情報をログファイル113に出力するための条件である。これにより、ログレベル判定部112は、ログ情報生成部112aによって生成されたログ情報をログファイル113に出力すべきか否かを判定する。
ログファイル出力部112dは、ログレベル判定部112によってログファイル113に出力すべきであると判定された場合、ログ情報生成部112aによって生成されたログ情報をログファイル113に出力する。これにより、ログファイル113には、ログ情報が格納される。
ログファイル113は、例えばHDD(Hard Disk Drive)のような記憶装置にその領域が確保されている。ログファイル113に格納されたログ情報は、例えばサーバ処理モジュール112に障害が発生した場合に、当該障害の原因究明のためのログ解析に用いられる。また、ログ情報は、サーバ処理モジュール112に障害が発生していない場合には、例えば当該サーバ処理モジュール112が正常に動作しているか否かの確認のために用いられる。
詳細ログ出力要請スイッチ112eは、ログ出力要請マネージャー20によって送信された詳細ログ出力要請(後述する)を受信する。詳細ログ出力要請スイッチ112eは、詳細ログ出力要請が受信されると、詳細ログ抽出部112fに対して詳細ログの抽出を要請する。
詳細ログ抽出部112fは、詳細ログ出力要請スイッチ112eからの要請を受けると、メモリ領域112gからログ情報を抽出する。このとき、詳細ログ抽出部112fは、例えば予め定められた量(時間分)のログ情報を抽出する。詳細ログ抽出部112fは、抽出されたログ情報をログファイル出力部112dに渡す。この抽出されたログ情報は、ログファイル出力部112dによってログファイル113に出力される。
ここでは、計算機11について説明したが、計算機システムを構成する他の計算機(計算機12〜14)についても同様である。つまり、計算機12〜14は、それぞれモニター部、各種サーバとして動作するためのサーバ処理モジュール及びログファイルを含む。また、各種サーバとして動作するためのサーバ処理モジュールには、図2に示すログ情報生成部112a、メモリ書込み部112b、ログレベル判定部112c、ログファイル出力部d、詳細ログ出力要請スイッチ112e及び詳細ログ抽出部112fが組み込まれている。また、計算機12〜14が有するメモリには、図2に示すメモリ領域112gが確保されている。以下、計算機12〜14の構成についても適宜図2を用いて説明する。
図3は、図1に示すログ出力要請マネージャー20の主として機能構成を示すブロック図である。
図3に示すように、ログ出力要請マネージャー20は、ログ出力要求受信部21、関連モジュールデータベース(DB)22、関連モジュール調査部23及び詳細ログ出力要請送信部24を含む。
ログ出力要求受信部21は、上記した例えば計算機11のモニター部111に含まれるログ出力要求送信部111bによって送信されたログ出力要求を受信する。上記したように、ログ出力要求には、モジュール情報が含まれる。
関連モジュールデータベース22には、例えば上記した計算機11〜14が有する各サーバ処理モジュール112のうち、互いに関連のあるサーバ処理モジュールを示す関連モジュール情報が予め格納される。例えば計算機11のサーバ処理モジュール112及び計算機12のサーバ処理モジュール112が互いに連動して動作する場合には、互いに関連があるサーバ処理モジュール112であるものとする。
関連モジュール調査部23は、ログ出力要求受信部21によって受信されたログ出力要求に含まれるモジュール情報によって示されるサーバ処理モジュール112(例えば、計算機11のサーバ処理モジュール112)に関連するサーバ処理モジュール112(例えば、計算機12のサーバ処理モジュール)を、関連モジュールデータベース22に格納されている関連モジュール情報に基づいて特定する。関連モジュール調査部23は、ログ出力要求受信部21によって受信されたログ出力要求に含まれるモジュール情報及び特定されたサーバ処理モジュール112を示すモジュール情報の一覧(以下、モジュール情報一覧と表記)を作成する。
詳細ログ出力要請送信部24は、関連モジュール調査部23によって作成されたモジュール情報一覧によって示される全てのサーバ処理モジュール112(の詳細ログ出力要請スイッチ112e)に対して詳細ログ出力要請を送信する。これにより、ログ出力要請マネージャー20は、モジュール情報一覧によって示される全てのサーバ処理モジュール112に対して最詳細ログ情報の出力を要請する。
図4は、図3に示す関連モジュールデータベース22に格納される関連モジュール情報のデータ構造の一例を示す。
図4に示すように、関連モジュール情報では、グループ(を示す情報)及びモジュール情報が対応付けられている。つまり、関連モジュール情報では、例えば各計算機が有するサーバ処理モジュール112を示すモジュール情報がグループで管理されている。また、関連モジュール情報において同一のグループに所属するモジュール情報によって示されるサーバ処理モジュール112は、互いに関連のあるサーバ処理モジュール112である。
図4に示す例では、関連モジュール情報において、グループ「G1」及びモジュール情報「M1」が対応付けられている。同様に、関連モジュール情報において、グループ「G1」及びモジュール情報「M2」、グループ「G1」及びモジュール情報「M3」、グループ「G2」及びモジュール情報「M5」、グループ「G2」及びモジュール情報「M6」、グループ「G3」及びモジュール情報「M8」、グループ「G3」及びモジュール情報「M10」がそれぞれ対応付けられている。
上記したように、グループ「G1」には、モジュール情報「M1」、「M2」及び「M3」がそれぞれ対応付けられている。これによれば、モジュール情報「M1」、「M2」及び「M3」によって示されるサーバ処理モジュール112が、それぞれ互いに関連していることが示される。
同様に、グループ「G2」には、モジュール情報「M5」及び「M6」がそれぞれ対応付けられている。これによれば、モジュール情報「M5」及び「M6」によって示されるサーバ処理モジュール112が、それぞれ互いに関連していることが示される。
また、グループ「G3」には、モジュール情報「M8」及び「M10」がそれぞれ対応付けられている。これによれば、モジュール情報「M8」及び「M10」によって示されるサーバ処理モジュール112が、それぞれ互いに関連していることが示される。
次に、図5に示すフローチャートを参照して、例えば計算機11が有するサーバ処理モジュール112においてログ情報が生成される際の処理手順について説明する。
まず、サーバ処理モジュール112に含まれるログ情報生成部112aは、当該サーバ処理モジュール112において実行された処理に応じたログメッセージを取得する(ステップS1)。このログメッセージは、例えばテキストデータである。
次に、ログ情報生成部112aは、取得されたログメッセージに基づいて、ログ情報を生成する(ステップS2)。ログ情報生成部112aは、上記したように最詳細ログ情報を生成する。このログ情報には、取得されたログメッセージ及び当該ログ情報のログレベルに関する情報が含まれる。
メモリ書込み部112bは、ログ情報生成部112aによって生成されたログ情報をメモリ領域112gに書き込む(ステップS3)。上記したようにメモリ領域112gは、例えば各計算機(ここでは、計算機11)に備えられるメモリの領域であって、サーバ処理モジュール112に割り当てられた領域である。
次に、ログレベル判定部112cは、ログ情報生成部112aによって生成されたログ情報に含まれるログレベルに関する情報を参照して、例えば計算機11のユーザによって任意に設定されてログレベルと当該情報とを比較する。これにより、ログレベル判定部112cは、ログ情報生成部112aによって生成されたログ情報をログファイル113に出力するか否かを判定する(ステップS4)。
ログ情報をログファイル113に出力すると判定された場合(ステップS4のYES)、ログファイル出力部112dは、当該ログ情報をログファイル113に出力する(ステップS5)。
一方、ログ情報をログファイル113に出力しないと判定された場合(ステップS4のNO)、処理は終了される。
上記したように、ログ情報生成部112aは最詳細ログ情報を生成するため、例えばユーザによってログ情報の出力を抑制するようなログレベルが設定されている場合には、上記したステップS4においてログ情報を出力しないと判定される。しかしながら、本実施形態においては、このようにログ情報の生成時に当該ログ情報がログファイル113に出力されない場合であっても、当該ログ情報は上記したステップS3においてメモリ領域112gに保存される。
次に、図6のフローチャートを参照して、例えば計算機11が有するサーバ処理モジュール112において障害が発生した場合のモニター部111の処理手順について説明する。
まず、モニター部111に含まれる監視部111aは、計算機11に含まれるサーバ処理モジュール112が正常に動作しているか否かを判定する(ステップS11)。監視部111aは、例えばサーバ処理モジュール112の状態を監視することにより判定処理を実行する。
サーバ処理モジュール112が正常に動作していないと判定された場合(ステップS11のNO)、監視部111aは、当該サーバ処理モジュール112の障害の発生を検出する。
監視部111aによってサーバ処理モジュール112の障害の発生が検出されると、ログ出力要求送信部111bは、当該サーバ処理モジュール112を示すモジュール情報を含むログ出力要求をログ出力要請マネージャー20に対して送信する(ステップS12)。
一方、ステップS11においてサーバ処理モジュール112が正常に動作していると判定された場合には、処理は終了される。
次に、図7のフローチャートを参照して、例えば計算機11が有するモニター部111によってログ出力要求が送信された際のログ出力要請マネージャー20の処理手順について説明する。
まず、ログ出力要請マネージャー20に含まれるログ出力要求受信部21は、計算機11に含まれるモニター部111のログ出力要求送信部111bによって送信されたログ出力要求を受信する(ステップS21)。このログ出力要求には、モジュール情報が含まれる。このモジュール情報は、障害の発生が検出されたサーバ処理モジュール112を示す。
次に、関連モジュール調査部23は、ログ出力要求受信部21によって受信されたログ出力要求に含まれるモジュール情報によって示されるサーバ処理モジュール112に関連するサーバ処理モジュール(以下、関連モジュールと表記)112を特定する。関連モジュール調査部23は、関連モジュールデータベース22に格納されている関連モジュール情報に基づいて関連モジュール112を特定する。
具体的には、関連モジュール調査部23は、関連モジュールデータベース22に格納されている関連モジュール情報において、ログ出力要求受信部21によって受信されたログ出力要求に含まれるモジュール情報に対応付けられているグループを特定する。関連モジュール調査部23は、関連モジュールデータベース22に格納されている関連モジュール情報において、ログ出力要求受信部21によって受信されたログ出力要求に含まれるモジュール情報以外のモジュール情報であって、特定されたグループに対応付けられているモジュール情報によって示されるサーバ処理モジュール112を関連モジュール112として特定する。
関連モジュール調査部23は、ログ出力要求受信部21によって受信されたログ出力要求受信部21によって受信されたログ出力要求に含まれるモジュール情報及び特定された関連モジュール112を示すモジュール情報を含むモジュール情報の一覧(モジュール情報一覧)を作成する(ステップS23)。
詳細ログ出力要請送信部24は、関連モジュール調査部23によって作成されたモジュール情報一覧に含まれるモジュール情報によって示される全てのサーバ処理モジュール(関連モジュール)112に対して詳細ログ出力要請を送信する(ステップS24)。このとき、詳細ログ出力要請送信部24は、モジュール情報一覧に含まれるモジュール情報に基づいて詳細ログ出力要請を送信する。これにより、詳細ログ出力要請送信部24は、モジュール情報一覧に含まれるモジュール情報によって示される全てのモジュールに対して最詳細ログ情報の出力を要請する。
次に、図8のフローチャートを参照して、上記したログ出力要請マネージャー20に含まれる詳細ログ出力要請送信部24によって詳細ログ出力要請が送信された際のサーバ処理モジュール112の処理手順について説明する。
詳細ログ出力要請は、上記した図7に示すステップS24の処理においてモジュール情報一覧に含まれるモジュール情報によって示される全てのモジュール(サーバ処理モジュール112)に対して送信される。したがって、ここで説明する処理(つまり、図8に示す処理)は、詳細ログ出力要請が送信された全てのサーバ処理モジュール112において実行される。
まず、サーバ処理モジュール112に含まれる詳細ログ出力要請スイッチ112eは、ログ出力要請マネージャー20に含まれる詳細ログ出力要請送信部24によって送信された詳細ログ出力要請を受信する(ステップS31)。
次に、詳細ログ抽出部112fは、詳細ログ出力要請スイッチ112eによって詳細ログ出力要請が受信されると、最詳細ログ情報をメモリ領域112gから抽出する(ステップS32)。このとき、詳細ログ抽出部112fは、例えば詳細ログ出力要請スイッチ112eによって詳細ログ出力要請が受信された時刻(時間)から予め定められた時間、遡った量(つまり、ログ解析に十分な情報量となるような時間分)の最詳細ログ情報を抽出する。
ログファイル出力部112dは、詳細ログ抽出部112fによって抽出された最詳細ログ情報を、ログファイル113に出力する(ステップS33)。このログファイル113に出力された最詳細ログ情報を元にログ解析を実行することによって、例えば計算機11において発生した障害の原因究明等が行われる。
次に、図9を参照して、本実施形態に係る計算機システム全体における処理の流れの概略について説明する。
上記したように、本実施形態における計算機システムは、計算機11〜14及びログ出力要請マネージャー20を備える。ここでは、図9に示すように、計算機11は、デーベース(DB)サーバ(以下、データベースサーバ11と表記)として動作するものとする。計算機12は、アプリケーションサーバ(以下、アプリケーションサーバ12と表記)として動作するものとする。計算機13は、Webサーバ(以下、Webサーバ13と表記)として動作するものとする。また、計算機14は、データベースサーバ、アプリケーションサーバ及びWebサーバとは異なるAAAサーバ(以下、AAAサーバ14と表記)として動作するものとする。
また、データベースサーバ11、アプリケーションサーバ12、Webサーバ13及びAAAサーバ14は、それぞれのサーバとして動作するための処理を行うサーバ処理モジュール112を含む。このサーバ処理モジュール112には、上記した図2に示す各部が組み込まれている。
ここでは、データベースサーバ11、アプリケーションサーバ12及びWebサーバ13は連動して動作するものとして説明する。つまり、データベースサーバ11、アプリケーションサーバ12及びWebサーバ13の各々に含まれるサーバ処理モジュール112は、互いに関連があるものとする。この場合、データベースサーバ11、アプリケーションサーバ12及びWebサーバ13の各々に含まれるサーバ処理モジュール112を示すモジュール情報は、関連モジュールデータベース22に格納されている関連モジュール情報において同一のグループに対応付けられている。
一方、AAAサーバ14に含まれるサーバ処理モジュール112は、データベースサーバ11、アプリケーションサーバ12及びWebサーバ13の各々に含まれるサーバ処理モジュール112とは関連がないものとする。
ここで、例えばデータベースサーバ11(第1の計算機)に含まれるモニター部111の監視部111aが、当該データベースサーバ11に含まれるサーバ処理モジュール112(第1のモジュール)の障害の発生を検出した場合を想定する。この場合、データベースサーバ11に含まれるモニター部111のログ出力要求送信部111bは、ログ出力要求をログ出力要請マネージャー20に送信する(ステップS41)。
ログ出力要請マネージャー20に含まれるログ出力要求受信部21によってログ出力要求が受信されると、当該ログ出力要請マネージャー20に含まれる関連モジュール調査部23は、データベースサーバ11に含まれるサーバ処理モジュール112に関連する関連モジュールを特定する。このとき、関連モジュール調査部23は、関連モジュールデータベース22に格納されている関連モジュール情報に基づいて関連モジュールを特定する。ここでは、関連モジュールとしてとしてアプリケーションサーバ12及びWebサーバ13(第2の計算機)に含まれるサーバ処理モジュール112(第2のモジュール)が特定される。
関連モジュール調査部23は、障害の発生が検出されたデータベースサーバ11に含まれるサーバ処理モジュール112と、関連モジュールとして特定されたアプリケーションサーバ12及びWebサーバ13に含まれるサーバ処理モジュール112を示すモジュール情報の一覧(モジュール情報一覧)を作成する。
次に、ログ出力要請マネージャー20に含まれる詳細ログ出力要請送信部24は、モジュール情報一覧に含まれるモジュール情報によって示される全てのサーバ処理モジュール112(ここでは、データベースサーバ11、アプリケーションサーバ12及びWebサーバ13の各々に含まれるサーバ処理モジュール112)に対して詳細ログ出力要請を送信する(ステップS42)。
つまり、詳細ログ出力要請は、障害の発生が検出されたサーバ処理モジュール112(ここでは、データベースサーバ11のサーバ処理モジュール112)及び当該サーバ処理モジュール112に関連する関連モジュール(ここでは、アプリケーションサーバ12及びWebサーバ13のサーバ処理モジュール112)に送信され、当該障害の発生が検出されたサーバ処理モジュール112に関連のないサーバ処理モジュール112(ここでは、AAAサーバ14のサーバ処理モジュール112)には送信されない。
上記したように、ログ出力要請マネージャー20に含まれる詳細ログ出力要請送信部24によって詳細ログ出力要請が送信された場合、当該詳細ログ出力要請が送信された全てのサーバ処理モジュール112(ここでは、データベースサーバ11、アプリケーションサーバ12及びWebサーバ13の各々に含まれるサーバ処理モジュール112)において、上記した図8に示す処理が実行される。
これにより、例えばデータベースサーバ11に含まれるサーバ処理モジュール112において障害の発生が検出された場合に、当該障害が発生したデータベースサーバ11のサーバ処理モジュール112だけでなく、当該データベースサーバ11のサーバ処理モジュール112に関連するアプリケーションサーバ12及びWebサーバ13のサーバ処理モジュール112からも最詳細ログ情報を出力させる。
上記したように本実施形態においては、サーバ処理モジュール112の最詳細ログ情報はメモリ領域112gに格納され、例えばサーバ処理モジュール112の障害の発生が検出された際には、当該サーバ処理モジュール112及び当該サーバ処理モジュール112に関連する関連モジュールに対してログ出力要請マネージャー20からログ出力要請が送信される。ログ出力要請が送信されたサーバ処理モジュール112では、予め定められた量の最詳細ログ情報がメモリ領域112gから抽出され、ログファイル113に出力される。
これにより、本実施形態においては、例えばサーバ処理モジュール112において障害が発生していないとき(通常時)においては、ユーザによって予め設定されたログレベルに応じてログ情報がログファイル113に出力されるので、ログ出力量を抑制することができる。
また、本実施形態においては、上記したようにサーバ処理モジュール112において障害の発生が検出された場合に、当該障害発生の原因の解析(ログ解析)のために必要な量のログ情報(詳細ログ情報)がログファイル113に出力されるため、例えばユーザによって予め設定されたログレベルを変更することなく、当該ログ解析に必要なログ情報が不足する事態を軽減することができる。
また、本実施形態においては、障害の発生が検出されたサーバ処理モジュール112に関連する他のサーバ処理モジュール112に対して最詳細ログ情報を出力させるため、例えば障害の発生が検出されたサーバ処理モジュール112以外のサーバ処理モジュール112に障害の原因がある場合であっても、当該ログ解析に十分なログ情報を得ることが可能となる。
また、本実施形態においては、最詳細ログ情報がメモリ領域112gに格納されているため、例えば突然のシステムトラブル(OSパニック等)に見舞われた場合であっても、当該メモリのダンプをとり、当該ダンプ内に残された最詳細ログ情報を参照することで、当該システムトラブル直前の詳細なログ情報を得ることが可能となる。
なお、本実施形態においては、互いに関連するサーバ処理モジュール112が異なる計算機に存在するものとして説明したが、同一の計算機に複数の関連するサーバ処理モジュール112が存在する場合であっても適用可能である。この場合であっても、関連するサーバ処理モジュール112の各々に対してログ出力要請が送信されることで、当該関連するサーバ処理モジュール112から最詳細ログ情報を出力させることができる。
また、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
本発明の実施形態に係る計算機システムの構成を示すブロック図。 図1に示す計算機11の主として機能構成を示すブロック図。 図1に示すログ出力要請マネージャー20の主として機能構成を示すブロック図。 図3に示す関連モジュールデータベース22に格納される関連モジュール情報のデータ構造の一例を示す図。 サーバ処理モジュール112においてログ情報が生成される際の処理手順を示すフローチャート。 サーバ処理モジュール112において障害が発生した場合のモニター部111の処理手順を示すフローチャート。 モニター部111によってログ出力要求が送信された際のログ出力要請マネージャー20の処理手順を示すフローチャート。 詳細ログ出力要請が送信された際のサーバ処理モジュール112の処理手順を示すフローチャート。 本実施形態に係る計算機システム全体における処理の流れの概略について説明するための図。
符号の説明
11,12,13,14…計算機、20…ログ出力要請マネージャー、21…ログ出力要求受信部(第1の受信手段)、22…関連モジュールデータベース(関連モジュール格納手段)、23…関連モジュール調査部(特定手段)、24…詳細ログ出力要請送信部(第2の送信手段)、111…モニター部、111a…監視部(検出手段)、111b…ログ出力要求送信部(第1の送信手段)、112…サーバ処理モジュール、112a…ログ情報生成部、112b…メモリ書込み部、112c…ログレベル判定部、112d…ログファイル出力部、112e…詳細ログ出力要請スイッチ、112f…詳細ログ抽出部、112g…メモリ領域。

Claims (5)

  1. 各種処理を実行する第1のモジュールを有する第1の計算機と、当該第1のモジュールに関連のある第2のモジュール及びメモリを有する第2の計算機と、前記第1の計算機及び前記第2の計算機と接続されたマネージャーとを具備し、
    前記第1の計算機は、
    前記第1のモジュールの障害の発生を検出する検出手段と、
    前記第1のモジュールの障害の発生が検出された場合に、当該第1のモジュールを示すモジュール情報を含むログ出力要求を前記マネージャーに送信する第1の送信手段と
    を含み、
    前記マネージャーは、
    前記第1のモジュール及び第2のモジュールが互いに関連があることを示す関連モジュール情報が予め格納される関連モジュール格納手段と、
    前記送信されたログ出力要求を受信する第1の受信手段と、
    前記受信されたログ出力要求に含まれるモジュール情報によって示される第1のモジュールと関連のある第2のモジュールを、前記関連モジュール格納手段に格納されている関連モジュール情報に基づいて特定する特定手段と、
    前記特定された第2のモジュールに詳細ログ出力要請を送信する第2の送信手段と
    を含み、
    前記第2のモジュールは、
    前記第2のモジュールによって実行された処理に応じた当該第2のモジュールのログ情報を生成するログ情報生成手段と、
    前記生成された第2のモジュールのログ情報を前記メモリに書き込むメモリ書込み手段と、
    前記第2の送信手段によって送信された詳細ログ出力要請を受信する第2の受信手段と、
    前記詳細ログ出力要請が受信された場合に、予め定められた量の前記第2のモジュールのログ情報を前記メモリから抽出する抽出手段と、
    前記抽出されたログ情報を出力する出力手段と
    を含む
    ことを特徴とする計算機システム。
  2. 前記第1の計算機は、メモリを有し、
    前記第2の送信手段は、前記第1の受信手段によって受信されたログ出力要求に含まれるモジュール情報によって示される第1のモジュールを有する第1の計算機に詳細ログ出力要請を送信し、
    前記第1のモジュールは、
    前記第1のモジュールのログ情報を生成するログ情報生成手段と、
    前記生成された第1のモジュールのログ情報を前記第1の計算機のメモリに書き込む書込み手段と、
    前記第2の送信手段によって送信された詳細ログ出力要請を受信する第3の受信手段と、
    前記第3の受信手段によって詳細ログ出力要請が受信された場合に、予め定められた量の前記第1のモジュールのログ情報を前記第1の計算機のメモリから抽出する抽出手段と
    を更に含む
    ことを特徴とする請求項1記載の計算機システム。
  3. 前記抽出手段は、前記第2の受信手段によって前記詳細ログ出力要請が受信された時刻から予め定められた時間遡った分の前記第2のモジュールのログ情報を前記第2の計算機のメモリから抽出することを特徴とする請求項1記載の計算機システム。
  4. 各種処理を実行する第1のモジュール、当該第1のモジュールに関連のある第2のモジュール及びメモリを有する計算機と、当該第1の計算機と接続されたマネージャーとを具備し、
    前記計算機は、
    前記第1のモジュールの障害の発生を検出する検出手段と、
    前記第1のモジュールの障害の発生が検出された場合に、当該第1のモジュールを示すモジュール情報を含むログ出力要求を前記マネージャーに送信する第1の送信手段と
    を含み、
    前記マネージャーは、
    前記第1のモジュール及び第2のモジュールが互いに関連があることを示す関連モジュール情報が予め格納される関連モジュール格納手段と、
    前記送信されたログ出力要求を受信する第1の受信手段と、
    前記受信されたログ出力要求に含まれるモジュール情報によって示される第1のモジュールと関連のある第2のモジュールを、前記関連モジュール格納手段に格納されている関連モジュール情報に基づいて特定する特定手段と、
    前記特定された第2のモジュールを有する前記計算機に詳細ログ出力要請を送信する第2の送信手段と
    を含み、
    前記第2のモジュールは、
    前記第2のモジュールによって実行された処理に応じた当該第2のモジュールのログ情報を生成するログ情報生成手段と、
    前記生成された第2のモジュールのログ情報を前記メモリに書き込むメモリ書込み手段と、
    前記送信された詳細ログ出力要請を受信する第2の受信手段と、
    前記詳細ログ出力要請が受信された場合に、予め定められた量の前記第2のモジュールのログ情報を前記メモリから抽出する抽出手段と、
    前記抽出されたログ情報を出力する出力手段と
    を含む
    ことを特徴とする計算機システム。
  5. 各種処理を実行するモジュール及びメモリを有する計算機において、
    前記モジュールは、
    前記モジュールによって実行された処理に応じた当該モジュールのログ情報を生成するログ情報生成手段と、
    前記生成されたログ情報を前記メモリに書き込むメモリ書込み手段と、
    外部からの詳細ログ出力要請を受信する受信手段と、
    前記詳細ログ出力要請が受信された場合に、予め定められた量の前記ログ情報を前記メモリから抽出する抽出手段と、
    前記抽出されたログ情報を出力する出力手段と
    を含む
    ことを特徴とする計算機。
JP2008116147A 2008-04-25 2008-04-25 計算機システム及び計算機 Pending JP2009266031A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008116147A JP2009266031A (ja) 2008-04-25 2008-04-25 計算機システム及び計算機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008116147A JP2009266031A (ja) 2008-04-25 2008-04-25 計算機システム及び計算機

Publications (1)

Publication Number Publication Date
JP2009266031A true JP2009266031A (ja) 2009-11-12

Family

ID=41391786

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008116147A Pending JP2009266031A (ja) 2008-04-25 2008-04-25 計算機システム及び計算機

Country Status (1)

Country Link
JP (1) JP2009266031A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113354A (ja) * 2009-11-27 2011-06-09 Nec Corp ログ出力装置、ログ出力方法、ログ出力用プログラム
JP2013003950A (ja) * 2011-06-20 2013-01-07 Nippon Telegr & Teleph Corp <Ntt> 分散処理システム、ログ収集サーバ、ログ収集方法、プログラム
WO2017208377A1 (ja) * 2016-06-01 2017-12-07 三菱電機株式会社 ログデータ取得装置およびログデータ取得方法
JP2019133308A (ja) * 2018-01-30 2019-08-08 京セラドキュメントソリューションズ株式会社 電子機器およびログ取得システム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573366A (ja) * 1991-09-12 1993-03-26 Nec Corp 異常トレースデータの検出及び編集出力方式
JPH06266686A (ja) * 1993-03-11 1994-09-22 Hitachi Ltd プログラムの保守情報取得方法
JPH11288408A (ja) * 1998-02-05 1999-10-19 Hitachi Ltd 分散処理システムおよび障害解析情報の保存方法
JP2002078200A (ja) * 2000-08-22 2002-03-15 Toshiba Corp 監視制御装置及び記憶媒体
JP2006058938A (ja) * 2004-08-17 2006-03-02 Hitachi Ltd ポリシルール管理支援方法およびポリシルール管理支援装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573366A (ja) * 1991-09-12 1993-03-26 Nec Corp 異常トレースデータの検出及び編集出力方式
JPH06266686A (ja) * 1993-03-11 1994-09-22 Hitachi Ltd プログラムの保守情報取得方法
JPH11288408A (ja) * 1998-02-05 1999-10-19 Hitachi Ltd 分散処理システムおよび障害解析情報の保存方法
JP2002078200A (ja) * 2000-08-22 2002-03-15 Toshiba Corp 監視制御装置及び記憶媒体
JP2006058938A (ja) * 2004-08-17 2006-03-02 Hitachi Ltd ポリシルール管理支援方法およびポリシルール管理支援装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113354A (ja) * 2009-11-27 2011-06-09 Nec Corp ログ出力装置、ログ出力方法、ログ出力用プログラム
JP2013003950A (ja) * 2011-06-20 2013-01-07 Nippon Telegr & Teleph Corp <Ntt> 分散処理システム、ログ収集サーバ、ログ収集方法、プログラム
WO2017208377A1 (ja) * 2016-06-01 2017-12-07 三菱電機株式会社 ログデータ取得装置およびログデータ取得方法
JPWO2017208377A1 (ja) * 2016-06-01 2018-08-09 三菱電機株式会社 ログデータ取得装置およびログデータ取得方法
JP2019133308A (ja) * 2018-01-30 2019-08-08 京セラドキュメントソリューションズ株式会社 電子機器およびログ取得システム

Similar Documents

Publication Publication Date Title
US7805630B2 (en) Detection and mitigation of disk failures
US7856575B2 (en) Collaborative troubleshooting computer systems using fault tree analysis
US9645815B2 (en) Dynamically recommending changes to an association between an operating system image and an update group
US7721158B2 (en) Customization conflict detection and resolution
EP3616066B1 (en) Human-readable, language-independent stack trace summary generation
US7711991B2 (en) Error monitoring of partitions in a computer system using partition status indicators
US20140006768A1 (en) Selectively allowing changes to a system
US9256489B2 (en) Synchronized debug information generation
US7783742B2 (en) Dynamic process recovery in a distributed environment
JP2008090504A (ja) コンピュータ保守支援システム及び解析サーバ
JP2009266031A (ja) 計算機システム及び計算機
US20150286548A1 (en) Information processing device and method
JP2009009448A (ja) データ送信装置及びデータ送信方法及びプログラム
JP6531601B2 (ja) 診断プログラム、診断方法および診断装置
JP5023086B2 (ja) 計算機システム
CN110674622B (zh) 可视化图表生成方法、系统、存储介质及电子设备
JP2006172427A (ja) 検査指示書生成システム、検査指示書生成装置、検査指示書生成方法、検査指示書生成プログラム、および記録媒体
JP2010003132A (ja) 情報処理装置、その入出力装置の故障検出方法及びプログラム
JP2007323380A (ja) メモリ管理装置及びメモリ管理方法及びプログラム
JP2021069009A (ja) 情報処理システム、情報処理システムの制御方法、情報処理装置、及びプログラム
US20230236953A1 (en) Dynamic debug log enabler for any protection failure jobs
US8756574B2 (en) Using reverse time for coverage analysis
JP6828692B2 (ja) 支援装置、支援方法およびプログラム
US20220311760A1 (en) Monitoring apparatus, control method thereof, storage medium, and image processing apparatus
JP2008287512A (ja) 計算機及び分散データ処理システム及びデータ処理方法及びプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100409

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101005