JP6780498B2 - 情報処理装置、情報処理装置の制御方法およびプログラム - Google Patents

情報処理装置、情報処理装置の制御方法およびプログラム Download PDF

Info

Publication number
JP6780498B2
JP6780498B2 JP2016255844A JP2016255844A JP6780498B2 JP 6780498 B2 JP6780498 B2 JP 6780498B2 JP 2016255844 A JP2016255844 A JP 2016255844A JP 2016255844 A JP2016255844 A JP 2016255844A JP 6780498 B2 JP6780498 B2 JP 6780498B2
Authority
JP
Japan
Prior art keywords
log
identification information
information
time
nodes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016255844A
Other languages
English (en)
Other versions
JP2018106638A (ja
Inventor
晴貴 山梨
晴貴 山梨
浩司 中園
浩司 中園
沙綾子 近藤
沙綾子 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2016255844A priority Critical patent/JP6780498B2/ja
Priority to US15/824,203 priority patent/US20180183690A1/en
Priority to DE102017221554.2A priority patent/DE102017221554A1/de
Publication of JP2018106638A publication Critical patent/JP2018106638A/ja
Application granted granted Critical
Publication of JP6780498B2 publication Critical patent/JP6780498B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/04Processing captured monitoring data, e.g. for logfile generation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/069Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/04Network management architectures or arrangements
    • H04L41/046Network management architectures or arrangements comprising network management agents or mobile agents therefor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network

Description

本件開示の技術は、情報処理システム内の障害に関するログを収集する情報処理装置、情報処理装置の制御方法およびプログラムに関する。
コンピュータなどのノードが互いに接続されている情報処理システムにおいて、複数のノードが連携して行う一連の処理に障害が発生したときに各ノードから動作に関するログが収集される。このような情報処理システムにおいて収集したログに基づく障害の評価の精度を高めるための技術が提案されている(特許文献1)。また、発生した障害の要因を過去に収集したログに基づいて推定する技術も提案されている(特許文献2)。
特開2010−117757号公報 特開2009−252006号公報
しかしながら、上記の技術を用いても、各ノードから収集したログを解析して障害に関連するログを特定する場合、障害とは関連のないログも収集される可能性がある。この場合、システムに設けられたログを格納するための記憶領域が圧迫される可能性がある。また、過去に収集したログに基づいて障害の要因を推定する場合も、あらかじめログを収集しないと障害を推定できないため、過去に発生した障害のログと現在発生している障害のログとが収集されることになる。すなわち、障害の推定のために、実質的に複数の障害のログが収集される。また、あらかじめ収集したログと関連した障害が発生する保証はないため、収集したログが障害の推定に使用されない可能性もある。
本件開示の技術は、上記の事情に鑑み、複数のノードによって実行される処理において発生する障害を解析するためのログを効率よく収集することが可能な情報処理装置を提供することを目的とする。
本件開示の技術の一側面によれば、情報処理装置は、複数のノードによって実行される処理に関するログを取得する情報処理装置であって、処理を示す識別情報を受信する受信部と、複数のノードから、受信した識別情報によって示される処理を実行した時刻と受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得する情報取得部と、複数のノードから、識別情報によって示される処理を実行した時刻と識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、識別情報によって示される処理とは異なる処理に関するログを取得するログ取得部とを有する。
本件開示の技術によれば、複数のノードによって実行される処理において発生する障害を解析するためのログを効率よく収集することが可能な情報処理装置を提供することができる。
図1は、一実施形態に係る情報処理システムの構成を例示する概略構成図である。 図2は、一実施形態に係る情報処理装置の構成を例示する概略構成図である。 図3は、一実施形態に係る情報処理システムにおいて出力されるログの一例を示す図である。 図4は、一実施形態に係る管理サーバが記憶するサーバ管理テーブルの一例を模式的に示す図である。 図5は、一実施形態に係る管理サーバが記憶するログ受信状況管理テーブルの一例を模式的に示す図である。 図6は、一実施形態に係るサーバsv−1が記憶するログ管理テーブルの一例を模式的に示す図である。 図7は、一実施形態に係るサーバsv−2が記憶するログ管理テーブルの一例を模式的に示す図である。 図8は、一実施形態に係るサーバsv−3が記憶するログ管理テーブルの一例を模式的に示す図である。 図9は、一実施形態に係るサーバsv−4が記憶するログ管理テーブルの一例を模式的に示す図である。 図10は、一実施形態に係る管理サーバが記憶するログ管理テーブルの一例を模式的に示す図である。 図11は、一実施形態に係るサーバが実行するエラーのログを検出する処理のフローチャートである。 図12は、一実施形態に係る管理サーバが実行するエラーのログに関する情報を記憶する処理のフローチャートである。 図13は、一実施形態に係る管理サーバが実行するエラーのログを取得および記憶する処理のフローチャートである。 図14は、一実施形態に係るサーバが実行するエラーのログを送信する処理のフローチャートである。 図15は、一実施形態に係る管理サーバが実行する所定の時間帯に出力されたログを取得および記憶する処理のフローチャートである。 図16は、一実施形態に係る管理サーバが図15の処理に続いて実行する処理のフローチャートである。 図17は、一実施形態に係るサーバが実行するエラーのログのリクエストIDを送信する処理のフローチャートである。 図18は、一実施形態に係る一事例を模式的に示す図である。 図19は、一実施形態に係る管理サーバが実行するエラーに関連するリソースのログを取得および記憶する処理のフローチャートである。 図20は、一実施形態に係る管理サーバが図19の処理に続いて実行する処理のフローチャートである。 図21は、一実施形態に係る図18に示す事例とは別の一事例を模式的に示す図である。
以下、本件開示の技術に係る実施形態について図面を参照しながら説明する。なお、以下の詳細な説明は例示的なものであり、実施形態の構成を限定するものではない。
図1に、一実施形態における情報処理システム1の概略構成の一例を示す。情報処理システム1は、管理サーバ2、サーバ3、4、ネットワーク5を有する。管理サーバ2、サーバ3、4は、ネットワーク5を経由して互いに接続されている。ネットワーク5は、有線あるいは無線の通信ネットワークである。また、情報処理システム1は、ネットワーク
5を経由してクライアント端末6と接続されている。なお、情報処理システム1内の各サーバがノードの一例である。
管理サーバ2、サーバ3、4は、それぞれデータベース21、31、41を有する。本実施形態において、管理サーバ2、サーバ3、4は、自サーバ内で出力される各種ログをデータベース21、31、41に記憶する。なお、管理サーバ2、サーバ3、4、ネットワーク5、クライアント端末6の数は、図1に示す数に限られない。
図2に、管理サーバ2の概略構成の一例を示す。管理サーバ2は、Central Processing
Unit(CPU)201、Random Access Memory(RAM)202、Hard Disk Drive(HDD)203、Graphics Processing Unit(GPU)204、入力インタフェース205、通信インタフェース206を有する。なお、HDD203は、データベース21としての役割を果たす。また、GPU204、入力インタフェース205、通信インタフェース206は、モニタ207、入力装置208、ネットワーク5にそれぞれ接続されている。CPU201、RAM202、HDD203、GPU204、入力インタフェース205、通信インタフェース206は、バス209を介して互いに接続されている。
本実施形態において、CPU201は、HDD203に記憶されている各種プログラムをRAM202に展開して実行することで、以下に説明する種々の処理を実行する。
本実施形態においては、一例として、クライアント端末6が情報処理システム1内のサーバに対して処理を指示した場合に、クライアント端末6からの指示を受けたサーバは、当該指示に基づいて実行する一連の処理に対して他の処理から識別可能となる一意なリクエストIDを付与する。リクエストIDの一例としてはUniversally Unique Identifier
(UUID)が挙げられる。情報処理システム1内の各サーバは、当該一連の処理についての要求や応答などを送受信する際に、付与されたリクエストIDを引き継ぐ。例えば、クラウド管理ソフトウェアであるOPENSTACK(登録商標)では、情報処理システム内において、インスタンスの作成後にネットワークを構築するときに、ネットワークの構築に関連する一連の処理に同じリクエストIDが付与される。例えば、情報処理システム内にノードA、B、Cがあり、ノードAがクライアント端末からインスタンスの作成指示を受けた場合、ノードAがノードBにネットワーク構築処理を依頼する。さらにノードBがノードCにネットワーク作成処理を依頼する。そして、これらの処理には同じリクエストIDが付与される。
また、本実施形態においては、情報処理システム1内の各リソースにはリソースIDが割り当てられているものとする。リソースIDの一例としてはUUIDが挙げられる。例えば、OPENSTACKの場合、情報処理システム内のサーバやディスクなど、クラウド上の各リソースにリソースIDが割り当てられている。例えば、情報処理システム内に管理サーバ、サーバA、サーバAに接続されたディスクがある場合に、管理サーバがクライアント端末からディスクの取り外し依頼を受けたとする。このとき、管理サーバがクライアント端末から受けるディスク取り外し依頼、管理サーバがサーバAに対して行うディスク取り外し処理依頼、サーバAがディスクに対して行うディスク取り外し処理に関する各ログが生成される。そして、各ログには、サーバA、ディスクの各リソースIDが出力される。
図3に、情報処理システム1において、ある一連の処理について生成されたログの一部を例示する。図3に示すように、ログには、付与されたリクエストIDおよび処理に関連するリソースのリソースIDが含まれる。リクエストIDは、西暦や日時に基づいて情報処理システム内で実行される処理が一意に特定できるUUIDとして生成される。また、リソースIDは、情報処理システム内のリソースが一意に特定できるUUIDとして生成
される。また、以下の説明において、ログとは、ログの内容を示すメッセージ(図3の場合は「Starting instance ...」)、ログの出力日時、リクエストID、リソースIDな
どの情報が組になったものを指す。したがって、1つのログによって、ログの内容、ログが出力された日時、当該ログに対応する一連の処理のリクエストID、当該処理に係るリソースのリソースIDがわかる。
図4に、管理サーバ2のデータベース21に記憶されるサーバ管理テーブルの一例を示す。本実施形態においては、情報処理システム1内の各サーバにはそれぞれ異なるIPアドレスが割り当てられる。図4に示すサーバ管理テーブルの「server」欄には、情報処理システム1内の各サーバが記憶され、「ip」欄には、各サーバに割り当てられているIPアドレスが記憶される。本実施形態において、管理サーバ2は、サーバ管理テーブルに記憶されているIPアドレスを使用して、情報処理システム内の各サーバに対するログの要求などの処理を実行する。なお、図4の例では、情報処理システム1内に7つのサーバがあり、各サーバの名称はそれぞれsv−1〜sv−7である。
図5に、管理サーバ2のデータベース21に記憶されるログ受信状況管理テーブルの一例を示す。本実施形態においては、管理サーバ2は、情報処理システム1内のサーバからのログの受信状況に関連する情報をログ受信状況管理テーブルに記憶する。テーブルのエントリはリクエストIDに対応し、各エントリは一例として「request_id」欄、「time」欄、「status」欄の各情報を有する。図5に示すログ受信状況管理テーブルの「request_id」欄には、情報処理システム1内で実行される処理に付与されたリクエストIDが記憶される。また、「time」欄には、エラーのログが出力された時刻が記憶される。また、「status」欄には、ログの受信状況を示すステータスが記憶される。本実施形態においてログの受信状況は、以下に説明する「step1」、「step2」、「completed」である。管理サーバ2は、ログ受信状況管理テーブルに記憶されている情報を使用して、各リクエストIDに対するログ受信処理を実行する。
図6〜9に、情報処理システム1内の各サーバのデータベースに記憶されるログ管理テーブルの一例を示す。なお、ここでは一例として、情報処理システム1の4つのサーバsv−1、sv−2、sv−3、sv−4がログ管理テーブルに記憶する情報をそれぞれ図6〜9に示す。図6〜9のログ管理テーブルの「request_id」欄には、ログ受信状況管理テーブルと同様、情報処理システム1内で実行される処理に付与されたリクエストIDが記憶される。また、「log_time」欄には、ログが出力された時刻が記憶される。また、「resource_id」欄には、リクエストIDが示す一連の処理に関連するリソースのリソースIDが1つあるいは複数記憶される。また、「message」欄には、出力されるログのメッセージの内容が記憶される。
図10に、管理サーバ2のデータベース21に記憶されるログ管理テーブルの一例を示す。本実施形態において、管理サーバ2は、情報処理システム1内の各サーバからログを受信し、受信したログに含まれる各種情報をログ管理テーブルに記憶する。図10のログ管理テーブルの「id」欄には、各ログを識別するための識別番号が記憶される。「id」欄に記憶される識別番号は、管理サーバ2によって各ログに割り当てられる。また、「server」欄、「request_id」欄、「log_time」欄、「resource_id」欄、「message」欄に記憶される情報は、それぞれ上記で説明した欄と同じである。
以下に、本実施形態における管理サーバ2およびサーバ3、4が実行する処理についてフローチャートを参照しながら説明する。図11に、サーバ3、4のCPUが実行する処理のフローチャートの一例を示す。サーバ3、4は、一例として、電源が投入されると、
エージェントを起動して図11に示すフローチャートの処理を開始する。OP101において、サーバ3、4で起動されたエージェントは、あらかじめ指定された文字列をキーワードとして、自サーバ内で生成されたログのいずれかのログを検索する。当該文字列の一例として、「error」、「warning」、「failure」などエラーのログに含まれる可能性がある文字列が挙げられる。
次いで、OP102において、エージェントは、OP101においてログ内で指定された文字列を検出したか否かを判定する。ログにキーワードである文字列が含まれる場合は(OP102:Yes)、エージェントは、処理をOP103に進める。ログにキーワードである文字列が含まれない場合は(OP102:No)、エージェントは、処理をOP101に戻し、文字列の検索を実行していないログに対して文字列の検索を行う。
OP103では、エージェントは、キーワードの文字列を含むログに対応する処理のリクエストIDを管理サーバ2に送信する。エージェントは、OP103の処理を完了すると、処理をOP101に戻し、文字列の検索を実行していないログに対して文字列の検索を行う。
図12に、管理サーバ2のCPU201が実行する処理のフローチャートの一例を示す。管理サーバ2は、一例として、電源投入されると、図12に示すフローチャートの処理を開始する。OP201において、CPU201は、受信部として機能し、サーバ3または4から、上記のOP103において送信されたリクエストIDを受信する。次いで、CPU201は、処理をOP202に進める。
OP202において、CPU201は、受信したリクエストIDがログ受信状況管理テーブルに記憶されているか否かを判定する。受信したリクエストIDがログ受信状況管理テーブルに記憶されている場合は(OP202:Yes)、CPU201は、処理をOP201に戻し、サーバ3または4から新たなリクエストIDを受信する。また、受信したリクエストIDがログ受信状況管理テーブルに記憶されていない場合は(OP202:No)、CPU201は処理をOP203に進める。
OP203において、CPU201は、受信したリクエストIDと現在時刻をログ受信状況管理テーブルに記憶する。CPU201は、OP203の処理を完了すると、処理をOP201に戻し、サーバ3または4から新たなリクエストIDを受信する。本実施形態では、管理サーバ2は、上記の処理を実行することで、情報処理システム1において実行される一連の処理において障害が発生した場合に、リクエストIDなどの障害が発生した処理に関する情報を取得することができる。
図13に、管理サーバ2のCPU201が実行する処理のフローチャートの一例を示す。管理サーバ2は、図12に示す処理とは別に図13に示す処理を実行する。管理サーバ2は、図12に示す処理と図13に示す処理とを並行して実行してもよい。
OP301において、CPU201は、ログ受信状況管理テーブルにおいて「status」欄が空であるエントリを検索する。ここで「status」欄が空であるとは、管理サーバ2が、図12における処理によって障害が発生した処理のリクエストIDは取得したが、当該リクエストIDに対応するログなどその他の情報は取得していないことを意味する。次いで、OP302において、CPU201は、上記の検索の結果から、ログ受信状況管理テーブルにおいて「status」欄が空であるエントリが存在するか否かを判定する。「status」欄が空であるエントリが存在する場合は(OP302:Yes)、CPU201は処理をOP304に進める。一方、「status」欄が空であるエントリが存在しない場合は(OP302:No)、CPU201は処理をOP303に
進める。
OP303において、CPU201は、一定時間待機してから処理をOP301に戻す。例えば、サーバ3、4が図11の処理によって管理サーバ2に送信したリクエストIDの処理が、システムタイムアウトによるリトライ処理などである場合、サーバ3、4は、当該処理を実行する度にエラーとしてログに記憶する。このため、管理サーバ2はOP201において、サーバ3、4から当該エラーが原因で同じリクエストIDを繰り返し受信する可能性がある。そこで、本実施形態では、CPU201が一定時間待機してからOP301を実行することで、管理サーバ2がサーバ3、4からシステムタイムアウトによるリトライ処理などが原因でOP201において同じリクエストIDを繰り返し受信する可能性を抑える。ここで、一定時間の一例としては、情報処理システム1内の各サーバ3、4のシステムタイムアウト時間より長い時間が挙げられる。
OP304において、CPU201は、OP302において「status」欄が空であると判定されたリクエストIDに対応するログを管理サーバ2に送信するようサーバ3、4に要求する。本実施形態では、一例として、管理サーバ2は当該要求をマルチキャストで情報処理システム1内のサーバに送信する。ただし、管理サーバ2がサーバ管理テーブルに記憶されている情報を用いて特定のサーバに当該要求を送信してもよい。
ここで、OP304において管理サーバ2からログの送信要求を受信したサーバ3、4のエージェントによって実行される処理について、図14を参照しながら説明する。OP401において、サーバ3、4のエージェントは、OP304において管理サーバ2から送信されたログの送信要求を受信する。OP402において、サーバ3、4のエージェントは、それぞれデータベース301、401を検索して要求のあったリクエストIDに対応するログが存在するか否かを判定する。当該ログが存在する場合は(OP402:Yes)、サーバ3、4のエージェントは処理をOP403に進める。当該ログが存在しない場合は(OP402:No)、サーバ3、4のエージェントは処理をOP401に戻し、管理サーバ2から新たなログの送信要求を受信するまで待機する。OP403では、サーバ3、4のエージェントは、OP402において存在すると判定したログをデータベース301、401から取得し、管理サーバ2に送信する。
図13に戻り、管理サーバ2のCPU201は、情報取得部として機能して、サーバ3、4からOP304において要求したログを受信すると(OP305)、CPU201は処理をOP306に進める。OP306において、CPU201は、受信したログに含まれるメッセージからハッシュ値を生成し、生成されたハッシュ値を受信したログのログIDとする。次いで、OP307において、CPU201は、OP305において受信したログに含まれる情報とOP306において生成したログIDとをログ管理テーブルに記憶する。図10に示すログ管理テーブルの例の場合、CPU201は、OP305において受信したログに含まれる情報を「server」欄、「request_id」欄、「log_time」欄、「resource_id」欄、「message」欄にそれぞれ記憶する。また、CPU201は、OP306において生成したログIDを「id」欄に記憶する。なお、OP307において、CPU201は、ログ管理テーブルに既に同じログIDのエントリが記憶されている場合は、上記の記憶処理をスキップして処理をOP308に進める。
さらに、OP308において、CPU201は、ログ受信状況管理テーブルのエントリのうち、OP302で「status」欄が空であると判定されたリクエストIDに対応するエントリの「status」欄を空の状態から「step1」に変更する。ここで、「step1」は、管理サーバ2が、図11、12の処理で受信したリクエストID、すなわち障害が発生した処理のリクエストIDに関連するログを情報処理システム1内のサ
ーバから取得したことを意味する。
次に、図15、16に、管理サーバ2のCPU201が実行する処理のフローチャートの一例を示す。管理サーバ2は、図12、13に示す処理とは別に図15、16に示す処理を実行する。管理サーバ2は、図12、13、15、16に示す処理を並行して実行してもよい。
OP501において、CPU201は、ログ受信状況管理テーブルにおいて「status」欄が「step1」であるエントリを検索する。次いで、OP502において、CPU201は、ログ受信状況管理テーブルの「status」欄が「step1」であるエントリが存在するか否かを判定する。「status」欄が「step1」であるエントリが存在する場合は(OP502:Yes)、CPU201は処理をOP503に進める。一方、「status」欄が「step1」であるエントリが存在しない場合は(OP502:No)、CPU201は処理をOP501に戻す。
OP503において、CPU201は、ログ管理テーブルを検索し、OP502で「status」欄が「step1」であると判定されたリクエストIDに対応するログを特定する。次いで、OP504において、CPU201は、OP503で特定したログの情報から、当該ログの出力開始時刻とエラーのログが出力された時刻を特定する。ここで、ログの出力開始時刻とは、OP503において特定されたログの出力時刻、すなわちログ管理テーブルの「log_time」欄の時刻のうち最先の時刻を指す。なお、ログの出力開始時刻は、「log_time」欄の時刻のうち最先の時刻に限らず、最先の時刻付近の区切りのよい時刻など(10分単位の時刻など)が採用されてもよい。また、エラーのログが出力された時刻とは、ログ管理テーブル「message」欄にOP101においてサーバ3、4がエラーのログの検索に使用する文字列を含むログの「log_time」欄の時刻を指す。
さらに、OP504において、CPU201は、特定したログの出力開始時刻からエラーのログが出力された時刻までの時間帯を特定する。例えば、ログ管理テーブルに記憶されている情報が図10に示す場合に、リクエストIDが「req−01」に対応するログの出力開始時刻とエラーのログが出力された時刻を特定すると想定する。また、一例として「id」欄が「05」であるログがエラーのログであると想定する。この場合、リクエストIDが「req−01」に対応するログのうち、「log_time」欄の時刻で最先の時刻は、「id」欄が「01」であるログの時刻「12:00」である。したがって、ログの出力開始時刻は「12:00」となる。また、「id」欄が「05」であるログの「log_time」欄の時刻は「12:03」である。したがって、エラーのログが出力された時刻は「12:03」である。この結果、12:00〜12:03の時間帯が、OP504において特定される時間帯となる。
次いで、OP505において、CPU201は、OP504において特定した時間帯に出力されたログのうち、当該時間帯の特定に用いたログのリクエストID以外のリクエストIDに対応するログを管理サーバ2に送信するようサーバ3、4に要求する。サーバ3、4のエージェントは、図17に示すフローチャートの処理を実行する。ここでは、サーバ3、4のエージェントは、管理サーバ2からOP504において特定された時間帯のログの要求を受信し(OP601)、要求された時間帯に出力されているログが存在するか否か判定する(OP602)。そして、要求された時間帯に出力されているログが存在する場合は、サーバ3、4のエージェントは、当該ログに対応するリクエストIDを管理サーバ2に送信する(OP603)。
そして、管理サーバ2のCPU201は、図16に示すフローチャートに従いサーバ3
、4からOP505において要求したログのリクエストIDを受信すると(OP506)、処理をOP507に進める。OP507において、CPU201は、受信したリクエストIDに対応するログを管理サーバ2に送信するようサーバ3、4に要求する。サーバ3、4のエージェントは、図14に示すフローチャートの処理と同様の処理を実行する。ここでは、サーバ3、4のエージェントは、管理サーバ2からリクエストIDに対応するログの要求を受信し(OP401)、要求されたリクエストIDに対応するログが存在するか否か判定する(OP402)。そして、要求されたリクエストIDに対応するログが存在する場合は、サーバ3、4のエージェントは、当該ログを管理サーバ2に送信する(OP403)。
ここで、図16に戻り、管理サーバ2のCPU201は、ログ取得部として機能して、サーバ3、4からOP507において要求したログを受信すると(OP508)、CPU201は処理をOP509に進める。OP509において、CPU201は、受信したログに含まれるメッセージからハッシュ値を生成し、生成されたハッシュ値を受信したログのログIDとする。次いで、OP510において、CPU201は、OP307と同様、OP508において受信したログに含まれる情報とOP509において生成したログIDとをログ管理テーブルに記憶する。
さらに、CPU201は、OP511において、ログ受信状況管理テーブルにおいて、OP502で「status」欄が「step1」であると判定されたリクエストIDの「status」欄を「step1」から「step2」に変更する。ここで、「step2」は、管理サーバ2が、OP504において特定された時間帯に出力されたログを情報処理システム1内のサーバから取得したことを意味する。そして、OP512において、CPU201は、OP510においてログ管理テーブルに記憶したログの情報をモニタ207に表示する。
図18に、本実施形態において図15〜17に示す処理を実行する場合に管理サーバ2によってログが取得される一事例を示す。図18に示す例では、情報処理システム1内にサーバA 801、サーバB 802、データベース803(残り容量:10GB)、管理サーバ2(図示せず)がある。このとき、ユーザAがクライアント端末を操作して、サーバA 801に対してデータベース803の残り容量のうち4GBのディスク使用申請を行う。また、ユーザBがクライアント端末を操作して、サーバB 802に対してデータベース803の残り容量のうち8GBのディスク使用申請を行う。ここで、ユーザAは、ユーザBよりも早くディスク使用申請を行ったとする。
サーバA 801は、ユーザAのディスク使用申請を受信して、時刻10:00にディスク容量確認を行う。そして、サーバA 801はディスク容量確認処理のログを出力する。一方、サーバB 802は、ユーザBのディスク使用申請を受信して、時刻10:01にディスク容量確認を行う。サーバB 802はディスク容量確認処理のログを出力する。
ここで、サーバB 802が、サーバA 801よりも早く時刻10:03にデータベース803のディスク使用処理を行ったとする。このとき、データベース803の残り容量は10GBであるため、ユーザBによる8GBのディスク使用申請に基づくディスク使用処理は正常に完了する。そして、サーバB 802は、当該ディスク使用処理のログを出力および記憶する。一方、時刻10:04におけるサーバA 801による4GBのディスク使用処理は、データベース803の残り容量が2GBであるためエラーとなり、サーバAは当該エラーのログを出力および記憶する。
図18の事例では、サーバA 801によるディスク容量確認処理とディスク使用処理
には同じリクエストIDが付与され、同様にサーバB 802によるディスク容量確認処理とディスク使用処理には同じリクエストIDが付与される。そして、上記の図15〜17の処理によれば、管理サーバ2は、サーバA 801から、時刻10:04にサーバA
801が出力したエラーのログと時刻10:00にサーバA 801が出力したディスク容量確認処理のログを取得する。さらに、管理サーバ2は、サーバB802から、10:00〜10:04の時間帯に出力されたディスク容量確認処理のログ(時刻10:01に出力)とディスク使用処理のログ(時刻10:03)を取得する。このように、本実施形態において図18の事例では、サーバA 801による一連の処理において発生した障害について、当該処理と同じ時間帯に他のサーバB 802が実行していた処理に関するログを取得することができる。すなわち、管理サーバ2は、あるサーバで発生した障害と関連がある可能性が高いログ(関連ログ)を他のサーバから取得することができる。
次に、図19、20に、管理サーバ2のCPU201が実行する処理のフローチャートの一例を示す。管理サーバ2は、図12、13、15、16に示す処理とは別に図19、20に示す処理を実行する。管理サーバ2は、図12、13、15、16、19、20に示す処理を並行して実行してもよい。
OP701において、CPU201は、ログ受信状況管理テーブルにおいて「status」欄が「step2」であるエントリを検索する。次いで、OP702において、CPU201は、ログ受信状況管理テーブルの「status」欄が「step2」であるエントリが存在するか否かを判定する。「status」欄が「step2」であるエントリが存在する場合は(OP702:Yes)、CPU201は処理をOP703に進める。一方、「status」欄が「step2」であるエントリが存在しない場合は(OP702:No)、CPU201は処理をOP701に戻す。
OP703において、CPU201は、ログ管理テーブルを検索し、OP702で「status」欄が「step2」であると判定されたリクエストIDに対応するログを特定する。次いで、OP704において、CPU201は、OP703で特定したログに含まれるリソースIDを特定する。本実施形態では、OP704で特定されるリソースIDに対応するリソースを、OP703で特定されるログに対応するリクエストIDが示す処理に関係があるリソースであるとみなすことができる。
次いで、OP705において、CPU201は、OP704において特定したリソースIDを含むログをサーバ3、4に要求する。サーバ3、4のエージェントは、図14に示すフローチャートの処理と同様の処理を実行する。ここでは、サーバ3、4のエージェントは、管理サーバ2からOP704において特定されたリソースIDを含むログの要求を受信し(OP401)、要求されたリソースIDを含むログが存在するか否か判定する(OP402)。そして、要求されたリソースIDを含むログが存在する場合は、サーバ3、4のエージェントは、当該ログを管理サーバ2に送信する(OP403)。
そして、管理サーバ2のCPU201は、ログ取得部として機能して、サーバ3、4からOP705において要求したログを受信すると(OP706)、CPU201は処理をOP707に進める。OP707において、CPU201は、受信したログに含まれるメッセージからハッシュ値を生成し、生成されたハッシュ値を受信したログのログIDとする。次いで、OP708において、CPU201は、OP307と同様、OP706において受信したログに含まれる情報とOP707において生成したログIDとをログ管理テーブルに記憶する。
さらに、CPU201は、OP709において、ログ受信状況管理テーブルにおいて、OP702で「status」欄が「step2」であると判定されたリクエストIDに
対応するエントリの「status」欄を「step2」から「completed」に変更する。ここで、「completed」は、管理サーバ2が、情報処理システム1で発生した特定の障害に関連するログを情報処理システム1内のサーバから取得したことを意味する。次いで、OP710において、CPU201は、OP708においてログ管理テーブルに記憶したログの情報をモニタ207に表示する。
図21に、本実施形態において図14、19、20に示す処理を実行する場合に管理サーバ2によってログが取得される一事例を示す。図21に示す例では、情報処理システム1内にサーバ901、ディスク902、管理サーバ2がある。また、サーバ901、ディスク902、管理サーバ2がリソースの一例であり、サーバ901、ディスク902、管理サーバ2にはそれぞれリソースIDが付与されている。
まず、ユーザAが、時刻10:00にディスク902をサーバ901から取り外す依頼を行う。しかし、当該依頼処理が正常に完了せず、ディスク902はサーバ901から取り外されなかったとする。さらに、ユーザAは、ディスク902を使用する予定がないため、ディスク902がサーバ901から取り外されていない状態を放置し、管理サーバ2のシステム管理者にその状態を報告しなかったとする。ここでは、サーバ901が、ディスク902の取り外し状態を含む利用状況を管理するディスク利用管理テーブルを保持していると想定する。そして、上記の例では、サーバ901からのディスク902の取り外しには失敗しているが、ディスク利用管理テーブルではディスク902がサーバ901から取り外されたとして記憶されると想定する。
上記の状況において、ユーザBが、サーバ901のディスク管理テーブルでディスク902が取り外されていることを確認し、時刻12:00にサーバ901にディスク902の追加を依頼する。しかし、ディスク902はサーバ901から取り外されていないため、サーバ901は、ユーザBのディスク追加依頼を処理する際に、「ディスク902は既にサーバ901追加されている」旨を示すエラーをログとして出力する。なお、ユーザBは、時刻12:00以前にサーバ901に対する処理は行っていないとする。
この事例において、上記の図14、19、20の処理によれば、管理サーバ2は、サーバ901から、「ディスク902は既にサーバ901追加されている」旨を示すエラーのログを取得する。さらに、管理サーバ2は、サーバ901から、ディスク902のリソースIDを含むログ、すなわちユーザAによるディスク取り外し依頼のログを取得する。このように、本実施形態において図21の事例では、サーバ901において発生した障害について、当該処理に係るリソースに関連するログを取得することができる。すなわち、管理サーバ2は、ある障害に係るリソースと関連する他のログ(関連ログ)を取得することができる。
以上が本実施形態に関する説明であるが、上記のサーバなどの構成や処理は、上記の実施形態に限定されるものではなく、本発明の技術的思想と同一性を失わない範囲内において種々の変更が可能である。例えば、上記の実施形態においては、管理サーバ2、サーバ3、4は、図13、14に示す処理の後に、図15〜17に示す処理を実行し、さらに図14、19、20に示す処理を実行することを想定している。しかし、管理サーバ2、サーバ3、4は、図15〜17に示す処理を実行した後に、図14、19、20に示す処理を実行しなくてもよい。この場合、OP511の処理を、「status」欄を「step1」から「completed」に変更する処理とする。
また、管理サーバ2、サーバ3、4は、図13、14に示す処理の後に、図15〜17に示す処理を実行せずに、図14、19、20に示す処理を実行してもよい。この場合、OP308の処理を、「status」欄を空の状態から「step2」に変更する処理
とする。
また、上記の実施形態において、上記の少なくとも一部の処理は、CPU以外のプロセッサ、例えば、Digital Signal Processor(DSP)、Graphics Processing Unit(GPU)、数値演算プロセッサ、ベクトルプロセッサ、画像処理プロセッサ等の専用プロセッサで行われてもよい。また、上記の少なくとも一部の処理は、集積回路(IC)、その他のディジタル回路であってもよい。また、上記各部の少なくとも一部にアナログ回路が含まれてもよい。集積回路は、Large-scale Integration(LSI)、Application Specific Integrated Circuit(ASIC)、プログラマブルロジックデバイス(PLD)を含む。PLDは、例えば、Field-Programmable Gate Array(FPGA)を含む。上記各部は、
プロセッサと集積回路との組み合わせであってもよい。組み合わせは、例えば、マイクロコントローラ(MCU)、System-on-a-Chip(SoC)、システムLSI、チップセットなどと呼ばれる。
<コンピュータが読み取り可能な記録媒体>
コンピュータその他の機械、装置(以下、コンピュータ等)に上記起動制御装置の設定を行うための管理ツール、OSその他を実現させるプログラムをコンピュータ等が読み取り可能な記録媒体に記録することができる。そして、コンピュータ等に、この記録媒体のプログラムを読み込ませて実行させることにより、その機能を提供させることができる。
ここで、コンピュータ等が読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータ等から読み取ることができる記録媒体をいう。このような記録媒体のうちコンピュータ等から取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD−ROM、CD−R/W、DVD、ブルーレイディスク、DAT、8mmテープ、フラッシュメモリ等のメモリカード等がある。また、コンピュータ等に固定された記録媒体としてハードディスクやROM等がある。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
複数のノードによって実行される処理に関するログを取得する情報処理装置であって、
前記処理を示す識別情報を受信する受信部と、
前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得する情報取得部と、
前記複数のノードから、前記識別情報によって示される処理を実行した時刻と前記識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、前記識別情報によって示される処理とは異なる処理に関するログを取得するログ取得部と
を有する情報処理装置。
(付記2)
前記情報取得部はさらに、前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得し、
前記ログ取得部はさらに、前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得する
付記1に記載の情報処理装置。
(付記3)
前記情報取得部は、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得する、付記1または2に記載の情報処理装置。
(付記4)
複数のノードによって実行される処理に関するログを取得する情報処理装置であって、
前記処理を示す識別情報を受信する受信部と、
前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得する情報取得部と、
前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得するログ取得部と
を有する情報処理装置。
(付記5)
前記情報取得部は、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得する、付記4に記載の情報処理装置。
(付記6)
複数のノードによって実行される処理に関するログを取得する情報処理装置に、
前記処理を示す識別情報を受信させ、
前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得させ、
前記複数のノードから、前記識別情報によって示される処理を実行した時刻と前記識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
情報処理装置の制御方法。
(付記7)
前記情報処理装置にさらに、
前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させ
前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
付記6に記載の情報処理装置の制御方法。
(付記8)
前記情報処理装置にさらに、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得させる、付記6または7に記載の情報処理装置の制御方法。
(付記9)
複数のノードによって実行される処理に関するログを取得する情報処理装置に、
前記処理を示す識別情報を受信させ、
前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させ、
前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
情報処理装置の制御方法。
(付記10)
前記情報処理装置にさらに、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させる、付記9に記載の情報処理装置の制御方法。
(付記11)
コンピュータに、
複数のノードによって実行される処理の識別情報を受信させ、
前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得させ、
前記複数のノードから、前記識別情報によって示される処理を実行した時刻と前記識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
プログラム。
(付記12)
前記コンピュータにさらに、
前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させ
前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
プログラム。
(付記13)
前記コンピュータにさらに、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得させる、付記11または12に記載のプログラム。
(付記14)
コンピュータに、
複数のノードによって実行される処理の識別情報を受信させ、
前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させ、
前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
プログラム。
(付記15)
前記コンピュータにさらに、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させる、付記14に記載のプログラム。
1 情報処理システム
2 管理サーバ
21、31、41 データベース
3、4 サーバ

Claims (9)

  1. 複数のノードによって実行される処理に関するログを取得する情報処理装置であって、
    前記処理を示す識別情報を受信する受信部と、
    前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得する情報取得部と、
    前記複数のノードから、前記識別情報によって示される処理を実行した時刻と前記識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、前記識別情報によって示される処理とは異なる処理に関するログを取得するログ取得部と
    を有する情報処理装置。
  2. 前記情報取得部はさらに、前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得し、
    前記ログ取得部はさらに、前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得する
    請求項1に記載の情報処理装置。
  3. 前記情報取得部は、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得する、請求項1または2に記載の情報処理装置。
  4. 複数のノードによって実行される処理に関するログを取得する情報処理装置であって、
    前記処理を示す識別情報を受信する受信部と、
    前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得する情報取得部と、
    前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得するログ取得部と
    を有する情報処理装置。
  5. 前記情報取得部は、前記複数のノードが実行する処理のタイムアウト時間より長い時間待機した後に、前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得する、請求項4に記載の情報処理装置。
  6. 複数のノードによって実行される処理に関するログを取得する情報処理装置に、
    前記処理を示す識別情報を受信させ、
    前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得させ、
    前記複数のノードから、前記識別情報によって示される処理を実行した時刻と前記識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
    情報処理装置の制御方法。
  7. 複数のノードによって実行される処理に関するログを取得する情報処理装置に、
    前記処理を示す識別情報を受信させ、
    前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソー
    スの情報を取得させ、
    前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
    情報処理装置の制御方法。
  8. コンピュータに、
    複数のノードによって実行される処理の識別情報を受信させ、
    前記複数のノードから、前記受信した識別情報によって示される処理を実行した時刻と前記受信した識別情報によって示される処理において障害が発生した時刻とを含む情報を取得させ、
    前記複数のノードから、前記識別情報によって示される処理を実行した時刻と前記識別情報によって示される処理において障害が発生した時刻とに基づいて定まる時間帯において生成された、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
    プログラム。
  9. コンピュータに、
    複数のノードによって実行される処理の識別情報を受信させ、
    前記複数のノードから、前記受信した識別情報によって示される処理と関連するリソースの情報を取得させ、
    前記複数のノードから、前記リソースを含むログであって、前記識別情報によって示される処理とは異なる処理に関するログを取得させる
    プログラム。
JP2016255844A 2016-12-28 2016-12-28 情報処理装置、情報処理装置の制御方法およびプログラム Active JP6780498B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2016255844A JP6780498B2 (ja) 2016-12-28 2016-12-28 情報処理装置、情報処理装置の制御方法およびプログラム
US15/824,203 US20180183690A1 (en) 2016-12-28 2017-11-28 Information processing apparatus for acquiring log and method of controlling information processing apparatus therefor
DE102017221554.2A DE102017221554A1 (de) 2016-12-28 2017-11-30 Informationsverarbeitungsvorrichtung zum Erfassen eines Protokolls und ein Verfahren zum Steuern einer Informationsverarbeitungsvorrichtung davon

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016255844A JP6780498B2 (ja) 2016-12-28 2016-12-28 情報処理装置、情報処理装置の制御方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2018106638A JP2018106638A (ja) 2018-07-05
JP6780498B2 true JP6780498B2 (ja) 2020-11-04

Family

ID=62510388

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016255844A Active JP6780498B2 (ja) 2016-12-28 2016-12-28 情報処理装置、情報処理装置の制御方法およびプログラム

Country Status (3)

Country Link
US (1) US20180183690A1 (ja)
JP (1) JP6780498B2 (ja)
DE (1) DE102017221554A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7338246B2 (ja) * 2019-06-05 2023-09-05 富士通株式会社 情報処理装置、ログ参照プログラム
US11900137B2 (en) * 2022-02-15 2024-02-13 Sap Se Configurable in-application event logging service

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010939A (ja) * 1998-06-25 2000-01-14 Sony Corp 情報処理装置、情報処理システム、および、記録媒体
JP3400398B2 (ja) * 1999-12-24 2003-04-28 日本電気株式会社 ストレージ管理システム
JP4300808B2 (ja) * 2003-01-24 2009-07-22 株式会社日立製作所 統合ログ表示方法及びシステム
JP2007257180A (ja) * 2006-03-22 2007-10-04 Hitachi Ltd ネットワークノード、スイッチ及びネットワーク障害回復方法
WO2009054847A1 (en) * 2007-10-23 2009-04-30 Qualcomm Incorporated Management of failures in wireless field devices
JP4928480B2 (ja) * 2008-01-31 2012-05-09 株式会社野村総合研究所 ジョブ処理システムおよびジョブ管理方法
JP4911074B2 (ja) * 2008-02-28 2012-04-04 日本電気株式会社 障害原因解析支援装置、方法
WO2009129841A1 (en) * 2008-04-21 2009-10-29 Telefonaktiebolaget L M Ericsson (Publ) Method and system for network fault management
JP5458308B2 (ja) * 2010-06-11 2014-04-02 株式会社日立製作所 仮想計算機システム、仮想計算機システムの監視方法及びネットワーク装置
JP5906719B2 (ja) * 2011-03-15 2016-04-20 株式会社リコー 電子機器、情報処理システム、及びプログラム
JP5447416B2 (ja) * 2011-03-23 2014-03-19 三菱電機株式会社 ログ解析装置
JP2013156730A (ja) * 2012-01-27 2013-08-15 Nec Corp 障害情報処理装置、障害情報処理方法、および障害情報処理プログラム
JP6528381B2 (ja) * 2014-10-06 2019-06-12 富士通株式会社 ログ管理装置,ログ管理プログラム,及びログ管理方法
US9665420B2 (en) * 2015-07-31 2017-05-30 Ca, Inc. Causal engine and correlation engine based log analyzer
US10795753B2 (en) * 2017-12-08 2020-10-06 Nec Corporation Log-based computer failure diagnosis

Also Published As

Publication number Publication date
DE102017221554A1 (de) 2018-06-28
JP2018106638A (ja) 2018-07-05
US20180183690A1 (en) 2018-06-28

Similar Documents

Publication Publication Date Title
JP2019525302A (ja) アプリケーション移行システム
JP5708937B2 (ja) 構成情報管理システム、構成情報管理方法、及び構成情報管理用プログラム
JP2019525300A (ja) インテリジェント構成検出技術
CN106302595B (zh) 一种对服务器进行健康检查的方法及设备
US9952940B2 (en) Method of operating a shared nothing cluster system
WO2015054582A1 (en) Methods and apparatus to manage virtual machines
US10949401B2 (en) Data replication in site recovery environment
US8225131B2 (en) Monitoring service endpoints
US20190372878A1 (en) Web site reachability management for content browsing
US9588853B2 (en) Automatic management of server failures
EP3304294A1 (en) Method and system for allocating resources for virtual hosts
WO2018233630A1 (zh) 故障发现
US20180004797A1 (en) Application resiliency management using a database driver
JP2018194882A (ja) 制御プログラム、制御方法、制御装置、及びデータベースサーバ
US20180188990A1 (en) Method, apparatus and system for inserting disk
JP6780498B2 (ja) 情報処理装置、情報処理装置の制御方法およびプログラム
JP5754440B2 (ja) 構成情報管理サーバ、構成情報管理方法、及び構成情報管理用プログラム
US8447833B2 (en) Reading and writing during cluster growth phase
WO2016095644A1 (zh) 数据库的高可用解决方法和装置
CN106453544B (zh) 一种云环境及其监控方法、系统
CN107483280B (zh) 用于服务节点设备监控的方法及设备
US9256648B2 (en) Data handling in a cloud computing environment
WO2019072088A1 (zh) 一种文件管理方法、文件管理装置、电子设备及存储介质
JP2019082816A (ja) 情報処理装置、情報処理方法およびプログラム
US10992760B2 (en) Information processing system, session management method, and non-transitory computer-readable storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200729

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200915

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200928

R150 Certificate of patent or registration of utility model

Ref document number: 6780498

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150