JP2019028878A - Information processing device and program - Google Patents

Information processing device and program Download PDF

Info

Publication number
JP2019028878A
JP2019028878A JP2017149995A JP2017149995A JP2019028878A JP 2019028878 A JP2019028878 A JP 2019028878A JP 2017149995 A JP2017149995 A JP 2017149995A JP 2017149995 A JP2017149995 A JP 2017149995A JP 2019028878 A JP2019028878 A JP 2019028878A
Authority
JP
Japan
Prior art keywords
log
page
message
extraction
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017149995A
Other languages
Japanese (ja)
Other versions
JP6974703B2 (en
Inventor
章二 大嶋
Shoji Oshima
章二 大嶋
宏和 松林
Hirokazu Matsubayashi
宏和 松林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017149995A priority Critical patent/JP6974703B2/en
Publication of JP2019028878A publication Critical patent/JP2019028878A/en
Application granted granted Critical
Publication of JP6974703B2 publication Critical patent/JP6974703B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To provide an information processing device for suppressing the collection of logs which are not useful to analysis.SOLUTION: A storage part 1a of an information processing device 1 stores a time range of log records to be an extraction object and the priority level of each type of the log records in operation information 2 including a plurality of log records about a component of a prescribed device as management information 3 in each message. A processing part 1b extracts log records #n-3, #n-1, #n from in the operation information to an extraction size upper limit=3 on the basis of a time range ΔT1=10 minutes from the current time=18:10:00 corresponding to a message (ID:M1) and a priority level type1>type2>type3 with reference to the storage part when the message is detected.SELECTED DRAWING: Figure 1

Description

本発明は情報処理装置およびプログラムに関する。   The present invention relates to an information processing apparatus and a program.

情報処理システムでは、運用管理用のコンピュータにより、情報処理システムに含まれる装置の動作に関する動作情報を取得し、当該装置の稼働状況を把握可能にすることがある。動作情報は、当該装置のハードウェアやソフトウェアなどのコンポーネントによって出力されるログを含む。   In an information processing system, an operation management computer may acquire operation information related to the operation of an apparatus included in the information processing system and make it possible to grasp the operating status of the apparatus. The operation information includes a log output by a component such as hardware or software of the device.

例えば、一連の通信パスの状態変化を表すログ情報を一括して収集し、一連の通信パスの状態変化を表すログ情報に統一したフォーマットで編集して外部記憶装置に出力するデータ通信処理装置の提案がある。   For example, the data communication processing apparatus collects log information representing a series of communication path status changes in a batch, edits the log information representing a series of communication path status changes in a unified format, and outputs the log information to an external storage device. I have a suggestion.

また、複数の監視対象が正常に稼働しているか監視し、複数の監視対象各々の稼働状況をまとめてディスプレイに表示する監視装置の提案もある。この提案では、監視装置は、ディスプレイに時間軸を表示するとともに、時間軸上に、所定数を上限として複数のイベント情報をイベント発生順またはイベント情報発生順に並べて表示する。監視装置は、新たなイベント情報を取得すると、当該イベント情報を時間軸条の所定の位置に、他のイベント情報と並べて表示する。   There is also a proposal for a monitoring device that monitors whether a plurality of monitoring targets are operating normally and displays the operating status of each of the plurality of monitoring targets on a display. In this proposal, the monitoring apparatus displays a time axis on the display, and displays a plurality of event information on the time axis in a sequence of event occurrence or event information occurrence with a predetermined number as an upper limit. When the monitoring device acquires new event information, the monitoring device displays the event information side by side with other event information at a predetermined position on the time axis.

特開平2−212956号公報Japanese Laid-Open Patent Publication No. Hei 2-212156 国際公開第2013/021530号International Publication No. 2013/021530

障害などの事象に対して、装置に保存されているログ情報を全て収集しようとすると、当該事象との関係が薄く、当該事象の解析に有用でないログも収集されるという問題がある。   When all the log information stored in the apparatus is collected for an event such as a failure, there is a problem that a log that is not related to the event and is not useful for analyzing the event is collected.

1つの側面では、本発明は、解析に有用でないログの収集を抑えることを目的とする。   In one aspect, the present invention aims to suppress the collection of logs that are not useful for analysis.

1つの態様では、情報処理装置が提供される。情報処理装置は、記憶部と処理部とを有する。記憶部は、所定の装置の構成部品に関する複数のログレコードを含む動作情報のうち、抽出対象とするログレコードの時間範囲とログレコードのタイプ毎の優先レベルとを、メッセージ毎に記憶する。処理部は、メッセージを検出すると、記憶部を参照して、メッセージに応じた現時刻からの時間範囲および優先レベルに基づき、動作情報の中からログレコードを抽出する。   In one aspect, an information processing apparatus is provided. The information processing apparatus includes a storage unit and a processing unit. A memory | storage part memorize | stores for every message the time range of the log record made into extraction object, and the priority level for every type of log record among the operation information containing the several log record regarding the component of a predetermined | prescribed apparatus. When the processing unit detects the message, the processing unit refers to the storage unit and extracts a log record from the operation information based on the time range and priority level from the current time according to the message.

1つの側面では、解析に有用でないログの収集を抑えることができる。   In one aspect, collection of logs that are not useful for analysis can be suppressed.

第1の実施の形態の情報処理装置を示す図である。It is a figure which shows the information processing apparatus of 1st Embodiment. 第2の実施の形態のストレージシステムの例を示す図である。It is a figure which shows the example of the storage system of 2nd Embodiment. 第2の実施の形態のストレージ装置の接続例を示す図である。It is a figure which shows the example of a connection of the storage apparatus of 2nd Embodiment. 第2の実施の形態のストレージ装置のハードウェア例を示す図である。3 is a diagram illustrating an example of hardware of a storage device according to a second embodiment. FIG. 第2の実施の形態のCMの機能例を示す図である。It is a figure which shows the function example of CM of 2nd Embodiment. 第2の実施の形態のページの例を示す図である。It is a figure which shows the example of the page of 2nd Embodiment. 第2の実施の形態のページリストの例を示す図である。It is a figure which shows the example of the page list of 2nd Embodiment. 第2の実施の形態の割り当て方式管理テーブルの例を示す図である。It is a figure which shows the example of the allocation system management table of 2nd Embodiment. 第2の実施の形態のログ抽出管理テーブルの例を示す図である。It is a figure which shows the example of the log extraction management table of 2nd Embodiment. 第2の実施の形態のログ収集例を示す図である。It is a figure which shows the log collection example of 2nd Embodiment. 第2の実施の形態のログ収集例を示すフローチャートである。It is a flowchart which shows the log collection example of 2nd Embodiment. 第2の実施の形態のCM単位のログ抽出例を示すフローチャートである。It is a flowchart which shows the log extraction example of CM unit of 2nd Embodiment. 第2の実施の形態の時間範囲内のログ抽出例を示すフローチャートである。It is a flowchart which shows the log extraction example within the time range of 2nd Embodiment. 第2の実施の形態の優先レベル単位のログ抽出例を示すフローチャートである。It is a flowchart which shows the log extraction example of the priority level unit of 2nd Embodiment. 第2の実施の形態のログ抽出例(その1)を示す図である。It is a figure which shows the log extraction example (the 1) of 2nd Embodiment. 第2の実施の形態のログ抽出例(その2)を示す図である。It is a figure which shows the log extraction example (the 2) of 2nd Embodiment. 第2の実施の形態のログ抽出例(その3)を示す図である。It is a figure which shows the log extraction example (the 3) of 2nd Embodiment. 第2の実施の形態のログ抽出例(その4)を示す図である。It is a figure which shows the log extraction example (the 4) of 2nd Embodiment. 第3の実施の形態のログ抽出管理テーブルの例を示す図である。It is a figure which shows the example of the log extraction management table of 3rd Embodiment. 第3の実施の形態のCM単位のログ抽出例を示すフローチャートである。15 is a flowchart illustrating an example of CM-unit log extraction according to the third embodiment. 第3の実施の形態のログ抽出例を示す図である。It is a figure which shows the log extraction example of 3rd Embodiment. 第3の実施の形態のログ抽出管理テーブルの第1具体例を示す図である。It is a figure which shows the 1st specific example of the log extraction management table of 3rd Embodiment. 第3の実施の形態のログ抽出の第1具体例を示す図である。It is a figure which shows the 1st specific example of the log extraction of 3rd Embodiment. 第3の実施の形態のログ抽出管理テーブルの第2具体例を示す図である。It is a figure which shows the 2nd specific example of the log extraction management table of 3rd Embodiment. 第3の実施の形態のログ抽出の第2具体例を示す図である。It is a figure which shows the 2nd specific example of log extraction of 3rd Embodiment.

以下、本実施の形態について図面を参照して説明する。
[第1の実施の形態]
図1は、第1の実施の形態の情報処理装置を示す図である。情報処理装置1は、所定の装置の構成部品の動作に関する動作情報を取得する。所定の装置は、情報処理装置1でもよいし、情報処理装置1以外の他の装置でもよい。情報処理装置1は、障害などのイベントに対して解析用の動作情報を収集する機能を提供する。情報処理装置1は、記憶部1aおよび処理部1bを有する。
Hereinafter, the present embodiment will be described with reference to the drawings.
[First Embodiment]
FIG. 1 is a diagram illustrating the information processing apparatus according to the first embodiment. The information processing apparatus 1 acquires operation information regarding the operation of the component parts of a predetermined apparatus. The predetermined device may be the information processing device 1 or another device other than the information processing device 1. The information processing apparatus 1 provides a function of collecting operation information for analysis for an event such as a failure. The information processing apparatus 1 includes a storage unit 1a and a processing unit 1b.

記憶部1aは、RAM(Random Access Memory)などの揮発性記憶装置でもよいし、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性記憶装置でもよい。処理部1bは、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)などを含み得る。処理部1bはプログラムを実行するプロセッサでもよい。「プロセッサ」には、複数のプロセッサの集合(マルチプロセッサ)も含まれ得る。   The storage unit 1a may be a volatile storage device such as a RAM (Random Access Memory) or a non-volatile storage device such as an HDD (Hard Disk Drive) or a flash memory. The processing unit 1b may include a CPU (Central Processing Unit), a DSP (Digital Signal Processor), an ASIC (Application Specific Integrated Circuit), an FPGA (Field Programmable Gate Array), and the like. The processing unit 1b may be a processor that executes a program. The “processor” may include a set of multiple processors (multiprocessor).

記憶部1aは、動作情報2および管理情報3を記憶する。動作情報2は、所定の装置の構成部品に関する複数のログレコードを含む。構成部品は、例えば、該当の装置が備えるハードウェアやソフトウェアなどのコンポーネントである。あるいは、構成部品は、当該コンポーネントにおいて所定の機能を実現するモジュールでもよい。1つのログレコードは、レコード番号(図中“#”と表記)、タイムスタンプ、ログタイプおよびログ内容を含む。レコード番号は、ログレコードの識別番号である。タイムスタンプは、ログ内容が記録された日時である。ログタイプは、ログ内容の分類を示す識別情報である。分類は、例えば、ログに関連するハードウェアの種類(記憶デバイスや通信デバイスなど)、ソフトウェアの種類(OS(Operating system)、ミドルウェアおよびアプリケーションなど)に応じて分けられる。動作情報2の例では、ログタイプは、“type1”、“type2”、“type3”の3種類ある。ログ内容は、記録されたログの内容を示す情報である。   The storage unit 1a stores operation information 2 and management information 3. The operation information 2 includes a plurality of log records related to components of a predetermined device. The component is, for example, a component such as hardware or software included in the corresponding device. Alternatively, the component may be a module that realizes a predetermined function in the component. One log record includes a record number (indicated as “#” in the figure), a time stamp, a log type, and log contents. The record number is an identification number of the log record. The time stamp is the date and time when the log content was recorded. The log type is identification information indicating the classification of log contents. The classification is classified according to, for example, the type of hardware (storage device, communication device, etc.) and the type of software (OS (Operating system), middleware, application, etc.) related to the log. In the example of the operation information 2, there are three log types, “type 1”, “type 2”, and “type 3”. The log content is information indicating the content of the recorded log.

例えば、動作情報2は、ログ番号(#)“n−5”(nは6以上の整数)、タイムスタンプ“2017/6/30 17:58:50”、ログタイプ“type1”、ログ内容“fault aaaa”というログレコードを含む。動作情報2の例では、ログ番号(#)“n”のログレコードが最新である。   For example, the operation information 2 includes a log number (#) “n-5” (n is an integer of 6 or more), a time stamp “2017/6/30 17:58:50”, a log type “type1”, and a log content “ It contains a log record called “fault aaa”. In the example of the operation information 2, the log record with the log number (#) “n” is the latest.

管理情報3は、動作情報2のうち、抽出対象とするログレコードの時間範囲とログレコードのタイプ(ログタイプ)毎の優先レベルとが、事象の発生を示すメッセージに対して登録された情報である。メッセージは、所定の装置(情報処理装置1または他の装置)におけるハードウェアやソフトウェアなどのコンポーネントにより発行される。管理情報の1つのレコードは、メッセージID(IDentifier)、時間範囲、およびログタイプ優先レベルを含む。メッセージIDは、メッセージの識別情報である。時間範囲は、ログレコードの抽出対象とする時間範囲を示す情報である。ログタイプ優先レベルは、ログタイプ毎の優先度を示す情報である。メッセージの発行元のコンポーネントに対して関連性が高いログタイプほど、優先度が高くなるように予め設定される。   The management information 3 is information in which the time range of the log record to be extracted and the priority level for each type of log record (log type) are registered with respect to the message indicating the occurrence of the event. is there. The message is issued by a component such as hardware or software in a predetermined device (the information processing device 1 or another device). One record of management information includes a message ID (IDentifier), a time range, and a log type priority level. The message ID is message identification information. The time range is information indicating a time range to be extracted from the log record. The log type priority level is information indicating the priority for each log type. The log type that is more relevant to the component that issued the message is set in advance so that the priority is higher.

例えば、管理情報3は、メッセージID“M1”、時間範囲“ΔT1”、ログタイプ優先レベル“type1>type2>type3”というレコードを含む。ここで、ログタイプ優先レベルの記号“>”は、当該記号の左側のログタイプの方が、当該記号の右側のログタイプよりも優先度が高いことを示す。例えば、“type1>type2>type3”の表記は、3つのログタイプのうち、“type1”が最も優先度が高く、次いで“type2”の優先度が高く、“type3”の優先度が最も低いことを示す。   For example, the management information 3 includes a record of message ID “M1”, time range “ΔT1”, and log type priority level “type1> type2> type3”. Here, the symbol “>” of the log type priority level indicates that the log type on the left side of the symbol has higher priority than the log type on the right side of the symbol. For example, in the notation “type1> type2> type3”, among the three log types, “type1” has the highest priority, “type2” has the highest priority, and “type3” has the lowest priority. Indicates.

処理部1bは、管理情報3を取得し、記憶部1aに格納する。管理情報3は、例えば、ユーザにより情報処理装置1に対して予め入力される。
処理部1bは、メッセージを検出すると、記憶部1aを参照して、当該メッセージに応じた現時刻からの時間範囲および優先レベル(ログタイプ優先レベル)に基づき、動作情報2の中からログレコードを抽出する。
The processing unit 1b acquires the management information 3 and stores it in the storage unit 1a. For example, the management information 3 is input in advance to the information processing apparatus 1 by the user.
When the processing unit 1b detects the message, the processing unit 1b refers to the storage unit 1a, and extracts a log record from the operation information 2 based on the time range and priority level (log type priority level) from the current time according to the message. Extract.

例えば、処理部1bは、メッセージID“M1”を含むメッセージを受信する。管理情報3によれば、メッセージID“M1”に応じた時間範囲は“ΔT1”である。管理情報3によれば、メッセージID“M1”に応じたログタイプ優先レベルは、“type1>type2>type3”である。したがって、処理部1bは、現時刻からの時間範囲“ΔT1”およびログタイプ優先レベル“type1>type2>type3”に基づいて動作情報2の中からログレコードを抽出する。   For example, the processing unit 1b receives a message including the message ID “M1”. According to the management information 3, the time range corresponding to the message ID “M1” is “ΔT1”. According to the management information 3, the log type priority level corresponding to the message ID “M1” is “type1> type2> type3”. Accordingly, the processing unit 1b extracts a log record from the operation information 2 based on the time range “ΔT1” from the current time and the log type priority level “type1> type2> type3”.

より具体的には、抽出条件の一例として、(1)ΔT1が10分(ΔT1=10分)であり、(2)現時刻が2017/6/30の18:10:00であり、(3)抽出するログレコードの合計サイズの上限が“3”(抽出サイズ上限=3)の場合を考える。ここで、例えば、動作情報2のログレコード1つ当たりのサイズを1とする。   More specifically, as an example of the extraction condition, (1) ΔT1 is 10 minutes (ΔT1 = 10 minutes), (2) the current time is 18/60: 00 of 2017/6/30, (3 ) Consider a case where the upper limit of the total size of log records to be extracted is “3” (extraction size upper limit = 3). Here, for example, the size of one log record of the operation information 2 is assumed to be 1.

この場合、処理部1bは、例えば、次のようにログレコードの抽出を行う。
まず、処理部1bは、現時刻(18:10:00)から時間範囲“ΔT1=10分”だけ遡った時刻18:00:00を計算する。そして、処理部1bは、時刻18:00:00から現時刻までの時間範囲に属するログレコードを抽出対象候補とする。動作情報2の例では、抽出対象候補は、レコード番号“n−4”〜“n”までのログレコードである。
In this case, the processing unit 1b extracts log records as follows, for example.
First, the processing unit 1b calculates a time 18:00 that is back by the time range “ΔT1 = 10 minutes” from the current time (18:10:00). Then, the processing unit 1b sets log records belonging to the time range from time 18:00 to the current time as extraction target candidates. In the example of the operation information 2, the extraction target candidates are log records with record numbers “n−4” to “n”.

次に、処理部1bは、抽出対象候補のログレコードのうち、最高の優先レベルであるログタイプ“type1”のログレコードを新しい方から古い方へ順に抽出する。まず、処理部1bは、ログタイプ“type1”であるレコード番号“n”のログレコードを抽出する。処理部1bは、ログレコードを1つ抽出するたびに、抽出したログレコードの合計サイズが上限“3”に達したか否かを判定する。この段階では、抽出したログレコードの合計サイズは“1”であり、上限“3”に達していない。次に、処理部1bは、ログタイプ“type1”であるレコード番号“n−3”のログレコードを抽出する。この段階では、抽出したログレコードの合計サイズは“2”であり、上限“3”に達していない。   Next, the processing unit 1b sequentially extracts the log records of the log type “type1”, which is the highest priority level, from the newest to the oldest among the extraction target candidate log records. First, the processing unit 1b extracts a log record with a record number “n” having a log type “type1”. Each time the processing unit 1b extracts one log record, the processing unit 1b determines whether or not the total size of the extracted log records has reached the upper limit “3”. At this stage, the total size of the extracted log records is “1” and does not reach the upper limit “3”. Next, the processing unit 1b extracts a log record with the record number “n-3” having the log type “type1”. At this stage, the total size of the extracted log records is “2” and does not reach the upper limit “3”.

次に、処理部1bは、抽出対象候補のログレコードのうち、2番目に高い優先レベルであるログタイプ“type2”のログレコードを新しい方から古い方へ順に抽出する。まず、処理部1bは、ログタイプ“type2”であるレコード番号“n−1”のログレコードを抽出する。この段階で、抽出したログレコードの合計サイズは“3”であり、上限“3”に達する。したがって、処理部1bは、抽出対象候補であるレコード番号“n−4”〜“n”までのログレコードのうち、レコード番号“n−3”、“n−1”、“n”のログレコードを抽出する。一方、処理部1bは、抽出対象候補であるレコード番号“n−4”〜“n”までのログレコードのうち、レコード番号“n−4”(ログタイプ“type2”)、“n−2”(ログタイプ“type3”)のレコードを抽出しない。   Next, the processing unit 1b sequentially extracts the log records of the log type “type2”, which is the second highest priority level, from the newest to the oldest among the log records of extraction target candidates. First, the processing unit 1b extracts a log record having a record number “n−1” having a log type “type 2”. At this stage, the total size of the extracted log records is “3” and reaches the upper limit “3”. Therefore, the processing unit 1b selects the log records with the record numbers “n-3”, “n−1”, and “n” from the log records with the record numbers “n-4” to “n” that are candidates for extraction. To extract. On the other hand, the processing unit 1b records the record number “n-4” (log type “type2”), “n-2” among the log records from the record numbers “n-4” to “n” that are extraction target candidates. The record of (log type “type3”) is not extracted.

処理部1bは、抽出したレコード番号“n−3”、“n−1”、“n”のログレコードを出力する。例えば、処理部1bは、抽出したログレコードを、情報処理装置1に接続された表示装置(図1では図示を省略している)に出力し、表示装置により抽出したログレコードに含まれるログ内容を表示させてもよい。また、処理部1bは、抽出したログレコードを解析することで、障害などのイベントの原因特定を支援してもよい。あるいは、処理部1bは、ログレコードの解析を行う他の装置(図1では図示を省略している)に、抽出したログレコードを送信してもよい。   The processing unit 1b outputs log records having the extracted record numbers “n-3”, “n−1”, and “n”. For example, the processing unit 1b outputs the extracted log record to a display device (not shown in FIG. 1) connected to the information processing device 1, and the log contents included in the log record extracted by the display device May be displayed. Further, the processing unit 1b may support the identification of the cause of an event such as a failure by analyzing the extracted log record. Alternatively, the processing unit 1b may transmit the extracted log record to another device (not shown in FIG. 1) that analyzes the log record.

このように、情報処理装置1によれば、解析に有用でないログの収集を抑えることができる。
ここで、例えば、障害などの事象(イベント)に対して、動作情報2を全て収集することも考えられる。しかし、動作情報2には、新しいものや古いもの、ハードウェアやソフトウェアなどに関する種々のログレコードが含まれる。このため、動作情報2を全て収集すると、発生した事象との関係が薄く、当該事象の解析に有用でないログレコードも収集されるという問題がある。余計なログレコードの収集は、ログレコードを他の装置に送信する際の通信量の増加や、有用でないログレコードによる解析量の増加などの要因になる。
Thus, according to the information processing apparatus 1, it is possible to suppress the collection of logs that are not useful for analysis.
Here, for example, it is also conceivable to collect all the operation information 2 for an event such as a failure. However, the operation information 2 includes various log records related to new and old items, hardware and software. For this reason, when all of the operation information 2 is collected, there is a problem that the relationship with the generated event is thin, and log records that are not useful for analyzing the event are also collected. The collection of unnecessary log records causes an increase in the amount of communication when the log records are transmitted to other devices, and an increase in the amount of analysis due to unusable log records.

例えば、収集するログサイズを小さくするために、単に、抽出対象サイズに上限を設けることも考えられる。しかし、抽出対象サイズに上限を設けただけでは、該当の事象に対して有用でないログレコードが抽出される可能性は大きい。なぜなら、発生する事象に応じて、当該事象と関連性の高いコンポーネントは異なるからである。また、現時点に対して古いログレコードほど、現時点の事象との関連が薄くなるからである。   For example, in order to reduce the log size to be collected, it is possible to simply set an upper limit on the extraction target size. However, simply setting an upper limit on the extraction target size is likely to extract log records that are not useful for the event. This is because components highly relevant to the event differ depending on the event that occurs. Also, the older the log record with respect to the current time, the less the relationship with the current event.

そこで、情報処理装置1は、事象の発生を示すメッセージ毎に抽出対象ログレコードの時間範囲とログタイプ別の優先レベルと(管理情報3)を取得し、記憶部1aにより記憶する。情報処理装置1は、メッセージを検出すると、当該メッセージに応じた時間範囲とログタイプ別の優先レベルとを記憶部1aに記憶された管理情報3から検索する。そして、情報処理装置1は、現時点以前の時間範囲とログタイプ別の優先レベルとを基にログレコードを抽出する。これにより、情報処理装置1は、動作情報2のうち、障害解析に有用なログレコードのみを得ることができる。   Therefore, the information processing apparatus 1 acquires the time range of the extraction target log record and the priority level for each log type (management information 3) for each message indicating the occurrence of an event, and stores it in the storage unit 1a. When the information processing apparatus 1 detects a message, the information processing apparatus 1 searches the management information 3 stored in the storage unit 1a for a time range corresponding to the message and a priority level for each log type. Then, the information processing apparatus 1 extracts log records based on the time range before the current time and the priority level for each log type. Thereby, the information processing apparatus 1 can obtain only the log record useful for the failure analysis in the operation information 2.

以下では、情報処理装置1の機能を有するストレージ装置を例示して、当該機能を更に具体的に説明する。
[第2の実施の形態]
図2は、第2の実施の形態のストレージシステムの例を示す図である。第2の実施の形態のストレージシステムは、ストレージ装置10,20を含む。ストレージ装置10,20は、フロントエンドエンクロージャ(FE:Front-end Enclosure)30を介して接続されている。ストレージ装置10は、ローカルエリアネットワーク(LAN:Local Area Network)40に接続されている。LAN40は、インターネット50に接続されている。
Hereinafter, the storage apparatus having the function of the information processing apparatus 1 will be exemplified to describe the function more specifically.
[Second Embodiment]
FIG. 2 illustrates an example of the storage system according to the second embodiment. The storage system according to the second embodiment includes storage apparatuses 10 and 20. The storage apparatuses 10 and 20 are connected via a front-end enclosure (FE) 30. The storage device 10 is connected to a local area network (LAN) 40. The LAN 40 is connected to the Internet 50.

ストレージ装置10は、LAN40およびインターネット50を介して、サポートサーバ60と通信する。サポートサーバ60は、ストレージシステムの保守に用いられるサーバコンピュータである。サポートサーバ60は、ストレージシステムで障害が発生した場合に、ストレージ装置10,20のログを取得し、取得したログに基づく保守員による保守作業(例えば、障害の原因究明や対策立案など)を支援する。   The storage device 10 communicates with the support server 60 via the LAN 40 and the Internet 50. The support server 60 is a server computer used for maintenance of the storage system. The support server 60 acquires logs of the storage devices 10 and 20 when a failure occurs in the storage system, and supports maintenance work (for example, investigation of the cause of the failure and planning of countermeasures) based on the acquired logs. To do.

ストレージ装置10,20は、ストレージエリアネットワーク(SAN:Storage Area Network)70に接続されている。SAN70には、業務サーバ80が接続されている。業務サーバ80は、ユーザの業務を支援するソフトウェアを実行するサーバコンピュータである。ストレージ装置10,20は、業務サーバ80の業務処理に用いられるデータを記憶する。ストレージ装置10,20はSAN70を介して、業務サーバ80によるデータアクセスを受け付ける。   The storage devices 10 and 20 are connected to a storage area network (SAN) 70. A business server 80 is connected to the SAN 70. The business server 80 is a server computer that executes software that supports a user's business. The storage devices 10 and 20 store data used for business processing of the business server 80. The storage apparatuses 10 and 20 accept data access by the business server 80 via the SAN 70.

図3は、第2の実施の形態のストレージ装置の接続例を示す図である。ストレージ装置10は、コントローラモジュール(CM:Controller Module)100,200およびドライブエンクロージャ(DE:Drive Enclosure)11,12を有する。   FIG. 3 is a diagram illustrating a connection example of the storage apparatus according to the second embodiment. The storage apparatus 10 includes controller modules (CM) 100 and 200 and drive enclosures (DE) 11 and 12.

CM100,200は、DE11,12に収納されたHDDやSSD(Solid State Drive)などの記憶装置に対するデータアクセスを制御するストレージ制御装置である。CM100,200は、コントローラエンクロージャ(CE:Controller Enclosure)と呼ばれる1つの筐体に収められる。CM100,200は、FE30に接続されている。CM100は、DE11,12に接続されている。CM200は、DE11,12に接続されている。   The CMs 100 and 200 are storage control devices that control data access to storage devices such as HDDs and SSDs (Solid State Drives) housed in the DEs 11 and 12. The CMs 100 and 200 are housed in a single housing called a controller enclosure (CE). The CMs 100 and 200 are connected to the FE 30. The CM 100 is connected to the DEs 11 and 12. The CM 200 is connected to the DEs 11 and 12.

DE11,12は、HDDやSSDなどの記憶装置を複数収容する。DE11,12は、CM100,200とは別筐体でも(CM100,200に対して外付けされても)よいし、CM100,200と同じ筐体に収められてもよい。CM100は、第1の実施の形態の情報処理装置1の一例である。   The DEs 11 and 12 accommodate a plurality of storage devices such as HDDs and SSDs. The DEs 11 and 12 may be separate from the CMs 100 and 200 (externally attached to the CMs 100 and 200) or may be housed in the same housing as the CMs 100 and 200. The CM 100 is an example of the information processing apparatus 1 according to the first embodiment.

ストレージ装置20は、CM300,400およびDE21,22を有する。
CM300,400は、DE21,22に収納されたHDDやSSDなどの記憶装置に対するデータアクセスを制御するストレージ制御装置である。CM300,400は、FE30に接続されている。CM300は、DE21,22に接続されている。CM400は、DE21,22に接続されている。
The storage apparatus 20 includes CMs 300 and 400 and DEs 21 and 22.
The CMs 300 and 400 are storage control devices that control data access to storage devices such as HDDs and SSDs stored in the DEs 21 and 22. The CMs 300 and 400 are connected to the FE 30. The CM 300 is connected to the DEs 21 and 22. The CM 400 is connected to the DEs 21 and 22.

DE21,22は、HDDやSSDなどの記憶装置を複数収容する。DE21,22は、CM300,400とは別筐体でも(CM300,400に対して外付けされても)よいし、CM300,400と同じ筐体に収められてもよい。   The DEs 21 and 22 accommodate a plurality of storage devices such as HDDs and SSDs. The DEs 21 and 22 may be separate from the CMs 300 and 400 (externally attached to the CMs 300 and 400), or may be housed in the same case as the CMs 300 and 400.

ここで、CM100は、CM200,300,400に対するマスタCMとして機能する。マスタCMは、ストレージシステムの運用管理機能を統括するCMであり、FE30を介して、他のCM(CM200,300,400)からログなどの情報を収集し、収集したログをサポートサーバ60に送信する機能を担う。   Here, the CM 100 functions as a master CM for the CMs 200, 300, and 400. The master CM is a CM that supervises the operation management function of the storage system, collects information such as logs from other CMs (CMs 200, 300, and 400) via the FE 30, and transmits the collected logs to the support server 60. It bears the function to do.

図4は、第2の実施の形態のストレージ装置のハードウェア例を示す図である。CM100は、プロセッサ101、RAM102、NA(Network Adapter)103、CA(Channel Adapter)104、NTB(Non-Transparent Bridge)105、BUD(Boot-up and Utility Device)106、DI(Drive Interface)107、CM−IF(InterFace)108および媒体リーダ109を有する。これらのハードウェアは、CM100の内部バスに接続されている。CM200,300,400も同様のハードウェアにより実現される。   FIG. 4 is a diagram illustrating a hardware example of the storage apparatus according to the second embodiment. The CM 100 includes a processor 101, RAM 102, NA (Network Adapter) 103, CA (Channel Adapter) 104, NTB (Non-Transparent Bridge) 105, BUD (Boot-up and Utility Device) 106, DI (Drive Interface) 107, CM An IF (InterFace) 108 and a media reader 109 are included. These hardwares are connected to the internal bus of the CM 100. The CMs 200, 300, and 400 are also realized by similar hardware.

プロセッサ101は、CM100の情報処理を制御するハードウェアである。プロセッサ101は、マルチプロセッサであってもよい。プロセッサ101は、例えばCPU、DSP、ASICまたはFPGAなどである。プロセッサ101は、CPU、DSP、ASIC、FPGAなどのうちの2以上の要素の組み合わせであってもよい。   The processor 101 is hardware that controls information processing of the CM 100. The processor 101 may be a multiprocessor. The processor 101 is, for example, a CPU, DSP, ASIC, or FPGA. The processor 101 may be a combination of two or more elements of CPU, DSP, ASIC, FPGA, and the like.

RAM102は、CM100の主記憶装置である。RAM102は、揮発性の半導体メモリである。RAM102として、例えば、SRAM(Static RAM)やDRAM(Dynamic RAM)などが用いられる。RAM102は、プロセッサ101に実行させるOSやファームウェアのプログラムの少なくとも一部を一時的に記憶する。また、RAM102は、プロセッサ101による処理に用いられる各種データを記憶する。   The RAM 102 is a main storage device of the CM 100. The RAM 102 is a volatile semiconductor memory. For example, SRAM (Static RAM) or DRAM (Dynamic RAM) is used as the RAM 102. The RAM 102 temporarily stores at least part of an OS or firmware program to be executed by the processor 101. The RAM 102 stores various data used for processing by the processor 101.

NA103は、LAN40を介してサポートサーバ60と通信する通信インタフェースである。NA103として、例えばイーサネット(登録商標)のインタフェースを用いることができる。   The NA 103 is a communication interface that communicates with the support server 60 via the LAN 40. As the NA 103, for example, an Ethernet (registered trademark) interface can be used.

CA104は、SAN50を介して業務サーバ80と通信する通信インタフェースである。CA104は、業務サーバ80からDE21,22へのブロックアクセスに用いられる。CA104として、例えばFC(Fibre Channel)のインタフェースを用いることができる。CA104として、FC以外のインタフェース(例えば、SAS(Serial Attached SCSI、SCSIはSmall Computer System Interfaceの略)など)が用いられることもある。   The CA 104 is a communication interface that communicates with the business server 80 via the SAN 50. The CA 104 is used for block access from the business server 80 to the DEs 21 and 22. As the CA 104, for example, an FC (Fibre Channel) interface can be used. An interface other than FC (for example, SAS (Serial Attached SCSI; SCSI is an abbreviation for Small Computer System Interface)) may be used as the CA 104.

NTB105は、FE30と接続する通信インタフェースである。NTB105は、FE30を介して、CM200,300,400と通信する。
BUD106は、CM100の補助記憶装置である。BUD106は、不揮発性の半導体メモリである。例えば、BUD106として、SSDが用いられる。BUD106は、OSやファームウェアを含むプログラムや各種データなどを記憶する。BUD106は、CM100において動作するハードウェアやソフトウェアなどのコンポーネントにより出力されたログの保存にも用いられる。
The NTB 105 is a communication interface connected to the FE 30. The NTB 105 communicates with the CMs 200, 300, and 400 via the FE 30.
The BUD 106 is an auxiliary storage device of the CM 100. The BUD 106 is a nonvolatile semiconductor memory. For example, an SSD is used as the BUD 106. The BUD 106 stores programs including OS and firmware, various data, and the like. The BUD 106 is also used for storing logs output by components such as hardware and software that operate in the CM 100.

DI107は、DE21,22と通信するためのインタフェースである。例えば、DI107として、SASなどのインタフェースを用いることができる。
CM−IF108は、CM200と接続するためのインタフェースである。CM100は、CM−IF108を用いて、CM200と連携してデータアクセスを行える。例えば、CM100を運用系、CM200を待機系としてもよい。あるいは、CM100,200の両方を運用系として、データアクセスを分散して行ってもよい。何れの場合も、一方の故障時に他方でデータアクセスを引き継ぐことができ、ユーザの業務が停止されることを防げる。
The DI 107 is an interface for communicating with the DEs 21 and 22. For example, an interface such as SAS can be used as the DI 107.
The CM-IF 108 is an interface for connecting to the CM 200. The CM 100 can perform data access in cooperation with the CM 200 using the CM-IF 108. For example, CM 100 may be the active system and CM 200 may be the standby system. Alternatively, the data access may be distributed by using both the CMs 100 and 200 as the active system. In either case, data access can be taken over by the other in the event of a failure, and the user's business can be prevented from being stopped.

媒体リーダ109は、記録媒体91に記憶されたプログラムやデータを読み取る装置である。記録媒体91として、例えば、フラッシュメモリカードなどの不揮発性の半導体メモリを使用することができる。媒体リーダ109は、例えば、プロセッサ101からの命令に従って、記録媒体91から読み取ったプログラムやデータを、RAM102やBUD106に格納することもできる。   The medium reader 109 is a device that reads programs and data stored in the recording medium 91. As the recording medium 91, for example, a non-volatile semiconductor memory such as a flash memory card can be used. For example, the medium reader 109 can store the program and data read from the recording medium 91 in the RAM 102 and the BUD 106 in accordance with an instruction from the processor 101.

図5は、第2の実施の形態のCMの機能例を示す図である。CM100は、記憶部110、メッセージ生成部120、通知制御部130、ログ収集部140およびログ抽出部150を有する。   FIG. 5 is a diagram illustrating a function example of the CM according to the second embodiment. The CM 100 includes a storage unit 110, a message generation unit 120, a notification control unit 130, a log collection unit 140, and a log extraction unit 150.

記憶部110は、RAM102やBUD106の記憶領域を用いて実現される。
メッセージ生成部120、通知制御部130、ログ収集部140およびログ抽出部150は、プロセッサ101によって実現される。例えば、プロセッサ101は、RAM102に記憶されたプログラムを実行することで、メッセージ生成部120、通知制御部130、ログ収集部140およびログ抽出部150の機能を発揮してもよい。あるいは、メッセージ生成部120、通知制御部130、ログ収集部140およびログ抽出部150は、FPGAやASICなどのハードワイヤードロジックにより実現されてもよい。
The storage unit 110 is realized using a storage area of the RAM 102 or the BUD 106.
The message generation unit 120, the notification control unit 130, the log collection unit 140, and the log extraction unit 150 are realized by the processor 101. For example, the processor 101 may exhibit the functions of the message generation unit 120, the notification control unit 130, the log collection unit 140, and the log extraction unit 150 by executing a program stored in the RAM 102. Alternatively, the message generation unit 120, the notification control unit 130, the log collection unit 140, and the log extraction unit 150 may be realized by a hard wired logic such as an FPGA or an ASIC.

記憶部110は、CM100におけるハードウェア(DE21,22を含む)、OS、ミドルウェアおよびアプリケーションなどのコンポーネントの動作に関するログを記憶する。また、記憶部110は、CM100,200,300,400のコンポーネントにより生成されるメッセージに対して、ログの抽出に用いられる管理情報を予め記憶する。管理情報は、CM100,200,300,400それぞれで抽出するログの上限サイズ(抽出量の上限値)を決定するための情報を含む。また、管理情報は、抽出候補とする時間範囲や抽出候補とするログの分類(ログタイプ)の優先レベルの情報を含む。   The storage unit 110 stores a log regarding the operation of components such as hardware (including the DEs 21 and 22), the OS, middleware, and applications in the CM 100. Further, the storage unit 110 stores in advance management information used for log extraction for messages generated by the components of the CMs 100, 200, 300, and 400. The management information includes information for determining the upper limit size (the upper limit value of the extraction amount) of the log extracted by each of the CMs 100, 200, 300, and 400. Further, the management information includes information on a priority range of a time range as an extraction candidate and a log classification (log type) as an extraction candidate.

メッセージ生成部120は、通知制御部130に対して障害の発生を示すメッセージを通知する。メッセージ生成部120は、CM100のコンポーネントにおける障害通知用のモジュールでもよい。また、メッセージ生成部120は、障害発生時以外にも、当該コンポーネントの動作に関するログを記憶部110に格納してもよい。   The message generation unit 120 notifies the notification control unit 130 of a message indicating the occurrence of a failure. The message generation unit 120 may be a failure notification module in the CM 100 component. Further, the message generation unit 120 may store a log related to the operation of the component in the storage unit 110 in addition to when a failure occurs.

通知制御部130は、メッセージ生成部120およびCM200,300,400によるメッセージの通知を監視する。通知制御部130は、メッセージ生成部120およびCM200,300,400の何れかにより通知されたメッセージを取得すると、取得したメッセージをサポートサーバ60に送信する。通知制御部130は、一定時間後に、ログ収集部140に対して、障害調査用のログ収集を依頼する。ここで、「一定時間」は、例えば、障害事象に応じた後処理を実行するための時間である。障害事象に応じた後処理の一例としては、異常部品の切り離しや再組み込みなどが挙げられる。   The notification control unit 130 monitors message notifications by the message generation unit 120 and the CMs 200, 300, and 400. When the notification control unit 130 acquires the message notified by any of the message generation unit 120 and the CMs 200, 300, and 400, the notification control unit 130 transmits the acquired message to the support server 60. The notification control unit 130 requests the log collection unit 140 to collect a log for failure investigation after a certain time. Here, the “certain time” is, for example, a time for executing post-processing according to a failure event. As an example of post-processing according to a failure event, separation or reassembly of an abnormal part can be cited.

通知制御部130は、ログ収集部140からログ収集結果を取得する。通知制御部130は、取得したログ収集結果をサポートサーバ60に送信する。ここで、サポートサーバ60へのログ収集結果の送信可能なサイズには上限が設けられる。例えば、サポートサーバ60へのログ収集結果の送信可能なサイズの上限は、1MB(Mega Bytes)である。   The notification control unit 130 acquires the log collection result from the log collection unit 140. The notification control unit 130 transmits the acquired log collection result to the support server 60. Here, an upper limit is set for the size of the log collection result that can be transmitted to the support server 60. For example, the upper limit of the transmittable size of the log collection result to the support server 60 is 1 MB (Mega Bytes).

ログ収集部140は、通知制御部130によるログ収集の依頼に応じて、記憶部110に記憶された管理情報を参照し、今回のメッセージに対してCM100,200,300,400それぞれで抽出するログのサイズ(抽出量)の上限値を決定する。ログ収集部140は、今回のメッセージのメッセージIDと決定した上限とをログ抽出部150およびCM200,300,400に通知し、通知した抽出量の上限値でのログ抽出を指示する。   The log collection unit 140 refers to the management information stored in the storage unit 110 in response to a log collection request from the notification control unit 130, and logs extracted by the CMs 100, 200, 300, and 400 for the current message, respectively. The upper limit value of the size (extraction amount) is determined. The log collection unit 140 notifies the log extraction unit 150 and the CMs 200, 300, and 400 of the message ID of the current message and the determined upper limit, and instructs log extraction with the upper limit value of the notified extraction amount.

なお、ログ収集部140は、CM100,200,300,400それぞれにCM番号と呼ばれる識別番号を付与している。CM100のCM番号は“1”である。CM200のCM番号は“2”である。CM300のCM番号は“3”である。CM400のCM番号は“4”である。   The log collection unit 140 assigns an identification number called a CM number to each of the CMs 100, 200, 300, and 400. The CM number of the CM 100 is “1”. The CM number of the CM 200 is “2”. The CM number of the CM 300 is “3”. The CM number of the CM 400 is “4”.

ログ収集部140は、ログ抽出部150およびCM200,300,400により抽出されたログのレコード群を取得し、取得したレコード群をログ収集結果として、通知制御部130に提供する。   The log collection unit 140 acquires a record group of logs extracted by the log extraction unit 150 and the CMs 200, 300, and 400, and provides the acquired record group to the notification control unit 130 as a log collection result.

ログ抽出部150は、ログ収集部140のログ抽出の指示に応じて、記憶部110に記憶されたログから障害調査用のレコードを抽出する。ログ抽出部150は、記憶部110に記憶された管理情報を参照し、今回のメッセージIDに対して、抽出候補とする時間範囲や抽出候補とするログタイプの優先レベルを特定する。ログ抽出部150は、レコードの抽出に、ログ収集部140により通知された抽出量の上限値、および、特定した時間範囲やログタイプの優先レベルの情報を用いる。ログ抽出部150は、抽出したレコードをログ収集部140に提供する。   The log extraction unit 150 extracts a failure investigation record from the log stored in the storage unit 110 in accordance with the log extraction instruction from the log collection unit 140. The log extraction unit 150 refers to the management information stored in the storage unit 110 and identifies the time range that is the extraction candidate and the priority level of the log type that is the extraction candidate for the current message ID. The log extraction unit 150 uses the upper limit value of the extraction amount notified by the log collection unit 140 and information on the priority level of the identified time range and log type for record extraction. The log extraction unit 150 provides the extracted record to the log collection unit 140.

CM200は、記憶部210、メッセージ生成部220およびログ抽出部230を有する。記憶部210は、CM200が備えるRAMやBUDの記憶領域を用いて実現される。メッセージ生成部220およびログ抽出部230は、CM200が備えるプロセッサを用いて実現される。例えば、CM200のプロセッサは、CM200のRAMに記憶されたプログラムを実行することで、メッセージ生成部220およびログ抽出部230の機能を発揮してもよい。あるいは、メッセージ生成部220およびログ抽出部230は、FPGAやASICなどのハードワイヤードロジックにより実現されてもよい。   The CM 200 includes a storage unit 210, a message generation unit 220, and a log extraction unit 230. The storage unit 210 is realized using a RAM or BUD storage area included in the CM 200. The message generator 220 and the log extractor 230 are realized using a processor included in the CM 200. For example, the processor of the CM 200 may exhibit the functions of the message generation unit 220 and the log extraction unit 230 by executing a program stored in the CM 200 RAM. Alternatively, the message generation unit 220 and the log extraction unit 230 may be realized by hard wired logic such as FPGA or ASIC.

記憶部210は、CM200におけるハードウェア、OS、ミドルウェアおよびアプリケーションなどのコンポーネントの動作に関するログを記憶する。
メッセージ生成部220は、通知制御部130に対して障害の発生を示すメッセージを通知する。メッセージ生成部220は、CM200のコンポーネントにおける障害通知用のモジュールでもよい。また、メッセージ生成部220は、障害発生時以外にも、当該コンポーネントの動作に関するログを記憶部210に格納してもよい。
The storage unit 210 stores a log regarding the operation of components such as hardware, OS, middleware, and applications in the CM 200.
The message generation unit 220 notifies the notification control unit 130 of a message indicating the occurrence of a failure. The message generation unit 220 may be a failure notification module in the CM 200 component. Further, the message generation unit 220 may store a log related to the operation of the component in the storage unit 210 other than when a failure occurs.

ログ抽出部230は、ログ収集部140のログ抽出の指示に応じて、記憶部210に記憶されたログから障害調査用のレコードを抽出する。ログ抽出部230は、記憶部210に記憶された管理情報を参照し、今回のメッセージIDに対して、抽出候補とする時間範囲や抽出候補とするログタイプの優先レベルを特定する。ログ抽出部230は、レコードの抽出に、ログ収集部140により通知された抽出量の上限値、および、特定した時間範囲やログタイプの優先レベルの情報を用いる。ログ抽出部230は、抽出したレコードをログ収集部140に送信する。   The log extraction unit 230 extracts a record for failure investigation from the log stored in the storage unit 210 in accordance with the log extraction instruction from the log collection unit 140. The log extraction unit 230 refers to the management information stored in the storage unit 210 and identifies the time range that is the extraction candidate and the priority level of the log type that is the extraction candidate for the current message ID. The log extraction unit 230 uses the upper limit value of the extraction amount notified by the log collection unit 140 and information on the priority level of the identified time range and log type for record extraction. The log extraction unit 230 transmits the extracted record to the log collection unit 140.

CM300は、記憶部310、メッセージ生成部320およびログ抽出部330を有する。記憶部310は、CM300が備えるRAMやBUDの記憶領域を用いて実現される。メッセージ生成部320およびログ抽出部330は、CM300が備えるプロセッサを用いて実現される。例えば、CM300のプロセッサは、CM300のRAMに記憶されたプログラムを実行することで、メッセージ生成部320およびログ抽出部330の機能を発揮してもよい。あるいは、メッセージ生成部320およびログ抽出部330は、FPGAやASICなどのハードワイヤードロジックにより実現されてもよい。   The CM 300 includes a storage unit 310, a message generation unit 320, and a log extraction unit 330. The storage unit 310 is realized using a RAM or BUD storage area included in the CM 300. The message generation unit 320 and the log extraction unit 330 are realized using a processor included in the CM 300. For example, the processor of the CM 300 may exhibit the functions of the message generation unit 320 and the log extraction unit 330 by executing a program stored in the RAM of the CM 300. Alternatively, the message generation unit 320 and the log extraction unit 330 may be realized by hard wired logic such as FPGA or ASIC.

記憶部310は、CM300におけるハードウェア、OS、ミドルウェアおよびアプリケーションなどのコンポーネントの動作に関するログを記憶する。
メッセージ生成部320は、通知制御部130に対して障害の発生を示すメッセージを通知する。メッセージ生成部320は、CM300のコンポーネントにおける障害通知用のモジュールでもよい。また、メッセージ生成部320は、障害発生時以外にも、当該コンポーネントの動作に関するログを記憶部310に格納してもよい。
The storage unit 310 stores a log related to the operation of components such as hardware, OS, middleware, and applications in the CM 300.
The message generation unit 320 notifies the notification control unit 130 of a message indicating the occurrence of a failure. The message generation unit 320 may be a failure notification module in the CM 300 component. Further, the message generation unit 320 may store a log related to the operation of the component in the storage unit 310 other than when a failure occurs.

ログ抽出部330は、ログ収集部140のログ抽出の指示に応じて、記憶部310に記憶されたログから障害調査用のレコードを抽出する。ログ抽出部330は、記憶部310に記憶された管理情報を参照し、今回のメッセージIDに対して、抽出候補とする時間範囲や抽出候補とするログタイプの優先レベルを特定する。ログ抽出部330は、レコードの抽出に、ログ収集部140により通知された抽出量の上限値、および、特定した時間範囲やログタイプの優先レベルの情報を用いる。ログ抽出部330は、抽出したレコードをログ収集部140に送信する。   The log extraction unit 330 extracts a failure investigation record from the log stored in the storage unit 310 in response to a log extraction instruction from the log collection unit 140. The log extraction unit 330 refers to the management information stored in the storage unit 310 and identifies the time range that is the extraction candidate and the priority level of the log type that is the extraction candidate for the current message ID. The log extraction unit 330 uses the upper limit value of the extraction amount notified by the log collection unit 140 and information on the specified time range and priority level of the log type for record extraction. The log extraction unit 330 transmits the extracted record to the log collection unit 140.

CM400は、記憶部410、メッセージ生成部420およびログ抽出部430を有する。記憶部410は、CM400が備えるRAMやBUDの記憶領域を用いて実現される。メッセージ生成部420およびログ抽出部430は、CM400が備えるプロセッサを用いて実現される。例えば、CM400のプロセッサは、CM400のRAMに記憶されたプログラムを実行することで、メッセージ生成部420およびログ抽出部430の機能を発揮してもよい。あるいは、メッセージ生成部420およびログ抽出部430は、FPGAやASICなどのハードワイヤードロジックにより実現されてもよい。   The CM 400 includes a storage unit 410, a message generation unit 420, and a log extraction unit 430. The storage unit 410 is realized using a RAM or BUD storage area included in the CM 400. The message generation unit 420 and the log extraction unit 430 are realized using a processor included in the CM 400. For example, the processor of the CM 400 may exhibit the functions of the message generation unit 420 and the log extraction unit 430 by executing a program stored in the RAM of the CM 400. Alternatively, the message generation unit 420 and the log extraction unit 430 may be realized by hard wired logic such as FPGA or ASIC.

記憶部410は、CM400におけるハードウェア、OS、ミドルウェアおよびアプリケーションなどのコンポーネントの動作に関するログを記憶する。
メッセージ生成部420は、通知制御部130に対して障害の発生を示すメッセージを通知する。メッセージ生成部420は、CM400のコンポーネントにおける障害通知用のモジュールでもよい。また、メッセージ生成部420は、障害発生時以外にも、当該コンポーネントの動作に関するログを記憶部410に格納してもよい。
The storage unit 410 stores a log regarding the operation of components such as hardware, OS, middleware, and applications in the CM 400.
The message generation unit 420 notifies the notification control unit 130 of a message indicating the occurrence of a failure. The message generation unit 420 may be a failure notification module in the CM 400 component. Further, the message generation unit 420 may store a log related to the operation of the component in the storage unit 410 other than when a failure occurs.

ログ抽出部430は、ログ収集部140のログ抽出の指示に応じて、記憶部410に記憶されたログから障害調査用のレコードを抽出する。ログ抽出部430は、記憶部410に記憶された管理情報を参照し、今回のメッセージIDに対して、抽出候補とする時間範囲や抽出候補とするログタイプの優先レベルを特定する。ログ抽出部430は、レコードの抽出に、ログ収集部140により通知された抽出量の上限値、および、特定した時間範囲やログタイプの優先レベルの情報を用いる。ログ抽出部430は、抽出したレコードをログ収集部140に送信する。   The log extraction unit 430 extracts a failure investigation record from the log stored in the storage unit 410 in response to a log extraction instruction from the log collection unit 140. The log extraction unit 430 refers to the management information stored in the storage unit 410 and identifies the time range that is the extraction candidate and the priority level of the log type that is the extraction candidate for the current message ID. The log extraction unit 430 uses the upper limit value of the extraction amount notified by the log collection unit 140 and information on the priority level of the identified time range and log type for record extraction. The log extraction unit 430 transmits the extracted record to the log collection unit 140.

図6は、第2の実施の形態のページの例を示す図である。ページP1は、ログのレコード(ログレコード)の集合である。ページP1のサイズは、固定サイズである。ページP1のサイズは、例えば、64KB(Kilo Bytes)である。1つのページP1に含まれるレコードの数は、1つでもよいし、2以上でもよい。ページP1に含まれるレコードの数が1つの場合、ページP1とレコードとは同義である。ページP1の例では、ページP1の3行目以降の1行が1つのレコードである。   FIG. 6 is a diagram illustrating an example of a page according to the second embodiment. The page P1 is a set of log records (log records). The size of the page P1 is a fixed size. The size of the page P1 is, for example, 64 KB (Kilo Bytes). The number of records included in one page P1 may be one or two or more. When the number of records included in page P1 is one, page P1 and the record are synonymous. In the example of page P1, one line after the third line of page P1 is one record.

例えば、1つのレコードは、タイムスタンプ(time stamp)、ログタイプ(log type)、モジュール(module)、ログテキスト(log text)のフィールドを含む。
タイムスタンプは、レコードが記録された日時(年月日時分秒)である。ログタイプは、ログの種別である。例えば、ログタイプとして、発行元のハードウェアやソフトウェアおよび障害の内容などに応じて種々の種別が予め定められる。モジュールは、レコードの発行元のモジュール(例えば、ハードウェアやソフトウェアなどのコンポーネントにおける構成部品)の識別名である。ログテキストは、コンポーネントの動作に関するログの具体的な内容を示す情報である。
For example, one record includes fields of time stamp, log type, module, and log text.
The timestamp is the date and time (year / month / day / hour / minute / second) when the record was recorded. The log type is a log type. For example, as the log type, various types are determined in advance according to the hardware and software of the issuer and the content of the failure. The module is an identification name of the module that issued the record (for example, a component in a component such as hardware or software). The log text is information indicating specific contents of the log regarding the operation of the component.

例えば、ページP1には、タイムスタンプ“2017/6/30 18:00:00”、ログタイプ“type1”、モジュール“M1”、ログテキスト“fault xxxxxx”というレコードが登録されている。このレコードは、2017年6月30日18時00分00秒に、ログタイプが“type1”、発行元のモジュールが“M1”、ログテキスト“fault xxxxxx”という情報が記録されたことを示す。   For example, a record of a time stamp “2017/6/30 18:00:00”, a log type “type1”, a module “M1”, and a log text “fault xxxxxxx” is registered in the page P1. This record indicates that information of the log type “type 1”, the issuing module “M1”, and the log text “fault xxxxxxx” was recorded on June 30, 2017 at 18:00:00.

各CMは、ログタイプ毎に、時系列のリスト構造により複数のページを管理する。ページのリスト構造は、各ページを時系列にリンクしたデータ構造である。例えば、あるページの時刻は、当該ページに属するレコードのうちの最も古い時刻(例えば、ページP1であれば“2017/6/30 18:00:00”)である。1つのログタイプに関する一連のページを、ページリストと呼ぶこととする。   Each CM manages a plurality of pages with a time-series list structure for each log type. The page list structure is a data structure in which each page is linked in time series. For example, the time of a certain page is the oldest time of records belonging to the page (for example, “2017/6/30 18:00:00” for page P1). A series of pages related to one log type will be referred to as a page list.

図7は、第2の実施の形態のページリストの例を示す図である。ページリストZ1は、ログタイプ“type1”に関するログである。ページリストZ1は、ページA1,A2,A3,A4,A5,A6,A7を含む。ページリストZ1に属する各ページのうち、ページA1が最も古く、ページA2,A3,A4,A5,A6の順に新しくなり、ページA7が最も新しい。ここで、図中、古いページほど上側に、新しいページほど下側に記載する。すなわち、図面の上側から下側へ向かう方向が時系列の正方向である。ページリストZ1のうち、ページA1は、top(最古)である。ページリストZ1のうち、ページA7は、bottom(最新)である。   FIG. 7 is a diagram illustrating an example of a page list according to the second embodiment. The page list Z1 is a log related to the log type “type1”. The page list Z1 includes pages A1, A2, A3, A4, A5, A6, and A7. Of the pages belonging to the page list Z1, the page A1 is the oldest, the pages A2, A3, A4, A5, A6 are newest, and the page A7 is the newest. Here, in the figure, older pages are listed on the upper side, and newer pages are listed on the lower side. That is, the direction from the upper side to the lower side of the drawing is the time-series positive direction. Of the page list Z1, page A1 is top (oldest). Of page list Z1, page A7 is bottom (latest).

このように、CM100におけるメッセージ生成部120などのログ生成機能は、複数のページを、ログタイプ毎に時系列にリンクさせる。そして、ログ抽出部150は、ページ間のリンクに基づき、各ログタイプのページの抽出順を決定する。ページには1以上のログレコードが含まれる。このため、ログ抽出部150は、ログレコード間のリンクに基づき、各ログタイプのログレコードの抽出順を決定するともいえる。このようなリスト構造によってログを管理することで、ログ抽出部150は、ログ抽出を高速に行える。   As described above, the log generation function such as the message generation unit 120 in the CM 100 links a plurality of pages in time series for each log type. Then, the log extraction unit 150 determines the extraction order of pages of each log type based on the link between pages. A page contains one or more log records. For this reason, it can be said that the log extraction unit 150 determines the extraction order of the log records of each log type based on the link between the log records. By managing logs with such a list structure, the log extraction unit 150 can perform log extraction at high speed.

図8は、第2の実施の形態の割り当て方式管理テーブルの例を示す図である。割り当て方式管理テーブル111は、各CMで抽出するページのサイズの上限値を決定するために用いられる情報である。割り当て方式管理テーブル111は、記憶部110に予め記憶されている。割り当て方式管理テーブル111は、マスタCMにより用いられる情報であるが、記憶部210,310,410にも記憶されていてもよい。割り当て方式管理テーブル111は、メッセージIDおよび割り当て方式の項目を含む。   FIG. 8 is a diagram illustrating an example of an allocation method management table according to the second embodiment. The allocation method management table 111 is information used to determine the upper limit value of the page size extracted by each CM. The allocation method management table 111 is stored in the storage unit 110 in advance. The allocation method management table 111 is information used by the master CM, but may also be stored in the storage units 210, 310, and 410. The assignment method management table 111 includes items of message ID and assignment method.

メッセージIDの項目には、メッセージ生成部120(あるいは、他CMのメッセージ生成部220,320,420)により生成されるメッセージに含まれ得るメッセージIDが登録される。割り当て方式の項目には、各CMで抽出するページのサイズの決定方法(割り当て方式)の識別情報が登録される。   In the message ID item, a message ID that can be included in a message generated by the message generation unit 120 (or the message generation unit 220, 320, or 420 of another CM) is registered. In the allocation method item, identification information of a method for determining the size of a page (allocation method) to be extracted by each CM is registered.

ここで、一例では、割り当て方式を、割り当て方式A,B,Cの3種類とする。
割り当て方式Aは、標準の割り当て方式である。割り当て方式Aでは、各CMに対する割り当てサイズ(抽出量の上限値に相当)を同じにする。サポートサーバ60に送信可能な収集ログのサイズの上限が1MBで、CM数が4の場合、CM毎に256KBを割り当てる。この場合、1つのCMは、抽出量の上限値256KBまでページを抽出する。
Here, in one example, there are three types of allocation methods A, B, and C.
The allocation method A is a standard allocation method. In the allocation method A, the allocation size (corresponding to the upper limit value of the extraction amount) for each CM is the same. When the upper limit of the size of the collected log that can be transmitted to the support server 60 is 1 MB and the number of CMs is 4, 256 KB is allocated for each CM. In this case, one CM extracts pages up to the upper limit 256 KB of the extraction amount.

割り当て方式Bは、マスタCM優先の割り当て方式である。割り当て方式Bでは、マスタCMに対する割り当てを、他CMの2倍にする。マスタCMは、ストレージシステム全体を管理するCMであり、全体動作の調査を要する障害の場合に、割り当て方式Bを採用する。例えば、サポートサーバ60に送信可能な収集ログのサイズの上限が1MBで、CM数が4の場合、マスタCMの割り当てサイズは410KBであり、他CMの割り当てサイズは205KBである。   The allocation method B is a master CM priority allocation method. In the allocation method B, the allocation to the master CM is made twice that of other CMs. The master CM is a CM that manages the entire storage system, and adopts the allocation method B in the case of a failure that requires an investigation of the overall operation. For example, when the upper limit of the size of the collection log that can be transmitted to the support server 60 is 1 MB and the number of CMs is 4, the allocation size of the master CM is 410 KB, and the allocation size of other CMs is 205 KB.

割り当て方式Cは、障害検出CM優先の割り当て方式である。割り当て方式Cでは、障害を検出したCMの割り当てを、他CMの2倍にする。特定の機能に関する障害であり、当該機能の処理を行っていたCMの情報をより多く要する場合に、割り当て方式Cを採用する。例えば、サポートサーバ60に送信可能な収集ログのサイズの上限が1MBで、CM数が4の場合、障害検出CMの割り当てサイズは410KBであり、他CMの割り当てサイズ205KBである。   Allocation method C is a failure detection CM priority allocation method. In the allocation method C, the allocation of CMs in which a failure has been detected is twice that of other CMs. Allocation method C is employed when a failure is related to a specific function and more information on the CM that has been processing the function is required. For example, when the upper limit of the size of the collected log that can be transmitted to the support server 60 is 1 MB and the number of CMs is 4, the allocation size of the failure detection CM is 410 KB and the allocation size of other CMs is 205 KB.

例えば、割り当て方式管理テーブル111には、メッセージIDが“a00000001”、割り当て方式が“A(標準)”という情報が登録される。これは、メッセージID“a00000001”を含むメッセージが検出された場合に、割り当て方式Aにより各CMに対するサイズ割り当てを行うことを示す。   For example, information that the message ID is “a00000001” and the assignment method is “A (standard)” is registered in the assignment method management table 111. This indicates that when a message including the message ID “a00000001” is detected, size allocation is performed for each CM by the allocation method A.

図9は、第2の実施の形態のログ抽出管理テーブルの例を示す図である。ログ抽出管理テーブル112は、メッセージIDに応じたログ抽出対象の時間範囲およびログタイプ毎の優先レベルが登録された情報である。ログ抽出管理テーブル112は、記憶部110に予め記憶されている。ログ抽出管理テーブル112は、記憶部210,310,410にも予め記憶されている。ログ抽出管理テーブル112は、メッセージID、時間範囲およびログタイプの優先レベルの項目を含む。   FIG. 9 illustrates an example of a log extraction management table according to the second embodiment. The log extraction management table 112 is information in which a log extraction target time range corresponding to a message ID and a priority level for each log type are registered. The log extraction management table 112 is stored in the storage unit 110 in advance. The log extraction management table 112 is also stored in advance in the storage units 210, 310, and 410. The log extraction management table 112 includes items of message ID, time range, and log type priority level.

メッセージIDの項目には、メッセージ生成部120(あるいは、他CMのメッセージ生成部220,320,420)により生成されるメッセージに含まれ得るメッセージIDが登録される。時間範囲の項目には、ログ抽出対象の時間範囲が登録される。当該時間範囲は、障害発生時から何時間前のログまでを抽出対象とするかを示す。すなわち、障害発生時から当該時間範囲の分だけ遡った時刻までがログ抽出対象の時間範囲である。時間範囲の単位は、例えば、時間(hour)である。ログタイプの優先レベルは、ログタイプ毎の優先レベルである。優先レベルは、レベル“1”が最も優先順位が高く、レベル“2”、“3”、・・・とレベルの数値が大きくなるほど、優先順位が低くなる。なお、優先レベル“0”は、抽出しないことを示す。また、優先レベルが同じ複数のログタイプについては、時刻(タイムスタンプ)が新しいページを優先して抽出する。   In the message ID item, a message ID that can be included in a message generated by the message generation unit 120 (or the message generation unit 220, 320, or 420 of another CM) is registered. In the time range item, a time range for log extraction is registered. The time range indicates how many hours before the failure occurs to be extracted. That is, the time range for log extraction is from the time of failure occurrence to the time that is back by the time range. The unit of the time range is, for example, time (hour). The log type priority level is a priority level for each log type. As for the priority level, the level “1” has the highest priority, and the higher the level “2”, “3”,..., The lower the priority. The priority level “0” indicates that no extraction is performed. For a plurality of log types having the same priority level, a page with a new time (time stamp) is extracted with priority.

例えば、ログ抽出管理テーブル112には、メッセージIDが“a00000001”、時間範囲が“12”、ログタイプ“type1”の優先レベル“1”、ログタイプ“type2”の優先レベル“1”、ログタイプ“type3”の優先レベル“1”、ログタイプ“type4”の優先レベル“1”、ログタイプ“type5”の優先レベル“1”、・・・という情報が登録される。これは、メッセージID“a00000001”を含むメッセージが検出された場合、当該検出時(障害発生時)から12時間前に遡った時刻までをログ抽出対象の時間範囲とすることを示す。また、各ログタイプの優先レベルにしたがって、ログ抽出を行うことを示す(この場合、ログタイプ“type1”〜“type5”までの優先レベルは“1”で同じである)。なお、各ログタイプの優先レベルにしたがったログ抽出方法の具体例は後述される。   For example, in the log extraction management table 112, the message ID is “a00000001”, the time range is “12”, the priority level is “1” for the log type “type1”, the priority level is “1” for the log type “type2”, and the log type. Information such as a priority level “1” of “type 3”, a priority level “1” of the log type “type 4”, a priority level “1” of the log type “type 5”, and the like are registered. This indicates that when a message including the message ID “a00000001” is detected, the time range from the time of the detection (at the time of the failure) to the time that goes back 12 hours is set as the log extraction target time range. It also indicates that log extraction is performed according to the priority level of each log type (in this case, the priority levels of log types “type1” to “type5” are the same as “1”). A specific example of the log extraction method according to the priority level of each log type will be described later.

図10は、第2の実施の形態のログ収集例を示す図である。マスタCMであるCM100は、CM100,200,300,400の何れかから障害に関する所定のメッセージを受け付けると、割り当て方式管理テーブル111に基づいて、各CMのログの抽出量の上限値を決定する。また、CM100は、ログ抽出管理テーブル112に基づいて、ログ抽出対象の時間範囲およびログタイプ毎の優先レベルを決定する。CM100は、決定した上限値、時間範囲および優先レベルによるログ抽出を、CM200,300,400に指示する。また、CM100は、自装置においてもログ抽出を行う。   FIG. 10 is a diagram illustrating an example of log collection according to the second embodiment. When the CM 100 as the master CM receives a predetermined message regarding a failure from any one of the CMs 100, 200, 300, and 400, the CM 100 determines an upper limit value of the log extraction amount of each CM based on the allocation method management table 111. Further, the CM 100 determines a priority level for each log type and a time range for log extraction based on the log extraction management table 112. The CM 100 instructs the CMs 200, 300, and 400 to perform log extraction based on the determined upper limit value, time range, and priority level. Further, the CM 100 also performs log extraction in its own device.

例えば、抽出ログL1は、CM100においてBUD106に記憶されたログから抽出されたページ群である。抽出ログL2は、CM200においてBUD206に記憶されたログから抽出されたページ群である。抽出ログL3は、CM300においてBUD306に記憶されたログから抽出されたページ群である。抽出ログL4は、CM400においてBUD406に記憶されたログから抽出されたページ群である。   For example, the extracted log L1 is a page group extracted from a log stored in the BUD 106 in the CM 100. The extracted log L2 is a page group extracted from the log stored in the BUD 206 in the CM 200. The extracted log L3 is a group of pages extracted from the log stored in the BUD 306 in the CM 300. The extracted log L4 is a group of pages extracted from the log stored in the BUD 406 in the CM 400.

CM100は、抽出ログL1,L2,L3,L4を収集する。収集ログL0は、抽出ログL1,L2,L3,L4の収集結果である。CM100は、LAN40およびインターネット50を介して、サポートサーバ60に収集ログL0を送信する。   The CM 100 collects the extraction logs L1, L2, L3, and L4. The collection log L0 is a collection result of the extraction logs L1, L2, L3, and L4. The CM 100 transmits the collection log L0 to the support server 60 via the LAN 40 and the Internet 50.

次に、上記の各CMによる処理手順を具体的に説明する。
図11は、第2の実施の形態のログ収集例を示すフローチャートである。以下、図11に示す処理をステップ番号に沿って説明する。ログ収集部140は、通知制御部130から障害通知のメッセージの検出結果を受け付けると下記の手順を行う。
Next, the processing procedure by each CM will be specifically described.
FIG. 11 is a flowchart illustrating an example of log collection according to the second embodiment. In the following, the process illustrated in FIG. 11 will be described in order of step number. When the log collection unit 140 receives the detection result of the failure notification message from the notification control unit 130, the log collection unit 140 performs the following procedure.

(S11)ログ収集部140は、記憶部110に記憶された割り当て方式管理テーブル111から、今回のメッセージに対応する割り当て方式を取得する。具体的には、ログ収集部140は、障害通知のメッセージに含まれるメッセージIDに対応する割り当て方式を、割り当て方式管理テーブル111から取得する。   (S11) The log collection unit 140 acquires an allocation method corresponding to the current message from the allocation method management table 111 stored in the storage unit 110. Specifically, the log collection unit 140 acquires an assignment method corresponding to the message ID included in the failure notification message from the assignment method management table 111.

(S12)ログ収集部140は、ステップS11で取得した割り当て方式にしたがって、各CMのログ抽出量の上限値を計算する。
(S13)ログ収集部140は、CM番号Nを、N=0に設定する。ログ収集部140は、CM番号N=0に対応するCM100のログ抽出部150にログ抽出を指示する。ログ抽出の指示は、ログ抽出量の上限値を含む。
(S12) The log collection unit 140 calculates the upper limit value of the log extraction amount of each CM according to the allocation method acquired in step S11.
(S13) The log collection unit 140 sets the CM number N to N = 0. The log collection unit 140 instructs the log extraction unit 150 of the CM 100 corresponding to the CM number N = 0 to perform log extraction. The log extraction instruction includes an upper limit value of the log extraction amount.

(S14)ログ抽出部150,230,330,430は、ログ収集部140のログ抽出の指示に応じて、CM単位のログ抽出処理を行う。CM単位のログ抽出処理の詳細は後述される。   (S14) The log extraction units 150, 230, 330, and 430 perform CM-unit log extraction processing in accordance with the log extraction instruction from the log collection unit 140. Details of the CM-unit log extraction processing will be described later.

(S15)ログ収集部140は、全CM(CM100,200,300,400)のログ(抽出ログ)を収集済であるか否かを判定する。全CMのログを収集済である場合、ログ収集部140は、ステップS17に処理を進める。全CMのログを収集済でない場合、ログ収集部140は、ステップS16に処理を進める。   (S15) The log collection unit 140 determines whether logs (extraction logs) of all CMs (CMs 100, 200, 300, 400) have been collected. If all CM logs have been collected, the log collection unit 140 proceeds to step S17. If the logs of all CMs have not been collected, the log collection unit 140 proceeds to step S16.

(S16)ログ収集部140は、CM番号Nを、N=N+1に設定する(CM番号をインクリメントする)。そして、ログ収集部140は、CM番号Nに対応するCMのログ抽出部(ログ抽出部230,330,430の何れか)に対してログ抽出を指示して、ステップS14に処理を進める。   (S16) The log collection unit 140 sets the CM number N to N = N + 1 (increments the CM number). Then, the log collection unit 140 instructs the log extraction unit (any one of the log extraction units 230, 330, and 430) of the CM corresponding to the CM number N to perform log extraction, and proceeds to step S14.

(S17)ログ収集部140は、通知制御部130に収集ログを提供する。収集ログは、各CMから収集された抽出された抽出ログの集合である。通知制御部130は、サポートサーバ60に収集ログを送信する。   (S17) The log collection unit 140 provides the collection log to the notification control unit 130. The collection log is a set of extracted extraction logs collected from each CM. The notification control unit 130 transmits the collection log to the support server 60.

このように、記憶部110は、抽出するページの合計サイズの上限値の算出方法(割り当て方式)をメッセージ毎に登録した割り当て方式管理テーブル111を記憶する。ログ収集部140は、メッセージを検出すると、記憶部110に記憶された割り当て方式管理テーブル111を参照して、当該メッセージに応じた算出方法に基づき、上限値を算出する。特に、ログ収集部140は、メッセージに応じて、複数のCM(CM100,200,300,400)それぞれによるCM毎(情報処理装置毎)のログ(動作情報)からのページの抽出を指示する。ログ収集部140は、ページの抽出を指示する際に、メッセージに応じた算出方法に基づき、CM毎の抽出ログのサイズの上限値を決定し、決定した上限値を、各CMに通知する。これにより、障害に応じて、障害解析に有用なログを収集可能となる。   As described above, the storage unit 110 stores the allocation method management table 111 in which the calculation method (allocation method) of the upper limit value of the total size of pages to be extracted is registered for each message. When the log collection unit 140 detects a message, the log collection unit 140 refers to the allocation method management table 111 stored in the storage unit 110 and calculates an upper limit value based on a calculation method according to the message. In particular, the log collection unit 140 instructs extraction of a page from a log (operation information) for each CM (for each information processing apparatus) by each of a plurality of CMs (CMs 100, 200, 300, and 400) according to a message. When instructing page extraction, the log collection unit 140 determines the upper limit value of the size of the extracted log for each CM based on the calculation method according to the message, and notifies each CM of the determined upper limit value. Thereby, logs useful for failure analysis can be collected according to the failure.

図12は、第2の実施の形態のCM単位のログ抽出例を示すフローチャートである。以下、図12に示す処理をステップ番号に沿って説明する。以下の手順は、図11のステップS14に相当する。ここで、以下の説明では、ログ抽出部150の処理手順を例示するが、ログ抽出部230,330,430も同様の処理手順となる。   FIG. 12 is a flowchart illustrating an example of CM-unit log extraction according to the second embodiment. In the following, the process illustrated in FIG. 12 will be described in order of step number. The following procedure corresponds to step S14 in FIG. Here, in the following description, the processing procedure of the log extraction unit 150 is illustrated, but the log extraction units 230, 330, and 430 also have the same processing procedure.

(S21)ログ抽出部150は、記憶部110に記憶されたログ抽出管理テーブル112から、今回のメッセージに対応する時間範囲を取得する。具体的には、ログ抽出部150は、障害通知のメッセージに含まれるメッセージIDに対応する時間範囲を、ログ抽出管理テーブル112から取得する。   (S21) The log extraction unit 150 acquires a time range corresponding to the current message from the log extraction management table 112 stored in the storage unit 110. Specifically, the log extraction unit 150 acquires a time range corresponding to the message ID included in the failure notification message from the log extraction management table 112.

(S22)ログ抽出部150は、取得した時間範囲内のログ抽出処理を実行する。時間範囲内のログ抽出処理の詳細は後述される。
(S23)ログ抽出部150は、ステップS22で抽出したログ(抽出ログ)をログ収集部140に提供する。
(S22) The log extraction unit 150 executes log extraction processing within the acquired time range. Details of the log extraction processing within the time range will be described later.
(S23) The log extraction unit 150 provides the log collection unit 140 with the log (extraction log) extracted in step S22.

図13は、第2の実施の形態の時間範囲内のログ抽出例を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。以下の手順は、図12のステップS22に相当する。   FIG. 13 is a flowchart illustrating an example of log extraction within a time range according to the second embodiment. In the following, the process illustrated in FIG. 13 will be described in order of step number. The following procedure corresponds to step S22 in FIG.

(S31)ログ抽出部150は、優先レベルPを、P=1に設定する。
(S32)ログ抽出部150は、優先レベル単位のログ抽出処理を行う。優先レベル単位のログ抽出処理の詳細は、後述される。
(S31) The log extraction unit 150 sets the priority level P to P = 1.
(S32) The log extraction unit 150 performs log extraction processing in units of priority levels. Details of the log extraction processing in units of priority levels will be described later.

(S33)ログ抽出部150は、ログ抽出部150による抽出ログの抽出量の合計が上限値に達したか否かを判定する。抽出量の合計が上限値に達した場合、ログ抽出部150は、処理を終了する。抽出量の合計が上限値に達していない場合、ログ抽出部150は、処理をステップS34に進める。   (S33) The log extraction unit 150 determines whether the total extraction amount of the extracted logs by the log extraction unit 150 has reached the upper limit value. When the total of the extraction amounts reaches the upper limit value, the log extraction unit 150 ends the process. When the total of the extraction amounts has not reached the upper limit value, the log extraction unit 150 proceeds with the process to step S34.

(S34)ログ抽出部150は、全優先レベルのページの抽出を行ったか否かを判定する。全優先レベルのページの抽出を行った場合、ログ抽出部150は、処理を終了する。全優先レベルのページの抽出を行っていない場合、ログ抽出部150は、ステップS35に処理を進める。全優先レベルのページの抽出を行った場合とは、優先レベルPの値が最高値(優先順位が最低であることに相当)に達した場合である。   (S34) The log extraction unit 150 determines whether pages of all priority levels have been extracted. When the pages of all priority levels are extracted, the log extraction unit 150 ends the process. If the extraction of all priority level pages has not been performed, the log extraction unit 150 proceeds to step S35. The case where the pages of all priority levels are extracted is when the value of the priority level P reaches the highest value (corresponding to the lowest priority order).

(S35)ログ抽出部150は、優先レベルPを、P=P+1に設定する(優先レベルPをインクリメントする)。そして、ログ抽出部150は、ステップS32に処理を進める。   (S35) The log extraction unit 150 sets the priority level P to P = P + 1 (increments the priority level P). Then, the log extraction unit 150 proceeds with the process to step S32.

図14は、第2の実施の形態の優先レベル単位のログ抽出例を示すフローチャートである。以下、図14に示す処理をステップ番号に沿って説明する。以下の手順は、図13のステップS32に相当する。   FIG. 14 is a flowchart illustrating an example of log extraction in priority level units according to the second embodiment. In the following, the process illustrated in FIG. 14 will be described in order of step number. The following procedure corresponds to step S32 in FIG.

(S41)ログ抽出部150は、着目する優先レベルPのログタイプのbottomページ(最新のページ)のタイムスタンプを取得する。なお、優先レベルPであるログタイプが複数の場合、複数のログタイプの各bottomページのうち、最新のタイムスタンプを取得する。   (S41) The log extraction unit 150 acquires the time stamp of the bottom page (latest page) of the log type of the priority level P of interest. When there are a plurality of log types having the priority level P, the latest time stamp is acquired from each bottom page of the plurality of log types.

(S42)ログ抽出部150は、タイムスタンプが全て時間範囲外であるか否かを判定する。タイムスタンプが全て時間範囲外である場合、ログ抽出部150は、処理を終了する。タイムスタンプが全て時間範囲外でない場合、ログ抽出部150は、ステップS43に処理を進める。タイムスタンプが全て時間範囲外である場合とは、ステップS41で取得したタイムスタンプが、現時刻から当該時間範囲分だけ遡った時刻よりも過去の時刻を示している場合である。   (S42) The log extraction unit 150 determines whether all time stamps are out of the time range. When all the time stamps are out of the time range, the log extracting unit 150 ends the process. When all the time stamps are not out of the time range, the log extraction unit 150 proceeds with the process to step S43. The case where all the time stamps are out of the time range is a case where the time stamp acquired in step S41 indicates a time that is in the past from a time that is back by the time range from the current time.

(S43)ログ抽出部150は、最新のタイムスタンプのページを抽出し、当該ページが属するページリストのリンクから当該ページを外す。
(S44)ログ抽出部150は、抽出量の合計が上限値に達したか否かを判定する。抽出量の合計が上限値に達した場合、ログ抽出部150は、処理を終了する。抽出量の合計が上限値に達していない場合、ログ抽出部150は、ステップS45に処理を進める。
(S43) The log extraction unit 150 extracts the page with the latest time stamp, and removes the page from the link of the page list to which the page belongs.
(S44) The log extraction unit 150 determines whether or not the total amount of extraction has reached the upper limit. When the total of the extraction amounts reaches the upper limit value, the log extraction unit 150 ends the process. When the total of the extraction amounts has not reached the upper limit value, the log extraction unit 150 proceeds with the process to step S45.

(S45)ログ抽出部150は、着目する優先レベルPのログタイプのページが残っているか否かを判定する。該当のログタイプのページが残っている場合、ログ抽出部150は、ステップS41に処理を進める。該当のログタイプのページが残っていない場合、ログ抽出部150は、処理を終了する。   (S45) The log extraction unit 150 determines whether or not a log type page with a priority level P of interest remains. When the log type page remains, the log extraction unit 150 advances the process to step S41. If no page of the corresponding log type remains, the log extraction unit 150 ends the process.

このように、ログ抽出部150は、現時刻から過去の時間範囲に属するページ群(ログレコード群ともいえる)のうち、第1の優先レベルに対応する第1のページ(第1のログレコード)を、第1の優先レベルで示される優先順位よりも低い優先順位を示す第2の優先レベルに対応する第2のページ(第2のログレコード)よりも優先的に抽出する。これにより、限られたサイズの中で、抽出されるページ(ログレコード)を、障害解析に有用なページ(ログレコード)に適切に絞り込むことができる。   As described above, the log extraction unit 150 selects the first page (first log record) corresponding to the first priority level among the page groups (also referred to as log record groups) belonging to the past time range from the current time. Are extracted with higher priority than the second page (second log record) corresponding to the second priority level indicating a lower priority level than the priority level indicated by the first priority level. As a result, the pages (log records) to be extracted can be appropriately narrowed down to pages (log records) useful for failure analysis within a limited size.

次に、ログ抽出部150によるログ抽出の具体例を説明する。ログ抽出部150について主に説明するが、ログ抽出部230,330,430も同様にしてログ抽出を行う。
図15は、第2の実施の形態のログ抽出例(その1)を示す図である。図15の例では、あるメッセージに対するログ抽出について次の条件を考える。抽出量の上限値は、ページ11個分(例えば、1ページのサイズが64KBの場合、64KB×11=704KB)である。ログ抽出の時間範囲はx時間である。抽出対象のログタイプは、“type1”、“type2”および“type3”である。ログタイプ“type1”、“type2”、“type3”の優先レベルは何れも“1”である。
Next, a specific example of log extraction by the log extraction unit 150 will be described. Although the log extracting unit 150 will be mainly described, the log extracting units 230, 330, and 430 perform log extraction in the same manner.
FIG. 15 is a diagram illustrating a log extraction example (part 1) according to the second embodiment. In the example of FIG. 15, the following conditions are considered for log extraction for a certain message. The upper limit of the extraction amount is 11 pages (for example, when the size of one page is 64 KB, 64 KB × 11 = 704 KB). The time range for log extraction is x hours. The log types to be extracted are “type 1”, “type 2”, and “type 3”. The priority levels of the log types “type 1”, “type 2”, and “type 3” are all “1”.

また、ページリストZ1は、ログタイプ“type1”のページリストである。ページリストZ1は、タイムスタンプの古い方から新しい方へ向かって、ページA1,A2,A3,A4,A5,A6,A7を含む。ページリストZ2は、ログタイプ“type2”のページリストである。ページリストZ2は、タイムスタンプの古い方から新しい方へ向かって、ページB1,B2,B3,B4,B5,B6,B7を含む。ページリストZ3は、ログタイプ“type3”のページリストである。ページリストZ3は、タイムスタンプの古い方から新しい方へ向かって、ページC1,C2,C3,C4,C5,C6,C7を含む。   The page list Z1 is a page list of the log type “type1”. The page list Z1 includes pages A1, A2, A3, A4, A5, A6, and A7 from the oldest time stamp to the newest time stamp. The page list Z2 is a page list of the log type “type2”. The page list Z2 includes pages B1, B2, B3, B4, B5, B6, and B7 from the oldest time stamp to the newest time stamp. The page list Z3 is a page list of the log type “type3”. The page list Z3 includes pages C1, C2, C3, C4, C5, C6, and C7 from the oldest time stamp to the newest time stamp.

この場合、メッセージの検出時(障害発生時)を現在とすると、現在からx時間前までがログ抽出対象の時間範囲である。図15の例では、ページA3,B3,C3以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   In this case, assuming that the time when a message is detected (when a failure occurs) is present, the time range from the present to x hours before is the log extraction target time range. In the example of FIG. 15, the time stamps of pages A3, B3, and C3 and subsequent pages are included in the time range for log extraction.

ここで、図15における各ページの左側に付した数字は、ログ抽出処理において該当のページが抽出される順番を示す(以降の図に関しても同様)。
上記のように、各ログタイプの優先レベルは“1”であり、ページリストZ1,Z2,Z3に属する各ページのうちの最新のページB7は、現在からx時間前の時刻よりも後の時刻である。このため、ログ抽出部150は、ページB7を抽出する。そして、ログ抽出部150は、ページリストZ2からページB7を外す。あるページが、あるページリストから外されると当該ページは、当該ページリストに属するページではなくなる。
Here, the numbers attached to the left side of each page in FIG. 15 indicate the order in which the corresponding page is extracted in the log extraction process (the same applies to the following figures).
As described above, the priority level of each log type is “1”, and the latest page B7 among the pages belonging to the page lists Z1, Z2, and Z3 is a time later than the time x hours before the current time. It is. For this reason, the log extraction unit 150 extracts the page B7. Then, the log extraction unit 150 removes the page B7 from the page list Z2. When a page is removed from a page list, the page is no longer a page belonging to the page list.

以降の処理でも、ログ抽出部150は、抽出候補のページがx時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ1,Z2,Z3に属する各ページのうち、最新のページA7を抽出する。そして、ログ抽出部150は、ページリストZ1からページA7を外す。
Also in the subsequent processing, the log extraction unit 150 confirms that the extraction candidate page is a time later than the time before x hours.
Second, the log extraction unit 150 extracts the latest page A7 from the pages belonging to the page lists Z1, Z2, and Z3. Then, the log extraction unit 150 removes the page A7 from the page list Z1.

3番目に、ログ抽出部150は、ページリストZ1,Z2,Z3に属する各ページのうち、最新のページC7を抽出する。そして、ログ抽出部150は、ページリストZ3からページC7を外す。   Third, the log extraction unit 150 extracts the latest page C7 from the pages belonging to the page lists Z1, Z2, and Z3. Then, the log extraction unit 150 removes the page C7 from the page list Z3.

4番目に、ログ抽出部150は、ページリストZ1,Z2,Z3に属する各ページのうち、最新のページA6を抽出する。そして、ログ抽出部150は、ページリストZ1からページA6を外す。   Fourth, the log extraction unit 150 extracts the latest page A6 from the pages belonging to the page lists Z1, Z2, and Z3. Then, the log extraction unit 150 removes the page A6 from the page list Z1.

以降、同様にして、ログ抽出部150は、ページの抽出を行う。5番目に抽出されるページは、ページB6である。6番目に抽出されるページは、ページC6である。7番目に抽出されるページは、ページC5である。8番目に抽出されるページは、ページB5である。9番目に抽出されるページは、ページA5である。10番目に抽出されるページは、ページA4である。11番目に抽出されるページは、ページB4である。   Thereafter, similarly, the log extraction unit 150 performs page extraction. The fifth extracted page is page B6. The sixth page to be extracted is page C6. The seventh extracted page is page C5. The eighth extracted page is page B5. The ninth extracted page is page A5. The tenth page extracted is page A4. The eleventh extracted page is page B4.

ログ抽出部150は、ページB4を抽出すると、抽出量の上限値に達したことを検出して、ログ抽出を終了する。抽出ログL1aは、上記の処理によってログ抽出部150により抽出されたページB7,A7,C7,A6,B6,C6,C5,B5,A5,A4,B4を含む。   When extracting the page B4, the log extraction unit 150 detects that the upper limit of the extraction amount has been reached, and ends the log extraction. The extracted log L1a includes pages B7, A7, C7, A6, B6, C6, C5, B5, A5, A4, and B4 extracted by the log extracting unit 150 by the above processing.

図16は、第2の実施の形態のログ抽出例(その2)を示す図である。図16の例では、あるメッセージに対するログ抽出について次の条件を考える。抽出量の上限値は、ページ11個分である。ログ抽出の時間範囲はx時間である。抽出対象のログタイプは、“type1”、“type2”および“type3”である。ログタイプ“type1”の優先レベルは“1”である。ログタイプ“type2”の優先レベルは“2”である。ログタイプ“type3”の優先レベルは“3”である。ページリストZ1,Z2,Z3に属する各ページは、図15と同様である。   FIG. 16 is a diagram illustrating a log extraction example (part 2) according to the second embodiment. In the example of FIG. 16, the following conditions are considered for log extraction for a certain message. The upper limit of the extraction amount is 11 pages. The time range for log extraction is x hours. The log types to be extracted are “type 1”, “type 2”, and “type 3”. The priority level of the log type “type1” is “1”. The priority level of the log type “type2” is “2”. The priority level of the log type “type 3” is “3”. Each page belonging to the page list Z1, Z2, Z3 is the same as that shown in FIG.

メッセージの検出時(障害発生時)を現在とすると、現在からx時間前までがログ抽出対象の時間範囲である。図16の例では、ページA3,B3,C3以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   Assuming that the time when a message is detected (when a failure occurs) is the time range from the present to x hours before the log extraction target. In the example of FIG. 16, the time stamps in the pages after pages A3, B3, and C3 are included in the time range for log extraction.

最も優先順位の高いログタイプ“type1”の最新のページA7は、現在からx時間前の時刻よりも後の時刻である。このため、ログ抽出部150は、ページA7を抽出する。そして、ログ抽出部150は、ページリストZ1からページA7を外す。   The latest page A7 of the log type “type1” with the highest priority is a time later than the time x hours before the present time. For this reason, the log extraction unit 150 extracts the page A7. Then, the log extraction unit 150 removes the page A7 from the page list Z1.

以降の処理でも、ログ抽出部150は、抽出候補のページがx時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA6を抽出する。そして、ログ抽出部150は、ページリストZ1からページA6を外す。
Also in the subsequent processing, the log extraction unit 150 confirms that the extraction candidate page is a time later than the time before x hours.
Second, the log extraction unit 150 extracts the latest page A6 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A6 from the page list Z1.

3番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA5を抽出する。そして、ログ抽出部150は、ページリストZ1からページA5を外す。   Third, the log extraction unit 150 extracts the latest page A5 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A5 from the page list Z1.

4番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA4を抽出する。そして、ログ抽出部150は、ページリストZ1からページA4を外す。   Fourth, the log extraction unit 150 extracts the latest page A4 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A4 from the page list Z1.

5番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA3を抽出する。そして、ログ抽出部150は、ページリストZ1からページA3を外す。   Fifth, the log extraction unit 150 extracts the latest page A3 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A3 from the page list Z1.

ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA2のタイムスタンプが、現在からx時間前の時刻よりも前の時刻を示すことを確認し、ページリストZ1からのログ抽出を完了する。ログ抽出部150は、抽出量の上限値に未だ達していないため、次に優先順位の高いログタイプ“type2”のページリストZ2からのログ抽出に移る。   The log extraction unit 150 confirms that the time stamp of the latest page A2 among the pages belonging to the page list Z1 indicates a time before x hours before the current time, and logs from the page list Z1. Complete the extraction. Since the log extraction unit 150 has not yet reached the upper limit of the extraction amount, the log extraction unit 150 proceeds to log extraction from the page list Z2 of the log type “type 2” having the next highest priority.

6番目に、ログ抽出部150は、ページリストZ2に属する各ページのうち、最新のページB7を抽出する。そして、ログ抽出部150は、ページリストZ2からページB7を外す。   Sixth, the log extraction unit 150 extracts the latest page B7 from the pages belonging to the page list Z2. Then, the log extraction unit 150 removes the page B7 from the page list Z2.

以降、同様にして、ログ抽出部150は、ページB6,B5,B4,B3をページリストZ2から順番に抽出する。そして、ログ抽出部150は、ページリストZ2に属する各ページのうち、最新のページB2のタイムスタンプが現在からx時間前の時刻よりも前の時刻を示すことを確認し、ページリストZ2からのログ抽出を完了する。ログ抽出部150は、抽出量の上限値に未だ達していないため、次に優先順位の高いログタイプ“type3”のページリストZ3からのログ抽出に移る。   Thereafter, similarly, the log extraction unit 150 sequentially extracts pages B6, B5, B4, and B3 from the page list Z2. Then, the log extraction unit 150 confirms that the time stamp of the latest page B2 among the pages belonging to the page list Z2 indicates a time before x hours before the current time, and from the page list Z2. Complete log extraction. Since the log extraction unit 150 has not yet reached the upper limit of the extraction amount, the log extraction unit 150 proceeds to log extraction from the page list Z3 of the log type “type3” having the next highest priority.

11番目に、ログ抽出部150は、ページリストZ3からページC7を抽出する。そして、ログ抽出部150は、ページリストZ3からページC7を外す。
ログ抽出部150は、ページC7を抽出すると、抽出量の上限値に達したことを検出して、ログ抽出を終了する。抽出ログL1bは、上記の処理によってログ抽出部150により抽出されたページA7,A6,A5,A4,A3,B7,B6,B5,B4,B3,C7を含む。
Eleventh, the log extraction unit 150 extracts a page C7 from the page list Z3. Then, the log extraction unit 150 removes the page C7 from the page list Z3.
When extracting the page C7, the log extraction unit 150 detects that the upper limit of the extraction amount has been reached, and ends the log extraction. The extracted log L1b includes pages A7, A6, A5, A4, A3, B7, B6, B5, B4, B3, and C7 extracted by the log extracting unit 150 by the above processing.

図17は、第2の実施の形態のログ抽出例(その3)を示す図である。図17の例では、あるメッセージに対するログ抽出について次の条件を考える。抽出量の上限値は、ページ11個分である。ログ抽出の時間範囲はx時間である。抽出対象のログタイプは、“type1”、“type2”および“type3”である。ログタイプ“type1”の優先レベルは“1”である。ログタイプ“type2”、“type3”の優先レベルは何れも“2”である。ページリストZ1,Z2,Z3に属する各ページは、図15と同様である。   FIG. 17 is a diagram illustrating a log extraction example (part 3) according to the second embodiment. In the example of FIG. 17, the following conditions are considered for log extraction for a certain message. The upper limit of the extraction amount is 11 pages. The time range for log extraction is x hours. The log types to be extracted are “type 1”, “type 2”, and “type 3”. The priority level of the log type “type1” is “1”. The priority levels of the log types “type 2” and “type 3” are both “2”. Each page belonging to the page list Z1, Z2, Z3 is the same as that shown in FIG.

メッセージの検出時(障害発生時)を現在とすると、現在からx時間前までがログ抽出対象の時間範囲である。図17の例では、ページA3,B3,C3以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   Assuming that the time when a message is detected (when a failure occurs) is the time range from the present to x hours before the log extraction target. In the example of FIG. 17, the time stamps in the pages subsequent to pages A3, B3, and C3 are included in the time range for log extraction.

最も優先順位の高いログタイプ“type1”の最新のページA7は、現在からx時間前の時刻よりも後の時刻である。このため、ログ抽出部150は、ページA7を抽出する。そして、ログ抽出部150は、ページリストZ1からページA7を外す。   The latest page A7 of the log type “type1” with the highest priority is a time later than the time x hours before the present time. For this reason, the log extraction unit 150 extracts the page A7. Then, the log extraction unit 150 removes the page A7 from the page list Z1.

以降の処理でも、ログ抽出部150は、抽出候補のページがx時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA6を抽出する。そして、ログ抽出部150は、ページリストZ1からページA6を外す。
Also in the subsequent processing, the log extraction unit 150 confirms that the extraction candidate page is a time later than the time before x hours.
Second, the log extraction unit 150 extracts the latest page A6 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A6 from the page list Z1.

3番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA5を抽出する。そして、ログ抽出部150は、ページリストZ1からページA5を外す。   Third, the log extraction unit 150 extracts the latest page A5 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A5 from the page list Z1.

4番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA4を抽出する。そして、ログ抽出部150は、ページリストZ1からページA4を外す。   Fourth, the log extraction unit 150 extracts the latest page A4 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A4 from the page list Z1.

5番目に、ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA3を抽出する。そして、ログ抽出部150は、ページリストZ1からページA3を外す。   Fifth, the log extraction unit 150 extracts the latest page A3 from the pages belonging to the page list Z1. Then, the log extraction unit 150 removes the page A3 from the page list Z1.

ログ抽出部150は、ページリストZ1に属する各ページのうち、最新のページA2のタイムスタンプが、現在からx時間前の時刻よりも前の時刻を示すことを確認し、ページリストZ1からのログ抽出を完了する。ログ抽出部150は、抽出量の上限値に未だ達していないため、次に優先順位の高いログタイプ“type2”、“type3”のページリストZ2,Z3からのログ抽出に移る。   The log extraction unit 150 confirms that the time stamp of the latest page A2 among the pages belonging to the page list Z1 indicates a time before x hours before the current time, and logs from the page list Z1. Complete the extraction. Since the log extraction unit 150 has not yet reached the upper limit of the extraction amount, the log extraction unit 150 proceeds to log extraction from the page lists Z2 and Z3 of the log types “type 2” and “type 3” having the next highest priority.

上記のように、ログタイプ“type2”、“type3”の優先レベルは“2”であり、ページリストZ2,Z3に属する各ページのうちの最新のページB7は、現在からx時間前の時刻よりも後の時刻である。このため、6番目に、ログ抽出部150は、ページB7を抽出する。そして、ログ抽出部150は、ページリストZ2からページB7を外す。   As described above, the priority level of the log types “type2” and “type3” is “2”, and the latest page B7 among the pages belonging to the page lists Z2 and Z3 is the time before x hours from the current time. Is a later time. For this reason, sixth, the log extraction unit 150 extracts the page B7. Then, the log extraction unit 150 removes the page B7 from the page list Z2.

7番目に、ログ抽出部150は、ページリストZ2,Z3に属する各ページのうち、最新のページC7を抽出する。そして、ログ抽出部150は、ページリストZ3からページC7を外す。   Seventh, the log extraction unit 150 extracts the latest page C7 from the pages belonging to the page lists Z2 and Z3. Then, the log extraction unit 150 removes the page C7 from the page list Z3.

8番目に、ログ抽出部150は、ページリストZ2,Z3に属する各ページのうち、最新のページB6を抽出する。そして、ログ抽出部150は、ページリストZ2からページB6を外す。   Eighth, the log extraction unit 150 extracts the latest page B6 from the pages belonging to the page lists Z2 and Z3. Then, the log extraction unit 150 removes the page B6 from the page list Z2.

9番目に、ログ抽出部150は、ページリストZ2,Z3に属する各ページのうち、最新のページC6を抽出する。そして、ログ抽出部150は、ページリストZ3からページC6を外す。   Ninth, the log extraction unit 150 extracts the latest page C6 from the pages belonging to the page lists Z2 and Z3. Then, the log extraction unit 150 removes the page C6 from the page list Z3.

以降、同様にして、ログ抽出部150は、ページの抽出を行う。10番目に抽出されるページは、ページC5である。11番目に抽出されるページは、ページB5である。
ログ抽出部150は、ページB5を抽出すると、抽出量の上限値に達したことを検出して、ログ抽出を終了する。抽出ログL1cは、上記の処理によってログ抽出部150により抽出されたページA7,A6,A5,A4,A3,B7,C7,B6,C6,C5,B5を含む。
Thereafter, similarly, the log extraction unit 150 performs page extraction. The tenth extracted page is page C5. The eleventh extracted page is page B5.
When extracting the page B5, the log extraction unit 150 detects that the upper limit of the extraction amount has been reached, and ends the log extraction. The extracted log L1c includes pages A7, A6, A5, A4, A3, B7, C7, B6, C6, C5, and B5 extracted by the log extracting unit 150 by the above processing.

図18は、第2の実施の形態のログ抽出例(その4)を示す図である。図18の例では、あるメッセージに対するログ抽出について次の条件を考える。抽出量の上限値は、ページ10個分(例えば、1ページのサイズが64KBの場合、64KB×10=640KB)である。ログ抽出の時間範囲はx時間である。抽出対象のログタイプは、“type1”、“type2”および“type3”である。ログタイプ“type1”の優先レベルは“1”である。ログタイプ“type2”、“type3”の優先レベルは何れも“2”である。   FIG. 18 is a diagram illustrating a log extraction example (part 4) according to the second embodiment. In the example of FIG. 18, the following conditions are considered for log extraction for a certain message. The upper limit of the extraction amount is 10 pages (for example, when the size of one page is 64 KB, 64 KB × 10 = 640 KB). The time range for log extraction is x hours. The log types to be extracted are “type 1”, “type 2”, and “type 3”. The priority level of the log type “type1” is “1”. The priority levels of the log types “type 2” and “type 3” are both “2”.

また、ページリストZ4は、ログタイプ“type1”のページリストである。ページリストZ4は、タイムスタンプの古い方から新しい方へ向かって、ページA1,A2,A3,A4,A5,A6,A7,A8を含む。ページリストZ5は、ログタイプ“type2”のページリストである。ページリストZ5は、タイムスタンプの古い方から新しい方へ向かって、ページB1,B2,B3,B4を含む。ページリストZ6は、ログタイプ“type3”のページリストである。ページリストZ6は、タイムスタンプの古い方から新しい方へ向かって、ページC1,C2,C3,C4を含む。   The page list Z4 is a page list of the log type “type1”. The page list Z4 includes pages A1, A2, A3, A4, A5, A6, A7, and A8 from the oldest time stamp to the newest time stamp. The page list Z5 is a page list of the log type “type2”. The page list Z5 includes pages B1, B2, B3, and B4 from the oldest time stamp to the newest time stamp. The page list Z6 is a page list of the log type “type3”. The page list Z6 includes pages C1, C2, C3, and C4 from the oldest time stamp to the newest time stamp.

ページリストZ4,Z5,Z6に属する各ページのタイムスタンプは、図15〜図17の場合とは異なっている。図18の例では、ページA1,B1,C1以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   The time stamps of the pages belonging to the page lists Z4, Z5 and Z6 are different from those in FIGS. In the example of FIG. 18, the time stamps of pages A1, B1, C1 and subsequent pages are included in the time range for log extraction.

最も優先順位の高いログタイプ“type1”の最新のページA8は、現在からx時間前の時刻よりも後の時刻である。このため、ログ抽出部150は、ページA8を抽出する。そして、ログ抽出部150は、ページリストZ4からページA8を外す。   The latest page A8 of the log type “type 1” with the highest priority is a time later than the time x hours before the present time. For this reason, the log extraction unit 150 extracts the page A8. Then, the log extraction unit 150 removes the page A8 from the page list Z4.

以降の処理でも、ログ抽出部150は、抽出候補のページがx時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ4に属する各ページのうち、最新のページA7を抽出する。そして、ログ抽出部150は、ページリストZ4からページA7を外す。
Also in the subsequent processing, the log extraction unit 150 confirms that the extraction candidate page is a time later than the time before x hours.
Second, the log extraction unit 150 extracts the latest page A7 from the pages belonging to the page list Z4. Then, the log extraction unit 150 removes the page A7 from the page list Z4.

以降、同様にして、ログ抽出部150は、ページリストZ4のページA6からページA1までを順に抽出し、ページリストZ4に残りのページ(未抽出のページ)がなくなったことを検出する。ログ抽出部150は、抽出量の上限値に未だ達していないため、次に優先順位の高いログタイプ“type2”、“type3”のページリストZ5,Z6からのログ抽出に移る。   Thereafter, similarly, the log extraction unit 150 sequentially extracts pages A6 to A1 of the page list Z4, and detects that there are no remaining pages (unextracted pages) in the page list Z4. Since the log extraction unit 150 has not yet reached the upper limit of the extraction amount, the log extraction unit 150 proceeds to log extraction from the page lists Z5 and Z6 of the log types “type2” and “type3” having the next highest priority.

上記のように、ログタイプ“type2”、“type3”の優先レベルは“2”であり、ページリストZ5,Z6に属する各ページのうちの最新のページB4は、現在からx時間前の時刻よりも後の時刻である。このため、9番目に、ログ抽出部150は、ページB4を抽出する。そして、ログ抽出部150は、ページリストZ5からページB4を外す。   As described above, the priority level of the log types “type2” and “type3” is “2”, and the latest page B4 among the pages belonging to the page lists Z5 and Z6 is from the time x hours before the current time. Is a later time. For this reason, ninthly, the log extraction unit 150 extracts the page B4. Then, the log extraction unit 150 removes the page B4 from the page list Z5.

10番目に、ログ抽出部150は、ページリストZ5,Z6に属する各ページのうち、最新のページC4を抽出する。そして、ログ抽出部150は、ページリストZ6からページC4を外す。   Tenth, the log extraction unit 150 extracts the latest page C4 from the pages belonging to the page lists Z5 and Z6. Then, the log extraction unit 150 removes the page C4 from the page list Z6.

ログ抽出部150は、ページC4を抽出すると、抽出量の上限値に達したことを検出して、ログ抽出を終了する。抽出ログL1dは、上記の処理によってログ抽出部150により抽出されたページA8,A7,A6,A5,A4,A3,A2,A1,B4,C4を含む。   When extracting the page C4, the log extracting unit 150 detects that the upper limit of the extraction amount has been reached, and ends the log extraction. The extracted log L1d includes pages A8, A7, A6, A5, A4, A3, A2, A1, B4, and C4 extracted by the log extracting unit 150 by the above processing.

このようにして、CM100によれば、解析に有用でないログの収集を抑えることができる。
ここで、例えば、障害などの事象(イベント)に対して、CM100,200,300,400におけるログを全て収集することも考えられる。しかし、ログには、新しいものや古いもの、ハードウェアやソフトウェアなどに関する種々のログレコードが含まれる。このため、ログを全て収集すると、発生した事象との関係が薄く、当該事象の解析に有用でないログレコードも収集されるという問題がある。余計なログレコードの収集は、収集したログレコードを他の装置に送信する際の通信量の増加や、有用でないログレコードによる解析量の増加などの要因になる。
In this way, according to the CM 100, collection of logs that are not useful for analysis can be suppressed.
Here, for example, it is also conceivable to collect all logs in the CMs 100, 200, 300, and 400 for events such as failures. However, the log includes various log records related to new and old items, hardware and software. For this reason, when all the logs are collected, there is a problem that the relationship with the occurred event is thin, and log records that are not useful for analyzing the event are also collected. The collection of unnecessary log records causes an increase in the amount of communication when the collected log records are transmitted to other devices, and an increase in the amount of analysis due to unusable log records.

例えば、収集するログサイズを小さくするために、単に、抽出対象サイズに上限を設けることも考えられる。しかし、抽出対象サイズに上限を設けただけでは、該当の事象に対して有用でないログレコードが抽出される可能性は大きい。なぜなら、発生する事象に応じて、当該事象と関連性の高いコンポーネントは異なるからである。また、現時点に対して古いログレコードほど、現時点の事象との関連が薄くなるからである。   For example, in order to reduce the log size to be collected, it is possible to simply set an upper limit on the extraction target size. However, simply setting an upper limit on the extraction target size is likely to extract log records that are not useful for the event. This is because components highly relevant to the event differ depending on the event that occurs. Also, the older the log record with respect to the current time, the less the relationship with the current event.

そこで、CM100は、障害の発生を示すメッセージ毎に抽出対象のページの時間範囲とログタイプ別の優先レベルとをログ抽出管理テーブル112により保持する。CM100は、メッセージを検出すると、当該メッセージに応じた時間範囲とログタイプ別の優先レベルとをログ抽出管理テーブル112から検索する。そして、CM100は、現時点以前の時間範囲とログタイプ別の優先レベルとを基に、ページを抽出する。これにより、CM100は、CM100のログのうち、障害解析に有用なログのみを抽出することができる。CM200,300,400も同様にして、障害解析に有用なログのみを抽出することができる。更に、CM100は、CM100,200,300,400における抽出ログを収集し、サポートサーバ60に収集ログを送信することで、障害解析に有用なログのみを、サポートサーバ60に送信することができる。すなわち、CM100は、サポートサーバ60に対して収集ログを送信する際の通信量の増加を抑えつつ、有用なログに絞った情報提供を行える。その結果、サポートサーバ60側での解析量の低減を図れる。   Therefore, the CM 100 holds the time range of the page to be extracted and the priority level for each log type in the log extraction management table 112 for each message indicating the occurrence of a failure. When the CM 100 detects a message, the CM 100 searches the log extraction management table 112 for a time range corresponding to the message and a priority level for each log type. Then, the CM 100 extracts pages based on the time range before the current time and the priority level for each log type. As a result, the CM 100 can extract only logs useful for failure analysis from the CM 100 logs. Similarly, the CMs 200, 300, and 400 can extract only logs useful for failure analysis. Further, the CM 100 collects the extracted logs in the CMs 100, 200, 300, and 400 and transmits the collected logs to the support server 60, so that only the logs useful for failure analysis can be transmitted to the support server 60. In other words, the CM 100 can provide information focused on useful logs while suppressing an increase in the amount of communication when transmitting a collection log to the support server 60. As a result, the amount of analysis on the support server 60 side can be reduced.

[第3の実施の形態]
以下、第3の実施の形態を説明する。前述の第2の実施の形態と相違する事項を主に説明し、共通する事項の説明を省略する。
[Third Embodiment]
Hereinafter, a third embodiment will be described. Items that differ from the second embodiment described above will be mainly described, and descriptions of common items will be omitted.

図18で例示したように、ログ抽出対象の時間範囲の設定によっては、特定のログタイプのページ(図18の例では、ログタイプ“type1”のページ)に偏ってログ抽出が行われる。また、抽出対象の時間範囲を広げた場合に、優先レベルの高いログの量が多いと、図18で例示したように、優先レベルの低いログをほとんど収集できないことも考えられる。一方、障害の内容によっては、特定のログタイプのページを重点的に抽出しながら、他のログタイプのページもある程度取得して解析を行いたいこともある。そこで、第3の実施の形態では、各メッセージに対して複数の時間範囲の設定を許容することで、ログ抽出の柔軟化を図る機能を提供する。   As illustrated in FIG. 18, depending on the setting of the time range for log extraction, log extraction is performed with a bias toward a specific log type page (in the example of FIG. 18, the log type “type1” page). Further, when the time range to be extracted is expanded, if the amount of logs having a high priority level is large, it is conceivable that logs having a low priority level can hardly be collected as illustrated in FIG. On the other hand, depending on the content of the failure, there may be a case where a specific log type page is focused on and other log type pages are acquired to some extent for analysis. In view of this, the third embodiment provides a function for making log extraction flexible by allowing a plurality of time ranges to be set for each message.

第3の実施の形態のストレージシステムのハードウェアおよび機能構成は、図2〜図5で例示した第2の実施の形態のストレージシステムのハードウェアおよび機能構成と同様である。このため、第3の実施の形態でも、第2の実施の形態と同様の名称および符号により各要素を指し示すこととする。第3の実施の形態では、ログ抽出管理テーブル112の代わりに、ログ抽出管理テーブル113を用いる点が、第2の実施の形態と異なる。   The hardware and functional configuration of the storage system of the third embodiment are the same as the hardware and functional configuration of the storage system of the second embodiment illustrated in FIGS. For this reason, in the third embodiment, each element is indicated by the same name and symbol as in the second embodiment. The third embodiment is different from the second embodiment in that a log extraction management table 113 is used instead of the log extraction management table 112.

図19は、第3の実施の形態のログ抽出管理テーブルの例を示す図である。ログ抽出管理テーブル113は、記憶部110に予め記憶されている。ログ抽出管理テーブル113は、メッセージIDに応じたログ抽出対象の時間範囲およびログタイプ毎の優先レベルが登録された情報である。ログ抽出管理テーブル113では、ログ抽出対象の時間範囲を2種類登録可能である点が、ログ抽出管理テーブル112と異なる。ログ抽出管理テーブル113は、メッセージID、時間範囲1(x)、時間範囲2(y)およびログタイプの優先レベルの項目を含む。   FIG. 19 is a diagram illustrating an example of a log extraction management table according to the third embodiment. The log extraction management table 113 is stored in the storage unit 110 in advance. The log extraction management table 113 is information in which a log extraction target time range corresponding to a message ID and a priority level for each log type are registered. The log extraction management table 113 is different from the log extraction management table 112 in that two types of log extraction target time ranges can be registered. The log extraction management table 113 includes items of message ID, time range 1 (x), time range 2 (y), and log type priority level.

メッセージIDおよびログタイプの優先レベルの項目の設定内容は、ログ抽出管理テーブル112における同名の項目の設定内容と同様である。
時間範囲1(x)の項目には、ログ抽出対象の第1の時間範囲xが登録される。時間範囲2(y)の項目には、ログ抽出対象の第2の時間範囲yが登録される。第1の時間範囲xおよび第2の時間範囲yの何れも、単位は、例えば、時間(hour)である。また、第2の時間範囲yは、第1の時間範囲xよりも新しい時刻である。時間範囲1(x)の項目における第1の時間範囲xの設定は、必須である。時間範囲2(y)の項目における第2の時間範囲yの設定は、任意である(時間範囲2(y)の項目は設定なしでもよい)。時間範囲2(y)の項目が設定なしの場合、図ではハイフン記号“−”を表記する。
The setting contents of the item of the priority level of the message ID and the log type are the same as the setting contents of the item of the same name in the log extraction management table 112.
In the item of time range 1 (x), the first time range x to be subjected to log extraction is registered. In the item of time range 2 (y), the second time range y to be extracted from the log is registered. The unit of both the first time range x and the second time range y is, for example, hour. The second time range y is a newer time than the first time range x. The setting of the first time range x in the item of the time range 1 (x) is indispensable. The setting of the second time range y in the item of the time range 2 (y) is arbitrary (the item of the time range 2 (y) may not be set). When the item of the time range 2 (y) is not set, a hyphen symbol “-” is shown in the figure.

例えば、ログ抽出管理テーブル112には、メッセージIDが“a00000005”、時間範囲1(x)が“48”、時間範囲2(y)が“3”、ログタイプ“type1”の優先レベル“1”、ログタイプ“type2”の優先レベル“2”、ログタイプ“type3”の優先レベル“3”、ログタイプ“type4”の優先レベル“0”,・・・という情報が登録される。これは、メッセージID“a00000005”を含むメッセージが検出された場合、当該検出時(障害発生時)から3時間前に遡った時刻までを第1段階のログ抽出対象の時間範囲とすることを示す。また、第1段階のログ抽出が完了した後に、当該検出時(障害発生時)から48時間前に遡った時刻までを第2段階のログ抽出対象の時間範囲とすることを示す。また、各ログタイプの優先レベルにしたがって、ログ抽出を行うことを示す。   For example, in the log extraction management table 112, the message ID is “a00000005”, the time range 1 (x) is “48”, the time range 2 (y) is “3”, and the priority level “1” is the log type “type1”. , The priority level “2” of the log type “type 2”, the priority level “3” of the log type “type 3”, the priority level “0” of the log type “type 4”, and so on are registered. This indicates that, when a message including the message ID “a00000005” is detected, the time range from the time of the detection (at the time of failure) to the time that goes back three hours ago is set as the time range of the log extraction target in the first stage. . In addition, after the log extraction at the first stage is completed, the time range from the time of the detection (at the time of failure) to the time that goes back 48 hours ago is set as the time range of the log extraction target of the second stage. It also indicates that log extraction is performed according to the priority level of each log type.

次に、第3の実施の形態におけるログ抽出部150によるログ抽出の手順を説明する。第3の実施の形態では、図12で例示したCM単位のログ抽出処理の手順に代えて、ログ抽出部150が以下に示す手順を実行する点が異なる。他の処理の手順について、第2の実施の形態で例示した手順と同様であるため、説明を省略する。また、以下では、ログ抽出部150について主に説明するが、ログ抽出部230,330,430も同様の手順によりログ抽出を行う。   Next, the log extraction procedure by the log extraction unit 150 in the third embodiment will be described. The third embodiment is different in that the log extraction unit 150 executes the following procedure instead of the CM-unit log extraction processing procedure illustrated in FIG. The other processing procedures are the same as the procedures exemplified in the second embodiment, and thus description thereof is omitted. In the following, the log extraction unit 150 will be mainly described, but the log extraction units 230, 330, and 430 also perform log extraction according to the same procedure.

図20は、第3の実施の形態のCM単位のログ抽出例を示すフローチャートである。以下、図20に示す処理をステップ番号に沿って説明する。以下に示す手順は、図11のステップS14に相当する。   FIG. 20 is a flowchart illustrating an example of CM-unit log extraction according to the third embodiment. In the following, the process illustrated in FIG. 20 will be described in order of step number. The procedure shown below corresponds to step S14 in FIG.

(S51)ログ抽出部150は、記憶部110に記憶されたログ抽出管理テーブル113から、今回のメッセージに対応する時間範囲2(y)の値を取得する。具体的には、ログ抽出部150は、障害通知のメッセージに含まれるメッセージIDに対応する時間範囲2(y)を、ログ抽出管理テーブル113から取得する。   (S51) The log extraction unit 150 acquires the value of the time range 2 (y) corresponding to the current message from the log extraction management table 113 stored in the storage unit 110. Specifically, the log extraction unit 150 acquires the time range 2 (y) corresponding to the message ID included in the failure notification message from the log extraction management table 113.

(S52)ログ抽出部150は、ステップS51の結果を基に、時間範囲2(y)が設定なしであるか否かを判定する。時間範囲2(y)が設定なしの場合、ログ抽出部150は、ステップS56に処理を進める。時間範囲2(y)が設定ありの場合、ログ抽出部150は、ステップS53に処理を進める。   (S52) The log extraction unit 150 determines whether the time range 2 (y) is not set based on the result of step S51. When the time range 2 (y) is not set, the log extraction unit 150 proceeds with the process to step S56. When the time range 2 (y) is set, the log extraction unit 150 proceeds with the process to step S53.

(S53)ログ抽出部150は、時間範囲を時間範囲2(y)に設定する。
(S54)ログ抽出部150は、時間範囲を時間範囲2(y)に設定した状態で、時間範囲内のログ抽出処理を実行する。時間範囲内のログ抽出処理の手順は、図13の手順と同様である。
(S53) The log extraction unit 150 sets the time range to the time range 2 (y).
(S54) The log extraction unit 150 executes log extraction processing within the time range in a state where the time range is set to the time range 2 (y). The procedure of log extraction processing within the time range is the same as the procedure of FIG.

(S55)ログ抽出部150は、抽出量の合計が上限値に達したか否かを判定する。抽出量の合計が上限値に達した場合、ログ抽出部150は、処理をステップS58に進める。抽出量の合計が上限値に達していない場合、ログ抽出部150は、ステップS56に処理を進める。   (S55) The log extraction unit 150 determines whether or not the total extraction amount has reached the upper limit. When the total of the extraction amounts reaches the upper limit value, the log extraction unit 150 proceeds with the process to step S58. If the total extraction amount has not reached the upper limit value, the log extraction unit 150 proceeds with the process to step S56.

(S56)ログ抽出部150は、ログ抽出管理テーブル113から、今回のメッセージに対応する時間範囲1(x)の値を取得する。具体的には、ログ抽出部150は、障害通知のメッセージに含まれるメッセージIDに対応する時間範囲1(x)を、ログ抽出管理テーブル113から取得する。   (S56) The log extraction unit 150 acquires the value of the time range 1 (x) corresponding to the current message from the log extraction management table 113. Specifically, the log extraction unit 150 acquires the time range 1 (x) corresponding to the message ID included in the failure notification message from the log extraction management table 113.

(S57)ログ抽出部150は、時間範囲を時間範囲1(x)に設定した状態で、時間範囲内のログ抽出処理を実行する。時間範囲内のログ抽出処理の手順は、図13の手順と同様である。   (S57) The log extraction unit 150 executes log extraction processing within the time range in a state where the time range is set to the time range 1 (x). The procedure of log extraction processing within the time range is the same as the procedure of FIG.

(S58)ログ抽出部150は、ステップS54,S57の両方または何れか一方により抽出したログ(抽出ログ)をログ収集部140に提供する。
このように、記憶部110は、時間範囲2(y)および時間範囲2(y)よりも長い期間を示す時間範囲1(x)(他の時間範囲)をメッセージ毎に登録したログ抽出管理テーブル113を記憶する。そして、ログ抽出部150は、障害発生を示すメッセージを検出すると、記憶部110に記憶されたログ抽出管理テーブル113を参照して、メッセージに応じた現時刻から過去の時間範囲2(y)および優先レベルに基づき、ログ(動作情報)の中からページ(ログレコード)を抽出する。その後、ログ抽出部150は、メッセージ応じた現時刻から過去の時間範囲1(x)および優先レベルに基づき、ログ(動作情報)の中から他のページ(他のログレコード)を抽出する。これにより、障害に応じて、抽出ログの内容を柔軟に調整可能になる。
(S58) The log extraction unit 150 provides the log collection unit 140 with the log (extraction log) extracted in both or one of steps S54 and S57.
As described above, the storage unit 110 stores the time range 2 (y) and the time range 1 (x) (other time range) indicating a period longer than the time range 2 (y) for each message. 113 is stored. Then, when the log extraction unit 150 detects a message indicating the occurrence of a failure, the log extraction unit 150 refers to the log extraction management table 113 stored in the storage unit 110 and refers to the past time range 2 (y) and the past time range corresponding to the message. Based on the priority level, a page (log record) is extracted from the log (operation information). Thereafter, the log extraction unit 150 extracts other pages (other log records) from the log (operation information) based on the past time range 1 (x) and the priority level from the current time according to the message. Thereby, the contents of the extraction log can be flexibly adjusted according to the failure.

図21は、第3の実施の形態のログ抽出例を示す図である。図21の例では、あるメッセージに対するログ抽出について次の条件を考える。抽出量の上限値は、ページ10個分(例えば、1ページのサイズが64KBの場合、64KB×10=640KB)である。ログ抽出の時間範囲1(x)はx時間である。ログ抽出の時間範囲2(y)はy時間である。抽出対象のログタイプは、“type1”、“type2”および“type3”である。ログタイプ“type1”の優先レベルは“1”である。ログタイプ“type2”、“type3”の優先レベルは何れも“2”である。ページリストZ4,Z5,Z6に属する各ページは、図18と同様である。   FIG. 21 is a diagram illustrating a log extraction example according to the third embodiment. In the example of FIG. 21, the following conditions are considered for log extraction for a certain message. The upper limit of the extraction amount is 10 pages (for example, when the size of one page is 64 KB, 64 KB × 10 = 640 KB). The log extraction time range 1 (x) is x hours. The log extraction time range 2 (y) is y hours. The log types to be extracted are “type 1”, “type 2”, and “type 3”. The priority level of the log type “type1” is “1”. The priority levels of the log types “type 2” and “type 3” are both “2”. Each page belonging to the page list Z4, Z5, Z6 is the same as that shown in FIG.

この場合、メッセージの検出時(障害発生時)を現在とすると、現在からy時間前までが第1段階のログ抽出対象の時間範囲である。図21の例では、ページA5,B3,C3以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   In this case, assuming that the time when a message is detected (when a failure occurs) is now, the time range from the present to y hours before is the first stage of log extraction target. In the example of FIG. 21, the time stamps in the pages subsequent to pages A5, B3, and C3 are included in the time range for log extraction.

最も優先順位の高いログタイプ“type1”の最新のページA8は、現在からy時間前の時刻よりも後の時刻である。このため、ログ抽出部150は、ページA8を抽出する。そして、ログ抽出部150は、ページリストZ4からページA8を外す。   The latest page A8 of the log type “type 1” with the highest priority is a time later than the time y hours before the present time. For this reason, the log extraction unit 150 extracts the page A8. Then, the log extraction unit 150 removes the page A8 from the page list Z4.

以降の第1段階のログ抽出処理でも、ログ抽出部150は、抽出候補のページがy時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ4に属する各ページのうち、最新のページA7を抽出する。そして、ログ抽出部150は、ページリストZ4からページA7を外す。
Also in the subsequent first-stage log extraction processing, the log extraction unit 150 confirms that the extraction candidate page is later than the time before y hours.
Second, the log extraction unit 150 extracts the latest page A7 from the pages belonging to the page list Z4. Then, the log extraction unit 150 removes the page A7 from the page list Z4.

3番目に、ログ抽出部150は、ページリストZ4に属する各ページのうち、最新のページA6を抽出する。そして、ログ抽出部150は、ページリストZ4からページA6を外す。   Third, the log extraction unit 150 extracts the latest page A6 from the pages belonging to the page list Z4. Then, the log extraction unit 150 removes the page A6 from the page list Z4.

4番目に、ログ抽出部150は、ページリストZ4に属する各ページのうち、最新ページA5を抽出する。そして、ログ抽出部150は、ページリストZ4からページA5を外す。   Fourth, the log extraction unit 150 extracts the latest page A5 from the pages belonging to the page list Z4. Then, the log extraction unit 150 removes the page A5 from the page list Z4.

ログ抽出部150は、ページリストZ4の最新のページA4のタイムスタンプが現在からy時間前の時刻よりも前の時刻を示すことを確認し、ページリストZ4からの第1段階のログ抽出を完了する。ログ抽出部150は、抽出量の上限値に未だ達していないため、次に優先順位の高いログタイプ“type2”、“type3”のページリストZ5,Z6からの第1段階のログ抽出に移る。   The log extraction unit 150 confirms that the time stamp of the latest page A4 in the page list Z4 indicates a time before the time y hours before the current time, and completes the first stage log extraction from the page list Z4. To do. Since the log extraction unit 150 has not yet reached the upper limit of the extraction amount, the log extraction unit 150 proceeds to the first-stage log extraction from the page lists Z5 and Z6 of the log types “type2” and “type3” having the next highest priority.

上記のように、ログタイプ“type2”、“type3”の優先レベルは“2”であり、ページリストZ5,Z6に属する各ページのうちの最新のページB4は、現在からy時間前の時刻よりも後の時刻である。このため、5番目に、ログ抽出部150は、ページB4を抽出する。そして、ログ抽出部150は、ページリストZ5からページB4を外す。   As described above, the priority level of the log types “type2” and “type3” is “2”, and the latest page B4 among the pages belonging to the page lists Z5 and Z6 is from the time y hours before the current time. Is a later time. For this reason, fifthly, the log extraction unit 150 extracts the page B4. Then, the log extraction unit 150 removes the page B4 from the page list Z5.

6番目に、ログ抽出部150は、ページリストZ5,Z6に属する各ページのうち、最新のページC4を抽出する。そして、ログ抽出部150は、ページリストZ6からページC4を外す。   Sixth, the log extraction unit 150 extracts the latest page C4 from the pages belonging to the page lists Z5 and Z6. Then, the log extraction unit 150 removes the page C4 from the page list Z6.

7番目に、ログ抽出部150は、ページリストZ5,Z6に属する各ページのうち、最新のページB3を抽出する。そして、ログ抽出部150は、ページリストZ5からページB3を外す。   Seventh, the log extraction unit 150 extracts the latest page B3 from the pages belonging to the page lists Z5 and Z6. Then, the log extraction unit 150 removes the page B3 from the page list Z5.

8番目に、ログ抽出部150は、ページリストZ5,Z6に属する各ページのうち、最新のページC3を抽出する。そして、ログ抽出部150は、ページリストZ6からページC3を外す。   Eighth, the log extraction unit 150 extracts the latest page C3 from the pages belonging to the page lists Z5 and Z6. Then, the log extraction unit 150 removes the page C3 from the page list Z6.

ログ抽出部150は、ページリストZ5,Z6に属する各ページのうち、最新のページC2のタイムスタンプが現在からy時間前の時刻よりも前の時刻を示すことを確認し、ページリストZ5,Z6からの第1段階のログ抽出を完了する。ログ抽出部150は、抽出量の上限値に未だ達していないため、第2段階のログ抽出に移る。第2段階のログ抽出の時間範囲は、現在からx時間前の時刻までである。   The log extraction unit 150 confirms that among the pages belonging to the page lists Z5 and Z6, the time stamp of the latest page C2 indicates a time before y hours before the current time, and the page lists Z5 and Z6. Complete the first stage log extraction from. Since the log extraction unit 150 has not yet reached the upper limit of the extraction amount, the log extraction unit 150 proceeds to the second-stage log extraction. The time range of the second stage log extraction is from the present time to the time x hours before.

最も優先順位の高いログタイプ“type1”の最新のページA4は、現在からx時間前の時刻よりも後の時刻である。このため、9番目に、ログ抽出部150は、ページA4を抽出する。そして、ログ抽出部150は、ページリストZ4からページA4を外す。   The latest page A4 of the log type “type1” with the highest priority is a time later than the time x hours before the present time. For this reason, ninthly, the log extraction unit 150 extracts the page A4. Then, the log extraction unit 150 removes the page A4 from the page list Z4.

10番目に、ログ抽出部150は、ページA3を抽出する。そして、ログ抽出部150は、ページリストZ4からページA3を外す。
ログ抽出部150は、ページA3を抽出すると、抽出量の上限値に達したことを検出して、第2段階のログ抽出を終了する。抽出ログL1eは、上記の処理によってログ抽出部150により抽出されたページA8,A7,A6,A5,B4,C4,B3,C3,A4,A3を含む。
Tenth, the log extraction unit 150 extracts the page A3. Then, the log extraction unit 150 removes the page A3 from the page list Z4.
When extracting the page A3, the log extraction unit 150 detects that the upper limit of the extraction amount has been reached, and ends the log extraction in the second stage. The extracted log L1e includes pages A8, A7, A6, A5, B4, C4, B3, C3, A4, and A3 extracted by the log extracting unit 150 by the above processing.

次に、第3の実施の形態のログ抽出方法について、更に具体的な例を説明する。以下の説明では、具体的な障害内容と、具体的なログタイプとを例示することで、CM100,200,300,400によるログ抽出例を更に具体的に説明する。   Next, a more specific example of the log extraction method according to the third embodiment will be described. In the following description, an example of log extraction by the CMs 100, 200, 300, and 400 will be described more specifically by illustrating specific failure contents and specific log types.

図22は、第3の実施の形態のログ抽出管理テーブルの第1具体例を示す図である。ログ抽出管理テーブル114は、CM100,200,300,400それぞれが備える筐体内の冷却用のファン(fan)の故障に対する時間範囲1(x)、時間範囲2(y)およびログタイプの優先レベルを例示している。例えば、ファンの故障を示すメッセージのメッセージIDを“FAN Fault”とする。ログ抽出管理テーブル114には、当該メッセージIDに対して、時間範囲1(x)が“48”、時間範囲2(y)が“1”という情報が登録されている。また、当該メッセージIDに対して、ログタイプ“type1”の優先レベル“1”、ログタイプ“type2”の優先レベル“0”、ログタイプ“type3”の優先レベル“0”、ログタイプ“type4”の優先レベル“1”、ログタイプ“type5”の優先レベル“2”、ログタイプ“type6”の優先レベル“0”、ログタイプ“type7”の優先レベル“0”、ログタイプ“type8”の優先レベル“0”という情報が登録されている。   FIG. 22 is a diagram illustrating a first specific example of the log extraction management table according to the third embodiment. The log extraction management table 114 indicates the time range 1 (x), the time range 2 (y), and the priority level of the log type with respect to the failure of the cooling fan in the casing of each of the CMs 100, 200, 300, and 400. Illustrated. For example, the message ID of a message indicating a fan failure is “FAN Fault”. In the log extraction management table 114, information that the time range 1 (x) is “48” and the time range 2 (y) is “1” is registered for the message ID. Also, for this message ID, the priority level “1” of the log type “type1”, the priority level “0” of the log type “type2”, the priority level “0” of the log type “type3”, and the log type “type4”. Priority level “1”, log type “type5” priority level “2”, log type “type6” priority level “0”, log type “type7” priority level “0”, log type “type8” priority Information of level “0” is registered.

ここで、ログタイプ“type1”は、ハードウェアエラー(ハードエラー)である。ログタイプ“type2”は、データのコピー機能に関するソフトウェアエラー(ソフトエラー)である。ログタイプ“type3”は、データの重複排除/圧縮機能に関するソフトエラーである。ログタイプ“type4”は、温度などの環境に関する情報である。ログタイプ“type5”は、電源オン/オフや消費電力などの電源制御に関する情報である。ログタイプ“type6”は、MMI(Man Machine Interface)に対する操作(MMI操作)に関する情報である。ログタイプ“type7”は、データのコピー機能に関するイベントである。ログタイプ“type8”は、データの重複排除/圧縮機能に関するイベントである。   Here, the log type “type1” is a hardware error (hardware error). The log type “type2” is a software error (soft error) related to the data copy function. The log type “type 3” is a soft error related to the data deduplication / compression function. The log type “type 4” is information about the environment such as temperature. The log type “type 5” is information relating to power control such as power on / off and power consumption. The log type “type 6” is information related to an operation (MMI operation) for an MMI (Man Machine Interface). The log type “type 7” is an event related to a data copy function. The log type “type 8” is an event related to the data deduplication / compression function.

FAN故障の解析に当たっては、故障の直接の原因を解析するために故障発生時付近のログを取得する。また、FAN故障を加速するような間接的な要因(例えば、温度異常など)の有無を解析するために、故障発生前の比較的長時間に亘る環境ログを抽出することが好ましい。そこで、故障発生から1時間前までのログを抽出し、更に、故障発生から48時間前までの範囲でハードエラーと環境情報のログを優先して抽出するように、ログ抽出管理テーブル114の設定を行う。   In analyzing a FAN failure, a log near the time of failure occurrence is acquired in order to analyze the direct cause of the failure. In addition, in order to analyze the presence or absence of an indirect factor (for example, temperature abnormality) that accelerates the FAN failure, it is preferable to extract an environmental log for a relatively long time before the failure occurs. Therefore, the log extraction management table 114 is set so that logs up to 1 hour before the occurrence of the failure are extracted, and further, logs of hardware errors and environmental information are preferentially extracted up to 48 hours before the occurrence of the failure. I do.

図23は、第3の実施の形態のログ抽出の第1具体例を示す図である。図23では、ログ抽出管理テーブル114に基づくログ抽出部150によるログ抽出を例示する。
図23の例では、メッセージ“FAN Fault”に対するログ抽出について次の条件を考える。抽出量の上限値は、ページ10個分(例えば、1ページのサイズが64KBの場合、64KB×10=640KB)である。ログ抽出の時間範囲1(x)は48時間である。ログ抽出の時間範囲2(y)は1時間である。抽出対象のログタイプは、“type1”、“type4”および“type5”である。ただし、図23では、比較のために、ログタイプ“type6”も図示している。ログタイプ“type1”、“type4”の優先レベルは何れも“1”である。ログタイプ“type5”の優先レベルは“2”である。
FIG. 23 is a diagram illustrating a first specific example of log extraction according to the third embodiment. FIG. 23 illustrates log extraction by the log extraction unit 150 based on the log extraction management table 114.
In the example of FIG. 23, the following conditions are considered for log extraction for the message “FAN Fault”. The upper limit of the extraction amount is 10 pages (for example, when the size of one page is 64 KB, 64 KB × 10 = 640 KB). The log extraction time range 1 (x) is 48 hours. The log extraction time range 2 (y) is one hour. The log types to be extracted are “type1”, “type4”, and “type5”. However, in FIG. 23, the log type “type6” is also illustrated for comparison. The priority levels of the log types “type 1” and “type 4” are both “1”. The priority level of the log type “type5” is “2”.

また、ページリストZ7は、ログタイプ“type1”のページリストである。ページリストZ7は、タイムスタンプの古い方から新しい方へ向かって、ページA1,A2,A3を含む。ページリストZ8は、ログタイプ“type4”のページリストである。ページリストZ8は、タイムスタンプの古い方から新しい方へ向かって、ページB1,B2,B3,B4,B5を含む。ページリストZ9は、ログタイプ“type5”のページリストである。ページリストZ9は、タイムスタンプの古い方から新しい方へ向かって、ページC1,C2,C3,C4を含む。ページリストZ10は、ログタイプ“type6”のページリストである。ページリストZ10は、タイムスタンプの古い方から新しい方へ向かって、ページD1,D2,D3,D4を含む。ただし、前述のように、ページリストZ10は、比較のために図示したものであり、ページの抽出対象ではない。   The page list Z7 is a page list of the log type “type1”. The page list Z7 includes pages A1, A2, and A3 from the oldest time stamp to the newest time stamp. The page list Z8 is a page list of the log type “type4”. The page list Z8 includes pages B1, B2, B3, B4, and B5 from the oldest time stamp to the newest time stamp. The page list Z9 is a page list of the log type “type5”. The page list Z9 includes pages C1, C2, C3, and C4 from the oldest time stamp to the newest time stamp. The page list Z10 is a page list of the log type “type6”. The page list Z10 includes pages D1, D2, D3, and D4 from the oldest time stamp to the newest time stamp. However, as described above, the page list Z10 is illustrated for comparison and is not a page extraction target.

この場合、メッセージの検出時(障害発生時)を現在とすると、現在から1時間前までが第1段階のログ抽出対象の時間範囲である。図23の例では、ページA2,B5,C4以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   In this case, assuming that the time when a message is detected (at the time of occurrence of a failure) is the current time range from the present to one hour before the log extraction target. In the example of FIG. 23, time stamps in pages A2, B5, and C4 and subsequent pages are included in the time range for log extraction.

最も優先順位の高いログタイプ“type1”、“type4”の最新のページB5は、現在から1時間前の時刻よりも後の時刻である。このため、ログ抽出部150は、ページB5を抽出する。そして、ログ抽出部150は、ページリストZ8からページB5を外す。   The latest page B5 of the log types “type1” and “type4” with the highest priority is a time later than the time one hour before the current time. For this reason, the log extraction unit 150 extracts the page B5. Then, the log extraction unit 150 removes the page B5 from the page list Z8.

以降の第1段階のログ抽出処理でも、ログ抽出部150は、抽出候補のページが1時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ7,Z8に属する各ページのうち、最新のページA3を抽出する。そして、ログ抽出部150は、ページリストZ7からページA3を外す。
Also in the subsequent first-stage log extraction processing, the log extraction unit 150 confirms that the extraction candidate page is later than the time one hour before.
Second, the log extraction unit 150 extracts the latest page A3 from the pages belonging to the page lists Z7 and Z8. Then, the log extraction unit 150 removes the page A3 from the page list Z7.

3番目に、ログ抽出部150は、ページリストZ7,Z8に属する各ページのうち、最新のページA2を抽出する。そして、ログ抽出部150は、ページリストZ7からページA2を外す。   Third, the log extraction unit 150 extracts the latest page A2 from the pages belonging to the page lists Z7 and Z8. Then, the log extraction unit 150 removes the page A2 from the page list Z7.

ログ抽出部150は、ページリストZ7,Z8に属する各ページのうち、最新のページB4のタイムスタンプが1時間前の時刻よりも前の時刻であることを確認する。すると、ログ抽出部150は、次の優先レベルであるログタイプ“type5”のページリストZ9からの第1段階のログ抽出に移る。   The log extraction unit 150 confirms that the time stamp of the latest page B4 among the pages belonging to the page lists Z7 and Z8 is a time before the time one hour before. Then, the log extraction unit 150 proceeds to the first stage log extraction from the page list Z9 of the log type “type 5” which is the next priority level.

4番目に、ログ抽出部150は、ページリストZ9に属する各ページのうち、最新のページC4を抽出する。そして、ログ抽出部150は、ページリストZ9からページC4を外す。   Fourth, the log extraction unit 150 extracts the latest page C4 from the pages belonging to the page list Z9. Then, the log extraction unit 150 removes the page C4 from the page list Z9.

ログ抽出部150は、ページリストZ9に属する各ページのうち、最新のページC3のタイムスタンプが1時間前の時刻よりも前の時刻であることを確認する。すると、ログ抽出部150は、抽出対象の全てのログタイプについて第1段階のログ抽出処理を終えたので、第2段階のログ抽出処理に移る。   The log extraction unit 150 confirms that the time stamp of the latest page C3 among the pages belonging to the page list Z9 is a time before the time one hour before. Then, since the log extraction unit 150 has finished the first-stage log extraction process for all the log types to be extracted, the log-extraction unit 150 proceeds to the second-stage log extraction process.

5番目に、ログ抽出部150は、ページリストZ7,Z8に属する各ページのうち、最新のページB4を抽出する。そして、ログ抽出部150は、ページリストZ8からページB4を外す。   Fifth, the log extraction unit 150 extracts the latest page B4 from the pages belonging to the page lists Z7 and Z8. Then, the log extraction unit 150 removes the page B4 from the page list Z8.

6番目に、ログ抽出部150は、ページリストZ7,Z8に属する各ページのうち、最新のページA1を抽出する。そして、ログ抽出部150は、ページリストZ7からページA1を外す。この段階では、ページリストZ7には、未抽出のページがなくなる。   Sixth, the log extraction unit 150 extracts the latest page A1 from the pages belonging to the page lists Z7 and Z8. Then, the log extraction unit 150 removes the page A1 from the page list Z7. At this stage, there are no unextracted pages in the page list Z7.

7番目に、ログ抽出部150は、ページリストZ8に属する各ページのうち、最新のページB3を抽出する。そして、ログ抽出部150は、ページリストZ8からページB3を外す。   Seventh, the log extraction unit 150 extracts the latest page B3 from the pages belonging to the page list Z8. Then, the log extraction unit 150 removes the page B3 from the page list Z8.

8番目に、ログ抽出部150は、ページリストZ8に属する各ページのうち、最新のページB2を抽出する。そして、ログ抽出部150は、ページリストZ8からページB2を外す。   Eighth, the log extraction unit 150 extracts the latest page B2 from the pages belonging to the page list Z8. Then, the log extraction unit 150 removes the page B2 from the page list Z8.

9番目に、ログ抽出部150は、ページリストZ8に属する各ページのうち、最新のページB1を抽出する。そして、ログ抽出部150は、ページリストZ8からページB1を外す。ページリストZ8にも未抽出のページがなくなったので、ログ抽出部150は、次の優先レベルであるページリストZ9からの第2段階のログ抽出処理に移る。   Ninth, the log extraction unit 150 extracts the latest page B1 from the pages belonging to the page list Z8. Then, the log extraction unit 150 removes the page B1 from the page list Z8. Since there are no unextracted pages in the page list Z8, the log extraction unit 150 proceeds to the second stage log extraction processing from the page list Z9 which is the next priority level.

10番目に、ログ抽出部150は、ページリストZ9に属する各ページのうち、最新のページC3を抽出する。そして、ログ抽出部150は、ページリストZ9からページC3を外す。   Tenth, the log extraction unit 150 extracts the latest page C3 from the pages belonging to the page list Z9. Then, the log extraction unit 150 removes the page C3 from the page list Z9.

ログ抽出部150は、ページC3を抽出すると、抽出量の上限値に達したことを検出して、第2段階のログ抽出を終了する。抽出ログL1fは、上記の処理によってログ抽出部150により抽出されたページB5,A3,A2,C4,B4,A1,B3,B2,B1,C3を含む。   When extracting the page C3, the log extraction unit 150 detects that the upper limit of the extraction amount has been reached, and ends the log extraction in the second stage. The extracted log L1f includes pages B5, A3, A2, C4, B4, A1, B3, B2, B1, and C3 extracted by the log extracting unit 150 by the above processing.

こうして、CM100,200,300,400は、FAN故障の障害調査に適した調査用ログを抽出することができる。また、CM100は、抽出された調査用ログを収集して、サポートサーバ60に送信することで、FAN故障の障害調査に有用な情報に絞った情報提供を行うことができる。また、余計な情報を送るよりも通信量を減らすことができる。   In this way, the CMs 100, 200, 300, and 400 can extract investigation logs suitable for FAN failure investigations. Further, the CM 100 collects the extracted investigation logs and transmits them to the support server 60, thereby providing information focused on information useful for trouble investigation of FAN failure. In addition, the amount of communication can be reduced compared to sending extra information.

図24は、第3の実施の形態のログ抽出管理テーブルの第2具体例を示す図である。ログ抽出管理テーブル115は、CM100,200,300,400それぞれにおけるデータのコピーセッションにおけるエラー(copy session error)に対する時間範囲1(x)、時間範囲2(y)およびログタイプの優先レベルを例示している。例えば、コピーセッションエラーのメッセージIDを“copy session error”とする。ログ抽出管理テーブル115には、当該メッセージIDに対して、時間範囲1(x)が“64”、時間範囲2(y)が“−”(設定なし)という情報が登録されている。また、当該メッセージIDに対して、ログタイプ“type1”、“type3”、“type4”、“type5”、“type6”、“type8”の優先レベル“0”という情報が登録されている。更に、当該メッセージIDに対して、ログタイプ“type2”、“type7”の優先レベル“1”という情報が登録されている。   FIG. 24 is a diagram illustrating a second specific example of the log extraction management table according to the third embodiment. The log extraction management table 115 exemplifies time range 1 (x), time range 2 (y), and log type priority level for an error (copy session error) in a data copy session in each of the CMs 100, 200, 300, and 400. ing. For example, the message ID of the copy session error is “copy session error”. In the log extraction management table 115, information that the time range 1 (x) is “64” and the time range 2 (y) is “−” (no setting) is registered for the message ID. In addition, information of the priority level “0” of the log types “type1”, “type3”, “type4”, “type5”, “type6”, and “type8” is registered for the message ID. Furthermore, information of the priority level “1” of the log types “type 2” and “type 7” is registered for the message ID.

ここで、ログ抽出管理テーブル115におけるログタイプは、ログ抽出管理テーブル114で例示したログタイプと同様である。
データのコピー機能のエラーの解析に当たっては、エラーに至るまでの経緯から原因を特定するために、事象発生からできるだけ長時間に亘るコピー機能に関するログを抽出することが好ましい。そこで、事象発生から64時間前までの時間範囲でコピー機能のログを優先して抽出するように、ログ抽出管理テーブル115の設定を行う。
Here, the log type in the log extraction management table 115 is the same as the log type exemplified in the log extraction management table 114.
In analyzing the error of the data copy function, it is preferable to extract a log relating to the copy function for as long as possible from the occurrence of the event in order to identify the cause from the background up to the error. Therefore, the log extraction management table 115 is set so that the log of the copy function is preferentially extracted in the time range from the occurrence of the event to 64 hours ago.

図25は、第3の実施の形態のログ抽出の第2具体例を示す図である。図25では、ログ抽出管理テーブル115に基づくログ抽出部150によるログ抽出を例示する。
図25の例では、メッセージ“copy session error”に対するログ抽出について次の条件を考える。抽出量の上限値は、ページ10個分(例えば、1ページのサイズが64KBの場合、64KB×10=640KB)である。ログ抽出の時間範囲1(x)は64時間である。ログ抽出の時間範囲2(y)は設定なしである。抽出対象のログタイプは、“type2”および“type7”である。ただし、図25では、比較のために、ログタイプ“type1”および“type4”も図示している。ログタイプ“type2”、“type7”の優先レベルは何れも“1”である。
FIG. 25 is a diagram illustrating a second specific example of log extraction according to the third embodiment. FIG. 25 illustrates log extraction by the log extraction unit 150 based on the log extraction management table 115.
In the example of FIG. 25, the following conditions are considered for log extraction for the message “copy session error”. The upper limit of the extraction amount is 10 pages (for example, when the size of one page is 64 KB, 64 KB × 10 = 640 KB). The log extraction time range 1 (x) is 64 hours. The log extraction time range 2 (y) is not set. The log types to be extracted are “type 2” and “type 7”. However, in FIG. 25, log types “type1” and “type4” are also illustrated for comparison. The priority levels of the log types “type 2” and “type 7” are both “1”.

また、ページリストZ11は、ログタイプ“type1”のページリストである。ページリストZ11は、タイムスタンプの古い方から新しい方へ向かって、ページA1,A2,A3を含む。ページリストZ12は、ログタイプ“type2”のページリストである。ページリストZ12は、タイムスタンプの古い方から新しい方へ向かって、ページB1,B2,B3を含む。ページリストZ13は、ログタイプ“type4”のページリストである。ページリストZ13は、タイムスタンプの古い方から新しい方へ向かって、ページC1,C2,C3,C4を含む。ページリストZ14は、ログタイプ“type7”のページリストである。ページリストZ14は、タイムスタンプの古い方から新しい方へ向かって、ページD1,D2,D3,D4,D5,D6,D7を含む。ただし、前述のように、ページリストZ11,Z13は、比較のために図示したものであり、ページの抽出対象ではない。   The page list Z11 is a page list of the log type “type1”. The page list Z11 includes pages A1, A2, and A3 from the oldest time stamp to the newest time stamp. The page list Z12 is a page list of the log type “type2”. The page list Z12 includes pages B1, B2, and B3 from the oldest time stamp to the newest time stamp. The page list Z13 is a page list of the log type “type4”. The page list Z13 includes pages C1, C2, C3, and C4 from the oldest time stamp to the newest time stamp. The page list Z14 is a page list of the log type “type7”. The page list Z14 includes pages D1, D2, D3, D4, D5, D6, and D7 from the oldest time stamp to the newest time stamp. However, as described above, the page lists Z11 and Z13 are illustrated for comparison, and are not pages to be extracted.

この場合、メッセージの検出時(障害発生時)を現在とすると、現在から64時間前までがログ抽出対象の時間範囲である。なお、図25の例では、ログ抽出の時間範囲2(y)は設定なしなので、時間範囲2(y)を用いたログ抽出は行われずに、時間範囲1(x)を用いたログ抽出が行われる。図25の例では、ページB1,D1以降のページにおけるタイムスタンプがログ抽出対象の時間範囲に含まれる。   In this case, assuming that the current message detection time (failure occurrence time) is 64 hours before the current time is the log extraction target time range. In the example of FIG. 25, since log extraction time range 2 (y) is not set, log extraction using time range 2 (y) is not performed, and log extraction using time range 1 (x) is performed. Done. In the example of FIG. 25, the time stamps in the pages after page B1, D1 are included in the time range for log extraction.

最も優先順位の高いログタイプ“type2”、“type7”の最新のページD7は、現在から64時間前よりも後の時刻である(ただし、ここでは、優先レベル“1”のログタイプのみがログの抽出元候補である)。このため、ログ抽出部150は、ページD7を抽出する。そして、ログ抽出部150は、ページリストZ14からページD7を外す。   The latest page D7 of the log types “type 2” and “type 7” with the highest priority is the time after 64 hours from the current time (however, only the log type with the priority level “1” is logged here) Is a source candidate). For this reason, the log extraction unit 150 extracts the page D7. Then, the log extraction unit 150 removes the page D7 from the page list Z14.

以降のログ抽出処理でも、ログ抽出部150は、抽出候補のページが64時間前の時刻よりも後の時刻であることを確認する。
2番目に、ログ抽出部150は、ページリストZ12,Z14に属する各ページのうち、最新のページB3を抽出する。そして、ログ抽出部150は、ページリストZ12からページB3を外す。
In the subsequent log extraction process, the log extraction unit 150 confirms that the extraction candidate page is later than the time 64 hours ago.
Second, the log extraction unit 150 extracts the latest page B3 from the pages belonging to the page lists Z12 and Z14. Then, the log extraction unit 150 removes the page B3 from the page list Z12.

3番目に、ログ抽出部150は、ページリストZ12,Z14に属する各ページのうち、最新のページD6を抽出する。そして、ログ抽出部150は、ページリストZ14からページD6を外す。   Third, the log extraction unit 150 extracts the latest page D6 from the pages belonging to the page lists Z12 and Z14. Then, the log extraction unit 150 removes the page D6 from the page list Z14.

以降、同様にして、ログ抽出部150は、ページリストZ12,Z14に属する各ページのうち、新しいページから古いページへ順に抽出する。
9番目に、ログ抽出部150は、ページリストZ12,Z14に属する各ページのうち、最新のページD1を抽出する。そして、ログ抽出部150は、ページリストZ14からページD1を外す。この段階で、ページリストZ14には、未抽出のページがなくなる。
Thereafter, similarly, the log extraction unit 150 sequentially extracts from the new page to the old page among the pages belonging to the page lists Z12 and Z14.
Ninth, the log extraction unit 150 extracts the latest page D1 from the pages belonging to the page lists Z12 and Z14. Then, the log extraction unit 150 removes the page D1 from the page list Z14. At this stage, there are no unextracted pages in the page list Z14.

10番目に、ログ抽出部150は、ページリストZ12に属する各ページのうち、最新のページB1を抽出する。そして、ログ抽出部150は、ページリストZ12からページB1を外す。この段階で、ページリストD12には、未抽出のページがなくなる。   Tenth, the log extraction unit 150 extracts the latest page B1 from the pages belonging to the page list Z12. Then, the log extraction unit 150 removes the page B1 from the page list Z12. At this stage, there are no unextracted pages in the page list D12.

ログ抽出部150は、ページリストZ12,Z14において、未抽出のページがなくなったことを検出し、ログ抽出を完了する。抽出ログL1gは、上記の処理によってログ抽出部150により抽出されたページD7,B3,D6,B2,D5,D4,D3,D2,D1,B1を含む。   The log extraction unit 150 detects that there are no unextracted pages in the page lists Z12 and Z14, and completes the log extraction. The extracted log L1g includes pages D7, B3, D6, B2, D5, D4, D3, D2, D1, and B1 extracted by the log extracting unit 150 by the above processing.

こうして、CM100,200,300,400は、コピー機能のエラーに適した調査用ログを抽出することができる。また、CM100は、抽出された調査用ログを収集して、サポートサーバ60に送信することで、コピー機能のエラー解析に有用な情報に絞った情報提供を行うことができる。また、余計な情報を送るよりも通信量を減らすことができる。   In this way, the CMs 100, 200, 300, and 400 can extract the investigation log suitable for the copy function error. Further, the CM 100 collects the extracted investigation logs and transmits them to the support server 60, thereby providing information focused on information useful for error analysis of the copy function. In addition, the amount of communication can be reduced compared to sending extra information.

なお、第1の実施の形態の情報処理は、処理部1bにプログラムを実行させることで実現できる。また、第2,第3の実施の形態の情報処理は、プロセッサ101にプログラムを実行させることで実現できる。CM100は、プロセッサ101とRAM102とを備えたコンピュータを含むといえる。プログラムは、コンピュータ読み取り可能な記録媒体91に記録できる。   The information processing according to the first embodiment can be realized by causing the processing unit 1b to execute a program. The information processing according to the second and third embodiments can be realized by causing the processor 101 to execute a program. It can be said that the CM 100 includes a computer including a processor 101 and a RAM 102. The program can be recorded on a computer-readable recording medium 91.

例えば、プログラムを記録した記録媒体91を配布することで、プログラムを流通させることができる。また、プログラムを他のコンピュータに格納しておき、ネットワーク経由でプログラムを配布してもよい。コンピュータは、例えば、記録媒体91に記録されたプログラムまたは他のコンピュータから受信したプログラムを、RAM102やBUD106などの記憶装置に格納し(インストールし)、当該記憶装置からプログラムを読み込んで実行してもよい。   For example, the program can be distributed by distributing the recording medium 91 on which the program is recorded. Alternatively, the program may be stored in another computer and distributed via a network. For example, the computer stores (installs) a program recorded in the recording medium 91 or a program received from another computer in a storage device such as the RAM 102 or the BUD 106, and reads and executes the program from the storage device. Good.

1 情報処理装置
1a 記憶部
1b 処理部
2 動作情報
3 管理情報
DESCRIPTION OF SYMBOLS 1 Information processing apparatus 1a Storage part 1b Processing part 2 Operation information 3 Management information

Claims (7)

所定の装置の構成部品に関する複数のログレコードを含む動作情報のうち、抽出対象とするログレコードの時間範囲と前記ログレコードのタイプ毎の優先レベルとを、メッセージ毎に記憶する記憶部と、
メッセージを検出すると、前記記憶部を参照して、前記メッセージに応じた現時刻からの前記時間範囲および前記優先レベルに基づき、前記動作情報の中から前記ログレコードを抽出する処理部と、
を有する情報処理装置。
Among the operation information including a plurality of log records related to a component of a predetermined device, a storage unit that stores, for each message, a time range of the log record to be extracted and a priority level for each type of the log record;
When detecting a message, referring to the storage unit, based on the time range from the current time according to the message and the priority level, a processing unit for extracting the log record from the operation information,
An information processing apparatus.
前記処理部は、前記複数のログレコードを、タイプ毎に時系列にリンクさせ、ログレコード間のリンクに基づき、各タイプの前記ログレコードの抽出順を決定する、請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the processing unit links the plurality of log records in time series for each type, and determines an extraction order of the log records of each type based on a link between the log records. . 前記記憶部は、抽出する前記ログレコードの合計サイズの上限値の算出方法を示す情報をメッセージ毎に記憶し、
前記処理部は、前記メッセージを検出すると、前記記憶部を参照して、前記メッセージに応じた前記算出方法に基づき、前記上限値を算出する、
請求項1または2記載の情報処理装置。
The storage unit stores, for each message, information indicating a calculation method of the upper limit value of the total size of the log records to be extracted,
When the processing unit detects the message, the processing unit refers to the storage unit and calculates the upper limit value based on the calculation method according to the message.
The information processing apparatus according to claim 1 or 2.
前記処理部は、現時刻から過去の前記時間範囲に属するログレコード群のうち、第1の優先レベルに対応する第1のログレコードを、前記第1の優先レベルで示される優先順位より低い優先順位を示す第2の優先レベルに対応する第2のログレコードよりも優先的に抽出する、請求項3記載の情報処理装置。   The processing unit prioritizes a first log record corresponding to a first priority level among log record groups belonging to the time range in the past from the current time, the priority order being lower than the priority order indicated by the first priority level. The information processing apparatus according to claim 3, wherein the information processing apparatus extracts the information more preferentially than the second log record corresponding to the second priority level indicating the ranking. 前記処理部は、前記メッセージを受け付けると、複数の情報処理装置に、情報処理装置毎の前記動作情報からの前記ログレコードの抽出を指示し、
前記ログレコードの抽出を指示する際に、前記メッセージに応じた前記算出方法に基づき、情報処理装置毎の前記上限値を決定し、決定した前記上限値を、前記複数の情報処理装置に通知する、
請求項3または4記載の情報処理装置。
Upon receipt of the message, the processing unit instructs a plurality of information processing devices to extract the log record from the operation information for each information processing device,
When instructing the extraction of the log record, the upper limit value for each information processing device is determined based on the calculation method according to the message, and the determined upper limit value is notified to the plurality of information processing devices. ,
The information processing apparatus according to claim 3 or 4.
前記記憶部は、前記時間範囲よりも長い期間を示す他の時間範囲をメッセージ毎に記憶し、
前記処理部は、前記メッセージを検出すると、前記記憶部を参照して、前記メッセージに応じた現時刻から過去の前記時間範囲および前記優先レベルに基づき、前記動作情報の中から前記ログレコードを抽出し、その後、前記メッセージに応じた現時刻から過去の前記他の時間範囲および前記優先レベルに基づき、前記動作情報の中から他のログレコードを抽出する、
請求項1乃至5の何れか1項に記載の情報処理装置。
The storage unit stores, for each message, another time range indicating a period longer than the time range,
When the processing unit detects the message, the processing unit refers to the storage unit and extracts the log record from the operation information based on the past time range and the priority level from the current time according to the message. Then, another log record is extracted from the operation information based on the other time range and the priority level in the past from the current time according to the message.
The information processing apparatus according to any one of claims 1 to 5.
メッセージを検出すると、所定の装置の構成部品に関する複数のログレコードを含む動作情報のうち、抽出対象とするログレコードの時間範囲と前記ログレコードのタイプ毎の優先レベルとを、メッセージ毎に記憶する記憶部を参照して、前記メッセージに応じた前記時間範囲および前記優先レベルに基づき、前記動作情報の中から前記ログレコードを抽出する、
処理をコンピュータに実行させるプログラム。
When a message is detected, the time range of the log record to be extracted and the priority level for each type of the log record are stored for each message among the operation information including a plurality of log records related to the components of the predetermined device. With reference to the storage unit, the log record is extracted from the operation information based on the time range and the priority level according to the message.
A program that causes a computer to execute processing.
JP2017149995A 2017-08-02 2017-08-02 Information processing equipment and programs Active JP6974703B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017149995A JP6974703B2 (en) 2017-08-02 2017-08-02 Information processing equipment and programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017149995A JP6974703B2 (en) 2017-08-02 2017-08-02 Information processing equipment and programs

Publications (2)

Publication Number Publication Date
JP2019028878A true JP2019028878A (en) 2019-02-21
JP6974703B2 JP6974703B2 (en) 2021-12-01

Family

ID=65478743

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017149995A Active JP6974703B2 (en) 2017-08-02 2017-08-02 Information processing equipment and programs

Country Status (1)

Country Link
JP (1) JP6974703B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021157299A1 (en) 2020-02-04 2021-08-12 株式会社日立産機システム Communication device, surveillance server, and log collection method

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013065244A (en) * 2011-09-20 2013-04-11 Toshiba Corp Information processor and log management method
WO2013088477A1 (en) * 2011-12-15 2013-06-20 株式会社日立製作所 Monitoring computer and method
JP2017111601A (en) * 2015-12-16 2017-06-22 富士通株式会社 Inspection object identification program and inspection object identification method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013065244A (en) * 2011-09-20 2013-04-11 Toshiba Corp Information processor and log management method
WO2013088477A1 (en) * 2011-12-15 2013-06-20 株式会社日立製作所 Monitoring computer and method
JP2017111601A (en) * 2015-12-16 2017-06-22 富士通株式会社 Inspection object identification program and inspection object identification method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021157299A1 (en) 2020-02-04 2021-08-12 株式会社日立産機システム Communication device, surveillance server, and log collection method

Also Published As

Publication number Publication date
JP6974703B2 (en) 2021-12-01

Similar Documents

Publication Publication Date Title
JP5324958B2 (en) Method, program and apparatus for generating an integrated display of performance trends for multiple resources in a data processing system (integrated display of resource performance trends)
JP5423904B2 (en) Information processing apparatus, message extraction method, and message extraction program
TWI384361B (en) Hard disk system state monitoring method
US9298651B2 (en) Continuous in-memory accumulation of hardware performance counter data
CN102597962A (en) Method and system for fault management in virtual computing environments
US10606722B2 (en) Method and system for diagnosing remaining lifetime of storages in data center
CN109388210B (en) Distributed chassis, and management method and device of distributed chassis
CN110309130A (en) A kind of method and device for host performance monitor
US9342390B2 (en) Cluster management in a shared nothing cluster
US11126501B2 (en) Method, device and program product for avoiding a fault event of a disk array
Di et al. Exploring properties and correlations of fatal events in a large-scale hpc system
JP5975094B2 (en) Exchange candidate presentation method, information processing apparatus, and program
JP2017091077A (en) Pseudo-fault generation program, generation method, and generator
US9465684B1 (en) Managing logs of storage systems
JP2016051425A (en) Storage control device and storage control program
JP4648961B2 (en) Apparatus maintenance system, method, and information processing apparatus
Schwarz et al. Disk failure investigations at the internet archive
JP4371720B2 (en) Storage device system and storage system maintenance method
JP6974703B2 (en) Information processing equipment and programs
US11113163B2 (en) Storage array drive recovery
JPWO2011051999A1 (en) Information processing apparatus and information processing apparatus control method
US20150281140A1 (en) Identifying reports to address network issues
US11907087B2 (en) Remote health monitoring in data replication environments
US10936400B2 (en) Dynamic handling of callhome data
JP5250963B2 (en) Trend data storage and display methods in supervisory control systems

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200514

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20200529

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20200529

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210622

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210805

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211018

R150 Certificate of patent or registration of utility model

Ref document number: 6974703

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150