JP2014052827A - 情報処理装置及び情報処理方法 - Google Patents
情報処理装置及び情報処理方法 Download PDFInfo
- Publication number
- JP2014052827A JP2014052827A JP2012196587A JP2012196587A JP2014052827A JP 2014052827 A JP2014052827 A JP 2014052827A JP 2012196587 A JP2012196587 A JP 2012196587A JP 2012196587 A JP2012196587 A JP 2012196587A JP 2014052827 A JP2014052827 A JP 2014052827A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- information processing
- log
- processing apparatus
- logs
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】障害が発生した場合であっても効率良くログ情報を保存できる情報処理装置及び情報処理方法を提供する。
【解決手段】実施形態によれば、情報処理装置は、第1記録手段と、決定手段と、前記第2記録手段とを有する。第1記録手段は、情報処理装置の動作履歴を示すログを蓄積する。決定手段は、障害が発生した場合に、第1記録手段に記録したログのうち保存すべきログの件数を前記障害の内容に応じて決定する。第2記録手段は、決定手段によって決定された件数分のログを第1記録手段から読み出し、読み出したログを保存する。
【選択図】図1
【解決手段】実施形態によれば、情報処理装置は、第1記録手段と、決定手段と、前記第2記録手段とを有する。第1記録手段は、情報処理装置の動作履歴を示すログを蓄積する。決定手段は、障害が発生した場合に、第1記録手段に記録したログのうち保存すべきログの件数を前記障害の内容に応じて決定する。第2記録手段は、決定手段によって決定された件数分のログを第1記録手段から読み出し、読み出したログを保存する。
【選択図】図1
Description
本発明の実施形態は、情報処理装置及び情報処理方法に関する。
情報処理装置には、障害が発生した場合などに、動作状況を示すログを保存する機能を有するものがある。障害発生時の動作状況を詳細に検証するために多くの詳細なログをメモリに保存しようとすると、メモリにログとして保存するデータ量が大量になる。たとえば、障害が発生する度に多数の詳細ログをメモリに保存する情報処理装置では、障害が頻繁に発生した場合には、詳細ログによってメモリの記憶容量が圧迫されてしまう。
上記の課題を解決するため、障害が発生した場合に効率良くログ情報を保存できる情報処理装置及び情報処理方法を提供する。
実施形態によれば、情報処理装置は、第1記録手段と、決定手段と、前記第2記録手段とを有する。第1記録手段は、情報処理装置の動作履歴を示すログを蓄積する。決定手段は、障害が発生した場合に、第1記録手段に記録したログのうち保存すべきログの件数を前記障害の内容に応じて決定する。第2記録手段は、決定手段によって決定された件数分のログを第1記録手段から読み出し、読み出したログを保存する。
以下、本実施形態について、図面を参照して説明する。
図1は、本実施形態に係る情報処理装置10の構成例を概略的に示す図である。
本実施形態に係る情報処理装置10としては、たとえば、パーソナルコンピュータ(PC)、サーバ装置、あるいは、携帯端末装置などの機器が想定される。
図1が示すように、情報処理装置10は、制御部11、RAM12、ROM13、不揮発性メモリ14、及び、通信インターフェース(I/F)15などを備える。
図1は、本実施形態に係る情報処理装置10の構成例を概略的に示す図である。
本実施形態に係る情報処理装置10としては、たとえば、パーソナルコンピュータ(PC)、サーバ装置、あるいは、携帯端末装置などの機器が想定される。
図1が示すように、情報処理装置10は、制御部11、RAM12、ROM13、不揮発性メモリ14、及び、通信インターフェース(I/F)15などを備える。
制御部11は、情報処理装置10全体の動作を制御する。制御部11は、CPUなどで構成される。また、制御部11は、内部メモリおよび各種のインターフェースなどを備えても良い。制御部11は、内部メモリ、ROM13あるいは不揮発性メモリ14に予め記憶したプログラムを実行することにより種々の処理を実現する。たとえば、制御部11は、プログラムを実行することにより、通信インターフェース15を介して入力されるデータなどのデータを処理するデータ処理機能を有する。なお、制御部11がプログラムを実行することにより実現する各種の機能のうちの一部は、ハードウエア回路により実現されるものであっても良い。この場合、制御部11は、ハードウエア回路により実行される機能を制御する。
RAM12は、揮発性のメモリである。RAM12は、制御部11の処理中のデータなどを一時的に格納する。RAM12は、制御部11からの命令に基づき種々のアプリケーションプログラムを格納している。また、RAM12は、アプリケーションプログラムの実行に必要なデータ及びアプリケーションプログラムの実行結果などを格納してもよい。たとえば、制御部11は、不揮発性メモリ14に記録されているログ出力プログラムをRAM12上に展開し、当該ログ出力プログラムを実行する。
また、制御部11は、RAM12内に、ログ出力プログラムの実行結果として詳細ログ及び障害発生カウンタなどを格納する。たとえば、RAM12は、複数の詳細ログを記録する記録領域12a、および、障害発生カウンタテーブルを記録する記録領域12bを有する。RAM12に記憶される詳細ログ、および、障害発生カウンタテーブルについては、後述する。
ROM13は、予め制御用のプログラム及び制御データなどが記憶された不揮発性のメモリである。ROM22に記憶される制御プログラム及び制御データは、予め情報処理装置10の仕様に応じて組み込まれる。ROM13は、たとえば、情報処理装置10の回路基板を制御するプログラム(BIOS)などを格納している。
不揮発性メモリ14は、データの書き込み及び書き換えが可能な不揮発性のメモリである。不揮発性メモリ14は、例えば、ハードディスク、SSD、EEPROM又はフラッシュメモリなどにより構成される。不揮発性メモリ14は、情報処理装置10の運用用途に応じて制御プログラム、アプリケーション、及び種々のデータを格納する。不揮発性メモリ14は、たとえば、ログ出力プログラムなどを格納する。
また、不揮発性メモリ14は、詳細ログを記録する記録領域14a、通常ログを記録する記録領域14b、障害ログを記録する記録領域14c、障害情報テーブルを格納する記録領域14d、仮出力件数テーブルを格納する記録領域14e、および、出力係数テーブルを格納する記録領域14fなどを有する。これらの情報およびテーブルについては、後述する。
通信インターフェース15は、外部のシステムとのデータ通信を行うためのインターフェースである。
なお、情報処理装置10は、さらに、表示部、操作部及び外部インターフェースなどを備えても良く、上述した構成以外の構成要素を適宜追加しても良い。
なお、情報処理装置10は、さらに、表示部、操作部及び外部インターフェースなどを備えても良く、上述した構成以外の構成要素を適宜追加しても良い。
次に、RAM12の記録領域12aに記憶される詳細ログについて説明する。
図2は、記録領域12aに時系列で記録される詳細ログの例を示す図である。
詳細ログは、情報処理装置10の詳細な動作内容と当該動作が生じた時刻とを対応付けたデータである。図2に示す例では、関数の呼び出し、関数の引数、関数の終了情報(たとえば、正常終了又は異常終了など)、及び、動作モードの遷移状況などを示すデータが時刻情報に対応づけて詳細ログとして記憶領域12aに記憶される。なお、詳細ログとしては、システムコール呼び出し及びハードウェアアクセスなどのデータであっても良く、特定のデータに限定されるものではない。詳細ログは、障害発生時において、障害が発生するまでの動作経緯を詳細に解析するために利用される。
図2は、記録領域12aに時系列で記録される詳細ログの例を示す図である。
詳細ログは、情報処理装置10の詳細な動作内容と当該動作が生じた時刻とを対応付けたデータである。図2に示す例では、関数の呼び出し、関数の引数、関数の終了情報(たとえば、正常終了又は異常終了など)、及び、動作モードの遷移状況などを示すデータが時刻情報に対応づけて詳細ログとして記憶領域12aに記憶される。なお、詳細ログとしては、システムコール呼び出し及びハードウェアアクセスなどのデータであっても良く、特定のデータに限定されるものではない。詳細ログは、障害発生時において、障害が発生するまでの動作経緯を詳細に解析するために利用される。
記録領域12aは、複数の詳細ログをサイクリックに時系列で記憶する。サイクリックとは、記録領域12aにデータを記録していき、記録領域12aがいっぱいになると記録領域12aの最も古いデータに新しいデータを上書きしてデータを記録していく記録方式である。すなわち、制御部11は、詳細ログを記録領域12aに時系列の順番に記憶していき、記録領域12aがいっぱいになると、最も古い詳細ログ(時系列で最も古い詳細ログ)に上書きして記憶する。
たとえば、記録領域12aに記録される詳細ログの個数は、予め決められている。記録領域12aに記録される詳細ログの個数は、障害発生時において不揮発性メモリ14に記録される詳細ログの最大個数よりも大きい。記録領域12aに記録される詳細ログの個数は、たとえば、200個などであるが、上記の条件を満たせば特定の個数に限定されるものではない。
次に。RAM12の記録領域12bに記憶される障害発生カウンタテーブルについて説明する。
図3は、RAM12の記録領域12bに記録される障害発生カウンタテーブルの例を示す図である。
図3に示すように、記憶領域12bには、発生した障害の内容と各種の障害が発生した回数をカウントする発生回数カウンタとを対応付けた障害発生カウンタテーブルを記憶する。たとえば、障害が発生した場合、制御部11は、発生した障害の内容を特定する。発生した障害の内容を特定すると、制御部11は、障害発生カウンタテーブルにおける当該障害に対応する発生回数カウンタをカウントアップする。
図3は、RAM12の記録領域12bに記録される障害発生カウンタテーブルの例を示す図である。
図3に示すように、記憶領域12bには、発生した障害の内容と各種の障害が発生した回数をカウントする発生回数カウンタとを対応付けた障害発生カウンタテーブルを記憶する。たとえば、障害が発生した場合、制御部11は、発生した障害の内容を特定する。発生した障害の内容を特定すると、制御部11は、障害発生カウンタテーブルにおける当該障害に対応する発生回数カウンタをカウントアップする。
図3が示す例において、たとえば、障害発生カウンタテーブル内の回線切断エラーに対応する発生回数カウンタが「5」である。図3に示す障害発生カウンタテーブルでは、回線切断エラーが5回生じたことを示している。たとえば、障害発生カウンタテーブルが図3に示す状態で障害として回線切断エラーが生じたと特定した場合、制御部11は、障害発生カウンタテーブルにおける回線切断エラーに対応する発生回数カウンタを「5」から「6」に書き換える。
また、障害発生カウンタテーブルは、RAM12に格納されているので、情報処理装置10が起動してからシャットダウンされるまでに生じた障害の回数をカウントする。すなわち、障害発生カウンタテーブルをRAM12の記憶領域12bに記憶することにより、情報処理装置10がリセット又はシャットダウンされるごとに、障害発生カウンタテーブルは、初期状態(即ち、全ての障害に対応する発生回数カウンタが初期化(「0」)の状態)に戻るようになっている。
なお、障害発生カウンタテーブルは、不揮発性メモリ14に記憶するようにしても良い。障害発生カウンタテーブルを不揮発性メモリ14に記憶することにより、情報処理装置10がリセット又はシャットダウンされた場合にも、障害発生カウンタテーブルにおいてカウントアップした値を初期状態に戻らないようにすることもできる。この場合も、障害発生カウンタテーブルは、制御部11の制御により任意のタイミングで初期化することが可能である。
次に、不揮発性メモリ14の記録領域14aに記憶する詳細ログについて説明する。
不揮発性メモリ14の記録領域14aは、障害発生時に制御部11が決定する記録件数の詳細ログを障害発生時から時系列で記録する。即ち、障害が発生すると、制御部11は、障害の内容に応じて決定する記録件数分の詳細ログを障害発生時から遡って選出する。記録領域14aは、制御部11が障害の内容に応じて決定した件数分の詳細ログを記録する。これにより、記録領域14aは、障害が発生する度に、障害発生時から遡って障害の内容に応じた件数分の詳細ログが追記される。なお、詳細ログの記録件数の決定方法及び記録領域14aへの詳細ログの記録手順は後述する。また、記録領域14aに記録される詳細ログは、RAM12の記録領域12aに記憶されている詳細ログであり、上述したような図2に示すような構成を有するものとする。
不揮発性メモリ14の記録領域14aは、障害発生時に制御部11が決定する記録件数の詳細ログを障害発生時から時系列で記録する。即ち、障害が発生すると、制御部11は、障害の内容に応じて決定する記録件数分の詳細ログを障害発生時から遡って選出する。記録領域14aは、制御部11が障害の内容に応じて決定した件数分の詳細ログを記録する。これにより、記録領域14aは、障害が発生する度に、障害発生時から遡って障害の内容に応じた件数分の詳細ログが追記される。なお、詳細ログの記録件数の決定方法及び記録領域14aへの詳細ログの記録手順は後述する。また、記録領域14aに記録される詳細ログは、RAM12の記録領域12aに記憶されている詳細ログであり、上述したような図2に示すような構成を有するものとする。
次に、不揮発性メモリ14の記録領域14bに記憶する通常ログについて説明する。
図4は、記録領域14bに時系列で記録される通常ログの例を示す図である。
通常ログは、情報処理装置10の稼働状況と当該稼働状況が生じた時刻とを対応付けたデータである。通常ログは、詳細ログよりも大まかに情報処理装置の稼働状況を示すログ情報である。たとえば、通常ログは、情報処理装置10の稼働時間などを記録するためなどに利用される。図4に示す例では、通常ログは、情報処理装置10の電源状態(たとえば、スイッチオン又はシャットダウンなど)及び稼動状況(たとえば、稼動開始又は稼動終了など)などを示すデータから構成される。記録領域14bには、通常ログが時系列を記録される。通常ログの構成は、特定の構成に限定されるものではない。
図4は、記録領域14bに時系列で記録される通常ログの例を示す図である。
通常ログは、情報処理装置10の稼働状況と当該稼働状況が生じた時刻とを対応付けたデータである。通常ログは、詳細ログよりも大まかに情報処理装置の稼働状況を示すログ情報である。たとえば、通常ログは、情報処理装置10の稼働時間などを記録するためなどに利用される。図4に示す例では、通常ログは、情報処理装置10の電源状態(たとえば、スイッチオン又はシャットダウンなど)及び稼動状況(たとえば、稼動開始又は稼動終了など)などを示すデータから構成される。記録領域14bには、通常ログが時系列を記録される。通常ログの構成は、特定の構成に限定されるものではない。
次に、不揮発性メモリ14の記録領域14cに記憶する障害ログについて説明する。
図5は、記録領域14cに時系列で記録される障害ログの例を示す図である。
障害ログは、情報処理装置10に発生した障害の内容と当該障害が発生した時刻とを対応付けたデータである。たとえば、障害ログは、発生した障害の内容を特定するために利用される。図5に示す例において、障害ログは、「回線接続失敗エラー」、「ファイル書き込み時エラー」、及び、「回線切断エラー」などの各障害が発生した時刻を示すデータで構成される。すなわち、障害が発生する毎に、制御部11は、発生した障害の内容を示す障害ログが生成し、記憶領域14cには、制御部11が生成する障害ログが追記される。この結果として、記憶領域14cは、時系列で障害ログを記憶する。なお、障害ログの構成は、特定の構成に限定されるものではない。
図5は、記録領域14cに時系列で記録される障害ログの例を示す図である。
障害ログは、情報処理装置10に発生した障害の内容と当該障害が発生した時刻とを対応付けたデータである。たとえば、障害ログは、発生した障害の内容を特定するために利用される。図5に示す例において、障害ログは、「回線接続失敗エラー」、「ファイル書き込み時エラー」、及び、「回線切断エラー」などの各障害が発生した時刻を示すデータで構成される。すなわち、障害が発生する毎に、制御部11は、発生した障害の内容を示す障害ログが生成し、記憶領域14cには、制御部11が生成する障害ログが追記される。この結果として、記憶領域14cは、時系列で障害ログを記憶する。なお、障害ログの構成は、特定の構成に限定されるものではない。
次に、不揮発性メモリ14の記憶領域14dに記憶される障害情報テーブルについて説明する。
図6は、記録領域14dに格納される障害情報テーブルの例を示す図である。
障害情報テーブルは、生じ得る障害の障害名と障害種別と重要度とを対応付けた情報であり、不揮発性メモリ14の記憶領域14dに記憶される。
障害名は、障害の内容を示す情報である。障害名は、記録領域14cに記録されている障害ログと対応している。障害種別は、障害のカテゴリを示す情報である。たとえば、「回線切断エラー」及び「回線接続失敗エラー」は、ともに「通信エラー」にカテゴライズされている。また、「ファイルオープンエラー」及び「ファイル書き込み時エラー」は、ともに「IOエラー」にカテゴライズされている。重要度は、障害の重要性を示す情報である。重要度が高いほど、重大な障害(即ち、障害の解析に多くの詳細ログを必要とする障害)である。たとえば、図6に示す例では、「回線切断エラー」の重要度は、「高」であるので、同一種別の中の他の障害と比べて重大な障害であるとして設定されている。また、図6に示す例において、「ファイルオープンエラー」の重要度は、「低」であるので、同一種別の中の他の障害と比べそれほど重大ではない障害として設定されている。
図6は、記録領域14dに格納される障害情報テーブルの例を示す図である。
障害情報テーブルは、生じ得る障害の障害名と障害種別と重要度とを対応付けた情報であり、不揮発性メモリ14の記憶領域14dに記憶される。
障害名は、障害の内容を示す情報である。障害名は、記録領域14cに記録されている障害ログと対応している。障害種別は、障害のカテゴリを示す情報である。たとえば、「回線切断エラー」及び「回線接続失敗エラー」は、ともに「通信エラー」にカテゴライズされている。また、「ファイルオープンエラー」及び「ファイル書き込み時エラー」は、ともに「IOエラー」にカテゴライズされている。重要度は、障害の重要性を示す情報である。重要度が高いほど、重大な障害(即ち、障害の解析に多くの詳細ログを必要とする障害)である。たとえば、図6に示す例では、「回線切断エラー」の重要度は、「高」であるので、同一種別の中の他の障害と比べて重大な障害であるとして設定されている。また、図6に示す例において、「ファイルオープンエラー」の重要度は、「低」であるので、同一種別の中の他の障害と比べそれほど重大ではない障害として設定されている。
障害情報テーブルは、制御部11が発生した障害について、種別および重要度を判定するために使用される。たとえば、障害として「回線接続失敗エラー」が生じた場合、制御部11は、障害情報テーブルを参照することにより、「回線接続失敗エラー」が属している種別とその重要度とを取得する。図6に示す障害情報テーブルを参照するとすれば、制御部11は、「回線接続失敗エラー」の障害種別を「通信エラー」と判断し、その重要度を「中」と判断する。障害情報テーブルを参照して取得した障害種別及び重要度の情報は、制御部11が詳細ログの記録件数を決定するために利用される。
なお、障害情報テーブルは、予め不揮発性メモリ14の記録領域14dに格納される情報である。障害情報テーブルにおいて各障害に対する障害種別及び重要度は、情報処理装置10の構成及び情報処理装置10を運用しているシステムなどによって適宜設定されるものであり、特定の構成に限定されるものではない。
次に、不揮発性メモリ14の記録領域14eに記憶される仮出力件数テーブルについて説明する。
図7は、記録領域14eに格納されている仮出力件数テーブルの例を示す図である。
仮出力件数テーブルは、障害種別及び重要度に対応する仮出力件数を示す情報であり、不揮発性メモリ14の記憶領域14eに記憶される。障害種別及び重要度は、障害情報テーブルに格納される障害種別及び重要度に対応する情報であり、前述した通りの情報である。仮出力件数は、障害発生時に、制御部11が不揮発性メモリ14に記憶する詳細ログの記録件数を決定するために利用される。制御部11は、仮出力件数テーブルで特定される仮出力件数を用いて後述する計算方法による演算処理により不揮発性メモリ14への詳細ログの記録件数を決定する。
図7は、記録領域14eに格納されている仮出力件数テーブルの例を示す図である。
仮出力件数テーブルは、障害種別及び重要度に対応する仮出力件数を示す情報であり、不揮発性メモリ14の記憶領域14eに記憶される。障害種別及び重要度は、障害情報テーブルに格納される障害種別及び重要度に対応する情報であり、前述した通りの情報である。仮出力件数は、障害発生時に、制御部11が不揮発性メモリ14に記憶する詳細ログの記録件数を決定するために利用される。制御部11は、仮出力件数テーブルで特定される仮出力件数を用いて後述する計算方法による演算処理により不揮発性メモリ14への詳細ログの記録件数を決定する。
すなわち、仮出力件数テーブルは、各種の障害に対して、詳細ログの記録件数の基準となる仮出力件数を示すものである。たとえば、障害の重要度が高いほど、障害を解析するために必要な詳細ログが多くなるものと考えると、仮出力件数は、障害の重要度が大きいほど、大きな値となるように設定される。たとえば、図7に示す例では、「通信エラー」の種別において、重要度が「高」である障害に対応する仮出力件数は、「100」であり、重量度が「低」である障害に対応する仮出力件数は、「60」である。また、仮出力件数テーブルは、障害種別によっても、仮出力件数が異なるように設定して良い。これは、障害種別によって障害を解析するのに必要な詳細ログの件数が異なることが想定されるからである。たとえば、図7に示す例では、重要度が「高」の欄において、種別が「通信エラー」である障害に対応する仮出力件数は、「100」であり、種別が「引数エラー」である障害に対応する仮出力件数は、「5」である。
仮出力件数テーブルは、障害発生時に、制御部11が発生した障害の仮出力件数を取得するために利用される。たとえば、発生した障害の障害種別が「IOエラー」でその重要度が「中」である場合、制御部11は、図7に示すような仮出力件数テーブルを参照することにより、発生した障害に対応する仮出力件数が「50」であると判断する。
不揮発性メモリ14の記録領域14eには、予め設定された仮出力件数テーブルが記憶される。仮出力件数テーブルにおける各障害種別及び重要度に対応する仮出力件数は、情報処理装置10の構成及び情報処理装置10を含むシステムの運用形態などによって適宜設定されるものであり、特定の構成に限定されるものではない。
次に、不揮発性メモリ14の記憶領域14fに記憶される出力係数テーブルについて説明する。
図8は、記録領域14fに格納されている出力係数テーブルの例を示す図である。
出力係数テーブルは、障害の発生回数と発生回数に対応した出力係数とを対応付けた情報であり、不揮発性メモリ14の記憶領域14fに記憶される。
図8は、記録領域14fに格納されている出力係数テーブルの例を示す図である。
出力係数テーブルは、障害の発生回数と発生回数に対応した出力係数とを対応付けた情報であり、不揮発性メモリ14の記憶領域14fに記憶される。
発生回数は、これまでに発生した同一の障害の発生回数に対する閾値である。出力係数は、発生した障害に応じた詳細ログの記録件数を決定するために、仮出力件数に乗算される値である。出力係数は、これまでに発生した同一の障害の発生回数に応じて変化するように設定できる。たとえば、出力係数テーブルにおいて、発生回数が多いほど出力計数を小さな値としても良い。これは、すでに同一の障害が発生している場合、以前に生じた同一の障害の詳細ログが既に不揮発性メモリ14の記録領域14aに記録されているため、改めて多数の詳細ログを記録領域14aに記録する必要性が少ないという考えに基づくものである。たとえば、図8に示す例では、発生回数「5件以上」に対応する出力係数は「0.5」であり、発生回数「2件未満」に対応する出力係数は「2」である。ただし、出力係数テーブルにおける出力係数の設定方法は、上述したものに限定されるものではなく、情報処理装置10の構成あるいは情報処理装置を含むシステムの運用形態などに応じて適宜設定されるものである。
出力係数テーブルは、障害発生時において、制御部11が出力係数を決定するために利用される。たとえば、図3に示すように、「回線接続失敗エラー」がこれまでに2回生じている場合において、再度「回線接続失敗エラー」が生じると、制御部11は、これまでに回線接続エラーが3回生じていると認識する。これまでの「回線接続失敗エラー」の回数が3回であると認識すると、制御部11は、図8に示す出力係数テーブルを参照すれば、発生回数「2〜4件」に対応する出力係数が「1」であると決定する。
不揮発性メモリ14の記録領域14fには、予め設定された出力係数テーブルが記憶される。発生回数の閾値及び発生回数に対応する出力係数は、情報処理装置10の構成及び情報処理装置10を含むシステムの運用形態などによって適宜設定ものであり、特定の構成に限定されるものではない。
次に、情報処理装置10がログを不揮発性メモリ14に保存する動作(ログの保存処理)について概略的に説明する。
まず、通常時(障害未発生時)におけるログの保存処理を説明する。
図9は、情報処理装置10における通常時(障害未発生時)のログの保存処理を説明するための図である。
まず、通常時(障害未発生時)におけるログの保存処理を説明する。
図9は、情報処理装置10における通常時(障害未発生時)のログの保存処理を説明するための図である。
情報処理装置10において、制御部11は、プロセッサがRAM12上に展開したログ出力プログラムを実行することにより、ログの保存処理を実行する。
通常時において、制御部11は、情報処理装置10の各部からその動作状況のデータを収集し、収集したデータなどから随時、通常ログを生成する。通常ログは、詳細ログとは異なり、情報処理装置全体としての稼働状況などを示すログ情報であり、例えば、図4に示すようなログ情報である。通常ログを生成すると、制御部11は、生成した通常ログを不揮発性メモリ14内の記録領域14bに時系列で格納する。
通常時において、制御部11は、情報処理装置10の各部からその動作状況のデータを収集し、収集したデータなどから随時、通常ログを生成する。通常ログは、詳細ログとは異なり、情報処理装置全体としての稼働状況などを示すログ情報であり、例えば、図4に示すようなログ情報である。通常ログを生成すると、制御部11は、生成した通常ログを不揮発性メモリ14内の記録領域14bに時系列で格納する。
また、制御部11は、自身がデータ処理のために実行した処理、あるいは、情報処理装置10の各部が実行した処理などの詳細な動作状況を示すデータを収集し、詳細ログを生成する。詳細ログは、通常ログよりも詳細に、実行した処理内容を示す情報であり、例えば、図2に示すようなログ情報である。詳細ログを生成すると、制御部11は、RAM12内の記録領域12aにサイクリックに当該詳細ログを格納する。
以上の動作を繰り返して実行することにより、通常時(障害が発生しない場合)は、制御部11は、通常ログを不揮発性メモリ14内の記録領域14bに時系列で書き込み、詳細ログを時系列でRAM12内の記録領域12aにサイクリックに書き込む。なお、通常ログを不揮発性メモリ14の記録領域14bに記憶する処理と詳細ログをRAM12の記録領域12aに記憶する処理とは、並行して実行しても良いし、交互に実行するようにしても良い。
次に、障害発生時におけるログの保存処理について説明する。
図10は、情報処理装置10における障害発生時のログの保存処理を説明するための図である。
制御部11は、当該情報処理装置10において障害が発生したか否かを常時監視している。障害の発生がなければ、制御部11は、上述した通常時の処理を繰り返し実行する。障害の発生を検出した場合、制御部11は、発生した障害の内容を特定し、RAM12における記録領域12bに記録されている障害発生カウンタテーブル内の発生した障害に対応する発生回数カウンタをカウントアップする。たとえば、「回線切断エラー」が発生した場合、制御部11は、図3に示す障害発生カウンタテーブル内の「回線切断エラー」に対応する発生回数カウンタを「5」から「6」に書き換える。なお、制御部11が障害の発生を検出する方法は、特定の方法に限定されるものではない。
図10は、情報処理装置10における障害発生時のログの保存処理を説明するための図である。
制御部11は、当該情報処理装置10において障害が発生したか否かを常時監視している。障害の発生がなければ、制御部11は、上述した通常時の処理を繰り返し実行する。障害の発生を検出した場合、制御部11は、発生した障害の内容を特定し、RAM12における記録領域12bに記録されている障害発生カウンタテーブル内の発生した障害に対応する発生回数カウンタをカウントアップする。たとえば、「回線切断エラー」が発生した場合、制御部11は、図3に示す障害発生カウンタテーブル内の「回線切断エラー」に対応する発生回数カウンタを「5」から「6」に書き換える。なお、制御部11が障害の発生を検出する方法は、特定の方法に限定されるものではない。
発生回数カウンタをカウントアップすると、制御部11は、発生した障害を示す障害ログを生成する。障害ログを生成すると、制御部11は、生成した障害ログを不揮発性メモリ14における記録領域14cに時系列で格納する。
生成した障害ログを不揮発性メモリ14内の記録領域14cに時系列で格納すると、制御部11は、不揮発性メモリ14に記録する詳細ログの記録件数を決定する。ここで、詳細ログの記録件数の決定方法について説明する。
発生した障害の内容を特定すると、制御部11は、不揮発性メモリ14内の記録領域14dに記録されている障害情報テーブルを参照して、発生した障害の障害種別及び重要度を判定する。たとえば、「回線切断エラー」が発生した場合、制御部11は、図6に示す障害情報テーブルを参照すれば、発生した障害(「回線切断エラー」)の障害種別が「通信エラー」であると判定し、重要度が「高」であると判定する。
発生した障害の障害種別及び重要度を判定すると、制御部11は、不揮発性メモリ14内の記録領域14eに記録されている仮出力件数テーブルを参照して、発生した障害の仮出力件数を判定する。たとえば、障害種別が「通信エラー」、かつ、重要度が「高」と判定した場合、制御部11は、図7に示す仮出力件数テーブルを参照すれば、発生した障害(「回線切断エラー」)の仮出力件数が「100」であると判定する。
仮出力件数を判定すると、制御部11は、RAM12内の記録領域12bに記録されている障害発生カウンタテーブルと不揮発性メモリ14内の記録領域14fに記録されている出力係数テーブルとを参照して、出力係数を取得する。たとえば、「回線切断エラー」が発生した場合、制御部11は、障害発生カウンタテーブルが図3に示す状態であれば、障害発生カウンタテーブルにおける「回線切断エラー」の発生回数「5」に「1」(今回の発生回数分)を加算した「6」に更新する。制御部11は、今回発生の「回線切断エラー」の分を加算した障害発生カウンタテーブルを参照して、「回線切断エラー」の発生回数が「6」であると判定する。今回発生した「回線切断エラー」の発生回数が「6」と判定した場合、制御部11は、図8に示す出力係数テーブルを参照すれば、発生回数「6」に対応する出力係数が「0.5」であると判定する。
出力係数を判定すると、制御部11は、判定した仮出力件数に、判定した出力係数を乗数して、詳細ログの記録件数を計算する。即ち、制御部11は、以下の式に従って詳細ログの記録件数を計算する。
詳細ログの記録件数=仮出力件数×出力係数
たとえば、「回線切断エラー」が発生した場合、制御部11は、仮出力件数「100」に、出力係数「0.5」を掛けて、詳細ログの記録件数「50」を計算する。
以上の手順により、制御部11は、詳細ログの記録件数を計算する。なお、詳細ログの記録件数は、障害が発生した時刻、不揮発性メモリ14の残り容量及び情報処理装置10で実行されているアプリケーションなどを考慮して決定してもよい。詳細ログの記録件数の決定方法は、特定の方法に限定するものではない。
詳細ログの記録件数=仮出力件数×出力係数
たとえば、「回線切断エラー」が発生した場合、制御部11は、仮出力件数「100」に、出力係数「0.5」を掛けて、詳細ログの記録件数「50」を計算する。
以上の手順により、制御部11は、詳細ログの記録件数を計算する。なお、詳細ログの記録件数は、障害が発生した時刻、不揮発性メモリ14の残り容量及び情報処理装置10で実行されているアプリケーションなどを考慮して決定してもよい。詳細ログの記録件数の決定方法は、特定の方法に限定するものではない。
詳細ログの記録件数を計算すると、制御部11は、障害発生時から遡って、詳細ログの記録件数分の詳細ログをRAM12内の記録領域12aから読み出し、読み出した詳細ログを不揮発性メモリ14内の記録領域14aに時系列で記憶する。RAM12内の記録領域12aに記録されている詳細ログの件数が詳細ログ記録件数に満たない場合には、制御部11は、RAM12内の記録領域12aに記録されている全ての詳細ログを、不揮発性メモリ14内の記録領域14aに追加的に時系列で格納する。たとえば、「回線切断エラー」が発生した場合、制御部11は、計算した詳細ログの記録件数「50」分の詳細ログをRAM12内の記録領域12aから読み出し、不揮発性メモリ14内の記録領域14aに追加的に時系列で格納する。
読み出した詳細ログを不揮発性メモリ14内の記録領域14aに時系列で記憶すると、制御部11は、障害発生に伴うログの保存処理を終了する。障害発生時のログの保存処理を終了すると、制御部11は、通常時のログの保存処理に戻る。
次に、情報処理装置10におけるログの保存処理の流れについて説明する。
図11は、情報処理装置10のログ出力動作例を説明するためのフローチャートである。
まず、情報処理装置10の稼働が開始されたものとする(ステップS11)。情報処理装置10の稼働が開始されると、制御部11は、情報処理装置10の稼働が停止されたことを監視する(ステップS12)。
図11は、情報処理装置10のログ出力動作例を説明するためのフローチャートである。
まず、情報処理装置10の稼働が開始されたものとする(ステップS11)。情報処理装置10の稼働が開始されると、制御部11は、情報処理装置10の稼働が停止されたことを監視する(ステップS12)。
情報処理装置10の稼働が停止されていない場合、つまり、情報処理装置10が稼働中である場合(ステップS12、NO)、制御部11は、通常ログとして記録すべきイベントが発生したか否かを判断する(ステップS13)。通常ログとして記録すべきイベントが発生したと判断した場合(ステップS13、YES)、制御部11は、当該イベントが発生したことを示す通常ログを生成し、生成した通常ログを不揮発性メモリ14内の記録領域14aに追加的に時系列で格納する(ステップS14)。
通常ログを不揮発性メモリ14内の記録領域14bに格納した場合、あるいは、通常ログとして記録すべきイベントが発生していないと判断した場合(ステップS13、NO)、制御部11は、詳細ログとして記録すべきイベントが発生したか否かを判断する(ステップS15)。なお、ステップS15−S16の処理は、ステップS13−S14の処理の前に実行しても良いし、ステップS13−S14の処理と並行して実行しても良い。
詳細ログとして記録すべきイベントが発生したと判断した場合(ステップS15、YES)、制御部11は、当該イベントが発生したことを示す詳細ログを生成し、生成した詳細ログをRAM12内の記録領域14aにサイクリックに格納する(ステップS16)。
詳細ログをRAM12内の記録領域14aに格納した場合、あるいは、詳細ログとして記録すべきイベントが発生していないと判断した場合(ステップS15、NO)、制御部11は、障害が発生したか判定する(ステップS17)。
障害が発生したと判定した場合(ステップS17、YES)、制御部11は、発生した障害の内容と特定し、RAM12内の記録領域12bに記録している発生した障害に対応する発生回数カウンタをカウントアップする(ステップS18)。発生した障害に対応する発生回数カウンタをカウントアップすると、制御部11は、発生した障害の内容を示す障害ログを生成し、生成した障害ログを不揮発性メモリ14内の記録領域14cに追加的に時系列で格納する(ステップS19)。
障害ログを不揮発性メモリ14内の記録領域14cに格納すると、制御部11は、発生した障害に応じて、不揮発性メモリ14に保存すべき詳細ログの記録件数を決定する(ステップS20)。詳細ログの記録件数の決定方法は、前述の通りである。発生した障害に応じた詳細ログの記録件数を決定すると、制御部11は、障害発生時から遡って決定した詳細ログの記録件数分の詳細ログをRAM12内の記録領域12aから読み出し、読み出した詳細ログを不揮発性メモリ14内の記録領域12aに追加的に時系列で保存する(ステップS21)。
障害に応じた件数の詳細ログを不揮発性メモリ14内の記録領域12aに保存した場合、あるいは、障害が発生していないと判断した場合(ステップS17、NO)、制御部11は、ステップS12へ戻り、上述した処理を繰り返し実行する。
また、情報処理装置10の稼働が停止されたと判断した場合(ステップS12、YES)、制御部11は、ログの保存処理を終了する。
また、情報処理装置10の稼働が停止されたと判断した場合(ステップS12、YES)、制御部11は、ログの保存処理を終了する。
以上のようなログの保存処理によれば、稼働中の情報処理装置10は、通常時には詳細ログをRAMに設けた記録領域にサイクリックに記憶しておき、障害が発生した場合には障害ログと発生した障害の内容に応じた件数の詳細ログとを不揮発性メモリに保存するようにできる。
上記のように、実施形態に係る情報処理装置は、通常時においてRAMに詳細ログを蓄積記録し、障害が発生した場合においては、発生した障害の種別、重要度及び発生回数などに基づいて不揮発性メモリに保存する詳細ログの件数を決定し、決定した件数の詳細ログをRAMから読み出して不揮発性メモリに保存する。
これにより、障害発生時に、発生した障害の種別、重要度および発生回数などに応じた件数の詳細ログを不揮発性メモリに保存することができ、障害が発生する毎に不要な詳細ログを不揮発性メモリに保存することによって不揮発性メモリの記憶容量が圧迫されることが防止できる。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
10…情報処理装置、11…制御部、12…RAM(第1記録手段)、13…ROM、14…不揮発性メモリ(第2記録手段)、15…通信インターフェース。
Claims (7)
- 障害発生時に動作履歴を記録する情報処理装置において、
当該情報処理装置の動作履歴を示すログを蓄積する第1記録手段と、
障害が発生した場合に、前記第1記録手段に記録したログのうち保存すべきログの件数を前記障害の内容に応じて決定する決定手段と、
前記決定手段によって決定された件数分のログを前記第1記録手段から読み出し、読み出したログを保存する第2記録手段と、
を有する情報処理装置。 - 前記第1記録手段は、揮発性のメモリであり、
前記第2記録手段は、不揮発性のメモリである、
前記請求項1に記載の情報処理装置。 - 前記決定手段は、前記障害の種別、重要度、或いは発生回数に基づいて前記件数を決定する、
前記請求項1又は2の何れか1項に記載の情報処理装置。 - 前記第1記録手段は、所定量のログをサイクリックに記録する、
前記請求項1乃至3の何れか1項に記載の情報処理装置。 - 前記第2記録手段は、前記障害が発生した時点から遡って前記件数分のログを前記第1記録手段から読み出して記録する、
前記請求項1乃至4の何れか1項に記載の情報処理装置。 - さらに、前記障害が発生した場合に、前記障害を示す障害ログを保存する第3記録手段を有する、
前記請求項1乃至5の何れか1項に記載の情報処理装置。 - 障害発生時に動作履歴を記録する情報処理方法において、
第1記録手段に情報処理装置の動作履歴を示すログを記録し、
障害が発生した場合に、前記第1記録手段に記録したログのうち保存すべきログの件数を前記障害の内容に応じて決定し、
前記決定した件数分のログを前記第1記録手段から読み出し、読み出したログを前記第1記録手段とは異なる第2記録手段に保存する、
情報処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012196587A JP2014052827A (ja) | 2012-09-06 | 2012-09-06 | 情報処理装置及び情報処理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012196587A JP2014052827A (ja) | 2012-09-06 | 2012-09-06 | 情報処理装置及び情報処理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2014052827A true JP2014052827A (ja) | 2014-03-20 |
Family
ID=50611273
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012196587A Pending JP2014052827A (ja) | 2012-09-06 | 2012-09-06 | 情報処理装置及び情報処理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2014052827A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015182295A1 (ja) * | 2014-05-26 | 2015-12-03 | 日立オートモティブシステムズ株式会社 | 車両制御装置 |
JP2016162264A (ja) * | 2015-03-03 | 2016-09-05 | 日立オートモティブシステムズ株式会社 | 自動車用電子制御装置 |
JP2019079354A (ja) * | 2017-10-25 | 2019-05-23 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
-
2012
- 2012-09-06 JP JP2012196587A patent/JP2014052827A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015182295A1 (ja) * | 2014-05-26 | 2015-12-03 | 日立オートモティブシステムズ株式会社 | 車両制御装置 |
JP2015225396A (ja) * | 2014-05-26 | 2015-12-14 | 日立オートモティブシステムズ株式会社 | 車両制御装置 |
US10642658B2 (en) | 2014-05-26 | 2020-05-05 | Hitachi Automotive Systems, Ltd. | Vehicle control apparatus |
JP2016162264A (ja) * | 2015-03-03 | 2016-09-05 | 日立オートモティブシステムズ株式会社 | 自動車用電子制御装置 |
JP2019079354A (ja) * | 2017-10-25 | 2019-05-23 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7031224B2 (ja) | 2017-10-25 | 2022-03-08 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7617074B2 (en) | Suppressing repeated events and storing diagnostic information | |
JP4487978B2 (ja) | 半導体記憶装置管理システム、プログラム、半導体記憶装置の管理方法 | |
JP4496265B2 (ja) | 情報処理装置及び故障予兆判定方法 | |
US8839017B2 (en) | Electronic device and method for detecting power statuses of electronic device | |
US20070067675A1 (en) | Method and system for managing failure information | |
US8234526B2 (en) | Computer system and monitoring device | |
CN111143104A (zh) | 一种内存异常的处理方法、系统、电子设备及存储介质 | |
JP2009110156A (ja) | ログ出力装置及びログ出力プログラム | |
JP5359601B2 (ja) | ダンプ出力制御装置、ダンプ出力制御プログラム、ダンプ出力制御方法 | |
JP2014052827A (ja) | 情報処理装置及び情報処理方法 | |
JP5545761B2 (ja) | 障害解析支援システム、障害解析支援方法、および障害解析支援プログラム | |
US20090259835A1 (en) | System and method for tracking and recording system configurations of electronic devices | |
US7886202B2 (en) | System and methods for recording, displaying, and reconstructing computer-based system and user events | |
JP2012247937A (ja) | 情報処理装置、ログ記憶制御プログラムおよびログ記憶制御方法 | |
US10956038B2 (en) | Non-volatile memory drive partitions within microcontrollers | |
JP5627414B2 (ja) | 動作ログ収集システム及びプログラム | |
US20160378589A1 (en) | Computer-readable recording medium, information processing apparatus, and control method | |
US20160188254A1 (en) | Lifecycle management of solid state memory adaptors | |
JP2007172414A (ja) | 組込機器向けのコンパクトコアダンププログラム及びコンパクトコアダンプを用いた方法 | |
JP2010157266A (ja) | 情報処理装置、故障予兆判定方法及びプログラム | |
US10592329B2 (en) | Method and electronic device for continuing executing procedure being aborted from physical address where error occurs | |
JP2009157441A (ja) | 情報処理装置、ファイル再配置方法およびプログラム | |
CN115033439B (zh) | 一种服务器测试方法及装置 | |
JP7037514B2 (ja) | プラント監視システムおよびプラント監視方法 | |
WO2009150722A1 (ja) | トレース情報制御装置、トレース情報制御方法およびそのためのプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |