JP7180319B2 - 情報処理装置、及び情報処理装置のダンプ管理方法 - Google Patents

情報処理装置、及び情報処理装置のダンプ管理方法 Download PDF

Info

Publication number
JP7180319B2
JP7180319B2 JP2018220635A JP2018220635A JP7180319B2 JP 7180319 B2 JP7180319 B2 JP 7180319B2 JP 2018220635 A JP2018220635 A JP 2018220635A JP 2018220635 A JP2018220635 A JP 2018220635A JP 7180319 B2 JP7180319 B2 JP 7180319B2
Authority
JP
Japan
Prior art keywords
memory
dump
information processing
processing device
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018220635A
Other languages
English (en)
Other versions
JP2020086950A (ja
Inventor
龍太 青木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2018220635A priority Critical patent/JP7180319B2/ja
Publication of JP2020086950A publication Critical patent/JP2020086950A/ja
Application granted granted Critical
Publication of JP7180319B2 publication Critical patent/JP7180319B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、情報処理装置、及び情報処理装置のダンプ管理方法に関する。
従来、OS(オペレーティングシステム)の中核部分であるカーネルの実行に致命的な支障が発生し、正常な動作を継続できなくなる状態、所謂カーネルパニックが発生すると、メインメモリにあるデータをダンプファイルとして他の記憶装置に出力する処理(以下では「パニックダンプ」という)が実行される。
今までのパニックダンプでは、コスト面などでHDD(ハードディスクドライブ)等の二次記憶装置を搭載できない機器では十分なダンプ領域を確保できないため、有益なダンプ情報を残せない問題がある。また、複数回発生するパニックダンプにおいては空き領域がない場合、古いデータを上書きしてしまい、必要なダンプ情報が得られないという問題もある。一方で、ネットワークを利用して、サーバ上のストレージにダンプファイルを保存する手段も考えられるが、セキュリティ面でネットワーク環境の構築が困難なケースやログ情報を外部へ持ち出せない場合は、機器内にダンプファイルを保持する必要がある。すなわち、パニックダンプにはダンプファイルの縮小や必要なデータの抽出が求められている。
特許文献1には、メモリダンプに必要な容量を縮小することが目的で、予め設定した保存サイズに適したコアファイル(ダンプファイル)を生成することが開示されている。
しかしながら、特許文献1の手法では、個々のダンプファイルのサイズを縮小するために元のダンプファイルの一部の情報だけを選択的に保存するため、有益なダンプ情報が欠落する虞がある。
本発明は、限られた保存領域の中で有益なダンプ情報を保持可能とすることを目的とする。
上述した課題を解決するために、本発明の一観点に係る情報処理装置は、カーネルと、第1メモリと、第2メモリと、前記カーネルに異常が発生した場合に、前記第1メモリに格納されているデータをダンプファイルとして前記第2メモリに出力する出力部と、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う判断部と、前記判断部によって前記2以上の同じ種類のダンプファイルがあると判断された場合、前記2以上の同じ種類のダンプファイルのうち1つ以外を削除する削除部と、前記ダンプファイルのログデータを含む入力情報と前記ダンプファイルの種類を含む出力情報との対応関係を機械学習により取得した学習済みモデルと、を備え、前記判断部は、前記第2メモリ内の複数の前記ダンプファイルのログデータを前記学習済みモデルに入力して算出した前記複数のダンプファイルのそれぞれの種類を比較することによって、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う。
同様に、上述した課題を解決するために、本発明の一観点に係る情報処理装置は、カーネルと、第1メモリと、第2メモリと、前記カーネルに異常が発生した場合に、前記第1メモリに格納されているデータをダンプファイルとして前記第2メモリに出力する出力部と、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う判断部と、前記判断部によって前記2以上の同じ種類のダンプファイルがあると判断された場合、前記2以上の同じ種類のダンプファイルのうち1つ以外を削除する削除部と、前記出力部による前記ダンプファイルの前記第2メモリへの格納後に当該情報処理装置を再起動させる再起動部と、を備え、前記判断部は、前記再起動部が前記再起動を実行した後、前記判断を行う。
限られた保存領域の中で有益なダンプ情報を保持できる。
実施形態に係る情報処理装置の機能ブロック図 情報処理装置のハードウェア構成図 情報処理装置のカーネルパニック発生時のダンプ出力処理のフローチャート 情報処理装置の再起動時のダンプ管理処理のフローチャート 学習済みモデルの構築と使用を説明する図
以下、添付図面を参照しながら実施形態について説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては可能な限り同一の符号を付して、重複する説明は省略する。
図1、図2を参照して実施形態に係る情報処理装置1の構成を説明する。図1は、実施形態に係る情報処理装置1の機能ブロック図である。
情報処理装置1は、OS(オペレーティングシステム)によって動作する。図1に示すように、情報処理装置1は、カーネル2と、メインメモリ3(第1メモリ)と、不揮発性メモリ4(第2メモリ)と、出力部5と、再起動部6と、判断部7と、学習済みモデル8と、削除部9と、を備える。
情報処理装置1は、OSの中核部分であるカーネル2の実行に致命的な支障が発生し、正常な動作を継続できなくなる状態、所謂カーネルパニックが発生すると、メインメモリ3にあるデータをダンプファイルとして他の記憶装置である不揮発性メモリ4に出力する処理(以下では「パニックダンプ」という)を実行する。
カーネル2は、OSの中核を構成するソフトウェアであり、動作中のプログラムの実行状態を管理したり、ハードウェア資源を管理してアプリケーションソフトがハードウェアの機能を利用する手段を提供したりする。
メインメモリ3は、OSにより情報処理装置1が動作する際にデータやプログラムを記憶する一次記憶装置である。例えばOS動作中には、メインメモリ3には、カーネル2やその他のソフトウェアからコールされた関数名や、コールされた関数の順序や、コールされたタイミング、などの情報が記録される。そしてパニックダンプ発生時には、これらの情報を含むログデータがダンプファイル11として出力される。また、ダンプファイル11には、例えばドライバのログやカーネルデバッガのログなども含まれる。
不揮発性メモリ4は、情報処理装置1の補助記憶装置であり、電源を供給しなくても記憶を保持するメモリである。本実施形態では、不揮発性メモリ4は、パニックダンプで発生したダンプファイル11を格納する。不揮発性メモリ4に格納されるダンプファイル11は、個々のパニックダンプに応じた複数個(図1の例ではダンプファイル11A、11B、11Cの3個)が格納されている。以下の説明では、不揮発性メモリ4に格納されている複数のダンプファイル11A、11B、11Cを纏めて「ダンプファイル11」とも表記する。
本実施形態の情報処理装置1は、ネットワーク・ストレージやHDD(ハードディスクドライブ)等の大容量の二次記憶装置を搭載しないタイプの機器であり、本実施形態でダンプファイル11が格納される不揮発性メモリ4が代わりに搭載される。このため不揮発性メモリ4には主に小容量のものが適用される。
出力部5は、カーネル2に異常が発生した場合に、メインメモリ3に格納されているデータをダンプファイル11(図1では「新規ダンプファイル11D」と示す)として不揮発性メモリ4に出力する。
再起動部6は、出力部5による新規ダンプファイル11Dの不揮発性メモリ4への格納後に情報処理装置1を再起動させる。
判断部7は、不揮発性メモリ4に2以上の同じ種類のダンプファイル11があるか否かの判断を行う。ダンプファイル11の種類とは、例えば、そのダンプファイルが発生した原因となる障害の種類である。判断部7は、不揮発性メモリ4内の複数のダンプファイル11のログデータを学習済みモデル8に入力して算出した複数のダンプファイル11のそれぞれの種類を比較することによって、不揮発性メモリ4に2以上の同じ種類のダンプファイル11があるか否かの判断を行う。
学習済みモデル8は、ダンプファイル11のログデータを含む入力情報と、ダンプファイル11の種類を含む出力情報との対応関係を、機械学習により既に取得して定式化したものである。学習済みモデル8は、例えばニューラルネットワーク、遺伝的アルゴリズムなどの教師あり学習モデルを適用できる。学習済みモデル8の入力情報は、例えば、ダンプファイルに記録されている、カーネル2に異常が発生したときのメインメモリ3でコールされた関数及び関数が実行された順番の情報を含む。
削除部9は、判断部7によって不揮発性メモリ4内に2以上の同じ種類のダンプファイル11があると判断された場合、2以上の同じ種類のダンプファイル11のうち1つ以外を削除する。
図2は、情報処理装置1のハードウェア構成図である。図2に示すように、情報処理装置1は、物理的には、CPU(Central Processing Unit)101、主記憶装置であるRAM(Random Access Memory)102およびROM(Read Only Memory)103、入力デバイスであるキーボード及びマウス等の入力装置104、ディスプレイ等の出力装置105、ネットワークカード等のデータ送受信デバイスである通信モジュール106、補助記憶装置107、などを含むコンピュータシステムとして構成することができる。
図1に示す情報処理装置1の各機能は、CPU101、RAM102等のハードウェア上に所定のコンピュータソフトウェア(ダンプ管理プログラム)を読み込ませることにより、CPU101の制御のもとで通信モジュール106、入力装置104、出力装置105を動作させるとともに、RAM102や補助記憶装置107におけるデータの読み出し及び書き込みを行うことで実現される。すなわち、本実施形態のダンプ管理プログラムをコンピュータ上で実行させることで、情報処理装置1は、図1のカーネル2、出力部5、再起動部6、判断部7、学習済みモデル8、削除部9として機能する。なお、図1に示すメインメモリ3は、コンピュータが備えるRAM102により実現できる。また、図1に示す不揮発性メモリ4は、図2の補助記憶装置107の一部により実現してもよいし、USBメモリなどの外部機器で情報処理装置1に読み書き可能に接続される構成でもよい。
図3、図4を参照して、本実施形態の情報処理装置1によるダンプ管理方法を説明する。図3は、情報処理装置1のカーネルパニック発生時のダンプ出力処理のフローチャートである。図3に示すフローチャートは、カーネルパニック発生時に実施される。
ステップS101では、カーネルパニックの発生に応じて、出力部5により、不揮発性メモリ4の容量に空きがあるか否かが判定される。
不揮発性メモリ4に空き領域が有る場合(ステップS101のYes)には、ステップS102に進み、出力部5により、カーネルパニック発生時のメインメモリ3のデータが新たなダンプファイル11D(図1参照)として空き領域に書き込まれる(出力ステップ)。すなわち当該データが空き領域にダンプされる。
一方、不揮発性メモリ4に空き領域が無い場合(ステップS101のNo)には、ステップS103に進み、出力部5により、既存のダンプファイル11A~11Cを記憶している領域に、カーネルパニック発生時のメインメモリ3のデータが新たなダンプファイル11Dとして上書きされる(出力ステップ)。すなわち、データが上書きしてダンプされる。ダンプファイル11A~11Cの上書きは、例えば古いものから順に行う。
ステップS104では、出力部5によるダンプ処理が完了した後に、再起動部6により情報処理装置1のOSが再起動される。ステップS104の処理が完了すると本制御フローを終了する。
図4は、情報処理装置1の再起動時のダンプ管理処理のフローチャートである。図4に示すフローチャートは、情報処理装置1のOSの再起動が完了した後に実施される。
ステップS201では、判断部7により、不揮発性メモリ4内に新規のダンプファイル11Dが有るか否かが判定される(判断ステップ)。本ステップは、例えば判断部7が、再起動部6から情報処理装置1のOSの再起動が完了した旨の情報を受信するのに応じて実行する。新規のダンプファイル11Dが有る場合には(ステップS201のYes)ステップS202に進む。新規のダンプファイル11Dが無い場合には(ステップS201のNo)本制御フローを終了する。
ステップS202では、不揮発性メモリ4内に新規のダンプファイル11Dが有るので、判断部7により、学習済みモデル8を用いて新規ダンプファイル11Dの種類が推定される。判断部7は、例えば、新規ダンプファイル11Dのログデータを学習済みモデル8に入力して、学習済みモデル8から出力される新規ダンプファイル11Dの種類の情報を取得する。
ステップS203では、判断部7により、不揮発性メモリ4内の既存のダンプファイル11A~11Cの中に新規ダンプファイル11Dと同じ種類のものが有るか否かが判定される。既存のダンプファイル11A~11Cの種類は、例えば、過去に当該ダンプファイルが新たに格納されたときに学習済みモデル8を用いて推定された情報を記録したファイルが不揮発性メモリ4内に格納されており、判断部7はこのファイルを参照して既存のダンプファイル11A~11Cの種類の情報を取得できる。
不揮発性メモリ4内の既存のダンプファイル11A~11Cの中に新規ダンプファイル11Dと同じ種類のものが有る場合には(ステップS203のYes)、ステップS204に進み、削除部9により、新規のダンプファイル11Dが不揮発性メモリ4から削除される(削除ステップ)。ステップS204の処理が完了すると本制御フローを終了する。
一方、不揮発性メモリ4内の既存のダンプファイル11A~11Cの中に新規ダンプファイル11Dと同じ種類のものが無い場合には(ステップS203のNo)、ステップS205に進み、削除部9による新規ダンプファイル11Dの削除処理は実行されずに不揮発性メモリ4内に保存される。ステップS205の処理が完了すると本制御フローを終了する。
なお、ステップS203では、不揮発性メモリ4内の複数のダンプファイル11A~11Cの種類が学習済みモデル8を用いて推定できていればよく、本制御フローを実施する度に、すべての既存のダンプファイル11A~11Cの種類を学習済みモデル8で求めてもよい。また、ステップS204では、2以上の同じ種類のダンプファイル11のうち1つ以外を削除すればよく、既存の他のダンプファイル11A~11Cのうち同種のものを削除して、新規ダンプファイル11Dを不揮発性メモリ4内に残す構成でもよい。
図5は、学習済みモデル8の構築と使用を説明する図である。図5(a)は、機械学習により学習済みモデル8を構築する手法を示す模式図である。図5(b)は、学習済みモデル8を用いた推定処理(ステップS202)を示す模式図である。
図5(a)に示すように、学習済みモデル8は障害発生時などの過去のログを使用して構築される。ここでは教師あり学習の例を示す。学習済みモデル8の構築処理は、情報処理装置1とは異なるサーバやパーソナルコンピューターなどの別の機械学習装置10で行うことができる。機械学習装置10は、情報処理装置1とは異なる機能を備えるものでもよいし、情報処理装置1と同様の機能を備えるものでもよい。
機械学習装置10には、予め取得又は生成されたログデータA~Cが記憶されている。該ログデータA~Cは、それぞれ異なる複数の種類の障害が発生した場合に取得されたログデータである。該ログデータA~Cは、例えば、情報処理装置1と同じ機種である別の情報処理装置において障害が発生した場合に取得されたログデータであっても良いし、障害を想定してサーバによって生成されたログデータであっても良い。機械学習装置10は、これら予め用意されたログデータA~Cを機械学習に用いることで、ダンプファイル11のログデータを含む入力情報と、ダンプファイル11の種類を含む出力情報との対応関係をモデルに獲得させ、学習済みモデル8を生成する。
図5(a)に示すように、機械学習に使用するログデータA~Cに対し、ログの種類(教師データ)を付与しておく。図5ではログの種類として「障害の種類」を挙げている。例えば、ログデータAには障害A、ログデータBには障害B、ログデータCには障害C、というようにログデータに対して該ログデータがどのような種類の障害発生時に取得されたログデータであるのか(又はどのような種類の障害発生を想定して生成されたログデータであるのか)を対応付けておく。なお、ログデータの種類及び障害の種類の数は図5(a)に示す3つに限定されない。ログデータと障害種類の対応付けは、機械学習装置10においてログデータと障害種類を対応させたテーブルデータを記憶させることで管理しても良いし、ログデータ中に障害種類の情報を付与しても良い。
機械学習装置10は、これらログデータと教師データのセットを複数用意し、機械学習アルゴリズムを適用して、モデルの入出力関係がログデータと教師データの入出力関係に近づく方向にモデルの学習を進め、学習済みモデル8を構築する。機械学習アルゴリズムは、例えばモデルがニューラルネットワークの場合には周知の誤差逆伝播法などが用いられる。学習済みモデル8は、ログデータに含まれる情報(一例として、カーネルやその他のソフトウェアからコールされた関数名及びコールされた関数の順序やコールされたタイミングなど)に基づいて、障害種類を複数パターンに分類することができる。なお、機械学習に用いるログデータは、ダンプファイル内に保存されているすべてのログデータではなく、一部を指す場合もありうる。例えば、バックトレースの関数名やログの種類(〇〇ドライバ、〇〇ライブラリ)を抽出して、学習用のログデータとして使用することができる。
機械学習装置10で構築された学習済みモデル8は、機械学習装置10から有線/無線通信によって直接的に、又は記録媒体や管理装置などの他の装置を介して間接的に、情報処理装置1へ送信されてROMなどの記憶装置に記憶される。
図4のステップS202では、図5(b)に示すように、新規ダンプファイル11DのログデータDを学習済みモデル8に入力し、学習済みモデル8から出力された障害の種類の情報からダンプファイルの種類を判断する。
情報処理装置1は、機械学習装置10が作成した学習済みモデル8を用いることで、ログデータDを解析する。これにより、学習済みモデル8が作成されたときの教師データとして使用された複数種類の障害A,B、Cのうち、いずれの種類の障害が情報処理装置1で発生したのかを判断する。図5(b)の例では、学習済みモデル8によって、障害の種類が障害Bであると判断している。
これにより、情報処理装置1で新規に取得されたダンプファイル11Dは、障害Bに対応するログデータであると判断することができたため、図4のステップS203では、不揮発性メモリ4に記憶されたダンプファイル11A~11Cの中に、同じく障害Bに対応するログデータが存在するか否かを判断する。障害Bに対応するダンプファイルが存在する場合は、新規に取得されたダンプファイル11Dは削除され、存在しない場合は新規のダンプファイル11Dは削除せずに保存される。
なお、機械学習装置10による学習済みモデル8の生成処理は、情報処理装置1の内部で行ってもよい。
本実施形態に係る情報処理装置1の効果を説明する。情報処理装置1は、カーネル2に異常が発生した場合に、メインメモリ3に格納されているデータをダンプファイル11Dとして不揮発性メモリ4に出力する出力部5と、不揮発性メモリ4に2以上の同じ種類のダンプファイル11があるか否かの判断を行う判断部7と、判断部7によって2以上の同じ種類のダンプファイル11があると判断された場合、2以上の同じ種類のダンプファイル11のうち1つ以外を削除する削除部9と、を備える。
この構成により、新たにダンプファイル11Dが発生するたびに不揮発性メモリ4に格納されている複数のダンプファイル11A~11Cから同種のものを間引き、同種のダンプファイルが重複して保存されるのを防止できるので、保存可能なダンプファイル11の種類を増やすことができる。また、個々のダンプファイル11は従来のようにファイルサイズ低減のためにファイルの内容を一部間引くなどの処理を行わず、メインメモリ3から出力された状態のままで保存するので、必要な情報の欠落などの虞がない。この結果、本実施形態の情報処理装置1は、限られた保存領域の中で有益なダンプ情報を保持できる。
また、本実施形態の情報処理装置1は、ダンプファイル11のログデータを含む入力情報と、ダンプファイル11の種類を含む出力情報との対応関係を機械学習により取得した学習済みモデル8を備える。判断部7は、不揮発性メモリ4内の複数のダンプファイル11のログデータを学習済みモデル8に入力して算出した複数のダンプファイル11のそれぞれの種類を比較することによって、不揮発性メモリ4に2以上の同じ種類のダンプファイル11があるか否かの判断を行う。
この構成により、汎化能力の高い学習済みモデル8を利用してダンプファイル11の種類を推定するので、より高精度にダンプファイル11の種類を判断でき、より有益な情報を抽出して保存できる可能性を高めることができる。
また、本実施形態の情報処理装置1では、学習済みモデル8の入力情報は、ダンプファイル11に記録されているカーネル2に異常が発生したときのメインメモリ3でコールされた関数及び関数が実行された順番の情報を含む。これらの情報はカーネル2に異常が発生した原因との関連性が高いので、より推定精度の高いモデルを構築できる。
また、本実施形態の情報処理装置1では、判断部7は、カーネル2が正常な状態において判断を行う。より詳細には、判断部7は、再起動部6が出力部5によるダンプファイル11の不揮発性メモリ4への格納後に情報処理装置1を再起動させた後に、判断を行う。この構成により、カーネルパニック時に実行できない処理が実行でき、ダンプファイルの種類判断や間引きの確実性を増すことができる。
また、本実施形態の情報処理装置1では、ダンプファイル11を格納する記憶装置が、HDDなどの大容量のものではなく、小容量の不揮発性メモリ4であるが、本実施形態のダンプファイルの種類判断や間引き処理を行うことにより、保存領域に制約があってもダンプ情報を効率良く保持できるので、保存領域の大小に依存せずに有益な情報を保持できる。
以上、具体例を参照しつつ本実施形態について説明した。しかし、本開示はこれらの具体例に限定されるものではない。これら具体例に、当業者が適宜設計変更を加えたものも、本開示の特徴を備えている限り、本開示の範囲に包含される。前述した各具体例が備える各要素およびその配置、条件、形状などは、例示したものに限定されるわけではなく適宜変更することができる。前述した各具体例が備える各要素は、技術的な矛盾が生じない限り、適宜組み合わせを変えることができる。
なお、上記では機械学習モデルを用いて、障害種類を判断する場合について説明したが、これに限定されない。例えば、ログデータのうち最後にコールされた関数名などによって一意に障害種類が判断できる場合には、機械学習モデルを用いずに障害種類を判断しても良い。この場合、障害が発生した場合であっても、一部の種類の障害については、学習モデルを使用した障害種類の解析を省略することができるため、第1情報処理装置のメモリやCPUの負荷を抑制することができる。
図4を参照して説明した不揮発性メモリ4のダンプ管理処理は、上記実施形態では情報処理装置1の再起動時に実施する構成を例示したが、カーネルパニックが発生した後にカーネルが正常な状態であればよく、再起動時以外のタイミングでダンプ管理処理を実施してもよい。また、カーネルパニック発生時のカーネルが異常な状態のとき、例えば新規ダンプファイル11Dが生成されたときに、図4のダンプ管理処理を実施してもよい。
上記実施形態では、カーネル2が動作中のログがメインメモリ3(第1メモリ)に記録され、カーネルパニック発生時にダンプファイルが不揮発性メモリ4(第2メモリ)に格納される構成を例示したが、メインメモリ3、不揮発性メモリ4以外の記憶装置に置き換えてもよい。
1 情報処理装置
2 カーネル
3 メインメモリ(第1メモリ)
4 不揮発性メモリ(第2メモリ)
5 出力部
6 再起動部
7 判断部
8 学習済みモデル
9 削除部
11 ダンプファイル
特開2007-172414号公報

Claims (8)

  1. カーネルと、
    第1メモリと、
    第2メモリと、
    前記カーネルに異常が発生した場合に、前記第1メモリに格納されているデータをダンプファイルとして前記第2メモリに出力する出力部と、
    前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う判断部と、
    前記判断部によって前記2以上の同じ種類のダンプファイルがあると判断された場合、前記2以上の同じ種類のダンプファイルのうち1つ以外を削除する削除部と、
    前記ダンプファイルのログデータを含む入力情報と前記ダンプファイルの種類を含む出力情報との対応関係を機械学習により取得した学習済みモデルと、
    を備え、
    前記判断部は、前記第2メモリ内の複数の前記ダンプファイルのログデータを前記学習済みモデルに入力して算出した前記複数のダンプファイルのそれぞれの種類を比較することによって、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う、
    情報処理装置。
  2. 情報処理装置であって、
    カーネルと、
    第1メモリと、
    第2メモリと、
    前記カーネルに異常が発生した場合に、前記第1メモリに格納されているデータをダンプファイルとして前記第2メモリに出力する出力部と、
    前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う判断部と、
    前記判断部によって前記2以上の同じ種類のダンプファイルがあると判断された場合、前記2以上の同じ種類のダンプファイルのうち1つ以外を削除する削除部と、
    前記出力部による前記ダンプファイルの前記第2メモリへの格納後に当該情報処理装置を再起動させる再起動部と、
    を備え、
    前記判断部は、前記再起動部が前記再起動を実行した後、前記判断を行う、
    情報処理装置。
  3. 前記学習済みモデルの前記入力情報は、前記ダンプファイルに記録されている前記カーネルに異常が発生したときの前記第1メモリでコールされた関数及び前記関数が実行された順番の情報を含む、
    請求項に記載の情報処理装置。
  4. 前記判断部は、前記カーネルが正常な状態において前記判断を行う、
    請求項1~3のいずれか1項に記載の情報処理装置。
  5. 前記出力部による前記ダンプファイルの前記第2メモリへの格納後に当該情報処理装置を再起動させる再起動部を備え、
    前記判断部は、前記再起動部が前記再起動を実行した後、前記判断を行う、
    請求項に記載の情報処理装置。
  6. 前記第1メモリがメインメモリであり、
    前記第2メモリが不揮発性メモリである、
    請求項1~5のいずれか1項に記載の情報処理装置。
  7. カーネルと、
    第1メモリと、
    第2メモリと、
    を備える情報処理装置のダンプ管理方法であって、
    前記情報処理装置の出力部が、前記カーネルに異常が発生した場合に、前記第1メモリに格納されているデータをダンプファイルとして前記第2メモリに出力する出力ステップと、
    前記情報処理装置の判断部が、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う判断ステップと、
    前記情報処理装置の削除部が、前記判断ステップにて前記2以上の同じ種類のダンプファイルがあると判断された場合、前記2以上の同じ種類のダンプファイルのうち1つ以外を削除する削除ステップと、
    を含み、
    前記情報処理装置は、前記ダンプファイルのログデータを含む入力情報と前記ダンプファイルの種類を含む出力情報との対応関係を機械学習により取得した学習済みモデルを備え、
    前記判断ステップは、前記第2メモリ内の複数の前記ダンプファイルのログデータを前記学習済みモデルに入力して算出した前記複数のダンプファイルのそれぞれの種類を比較することによって、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う、
    情報処理装置のダンプ管理方法。
  8. カーネルと、
    第1メモリと、
    第2メモリと、
    を備える情報処理装置のダンプ管理方法であって、
    前記情報処理装置の出力部が、前記カーネルに異常が発生した場合に、前記第1メモリに格納されているデータをダンプファイルとして前記第2メモリに出力する出力ステップと、
    前記情報処理装置の再起動部が、前記出力ステップによる前記ダンプファイルの前記第2メモリへの格納後に当該情報処理装置を再起動させる再起動ステップと、
    前記情報処理装置の判断部が、前記再起動ステップにおいて前記再起動を実行した後、前記第2メモリに2以上の同じ種類の前記ダンプファイルがあるか否かの判断を行う判断ステップと、
    前記情報処理装置の削除部が、前記判断ステップにて前記2以上の同じ種類のダンプファイルがあると判断された場合、前記2以上の同じ種類のダンプファイルのうち1つ以外を削除する削除ステップと、
    を含む情報処理装置のダンプ管理方法。
JP2018220635A 2018-11-26 2018-11-26 情報処理装置、及び情報処理装置のダンプ管理方法 Active JP7180319B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018220635A JP7180319B2 (ja) 2018-11-26 2018-11-26 情報処理装置、及び情報処理装置のダンプ管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018220635A JP7180319B2 (ja) 2018-11-26 2018-11-26 情報処理装置、及び情報処理装置のダンプ管理方法

Publications (2)

Publication Number Publication Date
JP2020086950A JP2020086950A (ja) 2020-06-04
JP7180319B2 true JP7180319B2 (ja) 2022-11-30

Family

ID=70908262

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018220635A Active JP7180319B2 (ja) 2018-11-26 2018-11-26 情報処理装置、及び情報処理装置のダンプ管理方法

Country Status (1)

Country Link
JP (1) JP7180319B2 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000066929A (ja) 1998-08-18 2000-03-03 Nec Corp コアファイル管理システムおよびコアファイル管理方法
JP2016057658A (ja) 2014-09-05 2016-04-21 日本電気株式会社 障害情報管理システムおよび障害情報管理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63293644A (ja) * 1987-05-27 1988-11-30 Hitachi Ltd オンライン自動回復システム
JPH0259837A (ja) * 1988-08-25 1990-02-28 Fujitsu Ltd データリカバリ処理方式
JPH07141227A (ja) * 1993-11-19 1995-06-02 Hitachi Ltd 障害情報の保全方式

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000066929A (ja) 1998-08-18 2000-03-03 Nec Corp コアファイル管理システムおよびコアファイル管理方法
JP2016057658A (ja) 2014-09-05 2016-04-21 日本電気株式会社 障害情報管理システムおよび障害情報管理方法

Also Published As

Publication number Publication date
JP2020086950A (ja) 2020-06-04

Similar Documents

Publication Publication Date Title
US10884837B2 (en) Predicting, diagnosing, and recovering from application failures based on resource access patterns
US20060206544A1 (en) Automatic backup and restore system and method
CN105144113A (zh) 从快照恢复应用
Levy et al. Predictive and Adaptive Failure Mitigation to Avert Production Cloud {VM} Interruptions
US11573848B2 (en) Identification and/or prediction of failures in a microservice architecture for enabling automatically-repairing solutions
CN110413694A (zh) 元数据管理方法及相关装置
CN114281591A (zh) 存储节点故障处理方法、装置、设备及存储介质
US20140156943A1 (en) Information processing apparatus, information processing method, and program
JP6880961B2 (ja) 情報処理装置、およびログ記録方法
JP5440073B2 (ja) 情報処理装置,情報処理装置の制御方法および制御プログラム
US9053023B2 (en) Fault-tolerant system, fault-tolerant method and program
JP7180319B2 (ja) 情報処理装置、及び情報処理装置のダンプ管理方法
US11226875B2 (en) System halt event recovery
CN114518985B (zh) 存储系统命令的故障指示
JP2013148938A (ja) 情報処理装置及び情報処理システム
CN105988885A (zh) 基于补偿回滚的操作系统故障自恢复方法
JP2016057658A (ja) 障害情報管理システムおよび障害情報管理方法
US11595244B2 (en) Recovery support apparatus, recovery support method and program
JP7279415B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP5601587B2 (ja) プロセス再起動装置、プロセス再起動方法およびプロセス再起動プログラム
CN111104256A (zh) 一种数据读取方法、装置、设备及存储介质
CN114443370A (zh) 一种数据还原方法、装置、介质
CN110658989B (zh) 用于备份存储垃圾收集的系统和方法
US20240126445A1 (en) Re-allocation of disks based on disk health prior to restore
US20090132565A1 (en) Information processing system and network logging information processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220628

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220630

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220819

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221018

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221031

R151 Written notification of patent or utility model registration

Ref document number: 7180319

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151