JP7063445B2 - 障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム - Google Patents

障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム Download PDF

Info

Publication number
JP7063445B2
JP7063445B2 JP2017055756A JP2017055756A JP7063445B2 JP 7063445 B2 JP7063445 B2 JP 7063445B2 JP 2017055756 A JP2017055756 A JP 2017055756A JP 2017055756 A JP2017055756 A JP 2017055756A JP 7063445 B2 JP7063445 B2 JP 7063445B2
Authority
JP
Japan
Prior art keywords
failure information
failure
computer
storage area
bios
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017055756A
Other languages
English (en)
Other versions
JP2018160009A (ja
Inventor
正吉 小佐野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2017055756A priority Critical patent/JP7063445B2/ja
Publication of JP2018160009A publication Critical patent/JP2018160009A/ja
Application granted granted Critical
Publication of JP7063445B2 publication Critical patent/JP7063445B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステムに関する。
コンピュータにおいて障害が発生すると、コンピュータは処理をOS(Operating System)からBIOS(Basic Input Output System)にハンドオーバし、BIOSによりログデータの採取がなされ、当該ログデータがBMC(Baseboard Management Controller)に送信される。ハンドオーバとは、CPUの制御権を移転することである。
特許文献1には、障害発生などによりBIOSとBMCとの間の通信要求が発生した場合に、OSに処理を再開させ、当該通信要求に伴う処理を分割して定期的に送信し、実行することが開示されている。
特開2011-164971号公報
コンピュータに障害が発生してからログデータの送信が完了するまで、OSは制御権を有しない。つまり、この間、OSの処理は停止した状態となる。これにより、コンピュータに障害が発生したときに、見かけ上の処理性能の低下が生じてしまうという。
本発明の目的は、上述した課題を解決する障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステムを提供することにある。
本発明の第1の態様によれば、障害情報処理プログラムは、自装置に発生した障害に関する障害情報を第1記憶領域に記録し、第2記憶領域に記録された障害情報を管理装置に送信するBIOSを備えるコンピュータのOSに、前記コンピュータのBIOSによって生成され、前記第1記憶領域に記録された、自装置に発生した障害に関する第1障害情報を取得する取得ステップと、前記第1障害情報の解析を実行する解析ステップと、前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて、前記第1障害情報のうち障害との関係性の小さいログデータを削除することで、管理装置に送信するための障害情報である第2障害情報を生成して前記第2記憶領域に記録する縮小ステップと実行させる。
本発明の第2の態様によれば、コンピュータは、CPUと、前記CPUに、自装置に発生した障害に関する第1障害情報を生成して第1記憶領域に記録する生成ステップと、前記第1障害情報に基づいて生成された第2障害情報を第2記憶領域から読み出して管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOSを記憶する第1記憶装置と、上記態様に係る障害情報処理プログラムを記憶する第2記憶装置とを備える。
本発明の第3の態様によれば、障害通知方法は、コンピュータがBIOSの実行により、当該コンピュータに発生した障害に関する第1障害情報を生成生成して第1記憶領域に記録する生成ステップと、前記コンピュータがOSの実行により、前記第1記憶領域から前記第1障害情報を取得し、前記第1障害情報の解析を実行する解析ステップと、前記コンピュータが前記OSの実行により、前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて、前記第1障害情報のうち障害との関係性の小さいログデータを削除することで、第2障害情報を生成し、第2記憶領域に記録する縮小ステップと、前記コンピュータが前記BIOSの実行により、前記第2記憶領域に記録された前記第2障害情報を管理装置に送信する送信ステップとを含む。
本発明の第4の態様によれば、コンピュータシステムは、コンピュータと管理装置とを備え、前記コンピュータは、BIOSの実行により、自装置に発生した障害に関する第1障害情報を生成して第1記憶領域に記録し、OSの実行により前記第1記憶領域から前記第1障害情報を取得し、前記第1障害情報を解析し、解析の結果に基づいて前記第1障害情報のうち障害との関係性の小さいログデータを削除することで第2障害情報を生成して、第2記憶領域に記録し、前記管理装置は、前記コンピュータから受信した前記第2障害情報を解析する。
上記態様のうち少なくとも1つの態様によれば、コンピュータは、障害が発生したときに、見かけ上の処理性能の低下が生じることを防ぐことができる。
第1の実施形態に係るコンピュータのハードウェア構成を示す概略ブロック図である。 第1の実施形態に係るコンピュータのソフトウェア構成を示す概略ブロック図である。 第1の実施形態に係るコンピュータによるログ収集処理を示すフローチャートである。 第1の実施形態に係るコンピュータによる障害通知処理を示すフローチャートである。 コンピュータの基本構成を示す概略ブロック図である。 コンピュータシステムの基本構成を示す概略ブロック図である。
以下、図面を参照しながら実施形態について詳しく説明する。
図1は、第1の実施形態に係るコンピュータのハードウェア構成を示す概略ブロック図である。
コンピュータ1は、CPU100、メインメモリ200、不揮発メモリ300、ストレージ400、インタフェース500を備える。
CPU100は、プログラムを不揮発メモリ300またはストレージ400から読み出してメインメモリ200に展開し、当該プログラムに従って処理を実行する。
不揮発メモリ300は、BIOS01を記憶する。不揮発メモリ300の例としては、EEPROM(Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリなどが挙げられる。
ストレージ400は、OS02、およびOS02上で動作するアプリケーションプログラムである障害情報処理プログラム03を記憶する。ストレージ400の例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、磁気ディスク、光磁気ディスク、CD-ROM(Compact Disc Read Only Memory)、DVD-ROM(Digital Versatile Disc Read Only Memory)、半導体メモリ等が挙げられる。ストレージ400は、コンピュータ1のバスに直接接続された内部メディアであってもよいし、インタフェース500または通信回線を介してコンピュータ1に接続される外部メディアであってもよい。
メインメモリ200、不揮発メモリ300およびストレージ400は、記憶装置の一例である。
また、CPU100は、BIOS01に従って、第1記憶領域M1および第2記憶領域M2をメインメモリ200に確保する。
第1記憶領域M1は、BIOS01によって生成されたログデータである第1ログデータと障害の検出日時と解析済フラグとを記憶する領域である。解析済フラグは、関連付けられた第1ログデータの解析が完了しているか否かを示すビットであって、解析されていない場合に0を示し、解析されている場合に1を示す。
第2記憶領域M2は、障害情報処理プログラム03によって生成されたログデータである第2ログデータと障害の検出日時と通報済フラグとを記憶する領域である。通報済フラグは、関連付けられた第2ログデータのBMCへの通報が完了しているか否かを示すビットであって、通報されていない場合に0を示し、通報されている場合に1を示す。
第1記憶領域M1および第2記憶領域M2は、いずれもBIOS01と障害情報処理プログラム03との両方によって参照される。そのため、CPU100は、メインメモリ200のうちアドレスが変動しないメモリブロック(固定メモリ)の予め定められたアドレスに、予め定められたサイズの領域を、第1記憶領域M1および第2記憶領域M2として確保する。
図2は、第1の実施形態に係るコンピュータのソフトウェア構成を示す概略ブロック図である。
CPU100は、BIOS01の実行により、ログ収集部101、第1ログ記録部102、第2ログ取得部103、送信部104として機能する。
ログ収集部101は、障害を検出したハードウェアの障害箇所を特定できる情報を保持しているレジスタをリードし、リードした情報に基づいて第1ログデータを生成する。
第1ログ記録部102は、ログ収集部101が生成した第1ログデータを、解析済フラグに関連付けて第1記憶領域M1に記録する。第1ログ記録部102は、第1ログデータの記録時に、解析済フラグを0にセットする。
第2ログ取得部103は、第2記憶領域M2に格納されている情報を取得する。第2記憶領域M2は固定メモリのメモリブロックに確保されているため、第2ログ取得部103は、第2記憶領域M2を参照することで、障害情報処理プログラム03が生成した第2ログデータを取得することができる。第2ログ取得部103は、0を示す解析済フラグに関連付けられた第2ログデータを取得する。
送信部104は、第2ログ取得部103が取得した第2ログデータを、BMCに送信する。送信部104は、第2記憶領域M2が記憶する通報済フラグのうち、送信が完了した第2ログデータに関連付けられたものを1にセットする。
CPU100は、障害情報処理プログラム03の実行により、第1ログ取得部105、解析部106、縮小部107、第2ログ記録部108として機能する。
第1ログ取得部105は、第1記憶領域M1に格納されている情報を取得する。第1記憶領域M1は固定メモリのメモリブロックに確保されているため、第1ログ取得部105は、第1記憶領域M1を参照することで、BIOS01が生成した第1ログデータを取得することができる。第1ログ取得部105は、0を示す解析済フラグに関連付けられた第1ログデータを取得する。
解析部106は、取得された第1ログデータの解析を実行する。つまり、CPU100は、BMCによる解析の前に、OS02上で一時解析を行う。解析部106は、第1記憶領域M1に記録された解析済フラグのうち、解析が完了した第1ログデータに関連付けられたものを1にセットする。
縮小部107は、解析部106による解析の結果に基づいて、第1ログデータよりデータ量の小さい第2ログデータを生成する。例えば、縮小部107は、第1ログデータのうち、障害との関係性の小さいイベントログを削除することで、データ量を削減する。なお、縮小部107は、解析部106による解析の終了後、第2ログデータを生成するため、解析済フラグは、第1ログデータに基づいて第2ログデータが作成されたか否かを示す情報であるともいえる。
第2ログ記録部108は、第2ログデータを、通報済フラグに関連付けて第2記憶領域M2に記録する。第2ログ記録部108は、第2ログデータの記録時に、通報済フラグを0にセットする。
図3は、第1の実施形態に係るコンピュータによるログ収集処理を示すフローチャートである。
コンピュータ1に障害が発生し、障害を検出したハードウェアがCPU100に割り込み要求を発すると、ログ収集処理を開始する。まず、CPU100は、ハンドオーバにより、OS02からBIOS01に制御権を移転する(ステップS001)。BIOS01の実行により、CPU100のログ収集部101は、ハードウェアの障害箇所を特定可能な情報を保持するレジスタから情報をリードし、これに基づいて第1ログデータを生成する(ステップS002)。
次に、第1ログ記録部102は、第1記憶領域M1に空きがあるか否かを判定する(ステップS003)。第1記憶領域M1に空きがない場合(ステップS003:NO)、第1記憶領域M1が記憶する最も古い第1ログデータを削除する(ステップS004)。第1記憶領域M1に空きがある場合(ステップS003:YES)、または第1記憶領域M1から第1ログデータを削除した場合、第1ログ記録部102は、ステップS002で生成された第1ログデータを、第1記憶領域M1に記録する(ステップS005)。このとき、第1ログ記録部102は、第1ログデータに関連付けられた解析済フラグを0にセットする。なお、第1ログ記録部102は、第1記憶領域M1の空き領域の末尾に第1ログデータを記録する。
次に、第1ログ記録部102は、ハンドオーバにより、BIOS01からOS02に制御権を移転し(ステップS006)、ログ収集処理を終了する。これにより、コンピュータ1は、ログデータをBMCに送信する前にOS02が制御権を取得する。
図4は、第1の実施形態に係るコンピュータによる障害通知処理を示すフローチャートである。
CPU100は、所定周期に係るタイミングに障害情報処理プログラム03を実行し、障害通知処理を開始する。まず、第1ログ取得部105は、第1記憶領域M1に格納された情報を参照し、0を示す解析済フラグがあるか否かを判定する(ステップS101)。0を示す解析済フラグが無い場合(ステップS101:NO)、コンピュータ1は、障害通知処理を終了する。
他方、0を示す解析済フラグがある場合(ステップS101:YES)、第1ログ取得部105は、0を示す解析済フラグに関連付けられた第1ログデータを取得する(ステップS102)。次に、解析部106は、取得された第1ログデータを解析する(ステップS103)。縮小部107は、解析部106による解析結果に基づいて、第1ログデータのデータ量を削減した第2ログデータを生成する(ステップS104)。解析部106は、解析対象となった第1ログデータに関連付けられた解析済フラグの値を1にセットする(ステップS105)。
次に、第2ログ記録部108は、第2記憶領域M2に空きがあるか否かを判定する(ステップS106)。第2記憶領域M2に空きがない場合(ステップS106:NO)、第2記憶領域M2が記憶する最も古い第2ログデータを削除する(ステップS107)。第2記憶領域M2に空きがある場合(ステップS106:YES)、または第2記憶領域M2から第2ログデータを削除した場合、第2ログ記録部108は、ステップS104で生成された第2ログデータを、第2記憶領域M2に記録する(ステップS108)。このとき、第2ログ記録部108は、第2ログデータに関連付けられた通報済フラグを0にセットする。なお、第2ログ記録部108は、第2記憶領域M2の空き領域の末尾に第2ログデータを記録する。
次に、CPU100は、ハンドオーバにより、OS02からBIOS01に制御権を移転する(ステップS109)。BIOS01の実行により、送信部104は、第2記憶領域M2に格納された情報を参照し、0を示す通報済フラグがあるか否かを判定する(ステップS110)。0を示す通報済フラグが無い場合(ステップS110:NO)、CPU100は、ハンドオーバにより、BIOS01からOS02に制御権を移転し(ステップS111)、障害通知処理を終了する。
他方、0を示す通報済フラグがある場合(ステップS110:YES)、第2ログ取得部103は、0を示す解析済フラグに関連付けられた第2ログデータを取得する(ステップS112)。次に、送信部104は、BMCに取得された第2ログデータを送信する(ステップS113)。第2ログデータは、第1ログデータよりデータ量が小さいため、第2ログデータの送信時間は第1ログデータの送信時間より短い。送信部104は、第2ログデータの送信を完了すると、当該第2ログデータに関連付けられた通報済フラグの値を1にセットする(ステップS114)。そして、CPU100は、ハンドオーバにより、BIOS01からOS02に制御権を移転し(ステップS111)、障害通知処理を終了する。
このように、第1の実施形態によれば、コンピュータ1に障害が発生した場合、CPU100は、障害情報処理プログラム03の実行により、第1ログデータのデータ量を縮小して第2ログデータを生成する。発明者は、一般的なコンピュータにおける障害処理において、処理時間の多くがログデータの送信に費やされているという知見を得ている。つまり、第1の実施形態に係るコンピュータ1によれば、BMCに送信すべきログデータのデータ量を削減することで、BIOS01が制御権を占有する時間が短くなることがわかる。
また、第1の実施形態によれば、コンピュータ1は、障害情報処理プログラム03の実行により、第1ログデータを解析し、これに基づいて第2ログデータを生成する。つまり、コンピュータ1は、第1ログデータの一次解析を行い、その解析結果である第2ログデータをBMCに解析させる。これにより、コンピュータ1は、ログデータの解析精度を確保しつつ、BIOS01が制御権を占有する時間を短くすることができる。
以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。
第1の実施形態に係るコンピュータ1は、OS02上で動作する障害情報処理プログラム03によって、第1ログ取得部105、解析部106、縮小部107、第2ログ記録部108として機能するが、これに限られない。例えば、他の実施形態においては、BIOS01がこれらの少なくとも一部の機能を実現するためのプログラムを含むものであってもよい。この場合、第1ログデータの生成後にOS02へのハンドオーバがなされないが、送信するデータ量が削減されるため、BIOS01によって第1ログデータを送信する場合と比較して、OS02の性能低下を防ぐことができる。また例えば、他の実施形態においては、OS02がこれらの少なくとも一部の機能を実現するためのプログラムを含むものであってもよい。
また、第1の実施形態に係るコンピュータ1は、BIOS01によって、第2ログデータがBMCに送信されるが、これに限られない。例えば、他の実施形態に係るコンピュータ1は、障害情報処理プログラム03またはOS02によって第2ログデータを送信してもよい。
また、第1の実施形態に係る障害情報処理プログラム03は、コンピュータ1に第1ログデータを解析させるが、これに限られない。例えば、他の実施形態に係る障害情報処理プログラム03は、コンピュータ1に第1ログデータの間引きなどにより、解析なしにデータ量を削減させるものであってもよい。
また、第1の実施形態において、第1記憶領域M1および第2記憶領域M2がメインメモリ200上に確保されるが、これに限られない。例えば、他の実施形態においては、第1記憶領域M1および第2記憶領域M2が不揮発メモリ300上に確保されてもよい。この場合、シャットダウン等によりコンピュータ1のサービスが停止しても、ログデータを保持し続けることができる。
また、第1の実施形態に係るコンピュータ1は、BMCにログデータを送信するが、これに限られない。例えば、他の実施形態に係るコンピュータ1は、BMCにログデータ以外の障害情報(例えば、障害の解析結果)を送信してもよい。この場合、コンピュータ1は、当該障害情報(第1の障害情報)のデータ量を小さくした第2の障害情報を生成する。
《障害情報処理プログラムの基本構成》
図5は、コンピュータの基本構成を示す概略ブロック図である。
上述した実施形態では、障害情報処理プログラムを実行するコンピュータの一実施形態として図2に示す構成について説明したが、障害情報処理プログラムを実行するコンピュータの基本構成は、図5に示すとおりである。
すなわち、コンピュータ9は、CPU91と、第1記憶装置92と、第2記憶装置93とを備える。
第1記憶装置92は、CPU91に、自装置に発生した障害に関する第1の障害情報を生成する生成ステップと、第1の障害情報に基づいて生成された第2の障害情報を管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOS001を記憶する。
第2記憶装置93は、BIOS001によって生成された第1障害情報を取得する取得ステップと、第1障害情報のデータ量を縮小することで、管理装置に送信するための障害情報である第2障害情報を生成する縮小ステップとを実行させるための障害情報処理プログラム002を記憶する。
これにより、コンピュータ9は、障害が発生したときに、見かけ上の処理性能の低下が生じることを防ぐことができる。
《コンピュータシステムの基本構成》
図6は、コンピュータシステムの基本構成を示す概略ブロック図である。
コンピュータシステム2は、コンピュータ9と、管理装置10とを備える。
コンピュータ9は、自装置に発生した障害に関する第1障害情報を解析することで第2障害情報を生成する。管理装置10は、第2障害情報を解析する。管理装置10は、例えば、BMCである。
これにより、コンピュータシステム2は、コンピュータ9に発生した障害を、コンピュータ9と管理装置10とで分散して解析することができる。
《付記》
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
(付記1)
コンピュータに、
前記コンピュータのBIOSによって生成された、自装置に発生した障害に関する第1障害情報を取得する取得ステップと、
前記第1障害情報のデータ量を縮小することで、管理装置に送信するための障害情報である第2障害情報を生成する縮小ステップと
実行させるための障害情報処理プログラム。
(付記2)
前記コンピュータに、前記第1障害情報の解析を実行する解析ステップをさらに実行させ、
前記縮小ステップは、前記コンピュータが前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて前記第2障害情報を生成するステップである
付記1に記載の障害情報処理プログラム。
(付記3)
前記BIOSによって生成された前記第1障害情報は、前記コンピュータの記憶装置の所定のアドレスおよびデータサイズに係る記憶領域に記録され、
前記取得ステップは、前記コンピュータが前記記憶装置の前記記憶領域に記憶された情報を取得するステップである
付記1または付記2に記載の障害情報処理プログラム。
(付記4)
前記BIOSによって生成された前記第1障害情報は、障害に係るログデータと、当該ログデータに基づいて前記第2障害情報が作成されたか否かを示す情報とを関連付けたものであり、
前記縮小ステップは、前記第1障害情報のうち前記第2障害情報作成されていないログデータに基づいて前記第2障害情報を作成するステップである
付記3に記載の障害情報処理プログラム。
(付記5)
CPUと、
前記CPUに、自装置に発生した障害に関する第1の障害情報を生成する生成ステップと、前記第1の障害情報に基づいて生成された第2の障害情報を管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOSを記憶する第1記憶装置と、
付記1から付記4の何れか1つに記載の障害情報処理プログラムを記憶する第2記憶装置と
を備えるコンピュータ。
(付記6)
前記第2記憶装置は、前記障害情報処理プログラムを実行可能なOSを記憶する
付記5に記載のコンピュータ。
(付記7)
前記CPUは、前記障害が検出されたときに前記BIOSに制御権を移転し、前記生成ステップの実行後に前記BIOSから前記OSに制御権を移転する
付記6に記載のコンピュータ。
(付記8)
第3記憶装置をさらに備え、
前記CPUは、
前記生成ステップにおいて前記第1の障害情報を前記第3記憶装置の所定のアドレスおよびデータサイズに係る第1記憶領域に記録し、
前記縮小ステップにおいて前記第3記憶装置の前記第1記憶領域に記憶された情報を読み出し、当該情報に基づいて前記第2障害情報を生成する
付記7に記載のコンピュータ。
(付記9)
前記CPUは、
前記縮小ステップにおいて前記第2の障害情報を前記第3記憶装置の所定のアドレスおよびデータサイズに係る第2記憶領域に記録し、
前記送信ステップにおいて前記第3記憶装置の前記第2記憶領域に記憶された情報を読み出し、読み出された第2障害情報を送信する
付記8に記載のコンピュータ。
(付記10)
コンピュータがBIOSの実行により、当該コンピュータに発生した障害に関する第1の障害情報を取得する取得ステップと、
前記第1障害情報のデータ量を縮小した障害情報である第2障害情報を生成する縮小ステップと、
前記第2の障害情報を管理装置に送信する送信ステップと
を含む障害通知方法。
(付記11)
自装置に発生した障害に関する第1障害情報を取得する取得ステップと、前記第1障害情報のデータ量を解析することで第2障害情報を生成する解析ステップとを実行するコンピュータと、
前記第2障害情報を解析する管理装置と
を備えるコンピュータシステム。
1 コンピュータ
01 BIOS
02 OS
03 障害情報処理プログラム
100 CPU
101 ログ収集部
102 第1ログ記録部
103 第2ログ取得部
104 送信部
105 第1ログ取得部
106 解析部
107 縮小部
108 第2ログ記録部
200 メインメモリ
300 不揮発メモリ
400 ストレージ
M1 第1記憶領域
M2 第2記憶領域

Claims (9)

  1. 自装置に発生した障害に関する障害情報を第1記憶領域に記録し、第2記憶領域に記録された障害情報を管理装置に送信するBIOSを備えるコンピュータのOSに、
    前記コンピュータのBIOSによって生成され、前記第1記憶領域に記録された、自装置に発生した障害に関する第1障害情報を取得する取得ステップと、
    前記第1障害情報の解析を実行する解析ステップと、
    前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて、前記第1障害情報のうち障害との関係性の小さいログデータを削除することで、管理装置に送信するための障害情報である第2障害情報を生成して前記第2記憶領域に記録する縮小ステップと
    を実行させるための障害情報処理プログラム。
  2. 前記BIOSによって生成された前記第1障害情報は、前記コンピュータの記憶装置の所定のアドレスおよびデータサイズに係る前記第1記憶領域に記録され、
    前記取得ステップは、前記コンピュータが前記記憶装置の前記第1記憶領域に記憶された情報を取得するステップである
    請求項1に記載の障害情報処理プログラム。
  3. 前記BIOSによって生成された前記第1障害情報は、障害に係るログデータと、当該ログデータに基づいて前記第2障害情報が作成されたか否かを示す情報とを関連付けたものであり、
    前記縮小ステップは、前記第1障害情報のうち前記第2障害情報が作成されていないログデータに基づいて前記第2障害情報を作成するステップである
    請求項2に記載の障害情報処理プログラム。
  4. CPUと、
    前記CPUに、自装置に発生した障害に関する第1障害情報を生成して第1記憶領域に記録する生成ステップと、前記第1障害情報に基づいて生成された第2障害情報を第2記憶領域から読み出して管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOSを記憶する第1記憶装置と、
    請求項1から請求項3の何れか1項に記載の障害情報処理プログラムを記憶する第2記憶装置と
    を備えるコンピュータ。
  5. 前記第2記憶装置は、前記障害情報処理プログラムを実行可能なOSを記憶する
    請求項4に記載のコンピュータ。
  6. 前記CPUは、前記障害が検出されたときに前記BIOSに制御権を移転し、前記生成ステップの実行後に前記BIOSから前記OSに制御権を移転する
    請求項5に記載のコンピュータ。
  7. 第3記憶装置をさらに備え、
    前記CPUは、
    前記生成ステップにおいて前記第1障害情報を前記第3記憶装置の所定のアドレスおよびデータサイズに係る前記第1記憶領域に記録し、
    前記縮小ステップにおいて前記第3記憶装置の前記第1記憶領域に記憶された情報を読み出し、当該情報に基づいて前記第2障害情報を生成し、前記第2障害情報を前記第3記憶装置の前記第2記憶領域に記録する
    請求項6に記載のコンピュータ。
  8. コンピュータがBIOSの実行により、当該コンピュータに発生した障害に関する第1障害情報を生成して第1記憶領域に記録する生成ステップと、
    前記コンピュータがOSの実行により、前記第1記憶領域から前記第1障害情報を取得し、前記第1障害情報の解析を実行する解析ステップと、
    前記コンピュータが前記OSの実行により、前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて、前記第1障害情報のうち障害との関係性の小さいログデータを削除することで、第2障害情報を生成し、第2記憶領域に記録する縮小ステップと、
    前記コンピュータが前記BIOSの実行により、前記第2記憶領域に記録された前記第2障害情報を管理装置に送信する送信ステップと
    を含む障害通知方法。
  9. コンピュータと管理装置とを備え、
    前記コンピュータは、
    BIOSの実行により、自装置に発生した障害に関する第1障害情報を生成して第1記憶領域に記録し、
    OSの実行により前記第1記憶領域から前記第1障害情報を取得し、前記第1障害情報を解析し、解析の結果に基づいて前記第1障害情報のうち障害との関係性の小さいログデータを削除することで第2障害情報を生成して、第2記憶領域に記録し、
    BIOSの実行により、前記第2記憶領域に記録された前記第2障害情報を前記管理装置に送信し、
    前記管理装置は、
    前記コンピュータから受信した前記第2障害情報を解析する
    コンピュータシステム。
JP2017055756A 2017-03-22 2017-03-22 障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム Active JP7063445B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017055756A JP7063445B2 (ja) 2017-03-22 2017-03-22 障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017055756A JP7063445B2 (ja) 2017-03-22 2017-03-22 障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム

Publications (2)

Publication Number Publication Date
JP2018160009A JP2018160009A (ja) 2018-10-11
JP7063445B2 true JP7063445B2 (ja) 2022-05-09

Family

ID=63796724

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017055756A Active JP7063445B2 (ja) 2017-03-22 2017-03-22 障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム

Country Status (1)

Country Link
JP (1) JP7063445B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6697102B1 (ja) * 2019-01-23 2020-05-20 Necプラットフォームズ株式会社 情報処理装置、情報処理装置の制御方法、及び、情報処理装置の制御プログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011145824A (ja) 2010-01-13 2011-07-28 Nec Computertechno Ltd 情報処理装置、障害解析方法及び障害解析プログラム
JP2011164971A (ja) 2010-02-10 2011-08-25 Nec Corp Biosとbmcとの間の通信パス強化方法、その装置及びそのプログラム
JP2011210064A (ja) 2010-03-30 2011-10-20 Nec Corp ログ情報収集システム、装置、方法及びプログラム
JP2013025440A (ja) 2011-07-19 2013-02-04 Hitachi Ltd 情報処理装置および障害処理方法
JP2013037421A (ja) 2011-08-04 2013-02-21 Nec Corp 情報処理装置、情報処理システム、メッセージ制御方法およびプログラム
US20170102985A1 (en) 2014-06-24 2017-04-13 Huawei Technologies Co.,Ltd. Fault processing method, related apparatus, and computer

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011145824A (ja) 2010-01-13 2011-07-28 Nec Computertechno Ltd 情報処理装置、障害解析方法及び障害解析プログラム
JP2011164971A (ja) 2010-02-10 2011-08-25 Nec Corp Biosとbmcとの間の通信パス強化方法、その装置及びそのプログラム
JP2011210064A (ja) 2010-03-30 2011-10-20 Nec Corp ログ情報収集システム、装置、方法及びプログラム
JP2013025440A (ja) 2011-07-19 2013-02-04 Hitachi Ltd 情報処理装置および障害処理方法
JP2013037421A (ja) 2011-08-04 2013-02-21 Nec Corp 情報処理装置、情報処理システム、メッセージ制御方法およびプログラム
US20170102985A1 (en) 2014-06-24 2017-04-13 Huawei Technologies Co.,Ltd. Fault processing method, related apparatus, and computer

Also Published As

Publication number Publication date
JP2018160009A (ja) 2018-10-11

Similar Documents

Publication Publication Date Title
TWI628542B (zh) 快閃記憶體的垃圾回收斷電回復方法以及使用該方法的裝置
US9015695B2 (en) Information processing apparatus and information processing method
US20200174865A1 (en) Controller, storage device having the controller, and method of operating the controller
EP3147797A1 (en) Data management method, node and system for database cluster
US8245085B2 (en) Dump output control apparatus and dump output control method
US20140351628A1 (en) Information processing device, control circuit, computer-readable recording medium for control program, and control method
KR20170010810A (ko) 플래시 메모리 내에 데이터를 판독/기록하기 위한 방법, 장치 및 사용자 장비
JP7063445B2 (ja) 障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステム
EP3534259A1 (en) Computer and method for storing state and event log relevant for fault diagnosis
US8977892B2 (en) Disk control apparatus, method of detecting failure of disk apparatus, and recording medium for disk diagnosis program
JP2007249469A (ja) 不揮発性半導体記憶装置およびメモリシステム
JP2004102395A (ja) メモリダンプデータの取得方法および情報処理装置、ならびにそのプログラム
JP2015118493A (ja) トレース装置及びトレースプログラム
JP3747213B1 (ja) シーケンシャルromインターフェース対応nand型フラッシュメモリーデバイス及びそのコントローラ
JP4897359B2 (ja) メモリ管理装置及びメモリ管理方法及びプログラム
CN110851162A (zh) 兼容raid与非raid的ssd固件升级方法和装置
US20170357545A1 (en) Information processing apparatus and information processing method
JP5427814B2 (ja) 障害解析情報収集装置
KR101539933B1 (ko) Cpu 행업 시 로그를 생성하는 방법 및 장치
JP2008299360A (ja) 履歴情報管理方法及び履歴情報管理システム
JP2006227923A (ja) ディスク管理装置およびディスク管理プログラム
CN109101192B (zh) 数据存储方法和装置
JP7102883B2 (ja) アプリケーションプログラム、機能プログラムモジュール
JP6805838B2 (ja) ディスク管理システム、ディスク管理方法、および、ディスク管理プログラム
JP4838226B2 (ja) ネットワークロギング処理プログラム,情報処理システムおよびネットワークロギング情報自動退避方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200207

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210405

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211005

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211206

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220414

R150 Certificate of patent or registration of utility model

Ref document number: 7063445

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150