JP2010033678A - ディスク装置、回路基板およびエラーログ情報記録方法 - Google Patents

ディスク装置、回路基板およびエラーログ情報記録方法 Download PDF

Info

Publication number
JP2010033678A
JP2010033678A JP2008196844A JP2008196844A JP2010033678A JP 2010033678 A JP2010033678 A JP 2010033678A JP 2008196844 A JP2008196844 A JP 2008196844A JP 2008196844 A JP2008196844 A JP 2008196844A JP 2010033678 A JP2010033678 A JP 2010033678A
Authority
JP
Japan
Prior art keywords
log information
area
error log
recorded
program code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008196844A
Other languages
English (en)
Inventor
Yutaka Komagome
豊 駒込
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Storage Device Corp
Original Assignee
Toshiba Storage Device Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Storage Device Corp filed Critical Toshiba Storage Device Corp
Priority to JP2008196844A priority Critical patent/JP2010033678A/ja
Priority to US12/490,929 priority patent/US20100031094A1/en
Publication of JP2010033678A publication Critical patent/JP2010033678A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2516Hard disks

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】ディスク装置における大規模なエラーログ情報を不揮発性メモリに記録するようにする。
【解決手段】ディスク装置の不揮発性メモリ12は、初期起動用のブートコードがブートコード領域と121と、ブートコードに引き続くプログラムコードが記録されたプログラムコード領域122と、ディスク装置固有の属性データを記録する記録領域123と、ログ情報を記録するためのログ情報領域124と、を有する。磁気ディスク装置にエラーが発生した際に収集されたエラーログ情報が、ディスク媒体に記録できず、かつ不揮発性メモリ12のログ情報領域124に記録可能なサイズで表現できない場合、不揮発性メモリ12のエラーログ記録開始アドレスからエラーログ情報を上書き記録する。
【選択図】図3

Description

故障発生時に収集されるエラーログ情報を記録するディスク装置、回路基板およびエラーログ情報記録方法に関する。
情報の記録のために、回転する磁気ディスク媒体を用いる磁気ディスク装置に故障が発生した場合は、故障の原因解析を的確に実施し、今後同様な故障が起こらないように適切な対策を講じる必要がある。そのため、磁気ディスク装置は、故障発生時の状況を含む過去の稼動状況のエラーログ情報を収集し、記録するための機能を有している。近年の磁気ディスク装置の大容量化、高機能化に伴い、発生する故障の種類も多様になっている。したがって、多様な故障に対応して各種の情報をログ情報として収集する必要がある。
ディスク装置がホストシステムと接続されている場合は、ホストシステムがログ情報を収集することができる。しかし、ディスク装置に故障が発生した場合は、ホストシステムから切り離して、故障診断システムなどに接続してログ情報を参照できるようにする必要がある。したがって、診断システムなどに接続してもエラーログ情報を参照することができるように、従来から磁気ディスク装置の不揮発性の記憶領域にエラーログ情報を保存するようにしていた。具体的には、磁気ディスク媒体のシステム領域、あるいはプリント基板上のフラッシュROM(EEPROM:Electrically Erasable Programable Read Only Memory)のログ用領域に、エラーログ情報を記録していた。
ディスク媒体にエラーログ情報を記録すると、大容量のエラーログ情報を記録することができ好適である。しかしながら、ディスク媒体上へエラーログ情報が記録できないということがある。例えば、ディスク媒体の駆動モータが回転していない場合、あるいは駆動モータに回転異常がある場合は、ディスク媒体上へのログ情報の記録はできない。さらに、ディスク媒体が定常回転に達していない場合など読み書きの用意ができていないノットレディ状態でも、ディスク媒体上へのログ情報の記録はできない。さらに、ディスク媒体が定常回転していても、ディスク媒体上へのログ情報の書き込みが失敗することもある。例えば、ディスク装置の素子不良やメカ機構の異常など内部的な不具合があると、ログ情報の書き込みができない。さらに、磁気ディスク装置を組み入れたシステム筐体の振動に起因してエラーログ情報の書き込みが失敗することもある。
情報の書き込み/読み出しのための機構部を持たないフラッシュROMにエラーログ情報を記録するようにすれば、安定してログ情報を記録することが可能である。しかし、フラッシュROMのログ情報用に割り当てられる領域のサイズは限られていて、記録できるエラーログ情報に制限がある。
したがって、エラーログ情報がある程度の規模になるとフラッシュROMのログ情報用領域には収まらない。さらに、関連する複数の故障が同時に発生した場合、あるいは故障が継続的に発生した場合には、それぞれの故障についてのログ情報を蓄積する必要があり、さらに大きなログ情報領域が求められている。
現状では、大きなサイズのエラーログ情報が何らかの理由でディスク媒体に記録できなければ、フラッシュROMに記録することもできず、エラーログ情報を破棄せざるを得ない。
なお、補助記憶装置の障害によるログ情報の欠落を補うことは公知である。公知のものは、ログ情報の補助記憶装置への格納が不可能となった場合に、ログ情報を不揮発性メモリに格納し、次に補助記憶装置の障害が回復した際に、ログ情報を補助記憶装置に再び格納するというものである。
特開平7−319741号公報
本発明は、上記問題点に鑑み、大規模なエラーログ情報であっても不揮発性メモリに記録することができるディスク装置、回路基板およびエラーログ情報記録方法を提供することを目的とする。
本ディスク装置あるいは回路基板は、初期起動用の第1のプログラムコードが記録された第1のプログラムコード領域と、第2のプログラムコードが記録された第2のプログラムコード領域と、ログ情報を記録するためのログ情報領域と、第2のプログラムコード領域に設定されたエラーログ情報記録開始アドレスを有する不揮発性メモリを有し、第1および第2のプログラムコードに従って動作するプロセッサが、エラーが発生した際にエラーログ情報を収集し、収集されたエラーログ情報が、ディスク媒体に記録できず、かつ不揮発性メモリの前記ログ情報領域に記録可能なサイズで表現できない場合、不揮発性メモリのエラーログ情報記録開始アドレスから前記収集されたエラーログ情報を上書き記録するものである。
本エラーログ情報記録方法は、エラーが発生した際にプロセッサがエラーログ情報を収集するステップと、収集されたエラーログ情報がディスク媒体のシステム領域に記録できるか否かを前記プロセッサが判定するステップと、収集されたエラーログ情報が不揮発性メモリのログ情報記録領域に記録可能なサイズで表現できるか否かをプロセッサが判定するステップと、エラーログ情報が、ディスク媒体のシステムデータ用領域に記録できず、かつ不揮発性メモリのログ情報記録領域に記録可能なサイズで表現できないとプロセッサが判定した場合、プロセッサは、前記不揮発性メモリの前記第2のプログラムコード記録領域に前記収集されたエラーログ情報を上書き記録するステップとを有するものである。
さらに、本エラーログ情報記録方法は、ディスク装置を故障診断システムに接続するステップと、故障診断システムが第1のコマンドを発行し、第2のプログラム領域が破壊されているか否かを判定するステップと、故障診断システムが第2のコマンドを発行し、第2のプログラムコードをディスク装置にダウンロードするステップと、故障診断システムが第3のコマンドを発行し、第2のプログラム領域のエラーログ情報記録開始アドレス付近のデータをチェックするステップと、エラーログ情報記録開始アドレス付近のデータがログ情報であると判定されると、故障診断システムが前記不揮発性メモリに記録されたすべてのログ情報を前記故障診断システムに収集するステップとを含むようにしてもよい。
このディスク装置、回路基板、およびエラーログ記録方法によると、エラーログ情報がディスク媒体に記録できず、かつ不揮発性メモリのログ情報領域に記録可能なサイズで表現できない場合でも、不揮発性メモリに記録することがでる。したがって、必要なエラーログ情報を廃棄しなければならない事態を避けることができる。
図1は、一実施形態が適用される磁気ディスク装置の機構部の概要を示す図である。磁気ディスク装置100の磁気記録媒体である磁気ディスク1は、ディスクエンクロージャ3に固定されたスピンドルモータ2に回転可能に支持されている。磁気ディスク1に対向して情報の書き込み/読み出しを行う磁気ヘッド8は、アクチュエータ7の先端に配置されている。アクチュエータ7は、ボイスコイル4により磁気ディスク1の略半径方向Bに移動可能に、ディスクエンクロージャ3に固定されている。磁気ヘッド8は、磁気ディスク1から退避するとき、ランプ9に保持される。制御部10は、プリント回路基板上に実装される複数の集積回路(LSI)を有し、磁気ディスク1の回転、磁気ヘッド8のシーク、あるいは磁気ヘッドによる情報の書き込み/読み出しなどの各種動作を制御する。
なお、本実施形態は、磁気ディスクを用いたディスク装置を対象とするが、光磁気ディスク、光ディスクなど他のディスク媒体を用いたディスク装置にも適用できる。
図2は、一実施形態である磁気ディスク装置の制御部の概要を示す図である。図2では、本実施形態の説明のためにエラーログ情報の記録に関連する機能ブロックを示す。ディスク媒体1の回転制御あるいはディスク媒体1へのデータの書き込み/読み出しのためのヘッド制御に関連する機能ブロックなど本実施形態の説明に必要がない機能は、省略あるいは簡略化している。
磁気ディスク装置100は、磁気ディスク1と、プリント回路基板19に搭載されている制御部10と、を備えている。制御部10は、ホストインタフェース18を介してサーバあるいはPC(Personal Computer)などのホストシステム200に接続される。
ディスク媒体1は、システム用領域1aとユーザデータ用領域1bとを有する。システム用領域1aは、フラッシュROM12に格納できなかったプログラムコードや、装置固有の属性データ、ならびにログ情報などを記録するための領域である。ユーザデータ用領域1bは、ホストシステム200を用いてユーザが読み書きできるデータを記録するための領域である。
制御部10は、プリント回路基板19に載置されているLSI等の複数の回路素子により形成される。MPU11は、RAM(Random Access Memory)13にロードされるプログラムに基づいて動作する。したがって、MPU11は、エラーログ情報の収集記録を制御する。
フラッシュROM12は、MPU11用のプログラムおよびデータが格納されている書き換え可能な不揮発性半導体メモリである。フラッシュROM12の領域は、ブート(BOOT)コード領域121と、プログラムコード領域122と、属性データ領域123と、ログ情報領域124とを有する。ブートコード領域121は、MPU11の立ち上げ時の初期起動用のプログラムコードを格納している。プログラムコード領域122は、ブートコードに引き続いて、MPU11を動作させるためのプログラムコードを格納している。プログラムコード領域122には、少なくとも磁気ディスク媒体1がレディ状態になるまでに必要な処理をMPU11に実行させるためのプログラムコードが格納される。属性データ領域123は、この磁気ディスク装置固有の属性データや制御用データを格納している。ログ情報領域124は、小規模なログ情報の記録のために使用される。
RAM13には、フラッシュROM12およびディスク媒体1のシステム用領域1aなどから、プログラムコードがロードされる。MPU11は、RAM13にロードされたプログラムに従って動作する。
ディスクコントローラ15は、ホストインタフェース18とのコマンドやデータの送受信、ならびにリード/ライト(R/W)制御回路17とのデータの送受信を制御する。R/W制御回路17は、ディスク媒体1に対するデータの書き込み/読み出しを制御する。バッファメモリ16は、磁気ディスク装置100がデータを効率よく出力するためのキャッシュとして動作する。
磁気ディスク装置100は、エラーログ情報を記録するための領域として、ディスク媒体1上のシステム用領域1aの一部と、フラッシュROM12の一部であるログ情報領域124を有している。一例として、ディスク媒体1上のシステム用領域1aが9MBであるとする。システム用領域1aの9MBのうち、プログラムコード用として1MB、属性データとして4.5MBを割り当てることができる。そうすると、ログ情報を記録するためには、システム用領域1aの3.5MBが使用できることになる。
図3は、本実施形態の磁気ディスク装置100に用いられるフラッシュROM12の一例を示す。この例では、フラッシュROM12の容量は512KBである。ブートコードを格納するブートコード領域121の容量は64KBである。初期動作に続くMPU11の動作のためのプログラムコードを格納するプログラムコード領域122の容量は約380KBである。属性データ領域123の容量は64KBである。したがって、ログ情報領域124の容量は、約4KBとなる。
本実施形態では、ログ情報領域124には格納できない大規模なログ情報の記録が必要なときのために、フラッシュROM12にエラーログ情報書き込み可能領域125が規定されている。具体的には、エラーログ記録のための書き込み開始アドレスがプログラムコード領域122に定義されている。エラーログ情報は、書き込み開始アドレスから順に上書きされる。図3では、エラーログ情報書き込み可能領域125は、プログラムコード領域122と、属性データ領域123と、ログ情報領域124に及んでいる。
エラーログ情報がエラーログ情報書き込み可能領域125に書き込まれると、プログラムコードは上書きされるので、プログラムコードは破壊される。したがって、エラーログ情報書き込み可能領域125内には、初期起動用のプログラムコードすなわちブートコードだけは含まないようにする。エラーログ情報書き込み可能領域125にブートコード領域121だけは含まないようにすれば、エラーログ情報書き込み可能領域125の開始アドレスおよび最終アドレスの設定は任意である。想定されるエラーログのサイズを考慮してエラーログ情報書き込み可能領域125を設定することができる。また、プログラムコード領域122のプログラムコードあるいは属性データ領域123の属性データの一部を上書きされないようにすることもできる。
ところで、エラーログ情報には、故障の発生回数や発生率などを含む統計情報、故障の発生シーケンスなどを発生順にとる履歴情報、そして個別の故障に関する詳細情報をとる個別情報などが含まれる。特に個別情報を充実させることは、故障発生時の原因解明に大いに寄与する。しかしながら、個別情報を充実させることは、エラーログ情報の規模も大きくする。
例えば、バッファCRCエラーが発生した時の調査に必要なログ情報は、以下のとおりである。ホストシステム200とディスク媒体1間においては、バッファメモリ16を介してデータが転送される。バッファCRCは、転送されるデータの正常性を保証するためのCRCコードである。データ転送中にCRCコードによる異常が検出される時は、バッファメモリ16に故障が発生している可能性が大きい。しかし、R/W制御回路17からホストインタフェース18間の素子の異常、あるいはデータバス上の異常の可能性もある。この故障状態を特定するために必要な情報量は、まず異常検出時におけるプログラム上の制御情報(内部テーブル、レジスタ値、内部処理シーケンスの履歴など)に約28KBが必要である。また、バッファメモリ16で異常が発生したと推定される付近のダンプデータに約5KB〜10KBが必要である。このダンプデータは、1セクタを512バイトとして約10〜20セクタ分に相当する。必要とされる情報量の合計は、約33〜38KBとなる。
30KBを超える規模のエラーログ情報は、フラッシュROM12のログ情報領域124が約4KBであるので、ログ情報領域124にはとうてい収まらない。ディスク媒体1のシステム用領域1aに格納することができればよいが、前述のようにディスク媒体1上のシステム用領域1aへのログ情報の記録ができない場合あるいは記録に失敗する場合がある。
本実施形態では、ディスク媒体1およびフラッシュROMの所定の領域にエラーログ情報の記録ができない場合には、エラーログ情報書き込み可能領域125にエラーログ情報を記録する。すなわち、ログ記録開始アドレスからエラーログ情報を上書きする。
図4は、本実施形態によるエラーログ情報の記録動作のフローを示す図である。故障等の何らかの事象が発生するとログ登録処理が行われる。まずMPU11はログ情報を収集し、RAM13のワーク領域に格納する(S1)。
次いで、MPU11は、ディスク媒体1のシステム領域1aへの書き込みが可能であるかどうかを確認する(S2)。すなわち、ディスクが正常に回転しているか、機構部品に異常がないかなどがチェックされる。
ステップS2で、ディスク媒体1のシステム領域1aが書き込み可能な状態にあると判定されると、ログ情報はディスク媒体1のシステム領域1aに書き込まれる(S3)。次いで、ディスク媒体1のシステム領域1aへの書き込みが成功したか否かが判定される(S4)。
ステップS4で、ディスク媒体1のシステム領域1bへの書き込みが成功したと判定されると、ログ登録処理は終了し、次ぎの処理に進む。
ステップS2で、ディスク媒体1のシステム領域1aへの書き込みができないと判定された場合、ステップS5に進む。また、ステップS4で、ディスク媒体1のシステム領域1aへの書き込み処理を実行したものの異常終了した場合など、システム領域1aへの書き込みが失敗したと判定されると、ステップS5へ進む。
ステップS5では、収集されたエラーログ情報の内容およびサイズなどを考慮してフラッシュROM12のログ情報領域124に記録可能か否かが判定される。ログ情報領域124に記録可能か否かの判定については、発生した故障の重要度、エラーログ情報のサイズ、エラーログ情報を圧縮することができるか否か、などが考慮される。例えば閾値などの判定基準は、フラッシュROM12に格納されているプログラムで規定される。大規模なエラーログ情報であっても必要なエラーログ情報を選択して圧縮することにより、ログ情報領域123に記録可能な場合がある。また、大規模なエラーログ情報であっても故障の重要度が低い場合、プログラムコードを壊してまで記録する必要はないと判断される場合もある。プログラムコードを壊してまで記録する必要はないと判断されると、エラーログ情報はいずれにも記録しないで廃棄する。
ステップS5で、フラッシュROM12のログ情報領域124に格納できるサイズで、必要なエラーログ情報を表現できる場合は、ログ情報領域124に記録可能と判定される。ログ情報領域124に記録可能と判定されると、ステップS6で、ログ情報領域124にエラーログ情報が記録され、記録が完了すると、エラーログ登録処理が完了する。
ログ情報領域124にエラーログ情報が記録されると、フラッシュROM12のプログラムコード領域122にプログラムコードがそのまま残るので、電源を切断/再投入した場合にも装置は正常に立ち上がる。
収集されたエラーログ情報を圧縮しても、必要なエラーログ情報のサイズがログ情報領域124のサイズを超える場合、エラーログ情報はログ情報領域124に格納することはできない。したがって、ステップS5では、ログ情報領域124に格納できない大規模なエラーログ情報は、エラーログ情報書き込み可能領域に記録することが決定される。これに従い、ステップS7で、エラーログ情報書き込み可能領域125のログ記録開始アドレス以降に、エラーログ情報が上書きされて書き込まれる。エラーログ情報書き込み可能領域へのエラーログ情報の書き込みが終了すると、ログ登録処理は完了する。
なお、エラーログ情報がエラーログ情報書き込み可能領域に書き込まれると、フラッシュROM12のプログラムコード領域122のプログラムコードは破壊され、電源を切断した後、再投入した場合、磁気ディスク装置100は正常には立ち上がらない。
図5は、故障診断システムに接続された磁気ディスク装置を示す図である。故障が発生した磁気ディスク装置100は、ホストシステム200から切り離され、故障診断システム300に接続されて、故障の解析・調査が行われる。故障診断システム300は、ホストシステムと同様のサーバあるいはPCであってもよい。故障診断システム300は、ホストインタフェース18を介して制御部10に接続される。故障診断システム300は、ディスク媒体1に記録されたエラーログ情報あるいは制御部10のフラッシュROM12に記録されたエラーログ情報を収集して、故障診断システム300内のファイルとして保存する。故障診断システム300は、ファイルに保存されたエラーログ情報に基づいてログ調査を実施する。
図6は、故障診断システムに接続された磁気ディスク装置を立ち上げて、エラーログを収集する手順の一例を示す図である。図6では、SCSI規格に則ったホストインタフェースコマンドに基づいて説明する。しかし、他の規格によるインタフェースコマンドでも類似の処理により図6のフローは実現可能である。
故障が発生したディスク装置100をホストシステム200から切り離して、故障診断システム300に接続する。故障診断システム300は、ディスク装置100に電源を投入した直後に、ディスク装置100の状態を確認するTEST UNIT READYコマンドを磁気ディスク装置100に対して発行する(S11)。磁気ディスク装置100は未だ立ち上がってはおらず、ノットレディ状態であるので、磁気ディスク装置100が正常であっても、TEST UNIT READYコマンドはエラー終了する。
ついで、故障診断システム300は、エラーの詳細を知るためにREQUEST SENSEコマンドを発行し、センス情報を収集する(S12)。収集されたセンス情報が初期診断エラーを示しているか否かが判断される(S13)。センス情報が初期診断エラーを示していない場合には、磁気ディスク装置100は通常のノットレディ状態であるので、通常の立ち上げシーケンスに進む(S14)。
ステップS13で、センス情報が初期診断エラーを示していると判断されると、ステップS15に進み、初期診断エラーの種別を判別する。エラーログ情報をフラッシュROM12のプログラム領域122に記録した場合、プログラム領域が破壊されるが、ブートコード領域121は残っている。したがって、磁気ディスク装置100は、ブートコードに従う初期動作が可能である。ブートコードは、プログラムコードが正常か否か、基本電子回路が正常か否かを診断することができる自己診断機能を有している。したがって、ブートコードによる自己診断機能によりプログラムコードが不当であることが検出されると、プログラムコードが破壊されていることが分る。
ステップS15で、プログラムコードが正当であると判断されると、ステップS16に進み、従来の装置故障時の処理を行なう。
ステップS15で、初期診断エラーがプログラムコードの破壊によるものであった場合には、ステップS17に進む。ステップS17では、SCSIインタフェースのWRITE BUFFERコマンドによって通常時用もしくは試験用のプログラムコードを故障診断システム300から磁気ディスク装置100にダウンロードし、RAM13に展開する。診断システム300からのプログラムコードのダウンロードは、不揮発性メモリであるフラッシュROM12にセーブしないモード(mode=4)で実行される。ダウンロードされるプログラムコードは、フラッシュROM12の内容を読むために、フラッシュROM12を含むメモリ空間のデータを読み出すことのできるコマンド(READ RAMコマンド)をサポートしている必要がある。
ダウンロード完了後、ステップS18で、診断システム300は、READ RAMコマンドを発行し、プログラムコード領域122のログ記録開始アドレス付近のデータをチェックする(S18)。ログ記録開始アドレス付近は、通常はプログラムが書き込まれている領域である。したがって、ログ記録開始アドレス付近のデータにログ情報であることを特徴付けるデータ、例えばログのヘッダやログパターンなどが含まれていると、エラーログ情報が上書きされていることが分る。なお、エラーログ情報であることを明確に示す所定のログパターンをログ記録開始アドレス付近に記録するように設定することもできる。
ステップS18によるログ記録開始アドレス付近のデータのチェックに従って、ステップS19では、ログ記録開始アドレス付近のデータに、ログパターンなどログ情報であることを特徴付けるデータが存在するか否かが判定される。ログ記録開始アドレス付近のデータにログ情報であることを特徴付けるデータが存在しなければ、プログラムコードが破壊されているのではないので、従来どおりの故障時の処理を行う。
ログ記録開始アドレス付近のデータがエラーログ情報であれば、ステップS20で、READ RAMコマンドに従って故障診断システム300にすべてのエラーログ情報を収集する。次いで、ステップS21で、故障診断システム300は、収集されたログ情報を故障診断システム300内のファイルに保存して、保存されたファイルのログ情報に基づいてログ調査を実施する。
本実施形態では、大規模なエラーログの記録を必要とする故障が磁気ディスク装置に発生した場合に、ディスク媒体に記録できなくても、不揮発性メモリに記録することができる。したがって、エラーログ情報は廃棄されることなく、確実に記録される。また、不揮発性メモリにエラーログ情報を記録した結果、不揮発性メモリのプログラムコード領域が破壊されていても、磁気ディスク装置を故障診断システムに接続して、不揮発性メモリに記録されたエラーログ情報を回収することができる。
本実施形態が適用される磁気ディスク装置の一例を示す図である。 本実施形態の磁気ディスク装置の制御部の概要を説明する図である。 本実施形態の不揮発性メモリの記憶領域の一例を示す図である。 本実施形態によるエラーログ情報の書き込み処理のフローを示す図である。 本実施形態による故障診断システムに接続された磁気ディスク装置を示す図である。 本実施形態の故障診断システムによる磁気ディスク装置からエラーログ情報を読み出す処理のフローを示す図である。
符号の説明
100 磁気ディスク装置
1 磁気ディスク媒体
1a システム用領域
1b ユーザデータ用領域
10 磁気ディスク装置の制御部
11 MPU
12 フラッシュROM
121 ブートコード領域
122 プログラムコード領域
123 属性データ領域
124 ログ情報領域
125 エラーログ情報可能領域
13 RAM
15 ディスクコントローラ
16 バッファメモリ
17 R/W制御回路
18 ホストインタフェース
200 ホストシステム
300 故障診断システム

Claims (7)

  1. データの書き込みおよび/または読み出しが可能なディスク媒体を駆動するディスク装置であって、
    初期起動用の第1のプログラムコードが記録された第1のプログラムコード領域と、第2のプログラムコードが記録された第2のプログラムコード領域と、ログ情報を記録するためのログ情報領域と、前記第2のプログラムコード領域に設定されたエラーログ情報記録開始アドレスを有する不揮発性メモリと、
    前記第1および第2のプログラムコードに従って動作するプロセッサと、を備え、
    前記プロセッサは、
    エラーが発生した際にエラーログ情報を収集し、
    前記収集されたエラーログ情報が、前記ディスク媒体に記録できず、かつ前記不揮発性メモリの前記ログ情報領域に記録可能なサイズで表現できない場合、前記不揮発性メモリの前記エラーログ情報記録開始アドレスから前記収集されたエラーログ情報を上書き記録することを特徴とするディスク装置。
  2. 前記収集されたエラーログ情報を上書き記録するための領域は、前記第1のプログラム領域を除く領域で設定される請求項1に記載のディスク装置。
  3. データの書き込みおよび/または読み出しが可能なディスク媒体を駆動する磁気ディスク装置用の回路基板であって、
    初期起動用の第1のプログラムコードが記録された第1のプログラムコード領域と、第2のプログラムコードが記録された第2のプログラムコード領域と、ログ情報を記録するログ情報記録領域と、前記第2のプログラムコード領域に設定されたエラーログ情報記録開始アドレスを有する不揮発性メモリと、
    前記第1および第2のプログラムコードに従って動作するプロセッサと、を搭載し、
    前記プロセッサは、
    エラーが発生した際にエラーログ情報を収集し、
    前記収集されたエラーログ情報が、前記ディスク媒体に記録できず、かつ前記不揮発性メモリの前記ログ情報領域に記録可能なサイズで表現できない場合、前記不揮発性メモリの前記第2のプログラムコード記録領域に設定されたエラーログ記録開始アドレスから前記収集されたエラーログ情報を上書き記録することを特徴とする回路基板。
  4. 前記収集されたエラーログ情報を上書き記録するための領域は、前記第1のプログラム領域を除く領域で設定される請求項3に記載の回路基板。
  5. 初期起動用の第1のプログラムコードが記録された第1のプログラムコード領域と、第2のプログラムコードが記録された第2のプログラムコード記録領域と、ログ情報を記録するエラーログ情報記録領域とを有する不揮発性メモリと、
    前記第1および第2のプログラムコードに従って動作するプロセッサと、を備えるディスク装置のエラーログ情報記録方法であって、
    エラーが発生した際に前記プロセッサがエラーログ情報を収集するステップと、
    前記収集されたエラーログ情報が前記ディスク媒体の前記システム領域に記録できるか否かを前記プロセッサが判定するステップと、
    前記収集されたエラーログ情報が前記不揮発性メモリの前記ログ情報記録領域に記録可能なサイズで表現できるか否かを前記プロセッサが判定するステップと、
    前記エラーログ情報が、ディスク媒体の前記システムデータ用領域に記録できず、かつ前記不揮発性メモリの前記ログ情報記録領域に記録可能なサイズで表現できないと前記プロセッサが判定した場合、前記プロセッサは、前記不揮発性メモリの前記第2のプログラムコード記録領域に前記収集されたエラーログ情報を上書き記録するステップと
    を有することを特徴とするエラーログ情報記録方法。
  6. 前記収集されたエラーログ情報を上書き記録するための領域は、前記第1のプログラム領域を除く領域で設定される請求項5に記載のエラーログ情報記録方法。
  7. 前記ディスク装置を故障診断システムに接続するステップと、
    前記故障診断システムが第1のコマンドを発行し、前記第2のプログラム領域が破壊されているか否かを判定するステップと、
    前記故障診断システムが第2のコマンドを発行し、前記故障診断システムから前記第2のプログラムコードを前記ディスク装置にダウンロードするステップと、
    前記故障診断システムが第3のコマンドを発行し、前記第2のプログラム領域のエラーログ情報記録開始アドレス付近のデータをチェックするステップと、
    前記エラーログ情報記録開始アドレス付近のデータがログ情報であると判定されると、前記故障診断システムが前記不揮発性メモリに記録されたすべてのログ情報を前記故障診断システムに収集するステップと
    をさらに含む請求項5また6に記載のエラーログ情報記録方法。
JP2008196844A 2008-07-30 2008-07-30 ディスク装置、回路基板およびエラーログ情報記録方法 Withdrawn JP2010033678A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008196844A JP2010033678A (ja) 2008-07-30 2008-07-30 ディスク装置、回路基板およびエラーログ情報記録方法
US12/490,929 US20100031094A1 (en) 2008-07-30 2009-06-24 Disk device, circuit board, and error log information recording method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008196844A JP2010033678A (ja) 2008-07-30 2008-07-30 ディスク装置、回路基板およびエラーログ情報記録方法

Publications (1)

Publication Number Publication Date
JP2010033678A true JP2010033678A (ja) 2010-02-12

Family

ID=41609570

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008196844A Withdrawn JP2010033678A (ja) 2008-07-30 2008-07-30 ディスク装置、回路基板およびエラーログ情報記録方法

Country Status (2)

Country Link
US (1) US20100031094A1 (ja)
JP (1) JP2010033678A (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8332695B2 (en) * 2009-12-23 2012-12-11 Western Digital Technologies, Inc. Data storage device tester
US8626463B2 (en) * 2009-12-23 2014-01-07 Western Digital Technologies, Inc. Data storage device tester
US8458526B2 (en) * 2009-12-23 2013-06-04 Western Digital Technologies, Inc. Data storage device tester
US8862930B2 (en) * 2010-11-24 2014-10-14 Red Hat, Inc. Crash recovery memory reservation based on device drivers for an operational kernel
JP2013222435A (ja) * 2012-04-19 2013-10-28 Toshiba Corp 半導体記憶装置及びその制御方法
JP6593981B2 (ja) * 2014-08-08 2019-10-23 キヤノン株式会社 情報処理装置、情報処理装置の制御方法、およびプログラム
US10297879B2 (en) * 2016-06-30 2019-05-21 GM Global Technology Operations LLC Titanium diboride nanotubes for trapping gases in lithium ion batteries
EP3507242B1 (en) * 2016-09-01 2021-07-14 COMPOSITE MATERIALS TECHNOLOGY, Inc. Nano-scale/nanostructured si coating on valve metal substrate for lib anodes
US10552280B2 (en) * 2017-12-14 2020-02-04 Microsoft Technology Licensing, Llc In-band monitor in system management mode context for improved cloud platform availability
CN111414299B (zh) * 2020-03-26 2023-06-06 深圳忆联信息系统有限公司 基于hdparm的SSD扩展信息获取方法和装置
CN113821364A (zh) * 2020-06-20 2021-12-21 华为技术有限公司 内存故障的处理方法、装置、设备及存储介质
CN113806127B (zh) * 2021-09-12 2024-02-13 济南浪潮数据技术有限公司 一种服务器日志收集方法、设备及可读存储介质

Also Published As

Publication number Publication date
US20100031094A1 (en) 2010-02-04

Similar Documents

Publication Publication Date Title
JP2010033678A (ja) ディスク装置、回路基板およびエラーログ情報記録方法
US7818556B2 (en) Storage apparatus, control method, and control device which can be reliably started up when power is turned on even after there is an error during firmware update
US7293203B1 (en) System and method for logging disk failure analysis in disk nonvolatile memory
US8612798B1 (en) Hybrid drive storing write data in non-volatile semiconductor memory if write verify of disk fails
TWI479309B (zh) 控制固態硬碟的裝置及方法
US7356744B2 (en) Method and system for optimizing testing of memory stores
US20110004871A1 (en) Embedded electronic device and firmware updating method thereof
US20080126784A1 (en) Storage apparatus, control method, and control device
US20070043903A1 (en) Data Processing Apparatus and Method, Control Program Therefor, and Recording Medium Having Program Recorded Thereon
JP3734620B2 (ja) 半導体ディスク装置
JP6740789B2 (ja) ストレージ制御装置および記憶装置管理プログラム
CN111737051B (zh) 一种SSD固态硬盘的trim数据校验测试方法、装置及系统
US20080244173A1 (en) Storage device using nonvolatile cache memory and control method thereof
CN110083305B (zh) 存储器系统及其操作方法
JP2003330629A (ja) ディスクアレイ制御装置及び方法並びにディスクアレイ制御プログラム
CN113190256A (zh) 一种升级方法、装置及设备
CN111897685A (zh) 掉电时校验数据的方法、装置、存储介质及电子设备
JP2868001B1 (ja) ディスクアレイ装置制御方法およびディスクアレイ装置
US20070174736A1 (en) Storage medium management apparatus, storage medium management program, and storage medium management method
US6229743B1 (en) Method of a reassign block processing time determination test for storage device
JP2009003557A (ja) 装置起動時診断方法、診断プログラム及び起動時診断装置
JP4342288B2 (ja) ドライブ装置
JP3457602B2 (ja) ディスク装置
JP2005316667A (ja) ファームウェアの更新方法
JP2005266871A (ja) ハードディスク装置の診断/消去機能を有するコンピュータ装置およびそのマザーボード

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20111004