JP2013109744A - ストレージシステムおよび製品の状態管理方法 - Google Patents

ストレージシステムおよび製品の状態管理方法 Download PDF

Info

Publication number
JP2013109744A
JP2013109744A JP2012001779A JP2012001779A JP2013109744A JP 2013109744 A JP2013109744 A JP 2013109744A JP 2012001779 A JP2012001779 A JP 2012001779A JP 2012001779 A JP2012001779 A JP 2012001779A JP 2013109744 A JP2013109744 A JP 2013109744A
Authority
JP
Japan
Prior art keywords
physical storage
state management
storage devices
storage system
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012001779A
Other languages
English (en)
Inventor
Makoto Ono
眞 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2012001779A priority Critical patent/JP2013109744A/ja
Publication of JP2013109744A publication Critical patent/JP2013109744A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Debugging And Monitoring (AREA)
  • For Increasing The Reliability Of Semiconductor Memories (AREA)

Abstract

【課題】
本発明は、ストレージシステム内の複数の物理記憶デバイスから得られる評価値を、物理的な位置関係で関連づけて、状態の異変を顕在化して検知する。
【解決手段】
入出力ユニット101、制御・演算ユニット102、一次記憶ユニット103、二次記憶ユニット104a、104b、バス105を有するストレージシステムにおいて、物理的に近接する複数の物理記憶デバイスの組合せを定義し、組合せ定義に基づいて、グループ内の物理記憶デバイスの評価値の平均の分散と組合せサイズを乗算した指標により、ストレージシステム内の状態の異変を顕在化して通知する。
【選択図】 図1

Description

本発明は、ハードディスクドライブやフラッシュメモリなどの物理記憶デバイスを多数組み込んで構成するストレージシステムに関する。ならびに、ストレージシステムに限らず、様々な製品の製造途中、すなわち半製品に対する状態管理方法に関する。
ハードディスクドライブやフラッシュメモリなどの物理記憶デバイスを多数組み込んで構成するストレージシステムは、銀行や証券などの常時稼働するオンラインシステムに導入され、稼働率を99.999%以上に維持することが不可欠である。そのため、近年のストレージシステムは、すべての物理記憶デバイスをフルに活用するのではなく、いくつかの物理記憶デバイスを故障時のスペアとして保持し、ある物理記憶デバイスが故障したときには、スペア用の物理記憶デバイスをデータの退避場所として活用する方法が採用されている。
特許文献1には、各物理記憶デバイスの読み取りエラー率を定期的に評価し、読み取りエラー率が悪化したら、その物理記憶デバイスは近い将来、故障する可能性が高いと判断し、上述のスペア用の物理記憶デバイスにデータを退避するとともに、その物理記憶デバイスへのアクセスを抑制し、データを保護する方法が開示されている。
特許文献2には、物理記憶デバイスで生じる読み取りエラーや書き込みエラーを訂正するために用いるECC(Error Check and Correct)機能を活用し、ECC訂正ビット数を評価することで、物理記憶デバイスの寿命を予測する方法が開示されている。
特許文献3には、特許文献1と同様に、各物理記憶デバイスの読み取りエラー率を評価し、読み取りエラー率が悪化したら、その物理記憶デバイスは近い将来、故障する可能性が高いと判断する。そして、複数の物理記憶デバイスに対して、それぞれの読み取りエラー率で順位を付け、読み取りエラー率の悪化の度合いに基づいて、物理記憶デバイスを交換する順番を決める方法が開示されている。
また、非特許文献1には、分散の誤差は、分散を計算するための元のデータの個数を自由度とするカイ二乗分布に従うことが記載されている。
特許4426262号 特許3486863号 特開2008−250566号
Douglas C. Montgomery、「Introduction to Statistical Quality Control 6th Edition」(米国)、John Wiley & Sons、2009年、p.259
上述の特許文献1〜3に開示された方法は、いずれも物理記憶デバイス単体の稼働中の読み取りエラー率やECC訂正ビット数などの評価値を監視して、近い将来、故障する可能性が高い物理記憶デバイスに対して、プロアクティブに保守する技術である。本発明は、多数の物理記憶デバイスが組み込まれたストレージシステムにおいて、近接する位置にある複数の物理記憶デバイスの評価値の関連性に着目し、個々の物理記憶デバイスだけではなく、ストレージシステム内の状態の異変を検知し、複数の物理記憶デバイスがほぼ同時に故障するような大規模な故障に対して、プロアクティブに保守する技術を提供する。
本発明は、ストレージシステムに組み込まれた複数の物理記憶デバイスに対して、それぞれ読み取りエラー率、ECC訂正ビット数、書き込みエラー率、温度、シーク時間、Gセンス・エラー率、スピンアップ時間など様々な評価値を測定し、各評価値に対して近接する位置にある複数の物理記憶デバイス間の関連性から、ストレージシステム内の状態の異変を顕在化することを特徴とするストレージシステムを提供することで、プロアクティブな保守を実現する。
また、状態の異変を顕在化する方法に関しては、ストレージシステムに限らず、様々な製品の製造途中、すなわち半製品に対する品質管理の課題も解決する。
上記課題を解決するために本発明では、制御・演算ユニットと、入出力ユニットと、一次記憶ユニットと、および複数の物理記憶デバイスより構成される二次記憶ユニットとを備えるストレージシステムを、前記制御・演算ユニットの二次記憶状態管理部は、任意の時刻に各物理記憶デバイスより状態・性能の評価値を収集する手段と、ストレージシステム内の複数の物理記憶デバイスをグループ分けし、グループごとに、グループに属する物理記憶デバイスの評価値の平均を計算し、計算された各グループの評価値の平均の分散を計算し、計算された平均の分散と1グループあたりの物理記憶デバイスの個数を乗算する手段と、乗算結果が予め既定したしきい値以上の場合に、異常な状態が発生していると判定して、警告を出力する手段とを有するように構成した。
また、上記課題を解決するために本発明では、製造途中の製品の状態管理方法において、 予め、製品の検査位置を、検査位置の近接関係、または基準位置からの距離に基づいて、1通り以上の組合せを定義した組合せ定義テーブルを作成して記憶し、所定の検査工程において製品の検査を実施し、検査結果データを前記組合せ定義テーブルに従ってグループ分けして、グループごとに、グループに属する検査位置の検査結果データの平均を計算し、 計算された各グループの検査結果データの平均の分散を計算して、計算された平均の分散と1グループあたりの検査位置数を乗算して指標を計算し、該指標が予め既定したしきい値以上の場合に、異常な状態が発生していると判定して、警告を出力するようにした。
本発明を組み込んだストレージシステムは、複数の物理記憶デバイスがほぼ同時に故障するような大規模な故障を回避できる。また、ストレージシステムに限らず、様々な製品の製造途中、すなわち半製品に対する品質管理にも活用できる。
ストレージシステムの概要の一例を示す図である。 大規模なストレージシステムの一例を示す図である。 ストレージシステムの状態を管理するフローチャートの一例を示す図である。 物理記憶デバイスの性能を評価するフローチャートの一例を示す図である。 物理記憶デバイスを評価する順番を表すテーブルの一例を示す図である。 物理記憶デバイスの性能評価結果の一例を示す図である。 システマティック指標を計算するフローチャートの一例を示す図である。 システマティック指標の着眼点を説明する図である。 組合せ定義テーブルの一例を示す図である。 物理記憶デバイスの組合せの例を示す図である。 組合せグループ毎に平均を計算した結果の例を示す図である。 システマティック指標の計算結果の例を示す図である。 ウエハ製造工程の概要の一例を示す図である。 寸法検査での組合せ定義の例を示す図である。 システマティック指標を計算するフローチャートの一例を示す図である。 状態管理システムの概要の一例を示す図である。 シミュレーションで生成したデータの例を示す図である。 シミュレーション結果を表すヒストグラムの一例を示す図である。 誤差補正結果を表すヒストグラムの一例を示す図である。 誤差補正後のシステマティック指標の計算結果の例を示す図である。
図1は、本発明に係るストレージシステムのハードウェアの概要の一例を示す図である。ストレージシステムの基本構造は、一般的なコンピュータと同じである。ただし、二次記憶ユニットに、ハードディスクドライブやフラッシュメモリなどの物理記憶デバイスが多数組み込まれている。101はネットワークを介して他のコンピュータとデータの送受信を行う入出力ユニット、102は各ユニットの動作制御や様々な計算を担当する制御・演算ユニット、103は各種プログラムやデータを一時的に格納する一次記憶ユニット、104a,104bは、ハードディスクドライブやフラッシュメモリなどの物理記憶デバイスを多数配置した二次記憶ユニット、105は各ユニットのデータや制御信号を送受信するためのバスである。
制御・演算ユニット102は、外部よりストレージシステムへアクセスした際に二次記憶ユニットに配置した物理記憶デバイスの入出力を制御する二次記憶入出力制御部121と、本発明の二次記憶ユニットの各物理記憶デバイスの性能を評価して、二次記憶の状態を管理、監視する二次記憶状態管理部122とを有する。
一次記憶ユニット103は、各種制御プログラムを格納する制御プログラム記憶部131と、二次記憶ユニットに配置した全ての物理記憶デバイスの性能を評価する順番を記載した個別性能評価の順番テーブル132と、本発明のシステマティック指標を計算する際の物理記憶デバイスの組合せ方を定義したデータを格納する組合せ定義テーブル133と、二次記憶ユニットに配置した全ての物理記憶デバイスの性能を評価した結果を記憶する個別性能評価値テーブル134とを有する。
ストレージシステム100では、二次記憶ユニットとして104aと104bの2台の筐体を有し、1台の筐体に32個、計64個の物理記憶デバイスがマトリクス状に配置されている例を示している。ストレージシステム100では、各物理記憶デバイスを(筐体番号、X座標、Y座標)の記述で一意に特定できるデバイス識別記号を有する。二次記憶ユニット104aは、筐体番号1、二次記憶ユニット104bは、筐体番号2と定義している。例えば、(1,3,4)は、筐体番号1内の左から3列目、上から4行目の物理記憶デバイスを意味する。ところで、本発明は筐体2台、各筐体に物理記憶デバイス32個などの制限は一切ないが、以降の説明をわかりやすくするため、上述のストレージシステム100の例で統一して説明する。
図2は、大規模なストレージシステムの概要の一例を示す図である。一般的なコンピュータ200、複数台のストレージシステム100がネットワーク210を介して接続されている。本発明に係るストレージシステムは、図1に示した単体のストレージシステムでもよいし、このように他のコンピュータ、他のストレージシステムとネットワークを介して接続された大規模なシステムでもよい。このシステムの場合には、コンピュータ200の演算ユニットに複数台のストレージシステム100の二次記憶ユニットの状態を管理する前記二次記憶状態管理部122を備え、コンピュータ200の記憶ユニットに、前記個別性能評価の順番テーブル132と、前記組合せ定義テーブル133と、前記個別性能評価値テーブル134とを備える構成が考えられる。
図3は、ストレージシステムの状態を管理する二次記憶状態管理部122が実行するフローチャートの一例を示す図である。まず個別性能評価ステップS1001では、各物理記憶デバイスの性能を評価する。物理記憶デバイスの性能とは、具体的には、読み取りエラー率、すなわち媒体からデータ信号を読み取るときに発生するエラーの割合や、物理記憶デバイスのスループット能力や、スピンアップ時間、すなわち物理記憶デバイス内のスピンドルモータに通電を開始してからモータが規定の回転数に達するまでにかかる時間や、物理記憶デバイス内のモータの回転数や、媒体上で使用不能となった領域に対して、代替処置を施した不良セクタ数や、シークエラー率、すなわち物理記憶デバイス内の薄膜磁気ヘッドが目的のデータがあるトラックへ移動しようとして失敗した割合や、薄膜磁気ヘッドがシーク作業に要した時間や、スピン・リトライ数、すなわち媒体を既定の速度までスピンアップしようと試みた回数や、ロード・アンロード・サイクル、すなわち物理記憶デバイスのロード・アンロード機構によって薄膜磁気ヘッドが媒体表面から退避場所に退避し、その後、再び媒体表面に戻った回数や、物理記憶デバイス内の温度や、ECC訂正ビット数や、書き込みエラー率や、サーマルアスペクト比、すなわち薄膜磁気ヘッドが媒体の突起に衝突して熱を生じてデータ検出を誤る現象によるエラー率や、媒体に対する薄膜磁気ヘッドの浮上高や、モータのスピンアップに使用した高電流量や、データの書き込み中に加わった振動や、データの読み込み中に加わった振動や、データ書き込み中に加わった衝撃や、媒体が衝撃で位置ずれした距離や、Gセンス・エラー率、すなわち物理記憶デバイスに加えられた衝撃によって発生するエラー率や、薄膜磁気ヘッドのアクチュエータの負荷や、薄膜磁気ヘッドのロードまたはアンロードの失敗回数や、媒体を回転させるためのトルク増幅量や、薄膜磁気ヘッドの緊急退避回数や、薄膜磁気ヘッドの動作中における振動の振幅や、薄膜磁気ヘッドが位置決めをする時間などである。
次に、システマティック指標計算ステップS1002では、S1001で評価した各物理記憶デバイスの評価値を、ストレージシステム内の複数の物理記憶デバイスの位置関係に基づいて組み合わせて、平均の分散と組合せサイズを乗算してシステマティック指標を計算する。ストレージシステム内の状態に異常がなければ、複数の物理記憶デバイスの評価値は、それぞれ独立なはずである。すなわち、ストレージシステム内の状態に異常がなければ、ストレージシステム内のある物理記憶デバイスの読み取りエラー率が悪化したとしても、他の物理記憶デバイスの読み取りエラー率が連動して悪化することはない。また、ある物理記憶デバイスのスループット能力が低下したとしても、他の物理記憶デバイスのスループット能力が連動して低下することはない。他の評価値においても同様である。
一方、例えば、二次記憶ユニット104aの冷却ファンの性能が劣化して、筐体内の温度分布に偏りが生じた場合には、温度の影響で、ある物理記憶デバイスの読み取りエラー率が悪化するとともに、その物理記憶デバイスに近接した位置にある他の物理記憶デバイスも同様に読み取りエラー率が悪化する現象が現れる。
また、二次記憶ユニット104bの筐体を置いた場所の安定性が悪く、その筐体が振動している場合には、振動の影響で、同じ筐体内の複数の物理記憶デバイスのロード・アンロード・サイクルやシークエラー率が悪化するといった現象が生じる。また、二次記憶ユニット104aの電源系が不安定な場合には、同じ筐体内のある物理記憶デバイスのスピンアップ時間が不安定になるとともに、その物理記憶デバイスと同じ電源を使っている他の物理記憶デバイスも同じようにスピンアップ時間が不安定になるといった現象が生じる。
システマティック指標とは、上述のように、ストレージシステム内の状態に異常がなければ、それぞれ独立なはずの評価値が、ストレージシステム内の状態に異常が発生したために、複数の物理記憶デバイスの評価値が連動する現象を定量化した値である。
次に、条件分岐ステップS1003では、ステップS1002で計算したシステマティック指標と予め設定したしきい値を比較し、指標がしきい値を超えていたら、異常な状態と判定して、ステップS1004に進み、異常な状態であることを通知する。一方、指標がしきい値未満であれば、異常な状態ではないと判定して、特に通知することもなく、状態管理処理を終了する。このフローチャートに基づいて、状態管理処理を数時間に1回実行することで、大規模故障が生じる前に、ストレージシステム内の状態の異変を管理できる。
図4は、物理記憶デバイスの性能を評価する処理、すなわちステップS1001の個別性能評価の詳細なフローチャートの一例を示す図である。まずステップS1101では、性能を評価する物理記憶デバイスの評価の順番を個別性能評価の順番テーブル132から読み込む。次に、ステップS1102では、変数TSTを0に初期化する。変数TSTは、性能評価の順番へのポインタを表す。ステップS1103では、変数TSTをインクリメントする。ステップS1104では、変数TSTと物理記憶デバイスの個数とを比較して条件分岐する。変数TSTがデバイス数を超えていたら、すべての物理記憶デバイスの性能評価が完了したと判断して、個別性能評価の処理を終了する。一方、変数TSTがデバイス数以下なら、ステップ1105へ進む。ステップ1105からステップS1111では、評価する項目をそれぞれ計測して、個別性能評価値テーブル134に記録する。評価する項目は、例えば上述のように多岐にわたるが、評価に必要な性能項目だけを計測、記録する。その一例として、ステップS1105では、物理記憶デバイス内の温度を計測して記録する。ステップS1106では、読み取りエラー率を計測して記録する。ステップS1107では、Gセンス・エラー率、すなわち物理記憶デバイスに加えられた衝撃によって発生するエラー率を計測して記録する。ステップS1108では、媒体に対する薄膜磁気ヘッドの浮上高を計測して記録する。ステップS1109では、書き込みエラー率を計測して記録する。ステップS1110では、シークエラー率、すなわち物理記憶デバイス内の薄膜磁気ヘッドが目的のデータがあるトラックへ移動しようとして失敗した割合を計測して記録する。ステップS1111では、スピンアップ時間、すなわち物理記憶デバイス内のスピンドルモータに通電を開始してからモータが規定の回転数に達するまでにかかる時間を計測して記録する。具体的には、各物理記憶デバイスに対して、制御・演算ユニット102の二次記憶状態管理部122から物理記憶デバイスのメーカが指定したコマンドを、バス105を介して送信すれば、各物理記憶デバイスが計測して、結果を二次記憶状態管理部122が受信して、個別性能評価値テーブル134に記録する。
図5は、ステップS1101で読み込む性能評価を実施するストレージシステム内の各物理記憶デバイスの順番を表すテーブル132の一例を示す図である。二次記憶ユニット104aや104bの中に、マトリクス状に配置した物理記憶デバイスに対して、このテーブルで指定した順番に性能を評価する。性能評価は、ストレージシステム100が稼動中に実施されることが前提であり、各物理記憶デバイスの空き状況に応じて順番が決められることになり、デバイス識別記号順に行なわれることは一般には無い。外部より、順番データを入力して、個別性能評価の順番テーブル132に記録しておくことが考えられる。またこの順番は、ストレージシステム100の稼働状況や論理的な制御プログラムに基づいて変更してよい。
図6は、物理記憶デバイスの性能評価結果を格納する個別性能評価値テーブル134の一例を示す図である。各物理記憶デバイスに対して1行の評価結果があり、各列に評価項目がある。例えば、物理記憶デバイス(1,1,5)のGセンス・エラー率の評価値は、2231であることがわかる。この結果は、2011年7月14日13時頃に、ステップ1001を実行した結果である。物理記憶デバイス毎、評価項目毎に、性能評価の完了時刻は異なる。しかし、ステップ1001を1回実行する度に、このような性能評価結果を作成する。
図7は、システマティック指標を計算する処理、すなわちステップS1002の詳細なフローチャートの一例を示す図である。ステップS1201では、図6に示した個別の物理記憶デバイスの性能評価結果を読み込む。次に、ステップS1202では、システマティック指標を計算するための物理記憶デバイスをグループ分けする定義情報を格納する組合せ定義テーブル133(説明を後述する)を読み込む。ステップS1203では、変数COMBを0に初期化する。変数COMBは、物理記憶デバイスをグループ分けする定義情報の種類を表わす組合せ定義項目(説明を後述する)へのポインタを表す。
ステップS1204では、変数COMBをインクリメントする。ステップS1205では、変数COMBと組合せ定義項目の個数を比較し、条件分岐する。変数COMBが組合せ定義項目の個数を超えたら、ステップS1210に進む。一方、変数COMBが組合せ定義項目の個数以下ならば、ステップS1206へ進む。
ステップS1206では、組合せ定義項目の定義によりグループ分けされた組合せグループ毎に性能評価値の平均を計算し、ステップS1207では、ステップS1206で計算した組合せグループ毎の性能評価値の平均の分散を計算する。ステップS1208では、ステップS1207で計算した平均の分散と組合せサイズを乗算し、結果をシステマティック指標の値とする。組合せサイズとは、組合せ定義項目の定義により1グループに組み合わせた物理記憶デバイスの個数である。
ステップS1209では、組合せ定義項目ごとのシステマティック指標を出力する。一方、ステップS1210では、組合せ定義項目ごとに計算されたシステマティック指標の最大値を計算し、ステップS1211では、ステップS1210で計算された最大値を出力する。
図8は、図7で示したシステマティック指標を計算する処理の着眼点を示す図である。統計学では、次の基本的な公式がある。母分散がσ2である母集団からサンプリングされた独立な標本X,X,・・・,Xについて、
Figure 2013109744
の分散は、
Figure 2013109744
が成り立つ。すなわち、サンプリングされたn個の独立な標本の平均の分散は、母分散をnで除算した結果に等しくなる。
上式は独立な標本であることが不可欠である。ストレージシステム内のそれぞれの物理記憶デバイスが独立な状態とは、ある物理記憶デバイスが近い将来、故障する可能性が高かったとしても、その近くに位置する他の物理記憶デバイスには何ら影響しない状態をいう。そのため、複数の物理記憶デバイスがそれぞれ独立ならば、黒丸の打点621,622,623,624のように、種々の組合せ定義項目の組合せグループに属する物理記憶デバイスの性能評価値の平均の分散と組合せサイズを乗算した値は、誤差があるもののほぼ等しい値になる。一方、独立ではない状態、すなわち、ある物理記憶デバイスが近い将来、故障する可能性が高くなったとき、その近くに位置する他の物理記憶デバイスも故障する可能性が高くなった場合、数2の式は成り立たなくなる。三角の打点631,632,633,634が独立ではない状態で、平均の分散と組合せサイズを乗算した値である。この場合、独立ではない度合いに依存して、平均の分散と組合せサイズを乗算した値が最大となる組合せサイズが変化する。そこで、本発明では、ステップS1209で組合せ定義項目毎にシステマティック指標、すなわち平均の分散と組合せサイズを乗算した値、すなわち数3を計算し、次に、ステップS1210で、計算された複数のシステマティック指標の中で最大値を代表的な指標とする。また、数3の式の平方根を計算して、システマティック指標としてもよい。
Figure 2013109744
図9は、ステップS1202で読み込む組合せ定義テーブル133の一例を示す図である。組合せ定義テーブル133は、予め作成されて、一次記憶ユニット103に格納される。組合せ定義テーブルの各行には、第1列の欄のデバイス識別記号で特定される各物理記憶デバイスが所属する各組合せ定義項目におけるグループ番号が記述されている。第2列以降の各列は組合せ定義項目である。各列、すなわち各組合せ定義項目において、同じグループ番号が記述された物理記憶デバイスは、同じ組合せ、すなわち同じグループと定義される。例えば、組合せ定義項目“COMB4”では、物理記憶デバイス(1,1,1),(1,1,2),(1,2,1),(1,2,2)がそれぞれグループ番号1に属する。組合せ定義項目“COMB4”の組合せサイズは、4個の物理記憶デバイスで1グループを構成しているため、4である。
図10は、図9に示した組合せ定義テーブルの各列が表わす組合せ定義項目でグループ分けされる物理記憶デバイスの組合せをわかりやすく図示した例である。組合せ定義項目“COMB1”は、1個の物理記憶デバイスを1個の組合せとしているため、二次記憶ユニット104aや104bに示したとおりであり、ここでは省略した。404aは、組合せ定義項目“COMB4”に基づいて、二次記憶ユニット104a内の複数の物理記憶デバイスの組合せを図示した一例である。404aから、(1,1,1),(1,2,1),(1,1,2),(1,2,2)の4個の物理記憶デバイスが一つのグループに属し、(1,3,1),(1,4,1),(1,3,2),(1,4,2)の4個の物理記憶デバイスが一つのグループに属し、(1,1,3),(1,2,3),(1,1,4),(1,2,4)の4個の物理記憶デバイスが一つのグループに属し、(1,3,3),(1,4,3),(1,3,4),(1,4,4)の4個の物理記憶デバイスが一つのグループに属し、(1,1,5),(1,2,5),(1,1,6),(1,2,6)の4個の物理記憶デバイスが一つのグループに属し、(1,3,5),(1,4,5),(1,3,6),(1,4,6)の4個の物理記憶デバイスが一つのグループに属し、(1,1,7),(1,2,7),(1,1,8),(1,2,8)の4個の物理記憶デバイスが一つのグループに属し、(1,3,7),(1,4,7),(1,3,8),(1,4,8)の4個の物理記憶デバイスが一つのグループに属していることがわかる。404bは、組合せ定義項目“COMB4”に基づいて、二次記憶ユニット104b内の複数の物理記憶デバイスの組合せを図示した一例である。404bから、(2,1,1),(2,2,1),(2,1,2),(2,2,2)の4個の物理記憶デバイスが一つのグループに属し、(2,3,1),(2,4,1),(2,3,2),(2,4,2)の4個の物理記憶デバイスが一つのグループに属し、(2,1,3),(2,2,3),(2,1,4),(2,2,4)の4個の物理記憶デバイスが一つのグループに属し、(2,3,3),(2,4,3),(2,3,4),(2,4,4)の4個の物理記憶デバイスが一つのグループに属し、(2,1,5),(2,2,5),(2,1,6),(2,2,6)の4個の物理記憶デバイスが一つのグループに属し、(2,3,5),(2,4,5),(2,3,6),(2,4,6)の4個の物理記憶デバイスが一つのグループに属し、(2,1,7),(2,2,7),(2,1,8),(2,2,8)の4個の物理記憶デバイスが一つのグループに属し、(2,3,7),(2,4,7),(2,3,8),(2,4,8)の4個の物理記憶デバイスが一つのグループに属していることがわかる。408aは、組合せ定義項目“COMB8A”に基づいて、二次記憶ユニット104a内の複数の物理記憶デバイスの組合せを図示した一例である。408aから、(1,1,1),(1,2,1),(1,3,1),(1,4,1),(1,1,2),(1,2,2),(1,3,2),(1,4,2)の8個の物理記憶デバイスが一つのグループに属し、(1,1,3),(1,2,3),(1,3,3),(1,4,3),(1,1,4),(1,2,4),(1,3,4),(1,4,4)の8個の物理記憶デバイスが一つのグループに属し、(1,1,5),(1,2,5),(1,3,5),(1,4,5),(1,1,6),(1,2,6),(1,3,6),(1,4,6)の8個の物理記憶デバイスが一つのグループに属し、(1,1,7),(1,2,7),(1,3,7),(1,4,7),(1,1,8),(1,2,8),(1,3,8),(1,4,8)の8個の物理記憶デバイスが一つのグループに属していることがわかる。組合せ定義項目“COMB8A”に基づいた二次記憶ユニット104b内の複数の物理記憶デバイスの組合せは、省略する。408bは、組合せ定義項目“COMB8B”に基づいて、二次記憶ユニット104a内の複数の物理記憶デバイスの組合せを図示した一例である。408bから、(1,1,1),(1,2,1),(1,1,2)(1,2,2),(1,1,3),(1,2,3),(1,1,4),(1,2,4)の8個の物理記憶デバイスが一つのグループに属し、(1,3,1),(1,4,1),(1,3,2),(1,4,2),(1,3,3),(1,4,3),(1,3,4),(1,4,4)の8個の物理記憶デバイスが一つのグループに属し、(1,1,5),(1,2,5),(1,1,6),(1,2,6),(1,1,7),(1,2,7),(1,1,8),(1,2,8)の8個の物理記憶デバイスが一つのグループに属し、(1,3,5),(1,4,5),(1,3,6),(1,4,6),(1,3,7),(1,4,7),(1,3,8),(1,4,8)の8個の物理記憶デバイスが一つのグループに属していることがわかる。432は,組合せ定義項目“COMB32”に基づいて、二次記憶ユニット104a内の複数の物理記憶デバイスの組合せを図示した一例である。組合せ定義項目“COMB32”では、二次記憶ユニット104a内の32個の物理記憶デバイスで1グループを構成している。
図11は、ステップS1206で組合せグループ毎に平均を計算した結果の例を示す図である。501は、図6に示した性能評価結果のうち、二次記憶ユニット104aの各物理記憶デバイスの「温度」を抽出して、マッピングした結果である。504は組合せ定義項目“COMB4”、508aは組合せ定義項目“COMB8A”、508bは組合せ定義項目“COMB8B”に基づいてグループごとの平均を計算した結果である。
図12は、システマティック指標の計算結果の例を示す図である。501は、図6に示した性能評価結果のうち、二次記憶ユニット104aの各物理記憶デバイスの「温度」を抽出してマッピングした結果である。これらは、2011年7月14日13時頃にステップS1001を実行して得た性能評価結果である。601は、同じ二次記憶ユニット104aの各物理記憶デバイスに対して、501を得る2時間前の11時頃にステップS1001を実行して得た性能評価結果のうち、「温度」を抽出してマッピングした結果である。
ストレージシステムの正常時の温度分布は、平均が40.0度、標準偏差が4.0度程度である。それと比べて、601および501のストレージシステム内の温度分布は、双方とも平均40.0度で同一である。また、601の分散は14.6、501の分散は15.1でほとんど大差がない。501の温度分布の中で最高温度は、46.1度であり、最大でも2シグマを超えない正常範囲と見なせる (一般には、3シグマ以内は正常範囲と見なされている。) 。
ところが、610は、601および501に対して、図9の組合せ定義テーブルに基づいて、システマティック指標を計算した結果である。この結果、2011年7月14日13時頃にステップS1001を実行して得た温度に対して、組合せ定義項目“COMB8A”で、極めて大きなシステマティック指標が計算されることがわかる。例えば、過去の性能評価結果からしきい値を30と設定しておくと、2011年7月14日13時頃の物理記憶デバイスの温度に対するシステマティック指標は、30を超えるため、ステップ1004が実行され、ストレージシステム内の状態に異変があったことが通知される。
この異変と判定された状態は、501の温度分布の上で、右上隅の一群の物理記憶デバイスの温度分布が上昇していることが認められる。この原因として、例えば、空冷ファンの故障などが考えられ、このまま放置すれば、温度が上昇した物理記憶デバイスが故障してしまうことを予測できる。本発明は、個々の物理記憶デバイスの性能値をモニターすることにより、個別の物理記憶デバイスの性能値は規格値には入っているのだけれど、物理記憶デバイスの不良を引き起こす影響を及ぼす要因が存在することを見出す手法、システムとして有効である。
有効に検出を望む複数の異常要因を予め想定して、個別に、物理記憶デバイスのいずれの性能値を評価対象とするか、組合せ定義のいずれの組合せ定義項目を採用するかを適宜決めて、評価を実施すればよい。
実施例1では、ステップS1201で、ストレージシステム内の多数の物理記憶デバイスの性能を評価し、性能評価結果の複数の物理記憶デバイス間の関連性から、ストレージシステム内の状態の異変を検知する例について説明した。
実施例2では、上述の状態管理方法を、様々な製品の最終工程ないしは製造途中における品質管理に応用した一例を説明する。以下、半導体ウエハの製造途中に行われる寸法検査への適用例について説明するが、本発明は半導体ウエハの寸法検査に限られるものではなく、任意の群に対して複数の位置で検査するようなものであれば、製品や検査項目は問わない。
図13は、ウエハ製造工程の概要の一例を示す図である。811の円は、半導体チップを形成する前のウエハを表し、812の円は、半導体チップを形成したウエハを表す。821の白抜きの長方形は、成膜工程、露光工程、エッチング工程、洗浄工程などの製造工程を表す。822の黒塗りの長方形は、回路パターンが設計仕様書どおりに形成できているかどうかを確認する寸法検査を表す。また、823の横縞の長方形は、ウエハ面内に形成された半導体チップの電気的な良否を判定する電気特性試験を表す。半導体チップは、製造ラインにウエハ811を投入後、数百に及ぶ製造工程821、および途中に数回行われる寸法検査822を経て、最後に電気特性試験823を行って形成される。
図14は、寸法検査での組合せ定義の例を示す図である。801の円はウエハを表す。802はウエハの方向を決める基準として、ノッチと呼ばれる。寸法検査822は、ウエハ面内の予め既定した位置に対して、電子顕微鏡を用いて回路パターンの幅が測定される。803の黒打点は、ウエハ面内での回路パターン寸法の測定位置を表す。この例ではウエハ面内の9点で寸法を測定している。804は、これら9点を測定位置間の距離に応じて3点ずつ3グループに分けた組合せ定義の一例である。また、805は、これら9点をウエハの中心からの距離に応じて3点ずつ3グループに分けた組合せ定義の一例である。
図15は、システマティック指標を計算するフローチャートの一例を示す図である。同図は、実施例1における図7と、ほとんど同じである。相違点は、ステップS1301とS1302である。ステップS1201では、ストレージシステムの物理記憶デバイスの性能評価結果を読み込んだが、ステップS1301では、検査結果を検査結果データベース902や検査装置901などから読み込む。ステップS1202では、ストレージシステム内の物理記憶デバイスの組合せ定義テーブルを読み込んだが、ステップS1302では、測定位置の組合せ定義テーブルを読み込む。
図16は、状態管理システムの一例を示す図である。電子顕微鏡などの検査装置901で計測された寸法データは、ウエハID、測定位置とともにネットワーク907を介して、検査結果データベース902に格納される。状態管理用コンピュータ903は、検査結果データベース902からウエハIDを検索キーとして、測定位置と計測された寸法データを収集し、上述のシステマティック指標計算処理に従って、システマティック指標を計算する。また、計算されたシステマティック指標が予め既定したしきい値以上であれば、ユーザコンピュータ904や無線ルータ905を経由して、ユーザの携帯端末906へ回路パターン寸法の異常を通知する。
実施例1および実施例2では、平均の分散を計算するときの誤差を考慮せずに、システマティック指標を計算する例を説明した。
実施例3では、平均の分散を計算するときの誤差を厳密に考慮して補正を行う場合の例をシミュレーション結果を交えて説明する。分散の誤差は、非特許文献1の259ページに記述されているように、分散を計算するための元のデータの個数を自由度とするカイ二乗分布に従う。カイ二乗分布とは、確率分布の一種である。データx,x,・・・,xが、標準正規分布に従うとき、数4が従う分布を自由度nのカイ二乗分布という。
(数4)
Z=x +x +・・・+x
図17は、ストレージシステムの筐体内の温度を安定時に測定した結果601と同等のデータを、シミュレーションで生成した例である。マトリクス6001と6002は、平均40、標準偏差4の正規分布を仮定して、ランダムなデータを生成した結果である。本シミュレーションでは、同じ条件でこのようなマトリクスを1万種類生成した。マトリクス7001と7002は、それぞれマトリクス6001と6002に対して、組合せ定義項目“COMB4”に基づいて平均を計算した結果である。生成した1万種類のマトリクスに対して同じように平均を計算した。
図18は、図17で示した1万種類のマトリクスに対して、数3の式でそれぞれシステマティック指標を計算し、その結果をヒストグラムで表した結果である。6100は、組合せ定義項目“COMB1”に基づいたシステマティック指標、すなわち6001や6002などのマトリクス内の32個のデータから計算した分散を横軸に表したヒストグラムである。7100は、組合せ定義項目“COMB4”に基づいたシステマティック指標、すなわち7001や7002などのマトリクス内の8個のデータから計算した分散に、4を乗算して算出した値を横軸に表したヒストグラムである。ヒストグラム6100とヒストグラム7100を比較すると、7100の方が横に広がっている様子がわかる。これは32個のデータから計算した分散より、8個のデータから計算した分散は、誤差が大きいことを意味する。この分布は、データの個数を自由度とするカイ二乗分布に従っている。ヒストグラムの中に描いた縦の破線(2本ずつ)は、ヒストグラムの面積が左側から0.135%の位置と99.865%の位置を示している。これらは、一般的に3シグマ管理と呼ばれるように、システマティック指標の内側99.73%を「正常」と判断する場合の境界線(管理限界線)である。これらの破線の位置は数5でも算出できる。
Figure 2013109744
ここで、σ2は母分散、すなわち定常的な状態での分散の平均と考えてよい。大文字のNは、マトリクス6001や6002の中のデータの個数、すなわち本例ではN=32である。小文字のnは組合せ定義に基づいて計算する平均、すなわち組合せ定義項目“COMB1”ではn=1、組合せ定義項目“COMB4”ではn=4である。qchisq()は、(N/n−1)を自由度とするカイ二乗分布における累積分布関数の変位値である。また、変数Pには、0.99865や0.00135などを代入する。このように、数3の式でシステマティック指標を計算した場合、組合せ定義項目“COMB1”より組合せ定義項目“COMB4”は分散を計算するときの誤差が大きいため、多めに「異常」と判定されやすい。
図19は、図18のような現象を回避したい場合に用いるシステマティック指標で正規化を行って計算したヒストグラムの結果である。図18では数3の式を用いたが、その代わりに図19では、数6の式でシステマティック指標を計算した。
Figure 2013109744
Figure 2013109744
ここで、Pには1より小さいが1に近い値、たとえば、0.99865を代入する。また、Pには0以上、すなわち0を含めて0より大きいが0に近い値、たとえば、0.00135を代入する。数7の誤差係数cを用いて、数6を計算することによって、分散を計算するときの誤差が考慮される。そのため、組合せ定義項目“COMB1”と組合せ定義項目“COMB4”で「異常」と判定する確率が同等になる。qchisq()は、例えば、オープンソースの統計解析ソフトウェアRであれば、関数qchisq()として組み込まれている。また、同様な統計解析ソフトウェアがないコンピュータの環境においては、統計解析に関する書籍の付録などに記載された数表を引用して計算できる。
しかしながら、システマティック指標を計算するときに、本来、未知の母分散σ2を代入することに難しい場合もある。その場合は、近似的なシステマティック指標として、組合せ定義項目“COMB1”での分散V、すなわち組合せサイズn=1のときの分散を、母分散の代わりに代入した数8の式を使ってもよい。
Figure 2013109744
図20は、数6の式でシステマティック指標を計算した結果の一例である。図12の表610は、マトリクス601および501に対して、数3の式でシステマティック指標を計算した結果であった。図20の表611は、マトリクス601および501に対して、数5の式でシステマティック指標を計算した結果である。ここで、Pには0.99865、Pには0.000135、母分散σ2には16を代入した。また表612は、マトリクス601および501に対して、数8の式でシステマティック指標を計算した結果である。表611や表612では、表610に比べて、2011年7月14日の11時頃に測定された評価値に対するシステマティック指標は、誤差が考慮されたため、標準偏差4の2乗、すなわち母分散16に近い値となった。また、2011年7月14日の13時頃に測定された評価値に対するシステマティック指標は、表611や表612では、表610より誤差が考慮されて、小さめの値となった。
上記の例では、誤差を考慮して、正規化を行ったシステマティック指標を算出したが、システマティック指標自体には、補正を行わずに「異常」を判断に使用されるしきい値を、誤差に合わせて変更することも可能である。例えば、数5により、システマティック指標の内側99.73%を含むような境界線を算出し、これに基づき上記のしきい値を設定する。誤差補正を行わないシステマティック指標が新たに設定されたしきい値を超える場合(例えば、図18の7100において、しきい値を境界線である53.9に設定し、システマティック指標が53.9を超える場合)に、「異常」があったとして通知するようにしてもよい。
なお、実施例1及び2においても本発明の効果は達成可能であるが、組み合わせサイズが大きく、数3の分散を計算するためのグループごとの平均の数が、例えば、10以下のように少なくなる組み合わせが存在する場合には、誤差を考慮する実施例3を適用することは特に有効である。
100…ストレージシステム、 101…入出力ユニット、 102…制御・演算ユニット、 103…一次記憶ユニット、 104a,104b…二次記憶ユニット、 105…バス、 121…二次記憶入出力制御部、 122…二次記憶状態管理部、 131…制御プログラム記憶部、 132…個別性能評価の順番テーブル、 133…組合せ定義テーブル、 134…個別性能評価値テーブル、 200…コンピュータ、 210…ネットワーク、 404a,404b,408a,408b,432…組合せ定義、 501,601…物理記憶デバイス毎の評価値、 504,508a,508b…平均の計算結果、 621,622,623,624…独立な状態でのシステマティック指標計算結果の打点、 631,632,633,634…独立ではない状態でのシステマティック指標計算結果の打点、 610…システマティック指標の計算結果、 801…ウエハ、 802…ノッチ、 803…測定点、 804…近接条件による組合せ定義、 805…半径による組合せ定義、 811…投入ウエハ、 812…完成ウエハ、 813…チップ、 821…製造プロセス、 822…寸法検査、 823…電気特性試験、 901…検査装置、 902…検査結果データベース、 903…状態管理用コンピュータ、 904…ユーザコンピュータ、 905…無線ルータ、 906…ユーザ携帯端末、 907…ネットワーク、 S1001…個別性能評価ステップ、 S1002…システマティック指標計算ステップ、 S1003…異常判定ステップ、 S1004…通知ステップ、 S1101…評価順番の読み込みステップ、 S1102…変数TSTの初期化ステップ、 S1103…変数TSTのインクリメント・ステップ、 S1104…分岐ステップ、 S1105…Temperatureの計測ステップ、 S1106…Read Error Rateの計測ステップ、 S1107…G-Sense Error Rateの計測ステップ、 S1108…Flying Heightの計測ステップ、 S1109…Write Error Rateの計測ステップ、 S1110…Seek Error Rateの計測ステップ、 S1111…性能評価結果の出力ステップ、 S1201…個別性能評価結果の読み込みステップ、 S1202…デバイス配置に対する組合せ定義テーブルの読み込みステップ、 S1203…変数COMBの初期化ステップ、 S1204…変数COMBのインクリメント・ステップ、 S1205…分岐ステップ、 S1206…平均の計算ステップ、 S1207…平均の分散の計算ステップ、 S1208…平均の分散と組合せサイズの乗算ステップ、 S1209…システマティック指標の出力ステップ、 S1210…システマティック指標の最大値の計算ステップ、 S1211…システマティック指標の最大値の出力ステップ、 S1301…検査結果の読み込みステップ、 S1302…測定点に対する組合せ定義テーブルの読み込みステップ、 6001,6002…シミュレーションで生成した値、 7001,7002…平均の計算結果、 6100,7100…数3の式でシステマティック指標計算結果のヒストグラム、 6101,7101…数6の式でシステマティック指標計算結果のヒストグラム、 611…数5の式でのシステマティック指標計算結果、 612…数6の式でのシステマティック指標計算結果

Claims (14)

  1. 制御・演算ユニットと、入出力ユニットと、一次記憶ユニットと、および複数の物理記憶デバイスより構成される二次記憶ユニットとを備えるストレージシステムにおいて、
    前記制御・演算ユニットの二次記憶状態管理部は、
    任意の時刻に各物理記憶デバイスより状態・性能の評価値を収集する手段と、
    ストレージシステム内の複数の物理記憶デバイスをグループ分けし、グループごとに、グループに属する物理記憶デバイスの評価値の平均を計算し、計算された各グループの評価値の平均の分散を計算し、計算された平均の分散と1グループあたりの物理記憶デバイスの個数を乗算する手段と、
    乗算結果が予め既定したしきい値以上の場合に、異常な状態が発生していると判定して、警告を出力する手段と
    を有することを特徴とするストレージシステム。
  2. 請求項1記載のストレージシステムにおいて、
    前記物理記憶デバイスのグループ分けは、物理記憶デバイス間の近接関係に基づいて1通り以上の組合せを定義したテーブルを前記一次記憶ユニットに記憶して、前記二次記憶状態管理部が該テーブルを参照して、各組合せ毎に複数の物理記憶デバイスをグループ分けすることを特徴とするストレージシステム。
  3. 請求項1記載のストレージシステムにおいて、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、その最大値を予め既定したしきい値と比較することを特徴とするストレージシステム。
  4. 制御・演算ユニットと、入出力ユニットと、一次記憶ユニットと、および複数の物理記憶デバイスより構成される二次記憶ユニットとを備えるストレージシステムの稼働状態の管理方法であって、
    前記制御・演算ユニットの二次記憶状態管理部は、
    任意の時刻に各物理記憶デバイスより状態・性能の評価値を収集するステップと、
    ストレージシステム内の複数の物理記憶デバイスをグループ分けし、グループごとにグループに属する物理記憶デバイスの評価値の平均を計算し、計算された各グループの評価値の平均の分散を計算し、計算された平均の分散と1グループあたりの物理記憶デバイスの個数を乗算して指標を計算するステップと、
    該指標が予め既定したしきい値以上の場合に、異常な状態が発生していると判定して、警告を出力するステップと
    を有することを特徴とするストレージシステムの稼働状態管理方法。
  5. 請求項4記載のストレージシステムの稼働状態管理方法において、
    前記物理記憶デバイスのグループ分けは、物理記憶デバイス間の近接関係に基づいて1通り以上の組合せを定義したテーブルを前記一次記憶ユニットに記憶して、前記二次記憶状態管理部が該テーブルを参照して、各組合せ毎に複数の物理記憶デバイスをグループ分けすることを特徴とするストレージシステムの稼働状態管理方法。
  6. 請求項4記載のストレージシステムの稼働状態管理方法において、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、その最大値を予め既定したしきい値と比較することを特徴とするストレージシステムの稼働状態管理方法。
  7. 製造途中の製品の状態管理方法であって、
    予め、製品の検査位置を、検査位置の近接関係、または基準位置からの距離に基づいて、1通り以上の組合せを定義した組合せ定義テーブルを作成して記憶し、
    所定の検査工程において製品の検査を実施し、
    検査結果データを前記組合せ定義テーブルに従ってグループ分けして、グループごとに、グループに属する検査位置の検査結果データの平均を計算し、
    計算された各グループの検査結果データの平均の分散を計算して、計算された平均の分散と1グループあたりの検査位置数を乗算して指標を計算し、
    該指標が予め既定したしきい値以上の場合に、異常な状態が発生していると判定して、警告を出力することを特徴とする製品の状態管理方法。
  8. 請求項7記載の製品の状態管理方法において、
    前記乗算結果が複数個あるとき、その最大値を予め既定したしきい値と比較することを特徴とする製品の状態管理方法。
  9. 請求項1記載のストレージシステムにおいて、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、前記1グループあたりの物理記憶デバイスの個数に応じた誤差係数を求めて、前記乗算結果を補正し、補正された値の最大値を予め既定したしきい値と比較することを特徴とするストレージシステム。
  10. 請求項1記載のストレージシステムにおいて、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、前記1グループあたりの物理記憶デバイスの個数に応じて、前記しきい値を変更することを特徴とするストレージシステム。
  11. 請求項4記載のストレージシステムの稼働状態管理方法において、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、前記1グループあたりの物理記憶デバイスの個数に応じた誤差係数を求めて、前記乗算結果を補正し、補正された値の最大値を予め既定したしきい値と比較することを特徴とするストレージシステムの稼働状態管理方法。
  12. 請求項4記載のストレージシステムの稼動状態管理方法において、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、前記1グループあたりの物理記憶デバイスの個数に応じて、前記しきい値を変更することを特徴とするストレージシステムの稼働状態管理方法。
  13. 請求項7記載の製品の状態管理方法において、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、前記1グループあたりの検査位置数の個数に応じた誤差係数を求めて、前記乗算結果を補正し、補正された値の最大値を予め既定したしきい値と比較することを特徴とする製品の状態管理方法。
  14. 請求項7記載の製品の状態管理方法において、
    前記二次記憶状態管理部は、
    前記乗算結果が複数個あるとき、前記1グループあたりの物理記憶デバイスの個数に応じて、前記しきい値を変更することを特徴とする製品の状態管理方法。
JP2012001779A 2011-10-25 2012-01-10 ストレージシステムおよび製品の状態管理方法 Pending JP2013109744A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012001779A JP2013109744A (ja) 2011-10-25 2012-01-10 ストレージシステムおよび製品の状態管理方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011234300 2011-10-25
JP2011234300 2011-10-25
JP2012001779A JP2013109744A (ja) 2011-10-25 2012-01-10 ストレージシステムおよび製品の状態管理方法

Publications (1)

Publication Number Publication Date
JP2013109744A true JP2013109744A (ja) 2013-06-06

Family

ID=48706393

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012001779A Pending JP2013109744A (ja) 2011-10-25 2012-01-10 ストレージシステムおよび製品の状態管理方法

Country Status (1)

Country Link
JP (1) JP2013109744A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015103270A (ja) * 2013-11-28 2015-06-04 株式会社東芝 電子機器、方法及びプログラム
KR20230122412A (ko) * 2022-02-14 2023-08-22 백석대학교산학협력단 경사하강법을 이용한 플래시 메모리 기반 저장 장치의 수명 예측 방법 및 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015103270A (ja) * 2013-11-28 2015-06-04 株式会社東芝 電子機器、方法及びプログラム
KR20230122412A (ko) * 2022-02-14 2023-08-22 백석대학교산학협력단 경사하강법을 이용한 플래시 메모리 기반 저장 장치의 수명 예측 방법 및 시스템
KR102689776B1 (ko) 2022-02-14 2024-07-29 백석대학교산학협력단 경사하강법을 이용한 플래시 메모리 기반 저장 장치의 수명 예측 방법 및 시스템

Similar Documents

Publication Publication Date Title
KR101211042B1 (ko) 고장 정보 저장장치 및 저장방법
US20130318418A1 (en) Adaptive error correction for phase change memory
US10749758B2 (en) Cognitive data center management
AU2010232843A1 (en) Method for computing cooling redundancy at the rack level
CN111104293A (zh) 用于支持盘故障预测的方法、设备和计算机程序产品
US11676671B1 (en) Amplification-based read disturb information determination system
CN106959912B (zh) 磁盘检测方法及装置
US11762448B1 (en) Method for troubleshooting abnormal sensor in energy-storage apparatus, terminal device, and storage medium
CN112199258A (zh) 一种磁盘监控的方法、装置、电子设备及介质
US9658922B2 (en) Computer-readable recording medium having stored therein program for write inspection, information processing device, and method for write inspection
JP2013109744A (ja) ストレージシステムおよび製品の状態管理方法
Djurasevic et al. Anomaly detection model for predicting hard disk drive failures
CN114860487A (zh) 一种内存故障识别方法及一种内存故障隔离方法
CN116775436A (zh) 芯片故障预测方法、装置、计算机设备和存储介质
JP5408975B2 (ja) 検査位置決定方法、検査情報管理システム及び検査支援方法
US20120005426A1 (en) Storage device, controller of storage device, and control method of storage device
US9275663B2 (en) Heater to keep reader head in stable temperature range
US11929135B2 (en) Read disturb information determination system
US10127950B1 (en) Data storage device with moving ambient temperature sensor
Amer et al. Reliability challenges for storing exabytes
KR101001071B1 (ko) 메모리 비트 정정 보고 방법 및 장치
TWI661297B (zh) 監控系統及監控方法
US20240170011A1 (en) Data processor, magnetic recording/reproducing device, and magnetic recording/reproducing system
US11763898B2 (en) Value-voltage-distirubution-intersection-based read disturb information determination system
CN116153386B (zh) 半导体失效分析方法、存储介质与电子设备