JP2006004408A - ディスクアレイシステムにおけるデータ保護の方法 - Google Patents

ディスクアレイシステムにおけるデータ保護の方法 Download PDF

Info

Publication number
JP2006004408A
JP2006004408A JP2005136801A JP2005136801A JP2006004408A JP 2006004408 A JP2006004408 A JP 2006004408A JP 2005136801 A JP2005136801 A JP 2005136801A JP 2005136801 A JP2005136801 A JP 2005136801A JP 2006004408 A JP2006004408 A JP 2006004408A
Authority
JP
Japan
Prior art keywords
data
disk drives
stored
integrity
disk drive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005136801A
Other languages
English (en)
Inventor
Hiroaki Odawara
宏明 小田原
Yuichi Yagawa
雄一 矢川
Shoji Kodama
昇司 児玉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JP2006004408A publication Critical patent/JP2006004408A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1608Error detection by comparing the output signals of redundant hardware
    • G06F11/1612Error detection by comparing the output signals of redundant hardware where the redundant component is persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/104Metadata, i.e. metadata associated with RAID systems with parity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2211/00Indexing scheme relating to details of data-processing equipment not covered by groups G06F3/00 - G06F13/00
    • G06F2211/10Indexing scheme relating to G06F11/10
    • G06F2211/1002Indexing scheme relating to G06F11/1076
    • G06F2211/1088Scrubbing in RAID systems with parity

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Power Sources (AREA)
  • Storage Device Security (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Abstract

【課題】
急速に拡大するデータ量のため、たいていの企業では自社の情報技術システムにより慎重にデータを管理することが必要になっている。このため、低頻度にアクセスされるデータを、性能の低いすなわちより低価格なストレージシステムに移行する費用効率の高い方法で、データを管理する技術を求められている。
【解決手段】
本発明の技術を実施したシステムにおいて、アクセスを制御する状態でデータ検証記録を保存することがまた有効である。そのようなものとして、検証記録を様々な公知の技術を使用して暗号化、あるいは保護することができる。このようなアプローチは、システム監査においてアーカイブされたデータの完全性を実証することを保証するのに有用である。
【選択図】図1

Description

0001 本発明はストレージシステム全般に関わり、具体的にはストレージシステムの検証可能データを高信頼度に長期保存することに関する。
0002 世界中の大規模な組織は現在、大量の文書、映像、イメージ、音声情報を伴う数百万の処理に関わり、これらの情報は日々に分類され、保存され、アクセスされ、転送されている。これらの情報の量は急速な増大を続けている。これらの膨大な量のデータを管理する1つの技術は、ストレージシステムを使うことである。従来のストレージシステムは、これらの膨大な量のデータの記録、バックアップ、および再生を可能とする様々な制御方式の下で動作する多数のディスクドライブを含むことができる。この急速に拡大するデータ量のため、たいていの企業では自社の情報技術システムにより慎重にデータを管理することが必要になっている。
0003 最近、各種の政府機関から新しい規格が公表され、企業やその他の組織は所定の期間データを高信頼度に保存することが必要になった。例えば、Sarbanes−Oxley法、SEC規制などの規制により民間企業は数百テラバイトにも達しうるある種のビジネス情報を保存することが求められている。この結果、これらの組織体は、低頻度にアクセスされるデータを、性能の低いすなわちより低価格なストレージシステムに移行する費用効率の高い方法で、データを管理する技術を求めている。ハードディスクドライブの製造コストの継続的な低下とこの要因とが結びついて、アーカイバルストレージを提供する多くの磁気テープ、光ディスクライブラリ機能をディスクドライブが置き換える結果となった。ハードディスクドライブに記憶されるデータのビットあたりコストが低下し続けるため、これらのシステムがますますアーカイバルストレージに使用されるであろう。
0004 企業情報技術向けの伝統的な高性能ディスクベースのストレージシステムは通常高性能で高信頼度のハードディスクドライブを備えている。これらのシステムは、ともに公知の情報転送の標準プロトコルであるファイバチャネルあるいはSCSIなどの高速インタフェースを用いて、サーバあるいは他のコンピュータと接続されている。一方、パーソナルコンピュータあるいは低価格のサーバはしばしば低性能で信頼度の低いディスクドライブを、ATAあるいはIDEなどの従来型の低速インタフェースを使って使用している。これらのハードディスクドライブはその信頼度と性能の低さゆえに、低価格で大量生産が可能となっている。これらの低価格のディスクドライブをアーカイバルストレージ用のストレージシステム製品にしばしば使用することが可能である。その例として、EMC社のClarion及びCentra製品、Network Appliance社のNearStore、StorageTek社のBladeStoreがあげられる。
0005 アーカイバルストレージでは、アーカイブされたデータは極めてまれにしかアクセスされず、例えば年に数回程度の頻度である。結果として通常では性能は問題ではないが、信頼度は依然として最大の懸案事項である。通常の、情報を高信頼度に保持するという内部的な要求に加えて、これらのストレージシステムのデータは、失なわれたり、修正されてはならないという政府の規制がしばしば及んでいる。さらに、データへのアクセスが低頻度であるので、システム設計者は、ディスクドライブがアクセスされないときは電源を落として電力消費を削減するようにシステムを設計することが可能である。ところが、長期間にわたって、ハードディスクドライブの電源を落としておくと記録媒体と読み書きデバイスの腐食を起こす可能性がある。多くのこれらアーカイバルシステムでは、例えばオペレータの人手操作介入あるいはソフトウェアにより誤って引き起こされるデータの意図的な、あるいは偶然な変更は、確実な認証方式により阻止されている。最高のデータ信頼度を維持するために、ハードディスクドライブの1台に起こるデータ劣化あるいはセクター障害はいかなるものでも回復されなければならない。あるいは、少なくとも検出され報告されなければならない。
0006 従って、低信頼度のハードディスクドライブを高信頼度な方法で使用でき、その上データの改竄あるいは喪失が防止できるディスクアレイを使用するストレージシステムが求められている。
0007 典型的な本発明の実施例では、コントローラと一群の通常は低信頼度のハードディスクが備えられている。これらのディスクドライブに保存されたデータは信頼度を保証するため定期的に取り出され検証される。ストレージシステムに接続されたホストコンピュータからアクセスがない時、選択的にハードディスクドライブの電源を落とす機構が備えられえている。コントローラは、必要なとき及びデータ検証プロセスを実行するときに、何台かのディスクドライブの電源を定期的にオンにする。検証プロセスの結果は、アーカイブされたデータの完全性に対して保証を求める人は誰でも情報にアクセスできるように不揮発性で安全な場所に保存される。
0008 アーカイブされたデータは数多くの異なった技術を用いて検証することができる。1つの技術では、個々のディスクドライブの全てのデータが順番に読み出される。欠陥セクターが検出されるとセクター番号がコントローラに報告され、次にコントローラはデータ回復プロセスを実行する。データ回復プロセスとしては典型的なRAIDミラーリング、バックアップ、エラー訂正技術を使用することが出来る。これらの技術により、バックアップコピー、パリティビット、エラー訂正コードを読み出して、不良データを訂正することができる。これによりシステムコントローラは、ハードディスクドライブを読んでも通常は発見できない偶発的なあるいは自然発生的なビット単位の欠陥を発見することができる。
0009 あるいは、データ検証に長時間にわたる多数の読み出しシーケンスを採用することもできる。例えば、指定された検証期間の間、ハードディスクドライブのデータの所定の部分のみが読み出され検証される。この種の検証処理がその後ディスクドライブのすべての部分に繰り返され、これによりディスクドライブの全内容が検証される。新しい、しばしば数百ギガバイトの記憶容量を持つ大容量のハードディスクドライブの全データをパリティグループと結びつけてチェックするには長い時間(例10時間)を要するので、このプロセスはこの種のディスクドライブに対して特に有用である。また、機構上の理由から、すなわち、ATA型のディスクドライブは頻繁に電源投入することが好ましいので、データ検証プロセスを分割するのが望ましい。
0010 本発明の技術は様々なアプローチにより実施することができる。1つの実施例では各ディスクドライブの内容に関する情報を維持する管理表が用意されている。管理表にはハードディスクドライブがオンであるかオフであるか、データ検証モードにあるかなどの情報を含むことができる。また、表にはドライブが最後にオンになった時期、オフを続けている期間を保存することも可能である。管理表はまた、データ検証プロセスが個々に行われたかを示し、分割して実施された場合には最後のセクターあるいはチェック済のディスクドライブの他のアドレスを示すデータを備えることができる。パリティグループと論理ユニット、ディスクドライブがオンになった時刻、あるいはデータ検証が始まってからの時間などの記録を保持しても良い。
0011 本発明を実施したシステムはデータ検証機能を備えることが望ましい。1つの実施例ではディスクアレイに接続するストレージコントローラにマイクロプロセッサが備えられている。マイクロプロセッサは、例えばミラーペアの各ドライブを比較処理することによりデータ検証を実行する。比較の成功、失敗はそのままマークされる。要望があればパリティチェックあるいはエラー訂正コード用の専用ハードウェアを備えても良い。データ検証処理用に、例えばこれら処理の設定あるいは手順を変更するなどの制御機能を持つこともまた望ましい。これらの設定変更はサービスプロセッサのコマンド、あるいは保守員が端末あるいはキーボードを用いて発行するコマンドにより実施することができる。言うまでもなく、ストレージシステムに接続するネットワークを通してコマンドを発行することも可能である。
0012 本発明の技術を実施したシステムにおいて、アクセスを制御する状態でデータ検証記録を保存することがまた有効である。そのようなものとして、検証記録を様々な公知の技術を使用して暗号化、あるいは保護することができる。このようなアプローチは、システム監査においてアーカイブされたデータの完全性を実証することを保証するのに有用である。
0013 本発明の他の実施例では、ストレージシステムが、全ディスクドライブが電源オンに保持される特殊な動作モードを有することが望ましい。アーカイブされたデータの監査が実施されるとき、検索をより迅速に実施することができる。
0014 各々が保存データを有する複数のディスクドライブを備えたストレージシステムの好適なる実施例において、保存データの完全性を検証するシステムは、ディスクドライブと関連付けられたデータエントリーを有し、ディスクドライブに保存されたデータが検証されたかを示す管理情報のストレージを有している。通常、検証処理自体は、ディスクアレイの動作を管理するストレージコントローラに配置されたプロセッサ、普通はマイクロプロセッサ、で実行される。
本発明の技術を実施したシステムにおいて、アクセスを制御する状態でデータ検証記録を保存することがまた有効である。そのようなものとして、検証記録を様々な公知の技術を使用して暗号化、あるいは保護することができる。このようなアプローチは、システム監査においてアーカイブされたデータの完全性を実証することを保証するのに有用である。
0025 図1は本発明の第一の実施例の典型的なシステム構成のブロック図である。図1は、ストレージコントローラ2を通してディスクユニット3と接続するホストコンピュータ1を含む、典型的なシステムの基本コンポーネントを示す。インタフェース110、117はホストコンピュータをストレージコントローラに接続し、他のインタフェース130、131、140、141はストレージコントローラをディスクユニットに接続する。ディスクユニットは図1に円筒形で示されるように多数のディスクドライブを有していることが望ましい。
0026 ストレージコントローラ2は共有メモリ4、サービスプロセッサ5、プロセッサ10乃至17を有している。プロセッサ10乃至17はマイクロプロセッサであることが望ましく、マイクロプロセッサ10乃至17が使用するプログラム及び/あるいはデータを保存するローカルメモリ20乃至27と接続している。いくつかの実施例では、ローカルメモリはマイクロプロセッサ回路と同じチップのROMとして実現できる。共有メモリ4は信号線120を介して全てのマイクロプロセッサに共有されている。(図をシンプルにするために図1ではコンポーネント間の接続は1本の線で表されている。しかし、実際には通常これらの1本の線はアドレス、データ、制御、その他の信号線に対する複数の信号線を有するバスとして実現されている。)
0027 共有メモリ4は以下に説明する管理表50を含んでいる。マイクロプロセッサ10乃至17はまた、好ましくはローカルエリアネットワーク121を用いて、システムの保守のための様々な動作を処理するサービスプロセッサ5と接続している。このサービスプロセッサは通常相互接続線123を介して、サービスプロセッサ5の動作を制御する管理ソフトウェア30を含む管理サーバ7と接続している。さらにコンソール6が回線122を介してプロセッサ5と接続しサービスプロセッサ(SVP)5上でマニュアル操作を可能にしている。
0028 ディスクユニット3は情報保存用の多くのユニットを含んでいる。これらはハードディスクドライブあるいは他の公知のストレージ装置であることが望ましい。ハードディスクドライブの場合、ドライブ60乃至67、70乃至77、80乃至87、90乃至97が全てバス130、131、140、141を介してマイクロプロセッサ10乃至17に相互接続されている。典型的な実施例ではディスクドライブはRAID1機能を提供するためペアを構成している。例えば、ドライブ80と90はミラーペアとなった2台のディスクドライブを提供する。図1に示すストレージシステムの異なる実施例では、ディスクドライブ、マイクロプロセッサ、特定のRAIDの数あるいは選択された他の冗長化技術を変えることができる。
0029 図1に示すシステムは2つの主な動作モードを有している。すなわち、“通常”モードと“フル稼働”モードである。個々の動作モードは管理表50(図2に示す如く)の欄で指定される。個々の実施例に応じて、選択されるモードはミラー化されたペアあるいは他の物理的/論理的構成、例えばRAID5パリティグループなど、に基づいている。通常動作モードでは、ミラーペアのハードディスクドライブはオフにされ、データ検証あるいは入出力(I/O)動作のときにオンにされる。この動作の形式の詳細については以下に説明する。フル稼働モードではミラーペアは常時動作しておりオフにされることはない。この動作モードの詳細についても以下に説明する。
0030 動作モードの設定と変更は異なった方法で実行することができる。1つの実行方法では、オペレータがコンソール6を使用してディスクドライブペアのIDと所望のモードを指定することにより、モード設定を設定あるいは変更する。他の実行方法では、管理ソフトウェア30がSVP5によってアプリケーションプログラムインタフェース(API)を使用して、モード設定を変更あるいは設定する。どちらの場合も、指定されたモード設定は、SVP5で処理され、その時に通常はマイクロプロセッサ10乃至17により更新される管理表50を有する適切なマイクロプロセッサ10乃至17に通知される。
0031 図2は図1に示す管理表50の典型的な実施例を示す図である。上記のように図1のディスクドライブの各ミラーペアは表にエントリーを有し、これらのエントリーは共通フォーマットを有している。例えば、ペア100のN番目のエントリー52は、通常は点線52の中に示す情報を有している。現在のモード欄53は対応するペアの現在の動作モードを特定する。“現在のモード”レジスターあるいは表のエントリーの好適なる実施例の典型的な内容が図2の下部に示されている。例えば、欄53の“0”は、このペアが通常動作モードにあり、省電力機能を実行していることを示す。同様に、同欄の“1”はミラーペアが通常動作モードにあるが、電源オフになっていることを示す。“2”は通常動作モードであるが、データチェックすなわち検証処理中であることを示し、“3”はフル稼働モードで省電力機能は実施されていないことを示す。“4”はエラー処理モードを示す。要求により、追加のデータを用いて、追加モードを指定することができることは言うまでもない。
0032 図2の管理表50の欄54はデータ検証すなわちチェックが起動される時刻を特定する。“現状休眠時間”欄55は対応するペアが電源オフされてからの経過時間を有している。(この欄は現在のモード欄53が“1”の時のみ有効である。)“データ検証オプション”欄56はデータ検証処理が実行されるかどうかを明らかにする。好ましくは、欄56の“0”はデータ検証が実行されないことを意味し、“1”は対応するディスクペアに対して間歇的なシーケンスでデータ検証が実行されることを意味する。“分割シーケンス”は所与の動作中にデータが検証されるディスクドライブの部分、例えばシリンダ、を示す。特定の検証単位は欄57に符号化されている。欄57で“0”は一つの論理シリンダを指定するときに使われ、“1”は8シリンダを指定するのに使われる。特定の単位は選択された個々の実施例によって決まる。
0033 “最終チェックアドレス”欄58は最後に実行された検証処理でチェックされたディスクペアの部分のアドレスを特定するために使われる。データ検証処理が実行されるたびにこの欄は更新される。“休止状態”欄59aはペアが休止中にその状態を特定する。言い換えれば、ペアが通常モードであるがI/O要求を処理中でないかどうかを示す。上記のように、この欄の個々の使用法は個々の実施例によって決まる。好適なる実施例の管理表50の最後の“電源オフの条件”欄59bは対応するペアの電源をオフにすると決定する条件を示す。この欄の使用法は個々の実施例によるが、通常は電源をオフにするまでの休止時間の最大長さである基準である。
0034 図3は図1に示したシステムの好適なる動作の方法を示すフローチャートである。本フローチャートはミラーペア100の通常モードでの動作を示す。電源オン後システムは初期設定され401、その時または少し後に現在のモード欄53はマイクロプロセッサ17によりステップ402で“0”に設定される。“休止状態”欄59もステップ403で示すようにリセットされる。システムは次にステップ404に移動し、そこでホストのI/O要求を待つ。その種の要求を受信すると、マイクロプロセッサ17がステップ407に示すようにディスクドライブペア100にて要求を処理する。処理が完了すると、システムの状態はステップ403へ戻る。
0035 I/O要求が来なければ、プロセッサ17はステップ405に示すように休止状態59aを更新し、ステップ406で現在の状態59aが条件59bに合致するかどうかをチェックする。もし電源オフ条件に合致しなければ、休止プロセスのステップ404、405、406が引き続き繰り返される。電源オフ条件59bに合致すれば、現在のモード欄53は“1”に設定され、現状休眠時間はリセットされる。次にステップ408に示すようにペアは電源オフされる。
0036 電源オフのディスクドライブペアへのI/O要求を発生するイベントを図3の下部に示す。このときホストコンピュータ1からペア100へのI/O要求はステップ409で受信され検出される。プロセッサ17は検出すると現在のモード欄を“0”に設定し、ペアの電源をオンにし、休止状態をリセットする。動作はステップ407に移行しI/O処理を完了させる。
0037 通常の場合、ホストからのI/O要求は受信されず、動作はステップ410へ移行する。このステップで、プロセッサ17は休眠時間が予め設定されたデータ検証期間に到達しているかをステップ410でチェックする。結果がノーであれば、プロセッサは休眠時間55を更新しステップ409、410のルーチンを繰り返す。一方、答えがイエスであれば、次にプロセッサは現在のモードを“2”に設定しデータ検証プロセス412を開始する。検証プロセスの詳細を以下に説明する。
0038 図4は図3のステップ412で実行される処理の詳細を示したフローチャートである。ステップ501に示すように、現在のモード欄53を“2”に設定した後、ペアは電源オンにされ、データ検証オプション欄56がステップ502で検出される。欄56が“0”であれば、なんの動作も起こされず、プロセスはステップ402から繰り返される(ステップ503に示すように)。ステップ502で検出したデータ検証オプション欄が“0”でなければ、欄57がフェッチされる。ステップ504、505に示すように、欄が“1”であれば、“検証単位”が読み出される。欄が“2”であれば、“最終チェックアドレス”欄がステップ505に示すようにリセットされる。制御は次にステップ506へ移動する。これらの各々の場合において、プロセッサ17は、ステップ506に示すように、プロセスが完了するまで、ドライブのペア100の各々からデータを読み出すことを繰り返し、互いに比較する。プロセスの完了は“検証単位”欄57及び“最終チェックアドレス”欄58によって決まる。ステップ507でエラーが検出されたら、プロセッサは“現在のモード”欄53を“4”に設定し、ステップ508でエラールーチンを開始する。
一方、エラーが検出されなければ、ステップ509でプロセッサは最終チェックアドレス欄58を更新し、結果をチェック記録51(図1参照)に保存する。検証記録を図5に示し、以下に説明する。ステップ510で全ユニットがチェック済であるかを判定する。済みであれば、最終チェックアドレス欄58がステップ511に示すようにリセットされ、プロセスは図3のステップ402へ戻る。全ユニットのチェックが終わっていなければ、プロセスの流れはステップ512へ進み、他のユニットのチェックが必要であるかが判定される。この判定にあたりデータ検証オプション欄がチェックされ、“1”が検出されれば、プロセスはステップ506から繰り返される。欄が“2”であれば、プロセスは図3のステップ402から始めて繰り返される。
0039 ブロック412に示すデータ検証プロセスの実行中に新しいI/O要求をホストコンピュータから受信した場合、このI/O要求の処理に優先度が与えられる。次いで、データ検証処理がプロセッサ17及び/またはミラーペア100がホストI/O処理に関わっていないときに実行される。
0040 図5は通常モードのミラーペアの典型的な動作の時間シーケンスを示す図である。図の中で動作が左から右に進んでいくことで時間が示されている。データ検証処理300が完了すると休止期間321を設けることができる。一定の時間の後に電源オフ条件が満足されると、休眠期間310が終了するまでミラーペアの電源はオフにされる。この期間が過ぎるとミラーペアは電源オンされ、次のユニットのデータ検証301が開始する。前と同様に、このプロセスが完了すると休止期間322を設けることができ、休眠311がそれに続く。
0041 例えば302で示すように、データ検証期間が終了する前にホストコンピュータからミラーペアへのI/O要求を受信すると、遅延を避けるためにミラーペアが電源オンされ、I/O要求が処理される。これが完了すると、次の休止期間322が開始し、不活動期間312が続く。前と同様に、不活動期間312中にI/O要求がなければ次のユニット303の処理が実行され、再び休止期間324と休眠期間313が続く。図の右側に示すように、データ検証処理中にI/O要求を受信すると、データ検証処理はバックグラウンドで実行される。この処理は、300、301、303の処理のようにデータ検証処理が前面で実行されるときに比べて長時間を要する。
0042 図6は最初に図1に示した記録51を説明する図である。通常、記録はサービスプロセッサ5に保存され、データ検証処理の結果が保存されている。ここに示した実施例では、記録51は対応するミラーペアの各々の検証結果に対応するエントリーを有している。個々のフォーマットは、言うまでもなく個々の実施例によって決まり、図6に示したものとは別のフォーマットを容易に採用することが可能である。図6に示す実施例は簡単な記録フォーマットで、全てのペアの結果が個々のペアのIDと関係なく時系列順にタイムスタンプとともに保存されている。このフォーマットではペアのIDと検証結果を関連付けておく必要がある。
0043 エントリー200などの典型的な例には、“タイムスタンプ”と“チェック状態”のデータペアが図示のように保存されている。記録が一杯になると、例えばレジスターにある一番古い記録エントリーを削除するなどの、任意の使用したいアルゴリズムを用いて、新しい情報を保存するためにエントリーを置き換えることができる。シリンダ、セクター、あるいはその他をベースの分割検証の実施例において、“チェック状態”欄は通常は結果に加えて“最終チェックアドレス”58を含むことになる。
0044 図7は図5と同様のタイミングダイアグラムである。図7ではフル稼働モードのシーケンスを説明している。前述のように、フル稼働モードは大量のアーカイブデータの高速検索が必要なときに最も役に立つ。フル稼働モードでは、かなりの時間を必要とし、ディスクの性能とアクセスタイムにかなりのインパクトがある電源オン/オフ動作を行わない。システムが規制に準拠して情報をアーカイブするために導入されたものである場合、フル稼働モードが役に立つ典型的な状況は保存された記録の監査時である。図7に示すように休眠期間がなくなっている。加えるに、図は典型的な大量のI/O処理を示している。図示された状況では、I/O処理330、332、334、336が休止期間331、333、335を間に挟んで処理されている。このモードではディスク検証処理は実行されていないことに注意を要する。
0045 図8はディスクアレイのデータ保護システムの他の実施例のブロック図である。本構成と図1に示した構成との基本的な違いは、ストレージコントローラ2aが回線118を介して他のストレージコントローラ2bに接続していることにある。(図1の実施例では、ストレージコントローラはストレージコントローラを介在させることなく直接ディスクユニットに接続している。)図1に比べて図8に示す構成の利点は、実現するのが困難であるか費用がかさむシステム機能をコントローラ2aに搭載し、コントローラ2bは機能の大半を有しないが実現するのに低価格である点にある。図8に示す実施例では、プロセッサ17aはプロセッサ17bに接続する物理デバイスから変換された論理デバイスを制御する。デバイス28は好ましくは他のマイクロプロセッサで、この構成から生ずる違いを解消するものである。図示の実施例では、ストレージコントローラ2bはディスクドライブの電源オンオフの機能を有し、管理表50bとSVP5bはその機能をサポートするのに必要なものとして備えられている。
0046 図8の構成に関してストレージコントローラ2b内のマイクロプロセッサ17bがディスクユニット3を直接制御する問題が発生する可能性がある。ストレージコントローラ2aからのI/O要求をコントローラ2bが受信すると、対応する論理デバイスがマッピングされたディスクドライブは電源オフ中であっても、電源オンされる。このように、ストレージコントローラ2aと2bの組み合わせは上記と同様に動作する。
0047 図9は図8に示した実施例の動作ステップを説明するフローチャートである。ストレージコントローラ2bの存在はストレージコントローラ2aがディスクドライブの電源オンオフの機能を持たなくて良いことを意味する。ストレージ3のこの種の管理はストレージコントローラ2bにより処理される。図9に示すようにシステムが601で初期化され、モードが“1”に設定された後、I/O要求を受信しているか判定するためにテストが行なわれる。受信していた場合、ステップ607に示すようにI/O要求が実行される。受信していなければ、休眠時間がデータ検証するのに十分な長さがあるか判定される。データ検証を実行するべきであると判定された場合、ステップ605が実行される。そうでなければ、ステップ606が実行される。制御は、ステップ605とステップ606に続いてフローチャートの前の部分に戻る。
0048 図10は図4に示したものと同様のフローチャートである。図10のフローチャートは図8に示す実施例のディスクユニット3で実行されるプロセスを説明するフローチャートである。図10に示すように、ステップ701の初期化に続いて、現在のモードがステップ702で“0”に設定される。次にステップ703で休止状態がリセットされ、ステップ704でI/O要求を受信しているか判定する。受信していたら、ステップ710でI/O要求を実行し完了する。受信していなければ、ステップ705で休止状態が更新され、当該ディスクドライブの電源をオフするかどうかをステップ706で決定する。電源オフしない場合、システムはステップ704へ戻り、ステップを繰り返す。一方、当該ディスクドライブの電源をオフにすると決定した場合は、ステップ707に示すように当該ドライブとそのミラーペアは電源オフされ、ステップ708でI/O要求を受信しているかが更にテストされる。I/O要求を受信していたら、ステップ709に示すように、ミラーペアの電源がオンにされ、休止状態がリセットされる。
0049 上記は本発明の好適なる実施例を説明したものである。発明の実施例に対して、以下の請求項で明らかにされる発明の範囲を外れることなく様々な変更を加えることができることは容易に理解されるところである。
図1は本発明の1つの実施例を実現した典型例を示すストレージシステムのブロック図である。 図2は図1と共に使用される管理表を示す。 図3は図1に示すシステムの動作の第一の部分を示すフローチャートである。 図4は図1に示すシステムの付随動作を示すフローチャートである。 図5はディスクドライブのペアの典型的動作の時間シーケンスを示す。 図6は典型的な検証記録を示す。 図7は他の動作モードの典型的な時間シーケンスを示す。 図8は本発明の他の実施例のシステム構成を示すブロック図である。 図9はストレージコントローラ内部の動作を示すフローチャートである。 図10はストレージコントローラ内部の付随動作を示す。
符号の説明
1 ホストコンピュータ
2 ストレージコントローラ
3 ディスクユニット
4 共有メモリ
5 チェック記録
6 コンソール
7 管理サーバ
10 マイクロプロセッサ
17 マイクロプロセッサ
30 管理ソフトウェア
50 管理表

Claims (19)

  1. 各々データを保存する複数のディスクドライブを有するストレージシステムにおいて、
    前記複数のディスクドライブと関連付けられ、該ディスクドライブに保存されたデータが検証済であるかどうかを示すデータエントリーを有する管理情報のストレージ
    を備えたことを特徴とする、保存データの完全性を検証するシステム。
  2. 前記管理情報のストレージに接続し、前記複数のディスクドライブのいくつかに選択的に接続可能で、該ディスクドライブに保存されたデータの検証処理を実行し、結果を該管理情報のストレージに保存するプロセッサをさらに備えたことを特徴とする請求項1に記載の保存データの完全性を検証するシステム。
  3. 前記プロセッサと接続し、前記検証プロセスの変更を可能にするコントローラをさらに備えていることを特徴とする請求項2に記載の保存データの完全性を検証するシステム。
  4. 前記管理情報のストレージが前記ディスクドライブの動作モードに関連するエントリーを内部に有するテーブルを備えていることを特徴とする請求項2に記載の保存データの完全性を検証するシステム。
  5. 前記動作モードが前記ディスクドライブの電源オン、オフ、あるいはデータ検証処理中を示す表示を備えていることを特徴とする請求項4に記載の保存データの完全性を検証するシステム。
  6. 前記モードが、前記ディスクドライブが最後に動作してからの時間を示す表示をさらに備えていることを特徴とする請求項5に記載の保存データの完全性を検証するシステム。
  7. 前記モードが前記ディスクドライブのデータがチェックされた程度を示す表示を備えていることを特徴とする請求項5に記載の保存データの完全性を検証するシステム。
  8. 前記管理情報のストレージが各ディスクドライブに対して実行された全てのデータ検証の記録を保持することを特徴とする請求項1に記載の保存データの完全性を検証するシステム。
  9. 前記管理情報のストレージがデータエントリーの改竄の危険性を減少するための保護手段をさらに有していることを特徴とする請求項8に記載の保存データの完全性を検証するシステム。
  10. 各々データを保存する複数のディスクドライブを有するストレージシステムにおいて、
    前記複数のディスクドライブと関連付けられ、該ディスクドライブに保存されたデータが検証済であるかどうかを示すデータエントリーを有する管理情報のストレージと、
    前記管理情報のストレージと接続し、前記複数のディスクドライブのいくつかと選択的に接続可能で、該ディスクドライブに保存されたデータの検証処理を実行し、結果を該管理情報のストレージに保存するプロセッサと、
    前記プロセッサに接続し、検証処理の変更を可能にするコントローラと、
    を備えたことを特徴とする、保存データの完全性を保証するシステム。
  11. 各々データを保存する複数のディスクドライブを有するストレージシステムにおいて、
    選択した時刻に前記保存されたデータの検証を実行するステップと、
    前記複数のディスクドライブと関連付けられ、該ディスクドライブに保存されたデータが検証されているかを示すデータエントリーを有する管理情報のストレージに、前記保存データの検証結果を保存するステップと、
    を備えることを特徴とする、保存されたデータの完全性を検証する方法。
  12. 検証処理を変更するステップをさらに含むことを特徴とする請求項11に記載の方法。
  13. 前記検証結果を保存するステップが、ディスクドライブの動作モードに関するエントリーを有する表に前記結果を保存するステップをさらに含むことを特徴とする請求項11に記載の方法。
  14. 前記モードが、前記ディスクドライブの電源オン、オフ、あるいはデータ検証処理中を示す表示を備えていることを特徴とする請求項13に記載の方法。
  15. 前記モードが、前記ディスクドライブが最後に動作してからの時間を示す表示をさらに備えていることを特徴とする請求項13に記載の方法。
  16. 前記モードが前記ディスクドライブのデータがチェックされた程度を示す表示を備えていることを特徴とする請求項13に記載の方法。
  17. 前記保存するステップが、各ディスクドライブに対して実行される全てのデータ検証の記録を保存するステップをさらに備えることを特徴とする請求項11に記載の方法。
  18. 各々データを保存する複数のディスクドライブを有するストレージシステムにおいて、
    前記保存されたデータの検証処理を実行するステップと、
    前記複数のディスクドライブに関連付けられ、該ディスクドライブに保存されたデータが検証されているかを示すデータエントリーを、管理情報のストレージに保存するステップと、
    を備えることを特徴とする、保存されたデータの完全性を検証する方法。
  19. 各々がデータを保存する複数のディスクドライブを備え、ホストコンピュータに接続するのに適合するストレージシステムにおいて、
    前記ディスクドライブの電源がオフされている通常動作モードと、
    ホストからアクセスされたディスクドライブは電源オンされ、ホストからアクセスされないディスクドライブはオフのままとされる入出力動作モードと、
    保存されたデータへの高速アクセスが可能となるように全ディスクドライブがオンとされる監査動作モードと、
    を備えることを特徴とする、ストレージシステムを動作させる方法。
JP2005136801A 2004-06-18 2005-05-10 ディスクアレイシステムにおけるデータ保護の方法 Pending JP2006004408A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/871,128 US20050283682A1 (en) 2004-06-18 2004-06-18 Method for data protection in disk array systems

Publications (1)

Publication Number Publication Date
JP2006004408A true JP2006004408A (ja) 2006-01-05

Family

ID=35481981

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005136801A Pending JP2006004408A (ja) 2004-06-18 2005-05-10 ディスクアレイシステムにおけるデータ保護の方法

Country Status (2)

Country Link
US (2) US20050283682A1 (ja)
JP (1) JP2006004408A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293442A (ja) * 2006-04-21 2007-11-08 Hitachi Ltd ストレージシステム及びその制御方法
JP2008171134A (ja) * 2007-01-10 2008-07-24 Nec Corp ストレージシステム、ストレージシステムの制御方法、ストレージ装置
JP2010198263A (ja) * 2009-02-25 2010-09-09 Fujitsu Ltd データ診断装置、データ診断方法及びデータ診断プログラム
US8762773B2 (en) 2010-03-30 2014-06-24 Fujitsu Limited Processing apparatus, data migration method, and computer-readable recording medium having data migration program recorded thereon

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7373559B2 (en) * 2003-09-11 2008-05-13 Copan Systems, Inc. Method and system for proactive drive replacement for high availability storage systems
JP2007213721A (ja) 2006-02-10 2007-08-23 Hitachi Ltd ストレージシステム及びその制御方法
JP4891811B2 (ja) * 2007-02-28 2012-03-07 東芝ストレージデバイス株式会社 制御装置および記憶装置
US8024518B1 (en) * 2007-03-02 2011-09-20 Netapp, Inc. Optimizing reads for verification of a mirrored file system
US20080235447A1 (en) * 2007-03-20 2008-09-25 Inventec Corporation Storage device
JP5521807B2 (ja) * 2010-06-16 2014-06-18 富士通株式会社 障害原因推定装置、障害原因推定プログラム及び障害原因推定方法
US9552160B2 (en) * 2011-06-27 2017-01-24 International Business Machines Corporation Preserving data availability and I/O performance when creating virtual raid volumes
SG11201507645XA (en) * 2013-03-21 2015-10-29 Storone Ltd Deploying data-path-related plugins

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2743606B2 (ja) * 1991-04-11 1998-04-22 三菱電機株式会社 アレイ型記録装置
JPH05181617A (ja) * 1991-12-26 1993-07-23 Hitachi Ltd ディスクサブシステムの高信頼化方式
JP2548480B2 (ja) * 1992-02-10 1996-10-30 富士通株式会社 アレイディスク装置のディスク装置診断方法
JPH05233162A (ja) * 1992-02-20 1993-09-10 Hitachi Ltd データ退避方式および保守機能を備えたデータ処理システム
US5572661A (en) * 1994-10-05 1996-11-05 Hewlett-Packard Company Methods and system for detecting data loss in a hierarchic data storage system
US5574855A (en) * 1995-05-15 1996-11-12 Emc Corporation Method and apparatus for testing raid systems
US5802600A (en) * 1996-11-12 1998-09-01 International Business Machines Corporation Method and apparatus for determining a desirable directory/data block ratio in a cache memory
US5889934A (en) * 1997-02-24 1999-03-30 Data General Corporation Data validation system for a group of data storage disks
US6195761B1 (en) * 1997-12-31 2001-02-27 Emc Corporation Method and apparatus for identifying and repairing mismatched data
US6434498B1 (en) * 1998-06-26 2002-08-13 Seagate Technology Llc Hard disc drive verification tester
JP4325817B2 (ja) * 1999-04-05 2009-09-02 株式会社日立製作所 ディスクアレイ装置
US6542962B2 (en) * 2001-03-21 2003-04-01 Hitachi, Ltd. Multiple processor data processing system with mirrored data for distributed access
US6968463B2 (en) * 2001-01-17 2005-11-22 Hewlett-Packard Development Company, L.P. System for controlling access to resources in a storage area network
US6718352B1 (en) * 2001-03-20 2004-04-06 Emc Corporation Methods and apparatus for managing a data set stored on a data storage device
US6854071B2 (en) * 2001-05-14 2005-02-08 International Business Machines Corporation Method and apparatus for providing write recovery of faulty data in a non-redundant raid system
JP2003280964A (ja) * 2002-03-22 2003-10-03 Hitachi Ltd スナップショット取得方法、ストレージシステム及びディスク装置
JP2005100259A (ja) * 2003-09-26 2005-04-14 Hitachi Ltd ドライブの2重障害を防止するアレイ型ディスク装置、プログラム、及び方法
JP4383148B2 (ja) * 2003-11-25 2009-12-16 株式会社日立製作所 処理オフロード機能モジュールを備えた磁気ディスクアレイ装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007293442A (ja) * 2006-04-21 2007-11-08 Hitachi Ltd ストレージシステム及びその制御方法
JP2008171134A (ja) * 2007-01-10 2008-07-24 Nec Corp ストレージシステム、ストレージシステムの制御方法、ストレージ装置
JP2010198263A (ja) * 2009-02-25 2010-09-09 Fujitsu Ltd データ診断装置、データ診断方法及びデータ診断プログラム
US8762773B2 (en) 2010-03-30 2014-06-24 Fujitsu Limited Processing apparatus, data migration method, and computer-readable recording medium having data migration program recorded thereon

Also Published As

Publication number Publication date
US7487400B2 (en) 2009-02-03
US20050283682A1 (en) 2005-12-22
US20060294438A1 (en) 2006-12-28

Similar Documents

Publication Publication Date Title
JP2006004408A (ja) ディスクアレイシステムにおけるデータ保護の方法
US8209595B2 (en) Storage sub-system and method for controlling the same
EP1999554B1 (en) Hard disk storage system
US7774643B2 (en) Method and apparatus for preventing permanent data loss due to single failure of a fault tolerant array
US7353406B2 (en) Disk array optimizing the drive operation time
US7644231B2 (en) Selective information caching on disk drive
US7558988B2 (en) Storage system and control method thereof
JP4832862B2 (ja) ディスクアレイシステム及びセキュリティ方法
US20070033356A1 (en) System for Enabling Secure and Automatic Data Backup and Instant Recovery
US20070162692A1 (en) Power controlled disk array system using log storage area
US20090119465A1 (en) Dynamic Loading of Virtual Volume Data in a Virtual Tape Server
US20090217067A1 (en) Systems and Methods for Reducing Power Consumption in a Redundant Storage Array
US20100064103A1 (en) Storage control device and raid group extension method
US20100115310A1 (en) Disk array apparatus
US10346051B2 (en) Storage media performance management
WO2010116419A1 (en) Storage apparatus and method for shredding storage medium
JP2006059347A (ja) ジャーナリングを使用した記憶システム
US7814361B2 (en) System and method for synchronizing redundant data in a storage array
US8539156B2 (en) Storage subsystem and its logical unit processing method
US20060277353A1 (en) Virtual tape library device, virtual tape library system, and method for writing data to a virtual tape
US20060245103A1 (en) Storage device system operating based on system information, and method for controlling thereof
JP2007048017A (ja) ストレージシステム及び記憶制御方法
US20090271648A1 (en) Information processing device, data writing method, and program for the same
US11080136B2 (en) Dropped write error detection
JP2007323377A (ja) 記録装置、管理データの書き込み方法および管理データの修復方法

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060425