JP2013186857A - ストレージ装置、データ復旧方法およびプログラム - Google Patents

ストレージ装置、データ復旧方法およびプログラム Download PDF

Info

Publication number
JP2013186857A
JP2013186857A JP2012054047A JP2012054047A JP2013186857A JP 2013186857 A JP2013186857 A JP 2013186857A JP 2012054047 A JP2012054047 A JP 2012054047A JP 2012054047 A JP2012054047 A JP 2012054047A JP 2013186857 A JP2013186857 A JP 2013186857A
Authority
JP
Japan
Prior art keywords
volume
hard disk
data
difference information
data stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012054047A
Other languages
English (en)
Other versions
JP5644795B2 (ja
Inventor
Masami Ikeda
正身 池田
Takao Sogo
孝雄 相合
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012054047A priority Critical patent/JP5644795B2/ja
Publication of JP2013186857A publication Critical patent/JP2013186857A/ja
Application granted granted Critical
Publication of JP5644795B2 publication Critical patent/JP5644795B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】冗長性を失った状態のストレージ装置において故障が生じた場合に、故障直前のデータに基づいて復旧できるようにする。
【解決手段】ストレージ装置は、第1および第2のボリュームを有するディスク部と、第1のボリュームに含まれるハードディスクに格納されたデータと第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す差分情報を保持する差分情報保持部と、差分情報を参照して第1のボリュームに含まれるハードディスクに格納されたデータを第2のボリュームに含まれるハードディスクに格納するとともに、差分情報を更新するボリュームコピー制御部と、第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、差分情報および第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するデータ修復制御部と、を備える。
【選択図】図1

Description

本発明は、ストレージ装置、データ復旧方法およびプログラムに関し、特に、データ復旧機能を備えたストレージ装置、ストレージ装置におけるデータ復旧方法、および、ストレージ装置の動作を制御するプログラムに関する。
ストレージ装置の冗長性を確保する技術として、RAID(Redundant Arrays of Inexpensive Disks, Redundant Arrays of Independent Disks)と呼ばれる技術が知られている。RAIDとは、複数台のハードディスクを組み合わせることで仮想的な1台のハードディスクとして運用することで、ストレージ装置の信頼性および可用性を向上させる技術をいう。RAIDは、その構成および機能に応じて、RAIDレベルと呼ばれる複数のレベルに分類されている。
例えば、RAIDレベルがRAID5であるストレージ装置では、データをディスクに記録する際、複数のディスクにデータを分散して書き込むとともに、書き込まれるデータのパリティも生成してディスクに書き込む。なお、パリティは、すべてのディスクに分散して書き込まれる。RAID5に基づくストレージ装置では、1台のディスクが故障しても、それ以外のディスクのデータとパリティ情報から、元のデータを生成して回復することができる。
なお、特許文献1には、ストレージ装置に冗長度がない状態で障害が発生した場合に、データを復旧する技術が記載されている。
特開2004−287955号公報
以下の分析は、本発明者によってなされたものである。
上述のストレージ装置においては、次のような問題がある。例えば、RAID5で構築されている論理ボリュームにおいて、1台のディスクが故障して縮退している状態(すなわち、冗長度がない状態)で、同一のRAIDを構成する別のディスクで読み出しエラー(メディアエラー等)が発生すると、その領域はデータが再生成できないため、データ損失となる。
データ損失となった領域は上位から読み出しができない状態となるため、バックアップデータからの復旧が必要となる。バックアップデータが存在しない場合には、そもそもデータの復旧ができず、業務に多大な影響が生じる。一方、バックアップデータが存在する場合においても、人手により複製ボリュームからデータを復旧する作業が必要となるため、業務が長時間停止するおそれがある。
一方、特許文献1に記載されたストレージ装置によると、ストレージ装置に冗長度がない状態で障害が発生した場合においても、ストレージ装置の構築時に初期フォーマット等によりディスクに設定された初期データについては回復することができる。しかしながら、ストレージ装置の運用を開始してから長期間が経過し、ストレージデータが保持するデータが初期データから大きく変動しているような場合には、初期データへの回復を行っても、業務を継続することは困難となるおそれがある。
そこで、故障により冗長性を失った状態のストレージ装置において、さらに故障が生じた場合に、故障直前のデータに基づいてストレージ装置を復旧できるようにすることが課題となる。本発明の目的は、かかる課題を解決するストレージ装置、データ復旧方法およびプログラムを提供することにある。
本発明の第1の視点に係るストレージ装置は、
1以上のハードディスクを含む第1のボリュームと、1以上のハードディスクを含む第2のボリュームとを有する第1のディスク部と、
前記第1のボリュームに含まれるハードディスクに格納されたデータと、前記第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す第1の差分情報を保持する第1の差分情報保持部と、
前記第1の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第2のボリュームに含まれるハードディスクに格納するとともに、前記第1の差分情報を更新するボリュームコピー制御部と、
前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するデータ修復制御部と、を備える。
本発明の第2の視点に係るデータ復旧方法は、
1以上のハードディスクを含む第1のボリュームと、1以上のハードディスクを含む第2のボリュームとを有する第1のディスク部と、前記第1のボリュームに含まれるハードディスクに格納されたデータと前記第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す第1の差分情報を保持する第1の差分情報保持部と、を備えたストレージ装置が、前記第1の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第2のボリュームに含まれるハードディスクに格納するとともに、前記第1の差分情報を更新する工程と、
前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する工程と、を含む。
本発明の第3の視点に係るプログラムは、
1以上のハードディスクを含む第1のボリュームと、1以上のハードディスクを含む第2のボリュームとを有する第1のディスク部と、前記第1のボリュームに含まれるハードディスクに格納されたデータと前記第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す第1の差分情報を保持する第1の差分情報保持部と、を備えたストレージ装置を制御するコンピュータに対して、
前記第1の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第2のボリュームに含まれるハードディスクに格納するとともに、前記第1の差分情報を更新する処理と、
前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する処理と、を実行させる。なお、プログラムは、非トランジエントなコンピュータ読み取り可能な記録媒体(non-transient computer-readable storage medium)に記録されたプログラム製品として提供することができる。
本発明に係るストレージ装置、データ復旧方法およびプログラムによると、故障により冗長性を失った状態のストレージ装置において、さらに故障が生じた場合に、故障直前のデータに基づいてストレージ装置を復旧することが可能となる。
第1の実施形態に係るストレージ装置の構成を一例として示すブロック図である。 第1の実施形態に係るストレージ装置の動作を一例として示すフロー図である。 第2の実施形態に係るストレージ装置(システム)の構成を一例として示すブロック図である。 関連技術のストレージ装置の動作を示すフロー図である。
はじめに、本発明の概要について説明する。なお、この概要に付記する図面参照符号は、専ら理解を助けるための例示であり、本発明を図示の態様に限定することを意図するものではない。
一実施形態に係るストレージ装置は、ビットマップ等で差分情報を管理して複製ボリュームを作成する機能を持つストレージ装置であって、業務ボリュームにおいて複数のディスクの故障等が発生して一部のデータが損失した際、複製ボリュームと業務ボリュームとの差分状態を確認し、差分がない(すなわち、データが一致している)領域であれば、複製ボリュームから当該データを読み出して業務ボリュームにコピーし、業務ボリュームを修復する。これにより、人手でのデータ復旧作業は不要となり、業務を停止することなくデータを修復することが可能となる。
以下では、図面を参照しつつさらに詳細に説明する。図1は、一実施形態に係るストレージ装置の構成を一例として示すブロック図である。図1を参照すると、ストレージ装置(20)は、1以上のハードディスクを含む第1のボリューム(業務ボリューム21)と、1以上のハードディスクを含む第2のボリューム(複製ボリューム22)とを有する第1のディスク部(23)と、第1のボリューム(21)に含まれるハードディスクに格納されたデータと、第2のボリューム(22)に含まれるハードディスクに格納されたデータの差分を表す第1の差分情報(差分ビットマップ17)を保持する第1の差分情報保持部(18)と、第1の差分情報(17)を参照して、第1のボリューム(21)に含まれるハードディスクに格納されたデータを、第2のボリューム(22)に含まれるハードディスクに格納するとともに、第1の差分情報(17)を更新するボリュームコピー制御部(15)と、第1のボリューム(21)に含まれるハードディスクに格納されたデータが損失した場合、第1の差分情報(17)および第2のボリューム(22)に含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するデータ修復制御部(19)と、を備える。
ここで、ボリュームコピー制御部(15)は、第1の差分情報(17)の参照、第1ボリューム(21)に含まれるハードディスクに格納されたデータの第2のボリューム(22)に含まれるハードディスクへの格納、および、第1の差分情報(17)の更新を定期的に行うようにしてもよい。
また、第1のボリューム(21)は複数のハードディスクを含み、複数のハードディスクのうちのいずれか1台が故障した場合、故障したハードディスク以外のハードディスクに格納されたデータに基づいて、故障したハードディスクに格納されたデータを修復するようにしてもよい。第1のボリューム(21)は、一例として、RAID5の冗長性を有していてもよい。
データ修復制御部(19)は、第1のボリューム(21)に含まれる複数のハードディスクのうちの故障したハードディスク以外のハードディスクからのデータ読み出しにおいてエラーが生じた場合、第1のボリューム(21)に含まれるハードディスクに格納されたデータが損失したものと判定するようにしてもよい。第1のボリューム(21)が例えばRAID5の冗長性を有している場合には、データ損失データ修復制御部(19)は、かかる判定方法に基づいてデータ損失の有無を判定することができる。
データ修復制御部(19)は、第2のボリューム(22)に含まれるハードディスクに格納されたデータを、第1のボリューム(21)に含まれる複数のハードディスクのうちの故障したハードディスクを代替する予備のハードディスク(ホットスペアディスク)に書き込むことで、損失したデータを修復してもよい。
かかるストレージ装置(20)によると、故障により冗長性を失った状態のストレージ装置において、さらに故障が生じた場合に、故障直前のデータに基づいてストレージ装置を復旧することが可能となる。なぜなら、第1のボリューム(21)に含まれるハードディスクのうちの1台が故障して冗長性が失われた状態において、第1のボリューム(21)に含まれる他のハードディスクがさらに故障した場合であっても、第2のボリューム(22)に格納されたデータを用いて、データの損失を防ぐことができるからである。また、第1のボリューム(21)に格納されたデータと第2のボリューム(22)に格納されたデータとの間に差分が存在する場合に、第1のボリューム(21)に格納されたデータを定期的に第2のボリューム(22)にコピーすることで、故障直前のデータへの回復が可能となる。
図3を参照すると、ストレージ装置(20、40)は、1以上のハードディスクを含む第3のボリューム(複製ボリューム42)を有する第2のディスク部(43)と、第1のボリューム(21)に含まれるハードディスクに格納されたデータと、第3のボリューム(42)に含まれるハードディスクに格納されたデータの差分を表す第2の差分情報(差分ビットマップ37)を保持する第2の差分情報保持部(38)と、をさらに備えていてもよい。また、ボリュームコピー制御部(15)は、第2の差分情報(37)を参照して、第1のボリューム(21)に含まれるハードディスクに格納されたデータを、第3のボリューム(42)に含まれるハードディスクに格納するとともに、第2の差分情報(37)を更新してもよい。さらに、データ修復制御部(19)は、第1のボリューム(21)に含まれるハードディスクに格納されたデータが損失した場合、第1の差分情報(差分ビットマップ17)および第2のボリューム(22)に含まれるハードディスクに格納されたデータ、または、第2の差分情報(37)および第3のボリューム(42)に含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復してもよい。なお、図3においては、ストレージシステムを、2台のストレージ装置(20、40)から構成したが、1台のストレージ装置によって構成してもよいし、3台以上のストレージ装置によって構成してもよい。
ここで、データ修復制御部(19)は、第1の差分情報(17)において差分が存在し、第2の差分情報(37)において差分が存在しない場合、第2の差分情報(37)および第3のボリューム(42)に含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するようにしてもよい。
また、データ修復制御部(19)は、第1の差分情報(17)および第2の差分情報(37)において差分が存在しない場合において、第2のボリューム(22)に含まれるハードディスクに格納されたデータが読み出せないときに、第2の差分情報(37)および第3のボリューム(42)に含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復してもよい。
図3の構成に基づくストレージ装置によると、図1の構成に基づくストレージ装置と比較して、さらに可用性を向上させることができる。
なお、本発明において、下記の形態が可能である。
[形態1]
上記第1の視点に係るストレージ装置のとおりである。
[形態2]
ボリュームコピー制御部は、前記第1の差分情報の参照、前記第1ボリュームに含まれるハードディスクに格納されたデータの前記第2のボリュームに含まれるハードディスクへの格納、および、前記第1の差分情報の更新を定期的に行うようにしてもよい。
[形態3]
前記第1のボリュームは複数のハードディスクを含み、前記複数のハードディスクのうちのいずれか1台が故障した場合、故障したハードディスク以外のハードディスクに格納されたデータに基づいて、故障したハードディスクに格納されたデータを修復するようにしてもよい。
[形態4]
前記データ修復制御部は、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスク以外のハードディスクからのデータ読み出しにおいてエラーが生じた場合、前記第1のボリュームに含まれるハードディスクに格納されたデータが損失したものと判定するようにしてもよい。
[形態5]
前記データ修復制御部は、前記第2のボリュームに含まれるハードディスクに格納されたデータを、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスクを代替する予備のハードディスクに書き込むことで、損失したデータを修復するようにしてもよい。
[形態6]
前記ストレージ装置は、1以上のハードディスクを含む第3のボリュームを有する第2のディスク部と、
前記第1のボリュームに含まれるハードディスクに格納されたデータと、前記第3のボリュームに含まれるハードディスクに格納されたデータの差分を表す第2の差分情報を保持する第2の差分情報保持部と、を備え、
前記ボリュームコピー制御部は、前記第2の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第3のボリュームに含まれるハードディスクに格納するとともに、前記第2の差分情報を更新し、
前記データ修復制御部は、前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータ、または、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するようにしてもよい。
[形態7]
前記データ修復制御部は、前記第1の差分情報において差分が存在し、前記第2の差分情報において差分が存在しない場合、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するようにしてもよい。
[形態8]
前記データ修復制御部は、前記第1の差分情報および前記第2の差分情報において差分が存在しない場合において、前記第2のボリュームに含まれるハードディスクに格納されたデータが読み出せないときに、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するようにしてもよい。
[形態9]
上記第2の視点に係るデータ復旧方法のとおりである。
[形態10]
前記ストレージ装置は、前記第1の差分情報の参照、前記第1ボリュームに含まれるハードディスクに格納されたデータの前記第2のボリュームに含まれるハードディスクへの格納、および、前記第1の差分情報の更新を定期的に行うようにしてもよい。
[形態11]
前記第1のボリュームは複数のハードディスクを含み、前記複数のハードディスクのうちのいずれか1台が故障した場合、故障したハードディスク以外のハードディスクに格納されたデータに基づいて、故障したハードディスクに格納されたデータを修復するようにしてもよい。
[形態12]
前記ストレージ装置は、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスク以外のハードディスクからのデータ読み出しにおいてエラーが生じた場合、前記第1のボリュームに含まれるハードディスクに格納されたデータが損失したものと判定するようにしてもよい。
[形態13]
前記ストレージ装置は、前記第2のボリュームに含まれるハードディスクに格納されたデータを、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスクを代替する予備のハードディスクに書き込むことで、損失したデータを修復するようにしてもよい。
[形態14]
前記ストレージ装置は、1以上のハードディスクを含む第3のボリュームを有する第2のディスク部と、
前記第1のボリュームに含まれるハードディスクに格納されたデータと、前記第3のボリュームに含まれるハードディスクに格納されたデータの差分を表す第2の差分情報を保持する第2の差分情報保持部と、を備え、
前記データ復旧方法は、前記ストレージ装置が、前記第2の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第3のボリュームに含まれるハードディスクに格納するとともに、前記第2の差分情報を更新する工程と、
前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータ、または、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する工程と、を含んでいてもよい。
[形態15]
前記ストレージ装置は、前記第1の差分情報において差分が存在し、前記第2の差分情報において差分が存在しない場合、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するようにしてもよい。
[形態16]
前記ストレージ装置は、前記第1の差分情報および前記第2の差分情報において差分が存在しない場合において、前記第2のボリュームに含まれるハードディスクに格納されたデータが読み出せないときに、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するようにしてもよい。
[形態17]
上記第3の視点に係るプログラムのとおりである。
[形態18]
前記プログラムは、前記第1の差分情報の参照、前記第1ボリュームに含まれるハードディスクに格納されたデータの前記第2のボリュームに含まれるハードディスクへの格納、および、前記第1の差分情報の更新を、前記コンピュータに定期的に実行させるようにしてもよい。
[形態19]
前記第1のボリュームは複数のハードディスクを含み、
前記プログラムは、前記複数のハードディスクのうちのいずれか1台が故障した場合、故障したハードディスク以外のハードディスクに格納されたデータに基づいて、故障したハードディスクに格納されたデータを修復する処理を前記コンピュータに実行させるようにしてもよい。
[形態20]
前記プログラムは、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスク以外のハードディスクからのデータ読み出しにおいてエラーが生じた場合、前記第1のボリュームに含まれるハードディスクに格納されたデータが損失したものと判定する処理を、前記コンピュータに実行させるようにしてもよい。
[形態21]
前記第2のボリュームに含まれるハードディスクに格納されたデータを、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスクを代替する予備のハードディスクに書き込むことで、損失したデータを修復するようにしてもよい。
[形態22]
前記ストレージ装置は、1以上のハードディスクを含む第3のボリュームを有する第2のディスク部と、
前記第1のボリュームに含まれるハードディスクに格納されたデータと、前記第3のボリュームに含まれるハードディスクに格納されたデータの差分を表す第2の差分情報を保持する第2の差分情報保持部と、を備え、
前記コンピュータは、前記第2の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第3のボリュームに含まれるハードディスクに格納するとともに、前記第2の差分情報を更新する処理と、
前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータ、または、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する処理と、を前記コンピュータに実行させるようにしてもよい。
[形態23]
前記プログラムは、前記第1の差分情報において差分が存在し、前記第2の差分情報において差分が存在しない場合、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する処理を、前記コンピュータに実行させるようにしてもよい。
[形態24]
前記プログラムは、前記第1の差分情報および前記第2の差分情報において差分が存在しない場合において、前記第2のボリュームに含まれるハードディスクに格納されたデータが読み出せないときに、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する処理を、前記コンピュータに実行させるようにしてもよい。
(実施形態1)
第1の実施形態に係るストレージ装置について、図面を参照して説明する。図1は、本実施形態に係るストレージ装置の構成を一例として示すブロック図である。図1を参照すると、ストレージ装置20は、ホストインタフェース制御部11、キャッシュメモリ12、RAID(Redundant Arrays of Inexpensive Disks, Redundant Arrays of Independent Disks)制御部13、ディスク制御部14、ボリュームコピー制御部15、差分情報保持部18、データ修復制御部19、および、ディスク部23を備える。また、差分情報保持部18はボリューム差分情報管理部16および差分ビットマップ17を備え、ディスク部23は業務ボリューム21および複製ボリューム22を備える。
ホストインタフェース制御部11は、ホストコンピュータ10からの書き込み要求を受けた場合には、ホストコンピュータ10から転送されたデータをキャッシュメモリ12に書き込む。また、ホストインタフェース制御部11は、ホストコンピュータ10からの読み出し要求を受けた場合、キャッシュメモリ12上にデータが存在するときには、ホストコンピュータ10にデータを転送する。一方、キャッシュメモリ12上にデータが存在しないときには、ホストインタフェース制御部11は、RAID制御部13に読み出し要求を指示し、読み出し完了の通知を受けると、キャッシュメモリ12上のデータをホストコンピュータ10に転送する。
RAID制御部13は、キャッシュメモリ12上のディスクに未書き込みのデータを、定期的にディスク部23に書き込む。また、RAID制御部13は、ホストインタフェース制御部11から読み出し要求を受けた場合には、ディスク制御部14を介してディスク部23からデータを読み出してキャッシュメモリ12上に格納し、ホストインタフェース制御部11に通知する。さらに、RAID制御部13は、ディスクが故障して使用できなくなった際、そのディスクをRAID構成から切り離して、ホットスペアディスク(予備ディスク)へのRAID再構成処理を実施する。
ボリュームコピー制御部15は、業務ボリューム21と複製ボリューム22間のデータコピー処理を行う。
差分情報保持部18は、業務ボリューム21と複製ボリューム22の間のデータの差分情報を、あるまとまった単位のデータを1ビットとする差分ビットマップ17として記憶し、ボリューム差分情報管理部16によって差分ビットマップ17を管理する。なお、差分ビットマップ17は、キャッシュメモリ12上で管理してもよい。
データ修復制御部19は、RAID制御部13からデータ再生成不能によるデータ損失の通知を受けると、ボリューム差分情報管理部16に差分情報を問い合わせ、データ修復が可能であれば、ボリュームコピー制御部15にデータコピーの指示を出す。
次に、本実施形態のストレージ装置20の動作について説明する。
はじめに、業務ボリューム21と複製ボリューム22の間のボリュームコピー動作について説明する。
まず、ストレージ装置20が、ホストコンピュータ10から書き込み要求を受けた際、業務ボリューム21と複製ボリューム22の間で常に同期する複製モード(「同期複製モード」という。)である場合について説明する。同期複製モードにおいては、ホストインタフェース制御部11が業務ボリューム21のデータをキャッシュメモリ12に書き込むと、ボリュームコピー制御部15は複製ボリュームに対しても同一のデータをキャッシュメモリ12上で書き込む。この場合には、業務ボリューム21と複製ボリューム22との間で差分が発生しないため、差分ビットマップ17には差分ビットをセットしない。
次に、ストレージ装置20が、ホストコンピュータ10からの書き込み要求を受けた際、業務ボリューム21と複製ボリューム22が非同期に複製されるモード(「非同期複製モード」という。)にある場合について説明する。非同期複製モードにおいては、ホストインタフェース制御部11が業務ボリューム21のデータをキャッシュメモリ12上に書き込むと、差分ビットマップ17の該当ビットをセットする。ボリュームコピー制御部15は、定期的にボリューム差分情報管理部16に問い合わせ、差分が発生したことを検出すると、非同期に複製ボリューム22へのコピー処理を実施し、コピー処理が正常に完了した場合には差分ビットマップ17の当該ビットをリセットする。
図4は、比較例として、関連技術のストレージ装置の動作を示すフロー図である。図4は、ストレージ装置においてハードディスクが故障して使用できなくなった際、故障したハードディスクをRAID構成から切り離し、ホットスペアディスクへのRAID再構成処理を実施する動作を示す。
図4を参照すると、RAIDの再構成処理が開始されると(ステップS101)、縮退ディスク(すなわち、故障したディスク)以外のディスクからデータが読み出される(ステップS102)。
縮退ディスク以外のディスクからのデータ読み出しで、読み出しエラーが発生しなければ(ステップS103のNo)、縮退ディスクのデータを他のディスクのデータから生成して(ステップS104)、生成したデータをホットスペアディスクに書き込む(ステップS105)。
一方、縮退ディスク以外のディスクからのデータ読み出しでエラーが発生した場合(ステップS103のYes)、データ再生成が不可能となるため、エラー箇所を読み出し不可の領域として登録する(ステップS109)。
次に、全アドレスの再構成処理が終了したかどうかを判定し(ステップS106)、終了した場合(ステップS106のYes)、RAIDの再構成処理を終了する(ステップS107)。
一方、全アドレスの再構成処理が終了していない場合(ステップS106のNo)、アドレス加算して(ステップS108)、ステップS102に戻り、次のアドレスのRAID再構成処理に進む。
図2は、本実施形態に係るストレージ装置20の動作を一例として示すフロー図である。図2は、ストレージ装置20においてディスクが故障して使用できなくなった際、そのディスクをRAID構成から切り離し、ホットスペアディスクへのRAID再構成処理を実施する動作を一例として示す。
RAIDの再構成処理が開始されると(ステップS1)、縮退ディスク(故障したディスク)以外のディスクからデータが読み出される(ステップS2)。
縮退ディスク以外のディスクからのデータ読み出しでエラーが発生した場合(ステップS3のYes)、RAID制御部13は、データ修復制御部19にデータ再生成不能によるデータ損失の通知を出す。データ修復制御部19は、この通知を受けると、ボリューム差分情報管理部16に差分情報を問い合わせ、エラー箇所の複製ボリューム22との差分情報を確認する(ステップS9)。
データ修復制御部19は、データに差分がない場合(ステップS10のYes)、ボリュームコピー制御部15に、当該領域の複製ボリューム22から業務ボリューム21へのキャッシュメモリ12上でのデータコピー処理を指示する(ステップS11)。データコピー処理が正常に完了すると、ボリュームコピー制御部15はデータ修復制御部19にコピー完了を通知し、データ修復制御部19はRAID制御部13に通知する。RAID制御部13は、コピーにより修復されたキャッシュメモリ12上のデータをホットスペアディスクに書き込む(ステップS12)。
一方、データに差分がある場合(ステップS10のNo)、データ再生成が不可能となるため、エラー箇所を読み出し不可の領域として登録する(ステップS13)。
次に、全アドレスの再構成処理が終了したかどうかを判定し(ステップS6)、終了した場合(ステップS6のYes)、RAIDの再構成処理を終了する(ステップS7)。
一方、全アドレスの再構成処理が終了していない場合(ステップS6のNo)、アドレスを加算して(ステップS8)、ステップS2に戻り、次のRAID再構成処理に進む。
以上のフローによると、RAID構成が冗長でない状態において、さらにディスクの読み出しエラーが発生した場合でも、データ損失することなく修復し、業務ボリューム21を用いて業務を継続することができる。
本実施形態のストレージ装置20によると、次の効果がもたらされる。すなわち、業務ボリューム21において、複数のディスク故障等によりデータ損失が発生した場合でも、速やかに人手に依ることなく自動的にデータを修復して業務を継続することができるため、可用性の高いストレージシステムを提供することができる。
(実施形態2)
第2の実施形態に係るストレージ装置について、図面を参照して説明する。図3は、本実施形態に係るストレージ装置の構成を一例として示すブロック図である。図3を参照すると、ストレージ装置20は、外部に設けられたストレージ装置40に接続されている。ストレージ装置20の構成は、第1の実施形態のストレージ装置(図1)の構成と同様であることから、図3においては、ストレージ装置20の構成を略記した。図3を参照すると、ストレージ装置20は、ディスク部23および差分情報保持部18を備える。また、ディスク部23は業務ボリューム21とその複製ボリューム22を有する。さらに、差分情報保持部18は、業務ボリューム21と複製ボリューム22の差分情報を、差分ビットマップ17として管理する。
一方、ストレージ装置40は、ストレージ装置20内の業務ボリューム21の複製データを持つ複製ボリューム42を有する。
ストレージ装置40は、ディスク部43および差分情報保持部38を備える。また、ディスク部43は、業務ボリューム21の複製ボリューム42を備える。さらに、差分情報保持部38は、業務ボリューム21と複製ボリューム42の差分情報を、差分ビットマップ37として管理する。
本実施形態では、ストレージ装置20の外部のストレージ装置40に設けられた複製ボリューム42から、業務ボリューム21のデータを修復する。
業務ボリューム21において複数のディスクの故障等が発生してデータ損失が発生した際に、データ修復制御部19は、まず、同一のストレージ装置20内の複製ボリューム22との差分があるかどうかを調べるために、差分ビットマップ17を参照する。当該領域の差分ビットがセットされている場合、業務ボリューム21のデータと複製ボリューム22のデータとの間に差分が存在するため、複数ボリューム22のデータを用いて業務ボリューム21のデータを修復することができない。
次に、データ修復制御部19は、ストレージ装置40内の複製ボリューム42との差分があるかどうかを調べるために、差分ビットマップ37を参照する。当該領域の差分ビットがセットされていない場合には、業務ボリューム21のデータと複製ボリューム42のデータとの間に差分がないため、複製ボリューム42のデータを用いて業務ボリューム21のデータを修復する。
なお、同一ストレージ装置20内の複製ボリューム22のデータと業務ボリューム21のデータとの差分がない場合においても、複製ボリューム22の当該領域のデータも読み出せない場合は、外部のストレージ装置40内の複製ボリューム42から業務ボリューム21のデータを修復するようにしてもよい。また、このとき、複製ボリューム22の当該領域のデータも、複製ボリューム42のデータに基づいて修復するようにしてもよい。
本実施形態のストレージ装置によると、複数の複製ボリュームおよび差分ビットマップを設けたことにより、第1の実施形態のストレージ装置よりもさらに可用性を向上させることができる。
なお、上記の特許文献等の先行技術文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示(請求の範囲を含む)の枠内において、さらにその基本的技術思想に基づいて、実施形態の変更・調整が可能である。また、本発明の請求の範囲の枠内において種々の開示要素(各請求項の各要素、各実施形態の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。
10 ホストコンピュータ
11 ホストインタフェース制御部
12 キャッシュメモリ
13 RAID制御部
14 ディスク制御部
15 ボリュームコピー制御部
16 ボリューム差分情報管理部
17、37 差分ビットマップ
18、38 差分情報保持部
19 データ修復制御部
20、40 ストレージ装置
21 業務ボリューム
22、42 複製ボリューム
23、43 ディスク部

Claims (10)

  1. 1以上のハードディスクを含む第1のボリュームと、1以上のハードディスクを含む第2のボリュームとを有する第1のディスク部と、
    前記第1のボリュームに含まれるハードディスクに格納されたデータと、前記第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す第1の差分情報を保持する第1の差分情報保持部と、
    前記第1の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第2のボリュームに含まれるハードディスクに格納するとともに、前記第1の差分情報を更新するボリュームコピー制御部と、
    前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復するデータ修復制御部と、を備えるストレージ装置。
  2. 前記ボリュームコピー制御部は、前記第1の差分情報の参照、前記第1ボリュームに含まれるハードディスクに格納されたデータの前記第2のボリュームに含まれるハードディスクへの格納、および、前記第1の差分情報の更新を定期的に行う、請求項1に記載のストレージ装置。
  3. 前記第1のボリュームは複数のハードディスクを含み、前記複数のハードディスクのうちのいずれか1台が故障した場合、故障したハードディスク以外のハードディスクに格納されたデータに基づいて、故障したハードディスクに格納されたデータを修復する、請求項1または2に記載のストレージ装置。
  4. 前記データ修復制御部は、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスク以外のハードディスクからのデータ読み出しにおいてエラーが生じた場合、前記第1のボリュームに含まれるハードディスクに格納されたデータが損失したものと判定する、請求項3に記載のストレージ装置。
  5. 前記データ修復制御部は、前記第2のボリュームに含まれるハードディスクに格納されたデータを、前記第1のボリュームに含まれる複数のハードディスクのうちの故障したハードディスクを代替する予備のハードディスクに書き込むことで、損失したデータを修復する、請求項4に記載のストレージ装置。
  6. 1以上のハードディスクを含む第3のボリュームを有する第2のディスク部と、
    前記第1のボリュームに含まれるハードディスクに格納されたデータと、前記第3のボリュームに含まれるハードディスクに格納されたデータの差分を表す第2の差分情報を保持する第2の差分情報保持部と、を備え、
    前記ボリュームコピー制御部は、前記第2の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第3のボリュームに含まれるハードディスクに格納するとともに、前記第2の差分情報を更新し、
    前記データ修復制御部は、前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータ、または、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する、請求項1ないし5のいずれか1項に記載のストレージ装置。
  7. 前記データ修復制御部は、前記第1の差分情報において差分が存在し、前記第2の差分情報において差分が存在しない場合、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する、請求項6に記載のストレージ装置。
  8. 前記データ修復制御部は、前記第1の差分情報および前記第2の差分情報において差分が存在しない場合において、前記第2のボリュームに含まれるハードディスクに格納されたデータが読み出せないときに、前記第2の差分情報および前記第3のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する、請求項6に記載のストレージ装置。
  9. 1以上のハードディスクを含む第1のボリュームと、1以上のハードディスクを含む第2のボリュームとを有する第1のディスク部と、前記第1のボリュームに含まれるハードディスクに格納されたデータと前記第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す第1の差分情報を保持する第1の差分情報保持部と、を備えたストレージ装置が、前記第1の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第2のボリュームに含まれるハードディスクに格納するとともに、前記第1の差分情報を更新する工程と、
    前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する工程と、を含むデータ復旧方法。
  10. 1以上のハードディスクを含む第1のボリュームと、1以上のハードディスクを含む第2のボリュームとを有する第1のディスク部と、前記第1のボリュームに含まれるハードディスクに格納されたデータと前記第2のボリュームに含まれるハードディスクに格納されたデータの差分を表す第1の差分情報を保持する第1の差分情報保持部と、を備えたストレージ装置を制御するコンピュータに対して、
    前記第1の差分情報を参照して、前記第1のボリュームに含まれるハードディスクに格納されたデータを、前記第2のボリュームに含まれるハードディスクに格納するとともに、前記第1の差分情報を更新する処理と、
    前記第1のボリュームに含まれるハードディスクに格納されたデータが損失した場合、前記第1の差分情報および前記第2のボリュームに含まれるハードディスクに格納されたデータに基づいて、損失したデータを修復する処理と、を実行させるプログラム。
JP2012054047A 2012-03-12 2012-03-12 ストレージ装置、データ復旧方法およびプログラム Expired - Fee Related JP5644795B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012054047A JP5644795B2 (ja) 2012-03-12 2012-03-12 ストレージ装置、データ復旧方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012054047A JP5644795B2 (ja) 2012-03-12 2012-03-12 ストレージ装置、データ復旧方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2013186857A true JP2013186857A (ja) 2013-09-19
JP5644795B2 JP5644795B2 (ja) 2014-12-24

Family

ID=49388181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012054047A Expired - Fee Related JP5644795B2 (ja) 2012-03-12 2012-03-12 ストレージ装置、データ復旧方法およびプログラム

Country Status (1)

Country Link
JP (1) JP5644795B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635532B2 (en) 2017-07-19 2020-04-28 Samsung Electronics Co., Ltd. Method of controlling error check and correction (ECC) of non-volatile memory device and memory system performing the same
JP2021174463A (ja) * 2020-04-30 2021-11-01 Necプラットフォームズ株式会社 Raid制御装置、raid制御方法及びプログラム
JP7276959B2 (ja) 2020-03-04 2023-05-18 Necプラットフォームズ株式会社 情報処理装置、情報処理方法及びプログラム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275479A (ja) * 2004-03-22 2005-10-06 Nec System Technologies Ltd ディスクアレイ制御システム
JP2006164162A (ja) * 2004-12-10 2006-06-22 Fujitsu Ltd コピー制御装置および方法
JP2006252126A (ja) * 2005-03-10 2006-09-21 Nec Corp ディスクアレイ装置及びその再構築方法
JP2011253400A (ja) * 2010-06-03 2011-12-15 Nec System Technologies Ltd 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005275479A (ja) * 2004-03-22 2005-10-06 Nec System Technologies Ltd ディスクアレイ制御システム
JP2006164162A (ja) * 2004-12-10 2006-06-22 Fujitsu Ltd コピー制御装置および方法
JP2006252126A (ja) * 2005-03-10 2006-09-21 Nec Corp ディスクアレイ装置及びその再構築方法
JP2011253400A (ja) * 2010-06-03 2011-12-15 Nec System Technologies Ltd 分散ミラードディスクシステム、コンピュータ装置、ミラーリング方法およびそのプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10635532B2 (en) 2017-07-19 2020-04-28 Samsung Electronics Co., Ltd. Method of controlling error check and correction (ECC) of non-volatile memory device and memory system performing the same
JP7276959B2 (ja) 2020-03-04 2023-05-18 Necプラットフォームズ株式会社 情報処理装置、情報処理方法及びプログラム
JP2021174463A (ja) * 2020-04-30 2021-11-01 Necプラットフォームズ株式会社 Raid制御装置、raid制御方法及びプログラム
JP7088567B2 (ja) 2020-04-30 2022-06-21 Necプラットフォームズ株式会社 Raid制御装置、raid制御方法及びプログラム

Also Published As

Publication number Publication date
JP5644795B2 (ja) 2014-12-24

Similar Documents

Publication Publication Date Title
US9053075B2 (en) Storage control device and method for controlling storages
US6701455B1 (en) Remote copy system with data integrity
JP2005196683A (ja) 情報処理システム、情報処理装置、及び情報処理システムの制御方法
JP2013041455A (ja) ストレージシステム、ストレージ制御装置およびストレージ制御方法
US20060190683A1 (en) Disk array apparatus and backup method of data
JP2014137711A (ja) ストレージ装置、バックアッププログラム、およびバックアップ方法
US10503620B1 (en) Parity log with delta bitmap
US7260739B2 (en) Method, apparatus and program storage device for allowing continuous availability of data during volume set failures in a mirrored environment
JP5644795B2 (ja) ストレージ装置、データ復旧方法およびプログラム
JP5040331B2 (ja) 記憶装置、記憶装置の制御方法、及び記憶装置の制御プログラム
JP6540334B2 (ja) システム、情報処理装置、および情報処理方法
JP5586712B2 (ja) ディスクアレイ制御装置およびディスクアレイ装置
JP5817296B2 (ja) 制御装置、制御方法およびストレージ装置
JP6335336B2 (ja) ストレージシステムおよびその制御方法
US10664346B2 (en) Parity log with by-pass
JP2006260376A (ja) ストレージ装置およびメディアエラー回復方法
JP3597349B2 (ja) 記憶サブシステムおよびその障害回復方法
JP2008276281A (ja) データ同期システム、方法、及び、プログラム
JP2005107675A (ja) ディスクアレイコントローラ及びディスクドライブの複製方法
JP5913078B2 (ja) ディスクアレイシステム、データ復旧方法、および、データ復旧プログラム
JP2007128183A (ja) ストレージシステム
JP3590015B2 (ja) ディスクアレイ装置および冗長データをもつ論理ドライブの一貫性回復方法
JP5598124B2 (ja) データ記録再生装置、データ記録方法、及び、データ記録プログラム
JP2014134884A (ja) ディスクアレイ装置、バッドセクタ修復方法および修復プログラム
JP2010244130A (ja) ディスクアレイ装置及びディスクアレイ制御方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130704

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140226

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141020

R150 Certificate of patent or registration of utility model

Ref document number: 5644795

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees