JP2007065873A - 記憶制御装置、記憶制御システム、及び記憶制御方法 - Google Patents

記憶制御装置、記憶制御システム、及び記憶制御方法 Download PDF

Info

Publication number
JP2007065873A
JP2007065873A JP2005249583A JP2005249583A JP2007065873A JP 2007065873 A JP2007065873 A JP 2007065873A JP 2005249583 A JP2005249583 A JP 2005249583A JP 2005249583 A JP2005249583 A JP 2005249583A JP 2007065873 A JP2007065873 A JP 2007065873A
Authority
JP
Japan
Prior art keywords
volume
storage control
file system
storage
secondary volume
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005249583A
Other languages
English (en)
Inventor
Katsuki Suzuki
勝喜 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005249583A priority Critical patent/JP2007065873A/ja
Priority to US11/257,014 priority patent/US7418564B2/en
Publication of JP2007065873A publication Critical patent/JP2007065873A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2058Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using more than 2 mirrored copies
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1658Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit
    • G06F11/1662Data re-synchronization of a redundant component, or initial sync of replacement, additional or spare unit the resynchronized component or unit being a persistent storage device
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2048Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share neither address space nor persistent storage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2087Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring with a common controller

Abstract

【課題】 サーバから記憶制御装置のボリュームへのアクセスを規制することなく、プライマリボリュームからセカンダリボリュームを切り離しても、セカンダリボリュームのファイルシステムに障害が残らないようにした、記憶制御技術を提供する。
【解決手段】 上位装置100と、上位装置からのリクエストに応じて、前記記憶装置と当該上位装置間のデータ処理を行う、記憶制御措置101と、管理サーバ130とを備えたシステムである。記憶制御装置は、正ボリューム102へ上位装置からのアクセスを許可した状態で、正ボリュームと副ボリューム103との同期状態を解除する解除処理を実行するコントローラ104を備える。管理サーバは、解除処理後の副ボリュームのボリューム管理情報の検査のための管理プログラムを実行する。
【選択図】 図1

Description

本発明は、ディスクアレイ装置等の記憶制御装置に係り、正ボリュームから副ボリュームに複製されたファイルシステムに異常があるか否かを検査し、異常がないと判定された場合に、副ボリュームに対するIOが有効化され、さらに、副ボリュームのファイルシステムがバックアップデータとして保証されるようにした記憶制御装置に関するものである。
一般的に、サーバ、ホストなどの上位装置からディスクアレイ装置にデータを格納する場合、データのバックアップのために、ディスクアレイ装置内に正ボリューム(プライマリボリューム)と、副ボリューム(セカンダリボリューム)を設け、セカンダリボリュームがプライマリボリュームのミラーとなるような運用をしている。ミラーとは、プライマリボリュームにセンカンダリーボリュームが同期して、プライマリボリュームの内容がセカンダリボリュームに複製されることである。
そして、データのバックアップを実施する場合、ディスクアレイ装置のコントローラは、プライマリボリュームからセカンダリボリュームを切り離して(SPLIT)、切り離しによって静止化されたセカンダリボリュームからテープ装置や、他のディスクアレイ装置などの他の記憶資源にバックアップデータ転送している。そして、バックアップ終了後に、ディスクアレイ装置は、セカンダリボリュームをプライマリボリュームに同期化している。
セカンダリボリュームをプライマリボリュームから切り離して、セカンダリボリュームに対してホスト等からのIOが無い状態で、データバックアップを行うのは、バックアップ中にデータが更新されることを防ぐためである。したがって、バックアップは、プライマリボリュームとセカンダリボリュームとを切り離した時点で行われる。
このことが、特開2000-330730号公報に、ディスクアレイ装置の差分コピー方式として記載されている。また、プライマリボリュームの複製を瞬時に作成する技術としては、特開2004-19213号公報記載の複製ボリューム生成方法およびディスク装置がある。
特開2000-330730号公報 特開2004-19213号公報
上記従来例によれば、ホストからの命令がディスクアレイ装置に送られると、直ちに、ボリュームの切り離しが行われる。しかしながら、SPLITが行われた瞬間にディスクへデータの書き込み処理が実施されている場合、データが破損するおそれがある。
そこで、データベースアプリケーションなどでは、データベースサーバがボリュームへアクセスすることを瞬間的に止めて、その時点でSPLITを実施するようにしている。しかしながら、このような制御はアプリケーション側で制御が必要となり、例えば安価なアプリケーションで担保されていない。
従来の記憶制御システムでは、アプリケーションの停止命令と、ディスクアレイ装置のアンマウント処理を実施して、ディスクアレイ装置へのサーバアクセスを処断した状態、つまりアプリケーションを停止した状態を作っている。そして、SPLIT終了後、再度ディスクアレイ装置をサーバにマウントすることになるが、この間、システムを停止しなければならないことになり、連続運用を望む顧客のニーズに答えることができない。かといって、サーバからのアクセスがある状態で、ディスクアレイ装置がSPLIT処理を実施すれば先に述べた通り最悪ファイルシステムが破損する。
本発明の目的は、サーバから記憶制御装置のボリュームへのアクセスを規制することなく、プライマリボリュームからセカンダリボリュームを切り離しても、セカンダリボリュームのファイルシステムに障害が残らないようにした、記憶制御技術を提供することである。本発明の他の目的は、テープ装置や他の記憶制御装置などのバックアップ側に、バックアップデータが正常なものであることを保証できる、記憶制御技術を提供することにある。
本発明は、既述の目的を達成するために、正ボリュームに対するサーバアクセスを中断することなく、正ボリュームから切り離された副ボリュームのファイルシステムを検証し、副ボリュームのファイルシステムに異常がないことを確認した後に、副ボリュームを他の記憶資源にバックアップする事を特徴とするものである。
本発明の一つの形態は、記憶装置を備え、上位装置からのリクエストに応じて、前記記憶装置と当該上位装置間のデータ処理を行う、記憶制御措置であって、前記上位装置がアクセス可能な正ボリュームと、この正ボリュームと同期化された副ボリュームと、前記正ボリュームへ前記上位装置からのアクセスを許可した状態で、前記正ボリュームと副ボリュームとの同期状態を解除する解除処理を実行するコントローラと、前記解除処理後の前記副ボリュームのボリューム管理情報の検査のためのユーティリティと、を備えることを特徴とする。ここでユーティリティとは、ボリューム管理用プログラム、管理用プログラムを実行する管理サーバ、この管理用プログラムを記憶制御装置内で有効にするためのプログラムなどをいう。したがって、ボリュームの検査は、管理サーバ、上位装置、又は記憶制御自身によって実行される。
本発明の他の形態は、上位装置と、記憶装置を備え、上位装置からのリクエストに応じて、前記記憶装置と当該上位装置間のデータ処理を行う、記憶制御措置であって、前記上位装置がアクセス可能なファイルシステムを備える正ボリュームと、この正ボリュームと同期化された副ボリュームと、前記正ボリュームへ前記上位装置からのアクセスを許可した状態で、前記正ボリュームと副ボリュームとの同期状態を解除する解除処理を実行するコントローラと、を備える記憶制御装置と、前記解除処理後の前記副ボリュームのボリューム管理情報の検査のための管理プログラムを実行する管理サーバと、を備える記憶制御システムである。
本発明の更に他の形態は、上位装置からのリクエストに応じて、記憶制御装置と前記上位装置間のデータ処理を行う、記憶制御方法であって、前記記憶制御装置内の正ボリュームと副ボリュームとを同期させ、前記正ボリュームを前記副ボリュームに複製するステップと、前記正ボリュームへの前記上位装置からのアクセスを許可した状態で、前記正ボリュームとの同期状態を解除するステップと、前記解除処理後の前記副ボリュームのファイルシステムを検査するステップと、前記副ボリュームのファイルシステムに異常がない場合に、前記副ボリュームのファイルシステムを他の記憶資源に複製するステップと、を備えることを特徴とするものである。
以上説明したように、本発明によれば、サーバから記憶制御装置のボリュームへのアクセスを規制することなく、プライマリボリュームからセカンダリボリュームを切り離しても、セカンダリボリュームのファイルシステムに障害が残らないようにした、記憶制御を提供することができる。
以下、本発明の実施形態について、図面を参照しながら説明する。図1は、サーバとディスクアレイ装置により構成された、ディザスタリカバリを構成する記憶制御システムのシステムブロック図である。
一般的に、ディザスタリカバリを構成するシステムは、図1の通り、メインサイト1とバックアップサイト1Aの複数のサイトから構成される。メインサイト1は、サーバ100と、このサーバ100がアクセス可能なディスクアレイ装置101から構成され、バックアップサイト1Aは、サーバ120と、このサーバがアクセス可能なディスクアレイ装置121から構成されている。サーバ100,120、ディスクアレイ装置101,121、管理サーバ120はLAN131に接続されている。
バックアップサイト1Aは、通常、メインサイト1と距離が離れた場所に設置され、メインサイト1とバックアップサイト1Aとの間は公衆回線や専用線134によりデータ転送が可能になっている。さらに、両サイト間はLAN131によりサーバ、ディスクアレイ装置、管理サーバが互いに通信可能になっている。なお、バックアップサイトは、同じビルやフロアーに位置していても良い。またバックアップサイトが複数存在する場合でも本発明は適用される。
メインサイト1にある、サーバ100とディスクアレイ装置101との間のデータは、ファイバチャネル(SAN)132によって送られる。ディスクアレイ装置101は、ディスクアレイ装置を制御するディスクコントローラ104を備えている。コントローラ104は、サーバ100からのIOを受けて、コントローラ104に接続された物理ディスクにデータを書き込む。
ディスアレイ装置101には、ファイルシステムへの、ホストからのIO結果を格納したプライマリボリューム102と、プライマリボリュームと同期化(図1の110)した、ミラーボリュームとしてのセカンダリボリューム103が存在する。管理サーバ130は、ディスクアレイ装置101のメモリに管理情報を設定することができる。以上の構成は、バックアップサイト1Aでも同様である。図1の符号132,133及び134がSANを構成している。
サーバ100が、データのバックアップを実行する場合、コントローラ104は、バックアップ対象ボリュームであるセカンダリボリューム103を静止化する。バックアップは時間(何時何分何秒)が指定されて実行される。コントローラ104は、バックアップ時間で、バックアップ対象ボリュームの内容を凍結する。そのために、コントローラ104は、サーバ100からのSPLITコマンドを受け、すなわち、バックアップのための指定された時点で、セカンダリボリューム103をプライマリボリューム102から切り離す。
バックアップサイト1Aには、メインサイト1と同様、サーバ120、ディスクアレイ装置121がある。セカンダリボリューム103がプライマリボリューム102からSPLITされた後、ディスクアレイ装置101,121が持っている、ボリュームのコピー機能により、メインサイト1のセカンダリボリューム103の内容をバックアップサイト1Aのプライマリボリューム122にボリュームコピーされる(図1の112)。このコピーはSAN、チャネルエクステンダ、WAN、専用線(134)を介する、データの転送によって実現される。ボリュームを全てコピーする方法の他、その差分を管理して差分のみコピーする方法がある。
バックアップサイト1Aでは、ボリュームコピーされたプライマリボリューム122が、ディスクアレイ装置121の筐体内でセカンダリボリューム123にコピーされる(111)。バックアップの処理は図中の110→112→111の順番で定期的に実施される。このようにデータがコピーされることで、図1のデータバックアップシステムは、最大で3世代のバックアップデータを備えることができる。
次に、ファイルシステムを有するプライマリボリュームと、セカンダリボリュームとの間のペア解除(SPLIT)について説明する。例えば、UNIX(登録商標)系のファイルシステムは、図2に示す構造を備えている。図2は、メインサイト1のプライマリボリューム102のファイルシステムの構造を示す。例えば、サーバ100が、プライマリボリューム10のファイルシステムにFile-Aを書き込む場合、ディレクトリ(DIR)の800番にデータを書き込むと、inode800として、File-Aが書き込まれる。inodeには、ファイル名と実際のデータが格納される番地が、例えば81,82,85,87,88と記録され、実際のデータはディスク上の81,82,85,87,88番地に書き込まれる。inodeはユーザから見えるファイルを示すメタデータ構造体で、各ファイルに存在する。つまり、ファイルシステムは階層構造を有する。この階層をたどって、サーバ100は、ファイルをアクセスすることになる。
同期してペアを形成しているボリューム同士を切断するSPLIT機能は、コントローラ104が、ファイルシステムにしたがって実施するものではなく、バックアップが指定された瞬間に、ロウデータレベルでデータの同期処理を中断することにより達成される。つまり、セカンダリボリューム103にデータを書き込んでいる最中にSPLIT命令がサーバ100からコントローラ104に発行されると、プライマリボリューム102からセカンダリボリューム103に書き込み中のデータは途中で途切れることになる。
このとき、書き込み中のデータが、図3に示すDIRデータを更新中であると、DIRデータが破壊される可能性がある。DIRが破壊されると、その配下に存在するinodeやデータを、サーバ100が参照することが出来なくなる。例えば、データのボリュームへの書き込み処理が4KB単位で実施されているとすると、その4KBの書き込みはセカンダリボリューム103がSPLITされた場合でも保証されるようにするため、データの1番地当たりのブロックを4KB以下にすれば、セカンダリボリューム103へ同期コピーされるデータの破損を回避できる。しかし、例えば、データ81,82の書き込み後、SPLITが行われると、セカンダリボリューム103へデータ85,87,88の書き込みが終了していないので、inode800と矛盾が発生し、ファイルが壊れている状態が発生します。DIRやinodeが破損すると、セカンダリボリューム103のファイルをサーバが読めなくなる問題が発生する。
ディスクアレイ装置のSPLIは、ロウレベルで行われるため、サーバ100がプライマリボリューム102にどのデータの書き込み中にSPLITが発行されたかを意識することは出来ない。したがって、サーバ100がプライマリボリューム102へデータの書き込みの最中にSPLITが実行されると、SPLIT以前は、プライマリボリューム102と同期化していたセカンダリボリューム103のファイルシステムが破損される可能性がある。また運悪く、3回連続してSPLITのファイルシステムが破損すると、103,122,123の各ボリュームは全て破損してしまい、どこからも回復できない状態を招く恐れがある。
図4は、図1に示された記憶制御システムの動作を示すフローチャートである。このフローチャートを、図1を利用しながら説明する。図1のプライマリボリューム102及びセカンダリボリューム103はLinuxのファイルシステムボリュームとする。
図1の管理サーバ120からプライマリボリューム102とセカンダリボリューム103をSPLITする命令が発行される(401)。この命令をディスクアレイ装置101のコントローラ104が受け、コントローラ上で動作するマイクロプログラムがプライマリボリューム102とセカンダリボリューム103とをロウレベルでSPLITする(402)。
この時、サーバ100からプライマリボリューム102へのIO、及びセカンダリボリューム103へのIOを停止する必要はない。このとき、両ボリュームをSPLITすると、プライマリボリューム102からセカンダリボリューム103への書き込み最中のデータが、既述のとおり場合によっては破損することになる。
次に、管理サーバ130は、セカンダリボリューム103に対してFSCKを実施する(404)。FSCKコマンドはファイルシステム検査ユーティリティである。Linuxでは、データを一時的にキャッシュに書き込む際に、ディスク上のデータブロックの位置や構造を示すメタデータを保存しておき、後でこれを参照してディスクにデータを書き込む。ファイルのクラッシュがあった場合は、FSCKコマンドがメタデータと実ファイルの不整合を検査・修正する。管理サーバ130は、このコマンドを利用して、SPLIT後のセカンダリボリューム103のファイルシステムが破損していないかをチェックする。
ファイルシステムがクラッシュしていた場合には、FSCKコマンドがファイルシステムの修復まで行うことも考えられるが、これには、多大な時間を費やす場合があるので、404ではファイルシステムのチェックのみが行われる。
FSCKコマンドがファイルシステムに異常があるか否かのチェックを行うのに代えて、読み込みテスト用のダミーファイルをファイルシステムに関連させて、セカンダリボリュームにダミーファイルを格納し、ダミーファイルを管理サーバ130が読めるか否かをテストする方法もある。この例では、図3に示す通り、DIRが破損していると管理サーバがファイルの読込をできないので、ダミーファイルを読み込めれば、最低限DIRは破損していないという判断ができる。また、さらに他の態様として、セカンダリボリュームのファイルシステムの管理情報からファイル数や、容量を読み込むことを内容とする、簡易的なチェック方法もある。本発明は、ファイルシステムの検証方法の態様を特に限定しない。
続いて、管理サーバ130は、FSCKの結果、セカンダリボリュームのファイルシステムに破損がなく正常と判断した場合(405)は、メインサイトのセカンダリボリューム103をバックアップサイト1Aのプライマリボリューム122に複製する処理を実施する(406)。FSCKの結果、セカンダリボリュームのファイルシステムに異常が検出された場合は、管理サーバ130は、再度プライマリボリューム102とセカンダリボリューム103の同期処理を実施する(407)。セカンダリボリュームのファイルシステムが、正常なイメージになるまで、両ファイルのSPLITと同期化が繰り返し実行される。すなわち、セカンダリボリュームのデータがクライアントに対して保証されることになる。この同期処理まで、直前のSPLIT処理から僅かな時間しか経過していないため、通常、差分バックアップ処理で瞬時に両ボリュームを同期させることが可能である。図4に示す一連の制御は管理サーバ130上で動作するディスクアレイ管理プログラムが実行する。
図4では、管理サーバがセカンダリボリュームをマウントする実施形態について説明したが、これに代えて、メインサイトのサーバ100が管理サーバ(ディスクアレイ管理プログラム)を内蔵して、メインサーバがセカンダリボリュームをマウントしても良い。
通常、プライマリボリュームとセカンダリボリュームとのSPLIT後、これらボリュームを同じサーバにマウントすることは可能であるが、サーバのOSから両ボリュームの名称が同じに見えて、同時にマウントできないようなシステムも存在する。それに、対処するためのフローが図5に示されている。
プライマリボリューム102とセカンダリボリューム103のSPLIT処理(501,502)までは図4と同じである。SPLIT処理終了後、管理サーバ130はセカンダリボリューム103の検証を実施しないで、バックアップサイト1Aのプライマリボリューム122へボリューム複製処理を行う(504)。複製が終了した時点で、バックアップサイトのプライマリボリューム122に対して管理サーバ130がFSCKコマンドを実施して(505)、ボリュームの破損有無を判定する(506)。管理サーバとバックアップサイトは、図1で示す通りLAN131で接続されておりFSCKを実行することが可能である。
また、別の方法として、管理サーバ130がFSCKを実施するのでなく、バックアップサイト1Aのサーバ120に対して、バックアップサイトのプライマリボリューム122のFSCKを実施するようにコマンドを発行し、その結果を管理サーバ130サーバ120から返してもらうということも可能である。
このバックアップサイトのプライマリボリューム122のFSCKの結果が、正常な場合は、次の処理としてプライマリボリューム122をバックアップサイトのセカンダリボリューム123に複製する処理を実行する(507)。ボリューム122が破損している場合は、あらかじめシステムに2通りの手順を登録しておき、その指定された手順に従い処理を進める。1つの手順としては、コントローラ124が、ボリューム122は破損ボリュームである情報を、管理サーバ130で動作するディスク管理プログラムに報告し、コントローラ124がセカンダリボリューム123への複製は実施しないということがある(508)。同時にメインサイトのセカンダリボリューム103も破損しているとの情報をディスク管理プログラムに報告する。ディスク管理プログラムは、セカンダリボリューム103とプライマリボリューム122を破損ボリュームとして認識し、このボリュームからのバック回復は行わない(行えない)ことを、管理サーバ130のバックアップシステムに伝達する(510)。このようなケースでは、データリカバリは、バックアップサイト1Aのセカンダリボリューム123から実施する。このような運用は、例えば、1時間毎に細かくバックアップを取っているような、記憶制御システムであって、3世代までのどこかに正しいバックアップデータが存在していれば良いとする、記憶制御システムで実現される。
他の運用として、ファイルシステムの破損を避けたい記憶制御システムでは、バックアップサイトのプライマリボリューム122に破損が見付かると、管理サーバ130はメインサイトのプライマリボリューム102とセカンダリボリューム103の同期処理をリトライする命令をコントローラ104に送り、ボリューム間の同期処理を行う(510)。その後は、502以降の処理を順に実行することで、セカンダリボリューム103のデータが正しいものであることを保証する。
図4及び図5で説明したバックアップ処理は、管理サーバ上で動作するディスク管理プログラムによって、ケジュール管理されて、繰り返し実行される。また、ディスクアレイ管理プログラムは、これら一連の処理の進捗状況をGUIにより表示する機能を備えている。ここで説明した、記憶制御システムによって、サーバのアプリケーション側でファイルIOを意識することなく、サーバの連続運転を確保した状態で、バックアップを行うことが可能となる。なお、本発明は、ここで説明した実施形態に限られるものではなく、実施形態を、本発明の範囲を逸脱することが無い範囲で内種々追加・変更を行うことができる。
本発明の記憶制御システムの機能ブロック図。 ファイルシステムの構造図。 ファイルシステムの破損状況を示す、ファイルシステムの構造図。 本発明に係る記憶制御システムの動作を示すフローチャート。 本発明に係る記憶制御システムの他の動作を示すフローチャート。
符号の説明
100,120 サーバ、101,121 ディスクアレイ装置、102,122 プライマリボリューム、103,123 セカンダリボリューム、104,124 コントローラ、130 管理用サーバ

Claims (17)

  1. 記憶装置を備え、上位装置からのリクエストに応じて、前記記憶装置と当該上位装置間のデータ処理を行う、記憶制御措置であって、
    前記上位装置がアクセス可能な正ボリュームと、
    この正ボリュームと同期化された副ボリュームと、
    前記正ボリュームへ前記上位装置からのアクセスを許可した状態で、前記正ボリュームと副ボリュームとの同期状態を解除する解除処理を実行するコントローラと、
    前記解除処理後の前記副ボリュームのボリューム管理情報の検査のためのユーティリティと、
    を備える記憶制御装置。
  2. 前記正ボリュームは、前記上位装置がアクセス可能なファイルシステムを有し、前記ユーティリティは前期正ボリュームから副ボリュームへ複製された、前記ファイルシステムを検査するものである、を備える請求項1記載の記憶制御装置。
  3. 前記ユーティリティが、前記副ボリュームのファイルシステムに破損を発見した場合、前記コントローラは、前記副ボリュームを前記正ボリュームに再同期させ、次いで、両ボリュームを解除する前記解除処理を再度実行する、請求項2記載の記憶制御装置。
  4. 前記ユーティリティが、前記副ボリュームのファイルシステムに異常を発見しなくなるまで、前記コントローラは、前記副ボリュームを前記正ボリュームに再同期させること、次いで、両ボリュームを解除する前記解除処理を、繰り返し実行する、請求項3記載の記憶制御装置。
  5. 前記ユーティリティが、前記副ボリュームのファイルシステムに異常を発見しない際、前記記憶制御装置は、前記第2のボリュームに対するIOを有効にする、請求項2記載の記憶制御装置。
  6. 前記ユーティリティが、前記副ボリュームに格納されているファイルシステムのディレクトリに基づいて、前記ファイルシステムの破損の有無を判定する、請求項2記載の記憶制御装置。
  7. 前記ユーティリティが、前記副ボリュームに格納されているファイルシステムのダミーファイルに基づいて、前記ファイルシステムの破損の有無を判定する、請求項2記載の記憶制御装置。
  8. 前記ユーティリティが、前記副ボリュームのファイルシステムに異常を発見しない際、前記記憶制御装置は、前記第2のボリュームのファイルシステムを、他の記憶資源へバックアップコピーするようにした、請求項2記載の記憶制御装置。
  9. 前記他の記憶資源がテープ装置である、請求項8記載の記憶制御装置。
  10. 前記他の記憶資源がリモートサイトにある第2の記憶制御装置内の論理ボリュームである、請求項8記載の記憶制御装置。
  11. 上位装置と、
    記憶装置を備え、上位装置からのリクエストに応じて、前記記憶装置と当該上位装置間のデータ処理を行う、記憶制御措置であって、
    前記上位装置がアクセス可能なファイルシステムを備える正ボリュームと、
    この正ボリュームと同期化された副ボリュームと、
    前記正ボリュームへ前記上位装置からのアクセスを許可した状態で、前記正ボリュームと副ボリュームとの同期状態を解除する解除処理を実行するコントローラと、を備える記憶制御装置と、
    前記解除処理後の前記副ボリュームのボリューム管理情報の検査のための管理プログラムを実行する管理サーバと、
    を備える記憶制御システム。
  12. さらに、前記副ボリュームの内容がバックアップコピーされるボリュームを有する、リモートサイトの第2の記憶制御装置を備えた、請求項11記載の記憶制御システム。
  13. 前記第2の記憶制御装置の前記ボリュームが、前記副ボリュームのファイルシステムがコピーされる第1のボリュームと、この第1のボリュームの内容が複製される第2のボリュームとを備えて構成される請求項13記載の記憶制御システム。
  14. 前記管理プログラムが第1のボリュームのファイルシステムの検査を行い、当該ファイルシステムに異常がないと判定した場合に、前記第1のボリュームを前記第2のボリュームに複製する、請求項13記載の記憶制御システム。
  15. 前記管理サーバが前記上位装置に内蔵されている請求項11記載の記憶制御システム。
  16. 上位装置からのリクエストに応じて、記憶制御装置と前記上位装置間のデータ処理を行う、記憶制御方法であって、
    前記記憶制御装置内の正ボリュームと副ボリュームとを同期させ、前記正ボリュームを前記副ボリュームに複製するステップと、
    前記正ボリュームへの前記上位装置からのアクセスを許可した状態で、前記正ボリュームとの同期状態を解除するステップと、
    前記解除処理後の前記副ボリュームのファイルシステムを検査するステップと、
    前記副ボリュームのファイルシステムに異常がない場合に、前記副ボリュームのファイルシステムを他の記憶資源に複製するステップと、を備える記憶制御方法。
  17. 前記副ボリュームのファイルシステムを、他の記憶装置のボリュームにコピーし、このボリュームのファイルシステムに異常が無いか否かを検査するようにした、請求項16記載の記憶制御方法。

JP2005249583A 2005-08-30 2005-08-30 記憶制御装置、記憶制御システム、及び記憶制御方法 Pending JP2007065873A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005249583A JP2007065873A (ja) 2005-08-30 2005-08-30 記憶制御装置、記憶制御システム、及び記憶制御方法
US11/257,014 US7418564B2 (en) 2005-08-30 2005-10-25 Storage controller, storage control system and storage control method for mirroring volumes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005249583A JP2007065873A (ja) 2005-08-30 2005-08-30 記憶制御装置、記憶制御システム、及び記憶制御方法

Publications (1)

Publication Number Publication Date
JP2007065873A true JP2007065873A (ja) 2007-03-15

Family

ID=37805720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005249583A Pending JP2007065873A (ja) 2005-08-30 2005-08-30 記憶制御装置、記憶制御システム、及び記憶制御方法

Country Status (2)

Country Link
US (1) US7418564B2 (ja)
JP (1) JP2007065873A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009070022A (ja) * 2007-09-12 2009-04-02 Ricoh Co Ltd バックアップ/リストア装置、バックアップ/リストアシステム及びバックアップ/リストア方法
JP2009230628A (ja) * 2008-03-25 2009-10-08 Hitachi Ltd 計算機システム及び管理計算機
JP2009251786A (ja) * 2008-04-03 2009-10-29 Fujitsu Ltd データ処理方法、ストレージ装置およびストレージシステム
JP2010039986A (ja) * 2008-08-08 2010-02-18 Hitachi Ltd データのバックアップを管理する計算機システム及び方法
JP2011097573A (ja) * 2009-09-29 2011-05-12 Canon Inc 情報処理装置、その制御方法及びプログラム
JP2012509533A (ja) * 2008-11-20 2012-04-19 インターナショナル・ビジネス・マシーンズ・コーポレーション ミラード・ディスク記憶システムを操作する装置、方法、及びコンピュータ・プログラム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4939102B2 (ja) * 2006-04-21 2012-05-23 株式会社日立製作所 ネットワークブート計算機システムの高信頼化方法
US8301602B1 (en) * 2008-05-01 2012-10-30 Emc Corporation Detection of inconsistencies in a file system
JP5780305B2 (ja) * 2011-08-18 2015-09-16 富士通株式会社 通信装置、通信方法、および通信プログラム
US9542320B2 (en) * 2015-01-12 2017-01-10 Avago Technologies General Ip (Singapore) Pte. Ltd. Multi-node cache coherency with input output virtualization

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000330730A (ja) 1999-05-21 2000-11-30 Nec Corp ディスクアレイ装置の差分コピー方式
DE60043873D1 (de) * 1999-06-01 2010-04-08 Hitachi Ltd Verfahren zur Datensicherung
US6859865B2 (en) * 2001-11-09 2005-02-22 Nortel Networks Limited System and method for removing latency effects in acknowledged data transfers
JP4089876B2 (ja) 2002-06-14 2008-05-28 前田建設工業株式会社 高精度基礎杭打設ガイド及びこれを用いた打設工法
US7096338B2 (en) * 2004-08-30 2006-08-22 Hitachi, Ltd. Storage system and data relocation control device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009070022A (ja) * 2007-09-12 2009-04-02 Ricoh Co Ltd バックアップ/リストア装置、バックアップ/リストアシステム及びバックアップ/リストア方法
JP2009230628A (ja) * 2008-03-25 2009-10-08 Hitachi Ltd 計算機システム及び管理計算機
US8386432B2 (en) 2008-03-25 2013-02-26 Hitachi, Ltd. Backup management method in a remote copy environment
JP2009251786A (ja) * 2008-04-03 2009-10-29 Fujitsu Ltd データ処理方法、ストレージ装置およびストレージシステム
US8555012B2 (en) 2008-04-03 2013-10-08 Fujitsu Limited Data storage apparatus
JP2010039986A (ja) * 2008-08-08 2010-02-18 Hitachi Ltd データのバックアップを管理する計算機システム及び方法
JP2012509533A (ja) * 2008-11-20 2012-04-19 インターナショナル・ビジネス・マシーンズ・コーポレーション ミラード・ディスク記憶システムを操作する装置、方法、及びコンピュータ・プログラム
US8677178B2 (en) 2008-11-20 2014-03-18 International Business Machines Corporation Recovery control in mirrored disks
US9558084B2 (en) 2008-11-20 2017-01-31 International Business Machines Corporation Recovery control in mirrored disks
JP2011097573A (ja) * 2009-09-29 2011-05-12 Canon Inc 情報処理装置、その制御方法及びプログラム

Also Published As

Publication number Publication date
US20070050576A1 (en) 2007-03-01
US7418564B2 (en) 2008-08-26

Similar Documents

Publication Publication Date Title
JP2007065873A (ja) 記憶制御装置、記憶制御システム、及び記憶制御方法
JP4833734B2 (ja) データベースシステム、ストレージ装置、初期コピー方法及びログ適用方法
US9679039B1 (en) Continuous protection of data and storage management configuration
US6742138B1 (en) Data recovery method and apparatus
EP1481324B1 (en) Producing a mirrored copy using incremental-divergence
JP4624829B2 (ja) データバックアップシステム及び方法
US7302540B1 (en) Virtual tape storage system having snapshot virtual tape library for disaster recovery testing
US8874508B1 (en) Systems and methods for enabling database disaster recovery using replicated volumes
US7194487B1 (en) System and method for recording the order of a change caused by restoring a primary volume during ongoing replication of the primary volume
US7310743B1 (en) Data recovery method and apparatus
US8028192B1 (en) Method and system for rapid failback of a computer system in a disaster recovery environment
US20080178050A1 (en) Data backup system and method for synchronizing a replication of permanent data and temporary data in the event of an operational error
US9189338B2 (en) Disaster recovery failback
US7457830B1 (en) Method and system of replicating data using a recovery data change log
US8375181B1 (en) System and method for performing replication based on change tracking information
US7979396B1 (en) System and method for performing consistent resynchronization between synchronized copies
US9053073B1 (en) Use of timestamp logic in synchronous replication
WO2017014814A1 (en) Replicating memory volumes
US10296517B1 (en) Taking a back-up software agnostic consistent backup during asynchronous replication
US8656215B2 (en) Disaster recovery production takeover
US20110219261A1 (en) Recovery control in mirrored disks
US7194675B2 (en) Backup method, backup system, disk controller and backup program
JP2009265973A (ja) データ同期システム、障害復旧方法、及び、プログラム
US8990161B1 (en) System and method for single segment backup
JP2008276281A (ja) データ同期システム、方法、及び、プログラム