JP4813872B2 - 計算機システム及び計算機システムのデータ複製方法 - Google Patents

計算機システム及び計算機システムのデータ複製方法 Download PDF

Info

Publication number
JP4813872B2
JP4813872B2 JP2005335655A JP2005335655A JP4813872B2 JP 4813872 B2 JP4813872 B2 JP 4813872B2 JP 2005335655 A JP2005335655 A JP 2005335655A JP 2005335655 A JP2005335655 A JP 2005335655A JP 4813872 B2 JP4813872 B2 JP 4813872B2
Authority
JP
Japan
Prior art keywords
logical volume
update data
storage system
data
hdd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005335655A
Other languages
English (en)
Other versions
JP2007141047A (ja
JP2007141047A5 (ja
Inventor
伸光 高岡
泰典 兼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005335655A priority Critical patent/JP4813872B2/ja
Priority to US11/342,833 priority patent/US7627610B2/en
Publication of JP2007141047A publication Critical patent/JP2007141047A/ja
Publication of JP2007141047A5 publication Critical patent/JP2007141047A5/ja
Application granted granted Critical
Publication of JP4813872B2 publication Critical patent/JP4813872B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2071Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring using a plurality of controllers
    • G06F11/2074Asynchronous techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/325Power saving in peripheral device
    • G06F1/3268Power saving in hard disk drive
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/855Details of asynchronous mirroring using a journal to transfer not-yet-mirrored changes
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/42Wire connectors; Manufacturing methods related thereto
    • H01L2224/47Structure, shape, material or disposition of the wire connectors after the connecting process
    • H01L2224/48Structure, shape, material or disposition of the wire connectors after the connecting process of an individual wire connector
    • H01L2224/485Material
    • H01L2224/48505Material at the bonding interface
    • H01L2224/48699Principal constituent of the connecting portion of the wire connector being Aluminium (Al)
    • H01L2224/487Principal constituent of the connecting portion of the wire connector being Aluminium (Al) with a principal constituent of the bonding area being a metal or a metalloid, e.g. boron (B), silicon (Si), germanium (Ge), arsenic (As), antimony (Sb), tellurium (Te) and polonium (Po), and alloys thereof
    • H01L2224/48717Principal constituent of the connecting portion of the wire connector being Aluminium (Al) with a principal constituent of the bonding area being a metal or a metalloid, e.g. boron (B), silicon (Si), germanium (Ge), arsenic (As), antimony (Sb), tellurium (Te) and polonium (Po), and alloys thereof the principal constituent melting at a temperature of greater than or equal to 400°C and less than 950 °C
    • H01L2224/48724Aluminium (Al) as principal constituent
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、複数の記憶システムを有する計算機システムに関し、特に、一方の記憶システムに記録されているデータを他方の記憶システムへコピーする機能、すなわちリモートコピー機能を有する計算機システムにおいて、記憶装置の電源を制御して電力消費量の抑制が可能な計算機システム及びデータ複製方法に関する。
本発明の背景技術として、二つの技術を挙げる。一つは、リモートコピー技術であり、一つは、記憶装置電源制御技術である。
まず、リモートコピー技術について述べる。
リモートコピー技術は、計算機等の上位装置が記憶システムに書き込むデータ(オリジナルデータ)を、別の記憶システムにもコピーする技術である。このような技術は、ディザスタリカバリ(大規模自然災害により破壊された情報システムの復元)や、データのバックアップのために必要とされる。
特許文献1は、リモートコピー技術の一形態を開示している。同公報が開示するリモートコピー技術を以下に説明する。前提として、下記(1)(2)(3)の要素からなる計算機システムを仮定する。
(1)計算機。
(2)(1)の計算機に接続され、(1)の計算機がデータを記録し、変更する第1の記憶システム。前記データをここではオリジナルデータと呼ぶ。
(3)第1の記憶システムに接続され、オリジナルデータのコピーを保持する第2の記憶システム。
上記の計算機システムにおいて、(1)の計算機は、(2)の記憶システムに対してオリジナルデータの変更を要求する。すると、(2)の記憶システムは、オリジナルデータの更新に関する情報(ジャーナル)を生成し、自身の記憶領域に一旦蓄積する。(3)の記憶システムは、(2)の記憶システムに対してジャーナルの送信を要求し、受信したジャーナルを用いてコピーを更新する。
(3)の記憶システムは、計算機からのアクセスとは非同期的に、ジャーナルが一旦蓄積された記憶領域からジャーナルを取得する(ジャーナルリード)。これにより、計算機によるオリジナルデータへのアクセスに、リモートコピーを原因とする性能低下が生じることを防いでいる。
以降、リモートコピー技術による記憶システムのデータコピー機能を、単にリモートコピーと呼ぶ。コピー対象のオリジナルのデータを記録している記憶システムを正記憶システムと呼び、コピーされたデータを記録している記憶システムを副記憶システムと呼ぶ。
上位装置からのデータの書き込みを、オリジナルデータとそのコピーに同時に反映するリモートコピーを同期リモートコピーと呼び、そうではない場合、すなわち、オリジナルデータへの書き込みとコピーへの書き込みを、同時に実行することを保証しないリモートコピーを、非同期リモートコピーと呼ぶ。
次に、記憶装置電源制御技術について述べる。
記憶装置電源制御技術は、記憶システムが備える記憶装置の電源を、記憶装置のアクセス頻度やアクセスの有無に応じて切断することで、記憶システムが消費する電力量の低減と、記憶装置が故障するまでの期間(以下、可動期間という)の延長を図る技術である。
ここで、記憶装置とは、電子データの記録と読み出しが可能な装置のことであり、本明細書ではハードディスクドライブに注目する。この技術には、記憶装置の電源が切断されているために発生するアクセスの遅延の低減や、記憶装置の電源が切断された状態を出来る限り維持する工夫が含まれる。
特許文献2は、記憶装置電源制御技術の一形態を開示している。同公報が開示する記憶装置電源制御技術は、以下のようなものである。
記憶システムは、指定した記憶装置(*)の電源の投入/切断を外部の計算機から要求できるインタフェースを備える。前記記憶システムに接続し、前記記憶システムにデータを記録する計算機は、前記記憶システムの記憶装置の内、当面はアクセスしないことが分っているものについて、前記記憶システムに対して、前記インタフェースを使って記憶装置の電源切断を要求する。(*)補足:実際には、論理ボリューム(後述)を指定する。
また、特許文献3が開示する技術は、以下のようなものである。
記憶システムは、記憶装置へのアクセスが無い限りは、原則的に記憶装置の電源を切断しておく。電源が切断された状態の記憶装置を多くするために、RAID(Redundant Arrays of Inexpensive Disks)レベル4を修正したデータ記録方式を用いる。アクセスの遅延を低減するために、前記データ記録方式におけるパリティディスク(エラー訂正情報を記録する記憶装置)およびメタデータディスク(記憶システム内部の構成情報と、データのキャッシュが記録された記憶装置)の電源を、常時投入しておく。
特開2005−18506号公報 特開2005−157710号公報 米国特許出願公開第2004/0054939号明細書
リモートコピー技術を使用して、主記憶システムに記録されたデータを副記憶システムへコピーする際、コピーされたデータを記録する記憶装置は、更新が必要ではない間は電源を切断できる。そこで、副記憶システムへの記憶装置電源制御技術の適用を考える。
特許文献2に記載の技術では、記憶装置の電源切断と投入を計算機が指示する。このため、特許文献1に記載されているような非同期リモートコピー、すなわち、データのコピーを、計算機からのアクセスとは非同期的に記憶システム間で実行するリモートコピーには、特許文献2に記載の技術は適さない。
特許文献3に記載の技術では、常時電源が投入されている記憶装置を必要とする。このような記憶装置は、記憶システムの電力消費量の増加と、記憶システム内の記憶装置の平均可動時間の減少を招く。
本発明の目的は、上記を鑑み、リモートコピー技術を使用する計算機システムにおいて、必要な記憶装置に電源を投入するように制御して、副記憶システムの電力消費量をより低減し、記憶装置の寿命を延長することができる計算機システムを提供することである。
上記の課題を解決するために、本発明の計算機システムでは、上位装置が、前記第一の記憶システムへデータを送信する送信部を備え、第一の記憶システムは、前記データを第一の論理ボリュームへ記録し、前記データを含む更新データを生成する第一の処理部を備え、第二の記憶システムは、第一の記憶システムから更新データを受領する契機において、第二の論理ボリュームを構成する記憶装置の電源が切断されていれば、第二の論理ボリュームを構成する記憶装置の電源を投入する電源制御部と前記更新データを前記第二の論理ボリュームに記録する調停部とを備え、さらに、第二の記憶システムは、第二の論理ボリュームに記録された更新データを読み出して第三の論理ボリュームへ記録する第二の処理部を備えることを特徴とする。
本発明により、リモートコピーを使用した計算機システムにおいて、副記憶システムの電力消費量をより低減し、記憶装置の寿命を延長することができる計算機システムを提供することができる。
以降、図面を参照して、本発明の実施形態を説明する。
図1は、本発明の第一の実施形態の論理的な構成を示している。
本発明の第一の実施形態は、正記憶システム1、副記憶システム2、上位装置である計算機9からなる計算機システムである。
本明細書において、上位装置とは、記憶システムに対してデータの記録を要求する装置一般を指す。記憶システムもまた上位装置である。
正記憶システム1と計算機9の間には、通信路71が構成される。正記憶システム1と副記憶システム2の間には、通信路72が構成される。これらの通信路を構成するには、ファイバチャネルによるストレージエリアネットワーク、LAN、公衆回線等のネットワークを使用する。通信路71と通信路72は同一のネットワークを使用して構成されるものであってもよい。
正記憶システム1と副記憶システム2は、記憶装置であるハードディスクドライブ(以降、HDDと表記)を複数個備えている。
正記憶システム1は、そのHDDから構成される複数の論理ボリュームを有し、とりわけ論理ボリューム121と124を有する。正記憶システム1の論理ボリューム121は、計算機9から一つのブロックデバイスとしてアクセスできる。すなわち、計算機9は、論理ボリューム121へのデータの書き込みと、論理ボリューム121からのデータの読み出しを実行することができる。正記憶システム1の論理ボリューム124は、論理ボリューム121の更新データ(後述)を記録するために、正記憶システム1が内部で使用する。論理ボリューム124には、計算機9からはアクセスできない。
副記憶システム2は、複数の論理ボリュームを有し、とりわけ論理ボリューム221と224を有する。論理ボリューム221は、正記憶システム1の論理ボリューム121に記録されたデータのコピーを記録する論理ボリュームである。論理ボリューム224は、論理ボリューム121の更新データを記録するために、副記憶システム2が内部で使用する。
上記の更新データとは、上位装置からの論理ボリュームへのデータの書き込みを、副論理ボリュームに記録されているデータのコピーに対しても適用するためのデータである。
更新データは、正記憶システム1で生成され、副記憶システム2へ送信される。更新データには、書き込まれたデータの内容、ペア(後述)を識別するための情報、データ更新の順序に関する情報などを含む。
この実施形態1では、正記憶システム1から副記憶システム2へ更新データを転送するためのプロトコルとして、副記憶システム2が正記憶システム1から更新データを「読み出す」形態のプロトコルを採用する。
すなわち、副記憶システム2が正記憶システム1に対して更新データの送信を要求することで、正記憶システム1は副記憶システム2に対して更新データを送信する。
副記憶システム2は、複数のHDDを備え、とりわけHDD211と215を備える。副記憶システム2の論理ボリューム224は、HDD211(および、その他3つのHDD)の記憶領域から構成され、論理ボリューム221は、HDD215(および、その他3つのHDD)の記憶領域から構成される。正記憶システム1の論理ボリュームも同様にHDDの記憶領域より構成される。図1ではHDD211と215以外のHDDの記載を省略している。
記憶システム内の各HDDを識別するために、各HDDには、記憶システム内で一意の識別番号(ID)が割当てられている。
HDD211と215は、通常は電源が切断されており、それらの論理ボリュームへのデータの記録が必要となった場合に電源を投入する。
論理ボリューム121に記録されるデータは、正記憶システム1と副記憶システム2のリモートコピー機能により、副記憶システム2の論理ボリューム221にコピーされる。
以降、コピーされるオリジナルデータを記録している論理ボリュームを正論理ボリューム、オリジナルデータのコピーを記録している論理ボリュームを副論理ボリュームと呼ぶ。
正論理ボリューム121と副論理ボリューム221の関係をペアと呼ぶ。
計算機システムを管理する者(以降、ユーザと言う)は、正論理ボリューム121と副論理ボリューム221のペアの確立を、正記憶システム1もしくは副記憶システム2に指示することが出来る。ペアの確立が指示されると、正記憶システム1と副記憶システム2は、指示されたペアの正論理ボリューム121と副論理ボリューム221を、ペアの情報として内部の共有メモリに記録する。
ペアの確立の指示は、正記憶システム1もしくは副記憶システム2を管理するための管理端末機器を通して実行できる。図1では管理端末機器の記載を省略しているが、このような仕組が実施可能であることは、当業者には明かである。
正記憶システム1と副記憶システム2の間のリモートコピーにおいては、更新データを一時的に記録する論理ボリューム124および224を使用する。更新データを記録する論理ボリュームを更新データ論理ボリュームと呼ぶ。また、正記憶システム1の更新データ論理ボリュームを正更新データ論理ボリューム、副記憶システム2の更新データ論理ボリュームを副更新データ論理ボリュームと呼ぶ。
更新データ論理ボリュームを使用して、論理ボリューム121へ書き込まれたデータを論理ボリューム221へ適用する処理の流れは次のようになる。正記憶システム1は、計算機9から論理ボリューム121へのデータの記録を指示されると、論理ボリューム121へデータを記録するとともに、更新データを生成し更新データ論理ボリューム124に記録する。その後、正記憶システム1は、しかるタイミングで更新データを副記憶システム2に送信する。副記憶システム2は、受信した更新データを更新データ論理ボリューム224に記録し、しかるタイミングで、更新データに基づき論理ボリューム221へ記録されたデータを更新する。
上でしかるタイミングという言葉を使用したが、このタイミングを決定する処理については後に詳細に説明する。また、データの更新の処理が上記のようであるため、計算機9からの正論理ボリューム121へのデータの書きこみは、副論理ボリューム221へ遅延して適用され、副論理ボリューム221のデータは、正論理ボリューム121のある過去の時点でのデータと一致する。このようなデータの一致性を、本明細書では断りなく一致性という場合がある。
なお、上記のタイミングは、正論理ボリューム121へのデータ記録処理とは無関係に決定される。したがって、本実施形態1のリモートコピーは非同期リモートコピーの一形態である。
上記の処理を実施するにあたり、更新データ論理ボリューム124および224の関係付け、論理ボリューム121と更新データ論理ボリューム124の関係付け、論理ボリューム221と更新データ論理ボリューム224の関係付けを、正記憶システム1と副記憶システム2に指示する必要がある。これらの関係付けは、ペアの確立の場合と同様に、ユーザが管理端末機器を使用して指示する。
正論理ボリューム121と副論理ボリューム221のペアの確立が確立した直後は、正論理ボリューム121のデータは、副論理ボリューム221にはその一部もコピーされていない。このため、正論理ボリューム121のデータを副論理ボリューム221へ全くコピーする必要がある。この、ペア確立直後のデータのコピーを初期コピーと呼ぶ。初期コピー後、上に述べたデータの更新の処理へ移行することで、正論理ボリューム121のデータと副論理ボリューム221のデータの間の一致性が維持される。
正記憶システム1および副記憶システム2への初期コピーの開始の指示は、ペア確立の場合と同様に、ユーザが管理端末機器を使用して行う。ペア確立の指示が初期コピー開始の意味を含むものであってもよい。
以降、副記憶装置のHDD211および215の電源を制御しつつ、正論理ボリューム121と副論理ボリューム221の一致性を維持する処理の流れ(フローF1)を説明する。正論理ボリューム121と副論理ボリューム221の間の初期コピーは行われているものとする。また、副記憶システム2のHDD211と215の電源は切断されているものとする。
本実施形態1では、正更新データ論理ボリューム124に記録された更新データの量に基づき、更新データを送信するタイミングを決定する。
[フローF1]
(F1−1) 計算機9は、正記憶システム1に対して、正論理ボリューム121へのデータの書き込みを要求する。この要求は、I/O処理部51によって処理される。
(F1−2) I/O処理部51は、計算機9からのデータの書き込みの要求に対して、正論理ボリューム121へ書き込むとともに、その要求から更新データを生成し、更新データを正更新データ論理ボリューム124へ書き込む。
ここまでのステップにおけるデータの流れを、矢印61によって示している。
(F1−3) 副記憶システム2の更新データ転送調停部53b(以降、更新データ転送調停部(副)と記載)は、更新データ転送調停部53a(以降、更新データ転送調停部(正)と記載)から正更新データ論理ボリューム124の使用率を定期的に取得する(矢印63)。正更新データ論理ボリューム124の使用率が一定の閾値以上である場合は、正記憶システム1から、正更新ボリューム124に記録されている更新データを取得することを決定する。
(F1−4) この時、副更新データ論理ボリューム224を構成しているHDD211の電源は停止しているため、受信した更新データを記録することができない。このため、更新データ転送調停部(副)53bは、まずHDD電源制御部56bに対して、副更新データ論理ボリューム224を構成しているHDDの電源を投入することを指示する(破線矢印67)。
(F1−5) HDD電源制御部56bは、上記の指示を受け、HDD211の電源を投入する(破線矢印64)。
(F1−6) HDDの電源が投入され、副更新データ論理ボリューム224へのデータの記録が可能となると、更新データ転送調停部(副)53bは、更新データ受信部54に対して、更新データの取得を指示する。
(F1−7) 更新データ受信部54は、上記指示を受け、正記憶システム1の更新データ送信部52に対して、正更新データ論理ボリューム124に記録された更新データの転送を指示する。更新データ転送部52は、上記の指示を受け、正更新データ論理ボリューム124に記録された更新データを転送する。更新データ受信部54は、受信した更新データを副更新データ論理ボリューム224に記録する。
(F1−8) 副更新データ論理ボリューム224の使用率が定められた閾値以上の場合は、更新データを副論理ボリューム221に適用する。
更新データを副論理ボリューム221に適用する場合、更新データ転送調停部53bは、リストア処理部55に対して、更新データの適用を指示する。ここで、副論理ボリューム221のHDDの電源は切断されているため、更新データ転送調停部53bは、まずHDD電源制御部56bに対して副論理ボリューム221の電源の投入を指示する。
(F1−9) HDD電源制御部56bは、上記指示を受けて、HDD215の電源を投入する(破線矢印65)。
(F1−10) リストア処理部55は、更新データ転送調停部(副)53bからの指示を受け、副更新データ論理ボリューム224に記録された更新データを、副論理ボリューム221に適用する。
(F1−11) 副記憶システム2は、HDDの電源を、適切なタイミングで切断する。このタイミングは、HDDへのアクセスの有無や、HDDへの電源投入回数に基づき決定される。
以上が、本実施形態1の概要である。以降、本実施形態1の詳細を、より詳細な図を参照しながら説明する。
図2は、正記憶システム1の構成を示す図である。
正記憶システム1は、ホストアダプタ101および102、ディスクアダプタ109、共有メモリ103、キャッシュメモリ110を備えたコントローラ100と、HDD111、112、113、114、115、116、117、118とを有する。ホストアダプタ101および102、ディスクアダプタ109、共有メモリ103、キャッシュメモリ110は、バス119によりCPU126に接続されており、相互に通信可能となっている。ディスクアダプタ109は、HDD接続線120によってHDD上記8つのHDDに接続されており、これによりこれらのHDDの制御(データの読み出し、書き込み、電源切断、電源投入)が可能となっている。
ホストアダプタ101および102は、I/O処理部51、更新データ送信部52、更新データ転送調停部53、更新データ受信部54、リストア処理部55を有する。これらをCPU126が実行できるプログラムとし、ホストアダプタ101および102内の各プログラムをコントローラ100のCPU126が実行するように構成し、ホストアダプタ101および102の上位装置からの要求(データの書き込み、読み出し)と更新データの転送に関する処理を実行することができる。
また、図2においては、ホストアダプタ101および102が行う上位装置からの要求(データの書き込み、読み出し)と、更新データの転送に関する処理をコントローラ100のCPU126が実行するものとして説明したが、ホストアダプタ101および102のそれぞれに、CPUおよびメモリを設置して、I/O処理部51、更新データ送信部52、更新データ転送調停部53、更新データ受信部54、リストア処理部55のプログラムを、ホストアダプタ101および102上のそれぞれのCPUが実行し、それぞれ、上位装置からの要求(データの書き込み、読み出し)と、更新データの転送に関する処理を行うようにすることができる。
更には、ホストアダプタ101および102のI/O処理部51、更新データ送信部52、更新データ転送調停部53、更新データ受信部54、リストア処理部55を、それぞれICチップ等のハードウェアコンポーネントで構成し、これらを論理制御回路で接続して、ホストアダプタ101および102をそれぞれ、独立に作動可能なハードウェアコンポーネントとすることもできる。
ホストアダプタ101は、ネットワーク41に接続されている。図1の通信路71は、ネットワーク41を用いて構成されている。ホストアダプタ102は、ネットワーク42に接続されている。図1の通信路72は、ネットワーク42を用いて構成されている。ネットワーク41と42は、同一のネットワークであってもよい。
ディスクアダプタ109は、HDDの電源の制御と、論理ボリュームの制御を実行する。
ディスクアダプタ109のHDD電源制御部56および論理ボリューム制御部57をプログラムとして、CPU50とRAM58を用いて実行することができる。また、ディスクアダプタ109上にCPUおよびメモリを設けて、HDD電源制御部56および論理ボリューム制御部57のプログラムを実行するように構成すること、あるいは、ディスクアダプタ109のHDD電源制御部56および論理ボリューム制御部57をハードウェアコンポーネントとすることもできる。
共有メモリ103は、コントローラ100のCPU126、あるいは、ホストアダプタ101よび102およびディスクアダプタ109からアクセスできるメモリである。共有メモリ103には、HDDグループ管理情報104、論理ボリューム管理情報105、更新データグループ管理情報106、ペア情報107、更新データグループ進捗情報108が記録されている。
HDDグループ管理情報104は、正記憶システム1が有するHDDグループの情報を記録している。HDDグループとは、HDDの障害時に、HDDに記録されたデータを復元するための冗長データを含む、HDDの集合である。本実施形態では、HDDグループ内のHDDを連続した記憶領域みなした上で、その記憶領域を幾つかの領域に分割し、分割した領域を論理ボリュームとする。
論理ボリューム管理情報105は、正記憶システム1が有する論理ボリュームの構成に関する情報を記録している。
更新データグループ管理情報106は、正記憶システム1が有する更新データ論理ボリュームと、更新データグループに関する情報を記録している。更新データグループとは、正記憶システム1と副記憶システム2の更新データ論理ボリューム124および224の関連性と、その関連性の上にペアを成す論理ボリューム121と221を含む、ペアを管理するためのグループである。
ペア情報107は、正記憶システム1に構成されているペアの情報を記録している。
更新データグループ進捗情報108は、更新データを記録する更新データ論理ボリューム124のアドレスと、更新データを副記憶システム2に送信するために更新データを読み出す更新データ論理ボリューム124のアドレスを記録している。
キャッシュメモリ110は、ホストアダプタ101、102およびディスクアダプタ109の間でのデータの受渡しのために使用するメモリである。また、キャッシュメモリは、計算機9等の上位装置からの論理ボリュームへのアクセス要求を高速に(応答時間を短く)処理するためのキャッシュ領域としての用途もある。
図3は、副記憶システム2の構成を示す図である。副記憶システム2は、正記憶システム1とほぼ同様の構成であり、ホストアダプタ201および202、ディスクアダプタ209、共有メモリ203、キャッシュメモリ210を備えたコントローラ200と、HDD211、212、213、214、215、216、217、218とを有する。ホストアダプタ201および202、ディスクアダプタ209、共有メモリ203、キャッシュメモリ210は、バス219によりCPU226に接続されており、相互に通信可能となっている。ディスクアダプタ209は、HDD接続線220によってHDD上記8つのHDDに接続されており、これによりこれらのHDDの制御(データの読み出し、書き込み、電源切断、電源投入)が可能となっている。
副記憶システム2の各構成要素は正記憶システムの各構成要素と同様に動作し、正記憶システム1と同様に、コントローラ200のCPU226による制御、ホストアダプタ201及びホストアダプタ202上に設置したCPUによる制御、あるいは、ハードウェアコンポーネントとしてのホストアダプタ201、ホストアダプタ202による制御等が可能なように構成することができる。
副記憶システム2は、正記憶システム1と異なる構成としては、コントローラ200内の共有メモリ203内にHDD電源制御情報225が記録されている。また、ホストアダプタ201はネットワーク42を介して正記憶システム1に接続され、ホストアダプタ202は、ネットワーク43に接続されている。
図4は、正記憶システム1の論理ボリューム管理情報105の内容をテーブルの形式で示す図である。論理ボリューム管理情報105は、記憶システム1が有する論理ボリュームの構成に関する情報を記録している。
一つの論理ボリュームの構成に関する情報は、論理ボリュームID、論理ボリュームタイプ、論理ボリューム状態、容量、物理アドレスの各情報からなる。
論理ボリュームIDは、記憶システムが有する論理ボリュームを識別するための識別子(ID)である。本実施形態では、論理ボリュームIDは、記憶システム内で重複しない一意の整数とする。理解を助けるために、本明細書では論理ボリュームIDと、図1の符号の指示番号を一致させている(図1に記載のない論理ボリュームもある)。
論理ボリュームタイプは、論理ボリュームの用途を示す数値である。論理ボリュームタイプには、ホスト(10)、正更新データ(20)、副更新データ(21)がある(括弧内は、対応する数値)。計算機9からアクセスされる論理ボリュームの場合、論理ボリュームタイプはホスト(10)である。論理ボリュームが正更新データ論理ボリュームの場合、論理ボリュームタイプは正更新データ(20)である。論理ボリュームが副更新データ論理ボリュームの場合、論理ボリュームタイプは副更新データ(21)である。
論理ボリュームがペアの正論理ボリューム121である場合は、論理ボリュームタイプの値に1を加算し、副論理ボリュームである場合は、論理ボリュームタイプの値に2を加算する。
理解を助けるために、本明細書の図においては、論理ボリュームタイプの数値を記載する代りに、ホスト、ホスト(正)、ホスト(副)、更新データ(正)、更新データ(副)等と記載する。
論理ボリューム状態は、論理ボリュームの状態を示す数値である。論理ボリュームの状態には、正常(1)、異常(2)がある(括弧内は、対応する数値)。理解を助けるために、本明細書の図においては、論理ボリューム状態の数値を記載する代りに、正常、異常等と記載する。
論理ボリュームが正常な状態にあるとは、論理ボリュームに対してデータを正しく記録でき、またデータを正しく読み出せることを言う。論理ボリュームが異常な状態にあるとは、論理ボリュームが正常にない状態を言う。論理ボリュームの異常な状態は、HDD等の障害により発生しうる。
容量は、論理ボリュームに記録できる最大のデータ量である。
物理アドレスは、論理ボリュームを構成しているHDDグループの識別番号(ID)、および、HDDグループにおける論理ボリュームの開始アドレスである。図4では「HDDグループのID:開始アドレス」の形式で表記している。HDDグループのIDは、HDDグループを構成する先頭のHDDの識別番号と同一とする。
図4に示す例では、論理ボリューム121は、計算機9からアクセスされる論理ボリュームであり、ペアの正論理ボリューム121であり、ボリューム状態が正常、容量が100ギガバイト(GB)、HDDグループ111の先頭(アドレス0)からデータが格納されることを示している。また、論理ボリューム情報105には、その他の論理ボリューム124、122、123の構成に関する情報が記録されている。
図5は、副記憶システム2の論理ボリューム管理情報205の内容をテーブル形式で示す図である。論理ボリューム管理情報205のデータ形式は、正記憶システム1の論理ボリューム管理情報105と同じであるため、説明を省略する。
図6は、正記憶システム1のHDDグループ管理情報104に記録されている情報をデーブル形式で示す図である。HDDグループ管理情報104は、正記憶システム1の各HDDグループの構成情報を記録している。
各HDDグループの構成情報は、HDDグループID、開始HDD、HDD数、RAIDレベルの情報からなる。
HDDグループIDは、記憶システム内のHDDグループそれぞれに一意に割り当てる識別番号(ID)である。
開始HDDは、HDDグループを構成するHDDの、識別番号が最も小さいものの、HDD IDである。理解を助けるため、HDDグループIDと開始HDDは同じ値を取るものとしている。
HDD数は、HDDグループに含まれるHDDの数である。本実施形態では、どのHDDグループも、開始HDDによって示されるHDD IDから、HDD数に示される数の、HDD IDが連続しているHDDから構成されるものとする。
RAIDレベルは、HDDグループに適用されている、RAID(Redundant Array of Inexpensive Disks)によるデータ冗長化方式のレベルを示す数字である。
図6では、HDDグループ管理情報104は、HDD グループIDが111であり、開始HDDのIDが111、HDD数が4、RAIDレベルが5であるHDDグループの情報を記録している。また、HDDグループ管理情報104は、HDDグループIDが115であるHDDグループの情報を記録している。
ID111のHDDグループと、その論理ボリュームの構成は、図7のように表わすことができる。図7において、111、112、113、114の番号により指示される実線の矩形は、それぞれHDD111、112、113、114の記憶領域を表わしている。図中で、記憶領域のアドレスは、上から下へ付けられているとする。121と122の番号により指示される点線の矩形は、それぞれ論理ボリューム121と122が、HDD111、112、113、114の記憶領域から構成されていることを表わしている。論理ボリューム121は、HDDグループの先頭の記憶領域から100GB分の領域を占有し、論理ボリューム122は、HDDグループの(論理的な)アドレス0xC800000から100GB分の領域を占有している。
図8は、副記憶システム2のHDDグループ管理情報204に記録される情報を、テーブルの形式で示している。副記憶システム2のHDDグループ管理情報204は、正記憶システム1のHDDグループ管理情報104と形式は同じであるため、説明を省く。
図9は、正記憶システム1の更新データグループ管理情報106に記録する情報を、テーブル形式で示す図である。更新データグループ管理情報106は、正記憶システム1が制御している更新データグループの構成に関する情報を記録している。
一つの更新データグループの構成に関する情報は、更新データグループID、更新データグループ状態、ペアID、更新データ論理ボリュームID、更新番号の各情報から成る。
更新データグループIDは、正記憶システム1と副記憶システム2の間で、更新データグループを一意に識別するための識別番号(ID)である。
更新データグループ状態は、更新データグループの状態を示す数値である。更新データグループの状態には、正常(1)、異常(2)がある(括弧内は、状態を表す数値)。更新データグループが正常な状態とは、更新データグループを構成している更新データ論理ボリュームに対する更新データの書き込み、同更新データ論理ボリュームからのデータの読み出し、更新データの送信が正常に実行できる状態を言い、更新データグループが異常な状態とは、これらの動作を実行できないことを言う。更新データグループが異常な状態は、HDDの障害、ネットワークの障害等により発生しうる。
理解を助けるために、本明細書においては、更新データグループの状態を数値で記載する代りに、正常、異常等と記載する。
ペアIDは、更新データグループに関連付けられているペアの識別番号(ID)である。更新データグループにペアが関連付けられている場合、そのペアの更新データは、関連付けられた更新データグループを構成する更新データ論理ボリュームに記録される。
なお、ペアIDは、正記憶システム1と副記憶システム2の間で、ペアを一意に識別するために、共通の値を用いる。
更新データ論理ボリュームIDは、更新データグループを構成する更新データ論理ボリュームのIDである。更新データ論理ボリュームは、複数でもよい。
更新番号は、更新データ論理ボリュームに最後に記録された更新データを示す、更新データに割り振られた番号である。更新データには、連続した一意の番号を割り振る。
図9の例は、更新データグループIDが1の更新データグループは、状態が正常、関連付けられたペアのIDは1、更新データ論理ボリュームは更新データ論理ボリューム124であることを示している。
図10は、副記憶システム2の更新データグループ管理情報206に記録する情報を、テーブル形式で示す図である。更新データグループ管理情報206のデータ形式は、正記憶システム1の更新データグループ管理情報106と同じであるため、説明を省く。ただし、更新データグループ管理情報206の更新番号は、更新データ論理ボリュームから読みだすべき更新データの番号を記録する。
また、更新データグループ管理情報206には、正閾値と副閾値のデータを追加している。正閾値は、更新データグループに含まれる正更新データ論理ボリューム)の使用率(単位:%)に対する閾値である。副閾値は、更新データグループに含まれる、副更新データ論理ボリュームの使用率に対する閾値である。これらの値は、副更新データ論理ボリューム、および副更新データを構成するHDDの電源を投入するか否かを決定するために使用する。これらの値を使用した処理については、図18および図19を用いて後に詳細に説明する。
図11は、正記憶システム1のペア情報107に記録するペアに関する情報を、テーブル形式で示した図である。各ペア情報は、正記憶システム1と副記憶システム2の間の各ペアの構成に関する情報を記録する。
ペア情報107は、各ペアに関してペアlD、ペア状態、正記憶システムID、正論理ボリュームID、副記憶システムID、副論理ボリュームID、更新データグループIDの情報を記録する。
ペアIDは、正記憶システム1と副記憶システム2の間でペアを一意に識別するための識別番号(ID)である。
ペア状態は、ペアの状態を示す数値である。ペアの状態には、正常(1)、異常(2)、停止(3)がある(括弧内は、対応する数値)。ペアの状態が正常であるとは、ペアの更新データが正記憶システム1と副記憶システム2の間で正常に送受信できる状態を言う。ペアの状態が異常であるとは、ネットワークやHDD等の障害により、正記憶システム1と副記憶システム2の間で更新データを正常に送受信できない状態を言う。ペアの状態が停止であるとは、正論理ボリューム121へのデータの書き込みが、副論理ボリュームへ更新されない状態を言う。ただし、未送信の更新データに関しては、正記憶システム1と副記憶システム2の間で送受信が実行される可能性がある。
理解を助けるために、本明細書においては、ペア状態の数値を記載する代りに、正常、異常、停止等と記載する。
正記憶システムIDは、ペアの正論理ボリューム121を有する正記憶システム1の識別番号(ID)である。説明を簡単にするために、本明細書では、図1における正記憶システム1の符号の指示番号1を、正記憶システム1の識別番号とする。同様に、副記憶システム2の識別番号を、2とする。
正論理ボリュームIDは、ペアの正論理ボリュームのIDである。
副記憶システムIDは、ペアの副論理ボリュームを有する副記憶システム2の識別番号(ID)である。
副論理ボリュームIDは、ペアの副論理ボリュームのIDである。
更新データグループIDは、ペアに関連付けられている更新データグループの識別番号である。
図11の例では、ペアIDが1であるペアは、ペア状態が正常、ペアの正記憶システムが正記憶システムが正記憶システム1、ペアの正論理ボリュームが論理ボリューム121、ペアの副記憶システムが2、ペアの副論理ボリュームが論理ボリューム221、ペアの更新データグループが、ID 1で識別される更新データグループであることを示している。
副記憶システム2のペア情報207には、正記憶システム1との間で構成されているペア(ID 1)の情報を、正記憶システム1のペア情報107と同じ形式で記録する。
論理ボリューム管理情報105および205の論理ボリュームタイプ、更新データグループ管理情報106および206、ペア情報107および207は、ユーザが管理端末機器を用いてペアの構成を指示した時、その指示に基づき内容を変更する。
図12は、正記憶システム1の更新データグループ進捗情報108に記録する情報を、テーブル形式で示している。更新データグループ進捗情報108は、各更新データグループにおける更新データの送受信の進捗を管理するための情報である(副記憶システム2にも更新データグループ進捗情報208があるが、これは更新データの副論理ボリュームへの適用の進捗を管理する情報として使用する)。
更新データグループは、更新データグループID、書き込みアドレス、読み出しアドレスの情報を各更新データグループに関して記録する。
更新データグループIDは、更新データグループの識別番号である。
書き込みアドレスは、更新データを記録すべき更新データ論理ボリュームの識別番号と、そのアドレスからなる情報である。
読み込みアドレスは、更新データを最後に読み出した更新データ論理ボリュームの識別番号と、そのアドレスからなる情報である。
図12では、書き込みアドレスと読み込みアドレスを、「更新データ論理ボリュームの識別番号:更新データ論理ボリュームのアドレス」の形式で記載している。
本実施形態において、更新データ論理ボリュームをいわゆるリングバッファのように使用する。上記の書き込みアドレスは、更新データを次に記録するアドレスであり、更新データを記録するごとに加算する。また読み込みアドレスは、更新データを次に読み出すアドレスであり、更新データをそのアドレスから読み出すごとに加算する。これらのアドレスが更新データグループに含まれる記憶領域の容量を超えた場合には、適切な先頭アドレスにリセットする。
更新データグループが複数の更新データ論理ボリュームを含む場合、更新データ論理ボリュームの識別番号が小さい順に、連続した記憶領域として扱う。
図12の例では、更新データグループIDが1の更新データグループは、書き込みアドレスが更新データ論理ボリューム124の500、読み込みアドレスが更新データ論理ボリューム124の400となっている。
ここで、更新データグループの使用率について説明する。更新データグループの使用率とは、記憶システムにおいて、更新データグループに属する更新データ論理ボリュームに記録可能な更新データの最大数に対して、実際に記録されている更新データの数の比率のことを言う。この値は、記憶システム個別に算出する値であり、正更新データ論理ボリュームと副更新データ論理ボリュームの合算から算出する値ではない。
更新データグループに記録可能な更新データの最大値は、更新データグループに含まれる更新データ論理ボリュームの容量の合計と、更新データのデータ長(後で述べるように、更新データは固定長のデータである)により定まる。本実施形態では、更新データ論理ボリュームから読み出され、正常に処理された更新データは破棄されるものとする。更新データグループに記録されている更新データの数は、更新データグループ進捗情報の書き込みアドレスと読み込みアドレスから算出する。これらの値から、更新データグループの使用率を算出できる。
図13は、副記憶システム2の更新データグループ進捗情報208に記録する情報を、テーブル形式で示す図である。更新データグループ進捗情報208は、正記憶システム1の更新データグループ進捗情報108とデータ形式が同じであるため、説明を省略する。
図14は、副記憶システム2のHDD電源制御情報225に記録する情報を、テーブル形式で示す図である。HDD電源制御情報225は、副記憶システム2が有するHDDの個々に関して、HDD ID、最終アクセス時刻、電源投入回数の各情報を記録している。
HDD IDは、HDDを識別するためのIDである。
最終アクセス時刻は、HDDへのアクセス(データの書き込みまたはデータの読み出し)が発生した時刻である。この情報は、ディスクアダプタ209の論理ボリューム制御部57が、HDDへのアクセスを行う度に、その時刻を記録する。
電源投入回数は、電源が切断されたHDDへ電源を投入した回数であり、0以上の値をとる。また、この値は一定の時間間隔ごとに減少するようにしている。この理由は後述する。これらの処理はディスクアダプタ209のHDD電源制御部56が行う。
図15は、更新データのデータ形式800を示す図である。更新データは、更新番号、ペアID、アドレス、データ長、ライトデータの各情報を含む。
更新番号は、更新データに割り振られた、一意の連続した番号である。更新データの更新番号は、更新データを生成する際に、直前に生成した更新データの更新番号の次の値となるように決定する。更新番号として取り得る値には最大値を定め、前記方法により更新番号を決定する際、最大値よりも大きい値となる場合は、その更新番号を0とする。前記最大値は、更新データ論理ボリュームに記録される更新データの更新番号が重複しない程度の大きさとする。
ペアIDは、更新データの適用の対象である副論理ボリュームが構成しているペアの識別番号である。
アドレスは、更新データに基づく更新を実施する論理ボリュームの、更新適用の対象となる先頭アドレスである。
データ長は、更新データに含まれるライトデータの有効なデータ長である。
ライトデータは、更新時に副論理ボリュームに書き込むデータの内容である。
更新番号、ペアID、アドレス、データ長からなる情報を、更新データヘッダと呼ぶ。
更新データは固定長のデータである。更新データヘッダとライトデータを含むデータ量が、更新データの固定長のサイズよりも大きい場合、ライトデータを適切に二つ以上に分割し、二つ以上の更新データを生成する。逆に、更新データヘッダとライトデータを含むデータ量が、更新データの固定長のサイズよりも小さい場合、ライトデータの余りの領域には0をセットする。
以降、本実施形態1における処理の流れを、フローチャートを参照しつつ説明する。
図16は、正記憶システム1のI/O処理部51における、計算機9からのデータ書き込み指示を受けた際の処理の流れを示すフローチャートである。
正記憶システム1のホストアダプタ101は、計算機9よりデータの書き込みの要求を受けると、I/O処理部51にてステップS101からの処理を開始する。計算機9からの要求には、情報として、データを書き込む対象の論理ボリュームを指定する情報、書き込むデータ(ライトデータ)とそのデータ長、データの書き込みを開始する論理ボリュームのアドレスが含まれる。
以降の説明では、計算機9は、正論理ボリューム121へのデータの書き込みを要求することを想定する。以降、特に断わらない限り、I/O処理部51と言う場合はホストアダプタ101のI/O処理部を指す。また、計算機9よりデータの書き込みを指示された論理ボリュームを対象論理ボリュームと呼ぶ。
ステップS101において、I/O処理部51は、計算機9からの要求内容を、キャッシュメモリ110に記録する。ステップS102において、I/O処理部51は、対象論理ボリュームがデータを書き込める論理ボリュームであるかどうかを判定する。データを書き込める論理ボリュームとは、論理ボリュームタイプがホスト、ホスト(正)のいずれかである論理ボリュームを言う。この判定には、論理ボリューム管理情報105に記録されている、論理ボリューム121の論理ボリュームタイプ情報を使用する(図4参照)。
図4では、論理ボリューム121の論理ボリュームタイプは、ホスト(正)である。この場合、処理はステップS104に進む。もし論理ボリューム121の論理ボリュームタイプがホスト(副)等である場合、I/O処理部51は計算機9に対して、要求が無効であることを通知し処理を終了する(ステップS103)。
ステップS104において、I/O処理部51は、対象論理ボリュームの論理ボリューム状態が正常であるかどうかを判定する。この判定には、論理ボリューム管理情報105に記録されている、論理ボリューム121の論理ボリューム状態情報を使用する。
図4では、論理ボリューム121の論理ボリューム状態は正常である。この場合、処理はステップS106に進む。もし論理ボリューム121の論理ボリュームタイプが異常である場合、I/O処理部51は、計算機9に対して対象論理ボリュームが異常であることを通知して処理を終了する(ステップS105)。
ステップS106において、I/O処理部51は、対象論理ボリュームがペアの正論理ボリューム1であるかどうかを判定する。この判定には、論理ボリューム管理情報105に記録されている、論理ボリューム121の論理ボリュームタイプ情報を使用する。
図4では、論理ボリューム121の論理ボリュームタイプは、ホスト(正)であり、論理ボリューム121はペアの正論理ボリューム1である。この場合、処理はステップS107に進む。もし論理ボリューム121の論理ボリュームタイプがホスト(正)でないならば、処理はステップS108に進む。
ステップS107において、I/O処理部51は、計算機9からの要求から更新データを生成し、更新データ論理ボリュームに記録する。この処理の詳細については、図17を用いて後述する。ステップS108において、I/O処理部51は、対象論理ボリュームに対して、計算機9から指示されたデータを記録する。このステップでは、ディスクアダプタ109の論理ボリューム制御部57を使用する。I/O処理部51は、ステップS101において計算機9からの要求内容を記録したキャッシュメモリ110上のアドレスと、論理ボリュームへのデータの書き込みの要求を、ディスクコントローラ109の論理ボリューム制御部57に通知する。この要求を受けて、ディスクコントローラ109の論理ボリューム制御部57は、論理ボリューム管理情報106から論理ボリュームの構成(HDDの構成)を得、キャッシュメモリ110に記録されている計算機9からの要求内容を参照し、論理ボリューム121(を構成するHDD)にライトデータを記録する。
その後、計算機9に対して正常に処理が終了したことを通知して処理を終了する(ステップS109)。
図17は、図16のステップS107(更新データ記録処理)の詳細な処理の流れを示すフローチャートである。
更新データを記録する処理は、ステップS201より開始する。なお、説明を簡単にするために、以降は論理ボリューム、更新データ論理ボリュームが異常状態である場合の処理の説明を省略する。
ステップS201において、対象論理ボリュームが構成しているペアを特定する。この特定処理ではペア情報107を用いる(図11参照)。ペア情報107を探索し、正論理ボリュームIDが121であるペアを見つけ出す。
ステップS202において、前ステップで特定したペアと関連付けられている更新データグループを特定する。更新データグループは、ペア情報107を参照することで特定できる。
ステップS203)において、前ステップで特定した更新データグループの書き込みアドレスと読み込みアドレスを、更新データグループ進捗情報108から取得する。
ステップS204において、前ステップで取得した書き込みアドレスと読み込みアドレスから、更新データグループに含まれる更新データ論理ボリュームに、更新データ論理ボリュームに更新データを書き込めるだけの空き記憶領域があるかどうかを判定する。
空き記憶領域がない場合、ステップS205に進む。ステップS205は、更新データを書き込める記憶領域ができることを期待し、一定時間待機する。その後、再度ステップS204の判定を行う。空き記憶領域がない場合の別の処理方法として、ペアのペア状態を”停止”に変更し、更新データの記録を停止する、または副記憶システム2に対して更新データを取得するように要求する方法を採用することもできる。
ステップS206において、計算機9からのデータ書き込み要求に基づいて更新データを生成し、キャッシュメモリ110に記録する。
更新データを構成する諸情報を次のように決定する。更新番号を、106に記録されている、上記で特定した更新データグループの更新番号とする。ペアIDを、上記で特定したペアのIDとする。アドレスを、計算機9に指示されたアドレスとする。データ長を、計算機9に指示されたライトデータのデータ長とする。ライトデータを計算機9に指示されたライトデータとする。
上記の諸情報は、ステップS101でキャッシュメモリに記録した、計算機9からの要求内容から得る。
ステップS207において、I/O処理部51は、ディスクアダプタ109の論理ボリューム制御部57に対し、キャッシュメモリ110に記録した更新データを、前ステップで取得した書き込みアドレス(更新データ論理ボリュームとそのアドレス)に記録することを指示する。ディスクアダプタ109の論理ボリューム制御部57は、前記指示を受け、更新データ論理ボリュームに更新データを書き込む。
ステップS208において、I/O処理部51は、更新データグループ進捗情報108に記録されている更新データグループの書き込みアドレスを、次回の書き込みアドレス(次回更新データを書き込む更新データ論理ボリュームおよびそのアドレス)へ変更する。また、更新データグループ管理情報106の更新番号を次の値にセットする。次回の書き込みアドレスは、現在の書き込みアドレスに、更新データのデータ長を加算して算出する。
この加算の結果、次の書き込みアドレスが最大値を超える場合は、次の書き込みアドレスは、更新データグループの先頭の更新データ論理ボリュームと、その先頭アドレス(0)となる。書き込みアドレスの最大値は、更新データグループに含まれる更新データ論理ボリュームの容量により定まる。
以上の処理を実行した後、処理を終了する(ステップS209)。
対象論理ボリュームが複数のペアを構成している場合、各ペアに関して上記処理を繰り返す。
図18は、副記憶システム2において、正記憶システム1に記録されている更新データを取得し、副更新データ論理ボリュームへ記録する処理(更新データ転送処理)の流れを示すフローチャートである。
この処理では、副更新データ論理ボリュームを構成しているHDDの電源の状態に応じた処理を行う。この処理は、副記憶システム2の更新データ転送調停部53(以降、副更新データ転送調停部)が、全更新データグループを対象に一定の時間間隔で定期的に実行する。
ステップS301より、更新データ転送処理を開始する。
ステップS302において、副記憶システム2に設定されている更新データグループの内、一つを選択する。選択した更新データグループを、以降対象更新データグループと呼ぶ。
ステップS303において、対象更新データグループの更新データを、正記憶システム1から取得するか否かを決定する。本実施形態では、この判定方法の一つとして、正記憶システム1における対象更新データグループの使用率に基づく方法を採用する。以下、その処理の流れを説明する。
副更新データ転送調停部は、(正記憶システム1の)対象更新データグループの使用率を、正記憶システム1のホストアダプタ102の更新データ転送調停部53(以降、正更新データ転送調停部)より取得する。この使用率を、更新データグループ管理情報206に記録されている対象更新データグループの正閾値よりも大きいかどうかを判定する。もし大きければ、更新データを取得することとし、小さければ取得は行わない。
正更新データ転送調停部は、更新データグループ進捗情報108に記録されている書き込みアドレスと読み込みアドレス、および更新データグループに含まれる正更新データ論理ボリュームの容量の合計から、使用率を算出する。
ステップS304において、前ステップでの決定にしたがい、S305またはステップS307に進む。
ステップS305において、更新データを記録すべき更新データ論理ボリュームに関し、その更新データ論理ボリュームを構成しているHDDの電源を投入する。このステップを以下に示す。
副更新データ転送調停部は、更新データグループ進捗情報208に記録されている、対象更新データグループの書き込みアドレスから、更新データを記録すべき更新データ論理ボリュームを特定する。そして、その更新データ論理ボリュームを構成している個々のHDDに対して、電源が切断されていれば、その電源を投入するように、ディスクアダプタ209のHDD電源制御部56に指示する。論理ボリュームを構成するHDDは、論理ボリューム管理情報205より取得できる。各HDDの電源の状態は、ディスクアダプタ209のHDD電源制御部56が把握しており、副更新データ転送調停部は、HDDの電源状況を、ディスクアダプタ209に問い合わせることで認識することができる。
ディスクアダプタ209のHDD電源制御部56は、上記指示を受け、指定された論理ボリュームを構成するHDDの電源を投入する。
ステップS306において、正記憶システム1より更新データを取得し、更新データ論理ボリュームに書き込む。このステップを以下に示す。
副更新データ転送調停部は、正更新データ転送調停部に対して、対象更新データグループの更新データを送信するように要求する。この要求を受け、正更新データ調停部は、ホストアダプタ102の更新データ送信部52に対し、対象更新データグループの更新データの送信を指示する。以降、特に断わらない限り、更新データ送信部52は、ホストアダプタ102の更新データ送信部を指す。
更新データ送信部52は、対象更新データグループに含まれる正更新データ論理ボリュームに記録された更新データであって、最後に副記憶システム2に送信された更新データの次の更新データを、副記憶システム2へ送信する。このような更新データが記録された更新データ論理ボリュームとそのアドレスは、更新データグループ進捗情報108の読み込みアドレスより判断できる。
対象更新データグループに更新データが含まれていない場合、更新データ送信部52は、更新データが存在しないことを副記憶システム2に通知する。更新データの送信が終了した場合は、更新データグループ進捗情報108の読み込みアドレスの値を、送信した更新データが記録されていたアドレスに変更する。
上記のように正記憶システム1により送信され、副記憶システム2により受信された更新データは、副記憶システム2のホストアダプタ201の更新データ受信部54が、更新データ論理ボリュームに書き込む。
更新データ受信部54が更新データを受信し、適切な更新データ論理ボリュームに書き込む処理は、図17に示したステップS203〜S209とほぼ同じであるため説明を省略する。ただし、ステップS206のように更新データの生成は行わず、更新データ論理ボリュームに記録する更新データを、正記憶システム1から送信された更新データとする。
ステップS306の更新データ受信処理は、正更新データ論理ボリュームの使用率が、例えば5%未満程度となるまで繰り返す。
ステップS302からステップS306までの処理を、副記憶システム2の全ての更新データグループに対して実施する(ステップS307)。
以上のステップにより、更新データを取得する処理を完了する(ステップS308)。
上記のステップS303では、更新データを取得するか否かを、正記憶システム1における更新データグループの使用率に基づいて判断していたが、副記憶システム2において管理される情報や状態を判断のために使用することで、HDDの電源の制御をより効率的にすることができる。
HDDの電源の投入と切断を過剰に行うと、スピンアップ、スピンダウンによるスピンドルモータへの負荷を高め、HDDの寿命の短縮を招くことになる。そこで、HDDの電源の投入/切断の回数を低減するために、副更新データ論理ボリュームのHDDの電源がすでに投入されているならば、正記憶システム1における更新データグループの使用率に関わらず更新データを取得し、副更新データ論理ボリュームに記録する、という判断を行なってもよい。
副更新データ論理ボリューム224を構成するHDDの電源は、同じHDDグループに構成されている他の論理ボリューム(たとえば、論理ボリューム222)へのアクセスを原因として、投入されることがある。上記の判断方法は、このような状況を効果的に活用する。
図19は、更新データ論理ボリュームに記録されている更新データを、副論理ボリュームに記録されているデータに適用する処理(以降、リストア処理と言う)の処理の流れを示すフローチャートである。
リストア処理は、副記憶システム2のリストア処理部55が実行する。ホストアダプタ201と202の両方がリストア処理部55を持つが、どちらのリストア処理部55がリストア処理を実行してもよい。ここでは、ホストアダプタ201のリストア処理部55がリストア処理を実行するものとし、以降、特に断わらない限りは、リストア処理部55とは、ホストアダプタ201のリストア処理部55のことを指す。
リストア処理は、前述の更新データ取得処理の終了直後に実行する。したがって、リストア処理実行時には、更新データグループに含まれる(副記憶システム2の)HDDの電源が投入されている。
ステップS401より、リストア処理を開始する。
ステップS402において、副記憶システム2に構成されている更新データグループを、リストア処理の対象として一つ選択する。ここで選択した更新データグループを、対象更新データグループと呼ぶ。
ステップS403において、対象更新データグループのリストア処理を実行するか否かを判断する。この判断は、ここでは対象更新データグループの(副記憶システム2における)使用率、対象更新データグループを構成するHDDの電源の状態、対象更新データグループに関連づけられている副論理ボリュームの電源の状態を基にする。
更新データグループの使用率は、更新データグループ進捗情報208に記録されている、対象更新データグループの書き込みアドレスと読み込みアドレス、および対象更新データグループに記録可能な更新データの最大数から算出する。このように算出した使用率が、更新データグループ管理情報206に記録されている対象更新データグループの副閾値を超えているならば、その更新データグループのリストア処理を行うものとする。
ただし、対象更新データグループに関連づけられている副論理ボリュームのいずれかが、そのHDDの電源が投入されているならば、その副論理ボリュームに関しては、対象更新データグループの使用率に関わらず、リストア処理を行うものとする。これにより、HDDに対する電源投入/切断の回数を低減する。
ステップS404において、前ステップで対象更新データグループに対するリストア処理を実行することを決定したならば、ステップS405へ進む。そうでなければ、ステップS410へ進む。
ステップS405において、対象更新データグループの更新データ論理ボリュームに記録された更新データを、キャッシュメモリに読み出す。この処理は、図18に示した更新データの取得処理のステップS306において、正記憶システム1が、副記憶システム2に対して更新データを送信するために、正更新データ論理ボリュームから更新データを読み出す処理とほぼ同様である。リストア処理部55は、対象更新データグループに含まれる副更新データ論理ボリュームに記録された更新データであって、直前に読み出した更新データの次の更新データを読み出す。
ステップS406において、上記のように読み出した更新データに対して、その更新データヘッダから、更新を実施すべき副論理ボリュームを特定し、副論理ボリュームへの更新データの適用(リストア処理)を実行するかどうかを判断する。もし副論理ボリュームを構成するHDDの電源が切断されているならば、リストア処理のためにHDDの電源を投入する必要があるが、前述のように、HDDの電源の投入/切断を過剰に繰り返すことは好ましくない。そこで、ここでは、HDDの電源が投入されている副論理ボリュームに対してはリストア処理を実行し、HDDの電源が投入されていない副論理ボリュームに対しては、既定量(ユーザが設定できるものとする)以上の更新データが無く、かつ既定の目標復旧時点(RPO:Recovery Point Objective、ユーザが設定できるものとする)に達していない場合、リストア処理を延期することとする。
上記以外に、更新データグループ内の複数の副論理ボリューム間で、データの更新の順序をホストからの書き込みの順序と一致するようにし、データ間の時間的整合性を保つようにすることもできる。この場合、更新データの副論理ボリュームへの適用は、必ず更新データが更新データ論理ボリュームに記録された順序で行う。更新データグループにおける更新データ適用の過程で、処理中の更新データが対象としている副論理ボリュームのHDDの電源が切断されている場合がある。このような場合、更新データ転送調停部53が、当該更新データグループにおける以降の更新データの適用を延期するか、もしくは電源が切断されている当該HDDの電源を投入して、更新データの適用を続行するかを判断する。上記の判断は、更新データ転送調停部53が、更新データの量に基づいて行う。
更新データヘッダにはペアIDが含まれている(図15参照)。これを用いて、ペア情報207から、ペアの副論理ボリュームのIDを取得できる。
ステップS407において、副論理ボリュームへのリストア処理を行うならばステップS408へ進み、そうでなければステップS409へ進む。
ステップS408において、副論理ボリュームに対して、更新データの内容に基づきデータの更新を実行する。この処理は以下の通りである。
リストア処理55は、リストア処理を実行する対象の副論理ボリュームを構成するHDDの電源が切断されているならば、そのHDDの電源を投入するように、ディスクアダプタ209のHDD電源制御部56に対して指示を行う。
ディスクアダプタ209のHDD電源制御部56は、指定された論理ボリュームのHDDを特定し、その電源を投入する。HDDを特定するために、論理ボリューム管理情報205を参照する。
リストア処理部55は、ディスクアダプタ209の論理ボリューム制御部57に対して、ステップS405にてキャッシュメモリ210に記録した更新データに基づき、副論理ボリュームのデータを更新するように指示する。この指示のパラメータとして、キャッシュメモリ210上の更新データを記録しているアドレスと、副論理ボリュームのIDを含める。ディスクアダプタ209の論理ボリューム制御部57は、キャッシュメモリ210に記録されている更新データが含むライトデータを、上記IDにより指定された副論理ボリュームの、更新データに記録されているアドレスから書き込む。
ステップS409において、更新データの副論理ボリュームへの適用により、対象更新データグループの使用率が、既定値(たとえば5%、ユーザが設定できるものとする)以下になったかどうかを判定する。使用率が既定値以上である場合は、残りの更新データに関する処理を行うためにS405へ戻る。
ステップS402からステップS409までの処理を、副記憶システム2の全ての更新データグループに対して実施する (ステップS410)。
図20は、HDDの電源を定期的に切断する処理(HDD電源切断処理)の流れを示すフローチャートである。この処理は、副記憶システム2のディスクアダプタ209のHDD電源制御部56が実行する。主記憶システム1にて同様の処理を行うこともできる。
HDD電源切断処理は、一定の時間間隔で、副記憶システム2が有する全てのHDDを対象として実行する。
ステップS501より、HDD電源切断処理を開始する。
ステップS502において、電源切断処理の対象とするHDDのIDを、HDD電源制御情報225に記録されているHDD IDの中から選択する。ステップS502からステップS507までの処理は、HDD電源制御情報225に記録されているすべてのHDD IDを対象とするループ処理であり、HDD電源制御情報225に記録されている順で、ループの先頭に戻る度に毎回異なるHDD IDを選択する。選択したHDDを対象HDDと呼ぶ。
ステップS503において、対象HDDが最後にアクセスされた時刻から、一定時間(例えば15分、ユーザが設定できるものとする)が経過しているかどうかを判定する。この判定は、HDD電源制御情報225に記録されている最終アクセス時刻と、現在時刻を比較することにより行う。一定時間が経過していればステップS504に進み、そうでなければステップS506に進む。
ステップS504において、HDD電源制御情報225に記録されている、対象HDDのHDD電源投入回数が、一定値(例えば4、ユーザが設定できるものとする)以下かどうかを判定する。一定値以下であれば、ステップS505に進み、そうでなければ、ステップS506に進む。このステップの目的は、HDDに対する過剰な電源の投入/切断の繰り返しを防止することである。HDD電源制御情報225のHDD電源投入回数情報は、HDDの電源投入回数を制限するために記録している値であり、HDDの電源が投入されるごとに1加算され、一定の時間間隔(例えば2時間、ユーザが設定できるものとする)で1減算されるようにしている。
ステップS505において、対象HDDの電源を切断する。
ステップS506において、HDD電源制御情報225のHDD電源投入回数情報に記録されている値を、1減算する時刻に達しているか否かを、判定する。この時刻に達しているならばステップS507に進み、そうでなければステップS508に進む。この判定は、例えば、偶数の時間(14:00など)の時刻を超たかどうかを毎回検査する方法により実施する。
ステップS507において、対象HDDの、HDD電源制御情報225のHDD電源投入回数に記録されている値を1減算する。
ステップS508において、HDD電源制御情報225に記録されているHDDについて、ステップS503からS507までの処理を行なったかどうかを判定する。全てのHDDについて処理を行ったならば、HDD電源切断処理を終了し(ステップS509)、そうでなければ、ステップS502に戻って、次のHDDを選択する。
次に、本発明の第二の実施形態を、図21を参照しながら説明する。
図21は、本発明の第二の実施形態の概要を表わすブロック図である。
第二の実施形態については、第一の実施形態との違いのみを示す。第二の実施形態と、第一の実施形態との違いは以下の通りである。
第二の実施形態では、更新データ論理ボリュームを使用しない非同期リモートコピーを使用する。第二の実施形態におけるI/O処理部51では、計算機9からのデータ書き込み要求に基づく更新データを生成しない。その代りに、正論理ボリューム121へデータを書き込む際に、書き込むデータと、正論理ボリューム121のどのアドレスにデータを記録したかの情報を、キャッシュメモリ110上のログ125に記録する。
更新データは、正記憶システム1から副記憶システム2へ送信するときに、正記憶システム1の更新データ送信部52により生成される。更新データ送信部52は、ログ125と正論理ボリューム1に記録されているデータより、更新データを生成する。
第一の実施形態では、更新データ論理ボリュームの使用率に基づき、更新データを送信するタイミングを決定していた。第二の実施形態では、正論理ボリューム121に記録されているデータの内、前回更新データを副記憶システム2に送信した時点から(計算機9からの要求により)変更されたものの、全データ量に占める割合が一定の値を超えた時点を、更新データを送信するタイミングとする。ログ125を参照することで、正論理ボリューム121のデータの更新された割合を判定できる。
上記、更新データ送信のタイミングに至ると、正記憶システム1の更新データ転送調停部53aは、副記憶システム2の更新データ転送調停部53に対して、更新データの送信を開始することを通知する。副記憶システム2の更新データ転送調停部53は、この通知を受けると、更新データの適用対象である副論理ボリューム221を構成するHDDの電源を(電源が切断されているならば)投入する(破線矢印67、64)。
ログ125と正論理ボリューム121に記録されているデータより生成された更新データは正記憶システム1の更新データ送信部52により送信され、副記憶システム2の更新データ受信部54により受信される。更新データに含まれている正論理ボリューム121からのデータは副論理ボリューム221に記録される。
あるいは、副記憶システム2は、すでにHDDの電源が投入されている副論理ボリュームへ優先的に更新データを適用するために、上記通知への返答において、更新データを優先的に送信することを所望するペアを、正記憶システム1へ通知してもよい。また、更新データを優先的に送信することを所望するペア、もしくは所望しないペアを、更新データの送信のタイミングに至る前に、副記憶システム2が、正記憶システム1へ通知しておいてもよい。この通知は、副論理ボリュームを構成するHDDの電源が投入された、または切断されたことを契機とする。このような状況は、副論理ボリュームを構成しているHDDグループ上に構成されている別の論理ボリュームに対して、計算機9等の上位装置からアクセスされる事等により発生する。
次に、本発明の第三の実施形態を、図22を参照しながら説明する。
図22は、本発明の第三の実施形態の概要を表わすブロック図である。
第三の実施形態では、第二の実施形態における副記憶システム2(以降、記憶システム(2)と表記)を、仮想化機能を備える記憶システムとする。仮想化機能とは、外部記憶システムの論理ボリュームの一つまたは複数から、仮想的な論理ボリューム(仮想論理ボリューム)を形成する機能である。仮想論理ボリュームへのアクセスは、記憶システム(2)が、それを構成する外部の論理ボリュームへのアクセス要求に変換した上で、外部記憶システムへ要求することで、仮想ボリュームを実現する。記憶システム(2)の副論理ボリューム222は、記憶システム3(以降、記憶システム(3)と表記)の論理ボリューム321から形成される仮想ボリュームとなっている。記憶システム(2)と、外部記憶システム(3)の間には、通信路73が形成されている。
第三の実施形態では、記憶システム(2)のHDD電源制御部56は、(仮想)論理ボリューム222に対する電源制御(電源の切断または投入)の要求を受けた場合、記憶システム(3)に対して、仮想論理ボリューム222を形成している論理ボリューム321の電源の制御を要求する(破線矢印67)。記憶システム(3)は、HDD電源制御部56cを備えており、HDD電源制御部56cは、前記電源制御の要求を受けて、論理ボリューム321を構成しているHDD311の電源を制御する(破線矢印66)。
記憶システム(2)を、HDDを内部に持たない、仮想化機能のみを備える仮想化システムに置き換えて実施してもよい。また、第一の実施形態のように、更新データ論理ボリュームを使用したリモートコピーを使用し、更新データ論理ボリュームないしは副論理ボリュームないしはそれらの両方を仮想論理ボリュームとして、本発明を実施することもできる。
第一の実施形態において、更新データの送信を、副記憶システム2が要求することで開始しているが、正記憶システム1が、副記憶システム2に更新データを送信することを通知することで、更新データの送信を開始してもよい。また、正記憶システム1が、副記憶システム2に、更新データの送信を通知することなく、副記憶システム2に更新データを送信するようにもできる。
本明細書に述べた各実施形態では、更新データを送信するタイミングを、主としてデータ量に基づき決定している。上記タイミングの決定の判断を行うための情報として、ある時点でのデータ量を用いるほかに、データ量の増加率を算出し、用いることができる。また、データ量およびデータ量の増加率と時刻の関係を統計的に算出してHDDの電源の投入が効率的となる時刻を計算し、HDDの電源の制御を効率的にすることもできる。また、HDDの電源を投入する時刻を、ユーザが記憶システムに事前に設定しておき、記憶システムは、この時刻に至ってHDDの電源を投入するようにしてもよい。
そのほか、ユーザがペア状態を変更した時点を、更新データを送信するタイミングとすることもできる。また、ユーザが、正論理ボリューム121への計算機9からのデータの書き込みが当面ないと判断し、正記憶システム1および副記憶システム2に対して更新データの転送を指示できる仕組を設けることもできる。また、特定の時刻や時間間隔で、副記憶システム2が必ず更新データを受領するようにし、RPOが過去に成り過ぎることを防止することがより好ましい。
本明細書に述べた各実施形態では、HDDの電源を切断するタイミングを、HDDへのアクセスの有無により判断しているが、図18や図19に示した処理が終了した時点、(副更新データ論理ボリュームや、副論理ボリュームへのデータの書き込みが終了した時点)で、HDDの電源を切断するようにしてもよい。
本発明の一実施形態の論理的な構成を示す図である。 正記憶システム1の構成を示す図である。 副記憶システム2の構成を示す図である。 正記憶システム1の論理ボリューム管理情報を示す図である。 副記憶システム2の論理ボリューム管理情報を示す図である。 正記憶システム1のHDDグループ管理情報を示す図である。 正記憶システム1のHDDグループの一つを表わす図である。 副記憶システム2のHDDグループ管理情報を示す図である。 正記憶システム1の更新データグループ管理情報を示す図である。 副記憶システム2の更新データグループ管理情報を示す図である。 正記憶システム1のペア情報を示す図である。 正記憶システム1の更新データグループ進捗情報を示す図である。 副記憶システム2の更新データグループ進捗情報を示す図である。 副記憶システム2のHDD電源制御情報を示す図である。 更新データの形式を示す図である。 上位装置からの書き込み要求に対する処理の内容を示すフローチャートである。 更新データを正更新データ論理ボリュームへ記録する処理の内容を示すフローチャートである。 更新データを受信し、副更新データ論理ボリュームへ記録する処理の内容を示すフローチャートである。 更新データ論理ボリュームに記録されている更新データを副論理ボリュームに記録されているデータに適用するリストア処理の流れを示すフローチャートである。 HDDの電源を切断する処理の内容を示すフローチャートである。 本発明の第二の実施形態の論理的な構成を示す図である。 本発明の第三の実施形態の論理的な構成を示す図である。
符号の説明
1 正記憶システム
2 副記憶システム
3 記憶システム
9 計算機
41,42、43 ネットワーク
51 I/O処理部
52 更新データ送信部
53,53a,53b 更新データ転送調停部
54 更新データ受信部
55 リストア処理部
56,56b,56c HDD電源制御部
57 論理ボリューム制御部
71,72,73 通信路
100,200 コントローラ
101,102,201,202 ホストアダプタ
103,203 共有メモリ
104,204 HDDグループ管理情報
105,205 論理ボリューム管理情報
106,206 更新データグループ管理情報
107,207 ペア情報
108,208 更新データグループ進捗情報
109,209 ディスクアダプタ
110,210 キャッシュメモリ
111〜118,211〜218 記憶装置
119,219 バス
120,220 HDD接続線
121 正論理ボリューム
124 正更新データ論理ボリューム
125 ログ
126 CPU
221 副論理ボリューム
222 仮想論理ボリューム
224 副更新データ論理ボリューム
225 HDD電源制御情報
226 CPU
311 外部記憶システム
321 論理ボリューム

Claims (3)

  1. 第一の論理ボリュームを有する第一の記憶システムと、
    前記第一の記憶システムに接続され、第二の論理ボリュームと第三の論理ボリュームを有する第二の記憶システムと、
    前記第一の記憶システムに接続された上位装置と、
    を有する計算機システムにおいて、
    前記上位装置は、前記第一の記憶システムへデータを送信する送信部を備え、
    前記第一の記憶システムは、前記データを前記第一の論理ボリュームへ記録し、前記データを含む更新データを生成する第一の処理部を備え、
    前記第二の記憶システムは、前記第一の記憶システムから前記更新データを受領する契機において、前記第二の論理ボリュームを構成する記憶装置の電源が切断されていれば、前記第二の論理ボリュームを構成する記憶装置の電源を投入する電源制御部と前記更新データを前記第二の論理ボリュームに記録する調停部とを備え、
    さらに前記第二の記憶システムは、前記第二の論理ボリュームに記録された更新データを読み出して前記第三の論理ボリュームへ記録する第二の処理部を備えている計算機システムであって、
    前記第二の記憶システムは、前記記憶装置の電源を切断する契機に至った場合に、前記電源制御部により、前記記憶装置の電源を切断し、前記電源を切断する契機は、前記記憶装置に対する最終アクセス時刻または規定の時間間隔以内の電源投入回数に基づき決定することを特徴とする計算機システム。
  2. 第一の論理ボリュームを有する第一の記憶システムと、
    前記第一の記憶システムに接続され、第二の論理ボリュームと第三の論理ボリュームを有する第二の記憶システムと、
    前記第一の記憶システムに接続された上位装置と、
    を有する計算機システムのデータ複製方法において、
    前記上位装置は、前記第一の記憶システムへデータを送信し、
    前記第一の記憶システムは、前記データを前記第一の論理ボリュームへ記録し、前記データを含む更新データを生成し、
    前記第二の記憶システムは、前記第一の記憶システムから前記更新データを受領する契機において、前記第二の論理ボリュームを構成する記憶装置の電源が切断されていれば、前記第二の論理ボリュームを構成する記憶装置の電源を投入し、前記更新データを前記第二の論理ボリュームに記録し、
    さらに前記第二の記憶システムは、前記第二の論理ボリュームに記録された更新データを読み出して前記第三の論理ボリュームへ記録する計算機システムのデータ複製方法であって、
    前記第二の記憶システムは、前記記憶装置の電源を切断する契機に至った場合に、前記第二の記憶システムの電源制御部により、前記記憶装置の電源を切断し、前記電源を切断する契機は、前記記憶装置に対する最終アクセス時刻または規定の時間間隔以内の電源投入回数に基づき決定することを特徴とする計算機システムのデータ複製方法
  3. 請求項記載の計算機システムのデータ複製方法であって、
    前記記憶装置の電源が投入されている第二の論理ボリュームに対してはリストア処理を実行し、前記記憶装置の電源が投入されていない第二の論理ボリュームに対しては、ユーザが設定できる既定量以上の更新データが無く、かつユーザが設定できる既定の目標復旧時点に達していない場合、リストア処理を延期することを特徴とする計算機システムのデータ複製方法
JP2005335655A 2005-11-21 2005-11-21 計算機システム及び計算機システムのデータ複製方法 Expired - Fee Related JP4813872B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005335655A JP4813872B2 (ja) 2005-11-21 2005-11-21 計算機システム及び計算機システムのデータ複製方法
US11/342,833 US7627610B2 (en) 2005-11-21 2006-01-31 Computer system and method of reproducing data for the system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005335655A JP4813872B2 (ja) 2005-11-21 2005-11-21 計算機システム及び計算機システムのデータ複製方法

Publications (3)

Publication Number Publication Date
JP2007141047A JP2007141047A (ja) 2007-06-07
JP2007141047A5 JP2007141047A5 (ja) 2008-06-05
JP4813872B2 true JP4813872B2 (ja) 2011-11-09

Family

ID=38203811

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005335655A Expired - Fee Related JP4813872B2 (ja) 2005-11-21 2005-11-21 計算機システム及び計算機システムのデータ複製方法

Country Status (2)

Country Link
US (1) US7627610B2 (ja)
JP (1) JP4813872B2 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9383938B2 (en) * 2006-04-18 2016-07-05 International Business Machines Corporation Method, system, and apparatus for re-conveying input/output operations utilizing a sequential-access data storage device secondary communication port
GB0616375D0 (en) * 2006-08-17 2006-09-27 Ibm An apparatus for facilitating disaster recovery
JP5022773B2 (ja) 2007-05-17 2012-09-12 株式会社日立製作所 ジャーナルを利用したリモートコピーのコピー先となるストレージシステムの消費電力を節約する方法及びシステム
WO2009004266A1 (fr) * 2007-06-29 2009-01-08 France Telecom Procede de stockage
US7814351B2 (en) * 2007-06-28 2010-10-12 Seagate Technology Llc Power management in a storage array
JP4481338B2 (ja) 2008-03-28 2010-06-16 株式会社日立製作所 バックアップシステム、ストレージ装置及びデータのバックアップ方法
JP5379988B2 (ja) * 2008-03-28 2013-12-25 株式会社日立製作所 ストレージシステム
JP4893731B2 (ja) 2008-12-25 2012-03-07 富士通株式会社 通信制御装置
WO2013046253A1 (en) * 2011-09-27 2013-04-04 Hitachi, Ltd. Storage system and volume pair synchronization method
US9244627B2 (en) * 2013-10-15 2016-01-26 Synetic Technologies, Inc. Secure data erasure system for erasing a plurality of data storage devices

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7281031B1 (en) * 2000-03-22 2007-10-09 Emc Corporation Method and apparatus for providing additional resources for a host computer
US6587970B1 (en) * 2000-03-22 2003-07-01 Emc Corporation Method and apparatus for performing site failover
US6898727B1 (en) * 2000-03-22 2005-05-24 Emc Corporation Method and apparatus for providing host resources for an electronic commerce site
JP2002182961A (ja) * 2000-12-13 2002-06-28 Nec Corp データベースの同期化システムとその同期化の方法
US7007141B2 (en) * 2001-01-30 2006-02-28 Data Domain, Inc. Archival data storage system and method
US7152078B2 (en) * 2001-12-27 2006-12-19 Hitachi, Ltd. Systems, methods and computer program products for backup and restoring storage volumes in a storage area network
US7181581B2 (en) * 2002-05-09 2007-02-20 Xiotech Corporation Method and apparatus for mirroring data stored in a mass storage system
JP2003050675A (ja) * 2002-07-15 2003-02-21 Hitachi Ltd データ多重化システム
US7035972B2 (en) 2002-09-03 2006-04-25 Copan Systems, Inc. Method and apparatus for power-efficient high-capacity scalable storage system
JP4254178B2 (ja) * 2002-09-11 2009-04-15 富士ゼロックス株式会社 分散格納制御装置及び方法
JP2004139217A (ja) * 2002-10-16 2004-05-13 Hewlett Packard Co <Hp> データベースの移行方法
JP4564721B2 (ja) * 2003-04-22 2010-10-20 Necシステムテクノロジー株式会社 ディスクアレイシステム
JP4462852B2 (ja) * 2003-06-23 2010-05-12 株式会社日立製作所 ストレージシステム及びストレージシステムの接続方法
JP4124348B2 (ja) * 2003-06-27 2008-07-23 株式会社日立製作所 記憶システム
US7219201B2 (en) * 2003-09-17 2007-05-15 Hitachi, Ltd. Remote storage disk control device and method for controlling the same
JP4574162B2 (ja) * 2003-11-20 2010-11-04 キヤノン株式会社 データ記憶装置
JP4486348B2 (ja) 2003-11-26 2010-06-23 株式会社日立製作所 ドライブの稼働時間を抑止するディスクアレイ
US7096325B2 (en) * 2004-03-29 2006-08-22 Hitachi, Ltd. Method and apparatus for multistage volume locking
US20050235091A1 (en) * 2004-04-20 2005-10-20 Caph Chen USB hub with built-in storage device
US7058731B2 (en) * 2004-08-03 2006-06-06 Hitachi, Ltd. Failover and data migration using data replication
JP4646574B2 (ja) * 2004-08-30 2011-03-09 株式会社日立製作所 データ処理システム

Also Published As

Publication number Publication date
JP2007141047A (ja) 2007-06-07
US20070180211A1 (en) 2007-08-02
US7627610B2 (en) 2009-12-01

Similar Documents

Publication Publication Date Title
JP4813872B2 (ja) 計算機システム及び計算機システムのデータ複製方法
JP3997061B2 (ja) 記憶サブシステムおよび記憶サブシステムの制御方法
JP5036158B2 (ja) 情報処理システム及び情報処理システムの制御方法
JP4986045B2 (ja) 二重アクティブ・コントローラ内のライト・キャッシュ・データのフェイルオーバーおよびフェイルバック
US7669022B2 (en) Computer system and data management method using a storage extent for backup processing
JP5090098B2 (ja) Nasの消費電力を削減する方法及びその方法を用いた計算機システム
US7461201B2 (en) Storage control method and system for performing backup and/or restoration
US8321622B2 (en) Storage system with multiple controllers and multiple processing paths
JP2002259063A (ja) バックアップ処理可能な記憶システム
KR101410596B1 (ko) 정보 처리 장치, 카피 제어 프로그램 및 카피 제어 방법
CN104750434A (zh) 存储集群中的自适应功率保存
JP2013257801A (ja) サーバコンピュータおよびドライブ制御装置
JP2005174196A (ja) 複数の記憶システムを有するデータ処理システム
TWI531901B (zh) 群組表資料沖除技術
JP2009122873A (ja) ストレージシステム間でのリモートコピーを管理する装置
JP2015052844A (ja) コピー制御装置,コピー制御方法及びコピー制御プログラム
JP2008140142A (ja) 情報処理システム
US7890715B2 (en) Suspension of an asynchronous remote copy pair system having a primary controller and a remote controller
JP2007058286A (ja) 記憶装置のフォーマットを不要としたストレージシステム及び記憶制御方法
JP2010211318A (ja) デバイス管理装置、デバイス初期化方法、デバイス初期化プログラムおよびデバイスシステム
WO2017081748A1 (ja) ストレージシステム、及び、ストレージ管理方法
JP2006260141A (ja) 記憶システムの制御方法、記憶システム、記憶制御装置、記憶システムの制御プログラム、情報処理システム
WO2019043815A1 (ja) ストレージシステム
WO2022033269A1 (zh) 数据处理的方法、设备及系统
JP4398596B2 (ja) ディスクアレイ装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080422

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110119

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110823

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110825

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees