JP2019197602A - ストレージ管理装置及びストレージ管理プログラム - Google Patents

ストレージ管理装置及びストレージ管理プログラム Download PDF

Info

Publication number
JP2019197602A
JP2019197602A JP2019155095A JP2019155095A JP2019197602A JP 2019197602 A JP2019197602 A JP 2019197602A JP 2019155095 A JP2019155095 A JP 2019155095A JP 2019155095 A JP2019155095 A JP 2019155095A JP 2019197602 A JP2019197602 A JP 2019197602A
Authority
JP
Japan
Prior art keywords
copy
storage device
storage
volume
lun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019155095A
Other languages
English (en)
Inventor
昭夫 山口
Akio Yamaguchi
昭夫 山口
誠 八代
Makoto Yashiro
誠 八代
優紀 田村
Yuki Tamura
優紀 田村
近藤肇
Hajime Kondo
肇 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2019155095A priority Critical patent/JP2019197602A/ja
Publication of JP2019197602A publication Critical patent/JP2019197602A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Retry When Errors Occur (AREA)

Abstract

【課題】フェイルオーバ発生時に処理中のコピー指示に関して新たにアクティブになったストレージ装置3で正しいLUNを用いてコピーを行うこと。【解決手段】バックアップ部10が、ストレージ装置3に故障が発生した際に処理が他のストレージ装置3に引継がれない操作ボリュームに対してコピー元及びコピー先のLUNを指定してコピーを指示する。そして、ストレージ装置3のコピー処理部31aが操作ボリュームに対するコピー処理を受けると、指定されたコピー元及びコピー先のLUNを用いてコピー処理を実行する。そして、バックアップ部10は、フェイルオーバの発生でコピー処理が他のストレージ装置3に引継がれることなくエラーが発生した場合に、コピーペアの2つのボリュームと各々クラスタペアを構成するボリュームのLUNを取得する。そして、バックアップ部10は、取得したLUNを用いてコピー処理を再実行する。【選択図】図9

Description

本発明は、ストレージ管理装置及びストレージ管理プログラムに関する。
ストレージ装置の信頼性を向上させる技術の1つに、ストレージクラスタがある。ストレージクラスタは、複数のストレージ装置をクラスタ構成とし、装置レベルの故障で1つストレージ装置がダウンした場合にも、他のストレージ装置で業務を継続できるようにするフェイルオーバを実現する技術である。
ストレージクラスタは、ボリューム単位に設定することが可能で、故障が発生したストレージ装置のWrite/Read I/Oを他のストレージ装置に自動的に引継ぐ。したがって、ユーザは異常が発生したことを意識せずに業務を継続することが可能となり、リカバリ時間の短縮とストレージ管理者の作業負担の軽減が図れる。
ストレージクラスタのボリュームは、例えば、ホストに同じボリュームの別パスとして見せることで実現される。ここで、「ホスト」とは、ストレージ装置にアクセスを行うサーバなどの装置であり、「パス」とは、ホストとストレージ装置との間の通信経路である。ストレージクラスタは、運用中のパスを「アクティブ」、待機側のパスを「スタンバイ」とし、アクティブのストレージ装置のみアクセス可能とする。運用中のストレージ装置がダウンした場合は、ストレージクラスタは、パス状態を変更して、待機側のパスをアクティブとし、Write/Read I/Oを自動的に引継ぐ。
なお、ストレージクラスタに関して、ストレージクラスタリング環境でのホスト書き込み先ボリュームの切り替え指示と非同期に連携して、非同期リモートコピーのペア操作を行うことで、ディザスタリカバリ用途の非同期リモートコピーを実現する技術がある。
また、ボリューム切替に関して、切替元ボリュームのホスト内IDと切替先ボリュームのストレージ内IDとを対応付けた切替テーブルを参照して切替元ボリュームへのアクセス要求を切替先ボリュームに切替えることで、ホスト内IDの枯渇を抑制する技術がある。
特開2011−76130号公報 特開2006−309638号公報
ボリュームに対する操作を行う際、ホストは、操作対象をストレージ装置に共通に設定されたデバイス名からLUN(Logical Unit Number)に変換して、LUNで操作対象を指定する。ここで、「LUN」とは、ストレージ装置内の記憶装置を論理的に識別する識別番号である。
また、ストレージクラスタのボリュームを構成する複数のストレージ装置では、アクティブとスタンバイでデバイス名は一致させるが、LUNについては一致させなくてもよい。その理由は、アクティブとスタンバイのストレージ装置でLUNを一致させるには、両ストレージ装置内を同じ構成にする必要があり、管理者の負担が著しく増加するためである。したがって、現状では、アクティブ側とスタンバイ側との対応関係にあるストレージ装置同士であっても、ほとんどの場合LUNを一致させていない。
しかし、ストレージクラスタのボリュームのLUNを指定した操作を行う時にフェイルオーバが発生すると、アクティブ側とスタンバイ側の対応するボリューム同士のLUNが一致しないため、フェイルオーバ後に誤ったボリュームが操作されるという問題がある。
本発明は、1つの側面では、フェイルオーバ発生時に正しいボリュームを操作できるようにすることを目的とする。
本願の開示するストレージ管理装置は、1つの態様において、第1のストレージ装置にエラーが発生すると第1のストレージ装置への操作をクラスタペアを用いて第2のストレージ装置へ引継いで管理するストレージ管理装置である。前記ストレージ管理装置は、記憶部と判定部とコピー処理部とを備える。前記判定部は、前記第1のストレージ装置と前記第2のストレージ装置のうちアクティブな装置を判定する。前記コピー処理部は、スタンバイ中の前記第2のストレージ装置に操作が引き継がれない操作ボリュームに対するアクティブな前記第1のストレージ装置でのコピー操作であって、前記第1のストレージ装置においてコピー元を識別する第1のコピー元LUNから、前記第1のストレージ装置においてコピー先を識別する第1のコピー先LUNへのコピー操作においてエラーが発生した際に、前記第1のストレージ装置の前記第2のストレージ装置へのフェイルオーバの発生によりアクティブとなった前記第2のストレージ装置において第1のコピー元LUN及び第1のコピー先LUNの各々のクラスタペアを識別する第2のコピー元LUN及び第2のコピー先LUNを前記記憶部に格納されたコピーペア情報から取得して、アクティブな前記第2のストレージ装置での前記コピー操作のリトライを指示する。
1実施態様によれば、フェイルオーバ発生時に正しいボリュームを操作できる。
図1は、クラスタペア及びコピーペアを説明するための図である。 図2は、コピーペア間のコピーを説明するための図である。 図3は、コピー開始要求中のフェイルオーバを説明するための図である。 図4は、コピー開始要求中のフェイルオーバの問題を説明するための図である。 図5は、操作ボリュームを説明するための図である。 図6は、操作ボリュームを介したコピーを説明するための図である。 図7は、操作ボリュームに対して指示されたコピー開始要求中のフェイルオーバを説明するための図である。 図8は、フェイルオーバ後の操作ボリュームを介したコピーを説明するための図である。 図9は、実施例に係る情報処理システムの構成を示す図である。 図10は、コピーペア情報テーブルの一例を示す図である。 図11は、操作ボリューム情報テーブルの一例を示す図である。 図12Aは、実施例に係る情報処理システムの処理のフローを示す第1のフローチャートである。 図12Bは、実施例に係る情報処理システムの処理のフローを示す第2のフローチャートである。 図12Cは、実施例に係る情報処理システムの処理のフローを示す第3のフローチャートである。 図12Dは、実施例に係る情報処理システムの処理のフローを示す第4のフローチャートである。 図12Eは、実施例に係る情報処理システムの処理のフローを示す第5のフローチャートである。 図13は、サーバのハードウェア構成を示す図である。 図14は、制御部のハードウェア構成を示す図である。
以下に、本願の開示するストレージ管理装置及びストレージ管理プログラムの実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
まず、クラスタペア及びコピーペアについて説明する。「クラスタペア」とは、ストレージクラスタのペアとなるボリュームである。「コピーペア」とは、コピー元とコピー先のボリュームのペアであり、例えばバックアップにおいて、バックアップされるボリュームとバックアップボリュームとのペアである。
図1は、クラスタペア及びコピーペアを説明するための図である。図1において、A及びBは、ストレージクラスタを構成するストレージ装置3である。Aはアクティブであり、Bはスタンバイである。サーバ9は、ストレージクラスタを利用するコンピュータである。/dev/sdc、/dev/sdd、/dev/sde及び/dev/sdfはデバイス名である。0x2〜0x6はLUNである。ここで、「0x」は16進数を表す。
図1に示すように、デバイス名が/dev/sdcであるボリューム6は、AにおいてLUNが0x3であるボリューム6とBにおいてLUNが0x4であるボリューム6がクラスタペア7を構成する。また、デバイス名が/dev/sddであるボリューム6は、AにおいてLUNが0x5であるボリューム6とBにおいてLUNが0x2であるボリューム6がクラスタペア7を構成する。このように、クラスタペア7は、デバイス名は一致するが、LUNは一致しなくてもよい。また、デバイス名が/dev/sdcであるボリューム6とデバイス名が/dev/sddであるボリューム6はコピーペア8である。
ここで、ストレージ管理者が、デバイス名が/dev/sdcであるボリューム6をデバイス名が/dev/sddのボリューム6へコピーするように指示する。すると、図2に示すように、サーバ9は、デバイス名をLUNに変換し(1)、LUNを指定してコピー操作の実行をAに指示する(2)。具体的には、サーバ9は、/dev/sdcを0x3に変換し、/dev/sddを0x5に変換する。そして、サーバ9は、LUN(0x3)からLUN(0x5)にコピーするようにAに指示する。ここで、LUN(0xn)は、LUNが0xnであるボリューム6を表す。
そして、図3に示すように、コピー開始要求中にAに障害が発生してアクティブなストレージ装置3がAからBに切替わる。すると、運用中のストレージ装置3のパス状態が切替わることにより、SCSI(Small Computer System Interface)コマンドのリトライエラーが発生し、自動的にBでSCSIコマンドがリトライされる。
しかしながら、LUN(0x3)からLUN(0x5)へのコピーがBで実行されると、Bにおいてコピーペア8に対応するボリューム6は、LUN(0x4)とLUN(0x2)であるので、図4に示すように、誤ったボリューム6が操作される。
このように、サーバ9がボリューム操作を指示し、ボリューム操作が完了する前にフェイルオーバが発生した場合、新たにアクティブになったストレージ装置3で誤ったボリューム6が操作されるという問題が発生する。同様な問題は、サーバ9が操作対象のボリューム6のデバイス名をLUNに変換してボリューム操作の指示を発行する前にフェイルオーバが発生した場合にも生じる。また、サーバ9がボリューム操作の指示を発行してストレージ装置3によるボリューム操作の実行までの間にフェイルオーバが発生した場合にも同様な問題が生じる。
そこで、実施例に係るサーバは、ストレージ装置3にコピー指示を出す場合、操作ボリュームに対してコピー指示を出す。ここで、「操作ボリューム」とは、ストレージ装置3に故障が発生してもWrite/Read I/Oが他のストレージ装置3に引継がれないボリューム6である。
図5は、操作ボリュームを説明するための図である。図5において、ストレージ管理者は、/dev/sdeをAの操作ボリューム6aとして登録し、/dev/sdfをBの操作ボリューム6aとして登録する。そして、実施例に係るサーバ2は、ストレージ装置3にコピー指示を出す場合、図6に示すように、デバイス名をLUNに変換し(1)、操作ボリューム6aに対してLUN(0x3)からLUN(0x5)にコピーするように指示する。すると、Aは、操作ボリューム6aに対して指示されたLUN(0x3)からLUN(0x5)へのコピーを実行する(2)。
そして、コピー開始要求中にAに障害が発生すると、図7に示すように、アクティブなストレージ装置3がBに切替わり、操作ボリューム6aに対するコピー操作がエラーとなる。ただし、操作ボリューム6aに対するコピー指示はBに自動的には引継がれない。その理由は、操作ボリューム6aはクラスタペア7を構成しないためである。すなわち、操作ボリューム6aは、コピー指示が引継がれるボリュームがない。
操作ボリューム6aに対するコピー指示がBに引継がれないため、サーバ2は、エラーを検出し、検出したエラーがフェイルオーバ前にアクティブであったAでのエラーである場合、図8に示すように、AのLUNをBのLUNに変換する(1)。そして、サーバ2は、Bの操作ボリューム6aに対してLUN(0x4)からLUN(0x2)にコピーするように指示する(2)。
このように、実施例に係るサーバ2は、Aの操作ボリューム6aに対してAのLUNを用いてコピー指示を出す。そして、コピー中にAからBへのフェイルオーバが発生すると、Aの操作ボリューム6aに対するコピー指示は自動的にBに引継がれることなく、エラーがサーバ2に通知される。すると、サーバ2は、AのLUNをBのLUNに変換し、Bの操作ボリューム6aに対してBのLUNを用いてコピー指示を出す。したがって、サーバ2は、フェイルオーバが発生した場合に、新たにアクティブになったストレージ装置3での誤ったボリューム6の操作を防ぐことができる。
次に、実施例に係る情報処理システムの構成について説明する。図9は、実施例に係る情報処理システムの構成を示す図である。図9に示すように、実施例に係る情報処理システム1は、サーバ2と、ストレージクラスタを構成する2台のストレージ装置3と、操作端末4とを有する。サーバ2、ストレージ装置3及び操作端末4は、ネットワーク5を用いて接続される。なお、ここでは説明の便宜上、1台のサーバ2及び2台のストレージ装置3のみを示したが、実施例に係る情報処理システム1は、複数のサーバ2及びストレージクラスタを構成する任意の台数のストレージ装置3を有してもよい。
サーバ2は、ストレージクラスタを利用するコンピュータである。サーバ2はストレージ装置3を管理するストレージ管理部2aを機能部として有し、ストレージ管理部2aはバックアップ部10とETL(Extraction,Transformation and Load)20とを有する。ETL20は、ストレージ装置3に対してデータの抽出、データの変換、データの挿入等の操作を行うSCSIコマンドの生成等を行う。また、ETL20は、ストレージ装置3とのネットワーク5を介した通信を制御する。
バックアップ部10は、ボリューム6のバックアップを作成するため、ボリューム6のコピー指示をストレージ装置3へ出す。バックアップ部10は、記憶部10aと制御部10bとを有する。記憶部10aは、情報を記憶する機能部であり、記憶する情報としてコピーペア情報テーブル11と操作ボリューム情報テーブル12とを有する。制御部10bは、記憶部10aを用いてバックアップ処理を行う機能部であり、ボリューム登録部13と、コピーペア登録部14と、コピー処理部15と、状態確認部16とを有する。
コピーペア情報テーブル11は、コピーペア8に関する情報とコピーペア8の2つのボリューム6と各々クラスタペア7を構成する2つのボリューム6に関する情報とを対応付けるテーブルである。図10は、コピーペア情報テーブル11の一例を示す図である。図10に示すように、コピーペア情報テーブル11には、コピー元情報と、コピー先情報と、コピー元ペア情報と、コピー先ペア情報とが含まれる。各情報には、BoxIDとLUNが含まれる。BoxIDは、ストレージ装置3を識別する識別子である。
コピー元情報には、コピー元のボリューム6のBoxIDとLUNが含まれる。コピー先情報には、コピー先のボリューム6のBoxIDとLUNが含まれる。コピー元ペア情報には、コピー元のボリューム6とクラスタペア7を構成するボリューム6のBoxIDとLUNが含まれる。コピー先ペア情報には、コピー先のボリューム6とクラスタペア7を構成するボリューム6のBoxIDとLUNが含まれる。
例えば、Aで識別されるストレージ装置3におけるコピーペア8であるLUN(0x3)及びLUN(0x5)には、Bで識別されるストレージ装置3のLUN(0x4)及びLUN(0x2)が各々対応付けられる。
操作ボリューム情報テーブル12は、ストレージ装置3と操作ボリューム6aとを対応付けるテーブルである。図11は、操作ボリューム情報テーブル12の一例を示す図である。図11に示すように、操作ボリューム情報テーブル12には、識別名と、BoxIDと、アドレスと、アクセスパスとが含まれる。
識別名は、操作ボリューム6aをユーザが識別する名前である。BoxIDは、操作ボリューム6aが定義されるストレージ装置3を識別する識別子である。アドレスは、ストレージ装置3のIPアドレスである。アクセスパスは、操作ボリューム6aのデバイス名である。
例えば、Aで識別されるストレージ装置3のIPアドレスは1.1.1.1であり、Aの操作ボリューム6aのデバイス名は/dev/sdeであり、Aの操作ボリューム6aをユーザはETXで識別する。
ボリューム登録部13は、ストレージ管理者による操作ボリューム6aの設定要求に基づいて、操作ボリューム6aの情報を操作ボリューム情報テーブル12に登録する。
コピーペア登録部14は、ストレージ管理者によるコピーペア8の登録要求に基づいて、コピーペア8の情報をコピーペア情報テーブル11に登録する。コピーペア情報テーブル11に登録される情報には、コピーペア8の2つのボリューム6と各々クラスタペア7を構成する2つのボリューム6に関する情報が含まれる。
コピー処理部15は、コピーペア8の間でのコピー処理を行う。コピー処理部15は、指示部15aと、判定部15bと、変換部15cとを有する。指示部15aは、コピー元及びコピー先のLUNを指定して操作ボリューム6aに対してコピーを指示する。判定部15bは、操作ボリューム6aに対するコピー指示に対してエラーが発生した場合に、フェイルオーバが発生したか否かを判定する。
変換部15cは、判定部15bによりフェイルオーバが発生したと判定された場合に、コピーペア情報テーブル11を参照して、エラーが発生したストレージ装置3でのコピーペア8のLUNを新たにアクティブとなったストレージ装置3でのLUNに変換する。変換されたLUNは、指示部15aが新たにアクティブとなったストレージ装置3の操作ボリューム6aに対してコピーを指示する際に使用される。
状態確認部16は、ストレージ管理者によるコピー状態の確認要求に基づいて、ストレージ装置3からコピー処理の状況に関する情報を取得し、取得した情報を操作端末4に送信する。
操作端末4は、ストレージ管理者がストレージ装置3の管理に使用する装置である。操作端末4は、ストレージ管理者による操作ボリューム6aの設定要求、コピーペア8の登録要求、コピー要求、コピー状態の確認要求等を受け付け、受け付けた要求をバックアップ部10に送信する。また、操作端末4は、状態確認部16から送信された状態確認情報を表示装置に表示する。
ストレージ装置3は、サーバ2が使用する情報を記憶する装置である。ストレージ装置3は、HDD(Hardware Disk Drive)、SSD(Solid State Drive)等の不揮発性記憶装置を有する。また、ストレージ装置3は、ストレージ装置3を制御する制御部31を機能部として有する。
制御部31は、コピー処理部31aと情報管理部31bとを有する。コピー処理部31aは、サーバ2からのコピー指示に基づいてコピー処理を行う。コピー処理部31aは、操作ボリューム6aに対するコピー処理を指示されると、コピー指示で指定されたコピー元及びコピー先のLUNを用いてボリューム6のコピーを行う。
情報管理部31bは、ストレージ装置3の制御に用いられる情報を管理し、サーバ2からの要求に基づいて要求された情報をサーバ2へ送信する。情報管理部31bは、例えば、ボリューム6のBoxID、LUN等の情報を管理し、サーバ2からの要求があると、ボリューム6のBoxID、LUN等の情報をサーバ2へ送信する。また、情報管理部31bは、サーバ2からの要求があると、コピー処理の状況に関する情報をサーバ2へ送信する。
次に、実施例に係る情報処理システム1の処理のフローについて説明する。図12A〜図12Eは、実施例に係る情報処理システム1の処理のフローを示す第1〜第5のフローチャートである。
図12Aに示すように、操作端末4は、ストレージ管理者から装置Aの操作ボリューム6aの設定要求を受け付け、装置Aの操作ボリューム6aの設定をサーバ2へ指示する(ステップS1)。ここで、「装置A」とは、BoxIDが「A」であるストレージ装置3である。ストレージ管理者は、操作ボリューム6aの識別名を指定して設定を要求する。
そして、バックアップ部10は、操作ボリューム6aの設定指示を受信し、操作ボリューム6aの登録を開始する(ステップS2)。そして、バックアップ部10は、ETL20に対して操作ボリューム6aのBoxIDの取得を指示する(ステップS3)。そして、ETL20がBoxIDの取得を装置Aに要求し(ステップS4)、装置Aの制御部31がBoxIDをETL20に返却する(ステップS5)。そして、ETL20がBoxIDをバックアップ部10に返却する。
そして、バックアップ部10が、操作ボリューム6aのBoxIDを、操作ボリューム6aの識別名、ストレージ装置3のIPアドレス、操作ボリューム6aのデバイス名とともに操作ボリューム情報テーブル12に登録する(ステップS6)。そして、バックアップ部10は、装置Aの操作ボリューム6aの登録を完了し(ステップS7)、登録の完了を操作端末4に通知する。
次に、操作端末4は、ストレージ管理者から装置Bの操作ボリューム6aの設定要求を受け付け、装置Bの操作ボリューム6aの設定をサーバ2へ指示する(ステップS8)。ストレージ管理者は、操作ボリューム6aの識別名を指定して設定を要求する。
そして、バックアップ部10は、操作ボリューム6aの設定指示を受信し、操作ボリューム6aの登録を開始する(ステップS9)。そして、バックアップ部10は、ETL20に対して操作ボリューム6aのBoxIDの取得を指示する(ステップS10)。そして、ETL20がBoxIDの取得を装置Bに要求し(ステップS11)、装置Bの制御部31がBoxIDをETL20に返却する(ステップS12)。そして、ETL20がBoxIDをバックアップ部10に返却する。
そして、バックアップ部10が、操作ボリューム6aのBoxIDを、操作ボリューム6aの識別名、ストレージ装置3のIPアドレス、操作ボリューム6aのデバイス名とともに操作ボリューム情報テーブル12に登録する(ステップS13)。そして、バックアップ部10は、装置Bの操作ボリューム6aの登録を完了し(ステップS14)、登録の完了を操作端末4に通知する。
次に、操作端末4は、ストレージ管理者からコピーペア8の登録要求を受け付け、コピーペア8の登録をサーバ2へ指示する(ステップS15)。すると、バックアップ部10は、コピーペア8の登録指示を受信し、コピーペア8の登録を開始する(ステップS16)。そして、バックアップ部10は、ETL20に対してクラスタペア7となるボリューム6の情報の取得を指示する(ステップS17)。
そして、ETL20がクラスタペア7となるボリューム6のBoxID及びLUNの取得を装置Aに要求し(ステップS18)、装置Aの制御部31がクラスタペア7となるボリューム6のBoxID及びLUNをETL20に返却する(ステップS19)。そして、ETL20がクラスタペア7となるボリューム6のBoxID及びLUNをバックアップ部10に返却する。
そして、バックアップ部10が、コピーペア8となる2つのボリューム6のBoxID及びLUNを各々のボリューム6とクラスタペア7を構成する2つのボリューム6のBoxID及びLUNとともにコピーペア情報テーブル11に登録する(ステップS20)。そして、バックアップ部10は、コピーペア8の登録を完了し(ステップS21)、登録の完了を操作端末4に通知する。すると、操作端末4は、コピーペアを表示する(ステップS22)。
次に、操作端末4は、図12Bに示すように、ストレージ管理者からコピー操作開始の要求を受け付け、コピー操作の開始をサーバ2へ指示する(ステップS23)。すると、バックアップ部10は、コピー操作対象のボリューム6のチェックを開始し(ステップS24)、ETL20に装置Aがアクティブかスタンバイかの情報の取得を要求する(ステップS25)。
すると、ETL20が装置Aにアクティブかスタンバイかの情報の取得を要求し(ステップS26)、装置Aの制御部31が装置Aのステータスを返却する(ステップS27)。すると、ETL20が装置Aのステータスをバックアップ部10に返却する。
すると、バックアップ部10は、装置Aは故障か否かすなわちアクティブか否かを判定し(ステップS28)、故障である場合には、装置Bをアクティブとする(ステップS29)。そして、バックアップ部10は、アクテイブペアを決定する(ステップS30)。ここで、「アクテイブペア」とは、アクティブなストレージ装置3でのコピーペア8である。
そして、バックアップ部10は、コピーペア8のボリューム情報の取得を開始し(ステップS31)、アクティブな装置を判定する(ステップS32)。その結果、装置Bがアクティブである場合には、ETL20が装置Bからのボリューム情報の取得を開始し(ステップS33)、装置BにBoxID及びLUNの取得を要求する(ステップS34)。すると、装置Bの制御部31がBoxID及びLUNをETL20に返却し(ステップS35)、ETL20はステップS39へ進む。
一方、装置Aがアクティブである場合には、ETL20が装置Aからのボリューム情報の取得を開始し(ステップS36)、装置AにBoxID及びLUNの取得を要求する(ステップS37)。すると、装置Aの制御部31がBoxID及びLUNをETL20に返却する(ステップS38)。
そして、ETL20は、ボリューム情報の取得を終了し(ステップS39)、取得したボリューム情報をバックアップ部10に送信する。すると、バックアップ部10は、ボリューム情報の取得を完了し(ステップS40)、取得したボリューム情報に基づいてボリュームチェックを行う(ステップS41)。そして、バックアップ部10は、コピー操作対象のボリュームチェックを完了する(ステップS42)。
次に、バックアップ部10は、アクティブな装置を判定する(ステップS43)。その結果、装置Bがアクティブである場合には、装置Bでのコピーを開始し(ステップS44)、コピー開始を装置Bの操作ボリューム6aに対して要求する(ステップS45)。すると、装置Bの制御部31がコピー処理を開始し(ステップS46)、コピーを実行する(ステップS47)。そして、装置Bの制御部31は、コピーの開始に成功したか否かを判定し(ステップS48)、成功した場合には、サーバ2に正常を応答し(ステップS49)、成功しなかった場合には、サーバ2にエラーを応答する(ステップS50)。
一方、装置Aがアクティブである場合には、装置Aでのコピーを開始し(ステップS51)、コピー開始を装置Aの操作ボリューム6aに対して要求する(ステップS52)。すると、装置Aの制御部31がコピー処理を開始し(ステップS53)、コピーを実行する(ステップS54)。そして、装置Aの制御部31は、コピーの開始に成功したか否かを判定し(ステップS55)、成功した場合には、サーバ2に正常を応答し(ステップS56)、成功しなかった場合には、サーバ2にエラーを応答する(ステップS57)。
そして、ETL20は、装置A又は装置Bから正常の応答を受け取ると、バックアップ部10に正常を応答し(ステップS58)、バックアップ部10がコピー開始を完了する(ステップS59)。そして、バックアップ部10はコピー操作の完了を操作端末4に通知し(ステップS66)、操作端末4はコピー操作を完了する(ステップS67)。
また、ETL20は、装置A又は装置Bからエラーの応答を受け取ると、バックアップ部10にエラーを応答し(ステップS60)、バックアップ部10がフェイルオーバか否かを判定する(ステップS61)。その結果、フェイルオーバでない場合には、バックアップ部10はコピー失敗を操作端末4に応答し(ステップS65)、操作端末4はコピー操作を完了する(ステップS67)。
一方、フェイルオーバである場合には、バックアップ部10は、エラーが2回目か否かを判定し(ステップS62)、2回目である場合には、コピー失敗を操作端末4に応答し(ステップS65)、操作端末4はコピー操作を完了する(ステップS67)。一方、エラーが2回目でない場合には、バックアップ部10は、リトライするコピーペア8のLUNをコピーペア情報テーブル11から取得し(ステップS63)、アクティブの装置を変更する(ステップS64)。そして、バックアップ部10は、ステップS43に戻り、新たにアクティブとなったストレージ装置3でコピーのリトライを行う。
次に、操作端末4は、図12Dに示すように、ストレージ管理者からコピー状態確認の要求を受け付け、コピー状態確認をサーバ2へ指示する(ステップS68)。すると、バックアップ部10は、コピー操作対象のボリューム6のチェックを開始し(ステップS69)、ETL20に装置Aがアクティブかスタンバイかの情報の取得を要求する(ステップS70)。
すると、ETL20が装置Aにアクティブかスタンバイかの情報の取得を要求し(ステップS71)、装置Aの制御部31が装置Aのステータスを返却する(ステップS72)。すると、ETL20が装置Aのステータスをバックアップ部10に返却する。
すると、バックアップ部10は、装置Aは故障か否かすなわちアクティブか否かを判定し(ステップS73)、故障である場合には、装置Bをアクティブとする(ステップS74)。そして、バックアップ部10は、アクテイブペアを決定する(ステップS75)。
そして、バックアップ部10は、コピーペア8のボリューム情報の取得を開始し(ステップS76)、アクティブな装置を判定する(ステップS77)。その結果、装置Bがアクティブである場合には、ETL20が装置Bからのボリューム情報の取得を開始し(ステップS78)、装置BにBoxID及びLUNの取得を要求する(ステップS79)。すると、装置Bの制御部31がBoxID及びLUNをETL20に返却し(ステップS80)、ETL20はステップS84へ進む。
一方、装置Aがアクティブである場合には、ETL20が装置Aからのボリューム情報の取得を開始し(ステップS81)、装置AにBoxID及びLUNの取得を要求する(ステップS82)。すると、装置Aの制御部31がBoxID及びLUNをETL20に返却する(ステップS83)。
そして、ETL20は、ボリューム情報の取得を終了し(ステップS84)、取得したボリューム情報をバックアップ部10に送信する。すると、バックアップ部10は、ボリューム情報の取得を完了し(ステップS85)、取得したボリューム情報に基づいてボリュームチェックを行う(ステップS86)。そして、バックアップ部10は、コピー操作対象のボリュームチェックを完了する(ステップS87)。
そして、バックアップ部10は、図12Eに示すように、コピー処理に関するセッション情報の取得を開始し(ステップS88)、アクティブな装置を判定する(ステップS89)。その結果、装置Bがアクティブである場合には、バックアップ部10が装置Bからのボリューム情報の取得をETL20に指示し(ステップS90)、ETL20が装置Bにセッション情報の取得を要求する(ステップS91)。すると、装置Bの制御部31がセッション情報をETL20に返却し(ステップS92)、ETL20はステップS96へ進む。
一方、装置Aがアクティブである場合には、バックアップ部10が装置Aからのボリューム情報の取得をETL20に指示し(ステップS93)、ETL20が装置Aにセッション情報の取得を要求する(ステップS94)。すると、装置Aの制御部31がセッション情報をETL20に返却する(ステップS95)。
そして、ETL20は、セッション情報をバックアップ部10に送信し、セッション情報の取得を完了する(ステップS96)。そして、バックアップ部10は、セッション情報を操作端末4に送信し、セッション情報の取得を完了する(ステップS97)。そして、操作端末4が、セッション情報に基づいてコピー状態を表示する(ステップS98)。
このように、バックアップ部10は、フェイルオーバの発生によりコピー処理でエラーが発生した場合に、リトライするコピーペア8のLUNをコピーペア情報テーブル11から取得し、新たにアクティブとなったストレージ装置3で再度コピー処理を行う。したがって、ストレージ管理部2aは、フェイルオーバ後に正しいLUNを指定してコピーを指示することができる。
なお、実施例では、ストレージ管理部2aについて説明したが、ストレージ管理部2aが有する構成をソフトウェアによって実現することで、同様の機能を有するストレージ管理プログラムを得ることができる。そこで、ストレージ管理プログラムを実行するサーバ2のハードウェア構成について説明する。
図13は、サーバ2のハードウェア構成を示す図である。図13に示すように、サーバ2は、メインメモリ41と、CPU(Central Processing Unit)42と、LAN(Local Area Network)インタフェース43と、HDD(Hard Disk Drive)44とを有する。また、サーバ2は、スーパーIO(Input Output)45と、DVI(Digital Visual Interface)46と、ODD(Optical Disk Drive)47とを有する。
メインメモリ41は、プログラムやプログラムの実行途中結果などを記憶するメモリである。CPU42は、メインメモリ41からプログラムを読み出して実行する中央処理装置である。CPU42は、メモリコントローラを有するチップセットを含む。
LANインタフェース43は、サーバ2をLAN経由で他のコンピュータに接続するためのインタフェースである。HDD44は、プログラムやデータを格納するディスク装置であり、スーパーIO45は、マウスやキーボードなどの入力装置を接続するためのインタフェースである。DVI46は、液晶表示装置を接続するインタフェースであり、ODD47は、DVDの読み書きを行う装置である。
LANインタフェース43は、PCIエクスプレス(PCIe)によりCPU42に接続され、HDD44及びODD47は、SATA(Serial Advanced Technology Attachment)によりCPU42に接続される。スーパーIO45は、LPC(Low Pin Count)によりCPU42に接続される。
そして、サーバ2において実行されるストレージ管理プログラムは、DVDに記憶され、ODD47によってDVDから読み出されてサーバ2にインストールされる。あるいは、ストレージ管理プログラムは、LANインタフェース43を介して接続された他のコンピュータシステムのデータベースなどに記憶され、これらのデータベースから読み出されてサーバ2にインストールされる。そして、インストールされたストレージ管理プログラムは、HDD44に記憶され、メインメモリ41に読み出されてCPU42によって実行される。
また、実施例では、ストレージ装置3の制御部31について説明したが、制御部31はファームウェアにより実現される。そこで、ファームウェアを実行する制御部31のハードウェア構成について説明する。図14は、制御部31のハードウェア構成を示す図である。図14に示すように、制御部31は、MPU(Micro Processing Unit)51と、フラッシュメモリ52と、RAM(Random Access Memory)53とを有する。
MPU51は、RAM53に記憶されたファームウェアを読み出して実行する処理装置である。フラッシュメモリ52は、ファームウェアを記憶する不揮発性のメモリである。RAM53は、フラッシュメモリ52から読み出されたファームウェアを記憶する揮発性メモリである。また、RAM53は、ファームウェアの実行に必要なデータ、ファームウェア実行の途中結果等を記憶する。
上述してきたように、実施例では、バックアップ部10が、ストレージ装置3に故障が発生した際に処理が他のストレージ装置3に引継がれない操作ボリューム6aに対してコピー元及びコピー先のLUNを指定してコピーを指示する。そして、ストレージ装置3のコピー処理部31aが操作ボリューム6aに対するコピー処理を受けると、指定されたコピー元及びコピー先のLUNを用いてコピー処理を実行する。
そして、バックアップ部10は、フェイルオーバの発生でコピー処理が他のストレージ装置3に引継がれることなくエラーが発生した場合に、コピーペア8の2つのボリューム6と各々クラスタペア7を構成する2つのボリューム6のLUNを取得する。そして、バックアップ部10は、取得したLUNを用いて新たにアクティブになったストレージ装置3でコピー処理を再実行する。
したがって、ストレージクラスタは、フェイルオーバ発生時に処理中のコピー指示に関して新たにアクティブになったストレージ装置3で正しいLUNを用いてコピーを行うことができる。
また、実施例では、コピーペア情報テーブル11に、コピーペア8のLUNと、コピーペア8の2つのボリューム6と各々クラスタペア7を構成する2つのボリューム6のLUNと、を対応付ける情報が登録される。そして、バックアップ部10は、フェイルオーバの発生によりコピー処理でエラーが発生した場合に、コピーペア情報テーブル11を参照してコピーの再指示に用いるコピー元及びコピー先のLUNを取得する。したがって、バックアップ部10は、フェイルオーバ後に使用するコピー元及びコピー先のLUNを簡単に取得することができる。
また、実施例では、操作ボリューム情報テーブル12にストレージ装置3のBoxIDと操作ボリューム6aのデバイス名とを対応付ける情報が登録され、バックアップ部10は操作ボリューム情報テーブル12を用いて操作ボリューム6aを取得する。したがって、バックアップ部10は、コピー指示の対象とする操作ボリューム6aのデバイス名を簡単に取得することができる。
なお、実施例では、フェイルオーバが発生した場合に、AのコピーペアのLUNを対応するBのLUNに変換する場合について説明したが、本発明はこれに限定されるものではなく、デバイス名からBのLUNに変換する場合にも同様に適用することができる。
また、実施例では、サーバ2がバックアップ部10を有する場合について説明したが、本発明はこれに限定されるものではなく、ストレージ装置3がバックアップ部を有する場合にも同様に適用することができる。また、バックアップ部10は、サーバ2及びストレージ装置3から独立した装置でもよい。
また、実施例では、バックアップ部10について説明したが、本発明はこれに限定されるものではなく、ボリューム6のコピーを管理するコピー管理部にも同様に適用することができる。
1 情報処理システム
2,9 サーバ
2a ストレージ管理部
3 ストレージ装置
4 操作端末
5 ネットワーク
6 ボリューム
6a 操作ボリューム
7 クラスタペア
8 コピーペア
10 バックアップ部
10a 記憶部
10b 制御部
11 コピーペア情報テーブル
12 操作ボリューム情報テーブル
13 ボリューム登録部
14 コピーペア登録部
15 コピー処理部
15a 指示部
15b 判定部
15c 変換部
16 状態確認部
20 ETL
31 制御部
31a コピー処理部
31b 情報管理部
41 メインメモリ
42 CPU
43 LANインタフェース
44 HDD
45 スーパーIO
46 DVI
47 ODD
51 MPU
52 フラッシュメモリ
53 RAM

Claims (2)

  1. 第1のストレージ装置にエラーが発生すると第1のストレージ装置への操作をクラスタペアを用いて第2のストレージ装置へ引継いで管理するストレージ管理装置において、
    記憶部と、
    前記第1のストレージ装置と前記第2のストレージ装置のうちアクティブな装置を判定する判定部と、
    スタンバイ中の前記第2のストレージ装置に操作が引き継がれない操作ボリュームに対するアクティブな前記第1のストレージ装置でのコピー操作であって、前記第1のストレージ装置においてコピー元を識別する第1のコピー元LUNから、前記第1のストレージ装置においてコピー先を識別する第1のコピー先LUNへのコピー操作においてエラーが発生した際に、前記第1のストレージ装置の前記第2のストレージ装置へのフェイルオーバの発生によりアクティブとなった前記第2のストレージ装置において第1のコピー元LUN及び第1のコピー先LUNの各々のクラスタペアを識別する第2のコピー元LUN及び第2のコピー先LUNを前記記憶部に格納されたコピーペア情報から取得して、アクティブな前記第2のストレージ装置での前記コピー操作のリトライを指示するコピー処理部と、
    を備えたことを特徴とするストレージ管理装置。
  2. 第1のストレージ装置にエラーが発生すると第1のストレージ装置への操作をクラスタペアを用いて第2のストレージ装置へ引継いで管理するストレージ管理装置に組み込まれたコンピュータに、
    前記第1のストレージ装置と前記第2のストレージ装置のうちアクティブな装置を判定し、
    スタンバイ中の前記第2のストレージ装置に操作が引き継がれない操作ボリュームに対するアクティブな前記第1のストレージ装置でのコピー操作であって、前記第1のストレージ装置においてコピー元を識別する第1のコピー元LUNから、前記第1のストレージ装置においてコピー先を識別する第1のコピー先LUNへのコピー操作においてエラーが発生した際に、前記第1のストレージ装置の前記第2のストレージ装置へのフェイルオーバの発生によりアクティブとなった前記第2のストレージ装置において第1のコピー元LUN及び第1のコピー先LUNの各々のクラスタペアを識別する第2のコピー元LUN及び第2のコピー先LUNを記憶部に格納されたコピーペア情報から取得して、アクティブな前記第2のストレージ装置での前記コピー操作のリトライを指示する、
    処理を実行させることを特徴とするストレージ管理プログラム。
JP2019155095A 2019-08-27 2019-08-27 ストレージ管理装置及びストレージ管理プログラム Pending JP2019197602A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019155095A JP2019197602A (ja) 2019-08-27 2019-08-27 ストレージ管理装置及びストレージ管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019155095A JP2019197602A (ja) 2019-08-27 2019-08-27 ストレージ管理装置及びストレージ管理プログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014251814A Division JP6749072B2 (ja) 2014-12-12 2014-12-12 ストレージ管理装置及びストレージ管理プログラム

Publications (1)

Publication Number Publication Date
JP2019197602A true JP2019197602A (ja) 2019-11-14

Family

ID=68537675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019155095A Pending JP2019197602A (ja) 2019-08-27 2019-08-27 ストレージ管理装置及びストレージ管理プログラム

Country Status (1)

Country Link
JP (1) JP2019197602A (ja)

Similar Documents

Publication Publication Date Title
JP4371724B2 (ja) 記憶システム及び記憶装置システム
JP6237406B2 (ja) 情報処理装置、ストレージシステム、およびプログラム
US8788636B2 (en) Boot controlling method of managed computer
DK3179359T3 (en) PROCEDURE FOR SENDING DATA, PROCEDURE FOR RECEIVING DATA AND STORAGE UNIT
US8762648B2 (en) Storage system, control apparatus and control method therefor
US20200142790A1 (en) Automatic data healing using a storage controller
JP4990332B2 (ja) データバックアップ管理システム、計算機システム及びプログラム記録媒体
JP5286212B2 (ja) ストレージクラスタ環境でのリモートコピー制御方法及びシステム
JP6540334B2 (ja) システム、情報処理装置、および情報処理方法
JP6749072B2 (ja) ストレージ管理装置及びストレージ管理プログラム
US20200142614A1 (en) Automatic data healing by i/o
JP6005446B2 (ja) ストレージシステム、仮想化制御装置、情報処理装置、および、ストレージシステムの制御方法
WO2018011882A1 (ja) 計算機システム及びストレージ装置の制御方法
JP6435842B2 (ja) ストレージ制御装置及びストレージ制御プログラム
JP6230707B2 (ja) ストレージシステム
JP6569476B2 (ja) ストレージ装置、ストレージシステムおよびストレージ制御プログラム
JP6665892B2 (ja) 情報処理システム,情報処理装置および制御プログラム
JP6337607B2 (ja) 情報処理装置、共有メモリ管理方法及び共有メモリ管理プログラム
US20120290807A1 (en) Changing ownership of cartridges
JP2019197602A (ja) ストレージ管理装置及びストレージ管理プログラム
JP2019082897A (ja) 情報処理装置、情報処理システム及びプログラム
US11734133B2 (en) Cluster system and fail-over control method of cluster system
WO2014087465A1 (ja) ストレージ装置及びストレージ装置移行方法
JP2018028793A (ja) 情報処理プログラム、情報処理システムおよび情報処理方法
JP2008305223A (ja) リストア制御プログラム、リストア制御方法、リストア制御装置、およびリストア制御システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201027

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210420