JP7048155B2 - パス診断装置、ストレージ装置、パス診断方法及びプログラム - Google Patents

パス診断装置、ストレージ装置、パス診断方法及びプログラム Download PDF

Info

Publication number
JP7048155B2
JP7048155B2 JP2019234789A JP2019234789A JP7048155B2 JP 7048155 B2 JP7048155 B2 JP 7048155B2 JP 2019234789 A JP2019234789 A JP 2019234789A JP 2019234789 A JP2019234789 A JP 2019234789A JP 7048155 B2 JP7048155 B2 JP 7048155B2
Authority
JP
Japan
Prior art keywords
path
diagnosis
rdr
normal operation
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019234789A
Other languages
English (en)
Other versions
JP2021103460A (ja
Inventor
長憲 福山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2019234789A priority Critical patent/JP7048155B2/ja
Publication of JP2021103460A publication Critical patent/JP2021103460A/ja
Application granted granted Critical
Publication of JP7048155B2 publication Critical patent/JP7048155B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Bus Control (AREA)

Description

本発明は、パス診断装置、ストレージ装置、パス診断方法及びプログラムに関する。
RDR(Remote Data Replication)は、FCIP(Fibre Channel over IP)を用いて遠隔地にあるストレージ装置を接続し、これらのストレージ装置の間でデータレプリケーションを行う技術である。RDRを実行するシステムでは、ストレージ装置の間にIPネットワークが存在し、それぞれのストレージ装置とIPネットワークの間にはFCIP変換装置が設けられる。FCIP変換装置は、例えば、ストレージから出力されたデータをFCフレームからIPパケットへ変換し、変換後のデータを、IPネットワークを介して送信する。他方のFCIP変換装置は、IPネットワークからデータを受信し、このデータをIPパケットからFCフレームに変換してレプリケーション先のストレージ装置へ出力する。
近年、FCIP変換装置の高性能化、多機能化に伴い、FCIP変換装置の内部設計が複雑化している。その為、FCIP変換装置には、これまでには無い故障が出現している。例えば、RDR診断コマンドなど、データ転送を行わないデータは正常に処理されるが、データ転送を伴うRDRデータの処理は異常となり、著しい遅延や不達が生じることがある。結果として、RDR診断コマンドで故障を検出できないにもかかわらず、データのレプリケーションが失敗するという故障が発生する。
特許文献1には、地震などの災害が発生した時に災害の影響が及ぶ範囲外に中継装置を設け、ストレージ1からストレージ2へのデータのレプリケーションを、この中継装置を経由して行うシステムが開示されている。
特開2004-086721号公報
データ転送を行わないRDRパス診断では検出できない故障を検出しようとして、RDRパス診断でデータ転送を実際に行ったり、診断頻度を上げたりすると、帯域が小さく貴重なWAN(Wide Area Network)回線の帯域を消費してしまう。この課題を解決する技術は特許文献1には開示されていない。
そこでこの発明は、上述の課題を解決するパス診断装置、ストレージ装置、パス診断方法及びプログラムを提供することを目的としている。
本発明の一態様によれば、パス診断装置は、第1のストレージ装置と第2のストレージ装置でデータレプリケーションを行うときに複製対象のデータが伝送されるパスに対して診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、前記パスの診断を行う診断手段、を備え、前記診断手段は、前記パスで前記複製対象のデータの伝送が行われていない状態から前記データの伝送が開始されると前記パスの帯域に負荷をかけながら前記パスの異常検出を行う非通常運用時パス診断を実行し、前記伝送の開始から所定時間が経過し、それまでに前記非通常運用時パス診断にて異常が検出されない場合、前記非通常運用時パス診断に代えて前記パスの帯域に負荷をかけないように前記パスの異常検出を行う通常運用時パス診断を実行し、前記非通常運用時パス診断では、前記通常運用時パス診断で使用するペイロードデータよりも圧縮率が低いペイロードデータ付きの前記診断コマンドを前記通常運用時パス診断よりも高頻度で送信し、
前記通常運用時パス診断では、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、前記非通常運用時パス診断で使用するペイロードデータよりも圧縮率が高いペイロードデータ付きの前記診断コマンドと、を所定の比率で混在させて送信する通常運用時パス診断を実行する。
また、本発明の他の一態様によれば、ストレージ装置は、RDR(Remote Data Replication)機能を有し、上記のパス診断装置を備える。
また、本発明の他の一態様によれば、パス診断方法は、第1のストレージ装置と第2のストレージ装置でデータレプリケーションを行うときに複製対象のデータが伝送されるパスに対して診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、前記パスの診断を行うステップ、を有し、前記診断を行うステップでは、前記パスで前記複製対象のデータの伝送が行われていない状態から前記データの伝送が開始されると前記パスの帯域に負荷をかけながら前記パスの異常検出を行う非通常運用時パス診断を実行し、前記伝送の開始から所定時間が経過し、それまでに前記非通常運用時パス診断にて異常が検出されない場合、前記非通常運用時パス診断に代えて前記パスの帯域に負荷をかけないように前記パスの異常検出を行う通常運用時パス診断を実行し、前記非通常運用時パス診断では、前記通常運用時パス診断で使用するペイロードデータよりも圧縮率が低いペイロードデータ付きの前記診断コマンドを前記通常運用時パス診断よりも高頻度で送信し、前記通常運用時パス診断では、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、前記非通常運用時パス診断で使用するペイロードデータよりも圧縮率が高いペイロードデータ付きの前記診断コマンドと、を所定の比率で混在させて送信する。
また、本発明の他の一態様によれば、プログラムは、コンピュータに、第1のストレージ装置と第2のストレージ装置でデータレプリケーションを行うときに複製対象のデータが伝送されるパスに対して診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、前記パスの診断を行うにあたり、前記パスで前記複製対象のデータの伝送が行われていない状態から前記データの伝送が開始されると前記パスの帯域に負荷をかけながら前記パスの異常検出を行う非通常運用時パス診断を実行し、前記伝送の開始から所定時間が経過し、それまでに前記非通常運用時パス診断にて異常が検出されない場合、前記非通常運用時パス診断に代えて前記パスの帯域に負荷をかけないように前記パスの異常検出を行う通常運用時パス診断を実行し、前記非通常運用時パス診断では、前記通常運用時パス診断で使用するペイロードデータよりも圧縮率が低いペイロードデータ付きの前記診断コマンドを前記通常運用時パス診断よりも高頻度で送信し、前記通常運用時パス診断では、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、前記非通常運用時パス診断で使用するペイロードデータよりも圧縮率が高いペイロードデータ付きの前記診断コマンドと、を所定の比率で混在させて送信する処理を実行させる。
本発明によれば、RDR診断コマンドによるWAN回線の帯域の消費を低減することができる。
本発明の一実施形態に係るRDRシステムの概略図である。 本発明の一実施形態に係るRDRパス正常性診断部の一例を示す図である。 本発明の一実施形態に係るRDRパス診断の概要を説明する図である。 本発明の一実施形態に係るRDRパス診断処理の一例を示す第1のフローチャートである。 本発明の一実施形態に係るRDRデータの一例を示す図である。 本発明の一実施形態に係るRDRパス診断処理の一例を示す第2のフローチャートである。 本発明の一実施形態に係る位置通知装置の最小構成を示す図である。 本発明の一実施形態に係るストレージ装置のコントローラのハードウェア構成の一例を示す図である。
<実施形態>
以下、本発明の一実施形態に係るRDRのパス診断方法について図面を参照して説明する。以下の説明に用いる図面において本発明に関係ない部分の構成については、記載を省略し、図示しない場合がある。
(構成)
図1は、本発明の一実施形態に係るRDRシステムの概略図である。
図1に示すように、RDRシステム100は、ストレージ装置1と、FCIP変換装置2と、WAN回線3と、FCIP変換装置4と、ストレージ装置5と、を有している。
RDRシステムは、遠隔地等に存在する異なるストレージ装置1とストレージ装置5の間でストレージ内のデータ複製を行うシステムである。例えば、ストレージ装置1のデータをストレージ装置5へ送信し、ストレージ装置5にバックアップデータとして記録する。FCIP変換装置2およびFCIP変換装置4の故障の内容によってはペイロードデータ無しのRDR診断コマンドは正常に伝送されるが、ペイロードデータ付きのRDRデータ(例えば、複製対象のデータを伴うRDRコマンド)が遅延・不達となる場合がある。このような故障を検出するため、一般的なRDRシステムでは、RDR診断コマンドはペイロードデータ付きのコマンドを用いて行っている。そのため、正常時でも、診断のためにWAN回線3の帯域を余計に消費している。通常、ストレージ装置1とFCIP変換装置2の間のデータパスおよびストレージ装置5とFCIP変換装置4の間のデータパスに比べて、FCIP変換装置2とFCIP変換装置4の間のWAN回線3の帯域は狭く高価である。そのため、WAN回線3の帯域の消費はなるべく抑制することが好ましい。
本実施形態に係るRDRシステム100では、ストレージ装置1とストレージ装置5の間でデータレプリケーションを行うにあたって、WAN回線3の帯域を必要以上に損なうことなく、且つ、データレプリケーション用のパスの故障および復旧を漏れなく検出できるようにパスの診断を実行する。例えば、通常運用時には、WAN回線3の帯域を圧迫しないよう、ペイロード無し、または、圧縮の容易な(圧縮率の高い)ペイロードデータを用いてRDRパスの診断を行う。一方、RDRシステム100の起動時や復旧時には、WAN回線3の帯域およびFCIP変換装置2,4が高負荷、広帯域に耐えられるかどうかを確認するため圧縮しにくいペイロードデータを用いてRDRパスの診断を行う。
以下、データレプリケーション用のパスを、RDRパスと呼ぶ。RDRパスには、ストレージ装置1と、ストレージ装置1とFCIP変換装置2を接続するFCケーブルと、FCIP変換装置2と、FCIP変換装置2とWAN回線3を接続するケーブルと、WAN回線3と、WAN回線3とFCIP変換装置4を接続するケーブルと、FCIP変換装置4と、FCIP変換装置4とストレージ装置5を接続するFCケーブルと、ストレージ装置5とが含まれる。
ストレージ装置1は、RDR機能を備えたストレージである。ストレージ装置1は、RDRデータ送受信部11と、RDRパス正常性診断部12と、を備える。
RDRデータ送受信部11は、複製を行う対象のデータを含んだRDRデータの送受信をストレージ装置5との間で行う。RDRデータの送受信により、データの複製が実行される。
RDRパス正常性診断部12は、対向するストレージ装置5から受信したデータからRDR診断コマンドを抽出し、RDRパスの正常性の診断を行う。例えば、RDR診断コマンドが所定の正常範囲の時間内に到達した場合、RDRパス正常性診断部12は、RDRパスが正常であると診断する。RDR診断コマンドが不達の場合や、所定の正常範囲時間を超えて遅延して到達した場合、RDRパス正常性診断部12は、RDRパスが異常であると診断する。RDRパス正常性診断部12は、診断に用いるペイロードデータ121と、RDR診断コマンド差込み部122とを備える。
診断用のペイロードデータ121は、診断状況に合わせた様々なペイロードデータを備えている。診断状況とは、通常運用か、非通常運用かである。通常運用とは、RDRパスの使用が開始されてからしばらく経ち、正常にデータレプリケーションが行われているような状況である。非通常運用とは、RDRパスを使用した運転を開始する場合や異常等から復旧する状況のことである。ここで、図2を参照する。
図2は、本発明の一実施形態に係るRDRパス正常性診断部の一例を示す図である。
図示するように診断用のペイロードデータ121は、複数のペイロードデータ、つまり、“ペイロード無し”、“圧縮容易データ1”、“圧縮容易データ2”、“圧縮困難データ”の各ペイロードデータを備える。
“ペイロード無し”は、例えば、長さ0のペイロードデータである。
“圧縮容易データ1”は、例えば、16進数表記“5A5A5A5A・・・”などの繰り返しデータである。“圧縮容易データ1”は、LZ法やdeflateなどの圧縮アルゴリズムによって、元のサイズの5%以下まで圧縮される。
“圧縮容易データ2”は、“圧縮容易データ1”と同様に、16進数表記“A5A5A5A5・・・”などの繰り返しデータである。“圧縮容易データ2”は、LZ法やdeflateなどの圧縮アルゴリズムによって、元のサイズの5%以下まで圧縮される。
“圧縮困難データ”は、既にLZ法やdeflateなどの圧縮アルゴリズムによって圧縮済みのデータや、繰り返しや周期性のないデータ、次に出現するデータが予測困難なデータなどである。
“ペイロード無し”と、圧縮率の高い“圧縮容易データ1”および“圧縮容易データ2”は、通常運用時のRDRパス診断に用いられるペイロードデータである。なお、上記例の“圧縮容易データ1”の“5A5A5A5A・・・”と“圧縮容易データ2”の“A5A5A5A5・・・”について、16進数表記の“5A”と“A5”は、二進法ではそれぞれ“01011010”、“10100101”となり、1と0が逆になる関係となる。これらを混在させることにより、圧縮/復元部22,42では、特定の位置のbitが処理できない故障を検出することができる。圧縮率の低い“圧縮困難データ”は、故障からの復旧時や運転の開始時におけるRDRパス診断に用いられるペイロードデータである。
RDR診断コマンド差込み部122は、RDRデータ送受信部11から送信されたRDRデータの間にRDR診断コマンドの差し込みを行う。このとき、RDR診断コマンド差込み部122は、ペイロードデータ121の中から適切なペイロードデータを選択してRDR診断コマンドを作成し、作成したRDR診断コマンドを差し込む。また、RDR診断コマンド差込み部122は、対向するストレージ装置5から受信したデータからRDR診断コマンドの抽出を行う。
図1に戻る。ストレージ装置1とFCIP変換装置2は、FCインタフェースで接続される。
FCIP変換装置2は、FCのフレームをIP(Internet Protocol)のパケットに変換して送受信を行う装置である。一般に、ストレージルータ、SAN(Storage Area Network)ルータ、SANスイッチ、エクステンションスイッチ(Extension Switch)、SANエクステンションスイッチなどと呼ばれる。FCIP変換装置2は、FC-IP変換部21と、圧縮/復元部22と、を備える。
FC-IP変換部21は、FCのフレームをIPのパケットに変換する。また、FC-IP変換部21は、IPのパケットをFCのフレームに変換する。
圧縮/復元部22は、WAN回線3と送受信を行うデータを、LZ法やdeflateなどの圧縮アルゴリズムを用いて圧縮または復元する。
なお、図1に例示する構成では、FC-IP変換部21と圧縮/復元部22は独立したものとなっているが、これらは一体的に構成されていてもよい。一体的に構成されている場合、FCIP変換装置2は、FCフレームとIPパケットの変換の途中で圧縮又は復元を行ってもよい。
FCIP変換装置2とFCIP変換装置4とは、WAN回線3を介してIPで接続される。
FCIP変換装置4は、FCIP変換装置2と同様の機能・構成を備えている。つまり、FCIP変換装置4は、FC-IP変換部41と、圧縮/復元部42と、を備える。
FC-IP変換部41は、FCのフレームとIPのパケットの変換を行う。
圧縮/復元部42は、WAN回線3と送受信を行うデータを、所定の圧縮アルゴリズムを用いて圧縮または復元する。
ストレージ装置5とFCIP変換装置4は、FCインタフェースで接続される。
ストレージ装置5は、ストレージ装置1と同様の機能・構成を有している。つまり、ストレージ装置5は、RDRデータ送受信部51と、RDRパス正常性診断部52と、を備え、RDRパスの正常性の診断を行う。また、RDRパス正常性診断部52は、診断用のペイロードデータ521と、RDR診断コマンド差込み部522とを備える。ペイロードデータ521は、“ペイロード無し”、“圧縮容易データ1”、“圧縮容易データ2”、“圧縮困難データ”を有している。RDR診断コマンド差込み部522は、RDR診断コマンドの差し込み、対向するストレージ装置1から受信したデータからRDR診断コマンドの抽出を行う。
RDRシステム100では、診断用のペイロードデータ121、521において複数のペイロードデータを有し、診断状況に応じてRDR診断コマンドに適用するペイロードデータの種類を変更する点で一般的なRDRシステムとは異なる。
(動作)
次にRDRパス診断の動作の大まかな流れについて説明する。
図3は、本発明の一実施形態に係るRDRパス診断の概要を説明する図である。
図の矢印は、ストレージ装置1からストレージ装置5へRDRパス診断コマンドを送信したときのデータの流れを示している。図示するようにストレージ装置1からストレージ装置5へRDRパス診断コマンドを送信すると、ストレージ装置5から応答が返信される。
また、データレプリケーションが開始されると、RDRデータ送受信部11が、複製対象のデータを含んだRDRデータを送信する。RDRデータは、FCIP変換装置2のFC-IP変換部21でIPパケットへ変換され、圧縮/復元部22で圧縮される。圧縮されたRDRデータは、WAN回線3を通ってFCIP変換装置4へ到達する。FCIP変換装置4ではFC-IP変換部41でIPパケットからFCフレームへ変換され、圧縮/復元部42で復元される。復元後のRDRデータは、ストレージ装置5へと送られ、複製対象のデータがストレージ装置5に記録される。
このようにして複製対象データが、ストレージ装置1からストレージ装置5へレプリケーションされる動作と並行して、RDRパス診断が所定の時間間隔で実行される。つまり、RDR診断コマンド差込み部122は、RDRデータ送受信部11から送信されるRDRデータとRDRデータの間にRDR診断コマンドを差し込む。RDR診断コマンドは、FCIP変換装置2のFC-IP変換部21でIPパケットへ変換され、圧縮/復元部22で圧縮される。圧縮後のRDR診断コマンドは、WAN回線3を通ってFCIP変換装置4へ到達する。FCIP変換装置4では復元とIPパケットからFCフレームへの変換が実行され、ストレージ装置5へ送られる。ストレージ装置5では、RDR診断コマンド差込み部522が、RDRデータ群の中からRDR診断コマンドを抽出する。RDR診断コマンドを抽出すると、RDR診断コマンド差込み部522は、RDR診断コマンドを受信したことを示す返信コマンドをストレージ装置1へ向けて送信する。送信された返信コマンドは、FCIP変換装置4にてFCフレームからIPパケットへ変換されて圧縮される。圧縮後の返信コマンドは、WAN回線3を介してFCIP変換装置2へ到達する。返信コマンドは、FCIP変換装置2で復元され、IPパケットからFCフレームへ変換されてストレージ装置1へと送られる。ストレージ装置1では、RDR診断コマンド差込み部122が、返信コマンドを抽出して、返信コマンド受信までの時間に基づいて、RDRパスの正常性の診断を行う。
同様にストレージ装置5もストレージ装置1へ向けて、例えば、所定の時間間隔でRDR診断コマンドを送信する。RDR診断コマンド差込み部122は、RDR診断コマンドを抽出して、ストレージ装置5から送信されるRDR診断コマンドの到達具合に基づいて、RDRパスの正常性の診断を行う。また、ストレージ装置5においても、RDRパス正常性診断部52が、ストレージ装置1から送信されるRDR診断コマンド、ストレージ装置5が送信したRDR診断コマンドに対する返信コマンドに基づいて、RDRパスの診断を行う。次に診断状況別の動作説明を行う。
(通常運用時のRDRパス診断処理)
まず、通常運用時のRDRパス診断の動作について説明する。通常運用時とは、RDRパスを使用中で、且つ、正常状態のことをいう。
図4は、本発明の一実施形態に係るRDRパス診断処理の一例を示す第1のフローチャートである。
まず、RDRパス正常性診断部12は、RDR診断コマンド差込み部122を用いて、通常運用時のペイロードデータを用いたRDR診断コマンドの差し込みを行う(ステップS1)。RDRパス正常性診断部12は、例えば、2秒に1回程度の頻度で、RDRデータ送受信部11が次々と送信する複製対象データを含んだRDRデータの間にRDR診断コマンドを差し込む。ここで、図5を参照する。
図5は、本発明の一実施形態に係るRDRデータの一例を示す図である。
通常運用時には、RDR診断用コマンドに付加するペイロードデータには“ペイロード無し”、“圧縮容易データ1”、“圧縮容易データ2”の何れかを用いる。図5に示すように、例えば、RDR診断コマンドの送信数全体の90%については“ペイロード無し”を付加し、5%については“圧縮容易データ1”を付加し、5%については“圧縮容易データ2”を付加する。また、RDR診断コマンドが通信全体に占める割合は、例えば、20%程度、残りはRDRデータ(複製対象データ)である。
差し込まれたRDR診断コマンドは、FCフレームとしてFCインタフェースでFCIP変換装置2へ送信される。FCIP変換装置2では、FC-IP変換部21および圧縮/復元部22によって、圧縮されてIPパケットとしてWAN回線3を通じてストレージ装置5へ向けて送信される(ステップS2)。
RDR診断コマンドは、その大半(例えば90%)は“ペイロードデータ無し”であり、ペイロードデータ付きのRDR診断コマンドも圧縮/復元部22によって、元データの5%以下まで圧縮される。一般的なRDR診断コマンドにおいて付加されているペイロードデータと比較すると、本実施形態の通常運用時のRDR診断コマンドが消費するWAN回線3の帯域は極めて小さくなる。
FCIP変換装置4は、RDR診断コマンドをストレージ装置5へ送信する。ストレージ装置5では、RDR診断コマンド差込み部522が、RDR診断コマンドを検出し、返信コマンドをストレージ装置1へ向けて送信する(ステップS3)。
また、ストレージ装置5もストレージ装置1と同様の処理を行って、所定の時間間隔でRDR診断コマンドを送信する(ステップS4)。
FCIP変換装置4は、これらをIPパケットに変換する。FCIP変換装置4から送信されたIPパケットは、WAN回線3を通してFCIP変換装置2で受信される。FCIP変換装置2では、圧縮/復元部22によって復元され、FC-IP変換部21によってFCフレームに変換され、ストレージ装置1へ送信される。
ストレージ装置1では、RDR診断コマンド差込み部122にて、FCIP変換装置2から受信したFCフレームからRDR診断コマンドを抽出する。このとき、RDR診断コマンドを正常に受信できた場合は、対向するストレージ装置5に対して、RDR診断コマンドが正常に受信できたことを示す返信コマンドを直ちに送信する(ステップS5)。
同様に、ストレージ装置1から送信したRDR診断コマンドに対する返信コマンドもストレージ装置5から送信される(ステップS3)ので、RDR診断コマンド差込み部122は、RDR診断用コマンドと同様に返信コマンドもFCフレームから抽出する。
RDRパス正常性診断部12は、RDRパスの診断を行う(ステップS6)。例えば、ストレージ装置5からのRDR診断コマンドが一定期間(例えば、数十秒)以上受信できない場合や、送信したRDR診断用コマンドに対する返信コマンドを、通常より極端に遅延(例えば、通常10ミリ秒のところを、2秒を超過)して受信した場合、RDRパス正常性診断部12は、RDRパスが異常である判定する。反対に、ストレージ装置5からのRDR診断コマンドを正常な範囲の時間間隔で取得し、返信コマンドの受信も遅延しない場合には、RDRパス正常性診断部12は、RDRパスに異常なしと判定する。
RDRシステム100は、通常運用中、上記の処理を繰り返し行う。これにより、通常運用時には、WAN回線3に負荷をかけることなく、RDRパスの正常性の診断ができる。また、ペイロード付きのRDR診断コマンドも混在させることで、ペイロード付きRDRデータの送受信が異常となるような故障も見落とさず検出することができる。
(非通常運用時のRDRパス診断処理)
次に非通常運用時のRDRパス診断の動作について説明する。非通常運用時とは、RDRパスを使用していない状態からRDRパスを通常状態で使用し始めるまでを指す。例えば、非通常運用時とは、RDRパスの初回の使用開始時や、異常状態から復旧時のことである。
図4で説明した処理だけでは、WAN回線3への負荷が小さく、RDRパスとしての使用を開始する前のWAN回線3の使用帯域の診断が適切に行えない。そこで、非通常運用時のパス診断では、圧縮率が低い圧縮困難なペイロードデータを付加したRDR診断コマンドを高頻度で送受信することで、RDRパスに負荷をかけ、RDRパスの異常検出に加え、WAN回線3等の使用帯域についても診断を行う。
なお、非通常運用時では、ストレージ装置1にてRDRデータ送受信部11は使用されておらず、ストレージ装置5にてRDRデータ送受信部51は使用されていない状態である。
まず、RDRパス正常性診断部12は、診断状況が非通常運用時か否かを判定する(ステップS11)。例えば、RDRパス正常性診断部12は、ユーザによって非通常運用時のパス診断を行うような信号が入力された場合に非通常運用時と判定してもよいし、RDRパス正常性診断部12の動作が開始されたことに基づいて非通常運用時と判定してもよい。あるいは、RDRパス正常性診断部12は、RDRデータ送受信部11がRDRデータを送信していない状態であると非通常運用時と判定してもよい。通常運用時と判断すると、図4のフローチャートで説明した処理に移る。
非通常運用時と判断すると、RDRパス正常性診断部12は、RDR診断コマンド差込み部122を用いて、非通常運用時のペイロードデータを用いたRDR診断コマンドの生成を行う(ステップS12)。具体的には、RDR診断コマンド差込み部122は、診断用のペイロードデータ121内の“圧縮困難データ”を使用して、RDR診断コマンドを生成する。RDR診断コマンド差込み部122は、RDRパスで使用可能なデータ転送帯域を上限まで使用するため、通常運用時の頻度(例えば、2秒に1回)よりも高頻度でRDR診断コマンドを送信する。通常、WAN帯域は高価で狭いため、一般的にはストレージ装置1,5やFCIP変換装置2,4には送信時に使用可能な上限帯域が設定されている。RDR診断コマンド差込み部122は、各装置の帯域が、定められた上限付近となるような頻度でRDR診断コマンドを送信する。高頻度でRDR診断コマンドを送信する期間は、一定期間、例えば、2分間である。
送信されたRDR診断コマンドは、FCフレームとしてFCインタフェースでFCIP変換装置2へ送信される。FCIP変換装置2では、FC-IP変換部21および圧縮/復元部22によって、圧縮されてIPパケットとしてWAN回線3を通じてFCIP変換装置4へ送信される(ステップS13)。
非通常運用時のパス診断では、RDR診断コマンドのペイロードデータに“圧縮困難データ”を用いており、且つ、高頻度にRDR診断コマンドを送信するため、図4を参照して説明した通常運用時の場合とは異なり、WAN回線3の帯域は大幅に消費される。
FCIP変換装置4は、RDR診断コマンドをストレージ装置5へ送信する。ストレージ装置5では、RDR診断コマンド差込み部522が、RDR診断コマンドを検出し、返信コマンドをストレージ装置1へ向けて送信する(ステップS14)。
また、ストレージ装置5もストレージ装置1と同様の処理を行って、高頻度に圧縮困難なペイロードデータを付加したRDR診断コマンドを送信する(ステップS15)。
FCIP変換装置4は、これらをIPパケットに変換し、圧縮する。FCIP変換装置4から送信されたIPパケットは、WAN回線3を通してFCIP変換装置2で受信される。FCIP変換装置2では、圧縮/復元部22によって復元され、FC-IP変換部21によってFCフレームに変換され、ストレージ装置1へ送信される。
ストレージ装置1では、RDR診断コマンド差込み部122にて、FCIP変換装置2から受信したFCフレームからRDR診断コマンドを抽出する。このとき、RDR診断コマンドを正常に受信できた場合は、対向するストレージ装置5に対して、RDR診断コマンドが正常に受信できたことを示す返信コマンドを直ちに送信する(ステップS16)。
同様に、ストレージ装置1から送信したRDR診断コマンドに対する返信コマンドもストレージ装置5から送信される(ステップS14)ので、RDR診断コマンド差込み部122は、RDR診断用コマンドと同様に返信コマンドもFCフレームから抽出する。
RDRパス正常性診断部12は、RDRパスの診断を行う(ステップS17)。例えば、RDR診断コマンドが一定期間(例えば、数十秒)以上受信できない場合や、送信したRDR診断用コマンドに対する返信コマンドを、通常より極端に遅延(例えば、通常10ミリ秒のところを、2秒を超過)して受信した場合、RDRパス正常性診断部12は、ストレージ装置1とストレージ装置5の間のRDRパスが異常である判定する。反対に、ストレージ装置5からのRDR診断コマンドを正常な範囲の時間間隔で取得し、返信コマンドの受信も遅延しない場合には、RDRパス正常性診断部12は、RDRパスに異常なし、帯域も十分と判定する。
次に、RDRパス正常性診断部12は、通常運用時のRDRパス診断の方法に切り替えるか否かを判定する(ステップS18)。例えば、RDRパス正常性診断部12は、高頻度でRDR診断コマンドを送信する期間(例えば2分間)を経過すると、RDRパスの使用開始にあたっての問題点はないと判断し、図4の通常運用時の動作に移行する。
これにより、非通常運用時には、WAN回線3の帯域を含むRDRパスに十分な負荷をかけて帯域が十分かどうかをチェックしつつ、ストレージ装置1とストレージ装置5の間のRDRパス全体の正常性の診断が可能になる。
なお、図4、図6では、ストレージ装置1からRDR診断コマンドを送信する視点で説明を行ったが、ストレージ装置5でも同様の処理を行ってもよい。
以上説明したように、本実施形態によれば、RDRパスを通常の運用で使用している場合は、ペイロードデータ無しのRDR診断コマンドや、圧縮容易なペイロードデータを一定の比率で混在させてRDRパス診断を行う。これにより、必要以上にWAN回線3の帯域が消費されることを避けつつ、ペイロードデータ付きでなければ検出できない故障を検出することができる。
また、RDRパスを使用していない状態から使用を開始する非通常運用時の場合(故障からの復旧時などRDRパスの使用開始時)、圧縮容易ではないペイロードデータを用いてRDRパスの診断を行う。これは、RDRパスの故障の検出だけではなく、WAN回線3の帯域が使用可能かどうかの確認を行う必要があるためである。圧縮しにくいペイロードデータ付きのRDR診断コマンドを送信することにより、WAN回線3およびFCIP変換装置2、4が高負荷・広帯域に耐えられるかの診断を行う。
また、非通常運用時の診断を開始して、一定期間を経過後、異常がない場合は、RDRパスを通常の運用で使用している場合のRDRパス診断に移行する。これにより、RDRパスの診断状況に応じて適切な診断を自動的に実行することができる。
なお、実施形態ではRDRパスが1ペアである場合を例に説明を行ったが、2ペア以上であってもよい。また、複数ペアのストレージ装置を1ペアのFCIP変換装置へ接続する構成や、1ペアのストレージ装置を複数ペアのFCIP変換装置へ接続する構成であってもよい。また、ストレージ装置1、5とFCIP変換装置2、4間のインタフェースはFCの場合を例に説明を行ったが、FCではなく、InfiniBandやSAS(Serial Attached SCSI)などの他のインタフェースであってもよい。
また、RDRパス正常性診断部12をストレージ装置1と一体的に設ける構成としたが、RDRパス正常性診断部12をストレージ装置1とは独立した装置として構成してもよい。
図7は、本発明の一実施形態に係る位置通知装置の最小構成を示す図である。
パス診断装置30は、少なくとも、第1のストレージ装置と第2のストレージ装置の間で診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、第1のストレージ装置と第2のストレージ装置の間のパスの診断を行う診断部31を備える。
診断部31は、前記パスが使用中で、且つ、正常状態である通常運用時において、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、ペイロードデータ付きの前記診断コマンドと、を所定の割合で混在させて送信する。
これにより、RDRパスを使用中で、かつ、正常状態の動作時に、RDR診断コマンドによるWAN回線の帯域の消費を抑えることができる。
図8は、本発明の一実施形態に係るストレージ装置のコントローラのハードウェア構成の一例を示す図である。
コンピュータ900は、CPU(Central Processing Unit)901、主記憶装置902、補助記憶装置903、入出力インタフェース904、通信インタフェース905を備える。なお、ストレージ装置1,5は図示しないコントローラを備えており、このコントローラは、コンピュータ900に実装される。そして、上述したRDRデータ送受信部11,51およびRDRパス正常性診断部12,52の各機能は、プログラムの形式で補助記憶装置903に記憶されている。CPU901は、プログラムを補助記憶装置903から読み出して主記憶装置902に展開し、当該プログラムに従って上記処理を実行する。また、CPU901は、プログラムに従って、記憶領域を主記憶装置902に確保する。また、CPU901は、プログラムに従って、処理中のデータを記憶する記憶領域を補助記憶装置903に確保する。
なお、ストレージ装置1,5のコントローラの全部または一部の機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより各機能部による処理を行ってもよい。ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、CD、DVD、USB等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。また、このプログラムが通信回線によってコンピュータ900に配信される場合、配信を受けたコンピュータ900が当該プログラムを主記憶装置902に展開し、上記処理を実行しても良い。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
100・・・RDRシステム
1、5・・・ストレージ装置
11、51・・・RDRデータ送受信部
12、52・・・RDRパス正常性診断部
121、521・・・ペイロードデータ
122、522・・・RDR診断コマンド差込み部
2、4・・・FCIP変換装置
21、41・・・FC-IP変換部
22、42・・・圧縮/復元部
3・・・WAN回線
900・・・コンピュータ
901・・・CPU
902・・・主記憶装置
903・・・補助記憶装置
904・・・入出力インタフェース
905・・・通信インタフェース

Claims (4)

  1. 第1のストレージ装置と第2のストレージ装置でデータレプリケーションを行うときに複製対象のデータが伝送されるパスに対して診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、前記パスの診断を行う診断手段、を備え、
    前記診断手段は、前記パスで前記複製対象のデータの伝送が行われていない状態から前記データの伝送が開始されると前記パスの帯域に負荷をかけながら前記パスの異常検出を行う非通常運用時パス診断を実行し、
    前記伝送の開始から所定時間が経過し、それまでに前記非通常運用時パス診断にて異常が検出されない場合、前記非通常運用時パス診断に代えて前記パスの帯域に負荷をかけないように前記パスの異常検出を行う通常運用時パス診断を実行し、
    前記非通常運用時パス診断では、前記通常運用時パス診断で使用するペイロードデータよりも圧縮率が低いペイロードデータ付きの前記診断コマンドを前記通常運用時パス診断よりも高頻度で送信し、
    前記通常運用時パス診断では、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、前記非通常運用時パス診断で使用するペイロードデータよりも圧縮率が高いペイロードデータ付きの前記診断コマンドと、を所定の比率で混在させて送信する、
    パス診断装置。
  2. RDR(Remote Data Replication)機能を有し、
    請求項1に記載のパス診断装置と、
    を備えるストレージ装置。
  3. 第1のストレージ装置と第2のストレージ装置でデータレプリケーションを行うときに複製対象のデータが伝送されるパスに対して診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、前記パスの診断を行うステップ、を有し、
    前記診断を行うステップでは、前記パスで前記複製対象のデータの伝送が行われていない状態から前記データの伝送が開始されると前記パスの帯域に負荷をかけながら前記パスの異常検出を行う非通常運用時パス診断を実行し、
    前記伝送の開始から所定時間が経過し、それまでに前記非通常運用時パス診断にて異常が検出されない場合、前記非通常運用時パス診断に代えて前記パスの帯域に負荷をかけないように前記パスの異常検出を行う通常運用時パス診断を実行し、
    前記非通常運用時パス診断では、前記通常運用時パス診断で使用するペイロードデータよりも圧縮率が低いペイロードデータ付きの前記診断コマンドを前記通常運用時パス診断よりも高頻度で送信し、
    前記通常運用時パス診断では、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、前記非通常運用時パス診断で使用するペイロードデータよりも圧縮率が高いペイロードデータ付きの前記診断コマンドと、を所定の比率で混在させて送信する、
    パス診断方法。
  4. コンピュータに、
    第1のストレージ装置と第2のストレージ装置でデータレプリケーションを行うときに複製対象のデータが伝送されるパスに対して診断コマンドを送受信して、前記診断コマンドの到達状況に基づいて、前記パスの診断を行うにあたり、
    前記パスで前記複製対象のデータの伝送が行われていない状態から前記データの伝送が開始されると前記パスの帯域に負荷をかけながら前記パスの異常検出を行う非通常運用時パス診断を実行し、
    前記伝送の開始から所定時間が経過し、それまでに前記非通常運用時パス診断にて異常が検出されない場合、前記非通常運用時パス診断に代えて前記パスの帯域に負荷をかけないように前記パスの異常検出を行う通常運用時パス診断を実行し、
    前記非通常運用時パス診断では、前記通常運用時パス診断で使用するペイロードデータよりも圧縮率が低いペイロードデータ付きの前記診断コマンドを前記通常運用時パス診断よりも高頻度で送信し、
    前記通常運用時パス診断では、前記診断コマンドとして、ペイロードデータ無しの前記診断コマンドと、前記非通常運用時パス診断で使用するペイロードデータよりも圧縮率が高いペイロードデータ付きの前記診断コマンドと、を所定の比率で混在させて送信する処理、
    を実行させるプログラム。
JP2019234789A 2019-12-25 2019-12-25 パス診断装置、ストレージ装置、パス診断方法及びプログラム Active JP7048155B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019234789A JP7048155B2 (ja) 2019-12-25 2019-12-25 パス診断装置、ストレージ装置、パス診断方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019234789A JP7048155B2 (ja) 2019-12-25 2019-12-25 パス診断装置、ストレージ装置、パス診断方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2021103460A JP2021103460A (ja) 2021-07-15
JP7048155B2 true JP7048155B2 (ja) 2022-04-05

Family

ID=76755294

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019234789A Active JP7048155B2 (ja) 2019-12-25 2019-12-25 パス診断装置、ストレージ装置、パス診断方法及びプログラム

Country Status (1)

Country Link
JP (1) JP7048155B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011028578A (ja) 2009-07-27 2011-02-10 Hitachi Ltd 縮退業務支援システム、縮退業務支援方法、およびバックアップサーバ
WO2011096082A1 (ja) 2010-02-08 2011-08-11 富士通株式会社 ネットワーク中継装置および診断方法
JP2014007712A (ja) 2012-06-27 2014-01-16 Nippon Telegr & Teleph Corp <Ntt> 遠隔制御システム、遠隔制御装置、遠隔制御方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011028578A (ja) 2009-07-27 2011-02-10 Hitachi Ltd 縮退業務支援システム、縮退業務支援方法、およびバックアップサーバ
WO2011096082A1 (ja) 2010-02-08 2011-08-11 富士通株式会社 ネットワーク中継装置および診断方法
JP2014007712A (ja) 2012-06-27 2014-01-16 Nippon Telegr & Teleph Corp <Ntt> 遠隔制御システム、遠隔制御装置、遠隔制御方法、およびプログラム

Also Published As

Publication number Publication date
JP2021103460A (ja) 2021-07-15

Similar Documents

Publication Publication Date Title
JP5052168B2 (ja) 障害部分を分離するストレージ・システム、障害を分離するプログラム、及びその方法
JP5509637B2 (ja) フォールトトレラントシステム
JP4166939B2 (ja) 能動的故障検出
CN105760247A (zh) 一种硬盘故障处理系统和方法
JP4155088B2 (ja) 情報処理装置
JP7048155B2 (ja) パス診断装置、ストレージ装置、パス診断方法及びプログラム
US8880957B2 (en) Facilitating processing in a communications environment using stop signaling
JP4413806B2 (ja) 障害切り分け方法、障害切り分け機能を有する通信装置及びプログラム
US8331270B2 (en) In-band communication of network statistics over a FICON network
JP6134720B2 (ja) 接続方法
JP5548160B2 (ja) 障害監視用ノード装置および障害検知回復方法
JP2016052074A (ja) 通信装置
JPH07183891A (ja) 計算機システム
JP4756203B2 (ja) プロトコル変換装置とこれを用いた二重化データ伝送システム
JP5556226B2 (ja) インタフェース試験装置及びインタフェース試験方法
JP2011101113A (ja) Mac回路
JP2001086146A (ja) Fc_alシステムの制御方法
JPH08202515A (ja) プリントサーバ装置
JPH0784899A (ja) Scsi機器の選択リセット方式
JPH0435251A (ja) リングネットワークの障害監視方式
JPH10260907A (ja) バスインタフェース方式およびバスインタフェース診断方式
JP2005159483A (ja) 二重化通信装置
JP3603956B2 (ja) 通信制御装置のバッファ管理方式
JPH03292024A (ja) 伝送装置の自己診断方式
JPH07135510A (ja) ローカルエリヤネットワーク接続装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211214

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20211214

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20211223

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20220104

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220222

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220317

R150 Certificate of patent or registration of utility model

Ref document number: 7048155

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150