JP2001043026A - 系間情報通信システム - Google Patents
系間情報通信システムInfo
- Publication number
- JP2001043026A JP2001043026A JP11215348A JP21534899A JP2001043026A JP 2001043026 A JP2001043026 A JP 2001043026A JP 11215348 A JP11215348 A JP 11215348A JP 21534899 A JP21534899 A JP 21534899A JP 2001043026 A JP2001043026 A JP 2001043026A
- Authority
- JP
- Japan
- Prior art keywords
- communication
- path
- controller
- information communication
- inter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2053—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
- G06F11/2089—Redundant storage control functionality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2005—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2007—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
- G06F11/201—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2002—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
- G06F11/2012—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant and using different communication protocols
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
- G06F11/2097—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/061—Improving I/O performance
- G06F3/0613—Improving I/O performance in relation to throughput
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0635—Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
- G06F3/0689—Disk arrays, e.g. RAID, JBOD
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Computer Networks & Wireless Communication (AREA)
- Memory System Of A Hierarchy Structure (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
- Hardware Redundancy (AREA)
- Memory System (AREA)
Abstract
2つの系の間の情報通信における転送サイズの違いによ
り、当該系間の情報通信に使用する通信パスを使い分け
ることで、当該系間の情報通信の高速化を図る。 【解決手段】キャッシュメモリ312a,322aを内
蔵する2重化されたコントローラ310,320間の通
信と、キャッシュメモリ312a,312a間のデータ
コピーでの転送サイズの違い(を反映する情報通信の種
類の違い)により、前者の場合には、MPU311、内
部バス317、コント間I/F315、バス330、コ
ント間I/F325、内部バス327、MPU321の
パスを、後者の場合には、キャッシュメモリ312a、
コント間I/F316、バス340、コント間I/F3
26、キャッシュメモリ322aのパスを、それぞれ切
り替えて使用する。
Description
系との間で情報通信が行われる、2重化されたコントロ
ーラを備えた2重化コントローラ内蔵装置に代表される
系間情報通信システムに関する。
れ異なるホスト装置と接続可能な2重化されたコントロ
ーラを備えた2重化コントローラ内蔵装置を構成してい
るものがある。この種のディスクアレイ装置では、各コ
ントローラ(各系)と対応するホスト装置との間でデー
タ転送が可能なようになっている。各コントローラに
は、ホスト装置との間の転送データを一時記憶するため
のキャッシュメモリがそれぞれ設けられている。
するディスクアレイ装置(系間情報通信システム)で
は、各コントローラ(各系)内のキャッシュメモリ上の
データの保全性を高めるために、いわゆるミラードキャ
ッシュ方式を採用している。この方式は、ホスト装置か
ら自系(のコントローラ)で受け取ったライトデータを
他系のコントローラのキャッシュメモリにコピー(ミラ
ー)する方式である。
ィスクアレイ装置においては、他系でのキャッシュメモ
リへのコピー(ライト)が完了するのを待って、つまり
自系と他系のキャッシュメモリの内容の一致化が図られ
るのを待って、ホスト装置へのライトの完了を通知する
のが一般的である。
コントローラ間の重要な通信での信頼性向上のために、
冗長なパスを特別に備えるのが一般的である。
化コントローラを内蔵し、ミラードキャッシュ方式を適
用する従来のディスクアレイ装置(2重化コントローラ
内蔵装置、系間情報通信システム)では、他系のライト
が完了するまで自系のコントローラはホスト側に完了を
返せないため、この2重化コントローラ間のライトデー
タの通信のパスがライト時の性能のボトルネックになる
という問題があった。
コントローラ内蔵装置、系間情報通信システム)では、
コントローラ間の重要な通信での信頼性向上のために、
冗長なパスを特別に備える必要があるという問題もあっ
た。
でその目的は、2重化コントローラ間の情報通信に代表
される2つの系の間の情報通信における転送サイズの違
いにより、当該系間の情報通信に使用する通信パスを使
い分けることで、当該系間の情報通信の高速化を図るこ
とができる系間情報通信システムを提供することにあ
る。
けなくても、パスの冗長化を図ることができる系間情報
通信システムを提供することにある。
2の系との間で情報通信が行われる系間情報通信システ
ムにおいて、上記第1の系と第2の系との間の転送サイ
ズが小さい場合の情報通信に供される、転送サイズが小
さい場合に高速レスポンスが可能な第1の通信路と、上
記第1の系と第2の系との間の転送サイズが大きい場合
の情報通信に供される、上記第1の通信路に比べて転送
サイズが大きい場合の転送能力が大きい第2の通信路と
を備えると共に、上記第1及び第2の系には、他系と情
報通信を行う場合、対象となる情報のサイズに応じて上
記第1または第2の通信路のいずれか一方が切り替え使
用されるように制御する主制御手段をそれぞれ設けたこ
とを特徴とする。
で情報通信を行う場合、その情報通信の対象となる情報
のサイズ(転送サイズ)に応じて使用する通信路を使い
分けることにより、つまり転送サイズが小さいときに
は、転送サイズが小さいときのレスポンスが高速な第1
の通信路を用い、転送サイズが大きいときには、転送能
力が大きい第2の通信路を用いることにより、2つの系
の間の高速情報通信が実現可能となる。ここで、転送サ
イズの大小は情報通信の種類によって決まることが多い
ため、その種類(例えば、データ転送に必要なデータ転
送前後の一連の手順での系間通信、つまり制御データの
通信であるか、データ転送それ自体であるか)に応じて
通信路を使い分けするとよい。
御手段(例えばマイクロプロセッサユニット)が接続さ
れた内部バスを備えた構成では、当該第1及び第2の系
に、自系内の主制御手段による内部バスを介しての制御
のもとで上記第1の通信路を介して他系との間で逐次情
報通信を行う第1のインタフェース制御手段と、自系内
の主制御手段からの指示に応じて主制御手段から独立に
上記第2の通信路を介して他系との間で指示された情報
通信を行う第2のインタフェース制御手段とを設けるこ
とで、転送サイズに応じて使用する通信路を使い分けて
の情報通信(情報転送)を効率的に行うことができる。
ドキャッシュ方式を適用するキャッシュメモリを内蔵す
る2重化コントローラである構成では、上記第2のイン
タフェース制御手段に、自系内の主制御手段からの指示
に応じて自系内のキャッシュメモリに格納されたデータ
を上記第2の通信路を介して他系内の第2のインタフェ
ース制御手段により当該他系内のキャッシュメモリにコ
ピーさせる機能を持たせるならば、内部バスでのトラヒ
ックが上がるのを防止しながら、大量のデータコピーが
実現可能となる。
クセス可能な少なくとも1つのディスク装置と、上記第
1及び第2の系とディスク装置とを接続するための第3
の通信路とを備えたシステムでは、上記第1のパスまた
は第2のパス上に障害が発生した場合に、上記主制御手
段の制御により、上記ディスク装置アクセス用の第3の
通信路が第1または第2のパスの代替パスとして使用さ
れる構成とすることにより、冗長パスを特別に用意しな
くても、通信パスの冗長化が実現可能となる。
き、系間情報通信システムが2重化コントローラ内蔵の
ディスクアレイ装置である場合を例に、図面を参照して
説明する。
ントローラ内蔵のディスクアレイ装置のブロック構成
図、図2は当該ディスクアレイ装置を備えたシステムの
ブロック構成図である。
に直接関係するディスクアレイ装置を接続するホスト装
置(ホストコンピュータ)であり、例えばサーバ(サー
バコンピュータ)をなす。ホスト装置100,200と
ディスクアレイ装置300(内の後述するコントローラ
310,320に設けられたホストI/F313,32
3)とは、SCSI(Small Computer System Interfac
e)バス、あるいはファイバチャネル等のバス110,
210により接続されている。ホスト装置100,20
0には、例えば複数のクライアント(クライアントコン
ピュータ)400がイーサネット(登録商標)(Ethern
et)(登録商標)バス、リングバス等により構成される
ネットワーク500を介して接続されている。
ように、当該装置300全体を制御する2重化されたコ
ントローラ310,320と、ディスクアレイを構成す
る複数のディスク装置、例えば2つのハードディスク装
置(以下、HDDと称する)360,361とを備えて
いる。コントローラ310,320(内の後述するHD
D−I/F314,324)とHDD360,361と
は、SCSIバス等のバス350により接続されてい
る。
トローラ310,320の制御中枢をなす中央制御部と
してのMPU(Micro Processing Unit)311,32
1と、キャッシュメモリ部312,322とを備えてい
る。
スト装置100,200から転送されたデータ(ライト
データ)、及びHDD360,361から読み出された
データ(リードデータ)を一時記憶するキャッシュメモ
リ312a,322を内蔵する。このキャッシュメモリ
312a,322aは、ミラードキャッシュを実現する
ために、当該キャッシュメモリ312a,322a(を
内蔵したキャッシュメモリ部312,322)を持つコ
ントローラ310,320と対をなすもう一方のコント
ローラ320,310からのデータ、つまり他方(他
系)のコントローラ320,310からのデータがコピ
ー可能な領域を有する。またキャッシュメモリ部31
2,322は、I/F(インタフェース)として、後述
する内部バス317,327との接続用と、コントロー
ラ間データ転送用(コントローラ間データ転送に用いる
バス340との接続用)との2ポートを有する。
ト装置100,200と接続するバス110,120の
制御部をなすインタフェース制御部、つまりホスト装置
100,200とのインタフェース制御部(以下、ホス
トI/Fと称する)313,323と、HDD360,
361とのインタフェース制御部(以下、HDD−I/
Fと称する)314,324とを備えている。
コントローラ310,320間のデータ転送制御を司
り、データ転送サイズが小さい場合に高速レスポンスが
可能なコントローラ間データ転送制御部(以下、コント
間I/Fと称する)315,325と、当該コントロー
ラ310,320間のデータ転送制御を司り、データ転
送サイズに影響されずに一定のレスポンスが可能なコン
トローラ間データ転送制御部(以下、コント間I/Fと
称する)316,326とを備えている。コント間I/
F315,325は内部バス317,327を介してM
PU311,321と接続され、コント間I/F31
6,326はキャッシュメモリ部312,322のコン
トローラ間データ転送用ポートと接続されている。
Iバス(Peripheral Component Interconnect Bus)に
代表される内部バス317,327を備えている。この
内部バス317,327には、コントローラ310,3
20内の各モジュール(ここでは、MPU311,32
1と、キャッシュメモリ部312,322と、ホストI
/F313,323と、HDD−I/F314,324
と、コント間I/F315,325の各モジュール)が
接続されている。
I/F315,225は、データ転送サイズが小さいデ
ータの転送に適したシリアルバスに代表されるバス33
0により相互接続され、コント間I/F316,326
は、データ転送サイズが大きいデータの転送に適した非
同期転送型のバス340により相互接続されている。従
来のディスクアレイ装置には、コント間I/F316,
326と、当該コント間I/F316,326を接続す
るバス340とが存在しないことに注意されたい。この
ため従来は、コントローラ310,320間のデータ転
送は、MPU311,312の制御により全て内部バス
317,327を介して行う必要がある。
構成のディスクアレイ装置300の動作について、ホス
ト装置100からコントローラ310に対して要求され
たデータのライト時に、そのコピーデータをもう一方の
コントローラ320内のキャッシュメモリ322に格納
する場合を例に、図3及び図4を参照して説明する。
装置300内のコントローラ310に対し、バス110
を介してデータのライト要求が送られたものとする。コ
ントローラ310が、このホスト装置100からのライ
ト要求をホストI/F313を介して受け付けると、ホ
スト装置100からコントローラ310へのライトデー
タの転送が開始される。
を介して転送されるデータは、コントローラ310内の
ホストI/F313で受け取られて、ホストI/F31
3→内部バス317→キャッシュメモリ部312のパス
を通って、そのコントローラ310のキャッシュメモリ
部312に内蔵されたキャッシュメモリ312に格納さ
れる。本実施形態では、ホスト装置100からのライト
要求で指定されたディスクアレイ(内のHDD)のデー
タがキャッシュメモリ312aにも存在する(ライト時
の)キャッシュヒットの場合には、当該キャッシュメモ
リ312a内の該当するデータが、ホスト装置100か
らのライトデータに更新される。このキャッシュメモリ
312aに格納されたライトデータは、ホスト装置10
0からのライト要求で指定されたディスクアレイ(内の
HDD)に対する遅延書き込みの対象となる。
当該コントローラ310(自系)のキャッシュメモリ3
12に格納されたのと同一のライトデータをコントロー
ラ320(他系)のキャッシュメモリ322にコピー
(ミラー)するために、コントローラ320が停止して
いないか否かを、内部バス317を介してのコント間I
/F315を用いたコントローラ間通信(制御データの
授受)で確認する。即ちMPU311は、コントローラ
320内のMPU321への問い合わせを、図3に示す
ように、MPU311→内部バス317→コント間I/
F315→バス330→コント間I/F325→内部バ
ス327→MPU321のパス31を用いて通知する。
コントローラ310内のMPU311からの問い合わせ
を(コント間I/F325から内部バス327を介し
て)受け取ると、その問い合わせとは逆のパスで、つま
り図3に示すように、MPU321→内部バス327→
コント間I/F325→バス330→コント間I/F3
15→内部バス317→MPU311のパス32で、コ
ントローラ310内のMPU311へ正常である旨の応
答を返す。
MPU321からの正常応答を受け取ると、先に格納し
たデータのキャッシュメモリ322へのコピーを、図4
に示すように、MPU311→内部バス317→キャッ
シュメモリ部312のパス41を用いてキャッシュメモ
リ部312に指示する。
されたデータを、コント間I/F316を用いたデータ
転送により、図4に示すように、キャッシュメモリ31
2a→コント間I/F316→バス340→コント間I
/F326→キャッシュメモリ322aのパス42を用
いて、コントローラ320内のキャッシュメモリ322
a(に確保されているコピー領域)にコピーさせる。こ
のデータ転送の最後では、データ転送結果を示す転送ス
テータスが(コントローラ320内の)キャッシュメモ
リ部322のコントローラ間データ転送用I/F(ポー
ト)から上記パス42と逆のパスで、(コントローラ3
10内の)キャッシュメモリ部312のコントローラ間
データ転送用I/F(ポート)に返される。
テータスからデータ転送の完了を判定すると、内部バス
317との接続用I/F(ポート)により、キャッシュ
メモリ322aへの転送(コピー)が完了したことを、
図4に示すように、キャッシュメモリ部312→内部バ
ス317→MPU311のパス43を用いてMPU31
1に通知する。
22aへの転送(コピー)完了通知を受け取って、キャ
ッシュメモリ312aからキャッシュメモリ322aへ
のコピー(ミラー)の完了を確認すると、ホスト装置1
00から要求されたデータライトの完了を判定し、MP
U311→内部バス317→ホストI/F313→バス
110→ホスト装置100のパスによりホスト装置10
0にライト完了通知を返す。なお、キャッシュメモリ3
12aからキャッシュメモリ322aへのコピー(ミラ
ー)が完了した旨の通知は、転送サイズが小さいため、
前記パス32を用いてコントローラ310内のMPU3
11送るようにしても構わない。
310,320(内のMPU311,321)間の上記
問い合わせ及び当該問い合わせに対する応答、つまりコ
ントローラ間通信(制御データの授受)には、コント間
I/F315,325及びバス330を含むパス31
(32)を用い、キャッシュメモリ312a,322a
間のデータ転送(データコピー)には、コント間I/F
316,326及びバス340を含むパス42を用いる
ようにしている。
データの転送が行われるキャッシュメモリ312a,3
22a間のデータ転送(データコピー)に比べて、その
転送データ量が著しく少ない。
は、本実施形態のようにシリアルバスで構成されている
場合、データ転送開始までの手順と、データ転送終了後
の手順に(伴う制御データの授受に)要する時間は、非
同期転送型のバス340と異なって少ない。つまり転送
のための手順のオーバヘッドが小さい。一方、データ転
送時間は、データ量が多いほど長く、少ないほど短くな
る。したがってバス330は、上記のコントローラ間通
信のように、データ量が少ないデータ転送の場合に高速
レスポンスが期待できる。
327及びバス340が存在しないため)、データ転送
量が少ないコントローラ間通信は勿論、データ転送量が
多いキャッシュメモリ間データ転送(データコピー)の
場合にも、(コント間I/F315,325及びバス3
30を含む)上記パス31(32)を用いていた。しか
も、このパス31(32)には各コントローラ310,
320の内部バス317,327が含まれている。した
がって、データコピーのために内部バス317,327
を使用することでバストラヒックが上がり、加えてMP
U311,321の処理が必要となることから、コピー
性能、更にはホスト装置100,200からの要求処理
性能が低下する虞があった。
メモリ部312,322に接続されたコント間I/F3
16,326を設け、当該コント間I/F316,32
6により、(内部バス317,327から独立した)バ
ス340を中心とするパス41を介して、キャッシュメ
モリ部312,322内のキャッシュメモリ312a,
312b間の(データコピーのための)データ転送をM
PU321,322から独立に行うようにしている。こ
こでは、データコピーのために、コントローラ310,
320内の各種モジュールが接続されている内部バス3
17,327を使用せず、MPU321,322の処理
も不要なことから、上述の性能低下を低減できる。
同期転送型の場合、データ転送開始までとデータ転送終
了後の手順が複雑であり、バス330と異なって転送の
ための手順のオーバヘッドが大きい。一方、バス330
経由でのデータコピー等、一定の転送サイズの範囲での
データ転送に要する時間は、上記手順に要する時間に比
べて短い。したがって、コント間I/F316,326
によりバス340を経由してのデータ転送では、一定の
転送サイズの範囲では、転送サイズに関係なく、データ
転送のための手順に要する時間でほぼ決まる一定のレス
ポンスを持つ。
バス317,327、コント間I/F315,325及
びバス330を含むパス31(32)を使用しない構成
では、つまりパス31(32)を、コントローラ間通信
のようにデータ量が少ないデータ転送のみに使用する構
成では、価格的な制約のもとで、バス330の信号ビッ
ト幅を少なくし(ハードウェア量を減らし)、代わりに
高速信号線を用いることが可能となり、コントローラ間
通信等を高速に処理することができる。
置300において、上記パス31(32)の中心をなす
コント間I/F315、バス330、コント間I/F3
25、或いは上記パス(42)の中心をなすコント間I
/F316、バス340、コント間I/F326のいず
れかに障害が発生することがあり得る。
いずれかの要素に障害が発生した場合の代替パスとし
て、HDD−I/F314、バス350及びHDD−I
/F324のパスが使用可能なようになっている。この
HDD−I/F314、バス350及びHDD−I/F
324のパス(代替パス)を実現するには、例えばコン
トローラ310であれば、内部バス317上の通信に使
用するデバイスの指定を、コント間I/F315或いは
キャッシュメモリ部312のコントローラ間データ転送
用I/F(ポート)からHDD−I/F314へ、コン
トローラ320であれば、内部バス327上の通信に使
用するデバイスの指定をコント間I/F325或いはキ
ャッシュメモリ部322のコントローラ間データ転送用
I/F(ポート)からHDD−I/F324へ変更すれ
ばよい。
トI/F313,323に、ホスト装置との接続ポート
を2つ持たせ、ホスト装置100,200を、図5に示
すように、バス110,210に相当するバス120,
220を介してコントローラ320,310のホストI
/F323,313に接続するとよい。
310自身の障害またはホスト装置100と当該コント
ローラ310との間の通信パスの障害が発生した場合、
ホスト装置100はバス120を用いることで、他系の
コントローラ320を切り替え使用することができる。
同様にコントローラ320自身の障害またはホスト装置
200と当該コントローラ320との間の通信パスの障
害が発生した場合には、ホスト装置200はバス220
を用いることで、他系のコントローラ310を切り替え
使用することができる。
0,200は、相手に障害が発生した場合に相手の代替
処理を行うようになっている。そのためホスト装置10
0,200は互いに障害発生を監視している。この監視
は、ネットワーク500を介して行うことも可能である
が、トラフィックと信頼性を考慮するならば、図5に示
すようにホスト装置100,200間を接続するイーサ
ネットバス等のバス600を設け、当該バス600を介
して監視するとよい。なお、ホスト装置100,200
は、互いに処理を行う構成でも、一方が待機系となる構
成のいずれでも構わない。
ーラ間の情報通信の高速化のために、その情報通信の対
象となる情報のサイズ(の違いを反映する情報通信の種
類、つまりデータ転送前後の一連の手順でのコントロー
ラ間通信であるか、データ転送それ自体であるか)に応
じて2種の通信パスを切り替え使用する2重化コントロ
ーラ内蔵のディスクアレイ装置に実施した場合について
説明したが、これに限るものではない。本発明は、相互
に情報通信を行う2つの系の装置を備えた系間情報通信
システムにおける、系間の情報通信の高速化にも適用可
能である。
重化されたコントローラ間の情報通信に代表される2つ
の系の間の情報通信における転送サイズの違い(を反映
する情報通信の種類の違い)により、当該系間の情報通
信に使用する通信パスを使い分けるようにしたので、当
該系間の情報通信の高速化を図ることができる。特に、
ミラードキャッシュ方式を適用するキャッシュメモリを
内蔵する2重化コントローラ間の情報通信を行うシステ
ムでは、コントローラ間の高速データコピーが実現でき
る。
ら共通にアクセス可能な少なくとも1つのディスク装置
と、これらを相互接続するための通信路とを備えたシス
テムでは、系間の情報通信に切り替え使用する通信パス
の障害時には、この通信路を代替パスとして使用するこ
とにより、冗長パスを特別に設けなくても、パスの冗長
化を図ることができる。
内蔵のディスクアレイ装置のブロック構成図。
テムのブロック構成図。
される通信パスを説明するための図。
通信パスを説明するための図。
2重化コントローラ内蔵装置) 310…コントローラ(第1の系) 311,321…MPU(主制御手段) 312,322…キャッシュメモリ部 312a,322a…キャッシュメモリ 313,323…ホストI/F 314,324…HDD−I/F 315,325…コント間I/F(第1のインタフェー
ス制御手段) 316,326…コント間I/F(第2のインタフェー
ス制御手段) 317,327…内部バス 320…コントローラ(第2の系) 330…バス(第1の通信路) 340…バス(第2の通信路) 350…バス(第3の通信路) 360,361…HDD(ディスク装置)
Claims (4)
- 【請求項1】 第1の系と第2の系との間で情報通信が
行われる系間情報通信システムにおいて、 前記第1の系と前記第2の系との間の転送サイズが小さ
い場合の情報通信に供される、転送サイズが小さい場合
に高速レスポンスが可能な第1の通信路と、 前記第1の系と前記第2の系との間の転送サイズが大き
い場合の情報通信に供される、前記第1の通信路に比べ
て転送サイズが大きい場合の転送能力が大きい第2の通
信路とを具備し、 前記第1及び第2の系は、他系と情報通信を行う場合、
対象となる情報のサイズに応じて前記第1または第2の
通信路のいずれか一方が切り替え使用されるように制御
する主制御手段をそれぞれ備えていることを特徴とする
系間情報通信システム。 - 【請求項2】 前記第1及び第2の系は、 前記主制御手段が接続された内部バスと、 自系内の前記主制御手段による前記内部バスを介しての
制御のもとで前記第1の通信路を介して他系との間で逐
次情報通信を行う第1のインタフェース制御手段と、 自系内の前記主制御手段からの指示に応じて当該主制御
手段から独立に前記第2の通信路を介して他系との間で
指示された情報通信を行う第2のインタフェース制御手
段とを備えていることを特徴とする請求項1記載の系間
情報通信システム。 - 【請求項3】 前記第1及び第2の系から共通にアクセ
ス可能な少なくとも1つのディスク装置と、 前記第1及び第2の系と前記ディスク装置とを接続する
ための第3の通信路とを更に具備し、 前記主制御手段は、前記第1の通信路及び前記第1のイ
ンタフェース制御手段を含む第1のパス上に、或いは前
記第2の通信路及び前記第2のインタフェース制御手段
を含む第2のパス上に障害が発生した場合に、前記第3
の通信路を前記第1または第2のパスの代替パスとして
使用されるように制御することを特徴とする請求項2記
載の系間情報通信システム。 - 【請求項4】 前記第1及び第2の系は、ミラードキャ
ッシュ方式を適用するキャッシュメモリを内蔵する2重
化コントローラであり、 前記第2のインタフェース制御手段は、自系内の前記主
制御手段からの指示に応じて自系内の前記キャッシュメ
モリに格納されたデータを前記第2の通信路を介して他
系内の前記第2のインタフェース制御手段により当該他
系内の前記キャッシュメモリにコピーさせることを特徴
とする請求項2記載の系間情報通信システム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21534899A JP3987241B2 (ja) | 1999-07-29 | 1999-07-29 | 系間情報通信システム |
US09/628,306 US6944684B1 (en) | 1999-07-29 | 2000-07-28 | System for selectively using different communication paths to transfer data between controllers in a disk array in accordance with data transfer size |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21534899A JP3987241B2 (ja) | 1999-07-29 | 1999-07-29 | 系間情報通信システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001043026A true JP2001043026A (ja) | 2001-02-16 |
JP3987241B2 JP3987241B2 (ja) | 2007-10-03 |
Family
ID=16670819
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21534899A Expired - Fee Related JP3987241B2 (ja) | 1999-07-29 | 1999-07-29 | 系間情報通信システム |
Country Status (2)
Country | Link |
---|---|
US (1) | US6944684B1 (ja) |
JP (1) | JP3987241B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005513596A (ja) * | 2001-12-12 | 2005-05-12 | エミュレックス・デザイン・アンド・マニュファクチュアリング・コーポレーション | スーパーチャージメッセージ交換装置 |
JP2007142307A (ja) * | 2005-11-22 | 2007-06-07 | Hitachi Ltd | 高速差動信号用多層基板、通信装置およびデータ記憶装置 |
JP2009053946A (ja) * | 2007-08-27 | 2009-03-12 | Toshiba Corp | 二重化コントーラ構成ブロックデバイス制御装置 |
JP2011164780A (ja) * | 2010-02-05 | 2011-08-25 | Fujitsu Ltd | ディスクアレイ装置の制御方法及びディスクアレイ装置 |
US8321622B2 (en) | 2009-11-10 | 2012-11-27 | Hitachi, Ltd. | Storage system with multiple controllers and multiple processing paths |
US9507677B2 (en) | 2013-10-25 | 2016-11-29 | Fujitsu Limited | Storage control device, storage apparatus, and computer-readable recording medium having storage control program stored therein |
JP2017134500A (ja) * | 2016-01-26 | 2017-08-03 | 日本電気株式会社 | 制御回路および制御方法 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7404005B1 (en) * | 2000-06-09 | 2008-07-22 | International Business Machines Corporation | Method, system, and program for selecting one of multiple paths to communicate with a device |
JP4090400B2 (ja) * | 2003-07-24 | 2008-05-28 | 株式会社日立製作所 | ストレージシステム |
US20060020720A1 (en) * | 2004-07-23 | 2006-01-26 | Lsi Logic Corporation | Multi-controller IO shipping |
JP2007109141A (ja) * | 2005-10-17 | 2007-04-26 | Hitachi Ltd | ストレージシステム |
JP2008046685A (ja) * | 2006-08-10 | 2008-02-28 | Fujitsu Ltd | 二重化システム及び系切り換え方法 |
JP4550929B2 (ja) * | 2009-01-16 | 2010-09-22 | 株式会社東芝 | 電子機器および通信状態報知方法 |
TWI582600B (zh) * | 2013-01-04 | 2017-05-11 | 宏碁股份有限公司 | 電子裝置及其資料處理方法 |
CN103970691A (zh) * | 2013-01-24 | 2014-08-06 | 宏碁股份有限公司 | 电子装置及其数据处理方法 |
WO2015033418A1 (ja) * | 2013-09-05 | 2015-03-12 | 株式会社日立製作所 | ストレージシステム及び記憶制御方法 |
CN107870832B (zh) * | 2016-09-23 | 2021-06-18 | 伊姆西Ip控股有限责任公司 | 基于多维度健康诊断方法的多路径存储设备 |
JP6939240B2 (ja) * | 2017-08-17 | 2021-09-22 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置 |
JP2019075032A (ja) * | 2017-10-19 | 2019-05-16 | 富士通株式会社 | ストレージシステム、ストレージ制御装置およびプログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6101574A (en) * | 1995-02-16 | 2000-08-08 | Fujitsu Limited | Disk control unit for holding track data in non-volatile cache memory |
US5768623A (en) * | 1995-09-19 | 1998-06-16 | International Business Machines Corporation | System and method for sharing multiple storage arrays by dedicating adapters as primary controller and secondary controller for arrays reside in different host computers |
US6073218A (en) * | 1996-12-23 | 2000-06-06 | Lsi Logic Corp. | Methods and apparatus for coordinating shared multiple raid controller access to common storage devices |
US6289389B1 (en) * | 1997-06-03 | 2001-09-11 | Lextron Systems, Inc. | Enhanced integrated data delivery system |
US6145028A (en) * | 1997-12-11 | 2000-11-07 | Ncr Corporation | Enhanced multi-pathing to an array of storage devices |
JP3726484B2 (ja) * | 1998-04-10 | 2005-12-14 | 株式会社日立製作所 | 記憶サブシステム |
JP3946873B2 (ja) * | 1998-06-19 | 2007-07-18 | 株式会社日立製作所 | ディスクアレイ制御装置 |
-
1999
- 1999-07-29 JP JP21534899A patent/JP3987241B2/ja not_active Expired - Fee Related
-
2000
- 2000-07-28 US US09/628,306 patent/US6944684B1/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005513596A (ja) * | 2001-12-12 | 2005-05-12 | エミュレックス・デザイン・アンド・マニュファクチュアリング・コーポレーション | スーパーチャージメッセージ交換装置 |
JP2007142307A (ja) * | 2005-11-22 | 2007-06-07 | Hitachi Ltd | 高速差動信号用多層基板、通信装置およびデータ記憶装置 |
JP2009053946A (ja) * | 2007-08-27 | 2009-03-12 | Toshiba Corp | 二重化コントーラ構成ブロックデバイス制御装置 |
US8321622B2 (en) | 2009-11-10 | 2012-11-27 | Hitachi, Ltd. | Storage system with multiple controllers and multiple processing paths |
JP2011164780A (ja) * | 2010-02-05 | 2011-08-25 | Fujitsu Ltd | ディスクアレイ装置の制御方法及びディスクアレイ装置 |
US9507677B2 (en) | 2013-10-25 | 2016-11-29 | Fujitsu Limited | Storage control device, storage apparatus, and computer-readable recording medium having storage control program stored therein |
JP2017134500A (ja) * | 2016-01-26 | 2017-08-03 | 日本電気株式会社 | 制御回路および制御方法 |
Also Published As
Publication number | Publication date |
---|---|
US6944684B1 (en) | 2005-09-13 |
JP3987241B2 (ja) | 2007-10-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7444541B2 (en) | Failover and failback of write cache data in dual active controllers | |
US9916113B2 (en) | System and method for mirroring data | |
US7062591B2 (en) | Controller data sharing using a modular DMA architecture | |
JP2001043026A (ja) | 系間情報通信システム | |
US6732243B2 (en) | Data mirroring using shared buses | |
US6839788B2 (en) | Bus zoning in a channel independent storage controller architecture | |
JP3694273B2 (ja) | 多重パスi/o要求機構を有するデータ処理システム | |
JP3732869B2 (ja) | 外部記憶装置 | |
CN100403300C (zh) | 镜像网络数据以建立虚拟存储区域网络 | |
US7437493B2 (en) | Modular architecture for a network storage controller | |
US6345368B1 (en) | Fault-tolerant access to storage arrays using active and quiescent storage controllers | |
US6009481A (en) | Mass storage system using internal system-level mirroring | |
CN101651559B (zh) | 一种存储服务在双控制器存储系统中故障切换的方法 | |
US6349357B1 (en) | Storage architecture providing scalable performance through independent control and data transfer paths | |
US20090327481A1 (en) | Adaptive data throttling for storage controllers | |
JP2002259063A (ja) | バックアップ処理可能な記憶システム | |
WO2010008984A2 (en) | Method and system for using shared memory with optimized data flow to improve input/output throughput and latency | |
US7634601B1 (en) | Method and apparatus for providing continuous communications between computers | |
JP2008112399A (ja) | ストレージ仮想化スイッチおよびコンピュータシステム | |
JPH09146842A (ja) | 記憶サブシステム | |
US7293197B2 (en) | Non-volatile memory with network fail-over | |
US6804794B1 (en) | Error condition handling | |
US7752340B1 (en) | Atomic command retry in a data storage system | |
JP2006268403A (ja) | データストレージシステム及びストレージ制御装置のログデータの等価制御方法 | |
JP2005122763A (ja) | 記憶装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040915 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070514 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070710 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070712 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100720 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100720 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110720 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120720 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130720 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |