JP2001043026A - 系間情報通信システム - Google Patents

系間情報通信システム

Info

Publication number
JP2001043026A
JP2001043026A JP11215348A JP21534899A JP2001043026A JP 2001043026 A JP2001043026 A JP 2001043026A JP 11215348 A JP11215348 A JP 11215348A JP 21534899 A JP21534899 A JP 21534899A JP 2001043026 A JP2001043026 A JP 2001043026A
Authority
JP
Japan
Prior art keywords
communication
path
controller
information communication
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11215348A
Other languages
English (en)
Other versions
JP3987241B2 (ja
Inventor
Morishige Kaneshiro
守茂 金城
Susumu Hirofuji
進 廣藤
Masayuki Takakuwa
正幸 高桑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP21534899A priority Critical patent/JP3987241B2/ja
Priority to US09/628,306 priority patent/US6944684B1/en
Publication of JP2001043026A publication Critical patent/JP2001043026A/ja
Application granted granted Critical
Publication of JP3987241B2 publication Critical patent/JP3987241B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2089Redundant storage control functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2005Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication controllers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2007Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media
    • G06F11/201Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant using redundant communication media between storage system components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • G06F11/2012Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant and using different communication protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0629Configuration or reconfiguration of storage systems
    • G06F3/0635Configuration or reconfiguration of storage systems by changing the path, e.g. traffic rerouting, path reconfiguration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)
  • Memory System (AREA)

Abstract

(57)【要約】 【課題】2重化コントローラ間の情報通信に代表される
2つの系の間の情報通信における転送サイズの違いによ
り、当該系間の情報通信に使用する通信パスを使い分け
ることで、当該系間の情報通信の高速化を図る。 【解決手段】キャッシュメモリ312a,322aを内
蔵する2重化されたコントローラ310,320間の通
信と、キャッシュメモリ312a,312a間のデータ
コピーでの転送サイズの違い(を反映する情報通信の種
類の違い)により、前者の場合には、MPU311、内
部バス317、コント間I/F315、バス330、コ
ント間I/F325、内部バス327、MPU321の
パスを、後者の場合には、キャッシュメモリ312a、
コント間I/F316、バス340、コント間I/F3
26、キャッシュメモリ322aのパスを、それぞれ切
り替えて使用する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、第1の系と第2の
系との間で情報通信が行われる、2重化されたコントロ
ーラを備えた2重化コントローラ内蔵装置に代表される
系間情報通信システムに関する。
【0002】
【従来の技術】近年のディスクアレイ装置には、それぞ
れ異なるホスト装置と接続可能な2重化されたコントロ
ーラを備えた2重化コントローラ内蔵装置を構成してい
るものがある。この種のディスクアレイ装置では、各コ
ントローラ(各系)と対応するホスト装置との間でデー
タ転送が可能なようになっている。各コントローラに
は、ホスト装置との間の転送データを一時記憶するため
のキャッシュメモリがそれぞれ設けられている。
【0003】従来、上記した2重化コントローラを内蔵
するディスクアレイ装置(系間情報通信システム)で
は、各コントローラ(各系)内のキャッシュメモリ上の
データの保全性を高めるために、いわゆるミラードキャ
ッシュ方式を採用している。この方式は、ホスト装置か
ら自系(のコントローラ)で受け取ったライトデータを
他系のコントローラのキャッシュメモリにコピー(ミラ
ー)する方式である。
【0004】このミラードキャッシュ方式を適用するデ
ィスクアレイ装置においては、他系でのキャッシュメモ
リへのコピー(ライト)が完了するのを待って、つまり
自系と他系のキャッシュメモリの内容の一致化が図られ
るのを待って、ホスト装置へのライトの完了を通知する
のが一般的である。
【0005】また、この種のディスクアレイ装置では、
コントローラ間の重要な通信での信頼性向上のために、
冗長なパスを特別に備えるのが一般的である。
【0006】
【発明が解決しようとする課題】上記したように、2重
化コントローラを内蔵し、ミラードキャッシュ方式を適
用する従来のディスクアレイ装置(2重化コントローラ
内蔵装置、系間情報通信システム)では、他系のライト
が完了するまで自系のコントローラはホスト側に完了を
返せないため、この2重化コントローラ間のライトデー
タの通信のパスがライト時の性能のボトルネックになる
という問題があった。
【0007】また、従来のディスクアレイ装置(2重化
コントローラ内蔵装置、系間情報通信システム)では、
コントローラ間の重要な通信での信頼性向上のために、
冗長なパスを特別に備える必要があるという問題もあっ
た。
【0008】本発明は上記事情を考慮してなされたもの
でその目的は、2重化コントローラ間の情報通信に代表
される2つの系の間の情報通信における転送サイズの違
いにより、当該系間の情報通信に使用する通信パスを使
い分けることで、当該系間の情報通信の高速化を図るこ
とができる系間情報通信システムを提供することにあ
る。
【0009】本発明の他の目的は、冗長パスを特別に設
けなくても、パスの冗長化を図ることができる系間情報
通信システムを提供することにある。
【0010】
【課題を解決するための手段】本発明は、第1の系と第
2の系との間で情報通信が行われる系間情報通信システ
ムにおいて、上記第1の系と第2の系との間の転送サイ
ズが小さい場合の情報通信に供される、転送サイズが小
さい場合に高速レスポンスが可能な第1の通信路と、上
記第1の系と第2の系との間の転送サイズが大きい場合
の情報通信に供される、上記第1の通信路に比べて転送
サイズが大きい場合の転送能力が大きい第2の通信路と
を備えると共に、上記第1及び第2の系には、他系と情
報通信を行う場合、対象となる情報のサイズに応じて上
記第1または第2の通信路のいずれか一方が切り替え使
用されるように制御する主制御手段をそれぞれ設けたこ
とを特徴とする。
【0011】このような構成においては、2つの系の間
で情報通信を行う場合、その情報通信の対象となる情報
のサイズ(転送サイズ)に応じて使用する通信路を使い
分けることにより、つまり転送サイズが小さいときに
は、転送サイズが小さいときのレスポンスが高速な第1
の通信路を用い、転送サイズが大きいときには、転送能
力が大きい第2の通信路を用いることにより、2つの系
の間の高速情報通信が実現可能となる。ここで、転送サ
イズの大小は情報通信の種類によって決まることが多い
ため、その種類(例えば、データ転送に必要なデータ転
送前後の一連の手順での系間通信、つまり制御データの
通信であるか、データ転送それ自体であるか)に応じて
通信路を使い分けするとよい。
【0012】また、上記第1及び第2の系に、上記主制
御手段(例えばマイクロプロセッサユニット)が接続さ
れた内部バスを備えた構成では、当該第1及び第2の系
に、自系内の主制御手段による内部バスを介しての制御
のもとで上記第1の通信路を介して他系との間で逐次情
報通信を行う第1のインタフェース制御手段と、自系内
の主制御手段からの指示に応じて主制御手段から独立に
上記第2の通信路を介して他系との間で指示された情報
通信を行う第2のインタフェース制御手段とを設けるこ
とで、転送サイズに応じて使用する通信路を使い分けて
の情報通信(情報転送)を効率的に行うことができる。
【0013】ここで、上記第1及び第2の系が、ミラー
ドキャッシュ方式を適用するキャッシュメモリを内蔵す
る2重化コントローラである構成では、上記第2のイン
タフェース制御手段に、自系内の主制御手段からの指示
に応じて自系内のキャッシュメモリに格納されたデータ
を上記第2の通信路を介して他系内の第2のインタフェ
ース制御手段により当該他系内のキャッシュメモリにコ
ピーさせる機能を持たせるならば、内部バスでのトラヒ
ックが上がるのを防止しながら、大量のデータコピーが
実現可能となる。
【0014】また、上記第1及び第2の系から共通にア
クセス可能な少なくとも1つのディスク装置と、上記第
1及び第2の系とディスク装置とを接続するための第3
の通信路とを備えたシステムでは、上記第1のパスまた
は第2のパス上に障害が発生した場合に、上記主制御手
段の制御により、上記ディスク装置アクセス用の第3の
通信路が第1または第2のパスの代替パスとして使用さ
れる構成とすることにより、冗長パスを特別に用意しな
くても、通信パスの冗長化が実現可能となる。
【0015】
【発明の実施の形態】以下、本発明の実施の形態につ
き、系間情報通信システムが2重化コントローラ内蔵の
ディスクアレイ装置である場合を例に、図面を参照して
説明する。
【0016】図1は本発明の一実施形態に係る2重化コ
ントローラ内蔵のディスクアレイ装置のブロック構成
図、図2は当該ディスクアレイ装置を備えたシステムの
ブロック構成図である。
【0017】図2において、100,200は、本発明
に直接関係するディスクアレイ装置を接続するホスト装
置(ホストコンピュータ)であり、例えばサーバ(サー
バコンピュータ)をなす。ホスト装置100,200と
ディスクアレイ装置300(内の後述するコントローラ
310,320に設けられたホストI/F313,32
3)とは、SCSI(Small Computer System Interfac
e)バス、あるいはファイバチャネル等のバス110,
210により接続されている。ホスト装置100,20
0には、例えば複数のクライアント(クライアントコン
ピュータ)400がイーサネット(登録商標)(Ethern
et)(登録商標)バス、リングバス等により構成される
ネットワーク500を介して接続されている。
【0018】ディスクアレイ装置300は、図1に示す
ように、当該装置300全体を制御する2重化されたコ
ントローラ310,320と、ディスクアレイを構成す
る複数のディスク装置、例えば2つのハードディスク装
置(以下、HDDと称する)360,361とを備えて
いる。コントローラ310,320(内の後述するHD
D−I/F314,324)とHDD360,361と
は、SCSIバス等のバス350により接続されてい
る。
【0019】コントローラ310,320は、当該コン
トローラ310,320の制御中枢をなす中央制御部と
してのMPU(Micro Processing Unit)311,32
1と、キャッシュメモリ部312,322とを備えてい
る。
【0020】キャッシュメモリ部312,322は、ホ
スト装置100,200から転送されたデータ(ライト
データ)、及びHDD360,361から読み出された
データ(リードデータ)を一時記憶するキャッシュメモ
リ312a,322を内蔵する。このキャッシュメモリ
312a,322aは、ミラードキャッシュを実現する
ために、当該キャッシュメモリ312a,322a(を
内蔵したキャッシュメモリ部312,322)を持つコ
ントローラ310,320と対をなすもう一方のコント
ローラ320,310からのデータ、つまり他方(他
系)のコントローラ320,310からのデータがコピ
ー可能な領域を有する。またキャッシュメモリ部31
2,322は、I/F(インタフェース)として、後述
する内部バス317,327との接続用と、コントロー
ラ間データ転送用(コントローラ間データ転送に用いる
バス340との接続用)との2ポートを有する。
【0021】コントローラ310,320はまた、ホス
ト装置100,200と接続するバス110,120の
制御部をなすインタフェース制御部、つまりホスト装置
100,200とのインタフェース制御部(以下、ホス
トI/Fと称する)313,323と、HDD360,
361とのインタフェース制御部(以下、HDD−I/
Fと称する)314,324とを備えている。
【0022】コントローラ310,320はまた、当該
コントローラ310,320間のデータ転送制御を司
り、データ転送サイズが小さい場合に高速レスポンスが
可能なコントローラ間データ転送制御部(以下、コント
間I/Fと称する)315,325と、当該コントロー
ラ310,320間のデータ転送制御を司り、データ転
送サイズに影響されずに一定のレスポンスが可能なコン
トローラ間データ転送制御部(以下、コント間I/Fと
称する)316,326とを備えている。コント間I/
F315,325は内部バス317,327を介してM
PU311,321と接続され、コント間I/F31
6,326はキャッシュメモリ部312,322のコン
トローラ間データ転送用ポートと接続されている。
【0023】コントローラ310,320は更に、PC
Iバス(Peripheral Component Interconnect Bus)に
代表される内部バス317,327を備えている。この
内部バス317,327には、コントローラ310,3
20内の各モジュール(ここでは、MPU311,32
1と、キャッシュメモリ部312,322と、ホストI
/F313,323と、HDD−I/F314,324
と、コント間I/F315,325の各モジュール)が
接続されている。
【0024】コントローラ310,320内のコント間
I/F315,225は、データ転送サイズが小さいデ
ータの転送に適したシリアルバスに代表されるバス33
0により相互接続され、コント間I/F316,326
は、データ転送サイズが大きいデータの転送に適した非
同期転送型のバス340により相互接続されている。従
来のディスクアレイ装置には、コント間I/F316,
326と、当該コント間I/F316,326を接続す
るバス340とが存在しないことに注意されたい。この
ため従来は、コントローラ310,320間のデータ転
送は、MPU311,312の制御により全て内部バス
317,327を介して行う必要がある。
【0025】次に、図2のシステムに適用される図1の
構成のディスクアレイ装置300の動作について、ホス
ト装置100からコントローラ310に対して要求され
たデータのライト時に、そのコピーデータをもう一方の
コントローラ320内のキャッシュメモリ322に格納
する場合を例に、図3及び図4を参照して説明する。
【0026】今、ホスト装置100からディスクアレイ
装置300内のコントローラ310に対し、バス110
を介してデータのライト要求が送られたものとする。コ
ントローラ310が、このホスト装置100からのライ
ト要求をホストI/F313を介して受け付けると、ホ
スト装置100からコントローラ310へのライトデー
タの転送が開始される。
【0027】すると、ホスト装置100からバス110
を介して転送されるデータは、コントローラ310内の
ホストI/F313で受け取られて、ホストI/F31
3→内部バス317→キャッシュメモリ部312のパス
を通って、そのコントローラ310のキャッシュメモリ
部312に内蔵されたキャッシュメモリ312に格納さ
れる。本実施形態では、ホスト装置100からのライト
要求で指定されたディスクアレイ(内のHDD)のデー
タがキャッシュメモリ312aにも存在する(ライト時
の)キャッシュヒットの場合には、当該キャッシュメモ
リ312a内の該当するデータが、ホスト装置100か
らのライトデータに更新される。このキャッシュメモリ
312aに格納されたライトデータは、ホスト装置10
0からのライト要求で指定されたディスクアレイ(内の
HDD)に対する遅延書き込みの対象となる。
【0028】コントローラ310内のMPU311は、
当該コントローラ310(自系)のキャッシュメモリ3
12に格納されたのと同一のライトデータをコントロー
ラ320(他系)のキャッシュメモリ322にコピー
(ミラー)するために、コントローラ320が停止して
いないか否かを、内部バス317を介してのコント間I
/F315を用いたコントローラ間通信(制御データの
授受)で確認する。即ちMPU311は、コントローラ
320内のMPU321への問い合わせを、図3に示す
ように、MPU311→内部バス317→コント間I/
F315→バス330→コント間I/F325→内部バ
ス327→MPU321のパス31を用いて通知する。
【0029】コントローラ320内のMPU321は、
コントローラ310内のMPU311からの問い合わせ
を(コント間I/F325から内部バス327を介し
て)受け取ると、その問い合わせとは逆のパスで、つま
り図3に示すように、MPU321→内部バス327→
コント間I/F325→バス330→コント間I/F3
15→内部バス317→MPU311のパス32で、コ
ントローラ310内のMPU311へ正常である旨の応
答を返す。
【0030】MPU311は、コントローラ320内の
MPU321からの正常応答を受け取ると、先に格納し
たデータのキャッシュメモリ322へのコピーを、図4
に示すように、MPU311→内部バス317→キャッ
シュメモリ部312のパス41を用いてキャッシュメモ
リ部312に指示する。
【0031】するとキャッシュメモリ部312は、指示
されたデータを、コント間I/F316を用いたデータ
転送により、図4に示すように、キャッシュメモリ31
2a→コント間I/F316→バス340→コント間I
/F326→キャッシュメモリ322aのパス42を用
いて、コントローラ320内のキャッシュメモリ322
a(に確保されているコピー領域)にコピーさせる。こ
のデータ転送の最後では、データ転送結果を示す転送ス
テータスが(コントローラ320内の)キャッシュメモ
リ部322のコントローラ間データ転送用I/F(ポー
ト)から上記パス42と逆のパスで、(コントローラ3
10内の)キャッシュメモリ部312のコントローラ間
データ転送用I/F(ポート)に返される。
【0032】キャッシュメモリ部312は、上記転送ス
テータスからデータ転送の完了を判定すると、内部バス
317との接続用I/F(ポート)により、キャッシュ
メモリ322aへの転送(コピー)が完了したことを、
図4に示すように、キャッシュメモリ部312→内部バ
ス317→MPU311のパス43を用いてMPU31
1に通知する。
【0033】MPU311は、このキャッシュメモリ3
22aへの転送(コピー)完了通知を受け取って、キャ
ッシュメモリ312aからキャッシュメモリ322aへ
のコピー(ミラー)の完了を確認すると、ホスト装置1
00から要求されたデータライトの完了を判定し、MP
U311→内部バス317→ホストI/F313→バス
110→ホスト装置100のパスによりホスト装置10
0にライト完了通知を返す。なお、キャッシュメモリ3
12aからキャッシュメモリ322aへのコピー(ミラ
ー)が完了した旨の通知は、転送サイズが小さいため、
前記パス32を用いてコントローラ310内のMPU3
11送るようにしても構わない。
【0034】このように本実施形態では、コントローラ
310,320(内のMPU311,321)間の上記
問い合わせ及び当該問い合わせに対する応答、つまりコ
ントローラ間通信(制御データの授受)には、コント間
I/F315,325及びバス330を含むパス31
(32)を用い、キャッシュメモリ312a,322a
間のデータ転送(データコピー)には、コント間I/F
316,326及びバス340を含むパス42を用いる
ようにしている。
【0035】ここで、コントローラ間通信は、大容量の
データの転送が行われるキャッシュメモリ312a,3
22a間のデータ転送(データコピー)に比べて、その
転送データ量が著しく少ない。
【0036】次に、パス31の中心をなすバス330
は、本実施形態のようにシリアルバスで構成されている
場合、データ転送開始までの手順と、データ転送終了後
の手順に(伴う制御データの授受に)要する時間は、非
同期転送型のバス340と異なって少ない。つまり転送
のための手順のオーバヘッドが小さい。一方、データ転
送時間は、データ量が多いほど長く、少ないほど短くな
る。したがってバス330は、上記のコントローラ間通
信のように、データ量が少ないデータ転送の場合に高速
レスポンスが期待できる。
【0037】ところが従来は(コント間I/F316,
327及びバス340が存在しないため)、データ転送
量が少ないコントローラ間通信は勿論、データ転送量が
多いキャッシュメモリ間データ転送(データコピー)の
場合にも、(コント間I/F315,325及びバス3
30を含む)上記パス31(32)を用いていた。しか
も、このパス31(32)には各コントローラ310,
320の内部バス317,327が含まれている。した
がって、データコピーのために内部バス317,327
を使用することでバストラヒックが上がり、加えてMP
U311,321の処理が必要となることから、コピー
性能、更にはホスト装置100,200からの要求処理
性能が低下する虞があった。
【0038】これに対して本実施形態では、キャッシュ
メモリ部312,322に接続されたコント間I/F3
16,326を設け、当該コント間I/F316,32
6により、(内部バス317,327から独立した)バ
ス340を中心とするパス41を介して、キャッシュメ
モリ部312,322内のキャッシュメモリ312a,
312b間の(データコピーのための)データ転送をM
PU321,322から独立に行うようにしている。こ
こでは、データコピーのために、コントローラ310,
320内の各種モジュールが接続されている内部バス3
17,327を使用せず、MPU321,322の処理
も不要なことから、上述の性能低下を低減できる。
【0039】ここで、バス340が本実施形態のように
同期転送型の場合、データ転送開始までとデータ転送終
了後の手順が複雑であり、バス330と異なって転送の
ための手順のオーバヘッドが大きい。一方、バス330
経由でのデータコピー等、一定の転送サイズの範囲での
データ転送に要する時間は、上記手順に要する時間に比
べて短い。したがって、コント間I/F316,326
によりバス340を経由してのデータ転送では、一定の
転送サイズの範囲では、転送サイズに関係なく、データ
転送のための手順に要する時間でほぼ決まる一定のレス
ポンスを持つ。
【0040】また、上記のように、データコピーに内部
バス317,327、コント間I/F315,325及
びバス330を含むパス31(32)を使用しない構成
では、つまりパス31(32)を、コントローラ間通信
のようにデータ量が少ないデータ転送のみに使用する構
成では、価格的な制約のもとで、バス330の信号ビッ
ト幅を少なくし(ハードウェア量を減らし)、代わりに
高速信号線を用いることが可能となり、コントローラ間
通信等を高速に処理することができる。
【0041】ところで、図2の構成のディスクアレイ装
置300において、上記パス31(32)の中心をなす
コント間I/F315、バス330、コント間I/F3
25、或いは上記パス(42)の中心をなすコント間I
/F316、バス340、コント間I/F326のいず
れかに障害が発生することがあり得る。
【0042】そこで本実施形態では、これらのパス上の
いずれかの要素に障害が発生した場合の代替パスとし
て、HDD−I/F314、バス350及びHDD−I
/F324のパスが使用可能なようになっている。この
HDD−I/F314、バス350及びHDD−I/F
324のパス(代替パス)を実現するには、例えばコン
トローラ310であれば、内部バス317上の通信に使
用するデバイスの指定を、コント間I/F315或いは
キャッシュメモリ部312のコントローラ間データ転送
用I/F(ポート)からHDD−I/F314へ、コン
トローラ320であれば、内部バス327上の通信に使
用するデバイスの指定をコント間I/F325或いはキ
ャッシュメモリ部322のコントローラ間データ転送用
I/F(ポート)からHDD−I/F324へ変更すれ
ばよい。
【0043】なお、コントローラ310,320のホス
トI/F313,323に、ホスト装置との接続ポート
を2つ持たせ、ホスト装置100,200を、図5に示
すように、バス110,210に相当するバス120,
220を介してコントローラ320,310のホストI
/F323,313に接続するとよい。
【0044】このような構成では、例えばコントローラ
310自身の障害またはホスト装置100と当該コント
ローラ310との間の通信パスの障害が発生した場合、
ホスト装置100はバス120を用いることで、他系の
コントローラ320を切り替え使用することができる。
同様にコントローラ320自身の障害またはホスト装置
200と当該コントローラ320との間の通信パスの障
害が発生した場合には、ホスト装置200はバス220
を用いることで、他系のコントローラ310を切り替え
使用することができる。
【0045】また図5の構成において、ホスト装置10
0,200は、相手に障害が発生した場合に相手の代替
処理を行うようになっている。そのためホスト装置10
0,200は互いに障害発生を監視している。この監視
は、ネットワーク500を介して行うことも可能である
が、トラフィックと信頼性を考慮するならば、図5に示
すようにホスト装置100,200間を接続するイーサ
ネットバス等のバス600を設け、当該バス600を介
して監視するとよい。なお、ホスト装置100,200
は、互いに処理を行う構成でも、一方が待機系となる構
成のいずれでも構わない。
【0046】以上は、本発明を、2重化されたコントロ
ーラ間の情報通信の高速化のために、その情報通信の対
象となる情報のサイズ(の違いを反映する情報通信の種
類、つまりデータ転送前後の一連の手順でのコントロー
ラ間通信であるか、データ転送それ自体であるか)に応
じて2種の通信パスを切り替え使用する2重化コントロ
ーラ内蔵のディスクアレイ装置に実施した場合について
説明したが、これに限るものではない。本発明は、相互
に情報通信を行う2つの系の装置を備えた系間情報通信
システムにおける、系間の情報通信の高速化にも適用可
能である。
【0047】
【発明の効果】以上詳述したように本発明によれば、2
重化されたコントローラ間の情報通信に代表される2つ
の系の間の情報通信における転送サイズの違い(を反映
する情報通信の種類の違い)により、当該系間の情報通
信に使用する通信パスを使い分けるようにしたので、当
該系間の情報通信の高速化を図ることができる。特に、
ミラードキャッシュ方式を適用するキャッシュメモリを
内蔵する2重化コントローラ間の情報通信を行うシステ
ムでは、コントローラ間の高速データコピーが実現でき
る。
【0048】また本発明によれば、第1及び第2の系か
ら共通にアクセス可能な少なくとも1つのディスク装置
と、これらを相互接続するための通信路とを備えたシス
テムでは、系間の情報通信に切り替え使用する通信パス
の障害時には、この通信路を代替パスとして使用するこ
とにより、冗長パスを特別に設けなくても、パスの冗長
化を図ることができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る2重化コントローラ
内蔵のディスクアレイ装置のブロック構成図。
【図2】図1の構成のディスクアレイ装置を備えたシス
テムのブロック構成図。
【図3】同実施形態におけるコントローラ間通信で使用
される通信パスを説明するための図。
【図4】同実施形態におけるデータコピーで使用される
通信パスを説明するための図。
【図5】図2のシステムの変形例を示すブロック図。
【符号の説明】
31,32…パス(第1のパス) 42…パス(第2のパス) 100,200…ホスト装置 300…ディスクアレイ装置(系間情報通信システム、
2重化コントローラ内蔵装置) 310…コントローラ(第1の系) 311,321…MPU(主制御手段) 312,322…キャッシュメモリ部 312a,322a…キャッシュメモリ 313,323…ホストI/F 314,324…HDD−I/F 315,325…コント間I/F(第1のインタフェー
ス制御手段) 316,326…コント間I/F(第2のインタフェー
ス制御手段) 317,327…内部バス 320…コントローラ(第2の系) 330…バス(第1の通信路) 340…バス(第2の通信路) 350…バス(第3の通信路) 360,361…HDD(ディスク装置)
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 12/08 G06F 12/08 J 5B083 G 320 320 12/16 310 12/16 310J 310M 13/00 301 13/00 301P 13/16 510 13/16 510D (72)発明者 高桑 正幸 東京都府中市東芝町1番地 株式会社東芝 府中工場内 Fターム(参考) 5B005 JJ01 JJ11 MM12 NN72 WW15 5B018 GA04 HA05 MA03 MA14 QA15 5B034 CC01 CC05 5B060 MB03 MB04 5B065 BA01 CA30 CE01 CE05 5B083 AA01 BB11 CC04 DD09 EE11

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 第1の系と第2の系との間で情報通信が
    行われる系間情報通信システムにおいて、 前記第1の系と前記第2の系との間の転送サイズが小さ
    い場合の情報通信に供される、転送サイズが小さい場合
    に高速レスポンスが可能な第1の通信路と、 前記第1の系と前記第2の系との間の転送サイズが大き
    い場合の情報通信に供される、前記第1の通信路に比べ
    て転送サイズが大きい場合の転送能力が大きい第2の通
    信路とを具備し、 前記第1及び第2の系は、他系と情報通信を行う場合、
    対象となる情報のサイズに応じて前記第1または第2の
    通信路のいずれか一方が切り替え使用されるように制御
    する主制御手段をそれぞれ備えていることを特徴とする
    系間情報通信システム。
  2. 【請求項2】 前記第1及び第2の系は、 前記主制御手段が接続された内部バスと、 自系内の前記主制御手段による前記内部バスを介しての
    制御のもとで前記第1の通信路を介して他系との間で逐
    次情報通信を行う第1のインタフェース制御手段と、 自系内の前記主制御手段からの指示に応じて当該主制御
    手段から独立に前記第2の通信路を介して他系との間で
    指示された情報通信を行う第2のインタフェース制御手
    段とを備えていることを特徴とする請求項1記載の系間
    情報通信システム。
  3. 【請求項3】 前記第1及び第2の系から共通にアクセ
    ス可能な少なくとも1つのディスク装置と、 前記第1及び第2の系と前記ディスク装置とを接続する
    ための第3の通信路とを更に具備し、 前記主制御手段は、前記第1の通信路及び前記第1のイ
    ンタフェース制御手段を含む第1のパス上に、或いは前
    記第2の通信路及び前記第2のインタフェース制御手段
    を含む第2のパス上に障害が発生した場合に、前記第3
    の通信路を前記第1または第2のパスの代替パスとして
    使用されるように制御することを特徴とする請求項2記
    載の系間情報通信システム。
  4. 【請求項4】 前記第1及び第2の系は、ミラードキャ
    ッシュ方式を適用するキャッシュメモリを内蔵する2重
    化コントローラであり、 前記第2のインタフェース制御手段は、自系内の前記主
    制御手段からの指示に応じて自系内の前記キャッシュメ
    モリに格納されたデータを前記第2の通信路を介して他
    系内の前記第2のインタフェース制御手段により当該他
    系内の前記キャッシュメモリにコピーさせることを特徴
    とする請求項2記載の系間情報通信システム。
JP21534899A 1999-07-29 1999-07-29 系間情報通信システム Expired - Fee Related JP3987241B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP21534899A JP3987241B2 (ja) 1999-07-29 1999-07-29 系間情報通信システム
US09/628,306 US6944684B1 (en) 1999-07-29 2000-07-28 System for selectively using different communication paths to transfer data between controllers in a disk array in accordance with data transfer size

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21534899A JP3987241B2 (ja) 1999-07-29 1999-07-29 系間情報通信システム

Publications (2)

Publication Number Publication Date
JP2001043026A true JP2001043026A (ja) 2001-02-16
JP3987241B2 JP3987241B2 (ja) 2007-10-03

Family

ID=16670819

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21534899A Expired - Fee Related JP3987241B2 (ja) 1999-07-29 1999-07-29 系間情報通信システム

Country Status (2)

Country Link
US (1) US6944684B1 (ja)
JP (1) JP3987241B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005513596A (ja) * 2001-12-12 2005-05-12 エミュレックス・デザイン・アンド・マニュファクチュアリング・コーポレーション スーパーチャージメッセージ交換装置
JP2007142307A (ja) * 2005-11-22 2007-06-07 Hitachi Ltd 高速差動信号用多層基板、通信装置およびデータ記憶装置
JP2009053946A (ja) * 2007-08-27 2009-03-12 Toshiba Corp 二重化コントーラ構成ブロックデバイス制御装置
JP2011164780A (ja) * 2010-02-05 2011-08-25 Fujitsu Ltd ディスクアレイ装置の制御方法及びディスクアレイ装置
US8321622B2 (en) 2009-11-10 2012-11-27 Hitachi, Ltd. Storage system with multiple controllers and multiple processing paths
US9507677B2 (en) 2013-10-25 2016-11-29 Fujitsu Limited Storage control device, storage apparatus, and computer-readable recording medium having storage control program stored therein
JP2017134500A (ja) * 2016-01-26 2017-08-03 日本電気株式会社 制御回路および制御方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7404005B1 (en) * 2000-06-09 2008-07-22 International Business Machines Corporation Method, system, and program for selecting one of multiple paths to communicate with a device
JP4090400B2 (ja) * 2003-07-24 2008-05-28 株式会社日立製作所 ストレージシステム
US20060020720A1 (en) * 2004-07-23 2006-01-26 Lsi Logic Corporation Multi-controller IO shipping
JP2007109141A (ja) * 2005-10-17 2007-04-26 Hitachi Ltd ストレージシステム
JP2008046685A (ja) * 2006-08-10 2008-02-28 Fujitsu Ltd 二重化システム及び系切り換え方法
JP4550929B2 (ja) * 2009-01-16 2010-09-22 株式会社東芝 電子機器および通信状態報知方法
TWI582600B (zh) * 2013-01-04 2017-05-11 宏碁股份有限公司 電子裝置及其資料處理方法
CN103970691A (zh) * 2013-01-24 2014-08-06 宏碁股份有限公司 电子装置及其数据处理方法
WO2015033418A1 (ja) * 2013-09-05 2015-03-12 株式会社日立製作所 ストレージシステム及び記憶制御方法
CN107870832B (zh) * 2016-09-23 2021-06-18 伊姆西Ip控股有限责任公司 基于多维度健康诊断方法的多路径存储设备
JP6939240B2 (ja) * 2017-08-17 2021-09-22 富士フイルムビジネスイノベーション株式会社 情報処理装置
JP2019075032A (ja) * 2017-10-19 2019-05-16 富士通株式会社 ストレージシステム、ストレージ制御装置およびプログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6101574A (en) * 1995-02-16 2000-08-08 Fujitsu Limited Disk control unit for holding track data in non-volatile cache memory
US5768623A (en) * 1995-09-19 1998-06-16 International Business Machines Corporation System and method for sharing multiple storage arrays by dedicating adapters as primary controller and secondary controller for arrays reside in different host computers
US6073218A (en) * 1996-12-23 2000-06-06 Lsi Logic Corp. Methods and apparatus for coordinating shared multiple raid controller access to common storage devices
US6289389B1 (en) * 1997-06-03 2001-09-11 Lextron Systems, Inc. Enhanced integrated data delivery system
US6145028A (en) * 1997-12-11 2000-11-07 Ncr Corporation Enhanced multi-pathing to an array of storage devices
JP3726484B2 (ja) * 1998-04-10 2005-12-14 株式会社日立製作所 記憶サブシステム
JP3946873B2 (ja) * 1998-06-19 2007-07-18 株式会社日立製作所 ディスクアレイ制御装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005513596A (ja) * 2001-12-12 2005-05-12 エミュレックス・デザイン・アンド・マニュファクチュアリング・コーポレーション スーパーチャージメッセージ交換装置
JP2007142307A (ja) * 2005-11-22 2007-06-07 Hitachi Ltd 高速差動信号用多層基板、通信装置およびデータ記憶装置
JP2009053946A (ja) * 2007-08-27 2009-03-12 Toshiba Corp 二重化コントーラ構成ブロックデバイス制御装置
US8321622B2 (en) 2009-11-10 2012-11-27 Hitachi, Ltd. Storage system with multiple controllers and multiple processing paths
JP2011164780A (ja) * 2010-02-05 2011-08-25 Fujitsu Ltd ディスクアレイ装置の制御方法及びディスクアレイ装置
US9507677B2 (en) 2013-10-25 2016-11-29 Fujitsu Limited Storage control device, storage apparatus, and computer-readable recording medium having storage control program stored therein
JP2017134500A (ja) * 2016-01-26 2017-08-03 日本電気株式会社 制御回路および制御方法

Also Published As

Publication number Publication date
US6944684B1 (en) 2005-09-13
JP3987241B2 (ja) 2007-10-03

Similar Documents

Publication Publication Date Title
US7444541B2 (en) Failover and failback of write cache data in dual active controllers
US9916113B2 (en) System and method for mirroring data
US7062591B2 (en) Controller data sharing using a modular DMA architecture
JP2001043026A (ja) 系間情報通信システム
US6732243B2 (en) Data mirroring using shared buses
US6839788B2 (en) Bus zoning in a channel independent storage controller architecture
JP3694273B2 (ja) 多重パスi/o要求機構を有するデータ処理システム
JP3732869B2 (ja) 外部記憶装置
CN100403300C (zh) 镜像网络数据以建立虚拟存储区域网络
US7437493B2 (en) Modular architecture for a network storage controller
US6345368B1 (en) Fault-tolerant access to storage arrays using active and quiescent storage controllers
US6009481A (en) Mass storage system using internal system-level mirroring
CN101651559B (zh) 一种存储服务在双控制器存储系统中故障切换的方法
US6349357B1 (en) Storage architecture providing scalable performance through independent control and data transfer paths
US20090327481A1 (en) Adaptive data throttling for storage controllers
JP2002259063A (ja) バックアップ処理可能な記憶システム
WO2010008984A2 (en) Method and system for using shared memory with optimized data flow to improve input/output throughput and latency
US7634601B1 (en) Method and apparatus for providing continuous communications between computers
JP2008112399A (ja) ストレージ仮想化スイッチおよびコンピュータシステム
JPH09146842A (ja) 記憶サブシステム
US7293197B2 (en) Non-volatile memory with network fail-over
US6804794B1 (en) Error condition handling
US7752340B1 (en) Atomic command retry in a data storage system
JP2006268403A (ja) データストレージシステム及びストレージ制御装置のログデータの等価制御方法
JP2005122763A (ja) 記憶装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070301

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070313

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070712

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100720

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100720

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110720

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120720

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130720

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees