JP4068798B2 - 記憶サブシステム及びi/oインタフェースの制御方法ならびに情報処理システム - Google Patents
記憶サブシステム及びi/oインタフェースの制御方法ならびに情報処理システム Download PDFInfo
- Publication number
- JP4068798B2 JP4068798B2 JP2000332164A JP2000332164A JP4068798B2 JP 4068798 B2 JP4068798 B2 JP 4068798B2 JP 2000332164 A JP2000332164 A JP 2000332164A JP 2000332164 A JP2000332164 A JP 2000332164A JP 4068798 B2 JP4068798 B2 JP 4068798B2
- Authority
- JP
- Japan
- Prior art keywords
- command
- processing unit
- data
- central processing
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 62
- 230000010365 information processing Effects 0.000 title claims description 16
- 238000012545 processing Methods 0.000 claims description 245
- 230000008569 process Effects 0.000 claims description 48
- 230000004044 response Effects 0.000 claims description 36
- 238000012546 transfer Methods 0.000 claims description 26
- 238000011084 recovery Methods 0.000 claims description 8
- 230000001174 ascending effect Effects 0.000 claims description 5
- 238000007726 management method Methods 0.000 description 24
- 230000005540 biological transmission Effects 0.000 description 14
- 238000013523 data management Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 12
- 238000005516 engineering process Methods 0.000 description 9
- 238000012005 ligant binding assay Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 8
- 239000000835 fiber Substances 0.000 description 6
- 230000004913 activation Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000010923 batch production Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0866—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
- G06F12/0873—Mapping of cache memory to specific storage devices or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F12/00—Accessing, addressing or allocating within memory systems or architectures
- G06F12/02—Addressing or allocation; Relocation
- G06F12/08—Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
- G06F12/0802—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
- G06F12/0866—Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches for peripheral storage systems, e.g. disk cache
- G06F12/0868—Data transfer between cache memory and other subsystems, e.g. storage devices or host systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/26—Using a specific storage system architecture
- G06F2212/261—Storage comprising a plurality of storage devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/26—Using a specific storage system architecture
- G06F2212/261—Storage comprising a plurality of storage devices
- G06F2212/262—Storage comprising a plurality of storage devices configured as RAID
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2212/00—Indexing scheme relating to accessing, addressing or allocation within memory systems or architectures
- G06F2212/31—Providing disk cache in a specific location of a storage system
- G06F2212/312—In storage controller
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Description
【発明の属する技術分野】
本発明は、記憶サブシステム及びI/Oインタフェースの制御技術ならびに情報処理システムに関し、より詳しくは、中央処理装置と記憶サブシステムの記憶制御装置とが、当該中央処理装置が複数のコマンドやデータから構成される1つのI/O要求を記憶制御装置からの応答とは非同期に記憶制御装置に対して発行することでI/O要求処理を実行するインタフェースプロトコルにより接続された情報処理システム等に適用して有効な技術に関する。
【0002】
【従来の技術】
銀行のオンラインシステムなどで用いられる大規模情報システム(メインフレームシステム)は、中央処理装置と周辺記憶装置とから構成される。この周辺記憶装置は、記憶制御装置と記憶装置から構成されており、これを記憶サブシステムと呼んでいる。以下、上記の記憶サブシステムとメインフレーム間のインタフェースについての概要を説明する。
【0003】
上記メインフレーム向け記憶サブシステムを構成する中央処理装置と記憶制御装置との間で、I/O要求処理の際に伝達される情報としては主に、(1)コマンド、(2)コマンド応答、(3)コマンド応答受付け、(4)データ、(5)ステータスなどがあり、これらがフレームの形式で伝達されてI/O要求処理が実行される。
【0004】
中央処理装置は、記憶装置に対するI/O要求を実行するためにCCWチェーンと呼ばれる複数のコマンド及びデータから構成されるコマンド群を作成する。中央処理装置は、このコマンド群の最初のコマンドを記憶制御装置に対して発行する。これに対し、コマンドを受領した記憶制御装置は、コマンドフレームを受領したことを通知するコマンド応答フレームを中央処理装置に対して送信する。このコマンド応答フレームに対して、中央処理装置はコマンド応答受付けフレームを記憶制御装置に対して送信する。この時点で、中央処理装置及び記憶制御装置は、共にデータの送受信が可能な状態になったことを認識し、この後、中央処理装置と記憶制御装置間でデータの送受信が開始される。発行されたコマンドに関するデータの送受信が終了した時点で、記憶制御装置から中央処理装置に対してデータ転送処理の終了状態を通知するステータスフレームが送信される。
【0005】
中央処理装置は、記憶制御装置からのステータスフレームを受領した後、このステータスの内容をチェックし、次コマンド処理が継続可能であるならば、次コマンドを発行する。この様に、1つのCCWチェーンは、中央処理装置と記憶制御装置間において、1つ1つのコマンド毎にコマンド〜コマンド応答〜データ転送〜ステータス送信といったインターロックをとりながら、逐次処理されていく。
【0006】
ここで、もう少しCCWチェーンについて詳細に述べる。CCWチェーンを構成するコマンドの種類としては、レコードへのアクセス可否やアクセスモード等を指定するDefine Extentコマンド(以下、DXコマンドとする)や、対象となる入出力データのシリンダ・トラック・レコードに位置付けるための情報などを示すLocate Recordコマンド(以下、LOCコマンドとする)、そして実際のリード・ライトを指示するリード・ライトコマンド、等がある。
【0007】
1つのCCWチェーンは、これらの複数コマンドのチェーンにより構成される。LOCコマンドを受領すると、記憶制御装置は、LOCコマンドのパラメタデータから位置付けすべきシリンダ・トラック・レコードを認識し、位置付け処理を行なう。
【0008】
LOCコマンドの後続には、リード/ライトコマンドがチェーンする。LOCコマンドにチェーンしたリード/ライトコマンドの処理は、LOCコマンドで位置付けたレコードから連続したレコードに対して実行される。この様にLOCコマンドに続いてチェーンされたリード/ライトコマンドのコマンド群をLOCドメインという。LOCドメイン数、つまりLOCコマンドに幾つのリード/ライトコマンドがチェーンするかは、LOCコマンドのパラメタで指定される。
【0009】
今、あるI/O要求を実行する1CCWチェーンにおいて、次に処理すべき対象レコードが、直前に処理したレコードとは不連続の場合、同一LOCドメインでは処理出来ず、次に処理すべきレコードへの位置付け処理が必要となる。この場合、再度LOCコマンドにて次に処理すべきレコードへの位置付けを行なう。この様に、1つのCCWチェーンの処理において、幾つかの不連続なレコードに対するリード・ライト要求がある場合には、1CCWチェーンに複数のLOCドメインが存在することになる。
【0010】
次に、上記CCWチェーン実行時における、中央処理装置と記憶制御装置間の論理的な接続の切り離し動作について説明する。
【0011】
中央処理装置から記憶制御装置配下のある記憶装置に対してリード/ライトコマンドが発行された時、記憶制御装置内のキャッシュメモリ上に処理対象のデータが存在しない場合には、記憶装置からデータをキャッシュメモリにステージングする必要がある。この場合には、記憶制御装置は前記のコマンド処理を直ぐには実行出来ない。このため、記憶制御装置は、一旦中央処理装置と記憶制御装置間の論理的な接続を切断する事を要求するステータスを中央処理装置に対して送信し、論理的な接続を切断する。その後、記憶制御装置内キャッシュメモリへのステージング処理が完了し、I/Oを処理する準備が出来た時点で、記憶制御装置は中央処理装置に対し接続割り込み要求の送信を行って論理的な接続を行った後、I/O処理再開を意味する状態通知を行なう。
【0012】
この様に記憶制御装置は、I/O処理のための準備が出来ていない等の理由で一旦、中央処理装置との論理的な接続を切断するケースがある。この様な切り離しの要因としては、(1)記憶制御装置内のキャッシュメモリ上にデータが存在せず、記憶装置からデータを記憶制御装置内のキャッシュメモリにステージングするケース、(2)記憶制御装置内のキャッシュメモリのスペース割り当てが出来ず、キャッシュメモリスペースの空き待ちのケース、(3)I/O処理のための資源がBusy状態で確保出来ず、資源のBusy解除待ちのケース、等がある。
【0013】
1CCWチェーンの実行中に、この様な切り離し動作が多く発生すると、I/O要求処理のトータルレスポンスタイムが増加してしまう。
【0014】
次にキャッシュミスによるレスポンスタイムの増加を削減する技術の一例について述べる。
【0015】
I/O要求のパターンの1つとして、大容量バッチ処理等に代表される様な、記憶装置内のレコードに対して、シーケンシャルにアクセスして処理するパターンがある。この場合のCCWチェーンは、前述のDXコマンド、LOCコマンド、そしてこのLOCコマンドにチェーンした複数のリードorライトコマンドから構成されており、連続したレコード・トラックの処理を実行するという特徴がある。処理対象のレコードは連続しているため、LOCドメインを切り替える必要はなく、連続してリード/ライトコマンドの処理が実行可能である。
【0016】
先程述べた様に、リード/ライト対象レコードがキャッシュミスの場合は、中央処理装置と記憶制御装置との論理的な切り離しが発生するため、レスポンスタイムが増加してしまう。しかし、このシーケンシャルアクセスの場合は、CCWチェーンの次のコマンドを受領していなくても次にアクセスするシリンダ・トラック・レコードを予測出来るため、処理を行なうであろうシリンダ・トラック・レコードのデータを、前もってキャッシュ上にステージングしておくことにより、キャッシュミスによる中央処理装置と記憶制御装置との切り離しを実行する契機を削減でき、レスポンスタイムの向上が望める。ちなみに、当該CCWチェーンがシーケンシャルアクセスか否かは、DXコマンドにシーケンシャルアクセスを示す情報があるので、これを参照すればよい。
【0017】
一方、別のI/O要求のパターンの1つとして、データベースへのアクセスに代表される様な、ランダムなレコードへのアクセスがある。ランダムアクセスでは、アクセス対象のレコードが分散しているため、それぞれのレコードの処理を行なう前に、LOCコマンドにて位置付け処理を行なう必要がある。このため、ランダムアクセスのCCWチェーンの中には、複数のLOCドメインが存在する。シーケンシャルアクセスと異なり、ランダムアクセスでは、処理対象のレコードが連続していないために次にアクセスするレコードを予測出来ず、シーケンシャルアクセス時の様にアクセス対象のデータを先にステージングすることが出来ない。従って、ランダムアクセスの方がシーケンシャルアクセスより、キャッシュミスによる中央処理装置との論理的な切り離し契機が多くなる可能性があると言える。
【0018】
以上、キャッシュミスによるレスポンスタイムの増加を軽減する技術について述べてきたが、次にスループット向上に関する技術について述べる。
【0019】
近年の大容量転送、遠隔データ転送などを実現するプロトコルとして注目を浴びているのが、ファイバーチャネルプロトコルである。ファイバーチャネルプロトコルは、主に、これまでオープン系システムで使われてきた技術だが、最近、メインフレーム用ファイバーチャネルプロトコルとして、ファイバーチャネルプロトコルの物理層(FC−PH)に準拠したプロトコルであるFC−SB2(FIBRE CHANNEL Single−Byte Command Code Sets−2 Mapping Protocol)が提案されている。これは、FC−PHに従来のメインフレームと記憶サブシステム間の通信プロトコルをマッピングしたものであり、現在、ANSI(American National Standard for Information Technology)により規格化が進められている。このFC−SB2には、大きく分けて次の2つの特徴がある。
【0020】
1つ目として、従来のメインフレームのプロトコルとは異なり、1I/Oの要求処理(1CCWチェーン)実行中に、中央処理装置と記憶制御装置間の論理的な接続パス(以下、論理パス)を占有することをせず、同一論理パス上で同時に複数の論理VOLに対するI/O要求を実行出来るという点である。2つめの特徴としては、中央処理装置は、記憶制御装置とのインターロックを取らずに、コマンド及びデータをパイプライン的に発行出来るという点である。FC−SB2では、例えばWRコマンド発行時では、記憶制御装置からWRコマンドに対するコマンド応答が送信されてこなくても、中央処理装置は、WRコマンドのデータを記憶制御装置に対して送信する事が可能である。更に、当該コマンドに対するステータスフレームを受信しなくても、中央処理装置は、次コマンド及びデータの発行が可能である。この様に、FC−SB2では、中央処理装置と記憶制御装置とが非同期にそれぞれコマンドの処理を実行していくプロトコルとなっている。
【0021】
以上、説明した様な特徴をもつFC−SB2プロトコルは、特に、長距離・高負荷接続時にシステムのスループットを低下させないという点で非常に効果的なプロトコルである。
【0022】
【発明が解決しようとする課題】
FC−SB2プロトコルの様な、中央処理装置と記憶制御装置間のインターロック軽減を実現するプロトコルにより接続された中央処理装置及び記憶サブシステムでは、長距離・高負荷接続時におけるスループットの低下を抑えることが出来る。しかし、記憶制御装置は受領したコマンドを受領順に逐次処理していくことに変わりは無い。従って、途中のコマンド処理において、処理対象のデータのキャッシュミスが発生した場合、前述の様にキャッシュメモリ上に必要なデータをステージングする間、中央処理装置と記憶制御装置間のデータ転送処理は実行出来ない。この結果、レスポンスタイムの増加を招く。特に、データベースアクセスに代表される様な、ランダムアクセス処理においては、シーケンシャルアクセス時の先読みステージング動作を行なえないため、キャッシュミス契機が多くなる可能性が高くなる。また、あるコマンドでキャッシュミスが発生した場合、そのコマンドからリトライする動作となるため、中央処理装置から受領したコマンド及びデータのうち、キャッシュミスが発生したコマンド以降のコマンド及びデータは一度破棄し、再度中央処理装置から受領し直す必要がある。このコマンド及びデータの再受領は長距離接続時においては、かなりのオーバヘッドとなる。
【0023】
本発明の目的は、ランダムアクセス時のキャッシュミス発生時において、レスポンスタイムの増加を防ぎ、FC−SB2プロトコルの様にパイプライン的に発行されたコマンド及びデータを効率よく処理することが可能な技術を提供することにある。
【0024】
本発明の他の目的は、上位装置と記憶サブシステムとが、記憶サブシステム側からの応答とは非同期に、上位装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を記憶サブシステムに対して発行するI/Oインタフェースにて接続された構成において、ランダムアクセス時のキャッシュミス発生時のレスポンスタイム削減によるスループット向上を実現することにある。
【0025】
本発明の他の目的は、上位装置と記憶サブシステムとが、FC−SB2プロトコルにて接続された構成において、ランダムアクセス時のキャッシュミス発生時のレスポンスタイム削減によるスループット向上を実現することにある。
【0026】
【課題を解決するための手段】
配下に複数の記憶装置を有し、内部にキャッシュメモリを有する記憶制御装置を備えた記憶サブシステムと、この記憶サブシステムにアクセスする中央処理装置とを含み、記憶制御装置からの応答とは非同期に、中央処理装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を記憶制御装置に対して発行するI/Oインタフェースプロトコルにより、中央処理装置と記憶制御装置とが接続されている情報処理システムにおいて、本発明の記憶サブシステムは、中央処理装置から受領した複数コマンド及びデータの受領順には依存せず、受領コマンドの処理順序を決定して実行する手段を有するものである。
【0027】
また、上記構成の情報処理システムにおいて、本発明の記憶サブシステムは、中央処理装置から受領した複数コマンドのうち、処理対象のデータがキャッシュメモリ上に存在するコマンドについては、中央処理装置とのデータ転送を実行し、処理対象のデータがキャッシュメモリ上に存在しないコマンドの処理対象データを、記憶装置からキャッシュメモリへ読み出す処理と、中央処理装置とのデータ転送処理とを並行して実行する手段を有するものである。
【0028】
また、上記構成の情報処理システムにおいて、本発明の記憶サブシステムは、1つの論理ボリュームのデータを複数の記憶装置に分割・配置して格納するRAID構成をとっている場合において、中央処理装置から受領した複数コマンドをまとめてコマンド群とし、コマンド群のうちの複数コマンドの処理対象データが、キャッシュメモリ上に存在しない場合、各コマンドの処理対象データが格納されている各記憶装置に対して、コマンド群の各コマンドの処理対象データのキャッシュメモリへの読み出し処理を複数並行して起動し、この読み出し処理が完了した順にコマンド群の各コマンドに関する中央処理装置とのデータ転送と読み出し処理を並行して実行する手段を有するものである。
【0029】
また、上記構成の情報処理システムにおいて、本発明の記憶サブシステムは、中央処理装置から受領した複数コマンドを纏めてコマンド群とし、コマンド群のうちの複数コマンドの処理対象データがキャッシュメモリ上に存在しない場合、各コマンドの処理対象データが格納されている各記憶装置の稼動率に応じて、記憶装置からキャッシュメモリへの処理対象データの読み出し処理を複数並行して起動し、読み出し処理が完了したものから、中央処理装置とのデータ転送を他の読み出し処理と並行して実行する手段を有するものである。
【0030】
また、上記構成の情報処理システムにおいて、本発明の記憶サブシステムは、中央処理装置から受領した複数コマンドを纏めて第1のコマンド群とし、第1のコマンド群のうちの複数コマンドの処理対象データが、キャッシュメモリ上に存在しない場合、第1のコマンド群のうち、対象データが同一の記憶装置に存在しているコマンドを記憶装置へアクセスするアドレスの昇順に纏めて第2のコマンド群とし、第2のコマンド群単位で記憶装置からキャッシュメモリへの記憶装置内データの読み出し範囲を決定して読み出し処理を起動し、読み出し処理が完了したものから中央処理装置へのデータ転送を他の読み出し処理と並行して実行する手段を有するものである。
【0031】
また、記憶サブシステムと中央処理装置との間を接続しているI/Oインタフェースプロトコル制御方式において、本発明のI/Oインタフェースプロトコル制御技術では、中央処理装置は、当該中央処理装置が発行したコマンド及びデータの発行順には依存しない順で、記憶制御装置からデータ及びコマンド終了報告を受領し、受領したデータ及びコマンド終了報告に対応するコマンドを特定し、データ及びコマンド終了報告を特定したコマンドに対する応答フレームとして処理する手段を有するものである。
【0032】
さらに、このI/Oインタフェース制御方式において、本発明のI/Oインタフェースプロトコル制御技術では、記憶制御装置は、中央処理装置から受領したコマンド及びデータのチェーンの途中でエラー及びリトライ要因が発生した場合、I/O要求を中断せずに継続して、受領した他の実行可能なコマンド及びデータに関して中央処理装置とのデータ転送を実施し、I/O要求を構成する全コマンド処理分の終了状態をまとめて、1つのI/O要求処理完了報告として中央処理装置へ報告する手段を備え、中央処理装置は、I/O要求処理完了報告を受領後、各コマンドの終了状態を認識し、エラーあるいはリトライ要求のあった各コマンドに対してのみリカバリ処理を実行する手段を備えたものである。
【0033】
また、このI/Oインタフェース制御方式において、本発明のI/Oインタフェースプロトコル制御技術では、中央処理装置は、当該中央処理装置が発行したコマンド及びデータの発行順には依存しない順で、記憶制御装置からデータ及びコマンド終了報告を受領する手段と、記憶制御装置からI/O要求を構成する全コマンド分に対するコマンド終了報告を受領する迄、I/O要求処理を中断せず継続して実行する手段と、I/O要求を構成する全コマンド分のコマンド処理終了報告を受領後、受領したコマンド処理終了報告の中でエラーあるいはリトライ要求があったコマンドに対してのみ、リカバリ処理を実行する手段とを有するものである。
【0034】
【発明の実施の形態】
以下、本発明の実施の形態を図面を参照しながら詳細に説明する。
【0035】
まず、本発明を説明するにあたり、本発明を用いた中央処理装置及び記憶サブシステムの構成について、図2を用いて説明する。
【0036】
本実施の形態における情報処理システムは、中央処理装置1、ディスク制御装置2、及びディスク装置3から構成されている。ディスク制御装置2は、中央処理装置1とは、たとえばFC−SB2プロトコル(FIBRE CHANNELSingle−Byte Command Code Sets−2 Mapping Protocol)が実装されたI/Oインタフェース100により接続されている。ディスク装置3には複数の物理ドライブ32が配置されており、データが格納されている。ディスク装置3は、ディスク制御装置2に対してドライブインタフェース200にて接続されている。
【0037】
まず、本実施の形態の中央処理装置1の構成例について説明する。中央処理装置1には、ユーザプログラムの要求を実行するアプリケーション部11、アプリケーション部11が発行した入出力要求を受け、実際のデータの入出力命令のためのCCWを作成したり、CCWデータの管理を行なうデータ管理部12、CCWやデータ、制御情報などが格納されている主記憶14、及びディスク制御装置2との間の入出力制御を行うチャネル制御部13から構成されている。
【0038】
主記憶14には、CCW情報が格納されているCCW情報格納域142、CCW情報格納域142の先頭アドレスが格納されているCCW先頭アドレス格納域141、CCWのデータが格納されているData格納域143、そしてI/O要求を管理するためのI/O管理領域144がある。これらの詳細については、後述する。
【0039】
次に、本実施の形態のディスク制御装置2の構成例について説明する。送受信バッファメモリ21は、中央処理装置1との間で送受信されるコマンド及びデータを一時的に格納するメモリである。対チャネルプロトコル制御部22は、前述のFC−SB2プロトコルを制御する。コマンド処理部23は、中央処理装置1から受領したコマンドをデコードし、コマンド処理を行う。キャッシュメモリ24は、送受信バッファメモリ21と、ディスク装置3内の各物理ドライブ32との間のデータ転送において、データを一時的に格納するためのメモリである。制御メモリ25には、コマンド処理用の制御情報、物理ドライブ32とキャッシュメモリ24との転送を制御するための情報及び、後述の本実施の形態における各種制御を実施する上で必要な各種情報が格納されている。各テーブルの内容、用途については後述する。ディスクドライブ制御部26は、ディスク制御装置2に接続されているディスク装置3とのインタフェース制御を行う。
【0040】
ディスク装置3には、ディスク制御装置2とのインタフェース制御を行う、ディスク装置インタフェース制御部31及び、データを格納する物理ドライブ32が複数配置されている。本実施の形態では、RAID5構成を用いてデータを格納しているが、これについて、図3を用いて説明する。
【0041】
中央処理装置1で扱うデータボリュームを論理ボリュームと言うが、図3にそのうちの1論理ボリューム4を示す。シリンダ(以下、CYL)及びヘッド(以下、HD)の組み合わせで決まるエリアをトラックという。論理ボリューム4は、複数のトラックから構成されている。本実施の形態では、論理ボリュームの各トラックを複数の物理ドライブ32に分割して配置する。図3の場合、論理ボリューム4内のトラック41はドライブ#0の物理ドライブ32に、トラック42はドライブ#1の物理ドライブ33に、そしてトラック43は、ドライブ#2の物理ドライブ34に格納する。そして、トラック41〜43からパリティデータを生成し、パリティデータを示すトラック44をドライブ#3の物理ドライブ35に格納する。この時、パリティデータの生成単位であるトラック41〜44の横一列のトラックの並びをストライプ列という。本実施の形態は、RAID5構成であるので、途中でパリティデータを格納する物理ドライブの位置がサイクリック的に移動していく。本実施の形態では、8ストライプ列毎にパリティデータの格納物理ドライブを代えていく。また、物理ドライブ32は、固定長ブロック(以下、LBA)に分割されており、CCWのデータはこの固定長に分割して格納される。
【0042】
次にI/O要求処理の基本的な流れについて、図2を用いて説明する。
【0043】
まず、中央処理装置1にあるアプリケーション部11において、ディスク装置3に格納されている論理ボリューム(以下、論理VOL)データに対する入出力要求が作成され、この要求がデータ管理部12に発行される。データ管理部12は、発行された入出力要求を実行するために、CCWチェーンを作成する。作成されたCCWは、主記憶14内のCCW情報格納域142に格納され、CCWのデータは、Data格納域143に格納される。また、CCW先頭アドレス格納域141に、CCW情報格納域142の先頭アドレスを格納しておく。データ管理部12はCCWを作成したら、チャネル制御部13に対し、CCWの実行を要求する。CCW実行要求を受けたチャネル制御部13は、CCW先頭アドレス格納域141を参照し、CCW情報格納域142の先頭アドレスを取得して、CCWを得る。そして、CCW情報格納域142に格納されているCCWのコマンドをディスク制御装置2に逐次発行していく。また、WR系コマンドの場合には、発行したコマンドに関連するデータは、Data格納域143に格納されているので、ディスク制御装置2に送信する。また、この時、データ管理部12はI/O管理領域144に図4に示すI/O要求共通情報1440以下の内容を登録する。その後、逐次CCWをディスク制御装置2に発行する度に必要なCCW情報をI/O管理領域144のCCW管理情報1441に登録する。
【0044】
一方、チャネル制御部13から受領したCCWのコマンド及びデータは、ディスク制御装置2の送受信バッファメモリ21に格納される。対チャネルプロトコル制御部22は、I/O管理テーブル256に図8に示すI/O要求共通情報2560以下の内容を登録し、管理する。また、パイプライン的に受領した後続のCCWについては、それぞれのCCWに対応したCCW管理情報2561に登録し、管理する。対チャネルプロトコル制御部22は、各CCWコマンド受領毎に、コマンドの受領をコマンド処理部23に通知する。コマンド処理部23は、受領したコマンドをデコードし、キャッシュデータ管理テーブル252を参照して、処理対象データがキャッシュメモリ24上に存在するか否かをチェックする。キャッシュデータ管理テーブル252には、対象の論理VOL#/CYL#/HD#/レコード#のデータがキャッシュメモリ24上に存在しているか否かの情報や、存在している場合のキャッシュメモリ24上のアドレス、データの属性などの情報が格納されている。キャッシュメモリ24上にデータが存在(以下、キャッシュヒット)した場合、コマンド処理部23は、キャッシュメモリ24と送受信バッファメモリ21間のデータ転送を実施する。一方、対チャネルプロトコル制御部22は、送受信バッファメモリ21と、チャネル制御部13との間のデータ転送を実施する。
【0045】
一方、キャッシュメモリ24上に処理対象データが存在しなかった(以下、キャッシュミス)場合、対象データをそのデータが格納されている物理ドライブ32からキャッシュメモリ24上に読み出す(以下、ステージング)処理が必要となる。このステージング処理は、物理ドライブ毎に独立して動作可能である。処理対象データが格納されているディスク装置3内の物理ドライブ番号は、論理−物理アドレス変換テーブル251を参照する事で取得する。このテーブルには、論理VOL#/CYL#/HD#/レコード#から決定される処理対象のレコードが、どの物理ドライブのどのLBAに格納されているか、が示されている。論理−物理アドレス変換テーブル251よりステージング対象の物理ドライブ#を取得したら、図5に例示されるドライブ別ステージング要求キューテーブル253にステージング要求内容を登録する。ドライブ別ステージング要求キューテーブル253はFIFO構造になっており、ステージングの要求順に登録される。登録する内容については、図5に例示されている通りである。ここで、ステージング要求を登録する際、各ドライブ毎にユニークな要求IDを付与する。ドライブ別ステージング要求キューテーブル253にステージング要求を登録後、ステージング起動キューテーブル254に図6に例示する内容を登録する。また、更に図8のI/O管理テーブル256の当該CCW#に対応するCCW管理情報のCCW管理情報2561に“ステージング完了待ち" を設定する。
【0046】
一方、ディスクドライブ制御部26は、図6のステージング起動キューテーブル254を定期的に参照し、ステージング要求が登録されたら、ステージング対象の物理ドライブ#からそのドライブ別ステージング要求キューテーブル253を参照して、ステージング内容を取得し、ステージング要求をディスク装置インタフェース制御部31に対して発行する。要求を受けたディスク装置インタフェース制御部31は、目的の物理ドライブから指示されたステージング開始LBA#(以下、SLBA#)から必要分のデータをキャッシュメモリ24に転送する。ステージング処理が終了すると、ディスク装置インタフェース制御部31からディスクドライブ制御部26に対し、ステージング終了の報告を行なう。報告を受けたディスクドライブ制御部26は、ステージング完了報告キューイングテーブル255にステージング処理が終了したドライブ#/要求IDをキューイングする。
【0047】
コマンド処理部23はステージング完了報告キューイングテーブル255を参照し、ステージング終了を検出すると、ステージング完了報告キューイングテーブル255のドライブ#及び要求IDを基に、ドライブ別ステージング要求キューテーブル253を参照して、ステージングが完了したI/O要求#/CCW#を取得する。コマンド処理部23は、取得したI/O要求#/CCW#を基にI/O管理テーブル256を参照し、当該CCW#に対応するCCW管理情報のCCW管理情報2561の“ステージング完了待ち" を“CCW処理中" に変化させ、コマンド処理を再開する。後はキャッシュヒット時の動作と同じになる。
【0048】
以下、本発明の実施の形態についてさらに詳細に説明する。
【0049】
本発明を実施したI/Oシーケンスの例を図1に示す。図1では、中央処理装置1からディスク制御装置2に対し、CMD101〜CMD103が発行され、コマンド処理部23において、CMD101のCCW1及びCMD102のCCW2がキャッシュミスだったと認識した(キャッシュミス、ヒットの判定については前述の通り)。この時、前述の方式により、CMD101のCCW1の処理対象データのステージング処理を起動し、続いてCMD102のCCW2の処理データのステージング処理も並行して起動する(2010、2011)。続いて、コマンド処理部23は、後続のCMD103(CCW3)がキャッシュヒットだったため、コマンド処理部23は、CCW3の処理を行い、CCW3のデータであるDATA104を中央処理装置1に送信する。CCW3のデータを送信した後、図1では、CCW1のステージング要求に対するステージング完了通知2012が報告されているため、コマンド処理部23はCCW1の処理を実行し、中央処理装置1に対してCCW1のDATA105を送信する。その後、CCW2のステージング要求に対するステージング完了通知2013が報告されてきたため、コマンド処理部23はCCW2の処理を実行し、中央処理装置1に対してCCW2のDATA106を送信する。最後にSTATUS107を送信する。
【0050】
ここで、CCW3の処理が終了した時点で、まだCCW1に対するステージング完了通知2012が報告されていなかった場合は、ディスク制御装置2は中央処理装置1との論理的な接続を切断し、ステージング完了通知2012があってから、再度中央処理装置1との論理的な接続を回復し、CCW1の処理を実行してもよい。また、中央処理装置1との論理的な接続は切り離さず、ステージング完了通知2012の報告を待ってからCCW1の処理を実行してもよい。図1では、CCW1に対するステージング完了通知(2012)の方が先に発生したが、CCW2に対するステージング完了通知(2013)の方が先に発生した場合は、先にCCW2の処理を実行してもよい。
【0051】
もし、中央処理装置1から受領した複数CCWコマンドがキャッシュミスだった場合は、各CCW毎にドライブ別ステージング要求キューテーブル253及び、ステージング起動キューテーブル254にステージング要求がキューイングされる。ステージング処理は物理ドライブ毎のため、ステージングの起動順にステージングが完了するとは限らない。この場合、ステージングが完了した順にステージング完了報告キューイングテーブル255にキューイングされ、このキューイング順でステージング完了報告が行われる。コマンド処理部23はステージング完了報告キューイングテーブル255を参照してコマンド処理を実行するため、結果として、ステージングが完了した順にコマンド処理を実行することになる。
【0052】
上記の処理は、次の様にしてもよい。しきい値テーブル259(図11)に受領CCW数しきい値2592を持ち、中央処理装置1から受領したCCW数が、この受領CCW数しきい値2592に達した場合、そこまでのCCW迄をCCW群として1つの処理対象範囲とし、図12に示すフローにて制御してもよい。
【0053】
すなわち、図12のフローチャートにおいては、まず、受領CCW数を0に初期化した後(ステップ120001)、中央処理装置1からのCCW到来を待ち(ステップ120002、ステップ120003)、CCWを受領したら、受領CCW数を加算し(ステップ120004)、当該CCWの対象データのヒット/ミス判定を実行し(ステップ120005)、ヒットの場合は当該CCWの処理を実行し(ステップ120006)、ミスの場合は、当該対象データのドライブからキャッシュメモリ24へのステージング処理を実行する(ステップ120007)。
【0054】
さらに、後続のCCWの有無を判別し(ステップ120008)、後続有りの場合には、受領済みのCCW数は、受領CCWしきい値以下か否かを判定し(ステップ120009)、しきい値以下の場合は、ステップ120002以降のCCWの受け付け処理を反復する。
【0055】
ステップ120008で後続なしの場合、あるいはステップ120009でしきい値以上の場合には、受領した全CCWがキャッシュミスか否かを判定し(ステップ120010)、キャッシュミスの場合には、ステージング処理待ち状態に移行する(ステップ120011)。
【0056】
ステップ120010で受領した全CCWがキャッシュミスではない場合には、STATUS Frame送信処理を実行する。
【0057】
上述のステージング処理待ち状態(ステップ120011)では、キャッシュミスのCCWの対象データのステージング処理の終了を監視し(ステップ120012、ステップ120013)、ステージング処理の終了したCCWがある場合には、当該ステージング処理の終了したCCWの処理を実行し(ステップ120014)、キャッシュミスの全CCWの対象データの処理が完了したか否かを判別し(ステップ120015)、未完の場合には、ステップ120012以降を反復し、完了の場合には、STATUS Frame送信処理を実行する。
【0058】
中央処理装置1から受領した複数CCWにおいて、キャッシュミスが発生し、ステージング処理の起動が必要な場合、図13に示すフローの様に制御してもよい。すなわち、まず、受領CCW数を0に初期化した後(ステップ130001)、中央処理装置1からのCCW到来を待ち(ステップ130002、ステップ130003)、CCWを受領したら、受領CCW数を加算し(ステップ130004)、当該CCWの対象データのヒット/ミス判定を実行し(ステップ130005)、ヒットの場合は当該CCWの処理を実行し(ステップ130006)、ミスの場合は、当該対象データのドライブからキャッシュメモリ24へのステージング処理を実行する(ステップ130007)。
【0059】
さらに、後続のCCWの有無を判別し(ステップ130008)、後続有りの場合には、受領済みのCCW数は、受領CCWしきい値以下か否かを判定し(ステップ130009)、しきい値以下の場合は、ステップ130002以降のCCWの受け付け処理を反復する。
【0060】
ステップ130008で後続なしの場合、あるいはステップ130009でしきい値以上の場合には、キャッシュミスのCCW無しか判定し(ステップ130010)、無しの場合には、STATUS Frame送信処理を実行する。
【0061】
有りの場合には、キャッシュミスのCCWの各データのキャッシュメモリへのステージング処理を起動すべき対象ドライブ番号を取得し(ステップ130011)、ステージング対象のCCWは残り一つか判定し(ステップ130012)、残り一つの場合には当該CCWに関してステージング処理を起動する(ステップ130013)。
【0062】
残り一つではない場合には、ドライブ別稼働管理テーブル257を参照して(ステップ130011)決定した対象ドライブのうち、一番稼働率の高いドライブ番号を選択し(ステップ130014)、選択した以外のドライブに関してステージング処理を起動し(ステップ130015)、ステージング起動未完か否かを調べ(ステップ130016)、未完の場合には、ステップ130012以降を反復し、完了の場合には、ステージング完了待ち処理へ移行する。
【0063】
なお、図13において、ステップ130014で、ステージング対象ドライブのうち、一番稼働率が高いドライブ番号を取得したが、これは図9のドライブ別稼動管理テーブル257のカレントエリア#2570(エリア#0、エリア#1のいずれか)を参照し、カレントなエリア(統計的なデータを採取中のエリア)の各ステージングが必要なドライブ#のアクセス回数をそれぞれ比較することで得られる。ディスク装置3のディスク装置インタフェース制御部31は、各物理ドライブにアクセスする度に、カレントエリア#2570が示しているエリアのアクセス回数を1インクリメントする。なお、ドライブ別稼動管理テーブル257のカレントエリア#2570は、一定時間超過すると、エリア#0とエリア#1の間で交互に逆エリアを指し示す様になっている。
【0064】
また、図15及び図16に示すフローチャートによって、複数のCCWに対するステージングを1つのステージング要求として纏めて起動してもよい。
【0065】
すなわち、図15の処理では、まず上述の図13のステップ130001〜ステップ130009までと同様の処理の後、受領CCWしきい値分のCCWのヒットミス判定およびキャッシュヒットしたCCWの処理を実行し(ステップ150001)、全CCWキャッシュミスでないか判定し(ステップ150002)、全CCWキャッシュミスでない場合は、STATUS Frame送信処理を実行する。
【0066】
一つでもキャッシュミスのCCWがある場合、ドライブ別ステージング要求ソートテーブル258に、アクセス対象アドレスが昇順になるようにステージング要求のCCWをキューイングし(ステップ150003)、ドライブ別ステージング要求のまとめステージング処理を実行し(ステップ150004)、ステージング完了待ち処理を移行する(ステップ150005)。
【0067】
上述のステップ150004のまとめステージング処理では、ループ変数Iを1に初期化した後(ステップ160001)、変数Nにドライブ別ステージング要求ソートテーブル258にエントリされているCWW数をセットし、I番目のステージング開始論理ブロックアドレスSLBA(I)を変数SLBAにセットし、I番目のステージング終端論理ブロックアドレスELBA(I)を変数ELBAにセットし(ステップ160002)、I+1がエントリされているCWW数をこえない間(ステップ160003)、ELBA(I)と次のSLBA(I)の間隔(差分)が、まとめステージングLBA数しきい値以下か判別し(ステップ160004)、当該しきい値以下の場合には、ELBA(I)を変数ELBAにセットし(ステップ160005)、ループ変数Iをインクリメントし(ステップ160006)、ステップ160003以降を反復することで、とびとびのステージング範囲を一つの領域にまとめる処理を行う。
【0068】
ステップ160003でIがI+1がエントリされているCWW数を超えた場合、またはステップ160004で隣り合うステージング範囲の間隔がまとめステージングLBA数しきい値以上離れている場合には、CCW#1〜CCW#IまでのCCW群(一つのCCWの場合もある)に関してステージング要求IDを付与する(ステップ160007)。
【0069】
ここで、図15におけるステップ150003では、ステージング対象のドライブ単位にドライブへアクセスするアドレスの昇順にCCW毎のステージング要求を並べているが、ドライブ別ステージング要求ソートテーブル258にステージング要求をキューイングする際に必ず昇順になるように新規ステージング要求をキューイングする。図16のフローチャートでは、複数のステージング要求をしきい値テーブル259の、纏めステージングLBA数しきい値2591を用いて、1つのステージング要求に置き換える処理を行なっている。これについて、図14を使って詳細に説明する。個々のCCWのステージング範囲が図14に示す状態だったとする。ここで、CCW#nのステージング範囲140005とCCW#(n+1)のステージング範囲140006の隙間(SLBA#(n+1)140003−ELBA#(n)140002)と、纏めステージングLBA数しきい値2591とを比較し、ステージング範囲の隙間の方が小さければ、CCW#nとCCW#(n+1)の両方のステージング範囲を一緒にして、1つのステージング要求として起動する。マージされたステージング範囲のステージング開始位置はSLBA#(n)140001となり、終端はELBA#(n+1) 140004となる。しかし、隙間より、纏めステージングLBA数しきい値2591の方が小さければ、ステージング範囲はマージしない。
【0070】
次に本実施の形態のI/Oインタフェースの制御方法について説明する。
【0071】
本実施の形態では、中央処理装置1から受領したCCWの順にディスク制御装置2はCCWを処理しない。従って、送信するデータの順も中央処理装置1が発行したCCWの順とは異なる場合がある。本実施の形態の中央処理装置1では、データを受信したチャネル制御部13は、データフレームに記載のI/O要求#及びCCW#から、I/O管理領域144を参照し、各I/Oの各CCWのデータ格納アドレスを取得し、そのアドレスに受領したCCWのデータを格納する。こうする事で、チャネル制御部13が発生したCCW順でないデータフレームやステータスフレームを受領しても対応可能である。
【0072】
また、ディスク制御装置2において、CCWチェーン途中のCCWでエラーが発生した場合、次の様にしてもよい。本実施の形態のI/Oインタフェースの制御方法では、図17に示す様にステータスフレームの内容を変更し、1つのステータスフレームの中に複数CCW分のステータス情報を含んだものとする。具体的に説明すると、図17のステータスフレームに制御情報170001を新規に設け、この中に、複数CCWの情報を含んでいる多重ステータス報告機能を有しているかを判定するためのビットを持つ。多重ステータス報告時、1つのステータスフレームには複数のCCWに関するステータス情報が含まれており、それぞれにこの制御情報170001が付与される。この時、幾つのCCWのステータス情報が含まれているかを示すために、各CCWの制御情報内に“後続STATUS報告チェーンビット" を設け、このチェーンビットがONの時、後続ステータス報告がありと判断する。チェーンビットがOFFのステータス報告で最後と判断する。
【0073】
このステータスフレームを用いた本実施の形態のI/Oプロトコルシーケンスを図18に示す。図18において、CCW2でエラー要因が発生したが、CCW2迄でCCWチェーンを切らず、ディスク制御装置2ではCCW3の実行も行なう。そして、全CCWの実行後、図17に記載のステータスフレームを使って、CCW1〜3のステータス情報を一緒に載せて報告する。
【0074】
また、このステータスフレームを受領したチャネル制御部13は、当該I/Oの各CCWの終了状態をI/O管理領域144に記憶する。その後、チャネル制御部13は当該I/Oの全CCWの終了状態をデータ管理部12に報告する。データ管理部12はI/O管理領域144を参照し、エラー及びリトライ要因が発生したCCWを特定して、必要に応じてリカバリ処理を実行する。
【0075】
また、次のようにしてもよい。ディスク制御装置2は、図19に示す様にディスク制御装置2が決定した順でCCWのデータの送信を実施し、各CCWの処理終了毎にステータスフレームを報告する。この時にステータスフレームは図17に示したものでなくてもよい。この場合、各CCW毎に送信されるステータスフレームを受領したチャネル制御部13側での対応が必要である。チャネル制御部13は、受領したステータスフレームからI/O要求#/CCW#を取得し、I/O管理領域144に当該CCWの終了状態を格納する。この時、例え、エラー及びリカバリを示すステータスフレームを受領しても、チャネル制御部13は、当該I/Oの全CCW分のステータスフレームを受領していない場合は、データ管理部12へCCWチェーン終了の報告は行なわない。当該I/Oの全CCWに対するステータスフレームを受領した後、データ管理部12に対して当該CCWチェーンの終了報告割り込みを行う。後は、前述の通り、データ管理部12が必要に応じてエラー及びリトライ要因が発生したCCWに対するリカバリ処理を実行する。
【0076】
以上説明したように、本実施の形態の記憶サブシステム及びI/Oインタフェース制御技術を用いた情報処理システムによれば、FC−SB2のような接続インタフェースにて接続された中央処理装置1と記憶サブシステム(ディスク制御装置2)において、ディスク制御装置2(記憶制御装置)は、対象データがキャッシュヒットして即時実行可能なCCWに関して中央処理装置1と記憶サブシステム間でデータ転送を実行すると同時に、キャッシュミスのCCWに関するデータのステージング処理を並行して実行することが出来るため、たとえば、ランダムアクセス時において、発生し易くなるキャッシュミスによるレスポンスタイムの増加を抑える事が出来るという効果が得られる。
【0077】
また、中央処理装置1では、一群のCCWのディスク制御装置2に対する発行順序に関係なく、ディスク制御装置2からのデータ及びCCW終了報告を受領し、受領したデータ及びCCW終了報告に対応する発行済みCCWを特定し、データ及びCCW終了報告を特定したCCWに対する応答フレームとして処理するので、たとえば、複数のCCWの一部がキャッシュミスによるステージング処理のために、他のキャッシュヒットのCCWが実行を待たされる等の不具合が解消され、たとえば、ランダムアクセス時において、発生し易くなるキャッシュミスによるレスポンスタイムの増加を抑える事が出来るという効果が得られる。
【0078】
この結果、中央処理装置1と、ディスク制御装置2およびディスク装置3からなる記憶サブシステムとの間におけるI/Oのスループットが向上する。
【0079】
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。
【0080】
たとえば、中央処理装置と記憶制御装置とを接続するI/Oシーケンスプロトコルとしては、上述の実施の形態に例示したFC−SB2等に限らず、記憶制御装置からの応答とは非同期に中央処理装置が記憶制御装置に対して複数のコマンドを発行するI/Oインタフェースに広く適用することができる。
【0081】
【発明の効果】
本発明によれば、ランダムアクセス時のキャッシュミス発生時において、レスポンスタイムの増加を防ぎ、FC−SB2プロトコルの様にパイプライン的に発行されたコマンド及びデータを効率よく処理することができる、という効果が得られる。
【0082】
本発明によれば、上位装置と記憶サブシステムとが、記憶サブシステム側からの応答とは非同期に、上位装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を記憶サブシステムに対して発行するI/Oインタフェースにて接続された構成において、ランダムアクセス時のキャッシュミス発生時のレスポンスタイム削減によるスループット向上を実現することができる、という効果が得られる。
【0083】
本発明によれば、上位装置と記憶サブシステムとが、FC−SB2プロトコルにて接続された構成において、ランダムアクセス時のキャッシュミス発生時のレスポンスタイム削減によるスループット向上を実現することができる、という効果が得られる。
【図面の簡単な説明】
【図1】本発明の一実施の形態である記憶サブシステムの作用の一例を示すシーケンスフローチャートである。
【図2】本発明の一実施の形態である記憶サブシステムを含むデータ記憶システムの構成の一例を示すブロック図である。
【図3】本発明の一実施の形態である記憶サブシステムにおけるディスク装置でのデータ格納方法の一例を示す説明図である。
【図4】本発明の一実施の形態である記憶サブシステムに接続される中央処理装置にて用いられている制御情報の一例を示す説明図である。
【図5】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図6】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図7】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図8】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図9】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図10】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図11】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置にて用いられている制御情報の一例を示す説明図である。
【図12】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置の作用の一例を示すフローチャートである。
【図13】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置の作用の一例を示すフローチャートである。
【図14】本発明の一実施の形態である記憶サブシステムの作用の一例を示す説明図である。
【図15】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置の作用の一例を示すフローチャートである。
【図16】本発明の一実施の形態である記憶サブシステムを構成する記憶制御装置の作用の一例を示すフローチャートである。
【図17】本発明の一実施の形態であるI/Oインタフェースの制御方法におけるI/Oプロトコルの一例を示す説明図である。
【図18】本発明の一実施の形態である情報処理システムの作用の一例を示すシーケンスフローチャートである。
【図19】本発明の一実施の形態である情報処理システムの作用の一例を示すシーケンスフローチャートである。
【符号の説明】
1…中央処理装置、101〜107…フレーム、11…アプリケーション部、12…データ管理部、13…チャネル制御部、14…主記憶、141…CCW先頭アドレス格納域、142…CCW情報格納域、143…Data格納域、144…I/O管理領域、1440…I/O要求共通情報、1441…CCW管理情報、2…ディスク制御装置(記憶制御装置)、21…送受信バッファメモリ、22…対チャネルプロトコル制御部、23…コマンド処理部、24…キャッシュメモリ、25…制御メモリ、2010…ステージング要求、2011…ステージング要求、2012…ステージング完了通知(CCW1)、2013…ステージング完了通知(CCW2)、251…論理−物理アドレス変換テーブル、252…キャッシュデータ管理テーブル、253…ドライブ別ステージング要求キューテーブル、254…ステージング起動キューテーブル、255…ステージング完了報告キューイングテーブル、256…I/O管理テーブル、2560…I/O要求共通情報、2561…CCW管理情報、257…ドライブ別稼動管理テーブル、2570…カレントエリア#、258…ドライブ別ステージング要求ソートテーブル、259…しきい値テーブル、2590…ステージング対象コマンド数しきい値、2591…纏めステージングLBA数しきい値、2592…受領CCW数しきい値、26…ディスクドライブ制御部、3…ディスク装置(記憶装置)、31…ディスク装置インタフェース制御部、32…物理ドライブ、4…論理ボリューム、41〜44…トラック、120001〜120015…処理ステップ、130001〜130016…処理ステップ、140001…CCW#(n)ステージング範囲先頭、140002…CCW#(n)ステージング範囲終端、140003…CCW#(n+1)ステージング範囲先頭、140004…CCW#(n+1)ステージング範囲終端、140005…CCW#nステージング範囲、140006…CCW#(n+1)ステージング範囲、150001〜15005…処理ステップ、160001〜160007…処理ステップ、170001…ステータスフレーム内制御情報、180001〜180008…フレーム、190001〜190010…フレーム、100…I/Oインタフェース、200…ドライブインタフェース。
Claims (10)
- 中央処理装置に接続され、配下に複数の記憶装置を有し、内部に前記中央処理装置と前記記憶装置との間で授受されるデータが一時的に格納されるキャッシュメモリを有する記憶制御装置を含み、前記記憶制御装置からの応答とは非同期に、前記中央処理装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を前記記憶制御装置に対して発行するI/Oインタフェースプロトコルにより、前記中央処理装置に接続されている記憶サブシステムであって、
前記記憶制御装置は、前記中央処理装置からの複数の前記コマンド及びデータの受領順には依存せずに、受領した前記コマンドの処理順序を決定して実行する手段を有することを特徴とする記憶サブシステム。 - 請求項1記載の記憶サブシステムにおいて、
前記記憶制御装置は、前記中央処理装置から受領した複数コマンドのうち、処理対象のデータが前記キャッシュメモリ上に存在する前記コマンドについては、前記中央処理装置とのデータ転送を実行し、処理対象のデータが前記キャッシュメモリ上に存在しない前記コマンドの処理対象データを、前記記憶装置から前記キャッシュメモリへ読み出す処理を、前記中央処理装置とのデータ転送処理と並行して実行する手段を有することを特徴とする記憶サブシステム。 - 請求項1記載の記憶サブシステムにおいて、
前記記憶制御装置は、1つの論理ボリュームのデータを複数の前記記憶装置に分散して格納するRAID構成をとっている場合において、前記中央処理装置から受領した複数コマンドをまとめてコマンド群とし、前記コマンド群のうちの複数コマンドの処理対象データが前記キャッシュメモリ上に存在しない場合、前記各コマンドの処理対象データが格納されている個々の前記記憶装置に対して、前記コマンド群の各コマンドの処理対象データの前記キャッシュメモリへの読み出し処理を複数並行して起動し、前記読み出し処理が完了した順に前記コマンド群の各コマンドに関する前記中央処理装置とのデータ転送と他の前記読み出し処理を並行して実行する手段を有することを特徴とする記憶サブシステム。 - 請求項3記載の記憶サブシステムにおいて、
前記記憶制御装置は、前記中央処理装置から受領した複数コマンドをまとめてコマンド群とし、前記コマンド群のうちの複数コマンドの処理対象データが前記キャッシュメモリ上に存在しない場合、前記コマンドの各々の処理対象データが格納されている前記記憶装置の各々の稼動率に応じて前記記憶装置から前記キャッシュメモリへの前記処理対象データの読み出し処理を複数並行して起動し、前記読み出し処理が完了したものから、前記中央処理装置とのデータ転送を他の前記読み出し処理と並行して実行する手段を有することを特徴とする記憶サブシステム。 - 請求項4記載の記憶サブシステムにおいて、
前記記憶制御装置は、前記中央処理装置から受領した複数コマンドをまとめて第1のコマンド群とし、前記第1のコマンド群のうちの複数コマンドの処理対象データが前記キャッシュメモリ上に存在しない場合、前記第1のコマンド群のうち、処理対象データが同一の前記記憶装置に存在しているコマンドを前記記憶装置へアクセスするアドレスの昇順にまとめて第2のコマンド群とし、前記第2のコマンド群単位で前記記憶装置から前記キャッシュメモリへの前記記憶装置内のデータの読み出し範囲を決定して前記読み出し処理を起動し、前記読み出し処理が完了したものから前記中央処理装置へのデータ転送を他の前記読み出し処理と並行して実行する手段を有することを特徴とする記憶サブシステム。 - 中央処理装置と、前記中央処理装置との間で授受されるデータが格納される複数の記憶装置を配下にもち、前記データが一時的に格納されるキャッシュメモリを備えた記憶制御装置との接続に用いられ、前記記憶制御装置からの応答とは非同期に、前記中央処理装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を前記記憶制御装置に対して発行するプロトコルを備えたI/Oインタフェースの制御方法であって、
前記記憶制御装置は、前記中央処理装置からのコマンドに関して前記コマンドの受領順に依存しない順序で前記中央処理装置とデータ転送を実行し前記コマンド毎にコマンド終了報告を行ない、
前記中央処理装置は、当該中央処理装置が発行したコマンド及びデータの発行順には依存しない順で、前記記憶制御装置からのデータ及びコマンド終了報告を受領し、前記受領したデータ及びコマンド終了報告に対応する発行済みコマンドを特定し、前記データ及びコマンド終了報告を前記特定したコマンドに対する応答フレームとして処理すること、
を特徴とするI/Oインタフェースの制御方法。 - 中央処理装置と、前記中央処理装置との間で授受されるデータが格納される複数の記憶装置を配下にもち、前記データが一時的に格納されるキャッシュメモリを備えた記憶制御装置との接続に用いられ、前記記憶制御装置からの応答とは非同期に、前記中央処理装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を前記記憶制御装置に対して発行するプロトコルを備えたI/Oインタフェースの制御方法であって、
前記記憶制御装置は、前記中央処理装置からのコマンドに関して前記コマンドの受領順に依存しない順序で、前記中央処理装置とデータ転送を実行し、
前記記憶制御装置は、前記中央処理装置から受領したコマンド及びデータのチェーンの途中でエラー及びリトライ要因が発生した場合、前記I/O要求を中断せずに継続して受領済みの他の実行可能な前記コマンド及びデータに関して前記中央処理装置とのデータ転送を実施し、前記I/O要求を構成する全コマンド処理分の終了状態を1つにまとめてI/O要求処理完了報告として前記中央処理装置へ報告し、
前記中央処理装置は、前記I/O要求処理完了報告を受領後、前記各コマンドの終了状態を認識し、エラーあるいはリトライ要求のあった前記各コマンドに対してのみリカバリ処理を実行すること、
を特徴とするI/Oインタフェースの制御方法。 - 請求項6記載のI/Oインタフェースの制御方法において、
前記中央処理装置は、当該中央処理装置が発行したコマンド及びデータの発行順には依存しない順で、前記記憶制御装置からデータ及びコマンド終了報告を受領する処理と、前記記憶制御装置から前記I/O要求を構成する全コマンド分に対するコマンド終了報告を受領するまで、前記I/O要求処理を中断せず継続して実行する処理と、前記I/O要求を構成する全コマンド分の前記コマンド終了報告を受領後、受領した前記コマンド終了報告の中でエラーあるいはリトライ要求があったコマンドに対してのみ、リカバリ処理を実行する処理と、を行うことを特徴とするI/Oインタフェースの制御方法。 - 中央処理装置と、前記中央処理装置との間で授受されるデータが格納される複数の記憶装置を配下にもち、前記データが一時的に格納されるキャッシュメモリを備えた記憶制御装置と、前記中央処理装置と前記記憶制御装置とを接続し、前記記憶制御装置からの応答とは非同期に、前記中央処理装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を前記記憶制御装置に対して発行するプロトコルを備えたI/Oインタフェースとを含む情報処理システムであって、
前記記憶制御装置は、前記中央処理装置からのコマンドに関して前記コマンドの受領順に依存しない順序で前記中央処理装置とデータ転送を実行し前記コマンド毎にコマンド終了報告を行なう手段を備え、
前記中央処理装置は、当該中央処理装置が発行したコマンド及びデータの発行順には依存しない順で、前記記憶制御装置からのデータ及びコマンド終了報告を受領し、前記受領したデータ及びコマンド終了報告に対応する発行済みコマンドを特定し、前記データ及びコマンド終了報告を前記特定したコマンドに対する応答フレームとして処理する手段を備えた、
ことを特徴とする情報処理システム。 - 中央処理装置と、前記中央処理装置との間で授受されるデータが格納される複数の記憶装置を配下にもち、前記データが一時的に格納されるキャッシュメモリを備えた記憶制御装置と、前記中央処理装置と前記記憶制御装置とを接続し、前記記憶 制御装置からの応答とは非同期に、前記中央処理装置が複数のコマンド及びデータのチェーンで構成されるI/O要求を前記記憶制御装置に対して発行するプロトコルを備えたI/Oインタフェースとを含む情報処理システムであって、
前記記憶制御装置は、前記中央処理装置からのコマンドに関して前記コマンドの受領順に依存しない順序で、前記中央処理装置とデータ転送を実行する手段を備え、
前記記憶制御装置は、前記中央処理装置から受領したコマンド及びデータのチェーンの途中でエラー及びリトライ要因が発生した場合、前記I/O要求を中断せずに継続して受領済みの他の実行可能な前記コマンド及びデータに関して前記中央処理装置とのデータ転送を実施し、前記I/O要求を構成する全コマンド処理分の終了状態を1つにまとめてI/O要求処理完了報告として前記中央処理装置へ報告する手段を備え、
前記中央処理装置は、前記I/O要求処理完了報告を受領後、前記各コマンドの終了状態を認識し、エラーあるいはリトライ要求のあった前記各コマンドに対してのみリカバリ処理を実行する手段を備えた、
ことを特徴とする情報処理システム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000332164A JP4068798B2 (ja) | 2000-10-31 | 2000-10-31 | 記憶サブシステム及びi/oインタフェースの制御方法ならびに情報処理システム |
US09/911,384 US6671767B2 (en) | 2000-10-31 | 2001-07-25 | Storage subsystem, information processing system and method of controlling I/O interface |
US10/618,619 US6944707B2 (en) | 2000-10-31 | 2003-07-15 | Storage subsystem, information processing system and method of controlling I/O interface |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000332164A JP4068798B2 (ja) | 2000-10-31 | 2000-10-31 | 記憶サブシステム及びi/oインタフェースの制御方法ならびに情報処理システム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002140233A JP2002140233A (ja) | 2002-05-17 |
JP2002140233A5 JP2002140233A5 (ja) | 2005-06-02 |
JP4068798B2 true JP4068798B2 (ja) | 2008-03-26 |
Family
ID=18808402
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000332164A Expired - Fee Related JP4068798B2 (ja) | 2000-10-31 | 2000-10-31 | 記憶サブシステム及びi/oインタフェースの制御方法ならびに情報処理システム |
Country Status (2)
Country | Link |
---|---|
US (2) | US6671767B2 (ja) |
JP (1) | JP4068798B2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6953392B2 (en) * | 2001-01-05 | 2005-10-11 | Asm Nutool, Inc. | Integrated system for processing semiconductor wafers |
US6754734B2 (en) * | 2001-12-18 | 2004-06-22 | International Business Machines Corporation | Systems, methods, and computer program products to improve performance of ported applications, such as a database |
US7113937B2 (en) * | 2001-12-18 | 2006-09-26 | International Business Machines Corporation | Systems, methods, and computer program products to improve performance of ported applications, such as a database, operating on UNIX system services for the OS/390 |
JP4080227B2 (ja) * | 2002-03-28 | 2008-04-23 | 株式会社日立製作所 | データ検証方法およびディスクアレイ装置 |
US7957401B2 (en) * | 2002-07-05 | 2011-06-07 | Geos Communications, Inc. | System and method for using multiple communication protocols in memory limited processors |
US7395337B2 (en) * | 2002-08-29 | 2008-07-01 | International Business Machines Corporation | Method, system, and program for establishing and requesting status on a computational resource |
US7346740B2 (en) * | 2002-11-01 | 2008-03-18 | Seagate Technology Llc | Transferring speculative data in lieu of requested data in a data transfer operation |
JP2005115600A (ja) | 2003-10-07 | 2005-04-28 | Hitachi Ltd | 情報処理装置及び方法 |
JP4405277B2 (ja) * | 2004-02-16 | 2010-01-27 | 株式会社日立製作所 | ディスク制御装置 |
JP4441286B2 (ja) * | 2004-02-10 | 2010-03-31 | 株式会社日立製作所 | ストレージシステム |
US7467238B2 (en) | 2004-02-10 | 2008-12-16 | Hitachi, Ltd. | Disk controller and storage system |
JP4528551B2 (ja) * | 2004-04-14 | 2010-08-18 | 株式会社日立製作所 | ストレージシステム |
US8054857B2 (en) * | 2004-10-07 | 2011-11-08 | Lsi Corporation | Task queuing methods and systems for transmitting frame information over an I/O interface |
JP2006277583A (ja) * | 2005-03-30 | 2006-10-12 | Hitachi Ltd | データ処理システム、データ処理方法、及びプログラム |
AT503473B1 (de) * | 2006-02-16 | 2013-07-15 | Salomon Automation Gmbh | Automatisiertes system und verfahren zum automatischen kommissionieren oder konsolidieren von artikeln |
US7500023B2 (en) * | 2006-10-10 | 2009-03-03 | International Business Machines Corporation | Facilitating input/output processing by using transport control words to reduce input/output communications |
JP4921142B2 (ja) * | 2006-12-12 | 2012-04-25 | キヤノン株式会社 | 通信装置 |
JP2009054083A (ja) * | 2007-08-29 | 2009-03-12 | Hitachi Ltd | プロセッサ、データ転送ユニット及びマルチコアプロセッサシステム |
US8566560B2 (en) * | 2008-02-01 | 2013-10-22 | Dell Products L.P. | System and method for configuring storage resources for database storage |
US9071624B2 (en) * | 2009-05-13 | 2015-06-30 | Dell Products L.P. | System and method for providing accessibility for access controller storage media |
US8825685B2 (en) * | 2009-11-16 | 2014-09-02 | Symantec Corporation | Selective file system caching based upon a configurable cache map |
JP5585773B2 (ja) * | 2010-09-06 | 2014-09-10 | 株式会社オリンピア | 遊技機 |
US8843676B2 (en) | 2012-06-27 | 2014-09-23 | International Business Machines Corporation | Optimizing an operating system I/O operation that pertains to a specific program and file |
US20150081967A1 (en) * | 2013-09-18 | 2015-03-19 | Hewlett-Packard Development Company, L.P. | Management of storage read requests |
US20170091138A1 (en) * | 2015-09-30 | 2017-03-30 | Mediatek Inc. | Circuit module capable of establishing one or more links with another device and associated method |
CN112363677B (zh) * | 2020-12-01 | 2023-03-31 | 浙江华忆芯科技有限公司 | 读请求的处理方法、装置和存储介质及电子装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05334012A (ja) * | 1992-05-28 | 1993-12-17 | Fujitsu Ltd | 大容量化ディスク制御装置 |
US5526484A (en) * | 1992-12-10 | 1996-06-11 | International Business Machines Corporation | Method and system for pipelining the processing of channel command words |
US5555389A (en) * | 1993-07-07 | 1996-09-10 | Hitachi, Ltd. | Storage controller for performing dump processing |
US5860022A (en) * | 1994-07-26 | 1999-01-12 | Hitachi, Ltd. | Computer system and method of issuing input/output commands therefrom |
US6105076A (en) * | 1999-04-23 | 2000-08-15 | International Business Machines Corporation | Method, system, and program for performing data transfer operations on user data |
US6349350B1 (en) * | 1999-05-04 | 2002-02-19 | International Business Machines Corporation | System, method, and program for handling failed connections in an input/output (I/O) system |
-
2000
- 2000-10-31 JP JP2000332164A patent/JP4068798B2/ja not_active Expired - Fee Related
-
2001
- 2001-07-25 US US09/911,384 patent/US6671767B2/en not_active Expired - Fee Related
-
2003
- 2003-07-15 US US10/618,619 patent/US6944707B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6944707B2 (en) | 2005-09-13 |
US6671767B2 (en) | 2003-12-30 |
US20020052985A1 (en) | 2002-05-02 |
JP2002140233A (ja) | 2002-05-17 |
US20040015654A1 (en) | 2004-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4068798B2 (ja) | 記憶サブシステム及びi/oインタフェースの制御方法ならびに情報処理システム | |
JP4175788B2 (ja) | ボリューム制御装置 | |
JP4183443B2 (ja) | データ再配置方法及び装置 | |
JP4903415B2 (ja) | 記憶制御システム及び記憶制御方法 | |
US7886114B2 (en) | Storage controller for cache slot management | |
US8312121B2 (en) | Storage system comprising function for alleviating performance bottleneck | |
US7401196B2 (en) | Storage system and storage control method for access exclusion control of each storage area unit comprising storage area of storage device | |
JP6955159B2 (ja) | ストレージシステム、ストレージ制御装置およびプログラム | |
US8380924B2 (en) | Storage system and processing efficiency improving method of storage system | |
JP2006309579A (ja) | 記憶制御装置及びストレージシステム | |
JP2005165852A (ja) | ストレージシステム、ストレージ制御装置、ストレージシステムの制御方法 | |
US8694698B2 (en) | Storage system and method for prioritizing data transfer access | |
US8713266B2 (en) | Storage apparatus and method including page discard processing for primary and secondary volumes configured as a copy pair | |
JP2003131908A (ja) | 記憶制御装置 | |
JP2002023958A (ja) | 計算機、計算機システムおよびデータ転送方法 | |
JP4369520B2 (ja) | ボリューム制御装置及び方法 | |
JP2006155640A (ja) | アクセスの設定方法 | |
JP2006031335A (ja) | 情報処理システム及び方法 | |
JP2005346426A (ja) | データ共有ディスク装置 | |
JP2010113727A (ja) | 制御方法及び記憶システム | |
JP2009151807A (ja) | 記憶装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040816 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040816 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20071010 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071023 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071206 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080111 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110118 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110118 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120118 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130118 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |