WO2017056219A1

WO2017056219A1 - ストレージ装置およびストレージ装置の制御方法

Info

Publication number: WO2017056219A1
Application number: PCT/JP2015/077693
Authority: WO
Inventors: 三雄伊達; 正法高田; 良介達見; 紀夫下薗
Original assignee: 株式会社日立製作所
Priority date: 2015-09-30
Filing date: 2015-09-30
Publication date: 2017-04-06

Abstract

ストレージ装置の応答性能を向上させることができる。　ストレージ装置は、第一メモリと、第一メモリ、第一デバイス、及び第二デバイスに接続される第一プロセッサと、を備える。第一プロセッサは、第一デバイスに格納されている第一データを、第二デバイスへ転送することを要求する第一転送要求を受領し、第一プロセッサは、第一転送要求に基づいて、第一データを第一デバイスから第一メモリへ転送する第一データ転送において、第一データの一部である第一部分データの転送の完了のタイミングを示す第一部分完了条件を決定し、第一プロセッサは、第一データ転送を開始させ、第一プロセッサは、第一部分完了条件に基づいて、第一データ転送の完了前に、第一データを第一メモリから第二デバイスへ転送する第二データ転送を開始させる。

Description

ストレージ装置およびストレージ装置の制御方法

　本発明は、ストレージ装置に関する。

　複数の磁気ディスク装置や半導体メモリデバイスなどの記憶メディアを備えたディスクアレイと、ディスクアレイへの読み書きを制御するストレージコントローラとを有する、いわゆるストレージ装置が知られている。このコントローラは、ホストコンピュータと接続するためのホストインターフェースや、記憶メディアと接続するためのドライブインターフェースを有する。

　また、コントローラ内にキャッシュメモリを持つことで読み書き性能を向上させたストレージ装置や、複数のコントローラを冗長接続することで可用性を向上させたストレージ装置が知られている。このようなストレージ装置において、あるコントローラに接続されたホストコンピュータから受領したデータを、別のコントローラ上のキャッシュメモリに複製し、記憶メディアへの格納前にホストに書き込み完了を通知する制御方法が知られている。これによって、ストレージ装置の高い可用性と高い書き込み性能を両立している。また、あるコントローラと接続されたホストコンピュータが、別のコントローラに接続された記憶メディアからデータを読み出す際に、記憶メディアが接続されたコントローラ上のキャッシュメモリにデータを一時的に格納し、コントローラ間接続を介してホストコンピュータが接続されたコントローラ上のキャッシュメモリにデータを転送し、その後ホストコンピュータにデータ転送する制御方法が知られている。

　一般に、各インターフェースを介したキャッシュメモリへの転送と、あるキャッシュメモリから別のキャッシュメモリへの転送は、ホストコンピュータからの要求データ長（転送長）毎に、逐次転送される。たとえば特許文献１では、ホストコンピュータが２５６ＫＢのデータの書き込みを要求する場合、２５６ＫＢのデータの全てがキャッシュメモリに格納された後に、ホストインターフェースが受領完了を通知し、通知を受けてから別のコントローラへ２５６ＫＢ転送を開始する方法が開示されている。この制御方法では、要求データ長が大きくなると、ホスト転送時間とコントローラ間転送時間の合算値に比例してストレージ装置の処理遅延が増加してしまう。

　また、特許文献２では、ホストインターフェースと、ホストインターフェースがデータを読み書きするメモリ１と、メモリ１とは異なるメモリ２と、メモリ１からメモリ２へのデータ転送を制御するＬＳＩとを含むストレージの制御部において、ＬＳＩがメモリ間の転送制御情報を予め保持し、なおかつＬＳＩがホストインターフェースからメモリ１への書き込み量を監視することで、ホストコンピュータからの要求データ長のデータがメモリ１に書き込まれる前に、メモリ２への転送を開始する制御方法が開示されている。

特開平９－１４６８４２号公報米国特許第６９８５９９４号明細書

　特許文献２のような技術では、専用ＬＳＩによる、メモリ及びバスの監視や、複数の転送要求の状態を管理するための処理負荷が大きい。一般に、ホストコンピュータや記憶メディアとストレージコントローラ間の通信では、通信要求の並列度を増やすことでスループットを高めるが、この技術では並列度増加に伴い監視処理負荷が増大してしまう。そのため、この技術では、並列動作数などに制限を設ける等の対策が必要になる。また、このような転送制御を、他の制御と共有するストレージコントローラ上の汎用ＣＰＵ（Central Processing Unit）やメモリで実施すると、他の制御の処理性能の低下に繋がる。

　上記課題を解決するために、本発明の一態様であるストレージ装置は、第一メモリと、前記第一メモリ、第一デバイス、及び第二デバイスに接続される第一プロセッサと、を備える。前記第一プロセッサは、前記第一デバイスに格納されている第一データを、前記第二デバイスへ転送することを要求する第一転送要求を受領し、前記第一プロセッサは、前記第一転送要求に基づいて、前記第一データを前記第一デバイスから前記第一メモリへ転送する第一データ転送において、前記第一データの一部である第一部分データの転送の完了のタイミングを示す第一部分完了条件を決定し、前記第一プロセッサは、前記第一データ転送を開始させ、前記第一プロセッサは、前記第一部分完了条件に基づいて、前記第一データ転送の完了前に、前記第一データを前記第一メモリから前記第二デバイスへ転送する第二データ転送を開始させる。

　ストレージ装置の応答性能を向上させることができる。

本発明の実施例のコンピュータシステムの構成を示す。メモリ４に格納されるデータの領域区分を示す一例である。ストレージ装置１におけるＷｒｉｔｅ要求受領時のデータ転送フローを示す。比較例のＷｒｉｔｅシーケンスを示す。実施例１のＷｒｉｔｅシーケンスを示す。実施例１のプロセッサ＃１のＷｒｉｔｅ処理を示す。実施例１のＷｒｉｔｅ要求に対する第一応答ケースを示す。実施例１のＷｒｉｔｅ要求に対する第二応答ケースを示す。部分完了通知間隔決定処理を示す。間隔設定テーブル１００１及び部分完了通知間隔設定用情報１００２を示す。ストレージ装置１におけるＲｅａｄ要求受領時のデータ転送フローを示す。比較例のＲｅａｄシーケンスを示す。実施例１のＲｅａｄシーケンスを示す。実施例１のプロセッサ＃２のＲｅａｄ処理を示す。実施例１のプロセッサ＃１のＲｅａｄ処理を示す。実施例２のＷｒｉｔｅシーケンスを示す。実施例２のＲｅａｄシーケンスを示す。実施例３のＷｒｉｔｅシーケンスを示す。実施例３のプロセッサ＃１のＷｒｉｔｅ処理を示す。実施例３のＲｅａｄシーケンスを示す。実施例４のＷｒｉｔｅシーケンスを示す。実施例４のプロセッサ＃１のＷｒｉｔｅ処理を示す。実施例４の投機転送パラメータとデータ転送状態管理テーブルの一例を示す。実施例４のＷｒｉｔｅ処理時のコントローラ＃１のノード間Ｉ／Ｆ２２３の投機転送処理を示す。実施例４のＲｅａｄシーケンスを示す。

　以下、図面を参照して本発明の実施形態を説明する。

　以下の説明では、「×××テーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「×××テーブル」を「×××情報」と呼ぶことができる。また、以下の説明において、各テーブルの構成は一例であり、１つのテーブルは、２以上のテーブルに分割されてもよいし、２以上のテーブルの全部又は一部が１つのテーブルであってもよい。

　また、以下の説明では、要素の識別情報として、ＩＤが使用されるが、それに代えて又は加えて他種の識別情報が使用されてもよい。

　また、以下の説明では、同種の要素を区別しないで説明する場合には、参照符号又は参照符号における共通番号を使用し、同種の要素を区別して説明する場合は、その要素の参照符号を使用又は参照符号に代えてその要素に割り振られたＩＤを使用することがある。

　また、以下の説明では、Ｉ／Ｏ（Input/Output）要求は、ライト要求又はリード要求であり、アクセス要求と呼ばれてもよい。

　また、以下の説明では、「プログラム」を主語として処理を説明する場合があるが、プログラムは、プロセッサ（例えばＣＰＵ（Central Processing Unit））によって実行されることで、定められた処理を、適宜に記憶資源（例えばメモリ）及び／又はインターフェースデバイス（例えば通信ポート）等を用いながら行うため、処理の主語がプロセッサとされてもよい。プログラムを主語として説明された処理は、プロセッサあるいはそのプロセッサを有する装置が行う処理又はシステムとしてもよい。また、プロセッサは、処理の一部または全部を行うハードウェア回路を含んでもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記憶メディアであってもよい。プログラムソースがプログラム配布サーバの場合、プログラム配布サーバはプロセッサ（例えばＣＰＵ）と記憶資源を含み、記憶資源はさらに配布プログラムと配布対象であるプログラムとを記憶してよい。そして、プログラム配布サーバのプロセッサが配布プログラムを実行することで、プログラム配布サーバのプロセッサは配布対象のプログラムを他の計算機に配布してよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

　また、以下の説明では、管理システムは、一以上の計算機を含んでいてもよい。具体的には、例えば、管理計算機が情報を表示する場合（具体的には、例えば、管理計算機が自分の表示デバイスに情報を表示する、或いは、管理計算機が表示用情報を遠隔の表示用計算機に送信する場合）、管理計算機が管理システムである。また、例えば、複数の計算機で管理計算機と同等の機能が実現されている場合は、当該複数の計算機（表示を表示用計算機が行う場合は表示用計算機を含んでよい）が、管理システムである。管理計算機（例えば管理システム）は、表示システムを含むＩ／Ｏシステムに接続されたインタフェースデバイスと、記憶資源（例えばメモリ）と、インタフェースデバイス及び記憶資源に接続されたプロセッサとを有してよい。表示システムは、管理計算機が有する表示デバイスでもよいし、管理計算機に接続された表示用計算機でもよい。Ｉ／Ｏシステムは、管理計算機が有するＩ／Ｏデバイス（例えばキーボード及びポインティングデバイス、タッチパネル）でもよいし、管理計算機に接続された表示用計算機又は別の計算機でもよい。管理計算機が「表示用情報を表示する」ことは、表示システムに表示用情報を表示することであり、これは、管理計算機が有する表示デバイスに表示用情報を表示することであってもよいし、管理計算機が表示用計算機に表示用情報を送信することであってもよい（後者の場合は表示用計算機によって表示用情報が表示される）。また、管理計算機が情報を入出力するとは、管理計算機が有するＩ／Ｏデバイスとの間で情報の入出力を行うことであってもよいし、管理計算機に接続された遠隔の計算機（例えば表示用計算機）との間で情報の入出力を行うことであってもよい。情報の出力は、情報の表示であってもよい。

　以下、添付図面を参照して本発明の実施形態を説明する。ただし、本実施形態は本発明を実現するための一例に過ぎず、本発明の技術的範囲を限定するものではないことに注意すべきである。また、各図において共通の構成については同一の参照番号が付されている。

　実施例１は、ストレージ装置においてＩ／Ｏの応答性能向上のために、ホストインターフェースやドライブインターフェースがメモリへのデータ転送の部分完了を通知し、その通知に基づいて異なるメモリへの転送を開始する制御方法の一実施形態である。実施例１では、インターフェースに記憶されるデータ転送状態に関する管理情報を用いることで、プロセッサやメモリへの追加の負荷を抑えつつ、応答性能向上を実現する。以下、図面を用いて本実施例の詳細を説明する。
＜装置の説明＞

　図１は、本発明の実施例のコンピュータシステムの構成を示す。

　コンピュータシステムは、主にデータ演算を行うホストコンピュータ１００と、データを格納するストレージ装置１とを含む。ストレージ装置１は、複数台のストレージノード２を含む。複数台のストレージノード２は、ストレージ装置１の内部ネットワーク３を介して接続されている。各ストレージノード２は、データを格納するドライブ筐体２１と、ホストコンピュータ１００や他のストレージノード２と通信をしながらドライブ筐体２１を制御するコントローラ２２とを含む。尚、ホストコンピュータ１００、ストレージノード２、ドライブ筐体２１、コントローラ２２のそれぞれの数は、１台であっても複数台あってもよい。例えばストレージ装置１は一つのストレージノード２を含み、ストレージノード２は、１台のコントローラ２２と複数台のドライブ筐体２１とを含んでいても良い。

　ドライブ筐体２１は、ハードディスクドライブ（ＨＤＤ）や、フラッシュメモリ等の不揮発メモリを搭載したソリッドステートドライブ（ＳＳＤ）などの複数の記憶メディア２１１を有する。

　コントローラ２２は、ホストコンピュータ１００との通信を行うホストインターフェース（以下、ホストＩ／Ｆ）２２１、ドライブ筐体２１と通信を行うドライブインターフェース（以下、ドライブＩ／Ｆ）２２２、他のストレージノード２と通信を行うノード間インターフェース（以下、ノード間Ｉ／Ｆ）２２３、それらの制御やデータ転送を中継するプロセッサ２２４、ホストコンピュータ１００によって生成されるデータやストレージ装置内部で制御用に生成される各種データを蓄えるメモリ４を有する。これらの各部は、コントローラ２２内に複数台あっても良い。

　ホストＩ／Ｆ２２１は、Fibre Channel（ＦＣ）、Fibre Channel Over Ethernet（登録商標）　（ＦＣｏＥ）、Internet SCSI（ｉＳＣＳＩ）等、ホストコンピュータ１００とコントローラ２２の間の通信に用いられるプロトコルデータを、コントローラ２２内部で用いられるPCI-Express等のプロトコルに変換する機能を有する。同様にドライブＩ／Ｆ２２２は、ＦＣやSerial Attached SCSI（ＳＡＳ）等、記憶メディア２１１とコントローラ２２の間の通信に用いられるプロトコルデータを、コントローラ２２内部で用いられるPCI-Express等のプロトコルに変換する機能を有する。また同様に、ノード間Ｉ／Ｆ２２３は、イーサネット（登録商標）やInfiniBand等、ストレージノード２間の通信に用いられるプロトコルデータを、コントローラ２２内部で用いられるPCI-Express等のプロトコルに変換する機能を有する。これらのＩ／Ｆは、ＬＳＩ（Large Scale Integration）であってもよいし、メモリ４に格納されるソフトウェアであってプロセッサ２２４により実行されてもよい。

　プロセッサ２２４は、各Ｉ／Ｆ及びメモリ４の間のデータ転送を行うためのデータバスや、ソフトウェアを動作させるための演算回路等を有する。この例ではデータバス機能と演算機能を有するプロセッサ２２４を例示しているが、プロセッサ２２４は、ＬＳＩであってもよい。

　メモリ４は、ＤＲＡＭ等の高速アクセス可能な記憶素子であり、プロセッサ２２４とＤＤＲ３やＤＤＲ４などのメモリインターフェースで接続される。コントローラ２２内のメモリ４は、複数のメモリモジュールを含んでいても良い。メモリ４上には、各Ｉ／Ｆやプロセッサ２２４が利用するデータを保持する。

　図２は、メモリ４に格納されるデータの領域区分を示す一例である。

　メモリ４は、ホストコンピュータ１００から受信したユーザデータを格納するユーザデータ領域４１と、ストレージ装置内の制御データを格納する制御データ領域４２とを有する。ユーザデータ領域４１は、ホストＩ／Ｆ２２１やドライブＩ／Ｆ２２２とコントローラの間でデータをやりとりするために用いる一時的な領域を転送バッファ領域４４と、頻繁に読み書きされるデータを高速にアクセスできるようにするために用いられるユーザデータキャッシュ領域４３とを備える。ユーザデータキャッシュ領域４３をキャッシュ領域４３と呼ぶことがある。なお、転送バッファ領域４４の代わりにキャッシュ領域４３が用いられてもよいし、キャッシュ領域４３の代わりに転送バッファ領域４４が用いられてもよい。

　本実施例では、プロセッサ２２４とホストＩ／Ｆ２２１とドライブＩ／Ｆ２２２とノード間Ｉ／Ｆ２２３がメモリ４を共用する。ホストＩ／Ｆ２２１は、ホストＩ／Ｆ２２１とホストコンピュータ１００の間で転送されるデータを格納する、転送バッファ領域４４やキャッシュ領域４３を個別に持つ必要がない。ホストＩ／Ｆ２２１は、ホストコンピュータ１００からのデータをメモリ４内の転送バッファ領域４４へ転送し、メモリ４内の転送バッファ領域４４に格納されたデータをホストコンピュータ１００へ転送する。同様に、ドライブＩ／Ｆ２２２は、ドライブＩ／Ｆ２２２と記憶メディア２１１の間で転送されるデータを格納する、転送バッファ領域４４やキャッシュ領域４３を個別に持つ必要がない。ドライブＩ／Ｆ２２２は、記憶メディア２１１からのデータをメモリ４内の転送バッファ領域４４へ転送し、メモリ４内の転送バッファ領域４４に格納されたデータを記憶メディア２１１へ転送する。同様に、ノード間Ｉ／Ｆ２２３は、二つのコントローラ２２の間で転送されるデータを格納する、転送バッファ領域４４やキャッシュ領域４３を個別に持つ必要がない。ノード間Ｉ／Ｆ２２３は、ローカルのコントローラ２２のメモリ４に格納されたデータを、他のコントローラ２２のメモリ４へ転送する。これにより、ホストＩ／Ｆ２２１、ドライブＩ／Ｆ２２２、ノード間Ｉ／Ｆ２２３のそれぞれに含まれるメモリの容量を抑えることができる。
＜Ｗｒｉｔｅ処理＞

　図３は、ストレージ装置１におけるＷｒｉｔｅ要求受領時のデータ転送フローを示す。

　ここでは、ストレージ装置１における３台のコントローラ２２を夫々、コントローラ＃１、＃２、＃３と呼ぶ。コントローラ＃１、＃２、＃３内のプロセッサ２２４をそれぞれ、プロセッサ＃１、＃２、＃３と呼ぶ。

　ホストコンピュータ１００が接続されたコントローラ＃１のホストＩ／Ｆ２２１がホストコンピュータ１００から受領したデータは、コントローラ＃１のメモリ４の転送バッファ領域４４に格納される（４００７）。その後、コントローラ＃１は、受領したデータを、異なるコントローラ＃２、＃３上の２か所のキャッシュ領域４３ａ、４３ｂに転送する（４００９）。その後、コントローラ＃１は、記憶メディア２１１に対してデータを書き込む前に、ホストコンピュータ１００に対してデータの受領完了を通知することで、記憶メディア２１１の書き込み速度とは独立した応答性能を実現できる。その際、単一のコントローラ２２に発生した障害によって、ホストコンピュータ１００から受領したデータを失わないように、２か所のコントローラ上のメモリにデータをコピーしている（４００９）。この例では、転送バッファ領域４４とキャッシュ領域４３ａ、４３ｂが、互いに異なるコントローラ＃１、＃２、＃３上に確保される例を示しているが、キャッシュ領域４３ａ、４３ｂの内の一方は、転送バッファ領域４４と同一コントローラ＃１上のメモリ４に確保されていても良い。また、この例では、全てのコントローラ＃１、＃２、＃３が内部ネットワーク３を跨り、異なるストレージノード２内に存在するケースを示しているが、これらは同一のストレージノード２内に存在しても良い。

　プロセッサ２２４が、プロセッサコアとＤＭＡ（Direct Memory Access）コントローラを有していてもよい。プロセッサコアがＤＭＡコントローラに指示することにより、ＤＭＡコントローラは、メモリ４と他のコントローラ内のメモリ４の間のＤＭＡ転送を実行してもよい。また、ホストＩ／Ｆ２２１がＤＭＡコントローラを有していてもよい。この場合、このＤＭＡコントローラは、プロセッサ２２４からの指示に応じて、ホストコンピュータ１００と転送バッファ領域４４の間のＤＭＡ転送を実行する。また、ノード間Ｉ／Ｆ２２３がＤＭＡコントローラを有していてもよい。この場合、このＤＭＡコントローラは、プロセッサ２２４からの指示に応じて、コントローラ＃１のメモリ４と他のコントローラ２２のメモリ４の間のＤＭＡ転送を実行する。これにより、データ転送時のプロセッサ２２４（プロセッサコア）の負荷を抑えることができる。
＜比較例のＷｒｉｔｅシーケンス＞

　ここで、比較例のストレージ装置が部分完了の通知を用いない場合の動作を説明する。

　図４は、比較例のＷｒｉｔｅシーケンスを示す。

　この図は、比較例のストレージ装置が、ホストコンピュータ１００からＷｒｉｔｅ要求（Ｗｒｉｔｅコマンド）を受領してから、ホストコンピュータ１００にＷｒｉｔｅデータ受領完了を通知するまでの通信シーケンスの一例を示す。この図では、キャッシュ領域４３を格納する２つのコントローラ＃２、＃３は等価であるため、一方を代表して示している。図中では、コントローラ＃１をＣＬ１と呼び、コントローラ＃２をＣＬ２と呼ぶ。また、図中では、ノード間Ｉ／Ｆ２２３を省略している。この図では、プロセッサ＃１の動作に、コントローラ＃１のメモリ４の動作も示されている。また、プロセッサ＃２の動作に、コントローラ＃２のメモリ４の動作も示されている。この例では、２５６ＫＢの書き込み要求を受領した場合を例示する。

　まず、コントローラ＃１において、ホストＩ／Ｆ２２１は、ホストコンピュータ１００から受領したＷｒｉｔｅ要求（４００１）をメモリ４上に書き込み、プロセッサ＃１に新規要求の受領を通知する（４００２）。この通知を受けたプロセッサ＃１は、要求を解析し、データを受け取る転送バッファ領域４４と、転送先のキャッシュ領域４３を含むコントローラ＃２とを決定する。なお、転送バッファ領域４４は予めプロセッサ＃１により確保され管理されていてもよいし、キャッシュ領域４３は予めプロセッサ＃２により確保され管理されていてもよい。その後、プロセッサ＃１は、他のコントローラ＃２にキャッシュ領域４３の確保を依頼する（４００３）。この依頼に基づいて、プロセッサ＃２は、メモリ４上のキャッシュ領域４３を確保し、その完了を通知する（４００４）。この例では、Ｗｒｉｔｅ要求受領後に、コントローラ＃１がコントローラ＃２にキャッシュ領域確保を依頼する例を示しているが、コントローラ＃１がコントローラ＃２のメモリ４内の利用可能な領域を予め把握しておいても良いし、ＸＦＥＲ＿ＲＤＹ（データ転送要求）送信（４００５）後に依頼しても良い。プロセッサ＃１は、Ｗｒｉｔｅデータの受領準備が完了したら、ホストＩ／Ｆ２２１を介して、ホストコンピュータ１００にＸＦＥＲ＿ＲＤＹを通知する（４００５、４００６）。

　このとき、プロセッサ＃１は、Ｗｒｉｔｅ要求（４００２）で指定された要求データ長（ここでは２５６ＫＢ）以下であれば、任意のデータ長の受領準備完了を複数回に分割して通知することができる。ただし、そのようなＸＦＥＲ＿ＲＤＹ（４００５）の分割は、ホストコンピュータ１００とホストＩ／Ｆ２２１間の通信量増加を意味する為、データ転送効率低下に繋がる。またホストコンピュータ１００内のデータ転送に関しても、一般に、同一のＸＦＥＲ＿ＲＤＹに対応する連続データを転送することは、異なるＸＦＥＲ＿ＲＤＹへの処理を切り替えながら非連続なデータを転送することよりも、転送効率が高い。そのため、ストレージ装置１は、ホストコンピュータ１００から受領したＷｒｉｔｅ要求に対して、要求データ長を示すＸＦＥＲ＿ＲＤＹを一回で通知することが一般的である。この例でも、プロセッサ＃１は、要求データ長と同量（２５６ＫＢ）を示すＸＦＥＲ＿ＲＤＹを発行する（４００５）。

　ＸＦＥＲ＿ＲＤＹを受領したホストコンピュータ１００は、予め準備していたＷｒｉｔｅデータをストレージ装置１に転送を開始する（４００７）。これを受領したホストＩ／Ｆ２２１は、ホストコンピュータ１００からのデータのプロトコル変換及びアドレス変換を行い、転送バッファ領域４４にデータを格納する（４００８）。ホストＩ／Ｆ２２１は、ＸＦＥＲ＿ＲＤＹ（４００５）によって指定された全データ（ここでは２５６ＫＢ）の転送バッファ領域４４への書き込みを完了したら、プロセッサ＃１にデータ受領完了を通知する（４００９）。データ受領完了通知を受けたプロセッサ＃１は、コントローラ＃２上のキャッシュ領域４３にデータ転送を開始する（４０１０）。プロセッサ＃１は、データ転送（４０１０）の完了を、プロセッサ２２４間のメッセージによって通知する（４０１１）。また、プロセッサ＃１がノード間Ｉ／Ｆ２２３にコントローラ間転送（４０１０）を指示する場合、ホストＩ／Ｆ２２１によるデータ受領完了通知（４００９）と同様に、ノード間Ｉ／Ｆ２２３がコントローラ間転送の完了をプロセッサ＃２に通知しても良い。全データの受領を完了したプロセッサ＃２は、受領完了をプロセッサ＃１に通知する（４０１２）。本通信もノード間Ｉ／Ｆ２２３の仕組みによって通知しても良い。コントローラ＃１は、コントローラ＃２、＃３の２か所のキャッシュ領域４３への２重書きが完了したら、ホストＩ／Ｆ２２１を介してホストコンピュータ１００に、Ｗｒｉｔｅデータ受領完了ステータス（Ｇｏｏｄ）を返信する（４０１３、４０１４）。ホストコンピュータ１００は、本ステータス受信を持って、Ｗｒｉｔｅ　要求の完了と判断する。すなわち、Ｗｒｉｔｅ要求発行（４００１）から、完了ステータス受信（４０１４）までの経過時間がホストコンピュータ１００から見たストレージ装置１のＷｒｉｔｅ応答時間となる。

　比較例の通信シーケンスでは、ホストＩ／Ｆ２２１から転送バッファ領域４４へのデータ転送（４００８）と、コントローラ＃１、＃２間のデータ転送（４０１０）が２５６ＫＢ単位で逐次実行される。そのため、ホストコンピュータ１００からの要求データ長が増加すると、二つの転送（４００８、４０１０）に係る転送時間の合計値に比例して、Ｗｒｉｔｅ応答時間が増加する。
＜実施例１のＷｒｉｔｅシーケンス＞

　図５は、実施例１のＷｒｉｔｅシーケンスを示す。

　ホストコンピュータ１００がデータ転送を開始する（５００７）までの処理は、比較例のＷｒｉｔｅシーケンスと同一である。本実施例では、ホストＩ／Ｆ２２１がホストコンピュータ１００から全データを受領完了する前に、一部のデータ受領完了（部分完了）を通知する（５００９）仕組みを有し、その通知に基づいてプロセッサ＃１がコントローラ間転送を開始する（５０１０）。この例において、ホストＩ／Ｆ２２１はＸＦＥＲ＿ＲＤＹで指定した要求データ長（２５６ＫＢ）とは無関係に、６４ＫＢのデータを転送バッファ領域４４へ書き込む毎に、それをプロセッサ＃１に通知する（５００９）例を示している。ホストＩ／Ｆ２２１は、転送したデータ長を管理しているため、プロセッサ＃１から指定されたデータ長の転送が完了したことを検出でき、プロセッサ＃１に通知することができる。この通知を受けたプロセッサ＃１は、転送準備の出来ている６４ＫＢ分だけ、コントローラ＃２に転送し（５０１０）、データ転送の完了を、プロセッサ２２４間のメッセージによって通知する（５０１１）。コントローラ＃１の転送バッファ領域４４からコントローラ＃２のキャッシュ領域４３へのデータ転送は、プロセッサ＃１内のＤＭＡコントローラによって実行されてもよいし、プロセッサ＃１内のプロセッサコアによって実行されてもよいし、プロセッサ＃１からの指示に応じてコントローラ＃１のノード間Ｉ／Ｆ２２３によって実行されてもよい。

　プロセッサ＃２は、メモリ確保（５００３）で指定された要求データ長（２５６ＫＢ）の受領が完了すると、プロセッサ２２４間のメッセージによって、完了通知をプロセッサ＃１へ通知する（５０１２）。プロセッサ＃１がＷｒｉｔｅデータの一部のデータ受領完了通知（部分完了通知）に応じてコントローラ間転送を開始することにより、ホストＩ／Ｆ２２１から転送バッファ領域４４へのデータ転送（５００８）と、コントローラ＃１、＃２間のデータ転送（５０１０）が並列処理（パイプライン転送）されるようになるため、ストレージ装置１がＷｒｉｔｅデータ受領完了ステータス（５０１３、５０１４）を早期に送信できるようになる。これにより、Ｗｒｉｔｅ応答時間を短縮できる。ただし、その短縮量は、部分完了が通知される間隔や、ホストＩ／Ｆ２２１と転送バッファ領域４４の間の通信帯域や、コントローラ間の通信帯域等によって変化する。短縮量を最大化するためには、これらの条件に応じて、部分完了通知（５００９）に対する制御を切り替える必要がある。

　なお、Ｗｒｉｔｅ要求の対象アドレスが、コントローラ＃１に接続された記憶メディア２１１に関連付けられていてもよい。この場合、プロセッサ＃１は、５０１０の代わりに、コントローラ＃１のドライブＩ／Ｆ２２２へＷｒｉｔｅ要求を発行することで、ドライブＩ／Ｆ２２２に転送バッファ領域４４から記憶メディア２１１へのデータ転送を実行させてもよい。

　図６は、実施例１のプロセッサ＃１のＷｒｉｔｅ処理を示す。

　この図は、実施例１における、Ｗｒｉｔｅ時の、プロセッサ＃１の制御フローの一例を示す。ここでは、ホストＩ／Ｆ２２１が接続されたコントローラ＃１上のプロセッサ＃１によって、ホストＩ／Ｆ２２１の部分完了通知（５００９）間隔を示す部分データ長が決定される例を示しているが、ホストＩ／Ｆ２２１が自律的に部分完了通知間隔を決定しても良いし、プロセッサ＃２が部分完了通知間隔を決定しても良い。まず、Ｗｒｉｔｅ要求を受領（Ｓ６０１）したプロセッサ＃１は、コントローラ＃２にキャッシュ領域確保を依頼する（Ｓ６０２）。これに対する応答を待っている間に、ホストＩ／Ｆ２２１が部分完了通知機能を利用可能か確認する（Ｓ６０３）。もし、ホストＩ／Ｆ２２１が部分完了通知機能を使えないならば、プロセッサ＃１は、比較例と同様に、他コントローラからのキャッシュ領域確保完了通知を待ち（Ｓ６０５ｂ）、ホストコンピュータ１００にはＷｒｉｔｅ要求で指定された要求データ長と同量を示すＸＦＥＲ＿ＲＤＹを、ホストＩ／Ｆ２２１を介して送信する（Ｓ６０６ｂ）。もし、ホストＩ／Ｆ２２１が部分完了通知機能を有しているならば、プロセッサ＃１は、その部分完了通知間隔を算出する部分完了通知間隔決定処理を実行する（Ｓ６０４）。この部分完了通知間隔決定処理については後述する。その後、プロセッサ＃１は、他コントローラ（他ＣＬ）からのキャッシュ領域確保完了通知を待ち（Ｓ６０５ａ）、ホストコンピュータ１００にはＷｒｉｔｅ要求で指定された要求データ長と同量を示すＸＦＥＲ＿ＲＤＹを、ホストＩ／Ｆ２２１を介して送信する（Ｓ６０６ａ）。このときのＸＦＥＲ＿ＲＤＹは、部分完了通知間隔を示す部分完了付きＸＦＥＲ＿ＲＤＹである。

　Ｓ６０６ａ又はＳ６０６ｂのＸＦＥＲ＿ＲＤＹ送信後、プロセッサ＃１は、ホストＩ／Ｆ２２１によるデータ受領完了通知を待ち（Ｓ６０７）、データ受領完了通知に応じて、受領したデータ分を他コントローラに転送（ＣＬ間転送）開始する（Ｓ６０８）。Ｗｒｉｔｅ要求に示された要求データ長に対して、まだ転送を開始していないデータが残っている場合（Ｓ６０９）、プロセッサ＃１は、再びホストＩ／Ｆ２２１からのデータ受領完了通知を待つ（Ｓ６０７）。プロセッサ＃１は、Ｗｒｉｔｅデータの全データ転送が完了するまで（Ｓ６０７～Ｓ６０９）を繰り返し、全データ転送を完了したら、他コントローラからの受領完了通知を待ち（Ｓ６１０）、ホストコンピュータ１００にＷｒｉｔｅ要求に対する完了ステータス（Good Status）を返答する（Ｓ６１１）。
＜通知間隔と効果＞

　以下、本実施例の効果の尺度の例について説明する。

　図７は、実施例１のＷｒｉｔｅ要求に対する第一応答ケースを示す。

　第一応答ケースを用いて、部分完了通知の効果と部分完了通知頻度の関係について説明する。この図は、ホストＩ／Ｆ２２１と転送バッファ領域４４の間の転送帯域Ｈ　ＧＢ／ｓ（７０１）が、コントローラ間の転送帯域Ｘ　ＧＢ／ｓ（７０２）より小さい場合を示す。また、ホストＩ／Ｆ２２１と転送バッファ領域４４の間の転送帯域Ｈ　ＧＢ／ｓ（７０１）が、ホストコンピュータ１００とホストＩ／Ｆ２２１間の転送帯域より大きい場合、転送帯域Ｈの実効帯域は、ホストコンピュータ１００とホストＩ／Ｆ２２１間の転送帯域となる。

　本実施例は、ホストＩ／Ｆ２２１と転送バッファ領域４４の間のデータ転送（５００８）と、コントローラ間のデータ転送（５０１０）の逐次転送を解消することにより、応答時間を短縮する。つまり、ホストＩ／Ｆ２２１による転送開始からコントローラ間転送完了までの総処理時間Ｔ_ＡＬＬ（７０５）を最小化するような、部分完了通知間隔Ｎ　ＫＢを選ぶことで、本実施例の効果を最大化できる。基本的には、二つの逐次転送（５００８、５０１０）が、同時処理される時間が増える程、応答時間短縮の効果を得られる。また、部分完了通知間隔Ｎを小さくする程、同時処理可能な転送粒度が細かくなる。ただし、部分完了通知頻度を高めると、ホストＩ／Ｆ２２１と転送バッファ領域４４の間の通知通信（５００９）が増加し、更にプロセッサ＃１が部分完了通知を検出（５００９）してコントローラ間転送（５０１０）を開始するためのプロセッサ処理負荷も増大してしまう。従って、これらの部分完了通知に関する処理オーバーヘッドＴ_ＯＨ（７０３）より、逐次転送の解消による効果が大きいときにのみ、部分完了通知頻度を高める効果が得られる。この例では、Ｔ_ＡＬＬ（７０５）は、ホストＩ／Ｆ２２１と転送バッファ領域４４の間の転送が全て完了して、最後の完了通知（５００９）を転送完了するまでの時間Ｔ_Ｈ（７０４）と、コントローラ間で最後のＮ　ＫＢ（もしくはＮ　ＫＢより小さい）を転送するために要する転送時間Ｔ_ＮＸ（７０５）との和に等しい。すなわち、Ｗｒｉｔｅ要求で要求される要求データ長（総転送サイズ）をＷ　ＫＢとしたとき、Ｔ_ＡＬＬ（Ｎ）は以下の等式で近似できる。

　Ｔ_ＡＬＬ（Ｎ）　＝　Ｔ_Ｈ　＋　Ｔ_ＮＸ　＝　Ｔ_ＯＨ　＊　Ｗ／Ｎ　＋　Ｗ／Ｈ　＋　Ｎ／Ｘ

　Ｔ_ＡＬＬ（Ｎ）　＝　０　を解くと、Ｔ_ＡＬＬを最小化するＮは、（Ｘ＊Ｗ＊Ｔ_ＯＨ）＾１／２である。これにより、本実施例の効果を最大化する部分完了通知間隔Ｎを求めることができる。

　図８は、実施例１のＷｒｉｔｅ要求に対する第二応答ケースを示す。

　第二応答ケースを用いて、部分完了通知の効果と部分完了通知頻度の関係について説明する。第二応答ケースは、第一応答ケースと異なり、ホストＩ／Ｆ２２１と転送バッファ領域４４の間の転送帯域Ｈ　ＧＢ／ｓ（８０１）が、コントローラ間の転送帯域Ｘ　ＧＢ／ｓ（８０２）より大きい場合を示す。ここで、プロセッサ＃１がコントローラ間転送（５０１０）を開始するときに、複数の部分完了通知（５００９）を受信済みである場合、転送バッファ領域４４上の全データをコントローラ間転送（５０１０）可能であるとする。そのための追加処理オーバーヘッドは、十分に小さいものとする。このとき、ホストＩ／Ｆ２２１から転送バッファ領域４４にＮ　ＫＢを転送するために必要な時間Ｔ_ＮＨ（８０３）と部分完了通知に伴う処理オーバーヘッドＴ_ＯＨ（８０４）の和が、コントローラ間でＮ　ＫＢ転送するために必要な時間Ｔ_ＮＸ（８０５）より大きいときのＴ_ＡＬＬ（Ｎ）は、第一応答ケースと同様、次式で表され、これを最小化するＮは前述の通りである。

　Ｔ_ＡＬＬ（Ｎ）　＝　Ｔ_Ｈ　＋　Ｔ_ＮＸ＝Ｔ_ＯＨ＊Ｗ／Ｎ　＋　Ｗ／Ｈ　＋　Ｎ／Ｘ

　Ｔ_ＮＨ（８０３）とＴ_ＯＨ（８０４）の和が、Ｔ_ＮＸ（８０５）より小さいとき、コントローラ間の転送（５０１０）開始以後は、コントローラ間の転送遅延が総処理遅延Ｔ_ＡＬＬ（８０７）を決定するため、Ｔ_ＡＬＬ（Ｎ）は次式で表される。

　Ｔ_ＡＬＬ（Ｎ）　＝　Ｔ_ＮＨ　＋　Ｔ_ＯＨ　＋　Ｔ_ＷＸ　＝　Ｎ／Ｈ　＋　Ｔ_ＯＨ　＋　Ｗ／Ｘ

　Ｔ_ＡＬＬ（Ｎ）（８０７）は、Ｎに対して線形増加するため、Ｔ_ＮＨ（８０３）とＴ_ＯＨ（８０４）の和がＴ_ＮＸ（８０５）と等しいときに最小値を示す。従って、Ｔ_ＮＨ　＋　Ｔ_ＯＨ　＝　Ｔ_ＮＸは、Ｎ／Ｈ　＋　Ｔ_ＯＨ　＝　Ｎ／Ｘであるから、Ｎ　＝　Ｔ_ＯＨ＊（Ｈ－Ｘ）／（ＨＸ）で本実施例の効果を最大化できる。

　以上に示した部分完了通知間隔Ｎは、本実施例の効果を高める目安量の一例であるが、実効的な各部の帯域Ｈ（７０１、８０１）、Ｘ（７０２、８０１）や、部分完了に関する処理オーバーヘッドＴ_ＯＨは動的に変化するため、静的な最適解とはならないことがある。各変数の動的な変化を考慮した設定や、異なる近似モデルによって算出した値を部分完了通知間隔Ｎとして使っても良い。

　図９は、部分完了通知間隔決定処理を示す。

　第一応答ケース及び第一応答ケースを用いて説明したように、応答性能向上に繋がる部分完了通知間隔を、Ｗｒｉｔｅ要求の要求データ長と、ホストＩ／Ｆ２２１と転送バッファ領域４４の転送帯域と、コントローラ間の転送帯域と、部分完了を通知することに依る処理オーバーヘッドによって概算することができる。

　ここでは、プロセッサ＃１が、動的に通知間隔を決めるモードと静的に決めるモードの両方を用意し、それらを切り替えるケースを例示している（Ｓ６０４１）。ここで、静的モードに用いられる間隔設定テーブル１００１と、動的モードに用いられる部分完了通知間隔設定用情報１００２とについて説明する。

　図１０は、間隔設定テーブル１００１及び部分完了通知間隔設定用情報１００２を示す。

　間隔設定テーブル１００１は、上記概算値などから予め作成され、メモリ４の制御データ領域４２に格納される。間隔設定テーブル１００１は、要求データ長（Ｗｒｉｔｅリクエストサイズ）毎に、部分完了通知間隔を示す。

　部分完了通知間隔設定用情報１００２は、プロセッサ＃１により測定された、ＣＰＵ稼働率、コマンド処理数、内部バス実行帯域、通知間隔設定履歴、応答時間履歴を示す。ＣＰＵ稼働率は、プロセッサ＃１の稼働率を示す。コマンド処理数は、現在処理中のＩ／Ｏ要求数を示す。内部バス実行帯域は、コントローラ＃１内のバスの実行帯域を示す。通知間隔設定履歴は、一定の時間の過去に設定された部分完了通知間隔を示す。応答時間履歴は、通知間隔設定履歴内の各部分完了通知間隔が設定されたときの応答時間を示す。応答時間は、ホストコンピュータ１００からのＩ／Ｏ要求からホストコンピュータ１００への応答までの時間である。

　予め静的モードに設定されている場合、プロセッサ＃１は、間隔設定テーブル１００１を参照することで、要求データ長に対応する部分完了通知間隔を決定する（Ｓ６０４７）。

　予め動的モードに設定されている場合、プロセッサ＃１は、部分完了通知機能が有効であるか否かを判定する。この例において、プロセッサ＃１は、処理するプロセッサ＃１の負荷状況（Ｓ６０４２）や内部バスの混雑状況（Ｓ６０４３）を採取し、採取された情報に基づいて、部分完了通知機能を使うか否かを判断する。プロセッサ＃１の負荷状況は例えば、部分完了通知間隔設定用情報１００２におけるＣＰＵ稼働率、コマンド処理数である。内部バスの混雑状況は例えば、部分完了通知間隔設定用情報１００２における内部バス実行帯域である。

　プロセッサ負荷が高いということは、多数のＩ／Ｏ要求や制御処理を並行して処理していることを意味する為、このような条件下では特定Ｉ／Ｏ要求の応答性能よりも、時間当たりのＩ／Ｏ要求処理数（スループット）が重要となることがある。そのような場合に、プロセッサ＃１が高頻度な部分通知を処理すると、プロセッサ＃１の総処理負荷の増加を招き、スループット低下に繋がってしまう。更に、Ｉ／Ｏ毎のプロセッサ処理時間を均等に分配するならば、処理するＩ／Ｏ数が増える程、特定Ｉ／Ｏの処理に使える時間が少なくなり、高頻度な部分完了通知を行ってもプロセッサ＃１がそれを検出するまでの時間が長くなる（実質的なＴ_ＯＨが増大する）ため、Ｉ／Ｏの応答時間も却って長くなってしまう。内部バスの混雑度に関しても同様で、バスが混雑しているときに転送を分割すると、バスの総処理負荷増大によるスループット低下や、応答時間の増大に繋がってしまう。また、Ｉ／Ｏ長が短く、プロセッサ＃１による処理遅延が応答時間の支配的要因であるときも同様で、部分完了通知によるプロセッサ処理負荷増大は応答時間増大に繋がってしまう。本実施例のプロセッサ＃１は、これらを考慮し、応答時間の短縮効果があると判定された場合（Ｓ６０４４：Ｙ）だけ、部分完了通知機能を用い（Ｓ６０４５）、スループットを重視するとき（Ｓ６０４４：Ｎ）、部分完了通知機能を用いない（Ｓ６０４６）。部分完了通知機能を用いると判定された場合、プロセッサ＃１は、通知間隔設定履歴と応答時間履歴に基づいて、効果があった部分完了通知間隔を決定する（Ｓ６０４５）。これにより、適切な部分完了通知間隔を決定することができる。また、この例において、プロセッサ＃１は、複数の判断基準を用いているが、これらの判断基準の内の任意の判断基準の組み合わせを用いても良い。
＜Ｗｒｉｔｅ処理の効果＞

　以上のＷｒｉｔｅ処理によれば、ホストＩ／Ｆ２２１が要求データ長の一部のデータの転送完了をプロセッサ＃１に通知することで、ホストコンピュータ１００から転送バッファ領域４４に対する全データの転送完了前に、プロセッサ＃１は、別のコントローラ上にあるキャッシュ領域４３にデータ転送を開始することが可能になる。プロセッサ＃１は、その部分転送完了通知頻度を、バスの帯域比率やデータ転送長やプロセッサ負荷などに応じて設定することで、ホストコンピュータ１００のＷｒｉｔｅ要求に対するストレージ装置１の応答性能向上を実現できる。
＜Ｒｅａｄ処理＞

　図１１は、ストレージ装置１におけるＲｅａｄ要求受領時のデータ転送フローを示す。

　ここでは、ホストコンピュータ１００が接続されたコントローラ＃１がホストコンピュータ１００からＲｅａｄ要求（Ｒｅａｄコマンド）を受領し、Ｒｅａｄ要求の対象データが、コントローラ＃１とは異なるコントローラ＃２に接続された記憶メディア２１１上に格納されているケースを想定している。コントローラ＃２に接続された記憶メディア２１１は、要求されたデータをコントローラ＃２上のキャッシュ領域４３に転送する（１１０１）。その後、プロセッサ＃２は、キャッシュ領域４３からコントローラ＃１上の転送バッファ領域４４にデータを転送する（１１０２）。最後にプロセッサ＃１は、転送バッファ領域４４からホストＩ／Ｆ２２１を介してホストコンピュータ１００にデータを転送する（１１０３）。もし、Ｒｅａｄ要求の対象データが、ホストコンピュータ１００が接続されたコントローラ＃１に接続された記憶メディア２１１上に格納されている場合は、コントローラを跨いだ転送（１１０２）が不要となる。
＜比較例のＲｅａｄシーケンス＞

　図１２は、比較例のＲｅａｄシーケンスを示す。

　この図は、比較例のストレージ装置が、ホストコンピュータ１００からＲｅａｄ要求（Ｒｅａｄコマンド）を受領してから、ホストコンピュータ１００に要求されたＲｅａｄデータを転送するまでの通信シーケンスの一例を示す。この図では、ホストＩ／Ｆ２２１やノード間Ｉ／Ｆ２２３は省略している。

　まず、ホストコンピュータ１００からホストＩ／Ｆ２２１を介してＲｅａｄ要求を受領したプロセッサ＃１は、要求内容を解析し、要求されたデータの格納先を特定し、転送バッファ領域４４を確保する（１２０１）。プロセッサ＃１は、Ｒｅａｄ要求受領前に、要求されたデータの格納先及び転送バッファ領域４４を予め決めていてもよい。次に、プロセッサ＃１は、Ｒｅａｄ要求を、対象データを管理するコントローラ＃２に転送する（１２０２）。Ｒｅａｄ要求を受領したプロセッサ＃２は、ドライブＩ／Ｆ２２２経由で、記憶メディア（ドライブ）２１１にＲｅａｄ要求を発行し、読み出しを開始する（１２０４）。このとき、対象データが、コントローラ＃２のメモリ４のキャッシュ領域４３に存在した場合は、記憶メディア２１１からの読み出しは不要となる。

　ドライブＩ／Ｆ２２２からＲｅａｄ要求を受領した記憶メディア２１１は、Ｒｅａｄ要求に指定されたデータの転送を開始する（１２０５）。ここでは、Ｒｅａｄ要求で指定された要求データ長が２５６ＫＢである場合を例示している。ドライブＩ／Ｆ２２２は、記憶メディア２１１からのデータのプロトコル変換及びアドレス変換を行い、プロセッサ＃２から指定されたキャッシュ領域４３にデータを転送する（１２０６）。ドライブＩ／Ｆ２２２は、全てのデータ読み出しを完了したら、読み出し完了を通知する（１２０７）。プロセッサ＃２は、この完了通知を受領したら、コントローラ＃１の転送バッファ領域４４に転送する（１２０８）。プロセッサ＃２は、全てのデータ転送を完了したら、ノード間Ｉ／Ｆ２２３やプロセッサ２２４間の通信によって、転送完了をコントローラ＃１へ通知する（１２０９）。通知を受けたプロセッサ＃１は、ホストＩ／Ｆ２２１を介してホストコンピュータ１００にデータを転送する（１２１０）。このときホストＩ／Ｆ２２１は、転送バッファ領域４４から読み出したデータのプロトコル変換及びアドレス変換を行い、ホストコンピュータ１００へ転送する。

　以上の、Ｒｅａｄ要求発行（１２０１）から、Ｒｅａｄデータ受領完了（１２１０）までの時間が、ホストコンピュータ１００から見た、ストレージ装置１のＲｅａｄ応答時間となる。以上のＲｅａｄシーケンスでは、記憶メディア２１１からコントローラ＃２のキャッシュ領域４３への転送（１２０５、１２０６）と、コントローラ間の転送（１２０８）と、コントローラ＃１からホストコンピュータ１００への転送（１２１０）とが全て逐次処理される。そのため、Ｒｅａｄ要求の要求データ長が大きくなると、三つの転送（１２０５、１２０８、１２１０）に係わる転送時間の合計値に比例してＲｅａｄ応答時間が増加する。
＜実施例１のＲｅａｄシーケンス＞

　図１３は、実施例１のＲｅａｄシーケンスを示す。

　記憶メディア２１１がデータ転送を開始する（１３０１から１３０５）までの処理は、比較例のＲｅａｄシーケンスと同一である。本実施例では、ドライブＩ／Ｆ２２２が記憶メディア２１１から全データの読み出しを完了する前に、一部のデータ受領完了を通知する（１３０７）仕組みを有し、その通知に基づいてプロセッサ＃２がコントローラ間転送を開始する（１３０８）。この例では、ドライブＩ／Ｆ２２２は、Ｒｅａｄ要求で指定された要求データ長（２５６ＫＢ）とは無関係に、記憶メディア２１１から６４ＫＢのデータを読み出してキャッシュ領域４３に格納する毎に、部分的な転送完了を通知する（１３０７）。ドライブＩ／Ｆ２２２は、転送したデータ長を管理しているため、プロセッサ＃２から指定されたデータ長の転送が完了したことを検出でき、プロセッサ＃２に通知することができる。この通知を受けたプロセッサ＃２は、転送準備の出来ている６４ＫＢ分だけ、コントローラ＃１に転送し（１３０８）、６４ＫＢの転送完了をコントローラ＃１に通知する（１３０９）。コントローラ＃２のキャッシュ領域４３からコントローラ＃１の転送バッファ領域４４へのデータ転送は、プロセッサ＃２内のＤＭＡコントローラによって実行されてもよいし、プロセッサ＃２内のプロセッサコアによって実行されてもよいし、プロセッサ＃２からの指示に応じてコントローラ＃２のノード間Ｉ／Ｆ２２３によって実行されてもよい。

　コントローラ＃１は、転送完了通知に応じて、６４ＫＢのデータをホストコンピュータ１００へ転送開始する（１３１０）。これらによって、記憶メディア２１１からキャッシュ領域４３へのデータ転送（１３０５、１３０６）と、コントローラ間のデータ転送（１３０８）と、転送バッファ領域４４とホストコンピュータ１００の間のデータ転送（１３１０）とが、並列処理（パイプライン転送）されるようになるため、Ｒｅａｄ応答時間を短縮できる。

　なお、この例では、三つの転送の全てをパイプライン転送する例を示しているが、記憶メディア２１１から転送バッファ領域４４への転送（１３０５、１３０６、１３０８）のみのパイプライン化や、キャッシュ領域４３からホストコンピュータ１００への転送（１３０８、１３１０）のみのパイプライン化を行っても良い。また、この例ではホストコンピュータ１００と記憶メディア２１１とがそれぞれ異なるコントローラ＃１、＃２に接続されている場合を例示しているが、同一のコントローラ２２に接続されている場合でも、同様の仕組みによって、記憶メディア２１１からキャッシュ領域４３へのデータ転送（１３０５、１３０６）と、キャッシュ領域４３からホストコンピュータ１００への転送（１３１０）とをパイプライン化することも可能である。ただし、Ｗｒｉｔｅの場合と同様に、応答性能の向上効果は、部分完了が通知される間隔や、Ｒｅａｄ要求の要求データ長、各部の通信帯域によって変化する。応答時間の短縮量を最大化するためには、これらの条件に応じて、部分完了通知（１３０７、１３０９）に対する制御を切り替える必要がある。

　なお、Ｒｅａｄ要求の対象アドレスが、コントローラ＃１に接続された記憶メディア２１１に関連付けられていてもよい。この場合、プロセッサ＃１は、１３０２、１３０３の代わりに、コントローラ＃１のドライブＩ／Ｆ２２２へＲｅａｄ要求を発行することで、ドライブＩ／Ｆ２２２に記憶メディア２１１から転送バッファ領域４４へのデータ転送を実行させてもよい。

　また、プロセッサ＃２の代わりにプロセッサ＃１が、プロセッサ＃２のＲｅａｄ処理と同様の処理を実行することで、プロセッサ＃２またはコントローラ＃２のノード間Ｉ／Ｆ２２３に部分完了通知間隔を示すＲｅａｄ要求を発行してもよい。

　図１４は、実施例１のプロセッサ＃２のＲｅａｄ処理を示す。

　この図は、プロセッサ＃１がＲｅａｄ要求を受領した場合の、プロセッサ＃２の制御フローの一例を示す。基本的なフローは、前述したプロセッサ＃１のＷｒｉｔｅ処理と同じである。プロセッサ＃２は、コントローラ＃１からＲｅａｄ要求を受領したら（Ｓ１４０１）、要求されたデータが既にコントローラ＃２のキャッシュ領域４３に格納されているかどうか判断する（Ｓ１４０２）。格納されていれば、プロセッサ＃２は、キャッシュ領域４３からコントローラ＃１の転送バッファ領域４４へのコントローラ間転送を開始する（Ｓ１４０７）。格納されていなければ、プロセッサ＃２は、ドライブＩ／Ｆ２２２に記憶メディア２１１からデータの読み出しを指示する。その際に、プロセッサ＃２は、ドライブＩ／Ｆ２２２の部分完了通知機能を利用可能か否かを判定し（Ｓ１４０３）、利用不可ならば通常のＲｅａｄ要求をドライブＩ／Ｆ２２２へ発行する（Ｓ１４０５ｂ）。利用可能ならば、プロセッサ＃２は、部分完了通知間隔処理を実行し（Ｓ１４０４）、Ｒｅａｄ要求をドライブＩ／Ｆ２２２へ発行する（Ｓ１４０５ａ）。このときのＲｅａｄ要求は、部分完了通知間隔を示す部分完了付Ｒｅａｄ要求である。その後、プロセッサ＃２は、ドライブＩ／Ｆ２２２によるデータ転送完了通知受領後（Ｓ１４０６）、コントローラ間転送を開始する（Ｓ１４０７）。プロセッサ＃２は、Ｒｅａｄ要求に対する全データ転送が完了するまで、ステップ（Ｓ１４０６とＳ１４０７）を繰り返す。全データ転送完了判断（Ｓ１４０８）により、未転送のデータが存在した際（Ｓ１４０８、Ｎ）に、プロセッサ＃２は、転送先のコントローラ＃１に部分的な転送完了を通知しても良い（前述したＲｅａｄシーケンスの１３０９）。

　図１５は、実施例１のプロセッサ＃１のＲｅａｄ処理を示す。

　この図は、実施例１における、Ｒｅａｄ要求受領時の、プロセッサ＃１の制御フローの一例を示す。Ｒｅａｄ要求を受領したプロセッサ＃１は、Ｒｅａｄ要求に基づいて、要求されたデータを管理しているコントローラ＃２（宛先）を特定し、コントローラ＃２にＲｅａｄ要求を転送する（Ｓ１５０２）。その後、プロセッサ＃１は、コントローラ＃２からの転送完了通知を待ち（Ｓ１５０３）、通知を受け取ったら受領したデータを、転送バッファ領域４４からホストＩ／Ｆ２２１を通じてホストコンピュータ１００に転送する（Ｓ１５０４）。プロセッサ＃１は、一部のデータ転送が完了する度に、ホストＩ／Ｆ２２１に完了を通知してもよい。プロセッサ＃１は、全データの転送が完了するまでこれを繰り返す（Ｓ１５０３～Ｓ１５０５）。

　前述したプロセッサ＃２のＲｅａｄ処理における部分完了通知間隔決定処理（Ｓ１４０４）は、プロセッサ＃１によるＷｒｉｔｅ処理における部分完了通知間隔決定処理と同様である。第一応答ケース及び第二応答ケースを用いて説明したＷｒｉｔｅ時の応答性能向上効果と部分完了通知間隔の関係性についても、Ｒｅａｄ時はデータ転送方向が逆になるだけで、同様の関係性を示す。ただしＲｅａｄ処理の場合、記憶メディア２１１からコントローラ＃２のキャッシュ領域４３への転送（１３０６）と、コントローラ＃２のキャッシュ領域４３からコントローラ＃１の転送バッファ領域４４への転送（１３０８）と、コントローラ＃１の転送バッファ領域４４からホストコンピュータ１００への転送（１３１０）との全てをパイプライン転送する場合と、一部のみパイプライン転送する場合を、応答性能向上効果に応じて使い分けることができる。また、完了通知間隔を算出するために用いる情報や、その保持方法も、Ｗｒｉｔｅ処理と同様、前述した間隔設定テーブル１００１及び部分完了通知間隔設定用情報１００２を用いて実施可能である。
＜Ｒｅａｄ処理の効果＞

　以上により、ストレージ装置１において、ドライブＩ／Ｆ２２２が、全データ転送の内一部の転送完了を通知することで、記憶メディア２１１からキャッシュ領域４３に対する全データ転送完了前に、別のコントローラ上にある転送バッファ領域４４にデータ転送を開始することが可能になる。同様に、ノード間Ｉ／Ｆ２２３やプロセッサ２２４が、全データ転送の一部の転送完了を転送先コントローラに通知することで、キャッシュ領域４３から別のコントローラ上にある転送バッファ領域４４への全データ転送が完了する前に、転送バッファ領域４４から、ホストコンピュータ１００へのデータ転送を開始することが可能になる。また、プロセッサ２２４が部分転送完了通知頻度を、バスの帯域比率やデータ転送長やプロセッサ負荷などに応じて設定することで、ホストコンピュータ１００のＲｅａｄ要求に対するストレージ装置１の応答性能向上を実現できる。
＜実施例１の効果＞

　本実施例によれば、ストレージ装置１において、コントローラ２２と、ホストコンピュータ１００又は記憶メディア２１１の間の第一データ転送が完了する前に、ホストＩ／Ｆ２２１やドライブＩ／Ｆ２２２が部分的な転送完了を通知することで、二つのコントローラ２２のメモリ４間の第二データ転送を開始可能になり、応答性能が向上する。さらに、第二データ転送が完了する前に、ノード間Ｉ／Ｆ２２３やプロセッサ２２４が部分的な転送完了を通知することで、第二データ転送の転送先のメモリ４からホストコンピュータ１００への第三データ転送を開始することができる。これら、第一、第二、第三データ転送をパイプライン化することで、応答性能が向上する。本実施例では、ホストＩ／Ｆ２２１やドライブＩ／Ｆ２２２が、ホストコンピュータ１００や記憶メディア２１１との通信用に用いている、データ転送状態に関する管理情報を用いることで、プロセッサ２２４やメモリ４への追加負荷を少なく、応答性能向上を実現している。更に、プロセッサ２２４が、転送完了通知頻度を、バスの帯域比率やデータ転送長やプロセッサ負荷などに応じて制御することで、スループットを低下させることなく、応答性能向上効果を高めることができる。

　実施例２のストレージ装置１の基本的な装置構成や処理フローは実施例１と同様であるが、部分的な転送完了を検知する方法において実施例１とは異なる。実施例２では、プロセッサ２２４がデータ転送要求を分割することで、部分的なデータ受領完了を検知する。

　図１６は、実施例２のＷｒｉｔｅシーケンスを示す。

　ここでは、実施例１のＷｒｉｔｅシーケンスとの相違点について説明する。特に言及されない処理は、実施例１のＷｒｉｔｅシーケンス内の処理と同様である。実施例１と比較すると、本実施例では、ＸＦＥＲ＿ＲＤＹの転送（１６０５）から、ホストＩ／Ｆ２２１による転送完了通知（１６０９）までの仕組みが異なる。実施例２では、Ｗｒｉｔｅ要求の要求データ長（ここでは２５６ＫＢ）を示すＸＦＥＲ＿ＲＤＹの代わりに、より細かい転送データ長を示す複数のＸＦＥＲ＿ＲＤＹを、ホストコンピュータ１００へ発行する。この例は、６４ＫＢのＸＦＥＲ＿ＲＤＹを４回転送する。このＸＦＥＲ＿ＲＤＹを受け取ったホストコンピュータ１００は、それぞれのＸＦＥＲ＿ＲＤＹに対応するデータを転送する（１６０７）。一つのＸＦＥＲ＿ＲＤＹに対応するデータ（６４ＫＢ）の受領を完了したホストＩ／Ｆ２２１は、ＸＦＥＲ＿ＲＤＹに対する転送の完了通知をプロセッサ＃１へ送信する（１６０９）。結果として、プロセッサ＃１は、実施例１と類似の部分転送完了通知を受領することができ、全データ受領前に、コントローラ間のデータ転送を開始することができる（１６１０）。

　実施例２のプロセッサ＃１のＷｒｉｔｅ処理の大部分は実施例１と同様である。但し、実施例２では、実施例１の部分完了通知間隔が、各ＸＦＥＲ＿ＲＤＹにより要求するデータ長であるＸＦＥＲ＿ＲＤＹ分割データ長に置き換えられる。

　実施例２のＷｒｉｔｅシーケンスにおける、ＸＦＥＲ＿ＲＤＹ分割と応答性能向上効果の関係は、実施例１と一部異なる。実施例１の第一応答ケース及び第二応答ケースにおける、分割処理オーバーヘッド（７０３、８０４）に加え、実施例２ではＸＦＥＲ＿ＲＤＹを分割することにより、ＸＦＥＲ＿ＲＤＹ転送のための転送効率が低下し、１６０５、１６０６に追加の処理負荷が発生する。また、ホストコンピュータ１００により受領されるＸＦＥＲ＿ＲＤＹを分割すると、ホストコンピュータ１００が複数のホストＩ／Ｆ２２１に対する処理を同時に行っているとき、転送対象の切り替えが高頻度になる。このような切り替えは、基本的にはホストコンピュータ１００のデータ転送効率低下に繋がる。実施例２ではこれらの、処理負荷増も、ＸＦＥＲ＿ＲＤＹ分割データ長を決める際に用いることができる。

　また、実施例２では等間隔でない完了通知（１６０９）を容易に実現できる。実施例２のＷｒｉｔｅシーケンスや、実施例１のＷｒｉｔｅシーケンスでは、６４ＫＢ毎の等間隔な完了通知を前提として例示したが、これらは等間隔である必要はない。非等間隔な通知が可能なとき、第一応答ケースにおいて、転送開始時にホストＩ／Ｆ２２１が比較的大きな転送データ長の転送を行い、徐々に転送データ長を小さくして通知間隔を狭めることで、Ｔ_ＡＬＬ（７０５）を更に短くできる。第二応答ケースにおいて、逆に転送開始時にホストＩ／Ｆ２２１が高頻度な通知を行い、徐々に通知間隔を長くすることで、通知を処理するプロセッサ＃１の負荷を軽減できる。ただし、実施例１では、プロセッサ＃１が最初に通知間隔をホストＩ／Ｆ２２１に設定するため、通知頻度を細かに変更することが比較的難しい。実施例２では、プロセッサ＃１が任意のＸＦＥＲ＿ＲＤＹへの設定値を変更できるため、非等間隔な通知が容易となる。また、プロセッサ＃１がホストコンピュータ１００から転送バッファ領域４４への最初のデータ転送時の負荷に基づいて、次のデータ転送のデータ長を決定し、そのデータ長を示すＸＦＥＲ＿ＲＤＹを発行してもよい。

　図１７は、実施例２のＲｅａｄシーケンスを示す。

　ここでは、実施例１のＲｅａｄシーケンスとの相違点について説明する。特に言及されない処理は、実施例１のＲｅａｄシーケンス内の処理と同様である。実施例１と比較すると、本実施例では、Ｒｅａｄ要求の発行（１７０３）から、ドライブＩ／Ｆ２２２による転送完了通知（１７０６）までの仕組みが異なる。実施例２では、Ｒｅａｄ要求の要求データ長（ここでは２５６ＫＢ）を示すＲｅａｄ要求の代わりに、より細かい転送データ長を示すＲｅａｄ要求に分割して、記憶メディア２１１へ発行する（ここでは６４ＫＢの要求を４回に分けて転送する例を示す）。この要求を受け取った記憶メディア２１１は、それぞれの要求に対応するデータを転送する（１７０５）。要求に対応する全データ（６４ＫＢ）を受領したドライブＩ／Ｆ２２２は、要求に対するＲｅａｄの完了通知を行う（１７０７）。結果として、プロセッサ＃２は、実施例１と類似の部分転送完了通知を受領することができ、全データ受領前に、コントローラ間のデータ転送を開始することができる（１７０８）。コントローラ間のデータ転送（１７０８）と転送バッファ領域４４からホストコンピュータ１００への転送（１７１０）のみをパイプライン転送する場合は、プロセッサ＃２が転送を分割し部分転送完了を通知すればよい。

　実施例２におけるプロセッサ＃２のＲｅａｄ処理とプロセッサ＃１のＲｅａｄ処理の大部分も実施例１と同様である。

　また、実施例２のＲｅａｄシーケンスにおける、Ｒｅａｄ要求分割と応答性能向上効果の関係は、実施例１の部分完了通知と応答性能向上効果の関係と一部異なるが、実施例２のＷｒｉｔｅシーケンスの効果の説明と同様である。実施例１の第一応答ケース及び第二応答ケースにおける、分割による処理オーバーヘッド（７０３、８０４）に加え、実施例２ではＲｅａｄ要求を分割することによって、１７０３、１７０４に追加の処理負荷が発生する。また、記憶メディア２１１が複数のドライブＩ／Ｆ２２２からの要求の処理を同時に行っているとき、読み出し対象の切り替えが高頻度になる。このような切り替えは、記憶メディア２１１内の非連続な領域に対するアクセス頻度の増加に繋がるため、特に記憶メディア２１１がハードディスクドライブである場合の転送効率低下に繋がる。実施例２のコントローラ＃１は、これらの処理負荷の増加を用いて、ＸＦＥＲ＿ＲＤＹ分割データ長を決めてもよい。また、実施例２のストレージ装置１は、Ｒｅａｄ処理においても非等間隔な通知を用いることができる。その利点はＷｒｉｔｅ処理と同様である。

　本実施例によれば、ストレージ装置１は、要求データ長を複数の転送データ長に分割し、それらの複数の転送データ長をそれぞれ示す複数のＸＦＥＲ＿ＲＤＹを、転送元であるホストコンピュータ１００や記憶メディア２１１に発行することで、転送元からコントローラ２２への第一データ転送が全て完了する前に通知を受けることができ、二つのコントローラ２２のメモリ４間の第二データ転送が開始可能になるため、応答性能が向上する。さらに、第二データ転送が完了する前に、第二データ転送の転送元のプロセッサ２２４が部分的な転送完了を通知することで、転送先のプロセッサ２２４は、メモリ４からホストコンピュータ１００への第三データ転送を開始することができる。これら、第一、第二、第三データ転送をパイプライン化することで、応答性能が向上する。更に、プロセッサ２２４が、バスの帯域比率やデータ転送長やプロセッサ負荷などに応じて制御することで、応答性能向上効果を高めることができる。また、転送完了を通知するデータ長を非均等に分割することで、更なる応答性能向上効果を実現できる。

　実施例３のストレージ装置１の基本的な装置構成や処理フローは実施例１及び実施例２と同一であるが、部分的な転送完了を検知する方法が実施例１及び実施例２とは異なる。実施例３では、プロセッサ２２４がメモリ４内の特定の監視アドレスを監視することで、部分的なデータ受領完了を検知する。

　図１８は、実施例３のＷｒｉｔｅシーケンスを示す。

　ここでは、実施例１のＷｒｉｔｅシーケンスとの相違点について説明する。特に言及されない処理は、実施例１のＷｒｉｔｅシーケンス内の処理と同様である。この図では、プロセッサ＃１によるメモリ４の監視とコントローラ間転送の関係をわかり易くするために、プロセッサ＃１とメモリ４を区別して図示しているが、本実施例のストレージ装置１の物理構成は実施例１と同様である。

　本実施例では、プロセッサ＃１が比較例と同様のＸＦＥＲ＿ＲＤＹを送出（１８０５）後、プロセッサ＃１はメモリ４の転送バッファ領域４４のうち転送先のアドレスの定期的な監視を行う（１８０９）。ホストコンピュータ１００がホストＩ／Ｆ２２１経由で転送バッファ領域４４にデータ転送を行い（１８０８）、転送バッファ領域４４内の監視アドレスのデータの更新が検出されると、コントローラ間転送を開始する（１８１０）。本実施例では、ＸＦＥＲ＿ＲＤＹで要求された一連のデータ（ここでは２５６ＫＢ）は、先頭のデータブロックから順番に転送されることを想定している。そのため、監視アドレスのデータの更新の検出は、データ転送開始アドレスから監視アドレスまでのデータ転送が完了していることを保証する。この例では、プロセッサ＃１は、６４ＫＢ間隔の監視アドレスを監視しており、最初の６４ＫＢ点更新を検出したら、コントローラ間通信を開始し（１８１０）、次の１２８ＫＢ目の監視を行う、という場合の例を示している。また、プロセッサ＃１は、更新前に監視アドレスに格納されているデータを記憶し、記憶されたデータと監視アドレスに格納されているデータとを比較することによって、監視アドレスのデータの更新を検出してもよいし、メモリ４のバス上のデータ流量や、監視アドレスへのアクセスを検出することにより、監視アドレスのデータの更新を検出してもよい。プロセッサ＃１は、メモリ４に関するメモリカウンタやバスカウンタ等のハードウェアからデータ流量を取得してもよい。プロセッサ＃１は、監視アドレスのデータを比較する方法で検出する場合、たまたま同一データが書き込まれたときに、更新を検出できない可能性があるが、その場合でも、ホストＩ／Ｆ２２１による転送完了通知（１８１１）を契機にコントローラ間転送（１８１０）を開始すれば良い。また、プロセッサ＃１の負荷によって監視の時間間隔が長くなっても、転送完了通知（１８１１）を契機にコントローラ間転送（１８１０）を開始できる。そのため、本実施例のＷｒｉｔｅシーケンスは、比較例のＷｒｉｔｅシーケンスと比べて、処理時間が大幅に長くなることはない。

　図１９は、実施例３のプロセッサ＃１のＷｒｉｔｅ処理を示す。

　この図は、プロセッサ＃１がＷｒｉｔｅ要求を受領した場合の、プロセッサ＃１の制御フローの一例を示す。プロセッサ＃１は、Ｗｒｉｔｅ要求を受領し（Ｓ１９０１）、他のコントローラ＃２にキャッシュ領域４３の確保を依頼（Ｓ１９０２）している間に、監視を行う監視アドレス間隔と、それに基づく複数の監視アドレスを決定する監視アドレス決定処理を実行する（Ｓ１９０３）。ここでプロセッサ＃１は、実施例１の部分完了通知間隔決定処理と同様で、プロセッサ＃１の負荷や内部バスや要求データ長などによって監視アドレス間隔を決定することができる。プロセッサ＃１は、他のコントローラ＃２から完了通知を受信したら（Ｓ１９０４）、ホストＩ／Ｆ２２１を介してホストコンピュータ１００にＸＦＥＲ＿ＲＤＹを送信し（Ｓ１９０５）、定期的な監視アドレスの監視を開始する（Ｓ１９０６）。プロセッサ＃１は、データ比較やバス監視などで、監視アドレスのデータの更新を検出したら（Ｓ１９０７：Ｙ）、受信完了したデータ分だけコントローラ間転送を行う（Ｓ１９０８）。プロセッサ＃１は、要求データ長の全データの転送を完了する（Ｓ１９０９：Ｙ）まで、監視と転送を続ける。但し、プロセッサ＃１は、なんらかの理由で検出漏れが発生していた場合や、監視による検出より先にホストＩ／Ｆ２２１からの完了通知を受領したら、残りの全データを転送する（Ｓ１９０６～Ｓ１９０９）。プロセッサ＃１は、他のコントローラ＃２から要求データ長の全データの転送の完了通知を受領すると（Ｓ１９１０）、ホストコンピュータ１００へＷｒｉｔｅ要求に対する完了ステータス（Good Status）を返答する（Ｓ１９１１）。

　実施例３における、メモリ監視頻度と応答性能向上効果の関係性は、実施例１と一部異なる。実施例１の第一応答ケース及び第二応答ケースにおける、分割処理オーバーヘッド（７０３、８０４）に加え、実施例３ではメモリ監視によるプロセッサ・メモリ負荷が発生する。プロセッサ＃１が高頻度に転送バッファ領域４４を監視するほど、プロセッサ＃１やメモリ４のバスの負荷は増加するが、転送バッファ領域４４へのデータ転送から検出までの遅延時間が減少する。そこで、プロセッサ＃１は、メモリ４内の転送先の領域のうち、監視される領域のみを、転送バッファ領域４４よりもアクセス負荷の低いキャッシュ領域４３などに配置することで、メモリ監視の処理負荷を削減することができる。即ち、プロセッサ＃１は、転送バッファ領域４４内に転送先の領域を割り当て、転送バッファ領域４４のアクセス負荷より低いアクセス負荷を有する領域を監視アドレスに割り当てる。また、監視するアドレス間隔を非均等にすることで、実施例２で述べたような非等間隔な部分転送完了通知と同様の効果を実現できる。

　図２０は、実施例３のＲｅａｄシーケンスを示す。

　ここでは、実施例１のＲｅａｄシーケンスとの相違点について説明する。特に言及されない処理は、実施例１のＲｅａｄシーケンス内の処理と同様である。ここでは、プロセッサ＃２によるメモリ４の監視とコントローラ間転送との関係をわかり易くするために、プロセッサ＃２とメモリ４を区別して図示しているが、本実施例のストレージ装置１の物理構成は実施例１と同様である。

　プロセッサ＃２は、ドライブＩ／Ｆ２２２による転送先であるキャッシュ領域４３の内、監視アドレスを監視する（２００７）。Ｒｅａｄ要求に対するデータがドライブＩ／Ｆ２２２からキャッシュ領域４３内の各監視アドレスまで書き込まれる（２００６）と、プロセッサ＃２はこれを検出し、検出された監視アドレスまでのデータのコントローラ間転送（２００８）を開始し、各コントローラ間転送の転送完了を、転送先のコントローラ＃１に通知する（２００９）。この通知を受けたプロセッサ＃１は、ホストＩ／Ｆ２２１を介してホストコンピュータ１００にデータを転送する（２０１０）。以上によって、三つのデータ転送をパイプライン化し、応答性能が向上する。なお、メモリの監視方法はＷｒｉｔｅに関する説明で述べた通り、データの比較によって行っても良いし、バス上のデータ転送量計測等によって行っても良い。

　実施例３のプロセッサ＃２のＲｅａｄ処理は、実施例１のコントローラ＃２のＲｅａｄ処理と同様であるが、部分完了通知間隔決定処理（Ｓ１４０４）の代わりに、実施例３のコントローラ＃１のＷｒｉｔｅ処理における監視アドレス決定処理（Ｓ１９０３）を実行する。実施例３のプロセッサ＃１のＲｅａｄ処理は、実施例１のコントローラ＃１のＲｅａｄ処理と同様である。

　本実施例によれば、ストレージ装置１において、プロセッサ２２４が所定のメモリアドレス更新を監視することによって、ホストコンピュータ１００や記憶メディア２１１からメモリ４への第一データ転送が全て完了する前に、二つのコントローラ２２のメモリ４間の第二データ転送が開始可能になるため、応答性能が向上する。さらに、第二データ転送が完了する前に、プロセッサ２２４が部分的な転送完了を通知することで、第二データ転送の転送先のメモリ４からホストコンピュータ１００への第三データ転送を開始することができる。これら、第一、第二、第三データ転送をパイプライン化することで、応答性能が向上する。更に、プロセッサ２２４がメモリ監視頻度と監視アドレスを、バスの帯域比率やデータ転送長やプロセッサ負荷などに応じて制御することで、スループット低下や並列処理Ｉ／Ｏ数を制限することなく、応答性能を高めることができる。また、プロセッサ２２４が監視頻度や監視アドレスをデータ転送に対して非均等に設定したり、監視アドレスの領域のみをアクセス負荷の低いメモリ領域に格納したりすることで、更なる応答性能向上効果を実現できる。

　実施例４は、基本的な装置構成や処理フローは実施例１と同一であるが、プロセッサ２２４は、第一データ転送完了が確定する前に投機的に第二データ転送を開始する。ただし、第一データ転送中に、データ転送に対して一意に定まる保証コードを付与し、第二データ転送中にデータ中の保証コードと期待値を比較する。第二の転送中に不一致を検出した場合、第一の転送未完了を検出し、再度転送を試みる。

　図２１は、実施例４のＷｒｉｔｅシーケンスを示す。

　ここでは、実施例１のＷｒｉｔｅシーケンスとの相違点について説明する。特に言及されない処理は、実施例１のＷｒｉｔｅシーケンス内の処理と同様である。この図では、ノード間Ｉ／Ｆ２２３による投機的な転送開始をわかり易くするために、プロセッサ＃１とノード間Ｉ／Ｆ２２３を区別して図示しているが、本実施例のストレージ装置１の物理構成は実施例１と同様である。ただし、ホストＩ／Ｆ２２１とノード間Ｉ／Ｆ２２３は、プロセッサ２２４から設定されたパラメータに従って、保証コードを付与、チェックする機能を有する。また前述の通り、ホストＩ／Ｆ２２１やノード間Ｉ／Ｆ２２３はプロセッサ２２４上で動作する制御ソフトウェアの一部であってもよい。その場合、実施例４は、実施例３における監視対象を全ての保証コードの領域に設定した例、と考えることもできる。

　この図では、Ｗｒｉｔｅ要求を受領したプロセッサ＃１が、ホストＩ／Ｆ２２１に、ＸＦＥＲ＿ＲＤＹを通知すると共に、受領するデータに保証コードを付与することを依頼する（２０１５）。保証コードは、意図に反したデータ変更を検出するためのコードであり、例えばＣＲＣ（Cyclic Redundancy Check）などの誤り検出符号であってもよいし、ユーザーにより定義される任意のＤＩＦ（Data Integrity Field）であっても良いし、これらのような複数種類の保証コードを含んでも良い。プロセッサ＃１は、コントローラ＃１からコントローラ＃２への投機転送のための投機転送パラメータを、ノード間Ｉ／Ｆ２２３に通知する（ＤＭＡ設定、２１０７）。投機転送パラメータは、ＸＦＥＲ＿ＲＤＹに応じて受領されるデータが格納される転送バッファ領域４４上の転送元のアドレスと、コントローラ＃２のキャッシュ領域４３上の転送先のアドレスと、保証コードを決定する情報とを含む。ＸＦＥＲ＿ＲＤＹを受領したホストコンピュータ１００は、データをホストＩ／Ｆ２２１に転送する（２１０８）。ホストＩ／Ｆ２２１は受領するデータに保証コードを付与して転送バッファ領域４４に格納する。

　一方で、プロセッサ＃１は、ＸＦＥＲ＿ＲＤＹをホストＩ／Ｆ２２１へ通知した後に、コントローラ間転送と保証コードに関する投機転送パラメータをノード間Ｉ／Ｆ２２３に通知する（２１０７）。この例におけるコントローラ間転送は、コントローラ＃１の転送バッファ領域４４からコントローラ＃２のキャッシュ領域４３へのＤＭＡ転送である。投機転送パラメータを受領したノード間Ｉ／Ｆ２２３は、プロセッサ＃１がホストＩ／Ｆ２２１からの完了通知（２１１３）を受信する前に、投機転送パラメータに従って、コントローラ＃１の転送バッファ領域４４からコントローラ＃２のキャッシュ領域４３へのコントローラ間転送を開始する（２１１０）。その際、ノード間Ｉ／Ｆ２２３は、保証コードの期待値と、転送バッファ領域４４から読み出したデータに付与された保証コードとを比較する。これが一致すれば、ノード間Ｉ／Ｆ２２３は、投機転送成功と判断し、コントローラ＃２のメモリ４内の制御データ領域４２を通じて転送成功をプロセッサ＃２に通知する（２１１１）。これが一致しなければ、ノード間Ｉ／Ｆ２２３は、データが未だ転送バッファ領域４４上に転送されていないと判断し、転送を中断する（２１１２）。この図では、転送を中断する例を示しているが、中断しなくてもよい。すなわちノード間Ｉ／Ｆ２２３は、コントローラ間転送と、保証コードのチェック及びチェック結果の通知とを、非同期に実施することで、ノード間Ｉ／Ｆ２２３の処理負荷を削減することも可能である。その後、ノード間Ｉ／Ｆ２２３は、転送パラメータに従って、中断された転送を再試行する（２１１３）。ノード間Ｉ／Ｆ２２３は、制御データ領域４２に、コントローラ間転送の状態であるデータ転送状態を書き込む。

　ホストＩ／Ｆ２２１が要求データ長の全データを転送バッファ領域４４に転送完了したことをプロセッサ＃１に通知すると（２１１４）、プロセッサ＃１は、制御データ領域４２内のデータ転送状態を参照する。データ転送状態に基づいて未転送のデータがあれば、プロセッサ＃１は、未転送のデータのコントローラ間転送を実施する。転送先のコントローラ＃２は、データ転送状態に基づいて全データを受け取ったら受領完了を通知し（２１１５）、それを受け取ったコントローラ＃１は、ホストＩ／Ｆ２２１を介して（２１１６）、ホストコンピュータ１００にＷｒｉｔｅ完了を通知する（２１１７）。

　図２２は、実施例４のプロセッサ＃１のＷｒｉｔｅ処理を示す。

　この図は、プロセッサ＃１がＷｒｉｔｅ要求を受領した場合の、プロセッサ＃１の制御フローの一例を示す。プロセッサ＃１は、Ｗｒｉｔｅ要求を受領すると（Ｓ２２０１）、コントローラ＃２にキャッシュ領域４３の確保を依頼すると共に、受領するＷｒｉｔｅデータに対する保証コードを決定する（Ｓ２２０２）。プロセッサ＃１は、投機転送パラメータを決定する投機転送決定処理を実行する（Ｓ２２０３）。プロセッサ＃１は、コントローラ＃２から受領準備完了通知を受領すると（Ｓ２２０４）、ホストＩ／Ｆ２２１に対し、ＸＦＥＲ＿ＲＤＹを通知すると共に保証コード付与を設定し（Ｓ２２０５）、ノード間Ｉ／Ｆ２２３に対し、投機転送パラメータを通知することで投機転送を設定する（Ｓ２２０６）。その後、プロセッサ＃１は、ホストＩ／Ｆ２２１から全データ受領の完了通知を受けるまで待機する（Ｓ２２０７）。プロセッサ＃１は、その完了通知を受けた後に、データ転送状態を参照することで（Ｓ２２０８）、投機転送の正常性を確認する（Ｓ２２０９）。この転送正常確認は、ノード間Ｉ／Ｆ２２３による保証コードの一致確認だけであってもよいし、転送先であるコントローラ＃２からの受領完了通知の受領を正常転送完了としてもよい。要求データ長の全データが正常転送済みであれば（Ｓ２２１１：Ｙ）、プロセッサ＃１は、コントローラ＃２からの受領完了通知を待つ（Ｓ２２１２）。まだ未転送のデータがあれば（Ｓ２２１１：Ｎ）、プロセッサ＃１は、未転送データのみの転送をノード間Ｉ／Ｆ２２３に要求する（Ｓ２２１０）。ここで未転送のデータは、異常により転送を中断したデータを含む。プロセッサ＃１は、コントローラ＃２から、要求データ長の全データの受領完了通知を受け取ったら、ホストＩ／Ｆ２２１を介してホストコンピュータ１００に、Ｗｒｉｔｅ要求に対する完了ステータスを通知する（Ｓ２２１３）。

　図２３は、実施例４の投機転送パラメータとデータ転送状態管理テーブルの一例を示す。

　制御データ領域４２には、ノード間Ｉ／Ｆ２２３がコントローラ間の投機転送を実行するための投機転送パラメータ２３０１と、プロセッサ＃１がホストＩ／Ｆ２２１から受領完了通知を受け取った際にコントローラ間転送で未転送のデータを判別するために、投機転送のデータ転送状態を示すデータ転送状態管理テーブル２３０２が格納される。投機転送パラメータ２３０１は、Ｉ／Ｏ要求毎に、要求ＩＤと、保証コード情報と、投機転送開始契機と、再送回数とを示す。要求ＩＤは、Ｉ／Ｏ要求を示す識別子である。保証コード情報は、保証コード期待値もしくは算出アルゴリズムを示す。投機転送開始契機は、投機転送を開始するための契機を示し、ノード間Ｉ／Ｆ２２３が投機転送を設定されてから転送を開始するまでのＷａｉｔ時間などを示す。再送回数は、保証コード不一致を検出した際のデータ転送の再送回数（後述）を示す。データ転送状態管理テーブル２３０２は、Ｉ／Ｏ要求毎に、要求ＩＤと、データ領域と、投機転送済情報と、他ＣＬ完了通知済情報とを含む。要求ＩＤは、Ｉ／Ｏ要求を示す識別子である。データ領域は、データ転送を行うアドレス領域を示す。投機転送済情報は、投機転送済みのデータのアドレスを示す。他ＣＬ完了通知済情報は、転送先コントローラから転送完了通知受信済みのデータのアドレスを示す。

　図２４は、実施例４のＷｒｉｔｅ処理時のコントローラ＃１のノード間Ｉ／Ｆ２２３の投機転送処理を示す。

　この図は、コントローラ＃１において、Ｗｒｉｔｅ処理時にプロセッサ＃１から投機転送パラメータを受領したノード間Ｉ／Ｆ２２３の動作を示す。ノード間Ｉ／Ｆ２２３は、投機転送パラメータを受領した後（Ｓ２４０１）、設定された投機転送開始契機の発生を検出すると、設定された転送元の転送バッファ領域４４のアドレスからデータを読み出す（Ｓ２４０２）。例えば、ノード間Ｉ／Ｆ２２３は、タイマーにより、投機転送パラメータを受領してから、それに含まれるＷａｉｔ時間が経過したことを検出することで、投機転送開始契機の発生を検出する。このとき、ノード間Ｉ／Ｆ２２３は、読み出したデータに付与された保証コードと、設定された保証コード期待値とを比較する（Ｓ２４０３）。比較結果が一致すれば（Ｓ２４０４：Ｙ）、ノード間Ｉ／Ｆ２２３は、指定された転送先のキャッシュ領域４３のアドレスにデータを転送し、データ転送状態管理テーブル２３０２にデータが正常に転送済みであることを示す情報を記録する（Ｓ２４０５）。比較結果が一致しなければ（Ｓ２４０４：Ｎ）、ノード間Ｉ／Ｆ２２３は、設定に従って再転送を試みる（Ｓ２４０７）。この例においてノード間Ｉ／Ｆ２２３は、保証コード不一致回数が再送回数以下であれば、再転送を試みる。ノード間Ｉ／Ｆ２２３は、再転送を行うか否かについて、データ転送の進捗（要求データ長の内初めの方か、終わりの方かなど）に応じて判断しても良いし、保証コードのうち期待値と不一致したフィールド（ＣＲＣ部か、ユーザー設定タグ部かなど）に応じて判断しても良いし、先行する転送に対して転送先から受領完了通知を受けているか否かに応じて判断しても良い。例えば、ノード間Ｉ／Ｆ２２３は、不一致箇所が要求データ長の最後の所定の範囲内であれば、すぐに再送し、不一致箇所が要求データ長の最初の所定の範囲内であれば、所定時間待ってから再送する、もしくは再送しない。ノード間Ｉ／Ｆ２２３は、要求データ長の全データの転送が完了するまで上記（Ｓ２４０２からＳ２４０５、Ｓ２４０７）を繰り返す（Ｓ２４０６）。

　保証コードの不一致の発生回数が再送回数を超えた場合、ノード間Ｉ／Ｆ２２３は転送を中断する。その後、プロセッサ＃１は、未転送のデータの転送要求をノード間Ｉ／Ｆ２２３へ発行し（Ｓ２２１０）、投機転送処理の異常が発生すると、プロセッサ＃１は、異常をホストコンピュータ１００へ通知する。

　また、本実施例は他の実施例と組み合わせて実施されても良い。すなわち、ノード間Ｉ／Ｆ２２３の初回の転送開始契機（Ｓ２４０２）を、他の実施例にて示した手法を用いてノード間Ｉ／Ｆ２２３に通知し、その後、ノード間Ｉ／Ｆ２２３は保証コードをチェックしながら転送を行っても良い。こうすることで、転送開始契機を正確することができるのでノード間Ｉ／Ｆ２２３の処理負荷は削減しつつ、その後の部分完了通知やメモリ監視に対するプロセッサ２２４の処理負荷を削減することができる。特に実施例３においては、ＸＦＥＲ＿ＲＤＹで要求された一連のデータは、先頭のデータブロックから順番に転送されることを想定したため、本実施例と組み合わせることで、仮に転送順序が乱れた場合でも、途中までのデータ転送の完了を検出することが可能になる。

　図２５は、実施例４のＲｅａｄシーケンスを示す。

　ここでは、実施例１のＲｅａｄシーケンスとの相違点について説明する。特に言及されない処理は、実施例１のＲｅａｄシーケンス内の処理と同様である。ここでは、ノード間Ｉ／Ｆ２２３による投機手的な転送をわかり易くするために、プロセッサ２２４とノード間Ｉ／Ｆ２２３を区別して図示しているが、本実施例のストレージ装置１の物理構成は実施例１と同様である。

　プロセッサ＃２は、プロセッサ＃１からＲｅａｄ要求を受領すると（２５０１、２５０２）、ドライブＩ／Ｆ２２２にＲｅａｄ要求を発行（２５０３）し、コントローラ＃２からコントローラ＃１への投機転送のための投機転送パラメータを、ノード間Ｉ／Ｆ２２３に通知する（ＤＭＡ設定、２５０５）。記憶メディア２１１は、ドライブＩ／Ｆ２２２からの要求に基づいて読み出すデータに保証コードが付与されている場合、その保証コードの期待値をノード間Ｉ／Ｆ２２３に通知する。記憶メディア２１１は、ドライブＩ／Ｆ２２２からの要求に基づいて読み出すデータに保証コードが付与されていない、もしくは、ドライブＩ／Ｆ２２２による保証コード付け替えを行う場合、ドライブＩ／Ｆ２２２にも保証コード期待値を通知する。ドライブＩ／Ｆ２２２からキャッシュ領域４３へのデータ転送とは独立に、ノード間Ｉ／Ｆ２２３は投機転送パラメータに従って、コントローラ＃２のキャッシュ領域４３からコントローラ＃１の転送バッファ領域４４への投機転送を開始する（２５０８）。その際、ノード間Ｉ／Ｆ２２３は、キャッシュ領域４３上のデータに付与された保証コードと、指定された保証コード期待値とを比較する。保証コードが一致したら正常転送完了を通知（２５０９）し、不一致を検出したら転送を中断する（２５１０）。ノード間Ｉ／Ｆ２２３は、投機転送を正常に完了すると、コントローラ間転送完了通知をプロセッサ＃１へ発行する（２５０９）。この通知を受けたプロセッサ＃１は、転送バッファ領域４４に転送されたデータを、ホストＩ／Ｆ２２１を介してホストコンピュータ１００へ転送する（２５１２）。このとき、コントローラ＃１からホストコンピュータ１００へのデータ転送も、ホストＩ／Ｆ２２１による保証コードチェックを行うことで、投機的に行っても良い。

　実施例４のプロセッサ＃２のＲｅａｄ処理は、実施例１のプロセッサ＃２のＲｅａｄ処理と、実施例４のプロセッサ＃１のＷｒｉｔｅ処理との組み合わせにより実現される。また、Ｒｅａｄ処理時のコントローラ＃２のノード間Ｉ／Ｆ２２３の投機転送処理は、Ｗｒｉｔｅ処理時のコントローラ＃１のノード間Ｉ／Ｆ２２３の投機転送処理と同様であるが、転送元がコントローラ＃２のキャッシュ領域４３になり、転送先がコントローラ＃１の転送バッファ領域４４になる。

　本実施例によれば、ストレージ装置１において、ホストコンピュータ１００や記憶メディア２１１からメモリ４への第一データ転送中に保証コードを付与し、二つのコントローラ２２のメモリ４間の第二データ転送を投機的に行いつつ、保証コードの一致をチェックすることで、第一データ転送が完了する前に第二データ転送を開始可能になるため、応答性能が向上する。さらに、Ｒｅａｄ処理時、転送先のメモリ４からホストコンピュータ１００への第三データ転送中にも保証コードの一致を確認することで、第二データ転送が完了する前に、第三データ転送を開始することができる。これら、第一、第二、第三データ転送をパイプライン化することで、応答性能が向上する。更に、本実施例によれば、プロセッサ２２４が投機的な転送の実行間隔をバスの帯域比率やデータ転送長やプロセッサ負荷などに応じて制御することで、応答性能向上効果を高めることができる。また、ノード間Ｉ／Ｆ２２３が、保証コード不一致検出時の再送判断を、保証コード内で不一致が検出された部分や、要求データ長のデータのうち、不一致が検出された部分のオフセットに応じて制御することで、効果を高めることができる。

　本発明の一態様の表現について説明する。第一転送要求がＷｒｉｔｅ要求で、第一プロセッサがプロセッサ＃１で、第一デバイスがホストコンピュータ１００で、第二デバイスがコントローラ＃２のメモリ４であってもよい。第一転送要求がＷｒｉｔｅ要求で、第一プロセッサがプロセッサ＃１で、第一デバイスがホストコンピュータ１００で、第二デバイスがコントローラ＃１に接続された記憶メディア２１１であってもよい。第一転送要求がＲｅａｄ要求で、第一プロセッサがプロセッサ＃２で、第一デバイスがコントローラ＃２に接続された記憶メディア２１１で、第二デバイスがコントローラ＃１内のメモリ４であってもよい。第一転送要求がＲｅａｄ要求で、第一プロセッサがプロセッサ＃１で、第一デバイスがコントローラ＃２内のメモリ４で、第二デバイスがホストコンピュータ１００であってもよい。第一転送要求がＲｅａｄ要求で、第一プロセッサがプロセッサ＃１で、第一デバイスがコントローラ＃１に接続された記憶メディア２１１で、第二デバイスがホストコンピュータ１００であってもよい。

　第一転送デバイス及び第二転送デバイスは、ホストＩ／Ｆ２２１、ドライブＩ／Ｆ２２２、ノード間Ｉ／Ｆ２２３、プロセッサ２２４、コントローラ２２内のＤＭＡコントローラ等であってもよい。

　第一部分完了条件は、コントローラ＃１のホストＩ／Ｆ２２１が部分完了通知間隔のデータ長の転送の完了を、プロセッサ＃１へ通知することであってもよいし、コントローラ＃１のホストＩ／Ｆ２２１が部分完了通知間隔のデータ長の転送を示すＸＦＥＲ＿ＲＤＹに対する転送の完了を、プロセッサ＃１へ通知することであってもよいし、プロセッサ＃１が監視アドレスのデータの変更を検出することであってもよいし、コントローラ＃１のノード間Ｉ／Ｆ２２３が投機転送開始契機の発生を検出することであってもよい。第一データ転送指示及び第一部分データ転送指示が、ＸＦＥＲ＿ＲＤＹであってもよい。開始タイミングが、投機転送開始契機であってもよい。

　第二メモリがコントローラ＃２のメモリ４で、第二プロセッサがプロセッサ＃２で、記憶デバイスがコントローラ＃２に接続されている記憶メディア２１１であってもよい。第二転送要求が、プロセッサ＃１からプロセッサ＃２へのＲｅａｄ要求であってもよい。

　第二部分完了条件は、コントローラ＃２のドライブＩ／Ｆ２２２が部分完了通知間隔のデータ長の転送の完了を、プロセッサ＃２へ通知することであってもよいし、コントローラ＃２のドライブＩ／Ｆ２２２が部分完了通知間隔のデータ長の転送を示すＲｅａｄ要求に対する転送の完了を、プロセッサ＃２へ通知することであってもよいし、プロセッサ＃２が監視アドレスのデータの変更を検出することであってもよいし、コントローラ＃２のノード間Ｉ／Ｆ２２３が投機転送開始契機の発生を検出することであってもよい。

　以上、本発明の実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲を上記構成に限定する趣旨ではない。本発明は、他の種々の形態でも実施する事が可能である。

　１…ストレージ装置、　２…ストレージノード、　３…内部ネットワーク、　４…メモリ、　２１…ドライブ筐体、　２２…コントローラ、　１００…ホストコンピュータ、　２１１…記憶メディア、　２２４…プロセッサ、　２２１…ホストＩ／Ｆ、　２２２…ドライブＩ／Ｆ、　２２３…ノード間Ｉ／Ｆ

Claims

　第一メモリと、
　前記第一メモリ、第一デバイス、及び第二デバイスに接続される第一プロセッサと、
を備え、
　前記第一プロセッサは、前記第一デバイスに格納されている第一データを、前記第二デバイスへ転送することを要求する第一転送要求を受領し、
　前記第一プロセッサは、前記第一転送要求に基づいて、前記第一データを前記第一デバイスから前記第一メモリへ転送する第一データ転送において、前記第一データの一部である第一部分データの転送の完了のタイミングを示す第一部分完了条件を決定し、
　前記第一プロセッサは、前記第一データ転送を開始させ、
　前記第一プロセッサは、前記第一部分完了条件に基づいて、前記第一データ転送の完了前に、前記第一データを前記第一メモリから前記第二デバイスへ転送する第二データ転送を開始させる、
ストレージ装置。
　前記第一転送要求は、前記第一データの長さである第一データ長を含み、
　前記第一プロセッサは、前記第一データ長に基づいて、前記第一部分データの長さである第一部分データ長を決定し、前記第一部分データ長に基づいて前記第一部分完了条件を決定する、
請求項１に記載のストレージ装置。
　前記第一デバイス、前記第一メモリ、及び前記第一プロセッサに接続される第一転送デバイスと、
　前記第二デバイス、前記第一メモリ、及び前記第一プロセッサに接続される第二転送デバイスと、
を更に含み、
　前記第一転送デバイスは、前記第一プロセッサからの指示に基づいて、前記第一データ転送を実行し、
　前記第二転送デバイスは、前記第一部分完了条件の成立に応じて、前記第二データ転送を実行する、
請求項２に記載のストレージ装置。
　前記第一デバイスは、ホストコンピュータであり、
　前記第一転送要求は、前記ホストコンピュータに格納されている前記第一データを前記ストレージ装置へ書き込むことを要求するライト要求である、
請求項３に記載のストレージ装置。
　前記第二デバイスである第二メモリと、
　記憶デバイスと、
　前記第一メモリ、前記第一プロセッサ、前記第二メモリ、及び前記記憶デバイスに接続される第二プロセッサと、
を更に備え、
　前記第一プロセッサは、前記ホストコンピュータから、前記ストレージ装置に格納されているデータを前記ホストコンピュータへ読み出すことを要求するリード要求を受領し、
　前記第一プロセッサは、前記リード要求に応じて、前記ストレージ装置に格納されている第二データを前記第一メモリへ転送することを要求する第二転送要求を、前記第二プロセッサへ発行し、
　前記第二プロセッサは、前記第二転送要求に基づいて、前記第二データを前記記憶デバイスから前記第二メモリへ転送する第三データ転送において、前記第二データの一部である第二部分データの転送の完了のタイミングを示す第二部分完了条件を決定し、
　前記第二プロセッサは、前記第二データ転送を開始させ、
　前記第二プロセッサは、前記第二部分完了条件に基づいて、前記第三データ転送の完了前に、前記第二データを前記第二メモリから前記第一メモリへ転送する第四データ転送を開始させる、
請求項４に記載のストレージ装置。
　前記第一プロセッサは、前記第二部分データが前記第一メモリへ転送されたことを認識し、前記第四データ転送の完了前に、前記第二部分データを前記第一メモリから前記ホストコンピュータへ転送する第五データ転送を開始させる、
請求項５に記載のストレージ装置。
　前記第一プロセッサは、前記第一部分データ長を前記第一転送デバイスへ通知し、
　前記第一転送デバイスは、前記第一部分データ長に基づいて、前記第一部分データを前記第一デバイスから前記第一メモリへ転送し、前記第一部分データの転送の完了を示す第一部分完了通知を前記第一プロセッサへ発行し、
　前記第一プロセッサは、前記第一部分完了通知に応じて、前記第一部分データを前記第一メモリから前記第二デバイスへ転送することを、前記第二転送デバイスに指示する、
請求項３に記載のストレージ装置。
　前記第一プロセッサは、前記第一データ長の転送を指示する第一データ転送指示であって前記第一部分データ長を含む前記第一データ転送指示を、前記第一転送デバイスへ発行し、
　前記第一転送デバイスは、前記第一データ転送指示に基づいて、前記第一データを前記第一デバイスから前記第一メモリへ転送し、前記第一データ転送により転送されたデータ長が前記第一部分データ長に達した場合、前記第一部分完了通知を前記第一プロセッサへ発行する、
請求項７に記載のストレージ装置。
　前記第一プロセッサは、前記第一部分データ長の転送を指示する第一部分データ転送指示と、前記第一データのうち前記第一部分データより後の第二部分データの転送を指示する第二部分データ転送指示とを、前記第一転送デバイスへ発行し、
　前記第一転送デバイスは、前記第一部分データ転送指示に基づいて、前記第一部分データを前記第一デバイスから前記第一メモリへ転送し、前記第一部分データの転送が完了したした場合、前記第一部分完了通知を前記第一プロセッサへ発行し、前記第二部分データ転送指示に基づいて、前記第二部分データを前記第一デバイスから前記第一メモリへ転送する、
請求項７に記載のストレージ装置。
　前記第一プロセッサは、前記第一メモリ内で前記第一部分データの転送先のアドレスである監視アドレスを決定し、
　前記第一プロセッサは、前記第一転送デバイスへ前記第一データ転送の指示を発行し、前記監視アドレスを監視し、
　前記第一プロセッサは、前記監視アドレスの監視に基づいて、前記第一デバイスから前記第一メモリへの前記第一部分データの転送の完了を検出した場合、前記第一部分データを前記第一メモリから前記第二デバイスへ転送することを、前記第二転送デバイスに指示する、
請求項３に記載のストレージ装置。
　前記第一プロセッサは、前記第一メモリから前記第一データ転送の転送先の領域を割り当て、前記転送先の領域のアクセス負荷よりが低いアクセス負荷を有する領域を前記監視アドレスに割り当てる、
請求項１０に記載のストレージ装置。
　前記第一プロセッサは、前記第一部分データ長に基づいて、前記第一部分データを前記第一メモリから前記第二デバイスへ転送を開始する開始タイミングを決定し、
　前記第一プロセッサは、前記開始タイミングを前記第二転送デバイスへ通知し、
　前記第一転送デバイスは、前記第一部分データを前記第一デバイスから前記第一メモリへ転送すると共に、保証コードを前記第一メモリへ書き込み、
　前記第二転送デバイスは、前記開始タイミングに応じて、前記第一メモリから前記保証コードを読み出し、前記保証コードが正常である場合、前記第一部分データを前記第一メモリから前記第二デバイスへ転送する、
請求項３に記載のストレージ装置。
　前記第一プロセッサは、前記第一データ転送の転送帯域と、前記第二データ転送の転送帯域と、前記第一プロセッサの負荷と、前記第一データ転送において前記第一部分データの転送の完了を認識することによる負荷の増加量と、過去の第一部分データ長と、前記ホストコンピュータに対する過去の応答時間との少なくとも一つに基づいて、前記第一部分データ長を決定する、
請求項２に記載のストレージ装置。
　前記第一プロセッサは、前記第一データのうち前記第一部分データより後の第二部分データの長さである第二部分データ長を決定し、
　前記第二部分データ長は、前記第一部分データ長と異なる、
請求項２に記載のストレージ装置。
　ストレージ装置の制御方法であって、
　第一プロセッサを用いて、第一デバイスに格納されている第一データを、第二デバイスへ転送することを要求する第一転送要求を受領し、
　前記第一プロセッサを用いて、前記第一転送要求に基づいて、前記第一データを前記第一デバイスから第一メモリへ転送する第一データ転送において、前記第一データの一部である第一部分データの転送の完了のタイミングを示す第一部分完了条件を決定し、
　前記第一プロセッサを用いて、前記第一データ転送を開始させ、
　前記第一プロセッサを用いて、前記第一部分完了条件に基づいて、前記第一データ転送の完了前に、前記第一データを前記第一メモリから前記第二デバイスへ転送する第二データ転送を開始させる、
制御方法。