WO2015111148A1

WO2015111148A1 - ストレージ装置およびストレージ装置制御方法

Info

Publication number: WO2015111148A1
Application number: PCT/JP2014/051216
Authority: WO
Inventors: 匠佐野; 健一澤; 友哉後藤
Original assignee: 株式会社日立製作所
Priority date: 2014-01-22
Filing date: 2014-01-22
Publication date: 2015-07-30

Abstract

　コントローラは、コマンドに基づくジョブを実行するプロセッサと、そのスケジューリングするためのキューを記憶するメモリを備える。キューは、初めて起動されるジョブの実行順序を示す初期起動キューと、実行中に待ち状態になったジョブの実行順序を示す待ちキューと、待ち状態の後に再起動されるジョブの実行順序を示す再起動キューを含む。プロセッサは、チャネルアダプタが第一コマンドを受信した場合に、第一コマンドに基づく第一ジョブを示す第一識別子を初期起動キューにエンキューし、第一ジョブが実行中に待ち状態になった場合に、第一識別子を初期起動キューからデキューして、待ちキューにエンキューし、第一ジョブの待ち状態が終了した場合に、第一識別子を前記待ちキューからデキューして、再起動キューにエンキューし、再起動キューに格納された識別子に対応するジョブを、初期起動キューに格納された識別子に対応するジョブよりも先に実行する。

Description

ストレージ装置およびストレージ装置制御方法

　本発明は、ストレージ装置に関する。

　ホスト計算機から送信されたコマンドの種類に基づき、特定の種類のコマンドを優先して実行するストレージ装置が知られている（例えば、特許文献１）。

　このストレージ装置では、コマンドは、その実行前において実行（初期起動）の順番を待つためキューに配置される。キューに配置されたコマンドは、原則としてキューに配置された順番に実行されるが、特定の種類のコマンドについては、キューに配置された順番に関わらず優先して実行される。

特開２０１０－２６９４６号公報

　上記のストレージ装置では、実行前のコマンドがすべて１つのキューに配置されており、他の種類のコマンドより後にキューに配置された特定の種類のコマンドが、他の種類のコマンドよりも先に実行される。しかし、コマンドにより実行されるジョブは、その実行中に他の処理により待ち状態（ｗａｉｔ）が発生する場合がある。待ち状態が発生したジョブを再度実行（再起動）させるためには、再起動のジョブをキューの最後尾に配置しなければならず、特定の種類のコマンドによるジョブであっても他の種類のコマンドの実行が完了するまで再起動させることができない場合がある。

　上記課題を解決するために、本発明の一態様であるストレージ装置は、記憶デバイスと、ホスト計算機から送信されるコマンドに基づき、記憶デバイスに対するジョブを実行するコントローラとを備える。コントローラは、ホスト計算機に接続され、コマンドを受信する１つ以上のチャネルアダプタと、記憶デバイスに接続され、チャネルアダプタからコマンドを受信し、コマンドに基づくジョブを実行する１つ以上のプロセッサと、チャネルアダプタおよびプロセッサに接続され、ジョブの実行をスケジューリングするためのキューを記憶するメモリと、を備える。キューは、初めて起動されるジョブの実行順序を示す初期起動キューと、実行中に待ち状態になったジョブの実行順序を示す待ちキューと、待ち状態の後に再起動されるジョブの実行順序を示す再起動キューを含む。プロセッサは、チャネルアダプタが第一コマンドを受信した場合に、第一コマンドに基づく第一ジョブを示す第一識別子を初期起動キューにエンキューし、第一ジョブが実行中に待ち状態になった場合に、第一識別子を初期起動キューからデキューして、待ちキューにエンキューし、第一ジョブの待ち状態が終了した場合に、第一識別子を前記待ちキューからデキューして、前記再起動キューにエンキューし、再起動キューに格納された識別子に対応するジョブを、前記初期起動キューに格納された識別子に対応するジョブよりも先に実行する。

　本発明の一態様によれば、待ち状態後のジョブを、実行前のジョブよりも優先して実行することができる。

図１は、本実施例の計算機システムの構成を示す。図２は、ホストＩ／Ｆ１１の構成図である。図３は、ＭＰＰＫ１２の構成図である。図４は、ＬＭ１２２内の論理領域を示す図である。図５は、初期起動イベント領域５２を説明する図である。図６は、ジョブ制御ブロック領域５１を説明する図である。図７は、専用領域で管理されているキューの種類を説明する図である。図８は、初期起動イベント検出処理のフローチャートである。図９は、ジョブスケジューリング処理のフローチャートである。図１０は、再起動イベント検出処理のフローチャートである。図１１は、ジョブ起動処理のフローチャートである。図１２は、ジョブ実行処理のフローチャートである。図１３は、沈み込み防止処理のフローチャートである。図１４は、メモリに記憶されるキューの配置を説明する図である。図１５は、他のキューの配置を説明する参考図である。図１６は、他のキューの配置を説明する参考図である。

　なお、以後の説明では「ａａａテーブル」、「ａａａキュー」等の表現にて情報を説明するが、これら情報はテーブル、キュー等のデータ構造以外で表現されていてもよい。そのため、データ構造に依存しないことを示すために「ａａａテーブル」、「ａａａキュー」等について「ａａａ情報」と呼ぶことがある。

　さらに、各情報の内容を説明する際に、「情報」、「識別子」という表現を用いるが、これらについてはお互いに置換が可能である。

　以後の説明では「プログラム」を主語として説明を行う場合があるが、プログラムはマイクロプロセッサによって実行されることで定められた処理をメモリ及び通信インタフェースを用いながら行うため、プログラムを主語とした処理の説明はマイクロプロセッサを主語とした説明としてもよい。また、そのマイクロプロセッサを含む装置が行う処理としてもよい。また、プログラムが行う処理の一部または全ては専用ハードウェアによって実現されてもよい。また、プログラムは、プログラム配布サーバや、計算機が読み取り可能な記憶メディアによって計算機にインストールされてもよい。

　各図において共通の要素については、同一の参照番号を付して説明する。また、共通の要素に関し、各要素を識別する場合には、数字の最後に１０＃１、１０＃２等の個別の番号等を付して説明する。ただし、必要に応じて番号等を省略して説明する場合がある。

　以下、図面等を用いて、本発明の実施例について説明する。以下の実施例は本発明の内容の具体例を示すものであり、本発明がこれらの実施例に限定されるものではなく、本明細書に開示される技術的思想の範囲内において当業者による様々な変更および修正が可能である。以下では、本発明のストレージ装置の実施例として、メインフレームのホスト計算機に接続されたストレージ装置について説明するが、これに限られない。例えば、ストレージ装置は、オープンシステムのホスト計算機に接続されてもよい。この場合、ホスト計算機に接続されるインタフェースは、オープンシステムのインタフェースとなる。

　以下、本実施例に係るストレージ装置におけるジョブのスケジューリング方法の概要について説明する。

　本実施例に係るストレージ装置の構成は、後に図を用いて詳細に説明するが、以下簡単に説明する。

　本実施例に係るストレージ装置は、物理記憶デバイスと、ホスト計算機から送信されるコマンドに基づき、物理記憶デバイスに対するジョブを実行するコントローラとを備える。

　コントローラは、ホスト計算機に接続されるチャネルアダプタと、物理記憶デバイスに接続され、チャネルアダプタを介してコマンドを受信し、コマンドに基づくジョブを実行するプロセッサと、プロセッサに接続され、ジョブの実行をスケジューリングするためのキューを記憶するメモリと、を備える。

　コマンドには、優先度を示す優先度情報が付される。チャネルアダプタは、コマンドを受信した場合に、コマンドをメモリに記憶する。

　図１４は、メモリに記憶されるキューを説明する図である。

　本実施例においては、各コマンドに対し、優先度として二値（高、低）の何れかが設定される。メモリに記憶されるキューは、具体的には、優先度が高いジョブであって実行前のジョブ専用のキューである、優先度高初期起動キューと、優先度が低いジョブであって実行前のジョブ専用のキューである、優先度低初期起動キューと、優先度が高いジョブであって待ち状態後のジョブ専用のキューである、優先度高再起動キューと、優先度が低いジョブであって待ち状態後のジョブ専用のキューである、優先度低再起動キューと、待ち状態のジョブ専用のキューである、ｗａｉｔキューである。図においては、優先度高初期起動キューには、ジョブの識別子が入力されておらず、優先度低初期起動キューに、優先度の低いジョブの識別子が３つ入力されている。また、ｗａｉｔキューには、優先度の高いジョブの識別子が１つ入力されている。さらに、優先度高再起動キューには、優先度の高いジョブの識別子が１つ入力され、優先度低再起動キューには、優先度の低いジョブの識別子が２つ入力されている。なお、優先度として三値以上の何れかが設定されても良い。

　プロセッサは、ホスト計算機からコマンドを受信した場合、コマンドに基づくジョブの優先度に応じて、実行前のジョブを優先度高初期起動キュー又は優先度低初期起動キューに入力する。優先度高初期起動キュー又は優先度低初期起動キューに格納されているジョブが実行され、そのジョブの実行中に他の処理により待ち状態が発生した場合、プロセッサは、そのジョブを優先度高初期起動キュー又は優先度低初期起動キューから取り出し、ｗａｉｔキューに入力する。ジョブの待ち状態が終了した場合、プロセッサは、そのジョブを待ちキューから取り出し、コマンドに基づくジョブの優先度に応じて、優先度高再起動キュー又は優先度低再起動キューに入力する。

　プロセッサは、再起動キューに格納されたジョブのうちの少なくとも１つのジョブを、初期起動キューに格納されたジョブよりも先に実行する。具体的には、例えば、優先度高再起動キューに格納されたジョブのうちの少なくとも１つのジョブを、優先度高初期起動キューに格納されたジョブよりも先に実行する。

　本実施例においては、実行前のジョブを格納するためのキューである初期起動キューのみならず、待ち状態後のジョブを格納するためのキューである再起動キューをメモリに記憶することで、待ち状態後のジョブを、実行前のジョブよりも先に実行させることができる。特に、優先度高再起動キューに格納されたジョブのうちの少なくとも１つのジョブを、優先度高初期起動キューに格納されたジョブよりも先に実行することにより、優先度の高い待ち状態後のジョブを、優先度の高い実行前のジョブよりも先に実行させうることができる。

　もし、本実施例の構成を用いず、図１５に示すように、実行前のジョブを格納するキューのみがメモリに記憶され、かつ、プロセッサが優先度の高いジョブを先に実行する場合で、このキューに待ち状態後の優先度の高いジョブを格納できるとしても、待ち状態後のジョブは、キューの最後尾に入力される。このため、待ち状態後のジョブの再起動が遅れ、このジョブの終了が遅れる。このようなキューによるジョブのスケジューリング方法に比べて、本実施例では、待ち状態後のジョブを、実行前のジョブよりも先に実行でき、待ち状態後のジョブの終了が遅れてしまうことを防止できる。

　もし、本実施例の構成を用いず、図１６に示すように、待ち状態後のジョブを格納するためのキューであって優先度を考慮しないキューである再起動キューがメモリに記憶される場合、ｗａｉｔキューに格納された優先度の高いジョブは、待ち状態終了後、優先度に関係なく、再起動キューの最後尾に配置されてしまうため、このジョブの再起動が遅れ、このジョブの終了が遅れる。このようなキューによるジョブのスケジューリング方法に比べて、本実施例では、待ち状態後の優先度の高いジョブを、待ち状態後の優先度の低いジョブよりも先に実行でき、待ち状態後にも、ジョブの実行の優先度を考慮することができる。

　以下、本実施例の計算機システムの構成について詳細に説明する。

　図１は、本実施例の計算機システムの構成を示す。

　本実施例の計算機システムは、メインフレームのホスト計算機（以下、ホスト）２と、ストレージ装置１とを有する。ホスト２とストレージ装置１とは、例えば、ＳＡＮ（Storage　Area　Network）又はＬＡＮ(Local　Area　Network)等の通信ネットワーク３に接続される。なお、計算機システムは、複数のホスト２を有していてもよい。この場合、ストレージ装置１は、通信ネットワーク３を介して複数のホスト２に接続される。

　ストレージ装置１は、ストレージコントローラ１０と、ディスクユニット２０とを有する。ストレージコントローラ１０が、ディスクユニット２０及びホスト２に接続される。

　ディスクユニット２０は、複数のドライブを有する。ドライブは、物理記憶デバイスであり、例えば、ＳＡＳ（Serial　Attached　Small　Computer　System　Interface）－ＨＤＤ（Hard　Disk Drive）２１、ＳＡＴＡ（Serial　Advanced　Technology　Attachment）－ＨＤＤ２２、ＳＳＤ（Solid　State　Drive）２３であるが、これに限られない。複数のドライブにより、ＲＡＩＤ（Redundant　Arrays　of　Inexpensive　Disks）グループが構成されてよい。１つのドライブ又は１つのＲＡＩＤグループを構成する複数のドライブに基づき、１つ又は複数のボリューム（ＬＵ：Logical　Unit）がホスト２に提供されてよい。なお、図示例では、ディスクユニット２０は１つであるが、複数のディスクユニット２０により冗長化されてよい。

　ストレージコントローラ１０は、ホストインタフェース（ホストＩ／Ｆ）１１と、ＭＰＰＫ(Micro　Processor　Package)１２と、スイッチ（ＳＷ）１３と、複数のディスクインタフェース（ディスクＩ／Ｆ)１４とを有する。スイッチ１３は、その内部にキャッシュメモリ（ＣＭ）１３１を有する。ストレージコントローラ１０の各部は、スイッチ１３を介してバスで接続される。なお、図示例では、ストレージコントローラ１０は、ＭＰＰＫ１２、スイッチ１３及びディスクＩ／Ｆ１４をそれぞれ１つずつ有するが、複数であってもよい。

　ホストＩ／Ｆ１１は、ホスト２との間の通信を行う。本実施例では、メインフレーム用のホストＩ／Ｆ１１を用いているため、通信は、ＦＩＣＯＮ（Fibre
Connection：登録商標）、ＥＳＣＯＮ（Enterprise System Connection：登録商標）、ＡＣＯＮＡＲＣ（Advanced
Connection Architecture：登録商標）、ＦＩＢＡＲＣ（Fibre Connection Architecture：登録商標）等のプロトコルに従って行うことができる。複数のディスクＩ／Ｆ１４は、それぞれ種類の異なるドライブ（ＳＡＳ－ＨＤＤ２１、ＳＡＴＡ－ＨＤＤ２２、ＳＳＤ２３）に接続され、ディスクユニット２０との間の通信を行う。

　キャッシュメモリ１３１は、ＳＷ１３を経由するコマンド及びデータを一時的に記憶する。ＭＰＰＫ１２は、ストレージ装置１を制御するためのプログラム及びデータを格納し、制御用のプログラムに従ってストレージ装置１を制御する。

　図２は、ホストＩ／Ｆ１１の構成図である。

　ホストＩ／Ｆ１１は、ＤＭＡ(Direct
Memory Access)１１１と、バッファ（ＢＦ：Buffer）１１２と、複数のチャネルプロセッサ（Hyper Transfer Processor：ＨＴＰ）１１３とを有する。

　ＨＴＰ１１３は、ホスト２に接続され、ホスト２との間でコマンド及びデータの通信を制御する。バッファ１１２は、ホスト２から送信されるコマンド及びデータを一時的に記憶する。ＤＭＡ１１１は、ＨＴＰ１１３に接続され、バッファ１１２に記憶されたコマンド及びデータを、スイッチ１３を介してＭＰＰＫ１２に転送する。

　図３は、ＭＰＰＫ１２の構成図である。

　ＭＰＰＫ１２は、ＣＰＵ１２１と、ＬＭ（Local　Memory）１２２とを有する。ＣＰＵ１２１は、複数のコア（Micro　Processor：ＭＰ）１２１１で構成される。図示例では、ＣＰＵ１２１が８つのＭＰ１２１１で構成されているが、これに限られない。各ＭＰ１２１１は、独立に動作可能であり、スイッチ１３を介して転送されるコマンド及びデータを処理する。ＬＭ１２２は、ＣＰＵ１２１に接続され、各ＭＰ１２１１よりアクセス可能である。

　図４は、ＬＭ１２２内の論理領域を示す図である。

　ＬＭ１２２には、複数の論理領域が形成される。これら論理領域は、ＣＰＵ１２１を構成するすべてのＭＰ１２１１とホストＩ／Ｆ１１内のすべてのＨＴＰ１１３とからアクセスされる共有領域５と、一つのＭＰ１２１１によりアクセスされる専用領域６とに大別される。本実施例では、専用領域６は、ＭＰＰＫ１２が有するＭＰ１２１１と同じ数に分割されている。各専用領域６には、対応するＭＰ１２１１が担当するジョブを示すジョブ情報が記憶される。なお、専用領域６は、他のＭＰ１２１１によってもアクセス可能である。また、本実施例では、共有領域５は、ジョブ制御ブロック（Job　Control　Block：ＪＣＢ）領域５１と、初期起動イベント領域５２と、ストレージ装置１を制御するためのプログラム及び情報を格納する領域（図示なし）とを有する。

　図５は、初期起動イベント領域５２を説明する図である。

　初期起動イベント領域５２は、複数のＨＴＰ領域５２ａに分割される。本実施例では、初期起動イベント領域５２は、ホストＩ／Ｆ１１が有する複数のＨＴＰ１１３の数に分割されており、ＨＴＰ領域＃０～＃ｘｘとＨＴＰ１１３とが１対１で対応づけられている。本図においては、ＨＴＰ領域５２ａを対応するＨＴＰ１１３の番号（ＨＴＰ＃０～＃ｘｘ）により示す。各ＨＴＰ領域５２ａは、さらに複数のブロック５２１に分割される。ホスト２からコマンドを受信したＨＴＰ１１３は、ＨＴＰ領域５２ａの所定のブロック５２１に、イベント情報として、そのコマンドの内容を示すコマンド情報と、そのイベントが有効であることを示すコマンド受信フラグと、そのコマンドに含まれている優先度が高いことを示す優先度フラグとを設定する。ここで、優先度は、ホスト２が発行するコマンドに含まれる。

　ホスト２からコマンドを受信したＨＴＰ１１は、自身に対応するＨＴＰ領域５２ａ内の一つのブロック５２１にコマンド受信フラグ及び優先度フラグを設定するよう、これらフラグをＭＰＰＫ１２に送信する。各ＭＰ１２１１は、ブロック５２１に設定されたコマンド受信フラグ及び優先度フラグをポーリングなどにより監視し、コマンド受信フラグが有効であるイベント情報を見つけた場合そのイベント情報に基づいて、後述のジョブ制御ブロック領域５１にジョブ情報を保存する。なお、どの種類のジョブをどのＭＰ１２１１が請け負うかは、予め定められていてもよい。ＭＰ１２１１は、ジョブ制御ブロック領域５１にジョブ情報を保存した後そのジョブ情報に対応するイベント情報のコマンド受信フラグを解除する。

　図６は、ジョブ制御ブロック領域５１を説明する図である。

　ジョブ制御ブロック領域５１は、ＭＰ１２１１毎のメモリ領域であるＭＰ領域５１ａに分割される。なお、以下の説明及び図では、ジョブ制御ブロックをＪＣＢ領域という場合がある。本実施例では、ＪＣＢ領域５１は８つに分割されており、ＭＰ領域＃０～＃７にＭＰ＃０～＃７が１対１で対応づけられている。各ＭＰ領域５１ａは、複数のジョブ制御ブロック（ＪＣＢ）５１ｂを有する。各ＪＣＢ５１ｂには、ＪＣＢ番号（ＪＣＢ＃ｘ）が付される。本実施例では、ＪＣＢ＃０～＃８１９１でＭＰ＃０用のＭＰ領域で構成される。

　ＭＰ１２１１は、ＨＴＰ領域５２ａから見つけたイベントに対応するコマンドに対して、自身のＭＰ領域５１ａの中から空きのＪＣＢ５１ｂを確保する。ＭＰ１２１１は、確保したＪＣＢ５１ｂに、そのコマンドに基づくジョブ情報を格納する。ＭＰ１２１１は、少なくとも１つのコマンドに対して１つのジョブを生成し、１つのジョブに対して１つのＪＣＢ５１ｂを確保する。そのジョブが終了するまで同じＪＣＢ５１ｂを確保し続ける。ジョブが終了した後、ＭＰ１２１１は、ＪＣＢ５１ｂを再び空きの状態にする。この図では、ＪＣＢ＃８１９１に、対応するコマンドがＩ／Ｏ（Input or Output）コマンドの場合の、ジョブ情報が記憶されている。ジョブ情報は、例えば、当該Ｉ／Ｏコマンドを受信したＨＴＰの識別子を示すＨＴＰ番号（＃）５１１と、当該Ｉ／Ｏコマンドの種別（リードコマンド又はライトコマンド）を示すＩ／Ｏコマンド情報５１２と、当該Ｉ／Ｏコマンドが指定するＩ／Ｏ先のアドレスやシリンダ等の情報を示すＩ／Ｏ制御情報５１３と、当該Ｉ／Ｏコマンドの優先度を示す基づくＩ／Ｏ優先度情報５１４とを有する。

　図７は、専用領域で管理されているキューの種類を説明する図である。

　図では、説明のため、ＭＰ＃０用の領域であるＭＰ＃０専用領域６を示すが、他のＭＰの専用領域６も同様の構成である。ＭＰ＃０専用領域６は、ジョブの種類に基づく複数種のキューを格納する。本実施例では、ジョブの種類毎にキューが生成される。キューは、入力順に実行される先入れ先出しの構造である。ここで、ジョブの種類は、ジョブの優先度（高・低）と、ジョブが待ち状態であるか否かと、ジョブが待ち状態の後か否か等に基づく。具体的には、ＭＰ＃０専用領域６では、優先度が高いジョブであって実行前のジョブ専用のキューである、優先度高初期起動キュー６１と、優先度が低いジョブであって実行前のジョブ専用のキューである、優先度低初期起動キュー６２と、優先度が高いジョブであって待ち状態後のジョブ専用のキューである、優先度高再起動キュー６３と、優先度が低いジョブであって待ち状態後のジョブ専用のキューである、優先度低再起動キュー６４と、待ち状態のジョブ専用のキューである、ｗａｉｔキュー６５とが格納される。これらのキューには、ＪＣＢ番号が入力される。なおここで、初期起動とは、ＭＰ１２１１がまだ起動されていないジョブを起動することである。ＭＰ１２１１は、まだ起動されていないジョブのＪＣＢ番号を、初期起動のキューに入力（エンキュー）する。ジョブが他の処理により待ち状態になるとき、ＭＰ１２１１はそのジョブのＪＣＢ番号をｗａｉｔキュー６５に入力する。ＭＰ１２１１は、ジョブの待ち状態が終わり、そのＪＣＢ番号がｗａｉｔキュー６５から出力（デキュー）された後、そのＪＣＢ番号を再度キューに入力する際は、初期起動のキューではなく、再起動のキューに入力する。なお、キューは、単方向のキューを用いても双方向キューを用いても良い。また、ジョブが待ち状態になるのは、例えば、ホスト２からのライトコマンドに基づくライトデータの送信を待つ場合、ホスト２からのリードコマンドに基づくキャッシュメモリ１３１上のリードデータをリードしようとする際、キャッシュメモリ１３１上にリードデータが存在せず（キャッシュミス）、ディスクユニット２０からデータを取得する（ステージング）のを待つ場合、スループットを向上させる目的で一つのジョブがＭＰを占有することを避けるための多重処理による待ち状態の発生等である。また、本実施例のようにホスト２がメインフレームであると、連続する複数のコマンドをチェインさせる場合（コマンドチェイン）や、１つのコマンドに対して連続する複数のデータをチェインさせる場合（データチェイン）も、オープンシステムに比べて待ち状態が発生しやすい。

　図８は、初期起動イベント検出処理のフローチャートである。

　初期起動イベント検出処理は、ＣＰＵ１２１の各ＭＰ１２１１が初期起動イベント検出プログラムを実行することにより行われる処理である。この処理は、ストレージ装置１が起動している間は、常に繰り返し行われてよい。

　プログラムは、初期起動イベント領域５２のＨＴＰ領域５２ａを順に１つずつ参照し、Ｓ８１の処理を繰り返す。以下のこの図の説明においては、取得したＨＴＰ領域５２ａを対象ＨＴＰ領域という。

　Ｓ８１で、プログラムは、対象ＨＴＰ領域のいずれかのブロック５２１にコマンド受信フラグが設定されているか否かを判定する。判定の結果、コマンド受信フラグが設定されている場合（Ｓ８１で、Ｙｅｓ）、プログラムは、Ｓ８１で自身のＭＰ領域５１ａの中から空きのＪＣＢ５１ｂを確保し、Ｓ８２で、コマンド受信フラグが設定されているイベント情報に基づくジョブ情報５１１～５１４を、確保されたＪＣＢ５１ｂに設定し、Ｓ８３に処理を進める。なお、このとき、プログラムは、当該ブロックに設定されたコマンド受信フラグを解除する。そして、プログラムは、次のＨＴＰ領域５２ａを取得し、対象ＨＴＰ領域としてＳ１３１に処理を進める。

　一方、判定の結果、コマンド受信フラグが設定されていない場合（Ｓ８１で、Ｎｏ）、プログラムは、次のＨＴＰ領域５２ａを取得し、対象ＨＴＰ５２ａとしてＳ８１に処理を進める。

　すべてのＨＴＰ領域５２ａの参照を終了したとき、プログラムは、処理を終了する。

　上記処理により、初期起動イベント領域５２のＨＴＰ領域５２ａを各ＭＰが監視することで、自身の請け負うジョブのコマンドについて、コマンド受信フラグを検出できる。

　図９は、ジョブスケジューリング処理のフローチャートである。

　ジョブスケジューリング処理は、ＬＭ１２２に記憶されたスケジューリングプログラムを各ＭＰ１２１１が実行することにより実行される。

　この処理は、ストレージ装置１が稼働している間は、常に繰り返し起動する。以下では、ステップを単に「Ｓ」と省略して説明する。

　Ｓ９１で、プログラムは、再起動すべきジョブをキューに入力する再起動イベント検出処理を実行する。再起動イベント検出処理は、図１０において詳細に説明する。

　Ｓ９２で、プログラムは、キューにより管理されているジョブを起動するジョブ起動処理を実行する。ジョブ起動処理は、図１１において詳細に説明する。

　Ｓ９３で、プログラムは、ジョブが長期間にわたって再起動されない状態を防ぐ沈み込み防止処理を実行する。沈み込み防止処理は、図１２において詳細に説明する。

　図１０は、再起動イベント検出処理のフローチャートである。

　再起動イベント検出処理は、図９で説明したジョブスケジューリング処理のＳ８１の処理である。

　プログラムは、ｗａｉｔキュー６５に格納されたＪＣＢ番号を、入力順に１つずつ取得し、Ｓ１０１～Ｓ１０５（またはＳ１０６）の処理を繰り返す。例えば、プログラムは、ｗａｉｔキュー６５内で入力順の位置Ａを０とし、ｗａｉｔキュー６５に格納されているＪＣＢ番号の数をｗａｉｔキュー接続数とし、その処理を行ってＡに１を加え、Ａがｗａｉｔキュー接続数に達するまで繰り返す。以下のこの図の説明においては、取得したＪＣＢ番号を対象ＪＣＢ番号という。

　Ｓ１０１で、プログラムは、対象ＪＣＢ番号のジョブ（対象ジョブ）が、再起動できる状態か否か、つまり、ジョブの待ち状態が終了したか否かを判定する。判定の結果、対象ジョブが再起動できる場合（Ｓ１０１で、Ｙｅｓ）、プログラムは、Ｓ１０２に処理を進める。一方、対象ジョブが再起動できない場合（Ｓ１０１で、Ｎｏ）、プログラムは、ｗａｉｔキュー６５から次のＪＣＢ番号を取得し、このステップ（Ｓ１０１）に処理を戻す。

　Ｓ１０２で、プログラムは、ｗａｉｔキュー６５から、対象ＪＣＢ番号をデキューする。

　Ｓ１０３で、プログラムは、対象ＪＣＢ番号に対応するジョブ情報に基づいて、対象ジョブの優先度が高いか否かを判定する。具体的には、例えば、プログラムは、自身のＭＰ領域５１ａの対象ＪＣＢ番号のＩ／Ｏ優先度情報５１４を参照し、対象ジョブの優先度を判定する。判定の結果、優先度が高い場合（Ｓ１０３で、Ｙｅｓ）、プログラムは、Ｓ１０６に処理を進め、対象ＪＣＢ番号を優先度高再起動キュー６３にエンキューし、ｗａｉｔキュー６５から次のＪＣＢ番号を取得してＳ１０１に処理を進める。

　一方、判定の結果、優先度が低い場合（Ｓ１０３で、Ｎｏ）、プログラムは、Ｓ１０４に処理を進める。

　Ｓ１０４で、プログラムは、対象ジョブが初期起動から一定時間経過したか否かを判定する。初期起動から一定時間経過したと判定された場合（Ｓ１０４でＹｅｓ）、プログラムは、Ｓ１０６に処理を進め、対象ＪＣＢ番号を優先度高再起動キュー６３にエンキューし、ｗａｉｔキュー６５から次のＪＣＢ番号を取得してＳ１０１に処理を戻す。

　一方、初期起動から一定時間経過していないと判定された場合（Ｓ１０４で、Ｎｏ）、プログラムは、対象ＪＣＢ番号を優先度低再起動キュー６４にエンキューし、ｗａｉｔキュー６５から次のＪＣＢ番号を取得してＳ７１に処理を進める。

　ｗａｉｔキュー６５に格納されたすべてのＪＣＢ番号が上記の処理を終了したとき、すなわちｗａｉｔキュー６５が空になったとき、プログラムは、再起動イベント検出処理を終了する。

　上記処理により、ｗａｉｔキュー６５に格納されたすべてのＪＣＢ番号について、ジョブの優先度に従ってキューに配置できる。本実施例では、各ＭＰ１２１１が、優先度が高いジョブであって初期起動時のジョブ専用のキューである、優先度高初期起動キュー６１と、優先度が低いジョブであって初期起動時のジョブ専用のキューである、優先度低初期起動キュー６２と、優先度が高いジョブであって待ち状態後のジョブ専用のキューである、優先度高再起動キュー６３と、優先度が低いジョブであって待ち状態後のジョブ専用のキューである、優先度低再起動キュー６４と、待ち状態のジョブ専用のキューである、ｗａｉｔキュー６５との５つのキューを管理しているため、初期起動のジョブのみならず、待ち状態後のジョブについても、優先度に基づいて適切なキューに配置することができ、ジョブのスケジューリングを適切に行うことができる。特に、待ち状態の終了した優先度の高いジョブについては、優先度甲再起動キュー６３に配置できるため、そのスケジューリングを適切に行うことができる。

　また、本実施例では、再起動かつ優先度の低いジョブについては、初期起動の時間から一定時間経過している場合に、優先度高再起動キュー６３に配置する。これにより、優先度の低いジョブが実行されなくなるのを防止することができる。

　図１１は、ジョブ起動処理のフローチャートである。

　ジョブ起動処理は、図９で説明したジョブスケジューリング処理のＳ９２の処理である。

　Ｓ１１１で、プログラムは、自身のＭＰ＃ｘ専用領域６を参照し、優先度高再起動キュー６３にＪＣＢ番号が格納されているか否かを判定する。判定の結果、このキュー６３にＪＣＢ番号が格納されている場合（Ｓ１１１で、Ｙｅｓ）、プログラムは、このＪＣＢ番号に対応するジョブを対象ジョブとして、Ｓ１１５においてジョブ実行処理を行い、処理を終了する。一方、このキュー６３にＪＣＢ番号が格納されていない場合（Ｓ１１１で、Ｎｏ）、プログラムは、Ｓ１１２に処理を進める。

　Ｓ１１２で、プログラムは、自身のＭＰ＃ｘ専用領域６を参照し、優先度高初期起動キュー６１にＪＣＢ番号が格納されているか否かを判定する。判定の結果、このキュー６１にＪＣＢ番号が格納されている場合（Ｓ１１２で、Ｙｅｓ）、プログラムは、このＪＣＢ番号に対応するジョブを対象ジョブとして、Ｓ１１５においてジョブ実行処理を行い、処理を終了する。一方、このキュー６１にＪＣＢ番号が格納されていない場合（Ｓ１１２で、Ｎｏ）、プログラムは、Ｓ１１３に処理を進める。

　Ｓ１１３で、プログラムは、自身のＭＰ＃ｘ専用領域６を参照し、優先度低再起動キュー６４にＪＣＢ番号が格納されているか否かを判定する。判定の結果、このキュー６４にＪＣＢ番号が格納されている場合（Ｓ１１３で、Ｙｅｓ）、プログラムは、このＪＣＢ番号に対応するジョブを対象ジョブとして、Ｓ１１５においてジョブ実行処理を行い、処理を終了する。一方、このキュー６２にＪＣＢ番号が格納されていない場合（Ｓ１１３で、Ｎｏ）、プログラムは、Ｓ１１４に処理を進める。

　Ｓ１１４で、プログラムは、自身のＭＰ＃ｘ専用領域６を参照し、優先度低初期起動キュー６２にＪＣＢ番号が格納されているか否かを判定する。判定の結果、このキュー６２にＪＣＢ番号が格納されている場合（Ｓ１１４で、Ｙｅｓ）、プログラムは、このＪＣＢ番号に対応するジョブを対象ジョブとして、Ｓ１１５においてジョブ実行処理を行い、処理を終了する。一方、このキュー６２にＪＣＢ番号が格納されていない場合（Ｓ１１４で、Ｎｏ）、プログラムは、処理を終了する。

　上記処理により、キューに応じてジョブの実行の順番を決定できる。具体的には、優先度の高いジョブを優先度の低いジョブよりも先に実行でき、かつ、優先度の同じジョブについては初期起動のジョブよりも再起動のジョブを優先して実行することができる。優先度の低い再起動のジョブよりも優先度の高い初期起動ジョブを優先して実行することができる。

　図１２は、ジョブ実行処理のフローチャートである。

　ジョブ実行処理は、図１１で説明したＳ１１５の処理である。Ｓ１１１～１１４のいずれかのステップにおいて、キュー６１～６４のいずれかのキューにジョブが設定されている場合にこの処理が実行される。この処理では、キュー６１～６４のいずれかのキューに設定されたジョブのうち、１つ又は複数のジョブを実行する。この際、ジョブの実行は、予め決められた数でもよいし、不特定の数であってもよい。以下では、簡単のため、実行されるジョブを１つとし、このジョブを対象ジョブとし、対象ジョブのＪＣＢ番号を格納するキューを対象キューとして説明する。

　Ｓ１２２で、プログラムは、対象ジョブを実行する。例えば、対象ジョブがライト処理のジョブであれば、コマンドで指定されたアドレスに基づき、ディスク２１～２３にライトデータを書き込む。

　Ｓ１２３で、プログラムは、対象ジョブが終了したか否かを判定する。判定の結果、対象ジョブが終了した場合（Ｓ１２３で、Ｙｅｓ）、プログラムは、対象ジョブのＪＣＢ番号を対象キューからデキューし、処理を終了する。

　一方、対象ジョブが終了していない場合（Ｓ１２３で、Ｎｏ）は、対象ジョブが待ち状態となっていることを意味している。この場合、プログラムは、対象ジョブのＪＣＢ番号を対象キューからデキューし、対象ジョブのＪＣＢ番号をｗａｉｔキュー６５にエンキューし、処理を終了する。

　上記処理では、対象ジョブの実行状態に合わせて、ジョブの終了した処理については、入力されていたキューからデキューでき、実行中に待ちが発生したジョブについては、ｗａｉｔキュー６５にエンキューできる。また、そのジョブが初期起動の場合は、ジョブの実行の前に該当のＪＣＢを確保し、優先度情報などを記憶できる。

　図１３は、沈み込み防止処理のフローチャートである。

　沈み込み防止処理は、図９で説明したジョブスケジューリング処理のＳ９３の処理である。

　プログラムは、優先度低再起動キュー６４に格納されたＪＣＢ番号を、入力順に１つずつ取得し、Ｓ１２１～Ｓ１２３の処理を繰り返す。例えば、プログラムは、優先度低再起動キュー６４内で入力順の位置Ｂを０とし、優先度低再起動キュー６４に格納されているＪＣＢ番号の数を再起動キュー接続数とし、その処理を行ってＢに１を加え、Ｂが再起動キュー接続数に達するまで繰り返す。以下のこの図の説明においては、取得したＪＣＢ番号を対象ＪＣＢ番号という。

　Ｓ１３１で、プログラムは、対象ＪＣＢ番号のジョブ（対象ジョブ）が、初期起動から一定時間経過しているか否かを判定する。判定の結果、対象ジョブが一定時間経過している場合（Ｓ１３１で、Ｙｅｓ）、プログラムは、Ｓ１３２において対象ジョブを優先度低再起動キュー６４からデキューし、Ｓ１３３において対象ジョブを優先度高再起動キュー６３にエンキューし、処理を終了する。

　一方、判定の結果、対象ジョブが初期起動から一定時間経過している場合（Ｓ１３１で、Ｎｏ）、プログラムは、優先度低再起動キュー６４から次のＪＣＢ番号を取得し、対象ＪＣＢ番号としてＳ１２１に処理を進める。

　優先度低再起動キュー６４に格納されたすべてのＪＣＢ番号に対して上記の処理を終了したとき、プログラムは、沈み込み防止処理を終了する。

　上記処理では、優先度低再起動キュー６４に設定されたジョブのうち、初期起動から一定時間経過したジョブの優先度を高くし、優先的に実行できる。これにより、優先度の高いジョブが相次いで発生する場合に、優先度の低いジョブであっても、一定時間経過した後は、優先的に実行できるようにできる。

　以上、幾つかの実施例を説明したが、本発明は、それらの実施例に限定されるものでなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。

　なお、上記の実施例で説明された技術は、次のように表現することもできる。

本発明のストレージ装置において、第一初期起動キューは、優先度高初期起動キュー６１等に対応し、第二初期起動キューは、優先度低初期起動キュー６２等に対応し、第一再起動キューは、優先度高再起動キュー６３等に対応し、第二再起動キューは、優先度低再起動キュー６４等に対応し、待ちキューは、ｗａｉｔキュー６５等に対応する。また、チャネルアダプタは、チャネルプロセッサ（ＨＴＰ）１１３等に対応し、プロセッサは、コア（ＭＰ）１２１１等に対応する。

　１：ストレージ計算機、２：ホスト計算機、１０：ストレージコントローラ、２０：ディスクユニット、１１：ホストインタフェース、１２：ＭＰＰＫ、１１３：ＨＴＰ、１２１：ＣＰＵ、１２２：ＬＭ、１２１１：ＭＰ

Claims

　記憶デバイスと、
　ホスト計算機から送信されるコマンドに基づき、前記記憶デバイスに対するジョブを実行するコントローラと
を備え、
　前記コントローラは、
　　前記ホスト計算機に接続され、前記コマンドを受信する１つ以上のチャネルアダプタと、
　　前記記憶デバイスに接続され、前記チャネルアダプタから前記コマンドを受信し、前記コマンドに基づく前記ジョブを実行する１つ以上のプロセッサと、
　　前記チャネルアダプタおよび前記プロセッサに接続され、前記ジョブの実行をスケジューリングするためのキューを記憶するメモリと、
を備え、
　前記キューは、初めて起動されるジョブの実行順序を示す初期起動キューと、実行中に待ち状態になったジョブの実行順序を示す待ちキューと、待ち状態の後に再起動されるジョブの実行順序を示す再起動キューを含み、
　前記プロセッサは、
　　前記チャネルアダプタが第一コマンドを受信した場合に、前記第一コマンドに基づく第一ジョブを示す第一識別子を初期起動キューにエンキューし、
　　前記第一ジョブが実行中に待ち状態になった場合に、前記第一識別子を前記初期起動キューからデキューして、前記待ちキューにエンキューし、
　　前記第一ジョブの待ち状態が終了した場合に、前記第一識別子を前記待ちキューからデキューして、前記再起動キューにエンキューし、
　　前記再起動キューに格納された識別子に対応するジョブを、前記初期起動キューに格納された識別子に対応するジョブよりも先に実行する
ストレージ装置。
　前記コマンドは、優先度を含み、
　前記初期起動キューは、優先度である第一値に対応する第一初期起動キューと、前記第一値より低い優先度である第二値に対応する第二初期起動キューとを含み、
　前記再起動キューは、前記第一値に対応する第一再起動キューと、前記第二値に対応する第二再起動キューとを含み、
　前記プロセッサは、
　　前記チャネルアダプタが前記第一コマンドを受信した場合、前記第一初期起動キュー及び前記第二初期起動キューのうち、前記第一コマンドに含まれている第一優先度に対応するキューに前記第一識別子をエンキューし、
　　前記第一ジョブの待ち状態が終了した場合に、前記第一識別子を前記待ちキューからデキューして、前記第一再起動キュー及び前記第二再起動キューのうち前記第一優先度に対応するキューにエンキューし、
　　前記第一再起動キューに格納された識別子に対応するジョブを、前記第一初期起動キューに格納された識別子に対応するジョブよりも先に実行する
　請求項１に記載のストレージ装置。
　前記プロセッサは、
　　前記第一ジョブの待ち状態が終了した場合であって、かつ、前記第一優先度が前記第一値である場合は、前記第一ジョブを前記待ちキューからデキューして、前記第一再起動キューにエンキューする
請求項２に記載のストレージ装置。
　前記プロセッサは、
　　前記第一ジョブの待ち状態が終了した場合であって、かつ、前記第一優先度が前記第二値である場合は、前記第一ジョブの最初に実行されてから所定時間が経過したか否かを判定し、
　　前記第一ジョブが最初に実行されてから所定時間が経過した場合には、第一識別子を前記待ちキューからデキューして、前記第一再起動キューにエンキューする
請求項３に記載のストレージ装置。
　前記プロセッサは、
　前記第二再起動キューに格納されている識別子に対応するジョブを、前記第二初期起動キューに格納されている識別子に対応するジョブよりも先に実行する
請求項４に記載のストレージ装置。
　前記プロセッサは、
　　前記第二再起動キューに格納されている第二識別子に対応する第二ジョブが、最初に実行されてから所定時間が経過した場合には、第二識別子を前記待ちキューからデキューして、前記第一再起動キューにエンキューする
請求項５に記載のストレージ装置。
　前記プロセッサは、
　　前記第一初期起動キューに格納された識別子に対応するジョブを、前記第二再起動キューに格納された識別子に対応するジョブよりも先に実行する
請求項６に記載のストレージ装置。
　前記１つ以上のチャネルアダプタは、複数のチャネルアダプタであって、
　前記１つ以上のプロセッサは、複数のプロセッサであって、
　前記メモリは、前記複数のチャネルアダプタのそれぞれに対応するチャネル領域、及び、前記複数のプロセッサのそれぞれに対応するプロセッサ領域を含み、
　各チャネルアダプタは、前記コマンドを受信した旨の情報であるコマンド受信情報と、前記優先度とを、自身に対応するチャネル領域に記憶し、
　各プロセッサは、
　　前記チャネル領域を監視し、前記コマンド受信情報を見つけた場合に、前記コマンドに含まれている情報を、自身のプロセッサ領域に記憶する
請求項７に記載のストレージ装置。
　記憶デバイスと、
　ホスト計算機から送信されるコマンドに基づき、前記記憶デバイスに対するジョブを実行するコントローラと
を備えるストレージ装置により実行されるストレージ装置制御方法において、
　前記コントローラは、
　　前記ホスト計算機に接続され、前記コマンドを受信する１つ以上のチャネルアダプタを有し、
　　初めて起動されるジョブの実行順序を示す初期起動キューと、実行中に待ち状態になったジョブの実行順序を示す待ちキューと、待ち状態の後に再起動されるジョブの実行順序を示す再起動キューと、を生成し、
　　前記チャネルアダプタが第一コマンドを受信した場合に、前記第一コマンドに基づく第一ジョブを示す第一識別子を初期起動キューにエンキューし、
　　前記第一ジョブが実行中に待ち状態になった場合に、前記第一識別子を前記初期起動キューからデキューして、前記待ちキューにエンキューし、
　　前記第一ジョブの待ち状態が終了した場合に、前記第一識別子を前記待ちキューからデキューして、前記再起動キューにエンキューし、
　　前記再起動キューに格納された識別子に対応するジョブを、前記初期起動キューに格納された識別子に対応するジョブよりも先に実行する
ストレージ装置制御方法。