JP4189342B2 - ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法 - Google Patents

ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法 Download PDF

Info

Publication number
JP4189342B2
JP4189342B2 JP2004069217A JP2004069217A JP4189342B2 JP 4189342 B2 JP4189342 B2 JP 4189342B2 JP 2004069217 A JP2004069217 A JP 2004069217A JP 2004069217 A JP2004069217 A JP 2004069217A JP 4189342 B2 JP4189342 B2 JP 4189342B2
Authority
JP
Japan
Prior art keywords
area
data
write
log
cache
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004069217A
Other languages
English (en)
Other versions
JP2005258789A (ja
Inventor
邦保 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2004069217A priority Critical patent/JP4189342B2/ja
Publication of JP2005258789A publication Critical patent/JP2005258789A/ja
Application granted granted Critical
Publication of JP4189342B2 publication Critical patent/JP4189342B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Memory System Of A Hierarchy Structure (AREA)

Description

本発明は、ログ領域が確保される2次記憶領域と、当該2次記憶領域に書き込むべきデータを一時格納するライトバックキャッシュとを備えたストレージ装置に係り、当該ライトバックキャッシュに記憶されているデータブロックを上記2次記憶領域に書き込むデステージ操作を含むキャッシュ制御に好適なストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法に関する。
2次記憶領域を備えたストレージ装置のホスト(上位装置)として、ネットワーク・アタッチド・ストレージ(Network Attached Storage)コントローラ(以下、NASコントローラと称する)が知られている。このNASコントローラとストレージ装置とから構成される装置はNAS装置と呼ばれる。NASコントローラは、ファイルサーバ、或いはデータベースサーバに代表されるサーバとして機能する。NASコントローラは、当該コントローラを介してストレージ装置を利用するクライアントマシン(クライアントコンピュータ)とLAN(ローカル・エリアネット・ワーク)等のネットワークを介して接続される。
NASコントローラは、一般にライトバックキャッシュを持つ。しかし、クライアントマシンからのネットワーク・ファイル・システム(Network File System)オペレーション、いわゆるNFSオペレーションなどによるストレージ装置へのアクセスの際には、NASコントローラは単純なライトバック動作を行うことができない。即ち、NASコントローラは、クライアントマシンから送信されたデータを受け取ると、そのデータがストレージ装置(の2次記憶領域)に書き込まれたことを保障した上でクライアントマシンに受信完了を返す必要がある。その理由は、NASコントローラがクライアントマシンから受け取ったデータを、当該コントローラ内のライトバックキャッシュに一時記憶しただけで、クライアントマシンに受信完了を返すと、次のような不具合が発生する可能性があるためである。つまり、NASコントローラが実際にストレージ装置にデータを書き込む前にシステムダウンした場合には、受信完了したはずのデータが失われてしまうためである。
ところで、システムのファイルシステムレベルでの無矛盾性を保障し、且つストレージ装置に対する入出力(I/O)性能を向上する技術として、ジャーナルファイルシステムが知られている。ジャーナルファイルシステムは、クライアントマシンからのデータ書き込み(データ更新)要求により、ストレージ装置の2次記憶領域内のデータイメージを変更するような操作を行う必要がある場合、次の動作を行う。まずジャーナルファイルシステムは、要求されたデータを、NASコントローラのライトバックキャッシュを介して、ログ領域と呼ばれる2次記憶領域内の特定の領域に一時保存して、クライアントマシンに書き込み完了を返す。その後の適切なタイミングで、ジャーナルファイルシステムは、上記書き込み要求で要求されたデータを2次記憶領域内の本来更新すべき箇所に実際に書き込む。この本来更新すべき箇所のデータを実データと呼び、この箇所へのデータ書き込みを、実データの書き込みまたは実データの更新と呼ぶ。この更新には、処理の高速化のために、ログ領域に保存されたデータではなくて、NASコントローラのライトバックキャッシュに記憶されたデータが用いられる。
ログ領域は連続する論理アドレスの領域に割り当てられており、データ(データ更新の履歴)を時系列順に保存するためのリングバッファとして用いられる。ログ領域に保存されたデータの集合はジャーナルファイルと呼ばれる。ログ領域にデータを保存することは「コミット処理」と呼ばれる。また、実データの更新を行うことは「チェックポイント処理」と呼ばれる。
一旦コミット処理を経たオペレーションでは、いずれ対応する実データの更新が行われることが保障される。これに対し、コミットを完了していないオペレーションでは、実データの更新が行われることはない。特にコミット処理はファイルシステム的に意味のあるオペレーションの集合としてまとめられており、複数のI/Oを伴う処理をまとめて1つのコミット単位として扱うことが多い。このため、もし不慮のシステムダウンが発生した場合でも、コミット単位で、オペレーションと2次記憶領域内のデータイメージとの一貫性が保障できる。
コミット処理中は、対応するオペレーションに関して実データの更新は行われておらず、また上位装置への書き込み完了も返されていない。このため、コミット処理完了以前にシステムダウンが発生した場合は、上記オペレーションは行われなかったことと等価になる。コミット処理を完了すれば、チェックポイントを経なくても上位装置へ書き込み完了を返すことができる。但し、これを可能にするためには、一旦コミット処理を完了したデータはいずれ必ず実データに反映されることを保障しなければならない。そこでジャーナルファイルシステムには、システムダウン等により、コミット処理は終わっているもののチェックポイント処理が未完のデータが存在する場合に、当該データがシステムリブート時に実データに反映されることを保障する機能が要求される。
最近のNASコントローラは、上述の機能を持つジャーナルファイルシステムを適用するようになっている。この種のNASコントローラは、データをストレージ装置のログ領域に保存完了した時点でクライアントマシンに受信完了を返すことができる。したがって、この種のNASコントローラは、コミット処理以降は性能的に有利なライトバック動作を行うことが可能であり、ファイルシステムレベルでの無矛盾性も保障することができる。
クライアントマシンからのデータ書き込み要求に対するストレージ装置へのI/O性能を決める重要なポイントは、コミット処理、即ちログ領域への書き込み(ログ書き込み)の応答性である。コミット処理が遅い場合には、それだけクライアントマシンへの処理完了通知も遅くなる。
ところで、最近のストレージ装置は、ライトバックキャッシュ(ライトバック方式を適用するディスクキャッシュ)を備えているのが一般的である(例えば、特許文献1参照)。このストレージ装置のライトバックキャッシュは、バッテリバックアップ等により、不慮のシステムダウンの際にも当該キャッシュ上のデータが保護されるように設計されている。したがって、一旦ストレージ装置のライトバックキャッシュに保存されたデータは、いずれストレージ装置の2次記憶領域に書き込まれることが保障される。
そこで最近は、ログ書き込みの際に、ログ領域に書き込むべきデータを、その書き込み先に対応する、ストレージ装置のライトバックキャッシュ内の箇所に一時保存して、コミット処理を完了させることで、一層の性能向上が図られている。このストレージ装置のライトバックキャッシュを利用すると、チェックポイント処理も、NASコントローラのライトバックキャッシュ上のデータを、2次記憶領域内の本来更新すべき箇所に対応する、ストレージ装置のライトバックキャッシュの箇所に一時保存するだけで、完了させることができる。
特開平10−293717(段落0003乃至0005)
上記した従来技術においては、ストレージ装置を利用するホスト(例えばNASコントローラ)が、当該ストレージ装置が有するライトバックキャッシュを利用してコミット処理及びチェックポイント処理を行うことにより、当該コミット処理及びチェックポイント処理の高速化が図られている。
ストレージ装置のライトバックキャッシュに保存されたデータは、当該ストレージ装置自身によって、ホストによるストレージ装置に対するI/O動作(以下、ホストI/Oと称する)とは非同期に、ストレージ装置の2次記憶領域に書き込まれる。この書き込みを、デステージまたはデステージ操作と呼ぶ。
さて、デステージ操作の対象となっているライトバックキャッシュ上のデータブロック(つまりキャッシュブロック)はリザーブ状態となり、ホストI/Oによるデータの更新を行うことはできない。したがって、ある論理アドレスに割り当てられたキャッシュブロックがデステージ中の場合、同じ論理アドレスに対するホストI/Oは、デステージ操作が完了してキャッシュブロックのリザーブ状態が解除されるまで待たされる。つまり、ライトバックキャッシュを備えたストレージ装置では、ホストI/Oとデステージとのキャッシュブロック上での競合が発生する。この競合の発生は、ストレージ装置としての性能に大きく影響を与える。特に、ホストがジャーナルファイルシステムを採用している場合には、この競合が頻繁に発生するため問題である。本発明者は、この競合が頻繁に発生する原因が、ホストI/Oによるログ書き込み(ストレージ装置の2次記憶領域に確保されているログ領域に対応する論理アドレスに対する書き込み)が繰り返し行われることにあると認識するに至った。
本発明は上記事情を考慮してなされたものでその目的は、ホストI/Oとデステージとのキャッシュブロック上での競合が頻繁に発生するのを抑制することができるストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法を提供することにある。
本発明の1つの観点によれば、ホストからのデータ更新の履歴を時系列順に保存するための、論理アドレスが連続するログ領域が確保される2次記憶領域と、前記2次記憶領域に書き込むべきデータを一時格納するための、キャッシュブロック単位で管理されるライトバックキャッシュとを備えたストレージ装置が提供される。このストレージ装置は、上記ホストのコミット処理またはチェックポイント処理の開始に伴う書き込み要求を受けて、要求されたデータを上記ライトバックキャッシュ上の上記キャッシュブロックに格納するデータ格納手段と、上記ライトバックキャッシュ上の更新されたキャッシュブロックのデータを上記2次記憶上の本来の書き込み先に書き込むためのデステージ操作を制御するデステージ制御手段であって、上記ログ領域内を本来の書き込み先とする上記ライトバックキャッシュ上のデータが格納された、ログ領域相当のキャッシュブロックが上記デステージ操作の対象となるのを抑制するデステージ制御手段とを具備する。
上記の構成において、ホストからストレージ装置に対して、コミット処理の開始またはチェックポイント処理の開始に伴う書き込み要求が送られた場合、当該ストレージ装置では、当該書き込み要求に従って2次記憶領域にデータを書き込む代わりに、その2次記憶領域内の本来の書き込み先に対応する、ライトバックキャッシュ上のキャッシュブロックにデータを書き込む(格納する)動作(ホストI/O)が行われる。ここで、ホストからの書き込み要求で指定される2次記憶領域の書き込み先は、上記ログ領域内またはログ領域外(つまり実データ領域内)のいずれかである。
デステージ制御手段は、上記のデータ書き込み(ホストI/O)によって更新されたライトバックキャッシュ上のキャッシュブロックのデータを、上記2次記憶領域内の本来の書き込み先に書き込むためのデステージ操作の実行に際し、上記ログ領域内を本来の書き込み先とする上記ライトバックキャッシュ上のデータが格納されたキャッシュブロックが上記デステージ操作の対象となるのを抑制する。
一般に、ログ領域が上記2次記憶領域内に占める割合は極めて小さい。また、ログ領域はリング状に使用される。したがって、ログ領域内の各ブロックが使用される頻度は、ログ領域外(つまり実データ領域内)の各ブロックが使用される頻度に比べて著しく高い。そこで、上記の構成において、ログ領域内を本来の書き込み先とするライトバックキャッシュ上のデータが格納されたキャッシュブロック、つまりログ領域相当のキャッシュブロックが、上記デステージ操作の対象となるのを抑制することにより、当該キャッシュブロックが頻繁にリザーブ状態となるのを極力避けることができる。これにより、ホストI/Oとデステージとのキャッシュブロック上での競合が頻繁に発生するのを抑制でき、ログ書き込みのレスポンスタイムの遅延を抑止して、ストレージ装置としての性能を向上できる。
ここで、ログ領域相当のキャッシュブロックが、上記デステージ操作の対象となるのを抑制するためには、デステージ制御手段が、ライトバックキャッシュ上の各キャッシュブロックを、ログ領域相当のキャッシュブロックであるかそれ以外のキャッシュブロック(実データ領域相当のキャッシュブロック)であるかを判定または推定できれば良い。例えば、ホストからストレージ装置に対して、ログ領域が割り当てられる論理アドレス範囲が通知されるならば、上記判定が可能である。しかし、ログ領域内の各ブロックが使用される頻度が、実データ領域内の各ブロックが使用される頻度に比べて著しく高いことを利用するならば、使用される頻度が高いキャッシュブロックをログ領域相当のキャッシュブロックと推定しても、誤って推定される確率は極めて低く、したがってホストI/Oとデステージとのキャッシュブロック上での競合が頻繁に発生するのを効果的に抑制できる。
本発明によれば、ログ領域内を本来の書き込み先とするライトバックキャッシュ上のデータが格納されたキャッシュブロックがデステージ操作の対象となるのを抑制することにより、ホストI/Oとデステージとのキャッシュブロック上での競合が頻繁に発生するのを抑制でき、ログ書き込みのレスポンスタイムの遅延を抑止して、ストレージ装置としての性能を向上できる。
以下、本発明の実施の形態につき図面を参照して説明する。
図1は本発明の一実施形態に係るストレージシステムの構成を示すブロック図である。図1において、NASコントローラ10は例えばSCSI(Small Computer System Interface)バス20を介してストレージ装置30と接続されている。SCSIバス20に代えてFC(Fibre Channel)バスを用いることも可能である。NASコントローラ10はまた、ネットワーク40を介してクライアントマシン(以下、クライアントと称する)41-1〜41-Nと接続されている。
NASコントローラ10は、例えば、ジャーナルファイルシステムを実現するためのファイルサーバとして機能し、クライアント41-1〜41-Nに対してネットワーク40を介してストレージ装置30のストレージ領域を提供する。NASコントローラ10は、ストレージ装置30を管理するためのストレージ管理モジュール11と、ライトバック方式を適用するキャッシュ(つまりライトバックキャッシュ)として用いられるキャッシュメモリ12とを備えている。ストレージ管理モジュール11は、ジャーナルファイルを含むファイルを管理するファイルシステム(図示せず)を含む。
ストレージ装置30は、2次記憶領域を実現するためのディスク31と、当該ディスク31へのアクセスを制御するストレージコントローラSCとを備えている。ストレージコントローラSCは、ライトバックキャッシュ(ライトバック方式を適用するディスクキャッシュ)として用いられるキャッシュメモリ32と、当該キャッシュメモリ32を管理するキャッシュ管理モジュール33とを備えている。キャッシュ管理モジュール33は、ストレージ装置30にインストールされた特定のソフトウェアプログラムを当該ストレージ装置30が読み取って実行することにより実現される。このプログラムは、コンピュータで読み取り可能な記憶媒体、例えばフロッピー(登録商標)ディスクに代表される磁気ディスク、CD−ROM、DVDに代表される光ディスク、フラッシュメモリに代表される半導体メモリ等の記憶媒体に予め格納して頒布可能である。また、このプログラムが、ネットワークを介してダウンロード(頒布)されても構わない。
ディスク31は、物理ディスク、或いは当該物理ディスクの集合体としての論理ディスクのいずれであっても構わない。ディスク31の領域(2次記憶領域)には、ログ領域311と実データ領域312とが確保されている。ログ領域311と実データ領域312とに割り当てられるディスク31上の領域は、NASコントローラ10のストレージ管理モジュール11によって指定される。ログ領域311は連続する論理アドレスの領域に割り当てられている。ログ領域311は、データ更新の履歴を時系列順に保存するための、論理アドレスが連続するリングバッファとして用いられる。
キャッシュメモリ32は、バッテリバックアップ等によりシステムダウンの際にも当該キャッシュ上のデータが保護されるように構成されている。したがって、たとえキャッシュメモリ32自体に揮発性メモリが用いられているとしても、当該キャッシュメモリ32は機能的には一種の書き換え可能な不揮発性メモリである。キャッシュメモリ32は、例えばmウェイセットアソシアティブ方式(mは2以上の整数)のキャッシュである。
図2は、キャッシュメモリ32の構成(キャッシュ構成)を示す。同図に示すように、キャッシュメモリ32の領域は、m行(ロウ)n桁(カラム)に分割して、つまりn×m個のキャッシュブロックに分割して用いられる。本実施形態では、キャッシュメモリ32の一部の領域、例えば第0行乃至第k−1行(つまりセット0乃至k−1)のk行(kセット)は、ディスク31のログ領域311に相当する特定領域(以下、ログ相当領域と称する)321に割り当てられる。キャッシュメモリ32の残りの領域、つまり第k行乃至第m−1行(つまりセットk乃至m−1)のm−k行(m−kセット)は、ディスク31の実データ領域312に相当する特定領域(以下、実データ相当領域と称する)322に割り当てられる。
次に、図1のシステムの動作を説明する。
まず、NASコントローラ10のシステムブート時の動作について、図3のシーケンスチャートを参照して説明する。
NASコントローラ10のストレージ管理モジュール11は、システムブート時に、ストレージ装置30のキャッシュ管理モジュール33に対し、ディスク31上でログ領域311として使用するディスク31上の領域の論理アドレスを通知する(ステップS1)。すると、キャッシュ管理モジュール33はログ相当領域割り当て手段として機能して、ストレージ管理モジュール11によって通知されたログ領域311の論理アドレスに相当するキャッシュメモリ32上の領域を、ログ相当領域321として割り当てる(ステップS2)。この場合、キャッシュメモリ32上のログ相当領域321以外の領域は、ディスク31上の実データ領域312に相当する実データのためのキャッシュ領域、即ち実データ相当領域322として使用することができる。
次に、クライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合の動作について、図4のシーケンスチャートを参照して説明する。
今、クライアント41-1からNASコントローラ10に対して、データ書き込み要求が送信されたものとする(ステップS11)。NASコントローラ10のストレージ管理モジュール11は、クライアント41-1からのデータ書き込み要求に応じて、要求された書き込みデータを受け取り、コミット処理を開始する(ステップS12)。
ストレージ管理モジュール11はまず、受け取ったデータをキャッシュメモリ12に格納すると共に、ストレージ装置30に対して書き込み要求(ここではログ書き込み要求)を送出する(ステップS13)。この場合の書き込み要求(ログ書き込み要求)で指定される書き込み先(ログ書き込み先)の論理アドレスは、システムブート時にNASコントローラ10のストレージ管理モジュール11から通知されたログ領域の論理アドレスの範囲内、つまりディスク31上に確保されるログ領域311の論理アドレスの範囲に入っている。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求を受け取ると、当該要求で指定される書き込み先の論理アドレスがログ領域311の論理アドレス範囲に入っているか否かを判定する。この例のように、、ストレージ管理モジュール11から要求された書き込み先の論理アドレスがログ領域311の論理アドレス範囲に入っている場合、キャッシュ管理モジュール33は当該書き込み要求がログ書き込み要求であると判定する。この場合、キャッシュ管理モジュール33はデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上のログ相当領域321に保存する(ステップS14)。ここでは、要求されたデータは、ブロック単位で、ログ相当領域321内の第i(iは0〜k−1のいずれか)行(セットi)のうちの対応するカラムのキャッシュブロックに保存される。キャッシュ管理モジュール33はステップS14の後、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS15)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここではログ書き込み完了)が通知されると、コミット処理を完了し、クライアント41-1に書き込み完了を通知する(ステップS16,S17)。
その後、NASコントローラ10のストレージ管理モジュール11はチェックポイント処理を開始する(ステップS18)。ストレージ管理モジュール11はまず、キャッシュメモリ12上で更新されたデータ(つまり、キャッシュメモリ12上での更新がストレージ装置30に反映されていないダーティなデータ)を当該ストレージ装置30の実データ領域312に書き込ませるために、ストレージ装置30のキャッシュ管理モジュール33に書き込み要求(実データ書き込み要求)を発行する(ステップS19)。この場合の書き込み要求で指定される書き込み先(実データ書き込み先)の論理アドレスは、ログ領域311の論理アドレスの範囲から外れている。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求を受け取ると、当該要求で指定される書き込み先の論理アドレスがログ領域311の論理アドレス範囲に入っているか否かを判定する。この例のように、ストレージ管理モジュール11から要求された書き込み先の論理アドレスがログ領域311の論理アドレス範囲から外れている場合、キャッシュ管理モジュール33は当該書き込み要求がログ書き込み要求でない、つまり実データ書き込み要求であると判定する。この場合、キャッシュ管理モジュール33はデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上の実データ相当領域322に保存する(ステップS20)。ここでは、要求されたデータは、ブロック単位で、実データ相当領域322内の第j(jはk〜m−1のいずれか)行(セットj)のうちの対応するカラムのキャッシュブロックに保存される。キャッシュ管理モジュール33はステップS20の後、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS21)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここでは実データ書き込み完了)が通知されると、書き込みを完了した実データに対応して自身が管理しているログ上のデータを破棄して、チェックポイント処理を完了する(ステップS22)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10からのストレージ装置30に対するI/O(ホストI/O)とは非同期にデステージ制御手段として機能して、予め定められたタイミングでデステージ操作を行う。本実施形態の特徴は、このデステージ操作が、キャッシュメモリ32の実データ相当領域322上で更新されたデータ(つまり、キャッシュメモリ32の実データ相当領域322上での更新がストレージ装置30に反映されていないダーティなデータ)のみを対象に行われる点にある(ステップS23)。換言すれば、本実施形態の特徴は、キャッシュメモリ32のログ相当領域321のデータブロックをデステージの対象としない点にある。上記の予め定められたタイミングとは、定期的なタイミングであるものとする。この他に、上記ステップS20でキャッシュメモリ12の実データ相当領域322にデータを格納しようとした際に、当該実データ相当領域322内の対応するカラムのキャッシュブロックが全てダーティブロックとなっている場合、つまり対応するカラムに空きブロックがない場合を、上記の予め定められたタイミングとしても良い。
以上の処理により、通常のNASコントローラ10とクライアント41-1〜41-Nとの間のデータの受け渡しの途中で、ストレージ装置30のキャッシュメモリ32のログ相当領域321を対象とするデステージが発生するのを抑制することができる。つまり、ホストI/Oとデステージとのキャッシュブロック上での競合が頻繁に発生するのを抑制できる。この結果、たとえログ書き込みが頻繁に行われても、キャッシュメモリ32上の対応するキャッシュブロックがリザーブ状態となることを抑止して、ログ書き込みの遅延を小さくすることが可能になり、ストレージ装置30としての性能を向上できる。
なお、NASコントローラ10のシャットダウン処理、或いはNASコントローラ10から要求されるキャッシュシンク処理(つまりキャッシュメモリ32の内容をディスク31に反映させるための処理)の場合は、キャッシュ管理モジュール33は、ログ相当領域321と実データ相当領域322とに無関係に、キャッシュメモリ32上の全ての更新されたデータをディスク31に書き出す。
[第1の変形例]
次に、上記実施形態の第1の変形例について説明する。第1の変形例では、上記実施形態と異なって、NASコントローラ10のストレージ管理モジュール11からストレージ装置30のキャッシュ管理モジュール33に対して、ディスク31上でログ領域311として使用するディスク31上の領域の論理アドレスは通知されない。このため、キャッシュ管理モジュール33は、キャッシュメモリ32のキャッシュメモリ領域を、ログ相当領域321と実データ相当領域322とに区分して用いることはできない。そこで第1の変形例では、キャッシュメモリ32の各キャッシュブロックのうち、ログ領域311内のブロックが割り当てられるキャッシュブロック(以下、ログ領域相当のブロックまたはログ領域相当のキャッシュブロックと称する)のデータ(つまりログデータ)は頻繁に更新されることを利用して、キャッシュメモリ32上のログデータを対象とするデステージの発生を抑制可能としている。つまり第1の変形例の特徴は、キャッシュメモリ32の各キャッシュブロックのうちデステージの対象とするブロックを、アクセス頻度に応じて選択するようにした点にある。
そこで、ストレージ装置30のキャッシュ管理モジュール33は、キャッシュメモリ32の各キャッシュブロックのアクセス頻度を管理するために、図5に示すアクセス頻度管理テーブル331を有する。このアクセス頻度管理テーブル331の各エントリは、キャッシュメモリ32の各キャッシュブロックBij(i=0〜m−1,j=0〜n−1)に対応付けられており、当該ブロックBijのアクセス頻度を管理するためのアクセス頻度情報Fijを保持する。アクセス頻度情報Fijは、対応するブロックが一定時間にアクセス(更新)された回数を示す。但し、キャッシュブロックのデータがデステージされた場合には、アクセス頻度情報Fijは初期化され、当該アクセス頻度情報Fijの示すアクセス頻度は0となる。
次に、上記実施形態の第1の変形例の動作を、上記実施形態と同様に、クライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合を例に、図6のシーケンスチャートを参照して説明する。。
NASコントローラ10のストレージ管理モジュール11は、クライアント41-1からのデータ書き込み要求に応じて(ステップS31)、要求された書き込みデータを受け取り、コミット処理を開始する(ステップS32)。ストレージ管理モジュール11は、受け取ったデータをキャッシュメモリ12に格納すると共に、ストレージ装置30に対して書き込み要求(ここではログ書き込み要求)を送出する(ステップS33)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求を受け取るとデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上のキャッシュブロックに保存する(ステップS34a)。同時にキャッシュ管理モジュール33はアクセス頻度管理手段として機能して、要求されたデータが保存されたキャッシュブロックに対応するアクセス頻度管理テーブル331のエントリに保持されているアクセス頻度情報を更新する(ステップS34b)。その後、キャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS35)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここではログ書き込み完了)が通知されると、コミット処理を完了し、クライアント41-1に書き込み完了を通知する(ステップS36,S37)。
その後、NASコントローラ10のストレージ管理モジュール11はチェックポイント処理を開始する(ステップS38)。ストレージ管理モジュール11はまず、キャッシュメモリ12上で更新されたデータをディスク31の実データ領域312に書き込ませるために、ストレージ装置30のキャッシュ管理モジュール33に書き込み要求(実データ書き込み要求)を発行する(ステップS39)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求(実データ書き込み要求)を受け取るとデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上の対応するキャッシュブロックに保存する(ステップS40a)。同時にキャッシュ管理モジュール33はアクセス頻度管理手段として機能して、要求されたデータが保存されたキャッシュブロックに対応するアクセス頻度管理テーブル331のエントリに保持されているアクセス頻度情報を更新する(ステップS40b)。その後、キャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS41)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここでは実データ書き込み完了)が通知されると、書き込みを完了したログ上のデータを破棄して、チェックポイント処理を完了する(ステップS42)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10からのストレージ装置30に対するI/O(ホストI/O)とは非同期にデステージ制御手段として機能して、上記実施形態と同様のタイミングでデステージ処理(ステップS43)を行う。このデステージ処理(ステップS43)の具体的な手順について、図7のフローチャートを参照して説明する。
まずキャッシュ管理モジュール33は、アクセス頻度管理テーブル331の各エントリに保持されているアクセス頻度情報Fijを参照する(ステップS43a)。次にキャッシュ管理モジュール33は、各アクセス頻度情報Fijによって示される、キャッシュメモリ32の各キャッシュブロックBijのアクセス頻度をもとに、当該各キャッシュブロックのうち、アクセス頻度が一定レベルよりも低いキャッシュブロックを、実データ領域312内のブロックが割り当てられるキャッシュブロック(以下、実データ領域相当のブロックまたは実データ領域相当のキャッシュブロックと称する)であると推定して選択する(ステップS43b)。キャッシュ管理モジュール33は、この選択されたキャッシュブロック、即ちアクセス頻度が一定レベルよりも低い、実データ領域相当のキャッシュブロックであると推定されたキャッシュブロックだけを対象にデステージ操作を行う(ステップS43c)。デステージされたキャッシュブロックのアクセス頻度情報は初期化される。ここでは、アクセス頻度が一定レベルを超えているキャッシュブロックは、ログ領域相当のキャッシュブロックと推定されて、デステージの対象から外される。
以上の処理により、アクセス頻度が一定レベルを超えているキャッシュブロックはデステージの対象とはならない。ここで、ディスク31の記憶領域(2次記憶領域)のうち、ログ領域311の占める割合は実データ領域312に比較して著しく小さい。しかし、ログ書き込み要求と実データ書き込み要求とは同一回数発生する。このことは、ログ領域311内の各ブロックのアクセス頻度をF1、実データ領域312内の各ブロックのアクセス頻度をF2で表すと、F1≫F2となることを意味する。したがって、ストレージ装置30のキャッシュメモリ32の各キャッシュブロックのうちアクセス頻度が高いブロックは、ログ領域311に対応するキャッシュブロック(ログ領域相当のキャッシュブロック)である確率が高い。同様に、キャッシュメモリ32の各キャッシュブロックのうちアクセス頻度が低いブロックは、実データ領域312に対応するキャッシュブロック(実データ領域相当のキャッシュブロック)である確率が高い。したがって第1の変形例においては、キャッシュメモリ32のキャッシュブロックのうち、実データ領域相当のキャッシュブロックがデステージの対象となる確率が高い。よって第1の変形例によれば、通常のNASコントローラ10とクライアント41-1〜41-Nとの間のデータの受け渡しの途中で、キャッシュメモリ32上のログ領域相当のブロックを対象とするデステージ(つまりログデータのデステージ)が発生するのを抑制することができる。この結果、たとえログ書き込みが頻繁に行われても、キャッシュメモリ32上の対応するキャッシュブロックがリザーブ状態となることを抑止して、ログ書き込みの遅延を小さくすることが可能になる。
なお、NASコントローラ10のシャットダウン処理、或いはNASコントローラ10から要求されるキャッシュシンク処理の場合は、キャッシュ管理モジュール33は、アクセス頻度に無関係に、キャッシュメモリ32上の全ての更新されたデータをディスク31に書き出す。
[第2の変形例]
次に、上記実施形態の第2の変形例について説明する。第2の変形例の特徴は、キャッシュメモリ32の各キャッシュブロックのアクセス頻度を管理する代わりに、デステージの対象となるキャッシュブロックの順番を、LRU(Least Recently Used)ルールに従って管理するようにした点にある。
そこで、ストレージ装置30のキャッシュ管理モジュール33は、キャッシュメモリ32上のデステージの対象となるキャッシュブロック(つまりダーティブロック)の順番を管理するためのデステージ待ちブロック管理テーブルとしての、図8に示すデステージ待ち行列(デステージキュー)332を有する。このデステージ待ち行列332は、キャッシュメモリ32上の各ダーティブロックBijの識別子(ブロックID)の列であり、デステージの対象となるダーティブロックの列を表す。デステージ待ち行列332におけるブロックIDの並び順、つまりダーティブロックの並び順はLRUルールに従って管理される。
次に、第2の変形例の動作の概要について説明する。まず、NASコントローラ10のストレージ管理モジュール11は、システムブート時に、ストレージ装置30のキャッシュ管理モジュール33に対し、ディスク31上でログ領域311として使用するディスク31上の領域のサイズ(つまりログサイズ)を通知する。ここでは、キャッシュメモリ32のキャッシュメモリ領域は、ログ相当領域321と実データ相当領域322とに区分されない。
ストレージ装置30のキャッシュ管理モジュール33は、キャッシュメモリ32内のデステージ操作の対象となるダーティブロックの順番を、LRUルールに従って更新されるデステージ待ち行列332により管理する。つまりキャッシュ管理モジュール33は、ダーティブロックであっても使用頻度の高いキャッシュブロックは、デステージ対象としての優先度を低くする。このため、ログ領域相当のキャッシュブロックのように、使用頻度の高いキャッシュブロックは他のダーティブロックよりもデステージの優先度が低くなる。更にキャッシュ管理モジュール33は、キャッシュメモリ32内のダーティブロックの総容量が、NASコントローラ10のストレージ管理モジュール11から通知されたログサイズ以下の状態では、キャッシュメモリ32内のダーティブロックは全てログ領域相当のキャッシュブロックである可能性が高いとして、デステージを行わない。以上の仕組みにより、使用頻度の高いログ領域相当のキャッシュブロックがデステージ対象として選択されることを避けることができる。
次に、第2の変形例の動作の詳細について、クライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合を例に、図9のシーケンスチャートを参照して説明する。
NASコントローラ10のストレージ管理モジュール11は、クライアント41-1からのデータ書き込み要求に応じて(ステップS51)、要求された書き込みデータを受け取り、コミット処理を開始する(ステップS52)。ストレージ管理モジュール11は、受け取ったデータをキャッシュメモリ12に格納すると共に、ストレージ装置30に対して書き込み要求(ここではログ書き込み要求)を送出する(ステップS53)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求を受け取るとデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上のキャッシュブロックに保存する(ステップS54a)。同時にキャッシュ管理モジュール33はデステージ待ちブロック管理手段として機能して、要求されたデータが保存されたキャッシュブロック(つまりダーティブロック)のIDを、デステージ待ち行列332の最後尾につなぐ(ステップS54b)。以下の説明では、説明を簡略化するために、デステージ待ち行列332がキャッシュブロック(ダーティブロック)の列であるとして扱う。その後、キャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS55)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここではログ書き込み完了)が通知されると、コミット処理を完了し、クライアント41-1に書き込み完了を通知する(ステップS56,S57)。
その後、NASコントローラ10のストレージ管理モジュール11はチェックポイント処理を開始する(ステップS58)。ストレージ管理モジュール11はまず、キャッシュメモリ12上で更新されたデータをディスク31の実データ領域312に書き込ませるために、ストレージ装置30のキャッシュ管理モジュール33に書き込み要求(実データ書き込み要求)を発行する(ステップS59)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求(実データ書き込み要求)を受け取るとデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上の対応するキャッシュブロックに保存する(ステップS60a)。同時にキャッシュ管理モジュール33はデステージ待ちブロック管理手段として機能して、要求されたデータが保存されたキャッシュブロックを、デステージ待ち行列332の最後尾につなぐ(ステップS60b)。その後、キャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS61)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここでは実データ書き込み完了)が通知されると、書き込みを完了したログ上のデータを破棄して、チェックポイント処理を完了する(ステップS62)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10からのストレージ装置30に対するI/O(ホストI/O)とは非同期にデステージ制御手段として機能して、予め定められたタイミングで(例えば定期的に)デステージ処理(ステップS63)を行う。このデステージ処理(ステップS63)の具体的な手順について、図10のフローチャートを参照して説明する。
まずキャッシュ管理モジュール33は、キャッシュメモリ32内のダーティブロックの数をカウントして、当該ダーティブロックの数からダーティブロックの総容量を算出する(ステップS63a,S63b)。次にキャッシュ管理モジュール33は、ダーティブロックの総容量が、NASコントローラ10のストレージ管理モジュール11から通知されたログサイズを超えているかを判定する(ステップS63c)。キャッシュ管理モジュール33は、ダーティブロックの総容量が、ログサイズを超えている場合に限り、キャッシュメモリ32内のダーティブロックが、実データ領域相当のキャッシュブロックを含んでいるとして、デステージの対象となるキャッシュブロックを選択する(ステップS63d)。ここでは、ステージ待ち行列332によって管理されているダーティブロックのうち、ログサイズを超えた分の先頭側のダーティブロック、つまり最後にアクセスがあってからの時間経過がより大きいダーティブロックが、実データ領域相当のキャッシュブロックであると推定されて選択される。これに対し、ステージ待ち行列332の後尾側のダーティブロック、即ち頻繁にアクセスされるダーティブロックは、ログ領域相当のキャッシュブロックであると推定されて、デステージの対象から外される。キャッシュ管理モジュール33は、ステップS63cで選択されたダーティブロックを対象にデステージ操作を行う(ステップS63e)。デステージされたブロックは、デステージ待ち行列332から外される。
以上の処理により、キャッシュメモリ32上の使用頻度の高いログ領域相当のキャッシュブロックがデステージ対象として選択されるのを抑制できる。よって第2の変形例によれば、通常のNASコントローラ10とクライアント41-1〜41-Nとの間のデータの受け渡しの途中で、ログデータのデステージが発生するのを抑制することができる。この結果、たとえログ書き込みが頻繁に行われても、キャッシュメモリ32上の対応するキャッシュブロックがリザーブ状態となることを抑止して、ログ書き込みの遅延を小さくすることが可能になる。
なお、NASコントローラ10のシャットダウン処理、或いはNASコントローラ10から要求されるキャッシュシンク処理の場合は、キャッシュ管理モジュール33は、デステージ待ち行列332の状態に無関係に、キャッシュメモリ32上の全ての更新されたデータをディスク31に書き出す。
[第3の変形例]
次に、上記実施形態の第3の変形例について説明する。第3の変形例の特徴は、デステージの対象となるキャッシュブロック(ダーティブロック)の順番を、キャッシュメモリ32のカラム(キャッシュカラム)毎に、LRUルールに従って管理するようにした点にある。
そこで、ストレージ装置30のキャッシュ管理モジュール33は、キャッシュメモリ32のカラム0〜n−1に対応して、図11に示すデステージ待ち行列(デステージキュー)332-0〜332-(n-1)を有する。デステージ待ち行列332-j(j=0〜n−1)は、キャッシュメモリ32のカラムjに属する各ダーティブロックBijのブロックIDの列であり、カラムjにおいてデステージの対象となるダーティブロックの列を表す。デステージ待ち行列332-jにおけるブロックIDの並び順、つまりダーティブロックの並び順はLRUルールに従って管理される。
次に、第3の変形例の動作の概要について説明する。まず、NASコントローラ10のストレージ管理モジュール11は、システムブート時に、ストレージ装置30のキャッシュ管理モジュール33に対し、ディスク31上でログ領域311として使用するディスク31上の領域の、ストレージ装置30のキャッシュメモリ32の総容量に対する割合Rを通知する。ここでは、キャッシュメモリ32のキャッシュメモリ領域は、ログ相当領域321と実データ相当領域322とに区分されない。
キャッシュメモリ32は、図2に示されているように、mウェイセットアソシアティブ方式のキャッシュである。キャッシュメモリ32の各カラム(キャッシュカラム)jには、論理アドレスに対して同一のハッシュ値を持つキャッシュブロックが割り当てられる。このため、ログ領域311のように論理アドレス上で連続する領域に相当するキャッシュブロックは、各カラムに一様に分散して割り当てられることになる。なお、上記実施形態、第1の変形例及び第2の変形例では、キャッシュメモリ32は必ずしもmウェイセットアソシアティブ方式のキャッシュである必要はない。
ストレージ装置30のキャッシュ管理モジュール33は、キャッシュメモリ32内のデステージ操作の対象となるキャッシュブロックの順番を、カラムj毎にLRUルールに従って更新されるデステージ待ち行列332-jにより管理する。つまりキャッシュ管理モジュール33は、カラムjに属するキャッシュブロックのうち、使用頻度の高いキャッシュブロックはダーティブロックであってもデステージ対象としての優先度を低くする。このため、ログ領域相当のキャッシュブロックのように、使用頻度の高いキャッシュブロックは他のダーティブロックよりもデステージの優先度が低くなる。更にキャッシュ管理モジュール33は、カラムjに属するキャッシュブロックの数に対するダーティブロックの数の割合Rjが、NASコントローラ10のストレージ管理モジュール11から通知された割合R以下の状態では、カラムjに属するダーティブロックは全てログ領域相当のキャッシュブロックである可能性が高いとして、デステージを行わない。以上の仕組みにより、使用頻度の高いログ領域に相当するキャッシュブロックがデステージ対象として選択されることを避けることができる。
次に、第3の変形例の動作の詳細について、クライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合を例に、図12のシーケンスチャートを参照して説明する。
NASコントローラ10のストレージ管理モジュール11は、クライアント41-1からのデータ書き込み要求に応じて(ステップS71)、要求された書き込みデータを受け取り、コミット処理を開始する(ステップS72)。ストレージ管理モジュール11は、受け取ったデータをキャッシュメモリ12に格納すると共に、ストレージ装置30に対して書き込み要求(ここではログ書き込み要求)を送出する(ステップS73)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求を受け取るとデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上のキャッシュブロックに保存する(ステップS74a)。このキャッシュブロックは、書き込み要求で指定された論理アドレスで決まるキャッシュメモリ32上のカラムjに属するクリーンなキャッシュブロック(つまり、データ更新がディスク31に既に反映されているキャッシュブロック)の中から選択される。同時にキャッシュ管理モジュール33はデステージ待ちブロック管理手段として機能して、要求されたデータが保存されたキャッシュブロック(のID)を、デステージ待ち行列332-jの最後尾につなぐ(ステップS74b)。その後、キャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS75)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここではログ書き込み完了)が通知されると、コミット処理を完了し、クライアント41-1に書き込み完了を通知する(ステップS76,S77)。
その後、NASコントローラ10のストレージ管理モジュール11はチェックポイント処理を開始する(ステップS78)。ストレージ管理モジュール11はまず、キャッシュメモリ12上で更新されたデータをディスク31の実データ領域312に書き込ませるために、ストレージ装置30のキャッシュ管理モジュール33に書き込み要求(実データ書き込み要求)を発行する(ステップS79)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11からの書き込み要求(実データ書き込み要求)を受け取るとデータ格納手段として機能して、要求されたデータを、キャッシュメモリ32上の対応するカラムに属するキャッシュブロックに保存する(ステップS80a)。同時にキャッシュ管理モジュール33はデステージ待ちブロック管理手段として機能して、要求されたデータが保存されたキャッシュブロックを、デステージ待ち行列332-0〜332-(n-1)のうちの対応するデステージ待ち行列の最後尾につなぐ(ステップS80b)。その後、キャッシュ管理モジュール33は、NASコントローラ10のストレージ管理モジュール11に対して書き込み完了を通知する(ステップS81)。
ストレージ管理モジュール11は、ストレージ装置30のキャッシュ管理モジュール33から書き込み完了(ここでは実データ書き込み完了)が通知されると、書き込みを完了したログ上のデータを破棄して、チェックポイント処理を完了する(ステップS82)。
ストレージ装置30のキャッシュ管理モジュール33は、NASコントローラ10からのストレージ装置30に対するI/O(ホストI/O)とは非同期にデステージ制御手段として機能して、予め定められたタイミングで(例えば定期的に)デステージ処理(ステップS83)を行う。このデステージ処理(ステップS83)の具体的な手順について、図13のフローチャートを参照して説明する。
まずキャッシュ管理モジュール33は、キャッシュメモリ32のカラムj毎にダーティブロック数をカウントして、当該カラムjに属するキャッシュブロックの数に対するダーティブロックの数の割合Rjを算出する(ステップS83a,S83b,S83c,S83g,S83h)。次にキャッシュ管理モジュール33は、カラムj毎に、ダーティブロックの数の割合Rjが、NASコントローラ10のストレージ管理モジュール11から通知された割合Rを超えているかを判定する(ステップS83d)。キャッシュ管理モジュール33は、RjがRを超えているカラムjに限り、当該カラムjのダーティブロックが、実データ領域相当のキャッシュブロックを含んでいるとして、デステージの対象となるキャッシュブロックを選択する(ステップS83e)。ここでは、デステージ待ち行列332-jによって管理されているダーティブロックのうち、割合Rを超えた分の先頭側のダーティブロック、つまり最後にアクセスがあってから時間経過がより大きいダーティブロックが、実データ領域相当のキャッシュブロックであると推定されて選択される。これに対し、ステージ待ち行列332-jの後尾側のダーティブロック、即ち頻繁にアクセスされるダーティブロックは、ログ領域相当のキャッシュブロックであると推定されて、デステージの対象から外される。キャッシュ管理モジュール33は、ステップS83cで選択されたダーティブロックを対象にデステージ操作を行う(ステップS83f)。デステージされたキャッシュブロックは、デステージ待ち行列332-jから外される。
以上の処理により、キャッシュメモリ32上の使用頻度の高いログ領域相当のキャッシュブロックがデステージ対象として選択されるのを、カラム単位で抑制できる。よって第2の変形例によれば、通常のNASコントローラ10とクライアント41-1〜41-Nとの間のデータの受け渡しの途中で、ログデータのデステージが発生するのを抑制することができる。この結果、たとえログ書き込みが頻繁に行われても、キャッシュメモリ32上の対応するキャッシュブロックがリザーブ状態となることを抑止して、ログ書き込みの遅延を小さくすることが可能になる。
なお、ストレージ装置30のシャットダウン処理、或いはNASコントローラ10から要求されるキャッシュシンク処理の場合は、キャッシュ管理モジュール33は、デステージ待ち行列332-0〜332-(n-1)の状態に無関係に、キャッシュメモリ32上の全ての更新されたデータをディスク31に書き出す。
本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態または変形例に亘る構成要素を適宜組み合せてもよい。
本発明の一実施形態に係るストレージシステムの構成を示すブロック図。 図1中のキャッシュメモリ32の構成を示すブロック図。 同実施形態におけるNASコントローラ10のシステムブート時の動作手順を示すシーケンスチャート。 同実施形態においてクライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合の動作手順を示すシーケンスチャート。 同実施形態の第1の変形例で適用されるアクセス頻度管理テーブル331のデータ構造例を示す図。 同第1の変形例においてクライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合の動作手順を示すシーケンスチャート。 図6中のデステージ処理(ステップS43)の具体的な手順を示すフローチャート。 同実施形態の第2の変形例で適用されるデステージ待ち行列332のデータ構造例を示す図。 同第2の変形例においてクライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合の動作手順を示すシーケンスチャート。 図9中のデステージ処理(ステップS63)の具体的な手順を示すフローチャート。 同実施形態の第3の変形例で適用されるデステージ待ち行列332-0〜332-(n-1)のデータ構造例を示す図。 同第3の変形例においてクライアント41-1からNASコントローラ10に対するデータ書き込み要求が発生した場合の動作手順を示すシーケンスチャート。 図12中のデステージ処理(ステップS83)の具体的な手順を示すフローチャート。
符号の説明
10…NASコントローラ(ホスト)、11…ストレージ管理モジュール、12…キャッシュメモリ、30…ストレージ装置、31…ディスク(2次記憶領域)、32…キャッシュメモリ(ライトバックキャッシュ)、33…キャッシュ管理モジュール、40…ネットワーク、41-1〜41-N…クライアント、311…ログ領域、312…実データ領域、321…ログ相当領域、322…実データ相当領域、331…アクセス頻度管理テーブル、332,332-0〜332-(n-1)…デステージ待ち行列、SC…ストレージコントローラ。

Claims (3)

  1. ホストからのデータ更新の履歴を時系列順に保存するためのリングバッファとして用いられる、論理アドレスが連続するログ領域と、前記ログ領域外の領域である実データ領域とが確保され、前記ログ領域の方が前記実データ領域に比べて小領域である2次記憶領域を備えたストレージ装置において、
    キャッシュブロック単位で管理され、前記ログ領域に書き込むべきデータを一時格納するためのログ相当領域、及び前記実データ領域に書き込むべきデータを一時格納するための実データ相当領域とが確保されたライトバックキャッシュと
    前記ログ領域にデータを保存するための前記ホストのコミット処理または要求されたデータを実データとして前記実データ領域内の本来更新すべき箇所に実際に書き込む実データ更新のための前記ホストのチェックポイント処理の開始に伴う書き込み要求を受けて、当該書き込み要求で指定される書き込み先の論理アドレスが前記ログ領域の論理アドレス範囲に入っているか否かにより、当該書き込み要求が前記コミット処理の開始に伴うログ書き込み要求であるか、或いは前記チェックポイント処理の開始に伴う実データ書き込み要求であるかを判定し、前記ログ書き込み要求である場合、当該ログ書き込み要求で要求されたデータを前記ライトバックキャッシュの前記ログ相当領域内の前記キャッシュブロックに格納し、前記実データ書き込み要求である場合、当該実データ書き込み要求で要求されたデータを前記ライトバックキャッシュの前記実データ相当領域内の前記キャッシュブロックに格納するデータ格納手段と、
    前記ライトバックキャッシュ上の更新されたキャッシュブロックのデータのうち、前記実データ相当領域内の更新されたキャッシュブロックのデータのみを前記2次記憶領域内の本来の書き込み先に書き込むためのデステージ操作を制御するデステージ制御手段と
    を具備することを特徴とするストレージ装置。
  2. ホストからのデータ更新の履歴を時系列順に保存するためのリングバッファとして用いられる、論理アドレスが連続するログ領域と、前記ログ領域外の領域である実データ領域とが確保され、前記ログ領域の方が前記実データ領域に比べて小領域である2次記憶領へのアクセスを制御するストレージコントローラにおいて、
    ャッシュブロック単位で管理され、前記ログ領域に書き込むべきデータを一時格納するためのログ相当領域、及び前記実データ領域に書き込むべきデータを一時格納するための実データ相当領域とが確保されたライトバックキャッシュと、
    前記ログ領域にデータを保存するための前記ホストのコミット処理または要求されたデータを実データとして前記実データ領域内の本来更新すべき箇所に実際に書き込む実データ更新のための前記ホストのチェックポイント処理の開始に伴う書き込み要求を受けて、当該書き込み要求で指定される書き込み先の論理アドレスが前記ログ領域の論理アドレス範囲に入っているか否かにより、当該書き込み要求が前記コミット処理の開始に伴うログ書き込み要求であるか、或いは前記チェックポイント処理の開始に伴う実データ書き込み要求であるかを判定し、前記ログ書き込み要求である場合、当該ログ書き込み要求で要求されたデータを前記ライトバックキャッシュの前記ログ相当領域内の前記キャッシュブロックに格納し、前記実データ書き込み要求である場合、当該実データ書き込み要求で要求されたデータを前記ライトバックキャッシュの前記実データ相当領域に格納するデータ格納手段と、
    前記ライトバックキャッシュ上の更新されたキャッシュブロックのデータのうち、前記実データ相当領域内の更新されたキャッシュブロックのデータのみを前記2次記憶領域内の本来の書き込み先に書き込むためのデステージ操作を制御するデステージ制御手段と
    を具備することを特徴とするストレージコントローラ。
  3. ホストからのデータ更新の履歴を時系列順に保存するための、リングバッファとして用いられる、論理アドレスが連続するログ領域と、前記ログ領域外の領域である実データ領域とが確保され、前記ログ領域の方が前記実データ領域に比べて小領域である2次記憶領域と、ャッシュブロック単位で管理され、前記ログ領域に書き込むべきデータを一時格納するためのログ相当領域、及び前記実データ領域に書き込むべきデータを一時格納するための実データ相当領域とが確保されたライトバックキャッシュと、データ格納手段と、デステージ制御手段とを備えたストレージ装置に適用される、前記ライトバックキャッシュを制御するためのライトバックキャッシュ制御方法であって、
    前記データ格納手段が、前記ログ領域にデータを保存するための前記ホストのコミット処理の開始に伴う書き込み要求を受けて、当該書き込み要求で指定される書き込み先の論理アドレスが前記ログ領域の論理アドレス範囲に入っているか否かを判定し、前記ログ領域の論理アドレス範囲に入っている場合に当該書き込み要求が前記コミット処理の開始に伴うログ書き込み要求であると判定して、当該ログ書き込み要求で要求されたデータを前記ライトバックキャッシュの前記ログ相当領域内の前記キャッシュブロックに格納するステップと、
    前記データ格納手段が、要求されたデータを実データとして前記実データ領域内の本来更新すべき箇所に実際に書き込む実データ更新のための前記ホストのチェックポイント処理の開始に伴う書き込み要求を受けて、当該書き込み要求で指定される書き込み先の論理アドレスが前記ログ領域の論理アドレス範囲に入っているか否かを判定し、前記ログ領域の論理アドレス範囲に入っていない場合に当該書き込み要求が前記チェックポイント処理の開始に伴う実データ書き込み要求であると判定して、当該実データ書き込み要求で要求されたデータを前記ライトバックキャッシュの前記実データ相当領域内の前記キャッシュブロックに格納するステップと、
    前記デステージ制御手段が、前記ライトバックキャッシュ上の更新されたキャッシュブロックのデータのうち、前記実データ相当領域内の更新されたキャッシュブロックのデータのみを前記2次記憶領域内の本来の書き込み先に書き込むためのデステージ操作を制御するステップと
    を具備することを特徴とするライトバックキャッシュ制御方法。
JP2004069217A 2004-03-11 2004-03-11 ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法 Expired - Fee Related JP4189342B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004069217A JP4189342B2 (ja) 2004-03-11 2004-03-11 ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004069217A JP4189342B2 (ja) 2004-03-11 2004-03-11 ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法

Publications (2)

Publication Number Publication Date
JP2005258789A JP2005258789A (ja) 2005-09-22
JP4189342B2 true JP4189342B2 (ja) 2008-12-03

Family

ID=35084444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004069217A Expired - Fee Related JP4189342B2 (ja) 2004-03-11 2004-03-11 ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法

Country Status (1)

Country Link
JP (1) JP4189342B2 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5244440B2 (ja) * 2008-04-10 2013-07-24 日本電信電話株式会社 データベースレプリケーション方法、データベース管理システム及びプログラム
JP5187017B2 (ja) * 2008-06-18 2013-04-24 富士通株式会社 分散ディスクキャッシュシステム及び分散ディスクキャッシュ方法
JP5483405B2 (ja) * 2009-04-27 2014-05-07 Necシステムテクノロジー株式会社 ログファイル管理システム、ログファイル管理方法及びプログラム
JP5455945B2 (ja) * 2011-02-14 2014-03-26 株式会社東芝 調停装置、記憶装置、情報処理装置およびプログラム
JP5699712B2 (ja) * 2011-03-17 2015-04-15 ソニー株式会社 メモリ制御装置、メモリ装置、メモリ制御方法、及びプログラム
WO2014041664A1 (ja) * 2012-09-13 2014-03-20 富士通株式会社 情報処理システム、情報処理装置、移行制御プログラム、及び移行制御方法
KR102002830B1 (ko) * 2012-09-28 2019-07-23 삼성전자 주식회사 세그먼트 클리닝 장치 및 방법
KR101475483B1 (ko) * 2013-06-27 2014-12-19 이화여자대학교 산학협력단 비휘발성 버퍼 캐시와 비휘발성 스토리지를 위한 통합 데이터 관리 장치 및 방법
KR101450157B1 (ko) 2013-08-19 2014-10-13 이화여자대학교 산학협력단 비휘발성 저널링 통합 버퍼 캐시와 비휘발성 스토리지를 위한 협동적 데이터 관리 장치 및 방법
JP6540391B2 (ja) 2015-09-03 2019-07-10 富士通株式会社 ストレージ制御装置、ストレージ制御プログラム、及びストレージ制御方法
US10565121B2 (en) 2016-12-16 2020-02-18 Alibaba Group Holding Limited Method and apparatus for reducing read/write contention to a cache

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02163851A (ja) * 1988-12-16 1990-06-25 Nec Corp ディスクキャッシュの同期処理方式
JPH05303528A (ja) * 1992-04-27 1993-11-16 Oki Electric Ind Co Ltd ライトバック式ディスクキャッシュ装置
JPH0644139A (ja) * 1992-07-22 1994-02-18 Ricoh Co Ltd ディスクキャッシュシステムおよびそのページ置き換え制御方法
JPH06124239A (ja) * 1992-10-13 1994-05-06 Kawasaki Steel Corp キャッシュメモリの常駐データ制御装置
JPH07334425A (ja) * 1994-06-14 1995-12-22 Mitsubishi Electric Corp ディスクキャッシュ制御方式
JPH08115264A (ja) * 1994-10-18 1996-05-07 Fuji Xerox Co Ltd ディスクキャッシュ装置
JPH08263380A (ja) * 1995-03-22 1996-10-11 Mitsubishi Electric Corp ディスクキャッシュ制御方式
JPH08328959A (ja) * 1995-05-31 1996-12-13 Mitsubishi Electric Corp ディスクキャッシュ制御装置
JPH096546A (ja) * 1995-06-19 1997-01-10 Toshiba Corp ディスク制御システム
JP3020833B2 (ja) * 1995-06-19 2000-03-15 株式会社東芝 チェックポイント取得システム
JP3159118B2 (ja) * 1997-04-18 2001-04-23 日本電気株式会社 ライトバックデータ選択方法及びプログラムを記録した機械読み取り可能な記録媒体
JP3812928B2 (ja) * 1999-07-14 2006-08-23 株式会社日立製作所 外部記憶装置及び情報処理システム
JP3612271B2 (ja) * 2000-09-12 2005-01-19 株式会社東芝 ファイルシステム
JP2002132552A (ja) * 2000-10-20 2002-05-10 Hitachi Ltd 情報処理システム
JP4186509B2 (ja) * 2002-05-10 2008-11-26 株式会社日立製作所 ディスクシステムとそのキャッシュ制御方法

Also Published As

Publication number Publication date
JP2005258789A (ja) 2005-09-22

Similar Documents

Publication Publication Date Title
US10725878B2 (en) Storage apparatus, storage system, and control method of storage system for dynamically securing free space when a storage apparatus is disused
US6785771B2 (en) Method, system, and program for destaging data in cache
KR102093523B1 (ko) 순차적인 순서의 스왑 파일을 이용한 작업 세트 스와핑 기법
US8074035B1 (en) System and method for using multivolume snapshots for online data backup
US9063945B2 (en) Apparatus and method to copy data
JP5142995B2 (ja) メモリページ管理
US20060129763A1 (en) Virtual cache for disk cache insertion and eviction policies and recovery from device errors
US7251716B2 (en) Method and system for data processing with recovery capability
US20180107601A1 (en) Cache architecture and algorithms for hybrid object storage devices
US10048866B2 (en) Storage control apparatus and storage control method
US20240126706A1 (en) Local page writes via pre-staging buffers for resilient buffer pool extensions
JP4189342B2 (ja) ストレージ装置、ストレージコントローラ及びライトバックキャッシュ制御方法
CN105376269B (zh) 虚拟机存储系统及其实现方法和装置
US6336164B1 (en) Method and system for preventing deadlock in a log structured array
US9471252B2 (en) Use of flash cache to improve tiered migration performance
US20060069888A1 (en) Method, system and program for managing asynchronous cache scans
Ghemawat The modified object buffer: a storage management technique for object-oriented databases
US7908434B2 (en) Raid apparatus, cache management method, and computer program product
KR101153688B1 (ko) 데이터 페이지들에 대해 무효화 기회를 부여하는 방법 및 이를 위한 낸드 플래시 메모리 시스템
CN110109954B (zh) 数据处理方法、系统、电子设备及存储介质
JP4506292B2 (ja) キャッシュ制御方法およびデータ処理システム並びにその処理プログラム
KR101295210B1 (ko) 데이터베이스 관리 방법 및 장치
JP2004102823A (ja) 冗長化論理ディスクに対するライトスルー処理方法、ライトスルー処理用プログラム及びディスクコントローラ
JP2010160544A (ja) キャッシュメモリシステム及びキャッシュメモリの制御方法
JP4371043B2 (ja) ストレージシステム、スナップショット制御方法およびプログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080602

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080811

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080912

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130919

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees