JP2014174844A

JP2014174844A - 性能評価支援プログラム、性能評価支援装置及び性能評価支援方法

Info

Publication number: JP2014174844A
Application number: JP2013048485A
Authority: JP
Inventors: Tetsutaro Maruyama; 哲太郎丸山
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2013-03-11
Filing date: 2013-03-11
Publication date: 2014-09-22
Also published as: US20140258647A1

Abstract

【課題】ストレージ装置のレスポンス性能の予測の精度の向上を図る。
【解決手段】ストレージ装置の冗長化方式情報と、ストレージ装置の記憶装置数と、使用されている記憶領域の使用率と、要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりの要求数を表す入出力指標と、ストレージ装置における書き込み要求に対する処理時間を表す定数と記憶装置の種類によって決定される記憶装置定数を用いて、ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数、記憶装置の性能に対する特徴量を示す記憶装置係数、低負荷と高負荷の境の多重度である相変化多重度、単位時間当たりの読み出し要求の数を表す読み出し要求指標を算出し、冗長化係数、記憶装置係数、相変化多重度、及び単位時間当たりに発行される読み出し入出力指標を用いて、読み出し要求に対する平均応答時間の予測値を算出することにより、上記課題の解決を図る。
【選択図】図１

Description

本発明は、ストレージ装置の性能予測に関する。

サーバの仮想化技術（VM: Virtual Machine）、クラウドコンピューティングの発達により、サーバの統廃合やクラウド化が進んでいる。ストレージシステムに関しても、ハードウェア環境の統合が加速すると考えられる。ストレージシステムが統合される場合に必要とされるのは、マルチテナント性とソフトウェアもしくは運用によって提供されるＱｏＳ（Quality of Service）である。マルチテナント性とは、複数のユーザがアクセスしている環境において、自分のデータをいかに他人からアクセスできないように守れるということである。

ハードウェアはユーザ毎に用意されるため、ストレージシステムの性能は、ストレージを構築するハードウェアに依存する。ストレージが統合されると、複数のユーザが同時に同じハードウェアを利用する。そのため、そのハードウェア上でのユーザ毎のストレージシステムの性能予測や性能評価が重要となる。

ストレージシステムの性能判定方法の一例として、次の技術がある。ディスクアレイ制御部は、CPUと統計情報蓄積手段とを有し、CPUは、論理ディスクの構成の適否を判定する性能判定手段を備える。統計情報蓄積手段は、入出力コマンドの負荷を投入し、初期基準値と、予測基準値とを決定する基準応答時間決定手段を備える。初期基準値は、処理性能情報を実測した統計データから求められる。予測基準値は、通常業務上で入出力コマンド処理を実行したときの処理性能情報を統計データに追加することで求められる。

ここで、レスポンス性能に直接関与する統計値としては、単位時間当たりの入出力数（I/O頻度）であるIOPS（Input Output Per Second）、平均レスポンス（応答時間）、多重度の３種類がある。多重度は、ある瞬間において発行中である（発行したが、また応答が返ってきていない）I/Oの個数をカウントし、単位時間に対してその個数を平均した値である。これらは、「（多重度）＝（I/O頻度）×（レスポンス）」の関係にある。

ここで、レスポンス性能予測を可能とする方法の一例として、多重度からレスポンスを予測する方法がある。

特開２０１０−１１３３８３号公報

Abigail Lebrecht、"Queueing network models of Zoned RAID"、［online］、January, 2010、Imperial College Longon、［平成２５年１月９日検索］、インターネット<http://pubs.doc.ic.ac.uk/Queueing-network-models-RAID/> A.Gulati, et al、"Pesto: Online Storage Performance Management in Virtualized Datacenters"、［online］、SOCC '11 Proceedings of the 2nd ACM Symposium on Cloud Computing Article No. 19、［平成２５年１月９日検索］、インターネット<http://dl.acm.org/citation.cfm?id=2038935>

しかしながら、上述の多重度からレスポンスを予測する方法では、測定するデータによって、モデル（関数）のパラメータが大きく変化する。そのため、例えば、多重度１〜１０の範囲で測定した結果から作成したモデルと、多重度１０より大きい範囲で測定した結果から作成したモデルとでは、非常に誤差が大きくなり、レスポンス性能の予測の精度に問題がある。

また、多重度からレスポンスを予測する手法においては、多重度を線形近似する方法が最も志度がよいと考える。しかしながら、測定した全範囲から近似関数を計算した場合と、測定範囲から一部部分を抜き出したデータで近似関数を計算した場合とでは、両者の誤差は大きい。これは厳密に言えば、多重度とレスポンスは線形関数の関係ではないということを意味している。したがって、このモデル（関数）は、測定範囲と適用範囲によっては、誤差が大きいモデルになってしまう。これに対して、厳密なモデルを作成しようとすると、関数が非常に難しいものになってしまう。

本発明は、一側面として、レスポンス性能の予測の精度を向上させる技術を提供する。

本実施形態に係る性能評価支援プログラムは、以下の処理をコンピュータに実行させる。コンピュータは、冗長化方式情報と、記憶装置の数と、使用率と、読み出し要求の割合と、平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、処理時間を表す定数と、記憶装置定数とを取得する。冗長化方式情報は、ストレージ装置におけるデータ冗長化方式に関する情報である。記憶装置の数は、ストレージ装置が有する記憶装置の数である。使用率は、記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率である。読み出し要求の割合は、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合である。平均データ量は、読み出し要求に対して読み込まれるデータの平均データ量である。処理時間を表す定数は、ストレージ装置における書き込み要求に対する処理時間を表す定数である。記憶装置定数は、前記記憶装置の種類によって決定される定数である。コンピュータは、冗長化方式情報と、記憶装置の数と、平均データ量を用いて、ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出する。コンピュータは、冗長化方式情報と、記憶装置の数と、平均データ量と、使用率と、記憶装置定数とを用いて、記憶装置の性能に対する特徴量を示す記憶装置係数を算出する。コンピュータは、記憶装置係数と、冗長化係数と、読み出し要求の割合と、処理時間を表す定数とを用いて、相変化多重度を算出する。相変化多重度は、入出力指標に対して応答時間が一定である低負荷相と、入出力指標に対してストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す。コンピュータは、読み出し要求の割合と、単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標を算出する。コンピュータは、冗長化係数と、記憶装置係数と、相変化多重度と、単位時間当たりに発行される読み出し要求数とを用いて、読み出し要求に対する平均応答時間の予測値を算出する。

本発明は、一側面として、レスポンス性能の予測の精度を向上させることができる。

本実施形態における性能評価支援装置のブロック図を示す。本実施形態におけるRAIDシステムに対するREAD処理を説明するための図である。本実施形態におけるRAIDシステムに対するWRITE処理を説明するための図である。本実施形態におけるREADが跨るストライプブロック数の期待値について説明するための図である。本実施形態におけるレスポンス性能を評価する処理を実行するコンピュータのハードウェアブロック図を示す。本実施形態におけるレスポンス性能を評価する処理のフローを示す。本実施形態における３つのディスクのRAIDレベル毎、及びブロックサイズ毎の仮想WRITEコスト（Ｖ）の測定結果を示す。本実施形態における多重度を説明するための図である。本実施形態におけるREADのみの場合の性能モデルの導出を説明するための図である。本実施形態におけるREAD及びWRITE混合時の性能モデルについて説明するための図である。本実施形態におけるREAD、WRITE混合時の相変化多重度の推定について説明するための図である。本実施形態におけるOnline SASディスクRAID5（4+1）に対する、性能の実測値と性能予測を示す。本実施形態におけるOnline SASディスクRAID6（4+2）に対する、性能の実測値と性能予測を示す。

また、性能予測を可能とする手法としては、I/O頻度からレスポンスを予測する手法が考えられる。この手法においては、I/O頻度を指数関数で近似する方法が精度がよいと考えられる。しかしながら、特に平均I/Oサイズが大きい場合に、中程度のI/O負荷におけるレスポンスの誤差が大きくなってしまう。

また、ストレージの性能予測は、待ち行列理論によって行うことも考えられる。しかしながら、実際に実測値から待ち行列理論を適用しても、制度のよい予測を行うことはできない。

そこで、本実施形態では、I/O頻度から多重度を予測するモデルを用いる。このモデルでは、多重度／I/O頻度＝レスポンスとなるため、任意のI/O頻度におけるレスポンスを計算することができる。

図１は、本実施形態における性能評価支援装置のブロック図を示す。性能評価支援装置１は、取得部２、冗長化係数算出部３、記憶装置係数算出部４、相変化多重度算出部５、読み出し要求数算出部６、読み出し応答時間予測部７を含む。

取得部２は、冗長化方式情報と、記憶装置の数と、使用率と、読み出し要求の割合と、平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、処理時間を表す定数と、記憶装置定数を取得する。冗長化方式情報は、ストレージ装置におけるデータ冗長化方式に関する情報であり、例えば後述するRAIDレベルである。記憶装置の数は、ストレージ装置が有する記憶装置の数であり、例えば後述するRAIDランク(R)である。使用率は、記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率であり、例えば後述する使用割合(ｖ)である。読み出し要求の割合は、読み出し要求及び書き込み要求を含む要求に対する前記読み出し要求の割合であり、例えば後述するREAD割合(c)である。平均データ量は、読み出し要求に対して読み込まれるデータの平均データ量であり、例えば後述するREAD平均ブロックサイズ(r_R)である。単位時間当たりに発行される要求の数は、例えば後述するI/O頻度(X)である。処理時間を表す定数は、ストレージ装置における書き込み要求に対する処理時間を表す定数であり、例えば後述する仮想WRITEコスト（Ｖ）である。記憶装置定数は、記憶装置の種類によって決定される定数であり、例えば後述するディスク定数（D）である。取得部の一例としては、入力インターフェース（I/F）２６が挙げられる。

冗長化係数算出部３は、冗長化方式情報と、記憶装置の数と、平均データ量を用いて、ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出する。冗長化係数は、例えば後述するRAID係数（A）である。冗長化係数算出部３の一例として、CPU２２が挙げられる。

記憶装置係数算出部４は、冗長化方式情報と、記憶装置の数と、平均データ量と、使用率とを用いて、記憶装置の性能に対する特徴量を示す記憶装置係数を算出する。記憶装置係数は、例えば後述するディスク係数（α）である。記憶装置係数算出部４の一例として、CPU２２が挙げられる。

相変化多重度算出部５は、記憶装置係数と、冗長化係数と、読み出し要求の割合と、処理時間を表す定数とを用いて、相変化多重度を算出する。相変化多重度は、入出力指標に対して応答時間が一定である低負荷相と、入出力指標に対してストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す。相変化多重度は、例えば後述する相変化多重度（ε）である。相変化多重度算出部５の一例として、CPU２２が挙げられる。

読み出し要求数算出部６は、読み出し要求の割合と、単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標を算出する。単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標は、例えば後述するREAD I/O頻度（X_R）である。読み出し要求数算出部６の一例として、CPU２２が挙げられる。

読み出し応答時間予測部７は、冗長化係数と、記憶装置係数と、相変化多重度と、単位時間当たりに発行される読み出し要求数とを用いて、読み出し要求に対する平均応答時間の予測値を算出する。読み出し要求に対する平均応答時間の予測値は、例えば後述するREADレスポンス（W_R）である。読み出し応答時間予測部７の一例として、CPU２２が挙げられる。

前記読み出し応答時間予測部７は、以下の式を用いて、読み出し要求に対する平均応答時間の予測値Ｗ_Rを算出する。
ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R単位時間当たりに発行される読み出し要求数

性能評価支援装置１は、さらに、期待値変換部８を含む。
期待値変換部８は、読み出し要求時に、ストレージ装置が有する記憶装置から読み出される前記平均データ量を、読み出し要求または前記書き込み要求に応じて読み込まれるまたは書き込まれる記憶装置の個数の期待値に変換する。記憶装置の個数の期待値は、例えば後述するREADが跨るストライプブロック数の期待値（E_R）である。期待値変換部８の一例として、CPU２２が挙げられる。このとき、冗長化係数算出部３及び記憶装置係数算出部４は、期待値を用いて、冗長化係数及び記憶装置係数を算出する。

性能評価支援装置１は、さらに、応答時間予測部９、多重度算出部１０を含む。取得部２は、さらに書き込み要求に対する応答時間を取得する。書き込み要求に対する応答時間は、例えば後述するWRITEレスポンス（W_W）である。

このとき、応答時間予測部９は、読み出し要求の割合と、読み出し要求に対する平均応答時間の予測値と、書き込み要求に対する応答時間を用いて、ストレージ装置に対して発行される要求に対する平均応答時間の予測値を算出する。要求に対する平均応答時間の予測値は、例えば後述するレスポンス（W）である。応答時間予測部９の一例として、CPU２２が挙げられる。

多重度算出部１０は、要求に対する平均応答時間の予測値に、単位時間当たりに発行される要求の数を乗じて、ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度を算出する。多重度は、例えば後述する多重度（N）である。多重度算出部１０の一例として、CPU２２が挙げられる。

以下では、本実施形態の詳細について説明する。ストレージは、データを記憶する媒体（ハードディスク等）、もしくはそれらで構成された装置である。本実施形態では、性能を予測する対象の装置の一例としてRAID（Redundant Arrays of Independent Disks）を挙げているので、ストレージと表記した場合には、RAIDと同義である。

RAIDは、複数の記憶媒体を用い、データを分散したり、冗長性を持たせつつ格納する技術であり、性能向上や信頼性（記憶媒体が故障してもデータ消失することが無い）を実現する技術、または上記技術を用いてデータを格納する装置（RAID装置）を示す。RAID装置はRAIDの実現に必要な構成要素（ディスク装置（記憶媒体）、コントローラ（CPU）、キャッシュ（メモリ））を含み、それぞれ、RAIDディスク、RAIDコントローラ、RAIDキャッシュと呼ぶ。

RAIDには、その実装方法によって様々な種類があり、それぞれに対して番号が振られている（RAID1、RAID5、RAID6等）。その番号をRAIDレベルと呼ぶ。例えばRAID5のRAIDレベルは、“5”である。

RAIDメンバとは、RAIDレベルによって、データ分散方式や冗長性の構築方式が異なり、これらを数式によって表したものである。RAID5の場合、データ分割単位であるRAIDストライプに対してデータ冗長を実現するパリティデータを１つ作成するので、ストライプを構成する分割数と併せて、“4+1”のように表記される。RAID6の場合、RAIDストライプに対してパリティを２つ作成するので、“6+2”のように表記される。RAIDを構築する場合に必要なRAIDディスクの数は、表記の式を計算した値である。例えば、RAID5 4+1には５台のディスクが必要である。

RAIDランクとは、RAIDメンバに対して、RAIDストライプを構成する分割数を抜き出したものである。例えば、RAID5 4+1のRAIDランクは、4である。

I/O（Input/Output）は、READ/WRITEと同じ意味であり、READコマンドもしくはWRITEコマンド、要するに、ストレージに対する入出力を示す。なお、ストレージの観点から、READ = Output、WRITE = Input と定義される。

次に、図２、図３を用いて、RAIDシステムに対するREAD処理とWRITE処理との違いを説明する。
図２は、本実施形態におけるRAIDシステムに対するREAD処理を説明するための図である。図３は、本実施形態におけるRAIDシステムに対するWRITE処理を説明するための図である。ホスト１１は、RAIDシステム１２と接続されているコンピュータである。RAIDシステム１２は、RAIDコントローラ１３、RAIDグループ１６を含む。

RAIDコントローラ１３は、ホスト１１から送信されたデータを記憶媒体１７に書き込んだり、ホスト１１からの要求に応じて、記憶媒体１７からデータを読み出すためのコントローラモジュールであり、RAIDグループ１６の動作制御を行う。RAIDコントローラ１３は、READキャッシュ１４、WRITEキャッシュ１５を含む。READキャッシュ１４は、READコマンド発行時に、RAIDコントローラ１３により用いられるキャッシュメモリである。WRITEキャッシュ１５は、WRITEコマンド発行時に、RAIDコントローラ１３により用いられるキャッシュメモリである。

RAIDグループ１６は、RAID内で、実際にRAIDを構成する記憶媒体（ディスク）に対して、あるRAIDレベル・RAIDメンバで構成される最小単位をいう。RAIDは、内部に様々なRAIDレベル・RAIDメンバからなる、複数のRAIDグループ１６によって構成され、これらはRAIDコントローラ１３によって管理される。

図２において、ホスト１１よりREADコマンドが発行される（Ｓ１）。すると、RAIDコントローラ１３は、READキャッシュ１４に、READ対象のデータがあるかを確認する（Ｓ２）。READキャッシュ１４にデータが無い場合（Ｓ２）、RAIDコントローラ１３は、データが格納されている記憶媒体（ディスク）１７からデータを読み出す（Ｓ３、Ｓ４）。RAIDコントローラ１３は、読み出したデータをホスト１１へ応答し（Ｓ５）、そのデータをREADキャッシュ１４へ登録する（Ｓ６）。

本実施形態では、ランダムアクセスを前提としているので、READコマンドのデータはREADキャッシュ１４に「無い」ものとする（100% READキャッシュミス）。よって、READレスポンスは、数×１０⁻³[sec]以上かかるものとする。

図３において、ホスト１１よりWRITEコマンドが発行される（Ｓ１１）。すると、RAIDコントローラ１３は、WRITEコマンドに指定されたWRITE対象データをWRITEキャッシュ１５に格納し（Ｓ１２）、すぐにホスト１１へ応答を返す（Ｓ１３）。それから、RAIDコントローラ１３は、WRITEキャッシュ１５に格納したWRITE対象データを記憶媒体（ディスク）１７に書き込む（Ｓ１４，Ｓ１５）。

本実施形態では、WRITEキャッシュ１５に空きがある場合を前提としている（100％ WRITEキャッシュヒット）。よって、WRITEレスポンスは、０[sec]であるとする。

次に、RAIDシステムの処理性能が変化する要因について説明する。RAIDシステムの処理性能が変化する要因としては、ディスク特性、RAID構成、ボリューム構成、ワークロード特性がある。ディスク特性としては、ディスク容量、ディスクの回転数[rpm]（＝シーク時間）がある。ディスクの回転数[rpm]は、後述するように、ディスク定数（Ｄ）として考慮される。

RAID構成として、RAIDレベル、RAIDメンバがある。RAIDメンバは、RAIDランク（Ｒ）として考慮される。

ボリューム構成は、使用するボリューム割合（v）がある。使用するボリューム割合（v）は、あるRAIDレベル・RAIDメンバで構成されたRAIDグループ全体の容量に対して、実際にデータを格納している容量を示す。ディスク容量をCとすると、RAIDグループの容量はCRと表されるので、使用する容量をLとすると、v＝L／CRとなる。

ワークロード特性は、I/O頻度、平均I/Oサイズ（＝平均ブロックサイズ）、READ：WRITE比がある。

I/O頻度は、単位時間[sec]当たりに処理されたI/Oの個数（Input/Output per second：ＩＯＰＳ）を示す。READコマンドをカウントしたI/O頻度を、READ I/O頻度と呼ぶ。WRITEコマンドをカウントしたI/O頻度を、WRITE I/O頻度と呼ぶ。総I/O頻度を“Ｘ”、READ I/O頻度を“Ｘ_R”、WRITE I/O頻度を“Ｘ_W”と表記する。

READ：WRITE比は、READ割合（C）として考慮される（C＝X_R／X）。
平均I/Oサイズ（＝平均ブロックサイズ）は、１回のリクエスト（I/O）で送られるデータサイズを示す。平均I/Oサイズは、READが跨るストライプブロック数の期待値（Ｅ_R）、WRITEが跨るストライプブロック数の期待値（Ｅ_W）として考慮される。ここで、図４を用いて、READが跨るストライプブロック数の期待値について説明する。

図４は、本実施形態におけるREADが跨るストライプブロック数の期待値について説明するための図である。ブロックサイズが異なれば、RAIDの性能は異なる。すなわち、ブロックサイズが大きい程、ディスクにアクセスするデータ量が大きくなり、レスポンス時間が長くなる。しかし、ディスク単体でレスポンス時間を測定した場合は、この影響はほとんどレスポンス性能に表れない。実際にディスクからの読み出し・書き出しに要する時間の変化は、ブロックサイズの違いによってレスポンスにほとんど影響を及ぼさないということが分かる。

ところがRAIDでレスポンス時間を測定すると、ブロックサイズが大きい程、レスポンス性能は悪くなる。これは、I/Oがストライプブロックを跨る場合に、I/Oがストライプブロック単位に分割されることで、複数のディスクにアクセスするため、性能が悪くなると考えられる。

ディスクは、図４（A）に示すように、論理的にストライブブロック単位で分割され、RAIDグループの各ディスク１７に対して同じ位置のストライプブロック（D1〜D4）でストライプが作成され、この単位で冗長性を保つためにパリティ（P）が作成される。

RAIDグループ１６内のディスクは全く同じもの（同じ容量のもの）を使用する。RAID5、RAID6の場合は、各ストライプにおけるパリティが格納されるディスクは、ストライプによって異なる。

すなわち、ブロックサイズが性能に影響を及ぼすのではなく、アクセスするディスク数が性能に影響を及ぼす。I/Oが行われるディスク数を、I/Oが跨ぐストライプブロック数と同じであると見積り、その期待値を計算する。

I/Oが跨るストラップブロック数の期待値の算出方法について説明する。ストライプ幅（＝ストライプブロックのサイズ）は、使用するRAIDによって異なる。本実施形態では、ストライプ幅（＝ストライプブロックのサイズ）は６４［K Byte（KB）］、ディスクブロックサイズを０．５[KB]とする。ディスクブロックサイズは、ディスクにおいて格納するデータの基本単位のサイズである。すべてのI/Oにおけるブロックサイズは、ディスクブロックサイズの整数倍である。ユーザ（アプリケーションプログラム）から発行されるブロックサイズは任意の大きさであるが、オペレーティングシステム（OS）で用いられているファイルシステムによって、どのようなシステムでもディスクブロックサイズの整数倍に整形されている。本実施形態では、ブロックサイズの平均値を用いるので、この平均値はディスクブロックサイズの整数倍とならない場合もあるが、ディスクブロックサイズの値よりも大きい。本実施形態では、説明の便宜のため、平均ブロックサイズは、ディスクブロックサイズの整数倍とする。

平均ブロックサイズを“ｒ”［KB］と表記する。I/Oのオフセット（アクセスする領域の先頭アドレス）がストライプブロックの境界である場合に、アクセスする最後のストライプブロックにおけるブロックサイズMは、次の式で表される。
M＝ ( (r−0.5) mod 64)＋0.5
また、I/Oがアクセスする最も少ないストライプブロックの個数Ｎは、次の式で表される。
N＝ (r −M＋64)／64
I/Oが跨るストラップブロック数の期待値Eは、次の式で表される。
E＝ (N ＋ 1) (2M − 1)／128 ＋ N (128 − 2M ＋ 1)／128

READ、WRITEそれぞれの平均ブロックサイズに対して、上記の期待値を算出する。
・READが跨るストライプブロック数の期待値（E_R）
・WRITEが跨るストライプブロック数の期待値（E_W）

ここで、I/Oのオフセットが、ストライプブロックの境界と全く同じ場合（図４（B）の（ケース（１））を考える。この場合にアクセスする最後のストライプブロックにおいてアクセスするサイズをMとする。この場合が、I/Oがアクセスするストライプブロック数が最も少ない場合である。

次に、ケース（１）から、オフセットをディスクブロックサイズずつずらしていき、次の境界のひとつ手前まで動かす（図４（Ｂ）のケース（２））ことを考える。ストライプブロック中にディスクブロックは128個あるので、I/Oのオフセットは合計128通りある。この128通りのI/Oのオフセットが、I/Oが跨るストライプブロック数を考えるべき全ての状態である。

これら全てを考えると、ケース（１）での跨る数をＮ個とした時に、最大でもN+1個しか跨らないことが分かる。よって、128通りの中で、跨る数がＮ個の場合と、N+1個の場合、それぞれが何通りあるか数えれば良い。

ケース（１）から、I/Oの最後がストライプブロックの境界に重なる場合（図４（B）ケース（３））までがN個で、ケース（３）以降からケース（２）までがN+1個である。ケース（２）で、N+1個目のストライプブロックにアクセスしているサイズは、Ｍ−0.5[KB]である。そのサイズをディスクブロックの個数に換算すると、2M−1となる。よって、跨る数がＮ＋１個になる確率は、(2M−1)／128となる。したがって、跨る数がＮ個になる確率は、1−((2M−1)／128)＝(128−2M＋1)／128となる。これらの確率に、各々の値（跨る数）をかけて足し合わせた値が、跨るストライプブロック数の期待値である。

次に、レスポンス性能モデルについて説明する。ある１つのRAIDグループにおけるランダムアクセス性能（READレスポンス）を予測する式は、次の式（１）で表される。なお、式中のパラメータA、α、εについては、後述する。
入力情報X_R：READ I/O頻度[IOPS]
出力情報W_R：READレスポンス[sec]
パラメータA：RAID係数
α：ディスク係数
ε：相変化多重度

READの場合は、100％キャッシュミスとなり、WRITEの場合は、100％キャッシュヒットとなることを想定している。したがって、READレスポンスを予測すれば、全体のレスポンスを予測することができる。

RAID係数Aは、使用するディスクに関係なく、RAIDグループのRAID構成によって決まる値である。RAID5の場合、RAID係数（A）は以下の式（２）で表される。

RAID6の場合、RAID係数（A）は以下の式（２’）で表される。
Rは、RAIDランクを示す。E_Rは、READ I/Oが跨るセグメントブロック数の期待値である。RAIDレベルによって、Aの係数の値（１／２か２／３か）が決まり、RAIDメンバ（RAIDランク）によって分子の値が決まるので、RAID係数はRAID構成によって決定されるといえる。

ディスク係数（α）は、RAIDグループに関係なく、使用するディスクのディスク特性によって決まる値である。RAID5の場合、ディスク係数（α）は、以下の式（３）で表される。
RAID6の場合、ディスク係数（α）は、以下の式（３’）で表される。
である。ここで、Ｒ：RAIDランク、Ｅ_R：READ I/Oが跨るセグメントブロック数の期待値、D：ディスク定数（RAIDに関わらず、ディスクの種別（回転数）で一定の値）、ｖ：RAIDグループにおいて、実際にアクセスする領域の割合（０≦v≦１）

ディスク定数（D）は、ディスクに回転数などディスク特性によって決定される値であるが、全てのディスクに対してモデル化することは困難であるため、使用するディスクに関する測定値を用いる。

ディスク係数（α）の式にもRAIDランクが含まれる。ここでのRAIDランクは、RAIDレベルが変化してもREAD最少レスポンスが変化しないという測定結果（後述）から導き出される項であり、ディスク係数はRAID構成に関係せず、ディスク特性から設定される。ディスク定数Dが回転数などディスクそのものの性質から導き出される性能を示す。
の項が、使用割合減少によりシーク時間が確率的に減少することによるディスク性能の向上を見積もる項に相当する。シーク距離Lに対して、シーク時間を（L）^1/2で見積もることが可能である。

次に相変化多重度（ε）について説明する。相変化多重度εはワークロードの特性によって決定される値であり、次の算出式（４）で表される。
ここで、α：ディスク係数、A：RAID係数、c：READ割合（総I/O頻度におけるREAD I/O頻度の割合）（０≦c≦１）、V：仮想WRITEコスト（WRITEの内部処理コストを見積もった値）

仮想WRITEコストは、READブロックサイズ（E_R）、WRITEブロックサイズ（E_W）、アクセスする領域の割合（v）によって変化する値であるため、使用するワークロードについてモデル化することは非常に困難である。そこで、使用するワークロードに関して限定条件を設定し、その限定条件に対する測定値を仮想WRITEコストとして用いる。例えば、v＝１、E_R＝E_W、READブロックサイズは８[KB]、１６[KB]、３２[KB]、４８[KB]、６４[KB]となる。

αAがREAD最少レスポンス（後述）、Vが仮想WRITEコスト、cがREAD割合を表すので、相変化多重度εの値は、ワークロードの特性によって決定されると言える。

次に、レスポンス性能の評価方法について説明する。ユーザがレスポンスに関して明確な指針を持っている場合、すなわち、RAIDをストレージとして利用するシステムを安全に運用するために、RAIDのレスポンスがある一定値以下でなければならない場合、その基準に対して、レスポンスを直接評価する。例えば、このRAIDに商品データを保存し、Web上での商品販売サイトを作成する場合、そのためにはRAIDのレスポンスが例えば0.010[sec]以内でないと商品販売サイトを利用するユーザが「遅い」と感じてしまう、というような場合が考えられる。この場合、想定される商品販売サイトのアクセス数からI/O頻度を算出し、そこから算出されたレスポンスが例えば0.010[sec]以内であれば、RAIDは十分な性能であるとみなす。もしくは、レスポンスが例えば10[sec]以内に収まるI/O頻度を逆算し、そのI/O頻度から商品販売サイトを安全に運用できるアクセス数を更に逆算することで、商品販売サイト全体の設計を行う。

一方、ユーザがレスポンスに関して明確な指針を持たない場合、多重度を指標とする。多重度はコマンドのキュー長と同じである。システムのハードウェアにはキュー長の最大値に制限があるものがある。例えば、ホストとRAIDの接続に用いられるFC HBA（Fibre Channel Host Bus Adaptor）は、内部のメモリ量の制限から、キュー長の最大値が３０程度に制限されている。多重度がキュー長の最大値３０以下であれば、安全に運用できるという評価を行う。

次に、本実施形態におけるレスポンス性能を評価する処理の詳細を説明する。
図５は、本実施形態におけるレスポンス性能を評価する処理を実行するコンピュータのハードウェアブロック図を示す。コンピュータ２０は、実施形態の処理を行うプログラムを読み込むことにより、性能評価支援装置として機能する。

コンピュータ２０は、出力I/F２１、CPU２２、ROM２３、通信I/F２４、入力I/F２５、RAM２６、記憶装置２７、読み取り装置２８、バス２９を含む。コンピュータ２０は、出力機器３１、及び入力機器３２と接続可能である。

ここで、CPUは、中央演算装置を示す。ROMは、リードオンリメモリを示す。RAMは、ランダムアクセスメモリを示す。I/Fは、インターフェースを示す。バス２９には、出力I/F２１、CPU２２、ROM２３、通信I/F２４、入力I/F２５、RAM２６、記憶装置２７、読み取り装置２８が接続されている。読み取り装置２８は、可搬型記録媒体を読み出す装置である。出力機器３１は、出力I/F２１に接続されている。入力機器３２は、入力I/F２５に接続されている。

記憶装置２７としては、ハードディスクドライブ、フラッシュメモリ装置、磁気ディスク装置など様々な形式の記憶装置を使用することができる。

記憶装置２７またはROM２３には、後述する処理を実現するレスポンス性能評価支援プログラム、評価処理で用いるパラメータ、所定の閾値等が格納されている。

CPU２２は、プロセッサの一例であり、記憶装置２７等に格納した実施形態に係るレスポンス性能評価支援プログラムを読み出し、当該プログラムを実行する。

実施形態に係るレスポンス性能評価支援プログラムは、プログラム提供者側から通信ネットワーク３０、および通信I/F２４を介して、例えば記憶装置２７に格納してもよい。また、第１〜第３の実施形態で説明した処理を実現するプログラムは、市販され、流通している可搬型記憶媒体に格納されていてもよい。この場合、この可搬型記憶媒体は読み取り装置２８にセットされて、CPU２２によってそのプログラムが読み出されて、実行されてもよい。可搬型記憶媒体としてはCD-ROM、フレキシブルディスク、光ディスク、光磁気ディスク、IC（Integrated Circuit）カード、USB（Universal Serial Bus）メモリ装置など様々な形式の記憶媒体を使用することができる。このような記憶媒体に格納されたプログラムが読み取り装置２８によって読み取られる。

また、入力機器３２には、キーボード、マウス、電子カメラ、ウェブカメラ、マイク、スキャナ、センサ、タブレット、タッチパネルなどを用いることが可能である。また、出力機器３１には、ディスプレイ、プリンタ、スピーカなどを用いることが可能である。また、ネットワーク３０は、インターネット、LAN、WAN、専用線、有線、無線等の通信網であってよい。

図６は、本実施形態におけるレスポンス性能を評価する処理のフローを示す。まず、事前準備（Ｓ２１）について説明する。ここでは、ディスク容量（C）は、予め得られている。使用するディスクのディスク定数（D）は、測定により求められる。また、使用する限定されたワークロードパターンにおける仮想WRITEコスト（V）は、測定により求められる。WRITEは100％キャッシュヒットとなるが、その場合のレスポンス（どんな状況でも常に一定である値）（W_W）を測定により求める。ディスク容量（C）、ディスク定数（D）、WRITEレスポンス（W_W）、仮想WRITEコスト（V）は、予め、レスポンス性能を評価するコンピュータ２０の記憶装置２７に登録される。

次に、コンピュータ２０は、ユーザの使用するストレージのRAID構成・ボリューム構成を取得する（Ｓ２２）。ユーザは、入力機器３２を用いて、RAIDレベル、RAIDランク（R）、ディスクの使用容量（L）を入力する。コンピュータ２０は、ディスク容量（C）、RAIDランク（R）、使用容量（L）から、使用割合（v）（＝L／（CR））を算出する。

コンピュータ２０は、ユーザの使用するストレージのワークロード特性を取得する（Ｓ２３）。ユーザは、入力機器３２を用いて、総I/O頻度（Ｘ）、READ割合（c）、READ平均ブロックサイズ（r_R）を入力する。コンピュータ２０は、READ平均ブロックサイズ（r_R）から、READが跨るストライプブロック数の期待値（E_R）を計算する。また、コンピュータ２０は、総I/O頻度（X）、READ割合（c）から、READ I/O頻度（X_R）を計算する。

次に、コンピュータ２０は、性能モデルにおけるパラメータを算出し、そのパラメータを用いて性能モデルを出力する（Ｓ２４）。コンピュータ２０は、RAIDレベル、RAIDランク（R）、及びREADが跨るストライプブロック数の期待値（E_R）から、RAID係数（A）を計算する。また、コンピュータ２０は、RAIDレベル、RAIDランク（Ｒ）、ディスク定数（D）、及び使用割合（v）から、ディスク係数（α）を計算する。また、コンピュータ２０は、RAID係数（A）、ディスク係数（α）、仮想WRITEコスト（V）、READ割合（c）から、相変化多重度（ε）を計算する。コンピュータ２０は、RAID係数（A）、ディスク係数（α）、相変化多重度（ε）、READ I/O頻度（X_R）からREADレスポンス（Ｗ_R）を計算する。

コンピュータ２０は、性能モデルにより得られたREADレスポンス（Ｗ_R）を用いて、ストレージのレスポンス・多重度を算出する（Ｓ２５）。具体的には、コンピュータ２０は、WRITEレスポンス（W_W）、READ割合（ｃ）、READレスポンス（Ｗ_R）を用いて、以下の式（５）よりレスポンス（W）を算出する。
レスポンス（Ｗ）＝cW_R＋(1−c)W_W (5)
コンピュータ２０は、I/O頻度（X）とレスポンス（W）から、以下の式（６）を用いて、多重度（N）を計算する。
多重度（N）＝XW (6)
コンピュータ２０は、レスポンス（W）と多重度（N）を出力する。ユーザは、出力されたレスポンス（W）と多重度（N）を用いて、対象のストレージのレスポンス性能を評価する。

図６のフローについての実施例を以下に示す。なお、以下の実施例では、本実施形態に係る性能評価支援プログラムの一例であるRAIDの性能予測ツール（サービス）を用いる。

Ｓ２１では、あるRAIDの性能評価に対して、性能評価支援プログラムで用いる条件情報を設定するための事前準備を行う。RAIDに搭載可能なディスクの種類（Online SAS /Nearline SAS、ディスクサイズ、回転数、容量）は、以下であるとする。ここで、ＳＡＳは、Serial Attached SCSI (Small Computer System Interface)を示す。
・Online SAS 3.5[inch] 15,000[rpm] 300[GB], 450[GB], 600[GB]
・Online SAS 2.5[inch] 15,000[rpm] 300[GB], 450[GB], 600[GB]
・Online SAS 2.5[inch] 10,000[rpm] 300[GB], 450[GB], 600[GB]
・Nearline SAS 3.5[inch] 7.200[rpm] 1[TB], 2[TB], 3[TB]
・Nearline SAS 2.5[inch] 7.200[rpm] 1[TB]

ディスクの回転数は３種類であるため、それぞれのディスクに対してディスク定数を測定する。
・15,000[rpm]のディスクのディスク定数（D₁）＝0.017
・10,000[rpm]のディスクのディスク定数（D₂）＝0.021
・7,200[rpm]のディスクのディスク定数（D₃）＝0.037

ディスクのサイズ（2.5［inch］または3.5［inch］）または容量が変わっても、性能は変化しないので、性能評価支援プログラムは上記３種類のディスク定数で列挙したディスクすべてに対応することができる。ただし、ディスクが製造された時期又はディスクの世代が異なると、同じ回転数、ディスクサイズ、容量でもファームウェアの制御またはディスクの部品が異なる可能性があるので、性能が異なる場合がある。よって、上記の３つのディスクは全て同じ世代であるとする。

次に、性能評価支援プログラムが対応するワークロードを限定、すなわち限定条件を設定する。本実施形態は、シーケンシャルアクセスには対応せず、ランダムアクセスに対応する。上述の通り、ランダムアクセスで、さらにREAD処理は100％キャッシュミスが発生し、WRITE処理は100％キャッシュヒットになる条件とする。この条件が、通常の運用の中で最もRAIDの性能が悪い条件であるので、このような制限は性能の評価として意義があると考える。

また、平均READブロックサイズと平均WRITEブロックサイズは同じであるとする。
平均ブロックサイズの代表値として、例えば、8[KB]、16[KB]、32[KB]、64[KB]が挙げられ、ユーザにはこれらの代表値から最も近い値を選択してもらうようにする。

上記限定条件に対応する仮想WRITEコスト（V）を測定する。上記３つのディスクのRAIDレベル毎、及びブロックサイズ毎の仮想WRITEコスト（V）の測定結果を図７に示す。

このとき、WRITEレスポンス（W_W）も測定しておく。WRITE処理は、100％キャッシュヒットとなることを想定しているので、全ての場合でほぼ同じ値になると想定される。本実施形態では、WRITEレスポンス（W_W）＝0.000275[sec]であるとする。

次に、Ｓ２２、Ｓ２３について説明する。Ｓ２２、Ｓ２３では、ユーザは、性能評価支援プログラムに、RAID構成情報（使用するディスクの属性情報、RAIDレベル、RAIDメンバ、使用容量の情報）、ワークロード情報（I/O頻度、READ割合、平均ブロックサイズ）を入力する。例えば、以下のように入力された場合を考える。
・2.5[inch] 10,000[rpm] SAS 600[GB]のディスクを用い、RAID5（4+1）を作成する。
・上記RAIDにおける全ての領域を使用する。
・ユーザが上記RAIDに対して行うアクセス（負荷）は、300[IOPS]である。
・READ割合は75％であり、平均ブロックサイズは48[KB]である。

コンピュータ２０は、上記の入力により、予め準備した条件値から適切な条件値を選択し、性能モデルに使用するための入力パラメータを計算する。
・ディスク定数：D＝0.021
・仮想WRITEコスト：V＝0.0310
・WRITEレスポンス：W_W＝0.00275
・RAIDランク：R＝４
・利用割合：v＝1
・I/O頻度：X＝1000
・READ割合：c＝0.75
・READ I/O頻度：XR＝cX＝0.75×300＝225
・平均ブロックサイズ：r＝48 [KB]

I/Oが跨るストライプブロック数の期待値Ｅを求める。
・M＝（（r−0.5）mod 64）＋0.5＝48
・N＝(r−M＋64)／64＝1
・E＝(N＋1)(2M−1)／128＋N(128−2M＋1)／128＝1.7422

平均ブロックサイズとREAD平均ブロックサイズが同じなので、READが跨るストライプブロック数の期待値E_Rは、上記のI/Oが跨るストライプブロック数の期待値Ｅと同じ値となる。

次に、Ｓ２４について説明する。Ｓ２４では、コンピュータ２０は、性能予測ツールへの入力から、性能モデルで用いるパラメータを計算する。RAIDレベルはRAID５なので、コンピュータ２０は、上述した式（２）を用いて、RAID係数Aを計算する。

RAIDレベルはRAID5なので、コンピュータ２０は、上述した式（３）を用いて、ディスク係数αを計算する。

コンピュータ２０は、上述した式（４）を用いて、相変化多重度εを計算する。ここで、計算の簡単のために、αA=0.00874を計算しておく。

コンピュータ２０は、上述した式（１）で示す性能モデルを用いて、READレスポンスW_Rを計算する。
以上より、READレスポンスは0.0291 [sec]であるとの予測値が得られる。

次に、Ｓ２５について説明する。Ｓ２５では、READレスポンスからレスポンス・多重度を計算し、評価を行う。コンピュータ２０は、上述した式（５）を用いて、レスポンスＷを計算する。
・W＝cW_R＋(1−c)W_W=0.75×0.0291＋0.25×0.000275＝0.0219
よって、レスポンスは0.0219[sec]であることが分かる。

コンピュータは、上述した式（６）を用いて、多重度（N）を計算する。
・N＝XW＝300×0.0219＝6.57

それから、コンピュータ２０は、レスポンス（W）と多重度（N）を、性能予測ツール（サービス）の出力として表示する。

ユーザは、0.0219[sec]というレスポンスまたは6.57という多重度により、実際にRAIDを使用する前、またはリアルタイムにRAIDを使用しながら、性能の評価を行うことができる。その結果、例えば、レスポンス時間がシステム基準により長ければ、ユーザはより性能の高い構成に変更する等の対応を行うことができる。

次に、性能モデルの論理的解析について説明する。
ここで、性能モデルを論理的に解析する。まずは、READのみの場合の性能モデルの導出について説明する。多重度（N）は、非線形項を加えた指数関数（y=Ae^Bx+β）によって得られる式として表される。
N＝Ae^BX+β Ｘ：I/O頻度

この式に、リトルの公式（（多重度）＝I/O頻度×レスポンス[sec]）を代入する。
レスポンス（W）=（Ae^BX+β）／X

しかし、上記の式では、Xが０の極限で無限大に発散してしまう。すなわち、
であるのに対し、
となる。これを解決するため、I/OがREADのみであるとし、多重度１を境界にして、上記レスポンス（W）の式の状態が異なると想定する。ここでは、WRITEは100％キャッシュヒットとなり、レスポンスがほぼ０［sec］であるため、とりあえず、READのみの場合を考える。

図８は、本実施形態における多重度を説明するための図である。多重度１以下の場合は、図８（Ａ）に示すように、各I/Oが重なりなく処理される。したがって、ブロックサイズが同じであれば、各I/OのレスポンスはI/O頻度や多重度に関わらず一定であると考えられる。

多重度１以上の場合には、図８（Ｂ）に示すように、各I/Oに重なりがある。この場合、I/Oに重なりがあるので、I/Oがキューに繋がれているだけで処理を待つ時間が生じる。この「処理待ち時間」が、I/O頻度に対する多重度の指数関数的上昇を生み出すものと考えられる。

したがって、レスポンスＷは、多重度１までは一定であり、多重度１以上は、指数関数的に上昇すると考えられる。

図９は、本実施形態におけるREADのみの場合の性能モデルの導出を説明するための図である。多重度１における状態変化を性能モデルの数式に組み入れると、以下の式になる。ここで、多重度１未満のレスポンスが一定である状態から、図９（Ａ）に示すように、多重度１以上の多重度が指数関数的に上昇する状態に変わることを、物理的に「相が変化した」と捉え、この多重度１を「READのみの場合の相変化多重度」と呼ぶことにする。
X₁：READの多重度が１となるREAD I/O頻度

READ多重度１のときにREAD I/O頻度がX₁であるので、リトルの公式によりこの場合のレスポンスは１／X₁である。I/O頻度がX₁以下である場合、図９（Ｂ）に示すように、レスポンスは１／X₁であることから、１／X₁を最少レスポンスと呼ぶ。

N＝ Ae^αX＋βという式は、X＝０のときにN＝A＋βとなるが、これをX＝X₁のときにN＝1になるようにアフィン変換（平行移動）を行うと、N＝ A(e^α(X−X1)−1)＋1となる。この式の右辺において、”−１”は、X＝X₁の場合に指数項を打ち消す定数であり、”＋１”は、X=X₁の場合の多重度を示す。この多重度の式をリトルの公式により変換すると、上記性能モデルが得られる。

さらに、性能モデルに、多重度１の前後で、I/O頻度に対する多重度の傾きは同じであるという平滑条件を考慮する。この平滑条件は多重度１未満から徐々にI/O頻度を増やしていった場合に、多重度１を境にして急激に多重度が上昇するのではなく、自然に緩やかに上昇していくという仮定である。

よって、多重度１前後で性能モデルをI/O頻度（X）に対して微分し、それらの値が同じであるとする。
ゆえに、平滑条件を仮定することにより、X₁＝１／（αA）とすることができる。ここで、指数関数は単調増加関数なので、I/O頻度がX₁以下の場合のレスポンスW＝1／X₁＝αＡが最少レスポンスとなる。

以上より、以下の式（１’）で示すように、READのみの場合の性能モデルが得られる。
このとき、READのみ（ｃ＝１）の場合は相変化多重度ε＝１であり、上記の式（１’）は性能モデルの式にε＝１を代入した式と同一である。

係数をモデル化するに際し、様々なRAID構成に対するREADのみの性能測定を重ねた結果、以下の知見が得られた。以下の知見は、よく使用されるブロックサイズの範囲（８[KB]〜６４[KB]）における性能測定から得られた知見である。
指数関数に対する定数係数Ａ：
・定数係数Aは、ディスク又は使用割合が変わっても同じ値である。
・定数係数Aは、RAIDランクに比例する。
・定数係数Aは、I/Oが跨るストライプブロック数の期待値に対して非線形の反比例という性質を示し、その非線形項の値はRAIDレベルに関わらず、一定（０．２５）である。

指数関数に対する指数係数α：
・指数係数αは、RAIDランクに反比例する
・指数係数αは、I/Oが跨るストライプブロック数の期待値に対して切片を持つ比例という性質を示し、そのｘ切片はRAIDレベルに関わらず一定である。
・指数係数αは、使用割合の平方根を取った値に比例する。
最少レスポンスαA：
最少レスポンスαAは、RAIDレベル、RAIDランクに関わらず、一定である。

そこで、定数係数AをRAID係数、指数係数αをディスク係数と名付け、RAID係数、ディスク係数を用いてモデル化を行ったところ、式（２）（２’）、式（３）（３’）が得られた。ここで、RAID5、RAID6とも
となり、この値はRAID構成とは無関係である。

次に、図１０を用いて、READ及びWRITE混合時の性能モデルについて説明する。READのみ、WRITEのみのアクセスというのは特殊な場合で、通常はREAD及びWRITEが混ざったアクセスが行われる。

WRITE処理時は、100%キャッシュヒットとなることにより、レスポンスがほぼ0［sec］であるが、図１０に示すように、通常WRITEの割合が多くなるほど、READの性能が悪化する。WRITEコマンドの処理が性能に及ぼす影響は、WRITEのレスポンスには表れないが、READレスポンスの悪化として間接的に表れる。この影響を定量化することは、非常に難しい。そこで、WRITEが混ざることで相変化多重度が１より小さい値になり、それが原因でREADレスポンスが悪化するということを想定する。

以下では、READ、WRITE混合時の相変化多重度の推定について考える。READレスポンスの最少レスポンスは、WRITEの割合がいくつあっても一定であることが測定結果の知見として得られた。そこで、相変化多重度以下の場合は、READレスポンスW_R=αAとする。

通常、WRITEコマンドはREADコマンドより複雑な処理を行っているので、処理に係る時間はREADコマンドより長い。例えば、ストレージは、WRITEコマンドを取得した場合、WRITEデータに対応するパリティの読み出し、新パリティの計算、WRITEデータと新パリティをそれぞれのディスクに書き出すという内部処理を行う。ただし、その内部処理時間は100%WRITEキャッシュヒットしているため、図１１に示すように、ホストから測定することはできない。そこで、WRITEコマンド当たりに要する内部処理時間を、仮想WRITEコストVと仮定する。また、図１１に示すように、「RAID内部で、READとWRITEを合わせて多重度が１になる点」を相変化点であると想定する。

READ割合c（０＜c＜１）の場合にRAID内部で、READ、WRITEを合わせた多重度が１になるI/O頻度をX_cとする。READ I/O頻度Ｘ_RCは、X_RC=cX_Cで求められる。READレスポンスＷ_RCは図１１に示すように、Ｗ_RC＝Ｗ_R＝αＡである。READ多重度εはリトルの公式より、
ε＝X_RCW_RC＝cαAX_c (7)
である。RAID内部で多重度１となることから、RAID内部でリトルの公式を適用する。
・N＝X_RCW_RC＋X_WCW_WC
・WRITE I/O頻度：X_WC＝(1−c)X_c
・WRITEレスポンス：W_WC＝V (WRITE仮想コスト)
・1＝ cαAX_c＋(1−c)VX_c＝(cαA＋(1−c)V)X_c
・Xc＝1／(cαA＋(1−c)V)
この得られたX_cを、式（７）で示すREAD多重度に代入する。
ε＝cαA／(cαA＋(1−c)V)
このREAD多重度を相変化多重度とし、READレスポンスの予測式である性能モデル式に適用する。

以下では、性能モデルへのREAD、WRITE混在時の相変化多重度の適用について考える。READ割合ｃにおいて、READ多重度εが相変化多重度となる。この場合のRAID係数、ディスク係数をそれぞれ、A’、α’とする。多重度に関する非線形項を含んだ指数関数近似を、READのみの場合と同様に考える。READ I/O頻度をX_Rとしたときに、相変化多重度がεであることから、READ多重度に関する非線形項を含む指数関数式をREADのみの場合と同様に作成する。READ割合がｃである場合にREAD多重度がεとなるREAD I/O頻度をX₁’とする。

READ多重度εの点における平滑条件を、READのみの場合と同様に適用する。
より、X₁’＝ε／(α’A’)
READ割合によらず、最少レスポンスは一定であるという見地より、α’A’＝αAとなる。

以上より、性能モデルは式（１‘’）になる。
A、α：READのみの場合のRAID係数・ディスク係数
A’、α’：READ割合がcである場合のRAID係数・ディスク係数

性能の実測値を上記式（１’’）に当てはめてA’、α’の値を求めたところ、以下の結果が得られた。
・A’＝εA
・α’＝α／ε
この結果より、αA＝A’α’となり、どんなREAD割合でも最少レスポンスが変化しないという知見と一致する。
以上より、性能モデルの式（１）が導出される。

図１２は、本実施形態におけるOnline SASディスクRAID5（4+1）に対する、性能の実測値と性能予測を示す。図１３は、本実施形態におけるOnline SASディスクRAID6（4+2）に対する、性能の実測値と性能予測を示す。図１２、図１３において、横軸はREAD I/O頻度を示し、縦軸はREADレスポンス［sec］を示す。READ割合を100%から5％刻みで減らしていった場合に対して、I/O頻度を徐々に増やしていった場合の実際の測定値と、性能モデルを利用した予測結果を示している。ここで、実線はREAD割合毎の予測値を示し、点は実測値を示す。図１２、図１３に示すように、性能の実測値と性能予測とは近似しており、どちらも高精度に予測できていることが示されている。

本実施形態によれば、負荷（I/O頻度）に対する多重度の変化を非線形項を含む指数関数でモデル化することで、高精度な性能（レスポンス）予測を実現することができる。ここで、使用する式は、指数関数とリトルの法則である。これらの式に加え、性能が低負荷相（多重度が相変化多重度以下である状態）と高負荷相（多重度が相変化多重度以上である状態）に分かれるという仮定と、その相変化点に関する平滑条件を仮定することで、高精度な性能モデル式を生成することができる。

RAID内部装置やファームウェアをモデル化するのではなく、多重度及びレスポンスが示す統計的な特徴をモデル化しているので、汎用的かつ高精度な性能予測を実現することができる。また、最新のRAIDだけでなく、古いRAIDや未知のRAIDに関しても、少数のパラメータを測定することで、高精度な性能予測を行うことができる。

なお、本発明は、以上に述べた実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。

上記実施形態に関し、更に以下の付記を開示する。
（付記１）コンピュータに、
ストレージ装置におけるデータ冗長化方式に関する冗長化方式情報と、該ストレージ装置が有する記憶装置の数と、該記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率と、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、前記ストレージ装置における書き込み要求に対する処理時間を表す定数と、前記記憶装置の種類によって決定される記憶装置定数とを取得させ、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量を用いて、前記ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出させ、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量と、前記使用率と、前記記憶装置定数とを用いて、前記記憶装置の性能に対する特徴量を示す記憶装置係数を算出させ、
前記記憶装置係数と、前記冗長化係数と、前記読み出し要求の割合と、前記処理時間を表す定数とを用いて、前記入出力指標に対して応答時間が一定である低負荷相と、前記入出力指標に対して前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す相変化多重度を算出させ、
前記読み出し要求の割合と、前記単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標を算出させ、
前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標とを用いて、前記読み出し要求に対する平均応答時間の予測値を算出させる
処理を実行させることを特徴とする性能評価支援プログラム。
（付記２）前記読み出し要求に対する平均応答時間の予測値W_Rは、前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標と、以下の式
（ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R：単位時間当たりに発行される読み出し要求数）
を用いて算出される
ことを特徴とする付記１に記載の性能評価支援プログラム。
（付記３）前記コンピュータに、さらに、
書き込み要求に対する応答時間を取得させ、
前記読み出し要求の割合と、前記読み出し要求に対する平均応答時間の予測値と、前記書き込み要求に対する応答時間を用いて、前記ストレージ装置に対して発行される要求に対する平均応答時間の予測値を算出させ、
前記要求に対する平均応答時間の予測値に、前記入出力指標を乗じて、前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度を算出させる
処理を実行させることを特徴とする付記１または２に記載の性能評価支援プログラム。
（付記４）前記冗長化係数及び前記記憶装置係数の算出において、読み出し要求時に、前記ストレージ装置が有する記憶装置から読み出される前記平均データ量を、前記読み出し要求または前記書き込み要求に応じて読み込まれるまたは書き込まれる記憶装置の個数の期待値に変換し、該期待値を用いて、前記冗長化係数及び前記記憶装置係数を算出する
ことを特徴とする付記１〜３のうちいずれか１項に記載の性能評価支援プログラム。
（付記５）ストレージ装置におけるデータ冗長化方式に関する冗長化方式情報と、該ストレージ装置が有する記憶装置の数と、該記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率と、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、前記ストレージ装置における書き込み要求に対する処理時間を表す定数と、前記記憶装置の種類によって決定される記憶装置定数とを取得する取得部と、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量を用いて、前記ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出する冗長化係数算出部と、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量と、前記使用率と、前記記憶装置定数とを用いて、前記記憶装置の性能に対する特徴量を示す記憶装置係数を算出する記憶装置係数算出部と、
前記記憶装置係数と、前記冗長化係数と、前記読み出し要求の割合と、前記処理時間を表す定数とを用いて、前記入出力指標に対して応答時間が一定である低負荷相と、前記入出力指標に対して前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す相変化多重度を算出する相変化多重度算出部と、
前記読み出し要求の割合と、前記単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指数を算出する読み出し要求数算出部と、
前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標とを用いて、前記読み出し要求に対する平均応答時間の予測値W_Rを算出する読み出し応答時間予測部と、
を備えることを特徴とする性能評価支援装置。
（付記６）前記読み出し応答時間予測部は、前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標と、以下の式
（ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R：単位時間当たりに発行される読み出し要求数）
を用いて前記読み出し要求に対する平均応答時間の予測値W_Rを算出する
ことを特徴とする付記５に記載の性能評価支援装置。
（付記７）前記取得部は、さらに、書き込み要求に対する応答時間を取得し、
前記性能評価支援装置は、さらに、
前記読み出し要求の割合と、前記読み出し要求に対する平均応答時間の予測値と、前記書き込み要求に対する応答時間を用いて、前記ストレージ装置に対して発行される要求に対する平均応答時間の予測値を算出する応答時間予測部と、
前記要求に対する平均応答時間の予測値に、前記入出力指標を乗じて、前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度を算出する多重度算出部と、
を備えることを特徴とする付記５または６に記載の性能評価支援装置。
（付記８）前記性能評価支援装置は、さらに、
読み出し要求時に、前記ストレージ装置が有する記憶装置から読み出される前記平均データ量を、前記読み出し要求または前記書き込み要求に応じて読み込まれるまたは書き込まれる記憶装置の個数の期待値に変換する期待値変換部
を備え、
前記冗長化係数算出部及び前記記憶装置係数算出部は、前記期待値を用いて、前記冗長化係数及び前記記憶装置係数を算出する
ことを特徴とする付記５〜７のうちいずれか１項に記載の性能評価支援装置。
（付記９）コンピュータに実行されるストレージ装置の性能評価支援方法であって、
前記コンピュータは、
前記ストレージ装置におけるデータ冗長化方式に関する冗長化方式情報と、該ストレージ装置が有する記憶装置の数と、該記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率と、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、前記ストレージ装置における書き込み要求に対する処理時間を表す定数と、前記記憶装置の種類によって決定される記憶装置定数とを取得し、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量を用いて、前記ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出し、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量と、前記使用率と、記憶装置定数とを用いて、前記記憶装置の性能に対する特徴量を示す記憶装置係数を算出し、
前記記憶装置係数と、前記冗長化係数と、前記読み出し要求の割合と、前記処理時間を表す定数とを用いて、前記入出力指標に対して応答時間が一定である低負荷相と、前記入出力指標に対して前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す相変化多重度を算出し、
前記読み出し要求の割合と、前記単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標を算出し、
前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標とを用いて、前記読み出し要求に対する平均応答時間の予測値W_Rを算出する
処理を実行することを特徴とする性能評価支援方法。
（付記１０）前記読み出し要求に対する平均応答時間の予測値Ｗ_Rは、前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標と、以下の式
（ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R：単位時間当たりに発行される読み出し要求数）
を用いて算出する
処理を実行することを特徴とする付記９に記載の性能評価支援方法。
（付記１１）前記コンピュータは、さらに、
書き込み要求に対する応答時間を取得し、
前記読み出し要求の割合と、前記読み出し要求に対する平均応答時間の予測値と、前記書き込み要求に対する応答時間を用いて、前記ストレージ装置に対して発行される要求に対する平均応答時間の予測値を算出し、
前記要求に対する平均応答時間の予測値に、前記入出力指標を乗じて、前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度を算出する
処理を実行することを特徴とする付記９または１０に記載の性能評価支援方法。
（付記１２）前記冗長化係数及び前記記憶装置係数の算出において、読み出し要求時に、前記ストレージ装置が有する記憶装置から読み出される前記平均データ量を、前記読み出し要求または前記書き込み要求に応じて読み込まれるまたは書き込まれる記憶装置の個数の期待値に変換し、該期待値を用いて、前記冗長化係数及び前記記憶装置係数を算出する
ことを特徴とする付記９〜１１のうちいずれか１項に記載の性能評価支援方法。

１性能評価支援装置
２取得部
３冗長化係数算出部
４記憶装置係数算出部
５相変化多重度算出部
６読み出し要求数算出部
７読み出し応答時間予測部
８期待値変換部
９応答時間予測部
１０多重度算出部
１１ホスト
１２ RAIDシステム
１３ RAIDコントローラ
１４ READキャッシュ
１５ WRITEキャッシュ
１６ RAIDグループ

Claims

コンピュータに、
ストレージ装置におけるデータ冗長化方式に関する冗長化方式情報と、該ストレージ装置が有する記憶装置の数と、該記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率と、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、前記ストレージ装置における書き込み要求に対する処理時間を表す定数と、前記記憶装置の種類によって決定される記憶装置定数とを取得させ、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量を用いて、前記ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出させ、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量と、前記使用率と、前記記憶装置定数とを用いて、前記記憶装置の性能に対する特徴量を示す記憶装置係数を算出させ、
前記記憶装置係数と、前記冗長化係数と、前記読み出し要求の割合と、前記処理時間を表す定数とを用いて、前記入出力指標に対して応答時間が一定である低負荷相と、前記入出力指標に対して前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す相変化多重度を算出させ、
前記読み出し要求の割合と、前記単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標を算出させ、
前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標とを用いて、読み出し要求に対する平均応答時間の予測値を算出させる
処理を実行させることを特徴とする性能評価支援プログラム。
前記読み出し要求に対する平均応答時間の予測値W_Rは、前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標と、以下の式
（ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R：単位時間当たりに発行される読み出し要求数）
を用いて算出されることを特徴とする請求項１記載の性能評価支援プログラム。
前記コンピュータに、さらに、
書き込み要求に対する応答時間を取得させ、
前記読み出し要求の割合と、前記読み出し要求に対する平均応答時間の予測値と、前記書き込み要求に対する応答時間を用いて、前記ストレージ装置に対して発行される要求に対する平均応答時間の予測値を算出させ、
前記要求に対する平均応答時間の予測値に、前記入出力指標を乗じて、前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度を算出させる
処理を実行させることを特徴とする請求項１または２に記載の性能評価支援プログラム。
前記冗長化係数及び前記記憶装置係数の算出において、読み出し要求時に、前記ストレージ装置が有する記憶装置から読み出される前記平均データ量を、前記読み出し要求または前記書き込み要求に応じて読み込まれるまたは書き込まれる記憶装置の個数の期待値に変換し、該期待値を用いて、前記冗長化係数及び前記記憶装置係数を算出する
ことを特徴とする請求項１〜３のうちいずれか１項に記載の性能評価支援プログラム。
ストレージ装置におけるデータ冗長化方式に関する冗長化方式情報と、該ストレージ装置が有する記憶装置の数と、該記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率と、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりに発行される要求の数を表す入出力指標と、前記ストレージ装置における書き込み要求に対する処理時間を表す定数と、前記記憶装置の種類によって決定される記憶装置定数とを取得する取得部と、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量を用いて、前記ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出する冗長化係数算出部と、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量と、前記使用率と、前記記憶装置定数とを用いて、前記記憶装置の性能に対する特徴量を示す記憶装置係数を算出する記憶装置係数算出部と、
前記記憶装置係数と、前記冗長化係数と、前記読み出し要求の割合と、前記処理時間を表す定数とを用いて、前記入出力指標に対して応答時間が一定である低負荷相と、前記入出力指標に対して前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す相変化多重度を算出する相変化多重度算出部と、
前記読み出し要求の割合と、前記単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指数を算出する読み出し要求数算出部と、
前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標とを用いて、読み出し要求に対する平均応答時間の予測値を算出する読み出し応答時間予測部と、
を備えることを特徴とする性能評価支援装置。
前記読み出し応答時間予測部は、前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標と、以下の式
（ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R：単位時間当たりに発行される読み出し要求数）
を用いて前記読み出し要求に対する平均応答時間の予測値W_Rを算出する
ことを特徴とする請求項５に記載の性能評価支援装置。
コンピュータに実行されるストレージ装置の性能評価支援方法であって、
前記コンピュータは、
前記ストレージ装置におけるデータ冗長化方式に関する冗長化方式情報と、該ストレージ装置が有する記憶装置の数と、該記憶装置の記憶領域のうち使用されている記憶領域の割合を表す使用率と、読み出し要求及び書き込み要求を含む要求に対する読み出し要求の割合と、読み出し要求に対して読み込まれるデータの平均データ量と、単位時間当たりに発行される前記要求の数を表す入出力指標と、前記ストレージ装置における書き込み要求に対する処理時間を表す定数と、前記記憶装置の種類によって決定される記憶装置定数とを取得し、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量を用いて、前記ストレージ装置のデータ冗長化方式に対する特徴量を示す冗長化係数を算出し、
前記冗長化方式情報と、前記記憶装置の数と、前記平均データ量と、前記使用率と、前記記憶装置定数とを用いて、前記記憶装置の性能に対する特徴量を示す記憶装置係数を算出し、
前記記憶装置係数と、前記冗長化係数と、前記読み出し要求の割合と、前記処理時間を表す定数とを用いて、前記入出力指標に対して応答時間が一定である低負荷相と、前記入出力指標に対して前記ストレージ装置への読み出し要求または書き込み要求が単位時間当たりに重なる個数を表す多重度が増加する高負荷相との境界となる多重度を示す相変化多重度を算出し、
前記読み出し要求の割合と、前記単位時間当たりに発行される入出力指標とを用いて、単位時間当たりに発行される読み出し要求の数を表す読み出し要求指標を算出し、
前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標とを用いて、前記読み出し要求に対する平均応答時間の予測値を算出する
処理を実行することを特徴とする性能評価支援方法。
前記読み出し要求に対する平均応答時間の予測値Ｗ_Rは、前記冗長化係数と、前記記憶装置係数と、前記相変化多重度と、前記読み出し要求指標と、以下の式
（ここで、Ａ：冗長化係数、α：記憶装置係数、ε：相変化多重度、X_R：単位時間当たりに発行される読み出し要求数）
を用いて算出する
処理を実行することを特徴とする請求項７に記載の性能評価支援方法。