JP6752889B2 - Management method and management calculator - Google Patents
Management method and management calculator Download PDFInfo
- Publication number
- JP6752889B2 JP6752889B2 JP2018533329A JP2018533329A JP6752889B2 JP 6752889 B2 JP6752889 B2 JP 6752889B2 JP 2018533329 A JP2018533329 A JP 2018533329A JP 2018533329 A JP2018533329 A JP 2018533329A JP 6752889 B2 JP6752889 B2 JP 6752889B2
- Authority
- JP
- Japan
- Prior art keywords
- countermeasure
- resource
- bottleneck
- load data
- load
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Description
本発明は、管理方法に関する。 The present invention relates to a management method.
計算機システムの運用管理においては、サーバやストレージシステムといったシステム構成要素の性能を監視し、性能低下が検知された場合には性能が自然と回復したか否かに限らず、将来的に性能低下が再発しないように構成変更等の対策を講じる必要がある。しかしながら、実施し得る構成変更手段と構成変更手段のパラメータとの組み合わせは大量である。そのため、管理者負担軽減のためには性能低下再現を抑止する対策案を提案する支援が重要である。 In computer system operation management, the performance of system components such as servers and storage systems is monitored, and if performance degradation is detected, it does not matter whether the performance recovers naturally or not, and performance degradation will occur in the future. It is necessary to take measures such as configuration changes to prevent recurrence. However, there are a large number of possible combinations of the configuration changing means and the parameters of the configuration changing means. Therefore, in order to reduce the burden on the administrator, it is important to support the proposal of countermeasures to prevent the reproduction of performance degradation.
特許文献1によれば、ストレージシステム内の論理ボリュームに対するI/O量が変化して所定の要求性能を満たさなくなった場合に、要求性能を満たさなくなった時点の構成情報、性能情報、及び容量消費傾向を基に、将来時点で論理ボリュームの要求性能を満たす状態とする構成変更案を生成し、最も適切な構成変更案を表示することができる。また、将来の構成変更予定の情報を基に、将来のストレージシステムの消費容量と構成変化を予測し、構成変更実施予定時刻において実施することができる構成変更案のみを表示することができる。
According to
上述の特許文献1は、論理ボリュームの所定の要求性能を満たさなくなった時点、及び構成変更に要する時間を加味した構成変更終了時点の、構成情報と性能情報を基に、要求性能を満たすことができる構成変更案を生成する。
The above-mentioned
しかしながら、変化が緩やかな容量消費傾向に比べて性能はアプリケーションのワークロードに応じて刻々と大きく変化する。そのため、特許文献1に基づき特定時点のみの情報を用いて生成した対策案では、性能低下時の負荷が再度発生した場合に、着目した時点に関しては性能低下再発が抑止されたとしても、それ以外の時点では適切な性能改善効果が見込めず性能低下が発生する可能性がある。
However, compared to the gradual change in capacity consumption tendency, the performance changes greatly from moment to moment depending on the workload of the application. Therefore, in the countermeasure plan generated by using the information only at a specific time point based on
一方で、前述の通り性能は刻々と変化するため、性能低下再現を防ぎたい複数の過去時点について、特許文献1に基づき対策案を生成したとしても、着目する時点によって生成される対策案が異なる可能性がある。全ての時点について適切な対策案を生成しようとすると、膨大な計算時間が必要になる。
On the other hand, as described above, the performance changes from moment to moment, so even if a countermeasure plan is generated based on
上記課題を解決するために、本発明の一態様である管理方法は、計算機システム内の複数のリソースのうち過去の期間の前記計算機システムの性能低下の原因であるボトルネックリソースに対し、前記期間の前記ボトルネックリソースの負荷の時系列データであるボトルネック負荷データを取得し、前記複数のリソースのうち前記ボトルネックリソースの負荷に影響を与える関連リソースに対し、前記期間の前記関連リソースの負荷の時系列データである関連負荷データを取得し、前記ボトルネック負荷データの傾向に基づいて、前記計算機システムの操作に必要なパラメータの決定の方針を示す複数の対策方針候補の中から、前記性能低下のための対策方針を選択し、前記対策方針と前記関連負荷データの傾向とに基づいて、夫々が前記計算機システムの操作を示す複数の対策手段候補の中から、前記性能低下のための対策手段を選択し、前記対策方針に基づいて、前記対策手段のパラメータを決定する、ことを備える。 In order to solve the above problems, the management method according to one aspect of the present invention has a period of the bottleneck resource that is the cause of the performance deterioration of the computer system in the past period among a plurality of resources in the computer system. The bottleneck load data, which is the time-series data of the load of the bottleneck resource, is acquired, and the load of the related resource during the period is relative to the related resource that affects the load of the bottleneck resource among the plurality of resources. The performance is selected from a plurality of countermeasure policy candidates that acquire the related load data, which is the time-series data of the above, and indicate the policy for determining the parameters necessary for operating the computer system based on the tendency of the bottleneck load data. A countermeasure for the deterioration is selected, and based on the countermeasure policy and the tendency of the related load data, the countermeasure for the performance deterioration is selected from a plurality of countermeasure candidate candidates each indicating the operation of the computer system. It is provided that the means is selected and the parameters of the countermeasure means are determined based on the countermeasure policy.
期間に亘って適切な対策案を、迅速に生成することができる。 Appropriate countermeasures can be quickly generated over a period of time.
幾つかの実施例について、図面を参照して説明する。なお、以下に説明する実施例は請求の範囲にかかる発明を限定するものではなく、また実施例の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。 Some embodiments will be described with reference to the drawings. It should be noted that the examples described below do not limit the invention according to the claims, and that all the elements and combinations thereof described in the examples are indispensable for the means for solving the invention. Not exclusively.
なお、以下の説明では、「aaaテーブル」の表現にて各種情報を説明することがあるが、各種情報は、テーブル以外のデータ構造で表現されていても良い。データ構造に依存しないことを示すために「aaaテーブル」を「aaa情報」と呼ぶことができる。さらに、テーブル内の各列の値からなる情報要素を欄またはエントリと呼び、「aaaテーブル」のエントリを、説明のために、「aaaテーブルエントリ」と称する。 In the following description, various information may be described by the expression of "aaa table", but various information may be expressed by a data structure other than the table. The "aaa table" can be called "aaa information" to show that it does not depend on the data structure. Further, an information element consisting of the values of each column in the table is referred to as a column or entry, and an entry in the "aaa table" is referred to as an "aaa table entry" for the sake of explanation.
また、以下の説明では、単に管理計算機及びサーバを主語として処理を説明する場合があるが、これら処理は、計算機が備える制御デバイスが有するプロセッサ(例えば、CPU(Central Processing Unit))によって、実行されていることを示す。同様に、単にストレージ装置を主語として処理を説明する場合には、ストレージ装置が備えるコントローラが実行していることを示す。また、上記制御デバイス及びコントローラのうちの少なくとも1つは、プロセッサそれ自体であっても良いし、制御デバイス又はコントローラが行う処理の一部又は全部を行うハードウェア回路を含んでも良い。 Further, in the following description, the processing may be described simply with the management computer and the server as the subjects, but these processings are executed by the processor (for example, CPU (Central Processing Unit)) of the control device included in the computer. Indicates that Similarly, when the process is simply described with the storage device as the subject, it indicates that the controller provided in the storage device is executing. Further, at least one of the control device and the controller may be the processor itself, or may include a hardware circuit that performs a part or all of the processing performed by the control device or the controller.
プログラムは、プログラムソースから各計算機或いはストレージ装置にインストールされても良い。プログラムソースは、例えば、プログラム配布サーバ又は記憶メディアであっても良い。 The program may be installed on each computer or storage device from the program source. The program source may be, for example, a program distribution server or storage media.
以降の説明においては、構成変更操作(例えばVMを移動する、オーナー権を変更する)や設定変更操作(例えばI/O量に上限を設定する)などの操作のことを対策手段と記載し、対策手段を実施する際に入力する必要がある設定値のことをパラメータと記載する。また、対策手段とパラメータの組み合わせのことを対策案やプランと記載する。 In the following description, operations such as configuration change operations (for example, moving a VM, changing ownership) and setting change operations (for example, setting an upper limit on the amount of I / O) are described as countermeasures. Describe the set value that needs to be entered when implementing the countermeasure measures as a parameter. In addition, the combination of countermeasure means and parameters is described as a countermeasure plan or plan.
(1−1)本実施例の形態の概要 (1-1) Outline of the embodiment of this embodiment
図1は、実施例1に係る管理計算機の動作の概要を示す。 FIG. 1 shows an outline of the operation of the management calculator according to the first embodiment.
この図は、計算機システム10における性能低下対策案の生成指示方法の例と、性能低下対策案の提示例、及び対策案生成の流れを示す。
This figure shows an example of a method for instructing generation of a performance deterioration countermeasure plan in the
管理計算機100は、計算機システム10と、表示装置400とに接続される。計算機システム10は、サーバ200と、ストレージ装置300とを含む。また、サーバ200ではVM700が稼動していてもよい。これらの詳細は後述する。表示装置400は、入力装置を含んでいてもよいし、端末装置であってもよい。計算機システムは、サーバ200とストレージ装置300の何れか一つであってもよいし、VMとボリュームを提供する一つの計算機であってもよい。
The
本実施例の概要を示すための一例として、図1ではストレージ装置300内のボリューム1に関して、性能低下が発生し要求性能を下回る状態が発生した場合を示している。以下、本実施例における処理の流れを説明する。
As an example for showing the outline of this embodiment, FIG. 1 shows a case where the performance of the
まず、管理計算機100が計算機システムの性能低下を検知すると、管理者に対してアラートを発行する。アラートを受領すると管理者は、過去の任意期間を指定期間として指定して、指定期間の負荷が再度発生しても性能低下が再発しないことを目的とする対策案の生成を開始する。指定期間の指定の方法は例えば、表示装置400に表示された画面に、指定期間の開始時刻と終了時刻を入力する方法でも良いし、負荷変化を示すグラフ上の点をポイントする、グラフ上の時刻を表す線分を移動させるなどの方法であっても良い。
First, when the
また、管理計算機100が、性能低下を検知した場合に、指定期間を設定し、自動的に対策案の生成を開始してもよい。
Further, when the
管理計算機100は、対策方針判断モジュールと、対策手段選択モジュールと、対策案生成モジュールとを含む。管理計算機100が、表示装置400から指定期間を指定され性能低下への対策を指示されると、対策方針判断モジュールは、性能低下が発生した計算機システムの構成要素(以降、構成要素のことをリソースと呼び、特に性能低下の原因であるリソースをボトルネックリソースと呼ぶ)の指定期間における負荷情報を参照し、負荷の傾向である負荷傾向を分析する。そして、対策方針判断モジュールは、分析結果を元に、ボトルネックリソースの性能低下が再現したと仮定した場合に、その性能低下を効率的に解消することができる対策案の生成方針(以降、簡単のために対策方針と記載する)を決定する。この図の例において、ボトルネックリソースは、ストレージ装置300のボリューム1であり、ボトルネックリソースの負荷は、稼働率で表される。
The
次に、対策手段選択モジュールは、ボトルネックリソースの負荷を増加させている原因である(ボトルネックリソースの負荷に影響を与える)、計算機システムの構成要素(以降、簡単のために関連リソースと呼ぶ)の指定期間における負荷情報を参照し、各関連リソースの負荷傾向を分析する。そして、その分析結果を元に、先に決定した対策方針の下で、性能低下の解消の効果がある対策手段のみを選択する。この図の例において、関連リソースは、サーバ200のVM1、VM2であり、関連リソースの負荷は、I/O量で表される。
Next, the countermeasure selection module is the cause of increasing the load of the bottleneck resource (affecting the load of the bottleneck resource), and is a component of the computer system (hereinafter referred to as a related resource for simplicity). ) Refers to the load information in the specified period and analyzes the load tendency of each related resource. Then, based on the analysis result, only the countermeasure measures effective in eliminating the performance deterioration are selected based on the countermeasure policy decided in advance. In the example of this figure, the related resources are VM1 and VM2 of the
その後、対策案生成モジュールは、先に決定した対策手段のパラメータの計算方法を決定する。そして、決定した計算方法に基づいてパラメータ(対策手段の設定値)を決定する。 After that, the countermeasure plan generation module determines the calculation method of the parameters of the countermeasure means determined earlier. Then, the parameter (set value of the countermeasure means) is determined based on the determined calculation method.
この図の例において、対策方針判断モジュールは、ボトルネックリソース負荷傾向に基づいて、対策方針として、各時点の負荷を均一に押し下げることを選択する。対策手段選択モジュールは、対策方針と関連リソース負荷傾向とに基づいて、対策手段として、ストレージ側I/O量制限を選択する。対策案生成モジュールは、制限するI/O量を決定する。 In the example of this figure, the countermeasure policy determination module selects to uniformly reduce the load at each time point as the countermeasure policy based on the bottleneck resource load tendency. The countermeasure means selection module selects the storage side I / O amount limit as the countermeasure means based on the countermeasure policy and the related resource load tendency. The countermeasure generation module determines the amount of I / O to be limited.
管理計算機100は、決定した対策案を表示装置400に表示させる。表示方法は、例えば対策手段(Method)とそのパラメータ(Detail)を、テキストで表示する方法であっても良い。また、表示される内容は、対策手段とパラメータ以外の要素、例えば対策案の概要などの付加情報を含んでもよく、複数の対策案を表示してもよい。
The
また、対策案は、表示装置400に表示されるのみではなく、ファイルなどの電子データとして保存されてもよい。
Further, the countermeasure plan is not only displayed on the
(1−2)計算機システムのハードウェア構成 (1-2) Hardware configuration of computer system
図2は、実施例1に係る計算機システムのハードウェア構成を示す。 FIG. 2 shows the hardware configuration of the computer system according to the first embodiment.
サーバ200が例えばLAN(Local Area Network)などの第1の通信ネットワーク500を介して、管理計算機100、ストレージ装置300、表示装置400に接続されている。また、サーバ200は例えばSAN(Storage Area Network)などの第2の通信ネットワーク600を介してストレージ装置300と接続されている。なお、第1の通信ネットワーク500と第2の通信ネットワーク600は一体に形成されていてもよい。
The
管理計算機100は、例えばNIC(Network Interface Card)などのI/F130を含む。詳細は図3の説明として後述する。
The
サーバ200は、プロセッサ210と、記憶資源220と、管理I/F(以下、M−I/Fと記載)230と、通信I/F(以下、C−I/Fと記載)240を含んで構成される物理計算機である。
The
M−I/F230は第1のプロトコルで通信するための通信インタフェース装置であり、例えばNICである。C−I/F240は第2のプロトコルで通信するためのインタフェース装置であり、例えばHBA(Host Bus Adapter)である。
The MI /
記憶資源220は例えばメモリであり、HDD(Hard Disk Drive)などの補助記憶装置を含んでも良い。記憶資源220は、例えばOS(Operating System)や業務アプリケーションなどのアプリケーション・プログラムを記憶し、プロセッサ210がそのアプリケーション・プログラムやOSを実行する。
The
ストレージ装置300は、記憶デバイス群360と、記憶デバイス群360に接続されたコントローラ390とを有する。記憶デバイス群360は1以上の記憶デバイスから構成される。記憶デバイスは、例えばSSD(Solid State Drive)であり、HDDや、FeRAMといったその他の不揮発性メモリであってもよい。このように、ストレージ装置300は性能の異なる複数の記憶デバイスが混在していてもよい。なお、記憶デバイス群360はストレージ装置300の外部から提供されるものであってもよい。
The
コントローラ390は、メモリ320と、M−I/F330と、C−I/F340と、デバイスI/F(D−I/F)350と、キャッシュメモリ380と、それらに接続されたプロセッサ310を有する。
The
D−I/F350は第3のプロトコルで記憶デバイスと通信するための通信インタフェース装置である。D−I/F350は、記憶デバイスの種類毎に有していてもよい。
The DI / F350 is a communication interface device for communicating with a storage device by a third protocol. The DI /
メモリ320は、プロセッサ310で実行されるコンピュータプログラムや、種々の情報を記憶する。また、キャッシュメモリ380は、サーバ200から受けたライトコマンドに従うデータや、サーバ200から受けたリードコマンドに応答して、記憶デバイスから読み出されたデータが一時格納される。なお、メモリ320とキャッシュメモリ380は一体の装置であってもよい。
The
表示装置400は、例えばディスプレイとキーボードとポインタデバイス等の入出力デバイスを含む装置であるが、これ以外のデバイスであってもよい。また、入出力デバイスの代替としてシリアルインタフェースやイーサーネットインタフェースを入出力デバイスとし、当該インタフェースにディスプレイ又はキーボード又はポインタデバイスを有する表示用計算機を接続し、表示用情報を表示用計算機に送信したり、入力用情報を表示用計算機から受信することで、表示用計算機で表示を行ったり、入力を受け付けることで入出力デバイスでの入力及び表示を代替してもよい。また、表示装置400は、管理計算機100や、サーバ200と一体として形成してもよい。
The
以上が、実施例1に係る計算機システムのハードウェア構成である。なお、処理の高速化や信頼性向上のために、管理計算機100、サーバ200、ストレージ装置300は複数接続されていてもよい。
The above is the hardware configuration of the computer system according to the first embodiment. A plurality of
図3は、実施例1に係る管理計算機のハードウェア構成を示す。 FIG. 3 shows the hardware configuration of the management computer according to the first embodiment.
管理計算機100は、記憶資源110と、通信インタフェース(I/F)130と、それらに接続されたプロセッサ120を含んで構成される。
The
記憶資源110は、例えばメモリであり、HDD等の補助記憶装置を含んでも良い。記憶資源110は、種々の情報と、プロセッサ120によって実行されるプログラムを記憶する。具体的には、情報として、VM管理テーブル1101、ホスト管理テーブル1102、ストレージボリューム管理テーブル1103、しきい値管理テーブル1104、性能管理テーブル1105、対策手段管理テーブル1106、メトリック管理テーブル1107、対策手段適用管理テーブル1108、選択手段保持テーブル1109が記憶され、プログラムとして、監視プログラム1121、対策案生成プログラム1122、対策方針判断プログラム1123、対策手段選択プログラム1124、パラメータ計算スクリプト群113が記憶される。
The
(1−3)計算機システムの論理構成 (1-3) Logical configuration of computer system
図4は、実施例1に係る計算機システムの論理構成を示す。 FIG. 4 shows the logical configuration of the computer system according to the first embodiment.
ストレージ装置300は、複数のボリューム370を有する。ボリュームは例えば後述する論理ボリューム、仮想ボリューム、ダイナミック仮想ボリュームであってもよい。
The
論理ボリュームは記憶デバイスの物理記憶領域(物理ページと呼ぶ)から構成されたボリュームである。ストレージ装置300の内部において、複数の記憶デバイスをRAID(Redundant Arrays of Independent Disks)技術でまとめた記憶デバイスのグループをRAIDグループと呼ぶ(図示せず)。論理ボリュームは、RAIDグループの一部物理領域を切り出し、計算機から論理的に1つの記憶資源としてアクセス可能としたLU(Logical Unit)である。
A logical volume is a volume composed of a physical storage area (called a physical page) of a storage device. Inside the
仮想ボリュームは、ストレージ装置300のシンプロビジョニング機構により実現される仮想的なボリュームである。シンプロビジョニング機構は、複数の論理ボリュームの論理的な記憶領域(論理ページと呼ぶ)からプールを構成する(図示せず)。そして、シンプロビジョニング機構は、仮想ボリュームに対するサーバ200からのI/Oを受領したときに、プールから論理ページを仮想ボリュームに割り当てる。これにより、シンプロビジョニング機構は、必要に応じて仮想ボリュームの容量を拡張することができる。
The virtual volume is a virtual volume realized by the thin provisioning mechanism of the
ダイナミック仮想ボリュームは、仮想ボリュームに対するI/O量の変化などに対応して、論理ページに対応する物理ページをI/O性能や信頼性の異なる別の記憶デバイスの物理ページに動的に変更することができる仮想ボリュームである。 The dynamic virtual volume dynamically changes the physical page corresponding to the logical page to the physical page of another storage device having different I / O performance and reliability in response to a change in the amount of I / O with respect to the virtual volume. It is a virtual volume that can be.
サーバ200はストレージ装置300へアクセスする計算機の一例である。サーバ200はアプリケーション・プログラムを実行することができるOSや、VM700を論理的に生成して実行することができるハイパバイザ800を有していてもよい。ハイパバイザ800は一度に複数のVM800を制御することができる。夫々のVM800は、あたかもスタンドアローンの物理計算機のようにアプリケーション・プログラムを実行することができる。
The
ボリューム370は、サーバ200やVM700のいずれか1つに対して提供される。例えば、汎用的なOSを有するサーバ200に対して提供されたボリューム370は、OSから一つの記憶資源として認識される。ハイパバイザ800を有するサーバ200に対して提供されたボリューム370は、データストアとして認識され、複数のVM700のデータが格納される。ハイパバイザ800は、データストアに格納したVMのデータを、プロセッサ210で実行することでVM700を提供する。そのため、VM700上で設定変更が行われると、ボリューム370に対してI/Oが発生する。また、ボリューム370がVM700に直接に提供されてもよい。その場合、ボリューム370はVM700上から一つの記憶資源として認識される。
The
なお、ハイパバイザ800は、複数のボリューム370を用いてVM700を構成してもよい。この場合は、VM700の制御情報や、OSイメージや、スナップショットなどの各情報が夫々別のボリューム370に格納される。
The
ハイパバイザ800は、あるサーバ200上で稼動しているVM700を別のサーバ200に対して移動する、VMマイグレーションの機能を有していてもよい。また、あるVM700のデータを別のボリューム370に移動させる、VMストレージマイグレーションの機能を有していてもよい。
The
(1−4)各種テーブルの内容 (1-4) Contents of various tables
図5は、VM管理テーブル1101を示す。 FIG. 5 shows the VM management table 1101.
VM管理テーブル1101は、VM700の各種情報を格納する。VM管理テーブル1101によって、VM700を稼動させるサーバ200およびVM700のデータを格納するデータストア、VM700の各種設定情報、VM700の移動先として選択可能なサーバやデータストアの情報などが分かる。管理計算機100は、定期的にサーバ200と通信し、サーバ200で稼動する各VM700の各種情報を取得し、VM管理テーブル1101に格納する。
The VM management table 1101 stores various information of the
具体的にVM管理テーブル1101は、VM毎のエントリに以下の情報を有する。VMID11010は、当該VMを識別するためのIDである。サーバID11011は、当該VMが稼動しているサーバ200を識別するためのIDである。データストア名11012は、当該VMのデータが格納されているデータストアの名前である。CPUコア数11013は、当該VMに割り当てられているCPUのコア数である。メモリ量11014は、当該VMが使用可能なメモリ量の最大値である。なお、CPUコア数11013とメモリ量11014はVM700の設定値の一例である。VM管理テーブル1101は他の設定値を含んでもよい。
Specifically, the VM management table 1101 has the following information in the entry for each VM. The VMID11010 is an ID for identifying the VM. The
移動可能サーバID11015は、当該VMの移動先となることができるサーバ200のIDである。当該VMの移動先となることができるサーバ200が無い場合は、“―”が格納される。
The
移動可能データストア名11016は、当該VMのデータの移動先となることができるデータストアの名前である。当該VMのデータの移動先となることができるデータストアが無い場合は、“―”が格納される。
The movable
図6は、ホスト管理テーブル1102を示す。 FIG. 6 shows the host management table 1102.
ホスト管理テーブル1102は、ストレージ装置300にアクセスする計算機の各種情報を格納する。ホスト管理テーブル1102によって、各計算機が物理計算機かVMか、汎用のOSが稼動しているかハイパバイザが稼動しているか、の判別ができる。また、サーバ200の各種構成情報や設定情報が分かる。管理計算機100は、定期的にサーバ200やVM700と通信し、各種情報を取得してホスト管理テーブル1102に格納する。
The host management table 1102 stores various information of the computer that accesses the
具体的にホスト管理テーブル1102は、計算機毎のエントリに以下の情報を有する。サーバID11020は、当該計算機を識別するためのIDである。仮想化フラグ11021は、当該計算機がサーバ200の場合には“No”が格納され、VM700の場合は“Yes”が格納される。VMID11022は、当該計算機がVMの場合にVMID11010を格納する。当該計算機がVMで無い場合は、“―”が格納される。OS種類11023は、当該計算機に適用されているOSの種類を格納する。当該計算機でハイパバイザが稼動している場合は、値として“ハイパバイザ”が格納される。また、当該計算機で汎用OSが稼動している場合は、OSの種類が判別できる値が格納される。例えば、OS名が格納される。
Specifically, the host management table 1102 has the following information in the entry for each computer. The
CPUコア数11024は、当該計算機がサーバ200の場合はプロセッサ210のコア数が格納され、当該計算機がVM700の場合は割り当てられているコア数11013の値が格納される。メモリ量11025は、当該計算機がサーバ200の場合は記憶資源220のうちメモリの容量が格納され、計算機がVM700の場合は割り当てられているメモリ量11014の値が格納される。なお、CPUコア数11024とメモリ量11025は計算機の設定値の一例である。ホスト管理テーブル1102はその他の情報、例えばクラスタリングの構成情報や、電源管理の設定など他の設定値を含んでもよい。ボリュームID11026は、当該計算機に対して提供されているボリュームの識別IDが格納される。
The number of
図7は、ストレージボリューム管理テーブル1103を示す。 FIG. 7 shows the storage volume management table 1103.
ストレージボリューム管理テーブル1103は、ストレージ装置300が提供するボリューム370の各種情報を格納する。ストレージボリューム管理テーブル1103によって、ストレージ装置300内部におけるボリューム370の構成情報と設定情報とが分かる。例えば、ボリューム370とRAIDグループやプールの関連が分かる。また、ボリューム370に対して発行されるI/Oを制御するためのCPUの割り当て設定などが分かる。さらに、ストレージボリューム管理テーブル1103によって、ボリューム370の提供を受ける計算機が分かる。管理計算機100は定期的にサーバ200、ストレージ装置300と通信し、ボリューム370の各種情報を取得し、ストレージボリューム管理テーブル1103に格納する。
The storage volume management table 1103 stores various information of the
具体的にはストレージボリューム管理テーブル1103は、ボリューム毎のエントリに、以下の情報を有する。ストレージID11030は、当該ボリュームを有するストレージ装置300を識別するためのIDである。ボリュームID11031は、当該ボリュームを識別するためのIDである。RAIDグループID11032は、当該ボリュームが論理ボリュームである場合に、当該ボリュームが所属するRAIDグループを識別するためのIDである。当該ボリュームが論理ボリュームで無い場合は、“―”の値が格納される。プールID11033は、当該ボリュームが仮想ボリュームである場合に、当該ボリュームが所属するプールを識別するためのIDである。当該ボリュームが仮想ボリュームで無い場合は、“―”の値が格納される。
Specifically, the storage volume management table 1103 has the following information in the entry for each volume. The
担当CPUID11034は、当該ボリュームへのI/O処理や、当該ボリュームに関連するレプリケーションなどのその他のストレージ内部処理を担当するプロセッサ310を識別するためのIDである。キャッシュメモリID11035は、当該ボリュームへのI/O処理や、当該ボリュームに関連するレプリケーションなどのその他のデータ処理を担当するキャッシュメモリ380を識別するためのIDである。キャッシュメモリ容量11036は、当該ボリュームへのI/O処理や、当該ボリュームに関連するレプリケーションなどのその他のデータ処理においてキャッシュとして利用することができる最大容量である。例えば、ストレージ装置300は、キャッシュメモリ380の領域を論理的に分割し、ボリューム370毎に利用可能な領域を割り当てる機能を有していてもよい。キャッシュメモリ380の領域が論理的に分割されている場合は、キャッシュメモリ容量11036には、当該ボリュームが利用することができるキャッシュメモリ領域の容量が格納され、当該ボリュームのキャッシュメモリ領域への割当状態が変更された場合などにキャッシュメモリ容量11036の値が変更される。なお、担当CPUID11034、キャッシュメモリID11035、キャッシュメモリ容量11036は、当該ボリュームの設定情報の一部である。ストレージボリューム管理テーブル1103は、その他の情報、例えばボリューム370のレプリケーションに関する設定や、ダイナミック仮想ボリュームの場合には論理ページが配置される記憶デバイスなどの設定を含んでいてもよい。
The
割当サーバID11037は、当該ボリュームの提供を受けるサーバ200またはVM700を識別するIDである。データストア名11038は、当該ボリュームがハイパバイザを有するサーバ200に提供されている場合に、ハイパバイザ上で当該ボリュームに設定されているデータストアの名前である。
The
図8は、しきい値管理テーブル1104を示す。 FIG. 8 shows the threshold management table 1104.
しきい値管理テーブル1104は、計算機システムを構成する各構成要素について、解消するべき性能低下が発生したと判断するためのしきい値を保持する。しきい値管理テーブル1104は、しきい値として警告しきい値と絶対しきい値の2種類のしきい値を保持する。絶対しきい値は、SLA(Service Level Agreement)を守るために、維持する必要のあるしきい値である。警告しきい値は、特定のリソースの特定の性能メトリックが絶対しきい値に近づかないようにするためのしきい値であり、絶対しきい値よりも程度の低い値が設定される。性能メトリックは、リソースの負荷を示す値であり、計算機システムにより記録される。 The threshold value management table 1104 holds a threshold value for determining that a performance deterioration to be resolved has occurred for each component constituting the computer system. The threshold value management table 1104 holds two types of threshold values, a warning threshold value and an absolute threshold value. The absolute threshold is a threshold that needs to be maintained in order to protect the SLA (Service Level Agreement). The warning threshold is a threshold for preventing a specific performance metric of a specific resource from approaching the absolute threshold, and is set to a value lower than the absolute threshold. The performance metric is a value indicating the load of the resource and is recorded by the computer system.
具体的にはしきい値管理テーブル1104は、リソース毎のエントリに以下の値を有する。リソースID11040は、計算機システムを構成する構成要素であるリソースを識別するIDである。計算機システムは、構成要素として、サーバ200や、ストレージ装置300や、ネットワークスイッチなど計算機システムを構成する物理構成要素の内部物理構成要素、例えばストレージ装置300内部のRAIDグループなどを含んでもよい。また、計算機システムは、VM700など、性能メトリックを有する論理的な構成要素を含んでもよい。リソース種別11041は、当該リソースの種別を示す。例えば、ストレージ装置300の内部のプールであれば“Storage.Pool”の値が格納される。性能メトリック種別11042は、しきい値が設定される性能メトリックの種別を表す。例えば、単位時間当たりに利用されている時間の割合を示す“稼働率”や、単位時間当たりのI/O回数を表す“IOPS”の値が格納される。警告しきい値11043は、警告しきい値の値が格納される。警告しきい値11043には、絶対しきい値11044以下の値が格納される。絶対しきい値11044は、SLAやSLO(Service Level Objective)から算出されたしきい値が格納される。警告しきい値超過許容時間11045は、警告しきい値11043を超過することが許容される時間が格納される。
Specifically, the threshold value management table 1104 has the following values in the entries for each resource. The
図9は、性能管理テーブル1105を示す。 FIG. 9 shows the performance management table 1105.
性能管理テーブル1105は、計算機システムから取得される、各リソースの性能メトリックの時系列データである性能データを保持する。ここでの性能管理テーブル1105の例は、ストレージ装置300内部のプールに関する性能データを保持する。なお、管理計算機100は、リソース種別毎に、同様の構造の性能管理テーブルを格納していてもよい。この図は、それらの一例として記載するものである。性能管理テーブル1105によって、過去の特定時刻における各リソースの性能データが分かる。管理計算機100は、定期的に監視プログラム1121を実行し、取得した性能データを性能管理テーブル1105に保存する。
The performance management table 1105 holds performance data which is time series data of performance metrics of each resource acquired from the computer system. The example of the performance management table 1105 here holds performance data related to the pool inside the
具体的には性能管理テーブル1105は、リソース毎、時刻毎のエントリに、以下の情報を有する。リソースID11050は、当該リソースを識別するためのIDである。時刻11051は、当該リソースの性能データ内の一つの値を取得した時刻である。稼働率11052は、当該時刻における当該リソース(図9においてはプール)の稼働率である。IOPS11053は、当該時刻における当該リソース(図9においてはプール)のIOPSである。稼働率11052とIOPS11053は、性能メトリックの一例である。これらの値は、リソース種別によって、取得することができる性能メトリックに代えられていてもよいし、性能管理テーブル1105に含まれる性能メトリックの種類は2個に限らない。
Specifically, the performance management table 1105 has the following information in the entries for each resource and each time. The
図10は、対策手段管理テーブル1106を示す。 FIG. 10 shows a countermeasure means management table 1106.
対策手段管理テーブル1106は、ボトルネックリソースの種別と、しきい値を違反している性能メトリックの種別毎に性能メトリックを改善することができる対策手段を保持する。対策手段管理テーブル1106によって、性能低下発生時に有効な対策手段を判別することができ、さらに対策手段のパラメータとなるリソースであるパラメータリソースの種別と、組み合わせることができる対策手段を判別することができる。 Countermeasure measures The management table 1106 holds countermeasures that can improve the performance metric for each type of bottleneck resource and the type of performance metric that violates the threshold value. The countermeasure measures management table 1106 can be used to determine effective countermeasure measures when performance degradation occurs, and further, it is possible to determine the types of parameter resources that are the parameters of the countermeasure measures and the countermeasure measures that can be combined. ..
具体的には対策手段管理テーブル1106は、対策手段毎のエントリに、以下の情報を有する。ボトルネックリソース種別11060は、当該対策手段の対象のボトルネックリソースの種別である。しきい値管理テーブル1104のリソース種別11041と同様の値を格納することができる。ボトルネック性能メトリック種別11061は、しきい値を違反している性能メトリックの種別である。しきい値管理テーブル1104の性能メトリック種別11042と同様の値を格納することができる。対策手段11062は、ボトルネックリソース種別11060に関して、ボトルネック性能メトリック種別11061の性能データを改善することができる当該対策手段である。例えば、“VMストレージマイグレーション”や“I/O量上限制御”など、対策手段を特定することができる値が格納される。パラメータリソース種別11063は、当該対策手段がパラメータとするリソースの種別である。例えば、値が“VM”であればVMを対象とした対策手段であることを示し、値が“Storage.Volume”であればストレージ装置300内部のボリューム370を対象とした対策手段であることを示す。組み合わせ可能対策手段11064は、当該対策手段と同時に実施することができる別の対策手段を示す。
Specifically, the countermeasure means management table 1106 has the following information in the entry for each countermeasure means. The
図11は、メトリック管理テーブル1107を示す。 FIG. 11 shows the metric management table 1107.
メトリック管理テーブル1107は、ボトルネックリソースの性能メトリックに関連して値が変化する、別のリソースの性能メトリック種別が格納される。 The metric management table 1107 stores the performance metric type of another resource whose value changes in relation to the performance metric of the bottleneck resource.
具体的にはメトリック管理テーブル1107は、性能メトリックの組み合わせ毎のエントリに、以下の情報を有する。ボトルネックリソース種別11070は、性能低下の原因であるボトルネックリソースの種別を示す。ボトルネック性能メトリック種別11071は、しきい値を違反しているボトルネックリソースの性能メトリックの種別を示す。パラメータリソース種別11072は、ボトルネックリソース種別11070のボトルネック性能メトリック種別11071に関連するリソースの種別である。パラメータ性能メトリック種別11073は、ボトルネック性能メトリック種別11071に関連している性能メトリックの種別である。
Specifically, the metric management table 1107 has the following information in the entry for each combination of performance metrics.
この図に示す一例は、VM700やボリューム370のIOPSが増加した結果、ストレージ装置300の内部のプールの稼働率が上昇している(悪化している)ことを示している。
An example shown in this figure shows that the operating rate of the pool inside the
図12は、対策手段適用管理テーブル1108を示す。 FIG. 12 shows a countermeasure means application management table 1108.
対策手段適用管理テーブル1108によって、ボトルネックリソースや関連リソースの負荷傾向に基づき対策手段が有効か、無効かを判断することができる。 The countermeasure measure application management table 1108 can be used to determine whether the countermeasure means are effective or invalid based on the load tendency of the bottleneck resource and the related resource.
具体的には対策手段適用管理テーブル1108は、対策手段毎のエントリに以下の情報を有する。ボトルネックリソース種別11080は、性能低下の原因であるボトルネックリソースの種別を示す。性能メトリック種別11081は、しきい値を違反しているボトルネックリソースの性能メトリックの種別を示す。対策手段11082は、VMストレージマイグレーションなどの対策手段を表す値が格納される。
Specifically, the countermeasure means application management table 1108 has the following information in the entry for each countermeasure means. The
対策方針11083は、ボトルネックリソースの性能低下を解消するための当該対策手段のパラメータ決定の方針を示す。例えば、指定期間内の各時点の性能データの値を平均的に低下させる方針(この図中には“平均下げ”と記載)や、指定期間内においてピーク値となる時点の性能データの値を優先的に低下させる方針(この図中には“ピーク下げ”と記載)などが格納される。なお、上記2つの方針以外の方針が記載されてもよい。
関連リソース傾向11084は、ボトルネックリソースに関連する関連リソースについて、指定期間における負荷傾向を示す。負荷傾向は、複数のパタンの一つで表される。例えば、指定期間において複数の時点間の性能データの変動幅が小さい(この図中には“安定”と記載)や、特定の時点の性能データの値のみが大きい(この図中には“不安定”と記載)などのパタンを示す値が格納される。なお。上記2つのパタン以外の傾向を表す値が格納されてもよい。
適用可否11085は、ボトルネックリソース種別11080のリソース種別に対し、関連リソースの負荷傾向が関連リソース傾向11084のパタンである場合において、対策手段11082を対策方針11083で適用することが概して有効か、無効かを示す。有効である場合には“Yes”が格納され、無効の場合には“No”が格納される。適用可否11085が“No”の場合には、ボトルネックリソースと関連リソースの負荷傾向を鑑みると当該対策手段を実施したとしても、性能改善の効果が得られる可能性が低いことを示している。
優先度11086は、ボトルネックリソース種別11080のリソース種別に対し、関連リソースの負荷傾向が関連リソース傾向11084のパタンである場合において、各対策手段を用いる対策案の優先順位を示す。例えば優先度が1である対策案は、優先度が2である対策案に比べ、優先的に実施すべきであることを示す。優先度11086は、例えば各リソースの性能に対する影響の度合いや、信頼性への影響の度合いなどによって決定されてよい。
The
スクリプトID11087は、対策手段11082のパラメータを計算する方法を記載したスクリプトを識別するIDである。スクリプトの具体的な例は後述する。
The
図13は、選択手段保持テーブル1109を示す。 FIG. 13 shows the selection means holding table 1109.
選択手段保持テーブル1109は、対策手段選択プログラム1124によって決定された対策手段と、対策手段のパラメータ候補となるリソースであるパラメータ候補リソースとを保持する。パラメータ候補リソースは、ボトルネックリソースに対する関連リソースの少なくとも一部である。
The selection means holding table 1109 holds the countermeasure means determined by the countermeasure means
具体的には選択手段保持テーブル1109は、プラン毎のエントリに、以下の情報を有する。プランは、対策手段とパラメータ候補リソースの組を示す。プランID11090は、指定期間、ボトルネックリソース、性能メトリックに対するプランを識別するIDである。指定期間、ボトルネックリソース、性能メトリックに対して複数の対策手段が取り得る場合、1つのプランに対して、各々の対策手段のパラメータ候補リソースと、対策手段を組み合わせる場合の各対策手段の適用優先度が格納される。 Specifically, the selection means holding table 1109 has the following information in the entry for each plan. The plan shows a set of countermeasures and parameter candidate resources. Plan ID 11090 is an ID that identifies a plan for a specified period, bottleneck resource, and performance metric. When multiple countermeasures can be taken for a specified period, bottleneck resource, and performance metric, priority is given to the application of each countermeasure when combining the parameter candidate resources of each countermeasure and the countermeasures for one plan. The degree is stored.
ボトルネックリソース種別11091は、性能低下の原因であるボトルネックリソースの種別を示す。ボトルネックリソースID11092は、性能低下の原因であるボトルネックリソースの識別IDである。性能メトリック種別11093は、しきい値を違反しているボトルネックリソースの性能メトリックの種別を示す。指定期間11094は、対策案の生成を指定された指定期間である。対策方針11095は、ボトルネックリソースの性能低下を解消するための対策手段のパラメータ決定の方針を示す。対策方針11095には、対策方針11083と同様の値が格納される。関連リソース傾向11096は、ボトルネックリソースに関連するリソースの負荷傾向のパタンを示す。関連リソース傾向11096には、関連リソース傾向11084と同様の値が格納される。対策手段11097は、VMストレージマイグレーションなど、対策手段を表す値が格納される。対策手段11097には、対策手段11082と同様の値が格納される。同一のプランID11090に対応する複数の対策手段11097を組み合わせて対策案を生成する場合に、優先度11098は、各対策手段の適用順序を示す。パラメータ候補リソース11099は、対策手段11097のパラメータ候補リソースを識別するIDが格納される。“All”の場合は、対策手段11097のパラメータとしてとり得るすべてのリソースが候補であることを意味する。
(1−5)各装置の動作の詳細 (1-5) Details of operation of each device
次に、管理計算機100の性能監視処理について説明する。性能監視処理は、管理計算機100に記憶されている監視プログラム1121を、プロセッサ120で実行する事によって実施される処理である。
Next, the performance monitoring process of the
図14は、性能監視処理のフローチャートである。 FIG. 14 is a flowchart of the performance monitoring process.
性能監視処理は定期的に実行されても良いし、ユーザからの指示によって実行されてもよい。本実施例の性能監視処理は、予め設定された監視間隔で定期的に実行される。性能監視処理は、計算機システムを構成する各種構成要素から性能データを取得し、しきい値管理テーブル1104に登録されたしきい値情報に照らして性能対策の実施が必要か否かを判断する。もしも、性能対策が必要な場合、性能監視処理は、対策案生成プログラム1122を実行する。
The performance monitoring process may be executed periodically or may be executed according to an instruction from the user. The performance monitoring process of this embodiment is periodically executed at preset monitoring intervals. The performance monitoring process acquires performance data from various components constituting the computer system, and determines whether or not it is necessary to implement performance measures in light of the threshold information registered in the threshold management table 1104. If performance countermeasures are required, the performance monitoring process executes the countermeasure
本実施例において、性能対策が必要と判断するケースとしては、警告しきい値を超過してから一定時間が経過した場合と、次回の性能監視処理実行後に対策案を生成すると絶対しきい値を超過する可能性が高い場合との2ケースについて説明する。 In this embodiment, the cases where it is judged that the performance countermeasure is necessary are the case where a certain time has passed since the warning threshold was exceeded and the absolute threshold when the countermeasure plan is generated after the next performance monitoring process is executed. Two cases, one with a high possibility of exceeding the threshold, and the other with a high possibility of exceeding the threshold value will be described.
まず、監視プログラム1121は、VM管理テーブル1101や、ホスト管理テーブル1102や、ストレージボリューム管理テーブル1103など、計算機システムを構成するリソースの構成情報を管理するテーブルを参照し、管理下にあるリソース毎に現在時刻の性能データを取得して、性能管理テーブル1105に格納する(S1000、S1010)。監視プログラム1121は、各リソースに対してS1000〜S1110の処理を行う。
First, the
次に、監視プログラム1121は、しきい値管理テーブル1104を参照し、リソースの種別とリソースIDを元に、性能メトリック種別1142毎の警告しきい値11043と、絶対しきい値11044と、警告しきい値超過許容時間11045とを取得する(S1020)。もしも、警告しきい値11043が設定されていない場合、監視プログラム1121は、以降の性能違反チェックのための処理を行う必要が無いため、S1000に戻り、次のリソースについて処理を実施する(S1030)。
Next, the
もしも、警告しきい値11043が設定されていれば、監視プログラム1121は、S1010で取得した現在時刻の性能データと警告しきい値11043を比較し、警告しきい値11043を違反していなければ、S1000に戻り次のリソースについて処理を実施する(S1040)。
If the
S1040の比較の結果、警告しきい値11043を違反している場合、監視プログラム1121は、次回に性能監視処理を実行するまで警告しきい値11043を超過していたとしても、許容されるか否かを判断する。そのために、監視プログラム1121は、まずしきい値管理テーブル1104より、警告しきい値超過許容時間11045を取得する(S1050)。次に、監視プログラム1121は、対策案の生成予想時間を見積もる(S1060)。その方法としては、例えば当該リソースに対し、同種類で同数の関連リソースに基づいて生成された対策案について、過去の対策案生成時間を記憶し、それを対策案生成予想時間として用いるなどの方法がある。
As a result of comparison in S1040, if the
次に、監視プログラム1121は、S1060で見積もった対策案生成予想時間と監視プログラム1121の実行間隔を足した値よりも、警告しきい値超過許容時間11045の方が大きいか、小さいかを計算する(S1070)。警告しきい値超過時間11045の方が小さい場合(S1070の結果がYesの場合)、監視プログラム1121は、仮に次回監視プログラム1121実行時まで常に警告しきい値を超過していると警告しきい値超過許容時間11045を超過してしまうことを意味している。そのため、監視プログラム1121は、当該リソースの当該性能メトリックにおいて、性能異常が発生していると判断する(S1080)。
Next, the
S1070の結果がNoの場合、次に監視プログラム1121は、当該リソースに絶対しきい値11044が設定されているか、否かを判断する(S1090)。絶対しきい値が設定されている場合(Yes)、監視プログラム1121は、当該リソースの過去の負荷傾向を基に将来の性能変化を見積もり、絶対しきい値に到達する予想時間を計算する(S1100)。将来の性能変化を予想する方法としては、例えば過去の一定期間の性能データに関して最小二乗法を用いて性能変化の近似式を計算し、将来も過去のトレンドが持続すると仮定して近似式より絶対しきい値11044に到達する時刻を計算する方法などを用いてよい。
If the result of S1070 is No, then the
次に、監視プログラム1121は、S1060で見積もった対策案生成予想時間と監視プログラム1121の実行間隔を足した値よりも、S1100で見積もった絶対しきい値到達予想時間の方が大きいか、小さいかを計算する(S1100)。絶対しきい値到達予想時間の方が小さい場合(S1110の結果がNoの場合)、監視プログラム1121は、次回監視プログラム1121実行時までに絶対しきい値11044を超過してしまう可能性が高いことを意味している。そのため、監視プログラム1121は、当該リソースの当該性能メトリックにおいて、性能異常が発生していると判断する(S1080)。
Next, in the
S1090の判断の結果がNoの場合と、S1110の判断の結果がYesの場合、本実施例において監視プログラム1121は、性能異常が発生していないと判断する。なお、本実施例では警告しきい値を超過してから一定時間が経過した場合と、次回の性能監視処理実行後に対策案を生成した場合とでは、絶対しきい値を超過する可能性が高い場合の2ケースに該当する場合に性能異常が発生していると判断した。しかしながら、監視プログラム1121は、それ以外のケース、例えば過去一定回数以上しきい値違反を発生しているケースに該当する場合に性能異常が発生していると判断してもよい。本実施例で挙げた2ケース以外のケースを考慮する場合、監視プログラム1121は、S1090の判断の結果がNoの場合と、S1110の判断の結果がYesの場合とに、さらに性能異常を判断する処理を追加して実行していてもよい。
When the result of the determination in S1090 is No and the result of the determination in S1110 is Yes, the
S1000からS1110までの処理を全てのリソースに関して行った結果、性能異常が発生していない場合には対策案を生成する必要が無いため、監視プログラム1121は終了する(S1120)。
As a result of performing the processes from S1000 to S1110 for all resources, if no performance abnormality has occurred, it is not necessary to generate a countermeasure plan, so the
1以上のリソースについて性能異常が発生していた場合(S1120の結果がYesの場合)は、監視プログラム1121は、以降の処理を行い、対策案生成プログラム1122を実行する。
When a performance abnormality has occurred for one or more resources (when the result of S1120 is Yes), the
計算機システムを構成する各リソースは互いに関連しているため、特定のリソースの性能低下が原因となって、二次的に性能が低下しているリソースが存在している可能性がある。そのため、監視プログラム1121は、S1130にて各リソースの性能低下が、別のリソースの性能変化に起因するかを判断し、最終的な原因であるボトルネックリソースと性能メトリックを抽出する。この原因分析の方法としては、例えばRCA(Root Cause Analysis)の公開技術を用いてよい。
Since each resource that composes a computer system is related to each other, there may be a resource whose performance is secondarily deteriorated due to the performance deterioration of a specific resource. Therefore, the
次に監視プログラム1121は、S1130で抽出したボトルネックリソースの性能メトリックについて、性能異常と判定されたリソースのうち警告しきい値を超過した最も早い時刻を開始時刻とし、現在時刻を終了時刻とし、開始時刻から終了時刻までを指定期間として指定して対策案生成プログラム1122を実行し、指定期間に対する対策案を生成する。そして、生成した対策案とともにアラートを表示装置400に表示する。
Next, the
監視間隔および指定期間が長いほど、対策案の精度が向上するが、しきい値を超過する可能性が高くなる。この性能監視処理によれば、ボトルネックリソースの性能メトリックがしきい値を超過することを防ぐと共に、対策案の精度を向上させることができる。 The longer the monitoring interval and the specified period, the better the accuracy of the countermeasure plan, but the more likely it is that the threshold will be exceeded. According to this performance monitoring process, it is possible to prevent the performance metric of the bottleneck resource from exceeding the threshold value and improve the accuracy of the countermeasure plan.
この性能監視処理によれば、管理計算機100は、定期的にリソースの負荷を監視し、負荷が警告しきい値を超過する時間が警告しきい値超過許容時間を超えないように、且つ負荷が絶対しきい値を超えないように、指定期間を設定し、指定期間に対する対策案を生成することができる。
According to this performance monitoring process, the
次に、管理計算機100の対策案生成処理について説明する。対策案生成処理は、管理計算機100に記憶されている対策案生成プログラム1122を、プロセッサ120で実行する事によって実施される処理である。
Next, the countermeasure plan generation process of the
図15は、対策案生成処理のフローチャートである。 FIG. 15 is a flowchart of the countermeasure plan generation process.
対策案生成処理はユーザからの指示によって実行されてもよいし、性能異常を検知した場合に対策案生成プログラム1122によって実行されてもよい。
The countermeasure plan generation process may be executed according to an instruction from the user, or may be executed by the countermeasure
対策案生成プログラム1122は、まずボトルネックリソースの種別、ボトルネックリソースの識別ID、対策案を生成する指定期間、警告しきい値11043を違反している性能メトリックの種別を受信する(S2000)。上記の情報は、表示装置400よりユーザから指定されていてもよいし、監視プログラム1121から指定されていてもよい。なお、これらは本実施例における一例であって、他のプログラムによって対策案生成プログラム1122が呼び出されることを制限するものではない。
The countermeasure
次に、対策案生成プログラム1122は、対策方針判断処理を実施する(S2020)。対策方針判断処理は、指定期間におけるボトルネックリソースの負荷傾向を分析し、性能低下の問題に関して効率的に、精度のよい対策案を生成するための対策方針を求める処理である。具体的なフローチャートについては後述する。
Next, the countermeasure
次に、対策案生成プログラム1122は、対策手段選択処理を実施する(S2030)。対策手段選択処理は、ボトルネックリソースに関連する関連リソース群について、指定期間における負荷傾向を分析し、対応方針に対して適切な対策手段を選択する処理である。具体的なフローチャートについては後述する。
Next, the countermeasure
対策案生成プログラム1122は、対策手段選択処理の結果を選択手段保持テーブル1109より取得する(S2040)。このとき、ボトルネックリソースの性能低下を解消する対策手段は複数存在する可能性があるため、選択手段保持テーブル1109には複数の対策案(プラン)が指定されたボトルネックリソース、性能メトリック、指定期間に対応するプランが複数個保持されている可能性がある。そのため、対策案生成プログラム1122は、以降の処理(S2070からS2110)を各プランについて実施する。
The countermeasure
なお、プラン11090は、複数の対策手段の組み合わせである可能性がある。その場合では対策案生成プログラム1122は、プラン11090を構成する各対策手段11097について優先度11098を参照し、優先度が高い対策手段11097の順番に以降の処理(S2070からS2110)を実施する。
The plan 11090 may be a combination of a plurality of countermeasures. In that case, the countermeasure
まず、対策案生成プログラム1122は、S2070において選択手段保持テーブル1109から対策手段11097を選択し、対応する対策方針11095と、関連リソース傾向11096と、パラメータ候補リソース11099とを取得する。
First, the countermeasure
次にS2080において、対策案生成プログラム1122は、S2070で取得した情報を基に対策手段適用管理テーブル1108を参照し、対策手段のパラメータを計算する方法を記載したスクリプトID11087を取得する。
Next, in S2080, the countermeasure
対策案生成プログラム1122は、S2090において、S2080で取得したスクリプトID1087に対応するスクリプトを、記憶資源110に記憶されたパラメータ計算スクリプト群113の中から特定する。そして、対策案生成プログラム1122は、S2070で取得したパラメータ候補リソースと、特定されたスクリプトとを用いて、パラメータを計算する。
In S2090, the countermeasure
対策案生成プログラム1122は、スクリプトで計算した対策案を実施した場合について、ボトルネックリソースのしきい値違反を起こした性能メトリックの値の変化を見積もる(S2100)。この見積もり方法は、S1100の見積もり方法と同様であってもよいし、S1100によって見積もられた結果に対策案を適用することで見積もってもよい。もしも、見積もりの結果、指定期間内の全時点について警告しきい値11043を違反しない状態となるならば(S2110の結果がYes)、より優先度11098の低い対策手段を実施する必要は無いため、対策案生成プログラム1122は、次のプラン11090について対策案生成の処理(S2070からS2110)を開始する。もしも、S2110の結果がNoならば、対策案生成プログラム1122は、より優先度11098の低い対策手段について対策案生成の処理(S2070からS2110)を実施する。
The countermeasure
その後、対策案生成プログラム1122は、生成した対策手段をプラン毎に表示装置400に表示する(S2120)。表示の方法としては、例えばXMLなど定型的な形式で表現されてもよい。例えば、その場合には表示装置400に表示するのみならず、ファイルなどの形式で電子的に保存されてもよい。
After that, the countermeasure
また、管理計算機100は、生成した対策案を実施した場合の見積もりをグラフとして表現し、対策案とともに表示装置400に提示させてもよい。これにより、対策案実行による変化を直感的に把握することが可能となる。
Further, the
また、生成された対策案は、対策手段に対応するCLIの形式で表現されていてもよい。なお、それに伴い本実施例においては対策手段およびパラメータ以外の内容を表示することを限定するものではない。例えば、対策案は、対策案の内容が含まれているならばプログラムの形式で表現されていてもよい。 Further, the generated countermeasure plan may be expressed in the form of CLI corresponding to the countermeasure means. Along with this, in this embodiment, the display of contents other than the countermeasure means and the parameters is not limited. For example, the countermeasure plan may be expressed in the form of a program as long as the content of the countermeasure plan is included.
この対策案生成処理によれば、管理計算機100は、適切なスクリプトを用いてパラメータを決定することができ、指定期間に対する対策案を生成することができる。
According to this countermeasure plan generation process, the
本実施例におけるスクリプトは、Script1からScript4である。Script1からScript4は、ストレージ装置300内のプールの稼働率が上昇したことが性能問題の原因である場合に、プールの稼働率を警告しきい値11043まで低下させる対策案を生成するためのスクリプトである。ここでのパラメータ候補リソースは、VMである。特にScript1とScript2は、VMストレージマイグレーションのパラメータを計算するための計算方法を記載したスクリプトである。Script3とScript4は、ボリュームのI/O量上限を制限するストレージ設定変更について、パラメータを計算するための計算方法を記載したスクリプトである。
The scripts in this embodiment are Script1 to Script4. Script1 to Script4 are scripts for generating a countermeasure plan to reduce the operating rate of the pool to the
図16は、Script1のフローチャートである。 FIG. 16 is a flowchart of Script1.
Script1は、VMストレージマイグレーションを行うVM700と、移動先のデータストアとを決定する。具体的には、Script1は、指定期間におけるボトルネックリソースの平均稼働率を警告しきい値11043よりも小さい値に低下させることができるVM700の組み合わせのうち、VM700のデータを移動させた場合の、各プールまたはRAIDグループの、指定期間における平均稼働率が最小となる組み合わせを求める。これは、例えば整数計画問題としてモデル化し、公知の整数計画問題ソルバなどを用いて計算してもよい。これが可能な理由は、対策方針判断処理によって、性能低下解消の効果を維持しつつ、最適化問題をより簡単な問題に変換できているためである。また、それでもリソース数が大きく、最適解が現実的な時間で生成できない場合には、例えば前掲の整数計画問題を線形緩和し、公知のアルゴリズムを用いて近似解を求めてもよい。
Script1 determines the VM700 that performs VM storage migration and the data store of the migration destination. Specifically, Script1 is a combination of VM700 that can reduce the average utilization rate of bottleneck resources in a specified period to a value smaller than the
複数のVMの負荷の合計により、プールの稼働率が指定期間に亘ってしきい値を超える場合、Script1を用いることにより、特定のリソースに負荷が集中しないようにVMを移動させることができる。 When the utilization rate of the pool exceeds the threshold value over a specified period due to the total load of a plurality of VMs, the VMs can be moved so that the load is not concentrated on a specific resource by using Script1.
図17は、Script2のフローチャートである。 FIG. 17 is a flowchart of Script2.
Script2は、VMストレージマイグレーションを行うVM700と、移動先のデータストアとを決定する。具体的には、Script2は、指定期間におけるボトルネックリソースの最大稼働率を警告しきい値11043よりも小さい値に低下させることができるVM700の組み合わせのうち、VM700のデータを移動させた後の各プールまたはRAIDグループの、指定期間における最大稼働率が最小となる組み合わせを求める。これは、例えば整数計画問題としてモデル化し、公知の整数計画問題ソルバなどを用いて計算してもよい。これが可能な理由は、対策方針判断処理によって、性能低下解消の効果を維持しつつ、最適化問題をより簡単な問題に変換できているためである。また、それでもリソース数が大きく、最適解が現実的な時間で生成できない場合には、例えば前掲の整数計画問題を線形緩和し、公知のアルゴリズムを用いて近似解を求めてもよい。
Script2 determines the VM700 that performs VM storage migration and the data store of the migration destination. Specifically, in Script2, among the combinations of VM700 that can reduce the maximum utilization rate of the bottleneck resource in the specified period to a value smaller than the
指定期間のうち、特定の時点でプールの稼働率がしきい値を超える場合、Script2によれば、移動先リソースのピーク値を最小にするようにVMを移動させることができる。 According to Script2, when the utilization rate of the pool exceeds the threshold value at a specific time during the specified period, the VM can be moved so as to minimize the peak value of the destination resource.
図18は、Script3のフローチャートである。 FIG. 18 is a flowchart of Script3.
Script3は、ボトルネックリソースに負荷をかけているボリューム370に対するI/Oの上限値を決定する。Script3は、まずボトルネックリソース(ストレージ装置300内のプール)について、その稼働率が警告しきい値11043以下となるための、プールのIOPS値上限を計算する(S11330)。
Script3 determines the upper limit of I / O for the
実際にはサーバ200やVM700がI/Oを発行する対象は、ボリューム370であり、プールに対して発行されるI/O量は、当該プールから生成されたボリューム370に対して発行されるI/O量の合計である。そのため、Script3は、各ボリューム370のIOPS合計が、S11330で計算したプールのIOPS上限と等しくなるように各ボリューム370のIOPS上限値を決定する。その際、例えば指定期間における各ボリューム370の平均IOPSを計算し、その比率に従ってプールのIOPS上限を分配することで、各ボリューム370のIOPS上限値を計算する。
Actually, the target for issuing I / O by the
ボリュームの負荷が指定期間に亘って安定しており、プールの稼働率が指定期間に亘ってしきい値を超える場合、Script3によれば、指定期間に亘ってボリュームの負荷を抑えるように、各ボリューム370のIOPS上限値を決定することができる。
If the volume load is stable over the specified period and the pool utilization exceeds the threshold over the specified period, according to Script3, each will reduce the volume load over the specified period. The IOPS upper limit of the
図19は、Script4のフローチャートである。 FIG. 19 is a flowchart of Script4.
Script4は、ボトルネックリソースに負荷をかけているボリューム370に対するI/Oの上限値を決定する。Script4では、S11330と同処理でボトルネックリソースであるプールのIOPS値上限を計算する(S11340)。
Script4 determines the upper limit of I / O for the
次に、対策案生成プログラム1122は、ボトルネックリソースであるプールに関連するボリューム370に対し、S11340で計算したIOPS値を上限値として設定する(S11341)。
Next, the countermeasure
指定期間のうち特定の時点でボリュームの負荷が高くなることで、プールの稼働率がしきい値を超える場合、Script4によれば、特定のボリュームの負荷を抑えるように、IOPS上限値を決定することができる。 When the capacity of the pool exceeds the threshold value due to the load of the volume becoming high at a specific point in the specified period, according to Script4, the IOPS upper limit is determined so as to suppress the load of the specific volume. be able to.
なお、上記のスクリプトは一例であって、ボトルネックリソースや、性能メトリックや、対策手段や、対策方針によって上記以外のスクリプトが含まれていてもよい。また、本実施例においてはフローチャートの形式で表現したが、処理内容や処理順序が表現できる他の形式、例えばXML(Extensible Markup Language)の形式で表現されていてもよい。また、管理計算機100は、ファイルなどの電子媒体に含まれるXMLデータを動的に記憶資源に読み込む機能を有していてもよい。
The above script is an example, and scripts other than the above may be included depending on the bottleneck resource, the performance metric, the countermeasure means, and the countermeasure policy. Further, although it is expressed in the form of a flowchart in this embodiment, it may be expressed in another form in which the processing contents and the processing order can be expressed, for example, in the form of XML (Extension Markup Language). Further, the
図20は、対策方針判断処理(S2020)を示すフローチャートである。 FIG. 20 is a flowchart showing a countermeasure policy determination process (S2020).
対策方針判断処理は、対策方針判断プログラム1123をプロセッサ120で実行することで、実行される。
The countermeasure policy determination process is executed by executing the countermeasure
まず、対策方針判断プログラム1123は、ボトルネックリソースの種別と、ボトルネックリソースのIDと、指定期間と、警告しきい値11043を違反している性能メトリックの種別とを、受信する(S3000)。
First, the countermeasure
次に、対策方針判断プログラム1123は、ボトルネックリソースに対応する性能管理テーブル1105を参照し、指定されたボトルネックリソースIDと、性能メトリック種別と、指定期間に含まれる各時点の性能データとを取得する(S3010)。
Next, the countermeasure
次に、対策方針判断プログラム1123は、S3010で取得した、ボトルネックリソースの性能データの傾向を、複数のパタンに分類する。本実施例においては、分類の一例として、各時点における性能データの値にばらつきが少ない場合を“安定的”パタンとし、逆に特定の時点における性能データの値が他の時点の性能データの値と比較して大きく外れている場合を“不安定的”パタンとする、2パタンに分類する場合を説明する。
Next, the countermeasure
対策方針判断プログラム1123は、S3010で取得した性能データが安定的パタンか不安定的パタンかを判別するために、指定期間に亘る性能データの平均値とボトルネック負荷偏差しきい値を計算する。例えば、対策方針判断プログラム1123は、指定期間に亘る性能データの標準偏差を算出し、標準偏差に、予め設定された係数を乗ずることで、ボトルネック負荷偏差しきい値を算出する。そして、対策方針判断プログラム1123は、各時点の性能データの値に関して、平均値に対する性能データの値の偏差がボトルネック負荷偏差しきい値以上となる時点があるか否かを判断する(S3020、S3030)。対策方針判断プログラム1123は、S3030の結果が、Yesの場合、不安定的パタンであると判断し、Noの場合、安定的パタンであると判断する。なお、S3030で用いた標準偏差を用いる計算方法は外れ値を求める方法の一例であり、他の外れ値検出方法を用いてもよい。
The countermeasure
そして、S3030の結果、不安定的パタンに分類された場合には、指定期間において特定の時点において大きくしきい値違反を起こしていることで性能異常が発生している可能性が高いと考えられるため、対策方針判断プログラム1123は、指定期間においてピーク値を取る時点の性能データの値を優先的に改善する対策方針を採ると決定する(S3040)。以降の説明においては本方針を“ピーク下げ”と記載する。
Then, when the pattern is classified as unstable as a result of S3030, it is highly probable that a performance abnormality has occurred due to a large threshold violation at a specific time point in the specified period. Therefore, the countermeasure
一方で、S3040の結果、安定的パタンに分類された場合には、指定期間において定常的にしきい値違反を起こしている可能性が高いと考えられるため、対策方針判断プログラム1123は、指定期間において各時点の性能データの値を均一に改善する対策方針を採ると決定する(S3050)。以降の説明においては本方針を“平均下げ”と記載する。
On the other hand, if it is classified as a stable pattern as a result of S3040, it is highly likely that the threshold value is constantly violated during the designated period. Therefore, the countermeasure
この対策方針判断処理によれば、ボトルネックリソースの負荷の傾向が安定的であるか不安定的であるかを判定し、その判定結果に基づいて適切な対策方針を決定することができる。 According to this countermeasure policy determination process, it is possible to determine whether the load tendency of the bottleneck resource is stable or unstable, and determine an appropriate countermeasure policy based on the determination result.
図21は、対策手段選択処理(S2030)を示すフローチャートである。 FIG. 21 is a flowchart showing a countermeasure means selection process (S2030).
対策手段選択処理は、対策手段選択プログラム1124をプロセッサ120で実行することで、実行される。
The countermeasure means selection process is executed by executing the countermeasure means
まず、対策手段選択プログラム1124は、ボトルネックリソースの種別と、ボトルネックリソースのIDと、指定期間と、警告しきい値11043を違反している性能メトリック種別と、対策方針とを、受信する(S4000)。
First, the countermeasure means
次に対策手段選択プログラム1124は、指定されたボトルネックリソース種別の性能メトリックについて、性能データを改善する効果のある対策手段を抽出する(S4010)。具体的には、対策手段選択プログラム1124は、対策手段管理テーブル1106を参照し、S4000で受信したボトルネックリソース種別11060と、警告しきい値違反を起こしているボトルネック性能メトリック種別11061に対応する対策手段11062と、パラメータリソース種別11063と、組み合わせ可能対策手段11064とを、抽出する。
Next, the countermeasure
ここでボトルネックリソースに対して複数の対策手段11062が適用できる可能性がある。また、各対策手段によってパラメータリソース種別が異なることから、対策手段選択プログラム1124は、以降の処理(S4030からS4120)を対策手段毎に実行する。
Here, there is a possibility that a plurality of
対策手段選択プログラム1124は、S4030において、S4010で取得した対策手段のパラメータリソース種別について、VM管理テーブル1101、ホスト管理テーブル1102、ストレージボリューム管理テーブル1103などの構成情報を管理する各種テーブルから、該当するリソースの情報を抽出する(S4030)。例えば、ボトルネックリソースがストレージ装置300内部のプールであった場合、対策手段としてVMストレージマイグレーションとI/O量上限制御の2つの対策手段11062がとり得ることを示している。そして、VMストレージマイグレーションを実行するためにはパラメータとしてVM700を設定する必要があり、I/O量上限制御を実行するためにはパラメータとしてボリューム370を設定する必要があることを示している。
The countermeasure means
ここで、該当するパラメータリソース種別の関連リソースの情報が、各種構成情報を管理するテーブルに存在しない場合(S4040の結果がNoの場合)、対策手段選択プログラム1124は、対策案を生成することができないため、S4020に戻り次の対策手段について同様の処理を実施する。
Here, when the information of the related resource of the corresponding parameter resource type does not exist in the table for managing various configuration information (when the result of S4040 is No), the countermeasure means
S4040の結果がYesの場合、対策手段選択プログラム1124は、以降の処理によって各関連リソースの負荷傾向をパタンに分類する。まずは、対策手段選択プログラム1124は、関連リソースにおいて着目する性能メトリックを特定するために、メトリック管理テーブル1107を参照し、ボトルネックリソース種別11070とボトルネック性能メトリック種別11071とパラメータリソース種別11072とに対応する、パラメータ性能メトリック種別11073を抽出する(S4050)。例えばストレージ装置300内のプールの性能メトリックである稼働率は、VM700の性能メトリックであるIOPS、または、ボリューム370の性能メトリックであるIOPSに関連していることを示している。
When the result of S4040 is Yes, the countermeasure means
次に、対策手段選択プログラム1124は、関連リソース毎に負荷傾向を分析する。本実施例においては、対策方針判断プログラム1123と同様、各関連リソースを安定的パタンと不安定的パタンに分類する場合について説明する。具体的には、対策手段選択プログラム1124は、関連リソース毎にS4070とS4080の処理を行う。
Next, the countermeasure means
対策手段選択プログラム1124は、S4070において性能管理テーブル1105を参照し、指定期間における関連リソースのパラメータ性能メトリック種別11073の性能データを抽出する。そして、S4080において、S4070で抽出した性能データについて外れ値判定を行うことで、関連リソースが安定的パタンであるか否かを判定する。ここで実施する処理は、S3020と同様でもよい(S4080)。例えば、対策手段選択プログラム1124は、指定期間に亘る性能データの平均値と関連負荷偏差しきい値とを計算し、平均値に対する性能データの値の偏差が関連負荷偏差しきい値以上となる時点があるか否かを判断する。関連負荷偏差しきい値は例えば、標準偏差に、予め設定された係数を乗じた値である。
The countermeasure means
S4030で抽出したすべての関連リソースをパタンに分類した後、対策手段選択プログラム1124は、安定的パタンに分類された関連リソースの数が、不安定的パタンに分類された関連リソースの数より多いか否かを判断する(S4090)。その結果がYesの場合であれば、対策手段選択プログラム1124は、指定されたボトルネックリソースに対して当該対策手段のパラメータとなる関連リソース群は安定的パタンであると判断する(S4110)。逆にNoの場合であれば、対策手段選択プログラム1124は、関連リソース群は不安定的パタンであると判断する(S4100)。
After classifying all the related resources extracted in S4030 into patterns, the
次に、対策手段選択プログラム1124は、S4000で受信した対策方針と、S4100またはS4110で判断した関連リソースのパタンとをつき合わせ、当該対策手段がボトルネックリソースの性能低下を解消する効果があるか否かを判断する。具体的には、対策手段選択プログラム1124は、対策手段適用管理テーブル1108を参照し、ボトルネックリソース種別11080と、性能メトリック種別11081と、対策手段11082と、対策方針11083と、関連リソース傾向11084に合致する適用可否11085の値を取得する。対策手段選択プログラム1124は、その結果が、Yesであれば、当該対策手段は有効であると判断し、Noであれば当該対策手段は有効でないと判断する(S4120)。
Next, the countermeasure
例えば、対策方針11083が平均下げかつ、関連リソース傾向11084が不安定的パタンである場合では、各関連リソースが夫々異なる時点において負荷が高まっているために、各関連リソースを集合すると指定期間を通して安定した負荷傾向に見えていると考えられる。そのため、このとき対策手段11082がVMストレージマイグレーションである場合では、特定のVM700のデータを異なるプールに移動させたとしても、VM700の負荷が高まるタイミングで移動先のプールにおいて警告しきい値違反を起こす可能性が高い。よって、適用可否11085はNoと判断される。
For example, when the
また、対策方針11083がピーク下げかつ、関連リソース傾向11084が不安定的パタンである場合、各関連リソースが同じ時点において負荷が高まっており、各関連リソースを集合すると特定の時点で大きくボトルネックリソースの負荷が高まる状態となっていると考えられる。そのため、このとき対策手段11082がI/O量上限制御である場合、各ボリューム370に対して同様にI/O量制限をかける必要があり、ピーク時点において各ボリューム370を用いるアプリケーションに対して大きな影響を発生させてしまう。よって、適用可否はNoと判断される。
Further, when the
この対策手段選択処理によれば、関連リソースの負荷の傾向が安定的であるか不安定的であるかを判定し、その判定結果と対策方針とに基づいて適切な対策手段を決定することができる。 According to this countermeasure selection process, it is possible to determine whether the load tendency of related resources is stable or unstable, and determine an appropriate countermeasure based on the determination result and the countermeasure policy. it can.
以上で説明したように、本実施例によれば、管理計算機100は、指定期間におけるボトルネックリソースの負荷変化の傾向に対応した対策案の生成方針を決定することができる。
As described above, according to the present embodiment, the
また、本実施例によれば、管理計算機100は、関連リソース群の特徴を表現する1つの負荷傾向のパタンを判断することができる。それにより、管理計算機100は、パラメータ計算の計算量が増大してしまう対策手段や、副作用が大きくなるためにアプリケーションに対する影響が大きくなる対策手段を除外することができる。
Further, according to the present embodiment, the
また、管理計算機100は、ボトルネックリソースの負荷傾向から導出される対策方針に基づき、対策手段のパラメータを計算することで、性能低下を解消するために必要なだけのパラメータを最小限の計算で求めることが可能となる。
In addition, the
(2−1)本実施例の形態の概要 (2-1) Outline of the embodiment of this embodiment
本実施例においては、ボトルネックリソースの関連リソースをパタン毎に分類し、そのパタンに適用可能な対策手段を導出することによって、複数の対策手段を組み合わせた対策案を導出可能となる。これにより、実施例2において、管理計算機100は、複数のパタンの関連リソースが混在していた場合であっても、パラメータ計算の計算量を削減しつつ、アプリケーションや各VMに対する副作用が小さい対策案を生成することが可能となる。
In this embodiment, by classifying the related resources of the bottleneck resource for each pattern and deriving the countermeasures applicable to the pattern, it is possible to derive a countermeasure plan combining a plurality of countermeasures. As a result, in the second embodiment, the
実施例2に係る計算機システムの構成や、計算機システムで管理される情報は実施例1で説明した計算機システムと同様のため、図示は省略する。また、実施例2に係る計算機システムで実行されるプログラムのうち、対策手段選択プログラム1124以外のプログラムの動作は、実施例1で説明したものと同様である。そのため、以下では、対策手段選択プログラム1124の動作のうち、実施例1で説明したものと異なる点を中心に説明する。
Since the configuration of the computer system according to the second embodiment and the information managed by the computer system are the same as those of the computer system described in the first embodiment, the illustration is omitted. Further, among the programs executed by the computer system according to the second embodiment, the operations of the programs other than the countermeasure means
(2−2)各装置動作の詳細 (2-2) Details of operation of each device
図22は、実施例2に係る対策手段選択処理(S2030)を示すフローチャートである。 FIG. 22 is a flowchart showing a countermeasure means selection process (S2030) according to the second embodiment.
まず、対策手段選択プログラム1124は、実施例1のS4010までの処理を行う。その後、対策手段選択プログラム1124は、対策手段毎に、実施例1のS4030からS4050までと同様の処理を行う。さらに、対策手段選択プログラム1124は、その後、関連リソース毎に、実施例1のS4070からS4080までと同様の処理を行う。
First, the countermeasure means
その後、本実施例において、対策手段選択プログラム1124は、S4080の外れ値判定の結果、当該関連リソースが安定的パタンであるか不安定的パタンであるかを判別する。本実施例においては、実施例1(S3020、S4080)と同様の方法で外れ値を判定すると想定する(S5000)。S5000の結果がYesであれば、対策手段選択プログラム1124は、当該関連リソースが安定的パタンであると判断し、当該関連リソースを安定的パタンの関連リソース群のひとつとして記憶資源に記憶する(S5010)。一方で、S5000の結果がNoであれば、対策手段選択プログラム1124は、当該関連リソースは不安定的パタンであると判断し、対策手段選択プログラム1124は当該関連リソースを不安定的パタンの関連リソース群のひとつとして記憶資源に記憶する(S5020)。
After that, in the present embodiment, the countermeasure means
対策手段選択プログラム1124は、S5020までの処理を各関連リソースに対して実施すると、次にS5010、S5020で分類した各パタンに対応する関連リソース群のうち、含まれる関連リソースの数が最も多いリソース群を選択する(S5030)。
When the countermeasure means
そして、対策手段選択プログラム1124は、S5030で選択した関連リソース群の傾向に対して、当該対策手段がボトルネックリソースの性能低下を解消する効果があるか否かを、対策手段適用管理テーブル1108を参照して判断する(S5040)。判断の内容や、具体例はS4120と同様である。
Then, the countermeasure means
S5040で判断した結果がYesの場合、当該対策手段はボトルネックリソースの性能低下の問題に関連するリソースのうち、最も多数の関連リソースに対して適用することができる対策手段である。そのため、対策手段を組み合わせる場合に、当該対策手段が最もボトルネックリソースの性能低下を解消する効果が大きいと考えられる。よって、対策手段選択プログラム1124は、当該対策手段を最も高い優先度(優先度1)の対策手段として記憶資源に記憶し、後述する対策手段組み合わせ生成処理に利用する(S5060)。
If the result determined in S5040 is Yes, the countermeasure is a countermeasure that can be applied to the largest number of related resources among the resources related to the problem of performance deterioration of the bottleneck resource. Therefore, when the countermeasures are combined, it is considered that the countermeasures have the greatest effect of eliminating the performance deterioration of the bottleneck resource. Therefore, the countermeasure means
S5050で判断した結果がNoの場合、当該対策手段はボトルネックリソースの関連リソースのうち、最も多数の関連リソースに対して適用することができない対策手段である。そのため、対策手段選択プログラム1124は、当該対策手段を他の対策手段と組み合わせても性能低下の問題を解消することができないと判断し、当該対策手段に対する処理を終了する。
If the result determined in S5050 is No, the countermeasure means is a countermeasure measure that cannot be applied to the largest number of related resources among the related resources of the bottleneck resource. Therefore, the countermeasure means
次に対策手段選択プログラム1124は、対策組み合わせ生成処理により、最多数の関連リソース群以外の関連リソース群のパタンを基に、当該対策手段と組み合わせる他の対策手段を判断する(S5070)。対策組み合わせ生成処理の詳細は後述する。
Next, the countermeasure means
最後に、S5060で選択した対策手段と、S5080で決定した対策手段を選択手段保持テーブル1109に登録する。対策手段11097登録時には、対応する優先度11098としてS5060で選択した優先度か、対策手段組み合わせ生成処理で選択した優先度を共に設定する。また、対策手段11097の登録時には、対応するパラメータ候補リソース11099として対策手段に対応する関連リソース群に含まれる関連リソースを設定する。
Finally, the countermeasure means selected in S5060 and the countermeasure means determined in S5080 are registered in the selection means holding table 1109. At the time of registering the countermeasure means 11097, both the priority selected in S5060 as the
図23は、実施例2に係る対策手段組み合わせ生成処理を示すフローチャートである。 FIG. 23 is a flowchart showing a countermeasure means combination generation process according to the second embodiment.
対策手段組み合わせ生成処理は、対策手段選択プログラム1124から呼び出されるサブプログラムである。
The countermeasure means combination generation process is a subprogram called from the countermeasure means
対策手段組み合わせ生成処理は、まずボトルネックリソースの種別およびIDと、警告しきい値違反を起こしている性能メトリック種別と、対策方針と、選択済みの対策手段と、S5010またはS5020で分類された関連リソース群とを受信する(S6000)。 In the countermeasure combination generation process, first, the bottleneck resource type and ID, the performance metric type causing the warning threshold violation, the countermeasure policy, the selected countermeasure, and the association classified by S5010 or S5020. Receives the resource group (S6000).
その後、対策手段組み合わせ生成処理は、S6000で受信した関連リソース群のうち、リソース数最多の関連リソース群を除いた関連リソース群を、リソース数が多い順に選択し、以降の処理を行う(S6010)。 After that, in the countermeasure means combination generation process, among the related resource groups received in S6000, the related resource groups excluding the related resource group having the largest number of resources are selected in descending order of the number of resources, and the subsequent processing is performed (S6010). ..
まず、対策手段組み合わせ生成処理は、対策手段管理テーブル1106を参照し、S6000で受信した対策手段と、S6040で選択済みの対策手段のすべての対策手段とに対して、組み合わせ可能対策手段11064を取得し、取得されたすべての組み合わせ可能対策手段11064に共通して含まれる対策手段を抽出する(S6020)。
First, in the countermeasure means combination generation process, the countermeasure means management table 1106 is referred to, and the countermeasure means 11064 that can be combined is acquired for the countermeasure means received in S6000 and all the countermeasure means of the countermeasure means selected in S6040. Then, the countermeasure measures commonly included in all the acquired
さらに対策手段組み合わせ生成処理は、S6000で受信したボトルネックリソース種別11080と、性能メトリック種別11081と、対策方針11083と、S6010で選択された関連リソース群の関連リソース傾向11084とを用いて、S6020で抽出された対策手段毎に、対策手段適用管理テーブル1108を参照し、性能低下を解消するために効果のある対策手段を抽出する(S6030)。
Further, the countermeasure means combination generation process is performed in S6020 by using the
次に、対策手段組み合わせ生成処理は、S6030で抽出した各対策手段と、以前のS6040の処理により生成された対策手段の組み合わせとを掛け合わせて、組み合わせを生成し、生成した組み合わせを新たに記憶する(S6040)。 Next, the countermeasure means combination generation process multiplies each countermeasure measure extracted in S6030 with the combination of the countermeasure means generated by the previous process of S6040 to generate a combination, and newly stores the generated combination. (S6040).
もしも、S6010からS6040までの処理をすべての関連リソース群について実施したならば、対策手段組み合わせ生成処理は処理を終了し、生成した対策手段の組み合わせを処理の呼び出し元に返却する。そうでないならば、対策手段組み合わせ生成処理は、S6010に処理を移し、次にリソース数の多い関連リソース群についてS6020からS6040までの処理を行う。 If the processes from S6010 to S6040 are performed for all the related resource groups, the countermeasure means combination generation process ends the process, and the generated combination of countermeasure measures is returned to the caller of the process. If not, the countermeasure means combination generation process shifts the process to S6010, and then performs the processes from S6020 to S6040 for the related resource group having the largest number of resources.
もし、期間内の全ての時点で性能低下を防ぐように、大量の構成変更手段や構成変更手段のパラメータの組み合わせの中から適切な対策案を生成しようとすると、現実的な計算時間で表示することができない。以上に述べた各実施例によれば、対策手段の候補を限定し、その上で対策手段のパラメータ計算の計算量を削減することができる。これにより、過去の期間に関して、負荷が再現した場合に性能低下が再現しない対策案を効率的に生成し、表示することができる。 If you try to generate an appropriate countermeasure plan from a large number of configuration change means or a combination of parameters of the configuration change means so as to prevent performance deterioration at all points in the period, it will be displayed in a realistic calculation time. Can't. According to each of the above-described embodiments, it is possible to limit the candidates for the countermeasure means and reduce the calculation amount of the parameter calculation of the countermeasure means. As a result, it is possible to efficiently generate and display a countermeasure plan in which the performance deterioration is not reproduced when the load is reproduced for the past period.
過去の期間は、指定期間等に対応する。ボトルネック負荷データは、ボトルネックリソースの性能データ等に対応する。関連負荷データは、関連リソースの性能データ等に対応する。ボトルネック負荷範囲は、ボトルネックリソースの性能データの平均値に対する偏差がボトルネック負荷偏差しきい値以下である範囲等に対応する。関連負荷範囲は、関連リソースの性能データの平均値に対する偏差が関連負荷偏差しきい値以下である範囲等に対応する。複数の対策方針候補は、対策方針11083に示された値等に対応する。複数の対策手段候補は、対策手段11062に示された値等に対応する。複数の判定結果は、関連リソース傾向11084に示された値等に対応する。
The past period corresponds to the designated period, etc. The bottleneck load data corresponds to the performance data of the bottleneck resource. The related load data corresponds to the performance data of related resources. The bottleneck load range corresponds to the range in which the deviation from the average value of the performance data of the bottleneck resource is equal to or less than the bottleneck load deviation threshold value. The related load range corresponds to a range in which the deviation from the average value of the performance data of the related resource is equal to or less than the related load deviation threshold value. The plurality of countermeasure policy candidates correspond to the values and the like shown in the
以上、本発明の実施形態を説明したが、これは本発明の説明のための例示であって、本発明の範囲を上記構成に限定する趣旨ではない。本発明は、他の種々の形態でも実施する事が可能である。 Although the embodiments of the present invention have been described above, this is an example for explaining the present invention, and does not mean that the scope of the present invention is limited to the above configuration. The present invention can also be implemented in various other forms.
10…計算機システム、 100…管理計算機、 110…記憶資源、 120…プロセッサ、 200…サーバ、 210…プロセッサ、 220…記憶資源、 300…ストレージ装置、 310…プロセッサ、 320…メモリ、 360…記憶デバイス群、 370…ボリューム、 380…キャッシュメモリ、 390…コントローラ、 400…表示装置、 500…通信ネットワーク、 600…通信ネットワーク、 700…VM、 800…ハイパバイザ 10 ... Computer system, 100 ... Management computer, 110 ... Storage resource, 120 ... Processor, 200 ... Server, 210 ... Processor, 220 ... Storage resource, 300 ... Storage device, 310 ... Processor, 320 ... Memory, 360 ... Storage device group , 370 ... Volume, 380 ... Cache Memory, 390 ... Controller, 400 ... Display Device, 500 ... Communication Network, 600 ... Communication Network, 700 ... VM, 800 ... Hyper Processor
Claims (12)
前記管理計算機は、
前記計算機システム内の複数のリソースのうち過去の期間の前記計算機システムの性能低下の原因であるボトルネックリソースに対し、前記期間の前記ボトルネックリソースの負荷の時系列データであるボトルネック負荷データを取得し、
前記複数のリソースのうち前記ボトルネックリソースの負荷に影響を与える関連リソースに対し、前記期間の前記関連リソースの負荷の時系列データである関連負荷データを取得し、
前記ボトルネック負荷データに基づいてボトルネック負荷範囲を算出し、前記ボトルネック負荷データ内の全ての値が前記ボトルネック負荷範囲内である場合、前記ボトルネック負荷データの傾向が安定的であると判定し、
前記ボトルネック負荷データの傾向が安定的であると判定された場合、前記計算機システムの操作に必要なパラメータの決定の方針を示す複数の対策方針候補の中から、前記性能低下を解消するための対策方針を選択し、
前記対策方針と前記関連負荷データの傾向とに基づいて、夫々が前記計算機システムの操作を示す複数の対策手段候補の中から、前記性能低下を解消するための対策手段を選択し、
前記対策方針に基づいて、前記対策手段のパラメータを決定する、
管理方法。 It is a management method of a computer system using a management computer.
The management computer
The relative causes a is the bottleneck resource degradation of the computer system of the prior period among a plurality of resources in the computer system, the bottleneck load data is time-series data of the load of the bottleneck resource of the period Acquired,
For the related resource that affects the load of the bottleneck resource among the plurality of resources, the related load data which is the time series data of the load of the related resource during the period is acquired.
When the bottleneck load range is calculated based on the bottleneck load data and all the values in the bottleneck load data are within the bottleneck load range, the tendency of the bottleneck load data is stable. Judge,
When it is determined that the tendency of the bottleneck load data is stable, the performance degradation can be resolved from among a plurality of countermeasure policy candidates indicating the policy for determining the parameters necessary for operating the computer system. Select a countermeasure policy and
Based on the countermeasure policy and the tendency of the related load data, the countermeasure means for resolving the performance deterioration is selected from a plurality of countermeasure measure candidates indicating the operation of the computer system.
The parameters of the countermeasure means are determined based on the countermeasure policy .
Management method.
請求項1に記載の管理方法。 Said management computer, if the tendency of the previous SL bottleneck load data is determined to be stable, based on the result of the determination of the bottleneck tendency of the load data, selects the countermeasure policy,
The management method according to claim 1.
請求項2に記載の管理方法。 When the management computer determines that the tendency of the bottleneck load data is stable, the management computer selects a countermeasure policy candidate that reduces the load of the bottleneck resource over the entire period as the countermeasure policy. ,
The management method according to claim 2.
請求項3に記載の管理方法。 When the management computer determines that the tendency of the bottleneck load data is not stable, the management computer selects a countermeasure policy candidate for reducing the peak value of the load of the bottleneck resource within the period as the countermeasure policy.
The management method according to claim 3.
前記複数のリソースのうち前記ボトルネックリソースに影響を与える複数の関連リソースに対し、複数の関連負荷データを夫々取得し、
各関連負荷データに基づいて関連負荷範囲を算出し、各関連負荷データ内の全ての値が、対応する関連負荷範囲内である場合、対応する関連負荷データの傾向が安定的であると判定し、
前記対応する関連負荷データの傾向が安定的であると判定された場合、前記複数の関連負荷データの傾向の判定の結果に基づいて前記対策手段を選択する、
請求項4に記載の管理方法。 The management computer
A plurality of related load data are acquired for each of the plurality of related resources that affect the bottleneck resource among the plurality of resources .
The related load range is calculated based on each related load data, and when all the values in each related load data are within the corresponding related load range, it is determined that the tendency of the corresponding related load data is stable. ,
When it is determined that the tendency of the corresponding related load data is stable, the countermeasure means is selected based on the result of the determination of the tendency of the plurality of related load data.
The management method according to claim 4 .
前記管理計算機は、前記ボトルネック負荷データの傾向が安定的であると判定され、且つ、前記複数の関連負荷データのうち、安定的であると判定された関連負荷データの数が、安定的でないと判定された関連負荷データの数よりも少ない場合、前記複数の対策手段候補の中から前記第1対策手段候補以外の対策手段候補を、前記対策手段として選択する、
請求項5に記載の管理方法。 The first countermeasure measure candidate among the plurality of countermeasure means candidates indicates that the related resource in the bottleneck resource is moved to another resource of the same type as the bottleneck resource in the computer system.
In the management computer , the tendency of the bottleneck load data is determined to be stable, and the number of related load data determined to be stable among the plurality of related load data is not stable. When the number is less than the number of related load data determined to be, a countermeasure measure candidate other than the first countermeasure means candidate is selected as the countermeasure means from the plurality of countermeasure means candidates.
The management method according to claim 5 .
前記管理計算機は、前記ボトルネック負荷データの傾向が安定的でないと判定され、且つ前記複数の関連負荷データのうち、安定的であると判定された関連負荷データの数が、安定的でないと判定された関連負荷データの数よりも少ない場合、前記複数の対策手段候補の中から前記第2対策手段候補以外の対策手段候補を、前記対策手段として選択する、
請求項6に記載の管理方法。 The second countermeasure candidate among the plurality of countermeasure candidates indicates that the load on the related resource is reduced.
The management computer determines that the tendency of the bottleneck load data is not stable, and that the number of related load data determined to be stable among the plurality of related load data is not stable. When the number of related load data is less than the number of related load data, a countermeasure measure candidate other than the second countermeasure means candidate is selected as the countermeasure means from the plurality of countermeasure means candidates.
The management method according to claim 6 .
請求項7に記載の管理方法。 When the bottleneck resource is a pool and the related resource is a VM (virtual machine), the first countermeasure candidate is to move the data of the VM to another pool.
The management method according to claim 7 .
請求項8に記載の管理方法。 When the bottleneck resource is the pool and the related resource is the VM, the second countermeasure candidate is to limit the I / O amount of the VM.
The management method according to claim 8 .
前記関連負荷データの傾向毎に、前記対策方針と前記関連負荷データの傾向とに基づいて、対応する関連リソースを用いる前記対策手段を選択することで、複数の対策手段を決定し、
前記関連負荷データの傾向毎に、前記対策方針に基づいて、対応する対策手段のパラメータを決定する、
請求項5に記載の管理方法。 The management computer
For each tendency of the related load data, a plurality of countermeasures are determined by selecting the countermeasure means using the corresponding related resource based on the countermeasure policy and the tendency of the related load data .
For each trend prior SL-related load data, based on the security objectives, to determine the parameters of the corresponding protective means,
The management method according to claim 5 .
請求項1に記載の管理方法。 It said management computer, and said is the determined determined measure means parameters, Ru is displayed on the display device,
The management method according to claim 1.
前記メモリおよび計算機システムに接続されるプロセッサと、
を備え、
前記プロセッサは、
前記計算機システム内の複数のリソースのうち過去の期間の前記計算機システムの性能低下の原因であるボトルネックリソースに対し、前記期間の前記ボトルネックリソースの負荷の時系列データであるボトルネック負荷データを取得し、
前記複数のリソースのうち前記ボトルネックリソースの負荷に影響を与える関連リソースに対し、前記期間の前記関連リソースの負荷の時系列データである関連負荷データを取得し、
前記ボトルネック負荷データに基づいてボトルネック負荷範囲を算出し、前記ボトルネック負荷データ内の全ての値が前記ボトルネック負荷範囲内である場合、前記ボトルネック負荷データの傾向が安定的であると判定し、
前記ボトルネック負荷データの傾向が安定的であると判定された場合、前記計算機システムの操作に必要なパラメータの決定の方針を示す複数の対策方針候補の中から、前記性能低下を解消するための対策方針を選択し、
前記対策方針と前記関連負荷データの傾向とに基づいて、夫々が前記計算機システムの操作を示す複数の対策手段候補の中から、前記性能低下を解消するための対策手段を選択し、
前記対策方針に基づいて、前記対策手段のパラメータを決定する、
管理計算機。 Memory and
With the processor connected to the memory and computer system
With
The processor
Of the plurality of resources in the computer system, the bottleneck load data which is the time-series data of the load of the bottleneck resource in the period is applied to the bottleneck resource which is the cause of the performance deterioration of the computer system in the past period. Acquired,
For the related resource that affects the load of the bottleneck resource among the plurality of resources, the related load data which is the time series data of the load of the related resource during the period is acquired.
When the bottleneck load range is calculated based on the bottleneck load data and all the values in the bottleneck load data are within the bottleneck load range, the tendency of the bottleneck load data is stable. Judge,
When it is determined that the tendency of the bottleneck load data is stable, the performance degradation can be resolved from among a plurality of countermeasure policy candidates indicating the policy for determining the parameters necessary for operating the computer system. Select a countermeasure policy and
Based on the countermeasure policy and the tendency of the related load data, the countermeasure means for resolving the performance deterioration is selected from a plurality of countermeasure measure candidates indicating the operation of the computer system.
The parameters of the countermeasure means are determined based on the countermeasure policy.
Management calculator.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/073376 WO2018029767A1 (en) | 2016-08-09 | 2016-08-09 | Management method and management computer |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2018029767A1 JPWO2018029767A1 (en) | 2019-06-06 |
JP6752889B2 true JP6752889B2 (en) | 2020-09-09 |
Family
ID=61162825
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018533329A Active JP6752889B2 (en) | 2016-08-09 | 2016-08-09 | Management method and management calculator |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6752889B2 (en) |
WO (1) | WO2018029767A1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11809890B2 (en) | 2018-06-29 | 2023-11-07 | Intel Corporation | Managing quality of storage service in virtual network |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02109148A (en) * | 1988-10-19 | 1990-04-20 | Hitachi Ltd | Monitoring method for system performance |
JP4857818B2 (en) * | 2006-03-02 | 2012-01-18 | 株式会社日立製作所 | Storage management method and storage management server |
JP5951111B2 (en) * | 2012-11-09 | 2016-07-13 | 株式会社日立製作所 | Management computer, computer system, and instance management method |
JP2015011569A (en) * | 2013-06-28 | 2015-01-19 | 株式会社東芝 | Virtual machine management device, virtual machine management method and virtual machine management program |
-
2016
- 2016-08-09 JP JP2018533329A patent/JP6752889B2/en active Active
- 2016-08-09 WO PCT/JP2016/073376 patent/WO2018029767A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
JPWO2018029767A1 (en) | 2019-06-06 |
WO2018029767A1 (en) | 2018-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11073999B2 (en) | Extent migration in multi-tier storage systems | |
JP6051228B2 (en) | Computer system, storage management computer, and storage management method | |
US10353730B2 (en) | Running a virtual machine on a destination host node in a computer cluster | |
US8924681B1 (en) | Systems, methods, and computer readable media for an adaptative block allocation mechanism | |
US10353616B1 (en) | Managing data relocation in storage systems | |
US11256595B2 (en) | Predictive storage management system | |
JP6260407B2 (en) | Storage management device, performance adjustment method, and performance adjustment program | |
US8495294B2 (en) | Management computer for managing storage system capacity and storage system capacity management method | |
US20130290274A1 (en) | Enhanced reliability in deduplication technology over storage clouds | |
US20180267728A1 (en) | Provisioning volumes | |
JP2019082801A (en) | Resource allocation optimization system and method | |
US20150355947A1 (en) | Resource provisioning based on logical profiles and piecewise objective functions | |
US20120151174A1 (en) | Computer system, management method of the computer system, and program | |
US9542103B2 (en) | Method and system for monitoring and analyzing quality of service in a storage system | |
WO2010099992A1 (en) | Method, system and computer program product for managing the placement of storage data in a multi tier virtualized storage infrastructure | |
US20150317556A1 (en) | Adaptive quick response controlling system for software defined storage system for improving performance parameter | |
CN106471473B (en) | Mechanism for controlling server over-allocation in a data center | |
US20130185531A1 (en) | Method and apparatus to improve efficiency in the use of high performance storage resources in data center | |
WO2013111331A1 (en) | Computer system | |
US20230123303A1 (en) | Adjusting resources within a hyperconverged infrastructure system based on environmental information | |
JP6752889B2 (en) | Management method and management calculator | |
US11635996B2 (en) | Management system and management method for migrating a business system operating on a target infrastructure | |
JP6100404B2 (en) | Computer system and method for controlling hierarchical storage thereof | |
US20160036632A1 (en) | Computer system | |
JP5987104B2 (en) | Computer system, storage system management system, and management method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190108 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200331 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200601 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200721 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6752889 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |