JP2022133993A

JP2022133993A - ストレージシステム、リソース制御方法、及びリソース制御プログラム

Info

Publication number: JP2022133993A
Application number: JP2021032991A
Authority: JP
Inventors: 斉志宇川; Tadashi Ukawa
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2021-03-02
Filing date: 2021-03-02
Publication date: 2022-09-14
Also published as: US20220283875A1

Abstract

【課題】物理サーバのリソースを適切に割り当てられるようにする。【解決手段】１以上の物理サーバ１００を備えるストレージシステム２において、物理サーバ１００には、物理サーバ１００のリソースが割り当てられる、クライアント１０とのフロントエンドネットワーク３０を介してのファイルストレージのプロトコルに関する処理を実行する１以上のプロトコルＶＭ１２０と、ファイルストレージにおけるファイルの管理に関する処理を実行する１以上のファイルシステムＶＭ１３０と、が形成され、物理サーバ１００は、プロトコルＶＭ１２０とファイルシステムＶＭ１３０との負荷に関する負荷情報を取得し、負荷情報に基づいて、プロトコルＶＭ１２０とファイルシステムＶＭ１３０とに対する物理サーバ１００のリソースの割り当てを制御するように構成する。【選択図】図１

Description

本発明は、１以上の物理サーバを含むストレージシステムにおいて、物理サーバに生成される仮想計算機に対するリソースの割り当てを制御する技術に関する。

例えば、ストレージやネットワーク機器がもつ基盤機能を仮想化させて実現する１台以上の物理サーバを備えるＨＣＩ（Ｈｙｐｅｒ―ＣｏｎｖｅｒｇｅｄＩｎｆｒａｓｔｒｕｃｔｕｒｅ）システムが知られている。ＨＣＩシステムでは、物理サーバには、各種機能を実行する仮想計算機（ＶＭ）が生成される。例えば、物理サーバにおいては、仮想計算機を管理するための仮想計算機（ハイパバイザ）と、記憶デバイスに対するブロックストレージの機能を提供する仮想計算機（ブロックストレージＶＭ）と、ファイルストレージの機能を提供する仮想計算機（ファイルストレージＶＭ）とが生成される。

例えば、特許文献１には、仮想的なファイルサーバを、その仮想的なファイルサーバのスループット等に基づいて、スケールアップ、スケールダウン、スケールイン、スケールアウトする技術が開示されている。

米国特許出願公開第２０１８／０１５７５２２号明細書

特許文献１に開示された技術によると、仮想的なファイルサーバの負荷が増えた場合においては、仮想的なファイルサーバを単位として、リソースの制御が行われることとなる。

例えば、仮想的なファイルサーバが、数千人規模の会社のユーザによって使用されている場合には、会社の始業時間に一斉にログインが発生することがあり、この際には、主に、仮想的なファイルサーバにおけるログインに関わる処理にのみ負荷が掛かることとなる。これに対して、特許文献１に開示された技術によると、仮想的なファイルサーバに対してリソースが割り当てられることとなり、割り当てられたリソースが、負荷が掛かっている処理に効率よく使用されることとはならず、リソースの利用効率が上がらない虞がある。

本発明は、上記事情に鑑みなされたものであり、その目的は、物理サーバのリソースを適切に割り当てることのできる技術を提供することにある。

上記目的を達成するため、一観点に係るストレージシステムは、１以上の物理サーバを備えるストレージシステムであって、前記物理サーバには、前記物理サーバのリソースが割り当てられる、クライアントとのネットワークを介してのファイルストレージのプロトコルに関する処理を実行する１以上の第１仮想計算機と、前記ファイルストレージにおけるファイルの管理に関する処理を実行する１以上の第２仮想計算機と、が形成され、前記物理サーバは、前記第１仮想計算機と前記第２仮想計算機との負荷に関する負荷情報を取得し、前記負荷情報に基づいて、前記第１仮想計算機と前記第２仮想計算機とに対する前記物理サーバのリソースの割り当てを制御する。

本発明によれば、物理サーバのリソースを適切に割り当てることができる。

図１は、一実施形態に係る計算機システムの全体構成図である。図２は、一実施形態に係るストレージシステムの全体構成図である。図３は、一実施形態に係る物理サーバの構成図である。図４は、一実施形態に係るファイルシステムＶＭ管理テーブルの構成を説明する図である。図５は、一実施形態に係るプロトコルＶＭ管理テーブルの構成を説明する図である。図６は、一実施形態に係る物理サーバ管理テーブルの構成を説明する図である。図７は、一実施形態に係る閾値管理テーブルの構成を説明する図である。図８は、一実施形態に係る負荷登録処理のフローチャートである。図９は、一実施形態に係る負荷分散処理のフローチャートである。図１０は、一実施形態に係るリソース制御処理のフローチャートである。

実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。

以下の説明では、「ＡＡＡテーブル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「ＡＡＡテーブル」を「ＡＡＡ情報」と呼ぶことができる。

また、以下の説明では、「プログラム」を動作主体として処理を説明する場合があるが、プログラムは、プロセッサ（例えばＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ））によって実行されることで、定められた処理を、適宜に記憶部（例えばメモリ）及び／又はインターフェースデバイス等を用いながら行うため、処理の動作主体が、プロセッサ（或いは、そのプロセッサを有する装置又はシステム）とされてもよい。また、プロセッサは、処理の一部または全部を行うハードウェア回路を含んでもよい。プログラムは、プログラムソースから計算機のような装置にインストールされてもよい。プログラムソースは、例えば、プログラム配布サーバまたは計算機が読み取り可能な記録メディア（例えば可搬型の記録メディア）であってもよい。また、以下の説明において、２以上のプログラムが１つのプログラムとして実現されてもよいし、１つのプログラムが２以上のプログラムとして実現されてもよい。

図１は、一実施形態に係る計算機システムの全体構成図である。

計算機システム１は、１以上のクライアント１０と、管理計算機２０と、ストレージシステム２とを備える。ストレージシステム２は、１以上の物理サーバ１００を備える。

クライアント１０は、ストレージシステム２に格納されているデータ（例えば、ファイル）を使用して各種処理を行う。管理計算機２０は、ストレージシステム２を管理する処理を行う。

物理サーバ１００は、ＶＭ（仮想計算機）として、ハイパバイザ（Ｈｙｐｅｒｖｉｓｏｒ）１１０と、１以上のプロトコルＶＭ（ＰｒｏｔｏｃｏｌＶＭ：第１仮想計算機）１２０と、ファイルシステムＶＭ（ＦｉｌｅＳｙｓｔｅｍＶＭ：第２仮想計算機）１３０と、ブロックストレージＶＭ（ＢｌｏｃｋＳｔｏｒａｇｅＶＭ）１４０とを含む。

１以上のクライアント１０と、物理サーバ１００のプロトコルＶＭ１２０とは、フロントエンドネットワーク３０を介して接続されている。フロントエンドネットワーク３０は、例えば、有線ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）、無線ＬＡＮ、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）などの通信ネットワークである。

管理計算機２０と、物理サーバ１００のブロックストレージＶＭ１４０とは、管理ネットワーク４０を介して接続されている。管理ネットワーク４０は、例えば、有線ＬＡＮ、無線ＬＡＮ、ＷＡＮなどの通信ネットワークである。

物理サーバ１００のそれぞれのＶＭ（１１０～１４０）は、ノード間ネットワーク５０を介して接続されている。ノード間ネットワーク５０は、例えば、有線ＬＡＮ、無線ＬＡＮ、ＷＡＮなどの通信ネットワークである。

なお、本実施形態では、フロントエンドネットワーク３０、管理ネットワーク４０、及びノード間ネットワーク５０は、別のネットワークとしていたが、例えば、いずれか複数を同一のネットワークとしてもよい。

図２は、一実施形態に係るストレージシステムの全体構成図である。

ストレージシステム２は、分散ファイルシステムのクラスタを構成する複数の物理サーバ１００を備える。図２の例では、ストレージシステム２は、物理サーバ１００Ａと、物理サーバ１００Ｂと、物理サーバ１００Ｃとを備える。

物理サーバ１００Ａは、分散ファイルシステムのクラスタを構成する物理サーバを統括するマスタープライマリ（主マスタ）として動作する物理サーバである。分散ファイルシステムのクラスタでは、例えば、マスタプライマリとして動作する物理サーバ１００を１台備える。

物理サーバ１００Ａは、ハイパバイザ１１０と、１以上のプロトコルＶＭ１２０と、ファイルシステムＶＭ１３０と、ブロックストレージＶＭ１４０と、を有する。

ハイパバイザ１１０は、ＶＭを生成したり、削除したり、ＶＭに対するリソースの割り当てを制御する。ハイパバイザ１１０は、負荷分散プログラム１１１と、リソース制御プログラム１１２とを実行する。負荷分散プログラム１１１は、プロトコルＶＭ１２０間のクライアント１０の接続数の違いによる負荷を分散する処理を行うためのプログラムである。リソース制御プログラム１１２は、プロトコルＶＭ１２０と、ファイルシステムＶＭ１３０とについてのリソースの割り当てを制御する処理を行うためのプログラムである。

プロトコルＶＭ１２０は、ファイルストレージにおける機能の一部、例えば、フロントエンドネットワーク３０を介してクライアント１０との間でファイルシステム（例えば、ＮＦＳ（ＮｅｔｗｏｒｋＦｉｌｅＳｙｓｔｅｍ）及び／又はＣＩＦＳ（ＣｏｍｍｏｎＩｎｔｅｒｎｅｔＦｉｌｅＳｙｓｔｅｍ））のプロトコルに従う機能を実行する。プロトコルＶＭ１２０が実行する処理としては、例えば、ユーザログイン、ユーザ間のロックの管理、ｗｉｎｄｏｗｓ（登録商標）／Ｌｉｎｕｘ（登録商標）間のユーザマッピング等の処理がある。プロトコルＶＭ１２０は、負荷登録プログラム１２１を実行する。負荷登録プログラム１２１は、自ＶＭ（ここでは、プロトコルＶＭ１２０）での負荷の情報を取得し、後述するデータベース１４１に登録する処理を行うためのプログラムである。

ファイルシステムＶＭ１３０は、ファイルストレージにおける機能の一部（プロトコルＶＭ１２０の機能以外）、例えば、ファイルを管理するための機能（ファイルＩ／ＯとブロックＩ／Ｏとの間の変換機能等）を実行する。ファイルシステムＶＭ１３０は、負荷登録プログラム１２１を実行する。負荷登録プログラム１２１は、自ＶＭ（ここでは、ファイルシステムＶＭ１３０）での負荷の情報を取得し、後述するデータベース１４１に登録する処理を行うためのプログラムである。これらプロトコルＶＭ１２０とファイルシステムＶＭ１３０とにより、ファイルストレージに必要な機能が揃う。

ブロックストレージＶＭ１４０は、データをブロック単位で後述する記憶デバイス１５４に格納して管理するブロックストレージとして機能する。ブロックストレージＶＭ１４０は、データベース１４１を有する。データベース１４１は、各種情報を格納する。データベース１４１は、ストレージシステム２の各物理サーバ１００が読み書き可能となっている。データベース１４１は、本実施形態では、後述するファイルシステムＶＭ管理テーブル１６１と、プロトコルＶＭ管理テーブル１６２と、物理サーバ管理テーブル１６３と、閾値管理テーブル１６４とを格納する。ブロックストレージＶＭ１４０は、負荷登録プログラム１２１を実行する。負荷登録プログラム１２１は、自ＶＭ（ここでは、ブロックストレージＶＭ１４０）での負荷の情報を取得し、データベース１４１に登録する処理を行うためのプログラムである。

物理サーバ１００Ｂは、分散ファイルシステムにおいて、マスタプライマリとして動作する物理サーバ１００Ａに障害が発生した際に、マスタプライマリとして動作可能なマスタセカンダリ（副マスタ）として動作する物理サーバである。分散ファイルシステムのクラスタでは、例えば、マスタプライマリとして動作する物理サーバを２台まで備えることができる。

物理サーバ１００Ｂは、ハイパバイザ１１０と、１以上のプロトコルＶＭ１２０と、ファイルシステムＶＭ１３０と、ブロックストレージＶＭ１４０と、を有する。物理サーバ１００Ｂのハイパバイザ１１０は、リソース制御プログラム１１２を実行し、負荷分散プログラム１１１を実行しない。なお、物理サーバＢが、物理サーバ１００Ａの障害により、マスタプライマリとして動作する場合には、負荷分散プログラム１１１を実行する。

物理サーバ１００ＢのブロックストレージＶＭ１４０のデータベース１４１は、物理サーバ１００ＡのブロックストレージＶＭ１４０のデータベース１４１のレプリカであり、例えば、物理サーバ１００ＡのブロックストレージＶＭ１４０により所定のタイミングで物理サーバ１００Ａのデータベース１４１のデータがコピーされる。

物理サーバ１００Ｃは、分散ファイルシステムにおける、マスタ（マスタプライマリ及びマスタセカンダリ）と動作する物理サーバ以外の物理サーバである。物理サーバ１００Ｃは、ハイパバイザ１１０と、１以上のプロトコルＶＭ１２０と、ファイルシステムＶＭ１３０と、ブロックストレージＶＭ１４０と、を有する。なお、物理サーバ１００ＣのブロックストレージＶＭ１４０は、データベース１４１を備えていなくてよい。

図３は、一実施形態に係る物理サーバの構成図である。

物理サーバ１００（１００Ａ，１００Ｂ，１００Ｃ）は、例えば、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）、汎用サーバによって構成されている。物理サーバ１００は、通信Ｉ／Ｆ１５１と、１以上のＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１５２と、入力装置１５３と、記憶デバイス１５４と、メモリ１５５と、表示装置１５６とのリソースを備える。

通信Ｉ／Ｆ１５１は、例えば、有線ＬＡＮカードや無線ＬＡＮカードなどのインターフェースであり、ネットワーク（３０，４０，５０）を介して他の装置（例えば、クライアント１０、管理計算機２０、他の物理サーバ１００）と通信する。

ＣＰＵ１５２は、メモリ１５５及び／又は記憶デバイス１５４に格納されているプログラムに従って各種処理を実行する。本実施形態では、ＣＰＵ１５２が各ＶＭに割り当てられる。各ＶＭに割り当てられる単位としては、ＣＰＵ１５２の個数単位であってもよい。

メモリ１５５は、例えば、ＲＡＭ（ＲＡＮＤＯＭＡＣＣＥＳＳＭＥＭＯＲＹ）であり、ＣＰＵ１５２で実行されるプログラムや、必要な情報を記憶する。本実施形態では、メモリ１５５は、各ＶＭに割り当てられて使用される。

記憶デバイス１５４は、例えば、ハードディスクやフラッシュメモリなどであり、ＣＰＵ１５２で実行されるプログラムや、ＣＰＵ１５２に利用されるデータ、クライアント１０によって利用されるユーザデータのファイル等を記憶する。本実施形態では、記憶デバイス１５４は、ハイパバイザ１１０を実現するプログラム（例えば、負荷分散プログラム１１１、リソース制御プログラム１１２を含む）、ハイパバイザ１１０によって生成されたＶＭをプロトコルＶＭ１２０として機能させるプログラム（例えば、負荷登録プログラム１２１を含む）、ハイパバイザ１１０によって生成されたＶＭをファイルシステムＶＭ１３０として機能させるプログラム（例えば、負荷登録プログラム１２１を含む）、ハイパバイザ１１０によって生成されたＶＭをブロックストレージＶＭ１４０として機能させるプログラム等を記憶する。また、記憶デバイス１５４は、ブロックストレージＶＭ１４０のデータベース１４１で管理されるデータを記憶する。

入力装置１５３は、例えば、マウス、キーボード等であり、ユーザによる情報の入力を受け付ける。表示装置１５６は、例えば、ディスプレイであり、各種情報を表示出力する。

次に、物理サーバ１００ＡのブロックストレージＶＭ１４０のデータベース１４１に格納されている各種情報について説明する。

まず、ファイルシステムＶＭ管理テーブル１６１について説明する。

図４は、一実施形態に係るファイルシステムＶＭ管理テーブルの構成を説明する図である。

ファイルシステムＶＭ管理テーブル１６１は、ストレージシステム２におけるファイルシステムＶＭ１３０の情報を管理するテーブルであり、ファイルシステムＶＭ１３０毎のエントリを格納する。

ファイルシステムＶＭ管理テーブル１６１のエントリは、ファイルシステムＶＭ識別子１６１ａと、物理サーバ識別子１６１ｂと、割り当てＣＰＵ数１６１ｃと、割り当てメモリサイズ１６１ｄと、ＣＰＵ使用率１６１ｅと、メモリ使用量１６１ｆとの項目を含む。

ファイルシステムＶＭ識別子１６１ａには、エントリに対応するファイルシステムＶＭ１３０を一意に特定可能な識別子（ファイルシステムＶＭ識別子）が格納される。物理サーバ識別子１６１ｂには、エントリに対応するファイルシステムＶＭ１３０が生成されている物理サーバ１００を一意に特定する識別子（物理サーバ識別子）が格納される。割り当てＣＰＵ数１６１ｃには、エントリに対応するファイルシステムＶＭ１３０に割り当てられているＣＰＵ１５２の数が格納される。割り当てメモリサイズ１６１ｄには、エントリに対応するファイルシステムＶＭ１３０に割り当てられているメモリ１５５のサイズが格納される。ＣＰＵ使用率１６１ｅには、エントリに対応するファイルシステムＶＭ１３０に割り当てられているＣＰＵ１５２の使用率が格納される。メモリ使用量１６１ｆには、エントリに対応するファイルシステムＶＭ１３０に割り当てられたメモリ１５５の中の使用されているサイズ（メモリ使用量）が格納される。

ファイルシステムＶＭ管理テーブル１６１においては、ファイルシステムＶＭ識別子１６１ａと、物理サーバ識別子１６１ｂと、割り当てＣＰＵ数１６１ｃと、割り当てメモリサイズ１６１ｄとの値は、ハイパバイザ１１０により、更新されるとともに参照される。ＣＰＵ使用率１６１ｅと、メモリ使用量１６１ｆとの値は、ファイルシステムＶＭ１３０により更新され、ハイパバイザ１１０により参照される。

次に、プロトコルＶＭ管理テーブル１６２について説明する。

図５は、一実施形態に係るプロトコルＶＭ管理テーブルの構成を説明する図である。

プロトコルＶＭ管理テーブル１６２は、ストレージシステム２におけるプロトコルＶＭ１２０の情報を管理するテーブルであり、プロトコルＶＭ１２０毎のエントリを格納する。

プロトコルＶＭ管理テーブル１６２のエントリは、プロトコルＶＭ識別子１６２ａと、物理サーバ識別子１６２ｂと、ＣＩＦＳ接続数１６２ｃと、ＮＦＳ接続数１６２ｄと、割り当てＣＰＵ数１６２ｅと、割り当てメモリサイズ１６２ｆと、ＣＰＵ使用率１６２ｇと、メモリ使用量１６２ｈとの項目を含む。

プロトコルＶＭ識別子１６２ａには、エントリに対応するプロトコルＶＭ１２０を一意に特定可能な識別子（プロトコルＶＭ識別子）が格納される。物理サーバ識別子１６２ｂには、エントリに対応するプロトコルＶＭ１２０が生成されている物理サーバ１００を一意に特定する識別子（物理サーバ識別子）が格納される。ＣＩＦＳ接続数１６２ｃには、エントリに対応するプロトコルＶＭ１２０に対するＣＩＦＳによるクライアントの接続数が格納される。ＮＦＳ接続数１６２ｄには、エントリに対応するプロトコルＶＭ１２０に対するＮＦＳによるクライアントの接続数が格納される。割り当てＣＰＵ数１６２ｅには、エントリに対応するプロトコルＶＭ１２０に割り当てられているＣＰＵ１５２の数が格納される。割り当てメモリサイズ１６２ｆには、エントリに対応するプロトコルＶＭ１２０に割り当てられているメモリ１５５のサイズが格納される。ＣＰＵ使用率１６２ｇには、エントリに対応するプロトコルＶＭ１２０に割り当てられているＣＰＵ１５２の使用率が格納される。メモリ使用量１６２ｈには、エントリに対応するプロトコルＶＭ１２０に割り当てられたメモリ１５５の中の使用されているサイズが格納される。

プロトコルＶＭ管理テーブル１６２においては、プロトコルＶＭ識別子１６２ａと、物理サーバ識別子１６２ｂと、割り当てＣＰＵ数１６２ｅと、割り当てメモリサイズ１６２ｆとの値は、ハイパバイザ１１０により、更新されるとともに参照される。ＣＩＦＳ接続数１６２ｃと、ＮＦＳ接続数１６２ｄと、ＣＰＵ使用率１６２ｇと、メモリ使用量１６２ｈとの値は、プロトコルＶＭ１２０により更新され、ハイパバイザ１１０により参照される。

次に、物理サーバ管理テーブル１６３について説明する。

図６は、一実施形態に係る物理サーバ管理テーブルの構成を説明する図である。

物理サーバ管理テーブル１６３は、ストレージシステム２における物理サーバ１００の情報を管理するテーブルであり、物理サーバ１００毎のエントリを格納する。

物理サーバ管理テーブル１６３のエントリは、物理サーバ識別子１６３ａと、割り当てＣＰＵ数１６３ｂと、割り当てメモリサイズ１６３ｃとの項目を含む。

物理サーバ識別子１６３ａには、エントリに対応する物理サーバ１００を一意に特定する識別子（物理サーバ識別子）が格納される。割り当てＣＰＵ数１６３ｂには、エントリに対応する物理サーバ１００において、割り当て可能なＣＰＵ１５２の数が格納される。割り当てメモリサイズ１６３ｃには、エントリに対応する物理サーバ１００において、割り当て可能なメモリ１５５のサイズが格納される。

物理サーバ管理テーブル１６３においては、物理サーバ識別子１６３ａと、割り当てＣＰＵ数１６３ｂと、割り当てメモリサイズ１６３ｃとの値は、ハイパバイザ１１０により、更新されるとともに参照される。

次に、閾値管理テーブル１６４について説明する。

図７は、一実施形態に係る閾値管理テーブルの構成を説明する図である。

閾値管理テーブル１６４は、処理に使用する閾値を管理するテーブルであり、ユーザ接続上限値１６４ａと、ユーザ接続下限値１６４ｂと、Ｓｃａｌｅ－ｏｕｔ上限値１６４ｃと、Ｓｃａｌｅ－ｉｎ下限値１６４ｄと、Ｓｃａｌｅ－ｕｐ上限値１６４ｅと、Ｓｃａｌｅ－ｄｏｗｎ下限値１６４ｆとの項目を含む。

ユーザ接続上限値１６４ａには、負荷分散プログラム１１１において、プロトコルＶＭ１２０の負荷が高いと判断するためのユーザ接続数の上限値（ユーザ接続上限値）が格納される。ユーザ接続下限値１６４ｂには、負荷分散プログラム１１１において、プロトコルＶＭ１２０の負荷が低いと判断するためのユーザ接続数の下限値（ユーザ接続下限値）が格納される。Ｓｃａｌｅ－ｏｕｔ上限値１６４ｃには、リソース制御プログラム１１２において、プロトコルＶＭ１２０の負荷が高いと判断するための上限値（Ｓｃａｌｅ－ｏｕｔ上限値）が格納される。なお、プロトコルＶＭ１２０の負荷がこの上限値より高い場合には、Ｓｃａｌｅ－ｏｕｔ、すなわち、新しいプロトコルＶＭ１２０の追加が行われる。Ｓｃａｌｅ－ｉｎ下限値１６４ｄには、リソース制御プログラム１１２において、プロトコルＶＭ１２０の負荷が低いと判断するための下限値（Ｓｃａｌｅ－ｉｎ下限値）が格納される。なお、プロトコルＶＭ１２０の負荷がこの下限値より低い場合には、Ｓｃａｌｅ－ｉｎ、すなわち、プロトコルＶＭ１２０の削除が行われる。

Ｓｃａｌｅ－ｕｐ上限値１６４ｅには、リソース制御プログラム１１２において、ファイルシステムＶＭ１３０の負荷が高いと判断するための上限値（Ｓｃａｌｅ－ｕｐ上限値）が格納される。なお、ファイルシステムＶＭ１３０の負荷がこの上限値より高い場合には、Ｓｃａｌｅ－ｕｐ、すなわち、ファイルシステムＶＭ１３０へのリソースの追加が行われる。Ｓｃａｌｅ－ｄｏｗｎ下限値１６４ｆには、リソース制御プログラム１１２において、ファイルシステムＶＭ１３０の負荷が低いと判断するための下限値（Ｓｃａｌｅ－ｄｏｗｎ下限値）が格納される。なお、ファイルシステムＶＭ１３０の負荷がこの下限値より低い場合には、Ｓｃａｌｅ－ｄｏｗｎ、すなわち、ファイルシステムＶＭ１３０のリソースの解放が行われる。

次に、ストレージシステム２による処理動作について説明する。

まず、負荷登録処理について説明する。

図８は、一実施形態に係る負荷登録処理のフローチャートである。

負荷登録処理は、プロトコルＶＭ１２０、ファイルシステムＶＭ１３０、ブロックストレージＶＭ１４０のそれぞれに割り当てられたＣＰＵ１５２が負荷登録プログラム１２１を実行することにより実行される。

負荷登録プログラム１２１は、この負荷登録プログラム１２１を実行するＶＭにおける各種負荷をチェックする（ステップＳ１１）。例えば、プロトコルＶＭ１２０で実行される負荷登録プログラム１２１は、プロトコルＶＭ１２０におけるＣＩＦＳ接続数、ＮＦＳ接続数、ＣＰＵ使用率、及びメモリ使用量をチェックする。また、ファイルシステムＶＭ１３０で実行される負荷登録プログラム１２１は、ファイルシステムＶＭ１３０におけるＣＰＵ使用率、及びメモリ使用量をチェックする。また、ブロックストレージＶＭ１４０で実行される負荷登録プログラム１２１は、ブロックストレージＶＭ１４０におけるＣＰＵ使用率、及びメモリ使用量をチェックする。

次いで、負荷登録プログラム１２１は、チェックした各種負荷に基づいて、マスタプライマリの物理サーバ１００のデータベース１４１の対応する表の対応する項目を更新する（ステップＳ１２）。次いで、負荷登録プログラム１２１は、一定時間経過したか否かを判定し（ステップＳ１３）、一定時間経過したと判定した場合（ステップＳ１３：ＹＥＳ）には、処理をステップＳ１１に進める。

プロトコルＶＭ１２０、ファイルシステムＶＭ１３０、及びブロックストレージＶＭ１４０において実行される負荷登録処理により、マスタプライマリの物理サーバ１００のデータベース１４１には、各ＶＭの最新の負荷の情報が格納されることとなる。

次に、負荷分散処理について説明する。

図９は、一実施形態に係る負荷分散処理のフローチャートである。

負荷分散処理は、マスタプライマリの物理サーバ１００のハイパバイザ１１０に割り当てられたＣＰＵ１５２が負荷分散プログラム１１１を実行することにより実行される。

負荷分散プログラム１１１は、データベース１４１からストレージシステム２における各ＶＭの負荷の情報を取得する（ステップＳ２１）。

次いで、負荷分散プログラム１１１は、接続ユーザ数（ＣＩＦＳ接続数＋ＮＦＳ接続数）が上限値（閾値管理テーブル１６４のユーザ接続上限値１６４ａのユーザ接続上限値）を超えている物理サーバ（物理サーバ（１）という）が存在するか否かを判定する（ステップＳ２２）。

この結果、接続数がユーザ接続上限値を超えている物理サーバが存在する場合（ステップＳ２２：ＹＥＳ）には、負荷分散プログラム１１１は、処理をステップＳ２３に進める一方、接続数がユーザ接続上限値を超えている物理サーバが存在しない場合（ステップＳ２２：ＮＯ）には、処理をステップＳ２６に進める。

ステップＳ２３では、負荷分散プログラム１１１は、接続ユーザ数が下限値（閾値管理テーブル１６４のユーザ接続下限値１６４ｂのユーザ接続下限値）よりも少ない物理サーバ（物理サーバ（２）という）が存在するか否かを判定する。

この結果、接続数がユーザ接続下限値よりも少ない物理サーバが存在する場合（ステップＳ２３：ＹＥＳ）には、負荷分散プログラム１１１は、処理をステップＳ２４に進める一方、接続数がユーザ接続下限値よりも少ない物理サーバが存在しない場合（ステップＳ２３：ＮＯ）には、処理をステップＳ２６に進める。

ステップＳ２４では、負荷分散プログラム１１１は、物理サーバ（１）から物理サーバ（２）へ負荷を分散する。具体的には、負荷分散プログラム１１１は、物理サーバ（１）のプロトコルＶＭ１２０から物理サーバ（２）のプロトコルＶＭ１２０へ、接続しているユーザについての一部のプロセスについて、等価的フェイルオーバーを行う。

次いで、負荷分散プログラム１１１は、負荷分散した結果に基づいて、データベース１４１の対応する表の値を更新する（ステップＳ２５）。

ステップＳ２６では、負荷分散プログラム１１１は、各物理サーバ１００のハイパバイザ１１０に対して、リソース制御プログラム１１２の実行を指示する。

次いで、負荷分散プログラム１１１は、一定時間経過したか否かを判定し（ステップＳ２７）、一定時間経過したと判定した場合（ステップＳ２７：ＹＥＳ）には、処理をステップＳ２１に進める。

上記した負荷分散処理によると、物理サーバ１００間でユーザ接続数を分散することができ、各物理サーバ１００の負荷を分散することができる。

次に、リソース制御処理について説明する。

図１０は、一実施形態に係るリソース制御処理のフローチャートである。

リソース制御処理は、各物理サーバ１００のハイパバイザ１１０に割り当てられたＣＰＵ１５２がリソース制御プログラム１１２を実行することにより実行される。

リソース制御プログラム１１２は、データベース１４１からリソース制御プログラム１１２を実行するハイパバイザ１１０が存在している物理サーバ１００（本処理の説明において、自物理サーバという）における各ＶＭの負荷の情報を取得する（ステップＳ３１）。

次いで、リソース制御プログラム１１２は、物理サーバ１００に負荷が高いプロトコルＶＭ１２０が存在するか否か、すなわち、負荷が所定の負荷以上であるプロトコルＶＭ１２０が存在するか否かを判定する（ステップＳ３２）。例えば、リソース制御プログラム１１２は、メモリ使用量が所定の閾値を超える場合、ＣＰＵ使用率が所定の閾値を超える場合、接続ユーザ数（ＣＩＦＳ接続数＋ＮＦＳ接続数）の合計が所定の閾値を超える場合のいずれかを満たすプロトコルＶＭ１２０が存在する場合に、負荷が高いプロトコルＶＭ１２０が存在すると判定してもよい。

この結果、負荷が高いプロトコルＶＭ１２０が存在すると判定した場合（ステップＳ３２：ＹＥＳ）、リソース制御プログラム１１２は、処理をステップＳ３３に進める一方、負荷が高いプロトコルＶＭ１２０が存在しないと判定した場合（ステップＳ３２：ＮＯ）には、処理をステップＳ４２に進める。

ステップＳ３３では、リソース制御プログラム１１２は、自物理サーバ内に空きリソースが存在するか否かを判定する。ここで、空きリソースがあるか否かは、例えば、物理サーバ管理テーブル１６３の自物理サーバに対応するエントリにおける割り当てＣＰＵ数及び割り当てメモリサイズと、自物理サーバに存在する全てのＶＭにおける割り当てＣＰＵ数及び割り当てメモリサイズとに差があるか否かにより特定することができる。

この結果、自物理サーバ内に空きリソースが存在すると判定した場合（ステップＳ３３：ＹＥＳ）には、リソース制御プログラム１１２は、自物理サーバの空きリソースを割り当てた新しいプロトコルＶＭ１２０を生成し（ステップＳ３４）、生成したプロトコルＶＭ１２０を、ストレージシステム２における分散ファイルシステムのクラスタに組み込むことにより、分散ファイルシステムをＳｃａｌｅ－ｏｕｔする（ステップＳ３５）。これにより、プロトコルＶＭ１２０により実行される処理の効率を向上することができる。次いで、リソース制御プログラム１１２は、処理をステップＳ３６に進める。

ステップＳ３６では、リソース制御プログラム１１２は、一定時間経過したか否かを判定し、一定時間経過したと判定した場合（ステップＳ３６：ＹＥＳ）には、処理をステップＳ３１に進める。

一方、自物理サーバ内に空きリソースが存在しないと判定した場合（ステップＳ３３：ＮＯ）には、リソース制御プログラム１１２は、自物理サーバ上のファイルシステムＶＭ１３０の負荷が低いか否かを判定する（ステップＳ３７）。例えば、リソース制御プログラム１１２は、ファイルシステムＶＭ１３０のメモリ使用量が所定の閾値以下であり、且つＣＰＵ使用率が所定の閾値以下である場合に、ファイルシステムＶＭ１３０の負荷が低いと判定してもよい。

この結果、自物理サーバ上のファイルシステムＶＭ１３０の負荷が低いと判定した場合（ステップＳ３７：ＹＥＳ）には、リソース制御プログラム１１２は、ファイルシステムＶＭ１３０に割り当てられた一部のリソースを解放（Ｓｃａｌｅ－ｄｏｗｎ）し（ステップＳ３８）、解放されたリソースを割り当てた新しいプロトコルＶＭ１２０を生成し（ステップＳ３９）、生成したプロトコルＶＭ１２０を、ストレージシステム２における分散ファイルシステムのクラスタに組み込むことにより、分散ファイルシステムをＳｃａｌｅ－ｏｕｔする（ステップＳ４０）。これにより、プロトコルＶＭ１２０により実行される処理の効率を向上することができる。次いで、リソース制御プログラム１１２は、処理をステップＳ３６に進める。処理をステップＳ３６に進める。

一方、自物理サーバ上のファイルシステムＶＭ１３０の負荷が低いと判定しなかった場合（ステップＳ３７：ＮＯ）には、リソース制御プログラム１１２は、自物理サーバの性能上限に達していることを示すアラートを通知し（例えば、管理計算機２０に通知し）（ステップＳ４１）、処理をステップＳ３６に進める。

ステップＳ４２では、ソース制御プログラム１１２は、自物理サーバ上のファイルシステムＶＭ１３０の負荷が高いか否か、すなわち、ファイルシステムＶＭ１３０の負荷が所定の負荷以上であるか否かを判定する。例えば、リソース制御プログラム１１２は、ファイルシステムＶＭ１３０のメモリ使用量が所定の閾値を超える場合、又は、ＣＰＵ使用率が所定の閾値を超える場合に、ファイルシステムＶＭ１３０の負荷が高いと判定してもよい。

この結果、ファイルシステムＶＭ１３０の負荷が高いと判定した場合（ステップＳ４２：ＹＥＳ）、リソース制御プログラム１１２は、処理をステップＳ４３に進める一方、ファイルシステムＶＭ１３０の負荷が高くないと判定した場合（ステップＳ４２：ＮＯ）には、処理をステップＳ３６に進める。

ステップＳ４３では、リソース制御プログラム１１２は、自物理サーバ内に空きリソースが存在するか否かを判定する。ここで、空きリソースがあるか否かは、例えば、物理サーバ管理テーブル１６３の自物理サーバに対応するエントリにおける割り当てＣＰＵ数及び割り当てメモリサイズと、自物理サーバに存在する全てのＶＭにおける割り当てＣＰＵ数及び割り当てメモリサイズとに差があるか否かにより特定することができる。

この結果、自物理サーバ内に空きリソースが存在すると判定した場合（ステップＳ４３：ＹＥＳ）には、リソース制御プログラム１１２は、自物理サーバの空きリソースをファイルシステムＶＭ１３０に割り当てることにより、分散ファイルシステムをＳｃａｌｅ－ｕｐする（ステップＳ４４）。これにより、ファイルシステムＶＭ１３０により実行される処理の効率を向上することができる。次いで、リソース制御プログラム１１２は、処理をステップＳ３６に進める。

一方、自物理サーバ内に空きリソースが存在しないと判定した場合（ステップＳ４３：ＮＯ）には、リソース制御プログラム１１２は、自物理サーバ上のプロトコルＶＭ１２０の負荷が低いか否かを判定する（ステップＳ４５）。例えば、リソース制御プログラム１１２は、プロトコルＶＭ１２０のメモリ使用量が所定の閾値以下であり、ＣＰＵ使用率が所定の閾値以下であり、且つ接続ユーザ数（ＣＩＦＳ接続数＋ＮＦＳ接続数）の合計が所定の閾値以下である場合に、プロトコルＶＭ１２０の負荷が低いと判定してもよい。

この結果、自物理サーバ上のプロトコルＶＭ１２０の負荷が低いと判定した場合（ステップＳ４５：ＹＥＳ）には、リソース制御プログラム１１２は、自物理サーバ内のプロトコルＶＭ１２０間で負荷を調整し、いずれか少なくとも１つのプロトコルＶＭ１２０の負荷を０にし（ステップＳ４６）、負荷を０にしたプロトコルＶＭ１２０を分散ファイルシステムのクラスタから除外（Ｓｃａｌｅ－ｏｕｔ）する（ステップＳ４７）。次いで、リソース制御プログラム１１２は、クラスタから除外されたプロトコルＶＭ１２０をハイパバイザ１１０の管理するＶＭから削除する（ステップＳ４８）。これにより、プロトコルＶＭ１３０に割り当てられていたリソースが解放されることとなる。次いで、リソース制御プログラム１１２は、ファイルシステムＶＭ１３０に解放されたリソースを割り当てることにより、分散ファイルシステムをＳｃａｌｅ－ｕｐする（ステップＳ４９）。これにより、ファイルシステムＶＭ１３０により実行される処理の効率を向上することができる。次いで、リソース制御プログラム１１２は、処理をステップＳ３６に進める。

一方、自物理サーバ上のプロトコルＶＭ１２０の負荷が低いと判定しなかった場合（ステップＳ４５：ＮＯ）には、リソース制御プログラム１１２は、自物理サーバの性能上限に達していることを示すアラートを通知し（例えば、管理計算機２０に通知し）（ステップＳ５０）、処理をステップＳ３６に進める。

なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。

例えば、上記実施形態では、ファイルシステムＶＭ１３０の増減に伴うファイルを管理するための各種データの転送による負荷を発生させないために、ファイルシステムＶＭ１３０の数を調整する制御を行わないようにしていたが、本発明はこれに限られず、ファイルシステムＶＭ１３０の数を調整することにより、物理サーバ１００におけるファイルシステムＶＭ１３０に対して割り当てるリソースの量を調整するようにしてもよい。

また、上記実施形態において、ＣＰＵ１５２について個数を単位としてリソースの割り当てをしていたが、本発明はこれに限られず、例えば、ＣＰＵ１５２のＣＰＵコアを単位としてリソース割り当てをしてもよく、ＣＰＵ１５２又はＣＰＵコアの処理時間を単位としてリソース割り当てをしてもよい。

また、上記実施形態において、ＣＰＵが行っていた処理の一部又は全部を、ハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア（例えば可搬型の記憶メディア）であってもよい。

１…計算機システム、２…ストレージシステム、１０…クライアント、２０…管理計算機、３０…フロントエンドネットワーク、４０…管理ネットワーク、５０…ノード間ネットワーク、１００，１００Ａ，１００Ｂ，１００Ｃ…物理サーバ、１１０…ハイパバイザ、１２０…プロトコルＶＭ、１３０…ファイルシステムＶＭ、１４０…ブロックストレージＶＭ、１５１…通信Ｉ／Ｆ、１５２…ＣＰＵ、１５３…入力装置、１５４…記憶デバイス、１５５…メモリ、１５６…表示装置

Claims

１以上の物理サーバを備えるストレージシステムであって、
前記物理サーバには、前記物理サーバのリソースが割り当てられる、クライアントとのネットワークを介してのファイルストレージのプロトコルに関する処理を実行する１以上の第１仮想計算機と、前記ファイルストレージにおけるファイルの管理に関する処理を実行する１以上の第２仮想計算機と、が形成され、
前記物理サーバは、
前記第１仮想計算機と前記第２仮想計算機との負荷に関する負荷情報を取得し、
前記負荷情報に基づいて、前記第１仮想計算機と前記第２仮想計算機とに対する前記物理サーバのリソースの割り当てを制御する
ストレージシステム。
前記物理サーバは、
前記負荷情報に基づいて、前記第１仮想計算機又は前記第２仮想計算機に対して割り当てる前記物理サーバのリソースの割り当て量を制御する
請求項１に記載のストレージシステム。
前記物理サーバは、
前記負荷情報に基づいて、前記第１仮想計算機又は前記第２仮想計算機の少なくとも一方の数を制御することにより、前記物理サーバのリソースの割り当てを制御する
請求項１に記載のストレージシステム。
前記物理サーバは、
前記第１仮想計算機の負荷が所定の負荷以上であり、前記物理サーバに空きリソースが存在する場合に、新たな第１仮想計算機を生成する
請求項３に記載のストレージシステム。
前記物理サーバは、
前記第１仮想計算機の負荷が所定の負荷以上であり、前記物理サーバに空きリソースが存在しない場合に、負荷が所定負荷よりも低い第２仮想計算機に割り当てられたリソースの一部を解放し、前記解放したリソースを用いて新たな第１仮想計算機を生成する
請求項４に記載のストレージシステム。
前記物理サーバは、
前記第２仮想計算機の負荷が所定の負荷以上であり、前記物理サーバに空きリソースが存在する場合に、前記第２仮想計算機に、前記物理サーバの空きリソースを追加して割り当てる
請求項２に記載のストレージシステム。
前記物理サーバには、複数の前記第１仮想計算機が生成されており、
前記物理サーバは、
前記第２仮想計算機の負荷が所定の負荷以上であり、前記物理サーバに空きリソースが存在しない場合に、複数の前記第１仮想計算機の一部の第１仮想計算機を削除し、削除した第１仮想計算機に割り当てられていたリソースを前記第２仮想計算機に割り当てる
請求項６に記載のストレージシステム。
前記ストレージシステムは、
複数の物理サーバを備え、
少なくとも一つの物理サーバは、
接続されているクライアントの数が所定数以下の物理サーバに対して、他の物理サーバに接続されているクライアントの一部を移管する処理を行う
請求項１に記載のストレージシステム。
１以上の物理サーバを備えるストレージシステムによるリソース制御方法であって、
前記物理サーバには、前記物理サーバのリソースが割り当てられる、クライアントとのネットワークを介してのファイルストレージのプロトコルに関する処理を実行する１以上の第１仮想計算機と、前記ファイルストレージにおけるファイルの管理に関する処理を実行する１以上の第２仮想計算機と、が形成され、
前記物理サーバは、
前記第１仮想計算機と前記第２仮想計算機との負荷に関する負荷情報を取得し、
前記負荷情報に基づいて、前記第１仮想計算機と前記第２仮想計算機に対する前記物理サーバのリソースの割り当てを制御する
リソース制御方法。
ストレージシステムを構成する物理サーバに実行させるリソース制御プログラムであって、
前記物理サーバには、前記物理サーバのリソースが割り当てられる、クライアントとのネットワークを介してのファイルストレージのプロトコルに関する処理を実行する１以上の第１仮想計算機と、前記ファイルストレージにおけるファイルの管理に関する処理を実行する１以上の第２仮想計算機と、が形成され、
前記物理サーバに、
前記第１仮想計算機と前記第２仮想計算機との負荷に関する負荷情報を取得させ、
前記負荷情報に基づいて、前記第１仮想計算機と前記第２仮想計算機に対する前記物理サーバのリソースの割り当てを制御させる
リソース制御プログラム。