JP7468651B2

JP7468651B2 - サーバ群選択システム、サーバ群選択方法、および、プログラム

Info

Publication number: JP7468651B2
Application number: JP2022532198A
Authority: JP
Inventors: 勝美藤田; 雅志金子
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2020-06-26
Filing date: 2020-06-26
Publication date: 2024-04-16
Anticipated expiration: 2040-06-26
Also published as: WO2021260908A1; US20230281089A1; JPWO2021260908A1

Description

本発明は、サーバ群選択システム、サーバ群選択方法、および、プログラムに関する。

汎用サーバ上の仮想化基盤を用いたサービス提供における性能・可用性の保証を両立させる対策が必要である。検討の一つとして、物理サーバ上の仮想マシン（VM:Virtual Machine）やコンテナの配置制御技術が提案されている。
性能を目的関数とした最適配置技術例として、特許文献１がある。特許文献１には、複数機能で構成されるブラックボックスＮＦＶアプリに対する最適配置推定技術が記載されている。

更に可用性を目的関数とした最適配置技術例として、非特許文献１がある。非特許文献１には、冗長構成システム及び方法が記載されている。

国際公開第２００９／０８１７３６号

A. Zhou et al.,"Cloud Service Reliability Enhancement via Virtual Machine Placement Optimization", in IEEE Transactions on Services Computing, vol. 10, no. 6, pp. 902-913, 1 Nov.-Dec. 2017.

これら特許文献１や非特許文献１では、物理サーバの故障のリスクが考慮されていないという問題がある。配置問題を考える際、配置先の物理サーバは、位置情報（設置場所／ネットワーク・トポロジー）とリソースの空き状況以外の特性が一様とする暗黙の前提条件が存在していた。しかし実際には、配置先の物理サーバは、例えば稼働時間や温度などの様々な要因により故障のリスクが異なると考えられる。よって、これらの要因を無視して仮想マシンやコンテナの配置先を選択すると、故障のリスクが高い物理サーバを選択してしまうおそれがあった。

そこで、本発明は、物理サーバの故障の要因に基づき、配置先のサーバ群を決定することを課題とする。

前記した課題を解決するため、請求項１に記載の発明では、複数の物理サーバを、各前記物理サーバから収集した当該物理サーバの稼働時間、ストレージの書き込み回数、当該物理サーバ内の温度センサが示す温度、ＭＴＢＦ（平均故障間隔）、故障率曲線のうち何れかまたはこれらを含む組み合わせに基づいて複数のクラスタに分類する分類部と、前記分類部が分類した複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択し、更に前記仮想マシンまたは前記コンテナの初期デプロイの場合、稼動時間がより少なく、ストレージ書き込み回数がより少なく、温度センサが示す温度がより低く、ＭＴＢＦがより長く、故障率曲線がより低いことの何れかにより故障の蓋然性がより低いクラスタに分類された物理サーバを優先的に配置先とする選択部と、を備えることを特徴とするサーバ群選択システムとした。

本発明によれば、物理サーバの故障の要因に基づき、配置先のサーバ群を決定することが可能となる。

本実施形態に係るシステムの構成図である。仮想マシンやコンテナを搭載可能なサーバをクラスタリングしたグラフである。仮想マシンやコンテナを搭載可能なサーバをクラスタリングし、更にサーバ配置場所でフィルタリングしたグラフである。仮想マシンやコンテナを搭載可能なサーバを抽出して位置情報をマッピングしたサーバグラフである。仮想マシンやコンテナを搭載可能なサーバで構成されたクラスタから初期デプロイの候補を選択するグラフである。仮想マシンやコンテナを搭載可能なサーバで構成されたクラスタから冗長化の候補を選択するグラフである。仮想マシンやコンテナを搭載可能なサーバで構成されたクラスタからスケールアウトの候補を選択するグラフである。仮想マシン／コンテナ搭載サーバ選択方法を示すフローチャート（その１）である。仮想マシン／コンテナ搭載サーバ選択方法を示すフローチャート（その２）である。仮想マシン／コンテナ搭載サーバ選択方法を示すフローチャート（その３）である。

以降、本発明を実施するための形態を、各図を参照して詳細に説明する。
図１は、本実施形態に係るシステムの構成図である。
図１に示すように、システムＳは、監視・解析機能部１と、推定・制御部２とを含んで構成される。システムＳは、既存の仮想マシン／コンテナの最適配置技術を適用する準備として、拠点３ａ～３ｃに設置されたサーバの個体差を考慮し、故障要因と関連するパラメータで分類したクラスタの中からデプロイ先のサーバ候補群を決定するものである。なお図面では、仮想マシンのことを“ＶＭ”と省略して記載している場合がある。

監視・解析機能部１は、拠点３ａ～３ｃとは別のサーバ上で動作し、推定・制御部２は、拠点３ａ～３ｃ内のサーバ上に複数存在するコントローラごとに存在する。

監視・解析機能部１は、データ収集部１１と、データストア１２と、データ解析部１３とを含んで構成される。監視・解析機能部１は、データ収集部１１によって拠点３ａ～３ｃに設置されたサーバを監視してデータを収集すると共に、データ解析部１３によって各サーバから収集した情報を解析するものである。

データ収集部１１によって拠点３ａ～３ｃに設置されたサーバから収集したデータは、データストア１２に格納される。データ解析部１３によって解析されたデータは、後記する推定・制御部２に出力される。

推定・制御部２は、分類部２１と、配置先選択部２２と、配置制御部２３とを含んで構成される。推定・制御部２は、仮想マシンまたはコンテナを何れかのサーバに配置するものであり、監視・解析機能部１から入力された各サーバの情報の解析結果を入力として、配置先のサーバを選択して、仮想マシンまたはコンテナを選択したサーバに配置する。

分類部２１は、拠点３ａ～３ｃに設置された物理サーバの個体差を考慮し、物理サーバの故障要因と関連するパラメータでクラスタに分類する。つまり分類部２１は、複数の物理サーバを、各物理サーバから収集したパラメータに基づいて複数のクラスタに分類する。分類部２１には、データ解析部１３によって各サーバから収集した情報が入力され、これら情報で分類されたサーバ群であるクラスタが配置先選択部２２に出力される。

配置先選択部２２は、新たに配置する仮想マシンまたはコンテナが１台目（初期デプロイ）か、２台目（ＳＢＹまたはスケールアウト）、３台目以降（スケールアウト）の何れかによって、これを配置するサーバ群であるクラスタを選択する。配置先選択部２２にはクラスタと、新たに配置する仮想マシンまたはコンテナの種別とが入力され、これを配置するサーバ群であるクラスタが出力される。
配置先選択部２２は、分類部２１が分類した複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択する。

配置制御部２３は、仮想マシンまたはコンテナをサーバ群（クラスタ）のうち何れかに配置するものである。配置制御部２３には、仮想マシンまたはコンテナを配置するサーバ群（クラスタ）が入力され、仮想マシンまたはコンテナを配置するサーバに対しての配置コマンドが出力される。

なお、監視・解析機能部１と推定・制御部２を搭載する物理サーバの場所は問わない。また、これら２つの部位がセットである必要はない。
本実施形態の物理サーバ群選択方法は、分類部２１と配置先選択部２２のためのものであり、配置制御部２３は、既存の最適配置技術の手法が適用される。また、これら分類部２１と配置先選択部２２は、不図示のコンピュータのＣＰＵ（Central Processing Unit）がプログラムを実行することによって具現化される。

《物理サーバ群選択方法》
分類部２１は、各サーバの特性を示すパラメータを用いて、これらサーバを分類する。分類部２１は、ｋ－ｍｅａｎｓ法などの非階層クラスタリング手法や重心法などの階層クラスタリング手法により、サーバをクラスタに分類する。

《配置先サーバ群（クラスタ）決定方法》
配置検討の対象となる仮想マシンまたはコンテナが１台目（初期デプロイ）か、２台目（例：ＳＢＹ用）、３台目以上（例：スケールアウト）の場合でクラスタ決定方法は異なる。２台目以降の配置ではリスク分散を考慮し、すでに搭載されている同種の仮想マシンまたはコンテナが所属するクラスタと異なる特性を持つクラスタを選択する。

《サーバの特性分類のパラメータ》
分類部２１は、ＯＳ（Operating System）から取得可能な情報や、サーバ設置時に取得可能な初期情報や、過去の運用データに基づく統計情報のうち何れかまたはこれらの組み合わせに基づいて、サーバをクラスタに分類する。これにより分類部２１は、機械的に取得可能な情報のみで、物理サーバをクラスタに分類し、クラスタを構成するサーバ群の故障の蓋然性を評価できる。

ＯＳから取得可能な情報とは、サーバが搭載可能な仮想マシン台数、サーバの稼働時間、ストレージの書き込み回数、サーバ内の温度センサが示す温度などである。
サーバ設置時に取得可能な初期情報とは、サーバが配置されているデータセンタの拠点、ラック番号、ラック棚番号、サーバのメーカ、製造時期、製造ロット番号などである。
過去の運用データに基づく統計情報とは、ＭＴＢＦ（平均故障間隔）や、故障率曲線などである。

図２は、仮想マシンやコンテナを搭載可能なサーバをクラスタリングしたグラフである。
図２は、３軸の立体グラフであり、ディスク書き込み回数の軸と、稼働時間の軸と、温度の軸とを含んで構成される。これにより各サーバは、これらのパラメータが比較的小さいクラスタと、中程度のクラスタと、比較的大きいクラスタの３つに大別される。データ収集部１１は、各サーバのディスク書き込み回数と稼働時間と温度のデータを収集し、収集したデータをデータストア１２へ保存する。

なお、この３軸に限られず、選択されたサーバのハードウエア情報や配置場所（拠点またはラック）、で分類されてもよい。また、ディスク書き込み回数は多いが、稼働時間は中程度で、温度が低いなどのように、各パラメータに偏りがあるクラスタであってもよい。

同一のクラスタに属するサーバ群は、ディスク書き込み回数と稼働時間と温度のパラメータが近似している。よって、サーバ群は、同様な傾向で故障が発生すると推定される。これらサーバ群は、同一の要因で同時期に故障が発生する可能性もある。よって、サービスの可用性を高めるため、現用系と予備系の仮想マシンまたはコンテナは、異なるクラスタに属するサーバに配置するとよい。更にスケールアウト用の複数の仮想マシンまたはコンテナは、できる限り異なるクラスタに属するサーバに配置するとよい。

図３は、仮想マシンやコンテナを搭載可能なサーバをクラスタリングし、更にサーバ配置場所でフィルタリングしたグラフである。
破線で示す丸印は、サーバ配置場所によってフィルタリングした結果、配置場所の候補から外れたサーバである。

図４は、仮想マシンやコンテナを搭載可能なサーバを抽出して位置情報をマッピングしたサーバグラフである。
このサーバグラフは、拠点３ａ～３ｃが矩形で示されている。拠点３ａは、複数のサーバ３１と、これらサーバ３１をスター接続するハブ３２を含んでいる。そして各ハブ３２はそれぞれ相互に接続されている。他の拠点３ｂ，３ｃも同様に接続されている。
拠点３ａ～３ｃは、ハブ３３を介してスター接続されている。これにより拠点３ａ～３ｃは、ネットワークを構成する。
同一の拠点のサーバ間の経路は短いため、サーバに配置された複数の仮想マシンまたはコンテナ間の通信時間は短くなる。よって、スケールアウト用の複数の仮想マシンまたはコンテナは、同一の拠点のサーバに配置すると好適である。

図５は、仮想マシンやコンテナを搭載可能なサーバで構成されたクラスタから初期デプロイの候補を選択するグラフである。
クラスタ４１は、ディスク書き込み回数と稼働時間と温度のパラメータが比較的小さい。クラスタ４２は、ディスク書き込み回数と稼働時間と温度のパラメータが中程度である。クラスタ４３は、ディスク書き込み回数と稼働時間と温度のパラメータが比較的大きい。ここでは、クラスタ４１を仮想マシンまたはコンテナの配置先のサーバ群として選択することで、他のクラスタを選択した場合よりも、仮想マシンまたはコンテナの故障頻度を減らすことができる。

図６は、仮想マシンやコンテナを搭載可能なサーバで構成されたクラスタから冗長化の候補を選択するグラフである。
クラスタ４１のうち太線で示したサーバは、現用系（ＡＣＴ）の仮想マシンまたはコンテナがデプロイされている。このとき、現用系（ＡＣＴ）の仮想マシンまたはコンテナを搭載するサーバを含むクラスタ４１とは異なるクラスタ４２，４３のうち何れかを予備系（ＳＢＹ）の仮想マシンまたはコンテナのデプロイ先として選択するとよい。これにより、同一要因によって現用系（ＡＣＴ）と予備系（ＳＢＹ）とが同時に故障する可能性を減らすことができる。

なお、ここでは冗長化に伴う予備系（ＳＢＹ）の候補を選択することについて説明したが、スケールアウトに伴う２台目の仮想マシンまたはコンテナのデプロイ先の候補も、同様に選択するとようい。

図７は、仮想マシンやコンテナを搭載可能なサーバで構成されたクラスタからスケールアウトの候補を選択するグラフである。
太線で示したサーバは、同種のスケールアウトの仮想マシンまたはコンテナがデプロイされている。このとき、同種の仮想マシンまたはコンテナを搭載するサーバを含むクラスタ４１，４２とは異なるクラスタ４３を新たなスケールアウトの仮想マシンまたはコンテナのデプロイ先として選択するとよい。

図８Ａから図８Ｃは、仮想マシン／コンテナ搭載サーバ選択方法を示すフローチャートである。
ステップＳ１０～Ｓ１５は、全てのデータセンタ内のサーバについての繰り返し処理である。

ステップＳ１１において、データ解析部１３は、このサーバの各属性を、配列ｍの新たな要素に代入する。ここで属性、拠点の識別情報と、ラック番号と、ラック内におけるサーバの番号と、サーバの空きリソース量と稼働時間とディスク（ストレージ）書き込み回数と温度である。サーバの空きリソース量は、具体的には仮想マシンまたはコンテナの搭載可能台数である。温度とは、サーバ内の温度センサが示す温度である。

ステップＳ１２において、データ解析部１３は、このサーバの空きリソース量が０を超えているか否かを判定する。ステップＳ１２において、データ解析部１３は、このサーバの空きリソース量が０ならば（Ｎｏ）、ステップＳ１５に進む。
データ解析部１３は、空きリソース量が０を超えているならば（Ｙｅｓ）、このサーバの属性を配列ｍ＊の新たな要素に追加し（Ｓ１３）、この新しい配列ｍ＊の要素数Ｍ＊に１を加算する（Ｓ１４）。データ解析部１３は、空きリソース量が０ならば、ステップＳ１５に進む。

ステップＳ１５において、データ解析部１３は、データセンタ内のサーバについて未処理のものがあれば、ステップＳ１０に戻り、全てのサーバを処理していたならば、ステップＳ１６に進む。

ステップＳ１６～Ｓ１８は、配列ｍ＊で示されるサーバについての繰り返し処理である。ここで、配列ｍ＊で示されるサーバとは、仮想マシンまたはコンテナを１台以上搭載可能な空きリソースを有するサーバである。

ステップＳ１７において、分類部２１は、このサーバをｋ－ｍｅａｎｓ法などのクラスタリング手法により、サーバのディスク書き込み回数と稼働時間と温度に応じてクラスタ番号ｘ７が１からＮｃまでのうち何れかのクラスタに分類する。Ｎｃとは、クラスタの個数である。なお、分類部２１は、ＯＳから取得可能な情報、サーバ設置時に取得可能な初期情報、および、過去の運用データに基づく統計情報のうち何れかに基づいて、クラスタに分類してもよい。

ステップＳ１８において、分類部２１は、配列ｍ＊で示されるサーバについて未処理のものがあれば、ステップＳ１６に戻り、全ての配列ｍ＊のサーバを処理していたならば、図８ＢのステップＳ１９に進む。

図８ＢのステップＳ１９において、分類部２１は、配置場所を考慮するか否かを判定する。分類部２１は、配置場所を考慮するならば（Ｙｅｓ）、Ｍ＊台のサーバを拠点毎に分ける（Ｓ２０）。そして分類部２１は、配列ｍ＊のうち、空きリソースあり台数が最大となる拠点に属するサーバを新しい配列ｍ＊＊に代入する（Ｓ２１）。なお、サーバの物理的距離を考慮する配置制御技術を適用する場合は、事前にサーバグラフ上の距離でフィルタリングするとよい。

分類部２１は、空きリソースありサーバ台数が最大となる拠点の前記台数を新たにＭ＊＊とすると（Ｓ２２）、ステップＳ２５の処理に進む。

図８ＢのステップＳ１９において、分類部２１は、配置場所を考慮しないならば（Ｎｏ）、全ての配列ｍ＊を新しい配列ｍ＊＊に代入し（Ｓ２３）、空きリソースありサーバ台数Ｍ＊を新たにＭ＊＊とすると（Ｓ２４）、ステップＳ２５の処理に進む。
つまり、分類部２１は、各物理サーバの設置場所に基づいて、この物理サーバをフィルタリングしたものをクラスタに分類する。

ステップＳ２５～Ｓ３３は、全てのクラスタの繰り返し処理である。クラスタ候補が複数存在する場合、故障の蓋然性が低い順、例えばサーバのディスク書き込み回数が低い順、稼働時間が短い順、温度が低い順にサーバ群を候補とする。

ステップＳ２６において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナが初期デプロイであるか否かを判定する。配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナが初期デプロイであったならば（Ｙｅｓ）、このクラスタｎのサーバの空きリソース量の合計値Ｃを計算する（Ｓ２９）。

そして、ステップＳ３０において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナ数が、サーバの空きリソース量の合計値Ｃ以下であるか否かを判定する。
ステップＳ３０において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナの数が、サーバの空きリソース量の合計値Ｃ以下ならば（Ｙｅｓ）、図８ＣのステップＳ３８に進む。そして、ステップＳ３８において、配置先選択部２２は、このクラスタｎを配備先として採用し、配置制御部２３へ配列ｍ＊＊と要素数Ｍ＊＊を伝達すると、図８Ｃの処理を終了する。

つまり、配置先選択部２２は、仮想マシンまたはコンテナの初期デプロイの場合、故障の蓋然性がより低いクラスタを優先的に配置先としている。

ステップＳ３０において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナの数が、サーバの空きリソース量の合計値Ｃを超えていたならば（Ｎｏ）、ステップＳ３３に進む。

ステップＳ２６において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナが初期デプロイでなかったならば（Ｎｏ）、ステップＳ２７に進み、２台目であるか否かを判定する。

ステップＳ２７において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナが２台目ならば（Ｙｅｓ）、このクラスタｎ内に初期デプロイした同種の仮想マシンまたはコンテナが有るか否かを判定する（Ｓ２８）。なお図８Ｂでは、ステップＳ２８を「クラスタｎ内に初期デプロイＶＭ有」と省略して記載している。ステップＳ２８の判定がＹｅｓの場合は、前述した冗長化や、スケールアウトによる２台目の配備に該当する。

配置先選択部２２は、このクラスタｎ内に初期デプロイした同種の仮想マシンまたはコンテナが無いならば（Ｎｏ）、ステップＳ２９に進み、このクラスタｎの空きリソース量が許すならば、このクラスタｎを配備対象とする。

ステップＳ２８において、配置先選択部２２は、このクラスタｎ内に初期デプロイした同種の仮想マシンまたはコンテナが有るならば（Ｙｅｓ）、ステップＳ３３に進み、このクラスタｎを配備対象としない。

つまり配置先選択部２２は、仮想マシンまたはコンテナの冗長化の場合、現用系の仮想マシンまたはコンテナが配置されておらず、かつ故障の蓋然性がより低いクラスタを優先的に配置先とする。よって、配置先選択部２２は、現用系と予備系の両方が同時に停止する可能性を低くすることができる。

配置先選択部２２は、仮想マシンまたはコンテナのスケールアウトの２台目の場合、１台目のマシンまたはコンテナが配置されておらず、かつ故障の蓋然性がより低いクラスタを優先的に配置先とする。よって、配置先選択部２２は、同種の２台の仮想マシンまたはコンテナが同時に停止する可能性を低くすることができる。

ステップＳ２７において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナが２台目でないならば（Ｎｏ）、このクラスタｎ内に存在する同種の仮想マシンまたはコンテナの数Ｎｎをカウントする（Ｓ３１）。この場合は、前述したスケールアウトのうち３台目以降に該当する。配置先選択部２２は、同種の仮想マシンまたはコンテナの数Ｎｎが０でないならば（Ｎｏ）、ステップＳ３３に進み、このクラスタｎを配備対象としない。

配置先選択部２２は、同種の仮想マシンまたはコンテナの数Ｎｎが０ならば（Ｙｅｓ）、ステップＳ２９に進み、このクラスタｎがデプロイに必要リソースを確保できるサーバ群ならば、配備対象とする。

つまり配置先選択部２２は、仮想マシンまたはコンテナのスケーリングの場合、同種の仮想マシンまたはコンテナが配置されておらず、かつ故障の蓋然性がより低いクラスタを優先的に配置先とする。よって配置先選択部２２は、スケーリングしたサービスが同時に停止する可能性を低くすることができる。

ステップＳ３３において、配置先選択部２２は、クラスタについて未処理のものがあれば、ステップＳ２５に戻り、全てのクラスタを処理していたならば、ステップＳ３４に進む。

ステップＳ３４～Ｓ３７は、全てのクラスタの繰り返し処理である。
配置先選択部２２は、このクラスタｎのサーバの空きリソース量の合計値Ｃを計算する（Ｓ３５）。

ステップＳ３６において、配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナ数が、サーバの空きリソース量の合計値Ｃ以下であるか否かを判定する。配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナの数が、サーバの空きリソース量の合計値Ｃ以下ならば（Ｙｅｓ）、ステップＳ３８に進み、このクラスタｎを配備先として採用して、配置制御部２３へ配列ｍ＊＊と要素数Ｍ＊＊を伝達すると、図８Ｃの処理を終了する。

配置先選択部２２は、新たに配備したい仮想マシンまたはコンテナの数が、サーバの空きリソース量の合計値Ｃを超えているならば、ステップＳ３７に進み、このクラスタｎを配備対象としない。

ステップＳ３７において、配置先選択部２２は、クラスタについて未処理のものがあれば、ステップＳ３４に戻り、全てのクラスタを処理していたならば、図８Ｃの処理を終了する。

《本実施形態の効果》
本システムは、仮想マシンまたはコンテナの冗長構成をとる際、同時に故障が発生する確率が低いサーバを選択する。これにより、システムの可用性を向上させる。
本システムは、物理サーバへの負荷を分散させている。これにより、故障が同時発生する確率を下げることができる。
更に、搭載先の物理サーバ候補数を減らすことで、最適配置のための計算量を削減することができる。

《本発明とその効果》
（１）複数の物理サーバを、各前記物理サーバから収集したパラメータに基づいて複数のクラスタに分類する分類部と、前記分類部が分類した複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択する選択部と、を備えることを特徴とするサーバ群選択システムとした。

このようにすることで、物理サーバの故障の要因に基づき、配置先のサーバ群を決定することができる。

（２）前記分類部が各前記物理サーバを分類する際に用いるパラメータには、ＯＳから取得可能な情報、サーバ設置時に取得可能な初期情報、および、過去の運用データに基づく統計情報のうち何れかが含まれる、ことを特徴とする請求項１に記載のサーバ群選択システムとした。

このようにすることで、機械的に取得可能な情報によって物理サーバをクラスタに分類できる。

（３）前記選択部は、前記仮想マシンまたは前記コンテナの初期デプロイの場合、故障の蓋然性がより低いクラスタを優先的に配置先とする、ことを特徴とする請求項１または２に記載のサーバ群選択システムとした。

このようにすることで、故障の蓋然性の低いサーバ群を優先的に配置先とすることができる。

（４）前記選択部は、前記仮想マシンまたは前記コンテナの冗長化の場合、現用系の前記仮想マシンまたは前記コンテナが配置されておらず、かつ故障の蓋然性がより低いクラスタを優先的に配置先とする、ことを特徴とする請求項１または２に記載のサーバ群選択システムとした。

このようにすることで、故障の蓋然性の低いサーバ群を優先的に配置先とすることができ、かつ現用系と予備系とを出来るだけ異なるクラスタに配置できる。よって、現用系と予備系の両方が同時に停止する可能性を低くすることができる。

（５）前記選択部は、前記仮想マシンまたは前記コンテナのスケーリングの場合、同種の前記仮想マシンまたは前記コンテナが配置されておらず、かつ故障の蓋然性がより低いクラスタを優先的に配置先とする、ことを特徴とする請求項１または２に記載のサーバ群選択システムとした。

このようにすることで、故障の蓋然性の低いサーバ群を優先的に配置先とすることができ、かつ同種の仮想マシンまたはコンテナを出来るだけ異なるクラスタに配置できる。よってスケーリングしたサービスが同時に停止する可能性を低くすることができる。

（６）前記分類部は、各前記物理サーバの設置場所に基づいて、当該物理サーバをフィルタリングしたものをクラスタに分類する、ことを特徴とする請求項１に記載のサーバ群選択システムとした。

このようにすることで、配置先のサーバ群を近距離に設置されたものに絞りこめるので、システムの応答時間を短縮できる。

（７）複数の物理サーバを、各前記物理サーバから収集したパラメータに基づいて複数のクラスタに分類するステップと、前記複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択するステップと、を実行することを特徴とするサーバ群選択方法とした。

（８）コンピュータに、複数の物理サーバを、各前記物理サーバから収集したパラメータに基づいて複数のクラスタに分類する工程、前記複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択する工程、を実行させるためのプログラムとした。

《変形例》
本発明は、上記実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で、変更実施が可能であり、例えば、次の（ａ）～（ｃ）のようなものがある。

（ａ）分類部２１がサーバをクラスタに分類する方法は、ｋ－ｍｅａｎｓ法に限定されず、これ以外の非階層クラスタリング手法や重心法などの階層クラスタリング手法であってもよい。
（ｂ）サーバをクラスタに分類するためのパラメータは、サーバの稼働時間、ストレージの書き込み回数、サーバ内の温度センサが示す温度に限定されない。サーバが搭載可能な仮想マシン台数、サーバが配置されているデータセンタの拠点、ラック番号、ラック棚番号、サーバのメーカ、製造時期、製造ロット番号、これらサーバのＭＴＢＦ（平均故障間隔）や故障率曲線などであってもよい。
（ｃ）サーバをクラスタに分類するためのパラメータは、ＯＳから取得可能な情報、サーバ設置時に取得可能な初期情報、および、過去の運用データに基づく統計情報のうち何れかが含まれていればよい。

Ｓシステム（サーバ群選択システム）
１監視・解析機能部
１１データ収集部
１２データストア
１３データ解析部
２推定・制御部
２１分類部
２２配置先選択部（選択部）
２３配置制御部
３ａ拠点
３ｂ拠点
３ｃ拠点
３１サーバ
３２，３３ハブ
４１～４３クラスタ

Claims

複数の物理サーバを、各前記物理サーバから収集した当該物理サーバの稼働時間、ストレージの書き込み回数、当該物理サーバ内の温度センサが示す温度、ＭＴＢＦ（平均故障間隔）、故障率曲線のうち何れかまたはこれらを含む組み合わせに基づいて複数のクラスタに分類する分類部と、
前記分類部が分類した複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択し、更に前記仮想マシンまたは前記コンテナの初期デプロイの場合、稼動時間がより少なく、ストレージ書き込み回数がより少なく、温度センサが示す温度がより低く、ＭＴＢＦがより長く、故障率曲線がより低いことの何れかにより故障の蓋然性がより低いクラスタに分類された物理サーバを優先的に配置先とする選択部と、
を備えることを特徴とするサーバ群選択システム。
複数の物理サーバを、各前記物理サーバから収集した当該物理サーバの稼働時間、ストレージの書き込み回数、当該物理サーバ内の温度センサが示す温度、ＭＴＢＦ（平均故障間隔）、故障率曲線のうち何れかまたはこれらを含む組み合わせに基づいて複数のクラスタに分類する分類部と、
前記分類部が分類した複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択し、更に前記仮想マシンまたは前記コンテナの冗長化の場合、現用系の前記仮想マシンまたは前記コンテナが配置されておらず、かつ、稼動時間がより少なく、ストレージ書き込み回数がより少なく、温度センサが示す温度がより低く、ＭＴＢＦがより長く、故障率曲線がより低いことの何れかにより故障の蓋然性がより低いクラスタに分類された物理サーバを優先的に配置先とする選択部と、
を備えることを特徴とするサーバ群選択システム。
複数の物理サーバを、各前記物理サーバから収集した当該物理サーバの稼働時間、ストレージの書き込み回数、当該物理サーバ内の温度センサが示す温度、ＭＴＢＦ（平均故障間隔）、故障率曲線のうち何れかまたはこれらを含む組み合わせに基づいて複数のクラスタに分類する分類部と、
前記分類部が分類した複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択し、更に前記仮想マシンまたは前記コンテナのスケーリングの場合、同種の前記仮想マシンまたは前記コンテナが配置されておらず、かつ稼動時間がより少なく、ストレージ書き込み回数がより少なく、温度センサが示す温度がより低く、ＭＴＢＦがより長く、故障率曲線がより低いことの何れかにより故障の蓋然性がより低いクラスタに分類された物理サーバを優先的に配置先とする選択部と、
を備えることを特徴とするサーバ群選択システム。
前記分類部が各前記物理サーバを分類する際に用いるパラメータには、ＯＳから取得可能な情報である前記物理サーバが搭載可能な仮想マシン台数、および、サーバ設置時に取得可能な初期情報である前記物理サーバが配置されているデータセンタの拠点、ラック番号、ラック棚番号、前記物理サーバのメーカ、製造時期、製造ロット番号のうち何れかが更に含まれる、
ことを特徴とする請求項１から３のうち何れか１項に記載のサーバ群選択システム。
前記分類部は、各前記物理サーバの設置場所に基づいて、当該物理サーバをフィルタリングしたものをクラスタに分類する、
ことを特徴とする請求項１から３のうち何れか１項に記載のサーバ群選択システム。
複数の物理サーバを、各前記物理サーバから収集した当該物理サーバの稼働時間、ストレージの書き込み回数、当該物理サーバ内の温度センサが示す温度、ＭＴＢＦ（平均故障間隔）、故障率曲線のうち何れかまたはこれらを含む組み合わせに基づいて複数のクラスタに分類するステップと、
前記複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択するステップと、
前記仮想マシンまたは前記コンテナの初期デプロイの場合、稼動時間がより少なく、ストレージ書き込み回数がより少なく、温度センサが示す温度がより低く、ＭＴＢＦがより長く、故障率曲線がより低いことの何れかにより故障の蓋然性がより低いクラスタに分類された物理サーバを優先的に配置先とするステップと、
を実行することを特徴とするサーバ群選択方法。
コンピュータに、
複数の物理サーバを、各前記物理サーバから収集した当該物理サーバの稼働時間、ストレージの書き込み回数、当該物理サーバ内の温度センサが示す温度、ＭＴＢＦ（平均故障間隔）、故障率曲線のうち何れかまたはこれらを含む組み合わせに基づいて複数のクラスタに分類する工程、
前記複数のクラスタのうち、増設対象の仮想マシンまたはコンテナの配置に必要なリソースを確保できるクラスタの何れかを配置先として選択する工程、
前記仮想マシンまたは前記コンテナの初期デプロイの場合、稼動時間がより少なく、ストレージ書き込み回数がより少なく、温度センサが示す温度がより低く、ＭＴＢＦがより長く、故障率曲線がより低いことの何れかにより故障の蓋然性がより低いクラスタに分類された物理サーバを優先的に配置先とする工程、
を実行させるためのプログラム。