JP2020181292A - 演算処理装置およびスケーリング条件計算方法 - Google Patents
演算処理装置およびスケーリング条件計算方法 Download PDFInfo
- Publication number
- JP2020181292A JP2020181292A JP2019082672A JP2019082672A JP2020181292A JP 2020181292 A JP2020181292 A JP 2020181292A JP 2019082672 A JP2019082672 A JP 2019082672A JP 2019082672 A JP2019082672 A JP 2019082672A JP 2020181292 A JP2020181292 A JP 2020181292A
- Authority
- JP
- Japan
- Prior art keywords
- load
- resource
- optimum
- value
- range
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】リソースの無駄な起動を抑制するとともに、高負荷状態を回避する。【解決手段】スケーリング条件計算部16が、統計値として、リソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算し、これら最大負荷Qmaxおよび平均負荷Qavgと最適負荷範囲Eの上限を示す最適範囲上限値Emaxとの差分A,Bに基づいて、スケーリング条件として、リソースの追加要否を判定するためのスケールアウトしきい値Soutを計算する。【選択図】 図1
Description
本発明は、負荷状況に応じてリソースの追加や削減を自動的に行うオートスケーリング技術に関する。
クラウドシステムにおいて、負荷状況に応じて仮想マシンやコンテナなどのリソースを自動的に追加・削減する、いわゆるオートスケーリングが行われている(例えば、特許文献1など参照)。仮想マシン上でコンテナを稼働させるシステムにおいて、オートスケーリングを行う際、リソースの追加・削減を判断するオートスケーリング条件のしきい値を一定にしていると、無駄なリソースを起動する可能性がある。反対に、新しいリソースの起動が遅れ、高負荷状態が長く続く可能性が高くなる。従来、その解決方法として、負荷の変動幅からしきい値を調整する技術が提案されている(例えば、特許文献2など参照)。
しかしながら、このような従来技術では、負荷の変動幅だけを考慮してしきい値を調整しているため、低負荷状態において負荷が大きく変動すると無駄なリソースが起動される可能性が高くなるという問題点がある。また、変動幅を検出する範囲が限定的であるため、高負荷状態から大きく低負荷状態に変わった後、低負荷状態のままであっても、スケーリング条件に合致してしまい、無駄なリソースが起動される可能性が高くなるという問題点もある。
本発明はこのような課題を解決するためのものであり、リソースの無駄な起動を抑制できるとともに、高負荷状態を回避できるスケーリング技術を提供することを目的としている。
このような目的を達成するために、本発明にかかる演算処理装置は、クラウドシステムにおける負荷状況を示すリソース負荷を取得するよう構成された情報取得部と、予め設定された前記クラウドシステムにおける最適な負荷状況を示す最適負荷範囲と、前記リソース負荷の平均値を示す平均負荷とに基づいて、前記クラウドシステムにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算するよう構成されたスケーリング条件計算部とを備えている。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の平均負荷と前記リソース負荷の最大値を示す最大負荷とを計算し、これら平均負荷および最大負荷と前記最適負荷範囲の上限を示す最適範囲上限値との差分に基づいて、スケーリング条件として、前記リソースの追加要否を判定するためのスケールアウトしきい値を計算するようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の平均負荷と前記リソース負荷の最小値を示す最小負荷とを計算し、これら平均負荷および最小負荷と前記最適負荷範囲の下限を示す最適範囲下限値との差分に基づいて、スケーリング条件として、前記リソースの削減要否を判定するためのスケールインしきい値を計算するようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の最大値を示す最大負荷が前記最適負荷範囲内であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記リソースの追加要否を判定するためのスケールアウトしきい値の更新を行わないようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の最大値を示す最大負荷が前記最適負荷範囲外であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記最大負荷と前記最適負荷範囲の上限を示す最適範囲上限値との差分に基づいて、前記リソースの追加要否を判定するためのスケールアウトしきい値の基準値を計算し、前記平均負荷と前記最適範囲上限値との差分に基づいて前記基準値を補正することにより、前記スケールアウトしきい値を計算するようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の最小値を示す最小負荷が前記最適負荷範囲内であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記リソースの削減要否を判定するためのスケールインしきい値の更新を行わないようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の最小値を示す最小負荷が前記最適負荷範囲外であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記最小負荷と前記最適負荷範囲の下限を示す最適範囲下限値との差分に基づいて、前記リソースの削減要否を判定するためのスケールインしきい値の基準値を計算し、前記平均負荷と前記最適範囲下限値との差分に基づいて前記基準値を補正することにより、前記スケールインしきい値を計算するようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の変化率が予め設定されている変化率設定値を超えて、かつ、前記リソース負荷が予め設定されている負荷判定値を超えた場合、前記リソースの追加要否を判定するためのスケールアウトしきい値を、予め設定されている臨時しきい値まで低下させるようにしたものである。
また、本発明にかかる上記演算処理装置の一構成例は、前記スケーリング条件計算部が、前記リソース負荷の変化をグラフ表示する際、前記リソースの追加要否を判定するためのスケールアウトしきい値、前記リソースの削減要否を判定するためのスケールインしきい値、前記最適負荷範囲の上限を示す最適範囲上限値、前記最適負荷範囲の下限を示す最適範囲下限値の、少なくともいずれか1つまたは複数を、前記リソース負荷の変化と合わせてグラフ表示するようにしたものである。
また、本発明にかかるスケーリング条件計算方法は、計算機システムが、クラウドシステムにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算する際に用いられるスケーリング条件計算方法であって、前記計算機システムが、前記クラウドシステムにおける負荷状況を示すリソース負荷を取得する情報取得ステップと、前記計算機システムが、予め設定された前記クラウドシステムにおける最適な負荷状況を示す最適負荷範囲と、前記リソース負荷の平均値を示す平均負荷とに基づいて、前記クラウドシステムにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算するスケーリング条件計算ステップとを備えている。
本発明によれば、クラウドシステムにおけるリソース負荷が、高負荷状態で変動している場合に限らず、低負荷状態や中負荷状態で変動している場合や、限られた期間においてのみ変動幅が大きい場合にも、無駄なリソースの起動を抑制できるとともに、高負荷状態を回避することが可能となる。
次に、本発明の実施の形態について図面を参照して説明する。
[第1の実施の形態]
まず、図1を参照して、本発明の第1の実施の形態にかかる演算処理装置10について説明する。図1は、第1の実施の形態にかかる演算処理装置の構成を示すブロック図である。
[第1の実施の形態]
まず、図1を参照して、本発明の第1の実施の形態にかかる演算処理装置10について説明する。図1は、第1の実施の形態にかかる演算処理装置の構成を示すブロック図である。
この演算処理装置10は、スケーリングシステムSSにおいて、オートスケーリングでのリソースの追加・削減を判断する際に用いるオートスケーリング条件を、クラウドシステムCSの負荷状況に応じて計算し、スケーリングシステムSSへ提供する装置である。
スケーリングシステムSSは、演算処理装置10で計算されたオートスケーリング条件に基づいて、クラウドシステムCS上に存在する仮想マシンやコンテナなどのリソースを、自動的に追加・削減する、いわゆるオートスケーリングを行うシステムである。スケーリングシステムSSについては、例えば、引用文献1−2などに記載された公知の計算機システムからなる。
本実施の形態では、演算処理装置10がスケーリングシステムSSとは別個の装置として通信網NWに接続されている場合を例として説明するが、これに限定されるものではなく、演算処理装置10をスケーリングシステムSSの1つの計算機として実装してもよい。また、演算処理装置10は、スケーリングシステムSSごとに別個に設けてもよいが、1つの演算処理装置10で複数の異なるスケーリングシステムSSのオートスケーリング条件を計算するように構成してもよい。
また、図1には、仮想マシンが複数のコンテナから構成され、これら複数の仮想マシンによりクラスターが構成されるパターンが例として記載されているが、クラウドシステムCSの構成については、これに限定されるものではない。例えば、仮想マシンを想定せず、複数のコンテナによりクラスターが構成されるパターンなど、他のパターンについても、以下と同様に本発明を適用でき、同様の作用効果を得ることができる。
[演算処理装置]
次に、図1を参照して、本実施の形態にかかる演算処理装置10の構成について詳細に説明する。
図1に示すように、演算処理装置10は、全体としてサーバー装置などの情報処理装置からなり、主な構成として、通信I/F回路11、操作入力装置12、表示装置13、記憶装置14、情報取得部15、スケーリング条件計算部16、およびスケーリング条件設定部17を備えている。これら構成は、内部バスBを介してデータやり取り可能に接続されている。これら構成のうち、情報取得部15、スケーリング条件計算部16、およびスケーリング条件設定部17は、CPUなどのマイクロプロセッサMPと記憶装置14のプログラム(図示せず)とが協働することにより処理部として構成されている。
次に、図1を参照して、本実施の形態にかかる演算処理装置10の構成について詳細に説明する。
図1に示すように、演算処理装置10は、全体としてサーバー装置などの情報処理装置からなり、主な構成として、通信I/F回路11、操作入力装置12、表示装置13、記憶装置14、情報取得部15、スケーリング条件計算部16、およびスケーリング条件設定部17を備えている。これら構成は、内部バスBを介してデータやり取り可能に接続されている。これら構成のうち、情報取得部15、スケーリング条件計算部16、およびスケーリング条件設定部17は、CPUなどのマイクロプロセッサMPと記憶装置14のプログラム(図示せず)とが協働することにより処理部として構成されている。
通信I/F回路11は、通信網NWを介してスケーリングシステムSSとデータ通信を行うことにより、クラウドシステムCSの負荷状況やスケーリングシステムSSの動作状況、さらには演算処理装置10で計算したスケーリング条件を、スケーリングシステムSSとの間でやり取りする機能を有している。なお、負荷状況については、通信I/F回路11が、通信網NWを介してクラウドシステムCSから直接取得してもよい。
操作入力装置12は、キーボード、マウス、タッチパネルなどの操作入力装置からなり、オペレータの操作を検出してマイクロプロセッサMPへ出力する機能を有している。
表示装置13は、LCDなどの画面表示装置からなり、マイクロプロセッサMPから出力された、メニュー画面、設定画面、計算結果画面などの各種画面を画面表示する機能を有している。
表示装置13は、LCDなどの画面表示装置からなり、マイクロプロセッサMPから出力された、メニュー画面、設定画面、計算結果画面などの各種画面を画面表示する機能を有している。
記憶装置14は、ハードディスクや半導体メモリなどの記憶装置からなり、マイクロプロセッサMPで実行するスケーリング条件計算処理に用いる各種の処理データやプログラムを記憶する機能を有している。プログラムは、演算処理装置10に接続された外部装置や記録媒体(ともに図示せず)から、予め読み込まれて記憶装置14に保存される。
図2は、主な処理データを示す説明図である。記憶装置14では、図2に示すような、処理データを記憶している。これら処理データのうち、負荷上限値Lmaxおよび負荷下限値Lminは、リソース負荷Qの上限値および下限値を示している。また、最適範囲上限値Emaxおよび最適範囲下限値Eminは、リソース負荷Qの最適負荷範囲Eの上限値および下限値を示している。これら負荷上限値Lmax、負荷下限値Lmin、最適範囲上限値Emax、および最適範囲下限値Eminは、クラウドシステムCSのリソース規模や運用形態に応じて予め設定される。
また、処理データのうち、スケールアウトしきい値Soutは、クラウドシステムCSにおけるリソース追加(スケールアウト)の要否を判定するためのしきい値であり、スケールインしきい値Sinは、クラウドシステムCSにおけるリソース削減(スケールイン)の要否を判定するためのしきい値である。これらスケールアウトしきい値Soutおよびスケールインしきい値Sinは、スケーリングシステムSSのオートスケーリングで用いるスケーリング条件である。これらスケールアウトしきい値Soutおよびスケールインしきい値Sinは、クラウドシステムCSのリソース規模や運用形態に応じて予め初期値が設定され、スケーリングシステムSSのオートスケーリング開始に応じて、演算処理装置10で計算した新たな値が、通信網NWを介してスケーリングシステムSSへ提供される。
情報取得部15は、通信I/F回路11を介してクラウドシステムCSで稼働しているリソース全体の負荷状況を示すリソース負荷Qや、スケーリングアウトやスケーリングの開始・終了を示すスケーリング情報、スケーリングシステムSSまたはクラウドシステムCSから取得し、記憶装置14に時系列データとして保存する機能を有している。
スケーリング条件計算部16は、予め設定されたクラウドシステムCSにおける最適な負荷状況を示す最適負荷範囲Eと、リソース負荷Qから計算したリソース負荷Qの平均値を示す平均負荷Qavgとに基づいて、クラウドシステムCSにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算する機能を有している。
具体的には、スケーリング条件計算部16は、リソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgを計算し、これら最大負荷Qmaxおよび平均負荷Qavgと最適負荷範囲Eの上限を示す最適範囲上限値Emaxとの差分A,Bに基づいて、スケーリング条件として、リソースの追加要否を判定するためのスケールアウトしきい値Soutを計算する機能を有している。
また、スケーリング条件計算部16は、リソース負荷Qの最小値を示す最小負荷Qminおよびリソース負荷Qの平均値を示す平均負荷Qavgを計算し、これら最小負荷Qminおよび平均負荷Qavgと最適負荷範囲Eの下限を示す最適範囲下限値Eminとの差分A,Bに基づいて、スケーリング条件として、リソースの削減要否を判定するためのスケールインしきい値Sinを計算する機能を有している。
スケーリング条件設定部17は、スケーリング条件計算部16で計算されたスケールアウトしきい値Soutおよびスケールインしきい値Sinを、新たなスケーリング条件として、通信I/F回路11から通信網NWを介してスケーリングシステムSSに設定する機能を有している。
[第1の実施の形態の動作]
次に、図3を参照して、本実施の形態にかかる演算処理装置10のスケーリング条件計算動作について説明する。図3は、第1の実施の形態にかかるスケーリング条件計算処理を示すフローチャートである。
次に、図3を参照して、本実施の形態にかかる演算処理装置10のスケーリング条件計算動作について説明する。図3は、第1の実施の形態にかかるスケーリング条件計算処理を示すフローチャートである。
演算処理装置10のマイクロプロセッサMPは、予め設定された一定間隔、あるいは、操作入力装置12やオペレータ端末(図示せず)からの指示、さらには、スケーリングシステムSSや要求など、スケーリング条件の更新タイミングの到来に応じて、図3のスケーリング条件計算処理を実行する。なお、スケーリング条件計算処理の実行開始に際し、記憶装置14には、図2に示したような処理データが予め設定されているとともに、情報取得部15で取得した最新のリソース負荷Qが保存されているものとする。
まず、スケーリング条件計算部16は、記憶装置14から計算対象となる対象期間におけるリソース負荷Qの時系列データを取得し(ステップS100)、これらリソース負荷Qの時系列データから計算した平均負荷Qavgさらには最大負荷Qmaxと、記憶装置14に設定されている最適範囲上限値Emaxおよび負荷上限値Lmaxとに基づいて、クラウドシステムCSにおけるリソースの追加要否判定に用いるスケーリング条件、すなわちスケールアウトしきい値Soutに関するしきい値調整幅ΔSoutを計算する(ステップS101)。
続いて、スケーリング条件計算部16は、得られたしきい値調整幅ΔSoutに基づいて、記憶装置14に保存されているスケールアウトしきい値Soutを増減し、得られた新たなスケールアウトしきい値Soutを記憶装置14に保存(更新)する(ステップS102)。なお、しきい値調整幅ΔSoutを含むスケールアウトしきい値Soutの計算に関する詳細については、後述する。
また、スケーリング条件計算部16は、リソース負荷Qの時系列データから計算した平均負荷Qavgさらには最小負荷Qminと、記憶装置14に設定されている最適範囲下限値Eminおよび負荷下限値Lminとに基づいて、クラウドシステムCSにおけるリソースの削減要否判定に用いるスケーリング条件、すなわちスケールインしきい値Sinに関するしきい値調整幅ΔSinを計算する(ステップS103)。
続いて、スケーリング条件計算部16は、得られたしきい値調整幅ΔSinに基づいて、記憶装置14に保存されているスケールインしきい値Sinを増減し、得られた新たなスケールインしきい値Sinを記憶装置14に保存(更新)する(ステップS104)。なお、しきい値調整幅ΔSinを含むスケールインしきい値Sinの計算に関する詳細については、後述する。
この後、スケーリング条件設定部17は、スケーリング条件計算部16で計算されたスケールアウトしきい値Soutおよびスケールインしきい値Sin、すなわち新たなスケーリング条件を記憶装置14から取得し、通信I/F回路11から通信網NWを介してスケーリングシステムSSに設定し(ステップS105)、一連のスケーリング条件計算処理を終了する。
[スケーリング条件の計算過程]
次に、図4を参照して、本実施の形態にかかるスケーリング条件の計算過程について詳細に説明する。図4は、第1の実施の形態にかかるスケーリング条件の計算過程を示す説明図である。図4には、リソース負荷Qの時間的変化がグラフ表示されており、横軸が時間を示し、縦軸がリソース負荷Q[%]を示している。
次に、図4を参照して、本実施の形態にかかるスケーリング条件の計算過程について詳細に説明する。図4は、第1の実施の形態にかかるスケーリング条件の計算過程を示す説明図である。図4には、リソース負荷Qの時間的変化がグラフ表示されており、横軸が時間を示し、縦軸がリソース負荷Q[%]を示している。
まず、スケールアウトしきい値Soutの計算過程について説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけ遡及した遡及期間、例えば、直前のスケールアウト処理の開始から終了までの期間を用いた場合を例として説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけ遡及した遡及期間、例えば、直前のスケールアウト処理の開始から終了までの期間を用いた場合を例として説明する。
続いて、スケーリング条件計算部16は、これら最大負荷Qmaxおよび平均負荷Qavgと最適範囲上限値Emaxとの差分を示す、差分A=Emax−Qmaxと差分B=Emax−Qavgを計算するとともに、負荷上限値Lmaxと最適範囲上限値Emaxとの差分を示す、差分C=Emax−Lmaxを計算する。
次に、スケーリング条件計算部16は、これら差分A,B,Cに基づいて、差分A,Bに関する重みWa=|A/C|と重みWb=|B/C|を計算する。なお、Y=|X|はYがXの絶対値であることを示している。
続いて、スケーリング条件計算部16は、次の式(1)に示すように、これら差分A,Bを重みWa,Wbで補正して得られた値を平均化することにより、スケールアウトしきい値Sout(t)に関するしきい値調整幅ΔSoutを計算する。
続いて、スケーリング条件計算部16は、次の式(1)に示すように、これら差分A,Bを重みWa,Wbで補正して得られた値を平均化することにより、スケールアウトしきい値Sout(t)に関するしきい値調整幅ΔSoutを計算する。
この後、スケーリング条件計算部16は、記憶装置14に保存されている前回(t−1)計算したスケールアウトしきい値Sout(t−1)を、式(1)で得られたしきい値調整幅ΔSoutで増減することにより、新たなスケールアウトしきい値Sout(t)=Sout(t−1)+ΔSoutを計算する。
例えば、最大負荷がQmax=86[%]で平均負荷がQavg=83[%]の場合、図2の処理データの設定例に基づけば、差分A=80−86=−6、差分B=80−83=−3、差分C=80−90=−10となり、重みWa=|−6/−10|=0.6、重みWb=|−3/−10|=0.3となる。したがって、しきい値調整幅はΔSout=(−6×0.6+−3×0.3)/2≒−2.25となり、新たなスケールアウトしきい値は、Sout(t)=75−2.25=72.75[%]となる。
次に、スケールインしきい値Sinの計算過程について説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最小値を示す最小負荷Qminおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけの遡及した遡及期間、例えば、直前のスケールイン処理の開始から終了までの期間を用いればよい。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最小値を示す最小負荷Qminおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけの遡及した遡及期間、例えば、直前のスケールイン処理の開始から終了までの期間を用いればよい。
続いて、スケーリング条件計算部16は、これら最小負荷Qminおよび平均負荷Qavgと最適範囲下限値Eminとの差分を示す、差分A=Emin−Qminと差分B=Emin−Qavgを計算するとともに、負荷下限値Lminと最適範囲下限値Eminとの差分を示す、差分C=Emin−Lminを計算する。
次に、スケーリング条件計算部16は、差分A,B,Cに基づいて、差分A,Bに関する重みWa=|A/C|と重みWb=|B/C|を計算し、次の式(2)に示すように、これら差分A,Bを重みWa,Wbで補正して得られた値を平均化することにより、スケールインしきい値Sinに関するしきい値調整幅ΔSinを計算する。
この後、スケーリング条件計算部16は、記憶装置14に保存されている前回(t−1)計算したスケールインしきい値Sin(t−1)を、式(2)で得られたしきい値調整幅ΔSinで増減することにより、新たなスケールインしきい値Sin(t)=Sin(t−1)+ΔSinを計算する。
なお、スケールアウトしきい値Soutについては、リソース負荷Qの最大負荷Qmaxと最適範囲上限値Emaxとの比較結果に基づき、計算要否を判定してもよい。例えば、図4に示すように、リソース負荷Q(実線)の最大負荷Qmaxが最適範囲上限値Emaxより大きい場合には、スケールアウトしきい値Soutを新たに計算するようにしてもよい。
また、スケールインしきい値Sinについては、リソース負荷Qの最小負荷Qminと最適範囲下限値Eminとの比較結果に基づき、計算要否を判定してもよい。例えば、図4に示すように、リソース負荷Q(破線)の最小負荷Qminが最適範囲下限値Eminより小さい場合には、スケールインしきい値Sinを新たに計算するようにしてもよい。
また、スケールインしきい値Sinについては、リソース負荷Qの最小負荷Qminと最適範囲下限値Eminとの比較結果に基づき、計算要否を判定してもよい。例えば、図4に示すように、リソース負荷Q(破線)の最小負荷Qminが最適範囲下限値Eminより小さい場合には、スケールインしきい値Sinを新たに計算するようにしてもよい。
[第1の実施の形態の効果]
一般に、オートスケーリングのスケーリング条件となるしきい値の設定は、スケールアウトしきい値が低く設定されると無駄なリソースが起動される可能性が高くなる。また、スケールアウトしきい値が高く設定されると予期しない高負荷状態となり、処理の遅延を招くことになる。同様に、スケールインしきい値が適切でないと、高負荷や無駄な起動の原因となる。
一般に、オートスケーリングのスケーリング条件となるしきい値の設定は、スケールアウトしきい値が低く設定されると無駄なリソースが起動される可能性が高くなる。また、スケールアウトしきい値が高く設定されると予期しない高負荷状態となり、処理の遅延を招くことになる。同様に、スケールインしきい値が適切でないと、高負荷や無駄な起動の原因となる。
前述した従来技術(特許文献2)では、リソースの最大負荷と最小負荷の変動幅によって、スケーリング条件を調整している。したがって、高負荷状態で変動している場合だけでなく、低程度から中程度の負荷状態で変動している場合にも、スケーリング条件が調整されるため、無駄な仮想マシンやコンテナが起動する可能性がある。
また、通常、リソースが高負荷状態である時間は短く、多くの時間は低程度から中程度の負荷状態である。また、低程度から中程度の負荷状態である場合も、変動幅は大きいが、処理時間のほとんどで最適な負荷状態になっていることから、実際には大きな条件調整は必要ない。
また、通常、リソースが高負荷状態である時間は短く、多くの時間は低程度から中程度の負荷状態である。また、低程度から中程度の負荷状態である場合も、変動幅は大きいが、処理時間のほとんどで最適な負荷状態になっていることから、実際には大きな条件調整は必要ない。
本発明は、このようなオートスケーリングにおける負荷変動とスケーリング条件の調整との関係に着目し、リソース負荷の平均負荷を考慮することによって、負荷状態をある指定された最適な範囲に収まるように、オートスケーリングのしきい値を自動調整するという方法に想到した。これにより、クラウドシステムCSにおけるリソース負荷Qが、低負荷状態や中負荷状態で変動している場合には、大きな調整は行わない、あるいは、調整をしないような処理を行うことで、無駄な仮想マシンやコンテナの起動の可能性を低減し、かつ、高負荷状態を回避しやすくなる。
本実施の形態は、情報取得部15が、クラウドシステムCSにおける負荷状況を示すリソース負荷Qを取得し、スケーリング条件計算部16が、予め設定されたクラウドシステムCSにおける最適な負荷状況を示す最適負荷範囲Eと、リソース負荷Qから計算した統計値とに基づいて、クラウドシステムCSにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算するようにしたものである。
具体的には、スケーリング条件計算部16が、統計値として、リソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算し、これら最大負荷Qmaxおよび平均負荷Qavgと最適負荷範囲Eの上限を示す最適範囲上限値Emaxとの差分A,Bに基づいて、スケーリング条件として、リソースの追加要否を判定するためのスケールアウトしきい値Soutを計算するようにしたものである。
また、スケーリング条件計算部16が、統計値として、リソース負荷Qの最小値を示す最小負荷Qminおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算し、これら最小負荷Qminおよび平均負荷Qavgと最適負荷範囲Eの下限を示す最適範囲下限値Eminとの差分A,Bに基づいて、スケーリング条件として、リソースの削減要否を判定するためのスケールインしきい値Sinを計算するようにしたものである。
これにより、クラウドシステムCSにおけるリソース負荷Qが、高負荷状態で変動している場合に限らず、低負荷状態や中負荷状態で変動している場合や、限られた期間においてのみ変動幅が大きい場合にも、無駄なリソースの起動を抑制できるとともに、高負荷状態を回避することが可能となる。
[第2の実施の形態]
次に、本発明の第2の実施の形態にかかる演算処理装置10について説明する。
最大負荷Qmaxや最小負荷Qminと平均負荷Qavgがともに、最適負荷範囲Eに入っている場合や、平均負荷Qavgが最適負荷範囲Eに入っている場合、差分A,Bを前述と同様の重みWa,Wbで補正してしきい値調整幅ΔSout,ΔSinを計算すると、不必要な調整を行う可能性がある。
次に、本発明の第2の実施の形態にかかる演算処理装置10について説明する。
最大負荷Qmaxや最小負荷Qminと平均負荷Qavgがともに、最適負荷範囲Eに入っている場合や、平均負荷Qavgが最適負荷範囲Eに入っている場合、差分A,Bを前述と同様の重みWa,Wbで補正してしきい値調整幅ΔSout,ΔSinを計算すると、不必要な調整を行う可能性がある。
本実施の形態では、最大負荷Qmaxや最小負荷Qminと平均負荷Qavgがともに、最適負荷範囲Eに入っている場合は、スケーリング条件を調整しないようにしたものである。また、最大負荷Qmaxや最小負荷Qminが最適負荷範囲Eに入っておらず、平均負荷Qavgが最適負荷範囲Eに入っている場合は、最大負荷Qmaxや最小負荷Qminからベースとなる調整幅を計算し、平均負荷Qavgが最適負荷範囲Eに入っている度合いから計算した重みで補正するようにしたものである。
すなわち、本実施の形態において、スケーリング条件計算部16は、最大負荷Qmaxが最適負荷範囲E内であって、かつ、平均負荷Qavgが最適負荷範囲E内である場合、リソースの追加要否を判定するためのスケールアウトしきい値Soutの更新を行わない機能と、最大負荷Qmaxが最適負荷範囲E外であって、かつ、平均負荷Qavgが最適負荷範囲E内である場合、最大負荷Qmaxと最適範囲上限値Emaxとの差分Aに基づいて、スケールアウトしきい値Soutの基準値を計算し、平均負荷Qavgと最適範囲上限値Emaxとの差分Bに基づいて基準値を補正することにより、スケールアウトしきい値Soutのしきい値調整幅ΔSoutを計算する機能とを有している。
また、スケーリング条件計算部16は、最小負荷Qminが最適負荷範囲E内であって、かつ、平均負荷Qavgが最適負荷範囲E内である場合、スケールインしきい値Sinの更新を行わない機能と、最小負荷Qminが最適負荷範囲E外であって、かつ、平均負荷Qavgが最適負荷範囲E内である場合、最小負荷Qminと最適範囲下限値Eminとの差分Aに基づいてスケールインしきい値Sinの基準値を計算し、平均負荷Qavgと最適範囲下限値Eminとの差分Bに基づいて基準値を補正することにより、スケールインしきい値Sinのしきい値調整幅ΔSinを計算する機能とを備えている。
[第2の実施の形態の動作]
次に、図5を参照して、本実施の形態にかかる演算処理装置10のスケーリング条件計算動作について説明する。図5は、第2の実施の形態にかかるスケーリング条件計算処理を示すフローチャートである。
次に、図5を参照して、本実施の形態にかかる演算処理装置10のスケーリング条件計算動作について説明する。図5は、第2の実施の形態にかかるスケーリング条件計算処理を示すフローチャートである。
演算処理装置10のマイクロプロセッサMPは、予め設定された一定間隔、あるいは、操作入力装置12やオペレータ端末(図示せず)からの指示、さらには、スケーリングシステムSSや要求など、スケーリング条件の更新タイミングの到来に応じて、図3のスケーリング条件計算処理を実行する。なお、スケーリング条件計算処理の実行開始に際し、記憶装置14には、図2に示したような処理データが予め設定されているとともに、情報取得部15で取得した最新のリソース負荷Qが保存されているものとする。
まず、スケーリング条件計算部16は、記憶装置14から計算対象となる対象期間におけるリソース負荷Qの時系列データを取得し(ステップS200)、これらリソース負荷Qの時系列データから計算した平均負荷Qavgと記憶装置14に設定されている最適範囲上限値Emaxとを比較する(ステップS201)。
平均負荷Qavgが最適範囲上限値Emaxより大きく、平均負荷Qavgが最適負荷範囲E外である場合(ステップS201:YES)、スケーリング条件計算部16は、図4と同様に、平均負荷Qavgさらには最大負荷Qmaxと、最適範囲上限値Emaxおよび負荷上限値Lmaxとに基づいて、スケールアウトしきい値Soutに関するしきい値調整幅ΔSoutを計算し(ステップS202)、このしきい値調整幅ΔSoutに基づいて、記憶装置14に保存されているスケールアウトしきい値Soutを増減し、得られた新たなスケールアウトしきい値Soutを記憶装置14に保存(更新)し(ステップS203)、後述するステップS211へ移行する。
一方、平均負荷Qavgが最適範囲上限値Emax以下で、平均負荷Qavgが最適負荷範囲E内である場合(ステップS201:NO)、スケーリング条件計算部16は、リソース負荷Qの時系列データから計算した最大負荷Qmaxと記憶装置14に設定されている最適範囲上限値Emaxとを比較する(ステップS204)。
最大負荷Qmaxが最適範囲上限値Emaxより大きく、最大負荷Qmaxが最適負荷範囲E外である場合(ステップS204:YES)、スケーリング条件計算部16は、最大負荷Qmaxと最適範囲上限値Emaxとの差分Aに基づいて、スケールアウトしきい値Soutの基準値を計算し、平均負荷Qavgと最適範囲上限値Emaxとの差分Bに基づいて基準値を補正することにより、しきい値調整幅ΔS’outを計算し(ステップS205)、このしきい値調整幅ΔS’outに基づいて、記憶装置14に保存されているスケールアウトしきい値Soutを増減し、得られた新たなスケールアウトしきい値Soutを記憶装置14に保存(更新)し(ステップS206)、後述するステップS211へ移行する。
一方、最大負荷Qmaxが最適範囲上限値Emax以下で、最大負荷Qmaxが最適負荷範囲E内である場合(ステップS204:NO)、スケーリング条件計算部16は、スケールアウトしきい値Soutの計算(更新)を行わず、後述するステップS211へ移行する。
この後、スケーリング条件計算部16は、これらリソース負荷Qの時系列データから計算した平均負荷Qavgと記憶装置14に設定されている最適範囲下限値Eminとを比較する(ステップS211)。
平均負荷Qavgが最適範囲下限値Eminより小さく、平均負荷Qavgが最適負荷範囲E外である場合(ステップS211:YES)、スケーリング条件計算部16は、図4と同様に、平均負荷Qavgさらには最小負荷Qminと、最適範囲下限値Eminおよび負荷下限値Lminとに基づいて、スケールインしきい値Sinに関するしきい値調整幅ΔSinを計算し(ステップS212)、このしきい値調整幅ΔSinに基づいて、記憶装置14に保存されているスケールインしきい値Sinを増減し、得られた新たなスケールインしきい値Sinを記憶装置14に保存(更新)し(ステップS213)、後述するステップS217へ移行する。
一方、平均負荷Qavgが最適範囲下限値Emin以上で、平均負荷Qavgが最適負荷範囲E内である場合(ステップS211:NO)、スケーリング条件計算部16は、リソース負荷Qの時系列データから計算した最小負荷Qminと記憶装置14に設定されている最適範囲下限値Eminとを比較する(ステップS214)。
最小負荷Qminが最適範囲下限値Eminより小さく、最小負荷Qminが最適負荷範囲E外である場合(ステップS214:YES)、スケーリング条件計算部16は、最小負荷Qminと最適範囲下限値Eminとの差分Aに基づいて、スケールインしきい値Sinの基準値を計算し、平均負荷Qavgと最適範囲下限値Eminとの差分Bに基づいて基準値を補正することにより、しきい値調整幅ΔS’outを計算し(ステップS215)、このしきい値調整幅ΔS’outに基づいて、記憶装置14に保存されているスケールインしきい値Sinを増減し、得られた新たなスケールインしきい値Sinを記憶装置14に保存(更新)し(ステップS216)、後述するステップS217へ移行する。
一方、最小負荷Qminが最適範囲下限値Emin以上で、最小負荷Qminが最適負荷範囲E内である場合(ステップS214:NO)、スケーリング条件計算部16は、スケールインしきい値Sinの計算(更新)を行わず、後述するステップS217へ移行する。
この後、スケーリング条件設定部17は、スケーリング条件計算部16で計算されたスケールアウトしきい値Soutおよびスケールインしきい値Sin、すなわち新たなスケーリング条件を記憶装置14から取得し、通信I/F回路11から通信網NWを介してスケーリングシステムSSに設定し(ステップS217)、一連のスケーリング条件計算処理を終了する。
この後、スケーリング条件設定部17は、スケーリング条件計算部16で計算されたスケールアウトしきい値Soutおよびスケールインしきい値Sin、すなわち新たなスケーリング条件を記憶装置14から取得し、通信I/F回路11から通信網NWを介してスケーリングシステムSSに設定し(ステップS217)、一連のスケーリング条件計算処理を終了する。
[スケーリング条件の計算過程]
次に、図6を参照して、本実施の形態にかかるスケーリング条件の計算過程について詳細に説明する。図6は、第2の実施の形態にかかるスケーリング条件の計算過程(高負荷状態および低負荷状態の場合)を示す説明図である。図6には、最大負荷Qmaxが最適負荷範囲E外であって、かつ、平均負荷Qavgが最適負荷範囲E内である、高負荷状態および低負荷状態の場合における、リソース負荷Qの時間的変化がグラフ表示されており、横軸が時間を示し、縦軸がリソース負荷Q[%]を示している。
次に、図6を参照して、本実施の形態にかかるスケーリング条件の計算過程について詳細に説明する。図6は、第2の実施の形態にかかるスケーリング条件の計算過程(高負荷状態および低負荷状態の場合)を示す説明図である。図6には、最大負荷Qmaxが最適負荷範囲E外であって、かつ、平均負荷Qavgが最適負荷範囲E内である、高負荷状態および低負荷状態の場合における、リソース負荷Qの時間的変化がグラフ表示されており、横軸が時間を示し、縦軸がリソース負荷Q[%]を示している。
まず、スケールアウトしきい値Soutの計算過程について説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけ遡及した遡及期間、例えば、直前のスケールアウト処理の開始から終了までの期間を用いた場合を例として説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最大値を示す最大負荷Qmaxおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけ遡及した遡及期間、例えば、直前のスケールアウト処理の開始から終了までの期間を用いた場合を例として説明する。
続いて、スケーリング条件計算部16は、これら最大負荷Qmaxおよび平均負荷Qavgと最適範囲上限値Emaxとの差分を示す、差分A=Emax−Qmaxと差分B=Emax−Qavgを計算するとともに、負荷上限値Lmaxと最適範囲上限値Emaxとの差分を示す、差分C=Emax−Lmaxを計算する。
次に、スケーリング条件計算部16は、これら差分A,Cに基づいて、差分Aに関する重みWa=|A/C|を計算する。なお、Y=|X|はYがXの絶対値であることを示している。
続いて、スケーリング条件計算部16は、次の式(3)に示すように、これら差分Aを重みWaで補正して得られた基準値を差分Bで補正することにより、スケールアウトしきい値Sout(t)に関するしきい値調整幅ΔS’outを計算する。
続いて、スケーリング条件計算部16は、次の式(3)に示すように、これら差分Aを重みWaで補正して得られた基準値を差分Bで補正することにより、スケールアウトしきい値Sout(t)に関するしきい値調整幅ΔS’outを計算する。
この後、スケーリング条件計算部16は、記憶装置14に保存されている前回(t−1)計算したスケールアウトしきい値Sout(t−1)を、式(3)で得られたしきい値調整幅ΔS’outで増減することにより、新たなスケールアウトしきい値Sout(t)=Sout(t−1)+ΔS’outを計算する。
例えば、最大負荷がQmax=89[%]で平均負荷がQavg=74[%]の場合、図2の処理データの設定例に基づけば、差分A=80−89=−9、差分B=80−74=6、差分C=80−90=−10となり、重みWa=|−9/−10|=0.9となる。したがって、しきい値調整幅はΔS’out=−9×0.9/6=−1.35となり、新たなスケールアウトしきい値は、Sout(t)=75−1.35=73.65[%]となる。図4の計算過程で計算した場合、ΔSout=−2.25となるため、しきい値調整幅ΔS’outが大幅に抑制されていることがわかる。
次に、スケールインしきい値Sinの計算過程について説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最小値を示す最小負荷Qminおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけの遡及した遡及期間、例えば、直前のスケールイン処理の開始から終了までの期間を用いた場合を例として説明する。
スケーリング条件計算部16は、記憶装置14に保存されているリソース負荷Qの時系列データから、計算対象となる対象期間に含まれるリソース負荷Qの時系列データを取得し、統計値として、これらリソース負荷Qの最小値を示す最小負荷Qminおよびリソース負荷Qの平均値を示す平均負荷Qavgとを計算する。対象期間については、例えば最新のリソース負荷Qから一定時間長だけの遡及した遡及期間、例えば、直前のスケールイン処理の開始から終了までの期間を用いた場合を例として説明する。
続いて、スケーリング条件計算部16は、これら最小負荷Qminおよび平均負荷Qavgと最適範囲下限値Eminとの差分を示す、差分A=Emin−Qminと差分B=Emin−Qavgを計算するとともに、負荷下限値Lminと最適範囲下限値Eminとの差分を示す、差分C=Emin−Lminを計算する。
次に、スケーリング条件計算部16は、差分A,Cに基づいて、差分Aに関する重みWa=|A/C|を計算し、次の式(4)に示すように、これら差分A,Bを重みWaで補正して得られた基準値を差分Bで補正することにより、スケールインしきい値Sin(t)に関するしきい値調整幅ΔS’inを計算する。
この後、スケーリング条件計算部16は、記憶装置14に保存されている前回(t−1)計算したスケールインしきい値Sin(t−1)を、式(4)で得られたしきい値調整幅ΔS’inで増減することにより、新たなスケールインしきい値Sin(t)=Sin(t−1)+ΔS’inを計算する。
例えば、最小負荷がQmin=11[%]で平均負荷がQavg=29[%]の場合、図2の処理データの設定例に基づけば、差分A=25−11=14、差分B=25−29=−4、差分C=25−10=15となり、重みWa=|14/15|≒0.93となる。したがって、しきい値調整幅はΔS’in≒14×0.93/|−4|≒3.27となり、新たなスケールインしきい値は、Sin(t)≒30+3.27≒33.27[%]となる。図4の計算過程で計算した場合、ΔSin=6となるため、しきい値調整幅ΔS’inが大幅に抑制されていることがわかる。
次に、図7を参照して、本実施の形態にかかるスケーリング条件の計算過程について詳細に説明する。図7は、第2の実施の形態にかかるスケーリング条件の計算過程(変動幅が大きい場合)を示す説明図である。図7には、最大負荷Qmaxが最適負荷範囲E外であって、かつ、平均負荷Qavgが最適負荷範囲E内であり、変動幅が大きい場合における、リソース負荷Qの時間的変化がグラフ表示されており、横軸が時間を示し、縦軸がリソース負荷Q[%]を示している。
図7の場合、リソース負荷Qが最適範囲下限値Emin付近から最適範囲上限値Emaxを超える値まで一旦上昇した後、最適範囲下限値Emin手前まで下降しており、リソース負荷Qの変動幅が極めて大きい。
前述の図6で説明したスケールアウトしきい値Soutの計算過程を適用した場合、例えば、最大負荷がQmax=89[%]で平均負荷がQavg=38[%]の場合、図2の処理データの設定例に基づけば、差分A=80−89=−9、差分B=80−38=42、差分C=80−90=−10となり、重みWa=|−9/−10|=0.9となる。したがって、しきい値調整幅はΔS’out=−9×0.9/42≒−0.19となり、新たなスケールアウトしきい値は、Sout(t)=75−0.19=74.81[%]となる。図4の計算過程で計算した場合、ΔSout=84.15となるため、しきい値調整幅ΔS’outが大幅に抑制されていることがわかる。
[第2の実施の形態の効果]
このように、本実施の形態では、最大負荷Qmaxや最小負荷Qminと平均負荷Qavgがともに、最適負荷範囲Eに入っている場合は、スケーリング条件を調整しないようにしたものである。また、最大負荷Qmaxや最小負荷Qminが最適負荷範囲Eに入っておらず、平均負荷Qavgが最適負荷範囲Eに入っている場合は、最大負荷Qmaxや最小負荷Qminからベースとなる調整幅を計算し、平均負荷Qavgが最適負荷範囲Eに入っている度合いから計算した重みで補正するようにしたものである。
これにより、最大負荷Qmaxが同じ場合であっても調整幅が異なるしきい値調整を行うことができ、より効果的な調整を行うことが可能となる。
このように、本実施の形態では、最大負荷Qmaxや最小負荷Qminと平均負荷Qavgがともに、最適負荷範囲Eに入っている場合は、スケーリング条件を調整しないようにしたものである。また、最大負荷Qmaxや最小負荷Qminが最適負荷範囲Eに入っておらず、平均負荷Qavgが最適負荷範囲Eに入っている場合は、最大負荷Qmaxや最小負荷Qminからベースとなる調整幅を計算し、平均負荷Qavgが最適負荷範囲Eに入っている度合いから計算した重みで補正するようにしたものである。
これにより、最大負荷Qmaxが同じ場合であっても調整幅が異なるしきい値調整を行うことができ、より効果的な調整を行うことが可能となる。
[第3の実施の形態]
次に、本発明の第3の実施の形態にかかる演算処理装置10について説明する。
クラウドシステムCSにおいて、ある仮想マシンの負荷状況の変化が、あるタイミングでは70%を超えてもそのまま緩やかに80%程度での負荷状態になるが、別のタイミングでは70%を超えると急激に90%になる場合も考えられる。
本実施の形態では、リソース負荷Qの変化率ΔQを考慮し、変化率ΔQが大きい場合は、リソース負荷Qがスケールアウトしきい値Soutを超える前でも、スケールアウトが行われるようにしたものである。
次に、本発明の第3の実施の形態にかかる演算処理装置10について説明する。
クラウドシステムCSにおいて、ある仮想マシンの負荷状況の変化が、あるタイミングでは70%を超えてもそのまま緩やかに80%程度での負荷状態になるが、別のタイミングでは70%を超えると急激に90%になる場合も考えられる。
本実施の形態では、リソース負荷Qの変化率ΔQを考慮し、変化率ΔQが大きい場合は、リソース負荷Qがスケールアウトしきい値Soutを超える前でも、スケールアウトが行われるようにしたものである。
すなわち、本実施の形態において、スケーリング条件計算部16は、リソース負荷Qの変化率ΔQが予め設定されている変化率設定値ΔQsを超えて、かつ、リソース負荷Qが予め設定されている負荷判定値Qhを超えた場合、スケールアウトしきい値Soutを、予め設定されている臨時しきい値Stmpまで低下させる機能を有している。
[第3の実施の形態の動作]
次に、図8を参照して、本実施の形態にかかる演算処理装置10のスケーリング条件切替動作について説明する。図8は、第3の実施の形態にかかるスケーリング条件切替処理を示すフローチャートである。
次に、図8を参照して、本実施の形態にかかる演算処理装置10のスケーリング条件切替動作について説明する。図8は、第3の実施の形態にかかるスケーリング条件切替処理を示すフローチャートである。
演算処理装置10のマイクロプロセッサMPは、予め設定された一定間隔、あるいは、操作入力装置12やオペレータ端末(図示せず)からの指示、さらには、スケーリングシステムSSや要求など、スケーリング条件の更新タイミングの到来に応じて、図3のスケーリング条件計算処理を実行する。なお、スケーリング条件計算処理の実行開始に際し、記憶装置14には、図2に示したような処理データが予め設定されているとともに、情報取得部15で取得した最新のリソース負荷Qが保存されているものとする。
まず、スケーリング条件計算部16は、記憶装置14から最新のリソース負荷Qを含む時系列データを取得し(ステップS300)、これらリソース負荷Qの時系列データから、単位時間当たりの変化幅を変化率ΔQとして計算する(ステップS301)。
次に、スケーリング条件計算部16は、得られた変化率ΔQと予め記憶装置14に設定されている変化率設定値ΔQsとを比較し(ステップS302)、変化率ΔQが変化率設定値ΔQsより大きい場合(ステップS302:YES)、リソース負荷Qと予め記憶装置14に設定されている負荷判定値Qhとを比較する(ステップS303)。
リソース負荷Qが負荷判定値Qhより大きい場合(ステップS303:YES)、スケーリング条件計算部16は、スケールアウトしきい値Soutを臨時しきい値Stmpに切り替える(ステップS304)。
リソース負荷Qが負荷判定値Qhより大きい場合(ステップS303:YES)、スケーリング条件計算部16は、スケールアウトしきい値Soutを臨時しきい値Stmpに切り替える(ステップS304)。
続いて、スケーリング条件設定部17は、スケーリング条件計算部16で切り替えられた臨時しきい値Stmpを、通信I/F回路11から通信網NWを介してスケーリングシステムSSに設定する(ステップS305)。これにより、スケーリングシステムSSにおいて、直ちにスケールアウトされることになる。臨時しきい値Stmpは、スケールアウトしきい値Soutより低い値であり、変化率設定値ΔQsおよび負荷判定値Qhとともに、クラウドシステムCSのリソース負荷Qの変動に応じて経験的に決定すればよい。
この後、スケーリング条件計算部16は、情報取得部15で取得したスケーリング情報に基づいてスケールアウトの有無を確認し(ステップS306)、スケールアウトが行われたことが確認されるまで待機する(ステップS306:NO)。
スケールアウトが行われたことが確認された場合(ステップS306:YES)、ケールアウトしきい値Soutを臨時しきい値Stmpに切り替える直前の元の値に戻し(ステップS307)、一連のスケーリング条件計算処理を終了する。
スケールアウトが行われたことが確認された場合(ステップS306:YES)、ケールアウトしきい値Soutを臨時しきい値Stmpに切り替える直前の元の値に戻し(ステップS307)、一連のスケーリング条件計算処理を終了する。
一方、変化率ΔQが変化率設定値ΔQs以下である場合(ステップS302:NO)、また、リソース負荷Qが負荷判定値Qh以下である場合(ステップS303:NO)、スケーリング条件計算部16は、スケールアウトしきい値Soutの切替を行わず、一連のスケーリング条件計算処理を終了する。
[第3の実施の形態の効果]
このように、本実施の形態では、しきい値負荷状態の変化率ΔQを考慮し、変化率ΔQが大きい場合は、ケールアウトしきい値Soutを臨時しきい値Stmpに切り替えることにより、リソース負荷Qがスケールアウトしきい値Soutを超える前でも、スケールアウトが行われるようにしたものである。
このように、本実施の形態では、しきい値負荷状態の変化率ΔQを考慮し、変化率ΔQが大きい場合は、ケールアウトしきい値Soutを臨時しきい値Stmpに切り替えることにより、リソース負荷Qがスケールアウトしきい値Soutを超える前でも、スケールアウトが行われるようにしたものである。
したがって、リソース負荷Qが急増して高負荷状態になりそうな状況である場合には、リソース負荷Qがスケールアウトしきい値Soutを超える前でも、スケールアウトを強制的に行わせることができ、高負荷状態を回避することが可能となる。また、しきい値を臨時に変更した場合はスケーリング後に元の値に戻すと、無駄なリソースの起動を抑えることが可能となる。
[第4の実施の形態]
次に、図9を参照して、本発明の第4の実施の形態にかかる演算処理装置10について説明する。図9は、リソース負荷の変化を示すトレンドグラフである。
演算処理装置10では、スケーリングシステムSSやクラウドシステムCSの動作状況をオペレータが確認するため、リソース負荷Qのトレンドグラフを表示装置13で画面表示する場合がある。
本実施の形態では、図9に示すように、リソース負荷Qの変化を示すトレンドグラフに、オートスケーリングの開始終了、その時のしきい値などを重ねて表示するようにしたものである。
次に、図9を参照して、本発明の第4の実施の形態にかかる演算処理装置10について説明する。図9は、リソース負荷の変化を示すトレンドグラフである。
演算処理装置10では、スケーリングシステムSSやクラウドシステムCSの動作状況をオペレータが確認するため、リソース負荷Qのトレンドグラフを表示装置13で画面表示する場合がある。
本実施の形態では、図9に示すように、リソース負荷Qの変化を示すトレンドグラフに、オートスケーリングの開始終了、その時のしきい値などを重ねて表示するようにしたものである。
すなわち、本実施の形態において、スケーリング条件計算部16は、リソース負荷Qの変化をグラフ表示する際、リソースの追加要否を判定するためのスケールアウトしきい値Sout、リソースの追加要否を判定するためのスケールインしきい値Sin、最適負荷範囲の上限を示す最適範囲上限値Emax、最適負荷範囲Eの下限を示す最適範囲下限値Emin、スケーリングのタイミングの、少なくともいずれか1つまたは複数を、リソース負荷の変化と合わせてグラフ表示する機能を有している。
これにより、オペレータがスケーリング条件と負荷状態の関連を認識しやすくなり、スケーリング条件を手動で設定する場合の有用な情報となりうる。また、閾値の調整のオンオフや範囲の指定はユーザが指定すること、常時調整モードにすることの両方を可能にすればより利便性もよくなる。常時調整モードの場合は、しきい値調整後から1回目のスケールインやスケールアウト処理が終了したタイミングで、スケールインやスケールアウトした結果をもとに調整を行う。
本発明により、例えば、コンテナ数の変更やプログラムの変更など、システム構成が変化する時にオートスケーリング条件を手動で設定するような場合に有用である。オペレータはトレンドグラフを見て、しきい値の値を手動で入力して設定してもよく、またグラフ上でしきい値をドラッグすることにより、任意の値に変更してもよい。
[実施の形態の拡張]
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をすることができる。また、各実施形態については、矛盾しない範囲で任意に組み合わせて実施することができる。
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解しうる様々な変更をすることができる。また、各実施形態については、矛盾しない範囲で任意に組み合わせて実施することができる。
10…演算処理装置、11…通信I/F回路、12…操作入力装置、13…表示装置、14…記憶装置、15…情報取得部、16…スケーリング条件計算部、17…スケーリング条件設定部、MP…マイクロプロセッサ、B…内部バス、SS…スケーリングシステム、CS…クラウドシステム、NW…通信網。
Claims (10)
- クラウドシステムにおける負荷状況を示すリソース負荷を取得するよう構成された情報取得部と、
予め設定された前記クラウドシステムにおける最適な負荷状況を示す最適負荷範囲と、前記リソース負荷の平均値を示す平均負荷とに基づいて、前記クラウドシステムにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算するよう構成されたスケーリング条件計算部と
を備えることを特徴とする演算処理装置。 - 請求項1に記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の平均負荷と前記リソース負荷の最大値を示す最大負荷とを計算し、これら平均負荷および最大負荷と前記最適負荷範囲の上限を示す最適範囲上限値との差分に基づいて、スケーリング条件として、前記リソースの追加要否を判定するためのスケールアウトしきい値を計算することを特徴とする演算処理装置。 - 請求項1または請求項2に記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の平均負荷と前記リソース負荷の最小値を示す最小負荷とを計算し、これら平均負荷および最小負荷と前記最適負荷範囲の下限を示す最適範囲下限値との差分に基づいて、スケーリング条件として、前記リソースの削減要否を判定するためのスケールインしきい値を計算することを特徴とする演算処理装置。 - 請求項1〜請求項3のいずれかに記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の最大値を示す最大負荷が前記最適負荷範囲内であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記リソースの追加要否を判定するためのスケールアウトしきい値の更新を行わないことを特徴とする演算処理装置。 - 請求項1〜請求項4のいずれかに記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の最大値を示す最大負荷が前記最適負荷範囲外であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記最大負荷と前記最適負荷範囲の上限を示す最適範囲上限値との差分に基づいて、前記リソースの追加要否を判定するためのスケールアウトしきい値の基準値を計算し、前記平均負荷と前記最適範囲上限値との差分に基づいて前記基準値を補正することにより、前記スケールアウトしきい値を計算することを特徴とする演算処理装置。 - 請求項1〜請求項5のいずれかに記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の最小値を示す最小負荷が前記最適負荷範囲内であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記リソースの削減要否を判定するためのスケールインしきい値の更新を行わないことを特徴とする演算処理装置。 - 請求項1〜請求項6のいずれかに記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の最小値を示す最小負荷が前記最適負荷範囲外であって、かつ、前記リソース負荷の平均負荷が前記最適負荷範囲内である場合、前記最小負荷と前記最適負荷範囲の下限を示す最適範囲下限値との差分に基づいて、前記リソースの削減要否を判定するためのスケールインしきい値の基準値を計算し、前記平均負荷と前記最適範囲下限値との差分に基づいて前記基準値を補正することにより、前記スケールインしきい値を計算することを特徴とする演算処理装置。 - 請求項1〜請求項7のいずれかに記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の変化率が予め設定されている変化率設定値を超えて、かつ、前記リソース負荷が予め設定されている負荷判定値を超えた場合、前記リソースの追加要否を判定するためのスケールアウトしきい値を、予め設定されている臨時しきい値まで低下させることを特徴とする演算処理装置。 - 請求項1〜請求項8のいずれかに記載の演算処理装置において、
前記スケーリング条件計算部は、前記リソース負荷の変化をグラフ表示する際、前記リソースの追加要否を判定するためのスケールアウトしきい値、前記リソースの削減要否を判定するためのスケールインしきい値、前記最適負荷範囲の上限を示す最適範囲上限値、前記最適負荷範囲の下限を示す最適範囲下限値、スケーリングのタイミングの、少なくともいずれか1つまたは複数を、前記リソース負荷の変化と合わせてグラフ表示することを特徴とする演算処理装置。 - 計算機システムが、クラウドシステムにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算する際に用いられるスケーリング条件計算方法であって、
前記計算機システムが、前記クラウドシステムにおける負荷状況を示すリソース負荷を取得する情報取得ステップと、
前記計算機システムが、予め設定された前記クラウドシステムにおける最適な負荷状況を示す最適負荷範囲と、前記リソース負荷の平均値を示す平均負荷とに基づいて、前記クラウドシステムにおけるリソースの追加および削減を自動的に行うスケーリング条件を計算するスケーリング条件計算ステップと
を備えることを特徴とするスケーリング条件計算方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019082672A JP2020181292A (ja) | 2019-04-24 | 2019-04-24 | 演算処理装置およびスケーリング条件計算方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019082672A JP2020181292A (ja) | 2019-04-24 | 2019-04-24 | 演算処理装置およびスケーリング条件計算方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020181292A true JP2020181292A (ja) | 2020-11-05 |
Family
ID=73024022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019082672A Pending JP2020181292A (ja) | 2019-04-24 | 2019-04-24 | 演算処理装置およびスケーリング条件計算方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020181292A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7214287B1 (ja) | 2022-07-26 | 2023-01-30 | 北京穿楊科技有限公司 | リソース割り当ての決定方法、装置、計算装置及びコンピュータプログラム |
-
2019
- 2019-04-24 JP JP2019082672A patent/JP2020181292A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7214287B1 (ja) | 2022-07-26 | 2023-01-30 | 北京穿楊科技有限公司 | リソース割り当ての決定方法、装置、計算装置及びコンピュータプログラム |
JP2024016782A (ja) * | 2022-07-26 | 2024-02-07 | 北京穿楊科技有限公司 | リソース割り当ての決定方法、装置、計算装置及びコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8370846B2 (en) | Task execution device and method | |
US9741090B2 (en) | Graphics display processing device, graphics display processing method, and vehicle equipped with graphics display processing device | |
US8667186B2 (en) | IO control method and program and computer | |
JP2020181292A (ja) | 演算処理装置およびスケーリング条件計算方法 | |
CN111080544B (zh) | 基于图像的人脸畸变校正方法、装置及电子设备 | |
JP6940761B2 (ja) | 情報処理装置、仮想マシン監視プログラム、および情報処理システム | |
JP6834118B2 (ja) | 端末装置、画面更新プログラム、画面更新方法及び情報処理システム | |
JP2024016782A (ja) | リソース割り当ての決定方法、装置、計算装置及びコンピュータプログラム | |
AU2020260535B2 (en) | Operation plan creation apparatus, operation plan creation method, and program | |
CN103455382A (zh) | 处理器运行频率控制方法及系统 | |
JP2007220026A (ja) | タイマ装置、タイマ処理方法、タイマ処理プログラム、電子機器及び回路装置 | |
CN112675535A (zh) | 显示界面调整方法、装置、网络设备及存储介质 | |
CN113687952A (zh) | 一种信息处理方法、装置、设备及存储介质 | |
TW201701158A (zh) | 資訊處理裝置及資訊處理方法 | |
CN109753363B (zh) | 一种嵌入式系统内存管理方法及装置 | |
CN114143196A (zh) | 实例配置更新方法、装置、设备、存储介质及程序产品 | |
US8966504B2 (en) | Information processing apparatus, electrical power control method, and computer product | |
US20190034141A1 (en) | Information processing system and information processing method | |
JP7401830B2 (ja) | 作業手待ち予知装置、方法、および、システム | |
US11640491B2 (en) | Automatic font value distribution for variable fonts | |
WO2021090399A1 (ja) | 負荷分散システム、負荷分散装置、負荷分散方法、及びコンピュータ可読媒体 | |
JP4999932B2 (ja) | 仮想計算機システム及び仮想計算機重み付け設定処理方法及び仮想計算機重み付け設定処理プログラム | |
US20220253364A1 (en) | Method of calculating predicted exhaustion date and non-transitory computer-readable medium | |
CN116009798A (zh) | 作业方法和图像形成设备 | |
JP2017162433A (ja) | 情報処理装置 |