WO2023105670A1

WO2023105670A1 - リソース管理装置及びプログラム

Info

Publication number: WO2023105670A1
Application number: PCT/JP2021/045073
Authority: WO
Inventors: 勇輝有川; 顕至田仲; 猛伊藤; 直樹三浦; 健坂本
Original assignee: 日本電信電話株式会社
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2023-06-15
Also published as: JPWO2023105670A1

Abstract

リソース管理装置（１０）は、複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースＲのハードウェア構成を管理する。リソース管理装置（１０）は、前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得部（１１Ａ）と、第１ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得部（１１Ｂ）と、を備える。リソース管理装置（１０）は、前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を変更する構成制御部（１１Ｃ）を備える。このような構成によれば、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成が適切に管理される。

Description

リソース管理装置及びプログラム

　本発明は、演算リソースを管理するリソース管理装置及びプログラムに関する。

　機械学習、人工知能（AI）、及び、ＩｏＴ（Internet of Things）などの多くの分野で技術革新が進み、様々なデータを活用することで、サービスの高度化・付加価値の提供が盛んに行われている。このような処理では、大量の計算をする必要があり、そのための情報処理基盤が必須である。

　例えば、非特許文献１では、既存の情報処理基盤をアップデートしようとする試みが展開されてはいるものの、急速に増えていくデータに対して現代のコンピュータが対応しきれていない旨が指摘されている。また、非特許文献１では、今後さらなる進化を遂げていくためには、ムーアの法則を越える「ポストムーア技術」が確立されなければいけない旨が指摘されている。

　ポストムーア技術として、例えば、非特許文献２には、フローセントリックコンピューティングという技術が開示されている。フローセントリックコンピューティングにより、データのある場所で処理を行うというこれまでのコンピューティングの考えではなく、計算機能（演算リソース）が存在する場所にデータを移動して処理を行うという新たな概念が導入されている。

"NTT Technology Report for Smart World 2020," 日本電信電話株式会社，２０２０年，https://www.rd.ntt/_assets/pdf/techreport/NTT_TRFSW_2020_EN_W.pdf R. Takano and T. Kudoh, "Flow-centric computing leveraged by photonic circuit switching for the post-moore era," Tenth IEEE/ACM International Symposium on Networks-on-Chip (NOCS), Nara, 2016, pp. 1-3.

　上記のようなフローセントリックコンピューティングを実現するためには、演算リソースをどのハードウェアにより構成するかを適切に管理する必要がある。例えば、管理が適切になされずに負荷の高い計算機のハードウェアにより演算リソースを構成すると、当該演算リソースでの処理に遅延が生じ得る。

　本発明は、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を適切に管理することを課題とする。

　上記課題を解決するために、本発明のリソース管理装置は、複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を管理するリソース管理装置であって、前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得部と、第１ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得部と、前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第１ハードウェア構成から前記第１ハードウェア構成とは異なる第２ハードウェア構成に前記計算システムの動作中に変更する構成制御部と、を備える。

　上記課題を解決するために、本発明のプログラムは、複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を管理するコンピュータに、前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得ステップと、第１ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得ステップと、前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第１ハードウェア構成から前記第１ハードウェア構成とは異なる第２ハードウェア構成に前記計算システムの動作中に変更する構成制御ステップと、を実行させる。

　本発明によれば、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成が適切に管理される。

図１は、本発明の第１実施形態のリソース管理装置及び計算機の構成を示すハードウェア構成図である。図２は、図１の計算機の構成を示すブロック図である。図３は、図１のリソース管理装置の構成を示すブロック図である。図４は、第１実施形態のリソース管理処理のフローチャートである。図５は、第２実施形態のリソース管理装置の構成を示すブロック図である。図６は、第３実施形態のリソース管理装置の構成を示すブロック図である。図７は、第３実施形態のリソース管理処理のフローチャートである。

　以下、本発明の実施の形態について図面を参照して説明する。以下の説明において同じ機能を有する要素、異なる機能を有するが互いに対応する要素などについては、適宜同じ符号を付して説明する。また、図面において、同じ機能を有するか互いに対応する複数の要素については、一部の要素にのみ符号を付している場合がある。

［第１実施形態］
　本実施形態に係るリソース管理装置１０は、図１に示すように、計算システム２０を構成する複数の計算機３０－１～３０－Ｎ（ただし、Ｎは２以上の自然数）のそれぞれとインターネット、ローカルエリアネットワーク（ＬＡＮ）などのネットワークＮＷを介して通信可能に設けられている。リソース管理装置１０は、計算システム２０の一部のハードウェアである計算機３０－１～３０－Ｎの後述のアクセラレータ３５を利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースＲのハードウェア構成を管理する。より詳細には、リソース管理装置１０は、各サービスについて、複数の演算リソースＲをどのハードウェアにより実現するかを管理する。以下、計算機３０－１～３０－Ｎの構成を説明してから、リソース管理装置１０の構成を説明する。計算機３０－１～３０－Ｎを総称して計算機３０ともいう。

　計算機３０－１～３０－Ｎは、ネットワークＮＷを介して互いに通信可能であり、多数の演算リソースＲを用い、計算システム２０全体として、複数種類のサービスを行う。サービスには、画像処理などが含まれる。１つのサービスは、複数の処理を含み、複数の処理は、複数の演算リソースＲにより分担して実行される。例えば、１つのサービスを行う複数の演算リソースＲは、ネットワークＮＷなどに構成された仮想ネットワークを介して連結されており、処理対象データを直列及び又は並列に処理する。例えば、１つのサービスとして、計算機３０－１の２つの演算リソースＲによる並列処理により処理対象データとしての画像データが２値化され、その後、２値化後の画像データに対して計算機３０－２の演算リソースＲによる画像認識処理が行われ、処理結果が画像データの提供元（不図示）に返される。提供元は、サービスのユーザのクライアントコンピュータなどである。処理対象データ及び処理結果は、リソース管理装置１０を介して提供元に送受信される。各サービスを構成する一連の処理は、例えば、リソース管理装置１０の制御下で行われる。例えば、リソース管理装置１０の記憶装置１３には、サービスごとに複数の演算リソースＲの各アドレスが格納されており、演算リソースＲが出力する処理結果のデータの転送先は、リソース管理装置１０により指定される。

　計算機３０－１～３０－Ｎのそれぞれは、実行可能な処理は異なるが、同様の構成を有する。以下、計算機３０－１～３０－Ｎを総称して計算機３０ともいう。以下、各計算機３０の構成を説明する。

　計算機３０は、パーソナルコンピュータ、スマートフォン、タブレットなどのコンピュータである。計算機３０は、プロセッサ３１と、プロセッサ３１のメインメモリ３２と、プログラム及び各種データを記憶する不揮発性の記憶装置３３と、ネットワークＮＷに接続されたＮＩＣ（Network Interface Card）３４と、を備える。計算機３０は、さらに、計算機３０の機能を向上させるアクセラレータ３５を備える。

　プロセッサ３１は、ＣＰＵ（Central Processing Unit）などからなり、記憶装置３３に記憶されているプログラム及び各種データを実行又は使用して計算機３０全体を制御する。メインメモリ３２は、ＲＡＭ（Random Access Memory）などからなる。プログラム及び各種データは、メインメモリ３２に適宜読み出される。記憶装置３３は、ＳＳＤ（Solid State Drive）などからなる。ＮＩＣ３４は、プロセッサ３１の制御のもとでネットワークＮＷに対してデータを送受信する。

　アクセラレータ３５は、ＦＰＧＡ（Field-Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）、サブＣＰＵ、及び、ＧＰＵ（Graphics Processing Unit）などのハードウェアにより構成されている。アクセラレータ３５がＦＰＧＡの場合、プロセッサ３１は、ＦＰＧＡの再構成可能な領域の少なくとも一部に所定の演算回路を演算リソースＲとして、計算機３０の稼働中つまり動的に削除及び再構成可能である。ここでは、アクセラレータ３５により、１又は複数の演算リソースＲが構成される。例えば、アクセラレータ３５がＦＰＧＡの場合、当該アクセラレータ３５に演算リソースＲとして動作する演算回路が構成されることにより、演算リソースＲが構成される。ＦＰＧＡの演算リソースＲが構成された領域が、演算リソースを構成するハードウェアとなる。演算リソースＲは、プロセッサ３１により例えば仮想マシンとして構成されてもよい。演算リソースＲは、GPUを論理的に複数に分割したハードウェアにより構成されてもよい。演算リソースＲへのデータ入力、演算リソースＲからの処理結果のデータの転送などは、例えばプロセッサ３１により制御される。

　プロセッサ３１は、上記プログラムを実行することにより、図２に示す、負荷監視部３１Ａ、性能見積部３１Ｂ、及び、リソース管理部３１Ｃとして動作する。

　負荷監視部３１Ａは、計算機３０に対する負荷を監視する。負荷としては、計算機３０に入力される単位時間当たりのデータ量、計算機３０が単位時間あたりに処理するデータ量、計算機３０が単位時間あたりに出力するデータ量、計算機３０の演算リソースＲの使用率などが挙げられる。また、負荷としては、処理過程において中間データを記憶したり、演算パラメータを記憶したりするための、メインメモリ３２又はアクセラレータ３５に設けられた記憶部などのメモリリソースの使用率も挙げられる。負荷は、これに限らず、例えば、入力データレートや、出力データレート、動画像処理であればフレームレートなどであってもよい。負荷は、計算機３０による処理時間の遅延の有無及び遅延の度合いに影響を与える情報により構成される。

　性能見積部３１Ｂは、１つのサービスの一部の処理を実行する１又は複数の演算リソースＲを動作させたときの計算機３０の処理時間に関する性能を見積もる。性能は、処理時間そのものであってもよいし、処理速度などの処理時間を増減させる量であってもよい。処理時間は、例えば、計算機３０にデータが入力されてから、当該データを上記１又は複数の演算リソースＲにより処理し、処理結果を計算機３０の外部に出力するまでの時間である。記憶装置３３には、演算リソースＲの回路規模及び計算機３０に対する負荷と、その演算リソースＲを使用したときの計算機３０の性能との関係を示す関係式又はテーブルが記憶されている。性能見積部３２Ｂは、演算リソースＲの回路規模及び負荷監視部３１Ａが監視している負荷に基づいて、前記の関係式又はテーブルを用いて前記の性能を見積もる。性能見積部３２Ｂは、見積時、テストデータを計算機３０に使用させて前記の処理時間などを計測し、計測した処理時間などを上記の性能として見積もってもよい。

　リソース管理部３２Ｃは、後述のリソース管理装置１０からの後述の指示に基づいて、アクセラレータ３５に対して任意の演算リソースＲを追加又は削除する。アクセラレータ３５がＦＰＧＡの場合、リソース管理部３２Ｃは、このＦＰＧＡに対して演算リソースＲとして動作する演算回路を書き込む又は削除する。

　図１に示すリソース管理装置１０は、サーバコンピュータなどのコンピュータである。リソース管理装置１０は、プロセッサ１１と、プロセッサ１１のメインメモリ１２と、プログラム及び各種データを記憶する不揮発性の記憶装置１３と、ネットワークＮＷに接続されたＮＩＣ１４と、を備える。

　プロセッサ１１は、ＣＰＵなどからなり、記憶装置１３に記憶されているプログラム及び各種データを実行又は使用してリソース管理装置１０全体を制御する。メインメモリ１２は、ＲＡＭなどからなる。プログラム及び各種データは、メインメモリ１２に適宜読み出される。記憶装置１３は、ＳＳＤなどからなる。ＮＩＣ１４は、プロセッサ１１の制御のもとでネットワークＮＷに対してデータを送受信する。

　プロセッサ１１は、上記プログラムを実行することで、図３に示す、要求品質取得部１１Ａ、見積結果取得部１１Ｂ、構成制御部１１Ｃ、負荷情報取得部１１Ｄ、及び、入力データ制限部１１Ｅとして動作する。これら各部１１Ａ～１１Ｅは、協働して図４に示すリソース管理処理を行う。リソース管理処理は、サービスごとに定期的に行われる。リソース管理処理は、例えば、１つのサービスについて数分おきに実行される。リソース管理処理は、計算システム２０の動作中に動的に実行される。つまり、リソース管理処理は、上記サービスの提供中に実行される。リソース管理装置１０は、リソース管理処理を行うとき、複数の計算機３０－１～３０－Ｎに対して処理対象のサービスの実行停止を指示してもよい。

　以下、図３～図４を参照しながら、各部１１Ａ～１１Ｅの動作について説明する。以下では、処理対象のサービスをサービスＸという。また、サービスＸを提供する複数の演算リソースＲのそれぞれを演算リソースＲＸともいう。複数の演算リソースＲＸが構成されている複数の計算機３０のそれぞれを計算機３０Ｘともいう。リソース管理装置１０の記憶装置１３には、サービスＸを行う複数の演算リソースＲＸの各アドレスが格納されているものとする。前記のアドレスにより、複数の演算リソースＲＸがそれぞれ設けられている計算機３０Ｘも特定可能となっている。

　リソース管理処理では、まず、要求品質取得部１１Ａが、サービスＸに要求される当該サービスＸの処理時間に関する品質である要求品質を取得する（ステップＳ１０１）。要求品質は、予め設定されている閾値として機能するものであり、記憶装置１３に各サービスに対応付けられて記録されているものとする。要求品質取得部１１Ａは、記憶装置１３からサービスＸに対応する要求品質を取得する。要求品質は、上記の性能の見積結果と比較されるものであり、性能と同じ次元を有する。性能が処理時間であれば、要求品質もそのサービスに要求される処理時間、例えば、処理時間として許容される上限時間となる。性能が処理速度であれば、要求品質も処理速度となる。

　なお、性能及び品質は、処理時間を増減させる量として、入力データレートや、出力データレート、サービスＸが動画像処理であれば処理時のフレームレートなどであってもよい。性能及び品質の内容は、各サービスの内容によって決定される。

　また、見積結果取得部１１Ｂが、現在のハードウェア構成の複数の演算リソースＲＸにより行われるサービスＸの品質を見積もった結果を品質見積結果として取得する（ステップＳ１０２）。見積結果取得部１１Ｂは、複数の演算リソースＲＸが設けられた各計算機３０ＸとＮＩＣ１４、ネットワークＮＷ、及びＮＩＣ３４を介して通信し（以下、通信について同じ）、演算リソースＲＸを使用したときのその計算機３０Ｘの性能の見積もりを指示する。計算機３０Ｘの性能見積部３１Ｂ（図２）は、前記の指示により見積もった見積結果を見積結果取得部１１Ｂに送信する。見積結果取得部１１Ｂは、計算機３０Ｘそれぞれから送信されてきた見積結果に基づいてサービスＸの品質を見積もり品質見積結果を取得する。見積結果となる性能が処理時間であれば、各計算機３０Ｘからの見積結果を合算した処理時間が品質見積結果となる。見積結果となる性能が処理速度であれば、各計算機３０Ｘからの見積結果の平均速度が品質見積結果となる。

　要求品質及び品質見積結果が取得されたあと（ステップＳ１０１及びＳ１０２のあと）は、構成制御部１１Ｃが、取得された要求品質と品質見積結果とを比較し、品質見積結果が要求品質を満たすかを判別する（ステップＳ１０３）。要求品質及び品質見積結果が処理時間である場合、品質見積結果である処理時間が要求品質である処理時間以下であれば、品質見積結果が要求品質を満たすと判別される。両者が処理速度である場合、品質見積結果である処理速度が要求品質である処理速度以上であれば、品質見積結果が要求品質を満たすと判別される。

　処理対象のサービスの品質が要求品質を満たす場合（ステップＳ１０３；Ｙｅｓ）、演算リソースＲＸのハードウェア構成を変更する必要が図４のリソース管理処理は終了する。

　処理対象のサービスの品質が要求品質を満たさない場合（ステップＳ１０３；Ｎｏ）、複数の演算リソースＲＸのハードウェア構成を変更する必要がある。このときは、負荷情報取得部１１Ｄが、計算システム２０の計算機３０－１～３０－Ｎのそれぞれに対する負荷を示す負荷情報を取得する（ステップＳ１０４）。負荷情報取得部１１Ｄは、計算機３０－１～３０－Ｎと通信して、これらに対して現在の負荷を要求する。計算機３０－１～３０－Ｎでは、負荷監視部３１Ａが前記負荷の要求に応答して、監視している負荷を負荷情報取得部１１Ｄに返信する。このようにして、負荷情報取得部１１Ｄは、計算機３０－１～３０－Ｎのそれぞれに対する負荷を負荷情報として取得する。

　負荷情報の取得後、構成制御部１１Ｃが、取得された負荷情報に基づいて、複数の演算リソースＲＸのハードウェア構成を見積結果取得時のハードウェア構成からこのハードウェア構成とは異なる第２のハードウェア構成に動的に変更する（ステップＳ１０５）。

　構成制御部１１Ｃは、ステップＳ１０５において、例えば、複数の演算リソースＲＸのうちの少なくとも１つを構成するハードウェアを計算機３０－１～３０－Ｎのうちの前記負荷の大きな計算機３０Ｘのハードウェアから前記負荷の小さな１以上の計算機３０のハードウェアに変更する。

　一例として、前記ハードウェアがＦＰＧＡの場合、構成制御部１１Ｃは、前記の負荷が第１基準よりも高い第１の計算機３０Ｘのアクセラレータ３５に書き込まれた演算リソースＲＸを削除する。他方、構成制御部１１Ｃは、前記の負荷が第２基準よりも低い第２の計算機３０のアクセラレータ３５に前記で削除した演算リソースＲＸと同じ回路構成の演算リソースＲを書き込む。なお、演算リソースＲは、複数の第２の計算機３０に分割して書き込まれてもよい。当該削除及び書込みは、構成制御部１１Ｃが第１及び第２の各計算機３０と通信して、リソース管理部３２Ｃにより行わせる。書き込み及び削除後は、記憶装置３３に記憶されている当該演算リソースＲＸのアドレスも変更する。また、負荷の低い計算機３０に負荷の高い計算機３０Ｘに設けれた演算リソースＲＸと同じ演算リソースＲが構成されている場合、両演算リソースの入れ替え、例えば、記憶装置３３に記憶されている当該演算リソースＲＸのアドレスの負荷の低い計算機３０の演算リソースＲへの書き換えによりハードウェア構成が変更されてもよい。ハードウェア構成の変更は、新たな演算リソースＲＸの追加を含んでもよい。このような追加は、構成制御部１１Ｃが、処理性能を向上させるため、演算リソースＲＸの回路規模を大きくし、回路構成の並列度を上げることを含む。構成制御部１１Ｃは、回路規模を大きくする場合、アクセラレータ３５において必要な領域の確保を試みる。

　構成制御部１１Ｃは、品質見積結果及び負荷情報を参照しながら、サービスＸの品質要求を満足できるように、演算リソースＲＸのハードウェア構成を変更するとよい。構成制御部１１Ｃは、演算リソースＲＸのハードウェア構成について最適化問題を解くアルゴリズムなど、任意のアルゴリズムでハードウェア構成を変更してもよい。

　構成制御部１１Ｃが、負荷情報を用いずに、複数の演算リソースＲＸのハードウェア構成を動的に変更してもよい。例えば、リソース管理装置１０の記憶装置１３には、複数の演算リソースＲＸの各アドレスの複数の組み合わせが格納されているものとする。構成制御部１１Ｃは、前記複数の組み合わせのいずれかをサービスＸに使用しており、前記ハードウェア構成の変更時には、サービスＸに使用する複数の演算リソースＲＸの各アドレスの組み合わせを変更してもよい。

　ステップＳ１０５のあとは、入力データ制限部１１Ｅが、負荷情報を参照しながら、負荷が所定基準よりも大きい計算機３０への処理対象データの入力量を制限する（ステップＳ１０６）。当該制御は、処理対象データの単位時間当たりの入力量を減らすほか、当該処理対象データの他の計算機３０への振り替えも含む。この処理は、特に、計算システム２０全体に対する負荷が大きいときや、上記ハードウェア構成の変更によってもサービスＸの品質が改善されないときに有効である。入力データ制限部１１Ｅは、品質見積結果をさらに参照して上記制御を行ってもよい。

　以上説明したように、この実施形態では、あるサービスについて、上記品質見積結果が上記要求品質を満たさない場合に、このサービスを分担して処理する複数の演算リソースＲのハードウェア構成が上記品質見積結果の取得時の第１ハードウェア構成から前記第１ハードウェア構成とは異なる第２ハードウェア構成に計算システム２０の動作中に変更する制御が行われる。上記品質見積結果は、演算リソースが設けられた計算機の負荷の影響を受けるので、本実施形態によれば、時々刻々と変化する計算機３０に対する負荷に追従しながら、演算リソースＲのハードウェア構成が変更される。従って、計算機３０の負荷が高い場合においても提供中のサービスの品質低下を軽減でき、複数の演算リソースＲのハードウェア構成が適切に管理される。前記制御を行わない場合、サービスの品質要求のため、演算リソースＲを過剰に配置する必要があり、電力効率及び計算機３０の利用効率が悪化する。本実施形態では、各サービスの品質を良好なものに保ったまま、電力効率及び計算機の使用率を最適な状態に保てる効果がある。また、本実施形態では、演算リソースを追加できるため、電力効率や計算機の使用率を最適な状態に保ちつつ、各サービスの品質要求を満足できる効果がある。

　さらに本実施形態では、計算機３０－１～３０－２のそれぞれに対する負荷を示す負荷情報に基づいて、上記複数の演算リソースＲのうちの少なくとも１つを構成するハードウェアが、計算機３０－１～３０－Ｎのうちの前記負荷の大きな計算機３０のハードウェアから前記負荷の小さな計算機３０のハードウェアに変更される。これにより、上記複数の演算リソースＲのハードウェア構成を前記第１ハードウェア構成から前記第２ハードウェア構成に変更する。このようにすることで、計算機３０に対する負荷によるサービスの品質低下を低減でき、複数の演算リソースＲのハードウェア構成が適切に管理される。

　さらに、本実施形態では、負荷情報に基づいて、計算機３０－１～３０－Ｎのうち負荷が所定基準よりも大きい計算機への入力データのデータ量を制限する。これにより、計算機３０に対する負荷によるサービスの品質低下を抑制できる。

　なお、見積結果取得部１１Ｂは、ステップＳ１０２において性能の見積りを計算機３０に対して指示する際、性能見積りを行う条件を指定してもよい。例えば、見積結果取得部１１Ｂは、上記ハードウェア構成により演算リソースＲを増加または削減した場合の計算機３０の性能を見積もるために、演算リソースＲの増加量及び削減量を見積時のパラメータとして指定してもよい。同様に、入力データ量が増加または減少した場合の処理性能を見積もるために、入力データの増加量及び減少量を見積時のパラメータとして指定してもよい。これら見積結果に基づく品質見積結果は、ステップＳ１０６などで使用されてもよい。

［第２実施形態］
　本実施形態に係るリソース管理装置１１０の構成を図５に示す。図５の見積結果取得部１１Ｂは、計算機３０―１～３０－Ｎのうち、１つのサービス（例えば、サービスＸ）を分担して実行する複数の演算リソースＲ（例えば、複数の演算リソースＲＸ）が構成された１以上の計算機３０（１以上の計算機３０Ｘ）それぞれの、複数の演算リソースＲのうちのその計算機に構成された１以上の演算リソースＲを使用したときの処理時間に関する性能を見積もった性能見積結果を取得する。この性能見積結果は、例えば、第１実施形態で見積結果取得部１１Ｂにより取得される各計算機３０の性能の見積結果であればよい。見積結果取得部１１Ｂは、取得した性能見積結果に１以上の変動量を加味した値に基づいてサービスの計算システム２０の動作中の前記品質を見積もる。１以上の変動量には、例えば、予め定められた第１変動量と、過去の前記負荷情報が示す前記負荷の傾向に応じた第２変動量とのうち、少なくとも前者が含まれればよい。

　見積結果取得部１１Ｂは、例えば、性能見積結果の値に対して、第１変動量として、当該値の５％を加算又は減算する。当該５％は、固定値として設定されている。なお、第１変動量は、５％以外の値であってもよい。また、見積結果取得部１１Ｂは、負荷情報取得部１１Ｄからの負荷情報が示す負荷を計算機３０ごとに記憶装置３３に順次記録する。見積結果取得部１１Ｂは、性能見積結果の対象となっている計算機３０についての過去の負荷を記憶装置３３から読み出し、当該過去の負荷の傾向、例えば、現在から過去の所定のタイミングまでの期間における負荷の平均値又は現在と同じ時間帯の負荷に基づく第２変動量を導出する。例えば、前記平均値又は負荷が所定の閾値以上であれば、第２変動量として５％の加算を導出する。見積結果取得部１１Ｂは、性能見積結果の値に対して、さらに第２変動量を加味した値（例えば、第１変動量が加味された値に、当該値の５％の値を加算した値）を上記品質見積結果として算出する。見積結果取得部１１Ｂは、第２変動量を、ニューラルネットワークのモデルを利用して算出してもよいし、統計データをベースにした機械学習モデルによって算出してもよい。

　入力データ制限部１１Ｅは、負荷情報に対して上記１以上の変動量を加味した値を新たな負荷情報とし、当該負荷情報が示す負荷が所定基準よりも大きい計算機３０への処理対象データの入力量を制限してもよい。

　その他の構成については、第１実施形態に準じるので、その説明を省略する。

　本実施形態によれば、品質見積結果及び負荷情報について所定の変動量が加味されているので、時々刻々と変化する計算機３０に対する負荷に対して予め想定し得る範囲で演算リソースＲを確保しておくことが可能となる。これにより、計算機３０に対する負荷が変動しても、サービスの品質低下を低減でき、複数の演算リソースＲのハードウェア構成が適切に管理される。また、予め想定し得る範囲で演算リソースＲを確保する際に、物理的に異なる演算リソースＲを配置することで、演算リソースＲの故障に対する冗長化も実現される。

［第３実施形態］
　本実施形態に係るリソース管理装置２１０の構成を図６に示す。リソース管理装置２１０は、リソース管理装置１０が備える各部１１Ａ～１１Ｅに加え、優先制御部２１１Ｇを備える。優先制御部２１１Ｇは、プロセッサ１１がまた、負荷情報取得部１１Ｄは、計算機３０－１～３０－Ｎそれぞれに対する負荷の他、計算システム２０全体に対する全体負荷を示す全体負荷情報も計算システム２０から取得する。負荷情報取得部１１Ｄは、全体負荷を、計算機３０－１～３０－Ｎそれぞれに対する負荷に基づいて算出してもよい。

　リソース管理装置２１０の各部１１Ａ～１１Ｅ及び２１１Ｇは、協働して図７に示すリソース管理処理を定期的に実行する。以下、当該リソース管理処理について図６及び図７を参照して説明する。なお、計算システム２０は、複数のサービスを提供可能であるが、当該複数のサービスには、実行タイミングが競合した場合にどのサービスを優先して実行するかを特定する優先順位が設定されているものとする。

　本実施形態に係るリソース管理処理では、まず、優先制御部２１１Ｇが負荷情報取得部１１Ｄから全体負荷情報を取得する（ステップＳ３０１）。その後、優先制御部２１１Ｇは、全体負荷情報が示す計算システム２０に対する全体負荷が所定の閾値より高いかを判定する（ステップＳ３０２）。全体負荷が所定の閾値より高くない場合（ステップＳ３０２；Ｎｏ）、リソース管理処理は終了する。全体負荷が所定の閾値より高い場合（ステップＳ３０２；Ｙｅｓ）、計算システム２０のサービス提供に遅延が生じている可能性がある。この場合、優先制御部２１１Ｇは、ステップＳ３０３の処理を実行する。ステップＳ３０３は、複数回実行されることがある。優先制御部２１１Ｇは、Ｐを自然数としたときのＰ回目のステップＳ３０３において、優先順位がＰ番目のサービスを選択する。その後、Ｐ番目のサービスを処理対象のサービスとして、ステップＳ１０２～ステップＳ１０６が実行される。これら処理についての説明は、第１実施形態に準じる。但し、ステップＳ１０３の判別結果が肯定だった場合、再度ステップＳ３０３の処理が実行される。ステップＳ３０３の処理回数Ｐが計算システム２０により提供可能なサービスの数に達した場合、再度ステップＳ３０１の処理が行われてもよい。また、ステップＳ１０６の処理のあともステップＳ３０１の処理が行われてもよい。

　本実施形態では、第１実施形態などと同様、計算システム２０には、当該計算システム２０が提供する複数のサービスそれぞれについて前記複数の演算リソースが構成されている。本実施形態のリソース管理装置２１０は、計算システム２０全体に対する全体負荷を示す負荷情報を取得する負荷情報取得部１１Ｄと、前記負荷情報が示す全体負荷が予め定められた閾値を超えた場合、前記複数のサービスのうちどのサービスを優先して、前記要求品質取得部と前記見積結果取得部と前記構成制御部とによる処理（ステップＳ１０１～Ｓ１０６）の対象とするかを決定する優先制御部２１１Ｇと、を備える。優先制御部２１１Ｇは、前記複数のサービスが競合したときの処理実行の優先順位に基づいて、前記どのサービスを優先して前記処理の対象とするかを決定する。

　優先制御部２１１Ｇは、前記の優先順位に代えて又は加えて、各サービスにおける前記品質見積結果と前記要求品質との乖離度合いに基づいて、前記どのサービスを優先して前記処理の対象とするかを決定してもよい。例えば、優先制御部２１１Ｇは、ステップＳ１０１及びＳ１０２で取得された要求品質と品質見積結果との差をサービスごとに記憶装置３３に蓄積しておき、当該差が大きいほど優先順位が上位のサービスとして前記処理の対象とする。優先制御部２１１Ｇは、例えば、ステップＳ３０３などで、各サービスについて、優先順位に前記差に応じた重みを加味し、加味後の値が小さいほどサービスの優先順位を高く設定してもよい。

　本実施形態によれば、計算システム２０全体の負荷が所定の閾値を超えた場合に、優先順位の高いサービスについて優先的に、第１実施形態の演算リソースのハードウェア構成の制御を行う。従って、システム全体の負荷が高い場合においても、優先度の高いサービスに対して、演算リソースＲのハードウェア構成を制御できるため、優先度の高いサービスについて品質の低下が低減される。

[本発明の範囲]
　本発明は、上記の実施の形態及び変形例に限定されるものではない。例えば、本発明には、本発明の技術思想の範囲内で当業者が理解し得る、上記の実施の形態及び変形例に対する様々な変更が含まれる。上記実施の形態及び変形例に挙げた各構成は、矛盾の無い範囲で適宜組み合わせることができる。また、上記の各構成のうちの任意の構成を削除することも可能である。上記各種のプログラムは、不揮発性の記憶装置３３に限らず、非一時的なコンピュータ読み取り可能な記憶媒体に記憶されてもよい。

　１０…リソース管理装置、１１…プロセッサ、１１Ａ…要求品質取得部、１１Ｂ…見積結果取得部、１１Ｃ…構成制御部、１１Ｄ…負荷情報取得部、１１Ｅ…入力データ制限部、１２…メインメモリ、１３…記憶装置、２０…計算システム、３０，３０－１～３０－Ｎ…計算機、３１…プロセッサ、３１Ａ…負荷監視部、３１Ｂ…性能見積部、３１Ｃ…リソース管理部、３２…メインメモリ、３２Ｂ…性能見積部、３２Ｃ…リソース管理部、３３…記憶装置、３５…アクセラレータ、１１０…リソース管理装置、２１０…リソース管理装置、２１１Ｇ…優先制御部、Ｒ…演算リソース。

Claims

　複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を管理するリソース管理装置であって、
　前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得部と、
　第１ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得部と、
　前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第１ハードウェア構成から前記第１ハードウェア構成とは異なる第２ハードウェア構成に前記計算システムの動作中に変更する構成制御部と、
　を備えるリソース管理装置。
　前記複数の計算機のそれぞれに対する負荷を示す負荷情報を取得する負荷情報取得部を備え、
　前記リソース配置制御部は、前記負荷情報に基づいて、前記複数の演算リソースのうちの少なくとも１つを構成するハードウェアを前記複数の計算機のうちの前記負荷の大きな第１計算機のハードウェアから前記負荷の小さな第２計算機のハードウェアに変更することで、前記複数の演算リソースのハードウェア構成を前記第１ハードウェア構成から前記第２ハードウェア構成に変更する、
　請求項１に記載のリソース管理装置。
　前記複数の計算機のそれぞれに対する負荷を示す負荷情報を取得する負荷情報取得部と、
　前記負荷情報に基づいて、前記複数の計算機のうち前記負荷が所定基準よりも大きい計算機への入力データのデータ量を制限する入力データ制限部と、
　を備える請求項１又は２に記載のリソース管理装置。
　前記見積結果取得部は、前記複数の計算機のうち前記複数の演算リソースが構成された１以上の計算機それぞれの、前記複数の演算リソースのうちのその計算機に構成された１以上の演算リソースを使用したときの処理時間に関する性能を見積もった性能見積結果を取得し、取得した性能見積結果に１以上の変動量を加味した値に基づいて前記サービスの前記計算システムの動作中の前記品質を見積もる、
　請求項１から３のいずれか１項に記載のリソース管理装置。
　前記複数の計算機のそれぞれに対する負荷を示す負荷情報を取得する負荷情報取得部を備え、
　前記見積結果取得部は、取得した前記性能見積結果に、予め定められた第１変動量と、過去の前記負荷情報が示す前記負荷の傾向に応じた第２変動量と、を加味した値に基づいて前記サービスの前記計算システムの動作中の前記品質を見積もる、
　請求項４に記載のリソース管理装置。
　前記計算システムには、当該計算システムが提供する複数のサービスそれぞれについて前記複数の演算リソースが構成されており、
　前記計算システム全体に対する負荷を示す負荷情報を取得する負荷情報取得部と、
　前記負荷情報が示す前記負荷が予め定められた閾値を超えた場合、前記複数のサービスのうちどのサービスを優先して、前記要求品質取得部と前記見積結果取得部と前記構成制御部とによる処理の対象とするかを決定する優先制御部と、を備える、
　請求項１から５のいずれか１項に記載のリソース管理装置。
　前記優先制御部は、前記複数のサービスが競合したときの処理実行の優先順位と、各サービスにおける前記品質見積結果と前記要求品質との乖離度合いとの少なくとも一方に基づいて、前記どのサービスを優先して前記処理の対象とするかを決定する、
　請求項６に記載のリソース管理装置。
　複数の計算機からなる計算システムの一部のハードウェアを利用して構成され、処理対象データを処理するサービスを分担して行う複数の演算リソースのハードウェア構成を管理するコンピュータに、
　前記サービスに要求される当該サービスの処理時間に関する品質を要求品質として取得する要求品質取得ステップと、
　第１ハードウェア構成の前記複数の演算リソースにより行われる前記サービスの前記計算システムの動作中の前記品質を見積もった結果を品質見積結果として取得する見積結果取得ステップと、
　前記品質見積結果が前記要求品質を満たさない場合に、前記複数の演算リソースのハードウェア構成を前記第１ハードウェア構成から前記第１ハードウェア構成とは異なる第２ハードウェア構成に前記計算システムの動作中に変更する構成制御ステップと、
　を実行させるプログラム。