WO2023243039A1

WO2023243039A1 - 情報処理装置、情報処理方法、および、プログラム

Info

Publication number: WO2023243039A1
Application number: PCT/JP2022/024146
Authority: WO
Inventors: 晃一原; 紀貴堀米
Original assignee: 日本電信電話株式会社
Priority date: 2022-06-16
Filing date: 2022-06-16
Publication date: 2023-12-21

Abstract

コンテナおよび仮想マシンの何れかのアプリケーションを実行可能な情報処理装置としてのサーバ（１０）であって、サーバは、ＣＰＵ（１１）と、ＣＰＵに複数のデバイス（１２）を接続する接続ＩＦ（１３）と、接続ＩＦの帯域の使用量が上限を超えているかを監視する監視部（１４）と、使用量が上限を超えている場合に当該帯域の使用量を調整する調整部（１５）と、を備える。帯域には、論理リソース量が定義されており、また、デバイスに紐付けた割り当て比率が論理リソース量に基づいて設定されており、調整部は、帯域の使用比率が割り当て比率に比べて高いものに対して、帯域の使用量が低減するように制御する。

Description

情報処理装置、情報処理方法、および、プログラム

　本発明は、コンテナおよび仮想マシンのオーケストレーションにおいて、デバイス間インタフェースの帯域の使用量を調整する情報処理装置、情報処理方法、および、プログラムに関する。

　近年、データセンタ等のサーバファームでは、仮想化基盤を構築して運用されることが多くなってきている。仮想化基盤とは、仮想化技術を用いてサーバやネットワークといった物理資源を抽象化・隠蔽し、複数のアプリケーションやサービスに対して共通基盤として準備された仮想環境、またそれらの仮想環境を管理するシステムのことをいう。

　オープンソースの仮想化基盤としては、クラウド環境構築用のソフトウェアであるOpenStackや、コンテナ化されたワークロードやサービスを運用管理するためのソフトウェアであるKubernetesが知られている。OpenStackは、主に物理マシンや仮想マシン（ＶＭ）の管理・運用に用いられる。Kubernetesは、主にコンテナの管理・運用に用いられる。これらのソフトウェアは、オーケストレーションソフトウェアと呼ばれる。

　一般的に、ＶＭまたはコンテナで実行されるアプリケーションは、オーケストレータ（複数の物理サーバで構成されるサーバ群を管理する機能部）に対して、物理のリソース量をリクエストする。例えば、アプリケーションは、オーケストレータに対して、ＣＰＵ（Central Processing Unit）が「３コア」、メモリが「４ＧＢ」、ＧＰＵ（Graphics Processing Unit）が「１つ」のように、どのくらいのリソース量が必要かをリクエストする。オーケストレータは、空いているサーバ群の中で、リクエストされた条件を満たすサーバを見つけ、見つけたサーバにＶＭまたはコンテナを割り当てる。

　例えば、コンテナを管理するKubernetesでは、コンテナを含むＰｏｄをデプロイする際に、必要なリソース量（ＣＰＵ、メモリ、デバイス等）をマニフェストファイルに記述して、Ｐｏｄに割り当てた分のリソース量を管理する（非特許文献１参照）。これにより、Kubernetesでは、リソース量を超える割り当てが発生しないように制限することが可能である。

Kubernetes,"GPUのスケジューリング",[online],[令和4年5月25日検索],インターネット＜ＵＲＬ：https://kubernetes.io/ja/docs/tasks/manage-gpus/scheduling-gpus/＞

　しかし、オーケストレーションソフトウェアでは、ＣＰＵとデバイスとを接続する接続インタフェース（「接続ＩＦ」と表記する場合がある）の帯域をリソース量として制限することが出来ない。ここでのデバイスは、例えば、ＧＰＵ、ＦＰＧＡ（Field Programmable Gate Array）、ＡＳＩＣ（Application Specific Integrated Circuit）、ＮＩＣ（Network Interface Card）などである。

　例えば、ＣＰＵとデバイスとを繋ぐＩＦとして現在一般に用いられるＰＣＩｅ（Peripheral Component Interconnect Express）の帯域について考える。ＰＣＩｅの帯域は、ＣＰＵに繋がる複数のデバイスで共有されている場合があり、各々のデバイスの通信状況によって利用可能な帯域が変化する。その為、ＣＰＵやメモリのように独立したリソース量としてＰＣＩｅの帯域をデバイスごとに割り当てることが出来ない。したがって、ＰＣＩｅの帯域は、リソース量として扱われず、管理もされていない。

　そして、ＣＰＵに沢山のデバイスが接続されている状況下では、接続ＩＦの帯域が不足するためにswitchで競合するケースが増加し、複数のアプリケーションのスループットが低下する。つまり、ＣＰＵに沢山のデバイスが繋がっている状況では、ＣＰＵとの通信が他のデバイスと競合してしまい、ネットワークと同じように輻輳する。その結果、デバイスの性能よりも接続ＩＦの帯域に律速されることになり、デバイスを利用するアプリケーションの性能が落ちてしまい、性能保証が出来ないという問題が発生する。

　このような点に鑑みて本発明がなされたのであり、本発明は、ＣＰＵとデバイスとを接続する接続ＩＦの帯域が逼迫することによるアプリケーションの性能の低下を抑制することを課題とする。

　本発明に係る情報処理装置は、コンテナおよび仮想マシンの何れかのアプリケーションを実行可能な情報処理装置であって、ＣＰＵと、前記ＣＰＵに複数のデバイスを接続する接続ＩＦと、前記接続ＩＦの帯域の使用量が上限を超えているかを監視する監視部と、前記使用量が上限を超えている場合に当該帯域の使用量を調整する調整部と、を備え、前記帯域には、論理リソース量が定義されており、また、前記デバイスに紐付けた割り当て比率が前記論理リソース量に基づいて設定されており、前記調整部は、前記帯域の使用比率が前記割り当て比率に比べて高いものに対して、前記帯域の使用量が低減するように制御する。

　本発明によれば、ＣＰＵとデバイスとを接続する接続ＩＦの帯域が逼迫することによるアプリケーションの性能の低下を抑制することができる。

本実施形態に係る情報処理システムの全体構成を示す図である。接続ＩＦの帯域に設定可能な論理リソース量の範囲を示すテーブルである。論理リソース量の割り当て比率を示すテーブルである。本実施形態に係る情報処理方法のフローチャート（第１のデバイス）の例示である。本実施形態に係る情報処理方法のフローチャート（第２のデバイス）の例示である。本実施形態に係る情報処理方法のフローチャート（第２のデバイス）の例示である。組合せ方式の調整処理で設定するパラメータの一覧である。本実施形態に係る情報処理方法のフローチャート（第２のデバイス）の例示である。変形例に係る情報処理システムの全体構成を示す図である。本実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

＜本発明の概要＞
　まず、本発明の処理の概要を説明する。本発明では、仮想化基盤を構築するサーバが有する接続ＩＦ（例えば、ＰＣＩｅ）の帯域に論理リソース量を予め定義する。論理リソース量は、例えば、サーバのスペックに基づく値であり、単位の無い数（無次元の数）である。また、定義した論理リソース量に対して、デバイスに紐づけた割り当て比率を設定する。割り当て比率は、例えば、各々のデバイスに対して論理リソース量を振り分けた割合が分かるものである。割り当て比率を算出可能な値を設定し、必要に応じて割り当て比率を算出してもよい。そして、アプリケーションを実行し、帯域の使用量が上限を超えている場合（実効帯域が上限に達している場合）に、割り当て比率に基づいて帯域の使用量を調整する。なお、接続ＩＦを介してＣＰＵに接続されるデバイスは、自身のサーバが有するものに限らず、ネットワークを介して接続されるものであってもよい。つまり、他の装置が備えるデバイスを含めて帯域の調整を行うことが可能である。

　次に、本発明を実施するための形態（以下、「本実施形態」と称する。）について説明する。
＜情報処理システムの構成＞
　本実施形態に係る情報処理システム１の構成について説明する。図１は、本実施形態に係る情報処理システム１の全体構成を示す図である。
　情報処理システム１は、物理資源である複数台のサーバ１０（１０Ａ，１０Ｂ，１０Ｃ）と、サーバ１０と通信接続される管理装置２０とを含んで構成される。情報処理システム１は、コンテナまたは仮想マシン（ＶＭ）の運用管理と自動化を行うために設計されたオーケストレーションソフトウェア（例えば、Kubernetes）によって管理されている。オーケストレーションソフトウェアは、仮想化技術により物理資源（ここでは、サーバ１０）を仮想化し、各サーバ１０上に設定した仮想化リソース（コンテナやＶＭ等）によりアプリケーションを提供する。サーバ１０は、「情報処理装置」の一例である。

　サーバ１０は、ＣＰＵ１１と、デバイス１２と、接続ＩＦ１３とを含んで構成される。
　デバイス１２は、例えば、ＧＰＵ、ＦＰＧＡ、ＡＳＩＣ、ＮＩＣなどである。
　接続ＩＦ（Device IF）１３は、ＣＰＵ１１にデバイス１２を接続するものである。接続ＩＦ１３は、例えば、ＰＣＩｅなどである。

　ＣＰＵ１１は、接続ＩＦ１３を介して、デバイス１２に接続される。例えば、一つ目のサーバ１０Ａである「Server A」のＣＰＵ１１は、接続ＩＦ１３を介して、一つ目のデバイス１２である「Device A-1」と、二つ目のデバイス１２である「Device A-2」とに接続される。また、二つ目のサーバ１０Ｂである「Server B」のＣＰＵ１１は、接続ＩＦ１３を介して、一つ目のデバイス１２である「Device B-1」と、二つ目のデバイス１２である「Device B-2」とに接続される。また、三つ目のサーバ１０Ｃである「Server C」のＣＰＵ１１は、接続ＩＦ１３を介して、一つ目のデバイス１２である「Device C-1」と、二つ目のデバイス１２である「Device C-2」とに接続される。

　なお、図９に示すように、ＣＰＵ１１は、接続ＩＦ１３およびネットワークを介して、他のサーバ１０が備えるデバイス１２に接続されていてもよい。図９に示す構成では、一つ目のサーバ１０Ａである「Server A」のＣＰＵ１１は、接続ＩＦ１３を介して、自身が有する一つ目のデバイス１２である「Device A-1」と、二つ目のデバイス１２である「Device A-2」とに接続され、また、ネットワークを介して、二つ目のサーバ１０Ｂである「Server B」の一つ目のデバイス１２である「Device B-1」と、二つ目のデバイス１２である「Device B-2」とに接続される。

　また、図１に示すように、サーバ１０は、監視部１４と、調整部１５とを備える。監視部１４および調整部１５は、オーケストレーションソフトウェアをプログラム実行処理することによって実現される。

　監視部１４は、接続ＩＦ１３の帯域の使用量を監視する。例えば、監視部１４は、接続ＩＦ１３の帯域の使用量を、デバイス単位で監視することができる。監視部１４は、接続ＩＦ１３の帯域の使用量（実効帯域）が接続ＩＦ１３の性能上限を超えている場合（性能上限を超える恐れがある場合でもよい）に、上限を超えたことを調整部１５に通知する。

　調整部１５は、接続ＩＦ１３の帯域の使用量（実効帯域）が接続ＩＦ１３の性能上限を超えている場合（性能上限を超える恐れがある場合でもよい）に、帯域の使用量を調整する制御を行う。

　ここで、接続ＩＦ１３の帯域には、論理リソース量が定義されている。論理リソース量は、例えば情報処理システム１の管理者によって設定可能なパラメータであり、最小値および最大値が決められていて、管理者がサーバ１０のスペック（特に、接続ＩＦ１３のスペック）に基づいて、その範囲内の数値を設定する。

　例えば図２に示す情報に基づいて、管理者は論理リソース量を設定する。図２は、接続ＩＦ１３の帯域に設定可能な論理リソース量の範囲を示すテーブルであり、論理リソース量として「１～１０」の範囲内の整数値が設定可能である。接続ＩＦ１３の帯域に設定される論理リソース量は、例えば特定のサーバを基準とした相対値（相対性能比）であってよく、その場合の論理リソース量は単位の無い数（無次元の数）である。サーバ１０のスペックが同様である場合、論理リソース量は規定値であってもよい。論理リソース量は、例えば管理装置２０の管理部２１に登録される。ここでは、一つ目のサーバ１０Ａである「Server A」の接続ＩＦ１３の帯域に、論理リソース量として最大値「１０」を設定したことにする。

　また、アプリケーションの作成者（「ユーザ」と称する）は、デバイス１２に紐付けた割り当て比率を設定する。割り当て比率は、接続ＩＦ１３の帯域に設定される論理リソース量に基づいて設定される。割り当て比率を算出可能な値を設定し、必要に応じて割り当て比率を算出してもよい。

　割り当て比率の一例を図３に示す。図３は、論理リソース量の割り当て比率を示すテーブルである。図３に示すテーブルは、「アプリ名」、「デバイス種類」、「ＩＦ帯域の設定リソース量」の項目を有する。図３に示すテーブルは、管理部２１に登録される。例えば、各アプリケーションに自身の情報を登録しておき、デプロイする際にアプリケーションが自身の情報を管理部２１に通知する（一部の情報を通知してもよい）。

　「アプリ名」は、アプリケーションを識別する情報である。図３には、一つ目のアプリケーションである「App-α」と、二つ目のアプリケーションである「App-β」とが登録されている。

　「デバイス種類」は、アプリケーションで使用するデバイス１２の種類に関する情報である。図３では、一つ目のアプリケーションである「App-α」で使用するデバイス１２としてデバイス種類「Ｘ，Ｙ」が登録され、二つ目のアプリケーションである「App-β」で使用するデバイス１２としてデバイス種類「Ｚ」が登録されている。デバイス種類は、例えば、ＧＰＵ、ＦＰＧＡ、ＡＳＩＣ、ＮＩＣを区別可能な情報である。

　「ＩＦ帯域の設定リソース量」は、アプリケーションで使用する接続ＩＦ１３の帯域に関する情報である。図３では、一つ目のアプリケーションである「App-α」で使用するデバイス種類「Ｘ」の論理リソース量として「３」が登録され、一つ目のアプリケーションである「App-α」で使用するデバイス種類「Ｙ」の論理リソース量として「４」が登録され、二つ目のアプリケーションである「App-β」で使用するデバイス種類「Ｚ」の論理リソース量として「３」が登録されている。「ＩＦ帯域の論理リソース量」は、図２における論理リソース量の範囲に基づいて設定される。コンテナがサーバ１０にデプロイされるときに、「ＩＦ帯域の設定リソース量」として登録された分の帯域が、デバイス１２に割り当てられる。

　なお、各々のサーバ１０のスペックが同じ場合には、図２に基づく論理リソース量の設定を行わず（つまり、論理リソース量として規定値を設定し）、図３に示す論理リソース量の割り当て比率のみを設定してもよい。図２に基づいて、各々のサーバ１０の帯域に対して論理リソース量を設定するのは、各々のサーバ１０のスペックに差があることを想定している場合である。

　図１に示すサーバ１０の調整部１５は、帯域の使用比率が割り当て比率に比べて高いものに対して、前記帯域の使用量が低減するように制御する。帯域の使用比率と割り当て比率との比較は、デバイス単位で行うことができる。

（デバイス単位で使用比率と割り当て比率との比較を行う処理の説明）
　調整部１５は、「ＩＦ帯域の設定リソース量」に基づいてデバイス単位での割り当て比率を算出する。例えば、あるサーバ１０で「App-α」および「App-β」を実行することを想定した場合、「App-α」で使用するデバイス種類「Ｘ」のデバイス１２の割り当て比率として「3/10（30％）」を算出し、「App-α」で使用するデバイス種類「Ｙ」のデバイス１２の割り当て比率として「4/10（40％）」を算出し、「App-β」で使用するデバイス種類「Ｚ」のデバイス１２の割り当て比率として「3/10（30％）」を算出する。また、調整部１５は、デバイス１２ごとの帯域の使用量を監視部１４から取得して使用比率を算出し、デバイス１２の割り当て比率と比較することによって、使用比率が割り当て比率に比べて高いデバイス１２を判定する。そして、調整部１５は、使用比率が割り当て比率に比べて高いと判定したデバイス１２に対して帯域の使用量が低減するように制御する。

　次に、管理装置２０について説明する。図１に示すように、管理装置２０は、管理部２１を備える。管理部２１は、オーケストレーションソフトウェアをプログラム実行処理することによって実現される。
　管理部２１は、仮想化リソース（コンテナやＶＭ等）で実行されるアプリケーションを制御する。仮想化リソースは、各サーバ１０に設定される。

　アプリケーションは、管理部２１に対して、物理リソース量をリクエストする。例えば、アプリケーションは、管理部２１に対して、ＣＰＵが「３コア」、メモリが「４ＧＢ」、ＧＰＵが「１つ」のように、どのくらいの物理リソース量が必要かをリクエストする。
　また、アプリケーションは、管理部２１に対して、論理リソース量をリクエストする。例えば、アプリケーションは、管理部２１に対して、接続ＩＦ１３の帯域の論理リソース量として「３（App-αが、デバイス種類「Ｘ」のデバイス１２の論理リソース量をリクエストする場合）」、「４（App-αが、デバイス種類「Ｙ」のデバイス１２の論理リソース量をリクエストする場合）」のように、どのくらいの論理リソース量が必要かをデバイス単位でリクエストする。

　管理部２１は、空いているサーバ群の中で、リクエストされた物理リソース量および論理リソース量の条件を満たすサーバ１０を見つけ、見つけたサーバ１０にＶＭまたはコンテナを割り当てる。そして、サーバ１０にＶＭまたはコンテナがデプロイされた後でアプリケーションが実行される。アプリケーションが実行されている間、監視部１４は、接続ＩＦ１３の帯域の使用量を監視し、調整部１５は、帯域の使用量が上限を超えている場合に使用量を調整する。調整部１５は、帯域の使用量を調整するために必要な情報を、管理部２１との間で送受信する。

＜情報処理システムでの帯域の使用量の調整処理＞
　次に、本実施形態に係る情報処理システム１が実行する帯域の使用量の調整処理の流れについて説明する。
　接続ＩＦ１３の帯域の使用量の調整処理は、デバイス１２に設定可能な方法に合わせて選択するのがよい。以下では、＜１＞デバイス１２の設定を変更することによって接続ＩＦ１３の帯域の使用量を直接調整可能なもの（「第１のデバイス」と称する）、＜２＞デバイス１２のスループットを制御することによって接続ＩＦ１３の帯域の使用量を間接的に調整可能なもの（「第２のデバイス」と称する）に場合分けして、帯域の使用量の調整処理について説明する。

＜１＞デバイス１２の設定を変更することによって接続ＩＦ１３の帯域の使用量を直接調整可能なもの（第１のデバイス）の調整処理
　ネットワークインターフェースカード（ＮＩＣ）のように、デバイス１２自体の設定値が利用する接続ＩＦ１３の帯域量に等しい場合、または、接続ＩＦ１３の帯域量を直接設定可能なデバイス１２である場合、デバイス１２の設定を変更することによって接続ＩＦ１３の帯域の使用量を調整する。調整部１５は、接続ＩＦ１３の帯域の使用量が上限を超えている場合に、第１のデバイス１２が使用可能な帯域を削減する制御を行う。これにより、例えば、ＮＩＣを介して入力されるデータ量を減らせるので、接続ＩＦ１３に流れるデータ量も必然的に減らすことが可能となる。

　図４を参照して（適宜、図１乃至図３を参照）、第１のデバイス１２に対する帯域の調整処理について説明する。図４は、本実施形態に係る情報処理方法のフローチャート（第１のデバイス）の例示である。

　管理装置２０の管理部２１は、コンテナをデプロイする際に、論理リソースの割り当て量を設定する（ステップＳ１１）。例えば、一つ目のサーバ１０Ａである「Server A」で「App-α」および「App-β」を実行することを想定した場合、管理部２１は、「App-α」で使用するデバイス種類「Ｘ」のデバイス１２に論理リソース量として「３」を割り当て、「App-α」で使用するデバイス種類「Ｙ」のデバイス１２に論理リソース量として「４」を割り当て、「App-β」で使用するデバイス種類「Ｚ」のデバイス１２に論理リソース量として「３」を割り当てる。そして、割り当てられた論理リソース量に基づいて、アプリケーションが実行される。

　アプリケーションの実行が開始した後で、サーバ１０の監視部１４は、接続ＩＦ１３の送信側および受信側の帯域の使用量を確認する（ステップＳ１２）。図４では、送信側の帯域の使用量を「tx」と表記し、受信側の帯域の使用量を「rx」と表記している。続いて、監視部１４は、送信側または受信側の帯域の使用量が性能上限に達しているか否かを判定する（ステップＳ１３）。性能上限に達していない場合（ステップＳ１３で“Ｎｏ”）、競合が起きていないので調整は行わず、処理をステップＳ１２に進めて帯域の使用量を引き続き確認する。

　一方、性能上限に達している場合（ステップＳ１３で“Ｙｅｓ”）、サーバ１０の調整部１５は、割り当て比率と使用比率を比較して、使用比率が高くなっている第１のデバイス１２の利用可能な接続ＩＦ１３の帯域を削減する（ステップＳ１４）。例えば、「App-α」で使用する第１のデバイス１２の割り当て比率「3/10（30％）」に対して、使用比率が「4/10（40％）」になっていた場合に、当該第１のデバイス１２が利用可能な帯域を削減する。そして、処理をステップＳ１２に進めて帯域の使用量を引き続き確認する。

＜２＞デバイス１２のスループットを制御することによって接続ＩＦ１３の帯域の使用量を間接的に調整可能なもの（第２のデバイス）の調整処理
　デバイス１２がＧＰＵ、ＦＰＧＡ、ＡＳＩＣなどの演算デバイスである場合、処理のスループットを制御することで、接続ＩＦ１３の帯域の使用量を調整する。調整部１５は、接続ＩＦ１３の帯域の使用量が上限を超えている場合に、第２のデバイス１２の演算ユニット数を削減する制御、および、動作クロックを下げる制御、の少なくとも何れか一方を行う。これにより、演算処理を行うデータ量を減らせるので、接続ＩＦ１３に流れるデータ量も必然的に減らすことが可能となる。

　図５および図６を参照して（適宜、図１乃至図４を参照）、第２のデバイス１２に対する帯域の調整処理について説明する。図５および図６は、本実施形態に係る情報処理方法のフローチャート（第２のデバイス）の例示である。

　図５におけるステップＳ２１～ステップＳ２３の処理は、図４におけるステップＳ１１～ステップＳ１３の処理と同様である。その為、これらのステップの処理の説明は省略する。ステップＳ２３の判定で性能上限に達している場合（ステップＳ２３で“Ｙｅｓ”）、サーバ１０の調整部１５は、割り当て比率と使用比率を比較して、使用比率が高くなっている第２のデバイス１２の実行可能な演算ユニット数を削減する（ステップＳ２４）。例えば、「App-α」で使用する第２のデバイス１２の割り当て比率「3/10（30％）」に対して、使用比率が「4/10（40％）」になっていた場合に、当該第２のデバイス１２の実行可能な演算ユニット数を削減する。そして、処理をステップＳ２２に進めて帯域の使用量を引き続き確認する。

　図６におけるステップＳ３１～ステップＳ３３の処理は、図４におけるステップＳ１１～ステップＳ１３の処理と同様である。その為、これらのステップの処理の説明は省略する。ステップＳ３３の判定で性能上限に達している場合（ステップＳ３３で“Ｙｅｓ”）、サーバ１０の調整部１５は、割り当て比率と使用比率を比較して、使用比率が高くなっている第２のデバイス１２の動作クロックを下げる（ステップＳ３４）。例えば、「App-α」で使用する第２のデバイス１２の割り当て比率「3/10（30％）」に対して、使用比率が「4/10（40％）」になっていた場合に、当該第２のデバイス１２の動作クロックを下げる。そして、処理をステップＳ３２に進めて帯域の使用量を引き続き確認する。

　また、デバイス１２がＧＰＵ、ＦＰＧＡ、ＡＳＩＣなどの演算デバイスである場合、調整部１５は、第２のデバイス１２の演算ユニット数を削減する制御と動作クロックを下げる制御とを組み合わせた処理を行ってもよい。

　図７および図８を参照して（適宜、図１乃至図６を参照）、第２のデバイス１２に対する組合せ方式による帯域の調整処理について説明する。図７は、組合せ方式の調整処理で設定するパラメータの一覧である。図８は、本実施形態に係る情報処理方法のフローチャート（第２のデバイス）の例示である。

　ここで、演算デバイスは、例えば、動作周波数が「1.5GHz」程度であり、演算ユニット数が「108」程度であるとする。動作クロックは、「100MHz」単位で設定可能な場合が多く、設定に伴う最小変化幅は「5～10％」程度となる。また、演算ユニット数は、「NVIDIA Multi-Instance GPU」を想定すると、設定に伴う最小変化幅は「15％」程度となる。

　図７に示す「閾値」のパラメータは、動作クロックで設定可能な最小変化幅による演算性能変化と、演算ユニット数で設定可能な最小変化幅による演算性能変化とが同じになる値である。例えば、動作クロックの最小変化幅が「5％」であるとし、演算ユニット数による最小変化幅が「15％」であるとした場合、閾値は「15％」である。

　「設定値Ａ」のパラメータは、動作クロックまたは演算ユニット数で設定可能な最小変化幅が小さい方の設定値である。ここでは、動作クロックの最小変化幅の方が小さいので、設定値Ａは動作クロックの設定値である。

　「設定値Ｂ」のパラメータは、動作クロックまたは演算ユニット数で設定可能な最小変化幅が大きい方の設定値である。ここでは、演算ユニット数の最小変化幅の方が大きいので、設定値Ｂは演算ユニット数の設定値である。

　「優先設定」のパラメータは、特定の状況になった場合に、動作クロックまたは演算ユニット数のどちらを削減するかを示す情報である。ここでは、設定可能な最小変化幅が小さい方（動作クロック）を用いてより細かな粒度で帯域の使用量の調整を行い、性能影響を最小化する。そして、閾値を超える設定変更の場合に、事前に設定された優先設定（例えば、演算ユニット数）に基づいた帯域の使用量の調整を行うことで、アプリケーションの特性に合わせて性能影響を最小化する。優先設定の処理の詳細は図８に示す通りである。

　図８におけるステップＳ４１～ステップＳ４３の処理は、図４におけるステップＳ１１～ステップＳ１３の処理と同様である。その為、これらのステップの処理の説明は省略する。ステップＳ４３の判定で性能上限に達している場合（ステップＳ４３で“Ｙｅｓ”）、サーバ１０の調整部１５は、割り当て比率と使用比率を比較して、使用比率が高くなっている第２のデバイス１２を確認する（ステップＳ４４）。

　続いて、調整部１５は、確認した第２のデバイス１２に対して既に設定変更を行っていて、次に設定を下げる場合に閾値に到達するか否かを判定する（ステップＳ４５）。ステップＳ４５で“Ｎｏ”の場合、調整部１５は、パラメータの「設定値Ａ」に基づいて最小変化幅が小さい方の設定を下げる（ステップＳ４６）。一方、ステップＳ４５で“Ｙｅｓ”の場合、調整部１５は、優先設定に基づく設定値を下げ、優先設定ではない値を戻す（ステップＳ４７）。

　例えば、帯域の使用量が最初に上限に達した場合に、動作クロックを下げて帯域の使用量を調整し、それに伴い最小変化幅「5％」だけ演算性能が低下する。帯域の使用量が次に上限に達した場合に、演算性能を下げたとしても閾値「15％」まで達しないので、動作クロックをさらに下げて帯域の使用量を調整し、それに伴い最小変化幅「5％」だけ演算性能が低下して合計の変化量が「10％」となる。帯域の使用量がさらに次に上限に達した場合に、演算性能を下げると閾値「15％」に到達するので、演算ユニット数を削減して帯域の使用量を調整すると共に、動作クロックの設定を戻して動作クロックによる演算性能の低下を解消する。それに伴い演算ユニット数の設定による最小変化幅「15％」だけ演算性能が低下する。帯域の使用量がさらに次に上限に達した場合に、演算性能を下げたとしても閾値「15％」まで達しないので（動作クロックの設定を戻したので）、動作クロックを下げて帯域の使用量を調整し、それに伴い最小変化幅「5％」だけ演算性能が低下して合計の変化量が「20％」となる。なお、優先設定を動作クロックとすることで、動作クロックの設定による帯域の使用量の調整を常に行うことも可能である。これにより、細かな粒度で帯域の使用量の調整を行うと共に、アプリケーションの特性に合わせた設定の変更が可能となる。例えば、アプリケーションの特性上、動作クロックを必要以上に下げたくないという要望に応えることが可能となる。

＜ハードウェア構成＞
　本実施形態に係るサーバ１０（情報処理装置）は、例えば図１０に示すような構成のコンピュータ９００によって実現される。
　図１０は、本実施形態に係るサーバ１０（情報処理装置）の機能を実現するコンピュータ９００の一例を示すハードウェア構成図である。コンピュータ９００は、ＣＰＵ９０１、ＲＯＭ（Read Only Memory）９０２、ＲＡＭ９０３、ＨＤＤ（Hard Disk Drive）９０４、入出力Ｉ／Ｆ（Interface）９０５、通信Ｉ／Ｆ９０６およびメディアＩ／Ｆ９０７を有する。

　ＣＰＵ９０１は、ＲＯＭ９０２またはＨＤＤ９０４に記憶されたプログラムに基づき作動し、制御部による制御を行う。ＲＯＭ９０２は、コンピュータ９００の起動時にＣＰＵ９０１により実行されるブートプログラムや、コンピュータ９００のハードウェアに係るプログラム等を記憶する。

　ＣＰＵ９０１は、入出力Ｉ／Ｆ９０５を介して、マウスやキーボード等の入力装置９１０、および、ディスプレイやプリンタ等の出力装置９１１を制御する。ＣＰＵ９０１は、入出力Ｉ／Ｆ９０５を介して、入力装置９１０からデータを取得するともに、生成したデータを出力装置９１１へ出力する。なお、プロセッサとしてＣＰＵ９０１とともに、ＧＰＵ等を用いても良い。

　ＨＤＤ９０４は、ＣＰＵ９０１により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信Ｉ／Ｆ９０６は、通信網（例えば、ＮＷ（Network）９２０）を介して他の装置からデータを受信してＣＰＵ９０１へ出力し、また、ＣＰＵ９０１が生成したデータを、通信網を介して他の装置へ送信する。

　メディアＩ／Ｆ９０７は、記録媒体９１２に格納されたプログラムまたはデータを読み取り、ＲＡＭ９０３を介してＣＰＵ９０１へ出力する。ＣＰＵ９０１は、目的の処理に係るプログラムを、メディアＩ／Ｆ９０７を介して記録媒体９１２からＲＡＭ９０３上にロードし、ロードしたプログラムを実行する。記録媒体９１２は、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto Optical disk）等の光磁気記録媒体、磁気記録媒体、半導体メモリ等である。

　例えば、コンピュータ９００が本発明のサーバ１０（情報処理装置）として機能する場合、コンピュータ９００のＣＰＵ９０１は、ＲＡＭ９０３上にロードされたプログラムを実行することにより、サーバ１０（情報処理装置）の機能を実現する。また、ＨＤＤ９０４には、ＲＡＭ９０３内のデータが記憶される。ＣＰＵ９０１は、目的の処理に係るプログラムを記録媒体９１２から読み取って実行する。この他、ＣＰＵ９０１は、他の装置から通信網（ＮＷ９２０）を介して目的の処理に係るプログラムを読み込んでもよい。

＜効果＞
　以下、本発明に係る情報処理装置等の効果について説明する。
　本発明に係る情報処理装置は、コンテナおよび仮想マシンの何れかのアプリケーションを実行可能なサーバ１０であって、ＣＰＵ１１と、ＣＰＵ１１に複数のデバイス１２を接続する接続ＩＦ１３と、接続ＩＦ１３の帯域の使用量が上限を超えているかを監視する監視部１４と、前記使用量が上限を超えている場合に当該帯域の使用量を調整する調整部１５と、を備え、前記帯域には、論理リソース量が定義されており、また、デバイス１２に紐付けた割り当て比率が前記論理リソース量に基づいて設定されており、調整部１５は、前記帯域の使用比率が前記割り当て比率に比べて高いものに対して、前記帯域の使用量が低減するように制御する、ことを特徴とする。

　この情報処理装置としてのサーバ１０によれば、接続ＩＦ１３の帯域に論理リソース量が定義されており、当該論理リソース量を用いて帯域の使用量の調整を行うことが可能となる。これにより、接続ＩＦ１３の使用量が上限を超えるのを防ぐことができ、接続ＩＦ１３の帯域が不足することによる競合を抑制することが可能となる。その結果、アプリケーションの性能を保証することが可能となる。また、本発明は、アプリケーションの実装に依存せず、汎用的に使用することが可能である。

　また、デバイス１２は、当該デバイス１２の設定を変更することによって、接続ＩＦ１３の帯域の使用量を調整可能な第１のデバイスであり、調整部１５は、前記使用量が上限を超えている場合に、使用可能な前記帯域を削減する制御を行う、ことを特徴とする。

　このようにすることで、ＮＩＣなどのデバイス１２がＣＰＵ１１に接続されている場合でも帯域の使用量を適切に調整することが可能となる。

　また、デバイス１２は、当該デバイス１２のスループットを制御することによって、接続ＩＦ１３の帯域の使用量を調整可能な第２のデバイスであり、調整部１５は、前記使用量が上限を超えている場合に、演算ユニット数を削減する制御、および、動作クロックを下げる制御、の少なくとも何れか一方を行う、ことを特徴とする。

　このようにすることで、ＧＰＵ、ＦＰＧＡ、ＡＳＩＣなどのデバイス１２がＣＰＵ１１に接続されている場合でも帯域の使用量を適切に調整することが可能となる。

　また、前記演算ユニット数を削減する制御による演算性能変化の最小変化幅と、前記動作クロックを下げる制御による演算性能変化の最小変化幅とが異なっており、前記最小変化幅が小さい方の設定値を下げていった場合の変化量と前記最小変化幅が大きい方の設定値を下げていった場合の変化量とが同等になる値を閾値として有しており、前記演算ユニット数を削減する制御および前記動作クロックを下げる制御の何れを優先するかを登録した優先設定が行われており、調整部１５は、前記使用量が上限を超えている場合に、前記最小変化幅が小さい方の設定値を徐々に下げていき、次に前記設定値を下げることで前記最小変化幅が小さい方の変化量が前記閾値に到達する場合に、前記優先設定した方の前記設定値を下げると共に他方の前記設定値を最初の状態に戻す、ことを特徴とする。

　このようにすることで、ＧＰＵ、ＦＰＧＡ、ＡＳＩＣなどのデバイス１２がＣＰＵ１１に接続されている場合に、細かな粒度で帯域の使用量の調整を行うと共に、アプリケーションの特性に合わせた設定の変更が可能となる。

　なお、本発明は、以上説明した実施形態に限定されるものではなく、多くの変形が本発明の技術的思想内で当分野において通常の知識を有する者により可能である。

　１　　　情報処理システム
　１０，１０Ａ，１０Ｂ，１０Ｃ　サーバ（情報処理装置）
　１１　　ＣＰＵ
　１２　　デバイス
　１３　　接続ＩＦ
　１４　　監視部
　１５　　調整部
　２０　　管理装置
　２１　　管理部

Claims

　コンテナおよび仮想マシンの何れかのアプリケーションを実行可能な情報処理装置であって、
　ＣＰＵと、
　前記ＣＰＵに複数のデバイスを接続する接続ＩＦと、
　前記接続ＩＦの帯域の使用量が上限を超えているかを監視する監視部と、
　前記使用量が上限を超えている場合に当該帯域の使用量を調整する調整部と、を備え、
　前記帯域には、論理リソース量が定義されており、また、前記デバイスに紐付けた割り当て比率が前記論理リソース量に基づいて設定されており、
　前記調整部は、前記帯域の使用比率が前記割り当て比率に比べて高いものに対して、前記帯域の使用量が低減するように制御する、
　ことを特徴とする情報処理装置。
　前記デバイスは、当該デバイスの設定を変更することによって、前記接続ＩＦの帯域の使用量を調整可能な第１のデバイスであり、
　前記調整部は、前記使用量が上限を超えている場合に、使用可能な前記帯域を削減する制御を行う、
　ことを特徴とする請求項１に記載の情報処理装置。
　前記デバイスは、当該デバイスのスループットを制御することによって、前記接続ＩＦの帯域の使用量を調整可能な第２のデバイスであり、
　前記調整部は、前記使用量が上限を超えている場合に、演算ユニット数を削減する制御、および、動作クロックを下げる制御、の少なくとも何れか一方を行う、
　ことを特徴とする請求項１に記載の情報処理装置。
　前記演算ユニット数を削減する制御による演算性能変化の最小変化幅と、前記動作クロックを下げる制御による演算性能変化の最小変化幅とが異なっており、前記最小変化幅が小さい方の設定値を下げていった場合の変化量と前記最小変化幅が大きい方の設定値を下げていった場合の変化量とが同等になる値を閾値として有しており、
　前記演算ユニット数を削減する制御および前記動作クロックを下げる制御の何れを優先するかを登録した優先設定が行われており、
　前記調整部は、前記使用量が上限を超えている場合に、前記最小変化幅が小さい方の設定値を徐々に下げていき、次に前記設定値を下げることで前記最小変化幅が小さい方の変化量が前記閾値に到達する場合に、前記優先設定した方の前記設定値を下げると共に他方の前記設定値を最初の状態に戻す、
　ことを特徴とする請求項３に記載の情報処理装置。
　コンテナおよび仮想マシンの何れかのアプリケーションを実行可能な情報処理装置の情報処理方法であって、
　前記情報処理装置は、
　ＣＰＵと、前記ＣＰＵに複数のデバイスを接続する接続ＩＦと、を備えており、
　前記接続ＩＦの帯域の使用量が上限を超えているかを監視する監視ステップと、
　前記使用量が上限を超えている場合に当該帯域の使用量を調整する調整ステップと、を実行し、
　前記帯域には、論理リソース量が定義されており、また、前記デバイスに紐付けた割り当て比率が前記論理リソース量に基づいて設定されており、
　前記調整ステップでは、前記帯域の使用比率が前記割り当て比率に比べて高いものに対して、前記帯域の使用量が低減するように制御する、
　ことを特徴とする情報処理方法。
　コンピュータを、請求項１乃至請求項４のいずれか一項に記載の情報処理装置として機能させるためのプログラム。