WO2021234885A1

WO2021234885A1 - コンテナリソース設計装置、コンテナリソース設計方法およびプログラム

Info

Publication number: WO2021234885A1
Application number: PCT/JP2020/020042
Authority: WO
Inventors: 正純太田; 信浜田
Original assignee: 日本電信電話株式会社
Priority date: 2020-05-21
Filing date: 2020-05-21
Publication date: 2021-11-25
Also published as: JP7533576B2; US20230195497A1; JPWO2021234885A1

Abstract

コンテナリソース設計装置であるマスターノード（１０）は、Ｐｏｄ（２）の冗長化の数を示すレプリカセット数、コンテナを起動させるための条件を示すアフィニティルールおよび障害許容数を含む定義情報を取得するコンテナ設定受付部（１１）と、障害許容数以下の障害がワーカーノード（２０）に発生した場合でも、レプリカセット数を満たし、かつ、アフィニティルールで規定される条件を満たした上で、必要ワーカーノード数を算出し、リソース払出指示情報をリソース管理機構に送信するリソース算出部（１２）と、払い出されたワーカーノード（２０）にＰｏｄ（２）の配置を決定し、コンテナ設定情報を送信するコンテナ設定部（１３）と備える。

Description

コンテナリソース設計装置、コンテナリソース設計方法およびプログラム

　本発明は、仮想化技術におけるコンテナシステムのリソース設計を行う、コンテナリソース設計装置、コンテナリソース設計方法およびプログラムに関する。

　仮想化技術を適用したコンテナシステムにおいて、コンテナオーケストレーションエンジン（コンテナ制御機構）は、複数のホストにわたるコンテナのオーケストレーションを実行する機能を備え、コンテナの実行ホストを提供する複数のワーカーノードと、そのワーカーノードを管理するマスターノードとでクラスタを構成する。このコンテナ制御機構では、自己修復が可能となる宣言的な状態を維持するため、レプリカセット数を規定できる。ここで「レプリカセット」とは、コンテナ制御機構が複数のＰｏｄのレプリカを作成する機能である。Ｐｏｄは、１または複数のコンテナの集合である。例えば、ノード障害などでＰｏｄが減少した場合には、コンテナ制御機構が別のノードにより自動的にＰｏｄを起動し、レプリカ数を維持する。また、コンテナ制御機構では、コンテナに必要な配置条件としてアフィニティルールにより、配置できるワーカーノードの条件を指定できる（例えば、非特許文献１参照）。

西島直、「KubernetesのマニュフェストをMagnumで実行する」、［online］、impress、2016年2月12日、［令和2年5月12日検索］，インターネット＜ＵＲＬ：https://thinkit.co.jp/article/9378＞

　しかしながら、レプリカセット数と配置するワーカーノードについてのアフィニティルールとの関連については、従来、リソース設計時に、システム管理者（設計者）が人手により考慮した上で、ワーカーノードとなるリソースを予め準備もしくは設定しておかなければならなかった。

　例えば、図６に示すように、マスターノード１０Ａ（各図においてマスターノードを「Master」と記載する。）により、レプリカセット数「３」としたＰｏｄ（ここでは、１Ｐｏｄが１コンテナとする。）がワーカーノード２０（各図においてワーカーノードを「Worker」と記載する。）３台に配置されているときにおいて、このワーカーノード３台のうちの１台に障害が発生した場合（図６の符号ａ）を想定する。このとき、レプリカセット数「３」とともに、アフィニティルールとして、「同一ワーカーノードには、同一コンテナ（Ｐｏｄ）のレプリカを配置しない」（同一Workerノード配置：不可）という設定がされているとき（図６の符号ｂ）には、障害が発生したワーカーノード「３」以外のワーカーノード「１」「２」には、アフィニティルールにより、同一コンテナ（Ｐｏｄ）を配置することができない（図６の符号ｃ）。よって、レプリカセット数「３」を保てないため、宣言的な状態を維持できないものとなる。
　このように、コンテナのレプリカセット数と、コンテナを起動させるための条件を示すアフィニティルールとが競合した場合に、コンテナを起動できずサービス停止に至るケースがある。

　このような点に鑑みて本発明がなされたのであり、本発明は、コンテナシステムにおいて、人手によるリソース設計を不要とし、障害発生時のサービス継続性を向上させることを課題とする。

　本発明に係るコンテナリソース設計装置は、仮想化されたコンテナシステムのリソース設計を行うコンテナリソース設計装置であって、前記コンテナシステムは、コンテナが配置されることによりサービスを提供する複数のワーカーノードと、当該ワーカーノードの生成および運用を行う前記コンテナリソース設計装置とにより構成されており、前記コンテナリソース設計装置が、１つ以上の前記コンテナの集合であるＰｏｄ単位での当該Ｐｏｄの冗長化の数を示すレプリカセット数、前記コンテナを起動させるための条件を示すアフィニティルール、および、自己修復が可能な状態を維持するために障害の発生が許容される前記ワーカーノードの数を示す障害許容数、を含む定義情報を取得するコンテナ設定受付部と、前記レプリカセット数、前記アフィニティルールおよび前記障害許容数を前記定義情報から抽出し、前記障害許容数以下の障害が前記ワーカーノードに発生した場合でも、前記レプリカセット数を満たし、かつ、前記アフィニティルールで規定される条件を満たした上で、最低限必要な前記ワーカーノードの数を示す必要ワーカーノード数を算出するとともに、算出された前記必要ワーカーノード数を含む、リソースの払い出しの指示情報であるリソース払出指示情報を、リソース管理機構に送信することにより、前記必要ワーカーノード数の前記ワーカーノードをリソースとして払い出させるリソース算出部と、払い出された前記ワーカーノードに、前記レプリカセット数で示される数の前記Ｐｏｄの配置を決定し、前記Ｐｏｄの配置を決定したワーカーノードに、前記Ｐｏｄを構成するコンテナの設定を指示するコンテナ設定情報を送信するコンテナ設定部と、を備えることを特徴とする。

　本発明によれば、コンテナシステムにおいて、人手によるリソース設計を不要とし、障害発生時のサービス継続性を向上させることができる。

本実施形態に係るコンテナリソース設計装置（マスターノード）を含むコンテナリソース設計システムの全体構成を示す図である。本実施形態に係るコンテナリソース設計装置（マスターノード）を含むコンテナリソース設計システムのコンテナリソース設計処理の第１実施例を示す図である。本実施形態に係るコンテナリソース設計装置（マスターノード）を含むコンテナリソース設計システムのコンテナリソース設計処理の第２実施例を示す図である。本実施形態に係るコンテナリソース設計装置（マスターノード）が実行する処理の流れを示すフローチャートである。本実施形態に係るコンテナリソース設計装置（マスターノード）の機能を実現するコンピュータの一例を示すハードウェア構成図である。従来のコンテナ制御機構における課題を説明するための図である。

　次に、本発明を実施するための形態（以下、「本実施形態」と称する。）について説明する。

　図１は、本実施形態に係るコンテナリソース設計装置（マスターノード１０）を含むコンテナリソース設計システム１０００の全体構成を示す図である。
　コンテナリソース設計システム１０００は、コンテナオーケストレーションエンジン（コンテナ制御機構）により設定される、マスターノード１０（Master）および複数のワーカーノード２０（Worker）と、仮想化されたネットワーク機能であるＶＮＦ（Virtual Network Function）を管理するＶＮＦＭ（VNF Manager）３００と、物理リソースおよび物理リソース上に設定される仮想リソースを管理するＶＩＭ（Virtualized Infrastructure Manager）４００とを含んで構成される。
　なお、コンテナオーケストレーションエンジンは、例えば、非特許文献１に記載の「Kubernetes」（登録商標）であるが、これに限定されない。また、マスターノード１０は、請求項に記載のコンテナリソース設計装置に相当する。ＶＮＦＭ３００およびＶＩＭ４００とで、請求項に記載のリソース管理機構を構成する。

　ここで、マスターノード１０は、各ワーカーノード２０および各ワーカーノード２０に配置されるＰｏｄ２を管理する。
　本実施形態に係るマスターノード１０（コンテナリソース設計装置）は、コンテナシステムの管理装置等から、コンテナの設定（デプロイ）に関する定義情報（マニュフェストファイル）を取得する。この定義情報（マニュフェストファイル）には、レプリカセット数およびコンテナを起動させるための条件を示すアフィニティルールに加えて、本実施形態において特有な情報である「障害許容数」（詳細は後記）が記載される。そして、マスターノード１０は、取得した定義情報に基づき、コンテナ作成の単位となるＰｏｄを配置するワーカーノード２０の数を、レプリカセット数、アフィニティルールおよび障害許容数を用いた所定のロジックに基づき算出する。マスターノード１０は、算出した数のワーカーノード２０を、ＶＮＦＭ３００およびＶＩＭ４００（リソース管理機構）を介して設定する（リソースとして払い出す）。続いて、マスターノード１０により、Ｐｏｄがワーカーノード２０に割り当てられると、ワーカーノード２０においてコンテナが設定される。そして、コンテナにより実際にサービス提供のタスク処理がなされる。

　ここで、ＶＮＦＭ３００は、ＥＴＳＩ（European Telecommunications Standards Institute）ＮＦＶ（Network Functions Virtualization）の標準規定（“ETSI GS NFV-SOL 002 V2.6.1,”ＥＴＳＩ，2019-04，インターネット＜ＵＲＬ：https://www.etsi.org/deliver/etsi_gs/NFV-SOL/001_099/002/02.06.01_60/gs_NFV-SOL002v020601p.pdf＞）における、ＶＮＦのライフサイクル（生成、削除、スケーリング）管理を行う機能を備える。
　また、ＶＩＭ４００は、ＥＴＳＩＶＮＦの標準規定における、物理リソースおよび仮想リソースの運用管理を行う機能を備え、ＶＭ（Virtual Machine）で構成されるワーカーノード２０の払い出しを行う。
　マスターノード１０（コンテナリソース管理装置）は、ＶＮＦＭ３００およびＶＩＭ４００を介して、仮想リソースを用いたワーカーノード２０の払い出しを行う。

＜マスターノード（コンテナリソース管理装置）＞
　以下、本実施形態に係るマスターノード１０（コンテナリソース管理装置）について、図１を参照して詳細に説明する。
　マスターノード１０は、従来の機能である、各ワーカーノード２０および各ワーカーノード２０に配置されるＰｏｄ２を管理する処理を行う。さらに、マスターノード１０は、本実施形態における特有な処理として、レプリカセット数、コンテナを起動させるための条件を示すアフィニティルールおよび障害許容数に基づく所定のロジックにより、コンテナ作成の単位となるＰｏｄ２を配置するワーカーノード２０の数を算出する。そして、マスターノード１０は、ワーカーノード２０の払い出しおよびコンテナ配置の制御を行うことを特徴とする。

　なお、コンテナオーケストレーションエンジン（コンテナ制御機構）により設定されるクラスタを構成する、マスターノード１０およびワーカーノード２０は、物理装置でもＶＭでもよいが、以下特に記載しない限りにおいてＶＭであるものとして説明する。また、マスターノード１０およびワーカーノード２０が物理装置である場合には、そのワーカーノード２０の設定（払い出し）についての要求情報を、コンテナシステムの管理装置等に送信することにより、ノード（物理装置）の払い出し（設定）を行う。
　このマスターノード１０は、制御部、入出力部、記憶部（いずれも図示省略）を備える。

　入出力部は、各ワーカーノード２０や、ＶＮＦＭ３００、その他の外部装置等との間の情報について入出力を行う。この入出力部は、通信回線を介して情報の送受信を行う通信インタフェースを備える。
　記憶部は、クラスタに関する情報である、各ワーカーノード２０、Ｐｏｄ、ノード間の構成情報などを記憶する。

　制御部は、図１に示すように、コンテナ設定受付部１１と、リソース算出部１２と、コンテナ設定部１３とを含んで構成される。

　コンテナ設定受付部１１は、コンテナシステムの管理装置等から、コンテナに関する定義情報（マニュフェストファイル）を取得する。
　このコンテナ設定受付部１１が取得する定義情報には、従来より記載される、レプリカセット数およびコンテナを起動させるための条件を示すアフィニティルールに加えて、障害許容数を含むことを特徴とする。
　なお、後記するように、コンテナ設定受付部１１は、同時期に設定する複数のレプリカセットに関する定義情報を受信してもよい。

　この障害許容数は、Ｎ＋Ｍ冗長構成において、レプリカセット数に対応するＮ（現用系）のワーカーノード２０の数に対して、Ｍ（予備系）のワーカーノード２０の数を設定するものである。障害許容数は、レプリカセット数およびアフィニティルールを満たした上で、宣言的な状態（自己修復が可能な状態）を維持するのに許容されるワーカーノード２０の数、つまり、ワーカーノード２０に障害が発生しても宣言的な状態を維持するために、予め払い出しておくワーカーノード２０の数を示している。
　この障害許容数で想定される「障害」は、ワーカーノード２０において発生する故障だけでなく、各ワーカーノード２０のトラヒック量やＣＰＵ使用率等において、所定の閾値を超えた場合も障害に該当するものとする。マスターノード１０は、障害許容数を考慮して、予め（予備系の）ワーカーノード２０を払い出しておく。そしてマスターノード１０は、ワーカーノード２０のトラヒック量やＣＰＵ使用率等が所定の閾値を超えないように、予め払い出しておいた（予備系の）ワーカーノード２０にＰｏｄを配置することにより、アフィニティルールを満たすようにする。

　リソース算出部１２は、取得した定義情報（マニュフェストファイル）から、レプリカセット数、コンテナを起動するための条件を示すアフィニティルール、および、障害許容数の情報を抽出する。そして、リソース算出部１２は、レプリカセット数、アフィニティルールおよび障害許容数を用いて、宣言的な状態を維持するために最低限必要なワーカーノード２０（ＶＭリソース）の数（以下、「必要ワーカーノード数」と称する。）を算出するというロジック（所定のロジック）に基づき、必要ワーカーノード数を算出する。

　また、リソース算出部１２は、コンテナの起動を要求する複数のレプリカセット（各々異なる複数のＰｏｄ）の定義情報（マニュフェストファイル）を同時期に受け取った場合には、複数の定義情報のすべてを満たし、かつ、宣言的な状態を維持するのに、全体として最低限必要なワーカーノード２０の数（必要ワーカーノード数）を算出する。
　このようにすることで、コンテナの起動を要求する複数のレプリカセットの定義情報を受け付けた場合に、マスターノード１０が、宣言的な状態を維持するのに、全体として最低限必要な必要ワーカーノード数を算出することができる。よって、人手によるリソース設計を不要とすることができる。また、より効率的にリソースを運用することができる。

　さらに、リソース算出部１２は、リソースの種別を識別するラベルを付したアフィニティルールが記載された定義情報を取得した場合には、ラベル種別を判別し、「必要ラベルノード数」を算出する。リソース算出部１２は、ラベル種別が例えば「ＧＰＵ（Graphics Processing Unit）」であれば、「必要ＧＰＵラベルノード数」を算出する。ラベル種別は、「ＧＰＵ」の他、例えば、ストレージや、ネットワーク機器をラベルとして指定し、判別できるようにしてもよい。
　このようにすることで、マスターノード１０は、ラベル種別を考慮して、リソースの種別を指定し、必要ラベルノード数（例えば、「必要ＧＰＵラベルノード数」）のリソースを算出することができる。よって、ラベルを付したアフィニティルールが記載された定義情報を取得した場合においても、人手によるリソース設計を不要とすることができる。

　リソース算出部１２は、必要ワーカーノード数、また必要ラベルノード数が算出されていれば、その必要ラベルノード数のワーカーノード２０を、リソースとして払い出す指示情報（以下、「リソース払出指示情報」と称する。）として、ＶＮＦＭ３００に送信する。これにより、ＶＩＭ４００がその指示情報をＶＮＦＭ３００から取得し、ＶＭで構成されるワーカーノード２０の払い出しが行われる。なお、ＶＩＭ４００が払い出したワーカーノード２０は、マスターノード１０に登録される。

　コンテナ設定部１３は、払い出されたワーカーノード２０に、レプリカセット数で示される数のＰｏｄ２の配置を決定し、Ｐｏｄ２の配置を決定したワーカーノード２０にＰｏｄ２の設定を指示する情報（コンテナ設定情報）を送信する。ワーカーノード２０は、このコンテナ設定情報を受信して、Ｐｏｄを作成する。
　また、コンテナ設定部１３は、ワーカーノード２０を監視しており、ワーカーノード２０に障害が発生した場合には、レプリカセット数を維持するように、リソースとして予め払い出しておいたワーカーノード２０を含めて、新たなＰｏｄ２の配置先を決定する。そして、コンテナ設定部１３は、新たなＰｏｄ２の配置先として決定したワーカーノード２０に、コンテナ設定情報を送信する。このようにすることで、マスターノード１０は、自己修復が可能な宣言的な状態をワーカーノード２０において維持することができる。

　次に、マスターノード１０を含むコンテナリソース設計システム１０００によるコンテナリソース設計処理の実施例を説明する。図２は、コンテナの設定に関する１つの定義情報（マニュフェストファイル）を、マスターノード１０が取得した場合のコンテナリソース設計処理を示す。図３は、コンテナ設定に関する複数（３つ）の定義情報（マニュフェストファイル）を、マスターノード１０が取得した場合のコンテナリソース設計処理を示す。

＜第１実施例＞
　図２は、本実施形態に係るコンテナリソース設計装置（マスターノード１０）を含むコンテナリソース設計システム１０００のコンテナリソース設計処理の第１実施例を示す図である。

　マスターノード１０（コンテナ設定受付部１１）は、コンテナシステムの管理装置等から、コンテナの設定に関する（１つのレプリカセットの）定義情報（マニュフェストファイル）を取得する。
　この定義情報には、レプリカセット数「３」、コンテナを起動させるための条件を示すアフィニティルールとして「同一ワーカーノードには、同一コンテナ（Ｐｏｄ）のレプリカを配置しない」（同一Workerノード配置：不可）、障害許容数「１」が記載されているものとする（図２の符号α１）。

　マスターノード１０のリソース算出部１２は、取得した定義情報（マニュフェストファイル）から、レプリカセット数、アフィニティルール、および、障害許容数の情報を抽出する。そして、リソース算出部１２は、宣言的な状態を維持するために最低限必要なワーカーノード２０（ＶＭリソース）の数（必要ワーカーノード数）を算出する。
　ここで、リソース算出部１２は、アフィニティルールにより、同一ワーカーノード２０に同一コンテナ（Ｐｏｄ）のレプリカを配置できないこと、および、障害許容数「１」であることから、レプリカセット数「３」にワーカーノード２０を「１」加えた、「４」を必要ワーカーノード数として算出する。

　マスターノード１０のリソース算出部１２は、必要ワーカーノード数「４」の情報を付したリソース払出指示情報を、ＶＮＦＭ３００に送信する（図２に符号α２）。そして、ＶＮＦＭ３００がそのリソース払出指示情報をＶＩＭ４００に送信することにより、４つのワーカーノード２０（Worker「１」「２」「３」「４」）の払い出しが行われる。

　続いて、マスターノード１０のコンテナ設定部１３は、払い出されたワーカーノード２０の中から、レプリカセット数で示される数「３」のＰｏｄ２の配置を決定し（ここでは、Worker「１」「２」「３」）、Ｐｏｄ２の配置を決定したワーカーノード２０にＰｏｄ２の設定を指示するコンテナ設定情報を送信する。コンテナ設定情報を受信したワーカーノード２０（Worker「１」「２」「３」）は、Ｐｏｄ２を設定する。
　なお、ワーカーノード「４」は、予めリソースとして払い出されているが、Ｐｏｄ２が設定されていない状態となる。

　ここで、例えば、ワーカーノード「３」に障害が発生したとする（図２の符号ｄ）。この場合、このままでは、レプリカセット数「３」を維持できないため、マスターノード１０（コンテナ設定部１３）は、予め払い出されているワーカーノード「４」に対し、コンテナ設定情報を送信する。これにより、ワーカーノード「４」は、Ｐｏｄ２（２ｎ）を設定する（図２の符号ｅ）。この際、アフィニティルールを考慮したうえで、リソースの払い出しが済んでいるため、サービスを中断することなく障害対応を行うことができる。つまり、サービス継続性を向上させることができる。

＜第２実施例＞
　図３は、本実施形態に係るコンテナリソース設計装置（マスターノード１０）を含むコンテナリソース設計システム１０００のコンテナリソース設計処理の第２実施例を示す図である。

　マスターノード１０（コンテナ設定受付部１１）は、コンテナシステムの管理装置等から、コンテナの設定に関する複数（３つのレプリカセット）の定義情報（マニュフェストファイル）を取得する。
　ここでは、Ａレプリカセット、Ｂレプリカセット、Ｃレプリカセットにおけるコンテナ（Ｐｏｄ）の設定を要求する３つの定義情報を取得したものとする。

　Ａレプリカセットの定義情報には、レプリカセット数「４」、コンテナを起動させるための条件を示すアフィニティルールとして「同一ワーカーノードには、同一コンテナ（Ｐｏｄ）のレプリカを配置しない」（同一Workerノード配置：不可）、障害許容数「２」が記載されているものとする（図２の符号β１－Ａ）。

　Ｂレプリカセットの定義情報には、レプリカセット数「３」、コンテナを起動させるための条件を示すアフィニティルールとして「同一ワーカーノードには、同一コンテナ（Ｐｏｄ）のレプリカを配置しない」（同一Workerノード配置：不可）、障害許容数「１」が記載されているものとする（図２の符号β１－Ｂ）。

　Ｃレプリカセットの定義情報には、レプリカセット数「１」、コンテナを起動させるための条件を示すアフィニティルールとしてラベル「ＧＰＵ」、障害許容数「１」が記載されているものとする（図２の符号β１－Ｃ）。

　マスターノード１０のリソース算出部１２は、取得した３つの定義情報（マニュフェストファイル）から、レプリカセット数、アフィニティルール、および、障害許容数の情報を抽出する。そして、リソース算出部１２は、宣言的な状態を維持するために最低限必要なワーカーノード２０（ＶＭリソース）の数（必要ワーカーノード数）を算出する。また、リソース算出部１２は、Ｃレプリカセットにおいて、ラベル種別に「ＧＰＵ」が設定されていることから、リソースとしてのＧＰＵにワーカーノード２０を設定する最低限必要なノード数（必要ＧＰＵラベルノード数）を算出する。

　リソース算出部１２は、まず、ＡレプリカセットとＢレプリカセットの定義情報を比較する。Ａレプリカセットのアフィニティルールにより、同一ワーカーノード２０に同一コンテナ（Ｐｏｄ）のレプリカを配置できないこと、および、障害許容数「２」であることから、レプリカセット数「４」にワーカーノード２０を「２」加えた、「６」をＡレプリカセットの必要ワーカーノード数として算出する。一方、Ｂレプリカセットのアフィニティルールにより、同一ワーカーノード２０に同一コンテナ（Ｐｏｄ）のレプリカを配置できないこと、および、障害許容数「１」であることから、レプリカセット数「３」にワーカーノード２０を「１」加えた、「４」をＢレプリカセットの必要ワーカーノード数として算出する。よって、ＡレプリカセットとＢレプリカセットとの間では、最低限必要なノード数（必要ワーカーノード数）は「６」となる。

　一方、Ｃレプリカセットの定義情報により、ＧＰＵへのワーカーノードの配置において、障害許容数「１」であることから、ＧＰＵに配置するワーカーノード数（必要ＧＰＵラベルノード数）は、「２」となる。

　リソース算出部１２は、以上に基づき、Ａ，Ｂ，Ｃの３つのレプリカセットを同時期に設定する場合において、全体として最低限必要なノード数として、必要ワーカーノード数「４」、必要ＧＰＵラベルノード数「２」を算出する。なお、ＡレプリカセットとＢレプリカセットとの間で必要ワーカーノード数は「６」であったが、そのうち、ＧＰＵをリソースとして用いるワーカーノード２０を、必要ＧＰＵラベルノード数「２」に振り分けたワーカーノード２０に重複させて設定を行う。よって、リソースとしてワーカーノード２０を払い出す総数は「６」のままとなる。

　マスターノード１０のリソース算出部１２は、必要ワーカーノード数「４」および必要ＧＰＵラベルノード数「２」の情報を付したリソース払出指示情報を、ＶＮＦＭ３００に送信する（図３に符号β２）。そして、ＶＮＦＭ３００がそのリソース払出指示情報をＶＩＭ４００に送信することにより、４つのワーカーノード２０（Worker「１」「２」「３」「４」）と、リソースとしてＧＰＵを提供する２つのワーカーノード２０（Worker「５」「６」）との払い出しが行われる。

　続いて、マスターノード１０のコンテナ設定部１３は、払い出されたワーカーノード２０の中から、各レプリカセットの定義情報のレプリカセット数で示される数に応じてＰｏｄ２の配置を決定し、Ｐｏｄ２の配置を決定したワーカーノード２０にそのＰｏｄ２の設定を指示するコンテナ設定情報を送信する。そして、コンテナ設定情報を受信した各ワーカーノード２０は、Ｐｏｄ２を設定する。

　ここでは、Ａレプリカセットの４つのＰｏｄが、ワーカーノード「１」「２」「４」「５」に設定される。Ｂレプリカセットの３つのＰｏｄが、ワーカーノード「１」「３」「４」に設定される。また、Ｃレプリカセットの１つのＰｏｄが、ＧＰＵをリソースとして提供するワーカーノード「５」に設定される。
　なお、ワーカーノード「６」は、予めリソースとして払い出されているが、Ｐｏｄが設定されていない状態となる。

　ここで、例えば、ワーカーノード「４」「５」に障害が発生したとする（図３の符号ｆ，ｇ）。この場合、このままでは、Ａ，Ｂ，Ｃの３つのレプリカセットにおいて各レプリカセット数を維持できない。そのため、マスターノード１０（コンテナ設定部１３）は、ＡレプリカセットのＰｏｄを、例えばワーカーノード「３」「６」に配置するようにし、コンテナ設定情報を送信する。ＢレプリカセットのＰｏｄを、例えばワーカーノード「２」に配置するようにし、コンテナ設定情報を送信する。また、ＣレプリカセットのＰｏｄを、ワーカーノード「６」に配置するようにし、コンテナ設定情報を送信する。
　これにより、ワーカーノード「２」は、ＢレプリカセットのＰｏｄを設定する（図３の符号ｈ）。ワーカーノード「３」は、ＡレプリカセットのＰｏｄを設定する（図３の符号ｉ）。また、ワーカーノード「６」は、ＡレプリカセットのＰｏｄとＣレプリカセットのＰｏｄとを設定する（図３の符号ｊ，ｋ）。

　このようにすることで、人手によるリソース設計を不要とし、障害発生時のサービス継続性を向上させることができる。また、最低限必要なノード数にワーカーノード２０の設定を抑えることが可能となり、効率的にリソースを運用することができる。

≪処理の流れ≫
　次に、マスターノード１０が実行する処理の流れについて説明する。
　図４は、本実施形態に係るコンテナリソース設計装置（マスターノード１０）が実行する処理の流れを示すフローチャートである。

　まず、マスターノード１０のコンテナ設定受付部１１は、コンテナシステムの管理装置等から、コンテナに関する定義情報（マニュフェストファイル）を取得する（ステップＳ１）。
　この定義情報には、レプリカセット数、コンテナを起動させるための条件を示すアフィニティルールおよび障害許容数が記載されている。
　また、コンテナ設定受付部１１は、複数のレプリカセットについての定義情報を受信してもよい。

　次に、マスターノード１０のリソース算出部１２は、取得した定義情報（マニュフェストファイル）から、レプリカセット数、コンテナを起動するための条件を示すアフィニティルール、および、障害許容数の情報を抽出する（ステップＳ２）。

　続いて、リソース算出部１２は、レプリカセット数、アフィニティルールおよび障害許容数に基づき、宣言的な状態を維持するために最低限必要なワーカーノード２０の数（必要ワーカーノード数）を算出する（ステップＳ３）。
　この際、リソース算出部１２は、複数のレプリカセットについての定義情報を受け取った場合には、各定義情報で示される、レプリカセット数、アフィニティルールおよび障害許容数の条件を満たし、かつ、ワーカーノード数が全体として最低となるように、必要ワーカーノード数を算出する。また、アフィニティルールにおいてリソースの種別を識別するラベルの情報が付されていた場合には、ラベル種別を考慮し、ラベルで示される種類のリソースの数を満たすようにして、必要ラベルノード数（例えば、ラベルが「ＧＰＵ」であれば「必要ＧＰＵラベルノード数」）を含めて算出する。

　次に、リソース算出部１２は、必要ワーカーノード数、また必要ラベルノード数（必要ＧＰＵラベルノード数）が算出されていれば、その必要ラベルノード数のワーカーノード２０を含む、リソース払出指示情報を、ＶＮＦＭ３００に送信する（ステップＳ４）。これにより、ＶＩＭ４００がその指示情報をＶＮＦＭ３００から取得し、ワーカーノード２０の払い出しが行われる。これにより、ＶＩＭ４００が払い出したワーカーノード２０が、マスターノード１０に登録される。

　そして、マスターノード１０のコンテナ設定部１３は、払い出されたワーカーノード２０に、レプリカセット数で示される数のＰｏｄ２の配置を決定し、Ｐｏｄ２の配置を決定したワーカーノード２０にＰｏｄ２の設定を指示するコンテナ設定情報を送信する（ステップＳ５）。ワーカーノード２０は、このコンテナ設定情報を受信して、Ｐｏｄを作成する。

　これにより、マスターノード１０（コンテナリソース設計装置）は、レプリカセット数およびアフィニティルールの条件を満たした上で、宣言的な状態を維持することができる。よって、人手によるリソース設計を不要とし、障害発生時のサービス継続性を向上させることができる。

＜ハードウェア構成＞
　本実施形態に係るコンテナリソース設計装置（マスターノード１０）は、例えば図５に示すような構成の物理装置であるコンピュータ９００によって実現される。
　図５は、本実施形態に係るコンテナリソース設計装置（マスターノード１０）の機能を実現するコンピュータ９００の一例を示すハードウェア構成図である。コンピュータ９００は、ＣＰＵ９０１、ＲＯＭ（Read Only Memory）９０２、ＲＡＭ９０３、ＨＤＤ（Hard Disk Drive）９０４、入出力Ｉ／Ｆ（Interface）９０５、通信Ｉ／Ｆ９０６およびメディアＩ／Ｆ９０７を有する。

　ＣＰＵ９０１は、ＲＯＭ９０２またはＨＤＤ９０４に記憶されたプログラムに基づき作動し、図１に示すコンテナリソース設計装置（マスターノード１０）の制御部（コンテナ設定受付部１１、リソース算出部１２、コンテナ設定部１３）による制御を行う。ＲＯＭ９０２は、コンピュータ９００の起動時にＣＰＵ９０１により実行されるブートプログラムや、コンピュータ９００のハードウェアに係るプログラム等を記憶する。

　ＣＰＵ９０１は、入出力Ｉ／Ｆ９０５を介して、マウスやキーボード等の入力装置９１０、および、ディスプレイ等の出力装置９１１を制御する。ＣＰＵ９０１は、入出力Ｉ／Ｆ９０５を介して、入力装置９１０からデータを取得するともに、生成したデータを出力装置９１１へ出力する。なお、プロセッサとしてＣＰＵ９０１とともに、ＧＰＵ等を用いても良い。

　ＨＤＤ９０４は、ＣＰＵ９０１により実行されるプログラムおよび当該プログラムによって使用されるデータ等を記憶する。通信Ｉ／Ｆ９０６は、通信網（例えば、ＮＷ（Network）９２０）を介して他の装置からデータを受信してＣＰＵ９０１へ出力し、また、ＣＰＵ９０１が生成したデータを、通信網を介して他の装置へ送信する。

　メディアＩ／Ｆ９０７は、記録媒体９１２に格納されたプログラムまたはデータを読み取り、ＲＡＭ９０３を介してＣＰＵ９０１へ出力する。ＣＰＵ９０１は、目的の処理に係るプログラムを、メディアＩ／Ｆ９０７を介して記録媒体９１２からＲＡＭ９０３上にロードし、ロードしたプログラムを実行する。記録媒体９１２は、ＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto Optical disk）等の光磁気記録媒体、磁気記録媒体、導体メモリテープ媒体又は半導体メモリ等である。

　例えば、コンピュータ９００が本実施形態に係るコンテナリソース設計装置（マスターノード１０）として機能する場合、コンピュータ９００のＣＰＵ９０１は、ＲＡＭ９０３上にロードされたプログラムを実行することによりコンテナリソース設計装置（マスターノード１０）の機能を実現する。また、ＨＤＤ９０４には、ＲＡＭ９０３内のデータが記憶される。ＣＰＵ９０１は、目的の処理に係るプログラムを記録媒体９１２から読み取って実行する。この他、ＣＰＵ９０１は、他の装置から通信網（ＮＷ９２０）を介して目的の処理に係るプログラムを読み込んでもよい。

＜効果＞
　以下、本発明に係るコンテナリソース設計装置（マスターノード１０）等の効果について説明する。
　本発明に係るコンテナリソース設計装置は、仮想化されたコンテナシステムのリソース設計を行うコンテナリソース設計装置（マスターノード１０）であって、コンテナシステムは、コンテナが配置されることによりサービスを提供する複数のワーカーノード２０と、当該ワーカーノード２０の生成および運用を行うコンテナリソース設計装置（マスターノード１０）とにより構成されており、コンテナリソース設計装置（マスターノード１０）が、１つ以上のコンテナの集合であるＰｏｄ２単位での当該Ｐｏｄ２の冗長化の数を示すレプリカセット数、コンテナを起動させるための条件を示すアフィニティルール、および、自己修復が可能な状態を維持するために障害の発生が許容されるワーカーノード２０の数を示す障害許容数、を含む定義情報を取得するコンテナ設定受付部１１と、レプリカセット数、アフィニティルールおよび障害許容数を定義情報から抽出し、障害許容数以下の障害がワーカーノード２０に発生した場合でも、レプリカセット数を満たし、かつ、アフィニティルールで規定される条件を満たした上で、最低限必要なワーカーノード２０の数を示す必要ワーカーノード数を算出するとともに、算出された必要ワーカーノード数を含む、リソースの払い出しの指示情報であるリソース払出指示情報を、リソース管理機構に送信することにより、必要ワーカーノード数のワーカーノード２０をリソースとして払い出させるリソース算出部１２と、払い出されたワーカーノード２０に、レプリカセット数で示される数のＰｏｄ２の配置を決定し、Ｐｏｄ２の配置を決定したワーカーノード２０に、Ｐｏｄ２を構成するコンテナの設定を指示するコンテナ設定情報を送信するコンテナ設定部１３と、を備えることを特徴とする。

　このようにすることで、本発明に係るコンテナリソース設計装置（マスターノード１０）は、レプリカセット数およびアフィニティルールの条件を満たした上で、宣言的な状態を維持することができる。また、障害許容数を加味した冗長設計を自動で行うことができる。よって、人手によるリソース設計を不要とし、障害発生時のサービス継続性を向上させることができる。

　また、コンテナリソース設計装置（マスターノード１０）において、コンテナ設定受付部１１は、各々異なるＰｏｄ２に関する複数の定義情報を取得し、リソース算出部１２は、各々のＰｏｄ２が複数の定義情報それぞれで示される、障害許容数以下の障害がワーカーノード２０に発生した場合でも、レプリカセット数を満たし、かつ、アフィニティルールで規定される条件を満たした上で、全体として最低限必要な必要ワーカーノード数を算出することを特徴とする。

　このようにすることで、同時期に異なるＰｏｄの定義情報に基づき、複数のコンテナを設定（デプロイ）する場合でも、全体として最低限必要なワーカーノード数を算出することができる。よって、より効率的にリソースを運用することができる。

　また、コンテナリソース設計装置（マスターノード１０）において、アフィニティルールに、コンテナを起動させるリソースの種別を示すラベルが付されている場合に、リソース算出部１２は、ラベルで示されるリソースの種別を判別し、判別した種別のリソースにおいて、最低限必要なワーカーノード２０の数を示す必要ラベルノード数を算出し、リソース払出指示情報に含めてリソース管理機構に送信することを特徴とする。

　このようにすることで、リソースの種別を考慮して最低限必要なワーカーノード数を算出することができる。よって、より効率的にリソースを運用することができる。

　なお、本発明は、以上説明した実施形態に限定されるものではなく、多くの変形が本発明の技術的思想内で当分野において通常の知識を有する者により可能である。
　例えば、本実施形態に係るコンテナリソース設計装置（マスターノード１０）の特徴構成となる各機能（コンテナ設定受付部１１、リソース算出部１２、コンテナ設定部１３）の全部または一部を、ＶＮＦＭ３００に備えさせるようにしてもよい。この場合であっても、マスターノード１０とＶＮＦＭ３００が連携して本実施形態の処理を実現することができる。

　２　　　Ｐｏｄ
　１０　　コンテナリソース設計装置（マスターノード）
　１１　　コンテナ設定受付部
　１２　　リソース算出部
　１３　　コンテナ設定部
　２０　　ワーカーノード
　３００　ＶＮＦＭ（リソース管理機構）
　４００　ＶＩＭ（リソース管理機構）
　１０００　コンテナリソース設計システム

Claims

　仮想化されたコンテナシステムのリソース設計を行うコンテナリソース設計装置であって、
　前記コンテナシステムは、コンテナが配置されることによりサービスを提供する複数のワーカーノードと、当該ワーカーノードの生成および運用を行う前記コンテナリソース設計装置とにより構成されており、
　前記コンテナリソース設計装置は、
　１つ以上の前記コンテナの集合であるＰｏｄ単位での当該Ｐｏｄの冗長化の数を示すレプリカセット数、前記コンテナを起動させるための条件を示すアフィニティルール、および、自己修復が可能な状態を維持するために障害の発生が許容される前記ワーカーノードの数を示す障害許容数、を含む定義情報を取得するコンテナ設定受付部と、
　前記レプリカセット数、前記アフィニティルールおよび前記障害許容数を前記定義情報から抽出し、前記障害許容数以下の障害が前記ワーカーノードに発生した場合でも、前記レプリカセット数を満たし、かつ、前記アフィニティルールで規定される条件を満たした上で、最低限必要な前記ワーカーノードの数を示す必要ワーカーノード数を算出するとともに、
　算出された前記必要ワーカーノード数を含む、リソースの払い出しの指示情報であるリソース払出指示情報を、リソース管理機構に送信することにより、前記必要ワーカーノード数の前記ワーカーノードをリソースとして払い出させるリソース算出部と、
　払い出された前記ワーカーノードに、前記レプリカセット数で示される数の前記Ｐｏｄの配置を決定し、前記Ｐｏｄの配置を決定したワーカーノードに、前記Ｐｏｄを構成するコンテナの設定を指示するコンテナ設定情報を送信するコンテナ設定部と、
　を備えることを特徴とするコンテナリソース設計装置。
　前記コンテナ設定受付部は、各々異なるＰｏｄに関する複数の前記定義情報を取得し、
　前記リソース算出部は、各々のＰｏｄが複数の前記定義情報それぞれで示される、前記障害許容数以下の障害が前記ワーカーノードに発生した場合でも、前記レプリカセット数を満たし、かつ、前記アフィニティルールで規定される条件を満たした上で、全体として最低限必要な前記必要ワーカーノード数を算出すること
　を特徴とする請求項１に記載のコンテナリソース設計装置。
　前記アフィニティルールに、前記コンテナを起動させるリソースの種別を示すラベルが付されている場合に、
　前記リソース算出部は、前記ラベルで示されるリソースの種別を判別し、判別した種別のリソースにおいて、最低限必要な前記ワーカーノードの数を示す必要ラベルノード数を算出し、前記リソース払出指示情報に含めて前記リソース管理機構に送信すること
　を特徴とする請求項１に記載のコンテナリソース設計装置。
　仮想化されたコンテナシステムのリソース設計を行うコンテナリソース設計装置のコンテナリソース設計方法であって、
　前記コンテナシステムは、コンテナが配置されることによりサービスを提供する複数のワーカーノードと、当該ワーカーノードの生成および運用を行う前記コンテナリソース設計装置とにより構成されており、
　前記コンテナリソース設計装置は、
　１つ以上の前記コンテナの集合であるＰｏｄ単位での当該Ｐｏｄの冗長化の数を示すレプリカセット数、前記コンテナを起動させるための条件を示すアフィニティルール、および、自己修復が可能な状態を維持するために障害の発生が許容される前記ワーカーノードの数を示す障害許容数、を含む定義情報を取得するステップと、
　前記レプリカセット数、前記アフィニティルールおよび前記障害許容数を前記定義情報から抽出し、前記障害許容数以下の障害が前記ワーカーノードに発生した場合でも、前記レプリカセット数を満たし、かつ、前記アフィニティルールで規定される条件を満たした上で、最低限必要な前記ワーカーノードの数を示す必要ワーカーノード数を算出するステップと、
　算出された前記必要ワーカーノード数を含む、リソースの払い出しの指示情報であるリソース払出指示情報を、リソース管理機構に送信することにより、前記必要ワーカーノード数の前記ワーカーノードをリソースとして払い出させるステップと、
　払い出された前記ワーカーノードに、前記レプリカセット数で示される数の前記Ｐｏｄの配置を決定し、前記Ｐｏｄの配置を決定したワーカーノードに、前記Ｐｏｄを構成するコンテナの設定を指示するコンテナ設定情報を送信するステップと、
　を実行することを特徴とするコンテナリソース設計方法。
　コンピュータを、請求項１乃至請求項３のいずれか一項に記載のコンテナリソース設計装置として機能させるためのプログラム。