JP7552433B2 - コンテナ管理方法およびコンテナ管理プログラム - Google Patents
コンテナ管理方法およびコンテナ管理プログラム Download PDFInfo
- Publication number
- JP7552433B2 JP7552433B2 JP2021029244A JP2021029244A JP7552433B2 JP 7552433 B2 JP7552433 B2 JP 7552433B2 JP 2021029244 A JP2021029244 A JP 2021029244A JP 2021029244 A JP2021029244 A JP 2021029244A JP 7552433 B2 JP7552433 B2 JP 7552433B2
- Authority
- JP
- Japan
- Prior art keywords
- container
- cluster
- group
- failover
- containers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 title claims description 37
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 1
- 238000000034 method Methods 0.000 claims description 50
- 238000012544 monitoring process Methods 0.000 claims description 34
- 238000004891 communication Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 28
- 230000015556 catabolic process Effects 0.000 claims description 17
- 238000006731 degradation reaction Methods 0.000 claims description 17
- 238000013508 migration Methods 0.000 claims description 8
- 230000005012 migration Effects 0.000 claims description 8
- 238000012790 confirmation Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 40
- 238000010586 diagram Methods 0.000 description 26
- 230000004044 response Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 8
- 230000005856 abnormality Effects 0.000 description 6
- 230000007850 degeneration Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000036541 health Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000001934 delay Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Landscapes
- Hardware Redundancy (AREA)
Description
前記第一のクラスタとは異なる第二のクラスタに配備されている第二のコンテナの状態監視を実行し、前記状態監視の結果に応じて、前記第二のクラスタとは異なる第三のクラスタに、前記第二のコンテナのフェイルオーバの実行を指示する、ことを特徴とする。
図1は、実施例1にかかるコンテナシステムの全体構成例を示す図である。図1に示すように、実施例1にかかるコンテナシステムは、複数の物理サーバや物理サーバ上で動作する仮想マシン(VM:Virtual Machine)により提供されるマルチクラスタで構成される。図1の例では、クラスタ1からクラスタ5の5つのクラスタリングシステムが実行されている一例を図示している。また、各クラスタは、1台以上の物理サーバまたは1台以上のVMにより提供されるとともに、それぞれが異なる物理サーバやVMで提供されている。また、コンテナシステムでは、一例としてKubernetes(登録商標)を用いて、コンテナが実行されているものとする。
次に、コンテナシステムを構成する各サーバの機能構成を説明する。なお、各クラスタサーバは、同様の構成を有するので、ここではクラスタサーバ200について説明する。図5は、実施例2にかかるマスタサーバとクラスタサーバの機能構成を示す機能ブロック図である。
図5に示すように、マスタサーバ100は、通信部101、記憶部102、制御部110を有する。
図5に示すように、クラスタサーバ200は、通信部201、記憶部202、制御部210を有する。
次に、コンテナシステムで実行される各コンテナの機能構成を説明する。なお、各クラスタサーバ内の各コンテナは、同様の構成を有するので、ここではクラスタサーバ200について説明する。図8は、実施例2にかかるコンテナシステム内の各コンテナの機能構成を説明する図である。なお、各クラスタで実行される各コンテナは、図4のとおりとする。
図4に示すように、クラスタ1では、マスタスケジューラと、コンテナA1と、コンテナC1とが実行されるが、ここではマスタスケジューラについて説明する。なお、コンテナA1とコンテナC1は、クラスタ2のコンテナと同様の構成を有するので、ここでは詳細な説明は省略する。
クラスタ2は、図4に示すように、スケジューラと、コンテナA2と、コンテナB2と、コンテナC2とが実行されるが、各コンテナは同様の構成を有するので、ここではスケジューラとコンテナA2について説明する。
次に、図10から図13を用いて、フェイルオーバの具体例を説明する。図10は、コンテナ間の監視を説明する図である。図10に示すように、具体例に示すコンテナシステムは、クラスタ1、クラスタ2、クラスタ3、クラスタ4、クラスタ5を有する。
クラスタ1には、マスタスケジューラ130とコンテナA1とコンテナC1が配備され、クラスタ2には、スケジューラ230とコンテナA2とコンテナB2とコンテナC2が配備され、クラスタ3には、スケジューラ330とコンテナB3が配備される。クラスタ4には、スケジューラ430とコンテナA4とコンテナB4とコンテナC4が配備され、クラスタ5には、スケジューラ530とコンテナB5とコンテナC5が配備される。
このような構成において、各コンテナは、同一コンテナグループ内のコンテナ間で相互に死活監視を実行する。例えば、図10に示すように、コンテナA1、コンテナA2、コンテナA4は、相互に監視する。なお、図10では、コンテナグループAを例示したが、コンテナB2、コンテナB3、コンテナB4、コンテナB5も相互に監視し、コンテナC1、コンテナC2、コンテナC4、コンテナC5も相互に監視する。
次に、一例として、クラスタ4のコンテナA4がクラスタ2の障害を検出した例を説明する。図11は、障害検出を説明する図である。図11に示すように、コンテナA4は、クラスタ2のコンテナA2から、定期的に送信する死活確認メッセージの応答を受信できない場合に、クラスタ2またはコンテナA2の停止を検出する。すると、コンテナA4は、フェイルオーバ先DBに記憶される情報にしたがって、フェイルオーバ先へ障害通知を実行する。
次に、フェイルオーバについて説明する。図12は、フェイルオーバを説明する図である。図12に示すように、クラスタ3のスケジューラ330は、コンテナB3から、クラスタ2のコンテナA2の障害発生が通知されると、イメージファイルDBからコンテナAの情報を取得して、コンテナA3として配備した上で動作させる。この結果、コンテナグループAは、障害発生前ではコンテナA1、コンテナA2、コンテナA4でサービスを提供していたが、障害発生後ではコンテナA1、コンテナA3、コンテナA4でサービス提供を継続することができる。
その後は、マスタスケジューラ130が稼働情報を収集することで、コンテナシステム内でフェイルオーバが共有される。図13は、フェイルオーバ後の稼働情報の収集を説明する図である。図13に示すように、マスタスケジューラ130は、各クラスタの各スケジューラに定期的に死活監視メッセージを送信する。ここで、マスタスケジューラ130は、クラスタ2のスケジューラ230からの応答が検出できないことから、クラスタ2の障害を検出する。そして、マスタスケジューラ130は、クラスタ3のスケジューラ330から、配備されているコンテナ一覧の情報を取得することで、コンテナA4(コンテナA2)のフェイルオーバを検出する。このとき、マスタスケジューラ130は、各スケジューラから、各コンテナの稼働情報も取得する。
図14は、実施例2にかかるフェイルオーバ処理の流れを示すフローチャートである。図14に示すように、各コンテナは、監視タイミングに到達すると(S101:Yes)、同一コンテナグループ内のコンテナを選択し(S102)、死活監視メッセージを送信する(S103)。
上述したように、コンテナシステムは、第一のコンテナが他のクラスタに配備されている、第一のコンテナのレプリカである同グループの第二のコンテナの死活監視を行い、コンテナ間で障害検出を実現することができる。この結果、システム外部から全コンテナの死活監視を行う場合に比べて、限られた範囲の監視だけで、迅速に障害検知を行うことができ、フェイルオーバによる障害対処を高速に実現することができる。
図17は、重複クラスタ数によるフェイルオーバ先の特定処理の流れを示すフローチャートである。図17に示すように、クラスタサーバ200は、コンテナグループを1つ選択し(S401)、選択したコンテナグループのコンテナが動作するクラスタを特定し(S402)、選択したコンテナグルーブ以外の他コンテナグループのコンテナが動作するクラスタを特定する(S403)。
図18は、非重複クラスタ数によるフェイルオーバ先の特定処理の流れを示すフローチャートである。この処理は、例えば、図17の手法により複数の候補が選択されたときに、その複数の候補について実行して最終的に決定することができる。また、図18の手法により複数の候補が選択されたときに、その複数の候補について図17を実行して最終的に決定することができる。
図19は、通信遅延量によるフェイルオーバ先の特定処理の流れを示すフローチャートである。この処理は、例えば、図17や図18の手法、人手等により複数の候補が選択されたときに、その複数の候補について実行して最終的に決定することができる。また、図19の手法により複数の候補が選択されたときに、その複数の候補について図17や図18を実行して最終的に決定することができる。
上記実施例で用いたクラスタ数、コンテナ数、クラスタリング技術、障害内容、性能劣化の検出手法、数値例、閾値等は、あくまで一例であり、任意に変更することができる。
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
次に、上記実施例で説明した各装置のハードウェア構成例を説明する。なお、各装置は、同様のハードウェア構成を有するので、ここでは、クラスタサーバ200を例にして説明する。図20は、ハードウェア構成例を説明する図である。図20に示すように、クラスタサーバ200は、通信装置200a、HDD(Hard Disk Drive)200b、メモリ200c、プロセッサ200dを有する。また、図20に示した各部は、バス等で相互に接続される。
101 通信部
102 記憶部
103 イメージファイルDB
104 稼働情報管理DB
110 制御部
111 クラスタ実行部
112 スケジュール実行部
113 コンテナ実行部
200 クラスタサーバ
201 通信部
202 記憶部
203 イメージファイルDB
204 フェイルオーバ先DB
210 制御部
211 クラスタ実行部
212 スケジュール実行部
213 コンテナ実行部
Claims (8)
- コンテナが複数のクラスタに分散されているコンテナシステムで実行されるコンテナ管理方法において、
第一のクラスタ内に配備されている第一のコンテナが、
前記第一のクラスタとは異なる第二のクラスタに配備されている第二のコンテナの状態監視を実行し、
前記状態監視の結果に応じて、前記第二のクラスタとは異なる第三のクラスタに、前記第二のコンテナのフェイルオーバの実行を指示する、
ことを特徴とするコンテナ管理方法。 - 前記第一のコンテナは、同じサービスを提供するコンテナグループに属する他コンテナとの間で生死確認を行うことを特徴とする請求項1に記載のコンテナ管理方法。
- 前記第一のコンテナが、
前記第一のコンテナおよび前記第二のコンテナが属する第一のコンテナグループのフェイルオーバ先として、
前記コンテナシステム内の複数のコンテナグループのうち、前記第一のコンテナグループのコンテナと同じクラスタに配備される重複クラスタ数が閾値以上であるコンテナグループを選択することを特徴とする請求項1または2に記載のコンテナ管理方法。 - 前記第一のコンテナが、
前記第一のコンテナおよび前記第二のコンテナが属する第一のコンテナグループのフェイルオーバ先として、
前記コンテナシステム内の複数のコンテナグループのうち、前記第一のコンテナグループのコンテナが配備されていないクラスタに配備される非重複クラスタ数が閾値以上であるコンテナグループを選択することを特徴とする請求項1から3のいずれか一つに記載のコンテナ管理方法。 - 前記第一のコンテナが、
移行先として選択された移行先のコンテナグループに属する各コンテナと、移行元である前記第一のコンテナグループに属する各コンテナとの通信遅延量が最小となるコンテナが配備されるクラスタを前記フェイルオーバによる移行先に決定することを特徴とする請求項3または4に記載のコンテナ管理方法。 - 前記第三のクラスタが、
前記第二のコンテナをフェイルオーバさせた第四のコンテナを実行し、
前記第四のコンテナを実行後に、前記第三のクラスタの性能状態を監視し、
前記第三のクラスタの性能劣化を検出した場合に、前記第四のコンテナを削除して、前記第二のコンテナが属する前記第一のコンテナグループの縮退運転を実行する、ことを特徴とする請求項3から5のいずれか一つに記載のコンテナ管理方法。 - 前記コンテナシステム内の第四のクラスタが、
前記第一のコンテナグループの縮退運転後に、前記第一のコンテナグループの性能劣化を検出した場合に、フェイルオーバ元の前記第二のコンテナに対応する第五のコンテナを、前記第四のクラスタ内に配備したスケールアウトを実行する、ことを特徴とする請求項5に記載のコンテナ管理方法。 - コンテナが複数のクラスタに分散されているコンテナシステムで実行されるコンテナ管理プログラムにおいて、
第一のクラスタ内に配備されている第一のコンテナが、
前記第一のクラスタとは異なる第二のクラスタに配備されている第二のコンテナの状態監視を実行し、
前記状態監視の結果に応じて、前記第二のクラスタとは異なる第三のクラスタに、前記第二のコンテナのフェイルオーバの実行を指示する、
処理をコンピュータに実行させることを特徴とするコンテナ管理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021029244A JP7552433B2 (ja) | 2021-02-25 | 2021-02-25 | コンテナ管理方法およびコンテナ管理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021029244A JP7552433B2 (ja) | 2021-02-25 | 2021-02-25 | コンテナ管理方法およびコンテナ管理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022130200A JP2022130200A (ja) | 2022-09-06 |
JP7552433B2 true JP7552433B2 (ja) | 2024-09-18 |
Family
ID=83150870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021029244A Active JP7552433B2 (ja) | 2021-02-25 | 2021-02-25 | コンテナ管理方法およびコンテナ管理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7552433B2 (ja) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003030161A (ja) | 2001-07-11 | 2003-01-31 | Hitachi Ltd | 移動エージェント障害監視方法 |
WO2017168484A1 (ja) | 2016-03-28 | 2017-10-05 | 株式会社日立製作所 | 管理計算機および性能劣化予兆検知方法 |
US20170339158A1 (en) | 2016-05-17 | 2017-11-23 | Amazon Technologies, Inc. | Versatile autoscaling for containers |
JP2018156465A (ja) | 2017-03-17 | 2018-10-04 | Kddi株式会社 | コンテナ最適配置システムおよびそのコンテナ復旧方法 |
US20180336113A1 (en) | 2017-05-16 | 2018-11-22 | Vmware, Inc. | Monitoring applications running on containers |
JP2019149192A (ja) | 2014-11-11 | 2019-09-05 | アマゾン テクノロジーズ インコーポレイテッド | コンテナの管理及びスケジューリングのためのシステム |
CN110895504A (zh) | 2018-09-12 | 2020-03-20 | 北京京东尚科信息技术有限公司 | 调度仿真系统和调度仿真方法 |
JP2020177489A (ja) | 2019-04-19 | 2020-10-29 | 富士通株式会社 | 制御方法、制御プログラム、および情報処理装置 |
US20210029204A1 (en) | 2019-07-24 | 2021-01-28 | Vmware, Inc. | Methods and apparatus to generate migration recommendations to migrate services between geographic regions |
JP2021012498A (ja) | 2019-07-05 | 2021-02-04 | 株式会社野村総合研究所 | 分散型コンテナ監視システム及び分散型コンテナ監視方法 |
-
2021
- 2021-02-25 JP JP2021029244A patent/JP7552433B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003030161A (ja) | 2001-07-11 | 2003-01-31 | Hitachi Ltd | 移動エージェント障害監視方法 |
JP2019149192A (ja) | 2014-11-11 | 2019-09-05 | アマゾン テクノロジーズ インコーポレイテッド | コンテナの管理及びスケジューリングのためのシステム |
WO2017168484A1 (ja) | 2016-03-28 | 2017-10-05 | 株式会社日立製作所 | 管理計算機および性能劣化予兆検知方法 |
US20170339158A1 (en) | 2016-05-17 | 2017-11-23 | Amazon Technologies, Inc. | Versatile autoscaling for containers |
JP2018156465A (ja) | 2017-03-17 | 2018-10-04 | Kddi株式会社 | コンテナ最適配置システムおよびそのコンテナ復旧方法 |
US20180336113A1 (en) | 2017-05-16 | 2018-11-22 | Vmware, Inc. | Monitoring applications running on containers |
CN110895504A (zh) | 2018-09-12 | 2020-03-20 | 北京京东尚科信息技术有限公司 | 调度仿真系统和调度仿真方法 |
JP2020177489A (ja) | 2019-04-19 | 2020-10-29 | 富士通株式会社 | 制御方法、制御プログラム、および情報処理装置 |
JP2021012498A (ja) | 2019-07-05 | 2021-02-04 | 株式会社野村総合研究所 | 分散型コンテナ監視システム及び分散型コンテナ監視方法 |
US20210029204A1 (en) | 2019-07-24 | 2021-01-28 | Vmware, Inc. | Methods and apparatus to generate migration recommendations to migrate services between geographic regions |
Also Published As
Publication number | Publication date |
---|---|
JP2022130200A (ja) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5851503B2 (ja) | 高可用性仮想機械環境におけるアプリケーションの高可用性の提供 | |
JP5215840B2 (ja) | 非同期イベント通知 | |
JP4620455B2 (ja) | サーバ連結環境のための業務継続ポリシー | |
JP6026705B2 (ja) | 更新管理システムおよび更新管理方法 | |
US9208029B2 (en) | Computer system to switch logical group of virtual computers | |
JP2011039740A (ja) | サーバ管理システム、サーバ管理方法、及びプログラム | |
US20190171442A1 (en) | Software update control device, software update control method, and recording medium having software update control program stored thereon | |
CN108347339B (zh) | 一种业务恢复方法及装置 | |
CN111835685B (zh) | 一种监控Nginx网络隔离空间的运行状态的方法和服务器 | |
US20160036654A1 (en) | Cluster system | |
EP2645635B1 (en) | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium | |
US20130205162A1 (en) | Redundant computer control method and device | |
JP7533576B2 (ja) | コンテナリソース設計システムおよびコンテナリソース設計方法 | |
JP7552433B2 (ja) | コンテナ管理方法およびコンテナ管理プログラム | |
JP2020129184A (ja) | クラスタシステム、その制御方法、サーバ、及びプログラム | |
JP2016177324A (ja) | 情報処理装置、情報処理システム、情報処理方法、及びプログラム | |
JP2011209811A (ja) | 仮想マシンシステムおよび仮想マシン配置方法 | |
JP2015114952A (ja) | ネットワークシステム、監視制御装置およびソフトウェア検証方法 | |
JP6260470B2 (ja) | 網監視システムおよび網監視方法 | |
JP6561766B2 (ja) | 情報処理装置、クラスタシステム、クラスタリング方法、及びプログラム | |
JP7311335B2 (ja) | 分散型コンテナ監視システム及び分散型コンテナ監視方法 | |
WO2019216210A1 (ja) | サービス継続システムおよびサービス継続方法 | |
JP2008117268A (ja) | 情報管理システム | |
JP2007041646A (ja) | クライアント−サーバ型システム、並びに、その管理方法および管理プログラム | |
KR101757257B1 (ko) | Sdn 기반의 장애회복을 위한 동적제어장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231109 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240612 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240806 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7552433 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |