JP7135780B2 - ライブマイグレーション調整プログラム及びライブマイグレーション調整方法 - Google Patents

ライブマイグレーション調整プログラム及びライブマイグレーション調整方法 Download PDF

Info

Publication number
JP7135780B2
JP7135780B2 JP2018221104A JP2018221104A JP7135780B2 JP 7135780 B2 JP7135780 B2 JP 7135780B2 JP 2018221104 A JP2018221104 A JP 2018221104A JP 2018221104 A JP2018221104 A JP 2018221104A JP 7135780 B2 JP7135780 B2 JP 7135780B2
Authority
JP
Japan
Prior art keywords
period
live migration
load
avoidance
group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018221104A
Other languages
English (en)
Other versions
JP2020086990A (ja
Inventor
二美 飯倉
伸吾 奥野
幸洋 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2018221104A priority Critical patent/JP7135780B2/ja
Publication of JP2020086990A publication Critical patent/JP2020086990A/ja
Application granted granted Critical
Publication of JP7135780B2 publication Critical patent/JP7135780B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、ライブマイグレーション調整プログラム及びライブマイグレーション調整方法に関する。
クラウドシステムでは、利用者の業務を実行する仮想マシン(VM:Virtual Machine)が動作する物理マシン(PM:Physical Machine)に対して定期的に計画メンテナンスが行われる。計画メンテナンス時には、VMは、停止されるか別のPMに無停止移動(LM:Live Migration:ライブマイグレーション)される。
図17は、計画メンテナンス時のLMを説明するための図である。図17(a)に示すように、最初の状態では、3台のPM2のうち、右のPM2が空PM2であるので、右のPM2のメンテナンスが行われる。ここで、空PM2とは、動作するVM21がないPM2である。
そして、右のPM2のメンテナンスが終了すると、真ん中のPM2で動作する3台のVM21が右のPM2にLMされ、図17(b)に示すように、真ん中のPM2が空PM2となる。そして、真ん中のPM2のメンテナンスが行われる。
そして、真ん中のPM2のメンテナンスが終了すると、左のPM2で動作する3台のVM21が真ん中のPM2にLMされ、図17(c)に示すように、左のPM2が空PM2となる。そして、左のPM2のメンテナンスが行われる。
このように、計画メンテナンスでは、メンテナンス対象のPM2で動作するVM21を全て他のPM2にLMするため、全てのVM21のLMをできるだけ短時間に行う必要がある。
一方、LMによってVM21の性能低下がおき、利用者の業務に影響が出ることがあるので、利用者は、LMの回避を要望する期間としてLM回避期間を指定する。このため、計画メンテナンス時のLMに時間がかかる場合がある。
図18は、計画メンテナンス時のLMに時間がかかる場合を説明するための図である。図18において、VM#1~VM#4はVM21を表す。図18(a)は、VM#1とVM#3の平均的な一日の負荷を0~100%で示す。なお、VM#2の平均的な一日の負荷はVM#1と同じであり、VM#4の平均的な一日の負荷はVM#3と同じであるとする。
VM#1とVM#2については、深夜1時~2時のみ、サービス規約上の日時メンテナンス期間なので、LMが許可される。したがって、VM#1とVM#2については、LM回避期間は、図18(b)に示すように、0時~1時と2時~24時である。また、VM#3とVM#4については、深夜1時~朝6時にバッチジョブが実行されるため、LM回避期間は、1時~6時である。
VM#1とVM#2についてはLM回避期間を除く1時にLMが行われ、VM#3とVM#4についてはLM回避期間を除く6時にLMが行われる。このため、VM#1~VM#4のLMには約5時間かかり、LMに時間がかかる。
ただし、利用者は余裕をもってLM回避期間を指定する傾向があるため、LM回避期間の中にLMが行える場合がある。図18(a)において、VM#3とVM#4の負荷は3時~4時頃低くなるので、例えば3時頃にVM#3とVM#4のLMを行うことによって、LMに要する時間を短縮することができる。
なお、LMに関しては、VMの所定の指標に関する傾向が類似するVMを同じVMM(VM Monitor)上に集約し、VMM上に集約された各VMの傾向と、各VMが他のVMM上に移動する場合の移動時間とに基づいて、各VMを移動する期間を決定する技術がある。ここで、VMMは、複数のVMを制御するソフトウェアである。この技術によれば、VMM上のVMを移動先のVMMへ高速に退避できる。
また、LMの失敗を低減するVM管理装置がある。このVM管理装置は、異なるPM内で稼働する複数のVMのそれぞれについて、アクセス数の増減の規則性を示すアクセスパターンを検出し、複数のVMの間でアクセスパターンの相関が低い組合せを特定する。そして、このVM管理装置は、特定した組合せと、各PMのリソースの空き容量とに基づいて、移行対象のVM及び移行先のPMを決定し、アクセスパターンに基づいて、当該移行対象のVMにおけるアクセス数が低下する時間帯を移行予定日時として決定する。
国際公開第2013/140524号 特開2018-55160号公報
LM回避期間中にLMを行う除外期間を特定する場合、除外期間中にLMを行っても利用者の業務に影響が出ないことを確認する必要があり、この確認は過去の実績に基づいて行われる。しかしながら、計画メンテナンスの頻度は、例えば数か月に1度であり、各VMについて影響の確認に十分な実績データを集めることができず、除外期間中のLMが利用者の業務に影響を与えないことを確認することができないという問題がある。
本発明は、1つの側面では、利用者の業務に影響を与えないことが確認された期間をLM回避期間の除外期間として特定することを目的とする。
1つの態様では、ライブマイグレーション調整プログラムは、コンピュータに、1つの物理マシン上で稼働している複数の仮想マシンそれぞれに対するユーザがライブマイグレーションの回避を希望するライブマイグレーション回避期間を取得する処理を実行させる。そして、前記ライブマイグレーション調整プログラムは、前記コンピュータに、前記複数の仮想マシンの1つである第1仮想マシンに対するライブマイグレーション回避期間の中で、負荷が第1閾値以下の低負荷期間があるか否かを判定する処理を実行させる。そして、前記ライブマイグレーション調整プログラムは、前記コンピュータに、前記低負荷期間があると判定した場合に、前記第1仮想マシンを含むグループを作成する処理を実行させる。前記グループには、前記複数の仮想マシンの中で、前記第1仮想マシンと利用者、生成元のソフトウェアイメージ及びライブマイグレーション回避期間が同じであり、ライブマイグレーション回避期間の負荷が類似する仮想マシンが含まれる。そして、前記ライブマイグレーション調整プログラムは、前記コンピュータに、前記ライブマイグレーション回避期間から除外する除外期間を特定する処理を実行させる。前記除外期間は、前記グループに含まれる仮想マシンについて過去に行われたライブマイグレーションの成否と該ライブマイグレーションが行われたときの負荷の実績に基づいて特定される。
1つの側面では、本発明は、利用者の業務に影響を与えないことが確認された期間をLM回避期間の除外期間として特定することができる。
図1は、実施例に係るクラウドシステムにおいてLM回避期間中のLMによる業務への影響を確認する方法を説明するための図である。 図2は、実施例に係るクラウドシステムの構成を示す図である。 図3は、利用者にLM回避要望を入力させる画面の例を示す図である。 図4は、LM回避期間短縮部の機能構成を示す図である。 図5は、V#3のシステム統計ログの一例を示す図である。 図6は、LM回避期間の負荷モデルの例を示す図である。 図7は、グルーピングの例を示す図である。 図8は、V#3グループのLM回避期間の負荷モデルの例を示す図である。 図9は、LM作業ログとシステム統計ログの突き合わせを説明するための図である。 図10は、除外期間の例を示す図である。 図11は、LM回避期間の短縮例を示す図である。 図12は、短縮したLM回避期間に基づくLMの実施について、利用者に許可を求める画面の例を示す図である。 図13は、メンテナンス調整部によるスケジュール作成処理のフローを示すフローチャートである。 図14は、メンテナンス調整部によるスケジュール調整処理のフローを示すフローチャートである。 図15は、実施例に係るLM回避期間短縮による効果を説明するための図である。 図16は、PMのハードウェア構成を示す図である。 図17は、計画メンテナンス時のLMを説明するための図である。 図18は、計画メンテナンス時のLMに時間がかかる場合を説明するための図である。
以下に、本願の開示するライブマイグレーション調整プログラム及びライブマイグレーション調整方法の実施例を図面に基づいて詳細に説明する。なお、この実施例は開示の技術を限定するものではない。
まず、実施例に係るクラウドシステムにおいてLM回避期間中のLMによる業務への影響を確認する方法について説明する。図1は、実施例に係るクラウドシステムにおいてLM回避期間中のLMによる業務への影響を確認する方法を説明するための図である。図1において、VM#1~VM#5は1つのPM2で動作するVM21を表す。また、矢印はLM回避期間を示し、折線は毎日のVM21の負荷の傾向を示す。負荷は、例えばCPU使用率、メモリ使用量、ディスクの1秒間のI/Oリクエスト数、ネットワーク6の1秒間の送信及び受信のパケット数である。
図1に示すように、実施例に係るクラウドシステムは、VM#1とVM#2、及び、VM#3とVM#4がそれぞれ似ているので、似たVM同士をグルーピングする。ここで、実施例に係るクラウドシステムは、似ているか否かを、LM回避期間、LM回避期間の負荷の傾向で判断する。例えば、VM#5は、VM#3及びVM#4とLM回避期間が同じであるが、LM回避期間の負荷の傾向が違うので、VM#3及びVM#4と同じグループにグルーピングされない。
そして、実施例に係るクラウドシステムは、同じグループでは、LMの成功の条件(負荷等)も同じと仮定する。例えば、VM#3の時点t1、時点t2でLMが成功した記録がLM作業ログにあれば、実施例に係るクラウドシステムは、VM#4の時点t3、時点t4等の負荷が同じ時点でもLMが成功する確率が高いとする。
このように、実施例に係るクラウドシステムは、似たVM同士をグルーピングし、同じグループで負荷が近い時点でのLMの実績に基づいて、LM回避期間中に行うLMが利用者の業務に影響を与えるか否かを確認する。したがって、実施例に係るクラウドシステムは、LMの実績が少ないVM21についても、LMが利用者の業務に影響を与えるか否かを確認することができる。
なお、同じグループにグルーピングされるVM21は、LM回避期間とLM回避期間の負荷の傾向が同じである他に、利用者が同じであり、生成元のソフトウェアイメージが同じである必要がある。ここで、ソフトウェアイメージとは、ディスクにインストールされた状態のソフトウェアであり、VM21は、VM21についての複数のソフトウェアイメージの中から選択されたソフトウェアイメージから生成される。ソフトウェアイメージには、例えば、データベースサーバ用のVM21のソフトウェアイメージ、Webサーバ用のVM21のソフトウェアイメージがある。以下の説明では、V#1~V#5は、利用者が同じであり、生成元のソフトウェアイメージが同じであるとする。
次に、実施例に係るクラウドシステムの構成について説明する。図2は、実施例に係るクラウドシステムの構成を示す図である。図2に示すように、実施例に係るクラウドシステム1は、3台のPM2と、PM3と、ストレージ4と、操作端末5とを有する。3台のPM2と、PM3と、操作端末5とは、ネットワーク6で接続される。なお、クラウドシステム1は、3台より少ない、あるいは多い数のPM2を有してもよい。
PM2は、コンピュータである。PM2では、3台のVM21と、仮想化ソフトウェア22とが動作する。VM21は、仮想のコンピュータである。VM21では、利用者の業務が処理される。仮想化ソフトウェア22は、PM2を仮想化するソフトウェアである。仮想化ソフトウェア22は、VM21を制御する。仮想化ソフトウェア22は、他のPM2の仮想化ソフトウェア22と連携してLMを行う。なお、PM2は、3台より少ない、あるいは多い数のVM21を動作させてもよい。
PM3は、コンピュータである。PM3では、監視部31と、クラウドコントローラ32と、メンテナンス調整部33とが動作する。
監視部31は、VM21のシステム統計ログを収集する。システム統計ログには、例えばCPU使用率のログ、メモリ使用量のログ、ディスクの1秒間のI/Oリクエスト数のログ、ネットワーク6の1秒間の送信及び受信のパケット数のログ等の負荷ログがある。
クラウドコントローラ32は、クラウドシステム1を制御する。クラウドコントローラ32は、仮想化ソフトウェア22にLMを指示し、LM作業ログを収集する。
メンテナンス調整部33は、PM2のメンテナンススケジュールを作成し、作成したメンテナンススケジュールを基に利用者と調整を行い、全ての利用者から承認を得ると、メンテナンススケジュールを確定する。メンテナンス調整部33は、LM回避期間短縮部60とスケジュール作成部70とを有する。
LM回避期間短縮部60は、VM毎に、利用者からLM回避要望を受け付け、可能であればLM回避期間を短縮し、LM回避期間をスケジュール作成部70に渡す。スケジュール作成部70は、VM毎のLM回避期間に基づいてLM及びPM2のメンテナンスのスケジュールを作成する。
なお、監視部31とクラウドコントローラ32とメンテナンス調整部33は、VM21で動作してもよい。あるいは、監視部31とクラウドコントローラ32とメンテナンス調整部33は、異なるPM3で動作してもよい。あるいは、監視部31とクラウドコントローラ32とメンテナンス調整部33の一部が別のPM3で動作してもよい。
ストレージ4は、監視部31により収集されたシステム統計ログ41、クラウドコントローラ32により収集されたLM作業ログ42、スケジュール作成部70により作成されたメンテナンススケジュール43を記憶する。また、ストレージ4は、利用者により入力されたLM回避要望44を記憶する。
操作端末5は、クラウドシステム1の管理者がPM2及びPM3を操作する場合に用いる端末である。
次に、LM回避期間短縮部60の詳細について説明する。図3は、利用者にLM回避要望44を入力させる画面の例を示す図である。図3に示すように、LM回避期間短縮部60は、画面36を表示装置に表示し、LM回避要望44の対象となるVM21と、LM回避要望が日次であるか週次であるかそれ以外であるかを利用者に選択させる。そして、利用者が「次へ」を押下すると、LM回避期間短縮部60は、利用者の選択に基づいて画面37を表示し、LMを禁止する期間又はLMを許可する期間を入力させる。そして、利用者が「登録」を押下すると、ストレージ4にLM回避要望44として格納する。
図4は、LM回避期間短縮部60の機能構成を示す図である。図4に示すように、LM回避期間短縮部60は、負荷モデル作成部61と、グルーピング部62と、成功率算出部63と、短縮部64と、記憶部65とを有する。
負荷モデル作成部61は、LM回避要望44を受け付け、LM回避要望44が指定されたVM21について、システム統計ログ41を用いて、LM回避期間にもかかわらず負荷の低い低負荷期間があるか否かを判定する。ここで、負荷モデル作成部61は、LM回避期間でない期間の負荷は低いと仮定し、LM回避期間でない期間の負荷の平均値μと分散σに基づいて低負荷閾値を計算し、LM回避期間で負荷が低負荷閾値以下である期間を低負荷期間とする。低負荷閾値は、例えばμ+3σである。
図5は、V#3のシステム統計ログ41の一例を示す図である。図5は、V#3の各時刻の負荷を示す。例えば、day#1の0時に測定された負荷は5であり、1時に測定された負荷は70であり、2時に測定された負荷は80である。図5では、2日間の負荷だけが示されているが、負荷モデル作成部61は、平均値μと分散σの計算にはより多くの日数の負荷を用いてもよい。
図5では、1時~6時がLM回避期間である。負荷モデル作成部61は、LM回避期間でない期間である0時と7時~23時の負荷の平均値μと分散σを計算する。図5では、点線で囲まれた負荷が平均値μと分散σの計算に用いられる。
また、負荷モデル作成部61は、LM回避期間の負荷の平均を計算し、VM21のLM回避期間の負荷モデルとして記憶部65に格納する。図6は、LM回避期間の負荷モデルの例を示す図である。図6は、図5に基づいて作成され、V#3のLM回避期間の負荷モデルである。図6に示すように、1時~6時の負荷の平均値がLM回避期間の負荷モデルである。
そして、負荷モデル作成部61は、平均値μと分散σ、及び、LM回避期間の負荷モデルに基づいて、LM回避期間に低負荷期間があるか否かを判定する。例えば、低負荷閾値=μ+3σ=5であるとすると、図6に示す負荷モデルでは3時及び4時の負荷の平均値が低負荷閾値以下であるので、負荷モデル作成部61は、V#3には、3時~4時に低負荷期間があると判定する。
グルーピング部62は、負荷モデル作成部61によりLM回避期間に低負荷期間があると判定された場合に、低負荷期間があると判定された対象VM21を含むグループを作成する。ここで、対象VM21とは、LM回避期間に低負荷期間があるか否かの判定の対象となったVM21である。グルーピング部62は、対象VM21と利用者が同じであり、同じソフトウェアイメージから生成され、LM回避期間が同じであり、LM回避期間の負荷モデルが類似するVM21を同じグループのVM21とする。
グルーピング部62は、LM回避期間の負荷モデルが類似するか否かの判断を、例えば、LM回避期間の負荷モデルをベクトルとし、ベクトル同士のコサイン類似度を計算して行う。そして、グルーピング部62は、コサイン類似度を用いてVM21のクラスタリングを行うことで、対象VM21を含むグループを作成する。クラスタリングのアルゴリズムとしては、例えばk-means法がある。
図7は、グルーピングの例を示す図である。図7に示すように、V#3とV#4は、LM回避期間が同じで、LM回避期間の負荷モデルが類似するので、V#3とV#4は同じグループにグルーピングされる。
また、グルーピング部62は、グループのLM回避期間の負荷モデルを作成して記憶部65に格納する。図8は、V#3グループのLM回避期間の負荷モデルの例を示す図である。ここで、V#3グループとは、対象VM21であるV#3を含むグループである。図8では、図7に示したV#3とV#4の負荷の平均値を用いて、V#3グループのLM回避期間の負荷モデルが作成される。
成功率算出部63は、対象VM21を含むグループのVM21について、LM作業ログ42とシステム統計ログ41を突き合わせることで、負荷とLMの成否の対応付けを行い、負荷とLMの成否の対応付けに基づいて、負荷毎にLMの成功率を計算する。
図9は、LM作業ログ42とシステム統計ログ41の突き合わせを説明するための図である。例えば、LM作業ログ42において、○月○日の13:50にVM#3がPM#2にLMされ、○月○日の13:51にVM#3のPM2を確認するとPM#2であるので、○月○日の13:50のLMは成功している。また、システム統計41によれば、○月○日の13:50に近い○月○日の14時の負荷は5%であるので、負荷の5%とLMの成功が対応付けられる。
成功率算出部63は、このような突き合わせを対象VM21を含むグループのVM21のLMについて行うことで、負荷毎にLMの成功率を計算する。そして、成功率算出部63は、例えば成功率が90%以上である負荷を特定して記憶部65に格納する。図9では、LMの成功率が90%以上の成功負荷閾値として5%が特定される。すなわち、5%以下の負荷の場合には、LMの成功率が90%以上である。なお、90%は成功率閾値の一例であり、成功率閾値は他の値でもよい。成功率閾値を100%とすると、LMが全て成功した成功負荷閾値が特定される。
短縮部64は、成功率算出部63により特定された成功負荷閾値以下の除外期間を対象VM21を含むグループの負荷モデルに基づいて特定し、特定した除外期間をLM回避期間から除外することで、LM回避期間を短縮する。図10は、除外期間の例を示す図である。図10に示すように、V#3グループの負荷モデルから負荷が5%以下の期間として3時~4時が除外期間として特定される。図11は、LM回避期間の短縮例を示す図である。図11に示すように、VM#3及びVM#4のLM回避期間が1時~6時から1時~3時と5時~6時に短縮される。
また、短縮部64は、短縮したLM回避期間に基づくLMの実施について、利用者に許可を求め、利用者の許可が得られると、LMの実施時間を確定する。図12は、短縮したLM回避期間に基づくLMの実施について、利用者に許可を求める画面の例を示す図である。図12に示すように、画面38は、VM#3について利用者によるLM回避要望44は1時~6時であったが、LMを3時~4時に実施してもよいか否かの回答を利用者から受け付ける。利用者が希望すれば、画面39が表示され、LMが実施されるときの負荷は5%以下であり、LM回避要望44の期間の負荷とほぼ同じであることが示される。
記憶部65は、対象VM21のLM回避期間の負荷モデル、対象VM21を含むグループの負荷モデル、LMの成功率が成功率閾値以上である負荷等を記憶する。
次に、メンテナンス調整部33による処理のフローについて説明する。図13は、メンテナンス調整部33によるスケジュール作成処理のフローを示すフローチャートである。図13に示すように、メンテナンス調整部33は、LM回避期間以外の対象VM21の負荷の平均及び分散を算出し、算出した平均及び分散に基づいて、対象VM21のLM回避期間に低負荷期間があるか否かを判定する(ステップS1)。
そして、対象VM21のLM回避期間に低負荷期間がある場合に、メンテナンス調整部33は、各VM21について、LM回避期間の負荷モデルを作成し(ステップS2)、作成した負荷モデルの類似度でVM21をグルーピングする(ステップS3)。なお、同じグループに含まれるVM21は、利用者が同じで、生成元のソフトウェアイメージが同じであり、LM回避期間が同じである。
そして、メンテナンス調整部33は、対象VM21を含むグループについて、LM作業ログ42とシステム統計ログ41を突き合わせ、負荷毎のLM成功率を算出する(ステップS4)。そして、メンテナンス調整部33は、対象VM21を含むグループのLM回避期間の負荷モデルからLM成功率が成功率閾値以上の期間を特定し(ステップS5)、LM回避期間を短縮する(ステップS6)。
そして、メンテナンス調整部33は、短縮したLM回避期間に基づくLMのスケジュールについて利用者の承認が得られると、メンテナンススケジュールを作成する(ステップS7)。
このように、メンテナンス調整部33は、LM回避期間を短縮することで、PM2で動作する全VM21のLMに要する時間を短縮することができる。
図14は、メンテナンス調整部33によるスケジュール調整処理のフローを示すフローチャートである。図14に示すように、メンテナンス調整部33は、利用者にLM予定を提示し(ステップS11)、LM予定を利用者が許可したか否かを判定する(ステップS12)。
そして、利用者が許可しなかった場合には、メンテナンス調整部33は、許可済みのLM予定を動かさないで再スケジュールし(ステップS13)、ステップS11に戻る。一方、利用者が許可した場合には、メンテナンス調整部33は、全ての利用者が許可したか否かを判定し(ステップS14)、全ての利用者が許可した場合には、スケジュール調整処理を終了し、許可していない利用者がいる場合には、ステップS11に戻る。
このように、メンテナンス調整部33は、利用者に許可を得ることで、利用者の同意の上でPM2で動作する全VM21のLMに要する時間を短縮することができる。
図15は、実施例に係るLM回避期間短縮による効果を説明するための図である。図15に示すように、従来は、VM#1とVM#2のLMが1時に開始され、VM#3とVM#4のLMが6時に開始されるとすると、全体のLM時間は約5時間である。一方、実施例に係るLM回避期間短縮に基づくLMでは、VM#1とVM#2のLMが1時に開始され、VM#3とVM#4のLMが3時に開始されるとすると、全体のLM時間は約2時間である。したがって、実施例に係るLM回避期間短縮により、全体のLM時間を短縮することができる。
次に、PM3のハードウェア構成について説明する。図16は、PM3のハードウェア構成を示す図である。図16に示すように、PM3は、メインメモリ51と、CPU(Central Processing Unit)52と、LAN(Local Area Network)インタフェース53と、HDD(Hard Disk Drive)54とを有する。また、PM3は、スーパーIO(Input Output)55と、DVI(Digital Visual Interface)56と、ODD(Optical Disk Drive)57とを有する。
メインメモリ51は、プログラムやプログラムの実行途中結果等を記憶するメモリである。CPU52は、メインメモリ51からプログラムを読み出して実行する中央処理装置である。CPU52は、メモリコントローラを有するチップセットを含む。
LANインタフェース53は、コンピュータ50をLAN経由で他のコンピュータに接続するためのインタフェースである。HDD54は、プログラムやデータを格納するディスク装置であり、スーパーIO55は、マウスやキーボード等の入力装置を接続するためのインタフェースである。DVI56は、液晶表示装置を接続するインタフェースであり、ODD57は、DVDの読み書きを行う装置である。
LANインタフェース53は、PCIエクスプレス(PCIe)によりCPU52に接続され、HDD54及びODD57は、SATA(Serial Advanced Technology Attachment)によりCPU52に接続される。スーパーIO55は、LPC(Low Pin Count)によりCPU52に接続される。
そして、PM3においてメンテナンス調整部33として動作するメンテナンス調整プログラムは、PM3により読み出し可能な記録媒体の一例であるDVDに記憶され、ODD57によってDVDから読み出されてPM3にインストールされる。あるいは、メンテナンス調整プログラムは、LANインタフェース53を介して接続された他のコンピュータシステムのデータベース等に記憶され、これらのデータベースから読み出されてPM3にインストールされる。そして、インストールされたメンテナンス調整プログラムは、HDD54に記憶され、メインメモリ51に読み出されてCPU52によって実行される。
上述してきたように、実施例では、負荷モデル作成部61が、対象VM21のLM回避期間に低負荷期間があるか否かを低負荷閾値を用いて判定する。そして、対象VM21のLM回避期間に低負荷期間がある場合に、グルーピング部62が、LM回避期間の負荷モデルの類似度でVM21をグルーピングする。そして、成功率算出部63が、対象VM21を含むグループのLMの実績から、負荷の値毎のLM成功率を算出する。そして、短縮部64が、LM成功率が成功率閾値以上の除外期間を特定する。したがって、LM回避期間短縮部60は、利用者の業務に影響を与えないことが確認された期間を除外期間として特定することができる。
また、実施例では、短縮部64は、LM成功率が成功率閾値以上の負荷の閾値として成功負荷閾値を特定し、対象VM21を含むグループのLM回避期間の負荷モデルから負荷が成功負荷閾値以下の期間を除外期間として特定する。したがって、LM回避期間短縮部60は、除外期間を適切に特定することができる。
また、実施例では、短縮部64は、成功率閾値として100%を用いることで、過去の実績においてLMの失敗のない期間を除外期間として特定するので、信頼性の高い除外期間を特定することができる。
また、実施例では、負荷モデル作成部61は、対象VM21のLM回避期間以外の負荷の平均及び分散を計算し、計算した平均及び分散に基づいて低負荷閾値を特定する。したがって、負荷モデル作成部61は、LM回避期間に低負荷期間があるか否かを正確に判定することができる。
また、実施例では、グルーピング部62は、LM回避期間の複数の時点の負荷のベクトルの類似度に基づいてVM21をクラスタリングすることでグループを作成するので、VM21を正確にグループ分けすることができる。
また、実施例では、LM回避期間を用いる場合について説明したが、メンテナンス調整部33は、LM回避期間の代わりにLM許容期間を用いてもよい。すなわち、メンテナンス調整部33は、ユーザに指定されたLM許容期間を拡張してもよい。
また、実施例では、LM回避期間短縮部60は、特定の対象VM21についてLM回避期間に負荷が低い期間があるか否かを判定し、LM回避期間に負荷が低い期間がある場合に、対象VM21を含むグループを作成した。しかしながら、LM回避期間短縮部60は、まずVM21をグルーピングし、グループの負荷に基づいてLM回避期間に負荷が低い低負荷期間があるか否かを判定し、低負荷期間がある場合に、過去の実績に基づいて低負荷期間を除外期間としてもよい。
1 クラウドシステム
2 PM
3 PM
4 ストレージ
5 操作端末
6 ネットワーク
21 VM
22 仮想化ソフトウェア
31 監視部
32 クラウドコントローラ
33 メンテナンス調整部
36,37,38,39 画面
41 システム統計ログ
42 LM作業ログ
43 メンテナンススケジュール
44 LM回避要望
51 メインメモリ
52 CPU
53 LANインタフェース
54 HDD
55 スーパーIO
56 DVI
57 ODD
60 LM回避期間短縮部
61 負荷モデル作成部
62 グルーピング部
63 成功率算出部
64 短縮部
65 記憶部
70 スケジュール作成部

Claims (7)

  1. コンピュータに、
    1つの物理マシン上で稼働している複数の仮想マシンそれぞれに対するユーザがライブマイグレーションの回避を希望するライブマイグレーション回避期間を取得し、
    前記複数の仮想マシンの1つである第1仮想マシンに対するライブマイグレーション回避期間の中で、負荷が第1閾値以下の低負荷期間があるか否かを判定し、
    前記低負荷期間があると判定した場合に、前記複数の仮想マシンの中で、前記第1仮想マシンと利用者、生成元のソフトウェアイメージ及びライブマイグレーション回避期間が同じであり、ライブマイグレーション回避期間の負荷が類似する仮想マシンを、前記第1仮想マシンと一緒にしてグループを作成し、
    前記グループに含まれる仮想マシンについて過去に行われたライブマイグレーションの成否と該ライブマイグレーションが行われたときの負荷の実績に基づいて、前記ライブマイグレーション回避期間から除外する除外期間を特定する
    処理を実行させることを特徴とするライブマイグレーション調整プログラム。
  2. 前記除外期間を特定する処理は、
    前記グループに含まれる仮想マシンの負荷に基づいて前記ライブマイグレーション回避期間における前記グループとしてのグループ負荷を計算し、
    ライブマイグレーションが成功した割合が第2閾値以上である負荷の閾値として第3閾値を特定し、
    前記グループ負荷が前記第3閾値以下である期間を前記除外期間として特定することを特徴とする請求項1に記載のライブマイグレーション調整プログラム。
  3. 前記第2閾値は、100%であることを特徴とする請求項2に記載のライブマイグレーション調整プログラム。
  4. 前記第3閾値を特定する処理は、前記グループに含まれる仮想マシンについてライブマイグレーションの作業ログと負荷のログを突き合わせることで負荷の値とライブマイグレーションの成否との対応付けを複数の負荷について行い、該対応付けに基づいて負荷の値毎にライブマイグレーションの成功率を計算して前記第3閾値を特定することを特徴とする請求項2に記載のライブマイグレーション調整プログラム。
  5. 前記低負荷期間があるか否かを判定する処理で用いられ第1閾値は、前記ライブマイグレーション回避期間以外の前記第1仮想マシンの負荷を用いて算出されることを特徴とする請求項1~4のいずれか1つに記載のライブマイグレーション調整プログラム。
  6. 前記グループを作成する処理は、前記ライブマイグレーション回避期間の複数の時点の負荷のベクトルの類似度に基づいて仮想マシンをクラスタリングすることによって前記グループを作成することを特徴とする請求項1~5のいずれか1つに記載のライブマイグレーション調整プログラム。
  7. コンピュータが、
    1つの物理マシン上で稼働している複数の仮想マシンそれぞれに対するユーザがライブマイグレーションの回避を希望するライブマイグレーション回避期間を取得し、
    前記複数の仮想マシンの1つである第1仮想マシンに対するライブマイグレーション回避期間の中で、負荷が第1閾値以下の低負荷期間があるか否かを判定し、
    前記低負荷期間があると判定した場合に、前記複数の仮想マシンの中で、前記第1仮想マシンと利用者、生成元のソフトウェアイメージ及びライブマイグレーション回避期間が同じであり、ライブマイグレーション回避期間の負荷が類似する仮想マシンを、前記第1仮想マシンと一緒にしてグループを作成し、
    前記グループに含まれる仮想マシンについて過去に行われたライブマイグレーションの成否と該ライブマイグレーションが行われたときの負荷の実績に基づいて、前記ライブマイグレーション回避期間から除外する除外期間を特定する
    処理を実行することを特徴とするライブマイグレーション調整方法。
JP2018221104A 2018-11-27 2018-11-27 ライブマイグレーション調整プログラム及びライブマイグレーション調整方法 Active JP7135780B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018221104A JP7135780B2 (ja) 2018-11-27 2018-11-27 ライブマイグレーション調整プログラム及びライブマイグレーション調整方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018221104A JP7135780B2 (ja) 2018-11-27 2018-11-27 ライブマイグレーション調整プログラム及びライブマイグレーション調整方法

Publications (2)

Publication Number Publication Date
JP2020086990A JP2020086990A (ja) 2020-06-04
JP7135780B2 true JP7135780B2 (ja) 2022-09-13

Family

ID=70908270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018221104A Active JP7135780B2 (ja) 2018-11-27 2018-11-27 ライブマイグレーション調整プログラム及びライブマイグレーション調整方法

Country Status (1)

Country Link
JP (1) JP7135780B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012181673A (ja) 2011-03-01 2012-09-20 Nec Corp リソース割当装置、リソース割当方法、およびプログラム
WO2013140524A1 (ja) 2012-03-19 2013-09-26 富士通株式会社 プログラム、管理サーバおよびパッチスケジューリング方法
JP2014078160A (ja) 2012-10-11 2014-05-01 International Business Maschines Corporation 仮想リソースの組み合わせの決定を支援する装置及び方法
JP2018028746A (ja) 2016-08-16 2018-02-22 富士通株式会社 仮想マシン管理プログラム、仮想マシン管理方法、及び、仮想マシン管理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012181673A (ja) 2011-03-01 2012-09-20 Nec Corp リソース割当装置、リソース割当方法、およびプログラム
WO2013140524A1 (ja) 2012-03-19 2013-09-26 富士通株式会社 プログラム、管理サーバおよびパッチスケジューリング方法
JP2014078160A (ja) 2012-10-11 2014-05-01 International Business Maschines Corporation 仮想リソースの組み合わせの決定を支援する装置及び方法
JP2018028746A (ja) 2016-08-16 2018-02-22 富士通株式会社 仮想マシン管理プログラム、仮想マシン管理方法、及び、仮想マシン管理装置

Also Published As

Publication number Publication date
JP2020086990A (ja) 2020-06-04

Similar Documents

Publication Publication Date Title
US10838803B2 (en) Resource provisioning and replacement according to a resource failure analysis in disaggregated data centers
JP6455035B2 (ja) 負荷分散管理装置、制御方法およびプログラム
US10873623B2 (en) Dynamically modifying a cluster of computing nodes used for distributed execution of a program
US9485160B1 (en) System for optimization of input/output from a storage array
US8707308B1 (en) Method for dynamic management of system resources through application hints
US11095530B2 (en) Service level management of a workload defined environment
US20200099592A1 (en) Resource lifecycle optimization in disaggregated data centers
US20070156731A1 (en) Automatic project management application
US9170840B2 (en) Duration sensitive scheduling in a computing environment
US8639818B1 (en) System and method for reliable and timely task completion in a distributed computing environment
US10754720B2 (en) Health check diagnostics of resources by instantiating workloads in disaggregated data centers
US11188408B2 (en) Preemptive resource replacement according to failure pattern analysis in disaggregated data centers
US9953276B2 (en) Method and system that measures and reports computational-resource usage in a data center
US10761915B2 (en) Preemptive deep diagnostics and health checking of resources in disaggregated data centers
US8428986B2 (en) Return on investment analysis tool for storage systems
US20200097349A1 (en) Diagnostic health checking and replacement of resources in disaggregated data centers
US20220245036A1 (en) Data-Driven Virtual Machine Recovery
US11675521B2 (en) Comprehensive data protection backup
JP6229733B2 (ja) 情報処理装置、方法、プログラム及び記録媒体
JP7135780B2 (ja) ライブマイグレーション調整プログラム及びライブマイグレーション調整方法
JP6622808B2 (ja) 管理計算機および計算機システムの管理方法
US11720269B1 (en) Predictive block storage size provisioning for cloud storage volumes
US20220147380A1 (en) Optimizing Hybrid Cloud Usage
US11301362B1 (en) Control system for distributed load generation
US11210159B2 (en) Failure detection and correction in a distributed computing system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220610

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220802

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220815

R150 Certificate of patent or registration of utility model

Ref document number: 7135780

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150