JP2017041191A - リソース管理装置、リソース管理プログラム、及びリソース管理方法 - Google Patents
リソース管理装置、リソース管理プログラム、及びリソース管理方法 Download PDFInfo
- Publication number
- JP2017041191A JP2017041191A JP2015163971A JP2015163971A JP2017041191A JP 2017041191 A JP2017041191 A JP 2017041191A JP 2015163971 A JP2015163971 A JP 2015163971A JP 2015163971 A JP2015163971 A JP 2015163971A JP 2017041191 A JP2017041191 A JP 2017041191A
- Authority
- JP
- Japan
- Prior art keywords
- resource
- resources
- information processing
- amount
- processing system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5014—Reservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5019—Workload prediction
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
【課題】情報処理システム間にてリソースを提供する場合に、提供する側の情報処理システムのリソースの枯渇の発生を抑制する技術を提供する。【解決手段】リソース管理装置は、複数の仮想計算機により構築される複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、複数のリソースの使用量に基づいて、第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、応答時間の閾値超過がいずれかのリソースの枯渇によるものであると判定された場合、複数のリソースの使用量に基づいて、複数のリソースのうち、枯渇したリソース以外のリソースである余剰リソースを特定し、余剰リソースを複数の情報処理システムのうち第2の情報処理システムへ提供することにより、上記課題の解決を図る。【選択図】図3
Description
本発明は、リソース管理装置、リソース管理プログラム、及びリソース管理方法に関する。
仮想化技術の浸透から、基幹系等の業務システムも仮想環境に載せることが多くなっている。そのため、例えば、一時的な処理要求の増加等が発生しても、業務への影響を発生させないことが重要となる。そのため、有限なコンピュータ資源(リソース)の最適化を図ることが求められる(例えば、特許文献1〜4)。
複数の業務システムにおける処理を複数の仮想マシン(VM)に実行させる際に、各業務システムの運用スケジュールや、処理の遅延の影響度合いに合わせて、リソースの予約により確実にリソースを確保する場合がある。ここで、予約しているリソースのうちで、余剰リソースの一部または全部は、他のシステムでリソースを予約するときに不足しているリソースとして補充することができる。以下では、このように予約されたリソースを「予約リソース」と表記する場合がある。実際の処理の段階で予約分についてもリソースを融通して確保しているため、安定してシステムを動作させることができる。
リソースを予約してリソースを確保する状況で、各業務システムがどれだけの余剰リソースを持つかを算出するには時間がかかるため、過去の実績等から、現在の余剰リソースを、相関等も考慮して推定することが考えられる。
しかしながら、複数の業務システムそれぞれで算出される余剰リソースの正確度は、過去のボトルネック状態でのリソースについての履歴情報がある業務システムと、過去のボトルネック状態でのリソースについての履歴情報が無い業務システムとでは異なる。ここで、ボトルネック状態とは、業務システム等の情報処理システムが有するリソースのうちいずれかのリソースの枯渇が発生している状態をいう。より具体的には、ボトルネック状態とは、業務システムにおいて使用される複数のリソースのうちのいずれかのリソースの使用量が割り当てられたリソースの上限値に達している場合に、その業務システム全体の処理能力が著しく低下する状態をいう。
このように、過去のボトルネック状態でのリソースについての履歴情報の有無に応じて余剰リソースの正確度が異なる。そのため、推定した余剰リソースが多い業務システムからリソースを融通することが、複数の業務システム全体として、最適なリソース配分とは限らない場合がある。たとえば、融通した業務システムが、却ってボトルネックに達する状況が生じることがありえる。
本発明の一側面として、情報処理システム間にてリソースを提供する場合に、提供する側の情報処理システムのリソースの枯渇の発生を抑制する技術を提供する。
本発明の一側面に係るリソース管理装置は、取得部と、判定部と、特定部と、提供部とを含む。取得部は、複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、第1の情報処理システムに割り当てられた複数のリソースの使用量を取得する。判定部は、複数のリソースの使用量に基づいて、第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定する。特定部は、前記応答時間の閾値超過がいずれかのリソースの枯渇によるものであると判定された場合、複数のリソースの使用量に基づいて、複数のリソースのうち、枯渇したリソース以外のリソースである余剰リソースを特定する。提供部は、余剰リソースを複数の情報処理システムのうち第2の情報処理システムへ融通する。
本発明の一側面によれば、情報処理システム間にてリソースを提供する場合に、提供する側の情報処理システムのリソースの枯渇の発生を抑制することができる。
以下にて、業務システムのボトルネックの発生における融通の問題について詳述する。
図1は、予測値に基づいて他の業務システムにリソースの空き容量を融通する場合の融通元の業務システムの選択例(第1の例)を示す。図1(A)に示すように、例えば、業務システムA,B,Cがある。業務システムA,Bは、仮想ホスト上で稼動しているとする。例えば、リソースの予約の設定を行う予約スケジューラに業務システムCの予約を追加しようとするが、仮想ホストの物理リソースに空きがないため、他の業務システムの予約リソースを融通する状況とする。
図1は、予測値に基づいて他の業務システムにリソースの空き容量を融通する場合の融通元の業務システムの選択例(第1の例)を示す。図1(A)に示すように、例えば、業務システムA,B,Cがある。業務システムA,Bは、仮想ホスト上で稼動しているとする。例えば、リソースの予約の設定を行う予約スケジューラに業務システムCの予約を追加しようとするが、仮想ホストの物理リソースに空きがないため、他の業務システムの予約リソースを融通する状況とする。
過去における、リソース使用実績とリクエスト数/sとの相関分析から、業務システムで処理可能な最大リクエスト数/s時のリソース使用量(予測値)が求められ、ボトルネック時の業務システム内VMの空き容量の合計を融通可能なリソース量とする。
例えば、業務システムAは、VMとして、Webサーバ、アプリケーション(AP)サーバ、データベース(DB)サーバを含む。業務システムAにおいて、割り当てられたリソース量に対してリソースの消費量または使用率が最も高くなる、すなわちボトルネックになるのは、APサーバであるとする。
また、業務システムAのWebサーバ、DBサーバにおいて、相関分析で求めたボトルネック時のリソースの空き量(予測値)はそれぞれ10、15であるとする。ボトルネック時のリソースの空き量とは、ある業務システムのボトルネック時において、リソースの消費量または使用率が100%の状態にあるサーバ以外のサーバのリソースの空き容量または余剰の不使用率を示す。
例えば、ボトルネック時のWebサーバのリソースの空き量(予測値)が10であるとは、次のことを示す。すなわち、APサーバのリソースの消費量または使用率が100%の状態の場合に、Webサーバのリソースの消費量または使用率が最大90%であり、10%分のリソースの余裕があると予測される。
業務システムBは、VMとして、Webサーバ、APサーバ、DBサーバを含む。業務システムBにおいても同様に、割り当てられたリソース量に対するリソースの消費量または使用率が最も高くなる、すなわちボトルネックになるのは、APサーバであるとする。また、Webサーバ、DBサーバにおいて、相関分析で求めたボトルネック時のリソースの空き容量(予測値)はそれぞれ12、18であるとする。
このような業務システムA,Bにおいてリソース量の空きの合計はそれぞれ25、30となる。ここで、リソースを融通するためにいずれかの業務システムを選択するとする。例えば、リソース量25のリソースを融通可能な業務システムの選択において、空きが業務システムAよりも多い業務システムBを選択するとする。この場合、図1(B)に示すように、業務システムBのWebサーバ、DBサーバの空き容量(予測値)12、18から合計25となるようにそれぞれ10、15の予約量が融通される。すなわち、予約量は、空き容量の12,18と同じ割合で10,15ずつ融通される。すると融通後の業務システムBの使用可能なリソース量は、Webサーバについて90、DBサーバについて85となる。
その後、業務システムBで突発的なリクエスト急増が発生した場合、予測値よりもリソース量が必要となったとする。この場合、融通した分のリソースが不足してレスポンス遅延が発生する。
例えば、図1(B)に示すように、業務システムBのDBサーバについて、使用可能なリソース量85に対して、突発的なリクエスト急増により実際に必要なリソース量が95であるとする。業務システムBのDBサーバは、予約量15を融通したことにより、予約量として設定されたリソースを使用できず、リソース不足でボトルネックとなり、レスポンスの遅延が発生する。
図2は、予測値に基づいて他の業務システムにリソースの空き容量を融通する場合の融通元の業務システムの選択例(第2の例)を示す。図2では、図1と同じ構成の業務システムAにおいて、ボトルネックを考慮しないで、リソースを他の業務システムへ融通した場合の例を示す。
図2(A)に示すように、各VMのリソース毎で、過去のリソースの使用実績と、モニタリングしている現在のリソース使用量との相関分析により今後のリソース使用量の増加分を予測し、空き容量を融通可能なリソース量とする。Webサーバ、DBサーバにおいて、相関分析で求めたボトルネック時のリソースの空き量(予測値)はそれぞれ10、15であるとする。また、ボトルネックとなるAPサーバのリソースについても空き容量として予測した5が予約量として設定され、他の業務システムへ融通される。
その後、業務システムAで突発的なリクエスト急増時に、ボトルネックリソースにて融通前よりもリソース使用量が頭打ちとなると想定する。その結果、融通前より早くレスポンス遅延が発生する。
例えば、図2(B)に示すように、APサーバでは、融通前は、リソース使用量が100%になるとリソース使用量が頭打ちとなるが、融通後はリソース使用量が95%になるとリソース使用量が頭打ちとなる。その結果、図2(C)に示すように、融通前より早くレスポンス遅延が発生する。
したがって、相関分析などで求めたボトルネック時のリソース使用量の予測値に基づいて、余剰リソース容量を融通する場合には、突発的なリクエスト急増時に対処できない場合がある。
複数のシステムそれぞれにおいて算出される余剰リソースの信頼度については、相関分析などで求めたボトルネック時のリソース使用量の予測値よりも過去にボトルネックが発生したときのリソース使用量の実測値の方が高くなる。このため、上述のように、予測値により求めた余剰リソースが多いシステムからリソースを融通することが、複数のシステム全体として、最適なリソース配分とならない場合がある。
また、各VMの余剰リソースからリソースを融通した場合に融通元の業務システムに与える影響度合いは、ボトルネックが発生したVMからリソースを融通した場合、非常に大きくなる。そのため、全VMについて画一的に余剰リソースを評価して万遍なく少しずつリソースを融通することで各VMに与えるインパクトは小さくなるが、システム全体として最適なリソース配分とならない場合がある。
更に、実測値として余剰リソースを求めるには、実際にボトルネック時のリソース使用量の分析が必要となる。しかしながら、全業務システムの全VMの膨大なリソース使用量の実績データを長期間保持しておく必要があり、かつ、融通時に短時間で、膨大なデータから融通可能なVMを特定し、そのリソース量を算出することができないため、即座に融通できない。
そこで、本実施形態では、異なる業務システムにリソースを融通する際に、複数の業務システムにおいて、過去にボトルネックが生じた業務システムが存在する場合は、当該業務システムのボトルネック時の余剰リソースを、融通するリソースとして優先する。この場合、融通後、業務に影響が出ないようボトルネックとなるリソース以外のリソースを選択して融通する。
図3は、本実施形態におけるリソース管理装置の一例を示す。リソース管理装置1は、取得部2と、判定部3と、特定部4と、提供部5とを含む。
取得部2は、複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、第1の情報処理システムに割り当てられた複数のリソースの使用量を取得する。取得部2の一例として、後述するリソース抽出部17が挙げられる。
判定部3は、複数のリソースの使用量に基づいて、第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定する。判定部3の一例として、後述するリソース抽出部17が挙げられる。
特定部4は、前記応答時間の閾値超過がいずれかのリソースの枯渇によるものであると判定された場合、複数のリソースの使用量に基づいて、複数のリソースのうち、枯渇したリソース以外のリソースである余剰リソースを特定する。特定部4の一例として、予約量設定部16が挙げられる。
提供部5は、余剰リソースを複数の情報処理システムのうち第2の情報処理システムへ提供する。提供部5の一例として、予約量設定部16が挙げられる。
このように構成することにより、情報処理システム間にてリソースを提供する場合に、提供する側の情報処理システムのリソースの枯渇の発生を抑制することができる。
特定部4は、第1の情報処理システムにいずれかのリソースの枯渇が発生したことがない場合、処理負荷と処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、複数のリソースから余剰リソースを特定する。
このように構成することにより、過去にボトルネックが発生していない場合には、処理負荷と処理負荷に応じて使用されたリソース量との相関関係に基づいて、ボトルネックルソースを特定することにより、余剰リソースを得ることができる。
特定部4は、いずれかのリソースの枯渇が発生した場合、いずれかのリソースの枯渇の発生時に仮想計算機が使用していたリソースの余剰を余剰リソースとして特定する。
このように構成することにより、業務システムにおいて、複数の仮想計算のうちの、いずれかの仮想計算機が用いるリソースがボトルネックとなっている場合、他の仮想計算機が用いるリソースの余剰分を予約量とすることができる。
取得部2は、第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の第1の情報処理システムが動作する複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得する。特定部は、第1の情報処理システムが動作する複数の仮想計算機のうち、使用量が割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する。提供部は、算出されたリソースの余剰量を複数の情報処理システムのうち第2の情報処理システムへ提供する。
このように構成することにより、複数の仮想計算機上で動作する情報処理システム間にてリソースを提供する場合に、提供する側の情報処理システムのリソースの枯渇の発生を抑制することができる。
特定部は、第1の情報処理システムが動作する複数の仮想計算機のうち、使用量が割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、次の処理を行う。特定部は、所定の関係情報に基づいて、第1の情報処理システムが動作する複数の仮想計算機のうち、使用量が割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する。所定の関係情報とは、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報である。
このように構成することにより、業務システムにおいて、複数の仮想計算のうちの、いずれかの仮想計算機が用いるリソースがボトルネックとなっている場合、他の仮想計算機が用いるリソースの余剰分を予約量とすることができる。
本実施形態により、以下のことが実現できる。
図4は、本実施形態における他の業務システムにリソースの空き容量を融通する場合の融通元の業務システムの選択例(第1の例)を示す。図4(A)に示すように、例えば、業務システムA(6)及び業務システムB(7)が予約スケジューラに登録され、仮想ホストに業務システムA(6),B(7)を実行するためのリソースが割り当てられていると想定する。ここで、さらに、予約スケジューラに業務システムCの予約を追加しようとするが、仮想ホストの物理リソースに空きがないため、他の業務システムの予約リソースを融通する状況とする。
図4は、本実施形態における他の業務システムにリソースの空き容量を融通する場合の融通元の業務システムの選択例(第1の例)を示す。図4(A)に示すように、例えば、業務システムA(6)及び業務システムB(7)が予約スケジューラに登録され、仮想ホストに業務システムA(6),B(7)を実行するためのリソースが割り当てられていると想定する。ここで、さらに、予約スケジューラに業務システムCの予約を追加しようとするが、仮想ホストの物理リソースに空きがないため、他の業務システムの予約リソースを融通する状況とする。
ここで、業務システムA(6)については、過去にボトルネックが発生した実績があり、その実績に基づいて、余剰リソースが予約値として設定されているとする。一方で、業務システムB(7)については、ボトルネックが発生した実績がないため、予測値に基づいて余剰リソースが予約値として設定されているとする。
融通する業務システムとして、過去にボトルネックが発生した業務システムが優先して選択される。融通するリソース量は、過去のボトルネック発生時での、ボトルネックが発生したリソース以外のリソースの空き容量とする。ここで説明する例では、図4(A)に示すように、業務システムBよりも空きリソース量が少ないが、融通リソース量25を満たし、予測値よりも信頼度が高い、過去にボトルネックが発生した業務システムAが選択されるとする。
その後、業務システムA(6)で突発的なリクエスト急増でボトルネックが発生しても、ボトルネック時に使えるリソース量は予約で確保されているため、融通による影響がない。例えば、図4(B)に示すように、業務システムA(6)で突発的なリクエスト急増でボトルネックが発生した場合、ボトルネックが発生した実績があるAPサーバで今回もボトルネックが発生する可能性が高い。APサーバにてボトルネックが発生した場合、Webサーバ、DBサーバにおけるリソースの使用量はそれぞれ、87、88で頭打ちにある(すなわち、Webサーバ、DBサーバの最大使用量はそれぞれ87、88である)。そのため、Webサーバ、DBサーバにおいてそれぞれ、予約量13,12のリソース量を融通していたとしても、リソースが最大使用量を超えて消費される可能性が少なく、融通した後の予約量を除いた範囲内でリソースの使用量が収まる。もし、レスポンス遅延が発生しても、そのレスポンス遅延は元々のボトルネックによるものであり、融通とは関係がない。
図5は、本実施形態における他の業務システムにリソースの空き容量を融通する場合の融通元の業務システムの選択例(第2の例)を示す。図5では、ボトルネックとなるリソースからの融通を防止することで、業務への影響を抑える例について説明する。
まず、融通するリソースは、過去にボトルネックが発生した業務システムで使用されるリソースであり、かつ、ボトルネックとなったリソース以外の空き容量(実績値)を有するリソースとする。図5(A)の場合、業務システムA(6)のAPサーバのCPUリソースがボトルネックとなるリソースであるため、APサーバのCPUリソースからは融通しない。
その後、業務システムA(6)で突発的なリクエスト急増時でボトルネックが発生しても、図5(B)に示すように、ボトルネックリソースであるAPサーバは融通前と同じく100%使用できる。そのため、図5(C)に示すように、APサーバは、融通の前後で、単位時間当たりの業務システムAで処理可能な最大リクエスト数(スループット)に変化はなく、融通による影響がない。
以下では、本実施形態のより具体的な実施例について説明する。
図6は、本実施形態におけるシステム構成図である。システム10は、管理装置群11、制御対象装置群31とを含む。制御対象装置群31は、制御対象となるサーバ物理装置(仮想ホスト)上で稼働する仮想化装置群である。管理装置群11は、制御対象装置群31を制御する管理装置群である。
図6は、本実施形態におけるシステム構成図である。システム10は、管理装置群11、制御対象装置群31とを含む。制御対象装置群31は、制御対象となるサーバ物理装置(仮想ホスト)上で稼働する仮想化装置群である。管理装置群11は、制御対象装置群31を制御する管理装置群である。
制御対象装置群31は、1以上のサーバ物理装置1(32−1)〜N(32−N)を含む。サーバ物理装置1(32−1)〜N(32−N)はそれぞれ、仮想ホストサーバ(または仮想ホスト)として機能し、仮想化装置34−1〜34−Nを含む。
仮想化装置34−1〜34−Nは、サーバ物理装置1(32−1)〜N(32−N)において仮想化環境を実現して、複数のVM33−1〜33−Nを稼動させる制御プログラムで(ハイパーバイザ、仮想マシンモニタ等)ある。
以下では、サーバ物理装置1(32−1)〜N(32−N)を総称して、サーバ物理装置32または仮想ホスト32と称する。また、仮想化装置34−1〜34−Nを総称して、仮想化装置34と称する。また、VM33−1〜33−Nを総称して、VM33と称する。
制御対象装置群31では、1以上のサーバ物理装置32上で複数のVMが稼動しており、業務システムが仮想化環境で運用される。
管理装置群11は、バッチジョブ制御装置12、融通制御装置13、蓄積装置19、監視装置20、統合制御装置21を含むサーバ群である。
バッチジョブ制御装置12は、業務システムで用いられるバッチ処理やジョブを制御する。蓄積装置19は、各業務システムから、その業務システムに対するリクエスト量(実績値)または各VMのリソース(CPU、メモリ等)の使用量(実績値)等を収集し、蓄積する。
監視装置20は、各業務システムのレスポンス時間を監視する。監視の結果、レスポンス時間が閾値を超えた場合には、監視装置20は、その旨を融通制御装置13に通知する。
統合制御装置21は、制御対象装置群に含まれる仮想リソースの統合及び制御を、業務システム単位で行うことを実現する。統合制御装置21は、本実施形態の例では、後述するように、ある業務システムで用いられる各仮想リソースに対して設定された予約量を、他の業務システムに融通する。
融通制御装置13は、各業務システムの遅延を防止するために設定された期間(遅延防止期間)で各VMのリソースを予約して運用する。融通制御装置13は、複数のVMの遅延防止期間の重なりにより、物理リソース以上の予約が必要となった場合に、予約融通処理を行う。
予約融通処理では、融通制御装置13は、事前に登録された各業務システムのボトルネックの有無や余剰リソースの情報に基づいて、過去にボトルネックが発生した信頼度の高い融通可能なリソース量を持つ業務システムを優先して選択する。
それから、融通制御装置13は、融通による業務への影響を考慮して求めた余剰リソース量を融通可能リソース量として予約する。
融通制御装置13は、期間検出部14、予約スケジューラ部15、予約量設定部16、リソース抽出部17、記憶部18を含む。
期間検出部14は、統合制御装置21から、制御対象装置群31上で構築されている全業務システムについての構成を示す情報である業務システム構成情報を取得する。期間検出部14は、業務システムで関連付けられているバッチ業務情報に基づいて、バッチジョブ制御装置12から、予約スケジューラのジョブ開始時刻を取得する。それから、期間検出部14は、蓄積装置19から業務システムのリクエスト量と各VMのリソース使用量を取得して、遅延防止期間を決定する。
予約スケジューラ部15は、期間検出部14によって決定された遅延防止期間をスケジュールに登録する。予約スケジューラ部15は、予約量設定部16に予約開始時刻を通知する。
予約量設定部16は、リソースの予約開始時刻となった旨の通知を受信すると、統合制御装置21から、仮想ホスト32のリソースの予約状況を取得する。予約量設定部16は、遅延防止期間において、いずれかの仮想ホスト32上で、リソースの予約ができる場合には、その仮想ホストにて予約量を設定する。遅延防止期間において、いずれかの仮想ホスト32上で余剰リソースの予約ができない場合には、余剰リソースを有する仮想ホストからリソースを融通するように、統合制御装置21に依頼する。また、予約量設定部16は、VMの移動指示を統合制御装置21に発行する。
リソース抽出部17は、監視装置20より業務システムのレスポンスの悪化が通知された場合、蓄積装置からのリソース使用量に基づいて、その通知の対象になった業務システムでのボトルネックの発生に有無を判断する。リソース抽出部17は、ボトルネックの発生の有無に応じて、リソース使用の実績値または単位時間当たりのリクエスト数とリソース使用量との相関関係を用いて、その業務システムの融通可能なリソース量を求める。リソース抽出部17は、その求めた融通可能なリソース量を融通可能リソース管理テーブル44に登録する。リソース抽出部17は、業務システムのVM構成が変更となった旨のVM構成変更通知を受信した場合、融通可能リソース管理テーブル44からその業務システムに対応するエントリを削除する。
記憶部18は、後述するように、業務システム構成テーブル41、仮想ホストテーブル42、予約スケジュールテーブル43、融通可能リソース管理テーブル44を含む。
図7は、本実施形態における業務システム構成テーブルの一例を示す。業務システム構成テーブル41は、各業務システムを構成する各VMで用いる仮想リソースを管理するテーブルである。
業務システム構成テーブル41は、「管理者名」41−1、「業務システム名」41−2、「仮想ホスト名」41−3、「VM名」41−4、「CPU」41−5、「メモリ」41−6、「CPU予約量」41−7、「メモリ予約量」41−8のデータ項目を含む。
「管理者名」41−1には、その業務システムの管理者名が格納される。「業務システム名」41−2には、その業務システムを識別する名称が格納される。「仮想ホスト名」41−3には、その業務システムで使用される仮想ホストを識別する名称が格納される。
「VM名」41−4には、その業務システムで使用されるVMを識別する名称が格納される。「CPU」41−5には、そのVMに割り当てられているCPUの性能が格納される。「メモリ」41−6には、そのVMに割り当てられているメモリの容量が格納される。
「CPU予約量」41−7には、「CPU」41−5に格納されたCPUの性能のうち、現在予約されているCPU予約量が格納される。「メモリ予約量」41−8には、「メモリ」41−6に格納されたメモリの容量のうち、現在予約されているメモリ予約量が格納される。
図8は、本実施形態における仮想ホストテーブルの一例を示す。仮想ホストテーブル42は、後述する予約期間における、仮想ホスト32を構築するサーバ物理装置に含まれる物理リソース及びリソースの予約量を管理するテーブルである。
仮想ホストテーブル42は、「仮想ホスト名」42−1、「物理CPU」42−2、「CPU予約量合計」42−3、「物理メモリ」42−4、「メモリ予約量合計」42−5のデータ項目を含む。
「仮想ホスト名」42−1には、仮想ホスト32を識別する名称が格納される。「物理CPU」42−2には、仮想ホスト32を構築するサーバ物理装置に含まれる物理CPUの内容(処理性能(例えば、2GHz×16コア)及び個数)が格納される。「CPU予約量合計」42−3には、業務システム構成テーブル41において、「仮想ホスト名」41−3にてグループ化した場合の「CPU予約量」41−7の合計値が格納される。なお、「CPU予約量合計」42−3に格納されるのは、現時点での仮想ホスト内のCPU予約量の合計である。
「物理メモリ」42−4には、仮想ホスト32を構築するサーバ物理装置に含まれる物理メモリの容量が格納される。「メモリ予約量合計」42−5には、業務システム構成テーブル41において、「仮想ホスト名」41−3にてグループ化した場合の「メモリ予約量」41−8の合計値が格納される。なお、「CPU予約量合計」42−3に格納されるのは、現時点での仮想ホスト内のメモリ予約量の合計である。
図9は、本実施形態における予約スケジュールテーブルの一例を示す。予約スケジュールテーブル43は、リソースを予約するタイミングを管理するテーブルである。
予約スケジュールテーブル43は、「業務システム名」43−1、「VM名」43−2、「予約開始」43−3、「予約終了」43−4を含む。「業務システム名」43−1には、その業務システムを識別する名称が格納される。「VM名」41−2には、その業務システムで使用されるVMを識別する名称が格納される。「予約開始」43−3及び「予約終了」43−4にはそれぞれ、業務システム間で融通可能なように予約したリソースを融通する開始時刻及び終了時刻が格納される。
図10は、本実施形態における融通可能リソース管理テーブルの一例を示す。融通可能リソース管理テーブル44は、業務システム単位で、融通可能なリソースを管理するテーブルである。融通可能リソース管理テーブル44は、業務システムのレスポンス悪化の発生時に、業務システム単位で、エントリの内容の記録または更新がされる。これにより、リソースの融通時にて、融通可能リソース管理テーブル44は、すぐに利用することができる。
融通可能リソース管理テーブル44は、「業務システム名」44−1、「レスポンス悪化日時」44−2、「ボトルネック有無(回数)」44−3、「VM名」44−4、「割り当て」44−5、「融通可能なリソース量」44−6のデータ項目を含む。なお、融通可能リソース管理テーブル44では、1業務システムにつき1エントリとなる。
「業務システム名」44−1には、その業務システムを識別する名称が格納される。「レスポンス悪化日時」44−2には、最新のレスポンス悪化が発生した日時が格納される。
「ボトルネック有無(回数)」44−3には、その業務システムにおけるボトルネックの発生の有無及び発生回数が格納される。「ボトルネック有無(回数)」44−3に「無」が登録される場合、過去に一度もボトルネックが発生していないことを示す。ボトルネックの有無やボトルネックの発生回数は、リソース融通時の信頼度を示す。図10の例では、有(3)、有(1)、無の優先順位でリソースが融通される。
「VM名」44−4には、その業務システムで使用されるVMを識別する名称が格納される。「割り当て」44−5には、そのVMに割り当てられているリソースの容量(CPUの性能、メモリの容量)が格納される。
「融通可能なリソース量」44−6には、業務システムで使用されるVMで用いられているリソース量のうち、融通可能なリソース量(CPUの性能、メモリの容量)が格納される。「融通可能なリソース量」44−6において、“〇”が格納されているリソースは、ボトルネックのリソースであることを示す(“〇”が付与されたリソースの融通可能なリソース量は“0”となる)。また、「融通可能なリソース量」44−6では、業務システム毎に、融通可能なリソース量の合計も格納される。
ここで、「ボトルネック有無(回数)」44−3及び「融通可能なリソース量」44−6について、さらに詳述する。「融通可能なリソース量」44−6には、ボトルネック発生時の実績値が優先して格納され、「ボトルネック有無(回数)」44−3には、“有”が格納される。
ボトルネックが複数回発生する場合は、実績値は安全性のため「融通可能なリソース量」44−6には最小値が格納され、「ボトルネック有無(回数)」44−3にはボトルネック発生回数が格納される。
ボトルネックが一度も発生しない場合は、「融通可能なリソース量」44−6には、相関分析による予測値が格納される。このとき、「ボトルネック有無(回数)」44−3には、“無”が格納される。なお、相関分析による予測値の算出により、あるリソースがボトルネックであると判定された場合にも、そのリソースの「融通可能なリソース量」44−6に、“〇”が格納される。
図11は、本実施形態における融通制御装置13の全体の処理フローを示す。融通制御装置13は、期間検出部14として機能し、遅延防止期間検出処理(S1)を行う。S1の処理については、図12を参照しながら説明する。
図12は、本実施形態における、遅延防止期間検出処理を説明するための図である。期間検出部14は、バッチ処理と連携した業務システムから、図12(A)に示すように業務の遅延を防止する期間(遅延防止期間)を検出する。
まず、期間検出部14は、オンライン業務の追加またはオンライン業務を構成するVMの設定の更新のタイミングで、オンライン業務と関係付けられているバッチ業務の集計開始時刻を取得する。
ここで、対象とする業務は、オンライン業務と、一定期間に受け付けたデータを締日以降に集計・分析処理するバッチ業務とを組み合わせたものである。オンライン業務の例として、チケット予約があり、一定期間は、チケットの予約期間(予約開始から予約終了(締日))に相当する。
また、バッチ業務は、予約期間の終了時刻が決定したとき、終了時刻以降を実行開始時刻としてスケジューリングされることを想定する。
期間検出部14は、オンライン業務で、上記取得した集計開始時刻に対して直前のリクエストの(山)をWebサーバのログから抽出する。
期間検出部14は、以下のようにして遅延防止期間を決定する。図12(A)において、締日時刻は、初回はバッチ業務の開始時刻である。次回以降は、過去のリクエスト数の実績より、集計開始時刻より前で連続したアクセスを含む期間の終了時刻を締日時刻とする。
開始時刻は、初回は集計開始時刻から前日の1日分の期間(設定で変更可)である。次回以降は、連続したアクセス期間の開始時刻を開始時刻とする。
期間検出部14は、上記で決定された遅延防止期間が予め設定された最大期間(例えば、10分)を超えている場合は、図12(B)に示すように、その最大期間を遅延防止期間とする。締日時刻前に要求されたトランザクション処理時間が締日時刻を超えない最大期間が、事前に設定されている。その最大期間は、例えば、オンライン業務におけるDBなどを更新するトランザクション処理時間を超えない最小の期間となるため、最長でも10分程度でよい。
リクエスト数の山の開始時刻から締日時刻までの期間が最大期間を超えている場合は、締日時刻から最大期間遡った時点の時刻を開始時刻とする。これは、予約期間を可能な限り最短期間なものとし、リソースを必要とするVMに優先的に予約期間を割り当てるようにするためである。
期間検出部14は、上記で求めた遅延防止期間を、図12(C)に示すように、予約スケジュールテーブル43に登録する。これにより、リソースを優先的に割り当てる期間を可能な限り短くかつ動的に算出することにより、リソース競合を最小限にして業務システムの性能劣化も防止できる。
再び図11の説明に戻る。次に、融通制御装置13は、予約量設定部16として機能し、リソース予約設定処理を行う(S2)。S2では、予約量設定部16は、予約スケジュールテーブル43に登録されている予約開始時刻(遅延防止期間の開始時刻)となったとき、予約開始時刻に対応する対象業務システムの対象VM33に対してリソース予約設定処理を開始する。
対象VM33でリソースを予約しても、予約したリソース量が、稼働している仮想ホスト32の物理リソースの上限を超えない場合は、予約量設定部16は、割り当てられたリソース量に対して100%のリソース量でリソースの予約を設定して終了する。
ここで、予約量設定部16は、遅延防止期間では、その開始時刻に対象VM33に対してリソースを100%割り当てることができる設定、すなわち予約をする。予約スケジューラ部15は、締日時刻になると、その予約を解除する。
予約期間(予約開始時刻〜予約終了時刻)にて予約された対象VM33がリソースを必要とする場合には、予約量設定部16は、予約されていない他のVM33がリソースを使用していても優先してそのリソースを割り当てることができる。逆に、予約されたVM33が使わないリソース量分(例えば、CPUリソース)については、他のVMが使用することができる。
予約可能なリソースの上限は、その仮想ホスト32の物理リソースの上限となる(厳密には、ハイパーバイザが使用する量やVM33毎のオーバーヘッド分を差し引いた上限となる)。そのため、複数の遅延防止期間を重ねることができる上限は、予約の上限(すなわち、物理リソースの上限)となる。
次に、融通制御装置13は、リソース抽出部17として機能し、融通可能なリソース量の抽出処理を行う(S3)。S3では、リソース抽出部17は、以下のようにして、融通時に、未融通の業務システムから融通可能なリソース、及びそのリソース量を決定し、融通リソース管理テーブル44に記録する。
まず、融通可能なリソース量を求めるタイミングは、業務システム毎でレスポンス悪化が発生しているとき、すなわち、監視装置20により監視しているレスポンス時間が閾値を越えたときとなる。
リソース抽出部17は、レスポンス時間の閾値超過がその業務システムでのボトルネックによるものであるか否かを判定する。すなわち、リソース抽出部17は、レスポンス悪化時(レスポンス時間が閾値を越えたとき)に、蓄積装置19により収集されたリソース使用量(実績値)またはリクエスト量(実績値)に基づいて、その業務システムでボトルネックが発生しているかを判断する。
ボトルネックは、業務システムで用いられるVM33のリソース(CPU、メモリ)のいずれかについて、割り当てられたリソース量を100%使い切っているかで判断される。リソース抽出部17は、割り当てられたリソース量を100%使い切っているリソースをボトルネックリソースとして融通リソース管理テーブル44に登録する。
このとき、リソース抽出部17は、ボトルネックと決定されたリソース以外で、リソース量に空きがあるリソースを余剰リソースとし、融通可能なリソースとする。すなわち、リソース抽出部17は、ボトルネックのリソース以外のリソースについて、ボトルネックとなったリクエスト数で使用されるリソース量をボトルネック時に使用されるリソース量とし、空き容量を余剰リソースとする。ボトルネックが過去にも発生している場合は、安全性を高めるため余剰リソースの最小値が融通可能なリソース量として採用される。
ボトルネックが発生していない場合は、まだリソースが使用される可能性がある。この場合、リソース抽出部17は、図13に示すように、業務システム毎で、リクエスト数と各VMのリソース使用量(CPU使用量、メモリ使用量)の相関関係を求める。そして、その求めた相関関係に基づいて、リソース抽出部17は、リクエスト数の増加で最初に上限に達するリソースをボトルネックリソースとして融通リソース管理テーブル44に登録する。
なお、VMの構成変更(リソース割り当て変更、VM個数の追加、削除等)やVM内のアプリケーションの入れ替え、システムパラメタの変更等、VMに対する変更が実施された場合、融通可能なリソース量が変化する。そのため、融通可能なリソース量が再計算され、融通リソース管理テーブル44に登録される。
次に、融通制御装置13は、予約量設定部16として機能し、予約融通処理を行う(S4)。S4では、予約量設定部16は、全ての仮想ホスト32で物理リソースの上限までリソースが予約されている場合、以下の方法で、融通可能なリソースを有する業務システムから、予約された業務システムの処理を実行するために必要なリソースを融通する。
予約量設定部16は、融通可能なリソースとして、業務システムのレスポンス悪化時にボトルネックとなったときの余剰リソースを利用する。予約量設定部16は、まず融通元となる業務システムを選択する場合、過去でレスポンス悪化が発生した時にボトルネックありと判断された業務システムを優先して選択する。これはボトルネックが発生した業務システムであれば、そのときボトルネックリソース以外のリソースの空き容量は、それ以上使用されない量として信頼度が高いためである。更に、ボトルネックが発生している回数が多い業務システムについては、以下の2点の理由から優先順位が上げられる。
・ボトルネックが発生している回数が多い業務システムは、何度もボトルネックによるレスポンス悪化が発生しているにも関わらず、特に対処をしていないため、業務への影響度が低いと考えられること
・ボトルネックが発生している回数が多い業務システムについては、ボトルネックリソース以外のリソースの余剰量が明確であること
・ボトルネックが発生している回数が多い業務システムは、何度もボトルネックによるレスポンス悪化が発生しているにも関わらず、特に対処をしていないため、業務への影響度が低いと考えられること
・ボトルネックが発生している回数が多い業務システムについては、ボトルネックリソース以外のリソースの余剰量が明確であること
次に、予約量設定部16は、ボトルネックとなっていないVMの空きリソース量(=割り当て量−使用量)を融通可能なリソース量とする。予約量設定部16は、ボトルネックとなったリソースについては他の業務システムへリソースの融通を行わない。これにより、融通後、融通元の業務システムにおいてリクエスト急増が発生しても当該融通元の業務システムが元々抱えているボトルネックでリソース量が頭打ちとなるため、融通による業務への影響(レスポンス悪化)を抑止することができる。したがって、この場合、業務への影響のリスクはリソース融通する前と後で変わらない。
ボトルネック発生回数が同一、もしくはボトルネック無同士といった同じ条件下において、複数の業務システムから融通元を選択する場合、予約量設定部16は、融通可能なリソース量の合計値が多いものを優先して選択する。特に信頼度が低い業務システムから融通する場合、融通後に余剰リソースを少しでも残すことで安全性を高めるためである。
1つの業務システムで融通に必要なリソース量が不足している場合は、予約量設定部16は、複数の業務システムからの融通を実施する。もし、これ以上、融通可能なリソースがない場合は、予約量設定部16は、運用管理者に融通失敗を通知する。
上述の通り、図11のフローにより、融通しあった双方の業務システムで突発的なリクエスト急増が発生しても、融通によるリソース不足で発生する業務遅延を防止できる。
以下では、図11のフローの詳細を説明する。すなわち、期間検出部14、予約スケジューラ部15、予約量設定部16、リソース抽出部17の各処理を詳述する。
図14は、本実施形態における期間検出部により実行される予約スケジュール追加処理のフローの一例を示す。新たに業務システムが業務システム構成テーブル41に追加された場合、またはバッチ業務処理の開始スケジュールが追加もしくが変更された場合、期間検出部14は、遅延防止期間算出処理を行う(S11)。期間検出部14は、ジョブの開始時刻を取得し、過去のリクエスト量の実績から予約開始時刻及び予約終了時刻を算出する。S11の処理については、図15にて詳述する。
次に、期間検出部14は、予約スケジューリング処理を行う(S12)。期間検出部14は、算出された予約開始時刻及び予約終了時刻を予約スケジュールテーブル43に登録する。S12の処理については、図16にて詳述する。
図15は、本実施形態における遅延防止期間算出処理(S11)の処理フローの一例を示す。期間検出部14は、まず統合制御装置21から、業務システムの構成を管理する情報である業務システム構成情報を取得し、業務システム構成情報テーブル41に格納する。期間検出部14は、業務システム構成情報テーブル41において「仮想ホスト名」41−3にてグループ化した場合の予約期間での「CPU予約量」41−7の合計値を、仮想ホスト毎に仮想ホストテーブル42に格納する。期間検出部14は、業務システム構成情報テーブル41において、「仮想ホスト名」41−3にてグループ化した場合の予約期間での「メモリ予約量」41−8の合計値を、仮想ホスト毎に仮想ホストテーブル42に格納する。
期間検出部14は、業務システム構成テーブル41から、オンライン業務と関係付けられているバッチ情報として、バッチ業務名(業務システム名)、そのバッチを実行するVM名、仮想ホスト名を抽出する。期間検出部14は、バッチジョブ制御装置12から、抽出したバッチ業務名及びVM名に対応するバッチを検索する(S11−1)。期間検出部14は、検索されたバッチのスケジュール情報から、そのバッチの開始時刻を取得する(S11−2)。
期間検出部14は、そのバッチを実行する業務システムに対して過去にリクエスト量に基づいて予約量を設定した実績がある場合(S11−3で「YES」)、過去の実績期間に基づいて予約開始時刻と予約終了時刻を決定する。
業務システムに対して過去にリクエスト量に基づいて予約量を設定した実績がない場合または新たに追加された業務システムである場合(S11−3で「NO」)、期間検出部14は、デフォルト期間を用いて予約開始時刻と予約終了時刻を決定する(S11−4)。
図16は、本実施形態における予約スケジューリング処理(S12)の処理フローの一例を示す。期間検出部14は、S11で処理対象となった各業務システムで用いられるVMに対して、決定した予約期間(開始時刻〜終了時刻)を、予約スケジュールテーブル43に登録する(S12−1)。
図17は、本実施形態における予約量設定部により実行される予約量決定処理のフローの一例を示す。
予約量設定部16は、予約スケジュールテーブル43を参照して、いずれかの業務システムの予約期間が開始したと判定した場合、配置先仮想ホスト及び予約量決定処理を行う(S21)。予約量設定部16は、複数のVMの予約期間(遅延防止期間)の重なりにより、物理リソース以上の予約が必要となった場合に、予約融通処理を行う。すなわち、予約量設定部16は、予約期間が開始された業務システム(対象業務システム)で使用される各VMを稼動させるために必要なリソースを確保可能な仮想ホスト(配置先仮想ホスト)を選択する。予約量設定部16は、必要があれば、業務システム間、または仮想ホスト間でVMを移動させる。
いずれの仮想ホストも、対象業務システムで使用される全VMを稼動させるために必要なリソースを有さない場合には、予約量設定部16は、予約融通処理を実施する。予約融通処理では、予約量設定部16は、リソース融通管理テーブル44を参照して、ボトルネック“有”の業務システムから、対象業務システムを稼動させる分のリソース量を融通する。ボトルネック“有”のシステムがない場合は、予約量設定部16は、ボトルネック“無”のシステムから余剰リソースを融通する。S21については、図18で詳述する。
次に、予約量設定部16は、S21で決定した配置先仮想ホストにて動作する各VMに予約量を設定する(S22)。後述するようにS21において、予約期間において仮想ホスト内のVMで使用されるリソース量が仮想ホスト32の物理リソースの上限を超えない場合は、予約量設定部16は、次の処理を行う。すなわち、予約量設定部16は、業務システム構成テーブル41に、配置先仮想ホストにて動作する各VMに割り当てられたリソース量に対して100%のリソース量を設定する。
図18は、本実施形態における配置先仮想ホスト及び予約量決定処理(S21)のフローの一例を示す。
予約量設定部16は、仮想ホストテーブル42から、対象業務システムのVMが稼働している仮想ホストを選択する。予約量設定部16は、仮想ホストテーブル42から、その選択した仮想ホストにおいて、予約期間における仮想ホストの予約量の合計が物理リソース量の上限を超えているかを判定する(S21−1)。ここで、予約期間における仮想ホストの予約量の合計とは、仮想ホストテーブル42の「CPU予約量合計」42−3、「メモリ予約量合計」42−5に格納されている値を示す。物理量の上限とは、仮想ホストテーブル42の「物理CPU」42−2、「物理メモリ」42−4に格納されている値を示す。
その選択した仮想ホストの予約量の合計が物理量の上限を超えていない場合(S21−1で「NO」)、予約量設定部16は、S21−4の処理へ進む。
その選択した仮想ホストの予約量の合計が物理量の上限を超えている場合(S21−1で「YES」)、予約量設定部16は、仮想ホストテーブル42から、他の仮想ホストを順次選択し、選択した仮想ホストで予約できる空きリソース量があるかを判定する(S21−2)。S21−2では、他の仮想ホストについて、S21−1の処理を行う。
選択した仮想ホストで予約できる空きリソース量がある場合(S21−2で「YES」)、予約量設定部16は、S21−4の処理へ進む。
いずれの仮想ホストも予約できる空きリソース量がない場合(S21−2で「NO」)、予約量設定部16は、必要なリソースを確保するため、予約融通処理を行う(S21−3)。S21−3については、図19で詳述する。
S21−1で「NO」またはS21−2で「YES」へ進んだ場合、予約量設定部16は、選択した仮想ホストを配置先仮想ホストとする。また、予約量設定部16は、予約融通処理(S21−1)がされた場合、融通元の仮想ホストを配置先仮想ホストとする。
図19は、本実施形態における予約融通処理(S21−3)のフローの一例を示す。予約量設定部16は、「ボトルネック有無(回数)」44−3に基づいて、リソース融通管理テーブル44に、ボトルネック“有”の業務システムがあるか否かを判定する(S21−3−1)。ボトルネック“有”の業務システムがある場合(S21−3−1で「YES」)、予約量設定部16は、未融通の業務システムのうち、ボトルネック発生回数の最大のものを抽出する(S21−3−5)。
予約量設定部16は、抽出した業務システムの「融通可能なリソース量」44−6に基づいて、抽出した業務システムの各VMから、そのVMに対応する融通可能リソースの予約量を削減する(S21−3−6)。ここでは、予約量設定部16は、抽出した業務システムの「融通可能なリソース量」44−6から、融通可能なリソース量を取得する。予約量設定部16は、業務システム構成テーブル41において、抽出した業務システムに対応する「CPU予約量」41−7と「メモリ予約量」41−8とから、取得した融通可能なリソース量を削減する。
予約量設定部16は、抽出した業務システムのリソースから、予約期間においてVMが使用するリソース量を削減できたかを判定する(S21−3−7)。削減したリソース量が予約期間においてVMが使用するリソース量に満たない場合(S21−3−7で「NO」)、処理がS21−3−1へ戻る。
削減したリソース量が予約期間においてVMが使用するリソース量以上である場合(S21−3−7で「YES」)、予約量設定部16は、業務システム構成テーブル41の、対応するリソースの予約量を、上記で削減したリソース量で更新する(S21−3−8)。
リソース融通管理テーブル44に、S21−3−5で未抽出の業務システムのうち、ボトルネック“有”の業務システムがない場合(S21−3−1で「NO」)、予約量設定部16は、次の処理を行う。すなわち、予約量設定部16は、リソース融通管理テーブル44を参照して、ボトルネック発生“無”の業務システムのうち、融通可能なリソース量を有する業務システムがあるか否かを判定する(S21−3−2)。
ボトルネック発生“無”の業務システムのうち、融通可能なリソース量を有する業務システムがある場合(S21−3−2で「YES」)、予約量設定部16は、次の処理を行う。すなわち、予約量設定部16は、リソース融通管理テーブル44に基づいて、ボトルネック発生“無”の業務システムから、最大の融通可能リソースを選択し(S21−3−4)、S21−3−6の処理を行う。
ボトルネック発生“無”の業務システムのうち、融通可能なリソース量を有する業務システムが全くない場合(S21−3−2で「NO」)、予約量設定部16は、リソースの確保の失敗を管理者に通知する。すなわち、全ての業務システムで融通するリソースがなくなり、リソースの予約ができなかった場合は、物理リソース不足の状況となるため、予約量設定部16は、リソースの予約の失敗をシステム管理者に通知する。
図20は、本実施形態における予約スケジューラ部により実行される予約終了処理フローの一例を示す。
予約スケジューラ部15は、予約スケジュールテーブル43を参照して、現在の時刻と予約終了時刻とを比較して、予約期間が終了したと判定した場合、該当のVMに対して予約の設定を解除するように、統合制御装置21に依頼する(S31)。その依頼に基づいて、統合制御装置21は、該当のVMに対して予約の設定を解除する。
図21は、本実施形態におけるリソース抽出部により実行される融通可能リソース抽出処理フローの一例を示す。融通可能リソース抽出処理は、監視装置20より業務システムのレスポンス悪化が通知された場合に開始される。
リソース抽出部17は、余剰リソース更新処理を行う(S41)。余剰リソース更新処理では、リソース抽出部17は、ボトルネックの発生の有無によって融通可能なリソース量の抽出処理を切り替え、融通可能リソース管理テーブル44に値を登録、もしくは更新する。S41の処理については、図22で詳述する。
図22は、本実施形態における余剰リソース更新処理(S41)の処理フローの一例を示す。監視装置20より業務システムのレスポンス悪化が通知された場合、リソース抽出部17は、次の処理を行う。すなわち、リソース抽出部17は、蓄積装置19により収集されたその業務システムのリソース使用量(実績値)またはリクエスト量(実績値)に基づいて、その業務システムでボトルネックが発生しているかを判断する(S41−1)。
S41−1では、リソース抽出部17は、業務システム構成テーブル41から、レスポンス悪化が通知された業務システムで使用されるVMに割り当てられたリソース量(「CPU」41−5、「メモリ」41−6)を取得する。
それから、リソース抽出部17は、蓄積装置19により収集されたその業務システムのリソース使用量が、割り当てられたリソース量に達しているリソースがあるかを判断する。
リソース使用量が、割り当てられたリソース量に達しているリソースがある場合、すなわち、ボトルネックが発生している場合(S41−1で「YES」)、リソース抽出部17は、次の処理を行う。すなわち、リソース抽出部17は、リソース使用量(実績値)に基づいて、各VMのリソースの空き容量を算出する。リソース抽出部17は、算出したリソースの空き容量を融通可能なリソース量として融通可能リソース管理テーブル44に登録する(S41−4)。
ここで、各VMの空きリソース量は、割り当てられたリソース量−リソース使用量(実績値)により算出される。ボトルネックが発生しているVM(ボトルネックリソース)の場合は、VMの空きリソース量は0となる。
リソース抽出部17は、融通可能リソース管理テーブル44において、ボトルネックリソースについて、ボトルネックであることを示すフラグ”○“を付ける。それから、リソース抽出部17は、融通可能リソース管理テーブル44において、発生日付を登録し、ボトルネック発生“有”を登録し、発生回数に1を加算する。
S41−1において、リソース使用量が、割り当てられたリソース量に達しているリソースがない場合、すなわち、ボトルネックが発生していない場合(S41−1で「NO」)、リソース抽出部17は、次の処理を行う。すなわち、リソース抽出部17は、単位時間あたりのリクエスト数とリソース使用量との相関分析から、最初に頭打ちとなるリソースを算出する(S41−2)。リソース抽出部17は、その最初に頭打ちとなるリソースをボトルネックリソースとして融通可能リソース管理テーブル44に登録する(S41−4)。その他のリソースについては、リソース抽出部17は、同じ単位時間あたりのリクエスト数からリソース使用量を求め、空きリソースを融通可能リソースとして融通可能リソース管理テーブル44に登録する。また、リソース抽出部17は、ボトルネック発生については“無”として融通可能リソース管理テーブル44に登録する。
図23は、本実施形態におけるリソース抽出部により実行される融通可能リソースクリア処理フローの一例を示す。
リソース抽出部17は、ある業務システムにおいてVMの構成変更が発生した場合、融通可能リソース管理テーブル44の登録されているその業務システムで使用される全VMの融通可能なリソース量をクリアする(S51)。
図24は、本実施形態におけるプログラムを実行するコンピュータのハードウェア環境の構成ブロック図の一例である。コンピュータ50は、融通制御装置13として機能する。コンピュータ50は、CPU52、ROM53、RAM56、通信I/F54、記憶装置57、出力I/F51、入力I/F55、読み取り装置58、バス59、出力装置61、入力装置62によって構成されている。
ここで、CPUは、中央演算装置を示す。ROMは、リードオンリメモリを示す。RAMは、ランダムアクセスメモリを示す。I/Fは、インターフェースを示す。バス59には、CPU52、ROM53、RAM56、通信I/F54、記憶装置57、出力I/F51、入力I/F55、及び読み取り装置58が接続されている。読み取り装置58は、可搬型記録媒体を読み出す装置である。出力装置61は、出力I/F51に接続されている。入力装置62は、入力I/F55に接続にされている。
記憶装置57は、記憶部18に相当し、ハードディスク、フラッシュメモリ、磁気ディスクなど様々な形式の記憶装置を使用することができる。記憶装置57またはROM53には、CPU52を取得部2と、判定部3と、特定部4と、提供部5として機能させる本実施形態に係るプログラムが格納されている。より具体的には、記憶装置57またはROM53には、期間検出部14、予約スケジューラ部15、予約量設定部16、リソース抽出部17として機能させる本実施形態に係るプログラムが格納されている。また、記憶装置57には、業務システム構成テーブル41、仮想ホストテーブル42、予約スケジュールテーブル43、融通可能リソース管理テーブル44が格納されていてもよい。
RAM56には、情報が一時的に記憶される。RAM56は、本実施形態におけるメモリ30に相当する。
CPU52は、記憶装置57またはROM53から本実施形態に係るプログラムを読み出し、当該プログラムを実行する。
通信I/F54は、ネットワークと接続して他の装置と通信するためのポート等のインターフェースである。
上記実施形態で説明した処理を実現するプログラムは、プログラム提供者側から通信ネットワーク60、および通信I/F54を介して、例えば記憶装置57に格納されてもよい。また、上記実施形態で説明した処理を実現するプログラムは、市販され、流通している可搬型記憶媒体に格納されていてもよい。この場合、この可搬型記憶媒体は読み取り装置58にセットされて、CPU52によってそのプログラムが読み出されて、実行されてもよい。可搬型記憶媒体としてはCD−ROM、フレキシブルディスク、光ディスク、光磁気ディスク、ICカード、USBメモリ装置、半導体メモリカードなど様々な形式の記憶媒体を使用することができる。このような記憶媒体に格納されたプログラムが読み取り装置58によって読み取られる。
入力装置62には、キーボード、マウス、電子カメラ、ウェブカメラ、マイク、スキャナ、センサ、タブレット、タッチパネルなどを用いることが可能である。また、出力装置61には、ディスプレイ、プリンタ、スピーカなどを用いることが可能である。
ネットワーク60は、インターネット、LAN、WAN、専用線、有線、無線等の通信網であってよい。
本実施形態によれば、同時期に優先業務を多数稼動させることが可能となり、リソースの融通による融通元の業務システムへの業務影響(処理遅延)も防止できる。
なお、本発明は、以上に述べた実施の形態に限定されるものではなく、本発明の要旨を逸脱しない範囲内で種々の構成または実施形態を取ることができる。
上記実施形態に関し、さらに、以下の付記を開示する。
(付記1)
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得する取得部と、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定する判定部と、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定する特定部と、
前記余剰リソースを前記複数の情報処理システムのうち第2の情報処理システムへ融通する提供部と、
を備えることを特徴とするリソース管理装置。
(付記2)
前記特定部は、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする付記1に記載のリソース管理装置。
(付記3)
前記特定部は、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする付記1または2に記載のリソース管理装置。
(付記4)
前記取得部は、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記特定部は、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記提供部は、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ融通する
ことを特徴とする付記1〜3のうちいずれか一項に記載のリソース管理装置。
(付記5)
前記特定部は、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする付記4に記載のリソース管理装置。
(付記6)
コンピュータに、
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定し、
前記複数の情報処理システムのうち第2の情報処理システムへ前記余剰リソースを融通する、
処理を実行させるリソース管理プログラム。
(付記7)
前記余剰リソースの特定において、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする付記6に記載のリソース管理プログラム。
(付記8)
前記余剰リソースの特定において、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする付記6または7に記載のリソース管理プログラム。
(付記9)
前記複数のリソースの使用量の取得において、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記余剰リソースの融通において、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ融通する
ことを特徴とする付記6〜8のうちいずれか一項に記載のリソース管理プログラム。
(付記10)
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする付記9に記載のリソース管理プログラム。
(付記11)
コンピュータが、
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定し、
前記複数の情報処理システムのうち第2の情報処理システムへ前記余剰リソースを融通する、
処理を実行させるリソース管理方法。
(付記12)
前記余剰リソースの特定において、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする付記6に記載のリソース管理方法。
(付記13)
前記余剰リソースの特定において、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする付記6または7に記載のリソース管理方法。
(付記14)
前記複数のリソースの使用量の取得において、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記余剰リソースの融通において、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ融通する
ことを特徴とする付記6〜8のうちいずれか一項に記載のリソース管理方法。
(付記15)
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする付記9に記載のリソース管理方法。
(付記1)
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得する取得部と、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定する判定部と、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定する特定部と、
前記余剰リソースを前記複数の情報処理システムのうち第2の情報処理システムへ融通する提供部と、
を備えることを特徴とするリソース管理装置。
(付記2)
前記特定部は、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする付記1に記載のリソース管理装置。
(付記3)
前記特定部は、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする付記1または2に記載のリソース管理装置。
(付記4)
前記取得部は、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記特定部は、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記提供部は、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ融通する
ことを特徴とする付記1〜3のうちいずれか一項に記載のリソース管理装置。
(付記5)
前記特定部は、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする付記4に記載のリソース管理装置。
(付記6)
コンピュータに、
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定し、
前記複数の情報処理システムのうち第2の情報処理システムへ前記余剰リソースを融通する、
処理を実行させるリソース管理プログラム。
(付記7)
前記余剰リソースの特定において、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする付記6に記載のリソース管理プログラム。
(付記8)
前記余剰リソースの特定において、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする付記6または7に記載のリソース管理プログラム。
(付記9)
前記複数のリソースの使用量の取得において、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記余剰リソースの融通において、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ融通する
ことを特徴とする付記6〜8のうちいずれか一項に記載のリソース管理プログラム。
(付記10)
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする付記9に記載のリソース管理プログラム。
(付記11)
コンピュータが、
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定し、
前記複数の情報処理システムのうち第2の情報処理システムへ前記余剰リソースを融通する、
処理を実行させるリソース管理方法。
(付記12)
前記余剰リソースの特定において、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする付記6に記載のリソース管理方法。
(付記13)
前記余剰リソースの特定において、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする付記6または7に記載のリソース管理方法。
(付記14)
前記複数のリソースの使用量の取得において、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記余剰リソースの融通において、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ融通する
ことを特徴とする付記6〜8のうちいずれか一項に記載のリソース管理方法。
(付記15)
前記余剰リソースの特定において、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする付記9に記載のリソース管理方法。
1 リソース管理装置
2 取得部
3 判定部
4 特定部
5 提供部
6 業務システムA
7 業務システムB
10 システム
11 管理装置群
12 バッチジョブ制御装置
13 融通制御装置
14 期間検出部
15 予約スケジューラ部
16 予約量設定部
17 リソース抽出部
18 記憶部
19 蓄積装置
20 監視装置
21 統合制御装置
31 制御対象装置群
32(32−1)〜N(32−N) 仮想ホスト
33(33−1〜33−N) VM
34(34−1〜34−N) 仮想化装置
41 業務システム構成テーブル
42 仮想ホストテーブル
43 予約スケジュールテーブル
44 融通可能リソース管理テーブル
2 取得部
3 判定部
4 特定部
5 提供部
6 業務システムA
7 業務システムB
10 システム
11 管理装置群
12 バッチジョブ制御装置
13 融通制御装置
14 期間検出部
15 予約スケジューラ部
16 予約量設定部
17 リソース抽出部
18 記憶部
19 蓄積装置
20 監視装置
21 統合制御装置
31 制御対象装置群
32(32−1)〜N(32−N) 仮想ホスト
33(33−1〜33−N) VM
34(34−1〜34−N) 仮想化装置
41 業務システム構成テーブル
42 仮想ホストテーブル
43 予約スケジュールテーブル
44 融通可能リソース管理テーブル
Claims (7)
- 複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得する取得部と、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定する判定部と、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定する特定部と、
前記余剰リソースを前記複数の情報処理システムのうち第2の情報処理システムへ提供する提供部と、
を備えることを特徴とするリソース管理装置。 - 前記特定部は、前記第1の情報処理システムに前記いずれかのリソースの枯渇が発生したことがない場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記複数のリソースから前記余剰リソースを特定する
ことを特徴とする請求項1に記載のリソース管理装置。 - 前記特定部は、前記いずれかのリソースの枯渇が発生した場合、該いずれかのリソースの枯渇の発生時に前記第1の情報処理システムが動作する前記複数の仮想計算機が使用していたリソースの余剰を前記余剰リソースとして特定する、
ことを特徴とする請求項1または2に記載のリソース管理装置。 - 前記取得部は、前記第1の情報処理システムにおいて処理の応答時間が閾値を超えた際の該第1の情報処理システムが動作する該複数の仮想計算機のそれぞれに割り当てられたリソースの使用量を取得し、
前記特定部は、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出し、
前記提供部は、算出された前記リソースの余剰量を前記複数の情報処理システムのうち第2の情報処理システムへ提供する
ことを特徴とする請求項1〜3のうちいずれか一項に記載のリソース管理装置。 - 前記特定部は、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機がこれまでになかった場合、処理負荷と該処理負荷に応じて使用されたリソース量との関係に関する情報に基づいて、前記第1の情報処理システムが動作する前記複数の仮想計算機のうち、前記使用量が前記割り当てられたリソースの上限値に達している仮想計算機以外の仮想計算機に割り当てられたリソースの余剰量を算出する
ことを特徴とする請求項4に記載のリソース管理装置。 - コンピュータに、
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定し、
前記複数の情報処理システムのうち第2の情報処理システムへ前記余剰リソースを提供する、
処理を実行させるリソース管理プログラム。 - コンピュータが、
複数の仮想計算機上で動作する複数の情報処理システムのうち第1の情報処理システムにおいて応答時間が閾値を超えた場合、該第1の情報処理システムに割り当てられた複数のリソースの使用量を取得し、
前記複数のリソースの使用量に基づいて、前記第1の情報処理システムにおいていずれかのリソースの枯渇が発生したかを判定し、
前記応答時間の閾値超過が前記いずれかのリソースの枯渇によるものであると判定された場合、前記複数のリソースの使用量に基づいて、前記複数のリソースのうち、枯渇した前記リソース以外のリソースである余剰リソースを特定し、
前記複数の情報処理システムのうち第2の情報処理システムへ前記余剰リソースを提供する、
処理を実行させるリソース管理方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015163971A JP2017041191A (ja) | 2015-08-21 | 2015-08-21 | リソース管理装置、リソース管理プログラム、及びリソース管理方法 |
US15/211,054 US20170052826A1 (en) | 2015-08-21 | 2016-07-15 | Resource management device and resource management method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015163971A JP2017041191A (ja) | 2015-08-21 | 2015-08-21 | リソース管理装置、リソース管理プログラム、及びリソース管理方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2017041191A true JP2017041191A (ja) | 2017-02-23 |
Family
ID=58157496
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015163971A Pending JP2017041191A (ja) | 2015-08-21 | 2015-08-21 | リソース管理装置、リソース管理プログラム、及びリソース管理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170052826A1 (ja) |
JP (1) | JP2017041191A (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10462070B1 (en) * | 2016-06-30 | 2019-10-29 | EMC IP Holding Company LLC | Service level based priority scheduler for multi-tenancy computing systems |
US11195100B2 (en) | 2016-08-17 | 2021-12-07 | International Business Machines Corporation | Determining applications based on interactions of different electronic devices |
US20180150331A1 (en) * | 2016-11-30 | 2018-05-31 | International Business Machines Corporation | Computing resource estimation in response to restarting a set of logical partitions |
US11803420B1 (en) * | 2016-12-20 | 2023-10-31 | Amazon Technologies, Inc. | Execution of replicated tasks using redundant resources |
JP6588956B2 (ja) * | 2017-11-14 | 2019-10-09 | 株式会社日立製作所 | 計算機、ボトルネック特定方法、及びプログラム |
CN107967178B (zh) * | 2017-12-06 | 2020-03-17 | Oppo广东移动通信有限公司 | 资源配置方法和资源配置装置及移动终端和介质 |
CN109376006B (zh) * | 2018-09-04 | 2021-09-21 | 西安电子科技大学 | 一种云计算环境下基于用户需求时变特性的资源整合方法 |
CN110784335B (zh) * | 2019-09-19 | 2022-09-02 | 烽火通信科技股份有限公司 | 一种云场景下的网元资源预留系统 |
-
2015
- 2015-08-21 JP JP2015163971A patent/JP2017041191A/ja active Pending
-
2016
- 2016-07-15 US US15/211,054 patent/US20170052826A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20170052826A1 (en) | 2017-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2017041191A (ja) | リソース管理装置、リソース管理プログラム、及びリソース管理方法 | |
EP3577561B1 (en) | Resource management for virtual machines in cloud computing systems | |
EP3577558B1 (en) | Resource management for virtual machines in cloud computing systems | |
US10120727B2 (en) | Techniques to allocate configurable computing resources | |
US8738972B1 (en) | Systems and methods for real-time monitoring of virtualized environments | |
JP5484601B2 (ja) | 並列分散処理システムのデータ転送制御方法、並列分散処理システム及び記憶媒体 | |
JP6241300B2 (ja) | ジョブスケジューリング装置、ジョブスケジューリング方法、およびジョブスケジューリングプログラム | |
US9852008B2 (en) | Computer-readable recording medium storing execution information notification program, information processing apparatus, and information processing system | |
Wang et al. | Smartharvest: Harvesting idle cpus safely and efficiently in the cloud | |
US7979864B2 (en) | Apparatus for setting used license of executing job into unused license state and allocating the set unused license to a to be executed job based on priority | |
US9207961B2 (en) | Cloud defragmentation | |
US9792142B2 (en) | Information processing device and resource allocation method | |
JP6233413B2 (ja) | タスク割り当て判定装置、制御方法、及びプログラム | |
US20140373010A1 (en) | Intelligent resource management for virtual machines | |
US20190146848A1 (en) | Adaptive Resource Management In Distributed Computing Systems | |
US9547520B1 (en) | Virtual machine load balancing | |
JP2016133964A (ja) | 計算資源割当て方法およびシステム | |
JP2011186701A (ja) | リソース割当装置、リソース割当方法、およびリソース割当プログラム | |
CN107430526B (zh) | 用于调度数据处理的方法和节点 | |
US20200012516A1 (en) | Migration management method, migration system, and storage medium | |
KR102469927B1 (ko) | 분할 메모리 관리장치 및 방법 | |
KR20100074920A (ko) | 멀티코어 시스템에서의 로드 밸런싱 장치 및 방법 | |
Yazdanov et al. | EHadoop: Network I/O aware scheduler for elastic MapReduce cluster | |
US20150269002A1 (en) | Allocation control method and apparatus | |
JP2010191567A (ja) | 情報管理装置及び情報管理方法等 |