JP5525654B2 - リソース管理方法および管理サーバ - Google Patents

リソース管理方法および管理サーバ Download PDF

Info

Publication number
JP5525654B2
JP5525654B2 JP2013508636A JP2013508636A JP5525654B2 JP 5525654 B2 JP5525654 B2 JP 5525654B2 JP 2013508636 A JP2013508636 A JP 2013508636A JP 2013508636 A JP2013508636 A JP 2013508636A JP 5525654 B2 JP5525654 B2 JP 5525654B2
Authority
JP
Japan
Prior art keywords
server
resource
trial
job
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013508636A
Other languages
English (en)
Other versions
JPWO2012137272A1 (ja
Inventor
翔一 楠田
智斉 内田
良史 高本
貴志 爲重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of JP5525654B2 publication Critical patent/JP5525654B2/ja
Publication of JPWO2012137272A1 publication Critical patent/JPWO2012137272A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/70Admission control; Resource allocation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3428Benchmarking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5077Logical partitioning of resources; Management or configuration of virtualized resources
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/5019Workload prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2209/00Indexing scheme relating to G06F9/00
    • G06F2209/50Indexing scheme relating to G06F9/50
    • G06F2209/508Monitor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、ネットワーク上のリソースを有効に活用することができるリソース管理方法および管理サーバに関する。
近年、大規模なクラウド技術や、異なるサーバ間でのリソースを組み合わせることのできるバスアーキテクチャ、I/O(Input/Output)デバイス割り当てをサーバ間で切り替えることができるI/Oスイッチ拡張装置を導入したリソース群が増加傾向にある。
また、クラウド技術の普及により、利用者または管理者の不特定化が進んでおり、不特定または未知数のハードウェアが不定期に増減する。このため、リソース群の配置管理をいかに行うかが重要となっている。リソース群の配置管理は、リソース群維持に要するコスト削減や、ユーザに提供するサーバの性能向上に多大に関係する。
リソース群の配置管理として、仮想計算機システムにおける演算に基づく方法が開示されている(例えば、特許文献1参照)。仮想計算機システムは、計算機の物理資源(リソース)を共有してアプリケーションを実行する複数の仮想装置と、複数の仮想装置を管理する仮想化手段と、仮想化手段を制御する管理手段とを有し、複数の仮想装置と管理手段との間で資源供給情報(例えば、資源割当量)および資源要求情報を交換しながら、第1の最適化演算と第2の最適化演算とを実行することにより、物理資源の動的な資源割り当てを行う。
WO2008/132924号公報
変動が生じるリソース群を対象とする場合、特許文献1に開示された演算に基づく方法でリソース配置の改善を行うと、演算に必要なパラメータ(例えば、リソースの種類や設定条件)の調査前後、およびそれらを用いた演算前後でのパラメータの不一致により、信頼できる改善された配置情報を管理者に提供できないことがある。
また、変動が生じないリソース群においても、演算によるリソース配置の改善は、把握できていないデバイスの周辺状況(温度または湿度、接続されているデバイス、故障、距離、通信量など)の影響により組み合わせたときに期待通りの性能が出ないことがある。
このため、要求する性能を可能にするリソース群の配置を、演算方法をよらないで、事前準備をしないで、改善のための必要時間にできるだけ制約されないで、入手可能な情報で随時行う仕組みも管理対象のリソース群にとっては必要となると考える。
本発明は、前記の課題を解決するための発明であって、ネットワーク上のリソースを有効に活用することができるリソース管理方法および管理サーバを提供することを目的とする。
前記目的を達成するため、本発明のリソース管理方法は、ネットワークに複数のサーバが接続された計算機システムにおいて、管理サーバが、該ネットワークで確保できたリソースを組み合わせて試行用サーバ(例えば、試行用物理サーバ100b、試行用仮想サーバ130b)を形成し、該試行用サーバが所定条件を満たす場合に、該ネットワークのサーバとして適用するリソース管理方法である。
管理サーバは、ネットワークで確保できたリソースに対し、試行用サーバが適用された際の適用情報の実績として抽出確率が登録されたリソース情報(例えば、リソース情報テーブル211)と、試行用サーバを採用するか否かの所定条件であるジョブを管理するジョブ管理情報(例えば、ジョブ管理テーブル215)とを記憶部に記憶している。また、管理サーバは、リソース情報の各リソースに対し、抽出確率が乱数生成部で発生させた乱数確率以上であれば、試行用のリソースとして選定し、選定されたリソースを組み合わせて試行用サーバを形成し、前記形成された試行用サーバを用いて前記ジョブを実行し、実行の結果がよければ、試行用サーバを該ネットワークのサーバとして適用することを特徴とする。
本発明によれば、ネットワーク上のリソースを有効に活用することができる。
本発明に係るネットワークシステムを示す全体構成図である。 管理サーバの構成を示す詳細図である。 仮想サーバ、試行用仮想サーバを適用した物理サーバの構成を示す詳細図である。 図3に示す仮想サーバ、試行用仮想サーバを適用した物理サーバとディスク装置との関係を示す詳細図である。 物理サーバ、試行用物理サーバの構成を示す詳細図である。 試行用物理サーバ、試行用仮想サーバが試行による改善で採用された際のリソースの再配置の関係を示す説明図である。 リソース情報テーブルの一例および使用率グラフを示す説明図であり、(a)はリソース情報テーブルの一例を示す図であり、(b)は、リソース情報テーブルの使用率グラフの例を示す図である。 改善リソース情報テーブルの一例を示す説明図である。 履歴テーブルの一例を示す説明図である。 サーバの関係テーブルの一例を示す説明図である。 ジョブ管理テーブルの一例を示す説明図である。 改善指定とジョブとの関係テーブルの一例を示す説明図である。 ジョブ結果管理テーブルの一例を示す説明図である。 改善記録テーブルの一例を示す説明図である。 情報収集部の処理を示すフローチャートである。 リソース配置改善部の処理を示すフローチャートである。 リソース確保・試行改善部の処理を示すフローチャートである。 試行改善部の処理を示すフローチャートである。 改善配置適用部の処理を示すフローチャートである。 比較情報取得部の処理を示すフローチャートである。 サーバの関係情報取得部の処理を示すフローチャートである。 リソース情報取得部の処理を示すフローチャートである。 仮想割り当て情報取得部の処理を示すフローチャートである。 サーバ群生成部の処理を示すフローチャートである。
以下、本発明の実施形態について図面を用いて詳細に説明する。
図1は、本発明に係るネットワークシステムを示す全体構成図である。図1に示すように、ネットワークシステムは、管理サーバ200と、1以上の物理サーバ100と、I/Oスイッチ拡張装置160、バス接続制御装置150とがネットワークスイッチ140を介して接続されている。物理サーバ100には、I/Oスイッチ拡張装置160、I/Oデバイス170を介して、ディスクボリューム190を有するストレージ装置180が接続されている。なお、物理サーバ100には、仮想サーバ130を提供する仮想化機構部131を有する物理サーバも含まれる。
管理サーバ200は、ネットワークシステムにおけるリソース群を有効に活用する上で、リソース配置の改善を行う制御の中心である。リソース群とは、リソースの総称であり、サーバを構成する構成品(例えば、プロセッサ、メモリ、HDD、FC(Fibre Channel)、LANなど)の組み合わせを意味する。
本実施形態に係る管理サーバ200は、ネットワーク上のリソースの情報を、物理サーバ100から収集し、割り当て済みでないリソース群の未使用のリソースを組み合わせて、試行用サーバ(試行用物理サーバ100b、試行用仮想サーバ130b)を形成し、試行用サーバが所定条件を満たす場合に、該ネットワーク上のサーバとして適用する。なお、試行用サーバというときは、試行用物理サーバ100b、試行用仮想サーバ130bを含む一般的表現である。
管理サーバ200は、ネットワーク上で確保できたリソースに対し、試行用サーバが適用された際の適用情報の実績として抽出確率Ep(Extraction probability)が登録されたリソース情報テーブル211(図7参照)と、試行用サーバを採用するか否かの所定条件であるジョブを管理するジョブ管理テーブル215(図11参照)とをメモリ201(記憶部)(図2参照)に記憶している。また、管理サーバ200は、リソース情報テーブル211(図7参照)の各リソースに対し、抽出確率Epが乱数生成部221(図2参照)で発生させた乱数確率Rp(Random numbers probability)以上であれば、リソースとして選定し、選定されたリソースを組み合わせて試行用サーバを形成し、形成された試行用サーバを用いて所定のジョブを実行し、実行の結果がよければ、試行用サーバを該ネットワーク上のサーバとして適用することができる。
図1に戻り、バス接続制御装置150は、例えば、物理サーバ100間(例えば、サーバブレード間)のSMP(Symmetric Multi Processor)接続による性能拡張の手法を実行する。SMP接続とは、複数のサーバブレードをひとつに結合し、より高性能なサーバを作る性能拡張の手法である。バス接続制御装置150は、管理サーバ200からの指示で、メモリ101、プロセッサ102を物理サーバ100(物理サーバ100a,試行用物理サーバ100b,仮想サーバ用の物理サーバ100c)に割り当てる。
図2は、管理サーバの構成を示す詳細図である。管理サーバ200は、メモリ201(記憶部)、プロセッサ202(処理部)、ユーザI/F203、ネットワークI/F204、ディスクI/F205から構成されている。
メモリ201には、リソース配置改善部206(図16参照)、情報収集部210(図15参照)を有しており、各種テーブル類には、リソース情報テーブル211(図7参照)、改善リソース情報テーブル212(図8参照)、履歴テーブル213(図9参照)、サーバの関係テーブル214(図10参照)、ジョブ管理テーブル215(図10参照)、ジョブ結果管理テーブル216(図12参照)、改善記録テーブル217(図13参照)、および改善指定とジョブとの関係テーブル218(図14参照)から構成される。
リソース配置改善部206は、乱数生成部221、リソース確保・試行改善部207(図17参照)、改善配置適用部209(図19参照)を有し、リソース確保・試行改善部207には、サーバ群生成部220(図24参照)を含む試行改善部208(図18参照)を有する。
ユーザI/F203は、メモリ201内の各テーブルをユーザ定義のもと更新する際にユーザの要求を管理サーバ200へ入力するためのI/Fである。ネットワークI/F204は、各サーバとネットワークを接続するI/Fである。ディスクI/F205は、各サーバとディスクボリューム190(図1参照)を接続するI/Fである。
リソース配置改善部206は、試行による方法、演算による方法によりリソースの配置改善をすることができる。試行による方法では、新規・改善・保守・増設・削減・故障特定などの試行方法によりリソースの抽出確率Epを設定したのち、リソース確保・試行改善部207を呼び出す。リソース確保・試行改善部207において、ネットワークに接続されたサーバ群から、各リソースの使用率を可能な範囲で調査し、試行用リソースを確保し、試行改善部208を呼び出す。試行改善部208では、確保できたリソースで試行用サーバを形成してジョブを実行するとともに現用のサーバでも実行し、ジョブ結果を現用のサーバと試行用サーバで比較し、サーバ群の改善確認をする。その結果をもって改善記録の成否を更新し、改善配置適用部209が、改善していれば生成された試行用サーバまたは試行用仮想サーバを適用する。
乱数生成部221は、乱数の生成部であり、生成された乱数確率Rp(乱数値)はリソースを選択する際に、リソース情報テーブル211(図7参照)の抽出確率Epと比較するために用いられる。乱数値は、例えば、最小値と最大値を与え、その間で乱数を発生させるとよい。リソース情報テーブル211(図7参照)の各リソースには、抽出確率Epが格納されており、どのリソースの抽出確率Epも0%にはならないように設定されている。各リソースの抽出確率Epが、乱数生成部221で発生させた乱数値以上であれば、そのリソースは試行用のリソースとして採用される。乱数生成部221によりリソースごとに毎回乱数を発生させることが本願発明の特徴でもある。
具体的に説明すると、第1のリソースの抽出確率Epが37.5とすると、最小値0、最大値99として整数値の乱数を発生させると乱数値12を得たとする。すると、12≦37.5となり、対象となるリソースは採用される。次の第2のリソースの抽出確率Epが12.5とすると、先に発生させた乱数値12.5で比較するのではなく、毎回乱数を発生させる。第2のリソースのための乱数値が14であるとすると、14>12.5となり、第2のリソースは採用されない。
なお、リソースの抽出確率Epは、初期値は50%で試行が行われ、試行が行われるたびにリソース配置改善部206内の抽出確率Epの変更(図16、ステップS1206〜ステップS1209参考)により更新され、0%<抽出確率Ep≦100%の間の値になる。
従来技術として、管理者が設定した条件を満たすリソースを選択しサーバを作成する方法に対し、本実施形態の方法では、未割り当てのリソースを無作為に抽出してサーバを作成し、作成されたサーバの性能をジョブによって評価している。このため、従来考えられなかったリソースの組み合わせができる可能性が多分にある。同様に、従来技術のひとつである演算による選択の場合にも、リソース選択について偶然性が入る余地はないが、本実施形態では、多分にリソース選択に偶然性が入る可能性がある。この点が本願発明の特徴のひとつとなっている。なお、無作為抽出の方法を実現する手段のひとつとして、乱数生成部221で発生した確率を用いているが、これに限定されるわけではない。
図3は、仮想サーバ、試行用仮想サーバを適用した物理サーバの構成を示す詳細図である。図4は、図3に示す仮想サーバ、試行用仮想サーバを適用した物理サーバとディスク装置との関係を示す詳細図である。物理サーバ100c(100)は、メモリ101、プロセッサ102、ユーザI/F103、ネットワークI/F104、ディスクI/F105から構成されている。
メモリ101内には、仮想割り当て情報取得部313(図23参照)を有する仮想化機構部131を有し、仮想化機構部131は、複数の仮想サーバ130(現用の仮想サーバ130a、ネットワーク上のサーバとして適用するか否かを試行するための試行用仮想サーバ130bが含まれる。)を有している。メモリ101のOS(Operating System)301内には、比較情報取得部310(図20参照)、サーバの関係情報取得部311(図21参照)、リソース情報取得部312(図23参照)を有する。
また、物理サーバ100cには、複数のディスクボリューム190からなるストレージ装置180(図1参照)が接続されている。ディスクボリューム190には、仮想I/Oデバイス171(図4参照)を介して、複数の仮想ディスク191を有している。なお、ストレージ装置180(図1参照)は、サーバ内蔵型でもファイバーチャネルなどを介した外部装置でもよい。
仮想化機構部131は、管理サーバ200のリソース配置改善部206(図2参照)からの指示で、プロセッサ102、メモリ101、仮想ディスク191、仮想I/Oデバイス171を仮想サーバ130a、試行用仮想サーバ130bに割り当てる。仮想サーバ130aは、管理サーバ200のリソース配置改善部206(図2参照)によって、仮想化機構部131の設定が変更されることにより、割り当てられているリソースが変更される。
試行用仮想サーバ130bは、管理サーバ200の試行改善部208(図2参照)により、現用の仮想サーバ130aと比較するために、リソース情報テーブル211(図7参照)の抽出確率Epに従って用意される仮想サーバである。
図5は、物理サーバ、試行用物理サーバの構成を示す詳細図である。図5には、図1で示した現用の物理サーバ100a、ネットワーク上のサーバとして適用するか否かを試行するための試行用物理サーバ100bの構成を示す。メモリ101のOS301内には、比較情報取得部310(図20参照)、サーバの関係情報取得部311(図21参照)、リソース情報取得部312(図23参照)を有する。
図6は、試行用物理サーバ、試行用仮想サーバが試行による改善で採用された際のリソースの再配置の関係を示す説明図である。図2を適宜参照して説明する。管理サーバ200の情報収集部210(図15参照)が未割り当てリソース群・割り当て済みリソース群の未使用部108を取得する。リソース配置改善部206が未割り当てリソース群・割り当て済みリソース群の未使用部108上に試行用物理サーバ100b、未割り当て仮想リソース群109上に試行用仮想サーバ130bを作成する。作成された試行用物理サーバ100bと現用の物理サーバ100aとを性能比較し、同様に、作成された試行用仮想サーバ130bと現用の仮想サーバ130aとを性能比較する。そして、リソース配置改善部206が、作成された試行用物理サーバ100b、試行用仮想サーバ130bが採用と判定した場合、改善配置適用部209が割り当て済みリソース群の使用部106へ試行用物理サーバ100b、割り当て済み仮想リソース群107へ試行用仮想サーバ130bとそれらに割り当てられているリソースを移動し、現用の物理サーバ100aと仮想サーバ130aとそれらに割り当てられているリソースを、未割り当てリソース群・割り当て済みリソースの未使用部108に移動し、リソース配置の改善が行われる。
図6を用いて、本願の特徴を説明する。例えば、図6に示す現用の物理サーバ100a、仮想サーバ130aは、管理者が設定した条件を満たすリソースを選択し作成したサーバであるのに対し、試行用物理サーバ100b、試行用仮想サーバ130bは、無作為抽出によりリソースを選択しサーバを作成したサーバである。このため、試行用物理サーバ100bは、CPU(Central Processing Unit、プロセッサ)が2GHzを3個採用した構成であるが、現用の物理サーバ100aのCPUが3GHzを2個採用した構成より、性能が向上することが偶然わかったことになる。このように、従来技術では、想定されるリソースの組み合わせで、所望する性能がでないことが多分にあるが、本実施形態では、管理者が予想していないリソースの組み合わせが実現できる。
次に、各種テーブルについて説明する。
図7は、リソース情報テーブルの一例および使用率グラフを示す説明図である。図7(a)はリソース情報テーブル211の一例を示し、図7(b)は、リソース情報テーブル211の使用率グラフ707の例を示す。図7(a)に示すリソース情報テーブル211は、管理サーバ200が保持しており、情報収集部210が収集した情報、ユーザI/F203からの入力情報を元に更新される。リソース情報テーブル211は、リソース名701、種類702、仮想関係703、論理・固有値設定704、物理位置705、割当状態706、使用率グラフ707、故障有無708、試行情報709、および抽出確率Ep(710)を含んで構成される。
具体的に説明すると、リソース名701が「FC1」の場合、種類702にはファイバチャネルデバイスであることを表す「FC」が格納される。仮想関係703には、仮想FCデバイスの「仮想FC2」を提供している親デバイスである情報が格納される。論理・固有値設定704には外部ストレージの割り当てなどに使用する「WWN(World Wide Name)情報」が格納される。物理位置705には「FC1」が搭載されている機器情報の「I/O拡張装置1」が格納される。割当状態706には現在割り当てられている「Srv1」、使用率グラフ707には過去の時間での使用率(FCの場合は帯域)を記録した「Graph1」、故障有無708にはユーザ指定や故障特定の試行によりこれまで故障と判断されなかったことを表す「無」、試行情報709には最後にそのリソースが対象になった試行の種類である「増設」(同じ改善IDでの試行で重複した調査を防ぐために、その試行の何番目の調査対象リソースであったかを記録する回数が括弧内に記録される。)、抽出確率Ep(710)にはFC1が各試行で割り当て可能リソースになっている時に、サーバ群生成部220で作成するサーバへの割り当てに使用される確率を表す。
抽出確率Ep(710)は、すでに説明したとおり、初期値は50%が設定され、試行が行われる度にリソース配置改善部206内の抽出確率Epの変更の処理により更新される。抽出確率Epは、0%より大きい値から100%の間の値になり、サーバ群生成部220でリソース使用の有無を決める確率である。
図7(b)に示す使用率グラフは、例えば、CPUの使用率を示すグラフであり、時間経過に応じて使用率が変化していることを示している。
本実施形態では、サーバ群生成部220で作成するサーバへの割り当てに使用される確率とは、具体的には、リソース情報テーブル211にあるリソースに対し、抽出確率Ep(710)と、乱数生成部221で発生させた確率とを比較し、抽出確率Epが乱数生成部221で発生させた確率以上であれば、作成するサーバへ該当リソースを適用することを意味する。
図8は、改善リソース情報テーブルの一例を示す説明図である。改善リソース情報テーブル212は、管理サーバ200が保持しており、リソース確保・試行改善部207(図2参照)が採用した試行用物理サーバ100b、試行用仮想サーバ130bの情報を元に更新される。改善リソース情報テーブル212は、リソース名801、種類802、仮想関係803、論理・固有値設定804、物理位置805、割当状態806、および故障有無808を含んで構成される。
図8に示すリソース名801、種類802、仮想関係803、論理・固有値設定804、物理位置805、割当状態806、および故障有無808は、図7に示すリソース名701、種類702、仮想関係703、論理・固有値設定704、物理位置705、割当状態706、および故障有無708に対応するものである。
図9は、履歴テーブルの一例を示す説明図である。履歴テーブル213は、情報収集部210(図2参照)がリソース情報を更新した日時であるリソース情報更新日時901、変更リソース数902、変更関係数903を含んで構成される。変更リソース数902は、リソース情報テーブル211が変更された頻度であり、変更関係数903は、サーバの関係テーブル214(図10参照)が変更された頻度である。
リソース配置改善部206は、図16のステップS1201の改善方法収集の処理で、履歴テーブル213を参照し、変更頻度が多い場合は試行によるリソース配置改善へ、頻度が少ない場合は演算によるリソース配置改善に改善方法を選択する際の参考にするとよい。
図10は、サーバの関係テーブルの一例を示す説明図である。適宜図3、図5を参照して説明する。サーバの関係テーブル214は、情報収集部210が収集した情報、すなわち、サーバの関係情報取得部311、リソース情報取得部312、および仮想割り当て情報取得部313から得た情報、または、ユーザI/F203から入力された情報を元に作成される。サーバの関係テーブル214は、各サーバのサーバ名1001、リソースを共用しているサーバを示すリソース共用1002、相互通信をしているサーバを示す相互通信1003、起動時間が同じようなサーバを示す起動時間1004を含んで構成される。具体的には、サーバ名「Srv1」の場合、「Srv2」のサーバとリソースを共用し、「Srv3」のサーバと相互通信し、「Srv6」のサーバとほぼ同じような起動時間であることがわかる。
図11は、ジョブ管理テーブルの一例を示す説明図である。ジョブ管理テーブル215は、試行改善部208(図2参照)が運用中の各サーバの比較を行うときに用いるジョブ内容のテーブルである。ジョブ管理テーブル215は、ジョブID1101、ジョブ内容1102、比較値1103、および比較に用いる判断方法1104を含んで構成される。
具体的に説明すると、ジョブ1の場合、ジョブAを実行し、問題なく実行できれば採用」となる。ジョブ2の場合、ジョブBを実行し、時間測定し、比較値である5秒よりも実行にかかる時間が短ければ採用となる。ジョブ3の場合、データ保存を実行し、保存できれば採用となる。ジョブ4の場合、ジョブCを実行し、関係あるサーバ群全てで問題なく実行できれば採用となる。ジョブ5の場合、PINGなどの通信試験をし、関係あるサーバ群全てと通信できれば採用となる。ジョブ6の場合、アプリケーションプログラムを実行し、特定のアプリケーションプログラムがエラーなく動作できれば採用となる。ジョブ7の場合、メモリ負荷のジョブを実行し、負荷結果1よりも良い結果が記録されると採用となる。
図12は、改善指定とジョブとの関係テーブルの一例を示す説明図である。改善指定とジョブとの関係テーブル218は、リソース配置改善する際に指定する改善指定1201とジョブID1202とを含んで構成される。図12に示すジョブID1202と図11に示すジョブID1101とは対応している。改善指定1201は、管理者が管理端末(図示していない)を介して指定すると、管理サーバ200は、試行用物理サーバ100b、試行用仮想サーバ130bに対して、改善指定1201に対応するジョブID1202の実行をする。また、管理サーバ200は、比較対象の現用の物理サーバ100a、現用の仮想サーバ130aに対しても同様に、改善指定1201に対応するジョブID1202の実行をする。すなわち、管理サーバ200の試行改善部208が比較情報取得部310に対して指定し、その実行結果を取得することになる。
具体的には、「新規」が指定されるとジョブ1を実行し、図11のジョブ管理テーブル215を参照して問題なく実行できるか否かが判断される。「改善」が指定されるとジョブ2を実行し、図11のジョブ管理テーブル215を参照して、比較値よりも実行にかかる時間が短縮できるか否かを判断する。
図13は、ジョブ結果管理テーブルの一例を示す説明図である。ジョブ結果管理テーブル216は、管理サーバ200の試行改善部208が収集した情報によって更新され、比較情報取得部310が各改善IDでのジョブを実行したリソースの組み合わせ、ジョブ、ジョブ結果履歴を保持する。ジョブ結果管理テーブル216は、改善ID1301、サーバ群1302、リソース1(1303)、リソース2(1304)、リソース3(1305)、リソース4(1306)、ジョブID1307、およびジョブ結果1308を含んで構成される。
具体的に説明すると、Test1の場合、「Srv3」のサーバは、CPU1、Mem1、HDD1、LAN1のリソースの組み合わせで構成されており、ジョブ3およびジョブ6が実行され、実行結果として、アプリケーション動作が成功していることがわかる。Test2の場合、「VSrv2」の仮想サーバは、VCPU2、Vmem2、VHDD2、VFC2のリソースの組み合わせで構成されており、ジョブ2を実行したが時間切れなどで実行できなかったことがわかる。
図14は、改善記録テーブルの一例を示す説明図である。改善記録テーブル217は、試行改善部208が試行による改善を行った際に、改善記録をするテーブルである。改善記録テーブル217は、改善ID1401、試行の種類を決める改善指定1402、管理対象のサーバ・リソース群全体の改善目標を格納する採用構成1403、情報収集ポリシー1404、改善の対象となるサーバ群1405、サーバ群の関係1406、成否1407、試行による改善を打ち切る目安の時間や繰り返し回数などの試行の超過判断1408、および試行の繰り返しの回数1409を含んで構成される。
具体的に説明すると、リソース配置改善部206が図16のステップS1202における改善記録更新の処理で改善ID1401である「Test1」が生成される。そののち、ステップS1201において選択情報収集の処理で、ユーザ(管理者も含む。)が、試行による改善として「保守」および「Srv3」で指定されていると、改善指定1402には「保守,Srv3」が格納される。改善指定1402の情報により、改善指定とジョブとの関係テーブル218(図12参照)から、試行改善部208が、図18のステップS1403において、比較情報取得部310の呼び出しの処理を行うと、比較情報取得部310に実行させるジョブが決まる。
採用構成1403は、ユーザ指定により「リソース最小」が格納される。採用構成1403の情報は、サーバ群生成部220が作成したサーバ群の中で、試行改善部208が図18のステップS1404において現用のサーバと比較の処理で、改善したサーバが複数見つかった場合に選定のために使用される。
情報収集ポリシー1404は、ユーザからの指定(例えば、「定期」)で格納される。情報収集ポリシー1404は、情報収集部210が、次に、ステップS1101(図15参照)において情報取得ポリシー設定の処理を行うとき自動設定してもよい。この場合、改善記録テーブル217の成否1407に「成功」がある改善のときに採用されていたポリシーを情報収集ポリシー1404の列から得て、採用する際に用いることが好ましい。
サーバ群1405には、改善指定1402でサーバの指定があった場合、サーバの関係テーブル214(図10参照)から関係のあるサーバを格納し、リソースの指定があった場合、リソース情報テーブル211からそのリソースの割り当てられているサーバを特定してサーバの関係テーブル214から関係のあるサーバを格納する。図14のTest1の場合は、サーバの関係テーブル214の「Srv3」の行で関係が記載されている「Srv1,Srv2」が「Srv3」と共に格納される。
サーバ群1405の情報は、各部のサイジングや改善結果取得までの収束時間を早めるためなど、全体を通して使用される。改善配置の移行が失敗した場合などで、移行対象をサーバの関係テーブル214の情報を元に削っていく場合、サーバ群1405のサーバが削減される。
サーバ群の関係1406は、サーバ群1405にサーバを格納したときに参照したサーバの関係テーブル214の関係項目を記録する。図14のTest1の場合、サーバの関係テーブル214の「Srv3」の行に値が入っていた「相互通信」と「起動時間」が格納されている。
成否1407は、リソース配置改善部206が図16のステップS1214の改善記録の成否更新の処理によって、この改善ID1401での改善が成功したか、失敗したかの情報が格納される。Test1の場合は、超過判断1408の時間を越えてしまったため、試行改善部208が図18のステップS1406の制限時間・回数の処理にて、「時間切れ(所要時間107h)」と格納される。
超過判断1408は、ユーザ指定、デフォルト値の時間、または、回数が格納される。Test1の場合、100h(100時間)と設定されており、改善配置が100hを超えても見つけられなかったため、試行改善部208の図18のステップS1406の制限時間・回数の処理で時間切れと判断され、成否1407が「時間切れ」で更新されている。
さらに具体的に説明すると、図14に示すTest1の場合、管理サーバ200は、「Srv3」の「保守」の試行を「定期」的に実行している。管理サーバ200は、リソース群の組み合わせでサーバ群1405にある試行用物理サーバ「Srv1」,「Srv2」,「Srv3」を形成し、ジョブ3のデータ保存を試行しているが、保存できない結果となっていることがわかる。ただし、試行用物理サーバ100bの群を現用の物理サーバ100aの群に移行する際、リソース不足があった場合、改善配置適用部209のステップS1506(図19参照)で、移行対象とするサーバを減らし移行を実施する。詳細については後記する。
Test2の場合、管理サーバ200は、「VSrv1」の「改善」の試行を「監視」で実行している。管理サーバ200は、リソース群の組合せでサーバ群1405にある実用の仮想サーバ「VSrv1」,「VSrv2」を形成し、ジョブ2のジョブB実行による時間測定を試行しているが、改善できていないことがわかる。なお、採用構成1403として「リソース集約」が指定されて、改善できるリソース配置が複数みつかった場合、物理位置が同じ場所のリソースが多く割り当てられている構成を採用することを意味する。
Test3の場合、管理サーバ200は、試行用物理サーバ「Srv5」を形成し、ジョブ4のジョブCを実行し、成功していることがわかる。
Test4の場合、管理サーバ200は、試行用物理サーバの3台を形成し、ジョブ1のジョブAを実行し、成功していることがわかる。
次に各処理フローについて説明する。
図15は、情報収集部の処理を示すフローチャートである。適宜図2、図3、図5を参照して説明する。情報収集部210は、各サーバに配置したサーバの関係情報取得部311、リソース情報取得部312、および仮想割り当て情報取得部313からリソースの情報を収集する。管理サーバ200が管理していないサーバの場合には、サーバの関係情報取得部311、リソース情報取得部312、および仮想割り当て情報取得部313を配置する処理をする。なお、所定のステップの処理(例えば、ステップS1102、ステップS1106)は、所要時間の許す限り行うものとし、規定、またはユーザ指定の時間に達した場合は、処理を切り上げ次の処理に進む。
情報収集部210は、ユーザI/F203からの入力値から、または、改善記録テーブル217(図14参照)の成否列にある結果が成功する傾向にある情報収集ポリシー1404により、情報取得のためのポリシー(例えば、定期的に行うか、監視によって行うか)を設定する(ステップS1101)。設定されたポリシーに基づき、サーバの関係情報取得部311、リソース情報取得部312、および仮想割り当て情報取得部313がリソースの情報を収集する。
情報収集部210は、サーバを検出する(ステップS1102)。リソース情報取得部312とサーバの関係情報取得部311とが未適用、あるいは、情報取得ポリシーの更新が行われていないサーバを検出する。また、仮想サーバを適用するサーバに対しては、仮想割り当て情報取得部313が未適用の物理サーバ100c(図3参照)を検出する。
情報収集部210は、ステップS1102で検出したサーバに対し、各情報取得部を配置する(ステップS1103)。具体的には、情報収集部210が検出したサーバに、サーバの関係情報取得部311、リソース情報取得部312、および必要なら仮想割り当て情報取得部313を、ステップS1101における設定を反映して、プッシュインストールする。なお、プッシュインストールとは、管理サーバ200がネットワーク上の対象とするサーバを遠隔操作して必要なソフトウェアなどをインストールすることをいう。
情報収集部210は、ステップS1101で設定されたポリシーを判断し(ステップS1104)、リソース監視の場合(ステップS1104、監視検出)、ステップS1106へ、定期的に行う設定の場合(ステップS1104、定期検出)、ステップS1105に進む。
ステップS1105において、情報収集部210は定期取得する。情報収集部210は、リソース情報取得部312、サーバの関係情報取得部311、および仮想割り当て情報取得部313から定期的に送られてくる情報を受ける。
ステップS1106において、情報収集部210は取得部からの応答待ちをする。情報収集部210は、リソース情報取得部312、サーバの関係情報取得部311、および仮想割り当て情報取得部313から随時送られてくる情報を受ける。
情報収集部210は、ステップS1105、ステップS1106で取得した情報を元に、リソース情報テーブル211(図7参照)およびサーバの関係テーブル214(図10参照)を更新する(ステップS1107)。
情報収集部210は、履歴テーブル213(図9参照)を更新する(ステップS1108)。情報収集部210は、ステップS1107において更新した日時と、いくつのリソースの情報が更新されたかを、履歴テーブル213に記録し、ステップS1101に戻る。
図16は、リソース配置改善部の処理を示すフローチャートである。図16は、リソース配置改善部206の処理の詳細を表している。リソース配置改善部206は、改善指示を受けると、改善方法を収集する(ステップS1201)。具体的には、リソース配置改善部206は、履歴テーブル213(図9参照)のリソース情報更新日時901、変更リソース数902、変更サーバの変更関係数903を確認する。また、リソース情報テーブル211(図7参照)の使用率グラフから全リソースの運用が止められる期間の有無を調査する。ユーザI/F203から改善方法に指定があるか確認する。
リソース配置改善部206は、改善記録を更新する(ステップS1202)。リソース配置改善部206は、改善記録テーブル217(図14参照)に新規の改善IDの行を作成し、ステップS1201で確認した改善指定(例えば、演算か試行か)、採用基準(採用構成1403に対応)を格納する。ステップS1201で変更リソース数902(図9参照)が規定値以下、または、全リソースの運用停止期間が有る場合で、かつ、ユーザから指定がなければ改善指定に演算を格納する。
図16においては、改善指定において試行の場合、新規・改善・保守・増設・削減・故障特定に限定して説明する。また、ユーザが対象サーバを指定した場合はサーバ名も含む。採用基準については、ユーザの指定によりリソース最小(もっとも使用リソースが少なくなる構成を目指す)、リソース集約(各サーバの割り当てリソースの物理位置が近くなる構成を目指す)、リソース分散(各サーバの割り当てリソースの物理位置が広く分布する構成を目指す)などが格納される。なお、新規とは改善ではなく、新しいサーバをユーザの要求にしたがって構築する場合を指す。
リソース配置改善部206は、改善方法を判別する(ステップS1203)。リソース配置改善部206は、改善記録テーブル217(図14参照)を参照して、ステップS1202で作成した改善IDの改善指定1402に従い、演算であれば(ステップS1203、演算)、ステップS1204へ進み、試行であれば(ステップS1203、試行)、ステップS1205へ進む。
ステップS1204において、リソース配置改善部206は、公知例(国際公開番号WO2008−132924)などに従って演算による最適化改善処理を行う。改善後の演算結果とリソース配置情報で、改善記録テーブル217(図14参照)・改善リソース情報テーブル212(図8参照)を更新する。
具体的には、管理サーバ200は、アプリケーションやデバイスの性能、設定といった情報を効用関数のパラメータとして扱い、リソースの配置改善が見られる傾向にしたがって、関数の調整と、解の導出を繰り返し、計算によって最適なパラメータ値(最適な配置情報も含む)を求める。そして、パラメータの把握が容易なリソース群に対しては、改善されたリソース配置を導出し、リソース配置を導出ができた場合、その情報を元にリソース配置を行うため、改善リソース情報テーブル212(図8参照)を更新する。また、改善記録テーブル217(図14参照)は、次回の改善時に改善方法(演算か試行か)を選択する際に使用される情報であるので、管理サーバ200は、演算による改善の成否を改善記録テーブル217(図14参照)に記録する。
ステップS1205において、リソース配置改善部206は、試行内容である新規・改善・保守・増設・削減・故障特定を判別し、次のステップ(ステップS1206〜S1209)へ進む。次のステップは、リソース情報テーブル211(図7参照)の抽出確率Epを調整する分岐処理である。
ステップS1206において、新規/改善/サーバ指定の場合、抽出確率Epを変更する処理(1)が実行される。リソース情報テーブル211(図7参照)の使用率グラフから使用率に応じて同テーブル内の抽出確率Epを今回の改善IDの試行の間、次のように変更する。
割り当てリソースの片寄を行いたい場合は、使用率の高いリソースの抽出確率Epを上げ、使用率の低いリソースの抽出確率Epを下げる。分散させたい場合は逆にする。また、改善記録テーブル217(図14参照)の成否1407の列に成功情報があり、今回の改善IDのサーバ群列・群のサーバの関係列の内容と類似(同じサーバ数、同じサーバの関係など)している改善IDの所要時間・所用回数が小さい試行が有った場合、そのサーバ群の使用しているリソースを、リソース情報テーブル211(図7参照)で特定して、リソースの抽出確率Epを上げ、収束が早くなる工夫を行うとよい。そして、ステップS1210に進む。
なお、リソース情報テーブル211(図7参照)の試行情報709の列にある括弧書きの数値は、同じ改善IDでの試行で重複した調査を防ぐために、その試行の何番目の調査対象リソースであったかを記録する回数である。
ステップS1207において、保守の場合、抽出確率Epを変更する処理(2)が実行される。リソース配置改善部206は、リソース情報テーブル211(図7参照)から特定されたユーザ指定の保守サーバ内のリソースについて、リソース情報テーブル211の試行情報709の列の値を「保守」に変更する。また、「保守」となったリソースの抽出確率Epを下げ、それ以外のリソースの抽出確率Epは上げる。そして、ステップS1212に進む。
ステップS1208において、増設/削減(増減)の場合、抽出確率Epを変更する処理(3)が実行される。リソース配置改善部206は、無作為、あるいは、事前にユーザに指定されたリソースについて、リソース情報テーブル211(図7参照)の試行情報709の列を「増設(#)」「削減(#)」に変更する。なお、括弧内の番号(#)は、全リソースに対して調査を行ったか判別するために使用される。増設となっているリソースは抽出確率Epを上げ、それ以外のリソースの抽出確率Epは下げる。削減となっているリソースは抽出確率Epを下げ、それ以外のリソースの抽出確率Epは上げる。そして、ステップS1212に進む。
ステップS1209において、故障特定の場合、抽出確率Epを変更する処理(4)が実行される。リソース配置改善部206は、事前のユーザ入力、管理ソフトウェアから受け取った障害情報、または、前回の故障特定の試行においてステップS1216において、リソース情報テーブル211(図7参照)の故障有無708の列が「有」にされたリソースと同じ物理位置のリソースの試行情報を「故障(#)」とし、リソースの抽出確率Epを上げ、その他のリソースについては抽出確率Epを下げる。特に選択に用いる情報が無ければ無作為にリソースを選択し、そのリソースを含む同じ物理位置のリソースの試行情報を「故障(#)」とし、リソースの抽出確率Epを上げる。そして、ステップS1212に進む。
ステップS1210において、リソース配置改善部206は、試行が新規か改善かサーバ指定かを判別し、新規であれば(ステップS1211,新規)、改善記録テーブル217(図14参照)を、デフォルト値、ユーザ入力値で作成し(ステップS1211)、ステップS1213に進む。改善/サーバ指定の場合、ステップS1212に進む。
ステップS1212において、リソース配置改善部206は、サーバの関係や指定されたサーバ情報で、改善記録テーブル217を作成する。指定されたサーバやリソースが有る場合は、リソース配置改善部206が、サーバの関係テーブル214(図10参照)からそのサーバやリソースとサーバの関係の強いサーバ同士を選択し、改善記録テーブル217のサーバ群1407の列に記録する。同じ改善IDでの処理で再度選択するときは、改善記録テーブル217(図14参照)の履歴から選択したことのある群にはならないように選択する。
リソース配置改善部206は、リソース確保・試行改善部207(図17参照)を呼び出し(ステップS1213)、改善記録テーブル217(図14参照)の成否1407の列を更新する(ステップS1214)。制限時間・回数を超過している場合は、成否1407の列を所要時間・回数情報とともに「失敗」に更新する。
それ以外の処理は、改善記録テーブル217(図14参照)の改善指定1402の列の値で異なる。
(1)新規・改善の場合:
改善リソース情報テーブル212(図8参照)の全てのサーバに、リソースの割り当てが済んでいる場合、改善記録テーブル217(図14参照)の成否1407の列に所要時間・回数情報とともに「改善」と格納する。
(2)保守の場合:
リソース情報テーブル211(図7参照)の試行情報709の列の値が「保守」になっているリソース全てで、割当状態706の列に割り当てられているサーバが無くなっている場合、改善記録テーブル217(図14参照)の成否1407の列に所要時間・回数情報とともに「保守対応可」と格納する。すなわち、リソースがどのサーバにも割り当てられていない状態を意味する。
(3)増設/削減の場合:
リソース情報テーブル211(図7参照)の試行情報709の列が「増設」になっているリソースの使用率が100%またはユーザ指定の値以上である場合、改善記録テーブル217(図14参照)の成否1407の列を所要時間・回数情報とともに「増設可」にする。同様に、リソース情報テーブル211(図7参照)の試行情報709の列が「削減」になっているリソースの使用率が0%またはユーザ指定の値以下である場合、改善記録テーブル217(図14参照)の成否1407の列を所要時間・回数情報とともに「削減可」にする。
本実施形態では、リソースの使用率が100%またはユーザ指定の値以上である場合、リソースの増設を推奨する旨を改善記録テーブル217(図14参照)に記録することができる。同様に、リソースの使用率が0%またはユーザ指定の値以下である場合、リソースの削除を推奨する旨を前記改善記録テーブル217に記録することができる。
試行情報709内の括弧内の番号(#)が最後になっている場合、成否1407の列を所要時間・回数情報とともに「増設不可」または「削減不可」にする。番号(#)は、全リソースに対して調査を行ったか判別するために使用される。図7に示すFC1の行の試行情報709は、改善指定が「増設」の判定で2番目に、LAN2の行の試行情報内709は、「故障」の判定で1番目に調査対象として選ばれたという履歴を表す。
(4)故障特定の場合
リソース情報テーブル211(図7参照)の試行情報709の列の値が「故障」となっているリソースの割当状態706列に情報が格納されていない場合、ユーザに故障の可能性があるリソースとして、改善記録テーブル217(図14参照)の成否1407の列に所要時間・回数情報とともに「故障(リソース名)」を格納する。他方、リソースの割当状態706の列に情報が格納されており、試行情報709内の#が最後になっている場合、改善記録テーブル217(図14参照)の成否1407の列に所要時間・回数情報とともに「故障無し」と格納する。
リソース配置改善部206は、採用判定をする(ステップS1215)。改善記録テーブル217(図14参照)の成否1407の列が空欄の場合(ステップS1215,再試行)、ステップS1205へ戻る。改善記録テーブル217の成否1407の列が「失敗」、「増設可」、「削減可」、「増設不可」、「削減不可」、「故障(リソース名)」、「故障無し」の場合(ステップS1215,試行終了)、ステップS1216へ進む。改善記録テーブル217の成否1407の列が「改善」の場合(ステップS1215,採用)、ステップS1217へ進む。
ステップS1216において、リソース配置改善部206は、ユーザに通知をする。「失敗」、「増設可」、「削減可」、「増設不可」、「削減不可」、「故障(リソース名)」、「故障無し」に応じた情報をユーザに提示し、リソース情報テーブル211(図7参照)を更新する。例えば、「故障」の場合は、リソース情報テーブル211の故障708の列を「有」にし、「故障無し」の場合は「無」にする。
ステップS1217において、リソース配置改善部206は、改善配置適用部209(図19参照)を呼び出し、改善配置を実行し、ステップS1201に戻る。
本実施形態では、管理サーバ200は、例えば、ジョブの判断方法を満たさない回数が所定回数を超えた場合、または、ジョブの判断方法を満たさない試行時間が所定時間を超えた場合、リソース配置の改善ができない旨を管理者に通知することができる。
図17は、リソース確保・試行改善部の処理を示すフローチャートである。図17は、リソース確保・試行改善部207の処理の詳細を表している。なお、所定のステップの処理(例えば、ステップS1301)は、所要時間の許す限り行うものとし、規定、またはユーザ指定の時間に達した場合は、処理を切り上げ次の処理に進む。
リソース確保・試行改善部207は、現用のサーバ群の比較情報取得部310を呼び出し、所定のジョブで性能を測定し、リソース情報テーブル211(図7参照)から該当するリソースの使用率を可能な範囲で調査する(ステップS1301)。具体的には、リソース確保・試行改善部207は、改善記録テーブル217(図14参照)のサーバ群1405の列のサーバに割り当てられているリソースの性能を、テストに必要なジョブを改善指定1402および改善指定とジョブとの関係テーブル218(図12参照)に基づいて特定する。そして、そのサーバ群1405に指定されたサーバに対し、比較情報取得部310を呼び出し、ジョブの結果を収集し、ジョブ結果管理テーブル216(図13参照)を更新する。また、リソースの使用率は、リソース情報テーブル211(図7参照)の使用率グラフ707から収集する。
リソース確保・試行改善部207は、リソース情報テーブル211(図7参照)に基づき、未割り当てとなっているリソースを試行用リソースとして確保する(ステップS1302)。試行用リソースを確保する際、改善記録テーブル217(図14参照)の今回の改善IDの超過判断に格納されている時間(例えば、100h(100時間))、確保することを試みる。また、過去の実績として、リソース情報テーブル211(図7参照)の使用率グラフに、変動がないリソースは、その未使用部分を、試行用リソースとして確保する。
また、改善記録テーブル217(図14参照)で、サーバ群1405のサーバの関係の情報が類似(同じサーバ数、同じサーバの関係、など)しており、成否1407の列に成功情報が格納されている改善IDがある場合は、成否1407の列にある所要時間だけ、過去の実績として、リソース情報テーブル211(図7参照)の使用率グラフに、変動がないリソースは、その未使用部分を、試行用リソースとして確保する。
リソース確保・試行改善部207は、試行改善部208(図18参照)を呼び出し(ステップS1303)、ステップS1302で確保したリソースで、試行改善できるか否かの処理を行う。
リソース確保・試行改善部207は、改善リソース情報テーブル212(図8参照)を参照し、改善記録テーブル217(図14参照)のサーバ群に改善後のリソース割り当てが行われているかについての改善リソース情報調査を行う(ステップS1304)。
リソース確保・試行改善部207は、改善されているか否かの判定を行う(ステップS1305)。リソース確保・試行改善部207は、ステップS1304における改善リソース情報調査で、改善記録テーブル217(図14参照)のサーバ群の全てに、改善リソース情報テーブル212(図8参照)でリソースが割り当てられていた場合(ステップS1305,改善)、処理を終了し、割り当てられていなかった場合(ステップS1305、改善無し)、ステップS1306へ処理を進む。
リソース確保・試行改善部207は、集約調査として、リソースの使用率とジョブ結果管理テーブル(図13参照)から処理の集約可能なリソースを特定する(ステップS1306)。すなわち、リソース確保・試行改善部207は、ジョブ結果管理テーブル216(図13参照)のジョブID1307とジョブ結果1308からジョブに対する結果が同じ、または、同等のリソースの組み合わせを持つサーバを見つけ出し、リソース情報テーブル211(図7参照)の使用率グラフ707を参照し、過去においてグラフの和が100%を超える事が無かったかを確認する。過去において超えることが無かった場合、比較したリソースを使用しているサーバはどちらかのリソース上に集約可能とする。
リソース確保・試行改善部207は、集約可能か判断し(ステップS1307)、集約可能なサーバが有る場合(ステップS1307,集約可)、ステップS1308に進み、集約可能なサーバが見つけられなかった場合(ステップS1307,集約不可)、集約不可として処理を終了する。
ステップS1308において、ステップS1306の集約調査において、リソース確保・試行改善部207は、集約可能と判明したサーバを集約させる。すなわち、同リソース上に同居させ、未割り当てリソースを増やすようにするとよい。
図18は、試行改善部の処理を示すフローチャートである。試行改善部208は、サーバ群を生成(作成)し、作成したサーバ群に比較情報取得部310を配置し、試行のジョブで、現用のサーバ群と作成した試行用サーバ群とで性能比較し、サーバ群の改善があるか否かの判定処理などを行う。
試行改善部208は、サーバ群生成部220(図24参照)を呼び出し(ステップS1401)、作成したサーバ群に比較情報取得部310を配置する(ステップS1402)。すなわち、サーバ群生成部220で作成した各試行用サーバ群に、比較情報取得部310をプッシュインストールする。
試行改善部208は、現用のサーバ群と、試行用サーバ群との比較情報取得部を呼び出す(ステップS1403)。具体的には、改善記録テーブル217(図14参照)で今回の改善IDに対応した改善指定1402の列とサーバ群1405の列から、改善指定とジョブとの関係テーブル218(図12参照)に基づいてジョブを特定し、各試行用サーバ群上で比較情報取得部310がジョブを実行し、ジョブの実行後に回収した結果を、ジョブ結果管理テーブル216(図13参照)へ格納する。
試行改善部208は、ジョブ結果管理テーブル216(図13参照)にある現用のサーバ群と各試行用サーバ群のジョブ結果について、ジョブ管理テーブル215(図11参照)の判断方法1104の列の情報と、改善記録テーブル217(図14参照)の採用構成1403の列の情報を元に比較(ジョブの実行時間が短縮され、かつ、リソース使用量が減るか、など)し(ステップS1404)、採用か不採用かを決める。採用の場合は、改善リソース情報テーブル212(図8参照)に試行用サーバのリソース配置情報を格納する。また、採用の際に、ジョブ管理テーブル215(図11参照)の判断方法に応じて比較値を更新することも可能である。
試行改善部208は、ステップS1404の比較結果、全ての試行用サーバ群が採用となった場合(ステップS1405,未改善サーバ無し)、処理を終了し、不採用があった場合(ステップS1405,未改善サーバ有り)、ステップS1406へ進む。
ステップS1406において、試行改善部208は、制限時間や回数が改善記録テーブル217(図14参照)の超過判断1408の列の内容以上になっている場合(ステップS1406、以上)、処理を終了し、超えていない場合(ステップS1406,未達)、ステップS1401に戻る。
具体的に説明すると、図14のTest1の場合、現用のサーバ群である「Srv1」,「Srv2」,「Srv3」に対し、試行用サーバ群である「Srv1」,「Srv2」,「Srv3」を生成し、現用のサーバ「Srv1」と試行用サーバ「Srv1」の比較、現用のサーバ「Srv2」と試行用サーバ「Srv2」の比較、現用サーバ「Srv3」と試行用サーバ「Srv3」の比較を行い、これら全ての比較で、改善された結果を得られるようになるまで、試行用サーバ群を生成し、現用のサーバ群と試行用サーバ群との性能比較を繰り返すとよい。試行用サーバ群の性能が現用のサーバ群の性能と比較して改善している場合、試行用サーバ群をネットワーク上のサーバとして適用する。
図19は、改善配置適用部の処理を示すフローチャートである。改善配置適用部209は、過去のリソースの使用率の傾向から将来的に移行できるか、リソースの使用率面積分で移行調査する(ステップS1501)。改善配置適用部209は、改善リソース情報テーブル212(図8参照)の移行先リソースと、改善記録テーブル217(図14参照)のサーバ群1405のサーバに割り当てられている同種のリソースとについて、リソース情報テーブル211(図7参照)のリソースの使用率グラフ707に基づいて面積分し、その差を比較する。改善前後のサーバ(現用のサーバと試行用サーバ)で取得したジョブ結果管理テーブル216(図13参照)のジョブ結果1308の列の結果に差があるときは、面積比較時にその差を考慮するため、面積値に性能差に基づく比率をかける。例えば、通信速度を測るジョブだった場合は、使用率の面積分にその速度比をかけた値を比較の数値にする。
具体的に説明すると、ジョブ結果管理テーブル216(図13参照)で同じジョブIDと比較可能な結果を持つリソースだった場合、その結果を面積値に反映させ比較することになる。LAN1の使用率グラフ面積分が「50(24hの%合計)」、LAN2の使用率グラフの空き部分の面積分「30(24hの%合計)」であったとする。この場合において、LAN1とLAN2との性能差があり、LAN2の性能がLAN1の性能の5/3倍以上であった場合、LAN2上の仮想LANやLAN2使用中の他サーバと交互切替え使用であれば、LAN1の移行先にできると判断する。
改善配置適用部209は、ステップS1501の面積分の差から移行できるか否かを判断し(ステップS1502)、面積分の差が移行先リソースの全てで現リソースより使用率グラフの面積分が小さい場合(ステップS1502,移行)、ステップS1503へ進み、どれか一つでも大きい場合(ステップS1502,移行対象変更)、ステップS1504へ進む。
ステップS1504において、改善配置適用部209は、サーバの関係を判断し(ステップS1504)、改善記録テーブル217(図14参照)のサーバ群の関係1406の列に値がない場合(ステップS1504,関係無し)、ステップS1505に進み、値が有る場合(ステップS1505,関係有り)、ステップS1506に進む。
ステップS1506において、改善配置適用部209は、サーバ群の変更の処理を行う。具体的には、サーバ群1405(図14参照)の列に示すサーバ群は、サーバ群の関係1406の列に記載されている情報を元に、図10に示すサーバの関係テーブル214から、論理和で決定される。このため、サーバ群の関係1406の列から項目が減ることにより、サーバ群1405の列の内容にあるサーバの数も減る。また、図10のサーバの関係テーブル214から包含関係が見出せる場合は、サーバ数が減少する方のサーバの関係にサーバ群の関係1406の列の内容を変更することで、サーバ群1405の列の内容にあるサーバ数を減らし、移行可能なサイズへの変更を試みる。
ステップS1503において、改善配置適用部209は、改善リソース情報テーブル212(図8参照)に従い、移行を進める。移行後はリソース情報テーブル211(図7参照)に割り当てられているリソースの割当状態706を更新する。
ステップS1505において、抽出確率Epの変更または移行不可情報を更新する。改善リソース情報テーブル212(図8参照)に残っているサーバの構成で割り当てられており、ステップS1501において面積分の差から移行不可であれば、改善記録テーブル217(図14参照)の成否1407の列を所要時間・回数情報とともに「移行不可」に更新する。また、該当するリソースに対し、リソース情報テーブル211(図7参照)の抽出確率Epを下げる。または、増設したほうがよい増設推奨リソースとしてユーザに通知するとよい。
図20は、比較情報取得部の処理を示すフローチャートである。比較情報取得部310は、管理サーバ100から送付されたジョブを取得すると(ステップS1601)、取得したジョブを実行し(ステップS1602)、ジョブ管理テーブル215(図11参照)の判断方法1104に必要なジョブ結果を、管理サーバ100の試行改善部208へ送信し(ステップS1603)、処理を終了する。
図21は、サーバの関係情報取得部の処理を示すフローチャートである。サーバの関係情報取得部311は、管理サーバ200の情報収集部210によりプッシュインストールされた際に設定されたポリシーを判断し(ステップS1701)、定期の場合(ステップS1701,定期)、ステップS1702に進み、監視の場合(ステップS1701,監視)、ステップS1704に進む。
ステップS1702において、サーバの関係情報取得部311は、サーバの関係テーブル214(図10参照)にある項目の内容を、OSや管理ソフトウェアの持つそのサーバのデバイス情報から情報を取得する。そして、サーバの関係情報取得部311は、管理サーバ200の情報収集部210へ、取得した情報を送信し(ステップS1703)、ステップS1701に戻る。次に、ステップS1701を実行する際は、予め設定されている時間経過後に実行する。
ステップS1704において、サーバの関係情報取得部311は、サーバの関係テーブル214(図10参照)の情報に含まれる項目について変更が無いか監視し、変更の有無を判断する(ステップS1705)。変更があった場合(ステップS1705,有)、ステップS1702に進み、変更がない場合(ステップS1705,無)、ステップS1701に戻る。
図22は、リソース情報取得部の処理を示すフローチャートである。リソース情報取得部312は、管理サーバ200の情報収集部210によりプッシュインストールされた際に設定されたポリシーを判断し(ステップS1801)、定期の場合(ステップS1801,定期)、ステップS1802に進み、監視の場合(ステップS1801,監視)、ステップS1804に進む。
ステップS1802において、リソース情報取得部312は、リソース情報テーブル211(図7参照)にある項目の内容をOSや管理ソフトウェアの持つそのサーバのデバイス情報から情報を取得する。そして、リソース情報取得部312は、管理サーバ200の情報収集部210へ取得した情報を送信し(ステップS1803)、ステップS1801に戻る。次に、ステップS1801を実行する際は、予め設定されている時間経過後に実行する。
ステップS1804において、リソース情報取得部312は、リソース情報(例えば、リソースの追加や削減)を監視し、変更の有無を判断する(ステップS1805)。変更があった場合(ステップS1805,有)、ステップS1802に進み、変更がない場合(ステップS1805,無)、ステップS1801に戻る。
図23は、仮想割り当て情報取得部の処理を示すフローチャートである。仮想割り当て情報取得部313は、管理サーバ200の情報収集部210によりプッシュインストールされた際に設定されたポリシーを判断し(ステップS1901)、定期の場合(ステップS1901,定期)、ステップS1902に進み、監視の場合(ステップS1901,監視)、ステップS1904に進む。
ステップS1902において、仮想割り当て情報取得部313は、リソース情報テーブル211(図7参照)とサーバの関係テーブル214(図10参照)にある項目の内容を仮想化機構部のリソース割り当て情報から情報を取得する。そして、仮想割り当て情報取得部313は、管理サーバ200の情報収集部210へ、取得した情報を送信し(ステップS1903)、ステップS1901に戻る。次に、ステップS1901を実行する際は、予め設定されている時間経過後に実行する。
ステップS1904において、仮想割り当て情報取得部313は、仮想化機構の各仮想マシンへの仮想割り当て情報を監視し、変更の有無を判断する(ステップS1905)。変更があった場合(ステップS1905,有)、ステップS1902に進み、変更がない場合(ステップS1905,無)、ステップS1901に戻る。
図24は、サーバ群生成部の処理を示すフローチャートである。サーバ群生成部220(図2参照)は、ステップS1302(図17参照)で確保した各試行用のリソースに対し、リソース情報テーブル211(図7参照)の抽出確率Ep(710)に基づいて、リソース情報テーブル211にある全て、または、一定範囲のリソース1つずつに対して、乱数生成部221(図2参照)で乱数を生成させ、今回のサーバ群生成部220内でサーバに割り当てるリソースとして使用するか、使用しないかを決定し抽出する(ステップS2001)。なお、リソースの抽出方法として、ステップS2001が本実施形態の特徴のひとつである。
サーバ群生成部220は、今回の改善IDに対応した改善記録テーブル217(図14参照)のサーバ群に格納されている現用のサーバの割り当てリソース情報(リソース情報テーブル211(図7参照)の割当状態706の列から把握する。)から作成するサーバ群のサーバ毎に割り当てるリソース個数を決定する(ステップS2002)。なお、割り当てる個数については現在の割り当てリソースの数を既定値とし、確率的にゆらぎを入れることでそこから増減を行うことも可能である。
サーバ群生成部220は、改善記録テーブル217(図14参照)のサーバ群のサーバ数だけ、ステップS2001で抽出したリソースからサーバ群を生成する(ステップS2003)。具体的には、サーバ群生成部220は、改善記録テーブル217(図14参照)の今回の改善IDに対応した改善指定1402の列、サーバ群の関係1406の列を参照し、改善指定のリソース、共用リソースとして、改善の際に要求されているリソースの指定を満たして、ステップS2001で抽出したリソースを割り当てる。そのほかに、各サーバの割り当てるリソース数は、ステップS2002によって決まった個数を参考にすることも可能である。また、ステップS2001で抽出したリソース数が要求されているリソース数に届かなかった場合は、処理を終了し、試行改善部208の処理をやり直すとよい。
本実施形態によれば、管理サーバ200は、計算機システムをなす複数のサーバが接続されるネットワークから確保できるリソースを組み合わせて形成する試行用サーバを計算機システムのサーバとして適用した際の適用情報の実績である抽出確率Epが登録されるリソース情報(例えば、リソース情報テーブル211)の記憶部と、試行用サーバを採用するか否かの所定条件であるジョブの判断方法をジョブごとに管理するジョブ管理情報(例えば、ジョブ管理テーブル215)が記憶されるジョブ管理情報の記憶部と、リソース情報の各リソースに対し、抽出確率が乱数生成部221で発生させた乱数確率Rp以上であれば、試行用のリソースとして選定し、選定された試行用のリソースを組み合わせて試行用サーバを形成する形成処理部と、形成された試行用サーバを用いてジョブを実行し、ジョブの実行結果がジョブの判断方法を満たせば、試行用サーバを該ネットワークのサーバとして適用する適用処理部と、を有する。なお、形成処理部および適用処理部は、プロセッサ202を機能別の処理部として表現したものである。
本実施形態によれば、管理サーバ200は、リソース情報テーブル211の各リソースに対し、リソースごとの抽出確率Epが乱数生成部221で発生させた乱数確率Rp以上であれば、試行用のリソースとして選定し、選定されたリソースを組み合わせて試行用サーバ(例えば、試行用物理サーバ100b、試行用仮想サーバ130b)を形成し、形成された試行用サーバを用いてジョブを実行し、ジョブの実行結果がジョブの判断方法を満たせば、試行用サーバを該ネットワーク上のサーバとして適用することができる。これにより、ネットワーク上のリソースを有効に活用することができる。
100 物理サーバ
130 仮想サーバ
131 仮想化機構部
140 ネットワークスイッチ
150 バス接続制御装置
160 I/Oスイッチ拡張装置
170 I/Oデバイス
180 ストレージ装置
190 ディスクボリューム
191 仮想ディスク
200 管理サーバ
201 メモリ(記憶部)
202 プロセッサ(処理部)
203 ユーザI/F
204 ネットワークI/F
205 ディスクI/F
206 リソース配置改善部
207 リソース確保・試行改善部
208 試行改善部
209 改善配置適用部
210 情報収集部
211 リソース情報テーブル
212 改善リソース情報テーブル
213 履歴テーブル
214 サーバの関係テーブル
215 ジョブ管理テーブル
216 ジョブ結果管理テーブル
217 改善記録テーブル
218 改善指定とジョブ関係テーブル
220 サーバ群生成部
310 比較情報取得部
311 サーバの関係情報取得部
312 リソース情報取得部
313 仮想割り当て情報取得部
Ep 抽出確率
Rp 乱数確率

Claims (20)

  1. ネットワークに複数のサーバが接続された計算機システムにおいて、管理サーバが、該ネットワークで確保できたリソースを組み合わせて試行用サーバを形成し、該試行用サーバが所定条件を満たす場合にサーバとして適用するリソース管理方法であって、
    前記管理サーバは、前記ネットワークで確保できたリソースに対し、前記試行用サーバが適用された際の適用情報の実績である抽出確率が登録されたリソース情報と、前記試行用サーバを採用するか否かの前記所定条件であるジョブの判断方法をジョブごとに管理するジョブ管理情報とを記憶部に記憶しており、
    前記管理サーバは、前記リソース情報の各リソースに対し、前記抽出確率が乱数生成部で発生させた乱数確率以上であれば、試行用のリソースとして選定し、
    前記選定された試行用のリソースを組み合わせて前記試行用サーバを形成し、
    前記形成された試行用サーバを用いて前記ジョブを実行し、
    前記ジョブの実行結果が前記ジョブの判断方法を満たせば、前記試行用サーバを該ネットワークのサーバとして適用する
    ことを特徴とするリソース管理方法。
  2. 前記管理サーバは、前記実行結果が前記ジョブの判断方法を満たさなければ、前記リソースの選定、前記試行用サーバの形成、前記ジョブの実行を繰り返し、前記繰り返したときのジョブの実行結果を改善記録情報として前記記憶部に記録する
    ことを特徴とする請求の範囲第1項に記載のリソース管理方法。
  3. 前記管理サーバは、前記試行用サーバを適用するか否かを判定する際に、現用のサーバで前記ジョブを実行し、前記現用のサーバのジョブの実行結果と前記試行用サーバのジョブの実行結果とを比較し、前記試行用サーバの性能が前記現用のサーバの性能と比較して改善している場合、前記試行用サーバを該ネットワークのサーバとして適用する
    ことを特徴とする請求の範囲第1項に記載のリソース管理方法。
  4. 前記管理サーバは、現用のサーバが指定され、かつ、保守要求がされた場合、前記現用のサーバと関係のあるサーバを特定し、前記特定されたサーバの数に対応する複数の試行用サーバを、前記選定されたリソースを組み合わせて形成し、前記複数の試行用サーバを用いて前記ジョブを実行し、前記ジョブの実行結果が前記ジョブの判断方法を満たせば、前記複数の試行用サーバを該ネットワークのサーバとして適用する
    ことを特徴とする請求の範囲第1項に記載のリソース管理方法。
  5. 前記管理サーバは、ユーザが演算による方法を選択した場合、請求の範囲第1項に記載のリソース管理方法に代わり、該演算による方法でリソース配置の改善をする
    ことを特徴とする請求の範囲第1項に記載のリソース管理方法。
  6. 前記管理サーバは、前記ジョブの実行を繰り返すごとに、前記抽出確率を変更する
    ことを特徴とする請求の範囲第2項に記載のリソース管理方法。
  7. 前記管理サーバは、リソースとして選定される確率をあげる際、前記抽出確率をあげる
    ことを特徴とする請求の範囲第2項に記載のリソース管理方法。
  8. 前記リソース情報には、リソースの使用率が含まれ、
    前記リソースの使用率がユーザ指定の値以上である場合、リソースの増設を推奨する旨を前記改善記録情報に記録する
    ことを特徴とする請求の範囲第2項に記載のリソース管理方法。
  9. 前記リソース情報には、リソースの使用率が含まれ、
    前記リソースの使用率がユーザ指定の値以下である場合、リソースの削除を推奨する旨を前記改善記録情報に記録する
    ことを特徴とする請求の範囲第2項に記載のリソース管理方法。
  10. 前記管理サーバは、前記ジョブの判断方法を満たさない回数が所定回数を超えた場合、または、前記ジョブの判断方法を満たさない試行時間が所定時間を超えた場合、リソース配置の改善ができない旨を管理者に通知する
    ことを特徴とする請求の範囲第2項に記載のリソース管理方法。
  11. 計算機システムをなす複数のサーバが接続されるネットワークから確保できるリソースを組み合わせて形成する試行用サーバを前記計算機システムのサーバとして適用した際の適用情報の実績である抽出確率が登録されるリソース情報の記憶部と、
    前記試行用サーバを採用するか否かの前記所定条件であるジョブの判断方法をジョブごとに管理するジョブ管理情報が記憶されるジョブ管理情報の記憶部と、
    前記リソース情報の各リソースに対し、前記抽出確率が乱数生成部で発生させた乱数確率以上であれば、試行用のリソースとして選定し、前記選定された試行用のリソースを組み合わせて前記試行用サーバを形成する形成処理部と、
    前記形成された試行用サーバを用いて前記ジョブを実行し、前記ジョブの実行結果が前記ジョブの判断方法を満たせば、前記試行用サーバを該ネットワークのサーバとして適用する適用処理部と、を有する
    ことを特徴とする管理サーバ。
  12. 前記管理サーバは、前記実行結果が前記ジョブの判断方法を満たさなければ、前記リソースの選定、前記試行用サーバの形成、前記ジョブの実行を繰り返し、前記ジョブの実行結果を改善記録情報として前記記憶部に記録する
    ことを特徴とする請求の範囲第11項に記載の管理サーバ。
  13. 前記管理サーバは、前記試行用サーバを適用するか否かを判定する際に、現用のサーバで前記ジョブを実行し、前記試行用サーバの実行結果が前記現用のサーバのジョブの実行結果より改善している場合、前記試行用サーバを該ネットワークのサーバとして適用する
    ことを特徴とする請求の範囲第11項に記載の管理サーバ。
  14. 前記管理サーバは、現用のサーバが指定され、かつ、保守要求がされた場合、前記現用のサーバと関係のあるサーバを特定し、前記特定されたサーバの数に対応する複数の試行用サーバを、前記選定されたリソースを組み合わせて形成し、前記複数の試行用サーバを用いて前記ジョブを実行し、前記ジョブの実行結果が前記ジョブの判断方法を満たせば、前記複数の試行用サーバを該ネットワークのサーバとして適用する
    ことを特徴とする請求の範囲第11項に記載の管理サーバ。
  15. 前記管理サーバは、ユーザが演算による方法を選択した場合、請求の範囲第11項に記載のリソース管理方法に代わり、該演算による方法でリソース配置の改善をする
    ことを特徴とする請求の範囲第11項に記載の管理サーバ。
  16. 前記管理サーバは、前記ジョブの実行を繰り返すごとに、前記抽出確率を変更する
    ことを特徴とする請求の範囲第12項に記載の管理サーバ。
  17. 前記管理サーバは、リソースとして選定される確率をあげる際、前記抽出確率をあげる
    ことを特徴とする請求の範囲第12項に記載の管理サーバ。
  18. 前記リソース情報には、リソースの使用率が含まれ、
    前記リソースの使用率がユーザ指定の値以上である場合、リソースの増設を推奨する旨を前記改善記録情報に記録する
    ことを特徴とする請求の範囲第12項に記載の管理サーバ。
  19. 前記リソース情報には、リソースの使用率が含まれ、
    前記リソースの使用率がユーザ指定の値以下である場合、リソースの削除を推奨する旨を前記改善記録情報に記録する
    ことを特徴とする請求の範囲第12項に記載の管理サーバ。
  20. 前記管理サーバは、前記ジョブの判断方法を満たさない回数が所定回数を超えた場合、または、前記ジョブの判断方法を満たさない試行時間が所定時間を超えた場合、リソース配置の改善ができない旨を管理者に通知する
    ことを特徴とする請求の範囲第12項に記載の管理サーバ。
JP2013508636A 2011-04-01 2011-04-01 リソース管理方法および管理サーバ Active JP5525654B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2011/058390 WO2012137272A1 (ja) 2011-04-01 2011-04-01 リソース管理方法および管理サーバ

Publications (2)

Publication Number Publication Date
JP5525654B2 true JP5525654B2 (ja) 2014-06-18
JPWO2012137272A1 JPWO2012137272A1 (ja) 2014-07-28

Family

ID=46968713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013508636A Active JP5525654B2 (ja) 2011-04-01 2011-04-01 リソース管理方法および管理サーバ

Country Status (3)

Country Link
US (1) US9385964B2 (ja)
JP (1) JP5525654B2 (ja)
WO (1) WO2012137272A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9215142B1 (en) * 2011-04-20 2015-12-15 Dell Software Inc. Community analysis of computing performance
US9298512B2 (en) * 2012-08-25 2016-03-29 Vmware, Inc. Client placement in a computer network system using dynamic weight assignments on resource utilization metrics
US9323579B2 (en) 2012-08-25 2016-04-26 Vmware, Inc. Resource allocation diagnosis on distributed computer systems
JP6350207B2 (ja) * 2014-10-23 2018-07-04 日本電気株式会社 コンピュータシステム、情報処理装置、リソース割り当て方法及び情報処理装置のプログラム
JP6550945B2 (ja) 2015-06-10 2019-07-31 富士通株式会社 判定制御プログラム、判定制御方法及び仮想マシン管理装置
US10216599B2 (en) 2016-05-26 2019-02-26 International Business Machines Corporation Comprehensive testing of computer hardware configurations
US10223235B2 (en) * 2016-05-26 2019-03-05 International Business Machines Corporation Comprehensive testing of computer hardware configurations
US11487646B2 (en) * 2019-03-01 2022-11-01 Red Hat, Inc. Dynamic test case timers
US11741276B1 (en) * 2022-12-16 2023-08-29 Dk Crown Holdings Inc. Systems and methods for modeling live events

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007526557A (ja) * 2004-01-30 2007-09-13 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピューティング・ユーティリティのためのコンピューティング環境のコンポーネント化された自動プロビジョニングおよび管理
JP2008527513A (ja) * 2005-01-06 2008-07-24 インターナショナル・ビジネス・マシーンズ・コーポレーション グリッド環境にサブミットされたグリッド・ジョブによる使用の前のリソース機能の検査
JP2010205209A (ja) * 2009-03-06 2010-09-16 Hitachi Ltd 管理計算機、計算機システム、物理リソース割り当て方法
JP2011018198A (ja) * 2009-07-09 2011-01-27 Hitachi Ltd 管理装置及び管理方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7487258B2 (en) 2004-01-30 2009-02-03 International Business Machines Corporation Arbitration in a computing utility system
US9104494B2 (en) 2007-04-13 2015-08-11 Nec Corporation Virtual computer system and its optimization method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007526557A (ja) * 2004-01-30 2007-09-13 インターナショナル・ビジネス・マシーンズ・コーポレーション コンピューティング・ユーティリティのためのコンピューティング環境のコンポーネント化された自動プロビジョニングおよび管理
JP2008527513A (ja) * 2005-01-06 2008-07-24 インターナショナル・ビジネス・マシーンズ・コーポレーション グリッド環境にサブミットされたグリッド・ジョブによる使用の前のリソース機能の検査
JP2010205209A (ja) * 2009-03-06 2010-09-16 Hitachi Ltd 管理計算機、計算機システム、物理リソース割り当て方法
JP2011018198A (ja) * 2009-07-09 2011-01-27 Hitachi Ltd 管理装置及び管理方法

Also Published As

Publication number Publication date
JPWO2012137272A1 (ja) 2014-07-28
US9385964B2 (en) 2016-07-05
US20140019624A1 (en) 2014-01-16
WO2012137272A1 (ja) 2012-10-11

Similar Documents

Publication Publication Date Title
JP5525654B2 (ja) リソース管理方法および管理サーバ
US11153383B2 (en) Distributed data analysis for streaming data sources
US9716746B2 (en) System and method using software defined continuity (SDC) and application defined continuity (ADC) for achieving business continuity and application continuity on massively scalable entities like entire datacenters, entire clouds etc. in a computing system environment
CN101370030B (zh) 基于内容复制的资源负载平衡方法
CN100407153C (zh) 需要时节点和服务器实例分配和解除分配
JP4597488B2 (ja) プログラム配置方法及びその実施システム並びにその処理プログラム
US7437460B2 (en) Service placement for enforcing performance and availability levels in a multi-node system
WO2012056596A1 (ja) 計算機システム及び処理制御方法
JP5651772B2 (ja) ジョブ管理サーバ及びジョブ管理方法
US20080133851A1 (en) Storage System Managing Method and Computer System
US20090138594A1 (en) Coordinating the monitoring, management, and prediction of unintended changes within a grid environment
CN105700908B (zh) 管理系统与管理系统的控制方法
JP2016511490A5 (ja)
CN104717094A (zh) 管理服务器和管理服务器的控制方法
JP2016511490A (ja) 仮想データセンタリソース利用ポリシーの自動調整
EP2972746A1 (en) Storage unit selection for virtualized storage units
US11513859B2 (en) Flexible computing
JPWO2016166844A1 (ja) 分散処理システム、タスク処理方法、記憶媒体
WO2022222579A1 (zh) 一种基于数据库中间件集群的高可用客户端负载均衡方法
KR101211207B1 (ko) 캐시 클라우드 구조를 이용한 캐시 시스템 및 캐싱 서비스 제공 방법
WO2014080492A1 (ja) 計算機システム、クラスタ管理方法、及び管理計算機
CN109992373A (zh) 资源调度方法、信息管理方法和装置及任务部署系统
JP4441362B2 (ja) ポート割当装置及びポート割当方法
US20060092851A1 (en) Method and apparatus for communicating predicted future network requirements of a data center to a number of adaptive network interfaces
CN110247801A (zh) 一种对集群宿主机的监控系统及方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140411

R150 Certificate of patent or registration of utility model

Ref document number: 5525654

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150