JP4897710B2 - データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法 - Google Patents

データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法 Download PDF

Info

Publication number
JP4897710B2
JP4897710B2 JP2008000963A JP2008000963A JP4897710B2 JP 4897710 B2 JP4897710 B2 JP 4897710B2 JP 2008000963 A JP2008000963 A JP 2008000963A JP 2008000963 A JP2008000963 A JP 2008000963A JP 4897710 B2 JP4897710 B2 JP 4897710B2
Authority
JP
Japan
Prior art keywords
servers
server
data center
order
comparison
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008000963A
Other languages
English (en)
Other versions
JP2008171427A (ja
Inventor
ロンダ・エル・チャイルドレス
クリストファ・エル・モロイ
デイビッド・ブルース・クムヒャ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2008171427A publication Critical patent/JP2008171427A/ja
Application granted granted Critical
Publication of JP4897710B2 publication Critical patent/JP4897710B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4405Initialisation of multiprocessor systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Description

本発明はデータセンタで複数のサーバーを再起動(リブート)するための最適の順序を決定するための方法に関する。
従来は、データセンタでの電力供給停止(停電)の後、電力の回復を管理するのに、必要とされる人的資源が高価で、システムをパワーアップするために予め決められたプランを使用することに起因する柔軟性の無い手順を含んでいた。更に、データセンタのための現存する電力対策は、データセンタのマシンの前に挿入されるパワー・ストリップすなわち電力資源を制御することを狙っている。そのようなパワー・ストリップがプログラム可能なアクセスを有する場合でさえ、それらは電源オフ状況では不作動であり、これによってデータセンタに電力を回復するためのマスタプランでもって使用するのが困難かまたは不可能である。このように従来技術における欠陥や制限の少なくとも一方を克服する必要がある。
本発明はデータセンタにおいて複数のサーバーを再起動するための適切な順序を決定するためのコンピュータで実施される方法を提供する。
本方法は、例えば(1)データセンタにおける異常なシャットダウン・イベントに続く電力の回復を自動的に検知するステップと、(2)データセンタに含まれるサーバーの再起動のための順序を、電力回復の検知に応答して、自動的にそして動的に決定するステップと、(3)ステップ(2)で決定された順序でサーバーを再起動するステップとを含む。ステップ(1)はコンピューティング・システムの電力回復管理サーバー( power restoration managementserver)によって実行される。ステップ(1)で検知された電力の回復はサーバーの再起動のために利用可能とすることができる。ステップ(2)における順序を決定することは1個もしくはそれ以上のポリシーを適用することを含む。ステップ(3)に於ける再起動はデータセンタに関連するエンティティの財政上の地位(financial position)を増進する。そのエンティティの財政上の地位の増進はエンティティの財政上の利益を増加させもしくは財政上の損失を減少させることを含む。
コンピューティング・システム、コンピュータ・プログラム製品および上記に要約した方法に対応するコンピューティング基盤(インフラ)をサポートするためのプロセスもまた記述されており、この特許請求の範囲に示す。
好適には、本発明は複数のサーバーを再起動する最適の順序を動的に決定するための技法を提供する。更にここに記述された再起動手順は、オペレーション・スタッフに対するサーバーの数の比が増すにつれ、データセンタの動作にとっては一層有利になる。更に本発明の再起動技法の利点は、遠隔地に逃避したデータセンタおよび遠隔管理されるデータセンタに拡張することができる。
本発明は電力の回復の順序およびタイミング、ならびにデータセンタなどにおける複数のサーバーの再起動を制御する電力回復管理ツールを提供する。この再起動の順序は動的にそして自動的に決定され、手動介入を必要としない。そのように動的に規定し順序づけた再起動手順を持たせると、電力およびワット数の適切なレベルを引き出すようなデータセンタの起動(ブートアップ)を提供することができる。
システムの概観
図1は、本発明の実施例に従い、ディジタル・コマンド信号を処理することのできる電力パネルを含むデータセンタにおいてサーバーを再起動するための最適の順序を決定するためのシステムのブロック図である。システム100はデータセンタ102、データセンタ102に結合された電力パネル104、電力パネル104に結合された電力回復管理(PRM)サーバー106を含む。一実施例では、PRMサーバー106が電力管理プログラム107を含む。他の実施例では、電力回復管理プログラム107が、PRMサーバー106とは別のコンピューティング・ユニット(図示せず)で実行される。PRMサーバー106に結合され、システム100に含まれるのは管理制御卓108,データ・ストア110および他のデータ・ストアに含まれる1個または複数個のポリシー112である。データセンタ102は1個もしくはそれ以上のグループのサーバー(例えばブレード、ラック、メインフレームなど)を含む。電力パネル104はブランチ・フィード(分岐回路への信号線、branch feed)を介してデータセンタ102の各グループに電力を提供する。電力パネル104を介してデータセンタ102中のサーバーへ電力を配分するのを制御するために電力回復管理プログラム107の論理が実行させる。電力回復管理プログラム107による電力配分の制御はデータセンタ102での電力供給停止(power outage)に続いてデータセンタ102におけるサーバーごとの電力回復のタイミングおよび再起動の順序を含む。図1による実施例では、電力パネル104が電力回復管理プログラム107から送信されたディジタル・コマンド信号を処理する論理を含む。
管理制御卓108がPRMサーバー106へのインターフェースを提供し、人間のオペレータが、遠隔でもしくはデータセンタ102でPRMサーバー106の機能をモニターすることができ、そしてポリシー112を変えることができる。1個もしくはそれ以上のポリシー112(またの名を起動順序決定(boot order determination)ポリシー)は、データセンタ102に含まれるサーバーの優先度を特定するために電力回復管理プログラム107によって適用される規則(例えば、XMLフォーマットで)を含む。その1個もしくはそれ以上のポリシーは異常なシャットダウン・イベント後の電力回復によって提供される負荷もしくはデータセンタ102に含まれるそれらのサーバーに関連するファクタに基く。ここで使用されるように、データセンタの異常なシャットダウン・イベントは、データセンタが企図していない電力供給停止を受けているものとして定義される。特定したサーバーの優先度(specified prioritization of servers)は、データセンタ102での異常シャットダウン・イベントの後、データセンタ102に含まれるサーバーを再起動するための最適の順序を決定する。電力回復管理プログラム107によるポリシー112の適用はデータ・ストア110からのデータを用いることを含む。
データ・ストア(データ格納部)110はデータセンタ102の複数のサーバーのオペレーションの最後の状態を含む。但し、データセンタ102の一つのサーバーの最後の状態はデータセンタ102での異常シャットダウン・イベントが生じた時点で存在するサーバーの状態である。一例として、データ・ストア110はデータセンタ102に関連する組織的なエンティティ(organizational entity)相互間(例えば、サービスを提供する会社とそのサービスを利用する顧客との間)のサービス・レベル契約(SLA)のXMLインプリメンテーションを含む。
図2は本発明の実施例による、ディジタル・コマンド信号を処理することのできない電力パネルを含む、データセンタにおけるサーバーを再起動するための最適の順序を決定するためのシステムのブロック図である。システム120はシステム100のコンポーネント(図1参照)(例えば、データセンタ102、電力パネル104、電力回復管理プログラム107を含むPRMサーバー106、管理制御卓108、データ・ストア110および1個もしくはそれ以上のポリシー112)を含む。他の実施例では、電力回復管理プログラム107がPRMサーバー106とは別のコンピューティング・ユニット(図示せず)を実行させる。システム120中のコンポーネントの構成および関係は、PRMサーバー106が電力パネル104に直接結合されている代わりにPRMサーバー106が電力回復管理スイッチ122に結合され、そしてそのスイッチが電力パネル104に直接結合されている点を除けば、システム100(100参照)と等価である。電力回復管理スイッチ122はPRMサーバー106に電力パネル104へのインターフェースを提供する。何故ならば図2に示す実施例では電力パネル104がPRMサーバー106からのディジタル・コマンド信号を受容れる論理を欠いているからである。
再始動前のデータセンタの作動
図3は、本発明の実施例に従い、図1および図2のシステムを用いて再始動する前のデータセンタを作動するプロセスのフローチャートである。再始動前のデータセンタ102(図1および図2参照)を作動するプロセスはステップ200で開始する。ステップ202では、データセンタ102(図1および図2参照)が正常に作動する。ステップ202は、PRMサーバー106(図1および図2参照)が、サーバーを再起動する順序に関連する優先度の動的なシフト(すなわち変化)を収集し、モニターし、そして捕捉し、またデータセンタ102(図1および図2参照)に含まれるサーバーに関係するSLA約定(コミットメント)もしくは請求書作成の機会すなわちビリングの機会(ビリングの割合)、あるいは図4に関して後述するような他のファクタを含む。例えば、管理制御卓108(図1参照)を用いてオペレータがXML文書を入れる。そのXML文書は、会社と顧客との間のSLA中で特定されたサーバー稼働時間を維持し損なうのに応答して顧客に対し会社が負わされる財政上の罰則(経済的あるいは金銭的な罰則を含む)を動的に変化させる。この例では、PRMサーバー106(図1参照)が財政上の罰則の変化をモニターし、捕捉する。
ステップ204では、PRMサーバー106(図1および図2参照)がステップ202で収集した変化をデータ・ストア110に書き込む。ステップ202に対し前述の例では、PRMサーバー106(図1参照)がSLAにおける財政上の罰則に対する変化をデータ・ストア110に書き込む。ステップ208では、データセンタ102(図1および図2参照)が異常シャットダウン・イベントを受け、データセンタ102(図1および図2参照)に含まれるサーバーをシャットダウンする。図3のこのプロセスはステップ210で終了する。
データセンタの再始動
図4は、本発明の実施例に従い、図1および図2のシステムを用い、制御された再起動順序(起動順序ともいう)で以ってデータセンタを再始動するプロセスのフローチャートである。PRMサーバー106により制御された再起動順序で以ってデータセンタ102(図1および図2参照)を再始動するプロセスはステップ300で開始するが、それは図3のステップ208での異常シャットダウン・イベントの後に続く。ステップ302の前に、電力が回復され、電力パネル104(図1および図2参照)に利用可能となり、PRMサーバー106(図1および図2参照)が電力の回復を検知し、これによってデータセンタ102(図1および図2参照)中に含まれるサーバーを再起動するのに利用できるようになる。ステップ302では、PRMサーバー106(図1および図2参照)がデータ・ストア110からデータセンタ102(図1および図2参照)に含まれるサーバーの最後の状態を読み出す。但し、その最後の状態は図3のステップ208の異常シャットダウン・イベントのときのそれらのサーバーの作動状態(即ち、異常シャットダウン・イベントの直前のサーバーの状態)である。その最後の状態は、サーバーを最適の順序で再起動するためにデータセンタ102(図1および図2参照)に含まれるサーバーの優先度に関係するデータ、またはデータセンタ102(図1および図2参照)に含まれるサーバーに関係するビリング(請求書作成発送)の機会(ビリング割合)もしくはSLA約定(コミットメント)を含む。
ステップ304では、電力回復管理プログラム107(図1および図2参照)が自動的にかつ動的に起動順序決定ポリシー112を適用し、データセンタ102(図1および図2参照)に含まれるサーバーを再起動するための順序を自動的にかつ動的に決定する。ステップ304で行われるポリシー112(図1および図2参照)の適用は、ステップ302で読み出されるサーバー動作の最後の状態、データセンタ102(図1および図2参照)に含まれるサーバーの再始動の日および時刻、データセンタ102(図1および図2参照)に含まれ且つビリング(請求書作成発送)の機会もしくはSLA約定(コミットメント)によって決定されるサーバーの優先度、電力の回復によって発生される筈の負荷を処理するためにデータセンタ102(図1および図2参照)中のサーバーに電力パネル104(図1および図2参照)を結合する分岐回路の能力、および以下に列挙する他のファクタなど種々の重み付けファクタに基く。
ステップ304で決定される再起動順序はこの順序でサーバーを再起動する最適の順序であり、データセンタに関連する組織的なエンティティ(例えば、データセンタのサーバーを管理し、そしてそのデータセンタのサーバーを利用する顧客とSLAに入る会社)の財政上の地位を高める。その決定された再起動順序は、組織的なエンティティの受ける財政上の利益を増加させ、あるいは組織的なエンティティの受ける損失を減少させることによってその組織的なエンティティの財政上の地位を増進する。
負荷を処理する分岐回路の能力に対する前述のファクタは、入来する可用性(即ち、二次的な電力供給停止を引起す)を超えずに誘起され得る最大数の適切な初期の波および/もしくはそのブランチのためにブレーカーの制限を踏み外さずに再始動することができる各分岐回路上のサーバーの数を考慮に入れる。
ステップ304に関連して上述したように、1個もしくはそれ以上のポリシー112(図1および図2参照)を適用する基礎を構成する重み付けファクタは、再起動順序が異常シャットダウン・イベントのときのサーバーの動作の状態を表す変数に基いて動的に決定されるのを許容し、あるいはサーバー動作の所望の状態がサーバーを再始動するのに応答して獲得されるのを許容する。そのようなファクタの例を書きに列挙する。
1.使用時間の約定:SLAに基く第1のサーバーの使用時間の約定、計算されたSLA違反、もしくは契約の同意が、第2のサーバーの使用時間のための他の同様の約定よりも大きいならば、ステップ304で決定された再起動順序において第2のサーバーの再起動よりも早くに第1のサーバーの再起動を置く。
2.ビリングの機会:2個のサーバーが過度の休止時間(ダウンタイム)のために同じ財政上の罰則に関係するが、第1のサーバーを用いている第1の顧客が特定の期間で第1のサーバーを再起動させるような財政上の罰則を与え、そしてそのような金銭的インセンティブ(報奨)が第2のサーバーを再起動することと関連するならステップ304で決定される再起動順序は第1のサーバーの再起動を第2のサーバーの再起動よりも早くに置く。
3.ワークロード:異常シャットダウン・イベントのときの第1のサーバーのワークロードが、異常シャットダウン・イベントのときの第2のサーバーのワークロードよりも大きいならば、ステップ304で決定される再起動順序は第1のサーバーの再起動を第2のサーバーの再起動よりも早くに置かれる。
4.システムの必要とされる順序:或るシステムはある順序で利用可能となる必要がある。一例として、ウエッブ商用サーバーを再起動する前にウエッブ商用サーバーのデータベース・サーバーを再起動してウエッブ商用サーバーが利用できるようにする必要がある。このように、この例では、ステップ304の再起動順序において、データベース・サーバーの再起動がウエッブ商用サーバーの再起動より早くに置かれる。他の例では、もし複数のアプリケーション・サーバーが一つのデータベース・サーバーに依存するならば、ステップ304の再起動順序において、データベース・サーバーがアプリケーション・サーバーより高い優先度を与えられる。
5.発生する収益:より多くの収益を発生するシステムはステップ304の再起動順序において早めに置かれる。例えば、医薬品の情報サイトよりも高い収益発生する航空予約システムは両方のシステムのサービスをする単一のデータセンタ中で高めの優先度を有することになろう。
6.重要性(criticality):もし第1のサーバーの機能が予め定義した基準に基く第2のサーバーの機能よりも重要性の高いレベルを有するなら、ステップ304で決定される再起動順序は第1のサーバーの再起動を、第2のサーバーの再起動よりも早くに置く。例えば、ある政府機関のサーバーおよびe911サーバーは、ステップ304の再起動順序においてこれらのサーバーが早くに置かれるに足りるだけの重要性を持つサービスを提供する。一実施例では、「高い評判(グッドウイル)」ファクタが上顧客のシステムに最高の重要性を割当てる。「高い評判」ファクタが適用される場合には、ステップ304で決定される再起動順序はその上顧客のシステムに再起動順序において最高の優先度を割当て、これによって他のファクタにより課された順序に優先する。
7.サーバー動作の状態:もし第1のサーバーが異常シャットダウン・イベントのときに動作可能でアクティブ(賦活)状態にあり、かつ第2のサーバーが異常シャットダウンのときに動作不能もしくは非アクティブ(非賦活)状態になるなら、ステップ304において決定される再起動順序は第1のサーバーの再起動を第2のサーバーの再起動よりも早くに置く。
一実施例では、ステップ304に関連する前述の種々のファクタに含まれるファクタに1対1対応の重み付けが割当てられ、その重み付けがステップ304においてポリシーを適用するための順序を決定する。重み付けは顧客がプログラム可能であるか、システム100(図1参照)もしくはシステム120(図2参照)によって予め割当てられる。
ステップ306では、PRMサーバー106(図1および図2参照)が、ステップ304で決定される最適の順序に従って特定のサーバーを初期化するように始動コマンドを送る。初期化されるその特定のサーバーは図4ではシステムと呼ばれる。始動コマンドは、例えば、予起動(preboot)実行環境(PXE)起動メッセージもしくは上級電力管理(APM)制御シーケンスである。PXEは利用可能なデータ・ストレージ装置もしくはインストールされたオペレーティング・システムと独立なネットワーク・インターフェース・カードを用いるブートストラップ・コンピュータ向きの環境である。PXEはカリフォルニア州サンタクララのインテル社によって提供される優先管理フレームワークの一部として導入された。APMはワシントン州レドモンドのインテル(R)社およびマイクロソフト(R)社により開発されたAPIである。これはBIOSが、電力を節約して使うために予めセットした期間の不作動後にCPU速度を下げたりハード・ディスクを遮断したり、ディスプレイへの電力を遮断するなどの電力管理を行う。
ステップ308では、ステップ306における始動コマンドを送られた特定のサーバーがその始動コマンドを受取り、始動する。PRMサーバー106(図1および図2参照)はデータセンタ102(図1および図2参照)に利用することができる電力の量をモニターし、そしてデータセンタ102(図1および図2参照)に含まれるもっと多くのサーバーをその利用可能な電力に基いて始動することができるかを問い合わせるステップ310で判定する。もしもっと多くのサーバーを始動することができるとステップ310で判定されるなら、図4のプロセスはステップ306にループで戻り、そこでPRMサーバー106(図1および図2参照)が、データセンタ102(図1および図2参照)に含まれる他の特定のサーバーに始動コマンドを送る。もしステップ310が他のサーバーを始動することができないと判定すると、図4の始動プロセスはステップ312で終了する。
代替実施例では、ステップ304における最適の再起動順序の判定の後にデータセンタ102(図1および図2参照)のサーバーを最適の再起動順序に従って再起動する手動のプロセスが続く。
プロビジョニング/オーケストレーション・システムとの相互作用
一実施例では、PRMサーバー106(図1および図2参照)は、所定の係属中のサーバーの変更を考慮するデータセンタ102(図1および図2参照)のサーバーの起動順序を変更するプランを得るためにプロビジョニング(最適資源配置)システム(図示せず)および/もしくはオーケストレーション(組織化)システム(図示せず)に相談する。これらの係属中のサーバーの変更は、通常の動作を単に再始動して、それからプロビジョニングもしくはオーケストレーション・システムのプランに従う再プロビジョニングを行うのではなく、図4のプロセスの中で開始される。例えば、記念日というのはビジネスの最も活発な売り出し(セールス)日なので、そのビジネスは記念日のセールの能力のもっと多くの店内ポイントを与えるようにそれを支えるオフィス・システムを再構成する所定のプランを有する。もし電力停止がその記念日に予測されそのビジネスのサーバーについてその記念日用の再プロビジョニングおよび再始動がその記念日の直前に行われる予定なら、PRMサーバー106(図1参照)は、ステップ306、308、310におけるサーバーの再起動を行う前に、所定の記念日用再プロビジョニングを提供する、ステップ304の再起動順序を発生する。これは通常モードでサーバーを再始動する代わりに記念日用プランに従って再プロビジョニングする。
前述のプロビジョニングおよびオーケストレーション機能を提供する製品の例は、ニューヨーク州アーモンクのインターナショナル・ビジネス・マシーンズ・コーポレーションが提供するIBM Tivoli Intelligent Orchestrator(ITIO)である。
コンピューティング・システム
図5は、図1および図2に示す電力回復管理プログラム107を含み、本発明に従って図3および図4のプロセスを実行する、コンピューティング・ユニットのブロック図である。一実施例では、コンピューティング・ユニット400はPRMサーバー106(図1および図2参照)である。他の実施例では、コンピューティング・ユニット400はPRMサーバーとは別である。コンピューティング・ユニット400は概略、中央処理装置(CPU)402、メモリ404、入出力(I/O)インターフェース406、バス408、I/O装置410およびストレージ。ユニット412を含む。CPU402はコンピューティング・ユニット400の計算および制御機能を行う。CPU402は単一の処理装置を含むか、または1箇所またはそれ以上の箇所に存在する1個もしくはそれ以上の処理装置(例えば、クライアントおよびサーバー)に跨って分散されていてもよい。
メモリ404は任意の既知の型のデータ・ストレージおよび/もしくは伝送媒体を含むことができ、また大容量のストレージ、磁気媒体、光媒体、ランダム・アクセス・メモリ(RAM)、読出し専用メモリ(ROM)、データ・キャッシュ、データ・オブジェクトなどを含む。メモリ404のキャッシュ・メモリ・エレメントは少なくとも幾つかのプログラム・コード(例えば、電力回復管理プログラム107)の一時的なストレージを提供する。これは大容量ストレージから何回もコードを取り出さなければならないがその実行中に取り出す回数を減らすためである。更に、CPU402と同様、メモリ404は一つの物理的な位置にあって、1個もしくはそれ以上の型データ・ストレージを含んでいてもよいし、あるいは種々の様式(例えば、ネットワーク接続ストレージ即ちNAS、ストレージ・エリア・ネットワーク即ちSAN、外部のドライブなど)の複数個の物理的なシステムに跨って分散していてもよい。更に。メモリ404はLAN、WAN、もしくはSAN(図示せず)などに跨ってデータが分散されていてもよい。
I/Oインターフェース406は、外部の資源と情報を交換するための任意のシステムを含む。I/O装置410は、ディスプレイ・モニター、キーボード、マウス、プリンタ、スピーカー、ハンドヘルド(手持ちサイズの)装置、ファクシミリ、ネットワーク装置(例えば、ハブ、ルーター、スイッチなど)を含む、任意の型の外部装置を含んでいてもよい。バス408は、コンピューティング・ユニット400中のコンポーネント相互間の通信リンクを提供するが、電子式、光学式、ワイヤレス式など任意の型の伝送リンクを含んでいてもよい。
I/Oインターフェース406はまたコンピューティング・ユニット400が補助記憶装置すなわちストレージ・ユニット412に情報(例えば、プログラム命令もしくはデータ)をストアしたり取出したりするのを許容する。このストレージ・ユニットは磁気ディスク・ドライブもしくは光ディスク・ドライブ(例えば、CD−ROMディスクを受取るCD−ROMドライブ)などの不揮発性のストレージ装置であってよい。コンピューティング・ユニット400は他の補助ストレージ装置(図示せず)に情報をストアし、また取出すことができる。これは直接アクセス・ストレージ装置(DASD)(例えば、ハード・ディスクもしくはフレキシブル・ディスク)、光磁気ディスク、テープ・ドライブ、またはワイヤレス通信装置を含むことができる。一実施例では、前述のストレージ・ユニットの一つはデータ・ストア110(図1もしくは図2参照)を含む。
メモリ404はデータセンタにおける複数個のサーバーを再起動するための最適の順序を決定する電力回復管理プログラム107を含む。電力回復管理プログラム107は図3および図4のプロセスの諸ステップを導入する。更に、メモリ404は図5に示さないが、CPU402上で稼動するオペレーティング・システム(例えばLinux)など他のシステムを含んでいて、コンピューティング・ユニット400の中、および/もしくはそれに接続された種々のコンポーネントの制御を提供してもよい。
本発明は全部がハードウエアの実施例、全部がソフトウエアの実施例、あるいはハードウエアおよびソフトウエアの両方のエレメントを含む実施例の形態を取り得る。好適な実施例では、本発明がソフトウエアで実装され、そして以下に限定するわけではないが、ファームウエア、常駐のソフトウエア、マイクロコードなどを含む。
更に本発明は、コンピューティング・システム400によって使用されもしくはそれと接続されるデータセンタにおいて複数個のサーバーを再起動するための最適な順序を決定するデータセンタ電力回復管理プログラム107のプログラム・コードを提供する媒体であって、コンピュータが使用可能あるいはコンピュータが読み取り可能な媒体からアクセスすることができるコンピュータ・プログラム製品の形態をとることができる。この記述の目的から、コンピュータが使用可能な、もしくはコンピュータが読み取り可能な媒体は、命令実行システム、装置もしくはデバイスによって使用されもしくはそれと接続されるためのプログラムを含み、ストアし、通信し、伝播し、もしくは伝送することができる任意の装置であり得る。
その媒体は電子的、磁気的、光学的、電磁的、赤外線の、もしくは半導体のシステム(または装置もしくはデバイス)または伝播媒体であってよい。コンピュータ読取り可能な媒体の例は、固体メモリ、磁気テープ、取り外し可能なコンピュータ・フロッピー・ディスク、RAM404、ROM、ハード磁気ディスク、および光ディスクを含む。光ディスクの今日の例は、コンパクト・ディスクの読出し専用メモリ(CD−ROM)、コンパクト・ディスクの読出し書き込みメモリおよびDVDを含む。
本発明のコンポーネントのうちのいずれかは、データセンタにおける複数個のサーバーを再起動するための最適の順序を決定するという本発明のプロセスについてコンピューティング環境を展開しもしくは統合するサービス・プロバイダが展開、管理、サービスなどをすることができる。このように、本発明は、コンピュータ読取り可能なコードをコンピューティング・システム(例えば、コンピューティング・ユニット400)の中に統合し、ホスティングし、維持し、展開することを含み、コンピュータ・インフラを支えるためのプロセスを開示する。そこでは、そのコードはコンピューティング・システムと組み合わさって、データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法を行うことができるのである。
他の実施例では、本発明は、定期購読契約、広告および/もしくは料金ベースでの本発明のプロセス・ステップを実行するビジネス方法を提供する。すなわち、ソリューション・インテグレータ(Solution Integrator)などのサービス・プロバイダが、データセンタにおける複数個のサーバーを再起動するための最適の順序を決定するステップを含む本発明のプロセスを生み出し、維持し、支えるといったことを提供することができる。この場合、サービス・プロバイダは一人もしくは複数人の顧客のために本発明のプロセス・ステップを行うコンピュータ・インフラを生み出し、維持し、支えるといったことができる。その見返りに、サービス・プロバイダは定期購読契約および/もしくは料金の契約の下で顧客から支払いを受けることができ、そしてその代わりにあるいはそれに加えて、1個もしくはそれ以上の第三者に広告のコンテンツを売却することから支払いを受けることができる。
ここで開示するフローチャートは一例である。これらのフローチャートもしくはここで開示するステップ(動作)は本発明の範囲内で種々の変形があり得る。例えば、或る場合にはこれらのステップを異なる順序で行ったり、幾つかのステップを加除修正したりということができる。これらの変形は全て添付の請求項に記載されるような本発明の一部と考えられる。
本発明の実施例を本発明の説明の目的上ここで開示したが、当業者には多くの修正や変更が明らかであろう。従って、添付の特許請求の範囲の各請求項は本発明の趣旨および範囲に属するそのような全ての変形を包含することを企図している。
本発明の実施例に従い、ディジタル・コマンド信号を処理することのできる電力パネルを含むデータセンタにおけるサーバーを再起動するための最適の順序を決定するためのシステムのブロック図である。 本発明の実施例に従い、ディジタル・コマンド信号を処理することのできない電力パネルを含むデータセンタにおけるサーバーを再起動するための最適の順序を決定するためのシステムのブロック図である。 本発明の実施例に従い、図1および図2のシステムを用いて再始動する前にデータセンタを作動するプロセスのフローチャートである。 本発明の実施例に従い、図1および図2のシステムを用いて制御された起動順序でもってデータセンタを再始動するプロセスのフローチャートである。 本発明の実施例に従い、図1および図2のシステムに含まれ、図3および図4のプロセスを導入するコンピューティング・システムのブロック図である。
符号の説明
100 コンピュータ・システム
102 データセンタ
104 電力パネル
106 電力回復管理(PRM)サーバー
107 電力回復管理プログラム
108 管理制御卓
110 データ・ストア
112 ポリシー
120 コンピュータ・システム
122 電力回復管理スイッチ

Claims (20)

  1. データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法であって、
    データセンタにおける異常なシャットダウン・イベントの後、前記データセンタにおける複数個のサーバーの再起動に利用することができる電力の回復を、コンピューティング・システムのコンピューティング・ユニットによって、自動的に検知するステップと、
    前記自動的に検知するステップに応答して、前記複数個のサーバーの前記再起動のための順序を、前記コンピューティング・システムにおいて実行するプログラムによって、自動的にかつ動的に決定するステップであって、前記複数個のサーバーに1対1対応で関連する複数個のサービス・レベル契約(SLA)によって指定された複数個の約定であって、前記複数個のサーバーの複数個の使用可能時間のための前記複数個の約定相互間の比較に基くポリシーを適用するステップを含む前記順序を自動的にかつ動的に決定するステップと、
    前記複数個のサーバーを前記順序で再起動するステップと
    を含む、コンピュータ実行方法。
  2. 前記ポリシーを適用するステップが、前記複数個のサーバーのうちの第1のサーバーを、前記複数個のサーバーのうちの第2のサーバーに関連する他の位置よりも前記順序において早い位置に置くことを含み、前記第1のサーバーが前記複数個のサーバーの複数個の使用可能時間のうちの第1の使用可能時間に関連し、前記第2のサーバーが前記複数個の使用可能時間のうちの第2の使用可能時間に関連し、前記第1の使用可能時間が前記第2の使用可能時間よりも大きいこと、または前記第1の使用可能時間を獲得するために故障と関連する第1の財政上の罰則が、前記第2の使用可能時間を獲得するための故障に関連する第2の財政上の罰則よりも大きいことを前記比較が示す結果で前記早い位置に置く、請求項1に記載のコンピュータ実行方法。
  3. 前記順序を前記電力の回復により与えられる負荷に関連するファクタを用いて修正するステップを更に含み、前記ファクタが、
    前記データセンタの二次電力停止を引き起こすことなく前記電力回復によって誘起され得る最大限耐えることのできる初期電力サージと、
    前記ブランチ回路のためのブレーカー制限を踏み外すことなく、前記電力回復による電力で以って回復されえる前記データセンタのブランチ回路上のサーバーの数と
    よりなるグループから選択されることを特徴とするファクタである、請求項1に記載のコンピュータ実行方法。
  4. 前記複数個の使用可能時間のための前記約定相互間の比較である第1のファクタを含む複数個のファクタに対し複数個の重み付けを1対1対応で割り当てるステップと、
    前記複数個の重み付けに対し、1対1対応で関連する複数個のポリシーを、前記複数個の重み付け相互間の比較によって決定された順序で適用するステップと
    を更に含む、請求項1に記載のコンピュータ実行方法。
  5. 前記複数個のサーバーが、サービスを提供するサーバーを含み、前記複数個のファクタが第2のファクタを含み、かつ前記第2のファクタが、
    前記複数個のサーバーにより提供される複数個のサービスのための複数個のビリング割合であって、前記データセンタを管理する組織化されたエンティティの複数の顧客に1対1対応で関連し、関連する顧客により各ビリング割合が支払われるような複数個のビリング割合相互間の比較と、
    前記複数個のサーバーの複数個のワークロード相互間の比較と、
    前記複数のサーバーのうちのサーバーに1対1対応で関連する複数の重要性のレベル相互間の比較と、
    前記複数個のサーバーのうちのサーバーと1対1対応で関連する動作可能性およびアクティビティの複数の状態相互間の比較と、
    前記複数のサービスに含まれ、かつ前記複数個のサーバーのうちの第1のサーバーにより提供される第1のサービスについて、前記他の1個もしくはそれ以上のサーバーの再起動の前に必要となる、該第1のサービスの動作可能性状態の識別と、
    前記複数個のサーバーのうちのサーバーと1対1対応で関連する複数の所望の動作状態であって、各所望の動作状態が前記複数個のサーバーのうちの関連するサーバーを再起動する時間に基づくような前記複数の所望の動作状態相互間の比較と
    よりなるグループから選択されることを特徴とする、請求項4に記載のコンピュータ実行方法。
  6. 前記コンピューティング・ユニットにより、かつプロビジョニングまたはオーケストレーション・システムから、前記複数個のサーバーのうちの1個もしくはそれ以上のサーバーの所定の再プロビジョニングに関連する命令を受け取るステップと、
    前記所定の再プロビジョニングを前記再起動するステップの前に行うステップと
    を更に含む、請求項1に記載のコンピュータ実行方法。
  7. 前記複数個のサーバーを再起動するステップが、
    前記複数個のサーバーを初期化するために、複数個の予起動実行環境(PXE)起動メッセージもしくは複数個の上級電力管理(APM)制御順序を発行するステップを更に含む、請求項1に記載のコンピュータ実行方法。
  8. データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法であって、
    組織的なエンティティにより管理されるデータセンタにおける異常なシャットダウン・イベントの後、前記データセンタにおける複数個のサーバーの再起動に利用することができる電力の回復を、コンピューティング・システムのコンピューティング・ユニットによって、自動的に検知するステップと、
    前記自動的に検知するステップに応答して、前記複数個のサーバーの前記再起動のための順序を、前記コンピューティング・システムにおいて実行するプログラムによって、自動的にかつ動的に決定するステップであって、前記複数個のサーバーにより提供される複数個のサービスのための複数個のビリング割合であって、前記データセンタを管理する組織化されたエンティティの複数の顧客に1対1対応で関連し、関連する顧客により各ビリング割合が支払われるような複数個のビリング割合相互間の比較に基くポリシーを適用することを含む前記順序を自動的にかつ動的に決定するステップと、
    前記複数個のサーバーを前記順序で再起動するステップと
    を含む、コンピュータ実行方法。
  9. 前記ポリシーを適用するステップが、前記複数個のサーバーのうちの第1のサーバーを、前記複数個のサーバーのうちの第2のサーバーに関連する他の位置よりも前記順序において早い位置に置くことを含み、前記第1のサーバーが前記複数個のサーバーの複数個のビリング割合のうちの第1のビリング割合に関連し、前記第2のサーバーが前記複数個のビリング割合のうちの第2のビリング割合に関連し、前記第1のビリング割合が前記第2のビリング割合よりも大きいことを前記比較が示す結果で前記早い位置に置く、請求項8に記載のコンピュータ実行方法。
  10. 前記順序を前記電力の回復により与えられる負荷に関連するファクタを用いて修正するステップを更に含み、前記ファクタが、
    前記データセンタの二次電力停止を引き起こすことなく前記電力回復によって誘起され得る最大限耐えることのできる初期電力サージと、
    前記ブランチ回路のためのブレーカー制限を踏み外すことなく、前記電力回復による電力で以って回復されえる前記データセンタのブランチ回路上のサーバーの数と
    からなるグループから選択されることを特徴とする、請求項8に記載のコンピュータ実行方法。
  11. 前記複数個のビリング割合相互間の比較である第1のファクタを含む複数個のファクタに対し複数個の重み付けを1対1対応で割り当てるステップと、
    前記複数個の重み付けに対し、1対1対応で関連する複数個のポリシーを、前記複数個の重み付け相互間の比較によって決定された順序で適用するステップと
    を更に含む、請求項8に記載のコンピュータ実行方法。
  12. 前記複数個のサーバーが、サービスを提供するサーバーを含み、前記複数個のファクタが第2のファクタを含み、かつ前記第2のファクタが、
    前記複数個のサーバーに1対1対応で関連する複数個のサービス・レベル契約(SLA)によって指定された複数個の約定であって、前記複数個のサーバーの複数個の使用可能時間のための前記複数個の約定相互間の比較と、
    前記複数個のサーバーの複数個のワークロード相互間の比較と、
    前記複数のサーバーのうちのサーバーに1対1対応で関連する複数の重要性のレベル相互間の比較と、
    前記複数個のサーバーのうちのサーバーと1対1対応で関連する動作可能性およびアクティビティの複数の状態相互間の比較と、
    前記複数のサービスに含まれ、かつ前記複数個のサーバーのうちの第1のサーバーにより提供される第1のサービスについて、前記他の1個もしくはそれ以上のサーバーの再起動の前に必要となる、該第1のサービスの動作可能性状態の識別と、
    前記複数個のサーバーのうちのサーバーと1対1対応で関連する複数の所望の動作状態であって、各所望の動作状態が前記複数個のサーバーのうちの関連するサーバーを再起動する時間に基づくような前記複数の所望の動作状態相互間の比較と
    からなるグループから選択されることを特徴とする、請求項11に記載のコンピュータ実行方法。
  13. データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法であって、
    組織的なエンティティにより管理されるデータセンタにおける異常なシャットダウン・イベントの後、前記データセンタにおける複数個のサーバーの再起動に利用することができる電力の回復を、コンピューティング・システムのコンピューティング・ユニットによって、自動的に検知するステップと、
    前記自動的に検知するステップに応答して、前記複数個のサーバーの前記再起動のための順序を、前記コンピューティング・システムにおいて実行するプログラムによって、自動的にかつ動的に決定するステップと、
    前記複数個のサーバーを前記順序で再起動するステップとを含み、
    前記順序を自動的にかつ動的に決定するステップは、更に
    前記複数個のサーバーの、前記異常シャットダウン・イベントのときに存在している複数の状態相互間の比較に基くポリシーを適用するステップを含み、
    前記ポリシーを適用するステップは、前記複数の状態のうちの一つの状態が前記複数のサーバーのうちの、第1のサービスを提供する第1のサーバーに関連付けられ、かつ前記一つの状態が、
    前記第1のサーバーのワークロード、
    前記第1のサーバーにより提供される前記第1のサービスの重要性のレベル、
    前記第1のサーバーの動作可能性およびアクティビティ、ならびに
    前記複数個のサーバーのうち、前記第1のサービスに関連するサービス以外の他の1個もしくはそれ以上のサービスを提供する、他の1個もしくはそれ以上のサーバーの再起動の前に、前記第1のサービスを動作可能とされるようにする要求、
    よりなるグループから選択されることを特徴とする、
    コンピュータ実行方法。
  14. 前記特性が前記ワークロードであり、
    前記ポリシーを適用するステップは、前記第1のサーバーの前記ワークロードが、前記第2のサーバーのワークロードよりも大きい結果、前記複数個のサーバーのうちの第1のサーバーを、前記複数個のサーバーのうちの第2のサーバーに関連する他の位置よりも前記順序において早い位置に置くことを含む、請求項13に記載のコンピュータ実行方法。
  15. 前記特性が前記第1のサービスの前記重要性のレベルであり、
    前記ポリシーを適用するステップは、前記第1のサービスの前記重要性のレベルが、前記第2のサーバーにより提供される第2のサービスの重要性のレベルよりも大きい結果、前記複数個のサーバーのうちの第1のサーバーを、前記複数個のサーバーのうちの第2のサーバーに関連する他の位置よりも前記順序において早い位置に置くことを含む、請求項13に記載のコンピュータ実行方法。
  16. 前記特性が前記第1のサーバーの前記動作可能性およびアクティビティの状態であり、
    前記ポリシーを適用するステップは、前記第1のサーバーの前記動作可能性およびアクティビティの状態について、前記異常シャットダウン・イベントのときの前記第1のサーバーの動作可能かつアクティブな状態であることを示すとともに、前記異常シャットダウン・イベントのときの前記第2のサーバーが動作不能もしくは非アクティブな状態を示す結果、前記複数個のサーバーのうちの第1のサーバーを、前記複数個のサーバーのうちの第2のサーバーに関連する他の位置よりも前記順序において早い位置に置くことを含む、請求項13に記載のコンピュータ実行方法。
  17. 前記特性が、前記他の1個もしくはそれ以上のサーバーの再起動の前に前記第1のサービスが動作可能とするような要求であり、
    前記ポリシーを適用するステップは、前記第1のサーバーがデータベース・サーバーであり、該データベース・サーバー上で前記他の1個もしくはそれ以上のサーバーが1個もしくはそれ以上のサービスを提供するように依存する結果、前記第1のサーバーを、前記他の1個もしくはそれ以上のサーバーに関連する他の1個もしくはそれ以上の位置よりも前記順序において早い位置に置くことを含む、請求項13に記載のコンピュータ実行方法。
  18. データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法であって、
    組織的なエンティティにより管理されるデータセンタにおける異常なシャットダウン・イベントの後、前記データセンタにおける複数個のサーバーの再起動に利用することができる電力の回復を、コンピューティング・システムのコンピューティング・ユニットによって、自動的に検知するステップと、
    前記自動的に検知するステップに応答して、前記複数個のサーバーの前記再起動のための順序を、前記コンピューティング・システムにおいて実行するプログラムによって、自動的にかつ動的に決定するステップと、
    前記複数個のサーバーを前記順序で再起動するステップとを含み、
    前記順序を自動的にかつ動的に決定するステップは、更に
    前記複数個のサーバーの複数個の動作の所望の状態相互間の比較に基くポリシーを適用するステップを含み、
    前記所望の状態は前記複数個のサーバーに1対1対応で関連し、
    前記複数個の所望の状態のうちの一つの所望の状態が、前記複数個のサーバーのうちの一つのサーバーを再起動する時間に基づき、
    前記時間が前記サーバーの動作の一つの予め定義された状態に関連する予め定義された時間である、
    コンピュータ実行方法。
  19. 前記順序を前記電力の回復により与えられる負荷に関連するファクタを用いて修正するステップを更に含み、前記ファクタが、
    前記データセンタの二次電力停止を引き起こすことなく前記電力回復によって誘起され得る最大限耐えることのできる初期電力サージと、
    前記ブランチ回路のためのブレーカー制限を踏み外すことなく、前記電力回復による電力で以って回復されえる前記データセンタのブランチ回路上のサーバーの数と
    よりなるグループから選択したファクタである、請求項18に記載のコンピュータ実行方法。
  20. 前記複数個の所望の状態相互間の比較である第1のファクタを含む複数個のファクタに対し複数個の重み付けを1対1対応で割り当てるステップと、
    前記複数個の重み付けに対し、1対1対応で関連する複数個のポリシーを、前記複数個の重み付け相互間の比較によって決定された順序で適用するステップと
    を更に含む、請求項18に記載のコンピュータ実行方法。
JP2008000963A 2007-01-11 2008-01-08 データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法 Expired - Fee Related JP4897710B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/622,033 2007-01-11
US11/622,033 US7818621B2 (en) 2007-01-11 2007-01-11 Data center boot order control

Publications (2)

Publication Number Publication Date
JP2008171427A JP2008171427A (ja) 2008-07-24
JP4897710B2 true JP4897710B2 (ja) 2012-03-14

Family

ID=39618669

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008000963A Expired - Fee Related JP4897710B2 (ja) 2007-01-11 2008-01-08 データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法

Country Status (3)

Country Link
US (1) US7818621B2 (ja)
JP (1) JP4897710B2 (ja)
CN (1) CN101227325B (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7774589B2 (en) * 2007-03-30 2010-08-10 International Business Machines Corporation System, method and program for selectivity rebooting computers and other components of a distributed computer system
US8335913B2 (en) * 2008-09-08 2012-12-18 Dell Products, LLP Method and system for restoring system configuration after disorderly shutdown
US8024606B2 (en) * 2009-08-21 2011-09-20 International Business Machines Corporation Power restoration to blade servers
EP2330481A1 (en) 2009-12-03 2011-06-08 Racktivity NV Data center management unit with improved disaster prevention and recovery
KR101377462B1 (ko) * 2010-08-24 2014-03-25 한국전자통신연구원 CPU 및 메모리 상태를 이용한 DDoS 공격 차단 정책의 자동화된 제어 방법 및 장치
JP2012108651A (ja) * 2010-11-16 2012-06-07 Hitachi Ltd クラスタシステム
US20120284067A1 (en) * 2011-05-03 2012-11-08 Intuit Inc. Revenue-based impact analysis using multidimensional models of software offerings
US8725998B1 (en) * 2011-08-31 2014-05-13 Amazon Technologies, Inc. Managing host computing devices with a host control component
JP5910246B2 (ja) * 2012-03-29 2016-04-27 富士通株式会社 情報処理システム及び仮想アドレス設定方法
CN103514038B (zh) 2012-06-26 2018-11-27 中兴通讯股份有限公司 一种虚拟系统的平滑关闭方法及系统
EP2907023B1 (en) * 2012-10-12 2021-04-07 Citrix Systems, Inc. Performing reboot cycles, a reboot schedule on on-demand rebooting.
WO2014171047A1 (ja) * 2013-04-17 2014-10-23 日本電気株式会社 障害復旧手順生成装置、障害復旧手順生成方法および障害復旧手順生成プログラム
US9367335B2 (en) 2013-07-12 2016-06-14 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. State dependent optimization for sequential booting of heterogeneous systems
US10268549B2 (en) * 2016-03-03 2019-04-23 International Business Machines Corporation Heuristic process for inferring resource dependencies for recovery planning
CN105912431A (zh) * 2016-04-01 2016-08-31 浪潮电子信息产业股份有限公司 服务器reboot测试方法、服务器、控制器和系统
JP7031600B2 (ja) * 2016-10-26 2022-03-08 日本電気株式会社 変更手順生成装置、変更手順生成方法および変更手順生成プログラム
US10599544B2 (en) * 2017-11-22 2020-03-24 International Business Machines Corporation Determining reboot times of computing nodes
US11169815B2 (en) * 2018-01-16 2021-11-09 Bby Solutions, Inc. Method and system for automation tool set for server maintenance actions
US11669141B2 (en) 2021-05-28 2023-06-06 Microsoft Technology Licensing, Llc Computing system including power nodes

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5930621B2 (ja) * 1981-05-21 1984-07-27 東洋ガラス機械株式会社 多重積層容器体からの容器取出移送装置
JPH05233086A (ja) * 1992-02-25 1993-09-10 Fujitsu Ltd 計算機システムの自動運転制御装置
US5854905A (en) * 1996-09-03 1998-12-29 Intel Corporation Extensible bios for boot support of devices on multiple hierarchical buses
JP2000194572A (ja) * 1998-12-25 2000-07-14 Nec Corp Ups連携による自動ジョブ運用方式
US6430687B1 (en) * 1999-04-15 2002-08-06 International Business Machines Corporation Boot sequence for a network computer including prioritized scheduling of boot code retrieval
US6553432B1 (en) * 1999-10-26 2003-04-22 Dell Usa, L.P. Method and system for selecting IDE devices
US6748525B1 (en) * 1999-11-30 2004-06-08 International Business Machines Corporation Method and apparatus for sending boot programs to workstation computers over a network in a controlled process
US6728875B1 (en) * 2000-11-09 2004-04-27 International Business Machines Corporation Network station suitable for identifying and prioritizing network adapters
US6795914B2 (en) * 2001-01-25 2004-09-21 Dell Products L.P. System and method for selectively executing programs in response to a reboot in a computer system
US20030005090A1 (en) * 2001-06-30 2003-01-02 Sullivan Robert R. System and method for integrating network services
US6944653B2 (en) * 2001-08-30 2005-09-13 Hewlett-Packard Development Company, L.P. Zero-click deployment of data processing systems
US7415519B2 (en) * 2002-06-28 2008-08-19 Lenovo (Singapore) Pte. Ltd. System and method for prevention of boot storms in a computer network
US7127597B2 (en) * 2002-09-24 2006-10-24 Novell, Inc. Mechanism for controlling boot decisions from a network policy directory based on client profile information
US7181604B2 (en) * 2003-02-13 2007-02-20 Sun Microsystems, Inc. Method and apparatus for configuring the boot options of a multi-domain system
US20040162898A1 (en) * 2003-02-14 2004-08-19 Rich Jason H. Dedicated networked device monitoring system
US7076645B2 (en) * 2003-06-25 2006-07-11 Nokia Inc. Method of rebooting a multi-device cluster while maintaining cluster operation
JP4277638B2 (ja) * 2003-09-25 2009-06-10 カシオ計算機株式会社 無停電電源装置
JP2006031096A (ja) * 2004-07-12 2006-02-02 Fuji Xerox Co Ltd 分散処理システムおよびその再起動制御方法および再起動制御プログラム
US7330965B2 (en) * 2005-02-09 2008-02-12 International Business Machines Corporation Multi-tiered boot list

Also Published As

Publication number Publication date
CN101227325B (zh) 2011-08-17
JP2008171427A (ja) 2008-07-24
CN101227325A (zh) 2008-07-23
US7818621B2 (en) 2010-10-19
US20080172553A1 (en) 2008-07-17

Similar Documents

Publication Publication Date Title
JP4897710B2 (ja) データセンタにおける複数個のサーバーを再起動するための最適の順序を決定する方法
Bauer et al. Reliability and availability of cloud computing
US9451013B1 (en) Providing instance availability information
US11550603B2 (en) Method and system for sizing a cloud desktop fabric
JP4374378B2 (ja) 運用実績評価装置、運用実績評価方法、およびプログラム
US9929971B2 (en) Flexible-location reservations and pricing for network-accessible resource capacity
US10810096B2 (en) Deferred server recovery in computing systems
US8161309B2 (en) Apparatus, system, and method for controlling power sequence in a blade center environment
US11507417B2 (en) Job scheduling based on job execution history
US10122593B2 (en) Method and system for managing computing resources using an electronic leasing agent
CN102326132A (zh) 最大化虚拟机平台的降低功率状态的电源管理
US8234486B2 (en) Managing reboot operations
JP2016042249A (ja) 設定検証方法、設定検証プログラムおよび設定検証装置
US9306814B1 (en) Providing instance availability information
JP2004303190A (ja) プログラム、情報処理装置、情報処理装置の制御方法、及び記録媒体
US11393018B2 (en) Method and system for managing computing resources using an electronic auction agent
JP5486687B2 (ja) 因果関係のプログラム実行容量修正への結論付け、およびプログラム実行容量の動的な修正
KR100915533B1 (ko) 미복귀 대기 리소스 이용량 결정 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
CN116401116A (zh) 高可用性调度器事件跟踪
US11983578B2 (en) Provisioning a computing subsystem including disaggregated hardware resources that comply with a power domain requirement for a workload
US20220217097A1 (en) Method and system for allocating and managing cloud resources
CN112912848A (zh) 一种丛集作业过程中的电源请求管理方法
JP5506653B2 (ja) ライセンス管理システム、ライセンス管理方法およびライセンス管理プログラム
US12088454B2 (en) Restoring system functionality when primary maintenance interface is unavailable
Russel et al. High Availability Without Clustering

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100824

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111129

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111222

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees