JP2005302039A - 動的ブート画像と仮想ディスクとを用いてコンピュータ・クラスタを仮想化するシステム及び方法 - Google Patents

動的ブート画像と仮想ディスクとを用いてコンピュータ・クラスタを仮想化するシステム及び方法 Download PDF

Info

Publication number
JP2005302039A
JP2005302039A JP2005117402A JP2005117402A JP2005302039A JP 2005302039 A JP2005302039 A JP 2005302039A JP 2005117402 A JP2005117402 A JP 2005117402A JP 2005117402 A JP2005117402 A JP 2005117402A JP 2005302039 A JP2005302039 A JP 2005302039A
Authority
JP
Japan
Prior art keywords
node
nodes
distributed application
boot image
software
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005117402A
Other languages
English (en)
Inventor
Shannon V Davidson
ヴイ デイヴィッドソン シャノン
Robert J Peterson
ジェイ ピーターソン ロバート
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Co
Original Assignee
Raytheon Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=34940758&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2005302039(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Raytheon Co filed Critical Raytheon Co
Publication of JP2005302039A publication Critical patent/JP2005302039A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0662Virtualisation aspects
    • G06F3/0667Virtualisation aspects at data level, e.g. file, record or object virtualisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/12Digital output to print unit, e.g. line printer, chain printer
    • G06F3/1201Dedicated interfaces to print systems
    • G06F3/1202Dedicated interfaces to print systems specifically adapted to achieve a particular effect
    • G06F3/1211Improving printing performance
    • G06F3/1212Improving printing performance achieving reduced delay between job submission and print start
    • G06F3/1213Improving printing performance achieving reduced delay between job submission and print start at an intermediate node or at the final node
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4416Network booting; Remote initial program loading [RIPL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Stored Programmes (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Apparatus For Radiation Diagnosis (AREA)

Abstract

【課題】コンピュータ・クラスタを仮想化する方法は、分散アプリケーションを選択する工程を含む。
【解決手段】分散アプリケーションと関連付けられるポリシーが取り出される。複数のノードのうちの1つが動的に選択される。更に、選択ノードのブート画像が、取り出されるポリシーに少なくとも部分的に基づいて再設定され、ブート画像は分散アプリケーションと互換である。更に、仮想ディスク画像がノードと関連付けられる。分散アプリケーションの少なくとも一部分は更に、関連付けられている仮想ディスク画像を用いて再設定ノードで実行される。
【選択図】図1

Description

本発明は、一般的に、データ処理の分野に関し、特に、動的ブート画像と仮想化ディスク・アクセスとを用いてコンピュータ・クラスタを仮想化するシステム及び方法に関する。
通常、企業向アプリケーションは専用の計算資源上で実行される。多くの場合、企業は、生産、検査及び開発などのアプリケーションの種々のインスタンスについての種々の計算環境を含むことになる。これらの複数の計算環境は通常、実際すなわち本番のインスタンスと同様なサイズと容量のものである。更に、非本番環境は、長期にわたって遊休状態である場合が多い。このことによって通常、これらの種々の環境を維持し、管理するうえで大量の計算資源と労務費とが無駄になってしまう。
現在、企業は、これらの課題を克服しようとするものとしてプロビジョニングを用い得る。一般的に、プロビジョニングは、計算資源を、局所ディスクをリポジトリからこの資源に複製することによって企業向アプリケーションにインスタンス化する処理のことである。この資源はその場合、プロビジョンニングされたオペレーティング・システム及びソフトウェアによって、10分間を超える時間を通常要する処理を通じてブートされる。
本願の開示は、分散アプリケーションの選択を含む、コンピュータ・クラスタを仮想化するシステム及び方法を備える。分散アプリケーションに関連したポリシーが取り出される。複数のノードのうちの1つが、場合によってはポリシーに基づいて動的に選択される。更に、選択ノードのブート画像が取り出したポリシーに少なくとも一部には基づいて再設定され、ブート画像は分散アプリケーションと互換である。更に、仮想ディスク画像がノードと関連付けられる。分散アプリケーションの少なくとも一部分が更に、関連仮想ディスク画像を用いて再設定ノードで実行される。
本発明はいくつかの重要な技術上の効果を有する。例えば、本発明の1つの考えられる効果には、計算ノードが、実行中に再プロビジョニングされて、分散アプリケーションについての仮想クラスタのメンバになることを可能にし、それによって、プロビジョニング時間を15秒以下に場合によっては削減するということがある。本願の開示の別の考えられる効果には、情報技術(IT)のハードウェア費用及び保守費用の少なくとも30%の削減があり得る。更に、アプリケーションがピーク処理期間にない場合、そのアプリケーションのアイドル・ノードは、別の分散アプリケーションに動的に、再割り当てされるか再プロビジョニングされる場合がある。なお別の考えられる効果には、本願の開示が集中容量計画、性能監視、及び管理の容易化を備えるということがある。更に、本発明は、よりうまくノード障害を管理することを可能にし得る。本発明の種々の実施例は、これらの効果を何ら有しない場合があり、これらの効果の一部又は全部を有する場合もある。本発明の別の技術上の効果は当業者に容易に明らかになる。
本願開示とその効果がより徹底的に分かるよう、次に、下記明細書を添付図面とともに参照する。
図1は、ソフトウェアのアプリケーション114及び処理を、動的ブート画像131を用いて実行する分散計算システム100を示す構成図である。一般的に、システム100は、企業向アプリケーション用か、別の分散アプリケーション用のスケーラブルな分散計算環境である。システム100は、計算ニーズに基づいて動的に発展することが可能であり、各アプリケーション114にそれ自体のスケーラブルな仮想クラスタを備えることによって計算資源を複数のアプリケーション114に同時に備えることが可能な、スケーラブルで、フォールト・トレランスを有する計算環境を備える。例えば、システム100は、1つ又は複数の管理のワークステーション又は局所クライアント120にネットワーク116によって接続されるサーバ102を含み得る。しかし、システム100は、あるいは、スタンドアロン型計算環境又は何れかの別の適切な環境であり得る。要約すれば、システム100は、アプリケーション114の要求、パラメータ、及び処理のニーズが変わるにつれてノード108が、実行中に動的に割り当てられることを自動的に可能にする何れかの計算環境である。本明細書及び特許請求の範囲の原文記載の「dynamically」の語は、一般的に、特定の処理が実行時に1つ又は複数の変数に少なくとも部分的には基づいて判定されるということを表す。本明細書及び特許請求の範囲の原文記載の「automatically」の語は一般的に、適切な処理がシステム100の少なくとも部分によって実質的に行われるということを表す。この「automatically」の語が更に、何れかの適切なユーザ又は管理者による、システム100との相互作用を、本願の開示の範囲から逸脱することなく想定しているということが分かるものである。
サーバ102は、複数のアプリケーション114を1つ又は複数のノード108にわたって実行するよう動作可能な何れかの、局所コンピュータ又は分散コンピュータを備える。一般的に、サーバ102は、ラック搭載サーバ、ブレード・サーバ又は別の分散サーバなどの分散コンピュータを備える。ノード108は、例えば、ブレード、汎用パーソナル・コンピュータ(PC)、マッキントッシュ、ワークステーション、ユニックス(Unix)ベースのコンピュータ、又は何れかの別の適切な装置などの何れかのコンピュータ装置又は処理装置を備える。一般的に、図1は、本願の開示とともに用い得るコンピュータ又はブレードの一例に過ぎないものを備える。例えば、図1は本願開示とともに用い得る一ブレード・サーバ102を示すが、サーバ102は、サーバ以外のコンピュータや、サーバ・プールを用いて実施することが可能である。すなわち、本願の開示は、汎用コンピュータ以外のコンピュータや、通常のオペレーティング・システムなしのコンピュータを想定している。本明細書及び特許請求の範囲の原文において用いているように、「computer」の語は、パーソナル・コンピュータ、ワークステーション、ネットワーク・コンピュータ、又は何れかの別の適切な処理装置に及ぶことが意図されている。サーバ102又はコンポーネント・ノード108は、リナックス(Linux)、ユニックス(Unix)、ウィンドウズ(登録商標)・サーバ、又は何れかの別の適切なオペレーティング・システムを含む何れかのオペレーティング・システムを実行するよう形成し得る。一実施例によれば、サーバ102は、遠隔ウェブ・サーバを含んでいてもよく、遠隔ウェブ・サーバに通信可能に結合されていてもよい。
図示するサーバ102は、複数のノード108と通信可能に結合され、動的ブート・エンジン105を実行するよう動作可能な管理ノードを含む。しかし、サーバ102もノード108も図示する構成部分の全部を含むものでない場合があるということが分かる。管理ノード104は、サーバ102を管理するか、管理者を支援することに実質的に専念している少なくとも1つのブレードすなわち計算装置を備える。例えば、管理ノード104は2つのホットスワップ可能なブレードを備える場合があり、(アクティブ構成/パッシブ構成などのように)2つのブレード又はラック搭載サーバのうちの一方が冗長である。
動的ブート・エンジン105は、ノード108を動的に、割り当て、管理し、ノード108の仮想クラスタ(すなわちアプリケーション環境)を用いてアプリケーション114を実行するよう動作可能な何れかのハードウェア、ソフトウェア、ファームウェア、又はその組み合わせを含み得る。例えば、動的ブート・エンジン105は、C、C++、ジャバ(Java)、ビジュアル・ベーシック(Visual Basic)、アセンブラ、4GLの何れかの適切なバージョン、及びその他の言語又はそれらの何れかの組み合わせにおいて作成すなわち記述される場合がある。動的ブート・エンジン105を図1に単一のマルチタスク・モジュールとして示しているが、このエンジンによって行われる特徴と機能は、例えば、物理層モジュール、仮想層モジュール、ジョブ・スケジューラ、及びプレゼンテーション・エンジンなどの、複数のモジュールによって行い得る。更に、動的ブート・エンジン105は、本願の開示の範囲から逸脱することなく、別のソフトウェア・モジュールの子モジュールすなわちサブモジュールであり得る。したがって、動的ブート・エンジン105は、ノード108とアプリケーション114とをポリシー132に基づいてインテリジェントに管理するよう動作可能な1つ又は複数のソフトウェア・モジュールを備える。
一般的に、動的ブート・エンジン105は個々のノード108上のアプリケーション環境を開始し、停止することによって1つ又は複数のアプリケーション114を管理する。例えば、動的ブート・エンジン105は、所望のアプリケーション環境に特有であるかその環境と互換である、ブート画像ファイル130とは異なるブート画像131によって特定のノード108を再設定し得る。すなわち、動的ブート・エンジン105は何れかの制御ノード108上の何れかの適切なアプリケーション環境を動的にブートすることをサポートする。よって、動的ブート・エンジン105は、何れかの制御コンピュータ上のパブリックIPインタフェース用のIPアドレス又はMACアドレスを動的に設定することをサポートする。動的ブート・エンジン105は更に、何れかのノード108を、ネットワーク・ブート・プロトコルを用いてネットワークから直接ブートしても、付属ディスク記憶機構からブートしてもよい。動的ブート・エンジン105は、何れかの制御コンピュータ用のオペレーティング・システム、サービス、及びアプリケーションを含む仮想局所ディスク画像に対する高速ネットワーク・アクセスを利用する場合もある。動的ブート・エンジン105はアプリケーション環境の起動又はシャットダウンを、カレンダーの日時に基づいて行ってもよく、何れかの別の所定パラメータを用いて行ってもよい。
動的ブート・エンジン105は、種々のフォールト・トレランス手法及び回復手法をサポートする場合もある。例えば、ブート・エンジン105は、障害が起こったノード108を自動的に取替え、障害が起こったノード108に対する取替えノード108を動的に再ブートすることによって単一ハードウェア構成部分障害からサーバ102を自動的に回復させ得る。更に、新たなノード108をインストールすることは、自動的に、新たなノード108を認識し、何れかの必要な構成、再設定又はブートを行うことを動的ブート・エンジン105ができることが理由で容易化させ得る。
ノード108は、アプリケーション114の(タスク又は処理などの)少なくとも一部分を実行するよう動作可能な何れかのコンピュータ、ブレード又はサーバを備える。図示するノード108は、概略を述べれば、メモリ109とプロセッサ110とを含む。メモリ109は、何れかのメモリ・モジュール又はデータベース・モジュールを含み、かつ、磁気媒体、光媒体、ランダム・アクセス・メモリ(RAM)、読み取り専用メモリ(ROM)、取り外し可能媒体、又は何れかの別の適切な、局所メモリ構成部分若しくは遠隔メモリ構成部分を、限定なく含む揮発性メモリ若しくは非揮発性メモリの形態を呈し得る。メモリ109は、種々の局所情報の何れかを含み得る。ノード108はプロセッサ110も含む。プロセッサ110は、例えば、中央処理装置(CPU)又はフィールドでプログラム可能なゲート・アレイ(FPGA)などのサーバ102の処理を行うよう、命令を実行し、データを操作する。図1は各ノード108において単一のプロセッサ110を示すが、特定のニーズによって複数のプロセッサ110を用いる場合があり、プロセッサ110への言及は、該当する場合、複数のプロセッサ110を含むことを表す。プロセッサ110は、例えば、電気的に消去可能な、プログラム可能な読み取り専用メモリ(EEPROM)111などのブート画像に向けての何れかのポインタを含み得る。しかし、ノード108は、何れかの適切な方法で構成される、何れかの数の構成部分を本願の開示の範囲から逸脱することなく備え得るということが分かるものである。ノード108は、局所の一時的なファイル空間及び仮想メモリ・スワップ空間を備える目的で1つ又は複数の局所ハード・ドライブを含む場合もある。
アプリケーション114は、例えば、データベース管理システム(DBMS)、財務ソフトウェア他などの何れかの企業向アプリケーション又は分散アプリケーションを備え得る。通常、アプリケーション114は、何れかの適切な言語で記述され、何れかのデータ処理を行うよう動作可能なソフトウェアから成る。しかし、通常のアプリケーションでないアプリケーションも本願の開示の範囲内に収まる。アプリケーション114は、アプリケーションを実行する環境を論理的に定義するアプリケーション環境すなわち仮想クラスタにおいて実行し得る。一実施例では、アプリケーション環境は、i)アプリケーション環境の名称と記述;ii)ノード108の最小数/最大数;iii)オペレーティング・システム・ソフトウェアのバージョンやアプリケーション114・ソフトウェアのバージョンなどのソフトウェア構成情報;及びiv)ブート画像、ホスト名並びにIPアドレス、ノード108のブート後に適用されるカスタム構成、仮想局所ディスク画像、局所ファイル・システム、搭載対象のファイル・システム、及びネットワーク構成などの、各ノード108のハードウェア構成;を備える。しかし、何れかの適切なパラメータ、変数、又は特性を用いて、動的ブート・エンジン105がアプリケーション環境を定義し、位置特定し、処理するのを支援するのに用い得るということが分かるものである。例えば、アプリケーション環境は、アプリケーション114の起動、シャットダウン、及び状態監視に関する情報を含む場合もある。
サーバ102は、クライアント・サーバ環境又は別の分散環境においてネットワーク116を介してクライアント120などの別のコンピュータ・システムと通信するインタフェース115を含み得る。特定の実施例では、サーバ102はブート画像131、仮想局所ディスク画像134、ポリシー132、又はアプリケーション・データ140をネットワーク116から受信して、高速インタフェース115を介して記憶させるか処理する。一般的には、インタフェース115は、適切な組み合わせにおける、ネットワーク116と通信するよう動作可能な、ソフトウェア及び/又はハードウェアにコード化される論理を備える。特に、インタフェース115は、物理的信号を通信するよう動作可能な通信ネットワーク116又はハードウェアに関連した1つ又は複数の通信プロトコルをサポートするソフトウェアを備え得る。
ネットワーク116は、コンピュータ・サーバ102と、クライアント120などの何れかの別のコンピュータとの間の無線通信又は有線通信を容易にする。実際に、サーバ102とクライアント120との間に存在するものとして図示しているが、ネットワーク116は、本願の開示の範囲から逸脱することなく、種々のノード108間に存在する場合もある。すなわち、ネットワーク116は、種々の計算構成部分間での通信を容易にするよう動作可能な何れかのネットワーク又はサブネットワークに及ぶ。ネットワーク116は、例えば、インターネット・プロトコル(IP)パケット、フレーム・リレイ・フレーム、非同期転送モード(ATM)・セル、音声、データ、及び別の適切な情報をネットワーク・アドレス間で通信し得る。ネットワーク116は、何れかの別の適切な通信プロトコル、例えば、インフィニバンド(InfiniBand)(IB)、ギガビット(Gigabit)・イーサネット(Ethernet)(登録商標)(GE)、又はファイバチャネル(FibreChannel)(FC)によってデータ・パケットを処理し、ルーティングする場合もある。データ・パケットは通常、アプリケーション・データ140内のデータを伝送するのに用いられる。データ・パケットは、発信元識別子と宛て先識別子とを有するヘッダを含み得る。発信元識別子、例えば、発信元アドレスは情報の発信元を識別し、宛て先識別子、例えば宛て先アドレスは情報の受信先を識別する。ネットワーク116は、1つ又は複数の場所での、1つ又は複数の、ローカル・エリア・ネットワーク(LAN)、無線アクセス・ネットワーク(RAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネットとして知られるグローバル・コンピュータ・ネットワークの全部若しくは一部、及び/又はいずれかの別の通信システムを含み得る。
ブート・テーブル130は、複数のブート画像131を含む何れかのディスク・ファーム又はネットワーク・ファイル・システムである。遠隔のものとして示しているが、ブート画像131は、動的ブート・エンジン105によって予めブートされて初期化とインストールとを単純にする場合がある。ブート画像131は、ブート・ドライブの1次オペレーティング・システム・パーティションの少なくとも一部分に対する何れかのフォーム、画像、ポインタ、又は参照である。ブート画像131は通常、2進形式である。ブート画像の種類には、ファイルからのカーネル画像、ブロック装置又はフロッピー(登録商標)・ディスクからのカーネル画像、又は何れかのオペレーティング・システムのブート・セクタが含まれる。例えば、リナックスのブート画像は次のように見える場合がある。
0x1B031336,
0x4,
0x90000000,
0x90000200,

0x4,
0x90200,
0x800,
0x800,

0x4,
0x10000,
0x80000,
0x80000,

0x04000004,
0x100000,
0x80000,
0x80000。
上記のブート画像131の例は、図示する目的のためのものに過ぎず、図示する構成要素や図示していない別の構成要素を何ら含まない場合もあり、図示する構成要素や図示していない別の構成要素の一部又は全部を含む場合もある。更に、ブート画像131は、本願の開示の範囲から逸脱することなく、上記の例とは別のレイアウト又は形式にある場合がある。
ポリシー・テーブル132は、ノード108とアプリケーション114とを管理する何れかのパラメータを含む。例えば、ポリシー132は、ノード108を自動的に、アプリケーション環境に追加するかアプリケーション環境から減らすためのものであり得る。代替又は組合せとして、ポリシー132をサーバ102によって用いて、競合するアプリケーション114間での課題を解決する場合がある。一般的に、ポリシー・テーブル132は、SQLステートメント又はSQLスクリプトによって記述されるリレーショナル・データベースに記憶されている1つ又は複数のテーブルを備え得る。別の実施例では、ポリシー・テーブル132は、種々のデータ構造をXML文書、仮想記憶アクセス方法(VSAM)ファイル、フラット・ファイル、ビートリーブ(Btrieve)・ファイル、又はコンマで区切られた値(CSV)ファイルによって記憶させてもよく、定義してもよい。ポリシー・テーブル132は、1つのコンピュータ上に記憶されているか、複数のコンピュータにわたって記憶されている複数のテーブル又はファイルを備える場合もある。更に、ポリシー・テーブル132は、本願の開示の範囲から逸脱することなく、局所であっても遠隔であってもよく、何れかの種類の適切なデータを記憶する。例えば、ポリシー・テーブル132は:i)アプリケーション環境に割り当てられるノード108の最小数/最大数;ii)アプリケーションに割り当てられるサーバのデフォールト数;iii)ノード108をアプリケーション環境に動的に追加する条件;iv)ノード108をアプリケーション環境から動的に取り除く条件;v)(ネットワーク・アクセスを切断するなど)ノード108を取り除くが、問題の調査に任せる条件;及びvi)アプリケーション114がトランザクション又は処理を実行中であるためにノード108を取り除かないこととする条件;を含む個々の仮想クラスタ・ポリシーを記憶し得る。
別の例では、ポリシー・テーブル132は、優先度ポリシー、資源共有ポリシー、及び横取りポリシーなどの何れかの数の仮想クラスタ間ポリシーを含み得る。優先度は通常、ポリシー競合が存在する場合にどのアプリケーションが資源を取得するかを判定する。例えば、特定のアプリケーション環境の優先度がより高い場合、ノード108に対する優先度付きアクセスを取得し得る。資源共有は多くの場合、アプリケーション環境の、規定されているエンタイトルメントに基づくものである。例えば、各アプリケーション環境には、ノード108の一部にエンタイトルメントが付与される。資源共有は時間軸上で自由に移動できる時間ウィンドウにわたるコンピュータ利用度に基づく場合もある。横取りポリシーによって、高優先度アプリケーション環境が低優先度アプリケーション環境に代わってノード108を支配することを可能にし得る。
仮想局所ディスク画像テーブル133は、複数の仮想局所ディスク画像134を含む何れかのディスク・ファーム又はネットワーク・ファイル・システムである。遠隔のものとして図示しているが、仮想局所ディスク画像134にオペレーティング・システムとアプリケーション・ソフトウェアとを予めロードして初期化とインストールとを単純にする場合がある。仮想局所ディスク画像134は、アプリケーション毎の各仮想ノードの局所ディスク記憶機構に対する何れかのフォーム、画像、ポインタ、又は参照である。仮想局所ディスク画像134は通常、各アプリケーションの仮想ノードの、オペレーティング・システム、構成サービス及びインストールされているアプリケーションを含むものである。各仮想局所ディスク画像134は、複数ノード間での共有については読み取り専用であり得る複数のファイル・システム又は、通常、アプリケーション・ノードに特有の修正可能ファイル・システムを含み得る。仮想局所ディスク画像134は、伝統的なファイル・システム内の階層ディレクトリに記憶させてもよく、アプリケーション・ノードに備えられるネットワーク・ファイル・システム・インタフェースを備えている回復可能なデータベースに記憶させてもよい。
一般的に、アプリケーション・データ140は、アプリケーション114についてのデータを記憶させる、何れかのメモリ、データベース、ストレージ・エリア・ネットワーク(SAN)、又はネットワーク付属ストレージ(NAS)である。アプリケーション・データ140は、SQLステートメント又はSQLスクリプトによって記述されるリレーショナル・データベースにおいて記憶される1つ又は複数のテーブルを備え得る。別の実施例では、アプリケーション・データ140は、種々のデータ構造をXML文書、VSAMファイル、フラット・ファイル、ビートリーブ・ファイル又はCSVファイルとして記憶させるか定義する場合がある。アプリケーション・データ140は、1つのコンピュータ上に記憶されているか複数のコンピュータにわたって記憶されている複数のテーブル又はファイルを備える場合もある。更に、アプリケーション・データ140は、本願の開示の範囲から逸脱することなく、局所のもの又は遠隔のものであり得る。
クライアント120は、アドミニストレーション画面がユーザにグラフィカル・ユーザ・インタフェース(GUI)122を介して提示されるよう動作可能な何れかの装置である。概略を述べれば、図示するクライアント120は、少なくともGUI122を含み、システム100に関連した何れかの適切なデータを受信し、送信し、処理し、記憶するよう動作可能な電子計算機装置を備える。通信可能にサーバ102に結合される何れかの数のクライアント120が存在する場合があるということが分かるものである。更に、「client 120」及び「user of client 120」は、本願の開示の範囲から逸脱することなく、適宜、同義で用い得る。更に、図示を容易にするよう、各クライアントは1つのユーザによって用いられるという点で表している。しかし、多くのユーザが1つのコンピュータを用いて、同じGUI122を用いてコマンドを通信するか、グラフィカル・プレゼンテーションを視る場合があるということを本願の開示は想定している。
本願の開示に記載のように、クライアント120は、パーソナル・コンピュータ、タッチ画面端末、ワークステーション、ネットワーク・コンピュータ、キオスク、無線データ・ポート、携帯電話、携帯情報端末(PDA)、これら若しくは別の装置の内部の1つか複数のプロセッサ、又は何れかの別の適切な処理装置に及ぶことが意図されている。例えば、クライアント120は、情報を受け入れることが可能な、キーパッド、タッチ画面、マウス、又は別の装置などの入力装置、ディジタル・データ、視覚情報を含む、サーバ102若しくはクライアント120の処理に関連した情報を伝える出力装置、又はGUI122を含むコンピュータを備え得る。入力装置も出力装置も、磁気コンピュータ・ディスクなどの固定記憶媒体又は取り外し可能記憶媒体、CD−ROM、又は別の適切な媒体を含んで、アドミニストレーション・ディスプレイ及びジョブ投入ディスプレイ、すなわちGUI122を介してクライアント120のユーザからの入力を受信し、出力をそのユーザに備え得る。
GUI122は、アプリケーション114の性能又はシステム性能を監視する目的か、仮想クラスタを修正する目的か、又は何れかの適切な監視目的でシステム100とのインタフェースをシステム管理者(又はネットワーク管理者)がとることを可能にするよう動作可能なグラフィカル・ユーザ・インタフェースを備える。一般的に、GUI122は、システム100によって備えられるデータの効率的でかつユーザ・フレンドリな提示をクライアント120のユーザに備える。GUI122は、ユーザによって操作される双方向フィールド、プルダウン・リスト、及びボタンを有する複数のカスタム化可能なフレームすなわち表示を備え得る。一実施例では、GUI122は、アプリケーション環境又はポリシー画面の種々のグラフィカル表示を提示し、入力装置のうちの1つを介してクライアント120のユーザからコマンドを受信するディスプレイを提示する。これらのグラフィカル表示は:i)アプリケーション環境、ノード資源及び監視負荷の現在の状態のグラフィカル表現;ii)アプリケーション環境、ノード資源及び利用度の経時的なグラフィカル表現;iii)ウィザード;及びiv)どのアプリケーション114が各アプリケーション環境において実行中であり、各ノード108上で実行中であるかの表示;を含み得る。要約すれば、GUI122は、ノード108の何れかの、物理的な状態若しくは特性、又は論理的な状態若しくは特性をシステム管理者に提示し、種々のコマンドを管理者から受信する場合がある。
一実施例では、GUI122は、管理者がアプリケーション環境を作成し、削除し、複製し、修正することを可能にし得る。管理者は、アプリケーション環境を共有するポリシーを設定し、アプリケーション環境の起動と起動解除とを行い、GUI122を用いてアプリケーション環境とノード108との状態と負荷とを監視する。更に、GUI122は、ノード108を実行中のアプリケーション環境から増減させることを可能にし得る。GUI122は、例えば、構成可能負荷レベルにノード108上かアプリケーション環境内で到達したこと、ノード108が利用不能になったこと、アプリケーション環境が開始されたか停止されたこと、ノード108がアプリケーション環境から増減されたこと、サーバ102が最小のアプリケーション環境要件を満たすことができなかったこと、又は(トランザクション応答時間などの)サービス要件のレベルを上回ったことなどの種々のシステム100の特性に基づいて管理者に警告を提示する場合もある。
グラフィカル・ユーザ・インタフェース(graphical user interface)の語を単数形か複数形で用いて、1つ又は複数のグラフィカル・ユーザ・インタフェースと、特定のグラフィカル・ユーザ・インタフェースの表示の各々を表し得るということが分かるものである。したがって、GUI122は、情報をシステム100において処理し、結果をユーザに効率的に提示する、一般的なウェブ・ブラウザなどの何れかのグラフィカル・ユーザ・インタフェースを想定している。GUI122は、SSL−HTTPSを介して通信するよう動作可能な、セキュアなブラウザも想定している。サーバ102は、クライアント120からのデータをウェブ・ブラウザ(例えば、マイクロソフト(Microsoft)社のインターネット・エクスプローラ(Internet Explorer)又はネットスケープ(Netscape)社のナビゲータ(Navigator))を介して受け入れ、適切なHTML応答又はXML応答を、ネットワーク106を用いて戻すことが可能である。
処理の一特徴では、動的ブート・エンジン105は分散アプリケーション114を選択する。1つ又は複数の関連ポリシー132に基づいて、動的ブート・エンジン105は、1つ又は複数の選択ノード108を特定のアプリケーション環境又は仮想クラスタに増減させ得る。取り出したポリシー132に基づいて、動的ブート・エンジン105は選択ノード108に適切なブート画像132を選択する。例えば、アプリケーション114の部分を実行する4つのノード108が既に存在する場合、アプリケーション114に互換の(ノードの108のハードウェアと、別の特性と1つ又は複数のポリシー132とに少なくとも部分的に基づいて)第5のブート画像132を自動的に選択する。取り出したポリシー132に基づいて、動的ブート・エンジン105は、選択ノード108に適切な仮想局所ディスク画像134を選択する場合もある。適切なブート画像132及び/又は仮想局所ディスク画像134が選択されると、動的ブート・エンジン105はノード108を、選択される、ブート画像132及び仮想局所ディスク画像134に向けたポインタ又は別の参照によって明滅させ、ノード108を再ブートする。(通常15秒間未満で)ノード108が初期化されると、動的ブート・エンジン105(又は特定の別のジョブ・スケジューラ)が選択ノード108のアプリケーション104の適切なタスク、処理又は別の部分を実行する。
図2は、本願の開示の一実施例において、ノード108を動的に再ブートする方法200の例を示す流れ図である。図2は、仮想クラスタ又はアプリケーション環境に対して複数のノード108のうちの1つを動的に割り当てることを概括的に表している。当然、本願の開示の範囲内で、何れかの数のノード108の再設定、再ブート、又は別の方法での割り当てを連続して行うか同時に行う場合がある。概略を述べれば、方法200は、アプリケーション114の環境へ割り当てるようノード108を選択する工程、選択ノード108のブート画像132を再設定する工程、及びノード108を再ブートする工程を含む。以下の説明は、方法200を行ううえでの動的ブート・エンジン105の処理に焦点を当てる。しかし、システム100は、記載機能の一部又は全部を実施する論理構成要素の何れかの適切な組み合わせと配置とを用いることを想定している。
方法200は工程205から始まり、動的ブート・エンジン105は、ソフトウェア・アプリケーション114のノード108を増加させることとするということを判定する。この判定は、何れかの適切な手法を用いて行い得る。例えば、管理者は、アプリケーション114のアプリケーション環境にノード108を手作業で追加し得る。別の例では、動的ブート・エンジン105は、ポリシー132に基づいてノード108を用いる場合があるか用いることとするということを動的に判定し得る。次に、工程210で、何れかの、利用されていない計算ノード108で利用可能なものが存在するかを判定する。利用可能なノード108が更に多く存在する場合、動的ブート・エンジン105は、工程215で、何れかの適切な手法を用いて最初に利用可能な計算ノード108を選択する。例えば、動的ブート・エンジン105は、物理位置、仮想位置、アプリケーション114の互換性、プロセッサ速度、又は何れかの別の適切な特性に基づいてノード108を選択し得る。判定工程220では、動的ブート・エンジン105は、選択ノードがアプリケーション114と互換であるかを判定する。ノード108がアプリケーション114と互換でない場合、動的ブート・エンジン105は工程225で何れかの適切な手法を用いて選択ノードを停止する。次に、動的ブート・エンジン105は工程230でソフトウェア・アプリケーション114に基づいてポリシー132を動的に選択する。例えば、動的ブート・エンジン105は、3つのノード108がソフトウェア・アプリケーション114を現在実行しているということを判定し得る。この判定に基づいて、動的ブート・エンジン105は、ポリシー132において第4論理ノード108を位置特定する。選択ポリシー132に基づいて、工程235で、動的ブート・エンジン105は、新たなブート画像131に向けたポインタによって選択ノードを明滅させて、工程237で仮想局所ディスク画像134を関連付ける。上記のように、動的ブート・エンジン105は、EEPROM111又は何れかの別の適切な構成部分を明滅させ得る。次に、動的ブート・エンジン105は、工程240で、新たなブート画像131を用いて選択ノード108をブートする。ノード108が再ブートされる場合(か、ノードがアプリケーション114と既に互換であった場合)、動的ブート・エンジン105は工程245で、選択ノード108のアプリケーション114を実行し、方法200は終了する。
判定工程210に戻れば、利用可能な計算ノード108が何ら存在しない場合には、工程250で、動的ブート・エンジン105は、アプリケーション114に利用される最適なノード108を選択する。この最適ノード108の選択は、例えば、最も利用されていないノード108を判定する工程、互換ノード108を選択する工程、又は特定の別の「最善のフィット」を判定する工程などの何れかの適切な方法で行い得る。工程255では、動的ブート・エンジン105が、選択ノード108の工程245での現行処理を強制終了する。動的ブート・エンジン105は、アプリケーション特有コマンドを実行する工程、オペレーティング・システムを用いて処理を強制終了する工程他などの何れかの適切な手法を用いて処理を終結し得る。判定工程260では、動的ブート・エンジン105は、選択ノード108がアプリケーション114と互換であるかが判定される。ノード108がアプリケーション114と互換でない場合、動的ブート・エンジン105は工程265で、何れかの適切な手法を用いて選択ノードを停止する。次に、動的ブート・エンジン105は、工程270で、ソフトウェア・アプリケーション114に基づいてポリシー132を動的に選択する。例えば、動的ブート・エンジン105は、3つのノード108がソフトウェア・アプリケーション114を現在実行しているということを判定し得る。この判定に基づいて、動的ブート・エンジン105は、ポリシー132において第4の論理ノード108を位置特定する。選択ポリシー132に基づいて、動的ブート・エンジン105は工程275で、新たなブート画像131に向けたポインタによって選択ノードを明滅させ、工程277で、仮想局所ディスク画像134を関連付ける。上記のように、資源管理エンジンは、EEPROM111又は何れかの別の適切な構成部分を明滅させ得る。次に、動的ブート・エンジン105は、工程280で、新たなブート画像131と仮想局所ディスク画像134とを用いて選択ノード108をブートする。ノード108が再ブートされた場合(か、ノードがアプリケーション114と既に互換であった場合)、動的ブート・エンジン105は工程285で選択ノード108のアプリケーション114を実行し、方法200は終了する。
上記流れ図と、付随する説明は、例示的方法200のみを示す。システム100は、これらやその他のタスクを行うのに適切な何れかの手法を用いることを想定している。よって、この流れ図における工程の多くは、表しているものと同時に行われる場合及び/又は表しているものとは異なる順序で行われる場合がある。更に、システム100は、当該方法が適切の状態のままである限り、工程を追加して方法を用いるか、工程を少なくして方法を用いる場合、及び/又は別の工程を備えている方法を用いる場合がある。
本願の開示は、特定の実施例と、概括的に関連している方法とによって表したが、これらの実施例と方法との改変と置換が当業者に明らかとなる。よって、例示的実施例の上記記載は本願の開示を規定するものでも制約するものでもない。別の変更、置換及び改変も、本願の開示の趣旨及び範囲から逸脱することなく考えられる。
本願の開示の一実施例による、動的にブートする分散システムの例を示す図である。 本願の開示の一実施例における、ノードを動的に再ブートする方法の例を示す図である。
符号の説明
100 システム
102 サーバ
104 管理ノード
105 動的ブート・エンジン
108 ノード
109 メモリ
110 プロセッサ
111 EEPROM
114a アプリケーション
114b アプリケーション
115 インタフェース
116 ネットワーク
120 クライアント
122 GUI
130 ブート画像ファイル
131 ブート画像
132 ポリシー
133 仮想局所ディスク画像テーブル
134 仮想局所ディスク画像
140 アプリケーション・データ
200 方法
205 工程
210 判定工程
215 工程
220 判定工程
225 工程
230 工程
235 工程
237 工程
240 工程
245 工程
250 工程
255 工程
260 判定工程
265 工程
270 工程
275 工程
277 工程
280 工程

Claims (45)

  1. コンピュータ・クラスタを仮想化する方法であって:
    分散アプリケーションを選択する工程;
    該分散アプリケーションと関連するポリシーを取り出す工程;
    複数のノードのうちの1つを動的に選択する工程;及び
    該取り出されるポリシーに少なくとも部分的に基づいて該選択ノードのブート画像を再設定する工程;
    を備え;
    該ブート画像が該分散アプリケーションと互換であり;
    更に、該取り出されるポリシーに少なくとも部分的に基づいて該選択ノードを仮想ディスク画像と関連付ける工程;及び
    該分散アプリケーションの少なくとも一部分を該関連付けられる仮想ディスク画像を用いて該再設定ノードで実行する工程;
    を備えることを特徴とする方法。
  2. 請求項1記載の方法であって:
    該アプリケーションは前記複数のノードの部分集合で実行され;
    更に、該取り出されるポリシーと該ノード部分集合とを比較する工程;及び
    複数の互換ブート画像のうちの1つを該比較に基づいて選択する工程;
    を備えることを特徴とする方法。
  3. 請求項2記載の方法であって、該取り出されるポリシーと該ノード部分集合とを比較する工程が:
    該部分集合におけるノード・カウントを判定する工程;及び
    該ブート画像を該ポリシーにおけるリンクと該ノード・カウントとに基づいて選択する工程;
    を備えることを特徴とする方法。
  4. 請求項2記載の方法であって、該ノード部分集合の各々が:
    前記複数の互換ブート画像のうちの1つと関連付けられることを特徴とする方法。
  5. 請求項1記載の方法であって、該複数のノードのうちの1つを動的に選択する工程が:
    前記複数のノードのうちの1つ又は複数が第2分散アプリケーションによって利用されていないかを判定する工程;及び
    前記複数のノードのうちの少なくとも1つが利用されていないことに応じて、該利用されていないノードのうちの1つを選択する工程;
    を備えることを特徴とする方法。
  6. 請求項5記載の方法であって、前記複数のノードのうち利用されていないものが何らないことに応じて、更に、該第2分散アプリケーションによって利用されている、前記複数のノードのうちの1つを:
    該取り出されるポリシー;
    前記選択ノードの低利用率;
    前記選択分散アプリケーションの優先度;及び
    該選択ノードの該選択分散アプリケーションとの互換性;
    のうちの1つ又は複数のものに基づいて選択する工程;
    を備えることを特徴とする方法。
  7. 請求項6記載の方法であって、前記選択ノードの該ブート画像を再設定する工程が:
    該選択ノードを自動的にシャットダウンする工程;
    該選択ノードの該ブート画像を再設定する工程;及び
    該選択ノードを、該再設定ブート画像を用いて再起動させる工程;
    を備えることを特徴とする方法。
  8. 請求項7記載の方法であって、更に:
    該第2分散アプリケーションに関連付けられる何れかの処理を、該選択ノードをシャットダウンする前に終結する工程;
    を備えることを特徴とする方法。
  9. 請求項1記載の方法であって、更に、前記ポリシーが:
    ブート画像に対する複数のリンク;
    を備え;
    該複数のリンクの各々が、該分散アプリケーションと互換のノード・カウントのうちの1つと関連付けられることを特徴とする方法。
  10. 請求項1記載の方法であって、前記ポリシーが:
    前記複数のノードのうちの1つの前記選択のタイミングを判定する1つ又は複数のパラメータ;
    を備えることを特徴とする方法。
  11. 請求項1記載の方法であって、該ブート画像が:
    ストレージ・エリア・ネットワーク(SAN)において記憶されている遠隔ブート画像;
    を備えることを特徴とする方法。
  12. 請求項1記載の方法であって:
    前記選択ノードは、該再設定に先行して第1ブート画像と関連付けられ、該再設定からは第2ブート画像と関連付けられ;
    該第1ブート画像と該第2ブート画像が:
    オペレーティング・システム;
    システム構成;及び
    分散アプリケーション・パラメータ;
    のうちの少なくとも1つにおいて異なっていることを特徴とする方法。
  13. 請求項1記載の方法であって、更に:
    前記複数のノードのうちの1つに障害が起こったということを判定する工程;
    を備え;
    該障害が起こったノードが、該選択分散アプリケーションのうちの少なくとも一部分を実行し;
    前記複数のノードのうちの1つを選択する工程が:
    該障害に応じて、前記複数のノードのうちの該1つ以外のうちの1つを選択する工程;
    を備えることを特徴とする方法。
  14. 請求項1記載の方法であって、前記複数のノードの各々が:
    同様なプロセッサ・アーキテクチャ;
    を備えることを特徴とする方法。
  15. 請求項1記載の方法であって、前記複数のノードのうちの1つを選択する工程が:
    該複数のノードのうちの1つを所定の時点で選択する工程;
    を備えることを特徴とする方法。
  16. コンピュータ・クラスタを仮想化するソフトウェアであって:
    分散アプリケーションを選択する工程;
    該分散アプリケーションと関連するポリシーを取り出す工程;
    複数のノードのうちの1つを動的に選択する工程;及び
    該取り出されるポリシーに少なくとも部分的に基づいて該選択ノードのブート画像を再設定する工程;
    を行うよう動作可能であり;
    該ブート画像が該分散アプリケーションと互換であり;
    更に、該取り出されるポリシーに少なくとも部分的に基づいて該選択ノードを仮想ディスク画像と関連付ける工程;及び
    該分散アプリケーションの少なくとも一部分を、該関連付けられる仮想ディスク画像を用いて該再設定ノードで実行する工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  17. 請求項16記載のソフトウェアであって:
    該アプリケーションが前記複数のノードの部分集合で実行され:
    更に、該取り出されるポリシーと該ノード部分集合とを比較する工程;及び
    複数の互換ブート画像のうちの1つを該比較に基づいて選択する工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  18. 請求項17記載のソフトウェアであって:
    該取り出されるポリシーと該ノード部分集合とを比較するよう動作可能であり;
    該部分集合におけるノード・カウントを判定する工程;及び
    該ブート画像を該ポリシーにおけるリンクと該ノード・カウントとに基づいて選択する工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  19. 請求項17記載のソフトウェアであって、該ノード部分集合の各々が:
    前記複数の互換ブート画像のうちの1つと関連付けられることを特徴とするソフトウェア。
  20. 請求項16記載のソフトウェアであって:
    該複数のノードのうちの1つを動的に選択し;
    前記複数のノードのうちの1つ又は複数が第2分散アプリケーションによって利用されていないかを判定する工程;及び
    前記複数のノードのうちの少なくとも1つが利用されていないことに応じて、該利用されていないノードのうちの1つを選択する工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  21. 請求項20記載のソフトウェアであって、前記複数のノードのうち利用されていないものが何らないことに応じて、更に、該第2分散アプリケーションによって利用されている、前記複数のノードのうちの1つを:
    該取り出されるポリシー;
    前記選択ノードの低利用率;
    前記選択分散アプリケーションの優先度;及び
    該選択ノードの該選択分散アプリケーションとの互換性;
    のうちの1つ又は複数のものに基づいて選択するよう動作可能であることを特徴とするソフトウェア。
  22. 請求項21記載のソフトウェアであって:
    前記選択ノードの該ブート画像を再設定し;
    該選択ノードを自動的にシャットダウンする工程;
    該選択ノードの該ブート画像を再設定する工程;及び
    該選択ノードを、該再設定ブート画像を用いて再起動させる工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  23. 請求項22記載のソフトウェアであって、更に:
    該第2分散アプリケーションに関連付けられる何れかの処理を、該選択ノードをシャットダウンする前に終結する工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  24. 請求項16記載のソフトウェアであって、更に、前記ポリシーが:
    ブート画像に対する複数のリンク;
    を備え;
    該複数のリンクの各々が、該分散アプリケーションと互換のノード・カウントのうちの1つと関連付けられることを特徴とするソフトウェア。
  25. 請求項16記載のソフトウェアであって、前記ポリシーが:
    前記複数のノードのうちの1つの前記選択のタイミングを判定する1つ又は複数のパラメータ;
    を備えることを特徴とするソフトウェア。
  26. 請求項16記載のソフトウェアであって、該ブート画像が:
    ストレージ・エリア・ネットワーク(SAN)において記憶されている遠隔ブート画像;
    を備えることを特徴とするソフトウェア。
  27. 請求項16記載のソフトウェアであって:
    前記選択ノードは、該再設定に先行して第1ブート画像と関連付けられ、該再設定からは第2ブート画像と関連付けられ;
    該第1ブート画像と該第2ブート画像が:
    オペレーティング・システム;
    システム構成;及び
    分散アプリケーション・パラメータ;
    のうちの少なくとも1つにおいて異なっていることを特徴とするソフトウェア。
  28. 請求項16記載のソフトウェアであって、更に:
    前記複数のノードのうちの1つに障害が起こったということを判定する工程;
    を行うよう動作可能であり;
    該障害が起こったノードが、該選択分散アプリケーションのうちの少なくとも一部分を実行し;
    前記複数のノードのうちの1つを選択し:
    該障害に応じて、前記複数のノードのうちの該1つ以外のうちの1つを選択する工程;
    を行うよう動作可能であることを特徴とするソフトウェア。
  29. 請求項16記載のソフトウェアであって、前記複数のノードの各々が:
    同様なプロセッサ・アーキテクチャ;
    を備えることを特徴とするソフトウェア。
  30. 請求項16記載のソフトウェアであって:
    前記複数のノードのうちの1つを選択し;
    該複数のノードのうちの1つを所定の時点で選択するよう動作可能であることを特徴とするソフトウェア。
  31. コンピュータ・クラスタを仮想化するシステムであって:
    複数の計算ノード;及び
    管理ノード;
    を備え;
    該管理ノードが:
    分散アプリケーションを選択する工程;
    該分散アプリケーションと関連するポリシーを取り出す工程;
    複数のノードのうちの1つを動的に選択する工程;及び
    該取り出されるポリシーに少なくとも部分的に基づいて該選択ノードのブート画像を再設定する工程;
    を行うよう動作可能であり;
    該ブート画像が該分散アプリケーションと互換であり;
    該管理ノードが更に、該取り出されるポリシーに少なくとも部分的に基づいて該選択ノードを仮想ディスク画像と関連付ける工程;及び
    該分散アプリケーションの少なくとも一部分を該関連付けられる仮想ディスク画像を用いて該再設定ノードで実行する工程;
    を行うよう動作可能であることを特徴とするシステム。
  32. 請求項31記載のシステムであって:
    該アプリケーションは前記複数のノードの部分集合で実行され;
    更に、該取り出されるポリシーと該ノード部分集合とを比較する工程;及び
    複数の互換ブート画像のうちの1つを該比較に基づいて選択する工程;
    を備えることを特徴とするシステム。
  33. 請求項32記載のシステムであって、該取り出されるポリシーと該ノード部分集合とを比較するよう動作可能な前記管理ノードが:
    該部分集合におけるノード・カウントを判定する工程;及び
    該ブート画像を該ポリシーにおけるリンクと該ノード・カウントとに基づいて選択する工程;
    を行うよう動作可能な前記管理ノードを備えることを特徴とするシステム。
  34. 請求項32記載のシステムであって、該ノード部分集合の各々が:
    前記複数の互換ブート画像のうちの1つと関連付けられることを特徴とするシステム。
  35. 請求項31記載のシステムであって、該複数のノードのうちの1つを動的に選択するよう動作可能な前記管理ノードが:
    前記複数のノードのうちの1つ又は複数が第2分散アプリケーションによって利用されていないかを判定する工程;及び
    前記複数のノードのうちの少なくとも1つが利用されていないことに応じて、該利用されていないノードのうちの1つを選択する工程;
    を行うよう動作可能な前記管理ノードを備えることを特徴とするシステム。
  36. 請求項35記載のシステムであって、前記複数のノードのうち利用されていないものが何らないことに応じて、更に、該第2分散アプリケーションによって利用されている、前記複数のノードのうちの1つを:
    該取り出されるポリシー;
    前記選択ノードの低利用率;
    前記選択分散アプリケーションの優先度;及び
    該選択ノードの該選択分散アプリケーションとの互換性;
    のうちの1つ又は複数のものに基づいて選択することを特徴とするシステム。
  37. 請求項36記載のシステムであって、前記選択ノードの該ブート画像を再設定するよう動作可能な前記管理ノードが:
    該選択ノードを自動的にシャットダウンする工程;
    該選択ノードの該ブート画像を再設定する工程;及び
    該選択ノードを、該再設定ブート画像を用いて再起動させる工程;
    を行うよう動作可能な前記管理ノードを備えることを特徴とするシステム。
  38. 請求項37記載のシステムであって、前記管理ノードが更に:
    該選択ノードをシャットダウンする前に該第2分散アプリケーションに関連付けられる何れかの処理を終結するよう動作可能であることを特徴とするシステム。
  39. 請求項31記載のシステムであって、更に、前記ポリシーが:
    ブート画像に対する複数のリンク;
    を備え;
    該複数のリンクの各々が、該分散アプリケーションと互換のノード・カウントのうちの1つと関連付けられることを特徴とするシステム。
  40. 請求項31記載のシステムであって、前記ポリシーが:
    前記複数のノードのうちの1つの前記選択のタイミングを判定する1つ又は複数のパラメータ;
    を備えることを特徴とするシステム。
  41. 請求項31記載のシステムであって、該ブート画像が:
    ストレージ・エリア・ネットワーク(SAN)において記憶されている遠隔ブート画像;
    を備えることを特徴とするシステム。
  42. 請求項31記載のシステムであって:
    前記選択ノードは、該再設定に先行して第1ブート画像と関連付けられ、該再設定からは第2ブート画像と関連付けられ;
    該第1ブート画像と該第2ブート画像が:
    オペレーティング・システム;
    システム構成;及び
    分散アプリケーション・パラメータ;
    のうちの少なくとも1つにおいて異なっていることを特徴とするシステム。
  43. 請求項31記載のシステムであって、前記管理ノードが更に:
    前記複数のノードのうちの1つに障害が起こったということを判定する工程;
    を行うよう動作可能であり;
    該障害が起こったノードが、該選択分散アプリケーションのうちの少なくとも一部分を実行し;
    前記複数のノードのうちの1つを選択するよう動作可能な前記管理ノードが:
    該障害に応じて、前記複数のノードのうちの該1つ以外のうちの1つを選択するよう動作可能な前記管理ノード;
    を備えることを特徴とするシステム。
  44. 請求項31記載のシステムであって、前記複数のノードの各々が:
    同様なプロセッサ・アーキテクチャ;
    を備えることを特徴とするシステム。
  45. 請求項31記載のシステムであって、前記複数のノードのうちの1つを選択するよう動作可能な前記管理ノードが:
    該複数のノードのうちの1つを所定の時点で選択するよう動作可能な前記管理ノード;
    を備えることを特徴とするシステム。
JP2005117402A 2004-04-15 2005-04-14 動的ブート画像と仮想ディスクとを用いてコンピュータ・クラスタを仮想化するシステム及び方法 Pending JP2005302039A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/825,345 US8190714B2 (en) 2004-04-15 2004-04-15 System and method for computer cluster virtualization using dynamic boot images and virtual disk

Publications (1)

Publication Number Publication Date
JP2005302039A true JP2005302039A (ja) 2005-10-27

Family

ID=34940758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005117402A Pending JP2005302039A (ja) 2004-04-15 2005-04-14 動的ブート画像と仮想ディスクとを用いてコンピュータ・クラスタを仮想化するシステム及び方法

Country Status (13)

Country Link
US (1) US8190714B2 (ja)
EP (1) EP1594057B1 (ja)
JP (1) JP2005302039A (ja)
KR (1) KR101173712B1 (ja)
CN (1) CN100447746C (ja)
AT (1) ATE474265T1 (ja)
CA (1) CA2503773C (ja)
DE (1) DE602005022249D1 (ja)
HK (1) HK1078957A1 (ja)
IL (1) IL178607A (ja)
MY (1) MY143931A (ja)
TW (1) TWI287713B (ja)
WO (1) WO2005106655A1 (ja)

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050114595A1 (en) * 2003-11-26 2005-05-26 Veritas Operating Corporation System and method for emulating operating system metadata to provide cross-platform access to storage volumes
US8782654B2 (en) 2004-03-13 2014-07-15 Adaptive Computing Enterprises, Inc. Co-allocating a reservation spanning different compute resources types
US9268607B2 (en) 2004-03-13 2016-02-23 Adaptive Computing Enterprises, Inc. System and method of providing a self-optimizing reservation in space of compute resources
US7711977B2 (en) * 2004-04-15 2010-05-04 Raytheon Company System and method for detecting and managing HPC node failure
US8190714B2 (en) 2004-04-15 2012-05-29 Raytheon Company System and method for computer cluster virtualization using dynamic boot images and virtual disk
US9178784B2 (en) 2004-04-15 2015-11-03 Raytheon Company System and method for cluster management based on HPC architecture
US8335909B2 (en) 2004-04-15 2012-12-18 Raytheon Company Coupling processors to each other for high performance computing (HPC)
US20050235055A1 (en) * 2004-04-15 2005-10-20 Raytheon Company Graphical user interface for managing HPC clusters
US8336040B2 (en) 2004-04-15 2012-12-18 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US20070266388A1 (en) 2004-06-18 2007-11-15 Cluster Resources, Inc. System and method for providing advanced reservations in a compute environment
US7577959B2 (en) * 2004-06-24 2009-08-18 International Business Machines Corporation Providing on-demand capabilities using virtual machines and clustering processes
US8176490B1 (en) 2004-08-20 2012-05-08 Adaptive Computing Enterprises, Inc. System and method of interfacing a workload manager and scheduler with an identity manager
CA2586763C (en) 2004-11-08 2013-12-17 Cluster Resources, Inc. System and method of providing system jobs within a compute environment
US7475274B2 (en) * 2004-11-17 2009-01-06 Raytheon Company Fault tolerance and recovery in a high-performance computing (HPC) system
US7433931B2 (en) * 2004-11-17 2008-10-07 Raytheon Company Scheduling in a high-performance computing (HPC) system
US8244882B2 (en) * 2004-11-17 2012-08-14 Raytheon Company On-demand instantiation in a high-performance computing (HPC) system
US8863143B2 (en) 2006-03-16 2014-10-14 Adaptive Computing Enterprises, Inc. System and method for managing a hybrid compute environment
WO2006112981A2 (en) 2005-03-16 2006-10-26 Cluster Resources, Inc. Automatic workload transfer to an on-demand center
US9231886B2 (en) 2005-03-16 2016-01-05 Adaptive Computing Enterprises, Inc. Simple integration of an on-demand compute environment
US20110258320A1 (en) * 2005-04-07 2011-10-20 Adaptive Computing Enterprises, Inc. Elastic management of compute resources between a web server and an on-demand compute environment
EP1872249B1 (en) 2005-04-07 2016-12-07 Adaptive Computing Enterprises, Inc. On-demand access to compute resources
US8484213B2 (en) * 2005-08-31 2013-07-09 International Business Machines Corporation Heterogenous high availability cluster manager
US8370416B2 (en) * 2006-04-26 2013-02-05 Hewlett-Packard Development Company, L.P. Compatibility enforcement in clustered computing systems
CN101169725A (zh) * 2006-10-23 2008-04-30 国际商业机器公司 随需个人计算机供应系统和方法
US8065676B1 (en) 2007-04-24 2011-11-22 Hewlett-Packard Development Company, L.P. Automated provisioning of virtual machines for a virtual machine buffer pool and production pool
US8141090B1 (en) * 2007-04-24 2012-03-20 Hewlett-Packard Development Company, L.P. Automated model-based provisioning of resources
US8069341B2 (en) * 2007-06-29 2011-11-29 Microsoft Corporation Unified provisioning of physical and virtual images
US9262366B2 (en) * 2007-09-21 2016-02-16 Microsoft Technology Licensing, Llc Software deployment in large-scale networked systems
US8041773B2 (en) 2007-09-24 2011-10-18 The Research Foundation Of State University Of New York Automatic clustering for self-organizing grids
US20090113408A1 (en) * 2007-10-30 2009-04-30 Telefonaktiebolaget Lm Ericsson (Publ) System synchronization in cluster
US9015704B2 (en) 2008-03-24 2015-04-21 International Business Machines Corporation Context agent injection using virtual machine introspection
KR101398935B1 (ko) * 2008-04-29 2014-06-27 삼성전자주식회사 가상화를 이용한 시스템 복원 방법 및 장치
WO2010008707A1 (en) * 2008-07-17 2010-01-21 Lsi Corporation Systems and methods for installing a bootable virtual storage appliance on a virtualized server platform
US8661235B2 (en) * 2008-10-08 2014-02-25 Hewlett-Packard Development Company, L.P. Firmware storage medium with customized image
US9239840B1 (en) 2009-04-24 2016-01-19 Swish Data Corporation Backup media conversion via intelligent virtual appliance adapter
US9087066B2 (en) * 2009-04-24 2015-07-21 Swish Data Corporation Virtual disk from network shares and file servers
US10877695B2 (en) 2009-10-30 2020-12-29 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US11720290B2 (en) 2009-10-30 2023-08-08 Iii Holdings 2, Llc Memcached server functionality in a cluster of data processing nodes
US8639658B1 (en) * 2010-04-21 2014-01-28 Symantec Corporation Cache management for file systems supporting shared blocks
US9684712B1 (en) * 2010-09-28 2017-06-20 EMC IP Holding Company LLC Analyzing tenant-specific data
US9237188B1 (en) 2012-05-21 2016-01-12 Amazon Technologies, Inc. Virtual machine based content processing
US9417925B2 (en) * 2012-10-19 2016-08-16 Microsoft Technology Licensing, Llc Dynamic functionality partitioning
US9110670B2 (en) 2012-10-19 2015-08-18 Microsoft Technology Licensing, Llc Energy management by dynamic functionality partitioning
CN103116569A (zh) * 2012-10-31 2013-05-22 劲智数位科技股份有限公司 操作系统环境调整的丛集式计算机系统
US20140122670A1 (en) * 2012-11-01 2014-05-01 Intigua Inc. System and method for automated system management
US9167002B2 (en) * 2013-08-15 2015-10-20 Microsoft Technology Licensing, Llc Global platform health management
FR3011151B1 (fr) * 2013-09-20 2017-01-13 Bull Sas Procede de configuration d'au moins un nœud d'une grappe d'ordinateurs
RU2600538C2 (ru) * 2014-04-08 2016-10-20 Интел Корпорейшн Запуск приложения на основе интерфейса передачи сообщения (mpi) в гетерогенной среде
RU2580425C1 (ru) * 2014-11-28 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ структуризации хранящихся объектов в связи с пользователем на сервере и сервер
US9762454B2 (en) * 2015-05-08 2017-09-12 Rockwell Automation Technologies, Inc. System and method to capture and document cross-product compatibility status information for industrial devices
US10387011B2 (en) 2015-05-08 2019-08-20 Rockwell Automation Technologies, Inc. System and method to capture and document cross-product compatibility status information for industrial devices
KR101644958B1 (ko) * 2015-12-23 2016-08-12 한국과학기술정보연구원 다중 사용자 맞춤형 컴퓨팅 자원 제공을 위한 클러스터 구축 방법 및 클러스터 구축 장치
US10237335B2 (en) * 2016-06-15 2019-03-19 Advanced Micro Devices, Inc. Managing cluster-level performance variability without a centralized controller
US10289785B1 (en) * 2016-09-15 2019-05-14 Xilinx, Inc. Platform architecture creation for a system-on-chip
US10387165B2 (en) 2016-10-25 2019-08-20 International Business Machines Corporation Choosing optimum nodes to boot in multi-node server
CN107147532B (zh) * 2017-05-27 2020-03-06 杭州迪普科技股份有限公司 一种分布式设备的虚拟化方法和装置
US20190004816A1 (en) * 2017-06-29 2019-01-03 Dell Products L.P. Systems and methods for heterogeneous system on a chip servers
US11237841B2 (en) 2019-08-21 2022-02-01 Micron Technology, Inc. Configurable media structure

Family Cites Families (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4885770A (en) * 1987-09-04 1989-12-05 Digital Equipment Corporation Boot system for distributed digital data processing system
US4868818A (en) * 1987-10-29 1989-09-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Fault tolerant hypercube computer system architecture
US5020059A (en) * 1989-03-31 1991-05-28 At&T Bell Laboratories Reconfigurable signal processor
US5396635A (en) * 1990-06-01 1995-03-07 Vadem Corporation Power conservation apparatus having multiple power reduction levels dependent upon the activity of the computer system
US5301104A (en) * 1990-08-07 1994-04-05 Honeywell Inc. Method for allocating processing elements interconnected in a hypercube topology
US5280607A (en) * 1991-06-28 1994-01-18 International Business Machines Corporation Method and apparatus for tolerating faults in mesh architectures
JPH05274178A (ja) 1992-03-25 1993-10-22 Fujitsu Ltd 並列計算機デバッグ結果表示処理方式
CA2106280C (en) * 1992-09-30 2000-01-18 Yennun Huang Apparatus and methods for fault-tolerant computing employing a daemon monitoring process and fault-tolerant library to provide varying degrees of fault tolerance
US5781715A (en) * 1992-10-13 1998-07-14 International Business Machines Corporation Fault-tolerant bridge/router with a distributed switch-over mechanism
US5513313A (en) * 1993-01-19 1996-04-30 International Business Machines Corporation Method for generating hierarchical fault-tolerant mesh architectures
US5450578A (en) * 1993-12-23 1995-09-12 Unisys Corporation Method and apparatus for automatically routing around faults within an interconnect system
JP3541212B2 (ja) 1993-12-28 2004-07-07 富士通株式会社 プロセッサ割当て装置
CA2185787A1 (en) * 1994-03-22 1995-09-28 Richard S. Norman Efficient direct cell replacement fault tolerant architecture supporting completely integrated systems with means for direct communication with system operator
US6408402B1 (en) 1994-03-22 2002-06-18 Hyperchip Inc. Efficient direct replacement cell fault tolerant architecture
JPH08227356A (ja) 1994-12-21 1996-09-03 Tec Corp データ処理装置
US5682491A (en) * 1994-12-29 1997-10-28 International Business Machines Corporation Selective processing and routing of results among processors controlled by decoding instructions using mask value derived from instruction tag and processor identifier
US5603044A (en) * 1995-02-08 1997-02-11 International Business Machines Corporation Interconnection network for a multi-nodal data processing system which exhibits incremental scalability
US5872928A (en) * 1995-02-24 1999-02-16 Cabletron Systems, Inc. Method and apparatus for defining and enforcing policies for configuration management in communications networks
US5889953A (en) * 1995-05-25 1999-03-30 Cabletron Systems, Inc. Policy management and conflict resolution in computer networks
US5805785A (en) * 1996-02-27 1998-09-08 International Business Machines Corporation Method for monitoring and recovery of subsystems in a distributed/clustered system
US6006242A (en) * 1996-04-05 1999-12-21 Bankers Systems, Inc. Apparatus and method for dynamically creating a document
US5805786A (en) * 1996-07-23 1998-09-08 International Business Machines Corporation Recovery of a name server managing membership of a domain of processors in a distributed computing environment
US6393581B1 (en) * 1996-08-29 2002-05-21 Cornell Research Foundation, Inc. Reliable time delay-constrained cluster computing
JPH10116261A (ja) 1996-10-14 1998-05-06 Hitachi Ltd 並列計算機システムのチェックポイントリスタート方法
KR100207598B1 (ko) 1997-01-27 1999-07-15 윤종용 상호연결망으로서 파이브 채널을 사용한 클러스터시스템
US5933631A (en) * 1997-03-17 1999-08-03 International Business Machines Corporation Dynamic boot filesystem selection
US6029246A (en) * 1997-03-31 2000-02-22 Symantec Corporation Network distributed system for updating locally secured objects in client machines
US5991877A (en) * 1997-04-03 1999-11-23 Lockheed Martin Corporation Object-oriented trusted application framework
US6088330A (en) * 1997-09-09 2000-07-11 Bruck; Joshua Reliable array of distributed computing nodes
US6167502A (en) 1997-10-10 2000-12-26 Billions Of Operations Per Second, Inc. Method and apparatus for manifold array processing
US6230252B1 (en) * 1997-11-17 2001-05-08 Silicon Graphics, Inc. Hybrid hypercube/torus architecture
US6633945B1 (en) * 1997-12-07 2003-10-14 Conexant Systems, Inc. Fully connected cache coherent multiprocessing systems
US6477663B1 (en) * 1998-04-09 2002-11-05 Compaq Computer Corporation Method and apparatus for providing process pair protection for complex applications
US6189100B1 (en) * 1998-06-30 2001-02-13 Microsoft Corporation Ensuring the integrity of remote boot client data
US6195760B1 (en) 1998-07-20 2001-02-27 Lucent Technologies Inc Method and apparatus for providing failure detection and recovery with predetermined degree of replication for distributed applications in a network
US6466932B1 (en) * 1998-08-14 2002-10-15 Microsoft Corporation System and method for implementing group policy
US6683696B1 (en) * 1998-10-27 2004-01-27 Hewlett-Packard Development Company, L.P. Filter based data imaging method for an image forming device
US6158010A (en) * 1998-10-28 2000-12-05 Crosslogix, Inc. System and method for maintaining security in a distributed computer network
US6691165B1 (en) * 1998-11-10 2004-02-10 Rainfinity, Inc. Distributed server cluster for controlling network traffic
US6496941B1 (en) 1998-12-29 2002-12-17 At&T Corp. Network disaster recovery and analysis tool
US6480972B1 (en) * 1999-02-24 2002-11-12 International Business Machines Corporation Data processing system and method for permitting a server to remotely perform diagnostics on a malfunctioning client computer system
US6453426B1 (en) * 1999-03-26 2002-09-17 Microsoft Corporation Separately storing core boot data and cluster configuration data in a server cluster
US6408326B1 (en) * 1999-04-20 2002-06-18 Microsoft Corporation Method and system for applying a policy to binary data
US6718486B1 (en) * 2000-01-26 2004-04-06 David E. Lovejoy Fault monitor for restarting failed instances of the fault monitor
US6597956B1 (en) * 1999-08-23 2003-07-22 Terraspring, Inc. Method and apparatus for controlling an extensible computing system
US6415323B1 (en) * 1999-09-03 2002-07-02 Fastforward Networks Proximity-based redirection system for robust and scalable service-node location in an internetwork
US6741983B1 (en) * 1999-09-28 2004-05-25 John D. Birdwell Method of indexed storage and retrieval of multidimensional information
US6629266B1 (en) * 1999-11-17 2003-09-30 International Business Machines Corporation Method and system for transparent symptom-based selective software rejuvenation
DE19957806A1 (de) * 1999-12-01 2001-06-07 Bsh Bosch Siemens Hausgeraete Wärmeisolierende Wandung
US6748437B1 (en) * 2000-01-10 2004-06-08 Sun Microsystems, Inc. Method for creating forwarding lists for cluster networking
JP3329804B2 (ja) * 2000-02-21 2002-09-30 株式会社東芝 監視制御装置
US6460149B1 (en) * 2000-03-03 2002-10-01 International Business Machines Corporation Suicide among well-mannered cluster nodes experiencing heartbeat failure
CA2404095A1 (en) 2000-03-22 2001-09-27 Yottayotta, Inc. Method and system for providing multimedia information on demand over wide area networks
US6785713B1 (en) * 2000-05-08 2004-08-31 Citrix Systems, Inc. Method and apparatus for communicating among a network of servers utilizing a transport mechanism
US6658504B1 (en) 2000-05-16 2003-12-02 Eurologic Systems Storage apparatus
US20040034794A1 (en) * 2000-05-28 2004-02-19 Yaron Mayer System and method for comprehensive general generic protection for computers against malicious programs that may steal information and/or cause damages
JP4292693B2 (ja) * 2000-07-07 2009-07-08 株式会社日立製作所 計算機資源分割装置および資源分割方法
US7032119B2 (en) * 2000-09-27 2006-04-18 Amphus, Inc. Dynamic power and workload management for multi-server system
JP2002108839A (ja) 2000-09-28 2002-04-12 Mitsubishi Electric Corp 通信ネットワークシステム、ジョブ割当方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20010000624A (ko) 2000-10-10 2001-01-05 최은석 고성능 컴퓨터를 이용한 연산기능 제공방법
US7428583B1 (en) * 2000-10-31 2008-09-23 Intel Corporation Network policy distribution
US6748737B2 (en) 2000-11-17 2004-06-15 Patrick Alan Lafferty Regenerative energy storage and conversion system
US7055148B2 (en) * 2000-12-07 2006-05-30 Hewlett-Packard Development Company, L.P. System and method for updating firmware
US6735660B1 (en) * 2000-12-21 2004-05-11 International Business Machines Corporation Sideband signal transmission between host and input/output adapter
EP1370966B1 (en) 2001-02-24 2010-08-25 International Business Machines Corporation A novel massively parrallel supercomputer
US7107337B2 (en) * 2001-06-07 2006-09-12 Emc Corporation Data storage system with integrated switching
US6952766B2 (en) * 2001-03-15 2005-10-04 International Business Machines Corporation Automated node restart in clustered computer system
US7028228B1 (en) * 2001-03-28 2006-04-11 The Shoregroup, Inc. Method and apparatus for identifying problems in computer networks
US6918051B2 (en) * 2001-04-06 2005-07-12 International Business Machines Corporation Node shutdown in clustered computer system
US6820221B2 (en) 2001-04-13 2004-11-16 Hewlett-Packard Development Company, L.P. System and method for detecting process and network failures in a distributed system
US7231430B2 (en) * 2001-04-20 2007-06-12 Egenera, Inc. Reconfigurable, virtual processing system, cluster, network and method
US6675264B2 (en) * 2001-05-07 2004-01-06 International Business Machines Corporation Method and apparatus for improving write performance in a cluster-based file system
WO2002095580A1 (en) 2001-05-23 2002-11-28 Tekelec Methods and systems for automatically configuring network monitoring system
US6950833B2 (en) * 2001-06-05 2005-09-27 Silicon Graphics, Inc. Clustered filesystem
US8010558B2 (en) * 2001-06-05 2011-08-30 Silicon Graphics International Relocation of metadata server with outstanding DMAPI requests
US6988193B2 (en) * 2001-06-28 2006-01-17 International Business Machines Corporation System and method for creating a definition for a target device based on an architecture configuration of the target device at a boot server
US20030005039A1 (en) * 2001-06-29 2003-01-02 International Business Machines Corporation End node partitioning using local identifiers
US8032625B2 (en) * 2001-06-29 2011-10-04 International Business Machines Corporation Method and system for a network management framework with redundant failover methodology
SE0102405D0 (sv) * 2001-07-04 2001-07-04 Software Run Ab A system and a method for selecting a preconfigured operating system for a server
GB0116310D0 (en) 2001-07-04 2001-08-29 New Transducers Ltd Contact sensitive device
US7065764B1 (en) * 2001-07-20 2006-06-20 Netrendered, Inc. Dynamically allocated cluster system
US7016299B2 (en) * 2001-07-27 2006-03-21 International Business Machines Corporation Network node failover using path rerouting by manager component or switch port remapping
EP1283464A1 (en) * 2001-08-06 2003-02-12 Hewlett-Packard Company A boot process for a computer, a boot ROM and a computer having a boot ROM
US6922791B2 (en) * 2001-08-09 2005-07-26 Dell Products L.P. Failover system and method for cluster environment
JP2003099412A (ja) 2001-09-21 2003-04-04 Hitachi Eng Co Ltd 超並列コンピュータ
US7073053B1 (en) * 2001-10-11 2006-07-04 Cisco Technology, Inc. Method and apparatus for a boot progression scheme for reliably initializing a system
GB2381713A (en) 2001-11-01 2003-05-07 3Com Corp Failover mechanism involving blocking of access of a malfunctioning server and continuing monitoring to enable unblocking of access if server recovers
US6904482B2 (en) * 2001-11-20 2005-06-07 Intel Corporation Common boot environment for a modular server system
EP1318453A1 (en) * 2001-12-07 2003-06-11 Hewlett-Packard Company Scheduling system, method and apparatus for a cluster
CA2365729A1 (en) * 2001-12-20 2003-06-20 Platform Computing (Barbados) Inc. Topology aware scheduling for a multiprocessor system
US7046687B1 (en) * 2002-01-16 2006-05-16 Tau Networks Configurable virtual output queues in a scalable switching system
US6918063B2 (en) * 2002-02-04 2005-07-12 International Business Machines Corporation System and method for fault tolerance in multi-node system
US7093004B2 (en) * 2002-02-04 2006-08-15 Datasynapse, Inc. Using execution statistics to select tasks for redundant assignment in a distributed computing platform
US7640547B2 (en) * 2002-02-08 2009-12-29 Jpmorgan Chase & Co. System and method for allocating computing resources of a distributed computing system
DE10214067B4 (de) * 2002-03-28 2010-01-21 Advanced Micro Devices, Inc., Sunnyvale Integrierter Schaltkreischip mit Hochgeschwindigkeitsdatenschnittstelle sowie zugehöriges Southbridgebauelement und Verfahren
US7043539B1 (en) * 2002-03-29 2006-05-09 Terraspring, Inc. Generating a description of a configuration for a virtual network system
US7139798B2 (en) * 2002-05-17 2006-11-21 Groove Networks, Inc. Method and apparatus for connecting a secure peer-to-peer collaboration system to an external system
US7161904B2 (en) 2002-06-04 2007-01-09 Fortinet, Inc. System and method for hierarchical metering in a virtual router based network switch
JP3932994B2 (ja) 2002-06-25 2007-06-20 株式会社日立製作所 サーバ引継システムおよびその方法
DE10234992A1 (de) * 2002-07-31 2004-02-19 Advanced Micro Devices, Inc., Sunnyvale Retry-Mechanismus für blockierende Schnittstellen
US7765299B2 (en) 2002-09-16 2010-07-27 Hewlett-Packard Development Company, L.P. Dynamic adaptive server provisioning for blade architectures
US7127597B2 (en) * 2002-09-24 2006-10-24 Novell, Inc. Mechanism for controlling boot decisions from a network policy directory based on client profile information
US20040210656A1 (en) * 2003-04-16 2004-10-21 Silicon Graphics, Inc. Failsafe operation of storage area network
US7287179B2 (en) * 2003-05-15 2007-10-23 International Business Machines Corporation Autonomic failover of grid-based services
US7007125B2 (en) 2003-06-24 2006-02-28 International Business Machines Corporation Pass through circuit for reduced memory latency in a multiprocessor system
US7379983B2 (en) * 2003-06-25 2008-05-27 International Business Machines Corporation Merging scalable nodes into single-partition merged system using service processors of nodes
US7644153B2 (en) * 2003-07-31 2010-01-05 Hewlett-Packard Development Company, L.P. Resource allocation management in interactive grid computing systems
WO2005036806A2 (en) * 2003-10-08 2005-04-21 Unisys Corporation Scalable partition memory mapping system
US7207039B2 (en) * 2003-12-24 2007-04-17 Intel Corporation Secure booting and provisioning
US7685597B1 (en) * 2004-02-20 2010-03-23 Sun Microsystems, Inc. System and method for management of characterized resources
US8484348B2 (en) * 2004-03-05 2013-07-09 Rockstar Consortium Us Lp Method and apparatus for facilitating fulfillment of web-service requests on a communication network
US20050256942A1 (en) 2004-03-24 2005-11-17 Mccardle William M Cluster management system and method
US8335909B2 (en) * 2004-04-15 2012-12-18 Raytheon Company Coupling processors to each other for high performance computing (HPC)
US20050235055A1 (en) * 2004-04-15 2005-10-20 Raytheon Company Graphical user interface for managing HPC clusters
US8190714B2 (en) 2004-04-15 2012-05-29 Raytheon Company System and method for computer cluster virtualization using dynamic boot images and virtual disk
US9178784B2 (en) 2004-04-15 2015-11-03 Raytheon Company System and method for cluster management based on HPC architecture
US7711977B2 (en) 2004-04-15 2010-05-04 Raytheon Company System and method for detecting and managing HPC node failure
US8336040B2 (en) * 2004-04-15 2012-12-18 Raytheon Company System and method for topology-aware job scheduling and backfilling in an HPC environment
US8244882B2 (en) * 2004-11-17 2012-08-14 Raytheon Company On-demand instantiation in a high-performance computing (HPC) system
US7475274B2 (en) * 2004-11-17 2009-01-06 Raytheon Company Fault tolerance and recovery in a high-performance computing (HPC) system
US7433931B2 (en) * 2004-11-17 2008-10-07 Raytheon Company Scheduling in a high-performance computing (HPC) system
JP2007141305A (ja) 2005-11-16 2007-06-07 Hitachi Global Storage Technologies Netherlands Bv 磁気ディスク装置

Also Published As

Publication number Publication date
TW200614001A (en) 2006-05-01
KR101173712B1 (ko) 2012-08-13
MY143931A (en) 2011-07-29
ATE474265T1 (de) 2010-07-15
CN1700178A (zh) 2005-11-23
EP1594057A1 (en) 2005-11-09
DE602005022249D1 (de) 2010-08-26
KR20060134211A (ko) 2006-12-27
US20050234846A1 (en) 2005-10-20
US8190714B2 (en) 2012-05-29
WO2005106655A1 (en) 2005-11-10
HK1078957A1 (en) 2006-03-24
CN100447746C (zh) 2008-12-31
EP1594057B1 (en) 2010-07-14
CA2503773C (en) 2013-06-04
CA2503773A1 (en) 2005-10-15
IL178607A0 (en) 2007-02-11
IL178607A (en) 2011-10-31
TWI287713B (en) 2007-10-01

Similar Documents

Publication Publication Date Title
JP2005302039A (ja) 動的ブート画像と仮想ディスクとを用いてコンピュータ・クラスタを仮想化するシステム及び方法
US9086918B2 (en) Unified resource manager providing a single point of control
US9253017B2 (en) Management of a data network of a computing environment
US8918512B2 (en) Managing a workload of a plurality of virtual servers of a computing environment
US7725559B2 (en) Virtual data center that allocates and manages system resources across multiple nodes
US8984115B2 (en) Ensemble having one or more computing systems and a controller thereof
US8972538B2 (en) Integration of heterogeneous computing systems into a hybrid computing system
US20070061441A1 (en) Para-virtualized computer system with I/0 server partitions that map physical host hardware for access by guest partitions
WO2008080827A1 (en) Virtual resource templates
US7668938B1 (en) Method and system for dynamically purposing a computing device
Platform Administering Platform LSF

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070731

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20071031

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20071105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080415

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080418

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080515

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080613

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080819

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081117

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20081222

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20090227

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101012

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101019

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101112

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101117

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101210

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101215

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110531

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110603

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110630

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110705

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110729

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110901