JP2023511153A

JP2023511153A - リザベーションに基づいた高性能コンピューティングシステム及び方法

Info

Publication number: JP2023511153A
Application number: JP2022544250A
Authority: JP
Inventors: エー．メイヤー，ダグラス; ディー．ストーン，ジョン; エフ．，ザセカンドスプーナー，ダッドリー; エル．バード，ライアン; エル．マクウォーター，アムジー
Original assignee: Raytheon Co
Current assignee: Raytheon Co
Priority date: 2020-01-27
Filing date: 2020-03-18
Publication date: 2023-03-16
Anticipated expiration: 2040-03-18
Also published as: WO2021154316A1; US20210232432A1; EP4097589A1; US11593171B2; JP7463527B2

Abstract

方法は、第１プロジェクトに関連したコアコンピューティングリソース（１０４，２０４ａ～２０４ｃ，４０２ａ～４０２ｃ）へ共有コンピューティングリソース（１０６，２０６ａ～２０６ｃ，４０４）を通信可能に結合することを含む。第１プロジェクトに関連したコアコンピューティングリソースは、第１プロジェクトに関連したデータ処理動作を実行するために共有コンピューティングリソースを使用するよう構成される。方法はまた、（ｉ）共有コンピューティングリソースの電源を切り（６０６）、（ｉｉ）第１プロジェクトに関連したコアコンピューティングリソースから共有コンピューティングリソースを切り離し（６０８）、（ｉｉｉ）第２プロジェクトに関連したコアコンピューティングリソース（１０４，２０４ａ～２０４ｃ，４０２ａ～４０２ｃ）へ共有コンピューティングリソースを通信可能に結合し（６１０）、（ｉｖ）共有コンピューティングリソースの電源を入れる（６１２）ことによって、共有コンピューティングリソースを第２プロジェクトに再割り当てすることを含む。第２プロジェクトに関連したコアコンピューティングリソースは、第２プロジェクトに関連したデータ処理動作を実行するために共有コンピューティングリソースを使用するよう構成される。共有コンピューティングリソースは、第１プロジェクト及び第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている。

Description

本開示は、概して、コンピューティングシステムを対象とする。より具体的には、本開示は、リザベーションに基づいた高性能コンピューティングシステム及び方法を対象とする。

異なるパーティによって異なる時点で高性能コンピューティングシステム（例えば、高性能サーバ又はグラフィクス処理ユニット）が使用されることがしばしば必要であるか、又は望ましいことがある。例えば、高性能コンピューティングリソースが購入し作動させるにはしばしば高価であるという事実によってコンピューティングリソースの共有が余儀なくされるので、時間にわたってコンピューティングリソースの使用を共有することは、それらの費用を複数のパーティの間で分配するのに役立ち得る。また、高性能コンピューティングリソースの使用を必要とするか又は望んでいる多くのパーティは、常にコンピューティングリソースを使用する必要があるわけではないので、時間にわたってコンピューティングリソースの使用を共有することは、コンピューティングリソースの全体的な使用量を増やすのに役立ち得る。

本開示は、リザベーションに基づいた高性能コンピューティングシステム及び方法に係る。

第１実施形態では、方法は、第１プロジェクトに関連したコアコンピューティングリソースへ共有コンピューティングリソースを通信可能に結合することを含む。第１プロジェクトに関連したコアコンピューティングリソースは、第１プロジェクトに関連したデータ処理動作を実行するために共有コンピューティングリソースを使用するよう構成される。方法はまた、（ｉ）共有コンピューティングリソースの電源を切り、（ｉｉ）第１プロジェクトに関連したコアコンピューティングリソースから共有コンピューティングリソースを切り離し、（ｉｉｉ）第２プロジェクトに関連したコアコンピューティングリソースへ共有コンピューティングリソースを通信可能に結合し、（ｉｖ）共有コンピューティングリソースの電源を入れることによって、共有コンピューティングリソースを第２プロジェクトに再割り当てすることを含む。第２プロジェクトに関連したコアコンピューティングリソースは、第２プロジェクトに関連したデータ処理動作を実行するために共有コンピューティングリソースを使用するよう構成される。共有コンピューティングリソースは、第１プロジェクト及び第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている。共有コンピューティングリソース及び第１プロジェクトに関連したコアコンピューティングリソースは、集合的に、第１コンピューティングクラスタの少なくとも部分を形成する。共有コンピューティングリソース及び第２プロジェクトに関連したコアコンピューティングリソースは、集合的に、第２コンピューティングクラスタの少なくとも部分を形成する。

第２実施形態では、システムは、共有コンピューティングリソースを含む。システムはまた、第１プロジェクトに関連したデータ処理動作を実行するために共有コンピューティングリソースを使用するよう構成される、第１プロジェクトに関連したコアコンピューティングリソースを含む。システムは更に、第２プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、第２プロジェクトに関連したコアコンピューティングリソースを含む。共有コンピューティングリソースは、（ｉ）第１プロジェクトに関連したコアコンピューティングリソースへ通信可能に結合され、（ｉｉ）電源を切られ、第１プロジェクトに関連したコアコンピューティングリソースから切り離され、（ｉｉｉ）共有コンピューティングリソースを再割り当てするよう、第２プロジェクトに関連したコアコンピューティングリソースへ通信可能に結合されて電源を入れられる、よう構成される。共有コンピューティングリソースは、第１プロジェクト及び第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている。共有コンピューティングリソース及び第１プロジェクトに関連したコアコンピューティングリソースは、集合的に、第１コンピューティングクラスタの少なくとも部分を形成する。共有コンピューティングリソース及び第２プロジェクトに関連したコアコンピューティングリソースは、集合的に、第２コンピューティングクラスタの少なくとも部分を形成する。

第３実施形態では、システムは、異なるプロジェクトに関連しかつ専用であるコアコンピューティングリソースの複数のセットを含み、コアコンピューティングリソースの各セットは、関連するプロジェクトのためのデータ処理動作を実行するよう構成される。システムはまた、異なるプロジェクトのうちの１つへ選択的に割り当てられ、その割り当てられたプロジェクトのためのデータ処理動作を実行するよう夫々構成される複数の共有コンピューティングリソースを含む。各共有コンピューティングリソースは、（ｉ）プロジェクトのうちの第１プロジェクトに関連したコアコンピューティングリソースのセットへ通信可能に結合され、（ｉｉ）電源を切られ、第１プロジェクトに関連したコアコンピューティングリソースのセットから切り離され、（ｉｉｉ）その共有コンピューティングリソースを再割り当てするよう、プロジェクトのうちの第２プロジェクトに関連したコアコンピューティングリソースのセットへ通信可能に結合されて電源を入れられる、よう構成される。各共有コンピューティングリソースは、プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている。コアコンピューティングリソースの各セット及びコアコンピューティングリソースのそのセットへ通信可能に結合されている共有コンピューティングリソースは、コンピューティングクラスタを形成する。各コンピューティングクラスタは、コアコンピューティングリソースのセットへ通信可能に結合されている共有コンピューティングリソースを変えることによって再設定可能である。

他の技術的な特徴は、次の図面、明細書、及び特許請求の範囲から当業者には容易に明らかになり得る。

本開示のより完全な理解のために、これより、添付の図面と併せて、以下の説明を参照する。

本開示に係る、リザベーションに基づいた高性能コンピューティングシステムで使用されるコンピューティングクラスタの例を表す。本開示に係る、１つ以上の再設定可能なコンピューティングクラスタを含むリザベーションに基づいた高性能コンピューティングシステムの例を表す。本開示に係る、図２のリザベーションに基づいた高性能コンピューティングシステムの再設定の例を表す。本開示に係る、リザベーションに基づいた高性能コンピューティングシステムをサポートする機能アーキテクチャの例を表す。本開示に係る、リザベーションに基づいた高性能コンピューティングシステムにおけるコンピューティングノードの例を表す。本開示に係る、リザベーションに基づいた高性能コンピューティングの方法の例を表す。

後述される図１～６、及び本明細書中で本発明の原理を説明するために使用される様々な実施形態は、単成る例示であり、発明の範囲を制限するものとして決して解釈されるべきではない。当業者は、本発明の原理が、あらゆるタイプの適切に配置されたデバイス又はシステムで実装されてもよい、と理解するだろう。

上述されたように、異なるパーティによって異なる時点で高性能コンピューティングシステム（例えば、高性能サーバ又はグラフィクス処理ユニット）が使用されることがしばしば必要であるか、又は望ましいことがある。数ある理由の中でも特に、これは、複数のパーティの間で高性能コンピューティングリソースの費用を分散するのを助けるために、又は高性能コンピューティングリソースの全体的な使用量を増やすのを助けるために、行われ得る。しかし、共有された高性能コンピューティングリソース又は他のコンピューティングリソースの使用により生じる１つの問題は、データセキュリティである。つまり、政府及び民間組織は、常に彼らの機密情報を保護しようと努めており、そうすることをしばしば求められるので、コンピューティングリソースが共有される場合に問題が発生する。これは、適切な予防措置がなければ、共有コンピューティングリソースに記憶されている１つのパーティに関連したデータが、共有コンピューティングリソースを用いて他のパーティによってアクセスされる可能性があるからである。これはまた、データを処理するために使用される実際のコンピューティングノードが時間とともに変化する可能性があるクラウドコンピューティング環境でも一般的な問題である。

いくつかの場合に、１つのパーティによって使用されている共有コンピューティングリソースが他のパーティに移動されて使用され得る前にどのような手順が行われる必要があるかに関して、厳密なガイドラインが用意されている。例えば、政府機関のために働く様々な商業請負業者がコンピューティングリソースを共有することは一般的であり、異なる”ｎｅｅｄ－ｔｏ－ｋｎｏｗ”（ＮＴＫ）環境の間での分類されたシステムの移動に関してしばしばセキュリティ規則が適用される。このようなタイプの規則はまた、同じ会社の異なる部署又は他のユニットが異なる政府プロジェクトのためにコンピューティングリソースを共有する場合など、単一の組織に影響を与える場合もある。

しばしば、これらのセキュリティ規則は、ハードディスクドライブ若しくは他の不揮発性記憶デバイスの「サニタイゼーション」（sanitization）（通常、記憶されたデータを上書きにより一掃することによる）又はコンピューティングノードでのハードドライブ若しくは他の不揮発性記憶デバイスの物理的な交換を求める。サニタイゼーションレコードはまた、記憶デバイスをサニタイズするために行われる特定のステップを識別するために、通常、様々な不揮発性記憶デバイスについて作られる必要がある。更に、コンピューティングリソースを移動する許可を得ることは、しばしば、複数レベルのセキュリティ認証とともに、移動されるコンピューティングリソースを取得及び喪失するコンピューティングシステムのハードウェアインベントリへの変更を必要とする。セキュリティレビュープロセス全体は、ワークロード及び関連するプロジェクト又はデータなどの様々な要因に応じて、延長される場合がある（場合により数週間又は数ヶ月）。よって、多数の手続き要件、長い文書化、及び多段階の承認プロセスは、閉鎖区域の境界を越えた装置の再利用を妨げる可能性がある。そのような再利用は、非常に努力を要し、かつ、変化するニーズへの迅速な対応を妨げる。更に悪いことには、異なる政府期間は、共有コンピューティングリソースに関して言えば、異なる要件をしばしば有している。更には、たとえ異なるプロジェクトを単一ネットワークに統合できたとしても、監査目的で必要とされる膨大な量の生データが共有リソースに関して生成される可能性がある。

コンピューティングリソースを共有するための他のアプローチは、仮想化又は仮想ローカルエリアネットワーク（Virtual Local Area Networks，ＶＬＡＮ）の構築によるコンピューティングリソースの論理的な分離を軸に展開する。しかし、仮想化は、コンピューティングリソースの物理的な分離に関連した保護を欠いている。また、仮想化は、政府規則又は規制がコンピューティングリソースの物理的な分離を求めている場合など、いくつかのアプリケーションでの利用には適切でない場合がある（これは、分類されたデータ又は機密データの処理プロジェクトに関連したコンピューティングリソースでは一般的である。）。

これら及び他の問題の結果として、コンピューティングリソースは、コンピューティングリソースが特定のプロジェクトによって完全に利用されているかどうかにかかわらず、通常は、その特定のプロジェクトの存続期間中にその特定のプロジェクトに割り当てられ得る。また、人々及び組織は、たとえコンピューティングリソースが完全には利用されていないとしても、将来的にコンピューティングリソースが再び必要とされる場合に大幅な遅延が発生する可能性があるため、しばしば、他者による使用のためにそれらのコンピューティングリソースを解放することを躊躇する。

本開示は、リザベーションに基づいた高性能コンピューティングのための様々な技術を提供する。以下で更に詳細に記載されるように、コンピューティングシステムアーキテクチャは、少なくとも１つの情報システムをサポートする１つ以上の共有コンピューティングリソースを含み、これは、容易にサニタイズされ得、かつ、異なるプロジェクトに瞬時に再割り当てされ得る。とりわけ、コンピューティングシステムアーキテクチャは、１つ以上の共有コンピューティングリソースからハードディスクドライブ（Hard Disk Drives，ＨＤＤ）及び任意の他のユーザ書き換え可能な不揮発性記憶デバイスを削除又は除外する。いくつかの場合に、揮発性ストレージのみが、１つ以上の共有コンピューティングリソースで使用される。コンピューティングシステムアーキテクチャの他のコンポーネントは、オペレーティングシステムファイル及び他のローカルファイルのためといった、データのローカルストレージをエミュレートしながら、１つ以上の共有コンピューティングリソースとの間でデータにアクセスし記憶又は読み出すことができる高速サーバ又は他の処理デバイスを使用する。１つ以上の共有コンピューティングリソースの揮発性ストレージ内のデータは、容易にクリアされ得る。これは、様々な政府セキュリティ規則又は他のデータセキュリティ要件の順守を促進する。

いくつかの実施形態で、このようなコンピューティングシステムアーキテクチャは、複数のコンピューティングクラスタを含み、各コンピューティングクラスタは、一般的に、２つタイプのコンポーネントに分けられる。第１タイプのコンポーネントは、コンピューティングクラスタの「ブラウン」（brawn）を表し、サーバブレード、コンピューティングエンジン、及び異なるコンピューティングクラスタ間で共有可能である他のコンピューティングリソースを含む。ハードドライブ及び他のユーザ書き換え可能な不揮発性記憶デバイスは、共有コンピューティングリソースには含まれない。これらは、異なるプロジェクトの間で共有され得、かつ、必要な場合にデータに関して容易にクリアされ得るコンポーネントである。第２タイプのコンポーネントは、コンピューティングクラスタの「ブレイン」（brain）又はコアを表し、ファイルサーバ、管理サーバ、ディスクレス画像サーバ、又は他のコアコンピューティングリソースを含んでよく、これらの少なくとも一部は、共有コンピューティングリソースの使用と相互作用するか、又は共有コンピューティングリソースの使用をサポートする。これらは、個々のプロジェクトに割り当てられ得、プロジェクト間で共有されないコンポーネントであるから、これらのコンポーネントは、データをより永続的に記憶することができるハードドライブ又は他のユーザ書き換え可能な不揮発性記憶デバイスを含むことができる。コアコンピューティングリソースの少なくとも一部は、共有コンピューティングリソースへの低レイテンシ高バンド幅接続を有することができ、これらの接続は、異なるプロジェクトのコアコンピューティングリソースに共有コンピューティングリソースを割り当てるよう必要に応じて変更され得る。

しばしば、共有コンピューティングリソース及びコアコンピューティングリソースは、異なるラックに物理的に置かれ、特定の共有コンピューティングリソースは、コアコンピューティングリソースのラックへの共有コンピューティングリソースのラックの適切な結合によって、特定のプロジェクトに（一時的に）割り当てられ得る。例えば、共有コンピューティングリソースを含むラックが、特定のプロジェクトの情報システムへの割り当てのために、識別される場合に、従うべき標準化されたプロシージャは、そのラックにある共有コンピューティングリソースの電源を切り、共有コンピューティングリソースを調べて共有コンピューティングリソースが実際に電源を切られたことを確かめ（従って、不揮発性メモリしか含まれないので全てのデータが失われる）、共有コンピューティングリソースから前のプロジェクトのコアコンピューティングリソースへのネットワーク接続を切断し、共有コンピューティングリソースから新しいプロジェクトのコアコンピューティングリソースへのネットワーク接続を接続することを含むことができる。いくつかの場合に、新しいプロジェクトにおける少なくとも１つのディスクレス画像サーバは、共有コンピューティングリソースにおけるサーバ又は他のコンピューティングノードのリモートブートをサポートすることができ、新しいプロジェクトにおける管理サーバは、新しいプロジェクトのコアコンピューティングリソースによって使用されるプールに共有コンピューティングリソースを組み入れることができる。このようなプロセスは、他のアプローチと比較してよりずっと速く完了され得る。また、共有コンピューティングリソースが異なるプロジェクトによる使用のために割り当て及び再割り当てされるべき場合を識別するために、予想されるワークロードに基づく（場合により、パフォーマンスメトリクスによってサポートされる）リザベーションシステムが使用されてもよい。

このようにして、共有コンピューティングリソースは、たとえデータの共有を防ぐためにプロジェクトが厳密なセキュリティ規則を有しているとしても、異なるプロジェクトをサポートするよう必要に応じて割り当て及び再割り当てされ得る（従って、ＮＴＫ環境での使用に適している）。分類された、機密の、又は他のプロジェクトで使用される共有コンピューティングリソースは、例えば数時間内といったように、よりずっと速く移動され得る。とりわけ、これは、新しい若しくは短期のプロジェクトへの、又は重要だが一時的な「急な」ニーズへの共有コンピューティングリソースの即時のかつ容易な割り当て及び再割り当てを可能にする。また、これは、ハードドライブを共有コンピューティングリソースに出し入れする必要なしに達成され得、共有コンピューティングリソースがそれら自体の情報システムを含み得るということで、共有コンピューティングリソースを使用する各プロジェクトのハードウェアインベントリを変更する必要がなくなる。更に、これは、仮想化（通常は、性能低下に付随し、有意な監査要件を有している）の使用を必要とせずに、かつ、基礎をなすシステムデータ処理動作の変更を必要とせずに（ローカルデータ記憶のエミュレーションが提供されるため）、達成され得る。更に、「テナンシー」（tenancy）（共有可能であることを意味する）に利用可能な共有コンピューティングリソースのベースラインは、専用の情報システムの部分として追跡され得、共有コンピューティングリソースが必要に応じて監視、解放、及び再請求されることを可能にする。更に、このアプローチは、例えば、ワークステーションレベルで又はサーバレベルで（又はそれら両方のレベル）といったように、コンピューティングシステム内の様々なレベルで使用され得る。これは、例えば、ディスクレス動作が、分類されたデスクトップ及びコンピューティングサーバのようなコンピューティングノードを含むシステムをサポートするために使用される場合など、様々な状況で有用であり得る。

図１は、本開示に係るリザベーションに基づいた高性能コンピューティングシステムで使用される例示的なコンピューティングクラスタ１００を表す。図１に示されるように、コンピューティングクラスタ１００は、多数のラック１０２に収容されている様々なコンピューティングリソースを含む。各ラック１０２は、如何なる適切なサイズ、形状、及び寸法も有することができ、各ラック１０２は、コンピューティングリソースをいくつでも保持するよう構成され得る。また、各ラック１０２は、ラック１０２内のコンピューティングリソースへ電力を分配するために使用され得る少なくとも１つの電力分配ユニットを含んでもよい。各電力分配ユニットは、１５ｋＷから２４ｋＷの電力といった、如何なる適切な量の電力も供給するよう構成されてよい。いくつかの実施形態で、各ラック１０２は、複数の余剰の電力分配ユニットを含んでもよい。なお、コンピューティングリソースは、如何なる適切な様態でも収容及び給電されてよいことに留意されたい。

コンピューティングクラスタ１００は、コアコンピューティングリソース１０４及び共有コンピューティングリソース１０６に分けられる。コアコンピューティングリソース１０４は、一般的に、特定のプロジェクトに割り当てられ、プロジェクト間で（少なくとも容易には）共有されないコンピューティングノードを表す。結果として、コアコンピューティングリソース１０４は、プロジェクト関連データを永続的に記憶するために使用されるハードディスクドライブ又は他のユーザ書き換え可能な不揮発性記憶デバイスを含む。対照的に、共有コンピューティングリソース１０６は、一般的に、異なる時点で異なるプロジェクトに割り当てられ得るコンピューティングリソースを表す。結果として、共有コンピューティングリソース１０６には、ハードディスクドライブ及び他のユーザ書き換え可能な不揮発性記憶デバイスがない。いくつかの実施形態で、共有コンピューティングリソース１０６は、プロジェクト関連データを記憶するために使用される揮発性記憶デバイスしか含まなくてよい。この分割によれば、共有コンピューティングリソース１０６は、割り当てられたプロジェクトのためのデータ処理計算のかなりの部分又は全部を実行するために使用されてよく、コアコンピューティングリソース１０４は、共有コンピューティングリソース１０６の動作を支援するようインテリジェンス及び制御を提供するために、かつ、関連するプロジェクトのためのデータ保持能力を提供するために使用されてよい。

コアコンピューティングリソース１０４及び共有コンピューティングリソース１０６で使用されるコンピューティングノードの具体的なタイプは、アプリケーションに基づいて多種多様であることができる。以下は、コアコンピューティングリソース１０４及び共有コンピューティングリソース１０６で使用され得るコンピューティングノードのタイプの例を表す。しかし、他の又は更なるタイプのコンピューティングノードが、コアコンピューティングリソース１０４で及び共有コンピューティングリソース１０６で使用されてもよい。

コアコンピューティングリソース１０４は、１つ以上の管理サーバ１０８ａ～１０８ｂを含み得る。管理サーバ１０８ａ～１０８ｂは、コアコンピューティングリソース１０４及びコンピューティングクラスタ１００全体の動作を管理するのを助ける様々な機能を提供するよう構成される。例えば、管理サーバ１０８ａ～１０８ｂは、エンジニア又は他の者によってサブミットされた処理ジョブを受け取って、処理ジョブをバッチキューイングシステムへ供給することができる処理ジョブスケジューラを実行又は別なふうに提供し得る。バッチキューイングシステムは、実行のために特定のコンピューティングリソース（例えば、共有コンピューティングリソース１０６）へ処理ジョブを割り当てる。バッチキューイングシステムは、如何なる適切な様態でも、例えば、ユーザによって定義された要件に基づいて、処理ジョブをコンピューティングリソースに割り当ててよい。とりわけ、これは、深夜まで開始せず、人が朝に仕事場に着く前に完了し得る処理ジョブを含む、ジョブの「２４時間体制」（around the clock）処理を可能にする。管理サーバ１０８ａ～１０８ｂはまた、様々なコアコンピューティングリソース１０４及び共有コンピューティングリソース１０６のためのメトリクス監視も実行又は別なふうに提供し得る。これは、管理サーバ１０８ａ～１０８ｂ（及び管理サーバ１０８ａ～１０８ｂと相互作用するエンジニア又は他の者）が時間にわたってコンピューティングリソース１０４及び１０６のパフォーマンスを監視することを可能にする。

管理サーバ１０８ａ～１０８ｂは、「ディスクレス」（diskless）コンピューティングノードのためのブートサービスを更に提供し得る。ディスクレスコンピューティングノードは、一般的に、必要とされるブート情報が管理サーバ１０８ａ～１０８ｂで保持されているコンピューティングデバイスを表す。これは、例えば、ディスクレスコンピューティングノードが、ブート情報のための不揮発性ストレージがない共有コンピューティングリソース１０６に相当する場合に、起こり得る。各ディスクレスコンピューティングノードのために管理サーバ１０８ａ～１０８ｂで保持されているブート情報は、システムアドレス、オペレーティングシステムの共有された読み出し専用のコピー、及びディスクレスコンピューティングノードに必要な一意のファイル（例えば、ログ及び設定ファイル）などの情報を含み得る。各ディスクレスコンピューティングノードは、管理サーバ１０８ａ～１０８ｂと相互作用することによって、自動的にアドレスを要求して、完全動作状態にブートし得る。これは、ディスクレスコンピューティングノードでのローカルハードドライブの必要性を取り除くことができる。

この例では、コアコンピューティングリソース１０４で使用される複数の管理サーバ１０８ａ～１０８ｂがある。より具体的には、２つの管理サーバ１０８ａ～１０８ｂがこの例では使用されている。複数の管理サーバ１０８ａ～１０８ｂの存在は、第１管理サーバ１０８ａ～１０８ｂが一次モードで作動することを可能にし得る一方で、第２管理サーバ１０８ｂ～１０８ａは、バックアップ又は二次モードで作動して、第１管理サーバが機能しなくなるか又は何らかの他の不具合を経験する場合に主たる役割を引き継ぐよう準備され得る。当然、単一の管理サーバが使用されてもよく、あるいは、複数の管理サーバは、如何なる他の適切な様態でも作動してよい。

コアコンピューティングリソース１０４はまた、１つ以上のスクラッチサーバ１１０ａ～１１０ｂ、１１２を含んでもよい。各スクラッチサーバ１１０ａ～１１０ｂ、１１２は、多数の不揮発性記憶デバイス（例えば、ハードディスクドライブ又はソリッドステートドライブ）を含むファイルサーバを表し、各ファイルサーバは、通常は、高い信頼性を有しながら大規模である。スクラッチサーバ１１０ａ～１１０ｂ、１１２はまた、通常は、高速ネットワーク接続を用いて作動して、スクラッチサーバ１１０ａ～１１０ｂ、１１２からのデータの高速な出し入れを可能にする。とりわけ、スクラッチサーバ１１０ａ～１１０ｂ、１１２は、共有コンピューティングリソース１０６によって実行されるコンピューティング動作により使用され、生成され、収集され、又はそれと別なふうに関連するデータを記憶しかつその読み出しを助けるために使用され得る。具体例として、スクラッチサーバ１１０ａ～１１０ｂ、１１２は、共有コンピューティングリソース１０６によって使用されるシミュレーション入力ファイル及び共有コンピューティングリソース１０６によって生成されたシミュレーション出力ファイルを記憶しかつそれらの読み出しを助けるために使用され得る。

この例では、スクラッチサーバ１１０ａ～１１０ｂ、１１２は、ｗｒｉｔｅ－ｈｅａｖｙ（ＷＨ）スクラッチサーバ１１０ａ～１１０ｂ及びｒｅａｄ－ｈｅａｖｙ（ＲＨ）スクラッチサーバ１１２を含む。その名の通り、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂは、より頻繁に書き込まれるデータを記憶するために使用され、一方、ｒｅａｄ－ｈｅａｖｙスクラッチサーバ１１２は、より頻繁に読み出されるデータを記憶するために使用される。よって、例えば、ｒｅａｄ－ｈｅａｖｙスクラッチサーバ１１２は、処理動作を実行するために共有コンピューティングリソース１０６によって繰り返し読み出されて使用される共通データのような、めったに変化しないデータを記憶し得る。このタイプのデータは、データがアーカイブ内にあり、ｒｅａｄ－ｈｅａｖｙスクラッチサーバ１１２が機能しなくなる場合に容易に置換され得る場合など、ほとんど又は全くバックアップを必要としない可能性がある。対照的に、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂは、処理動作の実行中に共有コンピューティングリソース１０６によって生成されるデータのような、より頻繁に変化するデータを記憶し得る。スクラッチサーバ間のこのタイプのデータ分離は、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂにかかる負荷を軽減するのに役立ち得る。２つのｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂ及び１つのｒｅａｄ－ｈｅａｖｙスクラッチサーバ１１２が図１には示されているが、これは単なる例示であることに留意されたい。また、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂ及びｒｅａｄ－ｈｅａｖｙスクラッチサーバ１１２でのデータの分離は不要であり、１つ以上のスクラッチサーバが全てのデータのために使用されてもよいことにも留意されたい。更に、複数のスクラッチサーバは、如何なる適切な様態でも、例えば、独立して、又は冗長的な構成で、使用されてもよいことに留意されたい。

コアコンピューティングリソース１０４は、少なくとも１つのセッションサーバ１１４を更に含んでもよい。各セッションサーバ１１４は、エンジニア又は他の者のリモートログインをサポートするコンピューティングノードを表す。各セッションサーバ１１４はまた、スクラッチサーバ１１０ａ～１１０ｂ、１１２の少なくとも一部への高速なアクセスも支援することができる。各セッションサーバ１１４は、作業者が処理ジョブの実行をセットアップ、サブミット、及び監視すること並びに生成されたデータを用いて後処理動作（例えば、データ削減及びレビュー）に従事することを可能にし得る。いくつかの場合に、セッションサーバ１１４は、複数の同時のユーザをサポートするよう構成されたワークステーション又は他のコンピューティングノードに相当し得る。セッションサーバ１１４は、大量のメモリを含み、高い処理ワークロードをサポートし、スクラッチサーバ１１０ａ～１１０ｂ、１１２への極めて高速なアクセスを提供し得る。

いくつかのアプリケーションで、コンピューティングクラスタ１００は、２４時間体制で高い負荷の下で作動することを期待される場合があり、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂは、同様にアクティブであり得る。そのようなものとして、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂは、他のサーバの従来のアイドル時間を有さない可能性があるので、ｗｒｉｔｅ－ｈｅａｖｙスクラッチサーバ１１０ａ～１１０ｂは、災害復旧バックアップ用に構成されない可能性がある（サーバ１１０ａ～１１０ｂの速度が低下したり、サーバ１１０ａ～１１０ｂの通常のアクティビティによって妨げられたりするため）。そのような状況では、重大なシステム障害の発生時にデータが失われる危険性がある。よって、エンジニア又は他の者は、セッションサーバ１１４を介してスクラッチサーバ１１０ａ～１１０ｂで処理中のジョブデータをレビューし、データを後処理し、結果をより永続的な記憶デバイス（ここでは図示せず）にコピーすることができる。

コアコンピューティングリソース１０４はまた、少なくとも１つの仮想デスクトップインフラストラクチャ（Virtual Desktop Infrastructure，ＶＤＩ）サーバ１１６を含んでもよい。ＶＤＩサーバ１１６は、コンピューティングクラスタ１００に関連したユーザのワークステーションで使用されるデスクトップ環境などの、仮想化されたデスクトップ環境をホストすることができる。いくつかの実施形態で、ＶＤＩサーバ１１６は、Ｗｉｎｄｏｗｓ（登録商標）及びＬｉｎｕｘ（登録商標）デスクトップ環境などの、様々なタイプの仮想化デスクトップ環境をホストすることができる。仮想化の使用を通じて、従来のセッションサーバで利用されるだろうより大きい大域的メモリ空間及び複数の処理コアへのアクセスなしで、複数のユーザセッションが分離され得る。

コアコンピューティングリソース１０４は、任意に、１つ以上の光ディスクからデータを読み出すよう（また、場合により、１つ以上の光ディスクにデータを書き込むよう）構成されたドライブを表す少なくとも１つの光学ドライブ１１８を含んでもよい。コアコンピューティングリソース１０４はまた、任意に、１つ以上の作業コンピューティングノード１２０を含んでもよい。作業コンピューティングノード１２０は、共有コンピューティングリソース１０６で使用される同じタイプのコンピューティングノードに相当し得る。よって、作業コンピューティングノード１２０には、ハードディスクドライブ及び任意の他のユーザ書き換え可能な不揮発性記憶デバイスがなくてもよい。いくつかの実施形態で、作業コンピューティングノード１２０は、揮発性記憶デバイスしか含まなくてもよい。作業コンピューティングノード１２０は、プロジェクトによって必要とされるデータ処理動作を実行するために使用されてよく、作業コンピューティングノード１２０は、上述されたように、管理サーバ１０８ａ～１０８ｂを用いてブートされ得る。いくつかの場合に、作業コンピューティングノード１２０は、１つ以上のプロセッサ及び適切な量の揮発性メモリを夫々含むサーバブレードに相当し得る。各作業コンピューティングノード１２０は、作業コンピューティングノード１２０のリモートシステム管理を可能にするインテリジェントプラットフォーム管理インターフェース（Intelligent Platform Management Interface，ＩＰＭＩ）又は他の適切なインターフェースを含むか又はそれをサポートし得る。具体例として、ＩＰＭＩは、作業コンピューティングノード１２０のためのオペレーティングシステムの画像をマウントするために使用されてよく、画像は、管理サーバ１０８ａ～１０８ｂによって供給される。他の場合には、作業コンピューティングノード１２０は、特殊な画像関連データ処理動作を提供するよう設計されたグラフィクス処理ユニットに相当し得る。

コアコンピューティングリソース１０４での作業コンピューティングノード１２０の存在は、コアコンピューティングリソース１０４へ結合されている共有コンピューティングリソース１０６があるかどうかにかかわらず、何らかのデータ処理機能が提供されることを可能にする。しばしば、作業コンピューティングノード１２０は、コアコンピューティングリソース１０４を含むラック１０２が空いた又は利用可能な空間を有する場合に、コアコンピューティングリソース１０４で使用され得る。しかし、作業コンピューティングノード１２０は、例えば、作業コンピューティングノード１２０の機能が不要である場合、又はコアコンピューティングリソース１０４を保持しているラックに利用可能な空間がない場合など、コアコンピューティングリソース１０４から省略される場合があることに留意されたい。

更に、コアコンピューティングリソース１０４は、１つ以上のネットワーキングスイッチ１２２ａ～１２２ｂを含んでもよい。ネットワーキングスイッチ１２２ａ～１２２ｂは、コアコンピューティングリソース１０４を互いに及び（もしあれば）共有コンピューティングリソース１０６へ通信可能に結合するために使用され得る。この例では、コアコンピューティングリソース１０４により使用される２つのネットワーキングスイッチ１２２ａ～１２２ｂが存在する。第１ネットワーキングスイッチ１２２ａは、多数のＥｔｈｅｒｎｅｔ（登録商標）ポートを含んでよく、これらのポートは、Ｅｔｈｅｒｎｅｔ接続を用いて様々なコンポーネント１０８ａ～１０８ｂ、１１０ａ～１１０ｂ、１１２、１１４、１１６、１１８、１２０へ結合され得る。第１ネットワーキングスイッチ１２２ａはまた、いくつかの光ポートを含んでもよく、これらのポートは、少なくとも１つの光ファイバ接続を用いて第２ネットワーキングスイッチ１２２ｂへ結合され得る。第２ネットワーキングスイッチ１２２ｂは、第１ネットワーキングスイッチ１２２ａへ及び共有コンピューティングリソース１０６へ光ファイバ接続を用いて結合され得る多数の光ポートを含んでよい。いくつかの場合に、少なくとも、第２ネットワーキングスイッチ１２２ｂと共有コンピューティングリソース１０６との間の接続は、冗長的な光ファイバ接続又は他の冗長接続を用いて形成され得ることに留意されたい。第１ネットワーキングスイッチ１２２ａと様々なコンポーネント１０８ａ～１０８ｂ、１１０ａ～１１０ｂ、１１２、１１４、１１６、１１８、１２０との間の接続、及びネットワーキングスイッチ１２２ａ～１２２ｂ間の接続は、冗長接続を用いて形成されてもされなくてもよい。

ネットワーキングスイッチ１２２ａ～１２２ｂの数及びタイプは、スイッチに結合されるノードの数及び使用される接続のタイプなどの多数の要因に基づいて様々であることができることに留意されたい。また、光接続及びＥｔｈｅｒｎｅｔ接続の使用は、単なる例示のためであって、如何なる適切な接続も、コアコンピューティングリソース１０４のノードに伴って行われてもよいことに留意されたい。

共有コンピューティングリソース１０６を含む各ラック１０２は、１つ以上のネットワーキングスイッチ１２４ａ～１２４ｂを含んでよく、ネットワーキングスイッチ１２４ａ～１２４ｂは、ラック１０２内の共有コンピューティングリソース１０６をコアコンピューティングリソース１０４へ（及び場合により互いに）通信可能に結合するために使用され得る。この例では、共有コンピューティングリソース１０６の各ラック１０２で使用される２つのネットワーキングスイッチ１２４ａ～１２４ｂが存在する。各ネットワーキングスイッチ１２４ａ～１２４ｂは、多数のＥｔｈｅｒｎｅｔポートを含んでよく、これらのポートは、Ｅｔｈｅｒｎｅｔ接続を用いてラック１０２内の共有コンピューティングリソース１０６へ結合され得る。各ネットワーキングスイッチ１２４ａ～１２４ｂはまた、いくつかの光ポートを含んでもよく、これらのポートは、光ファイバ接続を用いてコアコンピューティングリソース１０４へ結合され得る。いくつかの場合に、ネットワーキングスイッチ１２４ａ～１２４ｂは冗長ペアとして構成され、それにより、ネットワーキングスイッチ１２４ａ～１２４ｂの１つ又は光ファイバ接続の１つが機能しなくなるか又は何らかの他の不具合を経験する場合に、コアコンピューティングリソース１０４との接続は失われない。先と同じく、ここでの光接続及びＥｔｈｅｒｎｅｔ接続の使用は、単なる例示のためであって、如何なる適切な接続も、共有コンピューティングリソース１０６のノードに伴って行われてもよいことに留意されたい。

共有コンピューティングリソース１０６を含む各ラック１０２はまた、異なるプロジェクトに関連したコアコンピューティングリソース１０４の異なるセット間で共有可能であるコンピューティングノードも含む。この例では、共有コンピューティングリソース１０６を含むラック１０２の全てが、同じタイプのコンピューティングノード、つまり、作業コンピューティングノード１２６を有する。作業コンピューティングノード１２６には、ハードディスクドライブ及び任意の他のユーザ書き換え可能な不揮発性記憶デバイスがなくてもよい。いくつかの場合に、作業コンピューティングノード１２６は、不揮発性記憶デバイスしか含まなくてもよい。作業コンピューティングノード１２６は、プロジェクトによって必要とされるデータ処理動作を実行するために使用されてよく、作業コンピューティングノード１２６は、上述されたように、管理サーバ１０８ａ～１０８ｂを用いてブートされ得る。いくつかの場合に、作業コンピューティングノード１２６は、１つ以上のプロセッサ及び適切な量の揮発性メモリを夫々含むサーバブレードに相当し得る。各作業コンピューティングノード１２６は、作業コンピューティングノード１２６のリモートシステム管理を可能にするＩＰＭＩ又は他の適切なインターフェースを含み得る。他の場合には、作業コンピューティングノード１２６は、特殊な画像関連データ処理動作を提供するよう設計されたグラフィクス処理ユニットに相当し得る。作業コンピューティングノード１２６の数は、必要に応じて又は望まれるように様々であることができることに留意されたい。

この例では、様々なケーブル１２８が、コアコンピューティングリソース１０４と共有コンピューティングリソース１０６との間の接続を形成するために使用される。例えば、ケーブル１２８は、コアコンピューティングリソース１０４と共有コンピューティングリソース１０６との間の光ファイバ接続又は他のタイプの高速接続を含んでよい。上述されたように、コアコンピューティングリソース１０４を含むラック１０２と共有コンピューティングリソース１０６を含むラック１０２との間に冗長なケーブル１２８はあってもなくてもよい。

図１から分かるように、コアコンピューティングリソース１０４は、共有コンピューティングリソース１０６へ容易に接続され、また、それから容易に切り離され得る。例えば、共有コンピューティングリソース１０６を含むラック１０２が、現在、異なるプロジェクトのためのコアコンピューティングリソースを含むラック（図１に図示せず）へ結合されている、と仮定する。共有コンピューティングリソース１０６を含むラック１０２は、電源を切られ得る。そして、共有コンピューティングリソース１０６がもはや動作電力を受け取っていないことを確かめるために、検査が行われ得る。共有コンピューティングリソース１０６に如何なるタイプのユーザ書き換え可能な不揮発性ストレージもない場合（例えば、共有コンピューティングリソース１０６がランダムアクセスメモリのような揮発性メモリしか含まない場合）に、このことは、共有コンピューティングリソース１０６内の全データを失わせる。共有コンピューティングリソース１０６を含むラック１０２は、異なるプロジェクトのためのコアコンピューティングリソースを含むラックから切り離され得る。そして、１つ以上のケーブル１２８が、共有コンピューティングリソース１０６を含むラック１０２を、図１におけるコアコンピューティングリソース１０４を含むラック１０２へ接続するために使用され得る。共有コンピューティングリソース１０６は、電源を入れ直され得る。それから、共有コンピューティングリソース１０６は、新たに割り当てられたプロジェクトのためのコアコンピューティングリソース１０４による使用のために利用可能になる。

このアプローチは、プロジェクト間のデータセキュリティを依然として維持しながら、共有コンピューティングリソース１０６が、先行アプローチと比較して、よりずっと速く割り当て及び再割り当てされることを可能にする。更に、このアプローチは、多数のハードドライブ又は他の不揮発性記憶デバイスを繰り返しサニタイズする必要性を回避する。例えば、ここでの共有コンピューティングリソース１０６が、単一のハードドライブを夫々備えた１２８個の作業コンピューティングノード１２６を含む場合に、共有コンピューティングリソース１０６を１つのプロジェクトから他へ移すことは、１２８個のハードドライブのための適切なサニタイゼーションレコードの生成とともに、これらのハードドライブをワイピング又は置換することを必要とする。作業コンピューティングノード１２６から不揮発性メモリを排除又は省略し、作業コンピューティングノード１２６を使用するようコアコンピューティングリソース１０４を構成することによって、このアプローチは、共有コンピューティングリソース１０６内のハードドライブをワイピング又は置換する必要性を除くことができる。

図１は、リザベーションに基づいた高性能コンピューティングシステムで使用されるコンピューティングクラスタ１００の一例を表すが、様々な変更が図１に対して行われてよい。例えば、コアコンピューティングリソース１０４及び共有コンピューティングリソース１０６の夫々は、ラック１０２をいくつでも占有してよい。また、コアコンピューティングリソース１０４及び共有コンピューティングリソース１０６を形成する実際のコンピューティングノードは、必要に応じて又は望まれるように様々であってよく、上記のコンピューティングノードのタイプ以外の又はそれらに追加したコンピューティングノードが、ここで使用されてもよい。具体例として、コアコンピューティングリソース１０４は、内蔵キーボード、ビデオディスプレイ、及びマウスを含む「フリップＫＶＭ」モジュールを含んでもよく、ＫＶＭモジュールは、ローカルメンテナンスアクティビティをサポートするようコアコンピューティングリソース１０４内の如何なるノードへも接続され得る。

図２は、本開示に係る、１つ以上の再設定可能なコンピューティングクラスタを含む例示的なリザベーションに基づいた高性能コンピューティングシステム２００を表す。図２に示されるように、コンピューティングシステム２００は、多数のラック２０２に収容されている様々なコンピューティングリソースを含む。先と同じく、各ラック２０２は、如何なる適切なサイズ、形状、及び寸法も有することができ、各ラック２０２は、コンピューティングリソースをいくつでも保持するよう構成され得る。また、各ラック２０２は、ラック２０２内のコンピューティングリソースへ電力を分配するために使用され得る少なくとも１つの電力分配ユニットを含んでよい。各電力分配ユニットは、如何なる適切な量の電力も供給するよう構成されてよく、各ラック２０２は、複数の冗長的な電力分配ユニットを含んでよい。しかし、コンピューティングリソースは、如何なる適切な様態でも収容及び給電されてよいことに留意されたい。

この例では、コアコンピューティングリソースの３つのセット２０４ａ～２０４ｃと、共有コンピューティングリソースの３つのセット２０６ａ～２０６ｃが存在する。コアコンピューティングリソースの異なるセット２０４ａ～２０４ｃは、一般的に、特定のプロジェクトに割り当てられ、プロジェクト間で共有されないコンピューティングノードを表す。よって、例えば、コアコンピューティングリソース２０４ａは、第１プロジェクトと関連付けられ得、コアコンピューティングリソース２０４ｂは、第２プロジェクトと関連付けられ得、コアコンピューティングリソース２０４ｃは、第３プロジェクトと関連付けられ得る。政府セキュリティ規則又は他の要件に従うために、コアコンピューティングリソース２０４ａ～２０４ｃの間に接続はなくてもよい。また、コアコンピューティングリソース２０４ａ～２０４ｃは空隙をあけられてよい。つまり、コアコンピューティングリソース２０４ａ～２０４ｃは、如何なる安全でないネットワーク（例えば、インターネット）へも接続を有さない。

コアコンピューティングリソースの各セット２０４ａ～２０４ｃは、特定のプロジェクトに割り当てられている如何なる適切なコンピューティングノードも含む。この例では、コアコンピューティングリソースの各セット２０４ａ～２０４ｃは、一対のラック２０２に収容されている。コアコンピューティングリソースの各セット２０４ａ～２０４ｃにおける１つのラック２０２は、コアコンピューティングリソース１０４に関して上述されたコンピューティングノードの一部又は全部を含んでよく、コアコンピューティングリソースの各セット２０４ａ～２０４ｃにおける他のラック２０２は、特定のプロジェクトに専用の追加のコンピューティングノード（例えば、追加ノード１２０）を含んでよい。しかし、ラック２０２内のコンピューティングノードの如何なる適切な配置も使用されてよいことに留意されたい。

コアコンピューティングリソースの異なるセット２０４ａ～２０４ｃは、関連するプロジェクトのニーズに応じて、異なる数及びタイプのコンピューティングノードを有してよい。例えば、コンピューティングリソースの１つのセット２０４ａは、多数のサーバコンピューティングノードを含んでよく、コアコンピューティングリソースの他のセット２０４ｂは、より少ないサーバコンピューティングノードと、複数のグラフィクス処理ユニットとを含んでよく、コアコンピューティングリソースの更なる他のセット２０４ｃは、多数のグラフィクス処理ユニットを含んでよい。コアコンピューティングリソースの各セット２０４ａ～２０４ｃは、通常は、１つ以上の管理サーバ、１つ以上のスクラッチサーバ、１つ以上のセッションサーバ、及び場合により上記の他のコンポーネントを含んでよい（なお、これらのコンポーネントのいくつかは、特定の実施では省略されてもよい）。

同様に、共有コンピューティングリソースの各セット２０６ａ～２０６ｃは、複数のプロジェクトの間で共有され得る如何なる適切なコンピューティングノードも含む。この具体例で、共有コンピューティングリソースの各セット２０６ａ～２０６ｃは３つのラック２０２に収容されている。なお、ラック２０２の数は、必要に応じて又は望まれるように様々であることができる。共有コンピューティングリソースの異なるセット２０６ａ～２０６ｃは、複数のプロジェクトの間で共有され得る異なるタイプのコンピューティングノードを含んでよい。例えば、共有コンピューティングリソースの１つのセット２０６ａは、多数のサーバコンピューティングノードを含んでよく、共有コンピューティングリソースの他のセット２０６ｂは、より少ないサーバコンピューティングノードと、複数のグラフィクス処理ユニットとを含んでよく、共有コンピューティングリソースの更なる他のセット２０６ｃは、多数のグラフィクス処理ユニットを含んでよい。

様々なケーブル２０８が、コアコンピューティングリソース２０４ａ～２０４ｃを所望の共有コンピューティングリソース２０６ａ～２０６ｃへ結合するために使用される。ケーブル２０８は、例えば、コンピューティングリソース間の光ファイバ接続又は他の適切な高速データ接続に相当し得る。先と同じく、コアコンピューティングリソース２０４ａ～２０４ｃを含むラック２０２と共有コンピューティングリソース２０６ａ～２０６ｃを含むラック２０２との間に冗長なケーブル２０８があってもなくてもよい。

図２から分かるように、異なるプロジェクトは、異なるコンピューティングニーズを有するので、異なる共有コンピューティングリソースへ結合され得る。例えば、ここでのコアコンピューティングリソースのセット２０４ａは、共有コンピューティングリソースのセット２０６ａにおける２つのラック２０２へ、及び共有コンピューティングリソースのセット２０６ｂにおける単一のラック２０２へ結合されている。これは、多数のサーバコンピューティングノード及び限られた数のグラフィクス処理ユニットを備えたコアコンピューティングリソースのセット２０４ａをもたらす。ここでのコアコンピューティングリソースのセット２０４ｂは、共有コンピューティングリソースのセット２０６ｂにおける２つのラック２０２へ結合されている。これは、コアコンピューティングリソースのセット２０４ａと比べてサーバコンピューティングノードは少ないがグラフィクス処理ユニットは多いコアコンピューティングリソースのセット２０４ｂをもたらす。ここでのコアコンピューティングリソースのセット２０４ｃは、共有コンピューティングリソースのセット２０６ｃにおける２つのラック２０２へ結合されている。これは、コアコンピューティングリソースのセット２０４ａ～２０４ｂと比較してサーバコンピューティングノードは更に少ないがグラフィクス処理ユニットは更に多いコアコンピューティングリソースのセット２０４ｃをもたらす。

図３は、本開示に係る、図２のリザベーションに基づいた高性能コンピューティングシステム２００の再構成の例を表す。この例では、コアコンピューティングリソース２０４ｂに関連したプロジェクトが、コアコンピューティングリソース２０４ａによって前に使用されていた共有コンピューティングリソース２０６ｂのラック２０２の使用を必要とする、ことが仮定される。これは、コアコンピューティングリソース２０４ｂによる一時的な必要性、又はコアコンピューティングリソース２０４ａの処理タスクの完了などの様々な理由で起こり得る。どのような理由であろうと、コアコンピューティングリソース２０４ａによって前に使用されていた共有コンピューティングリソース２０６ｂは、シャットダウンされて、検査され得る。コアコンピューティングリソース２０４ａによって前に使用されていた共有コンピューティングリソース２０６ｂは、コアコンピューティングリソース２０４ａから切り離され、コアコンピューティングリソース２０４ｂへ接続され得、それらの共有コンピューティングリソース２０６ｂは、コアコンピューティングリソース２０４ｂによる使用のために電源を入れられ得る。このようにして、共有コンピューティングリソースは、必要に応じて異なるプロジェクトに容易に割り当て及び再割り当てされ得る。

図２及び図３で、各コンピューティングクラスタは、コアコンピューティングリソースのセット２０４ａ～２０４ｃのうちの１つに、コアコンピューティングリソースのそのセット２０４ａ～２０４ｃへ接続されている共有コンピューティングリソース２０６ａ～２０６ｃのいずれかをプラスしたものによって、定義される。結果として、各コンピューティングクラスタは再設定可能であり、コンピューティングクラスタにより使用される共有コンピューティングリソースが変化するにつれて時間とともに変化し得る。更に、異なるプロジェクトが必要に応じて特定の共有コンピューティングリソースをリザーブすることが可能であるので、コンピューティングシステム２００は「リザベーションに基づく」（reservation-based）ことができ、リザーブされた共有コンピューティングリソースは、そのようなリザベーションに従ってコアコンピューティングリソース２０４ａ～２０４ｃの間で容易に移動され得る。いくつかの場合に、共有コンピューティングリソースのリザベーションは、時間にわたるコアコンピューティングリソース２０４ａ～２０４ｃの予想されるワークロードに基づくことができ、コアコンピューティングリソース２０４ａ～２０４ｃのパフォーマンスメトリクスによってサポートされ得る。

図２は、１つ以上の再設定可能なコンピューティングクラスタを含むリザベーションに基づいた高性能コンピューティングシステム２００の一例を表し、図３は、図２のリザベーションに基づいた高性能コンピューティングシステム２００の一例となる再構成を表すが、様々な変更が図２及び図３に対して行われてよい。例えば、コンピューティングシステム２００は、如何なる適切な数及びセットのコアコンピューティングリソースも、及び如何なる適切な数及びセットの共有コンピューティングリソースも含んでよい。また、コンピューティングシステム２００は、コアコンピューティングリソースと共有コンピューティングリソースとの間の如何なる適切な接続も含んでよい。

図４は、本開示に係る、リザベーションに基づいた高性能コンピューティングシステムをサポートする例示的な機能アーキテクチャ４００を表す。説明を簡単にするために、図４に示される機能アーキテクチャ４００は、図１のコンピューティングクラスタ１００の複数のインスタンスを含み得る図２及び図３のコンピューティングシステム２００で使用されているものとして説明され得る。しかし、図４に示される機能アーキテクチャ４００は、如何なる適切なシステムにおいても、如何なる適切なコンピューティングクラスタによっても、使用されてよい。

図４に示されるように、ここでの機能アーキテクチャ４００は、１つ以上のプロジェクト空間４０２ａ～４０２ｃ及び１つ以上の共有リソース空間４０４を含む。各プロジェクト空間４０２ａ～４０２ｃは、一般的に、特定のプロジェクトに関連した機能を表す。例えば、各プロジェクト空間４０２ａ～４０２ｃは、特定のプロジェクトのためのコアコンピューティングリソースの関連するセット２０４ａ～２０４ｃの機能を表し得る。各共有リソース空間４０４は、一般的に、共有コンピューティングリソースに関連した機能を表す。例えば、共有リソース空間４０４は、共有コンピューティングリソースの１つ以上のセット２０６ａ～２０６ｃの機能を表し得る。この例では、共有リソース空間４０４は、必要に応じて又は望まれるようにプロジェクト空間４０２ａ～４０２ｃの異なる１つによってリザーブされるか又はそれに割り当てられ得る様々なコンピューティングノード４０６によって少なくとも部分的に定義される。各プロジェクト空間４０２ａ～４０２ｃは、（等しかろうと等しくなかろうと）任意の適切な数のコンピューティングノード４０６をリザーブするか又はそれらを割り当てられてよく、各プロジェクト空間４０２ａ～４０２ｃによってリザーブされるコンピューティングノード４０６の数は、時間とともに（場合により大幅に）変化し得ることに留意されたい。

各プロジェクト空間４０２ａ～４０２ｃはローカルプロジェクト機能４０８を含む。ローカルプロジェクト機能４０８は、一般的に、プロジェクトに関連したエンジニア又は他の者へ提供されるか又はその者によって実行される機能を表す。例えば、ローカルプロジェクト機能４０８は、プロジェクトに関連したエンジニア又は他の者によって使用されるワークステーション又は他のローカルコンピュータの機能を表し得る。セッションホスト４１０は、作業者がコアコンピューティングリソースにリモートでログイン及びアクセスすることを可能にする機能を表す。例えば、セッションホスト４１０は、コアコンピューティングリソースの部分を形成するセッションサーバ１１４によって提供される機能を表し得る。

高性能コンピューティング（High-Performance Computing，ＨＰＣ）管理機能４１２は、特定のプロジェクト又はプロジェクト空間に割り当てられている共有リソース空間４０４内のいずれかのリザーブされているコンピューティングノード４０６との相互作用をサポートするために使用される。例えば、ＨＰＣ管理機能４１２は、コアコンピューティングリソースの部分を形成する管理サーバ１０８ａ～１０８ｂ及びスクラッチサーバ１１０ａ～１１０ｂ、１１２によって提供される機能を表し得る。とりわけ、ＨＰＣ管理機能４１２は、リザーブされているコンピューティングノード４０６を、関連するプロジェクト空間４０２ａ～４０２ｃ内のローカルノードとして出現させるエミュレーション又は他の機能をサポートするか、あるいは、関連するプロジェクト空間４０２ａ～４０２ｃでのリザーブされているコンピューティングノード４０６の使用を別なふうにサポートすることができる。ＨＰＣ管理機能４１２はまた、追加のリザーブされているコンピューティングノード４０６がプロジェクト空間４０２ａ～４０２ｃに割り当てられて接続される場合を検出することもでき、プロジェクト空間４０２ａ～４０２ｃでのそれらの追加のリザーブされているコンピューティングノード４０６の使用をサポートすることができる。更に、ＨＰＣ管理機能４１２は、特定のリザーブされているコンピューティングノード４０６が再割り当てされ、プロジェクト空間４０２ａ～４０２ｃから切り離される場合を検出することができ、それらの追加のリザーブされているコンピューティングノード４０６をプロジェクト空間４０２ａ～４０２ｃから除くことができる。このようにして、ＨＰＣ管理機能４１２は、プロジェクト空間４０２ａ～４０２ｃの他のコンポーネントに対する変更を必要とせずに、共有コンピューティングリソースの一時的な使用をサポートすることができる。

ＨＰＣ管理機能４１２はまた、ＨＰＣストレージ４１４へのアクセスを提供してもよく、かつ、１つ以上の専用のコンピューティングノード４１６の使用をサポートしてもよい。ＨＰＣストレージ４１４は、共有リソース空間４０４からの情報（又は共有リソース空間４０４からの情報に基づいたデータ）が記憶され得る１つ以上の記憶デバイスを表す。例えば、上述されたように、エンジニア又は他の者は、セッションサーバ１１４を介してスクラッチサーバ１１０ａ～１１０ｂで処理中のジョブデータをレビューし、データを後処理し、結果をより永続的なストレージにコピーすることができる。ここでのＨＰＣストレージ４１４は、結果又は他のデータが移動され得る少なくとも１つの記憶デバイスを表す。また、上述されたように、いくつかのコアコンピューティングリソースは、例えば、コアコンピューティングリソース１０４が１つ以上の作業コンピューティングノード１２０を含む場合など、特定の機能を実行するための専用コンピューティングリソースを含んでもよい。これらのリソースは、専用のコンピューティングノード４１６に相当し、ＨＰＣ管理機能４１２は、これらの専用のコンピューティングノード４０６へのアクセスを提供することができる。ＨＰＣ管理機能４１２はまた、専用のコンピューティングノード４０６からの情報（又は専用のコンピューティングノード４０６からの情報に基づいたデータ）をＨＰＣストレージ４１４に記憶することもできる。

図４は、リザベーションに基づいた高性能コンピューティングシステムをサポートする機能アーキテクチャ４００の一例を表すが、様々な変更が図４に対して行われてよい。例えば、機能アーキテクチャ４００は、如何なる適切な数のプロジェクト空間も、及び如何なる適切な数の共有リソース空間も含んでよい。また、異なるプロジェクト空間は、異なる機能コンポーネント及び機能コンポーネントの配置を有してよく、異なる共有リソース空間は、異なる数及びタイプの共有コンピューティングリソースを有してよい。

図５は、本開示に係る、リザベーションに基づいた高性能コンピューティングシステムにおける例示的なコンピューティングノード５００を表す。説明を簡単にするために、図５に示されるコンピューティングノード５００は、図１のコンピューティングクラスタ１００の複数のインスタンスを含み得る図２及び図３のコンピューティングシステム２００で使用されているものとして説明され得る。例えば、コンピューティングノード５００の１つ以上のインスタンスは、上記のコアコンピューティングリソース及び共有コンピューティングリソースの夫々を少なくとも部分的に実装するために使用されてよい。しかし、それらのコンポーネントの夫々は、如何なる他の適切な様態でも実装されてよい。また、図５に示されるコンピューティングノード５００は、如何なる適切なシステムにおいても、如何なる適切なコンピューティングクラスタによっても、使用されてよい。

図５に示されるように、コンピューティングノード５００は、少なくとも１つの処理デバイス５０２、少なくとも１つの記憶デバイス５０４、少なくとも１つの通信ユニット５０６、及び少なくとも１つの入出力（Ｉ／Ｏ）ユニット５０８を含むコンピューティングデバイス又はシステムを表す。処理デバイス５０２は、揮発性ストレージ５１０にロードされるか又は不揮発性ストレージ５１２から読み出され得る命令を実行してよい。処理デバイス５０２は、如何なる適切な配置でも、如何なる適切な数及びタイプのプロセッサ又は他の処理デバイスも含んでよい。処理デバイス５０２のタイプの例として、１つ以上のマイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ（Digital Signal Processors，ＤＳＰ）、特定用途向け集積回路（Application Specific Integrated Circuits，ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（Field Programmable Gate Arrays，ＦＰＧＡ）、又はディスクリート回路がある。

揮発性ストレージ５１０及び不揮発性ストレージ５１２は、情報（例えば、データ、プログラムコード、及び／又は一時的又は永続的な他の適切な情報）を記憶すること及びその読み出しを助けることが可能な如何なる構造も表す記憶デバイス５０４の例である。揮発性ストレージ５１０は、ランダムアクセスメモリ又は任意の他の適切な揮発性記憶デバイスを表し得る。不揮発性ストレージ５１２は、ハードドライブ、ソリッドステートドライブ、又は任意の他の適切な不揮発性記憶デバイスのような、データの長期記憶をサポートする１つ以上のコンポーネント又はデバイスを含んでよい。特定のコンポーネント（例えば、共有コンピューティングリソース）には不揮発性ストレージがないので、不揮発性ストレージ５１２は、任意であるものとしてここでは示されていることに留意されたい。

通信ユニット５０６は、他のシステム又はデバイスとの通信をサポートする、例えば、通信ユニット５０６は、有線又は無線ネットワークを介した通信を助けるネットワークインターフェース又は無線トランシーバを含むことができる。通信ユニット５０６は、１つ以上の電気、光、又は無線通信リンクなどの如何なる適切な物理又は無線通信リンクも通る通信をサポートしてよい。

Ｉ／Ｏユニット５０８は、データの入力及び出力を可能にする。例えば、Ｉ／Ｏユニット５０８は、キーボード、マウス、キーパッド、タッチスクリーン、又は他の適切な入力デバイスを通じたユーザ入力のための接続を提供し得る。Ｉ／Ｏユニット５０８はまた、ディスプレイ又は他の適切な出力デバイスへ出力を送ってもよい。しかし、コンピューティングノード５００が、リモートでアクセスされ得るサーバ又は他のデバイスに相当する場合など、コンピューティングノード５００がローカルＩ／Ｏを必要としない場合には、Ｉ／Ｏユニット５０８は省略されてもよいことに留意されたい。

図５は、リザベーションに基づいた高性能コンピューティングシステムにおけるコンピューティングノード５００の一例を表すが、様々な変更が図５に対して行われてよい。例えば、コンピューティング及び他のデータ処理デバイス及びシステムは、多種多様な構成で提供され、図５は、如何なる特定のコンピューティングデバイス又はシステムにも本開示を制限しない。

図６は、本開示に係る、リザベーションに基づいた高性能コンピューティングのための例示的な方法６００を表す。説明を簡単にするために、図６に示される方法６００は、図１のコンピューティングクラスタ１００の複数のインスタンスを含み得る図２及び図３のコンピューティングシステム２００の使用を伴うものとして説明され得る。しかし、図６に示される方法６００は、如何なる適切なシステムによっても、如何なる適切なコンピューティングクラスタによっても、使用されてよい。

図６に示されるように、ステップ６０２で、共有コンピューティングリソースは、第１プロジェクトのコアコンピューティングリソースととも作動する。これは、例えば、特定のプロジェクトのために共有コンピューティングリソース１０６、２０６ａ～２０６ｃにある１つ以上の作業コンピューティングノード１２０（例えば、１つ以上のサーバ又はグラフィクス処理ユニット）を作動させることを含んでよい。ここでの共有コンピューティングリソース１０６、２０６ａ～２０６ｃは、第１プロジェクトのための如何なる適切なデータ処理動作も実行してよい。ステップ６０４で、共有コンピューティングリソースが再割り当てされるべきかどうかが判定される。これは、例えば、第１プロジェクトによる共有コンピューティングリソース１０６、２０６ａ～２０６ｃのリザベーションが終了しているか、あるいは、他のプロジェクトによる共有コンピューティングリソース１０６、２０６ａ～２０６ｃのリザベーションが開始しているかどうかを判定することを含んでよい。そうでない場合には、第１プロジェクトは、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを使用し続けることができる。

共有コンピューティングリソースが再割り当てされている場合には、ステップ６０６で、共有コンピューティングリソースは電源を切られる。これは、例えば、作業者が、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを含むラック１０２、２０２の電源を切り、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを検査して、それがもはや電力を受け取っていないことを確かめることを含んでよい。共有コンピューティングリソースは、ステップ６０８で第１プロジェクトのコアコンピューティングリソースから切り離され、ステップ６１０で第２プロジェクトのコアコンピューティングリソースへ接続される。これは、例えば、作業者が、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを第１プロジェクトのコアコンピューティングリソース１０４、２０４ａ～２０４ｃから切り離し、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを第２プロジェクトのコアコンピューティングリソース１０４、２０４ａ～２０４ｃへ接続するために、適切なケーブル１２８、２０８を切り替えるか又は移動することを含んでよい。ステップ６１２で、共有コンピューティングリソースは電源を入れ直される。これは、例えば、作業者が、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを含むラック１０２、２０２の電源を入れ、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを検査して、それが電源を受け取っていることを確かめることを含んでよい。

共有コンピューティングリソースは、ステップ６１４で第２プロジェクトのコアコンピューティングリソースとともに作動し、ステップ６１６で、第２プロジェクトのデータ交換及びデータ処理動作が、共有コンピューティングリソースを用いてサポートされる。これは、例えば、第２プロジェクトのための如何なる適切なデータ処理動作も実行するために共有コンピューティングリソース１０６、２０６ａ～２０６ｃを作動させることを含んでよい。この時点で、第２プロジェクトは、共有コンピューティングリソース１０６、２０６ａ～２０６ｃが再割り当てされ（、方法６００が、再び、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを再割り当てするために繰り返され得）るまで、共有コンピューティングリソース１０６、２０６ａ～２０６ｃを使用し続けることができる。

図６は、リザベーションに基づいた高性能コンピューティングのための方法６００の一例を表すが、様々な変更が図６に対して行われてよい。例えば、連続したステップとして示されているが、図６の様々なステップは、重なり合っても、同時に行われても、異なる順序で行われても、又は何回行われてもよい。また、共有コンピューティングリソースはいくつでも、いくつのプロジェクトの間でも必要に応じて又は望まれるように割り当て及び再割り当てされてよい。

いくつかの実施形態で、本明細書で説明されている様々な機能は、コンピュータ可読プログラムコードから形成され、コンピュータ可読媒体において具現化されるコンピュータプログラムによって、実装又はサポートされる。「コンピュータ可読プログラムコード」という表現は、ソースコード、オブジェクトコード、及び実行可能コードを含む如何なるタイプのコンピュータコードも含む。「コンピュータ可読媒体」という表現は、リードオンリーメモリ（Read Only Memory，ＲＯＭ）、ランダムアクセスメモリ（Random Access Memory，ＲＡＭ）、ハードディスクドライブ（Hard Disk Drive，ＨＤＤ）、コンパクトディスク（Compact Disc，ＣＤ）、デジタルビデオディスク（Digital Video Disc，ＤＶＤ）、又は任意の他のタイプのメモリなどの、コンピュータによってアクセス可能な如何なるタイプの媒体も含む。「非一時的な」コンピュータ可読媒体は、一時的な電気又は他の信号を運ぶ有線、無線、光、又は他の通信リンクを除く。非一時的なコンピュータ可読媒体は、データが永続的に記憶され得る媒体と、書き換え可能な光ディスク又は消去可能な記憶デバイスのような、データが記憶されての地に上書きされ得る媒体とを含む。

本明細書の全体を通して使用される特定の語及び語句の定義を説明することが有利であり得る。「アプリケーション」及び「プログラム」という用語は、適切なコンピュータコード（ソースコード、オブジェクトコード、又は実行可能コードを含む）での実施のために適応された１つ以上のコンピュータプログラム、ソフトウェアコンポーネント、命令の組み、プロシージャ、関数、オブジェクト、クラス、インスタンス、関連データ、又はその部分を指す。「通信する」（communicate）という用語及びその派生語は、直接通信及び間接通信の両方を包含する。「含む」（include）及び「有する」（comprise）という用語並びにそれらの派生語は、制限なしの包含を意味する。「又は」（or）という用語は、包括的であって、「及び／又は」(and/or)を意味する。「～に関連した」（associated with）という語句及びその派生語句は、含む（include）、～に含まれる（be included within）、～と相互接続する（interconnect with）、含む（contain）、～に含まれる（be contained within）、～へ又は～と接続する（connect to又はwith）、～へ又は～と結合する（couple to又はwith）、～と通信可能である（be communicable with）、～と協働する（cooperate with）、インターリーブする（interleave）、並列する（juxtapose）、～に近接する（be proximate to）、～へ又は～と結びつけられる（be bound to又はwith）、持つ（have）、～の性質を持つ（have a property of）、～と関係を持つ（have a relationship to又はwith）、などを意味し得る。「～のうちの少なくとも１つ」（at least one of）という語句は、アイテムのリストともに使用される場合に、リストアップされているアイテムのうちの１つ以上の異なる組み合わせが使用されてもよく、また、リスト内のただ１つのアイテムしか必要とされなくてもよいことを意味する。例えば、「Ａ、Ｂ、及びＣのうちの少なくとも１つ」は、次の組み合わせ：Ａ、Ｂ、Ｃ、ＡとＢ、ＡとＣ、ＢとＣ、ＡとＢとＣのいずれかを含む。

本願の説明は、いずれかの特定の要素、ステップ、又は機能が、請求項の範囲に含まれなければならない必須又は重要な要素であることを暗示するものとして、読まれるべきではない。特許対象の範囲は、許可された請求項によってのみ定義される。更に、請求項のどれもが、「～する手段」（means for）又は「～するステップ」（step for）という厳密な語が、機能を特定する分詞句とともに、特定の請求項で明示的に使用されない限りは、添付の特許請求の範囲又は請求項のいずれに関しても、米国特許法（３５Ｕ．Ｓ．Ｃ）第１２２（ｆ）条を行使しない。請求項内の「メカニズム」、「モジュール」、「デバイス」、「ユニット」、「コンポーネント」、「要素」、「メンバー」、「装置」、「マシン」、「システム」、「プロセッサ」、又は「コントローラ」などの（しかし、これらに限られない）用語の使用は、特許請求の範囲自体の特徴によって更に変更又は強調されるように、当業者に知られている構造を指すと理解及び意図され、米国特許法第１２２（ｆ）条を行使する意図はない。

本開示は、特定の実施形態及び一般的に関連する方法について説明しており、一般的に、それらの実施形態及び方法の代替及び置換は、当業者に明らかだろう。従って、例となる実施形態の上記の説明は、本開示を定義又は制約しない。他の変更、置換、及び代替も、続く特許請求の範囲によって定義される本開示精神及び範囲から逸脱せずに、可能である。

Claims

第１プロジェクトに関連したコアコンピューティングリソースへ共有コンピューティングリソースを通信可能に結合することであり、前記第１プロジェクトに関連したコアコンピューティングリソースは、前記第１プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、ことと、
前記共有コンピューティングリソースの電源を切り、前記第１プロジェクトに関連したコアコンピューティングリソースから前記共有コンピューティングリソースを切り離し、第２プロジェクトに関連したコアコンピューティングリソースへ前記共有コンピューティングリソースを通信可能に結合し、前記共有コンピューティングリソースの電源を入れることによって、前記共有コンピューティングリソースを前記第２プロジェクトに再割り当てすることであり、前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、ことと
を有し、
前記共有コンピューティングリソースは、前記第１プロジェクト及び前記第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いており、
前記共有コンピューティングリソース及び前記第１プロジェクトに関連したコアコンピューティングリソースは、集合的に、第１コンピューティングクラスタの少なくとも部分を形成し、
前記共有コンピューティングリソース及び前記第２プロジェクトに関連したコアコンピューティングリソースは、集合的に、第２コンピューティングクラスタの少なくとも部分を形成する、
方法。
前記共有コンピューティングリソースは、前記第１プロジェクト及び前記第２プロジェクトに関係がある前記データを記憶するために使用される揮発性メモリを有し、
前記共有コンピューティングリソースの電源を切ることは、前記不揮発性メモリをクリアし、前記第１プロジェクトに関連したデータが前記第２プロジェクトに関連したコアコンピューティングリソースによってアクセスされるのを防ぐ、
請求項１に記載の方法。
前記共有コンピューティングリソースは、ディスクレスコンピューティングノードを有し、
前記第２プロジェクトに関連したコアコンピューティングリソースは、ブート情報を前記ディスクレスコンピューティングノードへ供給する少なくとも１つの管理サーバを有する、
請求項１に記載の方法。
前記第２プロジェクトに関連したコアコンピューティングリソースは、情報を前記共有コンピューティングリソースへ供給することと、処理結果を前記共有コンピューティングリソースから受け取ることと、のうちの少なくとも１つを行う少なくとも１つのスクラッチサーバを有する、
請求項１に記載の方法。
前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２コンピューティングクラスタによって実行される処理ジョブをサブミットしモニタすることと、前記少なくとも１つのスクラッチサーバにある前記処理結果にアクセスすることと、をユーザに可能にする少なくとも１つのセッションサーバを更に有する、
請求項４に記載の方法。
前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２プロジェクトに関連したコアコンピューティングリソースによって使用されるプールに前記共有コンピューティングリソースを組み入れる少なくとも１つの管理サーバを有し、
前記少なくとも１つの管理サーバは、ジョブスケジューラ及びバッチキューイングシステムを有し、
前記ジョブスケジューラは、ユーザによってサブミットされた処理ジョブを受け取り、前記処理ジョブを前記バッチキューイングシステムへ供給し、
前記バッチキューイングシステムは、実行のために前記共有コンピューティングリソースを含む特定のコンピューティングリソースへ前記処理ジョブを割り当てる、
請求項１に記載の方法。
前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている少なくとも１つの専用コンピューティングノードを有する、
請求項１に記載の方法。
前記第２プロジェクトに関連したコアコンピューティングリソースにある不揮発性ストレージに前記共有コンピューティングリソースからの処理結果を記憶することを更に有する、
請求項１に記載の方法。
前記共有コンピューティングリソースは、共有コンピューティングリソースの第１セット内の複数の共有コンピューティングリソースのうちの１つを有し、
当該方法は、前記共有コンピューティングリソースの第１セット及び共有コンピューティングリソースの少なくとも１つの更なるセットを、前記第１プロジェクトに関連したコアコンピューティングリソースと、前記第２プロジェクトに関連したコアコンピューティングリソースとへ通信可能に結合することを更に有し、
共有コンピューティングリソースの異なるセットは、異なるタイプのコンピューティングノードを有する、
請求項１に記載の方法。
前記共有コンピューティングリソースは、１つ以上のサーバ及び１つ以上のグラフィクス処理ユニットのうちの少なくとも１つを有する、
請求項１に記載の方法。
共有コンピューティングリソースと、
第１プロジェクトに関連したコアコンピューティングリソースであり、前記第１プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、前記第１プロジェクトに関連したコアコンピューティングリソースと、
第２プロジェクトに関連したコアコンピューティングリソースであり、前記第２プロジェクトに関連したデータ処理動作を実行するために前記共有コンピューティングリソースを使用するよう構成される、前記第２プロジェクトに関連したコアコンピューティングリソースと
を有し、
前記共有コンピューティングリソースは、前記第１プロジェクトに関連したコアコンピューティングリソースへ通信可能に結合され、電源を切られ、前記第１プロジェクトに関連したコアコンピューティングリソースから切り離され、そして、前記共有コンピューティングリソースを再割り当てするよう、前記第２プロジェクトに関連したコアコンピューティングリソースへ通信可能に結合されて電源を入れられる、よう構成され、
前記共有コンピューティングリソースは、前記第１プロジェクト及び前記第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いており、
前記共有コンピューティングリソース及び前記第１プロジェクトに関連したコアコンピューティングリソースは、集合的に、第１コンピューティングクラスタの少なくとも部分を形成し、
前記共有コンピューティングリソース及び前記第２プロジェクトに関連したコアコンピューティングリソースは、集合的に、第２コンピューティングクラスタの少なくとも部分を形成する、
システム。
前記共有コンピューティングリソースは、前記第１プロジェクト及び前記第２プロジェクトに関係がある前記データを記憶するために使用される揮発性メモリを有し、
前記共有コンピューティングリソースは、前記共有コンピューティングリソースの電源を切ることが、前記不揮発性メモリをクリアし、前記第１プロジェクトに関連したデータが前記第２プロジェクトに関連したコアコンピューティングリソースによってアクセスされるのを防ぐように、構成される、
請求項１１に記載のシステム。
前記共有コンピューティングリソースは、ディスクレスコンピューティングノードを有し、
前記第２プロジェクトに関連したコアコンピューティングリソースは、ブート情報を前記ディスクレスコンピューティングノードへ供給する少なくとも１つの管理サーバを有する、
請求項１１に記載のシステム。
前記第２プロジェクトに関連したコアコンピューティングリソースは、情報を前記共有コンピューティングリソースへ供給することと、処理結果を前記共有コンピューティングリソースから受け取ることと、のうちの少なくとも１つを行う少なくとも１つのスクラッチサーバを有する、
請求項１１に記載のシステム。
前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２コンピューティングクラスタによって実行される処理ジョブをサブミットしモニタすることと、前記少なくとも１つのスクラッチサーバにある前記処理結果にアクセスすることと、をユーザに可能にするよう構成される少なくとも１つのセッションサーバを更に有する、
請求項１４に記載のシステム。
前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２プロジェクトに関連したコアコンピューティングリソースによって使用されるプールに前記共有コンピューティングリソースを組み入れるよう構成される少なくとも１つの管理サーバを有し、
前記少なくとも１つの管理サーバは、ジョブスケジューラ及びバッチキューイングシステムを有し、
前記ジョブスケジューラは、ユーザによってサブミットされた処理ジョブを受け取り、前記処理ジョブを前記バッチキューイングシステムへ供給するよう構成され、
前記バッチキューイングシステムは、実行のために前記共有コンピューティングリソースを含む特定のコンピューティングリソースへ前記処理ジョブを割り当てるよう構成される、
請求項１１に記載のシステム。
前記第２プロジェクトに関連したコアコンピューティングリソースは、前記第２プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いている少なくとも１つの専用コンピューティングノードを有する、
請求項１１に記載のシステム。
前記第２プロジェクトに関連したコアコンピューティングリソースは、記共有コンピューティングリソースからの処理結果を記憶するよう構成される不揮発性ストレージを有する、
請求項１１に記載のシステム。
前記共有コンピューティングリソースは、１つ以上のサーバ及び１つ以上のグラフィクス処理ユニットのうちの少なくとも１つを有する、
請求項１１に記載のシステム。
異なるプロジェクトに関連しかつ専用であるコアコンピューティングリソースの複数のセットであり、コアコンピューティングリソースの各セットが、関連するプロジェクトのためのデータ処理動作を実行するよう構成される、前記コアコンピューティングリソースの複数のセットと、
前記異なるプロジェクトのうちの１つへ選択的に割り当てられ、該割り当てられたプロジェクトのためのデータ処理動作を実行するよう夫々構成される複数の共有コンピューティングリソースと
を有し、
各共有コンピューティングリソースは、前記プロジェクトのうちの第１プロジェクトに関連したコアコンピューティングリソースのセットへ通信可能に結合され、電源を切られ、前記第１プロジェクトに関連したコアコンピューティングリソースのセットから切り離され、そして、当該共有コンピューティングリソースを再割り当てするよう、前記プロジェクトのうちの第２プロジェクトに関連したコアコンピューティングリソースのセットへ通信可能に結合されて電源を入れられる、よう構成され、
各共有コンピューティングリソースは、前記プロジェクトに関係があるデータを記憶する不揮発性メモリを欠いており、
コアコンピューティングリソースの各セット及びコアコンピューティングリソースの当該セットへ通信可能に結合されている前記共有コンピューティングリソースは、コンピューティングクラスタを形成し、各コンピューティングクラスタは、前記コアコンピューティングリソースの当該セットへ通信可能に結合されている前記共有コンピューティングリソースを変えることによって再設定可能である、
システム。