JP2013503385A - 統合された共有リソースを有する高密度マルチノードコンピュータ - Google Patents
統合された共有リソースを有する高密度マルチノードコンピュータ Download PDFInfo
- Publication number
- JP2013503385A JP2013503385A JP2012526754A JP2012526754A JP2013503385A JP 2013503385 A JP2013503385 A JP 2013503385A JP 2012526754 A JP2012526754 A JP 2012526754A JP 2012526754 A JP2012526754 A JP 2012526754A JP 2013503385 A JP2013503385 A JP 2013503385A
- Authority
- JP
- Japan
- Prior art keywords
- nodes
- computer system
- node
- carrier board
- row
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44505—Configuring for program initiating, e.g. using registry, configuration files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/18—Packaging or power distribution
- G06F1/181—Enclosures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/18—Packaging or power distribution
- G06F1/183—Internal mounting support structures, e.g. for printed circuit boards, internal connecting means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/18—Packaging or power distribution
- G06F1/189—Power distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4063—Device-to-bus coupling
- G06F13/4068—Electrical coupling
-
- H—ELECTRICITY
- H05—ELECTRIC TECHNIQUES NOT OTHERWISE PROVIDED FOR
- H05K—PRINTED CIRCUITS; CASINGS OR CONSTRUCTIONAL DETAILS OF ELECTRIC APPARATUS; MANUFACTURE OF ASSEMBLAGES OF ELECTRICAL COMPONENTS
- H05K7/00—Constructional details common to different types of electric apparatus
- H05K7/20—Modifications to facilitate cooling, ventilating, or heating
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Power Engineering (AREA)
- Computer Hardware Design (AREA)
- Software Systems (AREA)
- Thermal Sciences (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Power Sources (AREA)
- Cooling Or The Like Of Electrical Apparatus (AREA)
- Multi Processors (AREA)
Abstract
複数のノード、システム制御ユニット、及びキャリアボードを備えるマルチノードコンピュータシステム。複数のノードの各ノードは、プロセッサ、及びメモリを備える。システム制御ユニットは、電力管理、冷却、作業負荷プロビジョニング、ネイティブストレージサービス、及びI/Oの責任を負う。キャリアボードは、システムファブリック、及び複数の電気接続を備える。電気接続は、電力、管理制御、システム制御ユニットと複数のノードとの間のシステム接続、及びユーザインフラストラクチャへの外部ネットワーク接続を複数のノードに提供する。システム制御ユニット及びキャリアボードは、複数のノードに対して統合された共有リソースを提供する。マルチノードコンピュータシステムは、単一のエンクロージャに設けられる。
【選択図】図6
【選択図】図6
Description
[001]本出願は、2009年8月28日に出願された米国特許仮出願第61/238,084号、弁理士整理番号PCUBE−P001.PROの優先権を主張する。
[002]本発明は、一般にコンピュータシステムに関し、より詳細には、電力、スペース、及び冷却の改良を提供するサブ5W低電力プロセッサを含む家電の構成要素を使用するネットワーク中心のコンピュータアーキテクチャに関する。
[003]ペーパーレス技術の人気及び利点の増加により、データセンタの使用によるデジタル情報の格納及び情報管理が商業、通信、教育、及び政府の機能のおそらく重要な一部として台頭してきた。データセンタ又はサーバファームは、データ処理、データの格納、電気通信、及びインターネット接続に必要とされる必要なコンピュータシステムを提供する。データセンタは、至るところにあり、2、3例を挙げると、バンキング、エンターテインメント、ニュースアウトレット、先端技術産業、大学、及び政府機関にある。これら及び他のものは、こうしたデータセンタを動作させ、又は使用して、商取引、情報管理、電気通信、データ処理の要求を助ける。
[004]ペーパーレス技術の人気及び使用の増加により、データセンタの使用も増加した。多くの要因のうちのほんの数例に過ぎないが、バンキングでの電子トランザクションの使用の増加、インターネット通信及びエンターテインメントの人気、電子医療記録の使用の増加、及び電子商取引に見られる成長によって、データセンタの要求は増加している。2000年以降、EPAの議会報告(EPA report to Congress)によると、コンピュータリソースの需要の増加は、データセンタサーバ数のかなりの増加、並びにこれらのサーバ及びこうしたサーバをサポートする電力及び冷却インフラストラクチャによって使用されるエネルギーの推定5倍の増加につながった。EPAの報告は、エネルギーの使用のこの5倍の増加が、エネルギーコストの増加、発電による放出の増加とそれに伴う温室効果ガス排出と共に、この電力の増加の要件を満たすことを要求される現在の電力グリッドに対する追加の圧力、言うまでもなく現在のデータセンタ能力の拡張に必要な追加の資本費用、及び新しいデータセンタの建設と関連したコストを招くことを指摘する。
[005]したがって、社会のすべてのセクタのエネルギー効率の向上に対する関心の高まりと共に、データセンタのエネルギー効率の向上に対する関心も増えている。エネルギー効率のソリューションを提供するいくつかの新しい技術には、ブレードサーバ及び適応型冷却などがある。インターナショナルデータコーポレーション(International Data Corporation:IDC)によると、ブレードサーバの出荷数は、2013年までに世界的なサーバの出荷数の40%を超える。しかし、すべての改良は、漸進的で段階的である。消費電力を2000年のレベルまで低下させるには、システム技術及びアーキテクチャでの新しい躍進が必要であることは明白である。
[006]本発明の一実施形態において、マルチノードコンピュータシステムは、複数のノード、システム制御ユニット、及びキャリアボードを備える。複数のノードの各ノードは、プロセッサ、及びメモリを備える。システム制御ユニットは、電力管理、冷却制御、作業負荷プロビジョニング、ネイティブストレージサービス(native storage servicing)、及びI/Oの責任を負う。キャリアボードは、システムファブリック、及び複数の電気接続を備える。電気接続は、電力、管理制御、システム制御ユニットと複数のノードとの間のシステム接続、及びユーザインフラストラクチャへの外部ネットワーク接続を複数のノードに提供する。システム制御ユニット及びキャリアボードは、複数のノードに対して統合された共有リソースを提供する。マルチノードコンピュータシステムは、単一のエンクロージャに設けられる。
[007]本発明の別の実施形態において、マルチノードコンピュータシステムは、単一システムの電源をさらに備える。キャリアボードは、複数の電気接続をさらに備え、複数のノードは、それぞれの電気接続に対してキャリアボード上に配置される。電源は、複数のノードに単一の電圧レベルを提供し、各ノードが電圧を個々に変換する。
[008]本発明の別の実施形態において、複数のノードは、キャリアボード上のノードの第1の行及びノードの第2の行に垂直に配置される。ノードの第1の行は、ノードの第2の行とは異なるように配向される。ノードの行は、ノード間のチャネルを形成する。複数のチャネルは複数のゾーンに分割され、各ゾーンは少なくとも1つのチャネルを備える。複数のファンは、チャネルに空気を強制的に流し込むことによって複数のノードを冷却するための空気をファンで強制的に送り、各ファンは、少なくとも1つのゾーンに空気をファンで強制的に送る。
[009]本発明の別の実施形態において、マルチノードコンピュータシステムのノードは、5ワット未満を必要とするプロセッサと、メモリと、メモリコントローラと、I/Oチップセットと、システム相互接続と、サービスプロセッサとを備える。ノードは、50ワット未満を使用し、独立した動作ができない。ノードは、単一のエンクロージャ内のマルチノードコンピュータシステムの複数のノードの1つとして、キャリアボードに接続される。各ノードは、個々のエンクロージャを有していない。
[025]次に、添付の図面にその例が示されている本発明の好ましい実施形態を詳しく説明する。本発明は、好ましい実施形態との関連で説明するが、本発明をこれらの実施形態に限定するものではないことを理解されたい。これに対して、本発明は、代替、修正、及び均等物をカバーするものであり、こうした代替、修正、及び均等物は、添付の特許請求の範囲に定義される本発明の精神及び範囲内に含まれ得る。さらに、本発明の実施形態の以下の詳細な説明において、本発明を完全に理解できるようにするために、多数の具体的な詳細が記載される。しかし、これらの具体的な詳細なしで本発明を実践できることを当業者であれば認識されよう。他の例では、周知の方法、手順、構成要素、及び回路については、本発明の実施形態の態様を不必要に不明瞭にしないように、詳しくは記載しない。
表記及び用語:
[026]以下の詳細な説明のいくつかの部分は、コンピュータメモリ内のデータビットの操作の手順、ステップ、ロジックブロック、処理、及び他の象徴的表現に関して示される。これらの説明及び表現は、データ処理技術の当業者によって、他の当業者に最も効果的にその仕事の要旨を伝えるために使用される手段である。手順、コンピュータで実行されるステップ、ロジックブロック、プロセスなどは、ここでは、及び一般的に、所望の結果をもたらす首尾一貫した一連のステップ又は命令であると考えられる。ステップは、物理量の物理的操作を必要とするものである。必ずしもそうではないが、通常、これらの量は、コンピュータシステムにおける格納、転送、結合、比較、及びそうでなければ操作が可能な電気又は磁気信号の形をとる。これらの信号をビット、値、要素、記号、文字、項、数字などと呼ぶことは、主として一般的な用法という理由で、時として便利であることがわかっている。
[026]以下の詳細な説明のいくつかの部分は、コンピュータメモリ内のデータビットの操作の手順、ステップ、ロジックブロック、処理、及び他の象徴的表現に関して示される。これらの説明及び表現は、データ処理技術の当業者によって、他の当業者に最も効果的にその仕事の要旨を伝えるために使用される手段である。手順、コンピュータで実行されるステップ、ロジックブロック、プロセスなどは、ここでは、及び一般的に、所望の結果をもたらす首尾一貫した一連のステップ又は命令であると考えられる。ステップは、物理量の物理的操作を必要とするものである。必ずしもそうではないが、通常、これらの量は、コンピュータシステムにおける格納、転送、結合、比較、及びそうでなければ操作が可能な電気又は磁気信号の形をとる。これらの信号をビット、値、要素、記号、文字、項、数字などと呼ぶことは、主として一般的な用法という理由で、時として便利であることがわかっている。
[027]しかし、これら及び類似の用語はすべて、適切な物理量に関連付けられるものであり、単にこうした物理量に適用される便利なラベルに過ぎないことに留意されたい。以下の説明から明らかなように明記されない限り、本発明全体にわたって、「処理する」、「アクセスする」、「実行する」、「格納する」、又は「レンダリングする」などの用語を使用する説明は、コンピュータシステムのレジスタ及びメモリ、並びに他のコンピュータ可読媒体内の物理(電子)量として表されるデータを操作し、コンピュータシステムメモリ若しくはレジスタ又は他のこうした情報ストレージ、伝送デバイス、又はディスプレイデバイス内の物理量として同じように表される他のデータに変換するコンピュータシステム(例えば、図1のマルチノードコンピュータシステム10)又は類似の電子コンピューティングデバイスの動作及びプロセスを指すことを理解されたい。1つの構成要素がいくつかの実施形態に現れるとき、同じ参照番号の使用は、その構成要素が最初の実施形態に示されるのと同じ構成要素であることを示す。
[028]この40年間に、コンピューティングアーキテクチャの波がいくつかあった。メインフレームからミニコンピュータ、RISCワークステーション及びサーバ、そして現在のx86システムまで、新しいそれぞれの波は、性能、価格、及び電力のかなりの向上を送り出した。例えばアイフォン(iPhone)(商標)、ネットブック、モバイルインターネットデバイス(mobile internet device:MID)、及びデジタルビデオカメラなど、消費者デバイス対象の低電力プロセッサ及びフラッシュメモリのための技術開発に使われた巨大な投資を考慮して、次の波がこれらの基本的な家電技術に基づくことが明らかになりつつある。
グリーンマシン
[029]グリーンマシン(GreenMachine)(商標)のマルチノードコンピュータシステムは、電力、スペース、及び冷却において現在のコンピュータアーキテクチャより10倍以上の向上を目標とするI/O及びネットワーク中心のアーキテクチャである。マルチノードコンピュータシステムは、ユーザごとに個々の、複数のノードを備える。1人のユーザが一度に単一ノード又はいくつかのノードを使用/制御する可能性がある。各ノードは、ランダムアクセスメモリ、及び個々のノードの能力によって定義される別々の処理リソースを備える。グリーンマシンの(各ノードの)処理サブシステムは、スマートフォン/モバイルインターネットデバイスにある低電力プロセッサのタイプ、及びフラッシュメモリ技術に基づく。I/O、低電力要件、及び計算性能のため、最初の対象の市場は、クラウドコンピューティングである。グリーンマシンは、シンクライアント/仮想デスクトップ、データベース、データウェアハウス、ビジネスインテリジェンス及びビジネスアナリティクス、並びに高性能コンピューティング(HPC)を含めて、他の主要なバーティカル(verticals)に配備され得る。
[029]グリーンマシン(GreenMachine)(商標)のマルチノードコンピュータシステムは、電力、スペース、及び冷却において現在のコンピュータアーキテクチャより10倍以上の向上を目標とするI/O及びネットワーク中心のアーキテクチャである。マルチノードコンピュータシステムは、ユーザごとに個々の、複数のノードを備える。1人のユーザが一度に単一ノード又はいくつかのノードを使用/制御する可能性がある。各ノードは、ランダムアクセスメモリ、及び個々のノードの能力によって定義される別々の処理リソースを備える。グリーンマシンの(各ノードの)処理サブシステムは、スマートフォン/モバイルインターネットデバイスにある低電力プロセッサのタイプ、及びフラッシュメモリ技術に基づく。I/O、低電力要件、及び計算性能のため、最初の対象の市場は、クラウドコンピューティングである。グリーンマシンは、シンクライアント/仮想デスクトップ、データベース、データウェアハウス、ビジネスインテリジェンス及びビジネスアナリティクス、並びに高性能コンピューティング(HPC)を含めて、他の主要なバーティカル(verticals)に配備され得る。
[030]図1は、本発明の一実施形態によるマルチノードコンピュータシステム10を示す。各グリーンマシンマルチノードコンピュータシステム10は、グリーンマシンキャリア(GreenMachine Carrier:GMC)(商標)600と呼ばれるデュアル冗長スケーラブルシステムファブリックを使用するキャリアボードを介して相互接続される、ナノコンピュートユニット(NanoCompute Unit:NCU)(商標)100と呼ばれるモジュール式の構築ブロック(modular building block)から成る。NCU100は、マルチノードコンピュータシステムの個々のノードである。本発明において、各ノードはそれ自体の物理的に別々のプロセッサ及びメモリを備える「別々の」コンピュータシステムとして機能し、一方、以下でさらに説明するように、他のリソース(例えば電力、冷却、I/Oなど)はノード間で共有される。システム制御ユニット(SCU)300と呼ばれる管理サブシステムは、電力管理、冷却、作業負荷プロビジョニング、ネイティブストレージサービス、及びI/Oの責任を負う。GMC600は、電力、管理制御、及びSCU300とNCU100との間のシステム接続、並びにユーザインフラストラクチャへの外部ネットワーク接続を提供する。SCU300及びGMC600は、複数のNCU100に対して統合された共有リソースを提供する。
[031]グリーンマシンマルチノードコンピュータシステム10との外見上の類似点を特徴とする2つの既存のタイプのコンピュータシステムがある。ブレードサーバのクラスタも、システムファブリックを介して接続されるモジュール式の計算構築ブロックから成り、管理サブシステムも含むことも多い。しかし、グリーンマシン10は、以下の点、すなわち1)すべての構築ブロックは、個々に収納された構成要素の集まりであることに対して、単一のエンクロージャ内に収納される、及び2)グリーンマシンエンクロージャ全体は、等しく搭載されたブレードシステムの電力、スペース、及びコストを必要とする、という点で一意に異なる。あまり一般的でないマルチノードコンピュータも、単一のエンクロージャ内部の複数のモジュール式のコンピューティング要素から成り得る。しかし、グリーンマシンマルチノードコンピュータ10と既存のマルチノードコンピュータとの間にいくつかの違いがある。第1に、グリーンマシン10は、外部配線及び追加のスイッチを必要とすることなく、GMC600内のその複数のNCU100を相互接続するための機構を含む。さらに、グリーンマシン10は、ノードの操作及び使いやすさを容易にするための管理サブシステムを含む。また、最後に、グリーンマシン10は、今日の任意の他のマルチノードコンピュータと比較して、数倍の数のノードを含むが、電力をあまり消費せず、スペースがより少ない。グリーンマシン10は、初めてこうしたコンパクトな電力、スペース、及びコストのフットプリントにおいてその特徴及び機能を提供するマルチノードコンピュータである。
[032]また、複数のユーザの仮想環境を使用する従来のコンピュータシステムより、グリーンマシン10が享受する利点がいくつかある。グリーンマシン下の各ユーザには、仮想コンピュータとして全処理リソースを分割した一部ではなく、個々のNCU100が提供されるので、整合性があり、かつ、改善された障害分離がある。ユーザ数に関係なく、グリーンマシン10上のユーザが利用できる処理リソースは変わらないが、仮想コンピューティング環境を使用しているユーザが利用できるリソースは、ユーザの集約された処理要求に基づいて変わり得る。さらに、プロセッサが仮想コンピューティング環境において故障した場合、複数のユーザが影響を受ける可能性があるが、グリーンマシンシステム10では、NCU100が故障したとき、1人のユーザのみが影響を受ける。
[033]次に、グリーンマシン10(例えばNCU100、SCU200、及びGMC600)の様々な構成要素について、より詳細に説明する。グリーンマシン10の構成要素の詳細な説明の次に、アーキテクチャ、物理アセンブリ、効果的な冷却の実装、及びグリーンマシンの単一ソース電源分配について説明し、次いでさらなるグリーンマシンの実施形態について説明する。
ナノコンピュートユニット(NCU)
[034]図2は、本発明の一実施形態によるナノコンピュートユニット(NCU)100を示す。NCU100は、メインプロセッサ102と、メモリコントローラ104と、ランダムアクセスメモリ105と、チップセット106と、システム相互接続108と、サービスプロセッサ110とを備える。別の実施形態において、NCUメインプロセッサ102をオフロードし、アプリケーションの性能を強化するために、コプロセッサ112(例えばグラフィックプロセッサユニット及び浮動小数点演算ユニット)及び/又はネットワークプロセッサ114が含まれ得る。NCU100は、プロセッサに依存していない。NCU100は、サブ5Wプロセッサ、例えばインテル(Intel)のアトム(Atom)(商標)及びARMプロセッサなどをサポートする。チップセット106は、メインプロセッサ102をメモリ104に接続する。サービスプロセッサ110は、例えばキーボード、マウス、及びDVD/CD−ROMなど、リモートクライアントデバイスに、ビデオ及びUSBを有するシステムコンソールアクセスを提供する。ネットワーク相互接続は、イーサネット(Ethernet)ネットワークインターフェース(NIC)を介して実装される。任意選択で、イーサネットネットワークインターフェースは、ネットワークプロセッサ114を含む。ネットワークプロセッサ114は、ネットワークプロトコールオフロードエンジンでNCUメインプロセッサ102をオフロードする。信頼性のために、各NCU100は、イーサネットネットワークインターフェース上に少なくとも2つの高速システムインターフェース(1Gbp以上)を備える。これらのインターフェースは、ネットワーク相互接続(例えばイーサネット)又はI/O相互接続(例えばPCIe)とすることができる。サービスプロセッサ110は、システム制御ユニット(SCU)300に接続され、専用ネットワークインターフェース又はIPMBを介してΙΡΜΙ2.0管理を提供する。NCU100についてのKVM及びUSBリダイレクションは、サービスプロセッサ110上の専用ネットワークインターフェースを介して提供される。サービスプロセッサ110は、グリーンマシンキャリア600を介して外部ネットワークに接続する単一の専用ネットワークインターフェースを有する内蔵のイーサネットコントローラを含む。標準のコンピュータのように、各NCU100は、それ自体のオペレーティングシステムインスタンスを稼働させる。リモートクライアントデバイスと結合されて、各NCU100は、マルチノードコンピュータシステム10の単一ノードとして機能する。NCU100ローカル接続又はI/Oポートは、グリーンマシン10の外部に露出されない。
[034]図2は、本発明の一実施形態によるナノコンピュートユニット(NCU)100を示す。NCU100は、メインプロセッサ102と、メモリコントローラ104と、ランダムアクセスメモリ105と、チップセット106と、システム相互接続108と、サービスプロセッサ110とを備える。別の実施形態において、NCUメインプロセッサ102をオフロードし、アプリケーションの性能を強化するために、コプロセッサ112(例えばグラフィックプロセッサユニット及び浮動小数点演算ユニット)及び/又はネットワークプロセッサ114が含まれ得る。NCU100は、プロセッサに依存していない。NCU100は、サブ5Wプロセッサ、例えばインテル(Intel)のアトム(Atom)(商標)及びARMプロセッサなどをサポートする。チップセット106は、メインプロセッサ102をメモリ104に接続する。サービスプロセッサ110は、例えばキーボード、マウス、及びDVD/CD−ROMなど、リモートクライアントデバイスに、ビデオ及びUSBを有するシステムコンソールアクセスを提供する。ネットワーク相互接続は、イーサネット(Ethernet)ネットワークインターフェース(NIC)を介して実装される。任意選択で、イーサネットネットワークインターフェースは、ネットワークプロセッサ114を含む。ネットワークプロセッサ114は、ネットワークプロトコールオフロードエンジンでNCUメインプロセッサ102をオフロードする。信頼性のために、各NCU100は、イーサネットネットワークインターフェース上に少なくとも2つの高速システムインターフェース(1Gbp以上)を備える。これらのインターフェースは、ネットワーク相互接続(例えばイーサネット)又はI/O相互接続(例えばPCIe)とすることができる。サービスプロセッサ110は、システム制御ユニット(SCU)300に接続され、専用ネットワークインターフェース又はIPMBを介してΙΡΜΙ2.0管理を提供する。NCU100についてのKVM及びUSBリダイレクションは、サービスプロセッサ110上の専用ネットワークインターフェースを介して提供される。サービスプロセッサ110は、グリーンマシンキャリア600を介して外部ネットワークに接続する単一の専用ネットワークインターフェースを有する内蔵のイーサネットコントローラを含む。標準のコンピュータのように、各NCU100は、それ自体のオペレーティングシステムインスタンスを稼働させる。リモートクライアントデバイスと結合されて、各NCU100は、マルチノードコンピュータシステム10の単一ノードとして機能する。NCU100ローカル接続又はI/Oポートは、グリーンマシン10の外部に露出されない。
[035]スタンドアロンコンピュータ又は多くのサーバブレード構成とは異なり、(例えば、統合された電源、ファン、及びストレージがない)スタンドアロンコンピュータとして独立して機能せず、ベアボーンのNCU100は、低ワット要件閾値の利益を得る。サブ5Wプロセッサを使用すると、プロセッサのさらに低減した処理要件では、各個々のNCU100は、わずか35〜50ワットしか使用しない。
[036]現在の傾向は、家電の波を刺激している高密度プロセス技術(例えば32ナノメートル)を導入しているメインプロセッサにメモリコントローラなどの主要なチップセット機能を組み込むことである。NCUは、シングルチップ又は2チップソリューションとして実装することできる。図3は、本発明の一実施形態による2チップNCU200を示す。NCU200は、メモリコントローラ104、ランダムアクセスメモリ105、及びGPU122をメインプロセッサ102と統合する第1のチップ210を備え、I/Oチップセット106、サービスプロセッサ110、システム相互接続108、及びネットワークプロセッサ114を備えるNCU200の残りの構成要素が第2のチップ220に統合される2チップソリューションとして実装される。また、第2のチップは、ブートデバイス(例えばハードドライブ又は他の記憶媒体)に接続されたI/Oチップセット106を介して、又はサービスプロセッサ110のネットワークインターフェースを介してリモートブートデバイスに接続されたネットワークプロセッサによってブートサポートを提供する。
システム制御ユニット(SCU)
[037]システム制御ユニット(SCU)は、電力管理、冷却制御、作業負荷プロビジョニング、ネイティブストレージサービス、及びI/Oの責任を負う。SCUは、ナノコンピュートセンタ(NCC)と呼ばれるカスタムシステムファームウェアを稼働させる。図4は、本発明の一実施形態によるシステム制御ユニット300を示す。SCU300は、メインプロセッサ302と、メモリコントローラ304と、ランダムアクセスメモリ305と、チップセット306と、システム相互接続308とを備える。別の実装において、サービスプロセッサ310も設けられる。別の実装において、NCUメインプロセッサ102をオフロードし、アプリケーションの性能を強化するために、ネットワークプロセッサ312も含まれ得る。ネットワークのオフロードは、アプリケーションの性能を間接的に強化する。ネットワークのオフロードは、SCUが例えば共有ストレージなどのサービスをNCUに提供するのを助ける。より高品質のサービスは、アプリケーションの性能の向上につながる。さらに、SCU300は、I/Oチップセット106(例えばSATA)を介した内部ストレージインターフェース、I/Oチップセット106に配置されるシリアルポートを介したシステムスイッチファブリック(system switch fabrics)管理インターフェース、ネットワークプロセッサ114のネットワークインターフェースを介した高速ストレージネットワークインターフェース、及びI/Oチップセット106を介した外部でアクセス可能なI/Oポート(例えばVideo、USBなど)を提供する。
[037]システム制御ユニット(SCU)は、電力管理、冷却制御、作業負荷プロビジョニング、ネイティブストレージサービス、及びI/Oの責任を負う。SCUは、ナノコンピュートセンタ(NCC)と呼ばれるカスタムシステムファームウェアを稼働させる。図4は、本発明の一実施形態によるシステム制御ユニット300を示す。SCU300は、メインプロセッサ302と、メモリコントローラ304と、ランダムアクセスメモリ305と、チップセット306と、システム相互接続308とを備える。別の実装において、サービスプロセッサ310も設けられる。別の実装において、NCUメインプロセッサ102をオフロードし、アプリケーションの性能を強化するために、ネットワークプロセッサ312も含まれ得る。ネットワークのオフロードは、アプリケーションの性能を間接的に強化する。ネットワークのオフロードは、SCUが例えば共有ストレージなどのサービスをNCUに提供するのを助ける。より高品質のサービスは、アプリケーションの性能の向上につながる。さらに、SCU300は、I/Oチップセット106(例えばSATA)を介した内部ストレージインターフェース、I/Oチップセット106に配置されるシリアルポートを介したシステムスイッチファブリック(system switch fabrics)管理インターフェース、ネットワークプロセッサ114のネットワークインターフェースを介した高速ストレージネットワークインターフェース、及びI/Oチップセット106を介した外部でアクセス可能なI/Oポート(例えばVideo、USBなど)を提供する。
[038]現在の傾向は、家電の波を刺激している高密度プロセス技術(例えば32ナノメートル)を導入しているメインプロセッサにメモリコントローラなどの主要なチップセット機能を組み込むことである。したがって、SCUも、シングルチップ又は2チップソリューションとして実装することできる。図5に示すように、SCU400は、メモリコントローラ304及びランダムアクセスメモリ105をメインプロセッサ302と統合する第1のチップ410を備え、チップセット306、サービスプロセッサ310、システム相互接続308、及びネットワークプロセッサ312を備えるSCU400の残りの構成要素が第2のチップ420に統合される2チップソリューションとして実装され得る。第2のチップ420も、ブートサポートを提供する。
ナノコンピュートセンタ(NCC)
[039]SCU300は、ナノコンピュートセンタ(NCC)(商標)と呼ばれるカスタムシステムファームウェアを稼働させる。図6に、本発明の一実施形態による、主要なソフトウェア及びファームウェア構成要素、及びそれらの副構成要素を示す。ソフトウェア及びファームウェア構成要素及び副構成要素は、NCCのために特に開発されるオープンソース、サードパーティソフトウェア、及びソフトウェアを備える。ナノコンピュートセンタは、BASH/SSHDユーティリティと、Apache Httpdサーバと、コマンドラインインターフェース(Command Line Interface:CLI)と、グラフィカルユーザインターフェース(GUI)と、CentOS 5 Linex+ナノコンピュートセンタと、NCCコアとを備える。NCCコアは、以下のモジュール、すなわちNCC、SCU、及びNCUの構成ファイル/オブジェクト、ナノブレードブート(NanoBlade Boot)と、NCUインターフェース/アクセスと、NCUアップデートと、SCUアップデートと、NBC/シャーシマネージャ(Chassis Manager)とを備える。ナノブレードブートは、ロジカルボリュームマネージャ(Logical Volume Manager:LVM)と、DHCPサーバと、iSCSI−SCSTターゲットとを備える。iSCSI−SCSTターゲットは、アプリケーション及びオペレーティングシステムを備えるNCUソフトウェアと通信する。NCUインターフェース/アクセスは、IPMIクライアント及びKVM/vMediaクライアントを備え、両方ともNCUファームウェアのサービスプロセッサと通信する。NCUアップデートは、アップデートディレクタ及びメンテナンスOSを備え、メンテナンスOSはNCUファームウェアのBIOS及びオプションのROMと通信する。SCUアップデートは、ファームウェアツール及び画像dd/Grubアプリケーションを備える。ファームウェアツールはGMファームウェアのSCU BIOSと通信し、画像ddGrubアプリケーションはCentOS 5 Linux+ナノコンピュートセンタと通信する。NBC/シャーシマネージャはスイッチマネージャ及びシャーシマネージャを備え、スイッチマネージャはGMファームウェアのスイッチEEPROM/SDKと通信する。
[039]SCU300は、ナノコンピュートセンタ(NCC)(商標)と呼ばれるカスタムシステムファームウェアを稼働させる。図6に、本発明の一実施形態による、主要なソフトウェア及びファームウェア構成要素、及びそれらの副構成要素を示す。ソフトウェア及びファームウェア構成要素及び副構成要素は、NCCのために特に開発されるオープンソース、サードパーティソフトウェア、及びソフトウェアを備える。ナノコンピュートセンタは、BASH/SSHDユーティリティと、Apache Httpdサーバと、コマンドラインインターフェース(Command Line Interface:CLI)と、グラフィカルユーザインターフェース(GUI)と、CentOS 5 Linex+ナノコンピュートセンタと、NCCコアとを備える。NCCコアは、以下のモジュール、すなわちNCC、SCU、及びNCUの構成ファイル/オブジェクト、ナノブレードブート(NanoBlade Boot)と、NCUインターフェース/アクセスと、NCUアップデートと、SCUアップデートと、NBC/シャーシマネージャ(Chassis Manager)とを備える。ナノブレードブートは、ロジカルボリュームマネージャ(Logical Volume Manager:LVM)と、DHCPサーバと、iSCSI−SCSTターゲットとを備える。iSCSI−SCSTターゲットは、アプリケーション及びオペレーティングシステムを備えるNCUソフトウェアと通信する。NCUインターフェース/アクセスは、IPMIクライアント及びKVM/vMediaクライアントを備え、両方ともNCUファームウェアのサービスプロセッサと通信する。NCUアップデートは、アップデートディレクタ及びメンテナンスOSを備え、メンテナンスOSはNCUファームウェアのBIOS及びオプションのROMと通信する。SCUアップデートは、ファームウェアツール及び画像dd/Grubアプリケーションを備える。ファームウェアツールはGMファームウェアのSCU BIOSと通信し、画像ddGrubアプリケーションはCentOS 5 Linux+ナノコンピュートセンタと通信する。NBC/シャーシマネージャはスイッチマネージャ及びシャーシマネージャを備え、スイッチマネージャはGMファームウェアのスイッチEEPROM/SDKと通信する。
グリーンマシンキャリア(GMC)
[040]NCU100及びSCU300は、電気接続を含む、GMC600上のスロットに物理的に接続する。各スロットは、電力、管理制御、SCU300とNCU100との間のシステム接続、及びユーザインフラストラクチャへの外部ネットワーク接続を提供する。図7に示すように、3スイッチ実装は、複数のNCU100及びSCU300とのシステム接続のための2つの高速スイッチファブリックS1、S2、及びサービスプロセッサネットワークのためのスイッチファブリックS3を含む。3つのスイッチファブリックS1、S2、S3は、物理層(PHY)を介したGig−Es(ギガビットイーサネット、時として1000ベースTとして知られる)及び10gイーサネットとのさらなる接続を提供する。物理層は、スイッチファブリックS1、S2、及びS3と高速ネットワーク接続との間のインターフェースを提供する。
[040]NCU100及びSCU300は、電気接続を含む、GMC600上のスロットに物理的に接続する。各スロットは、電力、管理制御、SCU300とNCU100との間のシステム接続、及びユーザインフラストラクチャへの外部ネットワーク接続を提供する。図7に示すように、3スイッチ実装は、複数のNCU100及びSCU300とのシステム接続のための2つの高速スイッチファブリックS1、S2、及びサービスプロセッサネットワークのためのスイッチファブリックS3を含む。3つのスイッチファブリックS1、S2、S3は、物理層(PHY)を介したGig−Es(ギガビットイーサネット、時として1000ベースTとして知られる)及び10gイーサネットとのさらなる接続を提供する。物理層は、スイッチファブリックS1、S2、及びS3と高速ネットワーク接続との間のインターフェースを提供する。
[041]企業のロバスト性のために、管理プロセッサ604は、GMCスイッチファブリックS1、S2、S3を制御する。管理プロセッサ604は、それ自体のファームウェアを稼働させ、QoS、ACL、及び他のファブリックポリシーを構成することができる。SCU300上のSCUシステムスイッチ管理インターフェースは、GMCスイッチ管理プロセッサ604に接続される。
[042]システムスイッチファブリック管理インターフェースは、簡単なRS232又はネットワークインターフェース(例えばイーサネット)又はI/Oバスインターフェース(例えばPCI、PCIe)で実装することができ、これらのインターフェースはいずれも、管理プロセッサ604に接続される。SCU300のI/Oチップセット306に接続されるSCU管理バスは、NCUサービスプロセッサ110に接続されるIPMBマルチマスタモードで動作している。
[043]したがって、グリーンマシン10は、単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータのノードに内蔵の高帯域、冗長相互接続を提供する。追加の外部配線及びスイッチがネットワークにおけるそれらのノードと相互接続することを必要とする標準マルチノードコンピュータとは異なり、グリーンマシン10は、エンクロージャ内部のGMC600上においてデュアル冗長スイッチファブリックS1、S2を統合する。各グリーンマシン10は、他のグリーンマシン10及び外部ネットワークに直接接続するための高速外部アップリンクポート(例えばGig−Es及び10GのSFP+)も含む。
[044]グリーンマシン10は、単一のデスクトップ/サーバエンクロージャにおけるマルチノードコンピュータのリモートクライアントアクセスを提供する。従来のマルチノードコンピュータの各ノードは、それ自体のキーボード、マウス、及びビデオポートを含む。これらのキーボード、マウス、及びビデオポートは、個々の外部デバイスに接続されているか、外部スイッチを介して集約される。グリーンマシン10は、通常ハイエンドサーバ及びブレードシステムだけに見つかるリモート管理技術を一意に集約する。各NCU100は、やはりグリーンマシン10に内蔵の専用のスイッチファブリックS3に接続されているKVM−over−IPマイクロコントローラを含む。マイクロコントローラは、ビデオ及びUSBを圧縮し、例えばデスクトップ、ラップトップ、又はシンクライアントなどのデバイスが、あたかもそれらがローカルであるかのように、NCU100にアクセスし、NCU100と対話することができる。この設計も、GMに接続されているモニタ、キーボード、及び周辺機器の単一の組がすべてのNCU100にアクセスできるようにする。
グリーンマシンレイアウト
[045]グリーンマシン10アーキテクチャ(例えば先例のない電力、スペース、及び計算効率)の他に例をみない利点は、高密度マルチコンピュータシステムパッケージの結果である。図8Aは、20−NCUグリーンマシン10の実装を示す。NCU100及びSCU300は、通常互いに同じ平面上に水平に設けられる従来のマルチノードコンピュータのボードとは異なり、下部平面方向に、GMCボード600に垂直につながれるカードとして表される。ブレードサーバとは異なり、グリーンマシンカード100、300はすべて、ほぼ標準デスクトップコンピュータのサイズである単一シャーシ718に含まれる。NCU100は、個々のエンクロージャを有していない。したがって、各カード100は、隣接するカード100からわずか2、3センチメートル離れて配置され得る。本発明の一実施形態において、各カード100は、隣接するカード100から約2センチメートル離れている。複数の垂直方向のCPUカード用の機械式ハーネス702は、各カード100の個々のエンクロージャが存在しない状態では、剛性を提供する。カード100は、冷却、電力、ネットワーク、及びこれもまた同じシャーシ718内に含まれるストレージサブシステムを共有する。他に例をみないこの手法を介した高密度パッキングの提供に加えて、グリーンマシン10の設計は、NCU100とのケーブルのない接続、及びツールのないサービスを提供する。後述するように、単一電源716は、単一の電圧をすべてのグリーンマシン構成要素に分配し、シャーシ718内の低RPMファン708は、非常に効率の良い冷却を提供し、ファンがシャーシ718に固定された前面板720を介して空気を通す。最後に、機械式ハーネス702上に設けられている上蓋722と、GMC600上のネットワークへのアクセス、及びI/O接続を提供している後部パネル724と、シャーシ718とが、グリーンマシンマルチノードコンピュータシステム10全体を単一のエンクロージャ内に密閉する。
[045]グリーンマシン10アーキテクチャ(例えば先例のない電力、スペース、及び計算効率)の他に例をみない利点は、高密度マルチコンピュータシステムパッケージの結果である。図8Aは、20−NCUグリーンマシン10の実装を示す。NCU100及びSCU300は、通常互いに同じ平面上に水平に設けられる従来のマルチノードコンピュータのボードとは異なり、下部平面方向に、GMCボード600に垂直につながれるカードとして表される。ブレードサーバとは異なり、グリーンマシンカード100、300はすべて、ほぼ標準デスクトップコンピュータのサイズである単一シャーシ718に含まれる。NCU100は、個々のエンクロージャを有していない。したがって、各カード100は、隣接するカード100からわずか2、3センチメートル離れて配置され得る。本発明の一実施形態において、各カード100は、隣接するカード100から約2センチメートル離れている。複数の垂直方向のCPUカード用の機械式ハーネス702は、各カード100の個々のエンクロージャが存在しない状態では、剛性を提供する。カード100は、冷却、電力、ネットワーク、及びこれもまた同じシャーシ718内に含まれるストレージサブシステムを共有する。他に例をみないこの手法を介した高密度パッキングの提供に加えて、グリーンマシン10の設計は、NCU100とのケーブルのない接続、及びツールのないサービスを提供する。後述するように、単一電源716は、単一の電圧をすべてのグリーンマシン構成要素に分配し、シャーシ718内の低RPMファン708は、非常に効率の良い冷却を提供し、ファンがシャーシ718に固定された前面板720を介して空気を通す。最後に、機械式ハーネス702上に設けられている上蓋722と、GMC600上のネットワークへのアクセス、及びI/O接続を提供している後部パネル724と、シャーシ718とが、グリーンマシンマルチノードコンピュータシステム10全体を単一のエンクロージャ内に密閉する。
効率的な共有ストレージ
[046]別の実施形態において、グリーンマシンは、単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータにおいて動的に再構成可能で非常に効率的な統合ストレージ機能を提供する。標準マルチノードコンピュータ、ブレードサーバ、及び他の既存のタイプのコンピュータは、ノードごとに固定の直接接続されたストレージ、又は柔軟に割り当てられた外部ストレージをサポートする。グリーンマシンは、単一のエンクロージャにおけるマルチノードシステムの独特の特徴である、そのエンクロージャにおけるNCU100用のiSCSIストレージサーバとしてSCU300を使用することによって動的な内部ストレージ構成を可能にする。さらに図8Aに示されるように、SCU300は、ディスク706の配列に直接接続され、そこから論理ボリューム(ナノディスク)を作成し、論理ボリュームをNCU100に割り当てることができる。グリーンマシン10は、Copy−On−Write(COW)ナノディスククローン(Nano Disk Clone)技術によってそのNCU100中での物理的ストレージの共有の効率を大幅に向上させる。この技術は、複数のNCU100が類似のオペレーティングシステム及びアプリケーションを稼働させるときのディスクスペースの使用及びアクセス性能を最適化する。SCU300が作成するナノディスクごとに、この技術は、任意選択で複数のNCU100からのアクセスを可能にすることができる。各NCU100は、あたかも専用の、非共有リソースであるかのように、ナノディスクにアクセスすることができる。認可されたNCU100ごとに、SCU300は、最初のナノディスク及び非常に小さい書き込み可能なボリュームからなる仮想記憶装置を作る。NCU100がデータを書き込むとき、SCU300は、変更されたデータブロックをその書き込み可能なボリュームにリダイレクトする。NCU100がデータを読み込むとき、SCU300は、必要に応じて、最初のナノディスクと書き込み可能なボリュームとの組み合わせからデータを提供する。さらに、SCU300は、固体ディスク706の特性に合わせて最適化されるアルゴリズムを使用する。
[046]別の実施形態において、グリーンマシンは、単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータにおいて動的に再構成可能で非常に効率的な統合ストレージ機能を提供する。標準マルチノードコンピュータ、ブレードサーバ、及び他の既存のタイプのコンピュータは、ノードごとに固定の直接接続されたストレージ、又は柔軟に割り当てられた外部ストレージをサポートする。グリーンマシンは、単一のエンクロージャにおけるマルチノードシステムの独特の特徴である、そのエンクロージャにおけるNCU100用のiSCSIストレージサーバとしてSCU300を使用することによって動的な内部ストレージ構成を可能にする。さらに図8Aに示されるように、SCU300は、ディスク706の配列に直接接続され、そこから論理ボリューム(ナノディスク)を作成し、論理ボリュームをNCU100に割り当てることができる。グリーンマシン10は、Copy−On−Write(COW)ナノディスククローン(Nano Disk Clone)技術によってそのNCU100中での物理的ストレージの共有の効率を大幅に向上させる。この技術は、複数のNCU100が類似のオペレーティングシステム及びアプリケーションを稼働させるときのディスクスペースの使用及びアクセス性能を最適化する。SCU300が作成するナノディスクごとに、この技術は、任意選択で複数のNCU100からのアクセスを可能にすることができる。各NCU100は、あたかも専用の、非共有リソースであるかのように、ナノディスクにアクセスすることができる。認可されたNCU100ごとに、SCU300は、最初のナノディスク及び非常に小さい書き込み可能なボリュームからなる仮想記憶装置を作る。NCU100がデータを書き込むとき、SCU300は、変更されたデータブロックをその書き込み可能なボリュームにリダイレクトする。NCU100がデータを読み込むとき、SCU300は、必要に応じて、最初のナノディスクと書き込み可能なボリュームとの組み合わせからデータを提供する。さらに、SCU300は、固体ディスク706の特性に合わせて最適化されるアルゴリズムを使用する。
単一ソース配電
[047]上記した利点は、単一のデスクトップ/サーバエンクロージャにおけるマルチノードコンピュータ10の効率的な共有配電方式によってさらに向上する。電源及びAC−DC変換の数を低減し、システム全体にわたって電力回路の長さを最適化することによって、グリーンマシンマルチノードコンピュータ10は、他のシステム設計では実行可能でない優れた電力効率を達成する。エンクロージャ当たり単一の(又は冗長性のため2つの)電源は、GMC600のすべてのNCU100、SCU300、及び構成要素に単一システム電圧を供給する。次いで、この同一の電圧は、各個々の負荷の時点で電力の変換を受ける。図8Bに示すように、単一電源716は、各NCU100に単一システム電圧を供給し、DC−DCコンバータ730は、各NCU100の負荷の時点で単一の電圧を変換する。
[047]上記した利点は、単一のデスクトップ/サーバエンクロージャにおけるマルチノードコンピュータ10の効率的な共有配電方式によってさらに向上する。電源及びAC−DC変換の数を低減し、システム全体にわたって電力回路の長さを最適化することによって、グリーンマシンマルチノードコンピュータ10は、他のシステム設計では実行可能でない優れた電力効率を達成する。エンクロージャ当たり単一の(又は冗長性のため2つの)電源は、GMC600のすべてのNCU100、SCU300、及び構成要素に単一システム電圧を供給する。次いで、この同一の電圧は、各個々の負荷の時点で電力の変換を受ける。図8Bに示すように、単一電源716は、各NCU100に単一システム電圧を供給し、DC−DCコンバータ730は、各NCU100の負荷の時点で単一の電圧を変換する。
[048]図8Cは、複数の電圧レベルをシステム構成要素に分配する電源を使用する従来の先行技術のシステム設計を示す。システム構成要素756に提供される複数のシステム電圧754(例えば3.3V及び5Vのレール)を有する従来のATXフォームファクタの電源752を使用すると、電源752の各レールによって提供される負荷の数に対する制限が必要となり、レール754ごとの電力定格によって変化する合成が要求される。換言すれば、複数のATX電源752は、結果として消費電力が増加し、図8Bに示すように、本発明の単一電源よりもむしろ、電力を20−NCU100グリーンマシン10に供給することが必要となる。
グリーンマシンの電力効率
[049]グリーンマシン10は、必要なときのみ、スタンバイ電力を構成要素に供給することによって、電力消耗をさらに減らす。このスタンバイ電力方式は、マイクロコントローラによって動作される電力FETを含む管理サブシステム604によって可能になる。また、グリーンマシン10は、NCU100ごとにリアルタイムクロックバックアップバッテリを提供するよりはむしろ、各NCU100上のリアルタイムクロックを同期するためにマイクロコントローラを使用することによって、CMOSバッテリなど種々の電力デバイスを不要にする。
[049]グリーンマシン10は、必要なときのみ、スタンバイ電力を構成要素に供給することによって、電力消耗をさらに減らす。このスタンバイ電力方式は、マイクロコントローラによって動作される電力FETを含む管理サブシステム604によって可能になる。また、グリーンマシン10は、NCU100ごとにリアルタイムクロックバックアップバッテリを提供するよりはむしろ、各NCU100上のリアルタイムクロックを同期するためにマイクロコントローラを使用することによって、CMOSバッテリなど種々の電力デバイスを不要にする。
[050]グリーンマシンは、単一のデスクトップ/サーバエンクロージャのマルチノードコンピュータ10に高度な電力管理をさらに提供する。グリーンマシン10は、以前はハイエンドのブレードシステムのみにあった電力管理能力を、デスクトップ/ワークステーションサイズのマルチノードシステムが効果的に利益を得ることができる形に圧縮する。コンパクトなSCU300ブロードをグリーンマシン10に組み込むことによって、これが達成され、電力共有、電力シーケンス及び最適化が知的に調整され得る。
超高効率の冷却
[051]別の態様において、グリーンマシン10は、単一のデスクチップ/サーバサイズのエンクロージャのマルチノードコンピュータに超高効率の冷却設計を提供する。図8A、8D、及び8Eに示すように、グリーンマシン10の実装の物理的設計によって、最小数の低価格で静かな低RPMファン708がエンクロージャにおけるすべてのカード100を適切に冷却することができる。密にパッケージされたNCU100は、追加の配管を必要とすることなく、薄い自然空気チャネル710の行を形成する。空気チャネル710は、2センチメートル幅であり、これはNCU100の間の間隔を表す。冷却チャネル710がNCU100の行の間に形成されて、冷却チャネル710を介してNCU100を流れる空気の有効な層が設けられる。さらに、図8Aに示すように、第1の行のNCU100がNCU100の次の行に熱を容易に伝えないように、NCU100はカード100の2つの行の間では向きが反転されている。より多くの気流、より冷たい気流、配管又は熱配管で使用する追加の材料、又は上記のすべてを必要とする他の機械設計とは対照的に、図8D及び8Eに示される各チャネル710の薄型放熱器712によって、気流のボリューム全体が重要な構成要素から熱を効果的に放出できるようにする。最適量の空気分子が放熱器面712に効率的に接触することができるので、薄型放熱器712を有する冷却チャネル710は非常に効率的な冷却環境を提供する。
[051]別の態様において、グリーンマシン10は、単一のデスクチップ/サーバサイズのエンクロージャのマルチノードコンピュータに超高効率の冷却設計を提供する。図8A、8D、及び8Eに示すように、グリーンマシン10の実装の物理的設計によって、最小数の低価格で静かな低RPMファン708がエンクロージャにおけるすべてのカード100を適切に冷却することができる。密にパッケージされたNCU100は、追加の配管を必要とすることなく、薄い自然空気チャネル710の行を形成する。空気チャネル710は、2センチメートル幅であり、これはNCU100の間の間隔を表す。冷却チャネル710がNCU100の行の間に形成されて、冷却チャネル710を介してNCU100を流れる空気の有効な層が設けられる。さらに、図8Aに示すように、第1の行のNCU100がNCU100の次の行に熱を容易に伝えないように、NCU100はカード100の2つの行の間では向きが反転されている。より多くの気流、より冷たい気流、配管又は熱配管で使用する追加の材料、又は上記のすべてを必要とする他の機械設計とは対照的に、図8D及び8Eに示される各チャネル710の薄型放熱器712によって、気流のボリューム全体が重要な構成要素から熱を効果的に放出できるようにする。最適量の空気分子が放熱器面712に効率的に接触することができるので、薄型放熱器712を有する冷却チャネル710は非常に効率的な冷却環境を提供する。
[052]GMC600上のマイクロコントローラは、グリーンマシン10の冷却の効率をさらに最適化する。マイクロコントローラは、あらゆる冷却チャネル710にある温度センサ714を読み取り、独立したチャネル710、又はチャネル710のゾーンZ1、Z2にそれぞれ供給するよう複数のファン708を制御することができる。センサ714は、NCU100自体に、又はGMC600上の各NCU100スロットの近くに配置することができる。最高の精度のために、温度センサ714は、NCU100に直接配置される。
[053]この超高効率の冷却設計は、複数の独立した冷却/ゾーン及びファン714を制御する単一の冷却サブシステムを特徴としない標準のマルチノード、デスクトップ、サーバ、又はワークステーション冷却設計と異なる。内部エリアをゾーンZ1、Z2に分割することによって、マイクロコントローラは、特定のゾーンZ1、Z2の冷却チャネル710の温度センサ714に基づいて特定のゾーンZ1、Z2の冷却要件を満たすために個々のファン708のRPMを増加させると共に、他のファン708のRPMを、それらが割り当てられたゾーンZ1、Z2の冷却要件が可能にするだけ、低下させることによって、グリーンマシン10の冷却を効率的に制御することができる。
ノイズの低減
[054]別の実施形態において、グリーンマシン10は、ノイズの低減を単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータに提供する。標準マルチノードコンピュータ、サーバ、及びブレードシステムは、通常、データセンタのためのものであり、したがって、それらの設計はノイズを低減する取り組みをほとんどしていない。NCU100の高密度はノイズの回避不能な増加を示唆するが、グリーンマシン10の設計は、ノイズを単一の静かなデスクトップのものまで比類なく低減する特性を特徴とする。25度の室温を有する保守的なシミュレーションにおいて、ノイズレベルは、40dB未満だった。40度の室温を有する別のシミュレーションにおいて、ノイズレベルは、約55dBまで増加した。薄型空気チャネル710は、効率を最適化するだけでなく、空気の乱流も低減する。独立したゾーンZ1、Z2によって、冷却システムは、必要なときのみ、個々のファン708の速度を上げることができる。最後に、共有電源716によって、必要とされるファン708の全体数が低減する。全体として、これらの属性によって、グリーンマシン10を、他のコンピュータアーキテクチャが適していないノイズに弱い環境で使用することができる。
[054]別の実施形態において、グリーンマシン10は、ノイズの低減を単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータに提供する。標準マルチノードコンピュータ、サーバ、及びブレードシステムは、通常、データセンタのためのものであり、したがって、それらの設計はノイズを低減する取り組みをほとんどしていない。NCU100の高密度はノイズの回避不能な増加を示唆するが、グリーンマシン10の設計は、ノイズを単一の静かなデスクトップのものまで比類なく低減する特性を特徴とする。25度の室温を有する保守的なシミュレーションにおいて、ノイズレベルは、40dB未満だった。40度の室温を有する別のシミュレーションにおいて、ノイズレベルは、約55dBまで増加した。薄型空気チャネル710は、効率を最適化するだけでなく、空気の乱流も低減する。独立したゾーンZ1、Z2によって、冷却システムは、必要なときのみ、個々のファン708の速度を上げることができる。最後に、共有電源716によって、必要とされるファン708の全体数が低減する。全体として、これらの属性によって、グリーンマシン10を、他のコンピュータアーキテクチャが適していないノイズに弱い環境で使用することができる。
グリーンマシンクラスタコンピューティング
[055]別の実施形態において、グリーンマシン10は、単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータの高性能クラスタ処理能力を提供する。相当する物理的サイズ、消費電力、又はコストのマルチノードコンピュータを含む他のシステムとは異なり、グリーンマシン10は、単一のコンパクトなエンクロージャの中に含まれる高性能な計算クラスタとして使用することができる。グリーンマシン10は、そのモジュール式のナノコンピュートユニット100の設計、統合された高帯域幅のネットワークファブリック、及びクラスタ化ソフトウェア生産技術によりこれを達成する。上記のように、各NCU100は、任意選択で、グラフィクス、ビデオ、及び浮動小数点演算のオフロードのための組み込み型GPU112、及び通信及びストレージネットワークのオフロードための組み込み形ネットワークプロセッサ114を含む。これらの構成要素は、各NCU100の効率を最大にするが、複数のNCU100を使用する高性能のクラスタコンピューティングにも理想的である。各NCU100は、任意選択で、組み込み型GPU112を有する。組み込み型GPU112は、CUDA又はOpenCLを介して浮動小数点演算のオフロードのための低レベルのサポートを提供する。
[055]別の実施形態において、グリーンマシン10は、単一のデスクトップ/サーバサイズのエンクロージャのマルチノードコンピュータの高性能クラスタ処理能力を提供する。相当する物理的サイズ、消費電力、又はコストのマルチノードコンピュータを含む他のシステムとは異なり、グリーンマシン10は、単一のコンパクトなエンクロージャの中に含まれる高性能な計算クラスタとして使用することができる。グリーンマシン10は、そのモジュール式のナノコンピュートユニット100の設計、統合された高帯域幅のネットワークファブリック、及びクラスタ化ソフトウェア生産技術によりこれを達成する。上記のように、各NCU100は、任意選択で、グラフィクス、ビデオ、及び浮動小数点演算のオフロードのための組み込み型GPU112、及び通信及びストレージネットワークのオフロードための組み込み形ネットワークプロセッサ114を含む。これらの構成要素は、各NCU100の効率を最大にするが、複数のNCU100を使用する高性能のクラスタコンピューティングにも理想的である。各NCU100は、任意選択で、組み込み型GPU112を有する。組み込み型GPU112は、CUDA又はOpenCLを介して浮動小数点演算のオフロードのための低レベルのサポートを提供する。
別のグリーンマシンの実装:
[056]その設計上の利点をさらに最大にするために、グリーンマシン設計を追加の変形に適用することができる。図9〜図12は、上記の利点をさらに最大にするためのいくつかの可能な変形を示す。
[056]その設計上の利点をさらに最大にするために、グリーンマシン設計を追加の変形に適用することができる。図9〜図12は、上記の利点をさらに最大にするためのいくつかの可能な変形を示す。
[057]図9に示すように、NCU100は、環境に優しい再利用可能なラップトップコンピュータ900のためのモジュール方式のアップグレード可能な処理サブシステムとして実装することができる。サイズが小型であるため、個々のNCU100は、ノート型コンピュータエンクロージャ900にパッケージし直すことができる。このパッケージによって、ケーシング、スクリーン、キーボード、及びポートを再利用すると共に、ノート型コンピュータ900の主要な構成要素をアップグレードすることができる。
[058]図10に示すように、NCU100は、例えばホームゲートウェイ機器など、特定の用途のための他の構成にパッケージし直すこともできる。これによって、上記の利点を特定の作業負荷及び目的に合わせてさらに微細に最適化することができる。
[059]図11に示すように、データセンタインフラストラクチャにおける複数のグリーンマシンのためのラックフレームパッケージアーキテクチャを実装することができる。6つのグリーンマシンを、ラック側に配電、及び下から上への空冷設計を有する3×2行の構成にパッケージすることができる。図11は、各レベルが6つのグリーンマシンを含む3×2行の構成を使用する標準31.5インチのラックのために構成された12のGMを示す。ラックのオープンなシャーシ構造は、示されていない。
[060]グリーンマシン10の低エネルギー要件は、グリーンマシン10が、例えば様々な家電デバイスなどにおいてバッテリによって給電される追加の構成を可能にする。構成要素の選択及び電力管理による低電力消費に加えて、グリーンマシン配電設計は、バッテリを介して給電されるラップトップコンピュータの外部でのシステム設計を可能にし、電気自動車及び他の用途のバッテリの研究に使用されてきた巨大な投資が活用される。バッテリパックは、ラップトップと類似のグリーンマシン電源モジュール又は外部接続のバッテリステーションと同じスペースに適合するように設計されてもよい。バッテリで給電されるグリーンマシンは、ソーラー/他のエネルギー充電、ピークのエネルギー使用の最適化、フォールトトレランスの増加、及び可搬性を利用することが可能である。
PCIeベースのメモリファブリック:
[061]別の実施形態において、グリーンマシン10は、動的なマルチノードコンピュータシステムのPCIeベースのメモリファブリックと共に実装され得る。イーサネットネットワークファブリックをPCIeメモリファブリックに置き換えることは、単一のエンクロージャのコンピュータシステムの一意の特徴である。これは、NCU100とデバイスとの間のすべてのタイプの通信のかなり高い帯域幅及び短い待ち時間を可能にする。また、追加のリソース共有、電力の節約、及びコストの最適化も可能にする。
[061]別の実施形態において、グリーンマシン10は、動的なマルチノードコンピュータシステムのPCIeベースのメモリファブリックと共に実装され得る。イーサネットネットワークファブリックをPCIeメモリファブリックに置き換えることは、単一のエンクロージャのコンピュータシステムの一意の特徴である。これは、NCU100とデバイスとの間のすべてのタイプの通信のかなり高い帯域幅及び短い待ち時間を可能にする。また、追加のリソース共有、電力の節約、及びコストの最適化も可能にする。
[062]図12A〜12Dに示すように、メモリファブリック1200統合グリーンマシンは、システム管理及び制御のための統合SCU300と、ストリーム内処理(例えばメモリコピー、暗号化、自動データマイグレーション)のための組み込み型ファブリックプロセッサ1202と、NCU100のためのファブリックプロセッサ1202を介した拡張メモリサポートと、同期のための原子複合体(atomic complex:AC)ロック機能1204と、階層的な異種のメモリインフラストラクチャのための自動データマイグレーションと、(TCP/IPメモリベースの機能1206がメモリファブリックを使用することができるように、各NCU100によって使用されるソフトウェアドライバによって実施される)ノード間通信のためのTCP/IPメモリベースの機能1206と、物理的I/Oデバイス共有(例えばVNIC、VHBAなど)のための仮想I/O1208実装と、リモートシンクライアントのためのNCUネイティブI/Oコンソール1210トラフィック(ビデオ、USB、音声)とを備える。PCIeメモリファブリック1200は、任意のタイプのコモディティコンピュータシステムに一意の以下の特徴、すなわち複数のハードウェアキャッシュコヒーレンスNCU100を動的マルチプロセッサノード(Dynamic Multi−Processor:DMP)に集約するためのクロック及び配電設計、及び複数のNCU100をDMPノードに集約するための反射型記憶機構を可能にするために使用することができる。
[063]さらに、図12Dに示すように、ロックステップデュアルNCUタンデムフォールトトレランスノード構成(Tandem Fault Tolerance:TFT)、及びトリプルNCU冗長フォールトトレランス(Triple NCU Redundant Fault Tolerance)ノード構成のためのクロック同期が実装され得る。NCU100の使用に固有のコスト削減及び効率がNCU冗長フォールトトレランス構成に導入され、冗長フォールトトレランスを実施するために2台のNCU100(デュアル用)又は3台のNCU100(トリプル用)が使用される。2台又は3台のNCU100が結果を処理した後、ファブリックプロセッサ1202による投票を介して、処理の障害又はエラーを識別し、破棄することができ、正しい結果のみがメモリ1208に送信される。
[064]別の実施形態において、グリーンマシン10は、動的な分散されたストレージのサポートのために仮想化されたローカルストレージをマルチノードコンピュータシステムに組み込むことができる。(実際の又は仮想の)PCIデバイスを複数のNCU100に接続することができるPCIeメモリファブリック1200を使用することによって、(上記のような)集中化、共有、仮想化、及びネットワーク化されたストレージの使用を、仮想化されたローカルディスクを提供するように拡張することができる。これには、オペレーティングシステムをよりよくサポートする、性能がより高い、及び複雑さが低減するという効果がある。また、例えばキャッシュ、フラッシュメモリ、及び標準HDDを含む異種ストレージ階層などの仮想化された共有ストレージ、及び外部ストレージ(iSCSI、FC)の一意のサポート及び使用を可能にする。グリーンマシンの実装は、完全な隔離、安全なクライアントアクセス、及びアクセス待ち時間及び性能について最適化するためにストレージレベル間でデータを移動することによる自動データマイグレーションを特徴とする。
[065]別の実施形態において、グリーンマシンは、単一のエンクロージャの構成要素内のシステム負荷バランスのために休止状態/チェックポイント/再開技術の使用を組み込むことができる。通常、ハイエンドのフォールトトレラントシステム、又は個別の処理ジョブが何日もかかり得る高性能コンピューティングクラスタに、休止状態、チェックポイント、及び再開技術が配置される。グリーンマシンアーキテクチャによって、この技術は、グリーンマシンマルチノードコンピュータシステム10のための休止状態/チェックポイント/再開技術の一意の適合を必要とせず、複数の作業負荷をサポートする動的なリソースの割り振りの目的で、単一の自己内蔵型マシン内で有用となることができるようになる。この実装において、SCU300は、アイドルのNCU100を検出し、それらの状態をチェックポイントすることになる。作業負荷は、後で別のNCU100に保存又は移動され得る。SCU300は、チェックポイントされた画像と共に、MACアドレスなどのハードウェアアイデンティティも移動させる。ハードウェアアドレスリロケーションは、ファームウェア管理によって、又はアドレス仮想化によって達成することができる。
[066]別の実施形態において、グリーンマシンは、単一のエンクロージャを超えて拡大、縮小することができる。こうしたスケーリングは、複数のグリーンマシン、エラー回復及び障害隔離(Fault Containment)、及びドメインパーティションをサポートするNCCを含む。
Claims (49)
- コンピュータシステムであって、
プロセッサ及びメモリを備える複数のノードであり、前記複数のノード、マルチノードコンピュータシステムのノードである、複数のノードと、
システム制御ユニットと、
キャリアボードであり、前記キャリアボードがシステムファブリック及び複数の電気接続を備え、前記電気接続が、電力、管理制御、前記システム制御ユニットと前記複数のノードとの間のシステム接続、及びユーザインフラストラクチャへの外部ネットワーク接続を前記複数のノードのそれぞれ1つに提供し、前記システムファブリックが、前記システム接続を制御する少なくとも2つの高速スイッチ、及びサービスプロセッサネットワークのための第3のスイッチを備える、キャリアボードと
を備え、前記システム制御ユニット及び前記キャリアボードが、前記複数のノードに対して統合された共有リソースを提供し、前記コンピュータシステムが単一のエンクロージャに設けられる
コンピュータシステム。 - 前記システム制御ユニットが、電力管理、冷却、作業負荷プロビジョニング、ネイティブストレージサービス、及びI/Oを制御する請求項1に記載のコンピュータシステム。
- 前記システムファブリックが、デュアル冗長スケーラブルシステムファブリックである請求項1に記載のコンピュータシステム。
- 前記複数のノードが前記キャリアボードに垂直に配置され、前記キャリアボードが外部配線なしに前記複数のノード接続を提供する請求項1に記載のコンピュータシステム。
- 前記複数のノードに剛性を提供する機械式ハーネスをさらに備え、前記複数のノードが個々のエンクロージャを備えておらず、前記機械式ハーネスが、前記複数のノード上に、前記複数のノード上と接触して配置される請求項4に記載のコンピュータシステム。
- ノードがシングルチップとして統合される請求項1に記載のコンピュータシステム。
- ノードが第1のチップ及び第2のチップとして統合される請求項1に記載のコンピュータシステム。
- 各ノードがサブ5ワットプロセッサをさらに備える請求項1に記載のコンピュータシステム。
- 各ノードがナノコンピュートユニットである請求項1に記載のコンピュータシステム。
- 各ノードが50ワット未満を必要とする請求項1に記載のコンピュータシステム。
- 各ノードが35〜50ワットを必要とする請求項1に記載のコンピュータシステム。
- 単一システムの電源をさらに備え、前記電源が前記複数のノードに単一の電圧レベルを提供し、各ノードが前記電圧を個々に変換する請求項1に記載のコンピュータシステム。
- 各ノードが電力変換器をさらに備える請求項12に記載のコンピュータシステム。
- 前記単一の電圧レベルが12ボルトである請求項12に記載のコンピュータシステム。
- 前記複数のノードが、前記キャリアボード上のノードの第1の行及びノードの第2の行に垂直に配置され、前記ノードの第1の行が、前記ノードの第2の行とは異なるように配向される請求項1に記載のコンピュータシステム。
- 前記ノードの第1の行が、前記ノードの第2の行と比べて向きが180度反転される請求項15に記載のコンピュータシステム。
- 前記ノードの行が前記ノード間の複数のチャネルを形成し、前記複数のチャネルが複数のゾーンに分割され、各ゾーンが少なくとも1つのチャネルを備え、複数のファンが、前記チャネルに空気を強制的に流し込むことによって前記複数のノードを冷却するための空気をファンで強制的に送り、各ファンが、少なくとも1つのゾーンに空気をファンで強制的に送る請求項15に記載のコンピュータシステム。
- 3つの低RPMファンが空気をファンで強制的に送る請求項17に記載のコンピュータシステム。
- マイクロコントローラをさらに備え、前記マイクロコントローラが、前記複数のファンの各ファンの前記RPMを個々に制御する請求項17に記載のコンピュータシステム。
- 前記複数のチャネルの各チャネルに温度センサをさらに備え、各温度センサが、前記マイクロコントローラに温度測定値を伝え、前記マイクロコントローラが、前記複数のチャネルの前記温度に基づいて前記複数のファンの各ファンの前記RPMを制御する請求項19に記載のコンピュータシステム。
- 前記マイクロコントローラが、前記少なくとも1つの対応するゾーンの各温度センサからの前記集約された温度測定値に基づいて前記複数のファンの各ファンの前記RPMを制御する請求項20に記載のコンピュータシステム。
- 前記エンクロージャの前面の板が前記複数のファンに空気を誘導する請求項17に記載のコンピュータシステム。
- 前記ノードが前記複数のチャネルに複数の薄型放熱器をさらに備え、前記複数の薄型放熱器及び前記複数のノードの前記間隔が前記ファンで強制的に送られる空気のための前記複数のチャネルを通る低乱流パスを設け、前記ファンで強制的に送られる空気が前記複数のノードを効率的に冷却する請求項17に記載のコンピュータシステム。
- 前記マルチノードコンピュータシステムの前記ノイズレベルが40dB未満である請求項17に記載のコンピュータシステム。
- コンピュータシステムであって、
プロセッサ及びメモリを備える複数のノードであり、前記複数のノード、マルチノードコンピュータシステムのノードである、複数のノードと、
システム制御ユニットと、
単一システムの電源と、
複数の電気接続を備えるキャリアボードであり、前記複数のノードが、それぞれの電気接続に対して前記キャリアボード上に配置され、前記電源が前記複数のノードに単一の電圧レベルを提供し、各ノードが前記電圧を個々に変換する、キャリアボードと
を備え、前記システム制御ユニット及び前記キャリアボードが、前記複数のノードに対して統合された共有リソースを提供し、前記コンピュータシステムが単一のエンクロージャに設けられる
コンピュータシステム。 - 各ノードが電力変換器をさらに備える請求項25に記載のコンピュータシステム。
- 前記単一の電圧レベルが12ボルトである請求項25に記載のコンピュータシステム。
- バックアップ単一ソース電源をさらに備える請求項25に記載のコンピュータシステム。
- 前記システム制御ユニット及びキャリアボードがスタンバイ電力を提供し、必要なときに前記スタンバイ電力のみが供給される請求項25に記載のコンピュータシステム。
- ノードであって、
5ワット未満を必要とするプロセッサと、
メモリと、
メモリコントローラと、
I/Oチップセットと、
システム相互接続と、
サービスプロセッサであり、前記ノードが50ワット未満を使用し、前記ノードは、独立した動作ができず、前記ノードが、単一のエンクロージャ内のマルチノードコンピュータシステムの複数のノードの1つとして、キャリアボードに接続される、サービスプロセッサと
を備える、ノード。 - 前記ノードが個々のエンクロージャを有していない請求項30に記載のノード。
- GPUと浮動小数点演算ユニットとを備えるコプロセッサと、
ネットワークプロセッサと
をさらに備える請求項30に記載のノード。 - 前記ノードがナノコンピュートユニットである請求項30に記載のノード。
- 前記ノードの前記構成要素がシングルチップに統合される請求項30に記載のノード。
- 前記メインプロセッサ及び前記メモリコントローラが第1のチップに統合され、前記システム相互接続、I/Oチップセット、及びサービスプロセッサが第2のチップに統合される請求項30に記載のノード。
- 前記第1のチップがコプロセッサをさらに備え、前記第2のチップがネットワークプロセッサをさらに備える請求項35に記載のノード。
- コンピュータシステムであって、
プロセッサ及びメモリを備える複数のノードであり、前記複数のノード、マルチノードコンピュータシステムのノードである、複数のノードと、
システム制御ユニットと、
前記複数のノードのための複数の電気接続を備えるキャリアボードであり、前記複数のノードが、前記キャリアボード上のノードの第1の行及びノードの第2の行に垂直に配置され、前記ノードの第1の行が前記ノードの第2の行とは異なるように配向される、キャリアボードと
を備え、前記ノードの行が前記ノード間のチャネルを形成し、前記複数のチャネルが複数のゾーンに分割され、各ゾーンが少なくとも1つのチャネルを備え、複数のファンが、前記チャネルに空気を強制的に流し込むことによって前記複数のノードを冷却するための空気をファンで強制的に送り、各ファンが、少なくとも1つのゾーンに空気をファンで強制的に送り、
前記システム制御ユニット及び前記キャリアボードが、前記複数のノードに対して統合された共有リソースを提供し、前記コンピュータシステムが単一のエンクロージャに設けられる
コンピュータシステム。 - 前記複数のファンが3つの低RPMファンを備える請求項37に記載のコンピュータシステム。
- 前記マルチノードコンピュータシステムの前記ノイズレベルが40dB未満である請求項37に記載のコンピュータシステム。
- 前記ノードの第1の行が、前記ノードの第2の行と比べて向きが180度反転される請求項37に記載のコンピュータシステム。
- マイクロコントローラが、前記複数のファンの各ファンの前記RPMを個々に制御する請求項37に記載のコンピュータシステム。
- 前記複数のチャネルの各チャネルの温度センサが、前記マイクロコントローラに温度測定値を伝え、前記マイクロコントローラが、前記複数のチャネルの前記温度に基づいて前記複数のファンの各ファンの前記RPMを制御する請求項41に記載のコンピュータシステム。
- 前記マイクロコントローラが、前記少なくとも1つの対応するゾーンの各チャネルの各温度センサからの前記集約された温度測定値に基づいて前記複数のファンの各ファンの前記RPMを制御する請求項42に記載のコンピュータシステム。
- 前記エンクロージャの前面の板が空気を前記複数のファンに誘導する請求項37に記載のコンピュータシステム。
- 前記ノードが前記複数のチャネルに複数の薄型放熱器をさらに備え、前記複数の薄型放熱器及び複数のノードの前記間隔が、前記ファンで強制的に送られる空気のための前記複数のチャネルを通る低乱流パスを設け、前記ファンで強制的に送られる空気が前記複数のノードを効率的に冷却する請求項37に記載のコンピュータシステム。
- コンピュータシステムであって、
プロセッサ及びメモリを備える複数のノードであり、前記複数のノード、マルチノードコンピュータシステムのノード、各ノードが50ワット未満を必要とし、前記複数のノードは、独立した動作ができず、前記複数のノードが個々のエンクロージャを備えていない、複数のノードと、
システム制御ユニットであり、前記複数のノードに、電力管理、冷却、作業負荷プロビジョニング、ネイティブストレージサービス、及びI/O接続を提供する、システム制御ユニットと、
単一システムの電源と、
システムファブリックと、
複数の電気接続であり、前記電気接続が、電力、管理制御、前記システム制御ユニットと前記複数のノードとの間のシステム接続、及びユーザインフラストラクチャへの外部ネットワーク接続を前記複数のノードのそれぞれ1つに提供し、前記システムファブリックが、システム接続を提供する少なくとも2つの高速スイッチ、及びサービスプロセッサネットワークのための第3のスイッチを備える、複数の電気接続と
を備えるキャリアボードと、
を備え、前記電源が前記複数のノードに単一の電圧レベルを提供し、各ノードが前記電圧を変換し、
前記複数のノードが、前記キャリアボード上のノードの第1の行及びノードの第2の行に垂直に配置され、前記ノードの第1の行が前記ノードの第2の行とは異なるように配向され、前記ノードの行が前記ノード間のチャネルを形成し、前記複数のチャネルが複数のゾーンに分割され、ゾーンが少なくとも1つのチャネルを備え、複数のファンが、前記チャネルに空気を強制的に流し込むことによって前記複数のノードを冷却するための空気をファンで強制的に送り、各ファンが、少なくとも1つのゾーンに空気をファンで強制的に送り、
前記システム制御ユニット及び前記キャリアボードが、前記複数のノードに対して統合された共有リソースを提供し、前記コンピュータシステムが単一のエンクロージャに設けられる
コンピュータシステム。 - 前記マルチノードコンピュータシステムがグリーンマシンである請求項46に記載のコンピュータシステム。
- 前記NCUがナノコンピュートユニットである請求項46に記載のコンピュータシステム。
- 前記キャリアボードがグリーンマシンキャリアである請求項46に記載のコンピュータシステム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US23808409P | 2009-08-28 | 2009-08-28 | |
US61/238,084 | 2009-08-28 | ||
US12/634,441 US9442540B2 (en) | 2009-08-28 | 2009-12-09 | High density multi node computer with integrated shared resources |
US12/634,441 | 2009-12-09 | ||
PCT/US2010/041219 WO2011031373A2 (en) | 2009-08-28 | 2010-07-07 | High density multi node computer with integrated shared resources |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013503385A true JP2013503385A (ja) | 2013-01-31 |
Family
ID=43626763
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012526754A Pending JP2013503385A (ja) | 2009-08-28 | 2010-07-07 | 統合された共有リソースを有する高密度マルチノードコンピュータ |
Country Status (6)
Country | Link |
---|---|
US (2) | US9442540B2 (ja) |
JP (1) | JP2013503385A (ja) |
KR (1) | KR101739157B1 (ja) |
CN (1) | CN102576337B (ja) |
TW (1) | TWI460660B (ja) |
WO (1) | WO2011031373A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021066001A1 (ja) * | 2019-10-02 | 2021-04-08 | 三菱電機株式会社 | 情報処理装置及び通信切替方法 |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120159090A1 (en) * | 2010-12-16 | 2012-06-21 | Microsoft Corporation | Scalable multimedia computer system architecture with qos guarantees |
TWM415339U (en) * | 2011-04-28 | 2011-11-01 | Caswell Inc | Integration device for network computation, safety and network storage |
WO2011127854A2 (zh) * | 2011-05-17 | 2011-10-20 | 华为技术有限公司 | Kvm数据传输的方法、业务板及系统 |
US20140229764A1 (en) * | 2011-10-28 | 2014-08-14 | Theodore F. Emerson | Management of a computer |
US11521139B2 (en) * | 2012-09-24 | 2022-12-06 | Amazon Technologies, Inc. | Providing system resources with secure containment units |
TWI478538B (zh) * | 2012-11-28 | 2015-03-21 | Inventec Corp | 伺服器系統 |
US20140149715A1 (en) * | 2012-11-28 | 2014-05-29 | Los Alamos National Security, Llc | Scalable and programmable computer systems |
WO2015163865A1 (en) * | 2014-04-23 | 2015-10-29 | Hewlett-Packard Development Company, L.P. | Backplane interface sets |
CN104125292A (zh) * | 2014-08-06 | 2014-10-29 | 曙光信息产业(北京)有限公司 | 一种数据处理装置、云服务器及其使用方法 |
US9886264B2 (en) * | 2014-12-09 | 2018-02-06 | Xiaomi Inc. | Method and device for upgrading firmware |
CN104660997B (zh) * | 2015-02-12 | 2018-09-04 | 江苏中科羿链通信技术有限公司 | 面向服务的多源异构视频监控适配方法和系统 |
US20160246721A1 (en) * | 2015-02-19 | 2016-08-25 | Qualcomm Incorporated | Role based cache coherence bus traffic control |
CN105005547B (zh) * | 2015-06-25 | 2017-08-25 | 浪潮电子信息产业股份有限公司 | 一种基于numa的多路服务器完全物理分区方法 |
US9891700B2 (en) * | 2015-10-02 | 2018-02-13 | Infineon Technologies Austria Ag | Power management for datacenter power architectures |
CN105630723A (zh) * | 2015-12-22 | 2016-06-01 | 中国电子科技集团公司第三十二研究所 | 基于异构处理器平台的管理架构及其管理方法 |
US10101799B2 (en) * | 2016-04-01 | 2018-10-16 | Quanta Computer Inc. | System and method for smart power clamping of a redundant power supply |
US10390114B2 (en) | 2016-07-22 | 2019-08-20 | Intel Corporation | Memory sharing for physical accelerator resources in a data center |
CN106292909A (zh) * | 2016-08-01 | 2017-01-04 | 合肥奇也信息科技有限公司 | 一种集成共享资源的高密度多节点计算机系统 |
EP3523721A1 (en) * | 2016-10-05 | 2019-08-14 | Kaleao Limited | Hyperscale architecture |
US10341255B2 (en) * | 2016-10-28 | 2019-07-02 | Hewlett Packard Enterprise Development Lp | Switch resource manager |
TWI620075B (zh) * | 2016-11-23 | 2018-04-01 | 財團法人資訊工業策進會 | 用於雲端巨量資料運算架構之伺服器及其雲端運算資源最佳化方法 |
TWI737970B (zh) * | 2019-03-18 | 2021-09-01 | 神雲科技股份有限公司 | 伺服器機櫃 |
CN110096366B (zh) * | 2019-05-10 | 2022-03-04 | 苏州浪潮智能科技有限公司 | 一种异构内存系统的配置方法、装置及服务器 |
US10881030B1 (en) | 2019-07-31 | 2020-12-29 | Hewlett Packard Enterprise Development Lp | Electrical and liquid cooling midplane |
US11418931B2 (en) | 2020-04-06 | 2022-08-16 | Dell Products, Lp | Method and apparatus for operating a thin client across a 5G infrastructure |
US11109122B1 (en) | 2020-06-30 | 2021-08-31 | Microsoft Technology Licensing, Llc | Using free-space optics to interconnect a plurality of computing nodes |
US11202378B1 (en) * | 2020-07-30 | 2021-12-14 | Baidu Usa Llc | Modular infrastructure for compute and storage clusters |
RU2748454C1 (ru) * | 2020-10-02 | 2021-05-25 | Федеральное государственное унитарное предприятие "Научно-исследовательский институт "Квант" | Реконфигурируемая вычислительная система с многоуровневой подсистемой мониторинга и автоматическим управлением |
US11832033B2 (en) | 2020-11-03 | 2023-11-28 | Microsoft Technology Licensing, Llc | Efficiently interconnecting computing nodes to enable use of high-radix network switches |
US11539453B2 (en) | 2020-11-03 | 2022-12-27 | Microsoft Technology Licensing, Llc | Efficiently interconnecting a plurality of computing nodes to form a circuit-switched network |
CN112888258B (zh) * | 2021-01-25 | 2022-09-02 | 福建国青电力科技有限公司 | 一种便于安装维护的iscu-p系列智能开关控制器 |
US11438224B1 (en) | 2022-01-14 | 2022-09-06 | Bank Of America Corporation | Systems and methods for synchronizing configurations across multiple computing clusters |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU1587592A (en) * | 1991-03-18 | 1992-10-21 | Echelon Corporation | Networked variables |
US6266740B1 (en) * | 1998-07-31 | 2001-07-24 | Emc Corporation | Device sequencing and placement protection using a digital signature |
US20030236745A1 (en) * | 2000-03-03 | 2003-12-25 | Hartsell Neal D | Systems and methods for billing in information management environments |
JP4175788B2 (ja) * | 2001-07-05 | 2008-11-05 | 株式会社日立製作所 | ボリューム制御装置 |
US20030093510A1 (en) * | 2001-11-14 | 2003-05-15 | Ling Cen | Method and apparatus for enumeration of a multi-node computer system |
US6836813B1 (en) | 2001-11-30 | 2004-12-28 | Advanced Micro Devices, Inc. | Switching I/O node for connection in a multiprocessor computer system |
GB2387456B (en) * | 2002-04-12 | 2005-12-21 | Sun Microsystems Inc | Configuring computer systems |
US6826036B2 (en) * | 2002-06-28 | 2004-11-30 | Hewlett-Packard Development Company, L.P. | Modular power distribution system for use in computer equipment racks |
US20040107375A1 (en) * | 2002-12-02 | 2004-06-03 | Edward Anglada | System and method for switching clock sources |
US6801769B1 (en) * | 2003-03-12 | 2004-10-05 | The Boeing Company | Modular aircraft information network system and an associated method of packaging the same |
US7143279B2 (en) * | 2003-05-29 | 2006-11-28 | Intel Corporation | Dynamic BIOS execution and concurrent update for a blade server |
US7051215B2 (en) * | 2003-06-13 | 2006-05-23 | Intel Corporation | Power management for clustered computing platforms |
US20050091215A1 (en) * | 2003-09-29 | 2005-04-28 | Chandra Tushar D. | Technique for provisioning storage for servers in an on-demand environment |
JP4244319B2 (ja) * | 2003-12-17 | 2009-03-25 | 株式会社日立製作所 | 計算機システム管理プログラム,記録媒体,ならびに計算機システム管理システムおよびそのための管理装置および記憶装置 |
JP4451687B2 (ja) * | 2004-03-22 | 2010-04-14 | 株式会社日立製作所 | ストレージシステム |
CN2715218Y (zh) * | 2004-06-07 | 2005-08-03 | 鸿富锦精密工业(深圳)有限公司 | 扩充卡固定装置 |
US6978332B1 (en) * | 2004-07-02 | 2005-12-20 | Motorola, Inc. | VXS multi-service platform system with external switched fabric link |
US20060114923A1 (en) * | 2004-11-29 | 2006-06-01 | Overgaard Mark D | Disaggregated star platform management bus architecture system |
US7307837B2 (en) * | 2005-08-23 | 2007-12-11 | International Business Machines Corporation | Method and apparatus for enforcing of power control in a blade center chassis |
US7643307B2 (en) * | 2005-09-29 | 2010-01-05 | International Business Machines Corporation | Fail safe redundant power supply in a multi-node computer system |
JP5111754B2 (ja) * | 2005-11-14 | 2013-01-09 | 株式会社日立製作所 | 記憶制御システム |
US7272002B2 (en) * | 2005-11-16 | 2007-09-18 | Adc Dsl Systems, Inc. | Auxiliary cooling methods and systems for electrical device housings |
US8014388B2 (en) * | 2006-04-11 | 2011-09-06 | Cisco Technology, Inc. | Using a dual purpose physical layer interface for a flexible chassis-based server |
JP4749255B2 (ja) * | 2006-07-03 | 2011-08-17 | 株式会社日立製作所 | 複数種類の記憶デバイスを備えたストレージシステムの制御装置 |
CN100562833C (zh) * | 2006-09-04 | 2009-11-25 | 曙光信息产业(北京)有限公司 | 一种用于刀片服务器的io扩展模块 |
JP2008077325A (ja) * | 2006-09-20 | 2008-04-03 | Hitachi Ltd | ストレージ装置及びストレージ装置に対する設定方法 |
US7481679B1 (en) * | 2006-11-01 | 2009-01-27 | Emc Corporation | Electrical connector and circuit card assembly |
JP5020601B2 (ja) * | 2006-11-10 | 2012-09-05 | 株式会社日立製作所 | アクセス環境構築システム及び方法 |
US8739148B2 (en) * | 2007-02-09 | 2014-05-27 | Elster Electricity, Llc | Automated meter reading system |
JP5379956B2 (ja) * | 2007-03-19 | 2013-12-25 | 株式会社日立製作所 | ストレージ装置及び記憶領域配置方法 |
US7538453B1 (en) * | 2007-03-23 | 2009-05-26 | Emc Corporation | Fan power supply system |
US20080278912A1 (en) * | 2007-05-09 | 2008-11-13 | Dean Zavadsky | Thermal management systems and methods for electronic components in a sealed enclosure |
US8670241B2 (en) * | 2007-06-13 | 2014-03-11 | Hewlett-Packard Development Company, L.P. | Blade device enclosure |
US8230145B2 (en) * | 2007-07-31 | 2012-07-24 | Hewlett-Packard Development Company, L.P. | Memory expansion blade for multiple architectures |
JP4995015B2 (ja) * | 2007-09-13 | 2012-08-08 | 株式会社日立製作所 | 仮想計算機の実行可否検査方法 |
CN101431432A (zh) * | 2007-11-06 | 2009-05-13 | 联想(北京)有限公司 | 刀片服务器 |
CN101441506B (zh) * | 2007-11-20 | 2011-05-11 | 中兴通讯股份有限公司 | 一种刀片服务器系统及其功耗管理方法 |
US8051316B2 (en) * | 2008-06-09 | 2011-11-01 | Dell Products L.P. | System and method for managing power supply units |
CN101304543A (zh) * | 2008-06-17 | 2008-11-12 | 华为技术有限公司 | 双面插背板 |
US8245053B2 (en) * | 2009-03-10 | 2012-08-14 | Dell Products, Inc. | Methods and systems for binding a removable trusted platform module to an information handling system |
US20120011319A1 (en) * | 2010-07-01 | 2012-01-12 | Infinidat Ltd. | Mass storage system and method of operating thereof |
US20130346667A1 (en) * | 2012-06-21 | 2013-12-26 | Jonathan Stroud | Serial port access system and method in a computing system |
-
2009
- 2009-12-09 US US12/634,441 patent/US9442540B2/en not_active Expired - Fee Related
-
2010
- 2010-07-07 JP JP2012526754A patent/JP2013503385A/ja active Pending
- 2010-07-07 KR KR1020127007997A patent/KR101739157B1/ko active IP Right Grant
- 2010-07-07 CN CN201080038336.7A patent/CN102576337B/zh active Active
- 2010-07-07 WO PCT/US2010/041219 patent/WO2011031373A2/en active Application Filing
- 2010-08-26 TW TW099128673A patent/TWI460660B/zh active
-
2016
- 2016-09-13 US US15/264,441 patent/US10467021B2/en active Active - Reinstated
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021066001A1 (ja) * | 2019-10-02 | 2021-04-08 | 三菱電機株式会社 | 情報処理装置及び通信切替方法 |
JPWO2021066001A1 (ja) * | 2019-10-02 | 2021-04-08 | ||
JP7052929B2 (ja) | 2019-10-02 | 2022-04-12 | 三菱電機株式会社 | 情報処理装置及び通信切替方法 |
Also Published As
Publication number | Publication date |
---|---|
TW201216164A (en) | 2012-04-16 |
KR101739157B1 (ko) | 2017-06-08 |
US9442540B2 (en) | 2016-09-13 |
CN102576337B (zh) | 2015-12-16 |
CN102576337A (zh) | 2012-07-11 |
KR20120092579A (ko) | 2012-08-21 |
TWI460660B (zh) | 2014-11-11 |
US20110055844A1 (en) | 2011-03-03 |
US10467021B2 (en) | 2019-11-05 |
WO2011031373A2 (en) | 2011-03-17 |
WO2011031373A3 (en) | 2011-05-05 |
US20170052801A1 (en) | 2017-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101739157B1 (ko) | 통합 공유 리소스들을 가진 고밀도 멀티 노드 컴퓨터 | |
Shuja et al. | Survey of techniques and architectures for designing energy-efficient data centers | |
US20200142752A1 (en) | Physical partitioning of computing resources for server virtualization | |
Kant | Data center evolution: A tutorial on state of the art, issues, and challenges | |
US8176501B2 (en) | Enabling efficient input/output (I/O) virtualization | |
US9128682B2 (en) | Independent removable computer rack power distribution system for high-density clustered computer system | |
US6895480B2 (en) | Apparatus and method for sharing boot volume among server blades | |
US8370833B2 (en) | Method and system for implementing a virtual storage pool in a virtual environment | |
US20040015638A1 (en) | Scalable modular server system | |
US20100008038A1 (en) | Apparatus and Method for Reliable and Efficient Computing Based on Separating Computing Modules From Components With Moving Parts | |
Rao et al. | Energy efficiency in datacenters through virtualization: A case study | |
JP2023533445A (ja) | メモリモジュールの温度に基づくクラウドコンピューティングシステムにおけるメモリ割り当ておよびメモリ書き込みリダイレクト | |
US11782810B2 (en) | Systems and methods for automated field replacement component configuration | |
CN104102301A (zh) | 一种2u超高密度存储服务器 | |
Felter et al. | On the performance and use of dense servers | |
Kamoun | Virtualizing the datacenter without compromising server performance | |
US11809893B2 (en) | Systems and methods for collapsing resources used in cloud deployments | |
RU2616886C1 (ru) | Блейд-сервер | |
US20240028201A1 (en) | Optimal memory tiering of large memory systems using a minimal number of processors | |
US20240078196A1 (en) | Cxl persistent memory module link topology | |
US11314455B2 (en) | Mapping of RAID-CLI requests to vSAN commands by an out-of-band management platform using NLP | |
US11347435B2 (en) | One-touch migration of virtual assets | |
US11800646B1 (en) | Systems and methods for generating PCB (printed circuit board) designs | |
Leigh et al. | General-purpose blade infrastructure for configurable system architectures | |
US20240028406A1 (en) | Ihs (information handling system) mesh architecture for circuit optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20121010 |