JP3992148B2 - 大規模でスケーラブルなプロセッサ・システムを構築するための電子回路基板 - Google Patents

大規模でスケーラブルなプロセッサ・システムを構築するための電子回路基板 Download PDF

Info

Publication number
JP3992148B2
JP3992148B2 JP2004128842A JP2004128842A JP3992148B2 JP 3992148 B2 JP3992148 B2 JP 3992148B2 JP 2004128842 A JP2004128842 A JP 2004128842A JP 2004128842 A JP2004128842 A JP 2004128842A JP 3992148 B2 JP3992148 B2 JP 3992148B2
Authority
JP
Japan
Prior art keywords
processor
buses
processor chip
electronic circuit
circuit board
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004128842A
Other languages
English (en)
Other versions
JP2004326799A (ja
Inventor
ラヴィ・クマル・アリミリ
ヴィンセント・エンリク・チュン
ジョディ・バーン・ジョイナー
ジェリー・ドン・ルイス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2004326799A publication Critical patent/JP2004326799A/ja
Application granted granted Critical
Publication of JP3992148B2 publication Critical patent/JP3992148B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B26HAND CUTTING TOOLS; CUTTING; SEVERING
    • B26BHAND-HELD CUTTING TOOLS NOT OTHERWISE PROVIDED FOR
    • B26B11/00Hand knives combined with other implements, e.g. with corkscrew, with scissors, with writing implement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17337Direct connection machines, e.g. completely connected computers, point to point communication networks
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B26HAND CUTTING TOOLS; CUTTING; SEVERING
    • B26BHAND-HELD CUTTING TOOLS NOT OTHERWISE PROVIDED FOR
    • B26B5/00Hand knives with one or more detachable blades
    • B26B5/001Hand knives with one or more detachable blades with blades being slid out of handle immediately prior to use
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B26HAND CUTTING TOOLS; CUTTING; SEVERING
    • B26BHAND-HELD CUTTING TOOLS NOT OTHERWISE PROVIDED FOR
    • B26B1/00Hand knives with adjustable blade; Pocket knives
    • B26B1/08Hand knives with adjustable blade; Pocket knives with sliding blade

Description

本発明は、一般にデータ処理システムに関し、詳細にはマルチプロセッサ・データ処理システムに関する。さらにより詳細には、本発明は、複数のプロセッサを効率的に相互接続して大規模なマルチプロセッサ・システム用のビルディング・ブロックを提供する方法およびシステムに関する。
本出願の関連出願として、本出願と同時に出願された同時係属の米国特許出願第10/425421号(整理番号AUS920020206US1)「技術的および商用の作業負荷をサポートする新しい接続を有するデータ処理システム(Data Processing System Having Novel Interconnect For Supporting BothTechnical and Commercial Workloads)」がある。
商用用途に使用されるデータ処理システムは、非常に速い速度で進歩を遂げてきている。このような発展は、シングル・プロセッサ・システムの設計と利用に始まり、より複雑なマルチプロセッサ・システム(MP)の設計と利用にまで進んできている。発展の大部分は、より高い処理能力とより速いデータ・オペレーションを求める産業界における必要性の増大によって拍車がかけられてきている。
技術サーバおよび商用サーバが、追加の処理能力およびより速い全体的なデータ・オペレーションの恩恵を受けてきたシステムの2つの例である。これらのシステムは、一般に分散メモリ・システム、それぞれ関連するメモリ・ブロックに対する直接アクセスを有するプロセッサ、またはメモリ親和性(memory affinity)が最小の非常に大規模なキャッシング・メカニズムを用いて設計される。
図1から図4は、シングル・プロセッサ・システムから、従来技術のプロセッサ−メモリ構成をビルディング・ブロックとして利用したますます複雑なデータ処理システムへの進展を示すものである。図1に示すように、従来技術のシングル・プロセッサ・チップ・システム100は、シングル・プロセッサ101と、1対のバスによって相互接続されるメモリ105とを備える。各バスは、プロセッサ・チップとメモリ105の間で情報をやりとりするための1組の帯域幅(すなわちバイト数)を提供する。図1で、プロセッサ101は、8バイトのデータ入力バスおよび16バイトのデータ出力バスを介して、「1ウェイ」構成と呼ばれる方法でメモリ105に接続されている。メモリ105は、処理中、プロセッサ101が利用する命令とデータを提供する。トライステート・バスおよび単方向/双方向バスを含めて、バスにはいくつかの代替実装形態がある。
従来技術のシングル・プロセッサ・チップ・システム100は、2つのプロセッサ間バスを介して互いに結合されるマルチプロセッサ・チップを備える後続世代の処理システム用のビルディング・ブロックとして利用される。図2は、各チップからなるプロセッサ101を接続する相互接続バス103を有する2ウェイ・システムを示している。
一緒に接続すべきプロセッサ・チップ数が、(より大きな処理能力をもつシステムが要求されるために)増加するにつれて、プロセッサ・チップ間の接続性をサポートするために、スイッチSW121によって例示される階層的なスイッチ・ベースのトポロジが実装されてきた。図3および4は、それぞれ階層的なスイッチ・トポロジを介して他のプロセッサ・チップのそれぞれに結合されたプロセッサ・チップ101をもつ、4ウェイ、および8ウェイ・システムを示している。図3の4ウェイ・システムでは、最高レベルが2つの相互接続されたプロセッサ・チップを2組備える、ただ2つのレベルのワイヤ接続の階層しか必要でない。
図4は、3つのレベルまたはワイヤ接続がある8ウェイ・システムを用いた階層的なスイッチ・ベースのトポロジを示している。階層的なスイッチ・トポロジと共に示すように、プロセッサはそれぞれ、それに関連するメモリ・ブロックだけに、また階層スイッチの最高レベルにあるシングル・プロセッサに、直接に接続される(すなわち、プロセッサは、完全には相互接続されない)。したがって、1ウェイ・システムと同様に、従来技術の2ウェイ、4ウェイ、および8ウェイ・システムも、一対一のメモリ親和性を示す。すなわち、各プロセッサはたった1つの接続されたメモリ・ブロックに対してのみ直接アクセスができる。一対一のメモリ親和性の場合には、複数のプロセッサを有する大規模なシステムが、全体システム内の利用可能なメモリ資源/帯域幅をフルに利用することが制限される。
プロセッサの数を増加しながら各システムの実効的スケーリングを注意深く分析することにより、プロセッサ数が増加するとき、メモリ帯域幅およびメモリ親和性の増大が、線形にスケーリングしないことが分かる。プロセッサ・チップ数をそれぞれ増大すると、完全な相互接続構成をサポートするのに必要なバス帯域幅の大きさの非線形な増大がもたらされる。バスの数およびバスの帯域幅は、プロセッサの数に比べて速く増加することは注目に値する。バスのバイト総数をより大きくすることが、親和性のない広帯域メモリの利用をサポートするために必要になる。より大規模なシステム、例えば8ウェイ・システムを提供するためにプロセッサの数を増すとき、バスにとって必要となるバイト総数は極端に大きくなる。あいにく、チップ外のバスを提供するのに利用可能な表面の面積が小さいので、それによって、バスの合計幅または数が、したがって各チップによって直接サポートできる実際の帯域幅が厳しく制限される。
以上のように、外部接続のためにバスに割り当てられる、プロセッサ・チップ上で利用可能な表面積(または周辺部)が比較的小さいので、このプロセッサ・システム中でプロセッサ数を増加するごとに、ますます限定的で非実用的なものとなる。しかし、より多くのプロセッサ数をもつさらにより複雑なシステムは依然として必要とされている。上記の階層スイッチを含むこれらのシステムを提供することは、非常に高くつき、非効率でもある。
したがって、メモリの待ち時間がより長くなり、帯域幅が減少し、より多くのワイヤおよびスイッチ、ロジック、およびその他外部構成要素に起因するコストの増大、必要な電力およびシステムを構築するための物理的場所の増大を含めて、上記のスイッチ・トポロジを利用する際のいくつかの不利な点が認識されている。
特許出願第10/425421号(整理番号AUS920020206US1)、「技術的および商用の作業負荷をサポートする新しい接続を有するデータ処理システム(Data Processing System Having Novel Interconnect For Supporting BothTechnical and Commercial Workloads)」
本発明は、チップ上に実用的より多くのバスを必要とせず、スケーリングによってより大規模なシステムを提供する、Nウェイ・システムとして構成されるマルチプロセッサ・システム(MP)が提供できれば望ましいはずであることを認識したものである。大幅な再構成なしに、より大規模でスケーラブルな処理システム用のビルディング・ブロックとして利用できるMPは、歓迎される改善となるはずである。以上その他の利点が、本明細書に記載の本発明によって提供される。
複数のプロセッサおよび結合された分散メモリを用いて構成されるプロセッサ・ブックを提供する方法およびシステムが開示されている。2つの4チップMCM(multi-chip moduleマルチチップ・モジュール)をプロセッサ・ブックを作成するためのビルディング・ブロックとして利用する。第1および第2のMCMは、そのそれぞれのプロセッサを相互接続するプロセッサ−プロセッサ間配線を用いて構成される。第1のMCMの各チップの外部ピンを第2のMCMの対応するチップと結びつけ、その逆もまた同様に結びつける追加の配線が提供される。この追加のワイヤ接続により、第1のMCMの各プロセッサに第2のMCMの処理能力および分散メモリ構成要素に対するアクセスが提供され、このメモリ構成要素は、どのプロセッサに対しても親和性なしに動作し、その逆も同様である。
プロセッサ・ブック中の各チップへ他のチップから、また各チップから他のチップへのデータの経路指定を制御するための経路指定ロジックが、各チップ内に提供される。一実施形態では、経路指定ロジックは、商用作業負荷のプロセッサ・ブックまたは技術用作業負荷のプロセッサ・ブックとして動作するように後でプロセッサ・ブックを構成できるようにするためのソフトウェア設定可能なロジック構成要素を含む。
接続を完成するのに必要なバスの総数は、直接プロセッサ−プロセッサ間接続を提供する、従来技術の8ウェイ・システムで必要とされる数よりかなり少なく、階層的なスイッチ・ベース・システムに伴うコスト(追加のロジックなど)は、現実には発生しない。
このプロセッサ・ブックの実装形態をビルディング・ブロックとして用いて、複数のプロセッサ・ブックを接続する複数のレセプタをもつシステム・ラックを備える大規模なシステムを提供することができる。このシステム・ラックは、レセプタの1つにプラグされる各プロセッサ・ブックが、分散メモリを共用するより大きなプロセッサのシステムの一部となるように配線される。この経路指定ロジックは、システム・ラックに結合された一プロセッサ・ブックから他のプロセッサ・ブックへのコミュニケーションの外部経路指定をサポートするために必要とされるロジックを含む。
本発明の特徴と考えられる新規な特徴は、添付の特許請求の範囲に記載されている。しかし、本発明自体、ならびにその好ましい使用モード、さらなる目的、および利点については、実施形態の例についての以下の詳細な説明を参照し、添付図面と併せ読めば最も良く理解されよう。
本発明の上記、ならびに追加の目的、特徴、および利点は、以下の詳細に記述された説明の中で明らかとなろう。
本発明では、2個の相互接続されたマルチチップ・モジュール(MCM)からなる新しいプロセッサ・ブックが導入される。このプロセッサ・ブックは、ずっと大規模な商用または技術用のシステムを提供するために、システム・ラック上の他のプロセッサ・ブックに接続されるように設計されている。さらに、従来技術のマルチチップ構成とは異なり、プロセッサが全体のメモリ容量を表示できるようにして、利用可能なメモリ帯域幅がより有効に使用できるように、プロセッサ・ブックのプロセッサ内に経路指定ロジックが提供される。
したがって、本発明は、どのようなメモリ親和性もなしに(すなわち、完全集約モデル(fullyaggregate model)で)各プロセッサが分散メモリを完全に使い切ることができるプロセッサ構成で実装される。これを可能にする一方法は、プロセッサを接続する16バイトのバスでこの2ウェイ・システムを再構成するものである。このより大きなバスを用いると、この2ウェイ・システム、およびより大きなシステム内の各プロセッサが、その他のプロセッサのどれか1つに結合されたメモリ・ブロックに完全にアクセスすることが可能になる。次いで、この完全集約モデルを利用して、4つのプロセッサ・チップを有する完全相互接続構成の4ウェイMCMを設計する。
MCMでは、それぞれが1つまたは複数のプロセッサを備える2つ以上のプロセッサ・チップを、特定の帯域幅を有するバスで相互接続する。したがって、例えば4つのシングル・プロセッサ・チップを16バイトのバスで相互接続することによって、4つのプロセッサのマルチチップ・モジュール(MCM)を設計することができる。このMCMは、(図3に示すものなど)他の4ウェイ構成に比べて、より高い全体周波数、ならびにその他の利点を提供する。具体的には、このMCM構成により、従来のスイッチ・ベースの4ウェイ構成よりも商用負荷での性能が向上する。
図5は、4つのプロセッサによるMCMを示すものである(これは、4ウェイ・マルチプロセッサ(MP)とも呼ばれる)。図に示すように、MCM210は、MCMバス103によって相互接続された4つのシングル・プロセッサ・チップ201を含む。各プロセッサ・チップ201は、以下で説明するようにMCMロジック207を含む。MCM210のプロセッサ・チップ201は、複数対の16バイトMCMバス103を介して互いに相互接続され、情報をやりとりし、各対をなすMCMバス103は、16バイトのMCM入力バスと16バイトのMCM出力バスとを含む。図5によれば、各プロセッサ・チップは、MCM210上の他の2つのプロセッサ・チップに直接に結合されている。
各チップ201は、様々なバス上でのチップ間のデータ転送を管理する内部のMCM経路指定ロジック207を含む。MCM経路指定ロジック207は、MCM210内の構成要素への経路指定、ならびにMCM210の外部に接続された構成要素への経路指定を制御する。MCM経路指定ロジック207は、経路指定されるデータ構成要素内に含まれる宛先アドレスを読み取り、データ構成要素を経路指定すべき適切なバスを選択する。例えば、チップS上のプロセッサから、隣接するプロセッサ・チップ、TまたはVのいずれかのプロセッサへのコミュニケーション(命令もプロセッサ・チップ間で経路指定できるが、本明細書ではデータ・コミュニケーションと総称する)は、2つのチップを直接に結合するMCMバス103上のチップSのMCM経路指定ロジック207によって送られる。しかし、チップS上のプロセッサからチップU(すなわち、論理的に最も遠く離れておりSに直接に結合されていないプロセッサ・チップ)上のプロセッサへのコミュニケーションが望ましいときには、MCM経路指定ロジック207は、2つの隣接したプロセッサ・チップ、TまたはVのうちの1つを横切るホップを介してチップU上のプロセッサにこのコミュニケーションを送る。ホップの各段階における経路指定は、特定のチップ上のMCM経路指定ロジック207が制御する。隣接していないプロセッサ間の各コミュニケーション・パスでは、余分なホップが必要とされるので待ち時間がより長くなる。
MCM210内の各チップは、各ダイに直接に接続される追加のバスを介して、メモリ(図示せず)およびI/O装置(図示せず)を含めて他の外部構成要素に接続されている。外部構成要素(すなわち、他方のプロセッサ以外の構成要素)を接続するのに利用可能な追加のバスの数は、チップ・サイズの関数となる。一般に、各ダイには一定数のバスしか接続できず、したがって、各チップの接続性は、一定数のバスによって限定される。したがって、4チップのMCMは効率的に設計されているものの、階層スイッチ相互接続をもつ図4の8プロセッサ、または8チップのシステムでは、性能またはコストはスケーリングされない。
本発明を、図5のMCMと類似した、2つの相互接続した4ウェイのMCM(すなわち、ダイ当たり1つのシングル・プロセッサを有するチップ4個を含むMCM2個)からなる8ウェイのSMPブックを具体的に参照して以下で説明する。本明細書に記載の特徴および8ウェイSMPブックの具体的参照は、例示のためにすぎず、本発明を限定するものと解釈すべきでないこと、そして本発明を、ダイ当たり複数のプロセッサを有し、またはSMPブック当たりより多くのチップを有するより複雑なシステムにも同様に適用できることが、当業者には理解されよう。
本発明は、多数の処理構成要素、大容量のサポート・メモリ、およびプロセッサ・チップの所与のサイズに対して実用性を超えたスケーリングを必要としない相互接続性を有する大規模な処理システムを実現するためのビルディング・ブロックを提供する。詳細には、本発明では、個々の8ウェイのデータ処理システム(以下では、プロセッサ・ブックと呼ぶ)を提供し、次いで、これらプロセッサ・ブックをより複雑なMPを実現するためのビルディング・ブロックとして利用することにより、商用および技術用の作業負荷を処理するより複雑なシステムに対する必要性に対処している。
図6および図7は、本発明によるプロセッサ・ブック(すなわち、2つの相互接続された4プロセッサMCMのホストとして働くマザー・ボード)と呼ばれる8ウェイSMPの2つの構成を示すものである。図に示すように、プロセッサ・ブック200は、第1のMCM(すなわち、プロセッサ・チップ201、および関連するメモリ構成要素205A)と第2のMCM(プロセッサ・チップ203、および関連するメモリ構成要素205B)とを備える。第1のMCMも第2のMCMも共に、図5のMCM210と類似の4ウェイMCMである。
図7に示すように、プロセッサを直接に相互接続する8バイトのMCMチップ−チップ間バス103に加えて、MCM210のプロセッサ・チップ201は、以下の追加のバス、すなわち2つの8バイトMCM ECB(拡張制御バス)209と、2つの8バイトMCM−MCM間バス211と、8バイトのメモリ入力バスおよび16バイトのメモリ出力バスを含む1対のメモリ・バス213と、2つの8バイトI/Oバス215とを含む。
プロセッサ・ブック200の各チップはまた、MCM経路指定ロジック207を含み、これはまた、第1のMCMと第2のMCMとの間のコミュニケーションの経路指定も管理する。MCM経路指定ロジック207は、MCM−MCM間バス211およびMCM ECB209を含めてMCMの外部バスのすべてで行われる経路指定を制御する。図に示すように、(例えばS0−S1、T0−T1など)第1のMCMの各プロセッサ・チップへ第2のMCMの対応するプロセッサ・チップから、また第1のMCMの各プロセッサ・チップから第2のMCMの対応するプロセッサ・チップへと、1対のMCM−MCM間バス211が通っている。
図6も図7も共に、MCM拡張バス209を含めて、プロセッサ・ブック200内の第1のMCMと第2のMCMのプロセッサ間の相互接続を示すものである。各MCMのプロセッサ・チップ201、203は、互いに16バイトのチップ−チップ間バス103を介して相互接続され、各チップがそれぞれのMCM上の両方の隣接するプロセッサ・チップからの16バイトの入力バスと16バイトの出力バスを有している。個々のプロセッサ・チップ201、203には分散メモリ205が接続され、分散メモリの各ブロックは1対のバス213を介してそれぞれのプロセッサ・チップに接続されている。一実施形態では、対をなすバスは、8バイトのデータ入力バスおよび16バイトのデータ出力バス213を備える。一連のMCM ECB209も示されており、これは、プロセッサ・チップ201、203に、図3に示すような外部構成要素への接続性を提供する。本発明によれば、商用MPでは、MCM ECB209を利用して、プロセッサ・ブックを別の8ウェイSMPなど外部の他のプロセッサ・ブックに相互接続する。
プロセッサ・ブックの動作時に、第1のMCMから第2のMCMへのコミュニケーションには、8バイト・バス上での少なくとも1回の転送が常に必要になる、例えば、S0からS1へのコミュニケーションは、MCMバス211上で直接に経路指定される。S0からU1へのコミュニケーションには、8バイトのMCMバス上でプロセッサ・ブックを横切ってU1へと伝送する前に、MCMの16バイトのバスに沿って2つの中間ホップ(すなわち、S0−T0−U0)が必要なことは注目すべきである。あるいは、同じそのコミュニケーションをパスS0−S1−T1−U1を経由して経路指定することもできる。取るべき正確な経路の決定は、様々なパス上の現在の使用状況に基づいてMCM経路指定ロジック207が行う。どのパスを取るかにはかかわらずコミュニケーションは、宛先に到達する前に、2つのホップを行う。
図6および図7に示す構成に従って設計される複数の8ウェイ処理システムは、しばしば、図8および図9で示す方式で互いに接続されて、大規模な商用処理システム(すなわち、それぞれが商用データ作業負荷を処理するのに必要な機能的特徴を有するプロセッサを多数用いて設計されるマルチプロセッサ・システム)を作成する。一般的に、商用作業負荷では、大量の処理資源およびキャッシュ・サイトを含む処理システムが必要となるが、大きなメモリ帯域幅またはデータ転送効率は必要とはしない。商用処理では、(追加のホップに起因する)チップ間コミュニケーションのメモリの待ち時間は許容可能である。しかし、これらのホップは、メモリの非効率な利用をもたらすので、効率のよい技術用SMPを構築するには最適ではないことになる。その結果、上記のプロセッサ・ブック構成は、以下で述べるようにこれらの欠陥の影響をあまり受けない商用作業負荷を処理するようにより最適化される。
図8は、互いに配線して本発明の一実施形態による商用SMP310(すなわち、商用作業負荷を処理するように設計されたSMP)を形成する一連のプロセッサ・ブック200を示すものである。商用分野では、大規模なデータ処理システムは通常、大きな処理能力を必要とする。この処理能力を実現するために、プロセッサ・チップのMCM ECB209を使用して複数のプロセッサ・ブック200を一緒にまとめて配線する。プロセッサ・ブック200の第1および第2のMCMを通っているこれらのバスを示す。このようにして、N×8ウェイ(例えば、32W、48W、64Wなど)の商用SMPシステムが提供される。ただし、Nは正の整数である。
図9は、システム・ラック300上にプロセッサを組み立てた図8と同様の構成を示している。システム・ラック300は、例えば、業界標準の19”ラックなど、受動的バックプレーンを備え、そのバックプレーン上に、(図10に示す)複数のプロセッサ・ブックを同時に相互接続するための複数のバックプレーン・コネクタが設けられている。図10に、システム・ラック300のバックプレーン・コネクタ321の一例を示す。プロセッサ・ブック200の例も示されており、このプロセッサ・ブックは、システム・ラック300のバックプレーン・コネクタ321中に「プラグする」プラグイン・コネクタ325を含む。
プラグイン・コネクタ325は、プロセッサ・ブック200のMCM ECB209の終端ワイヤとなるピンを含む。したがって、プロセッサ・ブック200の8プロセッサ構成によれば、プラグイン・コネクタ325は、8出力のECBのそれぞれ、および8入力のECBのそれぞれに対して別々のコネクタ・ピンを含む。システム・ラック300の製造を、プロセッサ・ブック200の製造とは別々に完了し、したがって、異なる製造技術または設計あるいはその両方を利用して、プロセッサ・ブック200をシステム・ラック300へと接続、最終的には互いのプロセッサ・ブックへと接続することを可能にすることができる。
システム・ラック300の受動的バックプレーンは、ベース材料中に網目状に作り込まれた配線を含み、その配線は、図8に示す接続と同様にシステム・ラック300上で各バックプレーン・コネクタ321を相互に接続する。商用用途では、プロセッサ・ブック200をプラグイン・コネクタ325を介してシステム・ラック300のバックプレーン・コネクタ321にプラグするとき、プロセッサ・ブック200のMCM ECB209は、図8および図9に示すものと同様にしてラック上の隣接するプロセッサ・ブックのMCM ECB209に接続される。したがって、システム・ラック300を使用することにより、ますます大規模な商用SMPの構築に際して、システム・ラック300のサイズとそれに接続されるプロセッサ・ブックの数に応じて、スケーリングすることが可能になる。
プロセッサ・ブック間のコミュニケーションは、各プロセッサ・ブック上に配置されるロジック207によって制御される。ロジック207は、データを1つのブックから別の隣接するブックへと渡すことができるようにする経路指定プロトコルを提供する。データを第1のプロセッサ・ブックのチップU0上のプロセッサから別のプロセッサ・ブックのプロセッサS0へと転送するとき、このプロセッサ・ブック内の転送(U0−T0−S0またはU0−V0−S0)は、16バイトのMCMバス203上のMCM経路指定ロジック207の内部経路指定機能によって制御されるが、プロセッサ・ブックを横切る転送(S0−S0)は、8バイトのMCM ECB209上のMCM経路指定ロジック207の外部経路指定機能によって制御される。
さらに、再構成/再配線プロセッサ・ブックを用いると、どのようなメモリ親和性をも必要とせずまたは示さずに、すべてのメモリにわたる8ウェイのSMPが実現される。データ伝送の帯域幅を広げることによって、必要なデータ転送がデータ・バスに対するアクセス権を得る前に他のプロセスを待つ必要がないので、各メモリ・サブシステムはほぼ容量の100%を利用して実行できるようになる。したがって、もともと商用作業負荷に対して設計された8ウェイのプロセッサ・ブックから、より広いメモリ帯域幅とより短いメモリ待ち時間を実現することができ、その結果、このプロセッサ・ブックが、技術用作業負荷をサポートするように最適化される。
本発明を具体的な実施形態に関して説明してきたが、この説明を限定的な意味で解釈すべきではない。開示の実施形態の様々な変更形態、ならびに本発明の代替実施形態が、本発明の説明を参照すれば当業者には明らかとなるであろう。例えば、各チップが1つのECB出力と1つのECB入力を有するものとして図示し説明してきたが、他のバスの数も本発明の範囲に含まれる(例えば、プロセッサごとに別々のECB)。また、8ウェイのプロセッサ・ブックとして説明してきたが、本発明は、異なるサイズのプロセッサ・ブックを用いても実装することができる。例えば、同じMCM−MCM構成中でチップ当たり2つのプロセッサを備える16ウェイのプロセッサ・ブックも利用することができる。したがって、添付の特許請求の範囲で定義される本発明の趣旨および範囲を逸脱することなく、かかる変更を行うことができることが企図されている。
まとめとして、本発明の構成に関して以下の事項を開示する。
(1)第1のプロセッサ・チップ・モジュールの内部にある第1組のモジュール内バスによって相互接続され、少なくともプロセッサ・チップSおよびTを含む第1の複数のプロセッサ・チップを含む前記第1のプロセッサ・チップ・モジュールと、
第2のプロセッサ・チップ・モジュールの内部にある第2組のモジュール内バスによって相互接続され、プロセッサ・チップSおよびTを含む第2の複数のプロセッサ・チップを含む前記第2のプロセッサ・チップ・モジュールと、
前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの外部にあり、前記第1のプロセッサ・チップ・モジュールのうちの各プロセッサ・チップを前記第2のプロセッサ・チップ・モジュールのうちの対応するプロセッサ・チップにそれぞれ接続する第3組のバスであって、SがSに接続し、TがTに接続するバスと、
プロセッサ・ブック中のそれぞれのプロセッサ・チップにそれぞれ接続された複数の外部経路指定バスを含み、前記プロセッサ・チップのそれぞれに外部バスを経由して外部接続ポイントを提供する手段と
を備えるプロセッサ・ブック。
(2)前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの前記プロセッサ・チップのそれぞれに結合された個々のメモリ構成要素をもつ分散メモリをさらに備え、
前記第1、第2、および第3組のバスが、メモリ親和性のない前記プロセッサ・チップ内の各プロセッサによる、前記個々のメモリ構成要素のそれぞれに対するアクセスを可能にするバス帯域幅を提供する、上記(1)に記載のプロセッサ・ブック。
(3)さらに、前記第4組のバスが、同様の構成の別のグループのプロセッサ・チップ・モジュールに対する接続を提供する、上記(1)に記載のプロセッサ・ブック。
(4)さらに、前記第4組のバスが、前記プロセッサ・チップから前記第4組のバス内の各バスに相当するピンを備えるコネクタ中へと延びる、上記(2)に記載のプロセッサ・ブック。
(5)前記第1組のバスおよび前記第2組のバスが、16バイト・バスであり、前記第3組のバスが、8バイト・バスである、上記(1)に記載のプロセッサ・ブック。
(6)各メモリ構成要素が、そのそれぞれのプロセッサ・チップに8バイト・データ入力バスおよび16バイト・データ出力バスを介して結合される、上記(5)に記載のプロセッサ・ブック。
(7)それぞれ前記プロセッサ・チップのうちの1つに結合され、外部入力を受け取り、それぞれのプロセッサ・チップからの出力を送り出す手段を提供する第5組の入出力(I/O)バスをさらに備える、上記(1)に記載のプロセッサ・ブック。
(8)前記プロセッサ・チップのうちのそれぞれ1つに関連し、前記プロセッサ・ブック内のデータ転送を、前記第1のプロセッサ・チップ・モジュールから前記第2のプロセッサ・チップ・モジュールへと、また前記第2のプロセッサ・チップ・モジュールから前記第1のプロセッサ・チップ・モジュールへとを含めて1つのプロセッサ・チップから別のプロセッサ・チップへと導く、経路指定ロジックをさらに含む、上記(1)に記載のプロセッサ・ブック。
(9)第1のプロセッサ・チップ・モジュールの内部にある第1組のモジュール内バスによって相互接続され、少なくともプロセッサ・チップSおよびTを含む第1の複数のプロセッサ・チップを含む第1のプロセッサ・チップ・モジュールと、
第2のプロセッサ・チップ・モジュールの内部にある第2組のモジュール内バスによって相互接続され、プロセッサ・チップSおよびTを含む第2の複数のプロセッサ・チップを含む第2のプロセッサ・チップ・モジュールと、
前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの外部にあり、プロセッサ・チップS、T、U、およびVのそれぞれを、プロセッサ・チップSおよびTのそれぞれ1つに相互接続する第3組のバスと、
プロセッサ・ブック中のそれぞれのプロセッサ・チップにそれぞれ接続された複数の外部経路指定バスを含み、前記外部経路指定バスが、プロセッサ・ブックの外部にある構成要素用の接続ポイントを提供する、前記プロセッサ・ブックから外部に延びる第4組のバスと
を含む、外部接続ポイントを有するプロセッサ・ブック、ならびに
前記プロセッサ・ブックの外部にあり、前記外部接続ポイントを介して前記プロセッサ・ブックに結合される構成要素を
備えるデータ処理システム。
(10)前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの前記プロセッサ・チップのそれぞれに結合された個々のメモリ構成要素を有する分散メモリをさらに備え、
前記第1、第2、および第3組のバスが、メモリ親和性のない前記プロセッサ・チップ内の各プロセッサによる、前記個々のメモリ構成要素のそれぞれに対するアクセスを可能にするバス帯域幅を提供する、上記(9)に記載のデータ処理システム。
(11)さらに、前記第4組のバスが、同様の構成の別のグループのプロセッサ・チップ・モジュールに対する接続を提供する、上記(9)に記載のデータ処理システム。
(12)さらに、前記第4組のバスが、前記プロセッサ・チップから前記第4組のバス内の各バスに相当するピンを備えるコネクタ中へと延びる、上記(10)に記載のデータ処理システム。
(13)前記第1組のバスおよび前記第2組のバスが、16バイト・バスであり、前記第3組のバスが、8バイト・バスである、上記(9)に記載のデータ処理システム。
(14)各メモリ構成要素が、そのそれぞれのプロセッサ・チップに8バイト・データ入力バスおよび16バイト・データ出力バスを介して結合される、上記(13)に記載のデータ処理システム。
(15)それぞれ前記プロセッサ・チップのうちの1つに結合され、外部入力を受け取り、それぞれのプロセッサ・チップからの出力を送り出す手段を提供する第5組の入出力(I/O)バスをさらに備える、上記(9)に記載のデータ処理システム。
(16)前記プロセッサ・チップのうちのそれぞれ1つに関連し、前記プロセッサ・ブック内のデータ転送を、前記第1のMCMから前記第2のMCMへと、また前記第2のMCMから前記第1のMCMへとを含めて1つのプロセッサ・チップから別のプロセッサ・チップへと導く、経路指定ロジックをさらに含む、上記(9)に記載のデータ処理システム。
(17)プロセッサ・ブックのプラグイン・ヘッドを受ける複数のコネクタを有するバックプレーンを含み、前記複数のコネクタのうちの各コネクタが、順次お互いに配線されるプロセッサ・ラックと、
前記複数のコネクタのうちの第1のコネクタに結合された前記プラグイン・ヘッドを有する第1のプロセッサ・ブックとを備えるデータ処理システムであって、前記プロセッサ・ブックが、
第1のプロセッサ・チップ・モジュールの内部にある第1組のモジュール内バスによって相互接続され、少なくともプロセッサ・チップSおよびTを含む第1の複数のプロセッサ・チップを含む第1のプロセッサ・チップ・モジュールと、
第2のプロセッサ・チップ・モジュールの内部にある第2組のモジュール内バスによって相互接続され、プロセッサ・チップSおよびTを含む第2の複数のプロセッサ・チップを含む第2のプロセッサ・チップ・モジュールと、
前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの外部にあり、
プロセッサ・チップS、T、U、およびVのそれぞれを、プロセッサ・チップSおよびTのそれぞれ1つに相互接続する第3組のバスと、
前記プロセッサ・ブック中のそれぞれのプロセッサ・チップにそれぞれ接続された複数の外部経路指定バスを含み、前記外部経路指定バスが、前記プロセッサ・ブックの外部にある構成要素用の接続ポイントを提供する、前記プロセッサ・ブックから外部に延びる第4組のバスと
を備える、データ処理システム。
(18)前記プロセッサ・ブックが、前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの前記プロセッサ・チップのそれぞれに結合された個々のメモリ構成要素を有する分散メモリをさらに備え、
前記第1、第2、および第3組のバスが、メモリ親和性のない前記プロセッサ・チップ内の各プロセッサによる、前記個々のメモリ構成要素のそれぞれに対するアクセスを可能にするバス帯域幅を提供する、上記(17)に記載のデータ処理システム。
(19)前記プロセッサ・ブックが、やはり前記複数のコネクタのうちの第2のコネクタに結合された第2のプロセッサ・ブックをさらに備え、前記第2のプロセッサ・ブックが、前記第1のプロセッサ・ブックと同様の構成であり、前記プロセッサ・ラック上の前記第1のコネクタと前記第2のコネクタの間のワイヤ接続を介して前記第1のプロセッサ・ブックと相互接続される、上記(17)に記載のデータ処理システム。
(20)さらに、前記第4組のバスが、前記第1のプロセッサ・チップから前記プラグイン・ヘッドへと延び、前記プラグイン・ヘッド内のピン・コネクタとして終端する、上記(18)に記載のデータ処理システム。
(21)前記第1のプロセッサ・ブック上でも前記第1のプロセッサ・ブック外でも前記第2のプロセッサ・ブックに至るように、データ伝送およびコミュニケーション用の経路指定パスを選択する、前記第1のプロセッサ・ブック上の経路指定ロジックをさらに含む、上記(19)に記載のデータ処理システム。
(22)あるコネクタがそれに結合されたプロセッサ・ブックを含まないときに、前記プロセッサ・ラック内で完全な接続パスが常に提供されるように、前記コネクタから別のコネクタへの接続を完成する配線手段をさらに備える、上記(17)に記載のデータ処理システム。
従来技術による、従来のNウェイの処理システムの発展を示すブロック図である。 従来技術による、従来のNウェイの処理システムの発展を示すブロック図である。 従来技術による、従来のNウェイの処理システムの発展を示すブロック図である。 従来技術による、従来のNウェイの処理システムの発展を示すブロック図である。 本発明の一実施形態によるプロセッサ・ブックのビルディング・ブロックとして利用される4ウェイのマルチチップ・モジュール(MCM)を示すブロック図である。 本発明の一実施形態による、図5の2つのMCMを相互接続することによって設計され、商用作業負荷のプロセッサ・ブック、または技術用作業負荷のプロセッサ・ブックとして利用することができる8ウェイのプロセッサ・ブックを示す図である。 本発明の一実施形態による、図5の2つのMCMを相互接続することによって設計され、商用作業負荷のプロセッサ・ブック、または技術用作業負荷のプロセッサ・ブックとして利用することができる8ウェイのプロセッサ・ブックを示す図である。 本発明の一実施形態による、商用作業負荷のサーバを提供するための、システム・ラック上のMCMの外部コネクタ・バス(ECB)を介して相互接続されたN個の図6の8ウェイのプロセッサ・ブックを備えるN×8ウェイのSMPを示す図である。 本発明の一実施形態による、商用作業負荷のサーバを提供するための、システム・ラック上のMCMの外部コネクタ・バス(ECB)を介して相互接続されたN個の図6の8ウェイのプロセッサ・ブックを備えるN×8ウェイのSMPを示す図である。 本発明の一実施形態による、図8および図9のシステム・ラックに対する各8ウェイのプロセッサ・ブックの接続メカニズムを示すブロック図である。
符号の説明
103 MCMバス
200 プロセッサ・ブック
201 シングル・プロセッサ・チップ
205 分散メモリ
205A 関連するメモリ構成要素
205B 関連するメモリ構成要素
207 MCMロジック、MCM経路指定ロジック
209 MCM ECBバス
210 MCM
211 MCM−MCM間バス
213 メモリ・バス
215 8バイトI/Oバス
300 システム・ラック
310 商用SMP
321 バックプレーン・コネクタ
325 プラグイン・コネクタ

Claims (18)

  1. 第1のプロセッサ・チップ・モジュールの内部にある第1組のモジュール内バスによって相互接続され、少なくともプロセッサ・チップS0およびT0を含む第1の複数のプロセッサ・チップを含む前記第1のプロセッサ・チップ・モジュールと、
    第2のプロセッサ・チップ・モジュールの内部にある第2組のモジュール内バスによって相互接続され、プロセッサ・チップS1およびT1を含む第2の複数のプロセッサ・チップを含む前記第2のプロセッサ・チップ・モジュールと、
    前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの外部にあり、前記第1のプロセッサ・チップ・モジュールのうちの各プロセッサ・チップを前記第2のプロセッサ・チップ・モジュールのうちの対応するプロセッサ・チップにそれぞれ接続する第3組のバスであって、S0がS1に接続し、T0がT1に接続するバスと、
    電子回路基板中のそれぞれのプロセッサ・チップにそれぞれ接続された複数の外部経路指定バスを含み、前記プロセッサ・チップのそれぞれに外部バスを経由して外部接続ポイントを提供する手段と
    前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの前記プロセッサ・チップのそれぞれに結合された個々のメモリ構成要素をもつ分散メモリを備え、
    前記第1、第2、および第3組のバスが、メモリ親和性のない前記プロセッサ・チップ内の各プロセッサによる、前記個々のメモリ構成要素のそれぞれに対するアクセスを可能にするバス帯域幅を提供する、電子回路基板
  2. さらに、第4組のバスが、同様の構成の別のグループのプロセッサ・チップ・モジュールに対する接続を提供する、請求項1に記載の電子回路基板
  3. さらに、第4組のバスが、前記プロセッサ・チップから前記第4組のバス内の各バスに相当するピンを備えるコネクタ中へと延びる、請求項に記載の電子回路基板
  4. 前記第1組のバスおよび前記第2組のバスが、16バイト・バスであり、前記第3組のバスが、8バイト・バスである、請求項1に記載の電子回路基板
  5. 各メモリ構成要素が、そのそれぞれのプロセッサ・チップに8バイト・データ入力バスおよび16バイト・データ出力バスを介して結合される、請求項に記載の電子回路基板
  6. それぞれ前記プロセッサ・チップのうちの1つに結合され、外部入力を受け取り、それぞれのプロセッサ・チップからの出力を送り出す手段を提供する第5組の入出力(I/O)バスをさらに備える、請求項1に記載の電子回路基板
  7. 前記プロセッサ・チップのうちのそれぞれ1つに関連し、前記電子回路基板内のデータ転送を、前記第1のプロセッサ・チップ・モジュールから前記第2のプロセッサ・チップ・モジュールへと、また前記第2のプロセッサ・チップ・モジュールから前記第1のプロセッサ・チップ・モジュールへとを含めて1つのプロセッサ・チップから別のプロセッサ・チップへと導く、経路指定ロジックをさらに含む、請求項1に記載の電子回路基板
  8. 第1のプロセッサ・チップ・モジュールの内部にある第1組のモジュール内バスによって相互接続され、少なくともプロセッサ・チップS0およびT0を含む第1の複数のプロセッサ・チップを含む第1のプロセッサ・チップ・モジュールと、
    第2のプロセッサ・チップ・モジュールの内部にある第2組のモジュール内バスによって相互接続され、プロセッサ・チップS1およびT1を含む第2の複数のプロセッサ・チップを含む第2のプロセッサ・チップ・モジュールと、
    前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの外部にあり、プロセッサ・チップS0、T0、U0、およびV0のそれぞれを、プロセッサ・チップS1およびT1のそれぞれ1つに相互接続する第3組のバスと、
    電子回路基板中のそれぞれのプロセッサ・チップにそれぞれ接続された複数の外部経路指定バスを含み、前記外部経路指定バスが、電子回路基板の外部にある構成要素用の接続ポイントを提供する、前記電子回路基板から外部に延びる第4組のバスと
    を含む、外部接続ポイントを有する電子回路基板、ならびに
    前記電子回路基板の外部にあり、前記外部接続ポイントを介して前記電子回路基板に結合される構成要素を備え、
    前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの前記プロセッサ・チップのそれぞれに結合された個々のメモリ構成要素を有する分散メモリをさらに備え、
    前記第1、第2、および第3組のバスが、メモリ親和性のない前記プロセッサ・チップ内の各プロセッサによる、前記個々のメモリ構成要素のそれぞれに対するアクセスを可能にするバス帯域幅を提供する、データ処理システム
  9. さらに、前記第4組のバスが、同様の構成の別のグループのプロセッサ・チップ・モジュールに対する接続を提供する、請求項に記載のデータ処理システム。
  10. さらに、前記第4組のバスが、前記プロセッサ・チップから前記第4組のバス内の各バスに相当するピンを備えるコネクタ中へと延びる、請求項に記載のデータ処理システム。
  11. 前記第1組のバスおよび前記第2組のバスが、16バイト・バスであり、前記第3組のバスが、8バイト・バスである、請求項に記載のデータ処理システム。
  12. 各メモリ構成要素が、そのそれぞれのプロセッサ・チップに8バイト・データ入力バス
    および16バイト・データ出力バスを介して結合される、請求項11に記載のデータ処理システム。
  13. それぞれ前記プロセッサ・チップのうちの1つに結合され、外部入力を受け取り、それぞれのプロセッサ・チップからの出力を送り出す手段を提供する第5組の入出力(I/O)バスをさらに備える、請求項に記載のデータ処理システム。
  14. 前記プロセッサ・チップのうちのそれぞれ1つに関連し、前記電子回路基板内のデータ転送を、前記第1のMCMから前記第2のMCMへと、また前記第2のMCMから前記第1のMCMへとを含めて1つのプロセッサ・チップから別のプロセッサ・チップへと導く、経路指定ロジックをさらに含む、請求項に記載のデータ処理システム。
  15. 電子回路基板のプラグイン・ヘッドを受ける複数のコネクタを有するバックプレーンを含み、前記複数のコネクタのうちの各コネクタが、順次お互いに配線されるプロセッサ・ラックと、
    前記複数のコネクタのうちの第1のコネクタに結合された前記プラグイン・ヘッドを有する第1の電子回路基板とを備えるデータ処理システムであって、前記電子回路基板が、
    第1のプロセッサ・チップ・モジュールの内部にある第1組のモジュール内バスによって相互接続され、少なくともプロセッサ・チップS0およびT0を含む第1の複数のプロセッサ・チップを含む第1のプロセッサ・チップ・モジュールと、
    第2のプロセッサ・チップ・モジュールの内部にある第2組のモジュール内バスによって相互接続され、プロセッサ・チップS1およびT1を含む第2の複数のプロセッサ・チップを含む第2のプロセッサ・チップ・モジュールと、
    前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの外部にあり、
    プロセッサ・チップS0、T0、U0、およびV0のそれぞれを、プロセッサ・チップS1およびT1のそれぞれ1つに相互接続する第3組のバスと、
    前記電子回路基板中のそれぞれのプロセッサ・チップにそれぞれ接続された複数の外部経路指定バスを含み、前記外部経路指定バスが、前記電子回路基板の外部にある構成要素用の接続ポイントを提供する、前記電子回路基板から外部に延びる第4組のバスを備え、
    前記電子回路基板が、前記第1のプロセッサ・チップ・モジュールおよび前記第2のプロセッサ・チップ・モジュールの前記プロセッサ・チップのそれぞれに結合された個々のメモリ構成要素を有する分散メモリをさらに備え、
    前記第1、第2、および第3組のバスが、メモリ親和性のない前記プロセッサ・チップ内の各プロセッサによる、前記個々のメモリ構成要素のそれぞれに対するアクセスを可能にするバス帯域幅を提供する、データ処理システム
  16. 前記電子回路基板が、やはり前記複数のコネクタのうちの第2のコネクタに結合された第2の電子回路基板をさらに備え、前記第2の電子回路基板が、前記第1の電子回路基板と同様の構成であり、前記プロセッサ・ラック上の前記第1のコネクタと前記第2のコネクタの間のワイヤ接続を介して前記第1の電子回路基板と相互接続される、請求項15に記載のデータ処理システム。
  17. さらに、前記第4組のバスが、前記第1のプロセッサ・チップから前記プラグイン・ヘッドへと延び、前記プラグイン・ヘッド内のピン・コネクタとして終端する、請求項15に記載のデータ処理システム。
  18. 前記第1の電子回路基板上でも前記第1の電子回路基板外でも前記第2の電子回路基板に至るように、データ伝送およびコミュニケーション用の経路指定パスを選択する、前記第1の電子回路基板上の経路指定ロジックをさらに含む、請求項16に記載のデータ処理システム。
JP2004128842A 2003-04-28 2004-04-23 大規模でスケーラブルなプロセッサ・システムを構築するための電子回路基板 Expired - Fee Related JP3992148B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/425,420 US20040236891A1 (en) 2003-04-28 2003-04-28 Processor book for building large scalable processor systems

Publications (2)

Publication Number Publication Date
JP2004326799A JP2004326799A (ja) 2004-11-18
JP3992148B2 true JP3992148B2 (ja) 2007-10-17

Family

ID=33449614

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004128842A Expired - Fee Related JP3992148B2 (ja) 2003-04-28 2004-04-23 大規模でスケーラブルなプロセッサ・システムを構築するための電子回路基板

Country Status (5)

Country Link
US (1) US20040236891A1 (ja)
JP (1) JP3992148B2 (ja)
KR (1) KR100600928B1 (ja)
CN (1) CN1542604A (ja)
TW (1) TW200511109A (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7171499B2 (en) * 2003-10-10 2007-01-30 Advanced Micro Devices, Inc. Processor surrogate for use in multiprocessor systems and multiprocessor system using same
US7661006B2 (en) * 2007-01-09 2010-02-09 International Business Machines Corporation Method and apparatus for self-healing symmetric multi-processor system interconnects
US8140731B2 (en) * 2007-08-27 2012-03-20 International Business Machines Corporation System for data processing using a multi-tiered full-graph interconnect architecture
US7769892B2 (en) * 2007-08-27 2010-08-03 International Business Machines Corporation System and method for handling indirect routing of information between supernodes of a multi-tiered full-graph interconnect architecture
US7840703B2 (en) 2007-08-27 2010-11-23 International Business Machines Corporation System and method for dynamically supporting indirect routing within a multi-tiered full-graph interconnect architecture
US8185896B2 (en) * 2007-08-27 2012-05-22 International Business Machines Corporation Method for data processing using a multi-tiered full-graph interconnect architecture
US7793158B2 (en) 2007-08-27 2010-09-07 International Business Machines Corporation Providing reliability of communication between supernodes of a multi-tiered full-graph interconnect architecture
US7904590B2 (en) * 2007-08-27 2011-03-08 International Business Machines Corporation Routing information through a data processing system implementing a multi-tiered full-graph interconnect architecture
US7769891B2 (en) 2007-08-27 2010-08-03 International Business Machines Corporation System and method for providing multiple redundant direct routes between supernodes of a multi-tiered full-graph interconnect architecture
US7822889B2 (en) * 2007-08-27 2010-10-26 International Business Machines Corporation Direct/indirect transmission of information using a multi-tiered full-graph interconnect architecture
US7809970B2 (en) 2007-08-27 2010-10-05 International Business Machines Corporation System and method for providing a high-speed message passing interface for barrier operations in a multi-tiered full-graph interconnect architecture
US7958182B2 (en) * 2007-08-27 2011-06-07 International Business Machines Corporation Providing full hardware support of collective operations in a multi-tiered full-graph interconnect architecture
US8108545B2 (en) * 2007-08-27 2012-01-31 International Business Machines Corporation Packet coalescing in virtual channels of a data processing system in a multi-tiered full-graph interconnect architecture
US8014387B2 (en) * 2007-08-27 2011-09-06 International Business Machines Corporation Providing a fully non-blocking switch in a supernode of a multi-tiered full-graph interconnect architecture
US7958183B2 (en) * 2007-08-27 2011-06-07 International Business Machines Corporation Performing collective operations using software setup and partial software execution at leaf nodes in a multi-tiered full-graph interconnect architecture
US7827428B2 (en) * 2007-08-31 2010-11-02 International Business Machines Corporation System for providing a cluster-wide system clock in a multi-tiered full-graph interconnect architecture
US7921316B2 (en) * 2007-09-11 2011-04-05 International Business Machines Corporation Cluster-wide system clock in a multi-tiered full-graph interconnect architecture
CN101216815B (zh) * 2008-01-07 2010-11-03 浪潮电子信息产业股份有限公司 一种双翼可扩展多处理器紧耦合共享存储器体系结构
US7779148B2 (en) * 2008-02-01 2010-08-17 International Business Machines Corporation Dynamic routing based on information of not responded active source requests quantity received in broadcast heartbeat signal and stored in local data structure for other processor chips
US8077602B2 (en) 2008-02-01 2011-12-13 International Business Machines Corporation Performing dynamic request routing based on broadcast queue depths
CN102461088B (zh) * 2009-06-18 2016-02-10 惠普开发有限公司 处理器拓扑切换器
US8417778B2 (en) 2009-12-17 2013-04-09 International Business Machines Corporation Collective acceleration unit tree flow control and retransmit
US8751655B2 (en) 2010-03-29 2014-06-10 International Business Machines Corporation Collective acceleration unit tree structure
FR2979444A1 (fr) * 2011-08-23 2013-03-01 Kalray Reseau sur puce extensible
CN102520769A (zh) * 2011-12-31 2012-06-27 曙光信息产业股份有限公司 服务器
KR102057246B1 (ko) * 2013-09-06 2019-12-18 에스케이하이닉스 주식회사 메모리 중심 시스템 인터커넥트 구조
US20150178092A1 (en) * 2013-12-20 2015-06-25 Asit K. Mishra Hierarchical and parallel partition networks
US9456506B2 (en) * 2013-12-20 2016-09-27 International Business Machines Corporation Packaging for eight-socket one-hop SMP topology
EP3182277A4 (en) * 2014-09-09 2018-09-19 Huawei Technologies Co. Ltd. Processor
CN104391750B (zh) * 2014-11-26 2018-05-04 浪潮(北京)电子信息产业有限公司 一种基于软件定义的混合异构主机系统
US10108377B2 (en) 2015-11-13 2018-10-23 Western Digital Technologies, Inc. Storage processing unit arrays and methods of use
US11379389B1 (en) * 2018-04-03 2022-07-05 Xilinx, Inc. Communicating between data processing engines using shared memory

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5006961A (en) * 1988-04-25 1991-04-09 Catene Systems Corporation Segmented backplane for multiple microprocessing modules
WO1994017488A1 (en) * 1993-01-22 1994-08-04 University Corporation For Atmospheric Research Multipipeline multiprocessor system

Also Published As

Publication number Publication date
TW200511109A (en) 2005-03-16
CN1542604A (zh) 2004-11-03
KR20040093392A (ko) 2004-11-05
US20040236891A1 (en) 2004-11-25
JP2004326799A (ja) 2004-11-18
KR100600928B1 (ko) 2006-07-13

Similar Documents

Publication Publication Date Title
JP3992148B2 (ja) 大規模でスケーラブルなプロセッサ・システムを構築するための電子回路基板
US7917729B2 (en) System on chip IC with subsystem of multiple processing cores switch coupled to network protocol device and bus bridge to local system bus
US6266797B1 (en) Data transfer network on a computer chip using a re-configurable path multiple ring topology
TWI364663B (en) Configurable pci express switch and method controlling the same
US9886275B1 (en) Multi-core processor using three dimensional integration
CN109240832B (zh) 一种硬件重构系统及方法
US6275975B1 (en) Scalable mesh architecture with reconfigurable paths for an on-chip data transfer network incorporating a network configuration manager
EP2936554A1 (en) Die-stacked device with partitioned multi-hop network
US20080209163A1 (en) Data processing system with backplane and processor books configurable to suppprt both technical and commercial workloads
CN116501681B (zh) Cxl数据传输板卡及控制数据传输的方法
KR20090073195A (ko) 상호연결 시스템에서의 스큐 관리
US6415424B1 (en) Multiprocessor system with a high performance integrated distributed switch (IDS) controller
US20050193178A1 (en) Systems and methods for flexible extension of SAS expander ports
JP2005518749A (ja) 埋込固定論理回路を有するプログラマブル・ゲートアレイのフロア計画
JP2004070954A (ja) システムバックプレーンによってカスタマイズされたモジュラーシステム
JP3709322B2 (ja) 多次元クロスバーネットワークおよび並列計算機システム
JPH0675930A (ja) 並列プロセッサシステム
CN116266463A (zh) 三维存储单元、存储方法、三维存储芯片组件和电子设备
US20080114918A1 (en) Configurable computer system
Lane et al. Gigabit optical interconnects for the connection machine
US6553447B1 (en) Data processing system with fully interconnected system architecture (FISA)
CN1979461A (zh) 多处理器模块
US20230280907A1 (en) Computer System Having Multiple Computer Devices Each with Routing Logic and Memory Controller and Multiple Computer Devices Each with Processing Circuitry
US20230283547A1 (en) Computer System Having a Chip Configured for Memory Attachment and Routing
Hsu et al. Performance evaluation of wire-limited hierarchical networks

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060613

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060627

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20060919

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20060922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070619

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070718

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100803

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees