JP2006513489A - クラスタ化されたコンピュータシステムのための適応プロセッサノードのスケーラブルな相互接続のためのシステムおよび方法 - Google Patents

クラスタ化されたコンピュータシステムのための適応プロセッサノードのスケーラブルな相互接続のためのシステムおよび方法 Download PDF

Info

Publication number
JP2006513489A
JP2006513489A JP2004566446A JP2004566446A JP2006513489A JP 2006513489 A JP2006513489 A JP 2006513489A JP 2004566446 A JP2004566446 A JP 2004566446A JP 2004566446 A JP2004566446 A JP 2004566446A JP 2006513489 A JP2006513489 A JP 2006513489A
Authority
JP
Japan
Prior art keywords
computer system
node
clustered
processing
cluster interconnect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004566446A
Other languages
English (en)
Inventor
ハッペンタール,ジョン・エム
Original Assignee
エス・アール・シィ・コンピューターズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エス・アール・シィ・コンピューターズ・インコーポレイテッド filed Critical エス・アール・シィ・コンピューターズ・インコーポレイテッド
Publication of JP2006513489A publication Critical patent/JP2006513489A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/167Interprocessor communication using a common memory, e.g. mailbox

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multi Processors (AREA)

Abstract

適応プロセッサまたは再構成可能なプロセッサベースのクラスタ化された計算システムおよび方法であって、適応プロセッサノードのスケーラブルな相互接続と、少なくとも第1および第2の処理ノードと、第1および第2の処理ノードを結合するクラスタ相互接続とを用い、少なくとも第1のノードは、適応可能な、または再構成可能な処理要素を含む。特定的な実現例において、クラスタ化されたコンピュータの第2の処理ノードは、マイクロプロセッサ、再構成可能な処理要素、または共有メモリブロックを含んでもよく、クラスタ相互接続は、イーサネット(登録商標)、ミリネット(登録商標)、クロスバースイッチなどとして提供され得る。

Description

関連特許出願との相互参照
本発明は、本発明の譲受人であるコロラド(Colorado)州コロラドスプリングス(Colorado Springs)のエス・アール・シィ・コンピューターズ・インコーポレイテッド(SRC Computers, Inc.)に譲渡された、2002年5月9日出願の「少なくとも1つの組込型マイクロプロセッサコアを有するフィールドプログラマブルゲートアレイ制御要素を組込んだ適応プロセッサアーキテクチャ(Adaptive Processor Architecture Incorporating a Field Programmable Gate Array Control Element Having at Least One Embedded Microprocessor Core)」と題された米国特許出願連続番号第10/142,045号、および、2002年10月29日出願の「適応プロセッサインターフェイスポートを用いてハイブリッド処理システム内で緊密結合するためのコンピュータシステムアーキテクチャおよびメモリコントローラ(Computer System Architecture and Memory Controller for Close- Coupling Within a Hybrid Processing System Utilizing an Adaptive Processor
Interface Port)」と題された米国特許出願連続番号第10/282,986号に開示された主題に関し、その開示はここに全文が引用により援用される。
発明の背景
本発明は、一般に、再構成可能な計算システムおよび方法の分野に関する。より特定的には、本発明は、適応プロセッサノードのスケーラブルな相互接続を用いる、適応プロセッサベースのクラスタ化された計算システムおよび方法に関する。
フィールドプログラマブルゲートアレイ(「FPGA」)技術における進歩は、適応プロセッサまたは再構成可能なプロセッサをますます強力にしてきた。それらのプロセッサが、自らをある特定の用途に必要とされる回路にのみ再構成する能力は、標準的なマイクロプロセッサと比較して、性能において桁違いに大きい向上をもたらすことが示されてきた。しかしながら、さまざまな理由により、従来の適応プロセッサは、歴史的に、マイクロプロセッサのアクセラレータとして用いられるよう、脇役とされてきた。
その第1の理由は、これまではすべて、マイクロプロセッサホストの入出力(「I/O」)ポートを介して接続されるスレーブプロセッサとして提供されてきたことである。結果的にこのようなハイブリッドシステムは、マイクロプロセッサと再構成可能なプロセッサの対が、1対1、または1対数個でなされたものを有していなければならない。さらに、用いられる再構成可能なプロセッサの個数は、ホストマザーボードのI/Oスロットの個数によって限定され得る。
第2の理由は、これまで提供されてきたものは、ユーザが適応プロセッサボード上のFPGAの設計を開発するのに、マイクロプロセッサにおいて実行するプログラムを開発するのとは独立にしなければならないという点において、プログラミングが困難なことである。このことは事実上、適応プロセッサの使用を、求められるFPGA設計の完成に非標準言語を用いて開発時間を費やしても良いとユーザが考えるような、極めて特殊な機能に限る原因となる。
最後に、再構成可能なプロセッサが1つのFPGAを有する単一の「PCI」(peripheral component interconnect)ボードに存在するか、または、FPGAのアレイを含むI/O接続されたシャーシに存在するかにかかわらず、FPGAは、その構成時間の長さ
、およびそのホストへの接続性のために、一時に1人のユーザによる1つの用途に関連する作業を強いられる。
これらの要因の各々が、依然として、再構成可能なプロセッサの現在の使用を限定するよう働いている一方で、近い将来この状況を変え得るような開発がなされてきた。第1に、エス・アール・シィ・コンピューターズ・インコーポレイテッドが、ユーザがCまたはフォートランなどの標準的な高級言語を用いて単一のプログラムを書くことができるような、プロプラエタリなコンパイラ技術を開発した。プログラムは自動的に、マイクロプロセッサのためのコードとFPGAを構成するためのビットストリームとの両方を含む、単一の実行可能なプログラムにコンパイルされる。これにより、ユーザは、いかなる特別な先験的知識を必要とすることもなく、自動的に、マイクロプロセッサと再構成可能なプロセッサとをともに全く同等に用いることができる。
第2に、たとえば、前述の米国特許出願連続番号第10/142,045号に開示されたような、新しく導入された適応プロセッサアーキテクチャは、適応プロセッサそれ自体に直接に、マイクロプロセッサホストに共通して見られる多くの特徴を組込んでいる。それはたとえば、共有可能なダイナミックランダムアクセスメモリ(「DRAM」)、高速のスタティックランダムアクセスメモリ(「SRAM」)のキャッシュライクメモリ、ディスクドライブなどの周辺機器に直接接続するためのI/Oポート、およびI/O動作を可能にするためのファイルシステムを用いる能力などを含む。
現在では、MAP(エス・アール・シィ・コンピューターズ・インコーポレイテッドの登録商標)シリーズの適応プロセッサなど、これらの新しい適応プロセッサは、マイクロプロセッサに相互接続して、それと共に多くの新規で有利なやり方で動作することもできる。これらの新しい相互接続のいくつかは、たとえば、前述の2002年10月29日出願の米国特許出願連続番号第10/282,986号にさらに開示されている。
発明の概要
ここに開示されるのは、クラスタ化された計算システムにおける適応プロセッサノードのスケーラブルな相互接続のための手法であって、それにより、マイクロプロセッサミックスに対する適応プロセッサの柔軟性をはるかに大きくし、かつ、複数のユーザが適応プロセッサ、マイクロプロセッサおよびメモリなどのさまざまな補完的機器にアクセスすることが可能となる。
上述のように、適応プロセッサが自身を周辺機器に接続するオンボード知能を有していると、今度は適応プロセッサをクラスタ化された計算システムにおいて自律ノードとして用いることが可能になる。このクラスタは、たとえば、マイクロプロセッサボード、適応プロセッサ、および、所望のクラスタ化または相互接続プロトコルをサポートすることができる「賢い」フロントエンドを有する共有可能なメモリブロックまでもミックスしたものからできていてもよい。
特定的な実現例において、このクラスタ化は、イーサネット(登録商標)、ミリネット(登録商標)などの、業界標準のクラスタ化相互接続を用いて達成され得る。この相互接続を達成するために、エス・アール・シィ・コンピューターズ・インコーポレイテッドから入手可能な、商業用、またはプロプラエタリなクロスバースイッチなどを介してノードを相互接続することもさらに可能である。標準的なクラスタ化相互接続を用いるクラスタ化された計算システムは、さらに、標準的なクラスタ化ソフトウェアを用いて「Beowulf Cluster」を構成し、高速ネットワークによって相互接続される数多くの個別のコンピュ
ータを含む高性能なパラレルコンピュータをもたらすこともできる。
エス・アール・シィ・コンピューターズ・インコーポレイテッドのスイッチを用いて構成されるクラスタ化された計算システムの場合、その開示がここに引用にて援用される、2002年10月23日出願の「クラスタ化されたマルチプロセッサシステムにおいて、異なるノードで動作するプロセスの間で明示的なメッセージの通信を行なうための機構(Mechanism for Explicit Communication of Messages Between Processes Running on Different Nodes in a Clustered Multiprocessor System)」と題された米国特許出願連続番号第10/278,345号が、制御のために用いられ得るソフトウェアクラスタ化構成を説明する。この態様で作られたシステムにより、今や適応処理が計算方法の第1標準とされている。この構成は、すべての歴史的な「スレーブ」的な限定を取除き、適応プロセッサが、システムのすべてのリソースに全く同等にアクセスできるようにする。いずれのマイクロプロセッサも、システムのいずれの適応プロセッサまたはメモリブロックにもアクセスすることができるので、所与のユーザはもはや、既に構成された適応プロセッサを用いるために、ある特定のマイクロプロセッサノードで自己のプログラムを実行する必要はない。このやり方では、別のマイクロプロセッサの別のユーザが同じ機能を使いたい場合、または、オペレーティングシステムがコンテキスト切換を実行し、ユーザがシステム上の別のマイクロプロセッサに移る場合に、適応プロセッサボード上のFPGAは再構成される必要がない。これは、歴史的に適応プロセッサの使用を限定する要因の1つであった、FPGAの再構成の際システムで失われる時間を、大幅に最小化する。
ここで特定的に開示されるのは、少なくとも2つのノードを含む、クラスタ化されたコンピュータシステムのためのシステムおよび方法であって、ノードの少なくとも1つは再構成可能なプロセッサ要素、または適応プロセッサ要素である。ここで開示されるいくつかの代表的な実現例において、クラスタ化相互接続は、イーサネット(登録商標)、ミリネット(登録商標)、またはクロスバースイッチを含み得る。本発明によるクラスタ化された計算システムはさらに、少なくとも2つのノードを含むことができ、ノードの少なくとも1つは共有メモリブロックである。
ここで具体的に開示されるのは、クラスタ化されたコンピュータシステムであって、システムは少なくとも第1および第2の処理ノードと、第1および第2の処理ノードを結合するクラスタ相互接続とを含み、少なくとも第1の処理ノードは再構成可能な処理要素を含む。特定的な実現例において、クラスタ化されたコンピュータの第2の処理ノードは、マイクロプロセッサ、再構成可能な処理要素、または共有メモリブロックを含み得る。
添付の図面と関連して扱われる好ましい実施例の下記の説明を参照することにより、本発明に関する前述のおよびその他の特徴および目的、ならびにそれらを達成する態様がより明らかになり、発明それ自体が最もよく理解されるであろう。
代表的実施例の説明
図1を参照すると、典型的なI/O接続されたハイブリッド計算システム100の機能ブロック図が示される。ハイブリッド計算システム100は、1つ以上のノースブリッジIC1020〜102Nを含み、その各々がフロントサイドバスによって4つのマイクロプロセッサ10400〜10403から104N0〜104N3(これらを含む)に結合される。ノースブリッジIC1020〜102Nは、それぞれメモリブロック1060〜106Nに結合され、さらに、対応するI/Oブリッジ要素1080〜108Nに結合される。ネットワークインターフェイスカード(「NIC」)1120〜112Nは、それぞれのI/Oブリッジ1080〜208NのI/Oバスをクラスタバスに結合し、これは共通のクラスタ化ハブ(またはイーサネット(登録商標)スイッチ)114に結合される。
図示されるように、適応プロセッサ要素110O〜110Nは、I/Oブリッジ108O〜108Nの各々に結合され関連付けられる。これはハイブリッド計算システム100において適応プロセッサ110を接続するための既存の手法の中でも最も基本的なものであり、本質的に、標準的なI/Oポートを介してマイクロプロセッサ104に接続することにより実現される。これは比較的実現が容易ではあるが、その結果として適応プロセッサ110およびマイクロプロセッサ104間の結合は極めて「緩い」ものとなり、その結果、プロセッサバスの帯域幅およびレイテンシに対して、帯域幅は小さくレイテンシは長くなる。さらに、両タイプのプロセッサ104,110は同じメモリ106を共有しなければならないため、適応プロセッサ110での性能は著しく低下したものとなる。機能的には、このアーキテクチャでは、現実に生じ得るマイクロプロセッサ204と適応プロセッサ110と間の対話の量は事実上制限される。
図2を参照すると、マルチ適応プロセッサ要素200の特定的で代表的な実施例の機能ブロック図が示される。マルチ適応プロセッサ要素200は、関連する部分において、別個のユーザFPGA2040および2041の対に関連して動作する離散的制御FPGA202を含む。制御FPGA202ならびにユーザFPGA2040および2041は、この特定的な実現例において、ここではデュアルポートSRAMバンク2060〜2065として図示される、複数のSRAMバンク206を通じて結合される。DRAM208を含む追加的なメモリブロックもさらに制御FPGA202に関連付けられる。
制御FPGA202は、μP1 212を含む複数の組込型マイクロプロセッサコアを含み、μP1 212は電気光学コンバータ216によって周辺インターフェイスバス214に結合されて、バス214の追加的な物理的長によって、いずれかの接続された周辺装置(図示されない)を駆動できるようにする。第2のマイクロプロセッサコアμP0 218を用いてマルチ適応プロセッサ要素200のシステムインターフェイスバス220を管理する。簡潔にするために、これは単一の双方向バスとして示されるが、実際には1対の平行な単一方向バスを含み得る。図示されるように、追加的なマルチ適応プロセッサ要素200が、示されるマルチ適応プロセッサ要素200と直接通信できるように、チェーンポート222をさらに設けることもできる。
図示され、上述されたように、全体的なマルチ適応プロセッサ要素200アーキテクチャは、その主要な構成要素として、FPGA202ならびに2040および2041という3つのFPGA、DRAM208、ならびにデュアルポートSRAMバンク206を有する。その設計の中心は、所望の処理を実行するのに必要な論理がロードされた、ユーザFPGA2040および2041である。離散的FPGA2040および2041を用いることにより、再構成可能な回路の量を最大にすることが可能となる。このマルチ適応プロセッサ要素200の性能は、ユーザアレイを形成するこのようなFPGA204を2つ用いることによりさらに高めることができる。
デュアルポートSRAMバンク206を用いて、ユーザアレイ204をサポートする極めて高速のバルクメモリが設けられる。その容量を最大にするために、離散的SRAMチップが、図示されるように、独立して接続された複数のバンク1060〜2065に配置され得る。これにより、SRAMがFPGA202および/または204に直接組込まれるだけである場合に達成され得るよりも、はるかに大きい容量が得られる。さらに、現在、ここで採用され、開示される、特定的なパッケージングによって達成される多くの入力/出力(「I/O」)数により、汎用FPGAが6個の64ビット幅のSRAMバンク2060〜2065に相互接続されて、4.8Gbytes/秒の総メモリ帯域幅を達成することが可能となる。
典型的には、高速SRAM装置のコストは比較的高く、その密度は比較的低い。この事実に対応するために、デュアルポートSRAMは、アドレスおよびデータのための2つの別個のポートを有する各SRAMチップとともに用いられ得る。各チップからの一方のポートは2つのユーザアレイFPGA2040および2041に接続され、他方のポートは制御FPGA202として機能する第3のFPGAに接続される。この制御FPGA202はまた、はるかに大きい高速DRAM208メモリのデュアル・インライン・メモリ・モジュール(「DIMM」)に接続する。このDRAM108のDIMMは、あるバーストモードで用いられる場合、類似の帯域幅を有するSRAMバンク206の200倍の密度を容易に有し得る。これにより、後にさらに十分に説明されるように、マルチ適応プロセッサ要素200が、制御FPGA202によってDRAM208からのデータが供給される循環バッファとして、SRAM206を用いることが可能となる。
制御FPGA202はまた、他のいくつかの機能を実行する。好ましい実施例においては、制御FPGA202は、カリフォルニア州(CA)、サンノゼ(San Jose)のザイリンクス・インコーポレイテッド(Xilinx Inc.)社から入手可能である、埋込型パワーPCマイクロプロセッサコアを有するバーテックス・プロ(Virtex Pro)のファミリから選択され得る。これらのコアのうちの1つ(μP0 218)を用いて、システムインターフェイスバス220を介して受信される制御コマンドをデコードする。このインターフェイスは、複数のマルチ適応プロセッサ要素200を共に相互接続することを可能にする毎秒マルチギガバイトのインターフェイスである。それはまた、SRC SNAPカードを用いることにより標準的なマイクロプロセッサボードをマルチ適応プロセッサ要素200に相互接続することを可能にする。(「SNAP」はエス・アール・シィ・コンピューターズ・インコーポレイテッドの登録商標であり、このようなSNAPカードの代表的な実現例が、エス・アール・シィ・コンピューターズ・インコーポレイテッドに譲渡された、2001年8月17日出願の「デュアル・インライン・メモリ・モジュール・フォーマットのマルチ適応プロセッサのチェーンを用いるクラスタ化されたコンピュータのためのスイッチ/ネットワークアダプタポート(Switch/Network Adapter Port for Clustered Computers Employing a Chain of Multi-Adaptive Processors in a Dual In-Line Memory Module Format)」と題された米国特許出願連続番号第09/932,330号に開示され、その開示はその全体が引用によりここに援用される。)このインターフェイスを介して受信されるパケットは、局所的および周辺のダイレクトメモリアクセス(「DMA」)コマンドならびにユーザアレイ204の構成命令を含むさまざまな機能を実行する。これらのコマンドは、制御FPGA202内の埋込型マイクロプロセッサコアのうちの1つによって、および/または、FPGA202において他の方法で実現される論理によって処理され得る。
システムインターフェイスバス220の有効な帯域幅を増大させるために、いくつかの高速の直列周辺I/Oポートがさらに実現されてもよい。これらの各々は、他のマイクロプロセッサコア(たとえばμP1 212)、または、制御FPGA202において実現される離散的論理のいずれかによって制御され得る。これらにより、マルチ適応プロセッサ要素200が、ハードディスク、ディスクの記憶領域ネットワークまたは他のコンピュータ大容量記憶周辺装置に直接接続することが可能となるであろう。この態様で、システムインターフェイスバス220の帯域幅を少量のみ用いてデータを移動させることにより、多数のマルチ適応プロセッサ要素200へのスケーリングをサポートする、極めて効率的なシステム相互接続がもたらされる。いずれかのマルチ適応プロセッサ要素200に搭載されたDRAM208は、システムインターフェイスバス220を介して他のマルチ適応プロセッサ要素200によってアクセスされ得るので、いくつかのマルチ適応プロセッサ要素200にわたって分割されるデータベース検索におけるようなデータの共有が可能となる。
さらに図3を参照すると、本発明による適応ノードのスケーラブルな相互接続を含むクラスタ化された計算システムにおける、あり得る実現例のための自律共有メモリノード300の機能ブロック図が示される。メモリノード300は、関連する部分において、マイクロプロセッサコア304を組込む制御FPGA302を含む。FPGA302は、たとえばバンク3060〜バンク3063などの複数のDRAMバンクに結合されてもよく、さらに、クラスタ化された計算システム全体のシステムインターフェイス308に結合されてもよい。この図において、制御FPGA302は自身をクラスタ化媒体に接続する知能を組込む。代表的な実施例において、複数のメモリノード300を含むクラスタ化された計算システムは、マイクロプロセッサボード、および、所望のクラスタ化または相互接続プロトコルをサポートすることができる「賢い」フロントエンドを有する適応プロセッサをミックスしたものでできていてもよい。
さらに図4を参照すると、本発明による適応ノードのスケーラブルな相互接続の一般化された実現例を含む、クラスタ化された計算システム400の機能ブロック図が示され、クラスタ化は、イーサネット(登録商標)、ミリネット(登録商標)、または他の適切なスイッチングおよび通信機構などの標準的なクラスタ化相互接続を用いて達成され得る。
クラスタ化された計算システム400は、関連する部分において、1つ以上のマイクロプロセッサボードを含み、各々はメモリコントローラ4020を有し、その各々はフロントサイドバスによって複数のマイクロプロセッサ40400〜40403に結合される。メモリコントローラ4020は、それぞれのメモリブロック4060に結合され、さらに、対応するI/Oブリッジ要素4080に結合される。NIC4120は、それぞれのI/Oブリッジ4080のI/Oバスをクラスタ化相互接続414に結合する。
示されるように、1つ以上の適応プロセッサ要素または再構成可能なプロセッサ要素4100は、周辺インターフェイスまたはシステムインターフェイスバスによってクラスタ化相互接続414に結合される。同様の態様で、1つ以上の共有メモリブロック4160もさらに、システムインターフェイスバスによってクラスタ化相互接続414に結合される。代表的な実施例において、クラスタ化相互接続はイーサネット(登録商標)、ミリネット(登録商標)または他の適切な通信機構を含み得る。前者はネットワーク通信の標準であり、同軸ケーブルまたは撚線対ケーブルのいずれかを利用し、たとえばローカルエリアネットワーク(「LAN」)などにおいて用いられる。これはIEEE規格802.3に規定される。後者は、ワークステーション、パーソナルコンピュータ(「PC」)、サーバ、またはシングルボードコンピュータのクラスタを相互接続するのに広く用いられている、高性能のパケットベースの通信およびスイッチング技術である。これは米国標準規格(American National Standard)ANSI/VITA 26−1998に規定される。
以上、本発明の原理について、適応ノードおよびクラスタ化されたコンピュータシステムの具体的な構成との関連において説明したが、以上の説明は単に例としてなされたものであり、本発明の範囲を限定するものではないことが明らかに理解されるであろう。特に、以上の開示の教示が当業者に対して他の変形を示唆するであろうことが認識される。このような変形は、それ自体で既に公知であって、ここに既に説明された特徴の代わりに、またはこれに追加して用いられ得る、他の特徴を含み得る。本願においては、請求項を特定の特徴の組合せに対して作成してあるが、ここでの開示の範囲は、明示的または暗示的に開示された新規な特徴もしくは新規な特徴の組合せ、または当業者には明らかであろうその一般化もしくは変形をも含み、かつこのようなものがいずれかの請求項において現在クレームされている同じ発明に関係するか否か、および本発明が直面する同じ技術的問題のうちいずれかまたはすべてを緩和するか否かにはかかわらないことが理解されるべきである。出願人は、これにより、本願またはここから導き出されるあらゆるさらなる出願についての手続中に、上記のような特徴および/または上記のような特徴の組合せに対して
新たな請求項を作成する権利を留保する。
複数のマイクロプロセッサおよび適応プロセッサを含み、後者はI/Oブリッジに結合される、典型的なI/O接続されたハイブリッド計算システムの機能ブロック図である。 1対のユーザFPGAおよびデュアルポートスタティックランダムアクセスメモリ(「SRAM」)の6つのバンクと関連する、組込みプロセッサコアを有するフィールドプログラマブルゲートアレイ(「FPGA」)制御要素を組込んだ、マルチ適応プロセッサ要素の特定的で代表的な実施例を示す機能ブロック図である。 メモリ制御FPGAは自身を周辺機器に接続するための知能を組込む、本発明による適応ノードのスケーラブルな相互接続を含むクラスタ化された計算システムにおける、あり得る実現例のための自律知能共有メモリノードの機能ブロック図である。 イーサネット(登録商標)、ミリネット(登録商標)、クロスバースイッチなどの標準的なクラスタ化相互接続を用いてクラスタ化が達成され得る、本発明による適応ノードのスケーラブルな相互接続の一般化されたあり得る実現例を含む、クラスタ化された計算システムの機能ブロック図である。

Claims (27)

  1. クラスタ化されたコンピュータシステムであって、
    少なくとも第1および第2の処理ノードと、
    前記第1および第2の処理ノードを結合するクラスタ相互接続とを含み、
    少なくとも前記第1の処理ノードは再構成可能な処理要素を含む、クラスタ化されたコンピュータシステム。
  2. 少なくとも前記第2の処理ノードは再構成可能な処理要素を含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  3. 少なくとも前記第2の処理ノードはマイクロプロセッサベースの処理要素を含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  4. 前記少なくとも第1および/または第2の処理ノードによるアクセスのために、前記クラスタ相互接続に結合される少なくとも1つの共有メモリブロックをさらに含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  5. 前記クラスタ相互接続はイーサネット(登録商標)を含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  6. 前記クラスタ相互接続はミリネット(登録商標)を含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  7. 前記クラスタ相互接続はクロスバースイッチを含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  8. 前記第1の処理ノードは、周辺インターフェイスを通じて前記クラスタ相互接続に結合される、請求項1に記載のクラスタ化されたコンピュータシステム。
  9. 前記第1の処理ノードは、
    前記第1の処理ノードを前記クラスタ相互接続に結合するための少なくとも1つの処理要素を含む制御ブロックを含む、請求項1に記載のクラスタ化されたコンピュータシステム。
  10. 前記制御ブロックは制御FPGAを含む、請求項9に記載のクラスタ化されたコンピュータシステム。
  11. 前記第1の処理ノードは、
    デュアルポートメモリブロックを通じて前記制御ブロックに結合される少なくとも1つのユーザアレイをさらに含む、請求項9に記載のクラスタ化されたコンピュータシステム。
  12. 前記少なくとも1つのユーザアレイはユーザFPGAを含む、請求項11に記載のクラスタ化されたコンピュータシステム。
  13. 前記ユーザFPGAは、前記第1の処理ノードを別の処理ノードに結合するためのチェーンポートを含む、請求項12に記載のクラスタ化されたコンピュータシステム。
  14. マルチノードコンピュータシステムであって、
    クラスタ相互接続と、
    前記クラスタ相互接続に結合される再構成可能な処理要素と、
    前記クラスタ相互接続に結合されるメモリブロックとを含む、マルチノードコンピュータシステム。
  15. 前記クラスタ相互接続に結合される別の処理要素をさらに含む、請求項14に記載のマルチノードコンピュータシステム。
  16. 前記別の処理要素は第2の再構成可能な処理要素を含む、請求項15に記載のマルチノードコンピュータシステム。
  17. 前記別の処理要素はマイクロプロセッサベースの処理要素を含む、請求項15に記載のマルチノードコンピュータシステム。
  18. 前記再構成可能な処理要素および前記別の処理要素は両方とも前記メモリブロックにアクセスすることができる、請求項15に記載のマルチノードコンピュータシステム。
  19. 前記クラスタ相互接続はイーサネット(登録商標)を含む、請求項14に記載のマルチノードコンピュータシステム。
  20. 前記クラスタ相互接続はミリネット(登録商標)を含む、請求項14に記載のマルチノードコンピュータシステム。
  21. 前記クラスタ相互接続はクロスバースイッチを含む、請求項14に記載のマルチノードコンピュータシステム。
  22. 前記再構成可能な処理要素は周辺インターフェイスを通じて前記クラスタ相互接続に結合される、請求項14に記載のマルチノードコンピュータシステム。
  23. 前記再構成可能な処理要素は、
    前記第1の処理ノードを前記クラスタ相互接続に結合するための少なくとも1つのプロセッサを含む制御ブロックを含む、請求項14に記載のマルチノードコンピュータシステム。
  24. 前記制御ブロックは制御FPGAを含む、請求項23に記載のマルチノードコンピュータシステム。
  25. 前記再構成可能な処理要素は、
    デュアルポートメモリブロックを通じて前記制御ブロックに結合される少なくとも1つのユーザアレイをさらに含む、請求項23に記載のマルチノードコンピュータシステム。
  26. 前記少なくとも1つのユーザアレイはユーザFPGAを含む、請求項25に記載のマルチノードコンピュータシステム。
  27. 前記ユーザFPGAは、前記再構成可能な処理要素を別の処理要素に結合するためのチェーンポートを含む、請求項26に記載のマルチノードコンピュータシステム。
JP2004566446A 2003-01-10 2003-10-08 クラスタ化されたコンピュータシステムのための適応プロセッサノードのスケーラブルな相互接続のためのシステムおよび方法 Withdrawn JP2006513489A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/340,400 US20040139297A1 (en) 2003-01-10 2003-01-10 System and method for scalable interconnection of adaptive processor nodes for clustered computer systems
PCT/US2003/031951 WO2004063934A1 (en) 2003-01-10 2003-10-08 System and method for scalable interconnection of adaptive processor nodes for clustered computer systems

Publications (1)

Publication Number Publication Date
JP2006513489A true JP2006513489A (ja) 2006-04-20

Family

ID=32711324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004566446A Withdrawn JP2006513489A (ja) 2003-01-10 2003-10-08 クラスタ化されたコンピュータシステムのための適応プロセッサノードのスケーラブルな相互接続のためのシステムおよび方法

Country Status (6)

Country Link
US (1) US20040139297A1 (ja)
EP (1) EP1586041A1 (ja)
JP (1) JP2006513489A (ja)
AU (1) AU2003282507A1 (ja)
CA (1) CA2511812A1 (ja)
WO (1) WO2004063934A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211799A (ja) * 2009-03-11 2010-09-24 Harman Becker Automotive Systems Gmbh コンピューティングデバイスおよびその始動方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7493375B2 (en) * 2002-04-29 2009-02-17 Qst Holding, Llc Storage and delivery of device features
US20060136606A1 (en) * 2004-11-19 2006-06-22 Guzy D J Logic device comprising reconfigurable core logic for use in conjunction with microprocessor-based computer systems
GB2423840A (en) * 2005-03-03 2006-09-06 Clearspeed Technology Plc Reconfigurable logic in processors
WO2016014043A1 (en) * 2014-07-22 2016-01-28 Hewlett-Packard Development Company, Lp Node-based computing devices with virtual circuits
CN110083449B (zh) * 2019-04-08 2020-04-28 清华大学 动态分配内存和处理器的方法、装置及计算模块

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5600845A (en) * 1994-07-27 1997-02-04 Metalithic Systems Incorporated Integrated circuit computing device comprising a dynamically configurable gate array having a microprocessor and reconfigurable instruction execution means and method therefor
US5983269A (en) * 1996-12-09 1999-11-09 Tandem Computers Incorporated Method and apparatus for configuring routing paths of a network communicatively interconnecting a number of processing elements
US5970254A (en) * 1997-06-27 1999-10-19 Cooke; Laurence H. Integrated processor and programmable data path chip for reconfigurable computing
US6216191B1 (en) * 1997-10-15 2001-04-10 Lucent Technologies Inc. Field programmable gate array having a dedicated processor interface
US6076152A (en) * 1997-12-17 2000-06-13 Src Computers, Inc. Multiprocessor computer architecture incorporating a plurality of memory algorithm processors in the memory subsystem
US6279045B1 (en) * 1997-12-29 2001-08-21 Kawasaki Steel Corporation Multimedia interface having a multimedia processor and a field programmable gate array
US6370603B1 (en) * 1997-12-31 2002-04-09 Kawasaki Microelectronics, Inc. Configurable universal serial bus (USB) controller implemented on a single integrated circuit (IC) chip with media access control (MAC)
US6138229A (en) * 1998-05-29 2000-10-24 Motorola, Inc. Customizable instruction set processor with non-configurable/configurable decoding units and non-configurable/configurable execution units
US6111756A (en) * 1998-09-11 2000-08-29 Fujitsu Limited Universal multichip interconnect systems
US6748429B1 (en) * 2000-01-10 2004-06-08 Sun Microsystems, Inc. Method to dynamically change cluster or distributed system configuration
US20020049859A1 (en) * 2000-08-25 2002-04-25 William Bruckert Clustered computer system and a method of forming and controlling the clustered computer system
US6653859B2 (en) * 2001-06-11 2003-11-25 Lsi Logic Corporation Heterogeneous integrated circuit with reconfigurable logic cores
US7020669B2 (en) * 2001-09-27 2006-03-28 Emc Corporation Apparatus, method and system for writing data to network accessible file system while minimizing risk of cache data loss/ data corruption

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010211799A (ja) * 2009-03-11 2010-09-24 Harman Becker Automotive Systems Gmbh コンピューティングデバイスおよびその始動方法

Also Published As

Publication number Publication date
WO2004063934A1 (en) 2004-07-29
US20040139297A1 (en) 2004-07-15
EP1586041A1 (en) 2005-10-19
CA2511812A1 (en) 2004-07-29
AU2003282507A1 (en) 2004-08-10

Similar Documents

Publication Publication Date Title
US10437764B2 (en) Multi protocol communication switch apparatus
EP1652058B1 (en) Switch/network adapter port incorporating selectively accessible shared memory resources
EP1442378B1 (en) Switch/network adapter port for clustered computers employing a chain of multiadaptive processors in a dual in-line memory module format
US6769046B2 (en) System-resource router
US9946664B2 (en) Socket interposer having a multi-modal I/O interface
US20240012581A1 (en) Memcached Server Functionality in a Cluster of Data Processing Nodes
US20020010825A1 (en) Memory resource arbitrator for multiple gate arrays
US7647433B2 (en) System and method for flexible multiple protocols
JP2006513489A (ja) クラスタ化されたコンピュータシステムのための適応プロセッサノードのスケーラブルな相互接続のためのシステムおよび方法
Chou et al. Sharma et al.
AU2002356010A1 (en) Switch/network adapter port for clustered computers employing a chain of multi-adaptive processors in a dual in-line memory module format

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20070109