JP7295968B2 - 再構成可能な計算装置 - Google Patents

再構成可能な計算装置 Download PDF

Info

Publication number
JP7295968B2
JP7295968B2 JP2021552843A JP2021552843A JP7295968B2 JP 7295968 B2 JP7295968 B2 JP 7295968B2 JP 2021552843 A JP2021552843 A JP 2021552843A JP 2021552843 A JP2021552843 A JP 2021552843A JP 7295968 B2 JP7295968 B2 JP 7295968B2
Authority
JP
Japan
Prior art keywords
tile
enclosure
network fabric
reconfigurable
rpe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021552843A
Other languages
English (en)
Other versions
JP2022523830A (ja
Inventor
イー. デューブ,ラッセル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Raytheon Co
Original Assignee
Raytheon Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Raytheon Co filed Critical Raytheon Co
Publication of JP2022523830A publication Critical patent/JP2022523830A/ja
Application granted granted Critical
Publication of JP7295968B2 publication Critical patent/JP7295968B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • G06F15/7885Runtime interface, e.g. data exchange, runtime control
    • G06F15/7892Reconfigurable logic embedded in CPU, e.g. reconfigurable unit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/161Computing infrastructure, e.g. computer clusters, blade chassis or hardware partitioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7896Modular architectures, e.g. assembled from a number of identical packages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F2015/761Indexing scheme relating to architectures of general purpose stored programme computers
    • G06F2015/763ASIC
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F2015/761Indexing scheme relating to architectures of general purpose stored programme computers
    • G06F2015/768Gate array

Description

本発明は、再構成可能な計算装置及びそれを備えたコンピューティング・クラスタに関する。
フィールド・プログラマブル・ゲートアレイ(FPGA)のようなプログラマブル要素は、高性能コンピューティング(HPC)タスクのために使用される。しかしながら、これらのプログラマブル要素を従来のHPCフォームファクタとともにパッケージングするための便利なアプローチは存在しなかった。さらに、大量の高速データストリームを効率的に摂取し、次いで処理された結果をHPCクラスタ・ネットワーク・ファブリック上で効果的に往復転送するための統合メカニズムは存在しなかった。これらの制限は、HPC又はクラスタ・コンピューティング環境におけるストリーム・コンピューティングのために、FPGAのような非汎用コンピューティング要素の能力を利用することを困難にしている。
現在、ストリーム・コンピューティングは、HPCタスクを実行するために、非効率的な統合スキームを使用するカスタムハードウェア又は商用の入手可能な(COTS)ハードウェアを大量に必要とする。HPCクラスタに統合されたプログラマブル・ロジック又はFPGAの最も一般的な用途は、COTSラックサーバ用のアドイン・ボードとしてパッケージ化されている。これらのアプローチは、I/O容量が限られており、クラスタファブリック統合能力を持たない。カードケージスタイルの組み込みコンピューティング環境に実装されたOpenVPX(及び他のフォームファクタ)回路カードアセンブリは、多数の外部接続I/O及び堅牢なクラスタ・ファブリック・インタフェースを効率的に処理することができない。
必要なのは、クラスタ・コンピューティング環境におけるプログラマブル・ロジック要素の配備の改善である。
本開示の一態様では、再構成可能な計算装置(RCA )(100)は、エンクロージャ(104); 前記エンクロージャに設けられたネットワーク・ファブリック・インターフェース(116); エンクロージャに用意されているデータI/Oインターフェース(112);及び エンクロージャに備えられた第1計算タイル(136);を含み、 前記第1計算タイルは: 前記ネットワーク・ファブリック・インタフェースに結合され、ネットワーク・ファブリックへとデータを送信し、前記ネットワーク・ファブリックを介してデータを受信するように構成されたネットワーク・ファブリック・インタフェースデバイス(308); 前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに結合され、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つから受信された入力データを処理し、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに出力データを提供するように構成される再構成可能な処理要素(RPE)であり、前記出力データは受信された前記入力データの関数である、再構成可能な処理要素(RPE)(304);を有する。
RCAは、前記エンクロージャに設けられ、前記第1計算タイルに結合されたデイジー・チェーン・ポート(128);を含んでよく、前記デイジー・チェーン・ポートは、前記第1計算タイルを別のRCA上の計算タイルに結合するように動作可能である。
本発明の他の特徴において、コンピューティング・クラスタが、ラック;及び 前記ラックに搭載された複数の再構成可能な計算装置(RCA)(100);を含み、前記RCAの各々は: エンクロージャ(104); 前記エンクロージャに設けられたネットワーク・ファブリック・インターフェース; エンクロージャに用意されているデータI/Oインターフェース(112);及び エンクロージャに備えられた第1計算タイル(136);を含み、 前記第1計算タイルは: 前記ネットワーク・ファブリック・インタフェースに結合され、前記ネットワーク・ファブリックにデータを送信し、前記ネットワーク・ファブリックを介してデータを受信するように構成されたネットワーク・ファブリック・インタフェース・デバイス(308); 前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに結合され、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つから受信された入力データを処理し、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに出力データを提供するように構成される再構成可能な処理要素(RPE)であり、前記出力データは受信された前記入力データの関数である、再構成可能な処理要素(RPE)(304);を有する。
本開示の種々の態様が、添付の図面を参照して本明細書中で議論される。図面を簡単かつ明瞭にするために、図面に示されている要素は、必ずしも正確に又は縮尺通りに描かれていないことが理解されるであろう。例えば、素子のいくつかの寸法は、明瞭化のために他の素子に対して誇張されてもよく、又はいくつかの物理的構成要素が一つの機能ブロック又は素子に含まれてもよい。さらに、適切と考えられる場合には、対応する要素又は類似の要素を示すために、図面の間で同じ参照番号を繰り返すことができる。しかし、明瞭にするために、すべての構成要素がすべての図面でラベル付けされているわけではない。図面は、例示及び説明の目的で提供されるものであり、本開示の限界の定義として意図されたものではない。
本開示の態様に従った再構成可能な計算装置機器の斜視図である。 図1の再構成可能な計算装置の概略図である。 本開示の態様に従った計算タイルの機能ブロック図である。
以下の詳細な説明では、本開示の側面を完全に理解するために詳細が記載される。これらは、これらの特定の詳細のいくつかなしに実施され得ることが、当業者によって理解されるであろう。他の例では、周知の方法、手順、構成要素及び構造は、本開示の特徴を不明瞭にしないように詳細に記載されていないことがある。
本開示は、それが実施可能であるか、又は種々の方法で実施され得るか、又は実施されるので、以下の説明に記載され、又は図面に示される構成及び構成要素又はステップの詳細な配置に限定されないことが理解されるべきである。また、本明細書で使用される句及び用語は、説明のためのものに過ぎず、限定とみなされるべきではないことを理解すべきである。
特定の特徴は、明確にするために、別々の実装のコンテキストで説明され、単一の実装で組み合わせて提供されてもよい。逆に、種々の特徴、すなわち、簡潔のために、単一の実装のコンテキストで説明されるが、別々に、又は任意の適切なサブ-組み合わせで提供されてもよい。
本開示の一態様では、再構成可能なコンピューティング・アプライアンス(RCA)パッケージは、市販の、すなわち標準化された19インチ・ラックと互換性のある、例えばFPGAに限定されるわけではないが、再構成可能な処理要素又はプログラマブル・ロジック・デバイスを、簡単に統合するために既知の19インチ・ラック形態を使用することができる。HPCを使用する他の実装、例えば、地上移動環境を使用する実装は、異なるラックフォームファクタを使用することもあれば、ラックマウントではないこともあり、液体冷却及び/又は頑丈なパッケージオプションを必要とすることもある。
有利には、RCAは、本開示の態様によれば、I/O、例えば、10GB、40GB又は100GBのイーサネットを提供し、プログラマブル論理を使用する処理のために直接アクセス可能である。これにより、非汎用処理要素を用いた高データレートストリームの効率的な処理が可能となる。これらのプログラマブル要素の数は、処理に必要とされる所望のI/O量に応じてスケーリングすることができる。1つ以上のRCAユニット間のこれらのI/Oリンクは、所望のプログラマブル機能に応じて、様々な構成でチェーン接続又は接続することができる。
RCA内のプログラマブル要素は、InfiniBand、RoCE、イーサネット、又はOmnipathのような、リモート直接メモリアクセス(RDMA)が可能なHPCクラスタファブリックへの接続を含む。これらの接続は、RCAプログラマブル論理素子と他のHPC処理リソースとの間の高速で低遅延のデータ転送を可能にする。
次に、図1を参照すると、本開示の態様に従った再構成可能な計算装置(Reconfigurable Computing Appliance, RCA)100が、エンクロージャ104、例えば、標準19インチのラック寸法に対応するものを含む。フロントパネル108が、複数のフロントエンドデータ入力/出力(I/O)、すなわち、双方向インターフェース又はポート112を含む。ポート112は、RCA 100の外部の1つ以上のソースから入力データを受信するか、或いはそれらへ出力データを提供するように準備されたものである。フロントパネル108はまた、複数のネットワーク・ファブリックI/Oポート116を含む。ネットワーク・ファブリックI/Oポート116はまた、HPCネットワーク・ファブリックに結合するように準備されたものである。データI/Oポート112は、1つのアプローチにおいて、10GBイーサネットネットワークで動作するように構成されてもよい。HPCネットワーク・ファブリックは、例えば、非限定的に、InfiniBand、RoCE、イーサネット又はOmnipathのような、Remote Direct Memory Access (RDMA)が可能なHPCクラスタファブリックの1つであってもよい。フロントパネル108はまた、少なくとも1つの制御ポート120、1つ以上のジャンパー・ポート(jumper port)124、1つ以上のデイジー・チェーン・ポート(daisy-chain
port)128及びオン/オフスイッチ132を含んでもよい。制御ポート120、ジャンパー・ポート124及びデイジー・チェーン・ポート128の各々は双方向的である。本開示の一態様では、ネットワーク・ファブリックI/Oポート116、データI/Oポート112、制御ポート120、ジャンパー・ポート124、デイジー・チェーン・ポート128、又はオン/オフスイッチ132の一部を、エンクロージャの後部130に設けることができる。
以下に詳細を説明する1つ以上の計算タイル(computing tiles)136が、エンクロージャ104内に設けられている。各計算タイル136は、図2に示すように、1つ又は複数のデータI/Oポート112、ファブリックI/Oポート116及びジャンパー・ポート124に結合されてもよい。RCA 100は、所定の計算タイル136が、データI/Oポート112又はファブリックI/Oポート116のいずれにも結合されていない(すなわち、別の計算タイル136にのみ結合されている);データI/Oポート112及びファブリックI/Oポート116のうち一方又は他方にのみ結合されている;及び/又は別の計算タイル136に結合されている;又はデータI/Oポート112及びファブリックI/Oポート116の両方及び/又は別の計算タイル136に結合されている;ように構成されていてもよいことに留意されたい。各計算タイル136は、適切なジャンパー・ケーブル204(図2)をジャンパー・ポート124に接続することによって、RCA 100内の別の計算タイル136と結合/分離することができる。ジャンパー・ケーブル204及びジャンパー・ポート124は、タイル136間でデータを通信するための経路を提供する。したがって、外部ジャンパー・ケーブル204は、異なる使用の場合に対する再構成及びカスタマイズを可能にする。
さらに、タイルが、RCA 100の内部にある接続220を介して別のタイルに接続することができ、この場合エンクロージャ104の外側の接続を含まない。
さらに、1つのRCA 100が、デイジー・チェーン・ポート128及び適切なケーブル配線208を介して、別のRCA 100と結合されてもよい。当業者は、例えば、電源、ファン等の他の装置、及びタイルを操作するために必要な対応する支持装置もまた、図示しないが、RCA 100内に存在することを理解する。しかしながら、これらの他のデバイスは、本開示の態様と密接な関係はない。
次に、図3を参照すると、各計算タイル136は、少なくとも1つの再構成可能な処理要素(Reconfigurable Processing Element, RPE)304、例えば、FPGAを含むが、これに限定されない。RPE 304は、HPCネットワーク・ファブリックとインターフェースするように構成された対応するネットワーク・ファブリック・インターフェースデバイス(Network Fabric Interface device, NFID)308に結合される。NFIデバイス308は、1つの非限定的な例において、HPCネットワーク・ファブリックへのインターフェースとして機能するために、既知の技術に従って提供され、構成される特定用途向けIC(Application Specific IC, ASIC)である。
支持コントローラ312が、各計算タイル136に組み込まれ、RPE 304及びASIC 308に結合されてもよい。各計算タイル上の支持コントローラ312は、一般に、他のタスクの中でも、RPE 304及びASIC 308の動作を調整すると共に、RCA 100内の他の計算タイルと通信するようにプログラムされる。支持コントローラ312は、当業者には理解されるように、CPU、ROM、RAM、I/Oインターフェースなどを含むことができる。
RPE 304は、1つのアプローチにおいて、上述のフロントパネル接続を介して既知の技術によりプログラムされ、ソフトウェアベースの解決策を超える処理能力を提供する。変形的には、RPE 304は、支持コントローラ312へのインターフェース、予めプログラムされたメモリ、又はJoint Test Action Group (JTAG)業界標準に準拠したもののような別のインターフェースを介してプログラムされてもよい。複数のRPEを含む計算タイル136上では、各RPEは、同じ構成でプログラミングされてもよく、或いは各RPEは、計算タイル136上の他のRPEとは異なる構成でプログラミングされてもよい。
さらに、複数の計算タイル136を有するRCA 100において、1つの計算タイル136から次の計算タイル136まで、それぞれのRPEのプログラミング、すなわち、構成に相違があり得る。有利には、計算タイル136は、意図された動作のためにカスタマイズされた方法で提供することができる。
かくして、本開示の態様は、汎用コンピューティングソリューションと同様の方法で、コンピューティングファブリック上のネイティブな参加者として、計算タイル及びそれぞれのRPEを介して、プログラマブル論理ソリューションを提供する。I/Oポートのプラグ構成を通じて利用可能な再構成可能なI/Oメカニズムは、RCA内のプログラマブル要素のアレイを適用することによって、例えば、いくつか名前を挙げるだけで、レーダ信号処理及び機械学習のような、異なる処理ニーズを満たすための柔軟性を提供する。さらに、トレイ、モジュール、又はラックフォームファクタは、COTS又は組み込みコンピューティングインフラストラクチャへの適用及び統合を容易にする。
上述のシステム及び方法の種々の態様は、デジタル電子回路、コンピュータのハードウェア、ファームウェア、及び/又はソフトウェアの組み合わせ及びサブ-コンビネーションで実施することができる。この実装は、例えば、コンピュータ・プログラム製品、すなわち、有形情報キャリアに具現化されたコンピュータ・プログラム、データ処理装置の動作を制御するための機械可読記憶装置、又はプログラマブルプロセッサ、コンピュータ及び/又は複数のコンピュータを含むことができる。
コンピュータ・プログラムは、コンパイルされた言語及び/又は解釈された言語を含むプログラミング言語の任意の形態で書くことができ、コンピュータ・プログラムは、独立型プログラムとして、又はコンピュータ環境での使用に適したサブルーチン、要素、及び/又は他のユニットとして、任意の形態で展開することができる。コンピュータ・プログラムは、1つのコンピュータ又は1つのサイトの複数のコンピュータで実行されるように配備することができる。
本開示は、単なる例示として提供され、本開示の範囲を限定することを意図しない、その態様の非限定的な詳細な説明を使用して説明されたことが理解されるべきである。1つの態様に関して説明される特徴及び/又はステップは、他の態様とともに使用され得、開示のすべての態様が、特定の図に示されるか、又は態様の1つに関して説明されるすべての特徴及び/又はステップを有するわけではない。記載される態様のバリエーションが、当業者によって生じるであろう。
上記の態様のいくつかは、本開示に不可欠ではなく、例として記載される構造、行為、及び行為の構造、又は詳細を含むことに留意されたい。本明細書に記載されている構造及び/又は作用は、当該技術分野で知られているように、構造又は作用が異なる場合でも、同じ機能を実行する等価物によって置き換えることができ、例えば、本開示のプロセッサによって実行されると記載されている機能の少なくとも一部を実行するための複数の専用装置の使用がある。したがって、本開示の範囲は、特許請求の範囲で使用される要素及び制限によってのみ限定される。
本開示の多くの変更及び修正は、前述の説明を読んだ後に当業者に明らかになるであろうが、説明のために示され、記載された特定の態様は、決して、限定的であるとは考えられないことが理解されるべきである。さらに、発明の主題は特定の態様を参照して説明されてきたが、本開示の精神及び範囲内の変形が当業者に生じるであろう。前述の実施例は、単に説明のために提供されたにすぎず、決して本開示を制限するものではないことに留意されたい。
本開示は、特定の手段、材料及び態様に関して本明細書に記載されたが、本開示は、本明細書に開示された詳細に限定されることを意図するものではなく、むしろ、本開示は、添付の特許請求の範囲の範囲内にあるような、全ての機能的に等価な構造、方法及び用途に及ぶ。当業者は、本開示の範囲から逸脱することなく、開示された実施形態に種々の修正及び変更を加えることができる。

Claims (14)

  1. 再構成可能な計算装置であって:
    エンクロージャ;
    前記エンクロージャに設けられたネットワーク・ファブリック・インターフェース;
    前記エンクロージャに用意されているデータI/Oインターフェース;及び
    前記エンクロージャに備えられた第1計算タイル;
    前記エンクロージャに備えられた第2計算タイル;
    前記エンクロージャ上に設けられ、前記第1計算タイルに結合された第1ジャンパー・ポート;
    前記エンクロージャ上に設けられ、前記第2計算タイルに結合された第2ジャンパー・ポート;
    前記第1計算タイルに組み込まれた第1支持コントローラ;及び
    前記第2計算タイルに組み込まれた第2支持コントローラ;
    を含み、
    前記第1ジャンパー・ポート及び前記第2ジャンパー・ポートは、前記第1計算タイルと前記第2計算タイルを一緒に結合するために互いに結合することができ;
    前記第1支持コントローラ及び前記第2支持コントローラは、前記第1計算タイル及び前記第2計算タイルが互いに通信するようにプログラム可能であり、
    前記第1計算タイルは:
    前記ネットワーク・ファブリック・インタフェースに結合され、ネットワーク・ファブリックへとデータを送信し、前記ネットワーク・ファブリックを介してデータを受信するように構成されたネットワーク・ファブリック・インタフェースデバイス;
    前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに結合され、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つから受信された入力データを処理し、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに出力データを提供するように構成される再構成可能な処理要素(RPE)であり、前記出力データは受信された前記入力データの関数である、再構成可能な処理要素(RPE);
    を有する、
    再構成可能な計算装置。
  2. 請求項1に記載の再構成可能な計算装置であって、さらに:
    前記エンクロージャに設けられ、前記第1計算タイルに結合されたデイジー・チェーン・ポート;
    を含み、
    前記デイジー・チェーン・ポートは、前記第1計算タイルを別のRCA上の計算タイルに結合するように動作可能である、
    再構成可能な計算装置。
  3. 前記ネットワーク・ファブリック・インターフェース・デバイスはASICである、請求項1に記載の再構成可能な計算装置。
  4. 前記再構成可能な処理要素(RPE)はフィールド・プログラマブル・ゲートアレイ(FPGA)である、請求項1に記載の再構成可能な計算装置。
  5. 前記第1計算タイルが、第1RPE及び第2RPEを含み;かつ、
    前記第1RPEは第1構成にあり、前記第2RPEは前記第1構成とは異なる第2構成にある、
    請求項1に記載の再構成可能な計算装置。
  6. 請求項1に記載の再構成可能な計算装置であって:
    前記第1計算タイル上の前記再構成可能な処理要素(RPE)は第1構成にあり、前記第2計算タイル上の前記再構成可能な処理要素(RPE)は前記第1構成とは異なる第2構成にある、
    ことを特徴とする再構成可能な計算装置。
  7. 請求項6に記載の再構成可能な計算装置であって、さらに:
    前記第1ジャンパー・ポートに結合された第1端部と、前記第2ジャンパー・ポートに結合された第2端部とを有するジャンパー・ケーブル、
    を含む再構成可能な計算装置。
  8. コンピューティング・クラスタであって:
    ラック;及び
    前記ラックに搭載された複数の再構成可能な計算装置(RCA);
    を含み、
    前記RCAの少なくとも一つは:
    エンクロージャ;
    前記エンクロージャに設けられたネットワーク・ファブリック・インターフェース;
    前記エンクロージャに用意されているデータI/Oインターフェース;及び
    前記エンクロージャに備えられた第1計算タイル及び第2計算タイル
    前記エンクロージャ上に設けられ、前記第1計算タイルに結合された第1ジャンパー・ポート;
    前記エンクロージャ上に設けられ、前記第2計算タイルに結合された第2ジャンパー・ポート;
    前記第1計算タイルに組み込まれた第1支持コントローラ;及び
    前記第2計算タイルに組み込まれた第2支持コントローラ;
    を含み、
    前記第1ジャンパー・ポート及び前記第2ジャンパー・ポートは、前記第1計算タイルと前記第2計算タイルを一緒に結合するために互いに結合することができ;
    前記第1支持コントローラ及び前記第2支持コントローラは、前記第1計算タイル及び前記第2計算タイルが互いに通信するようにプログラム可能であり、
    前記第1計算タイル及び前記第2計算タイルの各々は:
    前記ネットワーク・ファブリック・インタフェースに結合され、ネットワーク・ファブリックにデータを送信し、前記ネットワーク・ファブリックを介してデータを受信するように構成されたネットワーク・ファブリック・インタフェース・デバイス;
    前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに結合され、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つから受信された入力データを処理し、前記ネットワーク・ファブリック・インターフェース・デバイス及び前記データI/Oインターフェースのうちの少なくとも1つに出力データを提供するように構成される再構成可能な処理要素(RPE)であり、前記出力データは受信された前記入力データの関数である、再構成可能な処理要素(RPE);
    を有する、
    コンピューティング・クラスタ。
  9. 請求項8に記載のコンピューティング・クラスタであって、前記RCAの各々が:
    前記エンクロージャに設けられ、前記第1計算タイル及び前記第2計算タイルのうちの1つの計算タイルに結合されたデイジー・チェーン・ポート;
    を含み、
    前記デイジー・チェーン・ポートは、前記1つの計算タイルを別のRCA上の計算タイルに結合するように動作可能である、
    コンピューティング・クラスタ。
  10. 前記ネットワーク・ファブリック・インターフェース・デバイスはASICである、請求項8に記載のコンピューティング・クラスタ。
  11. 少なくとも1つの前記再構成可能な処理要素(RPE)はフィールド・プログラマブル・ゲートアレイ(FPGA)である、請求項8に記載のコンピューティング・クラスタ。
  12. 前記第1計算タイル及び前記第2計算タイルのうちの少なくとも1つの計算タイルが、第1RPE及び第2RPEを含み;かつ、
    前記第1RPEは第1構成にあり、前記第2RPEは前記第1構成とは異なる第2構成にある、
    請求項8に記載のコンピューティング・クラスタ。
  13. 請求項8に記載のコンピューティング・クラスタであって、
    前記第1計算タイル上の前記再構成可能な処理要素(RPE)は第1構成にあり、前記第2計算タイル上の前記再構成可能な処理要素(RPE)は前記第1構成とは異なる第2構成にある、
    ことを特徴とするコンピューティング・クラスタ。
  14. 請求項13に記載のコンピューティング・クラスタであって、
    前記少なくとも1つの前記RCAが、
    前記第1ジャンパー・ポートに結合された第1端部と、前記第2ジャンパー・ポートに結合された第2端部とを有するジャンパー・ケーブル、
    を含むコンピューティング・クラスタ。
JP2021552843A 2019-03-07 2020-03-02 再構成可能な計算装置 Active JP7295968B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/295,058 US10983948B2 (en) 2019-03-07 2019-03-07 Reconfigurable computing appliance
US16/295,058 2019-03-07
PCT/US2020/020649 WO2020180787A1 (en) 2019-03-07 2020-03-02 Reconfigurable computing appliance

Publications (2)

Publication Number Publication Date
JP2022523830A JP2022523830A (ja) 2022-04-26
JP7295968B2 true JP7295968B2 (ja) 2023-06-21

Family

ID=70166125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021552843A Active JP7295968B2 (ja) 2019-03-07 2020-03-02 再構成可能な計算装置

Country Status (8)

Country Link
US (1) US10983948B2 (ja)
EP (1) EP3935512A1 (ja)
JP (1) JP7295968B2 (ja)
KR (1) KR20210126120A (ja)
CN (1) CN113597601A (ja)
IL (1) IL286138A (ja)
TW (1) TWI832982B (ja)
WO (1) WO2020180787A1 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116813A (ja) 2007-11-09 2009-05-28 Japan Aerospace Exploration Agency 大規模計算用カスタムメイド計算機
US20130239121A1 (en) 2010-11-19 2013-09-12 Eurotech Spa Unified network architecture for scalable super-calculus systems
US20160306668A1 (en) 2015-04-17 2016-10-20 Microsoft Technology Licensing, Llc Implementing a Service Using Plural Acceleration Components
US20180131635A1 (en) 2016-11-10 2018-05-10 LDA Technologies Ltd. Distributed fpga solution for high-performance computing in the cloud
US20190034363A1 (en) 2017-09-01 2019-01-31 Intel Corporation Accelerator interconnect assignments for virtual environments
JP2019047489A (ja) 2017-08-30 2019-03-22 インテル コーポレイション エージェント‐メッシュ・アーキテクチャーにおいてネットワーク・パケットを処理する技術

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640106A (en) * 1995-05-26 1997-06-17 Xilinx, Inc. Method and structure for loading data into several IC devices
US7444454B2 (en) * 2004-05-11 2008-10-28 L-3 Communications Integrated Systems L.P. Systems and methods for interconnection of multiple FPGA devices
US8237624B2 (en) * 2008-05-06 2012-08-07 Integrated Device Technology, Inc. System having capability for daisy-chained serial distribution of video display data
US8874853B2 (en) * 2010-06-04 2014-10-28 International Business Machines Corporation Local and global memory request predictor
US9501325B2 (en) 2014-04-11 2016-11-22 Maxeler Technologies Ltd. System and method for shared utilization of virtualized computing resources
US10659372B2 (en) * 2017-01-25 2020-05-19 Futurewei Technologies, Inc. Multi-core lock-free rate limiting apparatus and method
JP6960479B2 (ja) * 2017-03-14 2021-11-05 アズールエンジン テクノロジーズ ヂュハイ インク.Azurengine Technologies Zhuhai Inc. 再構成可能並列処理
US11227071B2 (en) * 2017-03-20 2022-01-18 Nanyang Technological University Hardware security to countermeasure side-channel attacks
US10838910B2 (en) * 2017-04-27 2020-11-17 Falcon Computing Systems and methods for systolic array design from a high-level program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009116813A (ja) 2007-11-09 2009-05-28 Japan Aerospace Exploration Agency 大規模計算用カスタムメイド計算機
US20130239121A1 (en) 2010-11-19 2013-09-12 Eurotech Spa Unified network architecture for scalable super-calculus systems
US20160306668A1 (en) 2015-04-17 2016-10-20 Microsoft Technology Licensing, Llc Implementing a Service Using Plural Acceleration Components
US20180131635A1 (en) 2016-11-10 2018-05-10 LDA Technologies Ltd. Distributed fpga solution for high-performance computing in the cloud
JP2019047489A (ja) 2017-08-30 2019-03-22 インテル コーポレイション エージェント‐メッシュ・アーキテクチャーにおいてネットワーク・パケットを処理する技術
US20190034363A1 (en) 2017-09-01 2019-01-31 Intel Corporation Accelerator interconnect assignments for virtual environments

Also Published As

Publication number Publication date
CN113597601A (zh) 2021-11-02
KR20210126120A (ko) 2021-10-19
WO2020180787A1 (en) 2020-09-10
TW202103020A (zh) 2021-01-16
US20200285603A1 (en) 2020-09-10
EP3935512A1 (en) 2022-01-12
TWI832982B (zh) 2024-02-21
JP2022523830A (ja) 2022-04-26
IL286138A (en) 2021-10-31
US10983948B2 (en) 2021-04-20

Similar Documents

Publication Publication Date Title
KR102266281B1 (ko) 멀티 모드에서 동작하는 장치 및 그것을 포함하는 시스템
KR102392204B1 (ko) 멀티-모드 및/또는 멀티-속도 NVMe-oF 장치들을 지원하는 시스템 및 방법
US11741040B2 (en) SFF-TA-100X based multi-mode protocols solid state devices
US11775464B2 (en) Computer system and a computer device
US20210265755A1 (en) MULTI-MODE AND/OR MULTI-SPEED NON-VOLATILE MEMORY (NVM) EXPRESS (NVMe) OVER FABRICS (NVMe-oF) DEVICE
KR20130084611A (ko) 전속 병렬 dut 테스트용 솔루션
US10528509B2 (en) Expansion bus devices comprising retimer switches
TWI620069B (zh) 用於io連接器的可交換電力及訊號接點
US10248605B2 (en) Bidirectional lane routing
JP2008229914A (ja) 画像形成装置、画像処理装置、制御装置、及び、接続装置
JP7295968B2 (ja) 再構成可能な計算装置
JP2013099949A (ja) 画像形成装置及び接続装置
US9785203B1 (en) Flex cable interface
US20230205585A1 (en) Elevated Isolation of Reconfigurable Data Flow Resources in Cloud Computing
US10349552B2 (en) Supporting input/output (I/O) connectivity for a printed circuit assembly (PCA) in a hot aisle cabling or a cold aisle cabling arrangement
Hanawa et al. Towards unification of accelerated computing and interconnection for extreme-scale computing

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230516

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230609

R150 Certificate of patent or registration of utility model

Ref document number: 7295968

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150