JP2006518057A - 改善された計算アーキテクチャ、関連システム、並びに、方法 - Google Patents

改善された計算アーキテクチャ、関連システム、並びに、方法 Download PDF

Info

Publication number
JP2006518057A
JP2006518057A JP2005502224A JP2005502224A JP2006518057A JP 2006518057 A JP2006518057 A JP 2006518057A JP 2005502224 A JP2005502224 A JP 2005502224A JP 2005502224 A JP2005502224 A JP 2005502224A JP 2006518057 A JP2006518057 A JP 2006518057A
Authority
JP
Japan
Prior art keywords
data
pipeline
accelerator
host
peer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005502224A
Other languages
English (en)
Inventor
マートゥル,チャンダン
ヘレンバッハ,スコット
ラープ,ジョン,ダブリュ.
ジャクソン,ラリー
ジョウンズ,マーク
カーサロ,トロイ
Original Assignee
ロッキード マーティン コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/684,053 external-priority patent/US7987341B2/en
Application filed by ロッキード マーティン コーポレーション filed Critical ロッキード マーティン コーポレーション
Publication of JP2006518057A publication Critical patent/JP2006518057A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3877Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor
    • G06F9/3879Concurrent instruction execution, e.g. pipeline or look ahead using a slave processor, e.g. coprocessor for non-native instruction execution, e.g. executing a command; for Java instruction set
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Advance Control (AREA)
  • Multi Processors (AREA)
  • Stored Programmes (AREA)
  • Programmable Controllers (AREA)
  • Logic Circuits (AREA)
  • Microcomputers (AREA)
  • Bus Control (AREA)
  • Complex Calculations (AREA)

Abstract

ピア−ベクトル・マシンはホストプロセッサとハードウェアに組み込まれたパイプライン加速器とを含む。ホストプロセッサはプログラムを実行し、該プログラムに応じてホスト・データを生成し、そしてパイプライン加速器はそのホスト・データからパイプライン・データを生成する。代替的には、パイプライン加速器はパイプライン・データを生成し、ホストプロセッサはそのパイプライン・データからホスト・データを生成する。ピア−ベクトル・マシンはプロセッサ及びパイプライン加速器の両方を含むので、しばしば、プロセッサだけ或は加速器だけを含むマシンよりもより効率的にデータを処理できる。例えば、ホストプロセッサが意思決定を実行すると共に数学的に非集中的な演算を実行し、そして加速器が非意思決定を実行すると共に数学的に集中的な演算を実行するようにピア−ベクトル・マシンを設計できる。数学的に集中的な演算を加速器にシフトすることによって、ピア−ベクトル・マシンは、しばしば、所与のクロック周波数で、プロセッサだけのマシンがデータを処理できる速度を凌ぐ速度でデータを処理できる。

Description

<優先権の請求>
この出願は、下記の特許文献1に対する優先権を請求するものであり、引用することでここに合体させる。
米国仮出願第60/422,503号(2002年10月31日出願)
<関連出願の相互参照>
この出願は、「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」と題された下記の特許文献2、「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」と題された下記の特許文献3、「プログラマブル回路、関連計算マシン、並びに、方法」と題された下記の特許文献4、「多数パイプライン・ユニットを有するパイプライン加速器、関連計算マシン、並びに、方法」と題された下記の特許文献5と関連し、これら特許文献は全て2003年10月9日に出願され、共通の所有者を有し、引用することでここに合体させる。
米国出願第10/684,053号 米国出願第10/683,929号 米国出願第10/684,057号 米国出願第10/683,932号
比較的大量のデータを比較的短い期間で処理する通常の計算アーキテクチャは、処理負担を分担する多数の相互接続プロセッサを含む。処理負担を分担することによって、これら多数のプロセッサは、しばしば、所与のクロック周波数で単一プロセッサができるものよりよりも迅速にデータを処理できる。例えば、これらプロセッサの各々はデータの各部分を処理できるか、或は、処理アルゴリズムの各部分を実行できる。
図1は、多数プロセッサ・アーキテクチャを有する従来の計算マシン10の概略ブロック図である。この計算マシン10は、マスター・プロセッサ12と、相互に通信すると共に該マスター・プロセッサとバス16を介して通信する共同プロセッサ141−14nと、遠隔装置(図1では不図示)から生データを受け取る入力ポート18と、該遠隔装置に処理データを提供する出力ポート20とを含む。また、計算マシン10はマスター・プロセッサ12に対するメモリ22と、共同プロセッサ141−14nに対する各メモリ241−24nと、マスター・プロセッサ及び共同プロセッサがバス16を介して共有するメモリ26とを含む。メモリ22はマスター・プロセッサ12に対するプログラム及び作業メモリの双方の役割を果たし、各メモリ241−24nは各共同メモリ141−14nに対するプログラム及び作業メモリの双方の役割を果たす。共有されたメモリ26は、マスター・プロセッサ12及び共同プロセッサ14がそれらの間でデータを転送すること、ポート18を介して遠隔装置からデータを転送すること、ポート20を介して遠隔装置にデータを転送することを可能としている。またマスター・プロセッサ12及び共同プロセッサ14は、マシン10が生データを処理する速度を制御する共通クロック信号を受け取る。
一般に、計算マシン10は、マスター・プロセッサ12及び共同プロセッサ14の間で生データの処理を効果的に分割する。ソナー・アレイ(図5)等の遠隔ソース(図1では不図示)は、ポート18を介して、生データに対する先入れ先出し(FIFO)バッファ(不図示)として作用する共有メモリ26の1つの区分に生データをロードする。マスター・プロセッサ12はバス16を介してメモリ26から生データを検索して、マスター・プロセッサ及び共同プロセッサ14はその生データを処理して、バス16を介して必要に応じてデータをそれらの間に転送する。マスター・プロセッサ12はその処理データを共有メモリ26内に規定された別のFIFOバッファ(不図示)にロードし、遠隔ソースがポート20を介してこのFIFOからその処理データを検索する。
演算例において、計算マシン10は生データに対するn+1個の各演算を順次実行することによって該生データを処理し、これら演算は一体的に高速フーリエ変換(FFT)等の処理アルゴリズムを構成する。より詳細には、マシン10はマスター・プロセッサ12及び共同プロセッサ14からのデータ−処理パイプラインを形成する。クロック信号の所与の周波数で、そうしたパイプラインはしばしばマシン10が単一プロセッサのみを有するマシンよりも高速に生データを処理することを可能としている。
メモリ26内における生データFIFO(不図示)からの生データ検索後、マスター・プロセッサ12はその生データに対して三角関数等の第1番演算を実行する。この演算は第1番結果を生み出し、それをプロセッサ12がメモリ26内に規定された第1番結果FIFO(不図示)に記憶する。典型的には、プロセッサ12はメモリ22内に記憶されたプログラムを実行し、そのプログラムの制御の下で上述した動作を実行する。プロセッサ12はメモリ22を作業メモリとしても使用し得て、当該プロセッサが第1番演算の中間期間に生成するデータを一時的に記憶する。
次に、メモリ26内における第1番結果FIFO(不図示)からの第1番結果検索後、共同プロセッサ141はその第1番結果に対して対数関数等の第2番演算を実行する。この第2番演算は第2番結果を生み出し、それを共同プロセッサ141がメモリ26内に規定された第2番結果FIFO(不図示)に記憶する。典型的には、共同プロセッサ141はメモリ241内に記憶されたプログラムを実行し、そのプログラムの制御の下で上述した動作を実行する。共同プロセッサ141はメモリ241を作業メモリとしても使用し得て、当該共同プロセッサが第2番演算の中間期間に生成するデータを一時的に記憶する。
次に共同プロセッサ242−24nは、共同プロセッサ241に対して先に議論されたものと同様に、(第2番結果−第(n−1)番)結果に対して(第3番演算−第n番)演算を順次実行する。
共同プロセッサ24nによって実行される第n番演算は最終結果、即ち処理データを生み出す。共同プロセッサ24nはその処理データをメモリ26内に規定された処理データFIFO(不図示)内にロードし、遠隔装置(図1では不図示)がこのFIFOからその処理データを検索する。
マスター・プロセッサ12及び共同プロセッサ14は処理アルゴリズムの種々の演算を同時に実行するので、計算マシン10は、しばしば、種々の演算を順次実行する単一プロセッサを有する計算マシンよりも生データを高速に処理することができる。詳細には、単一プロセッサは、生データから成る先行集合に対する全(n+1)個の演算を実行するまで、生データから成る新しい集合を検索できない。しかし、以上に議論したパイプライン技術を用いて、マスター・プロセッサ12は第1演算だけを実行後に生データから成る新しい集合を検索できる。結果として、所与のクロック周波数でこのパイプライン技術は、単一プロセッサ・マシン(図1では不図示)と比較して約n+1倍だけマシン10が生データを処理する速度を増大することができる。
代替的には、計算マシン10は、生データに対するFFT等の処理アルゴリズムの(n+1)例を同時に実行することによって該生データを並列して処理し得る。即ち、もしそのアルゴリズムが先行する例において先に記載されたような(n+1)個の順次演算を含めば、マスター・プロセッサ12及び共同プロセッサ14の各々は生データからそれぞれが成る各集合に対して、順次、全(n+1)個の演算を実行する。その結果として、所与のクロック周波数で、先のパイプライン技術と同様のこの並列処理技術は、単一プロセッサ・マシン(図1では不図示)と比較して約n+1倍だけマシン10が生データを処理する速度を増大することができる。
残念ながら、計算マシン10は単一プロセッサ・計算マシン(図1では不図示)と比べてより迅速にデータを処理できるが、マシン10のデータ処理速度はしばしばプロセッサ・クロックの周波数より非常に小さい。詳細には、計算マシン10のデータ処理速度はマスター・プロセッサ12及び共同プロセッサ14がデータ処理するのに必要な時間によって制限される。簡略化のため、この速度制限の例はマスター・プロセッサ12と連携して議論されているが、この議論は共同プロセッサ14にも適用されることを理解して頂きたい。先に議論されたように、マスター・プロセッサ12は所望の方式でデータを操作すべくプロセッサを制御するプログラムを実行する。このプログラムはプロセッサ12が実行する複数の命令から成るシーケンスを含む。残念ながら、プロセッサ12は典型的には単一命令を実行するために多数のクロック・サイクルを必要とし、そしてしばしばデータの単一値を処理すべく多数の命令を実行しなければならない。例えば、プロセッサ12が第1データ値A(不図示)を第2データ値B(不図示)で乗算することを仮定する。第1クロック・サイクル中、プロセッサ12はメモリ22から乗算命令を検索する。第2及び第3クロック・サイクル中、プロセッサ12はメモリ26からA及びBをそれぞれ検索する。第4クロック・サイクル中、プロセッサ12はA及びBを乗算し、そして第5クロック・サイクル中に結果としての積をメモリ22或は26に記憶するか、或は、その結果としての積を遠隔装置(不図示)に提供する。これは最良ケースのシナリオであり、その理由は多くの場合にプロセッサ12はカウンタの初期化及び閉鎖等のオーバーヘッド・タスクに対して付加的なクロック・サイクルを必要とするからである。それ故に、よくてもプロセッサ12はA及びBを処理すべく5クロック・サイクルを必要とするか、或は、1データ値当たり平均2.5クロック・サイクルを必要とする。
結果として、計算マシン10がデータを処理する速度は、しばしば、マスター・プロセッサ12及び共同プロセッサ14を駆動するクロックの周波数より非常に低い。例えば、もしプロセッサ12は1.0ギガヘルツ(GHz)でクロックされるが、1データ値当たり平均2.5クロック・サイクルを必要とすれば、効果的なデータ処理速度は(1.0GHz)/2.5=0.4GHzと同等である。この効果的なデータ処理速度は、しばしば、1秒当たり演算数の単位で特徴付けされる。それ故に、この例において、1.0GHzのクロック速度で、プロセッサ12は0.4ギガ演算数/秒(Gops)で使用限界が定められる。
図2は、所与クロック周波数で且つしばしば該パイプラインがクロックされる速度と略同一速度で、プロセッサが可能であるよりは高速で典型的にはデータを処理できるハードウェアに組み込まれたデータ・パイプライン30のブロック線図である。パイプライン30は、プログラム命令を実行することなく、各データに対する各演算を各々が実行する演算子回路321−32nを含む。即ち、所望の演算は回路32内に「書き込み」が為されて、それがプログラム命令の必要性なしに自動的にその演算を具現化するように為す。プログラム命令の実行と関連されたオーバーヘッドを減ずることによって、パイプライン30は所与のクロック周波数でプロセッサが可能であるよりは単位秒当たりより多くの演算を典型的には実行する。
例えば、パイプライン30は所与のクロック周波数でプロセッサが可能であるよりは高速で以下の数式1をしばしば解くことができる。
Y(xk)=(5xk+3)2xk
ここで、xkは複数の生データ値から成るシーケンスを表す。この例において、演算子回路321は5xkを計算する乗算器であり、回路322は5xk+3を計算する加算器であり、そして回路32n(n=3)は(5xk+3)2xkを計算する乗算器である。
第1クロック・サイクルk=1中、回路321はデータ値x1を受け取って、それを5で乗じて、5x1を生成する。
第2クロック・サイクルk=2中、回路322は回路321から5x1を受け取って、3を加えて、5x1+3を生成する。またこの第2クロック・サイクル中に回路321は5x2を生成する。
第3クロック・サイクルk=3中、回路323は回路322から5x1+3を受け取って、2x1で乗じて(効果としては、x1だけ5x1+3を右シフトする)、第1結果(5x1+3)2x1を生成する。またこの第3クロック・サイクル中に回路321は5x3を生成し、回路322は5x2+3を生成する。
このようにしてパイプライン30は、全ての生データ値が処理されるまで、引き続く生データ値xkの処理を続行する。
結果として、生データ値x1の受け取り後の2つのクロック・サイクルの遅延、即ち、この遅延はパイプライン30の待ち時間としばしば呼称され、パイプラインは結果(5x1+3)2x1を生成し、その後、各クロック・サイクル毎に1つの結果を生成する。
待ち時間を無視して、パイプライン30はこうしてクロック速度と同等のデータ処理速度を有する。比較して、マスター・プロセッサ12及び共同プロセッサ14(図1)が先の例におけるようにクロック速度の0.4倍であるデータ処理速度を有すると仮定すれば、パイプライン30は、所与のクロック速度で、計算マシン10(図1)よりも2.5倍高速でデータを処理できる。
更に図2で参照されるように、設計者はフィールド・プログラマブル・ゲート・アレイ(FPGA)等のプログラマブル・ロジックIC(PLIC)にパイプライン30を具現化することを選ぶ可能性があり、その理由はPLICが特殊用途IC(ASIC)が為すよりも多くの設計及び変更の柔軟性を許容するからである。PLIC内にハードウェアに組み込まれた接続を構成するため、設計者はPLIC内に配置された相互接続構成レジスタを単に所定バイナリー状態に設定する。全てのこうしたバイナリー状態の組み合わせはしばしば「ファームウェア」と呼称される。典型的には、設計者はこのファームウェアをPLICと結合された不揮発性メモリ(図2では不図示)内にロードする。PLICを「ターンオン」すると、それはファームウェアをそのメモリから相互接続構成レジスタにダウンロードする。それ故に、PLICの機能を変更すべく、設計者は単にそのファームウェアを変更して、PLICがその変更されたファームウェアを相互接続構成レジスタにダウンロードすることを可能とする。ファームウェアを単に変更することによってPLICを変更する能力は、モデル作成段階中や「フィールド内」にパイプライン30をアップグレードするために特に有用である。
残念ながら、ハードウェアに組み込まれたパイプライン30は、典型的には、全てのアルゴリズムを実行することができるわけではなく、特に、重要な意思決定を引き起こすアルゴリズムは実行できない。プロセッサは、典型的には、意思決定命令(例えば、「もしAであれば、Bへ行き、またCへ行く」のような、条件命令)を、比肩する長さの演算命令(例えば、「A+B」)を実行できる程に高速に実行できる。しかしパイプライン30は、比較的単純な決定(例えば、「A>B?」)を為し得るが、典型的には比較的複雑な決定(例えば、「もしAであれば、Bへ行き、またCへ行く」)を実行することができない。そして、そうした複雑な決定を実行すべくパイプライン30を設計できるが、必要とされる回路のサイズ及び複雑性はしばしばそうした設計を非現実的に為し、特にアルゴリズムが多数の種々の複雑な決定を含む場合にそうである。
結果として、プロセッサは典型的には重要な意思決定を必要とする用途において使用され、ハードウェアに組み込まれたパイプラインは殆ど意思決定が為されないか或は意思決定されない「ナンバークランチング(数値データ処理)」用途に典型的には限定される。
更には、下記に議論されるように、典型的には、特にパイプライン30が多数のPLICを含む場合、図2のパイプライン30等のハードウェアに組み込まれたパイプラインを設計/変更するよりも、図1の計算マシン10等のプロセッサに基づく計算マシンを設計/変更することが非常に易しい。
プロセッサ及びそれらの周辺機器(例えば、メモリ)等の計算構成要素は、典型的には、プロセッサに基づく計算マシンを形成すべくそれら構成要素の相互接続を補助する工業規格通信インターフェースを含む。
典型的には、規格通信インターフェースは2つの層、即ち、物理層及びサービス層を含む。
物理層は、回路とこの回路のインターフェース及び動作パラメータを形成する対応回路相互接続とを含む。例えば、物理層はそれら構成要素を1つのバスに接続するピンと、それらのピンから受け取ったデータをラッチするバッファと、信号をそれらピンに駆動するドライバとを含む。動作パラメータは、ピンが受け取るデータ信号の許容可能電圧範囲と、データの書き込み及び読み取りのための信号タイミングと、動作の支援されたモード(例えば、バーストモード、ページモード)とを含む。従来の物理層はトランジスタ−トランジスタ論理(TTL)及びRAMBUSを含む。
サービス層は、計算構成要素のデータ転送のためのプロトコルを含む。このプロトコルはデータのフォーマットと、構成要素によるフォーマット済みデータの送受信の方式とを含む。従来の通信プロトコルは、ファイル転送プロトコル(FTP)及びTCP/IP(拡張)を含む。
結果として、製造業者やその他は工業規格通信インターフェースを有する計算構成要素を典型的には設定するので、そうした構成要素のインターフェースを典型的には設計できて、それを他の計算構成要素と比較的少ない労力で相互接続することができる。これは、計算マシンの他の部分の設計に設計者自信の時間を殆ど費やすことを可能として、各種構成要素を追加或は除去することによってそのマシンを変更することを可能としている。
工業規格通信インターフェースを支援する計算構成要素を設計することは、設計ライブラリから既存の物理層を用いることによって設計時間を節約することを可能としている。これは、設計者が構成要素を既製の計算構成要素と容易にインターフェースすることを保証するものでもある。
そして、共通した工業規格通信インターフェースを支援する計算構成要素を用いる計算マシンを設計することは、設計者がそれら構成要素を少しの時間及び労力で相互接続することを可能としている。それら構成要素は共通インターフェースを支援するので、設計者はそれらをシステム・バスを介して少しの設計労力で相互接続することができる。そして、その支援されたインターフェースは工業規格であるので、マシンを容易に変更することができる。例えば、システム設計が進化するに伴って種々の構成要素及び周辺機器をマシンに追加することができるか、或は、テクノロジーが進化するに伴って次世代の構成要素を追加/設計することが可能である。更には、構成要素が通常の工業規格サービス層を支援するので、計算マシンのソフトウェアに対応するプロトコルを具現化する既存のソフトウェア・モジュールを組み込むことができる。それ故に、インターフェース設計が本質的には既に整っているので少しの労力で構成要素をインターフェースでき、よって、マシンに所望の機能を実行させるマシンの各種部分(例えばソフトウェア)の設計に集中することができる。
しかし残念ながら、図2のパイプライン30等のハードウェアに組み込まれたパイプラインを形成すべく、使用されるPLIC等の各種構成要素に対する既知の工業規格通信層が全くない。
結果として、多数のPLICを有するパイプラインを設計すべく、多大な時間を費やし、「ゼロから」種々のPLICの間の通信層を設計し且つデバッグする多大な労力を行使する。典型的には、そうしたその場限りのサービス層は種々のPLIC間で転送されるデータのパラメータに依存する。同じように、プロセッサとインターフェースするパイプラインを設計すべく、ゼロからのパイプライン及びプロセッサの間の通信層の設計及びデバッグに関して多大な時間を費やし且つ多大な労力を行使する必要がある。
同様に、そうしたパイプラインをPLICを該パイプラインに追加することによって変更すべく、典型的には、その追加されたPLICと既存のPLICとの間の通信層の設計及びデバッグに関して多大な時間を費やし且つ多大な労力を行使する。同じように、プロセッサを追加することによってパイプラインを変更すべく、或は、パイプラインを追加することによって計算マシンを変更すべく、パイプライン及びプロセッサの間の通信層の設計及びデバッグに関して多大な時間を費やし且つ多大な労力を行使しなければならいであろう。
結果として、図1及び図2で参照されるように、多数のPLICをインターフェースすることとプロセッサをパイプラインにインターフェースすることとの難しさのため、計算マシンを設計する際に多大な妥協を為すことがしばしば強いられる。例えば、プロセッサに基づく計算マシンでは、ナンバークランチング速度を、複雑な意思決定を為す能力及び設計/変更の柔軟性と交換することを強いられる。逆に、ハードウェアに組み込まれたパイプラインに基づく計算マシンでは、複雑な意思決定を為す能力と設計/変更の柔軟性を、ナンバークランチング速度と交換することを強いられる。更には、多数のPLICをインターフェースすることに関する難しさのため、少数のPLICよりも多くのPLICを有するパイプラインに基づくマシンを設計することはしばしば実際的ではない。その結果、実際的なパイプラインに基づくマシンはしばしば制限された機能しか有さない。そして、プロセッサをPLICとインターフェースすることに関する難しさのため、プロセッサを1つのPLICより多くのPLICにインターフェースすることは実際的ではない。その結果、プロセッサ及びパイプラインを組み合わせることによって獲得される利益は最少となる。
それ故に、プロセッサに基づくマシンの意思決定を為す能力を、ハードウェアに組み込まれたパイプラインに基づくマシンのナンバークランチング速度と組み合わせることを可能とする新しい計算アーキテクチャに対する要望が生じてきている。
本発明の実施例において、ピア−ベクトル・マシンはホストプロセッサとハードウェアに組み込まれたパイプライン加速器とを含む。ホストプロセッサは、プログラムを実行し、そしてそのプログラムに応じてホスト・データを生成し、パイプライン加速器はそのホスト・データからパイプライン・データを生成する。
本発明の別の実施例に従えば、パイプライン加速器はパイプライン・データを生成し、ホストプロセッサはそのパイプライン・データからホスト・データを生成する。
ピア−ベクトル・マシンはプロセッサとハードウェアに組み込まれたパイプライン加速器との両方を含むので、しばしば、プロセッサだけ或はハードウェアに組み込まれたパイプラインだけを含む計算マシンよりもデータをより効率的に処理できる。例えば、加速器が数学的に集中的な演算を実行する一方で、ホストプロセッサが意思決定及び数学的に非集中的な演算を実行するようにピア−ベクトル・マシンを設計できる。数学的に集中的な演算を加速器にシフトすることによって、ピア−ベクトル・マシンは、しばしば、所与のクロック周波数でプロセッサだけのマシンがデータを処理する速度を凌ぐ速度でそのデータを処理できる。
図3は、本発明の一実施例に従ったピア−ベクトル・アーキテクチャを有する計算マシン40の概略ブロック線図である。ホストプロセッサ42に加えて、ピア−ベクトル・マシン40はパイプライン加速器44を含み、それがデータ処理の少なくとも一部を実行して、図1の計算マシン10における共同プロセッサ14の列と効果的に置き換わる。それ故に、ホストプロセッサ42及び加速器44はデータ・ベクトルを前後に転送できる「ピア」である。加速器44はプログラム命令を実行しないので、所与のクロック周波数で共同プロセッサの列ができるものよりも著しく高速にデータに対して数学的に集中的な演算を典型的には実行する。結果として、プロセッサ42の意思決定能力と加速器44のナンバークランチング能力とを組み合わせることによって、マシン40はマシン10等の従来の計算マシンと同一の能力を有するが、しばしばそれよりもデータをより高速に処理することができる。更には、先行して引用された「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」と題された特許文献2や「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」と題された特許文献3で議論されているように、加速器44にホストプロセッサ42と同一の通信層を設けることは、特にその通信層が工業規格である場合、マシン40の設計及び変更を補助する。そして、加速器44が多数の構成要素(例えばPLIC)を含む場合、これら構成要素にこの同一の通信層を設けることは、特にその通信層が工業規格である場合、加速器の設計及び変更を補助する。更にはマシン40も、以下に説明されると共に先行して引用された特許出願に説明されているように、他の長所等を提供し得る。
ホストプロセッサ42及びパイプライン加速器44に加えて、ピア−ベクトル計算マシン40はプロセッサ・メモリ46、インターフェース・メモリ48、バス50、ファームウェア・メモリ52、任意選択的な生データ入力ポート54,56、処理データ出力ポート58,60、並びに、任意選択的なルータ61を含む。
ホストプロセッサ42は処理ユニット62及びメッセージ・ハンドラー64を含み、プロセッサ・メモリ46は処理ユニット・メモリ66及びハンドラー・メモリ68を含み、それらがプロセッサ・ユニット及びメッセージ・ハンドラーに対するプログラム及び作業の両メモリとしてそれぞれ役立っている。プロセッサ・メモリ46も加速器コンフィギュレーション・レジストリ70及びメッセージ・コンフィギュレーション・レジストリ72を含み、それらが、ホストプロセッサ42に加速器44の機能を構成させると共にメッセージ・ハンドラー64が生成するメッセージの構造とを構成させる各コンフィギュレーション・データを記憶する。
パイプライン加速器44は少なくとも1つのPLIC(不図示)上に配置されると共にハードウェアに組み込まれたパイプライン741−74nを含み、それらがプログラム命令を実行することなしに各データを処理する。ファームウェア・メモリ52は加速器44に対するコンフィギュレーション・ファームウェアを記憶する。もし加速器44が多数のPLIC上に配置されれば、それらPLIC及びそれらの各ファームウェア・メモリは多数の回路ボード上、即ちドーターカード(不図示)上に配置され得る。加速器44及びドーターカードは、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」と題された特許文献3や「多数パイプライン・ユニットを有するパイプライン加速器、関連計算マシン、並びに、方法」と題された特許文献5に更に議論されている。代替的には、加速器44は少なくとも1つのASIC上に配置され得て、よって構成不可能である内部相互接続を有し得る。この代替例において、マシン40はファームウェア・メモリ52を省略し得る。更には、加速器44が多数のパイプライン74を含むようにも示されているが、単一のパイプラインだけを含んでもよい。
更に図3で参照されるように、ピア−ベクトル・マシン40の動作は本発明の実施例に従って以下に議論される。
<ピア−ベクトル・マシンの構成>
ピア−ベクトル・マシン40が先ず起動されると、処理ユニット62はメッセージ・ハンドラー64及びパイプライン加速器44(加速器が構成可能である場合)を構成して、マシンが所望アルゴリズムを実行するように為す。詳細には処理ユニット62は、以下で議論されるように、メモリ66に記憶されると共に、処理ユニットにメッセージ・ハンドラー64及び加速器44を構成させるホスト・アプリケーション・プログラムを実行する。
メッセージ・ハンドラー64を構成すべく、処理ユニット62はレジストリ72からメッセージ・フォーマット情報を検索し、そのフォーマット情報をメッセージ・ハンドラーに提供して、該メッセージ・ハンドラーはこの情報をメモリ60に記憶する。マシン40が以下に議論されるようにデータを処理すると、メッセージ・ハンドラー64はそのフォーマット情報を用いて所望のフォーマットを有するデータ・メッセージを生成し解読する。一実施例において、フォーマット情報は拡張可能マークアップ言語(XML)で書かれるが、他の言語或はデータ・フォーマットでも書かれ得る。処理ユニット62はピア−ベクトル・マシン40が起動されるたびにメッセージ・ハンドラー64を構成するので、単にレジストリ72に記憶されたフォーマット情報を変更することによってメッセージ・フォーマットを変更することができる。代替的には、外部メッセージ・コンフィギュレーション・ライブラリ(不図示)が多数のメッセージ・フォーマットに対する情報を記憶し得て、そしてホスト・アプリケーションを設計及び/或は変更し得て、処理ユニット62がライブラリの選択された部分からレジストリ72を更新してから、更新されたレジストリからメッセージ・ハンドラー64に所望フォーマット情報をダウンロードするように為す。メッセージ・フォーマットとメッセージを生成して解読することとは、以下に更に議論されると共に、先行して引用された「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」と題された特許文献2に更に議論されている。
同様に、パイプライン加速器44の相互接続レイアウトを構成すべく、処理ユニット62はレジストリ70からコンフィギュレーション・ファームウェアを検索し、そのファームウェアをメッセージ・ハンドラー64及びバス50を介してメモリ52にダウンロードする。次いで加速器44は、メモリ52からその相互接続コンフィギュレーション・レジスタ(不図示)にファームウェアをダウンロードすることによってそれ自体を構成する。処理ユニット62がピア−ベクトル・マシン40が起動されるたびに加速器44を構成するので、単にレジストリ70に記憶されたファームウェアを変更することによって、加速器44の相互接続レイアウト(そして、それ故その機能と)を変更することができる。代替的には、外部加速器コンフィギュレーション・ライブラリ(不図示)は加速器44の多数のコンフィギュレーションに対するファームウェアを記憶し得て、そしてホスト・アプリケーションを設計及び/或は変更し得て、処理ユニット62がライブラリの選択された部分からレジストリ70を更新してから、更新されたレジストリからメモリ52に所望ファームウェアをダウンロードするように為す。更には、外部ライブラリ或はレジストリ70は加速器44の種々の部分及び/或は機能を規定するファームウェア・モジュールを記憶し得る。それ故、加速器44の設計及び/或は変更を補助するために、これらモジュールを使用し得る。加えて、処理ユニット62はこれらモジュールを使用し得て、マシン40がデータを処理している間に加速器44を変更する。加速器44の相互接続コンフィギュレーションとファームウェア・モジュールとは、先行して引用された「プログラマブル回路、関連計算マシン、並びに、方法」と題された特許文献4に更に議論されている。
処理ユニット62も、ピア−ベクトル・マシン40がデータを処理している間にパイプライン加速器44を「ソフト構成」し得る。即ち、処理ユニット62は、加速器の相互接続レイアウトを改変することなく、加速器44の機能を構成し得る。そうしたソフト・コンフィギュレーションは、以下に更に議論されると共に、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」と題された特許文献3に更に議論されている。
<ピア−ベクトル・マシンによるデータ処理>
一般に、ピア−ベクトル・マシン40はホストプロセッサ42及びパイプライン加速器44の間に生データの処理を効果的に分割する。例えば、ホストプロセッサ42はそのデータと関係する意思決定演算の殆ど或は全てを実行し得て、加速器44はそのデータに対する数学的に集中的な演算の殆ど或は全てを実行し得る。しかしながらマシン40は任意の所望の方式でそのデータ処理を分割する。
<ホストプロセッサの動作>
一実施例において、ホストプロセッサ42は、ソナー・アレイ(図5)等の遠隔装置から生データを受信し、その結果としての処理データをその遠隔装置に提供する。
ホストプロセッサ42は、先ず、遠隔装置から入力ポート54或はバス50を介して生データを受信する。ピア−ベクトル・マシン40はその受信された生データのバッファリングのためのFIFO(不図示)を含み得る。
次に、処理ユニット62はパイプライン加速器44による処理のための生データを準備する。例えば、ユニット62は、例えば、生データの何れを加速器44に送信すべきか、或は、何れのシーケンスでその生データを送信すべきかを決定し得る。或は、ユニット62は生データを処理し得て、加速器44に送信するための中間データを生成する。生データの準備は、先行して引用された「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」と題された特許文献2に更に議論されている。
生データを準備している間、処理ユニット54は1つ或はそれ以上の「ソフト・コンフィギュレーション」コマンドを生成して、加速器44の機能を変更もし得る。マシン40が起動された際に加速器44の相互接続レイアウトを構成するファームウェアとは異なり、ソフト・コンフィギュレーション・コマンドはその相互接続レイアウトを改変することなしに加速器の機能を制御する。例えば、ソフト・コンフィギュレーション・コマンドは、加速器44が処理するデータ・ストリングのサイズ(例えば、32ビット或は64ビット)を制御し得る。加速器44のソフト・コンフィギュレーションは、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」と題された特許文献3に更に議論されている。
次いで処理ユニット62はその準備されたデータ及び/或はソフト・コンフィギュレーション・コマンド(単数或は複数)をインターフェース・メモリ48の対応する箇所にロードし、それがユニット62及び加速器44の間のFIFOバッファとして作用する。
次に、メッセージ・ハンドラー64はインターフェース・メモリ48から準備されたデータ及び/或はソフトウェア・コマンド(単数或は複数)を検索して、データ及び/或はコマンド(単数或は複数)、並びに、関連情報を含むメッセージ・オブジェクトを生成する。典型的には加速器44は、データ/コマンド(単数或は複数)及び関連情報(集合的には「情報」)、即ち、a)情報の意図された仕向先(例えば、パイプライン741)、b)優先順位(例えば、加速器は先行して受信されるデータの前或は後にそのデータを処理すべきか)、c)メッセージ・オブジェクトの長さ或は終端、並びに、d)データの固有例(例えば、一千のセンサから成るアレイからのセンサ信号番号9)を記述する4つの識別子が必要である。この決定を補助すべく、メッセージ・ハンドラー64は、先に議論されたように、所定のフォーマットを有するメッセージ・オブジェクトを生成する。準備されたデータ/ソフト・コンフィギュレーション・コマンド(単数或は複数)に加えて、メッセージ・オブジェクトは、典型的には、4つの先に記載した識別子を含むと共にオブジェクトが含む情報のタイプを記述する識別子(例えば、データ・コマンド)をも含み得るヘッダーと、データが処理されることになるアルゴリズムとを含む。この後者の識別子は、仕向先パイプライン74が多数のアルゴリズムを具現化する場合に有用である。ハンドラー64はインターフェース・メモリ48からヘッダー情報を検索し得るか、準備されたデータ或はコマンド(単数或は複数)を検索するインターフェース・メモリ内の箇所に基づいてヘッダーを生成し得る。メッセージ・ヘッダーを解読することによって、ルータ61及び/或は加速器44はメッセージ・オブジェクト内の情報を所望の仕向先に送ることができ、その仕向先にその情報を所望の順序で処理させ得る。
メッセージ・オブジェクトを生成するための代替実施例が存在する。例えば、各メッセージ・オブジェクトがデータ或はソフト・コンフィギュレーション・コマンドの何れかを含むと説明されているが、単一のメッセージ・オブジェクトはデータと1つ或はそれ以上のコマンドとの両方を含み得る。更には、メッセージ・ハンドラー64がインターフェース・メモリ48からデータ及びコマンドを受信すると説明されているが、処理ユニット54からデータ及びコマンドを直接的に受信し得る。
メッセージ・オブジェクトの生成は、先行して引用された「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」と題された特許文献2に更に議論されている。
<パイプライン加速器>
パイプライン加速器44はメッセージ・ハンドラー64からメッセージ・オブジェクトを受信し解読して、そのオブジェクト内のデータ及び/或はコマンドを所望の仕向先に効果的に送る。この技術は、処理ユニット62及びパイプライン74によって具現化されたアルゴリズムの数が比較的小さい場合に特に有用であり、よってルータ61は省略され得る。代替的には、処理ユニット62或は番号パイプライン74によって具現化されたアルゴリズムの数が比較的大きい場合、ルータ61はメッセージ・ハンドラー64からメッセージ・オブジェクトを受信し解読して、そのオブジェクト内のデータ及び/或はコマンドを加速器44内の所望の仕向先に効果的に送る。
少数の処理ユニット・アルゴリズム及びパイプライン74が存在する場合の一実施例において、各パイプラインは、同時に、メッセージ・オブジェクトを受信し、ヘッダーを分析して、それが意図されたメッセージの受取人であるか否かを決定する。もしメッセージ・オブジェクトが特定のパイプライン74に意図されていれば、そのパイプラインはそのメッセージを解読し、回復されたデータ/コマンド(単数或は複数)を処理する。しかしながら、もしメッセージ・オブジェクトが特定のパイプライン74に意図されていなければ、そのパイプラインはそのメッセージ・オブジェクトを無視する。例えば、メッセージ・オブジェクトがパイプライン741による処理のためのデータを含むと仮定する。それ故に、パイプライン741はメッセージ・ヘッダーを分析し、それがそのデータの意図された仕向先であることを決定し、メッセージからデータを回復し、その回復されたデータを処理する。逆に、パイプライン742−74nの各々がメッセージ・ヘッダーを分析し、それがそのデータの意図された仕向先ではないことを決定し、よってそのデータの回復或は処理を為さない。もしメッセージ・オブジェクト内のデータが多数のパイプライン74に意図されていれば、メッセージ・ハンドラー64は同一データを含む各メッセージ・オブジェクトから成るシーケンスを、各仕向先パイプラインに対して1つのメッセージで、生成して送信する。代替的には、メッセージ・ハンドラー64は、仕向先パイプラインの全てを識別するヘッダーを有する単一のメッセージ・オブジェクトを送信することによって、データを仕向先パイプライン74の全てに同時に送信し得る。メッセージ・オブジェクトからデータ及びソフト・コンフィギュレーション・コマンドを回復することは、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」と題された特許文献3に更に議論されている。
多数の処理ユニット処理或はパイプライン74が存在する場合の別の実施例において、各パイプラインはルータ61からメッセージ・オブジェクトを受信する。ルータ61がメッセージ・オブジェクトを目標パイプライン74だけに理想的には送信すべきであるが、その目標パイプラインもヘッダーを分析して、それが意図されたメッセージの受取人であるか否かを決定する。そうした分析は潜在的なメッセージ・ルーチン・エラー、即ち例外を識別する。もしメッセージ・オブジェクトが目標パイプライン74に意図されていれば、そのパイプラインはそのメッセージを解読し、回復されたデータ/コマンド(単数或は複数)を処理する。しかしながら、もしメッセージ・オブジェクトがその目標パイプライン74に意図されていなければ、そのパイプラインはそのメッセージ・オブジェクトに対しての処理を無視して、更にルーチン例外が発生したことを示す新メッセージをホストプロセッサ42に発し得る。ルーチン例外の取り扱いは、先行して引用された「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」と題された特許文献2に議論されている。
次に、パイプライン加速器44はメッセージ・オブジェクトから回復された入来データ及び/或はコマンドを処理する。
データに対して、仕向先パイプライン或は複数の仕向先パイプライン74はデータに対する各演算或は複数演算を実行する。図2と連携して議論されたように、パイプライン74はプログラム命令を実行しないので、しばしばデータをパイプライン・クロックの周波数と略同一である速度で処理できる。
第1実施例において、単一パイプライン74は入来データを処理することによって結果としてのデータを生成する。
第2実施例において、多数のパイプライン74は入来データを順次処理することによって結果としてのデータを生成する。例えば、パイプライン74は入来データに対して第1演算を実行することによって第1中間データを生成し得る。次に、パイプライン742はその第1中間データに対して第2演算を実行することによって第2中間データを生成し得て、等々であり、そのチェーン中の最終パイプライン74が結果データを生成するまで同様である。
第3実施例において、多数のパイプライン74は入来データを並列して処理することによって結果としてのデータを生成する。例えば、パイプライン741は入来データから成る第1組に対して第1演算を実行することによって結果としてのデータから成る第1組を生成し得る。同時に、パイプライン742は入来データから成る第2組に対して第2演算を実行することによって結果としてのデータから成る第2組を生成し得て、等々である。
代替的には、先の3つの実施例の任意の組み合わせに従って、パイプライン74は入来データから結果としてのデータを生成し得る。例えば、パイプライン741は入来データから成る第1組に対して第1演算を実行することによって結果としてのデータから成る第1組を生成し得る。同時に、パイプライン742及び74nは入来データから成る第2組に対して第2及び第3の演算を順次実行することによって結果としてのデータから成る第2組を生成し得る。
先の実施例及び代替実施例の内の任意のものにおいて、単一のパイプライン74は多数の演算を実行し得る。例えば、パイプライン741はデータを受信し得て、その受信データに対して第1演算を実行することによって第1中間データを生成し得て、その第1中間データを一時的に記憶し得て、その第1中間データに対して第2演算を実行することによって第2中間データを生成し得て、等々であり、結果データを生成するまで同様である。パイプライン741に第1演算実行から第2演算実行までスイッチさせる等々の多数の技術がある。そうした技術は、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」(代理人整理番号1934−13−3)と題された特許文献3に議論されている。
ソフト・コンフィギュレーション・コマンドに対して、加速器44はメッセージ・ヘッダーによって示される対応するソフト・コンフィギュレーション・レジスタ(単数或は複数)(不図示)におけるビットを設定する。先に議論されたように、これらビットを設定することは、典型的には、加速器44の機能を変えるものであり、その相互接続レイアウトを変えることがない。これは、例えば、入力ピン或は出力ピンとしての外部ピンを設定する、或は、アドレス指定モードを選択することに対するプロセッサの制御レジスタにおけるビットを設定することと同様である。更には、ソフト・コンフィギュレーション・コマンドはデータを保持するためにレジスタ或はテーブル(レジスタのアレイ)を仕切ることができる。加速器44によって実行される別のソフト・コンフィギュレーション・コマンド或は演算はデータをソフト構成されたレジスタ或はテーブルにロードし得る。加速器44のソフト・コンフィギュレーションは、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」(代理人整理番号1934−13−3)と題された特許文献3に更に議論されている。
次に、パイプライン加速器44は結果としてのデータを、更なる処理のためにルータ61を介して(或はもしそのルータが省略されていれば直接的に)、ホストプロセッサ42に提供する。
代替的には、パイプライン加速器44は結果としてのデータを、出力ポート60を介して直接的に、或は、ルータ61(もしあれば)、バス50、ホストプロセッサ42、並びに、出力ポート58を介して間接的に、の何れかで、遠隔仕向先(図5)に提供する。結果として、この代替実施例において、加速器44によって生成された結果としてのデータは最終処理データである。
加速器44が結果としてのデータを(更なる処理のため或は遠隔装置まで通過させるため(図5))ホストプロセッサ42に提供するときには、それはメッセージ・ハンドラー64によって生成されたメッセージ・オブジェクトと同一のフォーマットを有するメッセージ・オブジェクトにおいてこのデータを送信する。メッセージ・ハンドラー64によって生成されたメッセージ・オブジェクトと同じように、加速器44によって生成されたメッセージ・オブジェクトは、例えば、結果としてのデータの仕向先及び優先順位を特定するヘッダーを含む。例えば、そのヘッダーはメッセージ・ハンドラー64に、その結果としてのデータを遠隔装置までポート58を介して通過させるように命令し得るか、或は、データの処理を制御することになるのは処理ユニット62によって実行されるプログラムの何れの部分かを特定し得る。同一メッセージ・フォーマットを用いることによって、加速器44はホストプロセッサ42と同一のインターフェース層を有する。これは、特にインターフェース層が工業規格であればピア−ベクトル・マシン40の設計及び変更を補助する。
パイプライン加速器44及びパイプライン66の構造及び動作は、先行して引用された「改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法」(代理人整理番号1934−13−3)と題された特許文献3に更に議論されている。
<ホストプロセッサによるパイプライン加速器からの受信及び処理>
加速器44からメッセージ・オブジェクトを受信すると、メッセージ・ハンドラー64は先ずそのメッセージ・ヘッダーを解読して、回復されたデータを指定された仕向先に送る。
もしそのヘッダーがデータがポート58を介して遠隔装置(図5)に渡されることを示せば、メッセージ・ハンドラー64はそのデータをポート58に直接的に、又は、インターフェース・メモリ48或は、別のメモリ内に形成されたポートFIFOバッファ(不図示)に、提供してから、そのバッファからポート58に、向かわせる。多数のポート58と多数の遠隔装置も意図されている。
しかしながら、もしヘッダーが処理ユニット62がデータを更に処理することになっていることを示せば、メッセージ・ハンドラー62はそのデータの処理を制御することになる処理ユニット・プログラムの部分と対応するインターフェース・メモリ48の箇所に該データを記憶する。より詳細には、同一ヘッダーが処理ユニット54によって実行されるプログラムの何れの部分(単数或は複数)がそのデータの処理を制御することになるのかを間接的に示す。結果として、メッセージ・ハンドラー64はそのプログラム部分と対応しているインターフェース・メモリ48の箇所(FIFO等)にそのデータを記憶する。
先に議論されたように、インターフェース・メモリ48は加速器44及び処理ユニット62の間のバッファとして作用し、よって処理ユニットが加速器と同期されない際にデータの転送を可能としている。例えば、同期に関するこの欠如は、加速器44が処理ユニット62よりもデータを高速に処理する際に生じ得る。インターフェース・メモリ48を用いることによって、加速器44は処理ユニット62のより遅い応答によって遅くさせられない。これは、割り込みの取り扱いに対する確定できない応答時間と関連する非効率というペナルティをも回避する。加速器44の出力メッセージの処理ユニット62による確定できない取り扱いは、a)バックアップされた出力メッセージに対する記憶及び取り扱い、或は、b)バックアップされたメッセージが上書きされることを防止するためのパイプライン全体にわたるアイドリング制御、の何れかを提供させるように、設計者に強制することによって加速器の設計を不必要に複雑化することになる。それ故に、加速器44及び処理ユニット62の間のバッファとして作用するインターフェース・メモリ48の使用は、a)加速器が設計に対してより容易、b)加速器がより少ない下部組織を必要として、大きなPLICアプリケーションを保持できる、c)加速器が合理化され得て、出力データがより緩慢なプロセッサによって「ブロック」されないのでより高速に作動する等の幾つかの所望の結果を有する。
次いで、メッセージ・ハンドラー64がインターフェース・メモリ48に記憶したデータに対して、処理ユニット62はそのインターフェース・メモリからそのデータを検索する。処理ユニット62はインターフェース・メモリ48にポーリングし得て、新データが特定箇所にいつ到達したかを決定するか、或は、メッセージ・ハンドラー64は処理ユニットにデータの到達を通知する割り込み若しくは他の信号を生成し得る。一実施例において、処理ユニット62がデータを検索する前、メッセージ・ハンドラー64はそのデータを含むメッセージ・オブジェクトを生成する。より詳細には、メッセージ・オブジェクト内のデータを受信するために、処理ユニット62によって実行されるプログラムを設計し得る。それ故にメッセージ・ハンドラー64は、データだけを記憶する代わりに、インターフェース・メモリ48内にメッセージ・オブジェクトを記憶し得る。しかし、メッセージ・オブジェクトは、典型的には、それが含有するデータよりも著しく大きなメモリ・スペースを専有する。結果として、メモリを節約すべく、メッセージ・ハンドラー64はパイプライン加速器44からのメッセージ・オブジェクトを解読し、そのデータをメモリ48に記憶してから、処理ユニット62がそのデータを受信する準備が為されるとメッセージ・オブジェクトを効果的に再生成する。次いで、処理ユニット62はそのメッセージ・オブジェクトを解読し、メッセージ・ヘッダーにおいて識別されたプログラム部分の制御の下、そのデータを処理する。
次に、プロセッサ・ユニット62はプログラムの仕向先部分の制御下で検索データを処理し、処理データを生成し、その処理データを該処理データの意図された仕向先と対応するインターフェース・メモリ48の箇所に記憶する。
次いで、メッセージ・ハンドラー64は処理データを検索し、それを指定された仕向先に提供する。処理データを検索すべく、メッセージ・ハンドラー64はメモリ48にポーリングし得て、データがいつ到達したかを決定するか、或は、処理ユニット62はメッセージ・ハンドラーに割り込み或は他の信号でデータの到達を通知し得る。処理データをその意図された仕向先に提供すべく、メッセージ・ハンドラー64はそのデータを含むメッセージ・オブジェクトを生成し得て、そのメッセージ・オブジェクトをデータの更なる処理のために加速器44に送り戻す。或は、ハンドラー56はデータをポート58に送信し得るか、或は、処理ユニット62による更なる処理のためにメモリ48の別の箇所に送信し得る。
ホストプロセッサのパイプライン加速器44からのデータの受信及び処理は、先行して引用された「改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法」(代理人整理番号1934−12−3)と題された特許文献2に更に議論されている。
<ピア−ベクトル・マシンを用いての代替的データ処理技術>
更に図3で参照されるように、ホストプロセッサ44がデータを受信し処理してから、そのデータを更なる処理のためにパイプライン加速器44に送信する先に記載された実施例に対する代替例が存在する。
一代替例において、ホストプロセッサ44はデータの少なくとも幾つかに対する処理の全てを実行し、よってこのデータは更なる処理のためにパイプライン加速器44に送信されない。
別の代替例において、パイプライン加速器44はポート56を介して遠隔装置(図5)から生データを直接的に受信し、その生データを処理する。加速器44は、次いで、その処理データをポート60を介して遠隔装置に直接的に送信し戻し得るか、或は、処理データを更なる処理のためにホストプロセッサ42に送信し得る。後者の場合、加速器44は先に議論されたようにそのデータをメッセージ・オブジェクト内にカプセル化し得る。
更に別の代替例において、加速器44は、ハードウェアに組み込まれたパイプライン74に加えて、ディジタル信号プロセッサ(DSP)等の1つ或はそれ以上の命令実行プロセッサを含み得て、そのパイプラインのナンバークランチング能力を補足する。
<ピア−ベクトル・マシンの具現化例>
更に図3で参照されるように、一実施例において、パイプライン・バス50は規格133MHzPCIバスであり、パイプライン74は1つ或はそれ以上の規格PMCカード上に含まれ、メモリ52は各々が各PMCカード上に位置決めされている1つ或はそれ以上のフラッシュメモリである。
<ピア−ベクトル・マシンの適用例>
図4は、本発明の実施例に従った、図3のピア−ベクトル・マシン40を組み入れるソナー・システム80のブロック線図である。マシン40に加えて、システム80は、ソナー信号を受信し伝送するための変換要素841−84nから成るアレイ82、ディジタル−アナログ変換器(DAC)861−86n、アナログ−ディジタル変換器(ADC)881−88n、並びに、データ・インターフェース90を含む。ソナー信号を生成し処理することがしばしば数学的に集中的な機能であるので、マシン40はしばしばこれらの機能を、図3と連携されて先に議論されたように、従来の計算マシン(多数プロセッサ・マシン10(図1)等)が所与のクロック周波数でできるものよりも、より迅速に且つ効率的に実行できる。
動作の送信モード中、アレイ82はソナー信号を水(不図示)等の媒体に送信する。先ず、ピア−ベクトル・マシン40はポート92で受信した生信号データを、アレイ要素84の各々に1つずつとなるように、n個のディジタル信号に変換する。これら信号の大きさ及び位相はアレイ82の伝送ビーム・パターンを指図する。次に、マシン40はこれらディジタル信号をインターフェース90に提供し、該インターフェースがそれら信号を各アナログ信号への変換のために各DAC86に提供する。例えばインターフェース90はマシン40からディジタル信号を順次受信するバッファとして作用し得て、それら信号の全n個を受信しバッファするまでそれらを記憶してから、それら順次的な信号サンプルを各DAC86に同時に提供する。次いで、変換要素84はそれらアナログ信号を各音波に変換して、相互に干渉させて、ソナー信号のビームを形成する。
動作の受信モード中、アレイ82は媒体(不図示)からソナー信号を受信する。受信されたソナー信号は遠隔オブジェクトによって反射された伝送ソナー信号の部分と、環境及び遠隔オブジェクトによって放出された音響エネルギーとで構成されている。先ず、変換要素84はソナー信号を構成する各音波を受信し、それら音波をn個のアナログ信号に変換し、それらアナログ信号をADC88に提供してn個の各ディジタル信号に変換する。次に、インターフェース90はこれらディジタル信号をピア−ベクトル・マシン40に処理のために提供する。例えば、インターフェース90はADC88からディジタル信号を並列に受信するバッファとして作用し得て、それら信号をマシン40に順次提供する。マシン40がディジタル信号に実行する処理はアレイ82の受信ビーム・パターンを指図する。フィルタリング、帯域シフト、スペクトル変換(例えば、フーリエ変換)、並びに、回旋等の付加的な処理ステップはそれらディジタル信号に適用される。次いでマシン40は処理された信号データを、ポート94を介して、位置決めされたオブジェクトを視認するための表示装置等の別の装置に提供する。
ソナー・システム80と連携して議論されたが、ソナー・システム以外の各種システムもピア−ベクトル・マシン40を組み入れることができる。
先行する議論は当業者が本発明を作製し使用することを可能とすべく提示されている。種々実施例への様々な変更は当業者には容易に明かであろうし、ここでの包括的な原則は本発明の精神及び範囲から逸脱することなしに他の実施例及び適用例に適用され得る。よって、本発明は図示された実施例に限定されることが意図されておらず、ここに開示された原理及び特徴と一貫した最も広い範囲と一致されるべきものである。
図1は、従来の多数プロセッサ・アーキテクチャを有する計算マシンのブロック線図である。 図2は、従来のハードウェアに組み込まれたパイプラインのブロック線図である。 図3は、本発明の実施例に従ったピア−ベクトル・アーキテクチャを有する計算マシンのブロック線図である。 図4は、本発明の実施例に従った図3のピア−ベクトル計算マシンを組み入れている電子システムの概略ブロック線図である。
符号の説明
10 計算マシン
14 共同プロセッサ
40 ピア−ベクトル・マシン
42 ホストプロセッサ
44 パイプライン加速器
46 プロセッサ・メモリ
48 インターフェース・メモリ
50 パイプライン・バス
52 ファームウェア・メモリ
54 生データ入力ポート
58 処理データ出力ポート
61 ルータ
62 処理ユニット
64 メッセージ・ハンドラー
66 処理ユニット・メモリ
68 ハンドラー・メモリ
70 加速器コンフィギュレーション・レジストリ
72 メッセージ・コンフィギュレーション・レジストリ
74 ハードウェアに組み込まれたパイプライン
80 ソナー・システム
84 要素
86 ディジタル−アナログ変換器
88 アナログ−ディジタル変換器
90 データ・インターフェース

Claims (27)

  1. ピア−ベクトル・マシンであって、
    プログラムを実行するように動作でき、そのプログラムに応じて第1ホスト・データを生成するように動作できるホストプロセッサと、
    前記ホストプロセッサと結合されて、前記第1ホスト・データを受信して、該第1ホスト・データから第1パイプライン・データを生成するように動作できるパイプライン加速器と、
    を備えるピア−ベクトル・マシン。
  2. 前記ホストプロセッサが、
    第2データを受信し、
    前記第2データから前記第1ホスト・データを生成するように更に動作できる、請求項1に記載のピア−ベクトル・マシン。
  3. 前記ホストプロセッサが、
    前記パイプライン加速器から前記第1パイプライン・データを受信し、
    前記第1パイプライン・データを処理するように更に動作できる、請求項1に記載のピア−ベクトル・マシン。
  4. 前記ホストプロセッサが、
    前記パイプライン加速器から前記第1パイプライン・データを受信し、
    前記第1パイプライン・データから前記第1ホスト・データを生成するように更に動作できる、請求項1に記載のピア−ベクトル・マシン。
  5. 前記ホストプロセッサと結合されると共に前記パイプライン加速器と結合され、第1メモリ区分を有するインターフェース・メモリを更に含み、
    前記ホストプロセッサが、
    前記第1メモリ区分に前記第1ホスト・データを記憶し、
    前記第1ホスト・データを前記第1メモリ区分から前記パイプライン加速器に提供するように動作できる、請求項1に記載のピア−ベクトル・マシン。
  6. 前記ホストプロセッサと結合されると共に前記パイプライン加速器と結合され、第1及び第2のメモリ区分を有するインターフェース・メモリを更に含み、
    前記ホストプロセッサが、
    前記第1メモリ区分に前記第1ホスト・データを記憶し、
    前記第1メモリ区分から前記パイプライン加速器に前記第1ホスト・データを提供し、
    前記パイプライン加速器から前記第1パイプライン・データを受信し、
    前記第2メモリ区分に前記第1パイプライン・データを記憶し、
    前記第2メモリ区分から前記ホストプロセッサまで前記第1パイプライン・データを検索し、
    前記第1パイプライン・データを処理するように動作できる、請求項1に記載のピア−ベクトル・マシン。
  7. 前記ホストプロセッサが前記パイプライン加速器を構成するように動作できる、請求項1に記載のピア−ベクトル・マシン。
  8. 前記パイプライン加速器が、プログラマブル論理集積回路を含む、請求項1に記載のピア−ベクトル・マシン。
  9. ピア−ベクトル・マシンであって、
    第1パイプライン・データを生成するように動作できるパイプライン加速器と、
    前記パイプライン加速器と結合されると共に、プログラムを実行するように動作でき、そのプログラムに応じて第1パイプライン・データを受信し、該第1パイプライン・データから第1ホスト・データを生成するように動作できるホストプロセッサと、
    を備えるピア−ベクトル・マシン。
  10. 前記パイプライン加速器が、
    第2データを受信し、
    前記第2データから前記第1パイプライン・データを生成するように更に動作できる、請求項9に記載のピア−ベクトル・マシン。
  11. 前記パイプライン加速器が、
    前記ホストプロセッサから前記第1ホスト・データを受信し、
    前記第1ホスト・データを処理するように更に動作できる、請求項9に記載のピア−ベクトル・マシン。
  12. 前記パイプライン加速器が、
    前記ホストプロセッサから前記第1ホスト・データを受信し、
    前記第1ホスト・データから前記第1パイプライン・データを生成するように更に動作できる、請求項9に記載のピア−ベクトル・マシン。
  13. 前記パイプライン加速器と結合されると共に前記ホストプロセッサと結合され、第1メモリ区分を有するインターフェース・メモリを更に含み、
    前記ホストプロセッサが、
    前記第1メモリ区分に前記パイプライン加速器からの前記第1パイプライン・データを記憶し、
    前記第1メモリ区分から前記第1パイプライン・データを検索するように動作できる、請求項9に記載のピア−ベクトル・マシン。
  14. 前記パイプライン加速器と結合されると共に前記ホストプロセッサと結合され、第1及び第2のメモリ区分を有するインターフェース・メモリを更に含み、
    前記ホストプロセッサが、
    前記第1メモリ区分に前記パイプライン加速器からの前記第1パイプライン・データを記憶し、
    前記第1メモリ区分から前記第1パイプライン・データを検索し、
    前記第2メモリ区分に前記第1ホスト・データを記憶し、
    前記第2メモリ区分から前記パイプライン加速器まで前記第1ホスト・データを提供するように動作でき、
    前記パイプライン加速器が前記第2メモリ区分から受信した前記第1ホスト・データを処理するように動作できる、請求項9に記載のピア−ベクトル・マシン。
  15. 前記ホストプロセッサが前記パイプライン加速器を構成するように動作できる、請求項9に記載のピア−ベクトル・マシン。
  16. システムであって、
    生データを生成するように動作できる装置と、
    前記装置と結合されると共に、プログラムを実行するように動作でき、前記プログラムに応じて前記生データからホスト・データを生成するように動作できるホストプロセッサと、
    前記ホストプロセッサと結合されると共に、前記ホスト・データを受信して該ホスト・データからパイプライン・データを生成するように動作できるパイプライン加速器と、
    を備えるシステム。
  17. システムであって、
    生データを生成するように動作できる装置と、
    前記装置と結合されると共に、前記生データからパイプライン・データを生成するように動作できるパイプライン加速器と、
    前記パイプライン加速器と結合されると共に、プログラムを実行するように動作でき、前記プログラムに応じて前記パイプライン・データを受信し、そして前記パイプライン・データからホスト・データを生成するように動作できるホストプロセッサと、
    を備えるシステム。
  18. 方法であって、
    ホストプロセッサによってプログラムを実行することによって第1ホスト・データを生成し、
    パイプライン加速器によって前記第1ホスト・データから第1パイプライン・データを生成することを含む方法。
  19. 生データを受信し、
    前記第1ホスト・データを生成することが、前記生データから前記第1ホスト・データを生成することを更に含む、請求項18に記載の方法。
  20. 前記第1ホスト・データを生成することが、前記第1パイプライン・データから前記第1ホスト・データを生成することを含む、請求項18に記載の方法。
  21. 前記ホストプロセッサによって前記プログラムを実行することによって前記第1パイプライン・データから第2ホスト・データを生成することを更に含む、請求項18に記載の方法。
  22. 前記ホストプロセッサによって前記プログラムを実行することによって前記パイプライン加速器を構成することを更に含む、請求項18に記載の方法。
  23. パイプライン加速器によって第1パイプライン・データを生成し、
    ホストプロセッサによってプログラムを実行することによって前記第1パイプライン・データから第1ホスト・データを生成することを含む方法。
  24. 生データを受信することを更に含み、
    前記第1パイプライン・データを生成することが、前記生データから前記第1パイプライン・データを生成することを含む、請求項23に記載の方法。
  25. 前記第1パイプライン・データを生成することが、前記第1ホスト・データから前記第1パイプライン・データを生成することを含む、請求項23に記載の方法。
  26. 前記パイプライン加速器によって前記第1ホスト・データから第2パイプライン・データを生成することを更に含む、請求項23に記載の方法。
  27. 前記ホストプロセッサによって前記プログラムを実行することによって前記パイプライン加速器を構成することを更に含む、請求項23に記載の方法。
JP2005502224A 2002-10-31 2003-10-31 改善された計算アーキテクチャ、関連システム、並びに、方法 Pending JP2006518057A (ja)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US42250302P 2002-10-31 2002-10-31
US10/684,053 US7987341B2 (en) 2002-10-31 2003-10-09 Computing machine using software objects for transferring data that includes no destination information
US10/684,102 US7418574B2 (en) 2002-10-31 2003-10-09 Configuring a portion of a pipeline accelerator to generate pipeline date without a program instruction
US10/684,057 US7373432B2 (en) 2002-10-31 2003-10-09 Programmable circuit and related computing machine and method
US10/683,929 US20040136241A1 (en) 2002-10-31 2003-10-09 Pipeline accelerator for improved computing architecture and related system and method
US10/683,932 US7386704B2 (en) 2002-10-31 2003-10-09 Pipeline accelerator including pipeline circuits in communication via a bus, and related system and method
PCT/US2003/034557 WO2004042560A2 (en) 2002-10-31 2003-10-31 Pipeline coprocessor

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011083371A Division JP2011154711A (ja) 2002-10-31 2011-04-05 改善された計算アーキテクチャ、関連システム、並びに、方法

Publications (1)

Publication Number Publication Date
JP2006518057A true JP2006518057A (ja) 2006-08-03

Family

ID=34280226

Family Applications (9)

Application Number Title Priority Date Filing Date
JP2005502222A Pending JP2006515941A (ja) 2002-10-31 2003-10-31 多数パイプライン・ユニットを有するパイプライン加速器、関連計算マシン、並びに、方法
JP2005502226A Pending JP2006518495A (ja) 2002-10-31 2003-10-31 改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法
JP2005502223A Pending JP2006518056A (ja) 2002-10-31 2003-10-31 プログラマブル回路、関連計算マシン、並びに、方法
JP2005502225A Pending JP2006518058A (ja) 2002-10-31 2003-10-31 改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法
JP2005502224A Pending JP2006518057A (ja) 2002-10-31 2003-10-31 改善された計算アーキテクチャ、関連システム、並びに、方法
JP2011070196A Expired - Fee Related JP5568502B2 (ja) 2002-10-31 2011-03-28 プログラマブル回路、関連計算マシン、並びに、方法
JP2011071988A Pending JP2011170868A (ja) 2002-10-31 2011-03-29 改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法
JP2011081733A Pending JP2011175655A (ja) 2002-10-31 2011-04-01 多数パイプライン・ユニットを有するパイプライン加速器、関連計算マシン、並びに、方法
JP2011083371A Pending JP2011154711A (ja) 2002-10-31 2011-04-05 改善された計算アーキテクチャ、関連システム、並びに、方法

Family Applications Before (4)

Application Number Title Priority Date Filing Date
JP2005502222A Pending JP2006515941A (ja) 2002-10-31 2003-10-31 多数パイプライン・ユニットを有するパイプライン加速器、関連計算マシン、並びに、方法
JP2005502226A Pending JP2006518495A (ja) 2002-10-31 2003-10-31 改善された計算アーキテクチャを有する計算マシン、関連システム、並びに、方法
JP2005502223A Pending JP2006518056A (ja) 2002-10-31 2003-10-31 プログラマブル回路、関連計算マシン、並びに、方法
JP2005502225A Pending JP2006518058A (ja) 2002-10-31 2003-10-31 改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法

Family Applications After (4)

Application Number Title Priority Date Filing Date
JP2011070196A Expired - Fee Related JP5568502B2 (ja) 2002-10-31 2011-03-28 プログラマブル回路、関連計算マシン、並びに、方法
JP2011071988A Pending JP2011170868A (ja) 2002-10-31 2011-03-29 改善された計算アーキテクチャ用パイプライン加速器、関連システム、並びに、方法
JP2011081733A Pending JP2011175655A (ja) 2002-10-31 2011-04-01 多数パイプライン・ユニットを有するパイプライン加速器、関連計算マシン、並びに、方法
JP2011083371A Pending JP2011154711A (ja) 2002-10-31 2011-04-05 改善された計算アーキテクチャ、関連システム、並びに、方法

Country Status (8)

Country Link
EP (5) EP1559005A2 (ja)
JP (9) JP2006515941A (ja)
KR (5) KR101062214B1 (ja)
AU (5) AU2003287319B2 (ja)
CA (5) CA2503620A1 (ja)
DE (1) DE60318105T2 (ja)
ES (1) ES2300633T3 (ja)
WO (4) WO2004042560A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009528584A (ja) * 2006-01-26 2009-08-06 エクセジー・インコーポレイテツド Fpgaベースのパイプライン処理のためのファームウェアソケットモジュール
US7676649B2 (en) 2004-10-01 2010-03-09 Lockheed Martin Corporation Computing machine with redundancy and related systems and methods
US7987341B2 (en) 2002-10-31 2011-07-26 Lockheed Martin Corporation Computing machine using software objects for transferring data that includes no destination information

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8095508B2 (en) 2000-04-07 2012-01-10 Washington University Intelligent data storage and processing using FPGA devices
US7711844B2 (en) 2002-08-15 2010-05-04 Washington University Of St. Louis TCP-splitter: reliable packet monitoring methods and apparatus for high speed networks
CA2503620A1 (en) * 2002-10-31 2004-05-21 Lockheed Martin Corporation Programmable circuit and related computing machine and method
EP2528000B1 (en) 2003-05-23 2017-07-26 IP Reservoir, LLC Intelligent data storage and processing using FPGA devices
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
WO2006096324A2 (en) 2005-03-03 2006-09-14 Washington University Method and apparatus for performing biosequence similarity searching
JP4527571B2 (ja) * 2005-03-14 2010-08-18 富士通株式会社 再構成可能演算処理装置
WO2007011203A1 (en) * 2005-07-22 2007-01-25 Stichting Astron Scalable control interface for large-scale signal processing systems.
US7702629B2 (en) 2005-12-02 2010-04-20 Exegy Incorporated Method and device for high performance regular expression pattern matching
JP2007164472A (ja) * 2005-12-14 2007-06-28 Sonac Kk 待ち合わせ機構を有する演算装置
US7840482B2 (en) 2006-06-19 2010-11-23 Exegy Incorporated Method and system for high speed options pricing
US7921046B2 (en) 2006-06-19 2011-04-05 Exegy Incorporated High speed processing of financial information using FPGA devices
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
US8374986B2 (en) 2008-05-15 2013-02-12 Exegy Incorporated Method and system for accelerated stream processing
US20110138158A1 (en) * 2008-07-30 2011-06-09 Masatomo Mitsuhashi Integrated circuit
CA3059606C (en) 2008-12-15 2023-01-17 Ip Reservoir, Llc Method and apparatus for high-speed processing of financial market depth data
US8478965B2 (en) 2009-10-30 2013-07-02 International Business Machines Corporation Cascaded accelerator functions
EP2649580A4 (en) 2010-12-09 2014-05-07 Ip Reservoir Llc METHOD AND DEVICE FOR THE MANAGEMENT OF CONTRACTS IN FINANCIAL MARKETS
US10650452B2 (en) 2012-03-27 2020-05-12 Ip Reservoir, Llc Offload processing of data packets
US9990393B2 (en) 2012-03-27 2018-06-05 Ip Reservoir, Llc Intelligent feed switch
US10121196B2 (en) 2012-03-27 2018-11-06 Ip Reservoir, Llc Offload processing of data packets containing financial market data
US11436672B2 (en) 2012-03-27 2022-09-06 Exegy Incorporated Intelligent switch for processing financial market data
FR2996657B1 (fr) * 2012-10-09 2016-01-22 Sagem Defense Securite Organe electrique generique configurable
US9633093B2 (en) 2012-10-23 2017-04-25 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
WO2014066416A2 (en) 2012-10-23 2014-05-01 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
US9633097B2 (en) 2012-10-23 2017-04-25 Ip Reservoir, Llc Method and apparatus for record pivoting to accelerate processing of data fields
KR101753866B1 (ko) 2013-05-10 2017-07-04 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 메모리 액세스의 가속
GB2541577A (en) 2014-04-23 2017-02-22 Ip Reservoir Llc Method and apparatus for accelerated data translation
US9977422B2 (en) * 2014-07-28 2018-05-22 Computational Systems, Inc. Intelligent configuration of a user interface of a machinery health monitoring system
US10942943B2 (en) 2015-10-29 2021-03-09 Ip Reservoir, Llc Dynamic field data translation to support high performance stream data processing
JP2017135698A (ja) * 2015-12-29 2017-08-03 株式会社半導体エネルギー研究所 半導体装置、コンピュータ及び電子機器
CN108701029A (zh) * 2016-02-29 2018-10-23 奥林巴斯株式会社 图像处理装置
WO2018119035A1 (en) 2016-12-22 2018-06-28 Ip Reservoir, Llc Pipelines for hardware-accelerated machine learning
JP6781089B2 (ja) * 2017-03-28 2020-11-04 日立オートモティブシステムズ株式会社 電子制御装置、電子制御システム、電子制御装置の制御方法
GB2570729B (en) * 2018-02-06 2022-04-06 Xmos Ltd Processing system
IT202100020033A1 (it) * 2021-07-27 2023-01-27 Carmelo Ferrante Sistema di interfacciamento tra due dispositivi a controllo elettronico e unità a controllo elettronico comprendente tale sistema di interfacciamento

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108347A (ja) * 1991-09-20 1993-04-30 Mitsubishi Heavy Ind Ltd パイプライン演算回路
JPH06282432A (ja) * 1993-03-26 1994-10-07 Olympus Optical Co Ltd 演算処理装置
JP2001236496A (ja) * 1999-10-04 2001-08-31 Texas Instr Inc <Ti> 絶対差分の合計および対称濾波用の再構成可能simdコプロセッサ構造

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4703475A (en) * 1985-12-04 1987-10-27 American Telephone And Telegraph Company At&T Bell Laboratories Data communication method and apparatus using multiple physical data links
US4811214A (en) * 1986-11-14 1989-03-07 Princeton University Multinode reconfigurable pipeline computer
US4914653A (en) * 1986-12-22 1990-04-03 American Telephone And Telegraph Company Inter-processor communication protocol
US4956771A (en) * 1988-05-24 1990-09-11 Prime Computer, Inc. Method for inter-processor data transfer
JP2522048B2 (ja) * 1989-05-15 1996-08-07 三菱電機株式会社 マイクロプロセッサ及びそれを使用したデ―タ処理装置
US5283883A (en) * 1991-10-17 1994-02-01 Sun Microsystems, Inc. Method and direct memory access controller for asynchronously reading/writing data from/to a memory with improved throughput
US5268962A (en) * 1992-07-21 1993-12-07 Digital Equipment Corporation Computer network with modified host-to-host encryption keys
US5440687A (en) * 1993-01-29 1995-08-08 International Business Machines Corporation Communication protocol for handling arbitrarily varying data strides in a distributed processing environment
US5583964A (en) * 1994-05-02 1996-12-10 Motorola, Inc. Computer utilizing neural network and method of using same
US5568614A (en) * 1994-07-29 1996-10-22 International Business Machines Corporation Data streaming between peer subsystems of a computer system
US5692183A (en) * 1995-03-31 1997-11-25 Sun Microsystems, Inc. Methods and apparatus for providing transparent persistence in a distributed object operating environment
JP2987308B2 (ja) * 1995-04-28 1999-12-06 松下電器産業株式会社 情報処理装置
US5748912A (en) * 1995-06-13 1998-05-05 Advanced Micro Devices, Inc. User-removable central processing unit card for an electrical device
US5752071A (en) * 1995-07-17 1998-05-12 Intel Corporation Function coprocessor
JP3156562B2 (ja) * 1995-10-19 2001-04-16 株式会社デンソー 車両用通信装置及び走行車両監視システム
US5784636A (en) * 1996-05-28 1998-07-21 National Semiconductor Corporation Reconfigurable computer architecture for use in signal processing applications
JPH1084339A (ja) * 1996-09-06 1998-03-31 Nippon Telegr & Teleph Corp <Ntt> ストリーム暗号による通信方法、ならびに通信システム
US5892962A (en) * 1996-11-12 1999-04-06 Lucent Technologies Inc. FPGA-based processor
JPH10304184A (ja) * 1997-05-02 1998-11-13 Fuji Xerox Co Ltd 画像処理装置および画像処理方法
DE19724072C2 (de) * 1997-06-07 1999-04-01 Deutsche Telekom Ag Vorrichtung zur Durchführung eines Blockchiffrierverfahrens
JP3489608B2 (ja) * 1997-06-20 2004-01-26 富士ゼロックス株式会社 プログラマブル論理回路システムおよびプログラマブル論理回路装置の再構成方法
US6216191B1 (en) * 1997-10-15 2001-04-10 Lucent Technologies Inc. Field programmable gate array having a dedicated processor interface
JPH11120156A (ja) * 1997-10-17 1999-04-30 Nec Corp マルチプロセッサシステムにおけるデータ通信方式
US6076152A (en) * 1997-12-17 2000-06-13 Src Computers, Inc. Multiprocessor computer architecture incorporating a plurality of memory algorithm processors in the memory subsystem
US6049222A (en) * 1997-12-30 2000-04-11 Xilinx, Inc Configuring an FPGA using embedded memory
KR100572945B1 (ko) * 1998-02-04 2006-04-24 텍사스 인스트루먼츠 인코포레이티드 효율적으로 접속 가능한 하드웨어 보조 처리기를 구비하는디지탈 신호 처리기
JPH11271404A (ja) * 1998-03-23 1999-10-08 Nippon Telegr & Teleph Corp <Ntt> プログラムによって再構成可能な回路における自己試験方法および自己試験装置
US6282627B1 (en) * 1998-06-29 2001-08-28 Chameleon Systems, Inc. Integrated processor and programmable data path chip for reconfigurable computing
JP2000090237A (ja) * 1998-09-10 2000-03-31 Fuji Xerox Co Ltd 描画処理装置
SE9902373D0 (sv) * 1998-11-16 1999-06-22 Ericsson Telefon Ab L M A processing system and method
JP2000278116A (ja) * 1999-03-19 2000-10-06 Matsushita Electric Ind Co Ltd Fpga用コンフィギュレーションインターフェース
JP2000295613A (ja) * 1999-04-09 2000-10-20 Nippon Telegr & Teleph Corp <Ntt> 再構成可能なハードウェアを用いた画像符号化方法,画像符号化装置および画像符号化のためのプログラム記録媒体
JP2000311156A (ja) * 1999-04-27 2000-11-07 Mitsubishi Electric Corp 再構成可能並列計算機
US6308311B1 (en) * 1999-05-14 2001-10-23 Xilinx, Inc. Method for reconfiguring a field programmable gate array from a host
EP1061438A1 (en) * 1999-06-15 2000-12-20 Hewlett-Packard Company Computer architecture containing processor and coprocessor
US20030014627A1 (en) * 1999-07-08 2003-01-16 Broadcom Corporation Distributed processing in a cryptography acceleration chip
JP3442320B2 (ja) * 1999-08-11 2003-09-02 日本電信電話株式会社 通信方式切替無線端末及び通信方式切替方法
US6326806B1 (en) * 2000-03-29 2001-12-04 Xilinx, Inc. FPGA-based communications access point and system for reconfiguration
JP3832557B2 (ja) * 2000-05-02 2006-10-11 富士ゼロックス株式会社 プログラマブル論理回路への回路の再構成方法および情報処理システム
US6982976B2 (en) * 2000-08-11 2006-01-03 Texas Instruments Incorporated Datapipe routing bridge
US7196710B1 (en) * 2000-08-23 2007-03-27 Nintendo Co., Ltd. Method and apparatus for buffering graphics data in a graphics system
JP2002207078A (ja) * 2001-01-10 2002-07-26 Ysd:Kk レーダ信号処理装置
US7091598B2 (en) * 2001-01-19 2006-08-15 Renesas Technology Corporation Electronic circuit device
US6657632B2 (en) * 2001-01-24 2003-12-02 Hewlett-Packard Development Company, L.P. Unified memory distributed across multiple nodes in a computer graphics system
JP2002269063A (ja) * 2001-03-07 2002-09-20 Toshiba Corp メッセージングプログラム、及び分散システムにおけるメッセージング方法、並びにメッセージングシステム
JP3873639B2 (ja) * 2001-03-12 2007-01-24 株式会社日立製作所 ネットワーク接続装置
JP2002281079A (ja) * 2001-03-21 2002-09-27 Victor Co Of Japan Ltd 画像データ伝送装置
CA2503620A1 (en) * 2002-10-31 2004-05-21 Lockheed Martin Corporation Programmable circuit and related computing machine and method
US7373528B2 (en) * 2004-11-24 2008-05-13 Cisco Technology, Inc. Increased power for power over Ethernet applications

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108347A (ja) * 1991-09-20 1993-04-30 Mitsubishi Heavy Ind Ltd パイプライン演算回路
JPH06282432A (ja) * 1993-03-26 1994-10-07 Olympus Optical Co Ltd 演算処理装置
JP2001236496A (ja) * 1999-10-04 2001-08-31 Texas Instr Inc <Ti> 絶対差分の合計および対称濾波用の再構成可能simdコプロセッサ構造

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7987341B2 (en) 2002-10-31 2011-07-26 Lockheed Martin Corporation Computing machine using software objects for transferring data that includes no destination information
US8250341B2 (en) 2002-10-31 2012-08-21 Lockheed Martin Corporation Pipeline accelerator having multiple pipeline units and related computing machine and method
US7676649B2 (en) 2004-10-01 2010-03-09 Lockheed Martin Corporation Computing machine with redundancy and related systems and methods
US7809982B2 (en) 2004-10-01 2010-10-05 Lockheed Martin Corporation Reconfigurable computing machine and related systems and methods
US8073974B2 (en) 2004-10-01 2011-12-06 Lockheed Martin Corporation Object oriented mission framework and system and method
JP2009528584A (ja) * 2006-01-26 2009-08-06 エクセジー・インコーポレイテツド Fpgaベースのパイプライン処理のためのファームウェアソケットモジュール

Also Published As

Publication number Publication date
KR100996917B1 (ko) 2010-11-29
JP5568502B2 (ja) 2014-08-06
KR101012744B1 (ko) 2011-02-09
KR20050088995A (ko) 2005-09-07
JP2006515941A (ja) 2006-06-08
CA2503613C (en) 2011-10-18
KR20050084629A (ko) 2005-08-26
AU2003287318B2 (en) 2010-11-25
CA2503617A1 (en) 2004-05-21
WO2004042560A3 (en) 2005-03-24
DE60318105T2 (de) 2008-12-04
JP2011175655A (ja) 2011-09-08
AU2003287320A1 (en) 2004-06-07
WO2004042569A2 (en) 2004-05-21
AU2003287317B2 (en) 2010-03-11
JP2006518495A (ja) 2006-08-10
AU2003287318A1 (en) 2004-06-07
KR101062214B1 (ko) 2011-09-05
WO2004042574A2 (en) 2004-05-21
WO2004042561A2 (en) 2004-05-21
EP1559005A2 (en) 2005-08-03
JP2006518056A (ja) 2006-08-03
JP2011170868A (ja) 2011-09-01
EP1576471A2 (en) 2005-09-21
EP1570344B1 (en) 2007-12-12
CA2503611A1 (en) 2004-05-21
WO2004042561A3 (en) 2006-03-02
AU2003287321B2 (en) 2010-11-18
KR20050084628A (ko) 2005-08-26
KR20050086423A (ko) 2005-08-30
AU2003287321A1 (en) 2004-06-07
KR20050086424A (ko) 2005-08-30
EP1573515A2 (en) 2005-09-14
WO2004042560A2 (en) 2004-05-21
CA2503622C (en) 2015-12-29
AU2003287319A1 (en) 2004-06-07
CA2503620A1 (en) 2004-05-21
EP1570344A2 (en) 2005-09-07
WO2004042569A3 (en) 2006-04-27
KR101012745B1 (ko) 2011-02-09
JP2006518058A (ja) 2006-08-03
CA2503622A1 (en) 2004-05-21
ES2300633T3 (es) 2008-06-16
JP2011154711A (ja) 2011-08-11
JP2011181078A (ja) 2011-09-15
CA2503613A1 (en) 2004-05-21
CA2503611C (en) 2013-06-18
DE60318105D1 (de) 2008-01-24
AU2003287320B2 (en) 2010-12-02
WO2004042574A3 (en) 2005-03-10
AU2003287317A1 (en) 2004-06-07
AU2003287319B2 (en) 2010-06-24
EP1573514A2 (en) 2005-09-14
KR101035646B1 (ko) 2011-05-19

Similar Documents

Publication Publication Date Title
JP2006518057A (ja) 改善された計算アーキテクチャ、関連システム、並びに、方法
US7418574B2 (en) Configuring a portion of a pipeline accelerator to generate pipeline date without a program instruction
US11507873B1 (en) Highly scalable quantum control
WO2004042562A2 (en) Pipeline accelerator and related system and method
JP5163306B2 (ja) 動的再構成回路およびデータ送信制御方法
JP6570046B2 (ja) Dmaコントローラ、実現方法及びコンピュータ記憶媒体
CN116324741A (zh) 用于可配置硬件加速器的方法和装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061030

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081209

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090309

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090316

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090609

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20090609

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090928

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20091020

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091027

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091027

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091214

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091222

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100105

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100115

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100301

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100304

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100308

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20101207