JP2006505053A - 並列性能を強化した多適応型計算システム - Google Patents

並列性能を強化した多適応型計算システム Download PDF

Info

Publication number
JP2006505053A
JP2006505053A JP2004549956A JP2004549956A JP2006505053A JP 2006505053 A JP2006505053 A JP 2006505053A JP 2004549956 A JP2004549956 A JP 2004549956A JP 2004549956 A JP2004549956 A JP 2004549956A JP 2006505053 A JP2006505053 A JP 2006505053A
Authority
JP
Japan
Prior art keywords
calculation
computing system
functional units
row
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004549956A
Other languages
English (en)
Other versions
JP4430544B2 (ja
JP2006505053A5 (ja
Inventor
フッペンサル,ジョン・エム
カリガ,デービッド・イー
Original Assignee
エス・アール・シィ・コンピューターズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=32175158&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2006505053(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by エス・アール・シィ・コンピューターズ・インコーポレイテッド filed Critical エス・アール・シィ・コンピューターズ・インコーポレイテッド
Publication of JP2006505053A publication Critical patent/JP2006505053A/ja
Publication of JP2006505053A5 publication Critical patent/JP2006505053A5/ja
Application granted granted Critical
Publication of JP4430544B2 publication Critical patent/JP4430544B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8023Two dimensional arrays, e.g. mesh, torus

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Image Processing (AREA)
  • Multi Processors (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Complex Calculations (AREA)

Abstract

計算機能の並列性および性能を強化するための多適応型処理システム(200)および技術であって、地震用途、探索アルゴリズム、情報機密保護、化学および生物学用途、フィルタリングなどにおける多次元パイプライン計算や、さらには流体流れおよび構造分析、生命情報科学などにおけるシストリック波面計算を含む無数の用途で用いられ得るシステムおよび技術が開示される。いくつかの用途では、ここに開示する多次元パイプライン(202)およびシストリック波面方法の両方が用いられることもある。

Description

関連特許出願の相互参照
この発明は、2001年1月5日出願の「メモリサブシステム内に複数のメモリアルゴリズムプロセッサを組み込んだ多重プロセッサコンピュータアーキテクチャ(Multiprocessor Computer Architecture Incorporating a Plurality of Memory Algorithm Processors in the Memory Subsystem)」と題された米国特許出願連続番号第09/755,744号の主題に関するものであり、さらに、「単一オペレーティングシステムのイメージの下で動作する再構成可能プロセッサを組み込んだコンピュータシステムを用いてウェブサイトへのアクセスおよび処理を高速化するためのシステムおよび方法(System and Method for Accelerating Web Site Access and Processing Utilizing a Computer System Incorporating Reconfigurable Processors Operating Under a Single Operating System Image)」と題された米国特許第6,454,687号の主題に関するものであり、これらはともにコロラド(Colorado)州、コロラド・スプリングス(Colorado Springs)市のエス・アール・シィ・コンピューターズ・インコーポレイテッド(SRC Computers, Inc.)に譲渡されており、その開示は本願明細書中でこの引用によりその全体において明確に援用される。
著作権表示/許可
本特許文献における開示の一部は著作権保護を受ける題材を含み得る。著作権の所有者は、米国特許商標庁の特許ファイルまたは記録に現れる本特許文献または特許開示についての何人によるファクシミリ複写に対しても異議を唱えるものではないが、他ではあらゆる著作権をすべて留保する。下の表示は、適用可能なところで図面の各図を含めた下記のソフトウェアおよびデータに適用される:Copyright (c)2000, SRC Computers, Inc.
発明の背景
この発明は、一般的に計算システムおよび計算技術の分野に関する。より特定的には、この発明は、計算機能の並列性および性能を強化するための多適応型処理システムおよび技術に関するものである。
現在、ほとんどの大型ソフトウェアアプリケーションにおいては、並列処理の採用により高性能の動作を実現している。この技術によると、多数のプロセッサが同一の問題に対して同時に働くことで、単一のプロセッサが同じ結果を得るのに必要な時間に比してごく僅かな時間で解に達することが可能となる。使用されるプロセッサは、同一の動作についての多数のコピーを実行する場合もあるが、または全く異なる動作を実行する場合もある。しかしいずれの場合でもすべてのプロセッサは同時に働くことになる。
このような並列処理の採用に伴い、多重プロセッサボードおよび大規模なクラスタ化システムがともに広く普及することになった。しかしながら、ますます高い性能が求められるにつれてより高い並列性が求められるようになり、その結果システムはますます大型化している。今日、何万個ものプロセッサを有しフットボール場ほどの空間を占め得るクラスタが存在する。このように大きな物理的サイズのシステムは多くの明白な問題を呈する。これにはとりわけ施設に関する要件、電力や熱の発生および信頼性などの要因が含まれる。
発明の概要
1個のプロセッサ当たりで数桁分もより高い並列性を提供するプロセッサ技術が利用可能であれば、上記システムはこれに類似の係数だけサイズが縮小可能であろう。このようなプロセッサまたは処理要素は、再構成可能プロセッサの採用により実現可能となる。再構成可能プロセッサは、或る特定の用途についての解決手段をもたらすのに必要な機能ユニットのみを具体化する。そしてその結果、再構成可能プロセッサは、利用される集積回路チップの容量全体まで、当該の問題を解くのに必要であり得るのと同数の機能ユニットを具体化するために利用可能な空間を有する。
現在、多適応型プロセッサ要素(MAPTM、エス・アール・シィ・コンピューターズ・インコーポレイテッドの登録商標)のような再構成可能プロセッサは、先行技術のマイクロプロセッサに比して2〜3桁分高い並列性および性能を実現することができる。ここに開示する適応処理技術の適用により、この種の再構成可能処理並列性は、現在達成可能であるよりも遥かに高い性能をもたらすと同時に、遥かに小さく安価なコンピュータシステムを使用しながら種々の用途に利用可能となるという利点が得られる。
上述の各利点に加えて、これより明白ではないもののいくつかの用途においてはむしろより大きな影響を及ぼす可能性のある利点であって、数百万ゲート再構成可能チップの到来で初めて享受できるようになったものが存在する。また、再構成可能プロセッサによって、各々のチップ内でマイクロプロセッサベースの計算システムで達成可能なよりも遥かに緊密な並列機能ユニットの結合により性能の向上が実現される。
多重プロセッサのマイクロプロセッサベースのシステムにおいては、各々のプロセッサには、セルと呼ばれる問題全体のうちの比較的小さな部分しか割当てられない。しかしながら、問題全体を解くためには、1プロセッサの結果が隣接する多数のセルによって必要とされることが多いが、それはこれらにおけるセルが境界で対話するからであり、結果を算出するためにすべて対話しなければならないセルが6個を上回ることも稀ではない。これに従い、問題全体の計算を完了させるためには中間結果をシステム中に回さなければならない。これには必然的にその他数多くのチップおよびバスが関与することになるが、これはマイクロプロセッサよりも遥かに低速で動作するため、結果としてシステム性能は生の計算時間よりも何桁も低くなることが多い。
一方、適応プロセッサベースのシステムを採用すると、単一のチップの中で実行され得る計算は10倍から千倍になるため、これら機能ユニット間で共有される境界データはいずれも単一の集積回路チップを離れる必要がない。したがって、システム中を動くデータと、それがシステム性能全体の現象に及ぼす影響は、やはり2〜3桁分だけ減じられ得る。これによって、いくつかの用途において性能の大幅な向上を得ることができると同時に、いくつかの用途は、以前であれば達成不可能な実際の時間枠内で実行可能となる。
本願明細書において特定的に開示されるのは、複数の機能ユニットを備える再構成可能計算システムにおけるデータ処理方法である。上記方法は、上記再構成可能計算システムについての計算を規定するステップと、上記計算を実行するために上記機能ユニットのうちの少なくとも2つを具体化するステップと、上記計算における後続のデータ次元に対して演算するために上記機能ユニットのうちの第1の機能ユニットを使用するステップと、実質的に並行して、上記計算における先行のデータ次元に対して演算するために上記機能ユニットのうちの第2の機能ユニットを使用するステップとを備える。
本願明細書においてさらに開示されるのは、複数の機能ユニットを備える再構成可能計算システムにおけるデータ処理方法である。上記方法は、上記複数の機能ユニットのうちのサブセットを形成するセルの行を含む第1のシストリック壁を規定するステップと、上
記第1のシストリック壁における少なくとも第1の行において上記セルの各々における値を計算するステップと、更新値を生成するために、上記セルのうちの上記第1の行にあるセル間で上記値を通信するステップと、上記第1のシストリック壁における第2の行に上記更新値を通信するステップと、実質的に並行して、上記複数の機能ユニットのうちの上記サブセットにあるセルの行からなる第2のシストリック壁における第1の行に上記更新値を与えるステップとを備える。
本願明細書においてさらに開示されるのは、投機的な処理戦略を用いてシストリック処理形式をセットアップするステップを含む再構成可能処理システムにおけるデータ処理方法である。
以下の好ましい実施例の説明を添付の図面とともに参照することで、この発明に関する上記およびその他の特徴および目的ならびにこれを達成する態様がより明らかとなり、またこの発明それ自体が最もよく理解されるであろう。
代表的な実施例の説明
本願は、カリガ、D(Caliga, D)他、「引渡しの高速化:再構成可能ロジックを用いたHPCアプリケーション性能向上の可能性(Delivering Acceleration:“The Potential for Increased HPC Application Performance Using Reconfigurable Logic”)」、SC2001、2001年11月、ACM 1-58113-293-X/01/0011の開示全体を引用により援用する。
まず図1を参照して、従来の多重プロセッサ計算システム100における典型的なクラスタ化プロセッサ間通信経路についての簡略化した機能ブロック図が示される。このコンピュータシステムは、或る数のメモリ・入出力(I/O)コントローラ集積回路(IC)1020〜102N(たとえば「ノースブリッジ」)102を含む。これにはたとえばVIA・テクノロジーズ・インコーポレイテッド(VIA Technologies, Inc.)社製のP4X333/P4X400デバイス、エイサー・ラブズ・インコーポレイテッド(Acer Labs, Inc.)社製のM1647デバイス、およびインテル・コーポレイション(Intel Corporation)社製の824430Xデバイスがある。ノースブリッジIC102は、フロントサイドバス(FSB)を用いて1つ以上のマイクロプロセッサ10400〜10403および104N0〜104N3に結合される。プロセッサ104としては、たとえばインテル・コーポレイション社製のPentium(登録商標)シリーズのプロセッサの1つが挙げられる。
ノースブリッジIC1020〜102Nはそれぞれメモリブロック1060〜106Nに結合され、さらに対応のI/Oブリッジ要素1080〜108Nに結合される。ネットワークインターフェイスカード(INC)1100〜210NはそれぞれI/Oブリッジ1080〜108NのI/Oバスをクラスタバスに結合し、これは共通のクラスタ化ハブ(またはイーサネット(登録商標)スイッチ)112に結合される。
典型的に単一のフロントサイドバスには、2つまたは4つの機能ユニットを各々が有するマイクロプロセッサ104が最大でも4個しか常駐できないため、5つ以上への通信はいずれもフロントサイドバス、ブリッジ間バス、入出力(I/O)バス、クラスタ相互接続部(たとえばイーサネット(登録商標)クラスタ化ハブ112)を経由してから受信側のプロセッサ104へと渡らなければならない。I/Oバスの帯域幅はフロントサイドバスよりも1桁低いのが典型的であり、これはすなわち上記4個のプロセッサ104を上回る数のプロセッサが関わる処理はいずれも、上記相互接続部の引起こす緩い結合によって大幅に制限されることを意味する。しかしこのことは、プロセッサ1個当たりに何百または何千の機能ユニットを有する再構成可能プロセッサによってすべて解消される。
次に図2を参照して、この発明の技術を実現するための適応プロセッサ200の通信経路の機能ブロック図が示される。適応プロセッサ200は適応プロセッサチップ202を含む。適応プロセッサチップ202は、再構成可能なルーティングリソースにより相互接続された多数の機能ユニット(FU)204を組み込んでいる。適応プロセッサチップ202はメモリ要素206に結合され、さらに相互接続部208および或る数の追加の適応プロセッサチップ210に結合される。
図示のように、各々の適応プロセッサチップ202は、現在扱われている特定の問題について専用の何千もの機能ユニット204を含み得る。これらの機能ユニット間の相互接続は、各々のチップ202の内部にある再構成可能ルーティングリソースによってもたらされる。その結果、機能ユニット204は、標準的なマイクロプロセッサ104(図1)よりも遥かに高いデータレートおよび遥かに短い待ち時間でデータを共有またはやり取りすることができる。これに加え、適応プロセッサチップ202は、プロセッサ間相互接続部208に直接接続でき、通信のためにチップセット内の多数のチップを通じてデータを渡す必要がない。適応プロセッサは、この接続を達成するために必要ないかなる類のインターフェイスをも実現できるからである。
次に図3Aを参照すると、従来の多重プロセッサ計算システム100(図1)で用いられるプロセッサの数に対する実際の性能向上についてのグラフが示される。この図では、このようなシステムにおける、特定の用途での完全なスケーラビリティからの逸脱が示される。
次に図3Bを参照すると、図3Aに対応した、適応プロセッサベースの計算システム200(図2)で用いられるプロセッサの数に対する実際の性能向上についてのグラフが示される。この図では、適応プロセッサベースの計算システム200でもたらされる性能向上が従来の多重プロセッサ計算システム100での性能向上を上回ることが示される。
次に図4Aを参照して、従来のシーケンシャルな処理演算400を例示する簡略化した論理フローチャートが与えられる。ここでは、入れ子状のループA(第1のループ402)およびループB(第2のループ404)が、当該プロセスについての異なる段階において交互にアクティブとなる。
図示のように、入れ子状のループ402,404の組を有するアプリケーションの標準的な実現においては、第1のループ402の処理を完了させてから第2のループ404に進む。この手法がフィールド・プログラマブル・ゲートアレイ(FPGA)との関連で利用される際に特に見られるこの手法に内在する問題は、具体化されたロジックすべてが完全に利用されていないということである。
次に図4Bを参照して、図4Aと比較させながらこの発明の技術に従う多次元プロセス410を示す簡略化された論理フローチャートが示される。多次元プロセス410の実現においては、多次元のデータがループA(第1のループ412)およびループB(第2のループ414)両方によって処理され、計算システムロジックが各々のクロックサイクルで動作可能であるようにする。
シーケンシャルな処理演算400(図4A)とは対照的に、利用可能なリソースを最も効果的に利用することの問題に対する本解決策は、アプリケーションに問題をデータフローの意味で評価させるというものである。すなわち、第1の論理ループ412を通じ所与の問題についての後続の次元を「通過」させるのと並行して、先行のデータ次元が第2のループ414を通じて処理される。データの「次元」としては、実際には、問題について
の多数のベクトル、問題についての多数の平面、問題における多数の時間ステップ、などがあり得る。
次に図5Aを参照して、多次元パイプライン動作の代表例を実行する一般的なプロセスが、地震移動画像化機能500の形で示される。プロセス500は、多適応型プロセッサ(MAPTM、この発明の譲受人であるエス・アール・シィ・コンピューターズ・インコーポレイテッドの登録商標)STEP3dルーチン502の形で、この発明の適応処理技術の採用により実行可能となった並列性を利用できるように適合され得る。MAP STEP3dルーチン502は、速度データ504、ソースデータ506および受信機データ508を利用して結果の画像510を生成するための演算である。これについては後でより詳細に説明する。
次に図5Bを参照して、前図のMAP STEP3dルーチン502が、さまざまな計算段階、すなわちMAPTRI_x520、MAPTRI_y522、MAPTRI_d+524およびMAPTRI_d−526で示される。
次に図6Aを参照して、特定の地震移動画像化アプリケーション600についての簡略化した論理フローチャートが示される。地震移動画像化アプリケーション600は、図2に示すような適応プロセッサベースの計算システム200の採用によって可能となった並列性を例示するものである。アプリケーションの代表例600は、三重対角求解部での入れ子状のループ並列性を例示し、x、y、d+およびd−方向での多数の三重対角求解部について同じロジックが実現され得る。ここで再びMAPTRI_x520、MAPTRI_y522、MAPTRI_d+524およびMAPTRI_d−526の計算段階を示す。
次に図6Bを参照して、マイクロプロセッサ(mP)が前図の地震移動画像化アプリケーション600の実行において利用し得る計算プロセス610が示される。プロセス610は、ソースフィールド[S(Z0)]および受信機フィールド[R(Z0)]を読込むステップ612を含み、さらに614では速度フィールド[V(Z0)]が読込まれる。ステップ616にて、S(Znz),R(Znz)の値が計算され、このステップにMAPTRI_x520およびMAPTRI_y522の各段階が続く。ステップ618にて、Z1/2の画像が計算される。これにMAPTRI_d+524およびMAPTRI_d−526の各段階が続き、620にて結果の画像Zが生成される。プロセス610は参照番号622で示すように深さスライスにわたってループし、かつ参照番号624で示すようにショットにわたってループする。
次に図6Cを参照して、この発明の技術に従う計算プロセス650の第1のステップが示され、ここでは第1のショット(S1)が開始される。プロセス650は、ここに記載の適応プロセッサ(たとえばMAPTM適応プロセッサ)により、図6Aの地震画像化アプリケーション600の実行において利用され得る。網掛けしたブロックで示すように、MAPTRI_x520の段階がアクティブである。
次に図6Dを参照して、計算プロセス650の第2のステップが第2のショット(S2)の開始時点にて示される。ここでもやはり網掛けしたブロックで示すように、MAPTRI_x520の段階がS2についてアクティブであり、MAPTRI_y522の段階はS1についてアクティブであり、ステップ618で画像Z1/2が生成される。図示のように、この発明の開示に従う適応プロセッサは、多次元での計算パイプライン化をサポートし、Zおよびショットでの並列性がステップ612で示される。
次に図6Eを参照して、計算プロセス650の第3のステップが示され、ここでは第1
および第2のショットに対する演算が計算を通じて継続される。網掛けしたブロックで示すように、MAPTRI_d+524の段階はS1についてアクティブであり、段階MAPTRI_y522はS2についてアクティブであり、ステップ618で画像Z1/2が生成される。
次に図6Fを参照して、計算プロセス650の第4のステップが示され、これはショットS1およびS2に対する後続の演算を例示するものである。MAPTRI_d+524の段階はS2についてアクティブであり、MAPTRI_d−526の段階はS1についてアクティブであり、画像Zはステップ620で生成されている。
次に図6Gを参照して、計算プロセス650の第5のステップが示され、これに続いて深さスライスすべてにわたるショットS1およびS2の下方伝播が継続される。MAPTRI_x520の段階はS1についてアクティブであり、MAPTRI_d−526の段階はS2についてアクティブであり、画像Zはステップ620で生成されている。
次に図7Aを参照して、シストリック波面演算の代表例を実行するプロセス700が貯留層シミュレーション機能の形で示され、この発明の適応処理技術により実行可能となった並列性を利用している。図示のように、プロセス700は「k」ループ702、「j」ループ704および「i」ループ706を含む。
次に図7Bを参照して、前図の貯留層シミュレーションプロセス700における流体流れ特性の一般的な計算であって、一群の隣り合ったセル710の間で値が通信されるものが例示される。この一群の隣り合ったセル710は、ここに示す略図においては、第1のセル壁712、第2のセル壁714および第3のセル壁716を含む。各々のセル壁は、対応する数の行、すなわち第1の行718、第2の行720、第3の行722および第4の行724を含む。
図示のように、流体流れ特性の計算は隣り合ったセル710に通信され、そして重要なことに、この計算はデータ格納の必要性がなくなるようにスケジュール可能である。この発明の技術に従うと、1組のセルを1個の適応プロセッサの中に常駐させ、計算のパイプラインを多数の適応プロセッサにわたって延ばすことができる。多数の適応プロセッサ間の通信オーバーヘッドは、この発明の譲受人であるエス・アール・シィ・コンピューターズ・インコーポレイテッドに譲渡された、2002年1月15日発行の米国特許第6,339,819号「ロードされた入力バッファ内のオペランドに各々のプロセッサ要素がアクセスして結果をFIFO出力バッファに送る多重プロセッサ(Multiprocessor With Each Processor Element Accessing Operands in Loaded Input Buffer and Forwarding Results to FIFO Output Buffer)」に開示されたMAPTM適応プロセッサチェーンポートを採用することにより最小限にされるのが有利である。上記米国特許における開示は本願明細書中でこの引用により明確に援用される。
次に図7Cを参照して、タイムセット1における計算のシストリック壁712の作成が示される。シストリック壁712は垂直のセル壁について開始されており、この垂直の壁において互いに隣接した行718〜724間での値の通信は、値をメモリに記憶させずに行なうことができる。
次に図7Dを参照して、図7Cを受けて、タイムセット1での計算のシストリック壁712およびタイムセット2での第2のシストリック壁714の作成についての説明図が示される。実行において、垂直な第2のセル壁は、対応する第1の壁の行にあるセルについての計算が完了した後に開始される。すなわち、たとえば、時間t0にて、シストリック壁712の第1の行718が完了し、その結果が第2のシストリック壁714の第1の行
718に渡される。時間t1にて、第1のシストリック壁712の第2の行720および第2のシストリック壁714の第1の行718が計算される。この後、時間t2にて、第1のシストリック壁712の第3の行722および第2のシストリック壁714の第2の行720が計算される。このようにして、すべての行およびすべての壁についてプロセスが継続する。
次に図8Aを参照して、シストリック波面演算の代表例を実行するもう1つのプロセス800が示される。プロセス800は、生命情報科学のシストリック処理の形をとっており、やはりこの発明の適応処理技術で実行可能となった並列性を利用したものである。図示のように、プロセス800でのシストリック処理は、前に計算されたデータを、1列(たとえば列802、804および806のうち1つ)内で下方へ渡したり、後続の列に渡したりする(たとえば列802から列804、列804から列806など)。ここで得られる計算上の利点は、第1の「マッチ」状態を計算するために第1の列802の処理を開始してから僅か数クロックサイクル後に第2の列804の処理を開始できることである。
次に図8Bを参照して、シストリック波面処理演算810が示される。「i」ループ812および「k」ループ814を含む処理演算810は、ここではさらに、XBの変化レートの評価に基づく投機的処理戦略を組み込んでいる。
演算810の実行には単純なシストリック処理演算を用いてもよいが、それにはXBの計算に内在する問題がある。その値であるXB[i]816は「k」ループ814全体が完了するまで知られ得ないからである。XBの変化レートを評価すると、この問題には投機的な処理戦略が用いられ得ると判断された。通常のシストリックの形がセットアップされ、XBの値はシストリック組で計算される列組について一定に保たれる。そして、各々の列の底でXB[i]816の値が計算される。
次に図8Cを参照して、前図の投機的処理を組み込んだシストリック波面処理演算810のさらなる説明図が示される。図示のように、投機的処理は「j」本の列8180〜818jを含む。列818の各々では、XB[i+j]が一定の値を有すると仮定する。列818の各々における底でテストが行なわれ、XB値により、ステップ8201〜820jで示される変化を求める。XBの値がi+nの列にて変化する場合、プロセスはこの列818で再開される。XBの変化レートは比較的低速であるため、計算作業の「コスト」が大幅に削減可能である。
次に図9Aを参照して、シストリック波面演算の代表例を実行する別のプロセス900が示され、これは格子の交差部902で多項式を計算する構造コードの形をとる。この発明の適応処理技術で実行可能となった並列性をこのプロセス900で利用するのが有利である。
次に図9Bおよび図9Cを参照して、タイムセット1における、格子点からなる垂直壁910についての計算の開始が、格子の交差部902(図9A)に対し実行される多項式の評価について示され、行912,914,016,918間の計算は先行の行からの値を用い推計学的に行なわれる。図示のように、格子交差部902に多項式の評価が実行されて、第2の壁9101が、第1の壁9100での対応する行にあるセルの完了後に開始されるようにする。
以上から判断できるように、ここに開示した計算機能の並列性および性能を強化する多適応型処理システムおよび技術が採用され得る用途としては、地震用途、探索アルゴリズム、情報機密保護、化学および生物学関連用途、フィルタリングなどにおける多次元パイプライン計算や、さらには流体流れおよび構造分析、生命情報科学などにおけるシストリ
ック波面計算を含む無数の用途がある。いくつかの用途では、多次元パイプラインおよびシストリック波面方法の両方が用いられることもある。
以下、ここに開示の適応プロセッサベースの計算についての技術の用途の代表例を示す。
[画像化]
地震関連:このようなアプリケーションは典型的に石油およびガス探鉱業で用いられ、エコーデータを処理して表面下における特徴についての詳細な分析をもたらす。このようなアプリケーションが使用するデータは、多数の点で収集されかつ多くの繰返しのパラメータからなるものである。このため、このようなプログラムは、並列計算を利用する理想的な候補である。加えて、1データポイントにおける計算結果が次での計算に使用されるため、このようなプログラムは、適応または再構成可能プロセッサの使用に見ることができる緊密な並列性から特に大きな利益を享受するであろう。
合成開口レーダ(SAR):このようなアプリケーションは典型的に地理学における画像化に用いられる。このようなアプリケーションは、帯状部分(swath)として収集されたデータを使用する。処理は、セルへと分割されたデータに対する繰返しの演算からなる。このようなプログラムもまた、並列計算を利用し、適応または再構成可能プロセッサに見ることができる緊密な並列性から特に大きな利益を享受する理想的な候補である。
JPEG画像圧縮:このようなアプリケーションでは、1つの画像を多数のブロックに分割する。次に、これらブロックには1組の演算が実行される。これら演算は多数のブロックにわたって並列化され得る。上記1組の演算および並列性の組合せは、適応または再構成可能プロセッサに見ることができる緊密な並列性から特に大きな利益を享受するであろう。
MPEG画像圧縮:このようなアプリケーションでは、1つのフレームを多数のブロックに分割する。次にこれらブロックには1組の演算が実行される。これら演算は多数のブロックにわたって並列化され得る。加えて、隣接したフレームに実行される演算が多数存在する。上記1組の演算および並列性の組合せは、適応または再構成可能プロセッサに見ることができる緊密な並列性から特に大きな利益を享受するであろう。
[流体流れ]
貯留層シミュレーション:このようなアプリケーションもまた典型的に石油およびガス製造業で用いられ、表面下にある石油およびガス貯留層における流体流れデータを処理して抽出モデルを生成する。このアプリケーションは、石油およびガスの貯留層を含む3次元(3d)のセル組を定義する。各々のセルに対する繰返しの演算があることから、このようなプログラムは並列または適応計算を利用する理想的な候補である。加えて、各々のセルについて計算された情報は隣り合ったセルへと渡される。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から特に大きな利益を享受するであろう。
気象予測:このようなアプリケーションでは、予報地域を論理的な格子セルへと分割する。次に、計算アルゴリズムは、ノードが格子セルに関連付けられた多項式を有する計算を実行する。予報で計算されるタイムセットに関連付けられた各々のセルに対する繰返しの演算があることから、このようなプログラムは適応または並列計算を利用する理想的な候補である。
自動推進関係:このようなアプリケーションは、自動車またはその他の空気動力学的構
造体の空気動力学を調べるものである。一般的に、このアプリケーションでは、当該の自動車構造体を取囲む空間を、計算上の多項式におけるノードに関連付けられた論理的セルへと分割する。予報で計算される風速の組に関連付けられた各々のセルに対する繰返しの演算があることから、このようなプログラムは適応または並列計算を利用する理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を得るであろう。
航空力学関係:このようなアプリケーションは、航空宇宙/飛行機構造体の空気動力学を調べるものである。このアプリケーションでは、当該の航空宇宙/飛行機構造体を取囲む空間を、計算上の多項式におけるノードに関連付けられた論理的セルへと分割する。予報で計算される風速の組に関連付けられた各々のセルに対する繰返しの演算があることから、このようなプログラムは並列計算を利用する理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
プラスチック射出成形:このようなアプリケーションは、液体プラスチックの金型注入に関する成形パラメータを調べるものである。このアプリケーションでは、金型内部の空間を、やはり計算上の多項式におけるノードに関連付けられた論理的セルへと分割する。射出パラメータの組に関連付けられた各々のセルに対する繰返しの演算があることから、このようなプログラムは並列計算を利用する理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
[構造]
クラッシュ分析:このようなアプリケーションは、典型的に自動推進または航空機産業で用いられる。このアプリケーションは、自動車全体を各構成要素に分割する。次にこれら構成要素がさらにセルへと分割される。このアプリケーションは、自動車の構造に対する衝突の影響を分析する。このようなプログラムは、各々のセルに対する繰返しの演算があり、その隣り合うセルから計算後の情報を受取ることから、並列計算に理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
構造分析:このようなアプリケーションは、構造的完全性の特性を調べる。このアプリケーションでは、当該の構造を、計算上の多項式におけるノードに関連付けられた論理的セルへと分割する。荷重および応力に関連付けられた各々のセルに対する繰返しの演算があることから、このようなプログラムは並列計算を利用する理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
[探索アルゴリズム]
画像探索:このようなアプリケーションは、典型的に警備業において指紋照合や顔認識などに用いられる。このアプリケーションでは、画像全体のうちのサブセットを集めたものか、または画像全体そのもののいずれかにおいて一致を探す。このプロセスは、モデルの画素を画像データベースからのレコードの画素と比較する。比較結果の相関がサブセットまたは画像全体における各々の画素につき存在するため、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
データマイニング:このようなアプリケーションは典型的に商業市場空間で用いられる。このアプリケーションは、データベースにおける各々のレコードにある1組の探索情報
(たとえばキャラクタストリング)における一致を探す。次に、このアプリケーションはすべてのデータレコードについての一致の相関を生成する。一致の相関は、各々の組の探索情報とデータベースレコードにあるキャラクタすべてとの比較結果から生成される。探索情報の組とデータベースレコードにある各々のキャラクタとのキャラクタ比較すべてにつき繰返しの比較演算が存在するため、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
[金融]
金融モデリング:このアプリケーションでは、モデル化のプロセスにおける各々の決定ステップにつき多数の戦略が作成される。計算上のステップの結果は、モデル化における後続のステップについての別の組の戦略へと送り込まれる。モデル化のステップ内の各々の戦略に対する繰返しの演算があることから、このようなプログラムは並列計算を利用する理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
[情報機密保護]
暗号化/復号:このアプリケーションでは、元のデータを暗号化または「保護」された形に変換するアルゴリズムを適用する。このプロセスは、元のデータにあるNビットからなる各々の組に適用される。復号ではこのプロセスを逆にして元のデータを得る。各々のNビットデータに対する繰返しの演算があることから、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
[化学/生物学]
遺伝子パターンマッチ:このようなアプリケーションは、典型的に生命情報科学産業で用いられる。このアプリケーションは、遺伝子レコードのデータベースに対する特定の遺伝シーケンス(またはモデル)の一致を探す。このアプリケーションは、モデル内の各々のキャラクタを遺伝子レコード内のキャラクタと比較する。モデルのキャラクタと遺伝子レコード内の各々のキャラクタとの比較すべてにつき繰返しの比較演算が存在するため、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
タンパク質折畳み:このようなアプリケーションは典型的に製薬会社で用いられる。このアプリケーションでは、タンパク質構造の変形の変遷を調べる。このアプリケーションでは、さまざまな「時間」間隔で再計算される1組の式を用いてタンパク質の折畳みをモデル化する。このモデル化シーケンスには、大きな組の時間間隔に対する繰返しの計算があることから、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
有機構造相互作用:このようなアプリケーションは、典型的に化学および薬品会社によって用いられる。このアプリケーションでは、有機構造体が相互作用する際におけるその変遷を調べる。このアプリケーションでは、さまざまな「時間」間隔で再計算される1組の式を用いて有機構造体の相互作用の様子をモデル化する。このモデル化シーケンスには、大きな組の時間間隔に対する繰返しの計算があることから、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
[信号]
フィルタリング:いくつかのアプリケーションではしばしば、記録されたデータシーケンスを「きれいにする(clean-up)」ためにフィルタリング技術を利用することがある。この技術は多種多様にわたる業界において利用される。一般的に、このアプリケーションでは、記録されたシーケンス内の各々のデータポイントに対して1組のフィルタ係数を適用する。シーケンス内のすべてのデータポイントおよびすべてのシーケンスに対する繰返しの計算があることから、このようなプログラムは並列計算のための理想的な候補である。このようなプログラムは、適応または再構成可能プロセッサに見ることができる緊密な並列性から利益を享受するであろう。
以上、この発明の原理について、多次元パイプラインおよびシストリック波面計算の実現における適応プロセッサベースのシステムの使用のための特定の例示的な用途との関連において説明したが、以上の説明は単に例としてなされたものであり、この発明の範囲の限定としてなされたものではないことを明確にに理解されたい。特に、以上の開示の教示によって当業者に他の変形例が示唆されることが認められる。このような変形例は、それ自体既に公知である他の特徴であって、本願明細書に既に記載された特徴の代わりにまたはこれに追加して用いられ得るものを含み得る。本願においては、特許請求の範囲を特定の特徴の組合せについて作成してあるが、ここでの開示の範囲は、明示的または暗示的に開示されたあらゆる新規の特徴もしくはあらゆる新規の特徴の組合せ、または当業者には明らかであろうそのあらゆる一般化もしくは変形をも含み、かつこのようなものがいずれかの請求項において現在請求されている同じ発明に関係するか否か、およびこの発明の直面する同じ技術的問題のうちいずれかまたはそのすべてを緩和するか否かにはかかわらないことを理解されたい。本出願人はこれにより、本願またはそこから導き出されるあらゆるさらなる出願についての手続中に、上記のような特徴および/または上記のような特徴の組合せについて新たな請求項を作成する権利を留保する。
従来の多重プロセッサ計算システムにおける典型的なクラスタ化プロセッサ間通信経路の簡略化された機能ブロック図である。 適応プロセッサチップ内の再構成可能ルーティングリソースにより相互接続された多数の機能ユニット(FU)を示す適応プロセッサ通信経路の機能ブロック図である。 図1に示すような従来の多重プロセッサ計算システムを採用した特定のアプリケーションの完全なスケーラビリティからの逸脱を示す、利用されるプロセッサの数に対する実際の性能向上のグラフである。 図3Aに対応して、利用されるプロセッサの数に対する実際の性能向上のグラフであって、図2に示すような適応プロセッサベースの計算システムを採用したときの従来の多重プロセッサ計算システムに対する性能向上を示す図である。 入れ子状のループA,Bがプロセス中の異なる段階で交互にアクティブとなる、従来のシーケンシャルな処理演算を示す簡略化された論理フローチャートである。 多次元のデータがループA,Bの両方により処理されて計算システムロジックが各クロックサイクルすべてに動作できる、図4Aとの比較でこの発明の技術に従う多次元処理を示す簡略化された論理フローチャートである。 この発明の適応処理技術を採用することで実行可能となった並列性を利用した、地震移動画像化機能の形での多次元パイプライン動作の代表例を実行する一般的なプロセスを例示する図である。 前図を受けて、前図の例示的な地震移動画像化機能を実現するのに利用される各計算段階を例示する図である。 適応プロセッサベースの計算システムの採用で得られる並列性を例示する、特定の地震移動画像化アプリケーションについての簡略化された論理フローチャートである。 マイクロプロセッサにより前図の地震移動アプリケーションの実行において用いられ得る計算プロセスを例示する図である。 適応プロセッサにより図6Aの地震画像化アプリケーションの実行において用いられ得る計算プロセスのうち、第1のショット(S1)が開始される第1のステップを示す図である。 図6Aの地震画像化アプリケーションの実行のための同じ計算プロセスのうち、第2のショット(S2)が開始される第2のステップを示す図である。 図6Aの地震画像化アプリケーションの実行のための同じ計算プロセスのうち、第1および第2のショットに対する演算が計算を通じて継続される第3のステップを示す図である。 同じ計算プロセスの第4のステップを示し、ショットS1およびS2に対する後続の演算を示す図である。 同じ計算プロセスの第5のステップを示す図であって、これに続いて深さスライスすべてにわたりショットS1,S2の下方伝播が継続されるものである。 この発明の適応処理技術の採用で実行可能となった並列性を利用した、貯留層シミュレーション機能の形でのシストリック波面演算の代表例を実行するプロセスを示す図である。 隣り合ったセルに通信される、前図の貯留層シミュレーションの流体流れ特性の一般的な計算を例示する図である。 垂直のセル壁について開始し、この垂直壁において互いに隣接した行間での値の通信が値のメモリへの格納なしに行なわれ得る、タイムセット1での計算のシストリック壁の作成を例示する図である。 前図を受けて、垂直な第2のセル壁が、第1の壁における対応の行にあるセルについての計算の完了後にどのように開始されるかを示す、タイムセット1およびタイムセット2での計算のシストリック壁の作成を例示する図である。 この発明の適応処理技術の利用で実行可能となった並列性を利用した、生命情報科学のシストリック処理の形でのシストリック波面演算の代表例を実行するもう1つのプロセスを例示する図である。 XBの変化レートの評価に基づく投機的な処理戦略をさらに組み込んだシストリック波面処理演算を例示する図である。 投機的処理を組み込んだ前図のシストリック波面処理演算をさらに説明する図である。 この発明の適応処理技術の採用で実行可能となった並列性を利用した、格子の交差部での多項式を計算する構造コードの形でのシストリック波面演算の代表例を実行するためのもう1つのプロセスを例示する図である。 格子の交差部に対して実行される多項式の評価についての、時間セット1における格子点からなる垂直壁についての計算の開始を例示する図であって、行間の計算が先行の行からの値を用いて推計学的に行なわれるものである。 前図の格子の交差部に対して実行される多項式の評価をさらに例示する図であって、第2の壁が、第1の壁での対応の行にあるセルの完了後に開始されるものである。

Claims (13)

  1. 複数の機能ユニットを備える再構成可能計算システムにおけるデータ処理方法であって、
    前記再構成可能計算システムについての計算を規定するステップと、
    前記計算を実行するために前記機能ユニットのうちの少なくとも2つを具体化するステップと、
    前記計算における後続のデータ次元に対して演算するために前記機能ユニットのうちの第1の機能ユニットを使用するステップと、
    実質的に並行して、前記計算における先行のデータ次元に対して演算するために前記機能ユニットのうちの第2の機能ユニットを使用するステップとを備える、方法。
  2. 前記計算における前記後続のデータ次元および前記先行のデータ次元は、(i)前記計算における多数のベクトル、(ii)前記計算における多数の平面、(iii)前記計算における多数のタイムステップ、および/または(iv)前記計算における多数の格子点を含む、請求項1に記載の方法。
  3. 前記計算は、(i)画像探索のための探索アルゴリズム、(ii)データマイニングのための探索アルゴリズム、(iii)金融モデル化アプリケーション、(iv)暗号化アルゴリズム、(v)復号アルゴリズム、(vi)遺伝子パターンマッチ機能、(vii)タンパク質折畳み機能、(viii)有機構造相互作用機能、(ix)信号フィルタリングアプリケーション、(x)地震画像化計算、(xi)合成開口レーダ画像化計算、(xii)JPEG画像圧縮計算、または(xiii)MPEG画像圧縮計算を含む、請求項1に記載の方法。
  4. 前記計算は、(i)貯留層シミュレーション、(ii)気象予測、(iii)自動推進関連用途、(iv)航空宇宙関連用途、または(v)射出成形用途、における流体流れ計算を含む、請求項1に記載の方法。
  5. 前記計算は、クラッシュ分析または構造分析における構造計算を含む、請求項1に記載の方法。
  6. 複数の機能ユニットを備える再構成可能計算システムにおけるデータ処理方法であって、
    前記複数の機能ユニットのうちのサブセットを形成するセルの行を含む第1のシストリック壁を規定するステップと、
    前記第1のシストリック壁における少なくとも第1の行において前記セルの各々における値を計算するステップと、
    更新値を生成するために、前記セルのうちの前記第1の行にあるセル間で前記値を通信するステップと、
    前記第1のシストリック壁における第2の行に前記更新値を通信するステップと、
    実質的に並行して、前記複数の機能ユニットのうちの前記サブセットにあるセルの行の第2のシストリック壁における第1の行に前記更新値を与えるステップとを備える、方法。
  7. 前記値は、(i)計算におけるベクトル、(ii)計算における平面、(iii)計算におけるタイムステップまたは(iv)計算における格子点、に対応する、請求項6に記載の方法。
  8. 前記第1のシストリック壁における第2の行に前記更新値を通信する前記ステップは、前記更新値を外部メモリに記憶させることなく実行される、請求項6に記載の方法。
  9. 前記値は、(i)地震画像化計算、(ii)合成開口レーダ画像化計算、(iii)JPEG画像圧縮計算、(iv)MPEG画像圧縮計算、(v)貯留層シミュレーションにおける流体流れ計算、(vi)気象予測における流体流れ計算、(vii)自動推進関連用途における流体流れ計算、(viii)航空宇宙関連用途における流体流れ計算、(ix)射出成形用途における流体流れ計算、(x)クラッシュ分析における構造計算、(xi)構造分析における構造計算、(xii)画像探索における探索アルゴリズム、(xiii)データマイニングにおける探索アルゴリズム、(xiv)金融モデル化アプリケーション、(xv)暗号化アルゴリズム、(xvi)復号アルゴリズム、(xvii)遺伝子パターンマッチ機能、(xviii)タンパク質折畳み機能、(xix)有機構造相互作用機能、または(xx)信号フィルタリングアプリケーションに対応する、請求項6に記載の方法。
  10. 前記再構成可能計算システムは少なくとも1つの適応プロセッサを含む、請求項6に記載の方法。
  11. 前記再構成可能計算システムはさらに少なくとも1つのマイクロプロセッサを含む、請求項10に記載の方法。
  12. 複数の機能ユニットを備える再構成可能計算システムにおけるデータ処理方法であって、
    計算されたデータを生成するために、前記複数の機能ユニットのうちのサブセットにより計算を実行するステップと、
    前記計算における最初の列からの前記計算されたデータを、前記計算における次の列に渡すステップと、
    前記計算における前記列の各々につき少なくとも1つの変数における変化レートを評価するステップと、
    前記計算における特定の列について前記変数が変化しない場合に前記計算を継続するステップと、
    前記変数が変化する場合に前記計算における前記列で前記計算を再開させるステップとを備える、方法。
  13. 再構成可能計算システムにおけるデータ処理方法であって、
    前記再構成可能計算システムにより実行されるべき計算に対してシストリック処理を実行するステップと、
    さらに、前記再構成可能計算システムにより前記計算に対して投機的処理を実行するステップとを備える、方法。
JP2004549956A 2002-10-31 2003-09-16 並列性能を強化した多適応型計算システム Expired - Fee Related JP4430544B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/285,318 US7225324B2 (en) 2002-10-31 2002-10-31 Multi-adaptive processing systems and techniques for enhancing parallelism and performance of computational functions
PCT/US2003/029444 WO2004042594A1 (en) 2002-10-31 2003-09-16 Enhanced parallel performance multi-adaptive computational system

Publications (3)

Publication Number Publication Date
JP2006505053A true JP2006505053A (ja) 2006-02-09
JP2006505053A5 JP2006505053A5 (ja) 2008-06-26
JP4430544B2 JP4430544B2 (ja) 2010-03-10

Family

ID=32175158

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004549956A Expired - Fee Related JP4430544B2 (ja) 2002-10-31 2003-09-16 並列性能を強化した多適応型計算システム

Country Status (6)

Country Link
US (2) US7225324B2 (ja)
EP (2) EP2278495A3 (ja)
JP (1) JP4430544B2 (ja)
AU (1) AU2003275027A1 (ja)
CA (1) CA2495813A1 (ja)
WO (1) WO2004042594A1 (ja)

Families Citing this family (92)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4450737B2 (ja) * 2005-01-11 2010-04-14 富士通株式会社 半導体集積回路
JP4527571B2 (ja) * 2005-03-14 2010-08-18 富士通株式会社 再構成可能演算処理装置
US7478222B2 (en) * 2005-03-29 2009-01-13 Karl M. Fant Programmable pipeline array
CN100419734C (zh) * 2005-12-02 2008-09-17 浙江大学 一种面向计算的通用型可重构计算阵列装置
US7716100B2 (en) * 2005-12-02 2010-05-11 Kuberre Systems, Inc. Methods and systems for computing platform
US20080126472A1 (en) * 2006-08-28 2008-05-29 Tableau, Llc Computer communication
US20080052429A1 (en) * 2006-08-28 2008-02-28 Tableau, Llc Off-board computational resources
US20080052490A1 (en) * 2006-08-28 2008-02-28 Tableau, Llc Computational resource array
US20080052525A1 (en) * 2006-08-28 2008-02-28 Tableau, Llc Password recovery
US8238624B2 (en) * 2007-01-30 2012-08-07 International Business Machines Corporation Hybrid medical image processing
US7876940B2 (en) * 2007-01-30 2011-01-25 International Business Machines Corporation Universal image processing
US8462369B2 (en) * 2007-04-23 2013-06-11 International Business Machines Corporation Hybrid image processing system for a single field of view having a plurality of inspection threads
US8331737B2 (en) * 2007-04-23 2012-12-11 International Business Machines Corporation Heterogeneous image processing system
US8326092B2 (en) * 2007-04-23 2012-12-04 International Business Machines Corporation Heterogeneous image processing system
US8156307B2 (en) * 2007-08-20 2012-04-10 Convey Computer Multi-processor system having at least one processor that comprises a dynamically reconfigurable instruction set
US8122229B2 (en) * 2007-09-12 2012-02-21 Convey Computer Dispatch mechanism for dispatching instructions from a host processor to a co-processor
US9710384B2 (en) 2008-01-04 2017-07-18 Micron Technology, Inc. Microprocessor architecture having alternative memory access paths
US8561037B2 (en) * 2007-08-29 2013-10-15 Convey Computer Compiler for generating an executable comprising instructions for a plurality of different instruction sets
US9015399B2 (en) 2007-08-20 2015-04-21 Convey Computer Multiple data channel memory module architecture
US8095735B2 (en) * 2008-08-05 2012-01-10 Convey Computer Memory interleave for heterogeneous computing
US8675219B2 (en) * 2007-10-24 2014-03-18 International Business Machines Corporation High bandwidth image processing with run time library function offload via task distribution to special purpose engines
US20090132582A1 (en) * 2007-11-15 2009-05-21 Kim Moon J Processor-server hybrid system for processing data
US9135073B2 (en) * 2007-11-15 2015-09-15 International Business Machines Corporation Server-processor hybrid system for processing data
US9332074B2 (en) 2007-12-06 2016-05-03 International Business Machines Corporation Memory to memory communication and storage for hybrid systems
US8229251B2 (en) 2008-02-08 2012-07-24 International Business Machines Corporation Pre-processing optimization of an image processing system
US8379963B2 (en) * 2008-03-28 2013-02-19 International Business Machines Corporation Visual inspection system
KR100995127B1 (ko) * 2008-05-28 2010-11-18 한국생명공학연구원 정보 분석프로세스 자동 설계 구현시스템 및 방법
KR100960286B1 (ko) * 2008-06-26 2010-06-07 한국생명공학연구원 파이프라인 역 탐색을 이용한 프로세스 설계시스템 및 방법
KR100992169B1 (ko) * 2008-07-25 2010-11-04 한국생명공학연구원 정보 분석프로세스 추천 설계시스템 및 방법
US20100115233A1 (en) * 2008-10-31 2010-05-06 Convey Computer Dynamically-selectable vector register partitioning
US8205066B2 (en) 2008-10-31 2012-06-19 Convey Computer Dynamically configured coprocessor for different extended instruction set personality specific to application program with shared memory storing instructions invisibly dispatched from host processor
CN101770401B (zh) * 2008-12-30 2013-09-18 北京天融信网络安全技术有限公司 一种建立多核运行环境的方法
US8423745B1 (en) 2009-11-16 2013-04-16 Convey Computer Systems and methods for mapping a neighborhood of data to general registers of a processing element
EP2507738B1 (en) 2009-11-30 2019-05-01 Exxonmobil Upstream Research Company Adaptive newton's method for reservoir simulation
EP2564309A4 (en) 2010-04-30 2017-12-20 Exxonmobil Upstream Research Company Method and system for finite volume simulation of flow
US8463586B2 (en) 2010-06-22 2013-06-11 Saudi Arabian Oil Company Machine, program product, and computer-implemented method to simulate reservoirs as 2.5D unstructured grids
EP2588952A4 (en) 2010-06-29 2017-10-04 Exxonmobil Upstream Research Company Method and system for parallel simulation models
CA2803068C (en) 2010-07-29 2016-10-11 Exxonmobil Upstream Research Company Method and system for reservoir modeling
CA2805446C (en) 2010-07-29 2016-08-16 Exxonmobil Upstream Research Company Methods and systems for machine-learning based simulation of flow
CA2803066A1 (en) 2010-07-29 2012-02-02 Exxonmobil Upstream Research Company Methods and systems for machine-learning based simulation of flow
US8386227B2 (en) 2010-09-07 2013-02-26 Saudi Arabian Oil Company Machine, computer program product and method to generate unstructured grids and carry out parallel reservoir simulation
US8433551B2 (en) 2010-11-29 2013-04-30 Saudi Arabian Oil Company Machine, computer program product and method to carry out parallel reservoir simulation
GB2502432B (en) 2010-09-20 2018-08-01 Exxonmobil Upstream Res Co Flexible and adaptive formulations for complex reservoir simulations
EP2643790A4 (en) 2010-11-23 2018-01-10 Exxonmobil Upstream Research Company Variable discretization method for flow simulation on complex geological models
KR101738641B1 (ko) 2010-12-17 2017-05-23 삼성전자주식회사 멀티 코어 시스템의 프로그램 컴파일 장치 및 방법
KR101731929B1 (ko) 2011-02-08 2017-05-02 삼성전자주식회사 재구성 가능 프로세서 및 구동 제어 방법
US8731891B2 (en) * 2011-07-28 2014-05-20 Saudi Arabian Oil Company Cluster 3D petrophysical uncertainty modeling
EP2756382A4 (en) 2011-09-15 2015-07-29 Exxonmobil Upstream Res Co MATRIX AND VECTOR OPERATIONS OPTIMIZED IN LIMITED INSTRUCTION ALGORITHMS THAT COMPLETE EOS CALCULATIONS
US20130157639A1 (en) 2011-12-16 2013-06-20 SRC Computers, LLC Mobile electronic devices utilizing reconfigurable processing techniques to enable higher speed applications with lowered power consumption
JP5051327B1 (ja) * 2012-03-22 2012-10-17 富士ゼロックス株式会社 画像処理装置及びプログラム
WO2013148021A1 (en) 2012-03-28 2013-10-03 Exxonmobil Upstream Research Company Method for mutiphase flow upscaling
US10430190B2 (en) 2012-06-07 2019-10-01 Micron Technology, Inc. Systems and methods for selectively controlling multithreaded execution of executable code segments
EP2901363A4 (en) 2012-09-28 2016-06-01 Exxonmobil Upstream Res Co ERROR REMOVAL IN GEOLOGICAL MODELS
US10741226B2 (en) 2013-05-28 2020-08-11 Fg Src Llc Multi-processor computer architecture incorporating distributed multi-ported common memory modules
US9898575B2 (en) 2013-08-21 2018-02-20 Seven Bridges Genomics Inc. Methods and systems for aligning sequences
US9116866B2 (en) 2013-08-21 2015-08-25 Seven Bridges Genomics Inc. Methods and systems for detecting sequence variants
AU2014337093B2 (en) 2013-10-18 2020-07-30 Seven Bridges Genomics Inc. Methods and systems for identifying disease-induced mutations
WO2015058120A1 (en) 2013-10-18 2015-04-23 Seven Bridges Genomics Inc. Methods and systems for aligning sequences in the presence of repeating elements
US10078724B2 (en) 2013-10-18 2018-09-18 Seven Bridges Genomics Inc. Methods and systems for genotyping genetic samples
US10832797B2 (en) 2013-10-18 2020-11-10 Seven Bridges Genomics Inc. Method and system for quantifying sequence alignment
US9063914B2 (en) 2013-10-21 2015-06-23 Seven Bridges Genomics Inc. Systems and methods for transcriptome analysis
US10867693B2 (en) 2014-01-10 2020-12-15 Seven Bridges Genomics Inc. Systems and methods for use of known alleles in read mapping
US9817944B2 (en) 2014-02-11 2017-11-14 Seven Bridges Genomics Inc. Systems and methods for analyzing sequence data
US9530483B2 (en) 2014-05-27 2016-12-27 Src Labs, Llc System and method for retaining dram data when reprogramming reconfigurable devices with DRAM memory controllers incorporating a data maintenance block colocated with a memory module or subsystem
US9153311B1 (en) 2014-05-27 2015-10-06 SRC Computers, LLC System and method for retaining DRAM data when reprogramming reconfigurable devices with DRAM memory controllers
WO2016018723A1 (en) 2014-07-30 2016-02-04 Exxonmobil Upstream Research Company Method for volumetric grid generation in a domain with heterogeneous material properties
WO2016060910A1 (en) 2014-10-14 2016-04-21 Seven Bridges Genomics Inc. Systems and methods for smart tools in sequence pipelines
CA2963092C (en) 2014-10-31 2021-07-06 Exxonmobil Upstream Research Company Methods to handle discontinuity in constructing design space for faulted subsurface model using moving least squares
EP3213126A1 (en) 2014-10-31 2017-09-06 Exxonmobil Upstream Research Company Handling domain discontinuity in a subsurface grid model with the help of grid optimization techniques
US10192026B2 (en) 2015-03-05 2019-01-29 Seven Bridges Genomics Inc. Systems and methods for genomic pattern analysis
US9411613B1 (en) 2015-04-22 2016-08-09 Ryft Systems, Inc. Systems and methods for managing execution of specialized processors
US9411528B1 (en) 2015-04-22 2016-08-09 Ryft Systems, Inc. Storage management systems and methods
US9542244B2 (en) 2015-04-22 2017-01-10 Ryft Systems, Inc. Systems and methods for performing primitive tasks using specialized processors
US10275567B2 (en) 2015-05-22 2019-04-30 Seven Bridges Genomics Inc. Systems and methods for haplotyping
US10793895B2 (en) 2015-08-24 2020-10-06 Seven Bridges Genomics Inc. Systems and methods for epigenetic analysis
US10724110B2 (en) 2015-09-01 2020-07-28 Seven Bridges Genomics Inc. Systems and methods for analyzing viral nucleic acids
US10584380B2 (en) 2015-09-01 2020-03-10 Seven Bridges Genomics Inc. Systems and methods for mitochondrial analysis
US11347704B2 (en) 2015-10-16 2022-05-31 Seven Bridges Genomics Inc. Biological graph or sequence serialization
US20170199960A1 (en) 2016-01-07 2017-07-13 Seven Bridges Genomics Inc. Systems and methods for adaptive local alignment for graph genomes
US10364468B2 (en) 2016-01-13 2019-07-30 Seven Bridges Genomics Inc. Systems and methods for analyzing circulating tumor DNA
US10460829B2 (en) 2016-01-26 2019-10-29 Seven Bridges Genomics Inc. Systems and methods for encoding genetic variation for a population
US10262102B2 (en) 2016-02-24 2019-04-16 Seven Bridges Genomics Inc. Systems and methods for genotyping with graph reference
US10672156B2 (en) 2016-08-19 2020-06-02 Seven Bridges Genomics Inc. Systems and methods for processing computational workflows
US11250931B2 (en) 2016-09-01 2022-02-15 Seven Bridges Genomics Inc. Systems and methods for detecting recombination
US10545792B2 (en) 2016-09-12 2020-01-28 Seven Bridges Genomics Inc. Hashing data-processing steps in workflow environments
US10839114B2 (en) 2016-12-23 2020-11-17 Exxonmobil Upstream Research Company Method and system for stable and efficient reservoir simulation using stability proxies
US11055135B2 (en) 2017-06-02 2021-07-06 Seven Bridges Genomics, Inc. Systems and methods for scheduling jobs from computational workflows
US20190050710A1 (en) * 2017-08-14 2019-02-14 Midea Group Co., Ltd. Adaptive bit-width reduction for neural networks
US10678613B2 (en) 2017-10-31 2020-06-09 Seven Bridges Genomics Inc. System and method for dynamic control of workflow execution
CN112286656B (zh) * 2020-10-21 2023-08-29 百度在线网络技术(北京)有限公司 小程序模拟方法、装置、电子设备和计算机可读存储介质
CN114301850B (zh) * 2021-12-03 2024-03-15 成都中科微信息技术研究院有限公司 一种基于生成对抗网络与模型压缩的军用通信加密流量识别方法
CN114896886A (zh) * 2022-05-18 2022-08-12 北京百度网讯科技有限公司 流场识别方法、装置、电子设备、介质和程序产品

Family Cites Families (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59206972A (ja) 1983-05-10 1984-11-22 Toshiba Corp 共有メモリ
EP0131416B1 (en) 1983-07-06 1990-06-13 The Secretary of State for Defence in Her Britannic Majesty's Government of the United Kingdom of Great Britain and Constraint application processor
US4763294A (en) 1985-12-19 1988-08-09 Wang Laboratories, Inc. Method and apparatus for floating point operations
JPH0821087B2 (ja) 1986-09-30 1996-03-04 日本電信電話株式会社 3次元陰影画像生成処理方法
US4872133A (en) * 1988-02-18 1989-10-03 Motorola, Inc. Floating-point systolic array including serial processors
DE68920388T2 (de) * 1988-09-19 1995-05-11 Fujitsu Ltd Paralleles Rechnersystem mit Verwendung eines SIMD-Verfahrens.
US5072371A (en) * 1989-03-01 1991-12-10 The United States Of America As Represented By The United States Department Of Energy Method for simultaneous overlapped communications between neighboring processors in a multiple
US5020059A (en) 1989-03-31 1991-05-28 At&T Bell Laboratories Reconfigurable signal processor
US4962381A (en) * 1989-04-11 1990-10-09 General Electric Company Systolic array processing apparatus
JP2644342B2 (ja) * 1989-09-01 1997-08-25 東芝マイクロエレクトロニクス株式会社 入力保護回路を備えた半導体装置
US5138695A (en) 1989-10-10 1992-08-11 Hnc, Inc. Systolic array image processing system
US5477221A (en) 1990-07-10 1995-12-19 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Pipeline synthetic aperture radar data compression utilizing systolic binary tree-searched architecture for vector quantization
US5274832A (en) * 1990-10-04 1993-12-28 National Semiconductor Corporation Systolic array for multidimensional matrix computations
DE4112776C1 (ja) * 1991-04-19 1992-10-08 Kress-Elektrik Gmbh & Co. Elektromotorenfabrik, 7457 Bisingen, De
JP2647330B2 (ja) * 1992-05-12 1997-08-27 インターナショナル・ビジネス・マシーンズ・コーポレイション 超並列コンピューティングシステム
US5802290A (en) * 1992-07-29 1998-09-01 Virtual Computer Corporation Computer network of distributed virtual computers which are EAC reconfigurable in response to instruction to be executed
US5509134A (en) 1993-06-30 1996-04-16 Intel Corporation Method and apparatus for execution of operations in a flash memory array
US6052773A (en) * 1995-02-10 2000-04-18 Massachusetts Institute Of Technology DPGA-coupled microprocessors
US5570040A (en) * 1995-03-22 1996-10-29 Altera Corporation Programmable logic array integrated circuit incorporating a first-in first-out memory
US5903771A (en) * 1996-01-16 1999-05-11 Alacron, Inc. Scalable multi-processor architecture for SIMD and MIMD operations
US5737766A (en) * 1996-02-14 1998-04-07 Hewlett Packard Company Programmable gate array configuration memory which allows sharing with user memory
US5956518A (en) * 1996-04-11 1999-09-21 Massachusetts Institute Of Technology Intermediate-grain reconfigurable processing device
US5715453A (en) 1996-05-31 1998-02-03 International Business Machines Corporation Web server mechanism for processing function calls for dynamic data queries in a web page
US5892962A (en) * 1996-11-12 1999-04-06 Lucent Technologies Inc. FPGA-based processor
US5784108A (en) * 1996-12-03 1998-07-21 Zapex Technologies (Israel) Ltd. Apparatus for and method of reducing the memory bandwidth requirements of a systolic array
US6128663A (en) 1997-02-11 2000-10-03 Invention Depot, Inc. Method and apparatus for customization of information content provided to a requestor over a network using demographic information yet the user remains anonymous to the server
US5953502A (en) 1997-02-13 1999-09-14 Helbig, Sr.; Walter A Method and apparatus for enhancing computer system security
US6215898B1 (en) * 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
US5966534A (en) 1997-06-27 1999-10-12 Cooke; Laurence H. Method for compiling high level programming languages into an integrated processor with reconfigurable logic
US6226776B1 (en) * 1997-09-16 2001-05-01 Synetry Corporation System for converting hardware designs in high-level programming language to hardware implementations
US6061706A (en) * 1997-10-10 2000-05-09 United Microelectronics Corp. Systolic linear-array modular multiplier with pipeline processing elements
US5915123A (en) * 1997-10-31 1999-06-22 Silicon Spice Method and apparatus for controlling configuration memory contexts of processing elements in a network of multiple context processing elements
US6339819B1 (en) 1997-12-17 2002-01-15 Src Computers, Inc. Multiprocessor with each processor element accessing operands in loaded input buffer and forwarding results to FIFO output buffer
US6076152A (en) * 1997-12-17 2000-06-13 Src Computers, Inc. Multiprocessor computer architecture incorporating a plurality of memory algorithm processors in the memory subsystem
US6192439B1 (en) * 1998-08-11 2001-02-20 Hewlett-Packard Company PCI-compliant interrupt steering architecture
WO2000049496A1 (en) 1999-02-15 2000-08-24 Koninklijke Philips Electronics N.V. Data processor with a configurable functional unit and method using such a data processor
GB2352548B (en) 1999-07-26 2001-06-06 Sun Microsystems Inc Method and apparatus for executing standard functions in a computer system
US6385757B1 (en) * 1999-08-20 2002-05-07 Hewlett-Packard Company Auto design of VLIW processors

Also Published As

Publication number Publication date
JP4430544B2 (ja) 2010-03-10
US20040088527A1 (en) 2004-05-06
EP2278495A2 (en) 2011-01-26
EP1559027A4 (en) 2007-03-21
US7620800B2 (en) 2009-11-17
AU2003275027A1 (en) 2004-06-07
EP1559027A1 (en) 2005-08-03
US20070204131A1 (en) 2007-08-30
EP2278495A3 (en) 2011-02-16
CA2495813A1 (en) 2004-05-21
WO2004042594A1 (en) 2004-05-21
US7225324B2 (en) 2007-05-29

Similar Documents

Publication Publication Date Title
JP4430544B2 (ja) 並列性能を強化した多適応型計算システム
TWI775605B (zh) 深度視覺處理器
US10853544B2 (en) Selective execution for partitioned parallel simulations
Jamshed Using HPC for Computational Fluid Dynamics: A guide to high performance computing for CFD engineers
KR101702996B1 (ko) 영상 처리를 위한 정렬 격자 및 그래프 운행
Kapahi et al. Parallel, sharp interface Eulerian approach to high-speed multi-material flows
Geng et al. O3BNN-R: An out-of-order architecture for high-performance and regularized BNN inference
Liang et al. OMNI: A framework for integrating hardware and software optimizations for sparse CNNs
Capizzano Automatic generation of locally refined Cartesian meshes: Data management and algorithms
Marco et al. A two-level parallelization strategy for genetic algorithms applied to optimum shape design
Gavrilov et al. Clustering optimization based on simulated annealing algorithm for reconfigurable systems-on-chip
Li et al. A design-driven partitioning algorithm for distributed verilog simulation
Saurabh et al. Scalable adaptive algorithms for next-generation multiphase flow simulations
Nie et al. Development of an object-oriented finite element program with adaptive mesh refinement for multi-physics applications
Ibrahim et al. Reconfigurable hardware accelerator for profile hidden Markov models
Nodine et al. I/O overhead and parallel VLSI architectures for lattice computations
Khattab et al. Cascade boosting-based object detection from high-level description to hardware implementation
KR101700829B1 (ko) 병렬처리 입자기반 유체 시뮬레이션 시스템 및 그 방법
Cong et al. Design Space Exploration of Heterogeneous-Accelerator SoCs with Hyperparameter Optimization
C Sunny et al. VOF with center of mass and Lagrangian particles (VCLP): a surface tracking and advection method for incompressible fluids
Melnyk et al. Ordered access memory based programmable hardware accelerator parallel architecture
Asha et al. Association rule mining and refinement using shared memory multiprocessor environment
McCrabb et al. Optimizing Vertex Pressure Dynamic Graph Partitioning in Many-Core Systems
Ertl et al. Massive parallel fluid flow simulations using hierarchical data format version 5 (HDF5)
Ali et al. ViPar: High‐Level Design Space Exploration for Parallel Video Processing Architectures

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060907

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060907

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080404

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080404

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080425

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080430

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080430

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20080508

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090728

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20091021

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091027

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091109

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20091021

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091208

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20091217

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121225

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4430544

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees