JP2013164847A - 高レベル言語を用いるプログラマブルデバイスの構成 - Google Patents

高レベル言語を用いるプログラマブルデバイスの構成 Download PDF

Info

Publication number
JP2013164847A
JP2013164847A JP2013022168A JP2013022168A JP2013164847A JP 2013164847 A JP2013164847 A JP 2013164847A JP 2013022168 A JP2013022168 A JP 2013022168A JP 2013022168 A JP2013022168 A JP 2013022168A JP 2013164847 A JP2013164847 A JP 2013164847A
Authority
JP
Japan
Prior art keywords
programmable
integrated circuit
circuit device
processor
virtual
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013022168A
Other languages
English (en)
Inventor
Tzu-Lang Chen Doris
ツー−ラン チェン ドリス
Singh Deshanand
シング デシャナンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Altera Corp
Original Assignee
Altera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Altera Corp filed Critical Altera Corp
Publication of JP2013164847A publication Critical patent/JP2013164847A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/34Circuit design for reconfigurable circuits, e.g. field programmable gate arrays [FPGA] or programmable logic devices [PLD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2115/00Details relating to the type of the circuit
    • G06F2115/08Intellectual property [IP] blocks or IP cores

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Geometry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Logic Circuits (AREA)
  • Devices For Executing Special Programs (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】高レベル言語を用いてプログラマブル集積回路デバイスを構成する方法を提供すること。
【解決手段】上記方法は、高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることと、高レベル言語で、プログラマブル集積回路デバイスのためのユーザー構成の記述を受信することと、プログラミングプロセッサを用いてユーザー構成を構文解析し、構文解析の結果として、コンパイルされた仮想プログラマブルデバイスのうちの1つを選択することと、プログラマブル集積回路デバイス上でコンパイルされた仮想プログラマブルデバイスのうちの1つのインスタンスを作成することと、ユーザー構成を用いて、コンパイルされた仮想プログラマブルデバイスのうちのインスタンスが作成された1つを構成することとを含む。
【選択図】図8

Description

(発明の分野)
本発明は、プログラマブル集積回路デバイス(例えば、フィールドプログラマブルゲートアレイ(FPGA)または他のタイプのプログラマブル論理デバイス(PLD))を構成するための高レベル言語の使用に関する。
(発明の背景)
初期のプログラマブルデバイスは、1回のみ構成可能であった。例えば、構成は、可溶性リンクを「ブローイング(blowing)」する(すなわち、開放する)ことによって達成された場合がある。代替的に、構成は、プログラマブル読み取り専用メモリに格納された場合がある。それらのデバイスは、概して、「積和」(またはP−TERM)論理動作に対してデバイスを構成する能力をユーザーに提供した。最近、構成に対して消去可能なプログラマブル読み取り専用メモリ(EPROM)を組み込むプログラマブル論理デバイスが利用可能になり、デバイスが再構成されることを可能にした。
なお最近、構成に対して静的ランダムアクセスメモリ(SRAM)要素を組み込むプログラマブルデバイスが利用可能になっている。同様に再構成され得るこれらのデバイスは、それらの構成を不揮発性メモリ(例えば、EPROM)に格納し、デバイスが電力をオンにされる場合、構成が不揮発性メモリからSRAM要素内にロードされる。これらのデバイスは、概してルックアップテーブルタイプの論理デバイスに対してデバイスを構成する能力をユーザーに提供する。
ある時点で、このようなデバイスは、ランダムアクセスメモリ、読み取り専用メモリ、または論理(例えば、P−TERM論理)として動作するために、ユーザーによって構成され得るランダムアクセスメモリの内蔵型ブロックを提供され始めた。さらに、プログラマブルデバイスがより大きくなってきているので、さまざまな一般的に使用される機能に対してプログラマブルデバイスに専用の回路を追加することはより一般的になってきている。その専用の回路は、クロック生成のための位相ロックループまたは遅延ロックループも、さまざまな数学的動作(例えば、加算、乗算)のためのさまざまな回路も含み得る。これは、利用可能な汎用プログラマブル論理を構成することによって、ユーザーを、同等回路を作らなければならないことから助ける。
さまざまな要素がどこに展開されるべきかを考えて決定することによって、手動で簡単に初期のプログラマブル論理デバイスを構成することが可能であったであろうが、たとえそのような以前のデバイスに関しても、ユーザーが必要に応じて論理を展開し、そしてその論理をプログラマブルデバイスのための構成に翻訳することを可能にするプログラミングソフトウェアを提供することは一般的であった。より大きな電流のデバイス(上述した専用の回路網を有するそのようなデバイスを含む)の場合、そのようなソフトウェアなしに、論理を展開しようとすることは、非現実であろう。現在、そのようなソフトウェアは、一般的に、ある一般的に使用される構造を構成するために、特に、上述した専用の回路を組み込む、数学的動作のための回路を構成するために、一般的に「コア」と呼ばれる所定の機能も含む。例えば、コアは、さまざまな三角関数または代数関数を提供され得る。
利用可能なプログラミングソフトウェアは、ユーザーがプログラムされるデバイスの能力内にほとんどの所望の論理設計を実装することを可能にするが、ほとんどのこのようなソフトウェアは、ハードウェア記述言語の知識(例えば、VHDLまたはVerilog)を必要とする。しかしながら、プログラマブルデバイスの多くの潜在的ユーザーは、ハードウェア記述言語に精通しておらず、より高レベルのプログラミング言語を用いてデバイスをプログラムすることを望む場合がある。
(発明の要約)
プログラマブルデバイスを構成するために適合され得る1つの高レベルプログラミング言語は、OpenCL(Open Computing Language)であるが、他の高レベル言語、特に、C、C++、Fortran、C#、F#、BlueSpecおよびMatlabを含む他の高レベル合成言語の使用も本発明の範囲内にある。
OpenCLにおいて、計算は、ホストおよびカーネルの組み合わせを用いて行われ、そこで、ホストは、入力/出力(I/O)およびセットアップタスクを担い、カーネルは、独立した入力で計算を行う。カーネルの明確なデクラレイションがあり、処理されるべき各組の要素が、独立であることが既知である場合、各カーネルは、高性能ハードウェア回路として実装され得る。プログラマブルデバイス(例えば、FPGA)における利用可能な空間の量に基づいて、カーネルは、アプリケーションの性能を向上させるために反復され得る。
カーネルコンパイラは、カーネルを、ハード生成器、システム集積を通じてOpenCLからのアプリケーションを実装し、かつ、ホストコンピュータとインターフェース接続するハードウェア回路に変換する。コンパイラは、OpenCLアプリケーションのコンパイルを可能にするために拡張される開放ソース低レベル仮想機械コンパイラに基づき得る。コンパイラは、OpenCLカーネルを構文解析し、分析し、最適化し、プログラマブルデバイス(例えば、FPGA)における実装に適している高性能のパイプライン化された回路として実装する。次に、システムは、特定のプログラマブルデバイスに対する適切なプログラミングツールを用いてコンパイルされ得る。デバイスは、OpenCL(または他の高レベル)コードを動作させるために、内蔵型ハードプロセッサも有し得るか、または内蔵型ソフトプロセッサ用いて構成され得るか、または外部のプロセッサが使用され得る。OpenCLまたは他の高レベルコードは、内蔵型または外部のプロセッサでホストプログラムを実行することによって動作され得る。
本発明に従って、高レベル言語を用いてプログラマブル集積回路デバイスを構成する方法が提供される。方法は、高レベル言語で記述から複数の仮想プログラマブルデバイスをコンパイルすることと、高レベル言語で、プログラマブル集積回路デバイスのためのユーザー構成の記述を受信することと、プログラミングプロセッサを用いてユーザー構成を構文解析することと、構文解析の結果として、コンパイルされた仮想プログラマブルデバイスのうちの1つを選択することとを含む。コンパイルされた仮想プログラマブルデバイスのうちのその選択された1つは、プログラマブル集積回路デバイス上にインスタンスを作成され、コンパイルされた仮想プログラマブルデバイスのうちのインスタンスが作成された1つは、ユーザー構成を用いて構成される。
仮想プログラマブルデバイスが事前にコンパイルされている場合の対応する方法、およびその方法を行う命令を用いて組み込まれた不揮発性機械読み取り可能な格納媒体も提供される。これらの方法に従ってプログラムされたデバイスも提供される。
例えば、本発明は以下の項目を提供する。
(項目1)
高レベル言語を用いてプログラマブル集積回路デバイスを構成する方法であって、該方法は、
該高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることと、
該高レベル言語で、該プログラマブル集積回路デバイスのためのユーザー構成の記述を受信することと、
プログラミングプロセッサを用いて該ユーザー構成を構文解析し、該構文解析の結果として、該コンパイルされた仮想プログラマブルデバイスのうちの1つを選択することと、
該プログラマブル集積回路デバイス上で該コンパイルされた仮想プログラマブルデバイスのうちの該1つのインスタンスを作成することと、
該ユーザー構成を用いて、該コンパイルされた仮想プログラマブルデバイスのうちの該インスタンスが作成された1つを構成することと
を含む、方法。
(項目2)
上記高レベル言語は、OpenCLである、上記項目に記載の方法。
(項目3)
上記インスタンスを作成することは、上記プログラマブル集積回路デバイスの外部のプロセッサで上記コンパイルされた仮想プログラマブルデバイスのうちの上記1つを実行することを含む、上記項目のいずれかに記載の方法。
(項目4)
上記インスタンスを作成することは、上記プログラマブル集積回路デバイス上の構成プロセッサで上記コンパイルされた仮想プログラマブルデバイスのうちの上記1つを実行することを含む、上記項目のいずれかに記載の方法。
(項目5)
上記実行することは、上記プログラマブル集積回路デバイス上でソフトプロセッサのインスタンスを作成することを含む、上記項目のいずれかに記載の方法。
(項目6)
上記実行することは、上記プログラマブル集積回路デバイスに内蔵されたハード構成プロセッサで上記コンパイルされた仮想プログラマブルデバイスのうちの上記1つを実行することを含む、上記項目のいずれかに記載の方法。
(項目7)
上記構成することは、合成、配置およびルーティングのうちの少なくとも1つを含む、上記項目のいずれかに記載の方法。
(項目8)
上記仮想プログラマブルデバイスの各々は、上記プログラマブル集積回路デバイスのプログラマブルリソースから構成された構成可能なルーティングリソースと、
該プログラマブル集積回路デバイスの構成可能なリソースから構成された複数の複雑な機能ブロックと
を含む、上記項目のいずれかに記載の方法。
(項目9)
上記複数の複雑な機能ブロックは、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つを含む、上記項目のいずれかに記載の方法。
(項目10)
複数の仮想プログラマブルデバイスのための上記複数のコンパイルされた構成は、動作中に再構成可能である仮想プログラマブルデバイスのための少なくとも1つのコンパイルされた構成を含み、
上記選択することは、上記構文解析の結果として、動作中に再構成可能である仮想プログラマブルデバイスのための該少なくとも1つのコンパイルされた構成のうちの1つを選択することを含み、
上記インスタントを作成することは、動作中に再構成可能である仮想プログラマブルデバイスのための該少なくとも1つのコンパイルされた構成のうちの該選択された1つのインスタントを作成することを含む、上記項目のいずれかに記載の方法。
(項目11)
上記コンパイルされた仮想プログラマブルデバイスのうちの上記1つを実行するプロセッサを含む、上記項目のいずれかに記載の方法に従って構成されたプログラマブル集積回路デバイス。
(項目12)
上記プロセッサは、上記プログラマブル集積回路デバイスの外部にある、上記項目のいずれかに記載のプログラマブル集積回路デバイス。
(項目13)
上記プロセッサは、上記プログラマブル集積回路デバイスの中に搭載されたハードプロセッサである、上記項目のいずれかに記載のプログラマブル集積回路デバイス。
(項目14)
上記プロセッサは、上記プログラマブル集積回路デバイスのプログラマブルリソースから構成されている、上記項目のいずれかに記載のプログラマブル集積回路デバイス。
(項目15)
高レベル言語を用いてプログラマブル集積回路デバイスを構成する方法であって、該方法は、
該高レベル言語で、該プログラマブル集積回路デバイスに対してユーザー構成を記述することと、
プログラミングプロセッサを用いて該ユーザー構成を構文解析し、該構文解析の結果として、事前にコンパイルされた仮想プログラマブルデバイスのライブラリの中から、1つの事前にコンパイルされた仮想プログラマブルデバイスを選択することと、
該プログラマブル集積回路デバイス上で該事前にコンパイルされた仮想プログラマブルデバイスのインスタンスを作成することと、
該ユーザー構成を用いて、該インスタンスが作成された事前にコンパイルされた仮想プログラマブルデバイスを構成することと
を含む、方法。
(項目16)
上記高レベル言語は、OpenCLである、上記項目のいずれかに記載の方法。
(項目17)
上記インスタンスを作成することは、上記プログラマブル集積回路デバイスの外部のプロセッサで上記事前にコンパイルされた仮想プログラマブルデバイスを実行することを含む、上記項目のいずれかに記載の方法。
(項目18)
上記インスタンスを作成することは、上記プログラマブル集積回路デバイス上の構成プロセッサで上記事前にコンパイルされた仮想プログラマブルデバイスを実行することを含む、上記項目のいずれかに記載の方法。
(項目19)
上記実行することは、上記プログラマブル集積回路デバイス上でソフトプロセッサのインスタンスを作成することを含む、上記項目のいずれかに記載の方法。
(項目20)
上記実行することは、上記プログラマブル集積回路デバイスに内蔵されたハード構成プロセッサで上記事前にコンパイルされた仮想プログラマブルデバイスを実行することを含む、上記項目のいずれかに記載の方法。
(項目21)
上記構成することは、合成、配置およびルーティングのうちの少なくとも1つを含む、上記項目のいずれかに記載の方法。
(項目22)
上記仮想プログラマブルデバイスの各々は、上記プログラマブル集積回路デバイスのプログラマブルリソースから構成された構成可能なルーティングリソースと、
該プログラマブル集積回路デバイスの構成可能なリソースから構成された複数の複雑な機能ブロックと
を含む、上記項目のいずれかに記載の方法。
(項目23)
上記複数の複雑な機能ブロックは、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つを含む、上記項目のいずれかに記載の方法。
(項目24)
上記事前にコンパイルされた仮想プログラマブルデバイスのライブラリにおける該事前にコンパイルされた仮想プログラマブルデバイスのうちの少なくとも1つは、動作中に再構成可能であり、
上記選択することは、上記構文解析の結果として、動作中に再構成可能である該少なくとも1つの事前にコンパイルされた仮想プログラマブルデバイスのうちの1つを選択することを含み、
上記インスタントを作成することは、動作中に再構成可能である該事前にコンパイルされた仮想プログラマブルデバイスのうちの該少なくとも1つのうちの該選択された1つのインスタントを作成することを含む、上記項目のいずれかに記載の方法。
(項目25)
上記コンパイルされた仮想プログラマブルデバイスを実行するプロセッサを含む、上記項目のいずれかに記載の方法に従って構成されたプログラマブル集積回路デバイス。
(項目26)
上記プロセッサは、上記プログラマブル集積回路デバイスの外部にある、上記項目のいずれかに記載のプログラマブル集積回路デバイス。
(項目27)
上記プロセッサは、上記プログラマブル集積回路デバイスの中に搭載されたハードプロセッサである、上記項目のいずれかに記載のプログラマブル集積回路デバイス。
(項目28)
上記プロセッサは、上記プログラマブル集積回路デバイスのプログラマブルリソースから構成されている、上記項目のいずれかに記載のプログラマブル集積回路デバイス。
(項目29)
高レベル言語を用いてプログラマブルデバイス集積回路デバイスを構成する方法を行う命令を用いて符号化された不揮発性機械読み取り可能な格納媒体であって、該命令は、
該高レベル言語で、該プログラマブル集積回路デバイスのためのユーザー構成の記述を受信する命令と、
プログラミングプロセッサを用いて該ユーザー構成を構文解析し、該構文解析の結果として、事前にコンパイルされた仮想プログラマブルデバイスのライブラリの中から1つの事前にコンパイルされた仮想プログラマブルデバイスを選択する命令と、
該プログラマブル集積回路デバイス上で該事前にコンパイルされた仮想プログラマブルデバイスのインスタンスを作成する命令と、
該ユーザー構成を用いて該インスタンスが作成された事前にコンパイルされた仮想プログラマブルデバイスを構成する命令と
を含む、不揮発性機械読み取り可能な格納媒体。
(項目30)
上記インスタンスを作成する命令は、上記プログラマブル集積回路デバイスの外部のプロセッサ上で上記事前にコンパイルされた仮想プログラマブルデバイスを実行する命令を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目31)
上記インスタンスを作成する命令は、上記プログラマブル集積回路デバイス上の構成プロセッサ上で上記事前にコンパイルされた仮想プログラマブルデバイスを実行する命令を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目32)
上記実行する命令は、上記プログラマブル集積回路デバイス上でソフトプロセッサのインスタンスを作成することを含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(摘要)
プログラマブル集積回路デバイスを構成する方法は、高レベル言語を使用する。方法は、高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることと、高レベル言語で、プログラマブル集積回路デバイスに対してユーザー構成を記述することと、プログラミングプロセッサを用いてユーザー構成を構文解析することと、構文解析の結果として、コンパイルされた仮想プログラマブルデバイスのうちの1つを選択することとを含む。コンパイルされた仮想プログラマブルデバイスのうちのその選択された1つは、プログラマブル集積回路デバイス上にインスタンスを作成され、コンパイルされた仮想プログラマブルデバイスのうちのインスタンスが作成された1つは、ユーザー構成を用いて構成される。
本発明のさらなる特徴、その特性およびさまざまな利点は、添付の図面に関連して以下の詳細な説明を考慮した上で明白になる。図面において、同様な参照文字は、本明細書を通じて同様な部分を指す。
図1は、プログラマブルデバイスを構成するために、高レベル言語を用いる既知の方法を示す。 図2は、本発明の実施形態に従う基本的な仮想ファブリックの例を示す。 図3は、本発明の実施形態に従うより数学的に複雑な仮想ファブリックの例を示す。 図4は、ソフトマイクロプロセッサブロックを含む、本発明の実施形態に従う仮想ファブリックの例を示す。 図5は、本発明の実施形態に従う方法を含む方法において使用される制御データフローグラフを示す。 図6は、本発明の実施形態に従う仮想ファブリックにおいて構成される仮想ルーティングスイッチの例を示す。 図7は、本発明の実施形態に従う仮想ファブリックにおいて構成される仮想FIFOを有する機能ブロックの例を示す。 図8は、プログラマブルデバイスを構成するために、仮想ファブリックのライブラリを用いる、本発明の実施形態に従う方法の実施形態のフローダイヤグラムを示す。 図9は、プログラマブルデバイスを構成するために、仮想ファブリックのライブラリを用いる、本発明の実施形態に従う別の方法の実施形態のフローダイヤグラムを示す。 図10は、本発明に従う方法を行う1組の機械的実行可能な命令を用いて符号化される磁気データ格納媒体の断面図である。 図11は、本発明に従う方法を行う1組の機械的実行可能な命令を用いて符号化される光学的に読み取り可能なデータ格納媒体の断面図である。 図12は、本発明を組み込むプログラマブル論理デバイスを使用する例示的なシステムの簡単化されたブロックダイヤグラムである。
OpenCLにおいて、アプリケーションが、2つの部分(ホストおよびカーネル)で実行される。ホストは、I/Oリクエストを処理することおよび並列処理のためにデータをセットアップすることを担うプログラムである。ホストがデータを処理する準備ができた場合、ホストは、カーネル上の1組のスレッドを起動し得る。カーネルは、各スレッドによって行われるべき計算のユニットを表す。
各スレッドは、ホストによって特定されるメモリからデータをロードし、そのデータを処理し、そしてユーザーまたはユーザーのアプリケーションによって読み込まれるために、メモリに結果を再格納することによってカーネル計算を実行する。OpenCLテクノロジーにおいて、カーネルおよびその上でカーネルが実行しているデータが、スレッドとして考えられる。結果は、一度にスレッドのグループに対して計算され得る。スレッドは、ワークグループ内にグループ化され得、これは、データがワークグループの中のスレッド間に共用されることを可能にする。普通は、ワークグループの中のスレッドの実行の順序に対して制約は課されない。
データ格納および処理の目的のために、各カーネルは、1つより多いタイプのメモリ、例えば、全てのスレッドによって共用されるグローバルメモリ、同じワークグループのスレッドによって共用されるメモリ、および単一のスレッドのみによって使用されるプライベートメモリへのアクセスを有し得る。
OpenCLアプリケーションの実行は、ホストプログラムにおいて部分的に、かつ1つ以上のカーネルを実行することによって部分的に発生し得る。例えば、ベクトル加算において、ベクトルを表すデータアレイは、ホストプログラムを用いてセットアップされ得るが、実際の加算は、1つ以上のカーネルを用いて行われ得る。アプリケーションのこの2つの部分間の通信は、ホストプログラムの中の1組のOpenCL機能によって容易にされ得る。これらの機能は、ホストとカーネルとの間のインターフェースを規定し、ホストプログラムが、どのデータが処理されるか、その処理がいつ開始するかを制御し、処理がいつ完了されたかを検出することを可能にする。
プログラマブルデバイス(例えば、FPGA)は、1組のカーネルおよびホストプログラムから開始することによって、高レベル言語(例えば、OpenCL)を用いてプログラムされ得る。カーネルは、この目的のために拡張され得る低レベル仮想機械(LLVM)コンパイラを用いてハード回路表示内にコンパイルされる。コンパイル処理は、各カーネルのための中間表示を生成する高レベルパーサー(例えば、C言語パーサー)から開始する。中間表示は、命令および命令間の依存関係の形態であり得る。次に、この表示は、標的プログラマブルデバイスに対して最適化され得る。
最適化されたLLVM中間表示は、次に、ハードウェア指向のデータ構造(例えば、制御データフローグラフ(Flow Graph)(CDFG)(図5)へ変換される。このデータ構造は、低レベルでカーネルを表し、そのエリアおよび最大のクロック周波数についての情報を含む。次に、CDFGは、各カーネルのVerilog HDL記述を生成するRTL生成の前に、システムのエリアおよび性能を向上させるために最適化され得る。
次に、コンパイルされたカーネルは、好ましくは、ホストへのインターフェースもメモリインターフェースも含むシステムにおいてインスタンスを作成される。ホストインターフェースは、ホストプログラムが各カーネルにアクセスすることを可能にする。これは、リモートでワークスペースのパラメータおよびカーネルの引数を設定することを可能にする。メモリは、OpenCLカーネルのためのグローバルメモリスペースとして機能する。このメモリは、ホストインターフェースを介してアクセスされ得、ホストプログラムが計算結果を処理し、読み出すために、カーネルに対してデータを設定することを可能にする。最後、ホストプログラムは、書き込まれる高レベル言語(例えば、C++)のためのレギュラーコンパイラを用いてコンパイルされ得る。
処理の個々の部分に戻ると、カーネルをハードウェア回路にコンパイルするために、各カーネルは、基本ブロックモジュールから実装される。各基本ブロックモジュールは、入力と出力インターフェースとを含み、出力インターフェースを用いて他の基本ブロックとトークし、かつ、ロード、加算、減算、格納等のような命令を実装する。
各カーネルをハードウェア回路として実装することにおける次のステップは、各基本ブロックモジュールをハードウェアモジュールに変換することである。各基本ブロックモジュールは、その内部の動作を扱うことを担う。適切に機能するために、基本ブロックモジュールは、他の基本ブロックと情報を交換することもできるべきである。基本ブロックモジュールがどのようなデータを必要とし、生成するかを決定することは、ライブ可変(Live−Variable)分析を用いて完成され得る。
一旦各基本ブロックが分析されると、制御データフローグラフ(CDFG)(図5)が、その基本ブロックモジュールの動作を表すように生成され得、CDFGは、ライブ可変分析の結果に基づいて、その基本ブロックモジュールがカーネルの引数かまたは別の基本ブロックからどのように入力を取り込むかを示す。一旦インスタンスを作成されると、各基本ブロックは、ブロック内に含まれる命令に従ってデータを処理し、他の基本ブロックによって、または直接にユーザーによって読み込まれ得る出力を生成する。
一旦各基本ブロックモジュールがCDFGとして表されると、ブロック内部の動作がスケジュール化され得る。各ノードは、動作を完成させるために必要とする1組のレジスタおよびクロックサイクルを割り当てられ得る。例えば、AND動作は、レジスタを必要としない場合があるが、浮動小数点の加算は、少なくとも7つのクロックサイクルおよび対応するレジスタを必要とし得る。一旦各基本ブロックがスケジュール化されると、パイプライン方式のレジスタが、CDFGを通じて、各経路の待ち時間のバランスを保つために挿入され得る。これは、多くのスレッドが処理されることを可能にする。
一旦各カーネルがハードウェア回路として記述されると、設計が生成され得、設計は、カーネル、メモリ、およびホストプラットフォームへのインターフェースを含む。パイプラインオーバーロードを防止するために、ワークグループ内に許可されるスレッドの数、および同時にカーネル内に許可されるワークグループの数が制限され得る。
上記の一般化された方法100が図1においてダイヤグラム化されている。図1において、経路101は、カーネルの実装を示すが、経路102は、ホストプログラムの実装を示す。
経路101は、カーネルファイル(kernel.cl)111から開始する。パーサーフロントエンド(front end)121は、カーネルファイル111から最適化されていない中間表示131を引き出し、最適化されていない中間表示131は、オプチマイザ(optimizer)141によって最適化された中間表示151に変換される。最適化処理は、コードをより効率的にするためのコンパイラ技術(例えば、ループ展開、メモリ−レジスタ変換、デッドコード削除等)を含む。レジスタタイミング言語「RTL」161生成器は、最適化された中間表示151をハードウェア記述言語表示171に変換し、ハードウェア記述言語表示171は、任意のハードウェア記述言語(例えば、Verlog(示された)またはVHDL)で書き込まれる。
経路102は、ホストプログラムファイル(host.c)112から開始し、ホストプログラムファイル112は、実行可能なプログラムファイル142を生成するために、ランタイムライブラリ132を用いてコンパイラ122によってコンパイルされ、ランタイムライブラリ132は、ホストとプログラマブルデバイスとの間の通信を抽象化するソフトウェアルーティンを含む。
実行可能なプログラムファイル142と、カーネルのハードウェア記述言語表示171とは、適切なソフトウェア103によってプログラマブルデバイス構成にコンパイルされる。例えば、Altera Corporation(San Jose,California)からの市販されているFPGAデバイスに対して、ソフトウェア103は、Alteraによって提供されるQUARTUS(登録商標)IIソフトウェアであり得る。
結果は、カーネルによって表される回路のインスタンスを作成するために、カーネルファイル上でホストプログラムを実行するように構成されたプログラマブルデバイスである。プログラマブルデバイスは、ハードウェア記述言語表示161を生成するために、カーネル111を実行するように、プログラムファイル142を実行するための内蔵型プロセッサを有するべきである。内蔵型プロセッサが、「ソフト」プロセッサである場合、内蔵型プロセッサも、ソフトウェア103を用いて構成され得る。内蔵型プロセッサが「ハード」プロセッサである場合、ソフトウェア103は、ハードプロセッサへの適切な接続を構成する。
上記の一般化された方法は、高レベル言語(例えば、OpenCL)を用いてユーザー論理設計の効率的ハードウェア回路実装を生成するために使用され得るが、必要とされるコンパイル時間が、従来のハードウェア記述言語ベースのプログラミングに対して必要とされるコンパイル時間に匹敵し得ることが望ましくない。特定のユーザー論理設計に応じて、コンパイルは、HDLベースのプログラミングに対する数秒または数分と比べて、数時間または数日さえもかかり得る。長いコンパイル時間の問題は、特に開発の中に、論理設計を周期的に変える必要によって拡大され得る。
それゆえ、本発明に従って、複数の「仮想ファブリック」の高レベル言語表示が事前にコンパイルされ得る。各このような仮想ファブリック200(図2)は、バス211およびルーティングスイッチ221の相互接続ネットワーク201と、論理要素の組み合わせを表す比較的に少数のより複雑な機能ブロック202とを含む粗粒の仮想FPGAの高レベル言語表示であり得、機能ブロック202は、比較的により多数の個々の論理要素を有する物理的FPGAの上に実装される。例えば、機能ブロック202は、基本的な数学関数(例えば、固定または浮動小数点の加算または乗算、または三角関数)を行うブロックと、多重化論理または「ソフト」マイクロプロセッサとを含み得る。
複数の仮想ファブリックは、仮想ファブリックのライブラリとして考えられ得る。ライブラリの中の異なる仮想ファブリックは、異なるタイプの機能ブロックの異なる分配を有し得る。例えば、ライブラリは、ファブリック200が単に1つの実施例である複数の異なる基本仮想ファブリックを含み得、基本仮想ファブリックの各々は、多重化論理と共に基本的な数学関数を含む機能ブロック202の異なる分配を有する。ファブリック300(図3)が単に1つの実施例であるいくつかの複雑な仮想ファブリックもあり得、ファブリック300が、基本的および多重化機能202を有するが、ファブリック300において、機能ブロック301は、より複雑な関数(例えば、三角関数)を行うものである。それらのより複雑な仮想ファブリックのうちの異なるもの間において、さまざまな算数関数、三角関数および多重化機能の数および分配が変えられ得る。ファブリック400(図4)が単に1つの実施例である仮想ファブリックさえもあり得、ファブリック400は、1つ以上の機能ブロックがソフトプロセッサブロック401によって置換されていること以外、ファブリック200またはファブリック300に類似し得る。さらなるタイプの仮想ファブリックも提供され得る。
仮想ファブリックをある程度までパイプライン化することによって仮想ファブリックの性能を加速することが望ましい場合がある。例えば、レジスタステージが、仮想ルーティングスイッチにおいて提供され得、レジスタステージの各々は、レジスタにつながる多重器として考えられ得る。パイプラインにおける任意の要素は、好ましくは、ストール信号アップストリームを送信することによって、パイプラインをストールする(すなわち、より多く受け取る準備ができるまでデータのフローを停止する)能力を有する。そうでなければ、ダウンストリーム要素がビジーすぎてデータを処理できない間にアップストリーム要素がデータを送信し続ける場合、データが失われる。
しかしながら、要素がストール信号アップストリームを送信する場合、信号が1クロックサイクル遅れて到達する場合があり、その結果、1つのクロックサイクルに相当するデータが失われ得る。それゆえ、ストール信号は、好ましくは、それ自身パイプライン化され、それによって、仮想ファブリック内にパイプライン化されるストール信号ネットワークを提供する。これは、一部または全てのルーティングスイッチにおいてレジスタにストール信号を提供することによって達成され得る。次に、ストールされたコンポーネントからストール信号を送信することに代わって、ストール信号は、レジスタから送信され得る。
一実施例が図6に示される。図6の全てのコンポーネントは、仮想であり、すなわち、それらは、下部FPGAの基本要素、または仮想ファブリックのコンパイルの一部分のような他の構成可能またはプログラム可能なデバイスから構成される。
図6は、ルーティングスイッチ600の1つの可能で詳細な実装のダイヤグラムであり、ルーティングスイッチ600において、信号は、601において「west」から入り、602において「north」へ、603において「south」へ、または604において「east」へルーティング可能である。ルーティングスイッチ600は、605においてアップストリームにストール信号を返送することが可能である必要があるが、606においてnorthから、607においてsouthから、および608においてeastからストール信号を受信する。
仮想ルーティングスイッチ600は、入力多重器611と、north、southおよびeast出力のそれぞれにおける出力多重器612、613および614とを含む。このようなルーティングスイッチは、入力が到達する方向でストール信号605を返送する必要があり得るが、3つの出力方向のうちの任意の1つからストール信号606、607、608を受信する必要もあり得る。本発明の実施形態に従って、ストール信号レジスタ615が、ストール信号605を出力するために提供され得、ストール信号レジスタ616、617、618が、受信されるストール信号606、607、608を登録するために提供され得る。ストール信号レジスタ615,616、617、618は、パイプライン化されるストール信号がアップストリームおよびダウンストリームの両方へ完全に伝搬することを可能にする。
レジスタ609、610が、入力データを提供される。レジスタ609は、ストールがダウンストリームから受信されているため、さらに伝搬することができないデータをキャプチャーする。データが伝搬されるべき出力方向602、603、604のうちの任意の1つがストールされる場合、それらのデータが、ストールが消去されるまでにレジスタ609において保持される。レジスタ610は、入力データをキャプチャーし、かつ、ストール信号605がアサートされなければならない場合にそれらのデータが失われることを防ぐ。レジスタ610がない場合、上述した1つのクロックの遅延のため、新しいデータは、ストール信号605のアサーション後の最初のクロックサイクルで多重器611において受信され得、たとえ事前に受信されたデータがダウンストリームへ伝搬されていなくても、多重器611において任意の事前に受信されたデータを置換し得る。しかしながら、レジスタ610がある場合、たとえ追加のデータが多重器611において後に受信されても、多重器611において事前に受信されたデータが保存される。構成レジスタ626、627、628は、ストール信号を受信するための能力をオンまたはオフにするために提供され得る。構成レジスタ629は、多重器611へ、従って仮想ルーティングスイッチ600への入力を選択する。構成レジスタ630、631、632は、仮想ルーティングスイッチ600の1つ以上の出力を選択するように出力多重器612、613、614を制御する。
前述のストール信号ネットワークのパイプライン方式に加えて、仮想ファブリックのパイプライン方式も、仮想ファブリックの個々の機能ブロック202、301、401の入力におけるデータ自身のためのレジスタを含み得る。パイプライン化されるデータ経路の長さが、仮想ファブリックの生成時において未知であり、かつ、同じ機能ブロックに対する異なるデータ経路が、特定のユーザー設計において実装される場合、それらは異なり得るので、各機能ブロック202、301、401の入力においてデータパイプラインレジスタは、好ましくは、パイプラインのバランスを保つために、図7に示されるFIFO701である。
各FIFO701の深さは、最大予期されたパイプラインのアンバランスに基づいて選択され得る。しかしながら、FIFO701は満杯になる場合があり、従って各FIFO701は、満杯のときにストール信号702をアサートする能力を有することが可能である。
同様に、各FIFO701は、機能ブロック202、301、401が利用不能のときにデータを読み込もうとしないように、空(empty)信号703をアサートして、機能ブロック202、301、401をストールする能力も有し得る。そうでなければ、機能ブロック202、301、401へのさまざまな入力は、同期から外れ得る(すなわち、機能ブロック202、301、401は、1つのパイプライン上のデータがまだ到達していないときに、2つ以上のパイプラインからデータを読み込む)。
本発明の別の局面に従って、プログラマブルデバイスは、事前にコンパイルされた仮想ファブリックのライブラリまたは集合の中から選択することによって構成され得る。特定の仮想ファブリックの選択は、ユーザーの論理設計の機能的ニーズを検査し、仮想機能ブロックの数およびタイプに関してその機能的ニーズに最もよくマッチする仮想ファブリックを選択することによって、プログラミングソフトウェアで実行され得る。その仮想ファブリックは、オンボードハードプロセッサ、仮想ファブリックの選択の前、後または間にオンボードで構成されるソフトプロセッサ、または外部のプロセッサによってデバイス上で実行される。選択された仮想ファブリックの実行は、デバイスを粗粒の仮想デバイスとして構成する。次に、従来の合成、配置およびルーティングツールは、ユーザーの論理設計を用いてその粗粒の仮想デバイスを構成するために使用され得る。
図8にダイヤグラム化されたプロセッサ800の実施形態は、前述のようなさまざまなタイプの機能ブロックの異なるサイズおよび異なる分配を有するコンパイルされた仮想ファブリックの集合の生成を有するステップ801において開始し得る。ステップ801は、デバイス製造者によって行われ得、仮想ファブリックのライブラリは、デバイス上のメモリ、またはデバイスに提供されたデバイス構成ソフトウェアに関連付けられた格納デバイスまたは媒体に提供され得る。第3者も、コンパイルされた仮想ファブリックのライブラリを提供し得る。代替的に、ユーザーは、デバイスが始めて構成されるときに仮想ファブリックのライブラリをコンパイルし得る。
ユーザー自身の仮想ファブリックのライブラリをコンパイルしたユーザーのために、処理800は、ステップ803において続く。仮想ファブリックの事前にコンパイルされたライブラリ(デバイスの事前構成中に、製造者、第3者、または、ユーザーによって提供される)を用いるユーザーに対して、ユーザーは、802において処理800に入り、ステップ803へ進む。
ステップ803において、ユーザーは、前述のような高レベル言語ステートメント(例えば、OpenCLステートメント)の形態で所望の構成を入力し、1組のカーネルを規定する。前述のように、ステップ804において、カーネルは、各カーネルに対して中間表示を生成する高レベルパーサー(例えば、C言語パーサー)を用いて構文解析される。中間表示は、命令および命令間の依存関係の形態であり得る。次に、ステップ805において、この表示は、最適化され、ハードウェア指向のデータ構造(例えば、制御データフローグラフ(CDFG))に変換され得る。
ステップ806において、CDFGは、そのハードウェアニーズを確定するために、プログラミングソフトウェアによって検査され、次に、ソフトウェアは、仮想ファブリックのライブラリの中から、そのハードウェアニーズに合う仮想ファブリックを選択する。既知の技術を用いて、ソフトウェアは、最もよい仮想ファブリックを見つけるために、全ての仮想ファブリックを検査し得るか、または、検査は、ハードウェアニーズに十分に近い仮想ファブリックが見つかれば、終了し得る。この文脈において、「十分に近い」は、全ての必要とされるリソースが仮想ファブリックの中に存在するが、仮想ファブリックが使用されないことがある追加のリソースを有し得ることを意味する。
最後、ステップ807において、ユーザーの論理設計は、従来の合成、配置およびルーティング技術(例えば、Altera Corporationからの前述した市販のQUARTUS(登録商標)IIソフトウェアによって実装され得る技術)を用いて、CDFGから選択された仮想ファブリック上でプログラムされる。もしデバイスが内蔵型ハードプロセッサを含むことも、外部のハードプロセッサが仮想ファブリックを実行するために使用されるべきでもなければ、このステップは、仮想ファブリックを実行するために、ソフトプロセッサを構成することを含み得る。
特定のユーザー設計は、多数の機能を含み得るが、その機能の全てが同時にアクティブにならない。本明細書に説明される仮想ファブリックが、比較的に粗いので、その仮想ファブリックは、比較的に少数の構成ビットを有する。それゆえ、ランタイムで仮想ファブリックの構成を可能にすることは、(実行時間の観点から)非現実であり得る。従って、仮想ファブリックは、第1のグループの機能を含む第1の構成で構成され得、次に、「オンザフライ(on the fly)」は、第2のグループの機能を用いて再構成され得る(第2のグループの機能は、第1のグループの機能と重なり得、すなわち、第2のグループの機能は、第1のグループの機能と同じようないくつかの機能を有し得る)。
このような再構成を用いるためにデバイスをプログラムする方法850が図9に示される。方法850は、方法800と同様に開始し、ステップ801,802、803、804および805を有する。ステップ856において、CDFGは、そのハードウェアニーズを確定するために検査され、次に、ソフトウェアは、仮想ファブリックのライブラリの中から、2つ以上の別個の構成においてそのハードウェアニーズに合い得る仮想ファブリックを選択する。例えば、どの仮想ファブリックを使用すべきかを決定する1つの方法は、仮想ファブリックがどの程度カーネルのリソースニーズと似ているかを計算するコスト機能を使用することであり得る。
ステップ857において、2つ以上の別個の構成は、従来の合成、配置およびルーティング技術(例えば、前述したQUARTUS(登録商標)IIソフトウェアによって実装され得る技術)を用いてプログラムされる。さまざまな構成に対する構成ビットストリームが、ステップ858において格納され、仮想ファブリックは、第1の構成を用いてステップ859において構成される。必要な場合(テスト860、861)、その構成は、ステップ862においてアンロードされ得、2つ以上の構成のうちの別の構成が、ステップ863においてロードされ得る。新しい構成が実行される場合、方法は、ステップ859に戻る。これは、デバイスの所望の機能が完成されるまで、2つ以上の構成のうちの異なる構成がアンロードおよび再ロードされるように、1回より多く発生し得る。
選択された仮想ファブリックが前述された再構成処理中に変更されないので、再構成処理は、物理的デバイスが再構成をオンザフライでサポートするか否かに関わらずに使用され得ることが認識される。仮想ファブリックによって表される仮想デバイスが再構成をオンザフライでサポートすることのみが必要である。物理的デバイスが再構成をオンザフライでサポートする場合、選択された仮想ファブリックの構成がランタイムで変更されることが可能であるだけではなく、仮想ファブリック自身も、(前述のように、必要な場合、ロードされている任意の特定の仮想ファブリックの構成がオンザフライで変更されることより)オンザフライでアンロードおよびロードされることが可能であることがさらに認識される。
ライブラリの中の仮想ファブリックが、前もってハードウェア記述言語表示にコンパイルされるので、仮想ファブリックの所望の構成のユーザー高レベル合成言語表示のみが、ユーザープログラミング処理の一部分としてコンパイルされる必要がある。ユーザーは、なお、所望の回路の完全な高レベル記述を入力し、構成されるデバイスを生成するために、高レベル記述を実行するためのプロセッサがなお存在する。しかしながら、ユーザーの高レベル記述の実行の大部分が事前にコンパイルされた仮想ファブリックの選択を伴うので、伴われたコンパイルは、前述のように比較的に小さな構成問題のみを伴う仮想ファブリックの構成のコンパイルのみである。従って、ユーザーによって見られるコンパイル時間は、全設計が高レベル記述からコンパイルされた場合に必要とされ得る時間よりずっと短く、かつ、ハードウェア言語を用いるときの構成時間に匹敵する。
従って、過度に長いコンパイル時間を必要とせずに、高レベル合成言語を用いてプログラマブルデバイスを構成する方法が提供されていることが分かる。
プログラマブルデバイスをプログラムする本発明に従う方法を実行する命令は、機械読み取り可能な媒体上に符号化され、前述の高レベル合成言語によって記述された構成を用いてPLDまたはプログラマブルデバイスをプログラムまたは構成する本発明の方法を実装するために、適切なコンピュータまたは類似のデバイスによって実行され得る。例えば、パーソナルコンピュータは、PLDが接続され得るインターフェースを装備され得、パーソナルコンピュータは、前述のように、適切なソフトウェアを用いてPLDをプログラムするために、ユーザーによって使用され得る。さらに、同じ機械読み取り可能な媒体、または別個の機械読み取り可能な媒体は、仮想ファブリックのライブラリを用いて符号化され得る。
図10は、磁気データ格納媒体1200の断面を示し、磁気データ格納媒体1200は、前述のパーソナルコンピュータ、または他のコンピュータまたは類似のデバイスのようなシステムによって実行され得る機械実行可能なプログラムを用いて符号化され、または仮想ファブリックのライブラリを用いて符号化され得る。媒体1200は、フロッピー(登録商標)ディスクまたはハードディスク、または磁気テープであり得、媒体1200は、従来的であり得る適切な基板1201と、片側または両側上の従来的であり得る適切なコーティング1202とを有し、コーティング1202は、極性または配向が磁気的に変更され得る磁気領域(見えない)を含む。磁気テープである場合を除いて、媒体1200は、ディスクドライブのスピンドルまたは他のデータ格納デバイスを受け取るための開口部(示されていない)も有し得る。
媒体1200のコーティング1202の磁気領域は、パーソナルコンピュータまたは他のコンピュータまたは類似のシステムのようなプログラミングシステムによる実行のために、機械実行可能なプログラムを従来的であり得る方法を符号化するように偏極または配向され、プログラミングシステムは、本発明に従って、(もしあれば)、その特定された処理ブロックを含むPLDの適切な部分を構成するために、プログラムされるべきPLDが挿入され得るソケットまたは周辺アタッチメントを有する。
図11は、光学的読み取り可能なデータ格納媒体1210の断面を示し、光学的読み取り可能なデータ格納媒体1210は、前述のパーソナルコンピュータ、または他のコンピュータまたは類似のデバイスのようなシステムによって実行され得る機械実行可能なプログラムを用いても符号化され、または仮想ファブリックのライブラリを用いて符号化され得る。媒体1210は、従来のコンパクトディスク読み取り専用メモリ(CD−ROM)またはデジタルビデオディスク読み取り専用メモリ(DVD−ROM)または再書き込み可能な媒体(例えば、CD−R、CD−RW、DVD−R、DVD−RW、DVD+R、DVD+RW、または光学的に読み取り可能、かつ、磁気光学的に再書き込む可能であるDVD−RAMまたは磁気光学ディスクであり得る。媒体1210は、好ましくは、従来的であり得る適切な基板1211と、一般的に基板1211の片側または両側上の従来的であり得る適切なコーティング1212とを有する。
CDベースまたはDVDベースの媒体の場合、周知のように、コーティング1212は、反射性であり、機械実行可能なプログラムを符号化するために、1つ以上の層の上に配列される複数のピット1213を加えられる。ピットの配列は、コーティング1212の表面にレーザー光を反射させることによって読み取られる。保護性コーティング1214は、好ましくは、実質的に透明であり、コーティング1212の上に提供される。
磁気光学ディスクの場合、周知のように、コーティング1212は、ピット1213を有しないが、レーザー(示されていない)によってある温度より上に加熱されたときに、極性または配向が磁気的に変更され得る複数の磁気領域を有する。領域の配向は、コーティング1212から反射されるレーザー光の偏光を測定することによって読み取られ得る。領域の配列は、前述のように、プログラムを符号化する。
本発明に従ってプログラムされたPLD1500は、多くの種類の電子デバイス内に使用され得る。1つの可能な使用は、図12に示されるデータ処理システム1400内に使用される。データ処理システム1400は、以下のコンポーネント:プロセッサ1401、メモリ1402、I/O回路網1403、および周辺デバイス1404のうちの1つ以上を含み得る。これらのコンポーネントは、システムバス1405によって一緒に連結され、エンドユーザーシステム1407内に含まれる回路ボード1406上に装着される。
システム1400は、幅広いさまざまな応用、例えば、コンピュータネットワーク、データネットワーク、計装、ビデオ処理、デジタル信号処理、またはプログラム可能または再プログラム可能な論理の使用の利点が望まれる任意の他の応用において使用され得る。PLD140は、さまざまな異なる論理機能を行うために使用され得る。例えば、PLD1500は、プロセッサ1401と協働して動作するプロセッサまたはコントローラとして構成され得る。PLD1500は、システム1400の共用のリソースへのアクセスを調停するアービターとしても使用され得る。なお別の実施例において、PLD1500は、プロセッサ1401とシステム1400の他のコンポーネントのうちの1つとの間のインターフェースとして構成され得る。システム1400は、例示のみであることと、本発明の真の範囲および精神は、以下の請求項によって示されるべきであることとが留意されるべきである。
さまざまなテクノロジーは、前述のようで本発明を組み込むPLD1500を実装するために使用され得る。
上記説明は、単に本発明の原理の例示であることと、本発明の範囲および精神から逸脱することなしに当業者によってさまざまな変更がなされ得ることとが理解される。例えば、本発明のさまざまな要素は、任意の所望の数および/または配列でPLD上に提供され得る。当業者は、限定ではなく、例示の目的のために示された説明された実施形態以外で実践され得ることと、本発明は、後に続く請求項のみによって限定されることとを認識する。

Claims (32)

  1. 高レベル言語を用いてプログラマブル集積回路デバイスを構成する方法であって、該方法は、
    該高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることと、
    該高レベル言語で、該プログラマブル集積回路デバイスのためのユーザー構成の記述を受信することと、
    プログラミングプロセッサを用いて該ユーザー構成を構文解析し、該構文解析の結果として、該コンパイルされた仮想プログラマブルデバイスのうちの1つを選択することと、
    該プログラマブル集積回路デバイス上で該コンパイルされた仮想プログラマブルデバイスのうちの該1つのインスタンスを作成することと、
    該ユーザー構成を用いて、該コンパイルされた仮想プログラマブルデバイスのうちの該インスタンスが作成された1つを構成することと
    を含む、方法。
  2. 前記高レベル言語は、OpenCLである、請求項1に記載の方法。
  3. 前記インスタンスを作成することは、前記プログラマブル集積回路デバイスの外部のプロセッサで前記コンパイルされた仮想プログラマブルデバイスのうちの前記1つを実行することを含む、請求項1に記載の方法。
  4. 前記インスタンスを作成することは、前記プログラマブル集積回路デバイス上の構成プロセッサで前記コンパイルされた仮想プログラマブルデバイスのうちの前記1つを実行することを含む、請求項1に記載の方法。
  5. 前記実行することは、前記プログラマブル集積回路デバイス上でソフトプロセッサのインスタンスを作成することを含む、請求項4に記載の方法。
  6. 前記実行することは、前記プログラマブル集積回路デバイスに内蔵されたハード構成プロセッサで前記コンパイルされた仮想プログラマブルデバイスのうちの前記1つを実行することを含む、請求項4に記載の方法。
  7. 前記構成することは、合成、配置およびルーティングのうちの少なくとも1つを含む、請求項1に記載の方法。
  8. 前記仮想プログラマブルデバイスの各々は、前記プログラマブル集積回路デバイスのプログラマブルリソースから構成された構成可能なルーティングリソースと、
    該プログラマブル集積回路デバイスの構成可能なリソースから構成された複数の複雑な機能ブロックと
    を含む、請求項1に記載の方法。
  9. 前記複数の複雑な機能ブロックは、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つを含む、請求項8に記載の方法。
  10. 複数の仮想プログラマブルデバイスのための前記複数のコンパイルされた構成は、動作中に再構成可能である仮想プログラマブルデバイスのための少なくとも1つのコンパイルされた構成を含み、
    前記選択することは、前記構文解析の結果として、動作中に再構成可能である仮想プログラマブルデバイスのための該少なくとも1つのコンパイルされた構成のうちの1つを選択することを含み、
    前記インスタントを作成することは、動作中に再構成可能である仮想プログラマブルデバイスのための該少なくとも1つのコンパイルされた構成のうちの該選択された1つのインスタントを作成することを含む、請求項1に記載の方法。
  11. 前記コンパイルされた仮想プログラマブルデバイスのうちの前記1つを実行するプロセッサを含む、請求項1に記載の方法に従って構成されたプログラマブル集積回路デバイス。
  12. 前記プロセッサは、前記プログラマブル集積回路デバイスの外部にある、請求項11に記載のプログラマブル集積回路デバイス。
  13. 前記プロセッサは、前記プログラマブル集積回路デバイスの中に搭載されたハードプロセッサである、請求項11に記載のプログラマブル集積回路デバイス。
  14. 前記プロセッサは、前記プログラマブル集積回路デバイスのプログラマブルリソースから構成されている、請求項11に記載のプログラマブル集積回路デバイス。
  15. 高レベル言語を用いてプログラマブル集積回路デバイスを構成する方法であって、該方法は、
    該高レベル言語で、該プログラマブル集積回路デバイスに対してユーザー構成を記述することと、
    プログラミングプロセッサを用いて該ユーザー構成を構文解析し、該構文解析の結果として、事前にコンパイルされた仮想プログラマブルデバイスのライブラリの中から、1つの事前にコンパイルされた仮想プログラマブルデバイスを選択することと、
    該プログラマブル集積回路デバイス上で該事前にコンパイルされた仮想プログラマブルデバイスのインスタンスを作成することと、
    該ユーザー構成を用いて、該インスタンスが作成された事前にコンパイルされた仮想プログラマブルデバイスを構成することと
    を含む、方法。
  16. 前記高レベル言語は、OpenCLである、請求項15に記載の方法。
  17. 前記インスタンスを作成することは、前記プログラマブル集積回路デバイスの外部のプロセッサで前記事前にコンパイルされた仮想プログラマブルデバイスを実行することを含む、請求項15に記載の方法。
  18. 前記インスタンスを作成することは、前記プログラマブル集積回路デバイス上の構成プロセッサで前記事前にコンパイルされた仮想プログラマブルデバイスを実行することを含む、請求項15に記載の方法。
  19. 前記実行することは、前記プログラマブル集積回路デバイス上でソフトプロセッサのインスタンスを作成することを含む、請求項18に記載の方法。
  20. 前記実行することは、前記プログラマブル集積回路デバイスに内蔵されたハード構成プロセッサで前記事前にコンパイルされた仮想プログラマブルデバイスを実行することを含む、請求項18に記載の方法。
  21. 前記構成することは、合成、配置およびルーティングのうちの少なくとも1つを含む、請求項15に記載の方法。
  22. 前記仮想プログラマブルデバイスの各々は、前記プログラマブル集積回路デバイスのプログラマブルリソースから構成された構成可能なルーティングリソースと、
    該プログラマブル集積回路デバイスの構成可能なリソースから構成された複数の複雑な機能ブロックと
    を含む、請求項15に記載の方法。
  23. 前記複数の複雑な機能ブロックは、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つを含む、請求項22に記載の方法。
  24. 前記事前にコンパイルされた仮想プログラマブルデバイスのライブラリにおける該事前にコンパイルされた仮想プログラマブルデバイスのうちの少なくとも1つは、動作中に再構成可能であり、
    前記選択することは、前記構文解析の結果として、動作中に再構成可能である該少なくとも1つの事前にコンパイルされた仮想プログラマブルデバイスのうちの1つを選択することを含み、
    前記インスタントを作成することは、動作中に再構成可能である該事前にコンパイルされた仮想プログラマブルデバイスのうちの該少なくとも1つのうちの該選択された1つのインスタントを作成することを含む、請求項15に記載の方法。
  25. 前記コンパイルされた仮想プログラマブルデバイスを実行するプロセッサを含む、請求項15に記載の方法に従って構成されたプログラマブル集積回路デバイス。
  26. 前記プロセッサは、前記プログラマブル集積回路デバイスの外部にある、請求項25に記載のプログラマブル集積回路デバイス。
  27. 前記プロセッサは、前記プログラマブル集積回路デバイスの中に搭載されたハードプロセッサである、請求項25に記載のプログラマブル集積回路デバイス。
  28. 前記プロセッサは、前記プログラマブル集積回路デバイスのプログラマブルリソースから構成されている、請求項25に記載のプログラマブル集積回路デバイス。
  29. 高レベル言語を用いてプログラマブルデバイス集積回路デバイスを構成する方法を行う命令を用いて符号化された不揮発性機械読み取り可能な格納媒体であって、該命令は、
    該高レベル言語で、該プログラマブル集積回路デバイスのためのユーザー構成の記述を受信する命令と、
    プログラミングプロセッサを用いて該ユーザー構成を構文解析し、該構文解析の結果として、事前にコンパイルされた仮想プログラマブルデバイスのライブラリの中から1つの事前にコンパイルされた仮想プログラマブルデバイスを選択する命令と、
    該プログラマブル集積回路デバイス上で該事前にコンパイルされた仮想プログラマブルデバイスのインスタンスを作成する命令と、
    該ユーザー構成を用いて該インスタンスが作成された事前にコンパイルされた仮想プログラマブルデバイスを構成する命令と
    を含む、不揮発性機械読み取り可能な格納媒体。
  30. 前記インスタンスを作成する命令は、前記プログラマブル集積回路デバイスの外部のプロセッサ上で前記事前にコンパイルされた仮想プログラマブルデバイスを実行する命令を含む、請求項29に記載の不揮発性機械読み取り可能な格納媒体。
  31. 前記インスタンスを作成する命令は、前記プログラマブル集積回路デバイス上の構成プロセッサ上で前記事前にコンパイルされた仮想プログラマブルデバイスを実行する命令を含む、請求項29に記載の不揮発性機械読み取り可能な格納媒体。
  32. 前記実行する命令は、前記プログラマブル集積回路デバイス上でソフトプロセッサのインスタンスを作成することを含む、請求項31に記載の不揮発性機械読み取り可能な格納媒体。
JP2013022168A 2012-02-09 2013-02-07 高レベル言語を用いるプログラマブルデバイスの構成 Pending JP2013164847A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/369,836 2012-02-09
US13/369,836 US20130212366A1 (en) 2012-02-09 2012-02-09 Configuring a programmable device using high-level language

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2017182139A Division JP6527202B2 (ja) 2012-02-09 2017-09-22 高レベル言語を用いるプログラマブルデバイスの構成

Publications (1)

Publication Number Publication Date
JP2013164847A true JP2013164847A (ja) 2013-08-22

Family

ID=47747417

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013022168A Pending JP2013164847A (ja) 2012-02-09 2013-02-07 高レベル言語を用いるプログラマブルデバイスの構成
JP2017182139A Active JP6527202B2 (ja) 2012-02-09 2017-09-22 高レベル言語を用いるプログラマブルデバイスの構成

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2017182139A Active JP6527202B2 (ja) 2012-02-09 2017-09-22 高レベル言語を用いるプログラマブルデバイスの構成

Country Status (4)

Country Link
US (1) US20130212366A1 (ja)
EP (1) EP2626800B1 (ja)
JP (2) JP2013164847A (ja)
CN (1) CN103324511B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016114532A1 (ko) * 2015-01-16 2016-07-21 서울대학교 산학협력단 프로그램 컴파일 장치 및 프로그램 컴파일 방법
JP2016143044A (ja) * 2015-02-05 2016-08-08 大日本印刷株式会社 太陽電池付き表示体
KR101737785B1 (ko) * 2015-01-16 2017-05-19 서울대학교산학협력단 프로그램 컴파일 장치 및 프로그램 컴파일 방법

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8959469B2 (en) 2012-02-09 2015-02-17 Altera Corporation Configuring a programmable device using high-level language
US9817931B1 (en) * 2013-12-05 2017-11-14 The Mathworks, Inc. Systems and methods for generating optimized hardware descriptions for models
US10078717B1 (en) 2013-12-05 2018-09-18 The Mathworks, Inc. Systems and methods for estimating performance characteristics of hardware implementations of executable models
US9727679B2 (en) * 2014-12-20 2017-08-08 Intel Corporation System on chip configuration metadata
US20160179161A1 (en) * 2014-12-22 2016-06-23 Robert P. Adler Decode information library
US9286196B1 (en) * 2015-01-08 2016-03-15 Arm Limited Program execution optimization using uniform variable identification
US9864828B1 (en) * 2015-09-17 2018-01-09 Xilinx, Inc. Hardware acceleration device handoff for using programmable integrated circuits as hardware accelerators
JP7015249B2 (ja) * 2016-01-26 2022-02-02 アイキャット・エルエルシー 再構成可能アルゴリズムによるパイプラインコアおよびアルゴリズムマッチングパイプラインコンパイラを有するプロセッサ
CN109656673B (zh) * 2017-10-11 2023-03-31 阿里巴巴集团控股有限公司 程序的加载方法、装置、系统以及电子设备
CN109032059B (zh) * 2018-07-25 2019-12-24 山东大学 一种控制器逻辑柔性的编码、通信方法及装置
US10642630B1 (en) * 2018-08-27 2020-05-05 Liquid Instruments Pty. Ltd. Process of programming field programmable gate arrays using partial reconfiguration
KR20200139525A (ko) * 2019-06-04 2020-12-14 삼성전자주식회사 Fpga를 포함하는 전자 시스템 및 이의 동작 방법

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171913A (ja) * 2004-12-13 2006-06-29 Canon Inc 情報処理装置、情報処理方法、ならびにプログラム、記憶媒体

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541849A (en) * 1990-04-06 1996-07-30 Lsi Logic Corporation Method and system for creating and validating low level description of electronic design from higher level, behavior-oriented description, including estimation and comparison of timing parameters
US7356620B2 (en) * 2003-06-10 2008-04-08 Altera Corporation Apparatus and methods for communicating with programmable logic devices
EP1356400A2 (en) * 2000-08-07 2003-10-29 Altera Corporation Inter-device communication interface
JP2004023761A (ja) * 2002-06-20 2004-01-22 Konica Minolta Holdings Inc プログラマブル集積回路装置
US6983456B2 (en) * 2002-10-31 2006-01-03 Src Computers, Inc. Process for converting programs in high-level programming languages to a unified executable for hybrid computing platforms
US7290240B1 (en) * 2004-07-30 2007-10-30 Altera Corporation Leveraging combinations of synthesis, placement and incremental optimizations
JP4390211B2 (ja) * 2004-11-30 2009-12-24 国立大学法人九州大学 カスタムlsi開発プラットフォーム、命令セット・アーキテクチャ及び論理回路構成情報の生成方法、並びにプログラム
US7254801B1 (en) * 2005-01-20 2007-08-07 Altera Corporation Synthesis aware placement: a novel approach that combines knowledge of possible resynthesis
WO2007005724A2 (en) * 2005-07-01 2007-01-11 The Regents Of The University Of California Fpga circuits and methods considering process variations
US7996797B1 (en) * 2006-08-16 2011-08-09 Altera Corporation Method and apparatus for performing multiple stage physical synthesis
US8296696B1 (en) * 2008-03-12 2012-10-23 Altera Corporation Method and apparatus for performing simultaneous register retiming and combinational resynthesis during physical synthesis
US8959469B2 (en) * 2012-02-09 2015-02-17 Altera Corporation Configuring a programmable device using high-level language

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171913A (ja) * 2004-12-13 2006-06-29 Canon Inc 情報処理装置、情報処理方法、ならびにプログラム、記憶媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
GREG STITT ET AL.: "Intermediate Fabrics: Virtual Architectures for Near-Instant FPGA Compilation", IEEE EMBEDDED SYSTEMS LETTERS, vol. 3, no. 3, JPN6017004450, 12 September 2011 (2011-09-12), pages 81 - 84, XP055063469, DOI: doi:10.1109/LES.2011.2167713 *
JAMES COOLE ET AL.: "Intermediate Fabrics: Virtual Architectures for Circuit Portability and Fast Placement and Routing", CODES/ISSS'10 PROCEEDINGS OF THE EIGHTH IEEE/ACM/IFIP INTERNATIONAL CONFERENCE ON HARDWARE/SOFTWARE, JPN7017000453, 24 October 2010 (2010-10-24), pages 13 - 22 *
MUHSEN OWAIDA ET AL.: "Synthesis of Platform Architectures from OpenCL Programs", 2011 IEEE 19TH INTERNATIONAL SYMPOSIUM ON FIELD-PROGRAMMABLE CUSTOM COMPUTING MACHINES [ONLINE], JPN6017004452, 19 May 2011 (2011-05-19), pages 186 - 193, XP031869962, DOI: doi:10.1109/FCCM.2011.19 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016114532A1 (ko) * 2015-01-16 2016-07-21 서울대학교 산학협력단 프로그램 컴파일 장치 및 프로그램 컴파일 방법
KR101737785B1 (ko) * 2015-01-16 2017-05-19 서울대학교산학협력단 프로그램 컴파일 장치 및 프로그램 컴파일 방법
JP2016143044A (ja) * 2015-02-05 2016-08-08 大日本印刷株式会社 太陽電池付き表示体

Also Published As

Publication number Publication date
US20130212366A1 (en) 2013-08-15
JP2018028919A (ja) 2018-02-22
EP2626800B1 (en) 2019-09-11
CN103324511A (zh) 2013-09-25
EP2626800A1 (en) 2013-08-14
JP6527202B2 (ja) 2019-06-05
CN103324511B (zh) 2019-01-08

Similar Documents

Publication Publication Date Title
JP6139160B2 (ja) 高レベル言語を用いるプログラマブルデバイスの構成
JP6527202B2 (ja) 高レベル言語を用いるプログラマブルデバイスの構成
US10033387B2 (en) Method apparatus for high-level programs with general control flow
JP6059413B2 (ja) 再構成可能命令セル・アレイ
Pellauer et al. Buffets: An efficient and composable storage idiom for explicit decoupled data orchestration
JP5045961B2 (ja) 同期回路設計の表現から非同期回路設計の表現へおよび非同期回路設計の表現から同期回路設計の表現への自動変換を実行するためのシステムおよび方法
US8146040B1 (en) Method of evaluating an architecture for an integrated circuit device
US8806403B1 (en) Efficient configuration of an integrated circuit device using high-level language
WO2006046711A1 (ja) 再構成可能な論理回路を有するデータ処理装置
US9298866B1 (en) Method and system for modeling a flip-flop of a user design
Koul et al. Aha: An agile approach to the design of coarse-grained reconfigurable accelerators and compilers
Garrault et al. HDL coding practices to accelerate design performance
Jozwiak et al. Hardware synthesis for reconfigurable heterogeneous pipelined accelerators
Reese et al. A fine-grain Phased Logic CPU
Suvorova et al. System level modeling of dynamic reconfigurable system-on-chip
Dumitriu et al. A framework of embedded reconfigurable systems based on re-locatable virtual components
US10303831B1 (en) Method and apparatus for performing and utilizing source code area annotation
Koch UltraSynth: Integration of a CGRA into a Control Engineering Environment
Lallet et al. xMAML: A modeling language for dynamically reconfigurable architectures
Wilson Overlay Strategies and Optimizations for Rapid FPGA Application Development
Chang Concept of Logic Synthesis
Koster A Parameterizable Processor for Reconfigurable Computing on FPGAs
Lanzagorta et al. FPGA Technology
Oreja et al. Hardware Platform to Test New ISA Extensions
TW200813767A (en) Branching and behavioral partitioning for a VLIW processor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170512

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170605