JP2013165490A - 高レベル言語を用いるプログラマブルデバイスの構成 - Google Patents

高レベル言語を用いるプログラマブルデバイスの構成 Download PDF

Info

Publication number
JP2013165490A
JP2013165490A JP2013022166A JP2013022166A JP2013165490A JP 2013165490 A JP2013165490 A JP 2013165490A JP 2013022166 A JP2013022166 A JP 2013022166A JP 2013022166 A JP2013022166 A JP 2013022166A JP 2013165490 A JP2013165490 A JP 2013165490A
Authority
JP
Japan
Prior art keywords
input
stall
configuration
register
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013022166A
Other languages
English (en)
Other versions
JP6139160B2 (ja
Inventor
Tzu-Lang Chen Doris
ツー−ラン チェン ドリス
Singh Deshanand
シング デシャナンド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Altera Corp
Original Assignee
Altera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Altera Corp filed Critical Altera Corp
Publication of JP2013165490A publication Critical patent/JP2013165490A/ja
Application granted granted Critical
Publication of JP6139160B2 publication Critical patent/JP6139160B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/34Circuit design for reconfigurable circuits, e.g. field programmable gate arrays [FPGA] or programmable logic devices [PLD]
    • G06F30/347Physical level, e.g. placement or routing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/32Circuit design at the digital level
    • G06F30/327Logic synthesis; Behaviour synthesis, e.g. mapping logic, HDL to netlist, high-level language to RTL or netlist
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/34Circuit design for reconfigurable circuits, e.g. field programmable gate arrays [FPGA] or programmable logic devices [PLD]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/39Circuit design at the physical level
    • G06F30/394Routing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/39Circuit design at the physical level
    • G06F30/398Design verification or optimisation, e.g. using design rule check [DRC], layout versus schematics [LVS] or finite element methods [FEM]
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03KPULSE TECHNIQUE
    • H03K19/00Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits
    • H03K19/02Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components
    • H03K19/173Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components
    • H03K19/177Logic circuits, i.e. having at least two inputs acting on one output; Inverting circuits using specified components using elementary logic circuits as components arranged in matrix form
    • H03K19/17736Structural details of routing resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0806Configuration setting for initial configuration or provisioning, e.g. plug-and-play
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/35Switches specially adapted for specific applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2115/00Details relating to the type of the circuit
    • G06F2115/08Intellectual property [IP] blocks or IP cores
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/06Power analysis or power optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/30Circuit design
    • G06F30/39Circuit design at the physical level

Abstract

【課題】高レベル言語を用いてプログラマブルデバイスを構成する方法を提供すること。
【解決手段】上記方法は、高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることを含み、コンパイルすることは、プログラマブル集積回路デバイスのプログラマブルリソースから構成可能なルーティングリソースの構成をコンパイルすることと、プログラマブル集積回路デバイスのプログラマブルリソースから複数の複雑な機能ブロックの構成をコンパイルすることとを含む。
【選択図】図8

Description

(発明の分野)
本発明は、プログラマブル集積回路デバイス(例えば、フィールドプログラマブルゲートアレイ(FPGA)または他のタイプのプログラマブル論理デバイス(PLD))を構成するための高レベル言語の使用に関する。
(発明の背景)
初期のプログラマブルデバイスは、1回のみ構成可能であった。例えば、構成は、可溶性リンクを「ブローイング(blowing)」する(すなわち、開放する)ことによって達成された場合がある。代替的に、構成は、プログラマブル読み取り専用メモリに格納された場合がある。それらのデバイスは、概して、「積和」(またはP−TERM)論理動作に対してデバイスを構成する能力をユーザーに提供した。最近、構成に対して消去可能なプログラマブル読み取り専用メモリ(EPROM)を組み込むプログラマブル論理デバイスが利用可能になり、デバイスが再構成されることを可能にした。
なお最近、構成に対して静的ランダムアクセスメモリ(SRAM)要素を組み込むプログラマブルデバイスが利用可能になっている。同様に再構成され得るこれらのデバイスは、それらの構成を不揮発性メモリ(例えば、EPROM)に格納し、デバイスが電力をオンにされる場合、構成が不揮発性メモリからSRAM要素内にロードされる。これらのデバイスは、概してルックアップテーブルタイプの論理デバイスに対してデバイスを構成する能力をユーザーに提供する。
ある時点で、このようなデバイスは、ランダムアクセスメモリ、読み取り専用メモリ、または論理(例えば、P−TERM論理)として動作するために、ユーザーによって構成され得るランダムアクセスメモリの内蔵型ブロックを提供され始めた。さらに、プログラマブルデバイスがより大きくなってきているので、さまざまな一般的に使用される機能に対してプログラマブルデバイスに専用の回路を追加することはより一般的になってきている。その専用の回路は、クロック生成のための位相ロックループまたは遅延ロックループも、さまざまな数学的動作(例えば、加算、乗算)のためのさまざまな回路も含み得る。これは、利用可能な汎用プログラマブル論理を構成することによって、ユーザーを、同等回路を作らなければならないことから助ける。
さまざまな要素がどこに展開されるべきかを考えて決定することによって、手動で簡単に初期のプログラマブル論理デバイスを構成することが可能であったであろうが、たとえそのような以前のデバイスに関しても、ユーザーが必要に応じて論理を展開し、そしてその論理をプログラマブルデバイスのための構成に翻訳することを可能にするプログラミングソフトウェアを提供することは一般的であった。より大きな電流のデバイス(上述した専用の回路網を有するそのようなデバイスを含む)の場合、そのようなソフトウェアなしに、論理を展開しようとすることは、非現実であろう。現在、そのようなソフトウェアは、一般的に、ある一般的に使用される構造を構成するために、特に、上述した専用の回路を組み込む、数学的動作のための回路を構成するために、一般的に「コア」と呼ばれる所定の機能も含む。例えば、コアは、さまざまな三角関数または代数関数を提供され得る。
利用可能なプログラミングソフトウェアは、ユーザーがプログラムされるデバイスの能力内にほとんどの所望の論理設計を実装することを可能にするが、ほとんどのこのようなソフトウェアは、ハードウェア記述言語の知識(例えば、VHDLまたはVerilog)を必要とする。しかしながら、プログラマブルデバイスの多くの潜在的ユーザーは、ハードウェア記述言語に精通しておらず、より高レベルのプログラミング言語を用いてデバイスをプログラムすることを望む場合がある。
(発明の要約)
プログラマブルデバイスを構成するために適合され得る1つの高レベルプログラミング言語は、OpenCL(Open Computing Language)であるが、他の高レベル言語、特に、C、C++、Fortran、C#、F#、BlueSpecおよびMatlabを含む他の高レベル合成言語の使用も本発明の範囲内にある。
OpenCLにおいて、計算は、ホストおよびカーネルの組み合わせを用いて行われ、そこで、ホストは、入力/出力(I/O)およびセットアップタスクを担い、カーネルは、独立した入力で計算を行う。カーネルの明確なデクラレイションがあり、処理されるべき各組の要素が、独立であることが既知である場合、各カーネルは、高性能ハードウェア回路として実装され得る。プログラマブルデバイス(例えば、FPGA)における利用可能な空間の量に基づいて、カーネルは、アプリケーションの性能を向上させるために反復され得る。
カーネルコンパイラは、カーネルを、ハード生成器、システム集積を通じてOpenCLからのアプリケーションを実装し、かつ、ホストコンピュータとインターフェース接続するハードウェア回路に変換する。コンパイラは、OpenCLアプリケーションのコンパイルを可能にするために拡張される開放ソース低レベル仮想機械コンパイラに基づき得る。コンパイラは、OpenCLカーネルを構文解析し、分析し、最適化し、プログラマブルデバイス(例えば、FPGA)における実装に適している高性能のパイプライン化された回路として実装する。次に、システムは、特定のプログラマブルデバイスに対する適切なプログラミングツールを用いてコンパイルされ得る。デバイスは、OpenCL(または他の高レベル)コードを動作させるために、内蔵型ハードプロセッサも有するか、または内蔵型ソフトプロセッサ用いて構成され得るか、または外部のプロセッサが使用され得る。OpenCLまたは他の高レベルコードは、内蔵型または外部のプロセッサでホストプログラムを実行することによって動作され得る。
本発明に従って、高レベル言語を用いてプログラマブル集積回路デバイスを構成のために準備する方法が提供される。方法は、該高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることを含む。そのコンパイルすることは、該プログラマブル集積回路デバイスのプログラマブルリソースから構成可能なルーティングリソースの構成をコンパイルすることと、該プログラマブル集積回路デバイスのプログラマブルリソースから複数の複雑な機能ブロックの構成をコンパイルすることとを含む。
このようなコンパイルされた構成のライブラリを用いて符号化された機械読み取り可能なデータ格納媒体も提供され、仮想プログラマブルデバイスまたは任意のプログラマブルデバイスにおいて使用され得るルーティングスイッチが同様に提供される。
例えば、本発明は以下の項目を提供する。
(項目1)
高レベル言語を用いてプログラマブル集積回路デバイスを構成のために準備する方法であって、該方法は、
該高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることを含み、該コンパイルすることは、
該プログラマブル集積回路デバイスのプログラマブルリソースから構成可能なルーティングリソースの構成をコンパイルすることと、
該プログラマブル集積回路デバイスのプログラマブルリソースから複数の複雑な機能ブロックの構成をコンパイルすることと
を含む、方法。
(項目2)
上記高レベル言語は、OpenCLである、上記項目に記載の方法。
(項目3)
上記構成可能なルーティングリソースの構成をコンパイルすることは、パイプライン化されたストール信号ネットワークをコンパイルすることを含む、上記項目のいずれかに記載の方法。
(項目4)
上記パイプライン化されたストール信号ネットワークをコンパイルすることは、両方の方向でパイプライン化されている双方向性ストール信号ネットワークをコンパイルすることを含む、上記項目のいずれかに記載の方法。
(項目5)
上記パイプライン化されたストール信号ネットワークをコンパイルすることは、複数のルーティングスイッチを含むネットワークをコンパイルすることを含み、該複数のルーティングスイッチの各々は、
入力および少なくとも1つの出力と、
該入力および該少なくとも1つの出力の各々のストール信号のためのそれぞれのレジスタと、
該少なくとも1つの出力のうちのいずれかのストールの間に、出力データを格納する出力データストールレジスタと、
該入力のストールの前に、該入力において受信されたデータを格納する第1の入力データストールレジスタと、
該入力がストールする場合、該入力において存在するデータを格納する第2の入力データストールレジスタと
を有する、上記項目のいずれかに記載の方法。
(項目6)
上記複数の複雑な機能ブロックは、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つを含む、上記項目のいずれかに記載の方法。
(項目7)
上記構成可能なルーティングリソースのバランスを保つために、上記複数の複雑な機能ブロックのうちの少なくとも1つの複雑な機能ブロックに対して入力レジスタを構成することを含む、上記項目のいずれかに記載の方法。
(項目8)
上記入力レジスタを構成することは、上記複数の複雑な機能ブロックのうちの上記少なくとも1つの複雑な機能ブロックの少なくとも1つの入力においてそれぞれのFIFOを構成することを含む、上記項目のいずれかに記載の方法。
(項目9)
上記入力レジスタを構成することは、上記複数の複雑な機能ブロックの各複雑な機能ブロックの各入力においてそれぞれのFIFOを構成することを含む、上記項目のいずれかに記載の方法。
(項目10)
上記それぞれのFIFOを構成することは、それぞれの最大予期されたパイプラインアンバランスに等しいそれぞれの深さを有するそれぞれのFIFOを構成することを含む、上記項目のいずれかに記載の方法。
(項目11)
上記複数の仮想プログラマブルデバイスをコンパイルすることは、動作中に再構成可能である少なくとも1つの仮想プログラマブルデバイスをコンパイルすることを含む、上記項目のいずれかに記載の方法。
(項目12)
プログラマブル集積回路デバイスに対する複数のコンパイルされた構成を用いて符号化された不揮発性機械読み取り可能な格納媒体であって、該複数のコンパイルされた構成の各々は、プロセッサに高レベル合成言語を実行することによって該プログラマブル集積回路デバイス上にそれぞれの仮想プログラマブルデバイスのインスタンスを作成させ、該各それぞれの仮想プログラマブルデバイスは、
それぞれのルーティングリソース構成と、
複数の複雑な機能ブロックのための構成と
を含む、不揮発性機械読み取り可能な格納媒体。
(項目13)
各それぞれのルーティングリソース構成は、パイプライン化されたストール信号ネットワークのインスタンスを作成する、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目14)
各それぞれのルーティングリソース構成は、両方の方向でパイプライン化されている双方向性ストール信号ネットワークのインスタンスを作成する、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目15)
各それぞれのルーティングリソース構成は、複数のルーティングスイッチを含むパイプライン化されたストール信号ネットワークのインスタンスを作成し、該複数のルーティングスイッチの各々は、
入力および少なくとも1つの出力と、
該入力および該少なくとも1つの出力の各々のストール信号のためのそれぞれのレジスタと、
該少なくとも1つの出力のうちのいずれかのストール中に、出力データを格納する出力データストールレジスタと、
該入力のストールの前に、該入力において受信されたデータを格納する第1の入力データストールレジスタと、
該入力がストールする場合、該入力において存在するデータを格納する第2の入力データストールレジスタと
を有する、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目16)
上記複数の複雑な機能ブロックのための構成は、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つのための構成を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目17)
上記複数の複雑な機能ブロックのための構成は、上記構成可能なルーティングリソースのバランスを保つために、該複数の複雑な機能ブロックのうちの少なくとも1つの複雑な機能ブロックに対する入力レジスタのための構成を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目18)
上記入力レジスタのための構成は、上記複数の複雑な機能ブロックのうちの上記少なくとも1つの複雑な機能ブロックの少なくとも1つの入力におけるそれぞれのFIFOのための構成を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目19)
上記入力レジスタのための構成は、上記複数の複雑な機能ブロックの各々の各入力におけるそれぞれのFIFのための構成を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目20)
上記それぞれのFIFOのための構成は、それぞれの最大予期されたパイプラインアンバランスに等しいそれぞれの深さを有するそれぞれのFIFOのための構成を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目21)
複数の仮想プログラマブルデバイスのための上記複数のコンパイルされた構成は、動作中に再構成可能である仮想プログラマブルデバイスのための少なくとも1つのコンパイルされた構成を含む、上記項目のいずれかに記載の不揮発性機械読み取り可能な格納媒体。
(項目22)
ストール信号が信号のフローを制御するネットワークにおいて用いるルーティングスイッチであって、該ルーティングスイッチは、
該ネットワークの他の所からデータを受信する入力と、
データが該ネットワークの他の所から該入力へ伝搬されることを防ぐために、入力ストール信号を伝搬する入力ストール信号出力と、
データを該ネットワークの他の位置のそれぞれに伝搬する複数のそれぞれの出力と、
該それぞれの出力がデータを該他の位置のうちのそれぞれの1つに伝搬することを防ぐために、該他の位置のうちの該それぞれの1つからそれぞれの出力ストール信号を受信する、該それぞれの出力の各々に関連付けられたそれぞれの出力ストール信号入力と
含む、ルーティングスイッチ。
(項目23)
上記入力ストール信号のための入力ストール信号レジスタと、
上記それぞれの出力ストール信号の各々のためのそれぞれの出力ストール信号レジスタと
をさらに含む、上記項目のいずれかに記載のルーティングスイッチ。
(項目24)
上記出力ストール信号のうちの1つのアサーションの前に受信されたデータが伝搬されることが可能になるまで、該出力ストール信号のうちの該1つのアサーションの前に該受信されたデータを保持する入力データレジスタをさらに含む、上記項目のいずれかに記載のルーティングスイッチ。
(摘要)
高レベル言語を用いてプログラマブル集積回路デバイスを構成のために準備する方法は、該高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることを含む。そのコンパイルすることは、該プログラマブル集積回路デバイスのプログラマブルリソースから構成可能なルーティングリソースの構成をコンパイルすることと、該プログラマブル集積回路デバイスのプログラマブルリソースから複数の複雑な機能ブロックの構成をコンパイルすることとを含む。機械読み取り可能なデータ格納媒体は、このようなコンパイルされた構成のライブラリを用いて符号化され得る。仮想プログラマブルデバイスは、ストール信号ネットワークを含み得、仮想プログラマブルデバイスのルーティングスイッチは、ストール信号入力および出力を含み得る。
本発明のさらなる特徴、その特性およびさまざまな利点は、添付の図面に関連して以下の詳細な説明を考慮した上で明白になる。図面において、同様な参照文字は、本明細書を通じて同様な部分を指す。
図1は、プログラマブルデバイスを構成するために、高レベル言語を用いる既知の方法を示す。 図2は、本発明の実施形態に従う基本的な仮想ファブリックの例を示す。 図3は、本発明の実施形態に従うより数学的に複雑な仮想ファブリックの例を示す。 図4は、ソフトマイクロプロセッサブロックを含む、本発明の実施形態に従う仮想ファブリックの例を示す。 図5は、本発明の実施形態に従う方法を含む方法において使用される制御データフローグラフを示す。 図6は、本発明の実施形態に従う仮想ファブリックにおいて構成される仮想ルーティングスイッチの例を示す。 図7は、本発明の実施形態に従う仮想ファブリックにおいて構成される仮想FIFOを有する機能ブロックの例を示す。 図8は、プログラマブルデバイスを構成するために、仮想ファブリックのライブラリを用いる、本発明の実施形態に従う方法の実施形態のフローダイヤグラムを示す。 図9は、プログラマブルデバイスを構成するために、仮想ファブリックのライブラリを用いる、本発明の実施形態に従う別の方法の実施形態のフローダイヤグラムを示す。 図10は、本発明に従う方法を行う1組の機械的実行可能な命令を用いて符号化される磁気データ格納媒体の断面図である。 図11は、本発明に従う方法を行う1組の機械的実行可能な命令を用いて符号化される光学的に読み取り可能なデータ格納媒体の断面図である。 図12は、本発明を組み込むプログラマブル論理デバイスを使用する例示的なシステムの簡単化されたブロックダイヤグラムである。
OpenCLにおいて、アプリケーションが、2つの部分(ホストおよびカーネル)で実行される。ホストは、I/Oリクエストを処理することおよび並列処理のためにデータをセットアップすることを担うプログラムである。ホストがデータを処理する準備ができた場合、ホストは、カーネル上の1組のスレッドを起動し得る。カーネルは、各スレッドによって行われるべき計算のユニットを表す。
各スレッドは、ホストによって特定されるメモリからデータをロードし、そのデータを処理し、そしてユーザーまたはユーザーのアプリケーションによって読み込まれるために、メモリに結果を再格納することによってカーネル計算を実行する。OpenCLテクノロジーにおいて、カーネルおよびその上でカーネルが実行しているデータが、スレッドとして考えられる。結果は、一度にスレッドのグループに対して計算され得る。スレッドは、ワークグループ内にグループ化され得、これは、データがワークグループの中のスレッド間に共用されることを可能にする。普通は、ワークグループの中のスレッドの実行の順序に対して制約は課されない。
データ格納および処理の目的のために、各カーネルは、1つより多いタイプのメモリ、例えば、全てのスレッドによって共用されるグローバルメモリ、同じワークグループのスレッドによって共用されるメモリ、および単一のスレッドのみによって使用されるプライベートメモリへのアクセスを有し得る。
OpenCLアプリケーションの実行は、ホストプログラムにおいて部分的に、かつ1つ以上のカーネルを実行することによって部分的に発生し得る。例えば、ベクトル加算において、ベクトルを表すデータアレイは、ホストプログラムを用いてセットアップされ得るが、実際の加算は、1つ以上のカーネルを用いて行われ得る。アプリケーションのこの2つの部分間の通信は、ホストプログラムの中の1組のOpenCL機能によって容易にされ得る。これらの機能は、ホストとカーネルとの間のインターフェースを規定し、ホストプログラムが、どのデータが処理されるか、その処理がいつ開始するかを制御し、処理がいつ完了されたかを検出することを可能にする。
プログラマブルデバイス(例えば、FPGA)は、1組のカーネルおよびホストプログラムから開始することによって、高レベル言語(例えば、OpenCL)を用いてプログラムされ得る。カーネルは、この目的のために拡張され得る低レベル仮想機械(LLVM)コンパイラを用いてハード回路表示内にコンパイルされる。コンパイル処理は、各カーネルのための中間表示を生成する高レベルパーサー(例えば、C言語パーサー)から開始する。中間表示は、命令および命令間の依存関係の形態であり得る。次に、この表示は、標的プログラマブルデバイスに対して最適化され得る。
最適化されたLLVM中間表示は、次に、ハードウェア指向のデータ構造(例えば、制御データフローグラフ(Flow Graph)(CDFG)(図5)へ変換される。このデータ構造は、低レベルでカーネルを表し、そのエリアおよび最大のクロック周波数についての情報を含む。次に、CDFGは、各カーネルのVerilog HDL記述を生成するRTL生成の前に、システムのエリアおよび性能を向上させるために最適化され得る。
次に、コンパイルされたカーネルは、好ましくは、ホストへのインターフェースもメモリインターフェースも含むシステムにおいてインスタンスを作成される。ホストインターフェースは、ホストプログラムが各カーネルにアクセスすることを可能にする。これは、リモートでワークスペースのパラメータおよびカーネルの引数を設定することを可能にする。メモリは、OpenCLカーネルのためのグローバルメモリスペースとして機能する。このメモリは、ホストインターフェースを介してアクセスされ得、ホストプログラムが計算結果を処理し、読み出すために、カーネルに対してデータを設定することを可能にする。最後、ホストプログラムは、書き込まれる高レベル言語(例えば、C++)のためのレギュラーコンパイラを用いてコンパイルされ得る。
処理の個々の部分に戻ると、カーネルをハードウェア回路にコンパイルするために、各カーネルは、基本ブロックモジュールから実装される。各基本ブロックモジュールは、入力と出力インターフェースとを含み、出力インターフェースを用いて他の基本ブロックとトークし、かつ、ロード、加算、減算、格納等のような命令を実装する。
各カーネルをハードウェア回路として実装することにおける次のステップは、各基本ブロックモジュールをハードウェアモジュールに変換することである。各基本ブロックモジュールは、その内部の動作を扱うことを担う。適切に機能するために、基本ブロックモジュールは、他の基本ブロックと情報を交換することもできるべきである。基本ブロックモジュールがどのようなデータを必要とし、生成するかを決定することは、ライブ可変(Live−Variable)分析を用いて完成され得る。
一旦各基本ブロックが分析されると、制御データフローグラフ(CDFG)(図5)が、その基本ブロックモジュールの動作を表すように生成され得、CDFGは、ライブ可変分析の結果に基づいて、その基本ブロックモジュールがカーネルの引数かまたは別の基本ブロックからどのように入力を取り込むかを示す。一旦インスタンスを作成されると、各基本ブロックは、ブロック内に含まれる命令に従ってデータを処理し、他の基本ブロックによって、または直接にユーザーによって読み込まれ得る出力を生成する。
一旦各基本ブロックモジュールがCDFGとして表されると、ブロック内部の動作がスケジュール化され得る。各ノードは、動作を完成させるために必要とする1組のレジスタおよびクロックサイクルを割り当てられ得る。例えば、AND動作は、レジスタを必要としない場合があるが、浮動小数点の加算は、少なくとも7つのクロックサイクルおよび対応するレジスタを必要とし得る。一旦各基本ブロックがスケジュール化されると、パイプライン方式のレジスタが、CDFGを通じて、各経路の待ち時間のバランスを保つために挿入され得る。これは、多くのスレッドが処理されることを可能にする。
一旦各カーネルがハードウェア回路として記述されると、設計が生成され得、設計は、カーネル、メモリ、およびホストプラットフォームへのインターフェースを含む。パイプラインオーバーロードを防止するために、ワークグループ内に許可されるスレッドの数、および同時にカーネル内に許可されるワークグループの数が制限され得る。
上記の一般化された方法100が図1においてダイヤグラム化されている。図1において、経路101は、カーネルの実装を示すが、経路102は、ホストプログラムの実装を示す。
経路101は、カーネルファイル(kernel.cl)111から開始する。パーサーフロントエンド(front end)121は、カーネルファイル111から最適化されていない中間表示131を引き出し、最適化されていない中間表示131は、オプチマイザ(optimizer)141によって最適化された中間表示151に変換される。最適化処理は、コードをより効率的にするためのコンパイラ技術(例えば、ループ展開、メモリ−レジスタ変換、デッドコード削除等)を含む。レジスタタイミング言語「RTL」161生成器は、最適化された中間表示151をハードウェア記述言語表示171に変換し、ハードウェア記述言語表示171は、任意のハードウェア記述言語(例えば、Verlog(示された)またはVHDL)で書き込まれる。
経路102は、ホストプログラムファイル(host.c)112から開始し、ホストプログラムファイル112は、実行可能なプログラムファイル142を生成するために、ランタイムライブラリ132を用いてコンパイラ122によってコンパイルされ、ランタイムライブラリ132は、ホストとプログラマブルデバイスとの間の通信を抽象化するソフトウェアルーティンを含む。
実行可能なプログラムファイル142と、カーネルのハードウェア記述言語表示171とは、適切なソフトウェア103によってプログラマブルデバイス構成にコンパイルされる。例えば、Altera Corporation(San Jose,California)からの市販されているFPGAデバイスに対して、ソフトウェア103は、Alteraによって提供されるQUARTUS(登録商標)IIソフトウェアであり得る。
結果は、カーネルによって表される回路のインスタンスを作成するために、カーネルファイル上でホストプログラムを実行するように構成されたプログラマブルデバイスである。プログラマブルデバイスは、ハードウェア記述言語表示161を生成するために、カーネル111を実行するように、プログラムファイル142を実行するための内蔵型プロセッサを有するべきである。内蔵型プロセッサが、「ソフト」プロセッサである場合、内蔵型プロセッサも、ソフトウェア103を用いて構成され得る。内蔵型プロセッサが「ハード」プロセッサである場合、ソフトウェア103は、ハードプロセッサへの適切な接続を構成する。
上記の一般化された方法は、高レベル言語(例えば、OpenCL)を用いてユーザー論理設計の効率的ハードウェア回路実装を生成するために使用され得るが、必要とされるコンパイル時間が、従来のハードウェア記述言語ベースのプログラミングに対して必要とされるコンパイル時間に匹敵し得ることが望ましくない。特定のユーザー論理設計に応じて、コンパイルは、HDLベースのプログラミングに対する数秒または数分と比べて、数時間または数日さえもかかり得る。長いコンパイル時間の問題は、特に開発の中に、論理設計を周期的に変える必要によって拡大され得る。
それゆえ、本発明に従って、複数の「仮想ファブリック」の高レベル言語表示が事前にコンパイルされ得る。各このような仮想ファブリック200(図2)は、バス211およびルーティングスイッチ221の相互接続ネットワーク201と、論理要素の組み合わせを表す比較的に少数のより複雑な機能ブロック202とを含む粗粒の仮想FPGAの高レベル言語表示であり得、機能ブロック202は、比較的により多数の個々の論理要素を有する物理的FPGAの上に実装される。例えば、機能ブロック202は、基本的な数学関数(例えば、固定または浮動小数点の加算または乗算、または三角関数)を行うブロックと、多重化論理または「ソフト」マイクロプロセッサとを含み得る。
複数の仮想ファブリックは、仮想ファブリックのライブラリとして考えられ得る。ライブラリの中の異なる仮想ファブリックは、異なるタイプの機能ブロックの異なる分配を有し得る。例えば、ライブラリは、ファブリック200が単に1つの実施例である複数の異なる基本仮想ファブリックを含み得、基本仮想ファブリックの各々は、多重化論理と共に基本的な数学関数を含む機能ブロック202の異なる分配を有する。ファブリック300(図3)が単に1つの実施例であるいくつかの複雑な仮想ファブリックもあり得、ファブリック300が、基本的および多重化機能202を有するが、ファブリック300において、機能ブロック301は、より複雑な関数(例えば、三角関数)を行うものである。それらのより複雑な仮想ファブリックのうちの異なるもの間において、さまざまな算数関数、三角関数および多重化機能の数および分配が変えられ得る。ファブリック400(図4)が単に1つの実施例である仮想ファブリックさえもあり得、ファブリック400は、1つ以上の機能ブロックがソフトプロセッサブロック401によって置換されていること以外、ファブリック200またはファブリック300に類似し得る。さらなるタイプの仮想ファブリックも提供され得る。
仮想ファブリックをある程度までパイプライン化することによって仮想ファブリックの性能を加速することが望ましい場合がある。例えば、レジスタステージが、仮想ルーティングスイッチにおいて提供され得、レジスタステージの各々は、レジスタにつながる多重器として考えられ得る。パイプラインにおける任意の要素は、好ましくは、ストール信号アップストリームを送信することによって、パイプラインをストールする(すなわち、より多く受け取る準備ができるまでデータのフローを停止する)能力を有する。そうでなければ、ダウンストリーム要素がビジーすぎてデータを処理できない間にアップストリーム要素がデータを送信し続ける場合、データが失われる。
しかしながら、要素がストール信号アップストリームを送信する場合、信号が1クロックサイクル遅れて到達する場合があり、その結果、1つのクロックサイクルに相当するデータが失われ得る。それゆえ、ストール信号は、好ましくは、それ自身パイプライン化され、それによって、仮想ファブリック内にパイプライン化されるストール信号ネットワークを提供する。これは、一部または全てのルーティングスイッチにおいてレジスタにストール信号を提供することによって達成され得る。次に、ストールされたコンポーネントからストール信号を送信することに代わって、ストール信号は、レジスタから送信され得る。
一実施例が図6に示される。図6の全てのコンポーネントは、仮想であり、すなわち、それらは、下部FPGAの基本要素、または仮想ファブリックのコンパイルの一部分のような他の構成可能またはプログラム可能なデバイスから構成される。
図6は、ルーティングスイッチ600の1つの可能で詳細な実装のダイヤグラムであり、ルーティングスイッチ600において、信号は、601において「west」から入り、602において「north」へ、603において「south」へ、または604において「east」へルーティング可能である。ルーティングスイッチ600は、605においてアップストリームにストール信号を返送することが可能である必要があるが、606においてnorthから、607においてsouthから、および608においてeastからストール信号を受信する。
仮想ルーティングスイッチ600は、入力多重器611と、north、southおよびeast出力のそれぞれにおける出力多重器612、613および614とを含む。このようなルーティングスイッチは、入力が到達する方向でストール信号605を返送する必要があり得るが、3つの出力方向のうちの任意の1つからストール信号606、607、608を受信する必要もあり得る。本発明の実施形態に従って、ストール信号レジスタ615が、ストール信号605を出力するために提供され得、ストール信号レジスタ616、617、618が、受信されるストール信号606、607、608を登録するために提供され得る。ストール信号レジスタ615,616、617、618は、パイプライン化されるストール信号がアップストリームおよびダウンストリームの両方へ完全に伝搬することを可能にする。
レジスタ609、610が、入力データを提供される。レジスタ609は、ストールがダウンストリームから受信されているため、さらに伝搬することができないデータをキャプチャーする。データが伝搬されるべき出力方向602、603、604のうちの任意の1つがストールされる場合、それらのデータが、ストールが消去されるまでにレジスタ609において保持される。レジスタ610は、入力データをキャプチャーし、かつ、ストール信号605がアサートされなければならない場合にそれらのデータが失われることを防ぐ。レジスタ610がない場合、上述した1つのクロックの遅延のため、新しいデータは、ストール信号605のアサーション後の最初のクロックサイクルで多重器611において受信され得、たとえ事前に受信されたデータがダウンストリームへ伝搬されていなくても、多重器611において任意の事前に受信されたデータを置換し得る。しかしながら、レジスタ610がある場合、たとえ追加のデータが多重器611において後に受信されても、多重器611において事前に受信されたデータが保存される。構成レジスタ626、627、628は、ストール信号を受信するための能力をオンまたはオフにするために提供され得る。構成レジスタ629は、多重器611へ、従って仮想ルーティングスイッチ600への入力を選択する。構成レジスタ630、631、632は、仮想ルーティングスイッチ600の1つ以上の出力を選択するように出力多重器612、613、614を制御する。
前述のストール信号ネットワークのパイプライン方式に加えて、仮想ファブリックのパイプライン方式も、仮想ファブリックの個々の機能ブロック202、301、401の入力におけるデータ自身のためのレジスタを含み得る。パイプライン化されるデータ経路の長さが、仮想ファブリックの生成時において未知であり、かつ、同じ機能ブロックに対する異なるデータ経路が、特定のユーザー設計において実装される場合、それらは異なり得るので、各機能ブロック202、301、401の入力においてデータパイプラインレジスタは、好ましくは、パイプラインのバランスを保つために、図7に示されるFIFO701である。
各FIFO701の深さは、最大予期されたパイプラインのアンバランスに基づいて選択され得る。しかしながら、FIFO701は満杯になる場合があり、従って各FIFO701は、満杯のときにストール信号702をアサートする能力を有することが可能である。
同様に、各FIFO701は、機能ブロック202、301、401が利用不能のときにデータを読み込もうとしないように、空(empty)信号703をアサートして、機能ブロック202、301、401をストールする能力も有し得る。そうでなければ、機能ブロック202、301、401へのさまざまな入力は、同期から外れ得る(すなわち、機能ブロック202、301、401は、1つのパイプライン上のデータがまだ到達していないときに、2つ以上のパイプラインからデータを読み込む)。
本発明の別の局面に従って、プログラマブルデバイスは、事前にコンパイルされた仮想ファブリックのライブラリまたは集合の中から選択することによって構成され得る。特定の仮想ファブリックの選択は、ユーザーの論理設計の機能的ニーズを検査し、仮想機能ブロックの数およびタイプに関してその機能的ニーズに最もよくマッチする仮想ファブリックを選択することによって、プログラミングソフトウェアで実行され得る。その仮想ファブリックは、オンボードハードプロセッサ、仮想ファブリックの選択の前、後または間にオンボードで構成されるソフトプロセッサ、または外部のプロセッサによってデバイス上で実行される。選択された仮想ファブリックの実行は、デバイスを粗粒の仮想デバイスとして構成する。次に、従来の合成、配置およびルーティングツールは、ユーザーの論理設計を用いてその粗粒の仮想デバイスを構成するために使用され得る。
図8にダイヤグラム化されたプロセッサ800の実施形態は、前述のようなさまざまなタイプの機能ブロックの異なるサイズおよび異なる分配を有するコンパイルされた仮想ファブリックの集合の生成を有するステップ801において開始し得る。ステップ801は、デバイス製造者によって行われ得、仮想ファブリックのライブラリは、デバイス上のメモリ、またはデバイスに提供されたデバイス構成ソフトウェアに関連付けられた格納デバイスまたは媒体に提供され得る。第3者も、コンパイルされた仮想ファブリックのライブラリを提供し得る。代替的に、ユーザーは、デバイスが始めて構成されるときに仮想ファブリックのライブラリをコンパイルし得る。
ユーザー自身の仮想ファブリックのライブラリをコンパイルしたユーザーのために、処理800は、ステップ803において続く。仮想ファブリックの事前にコンパイルされたライブラリ(デバイスの事前構成中に、製造者、第3者、または、ユーザーによって提供される)を用いるユーザーに対して、ユーザーは、802において処理800に入り、ステップ803へ進む。
ステップ803において、ユーザーは、前述のような高レベル言語ステートメント(例えば、OpenCLステートメント)の形態で所望の構成を入力し、1組のカーネルを規定する。前述のように、ステップ804において、カーネルは、各カーネルに対して中間表示を生成する高レベルパーサー(例えば、C言語パーサー)を用いて構文解析される。中間表示は、命令および命令間の依存関係の形態であり得る。次に、ステップ805において、この表示は、最適化され、ハードウェア指向のデータ構造(例えば、制御データフローグラフ(CDFG))に変換され得る。
ステップ806において、CDFGは、そのハードウェアニーズを確定するために、プログラミングソフトウェアによって検査され、次に、ソフトウェアは、仮想ファブリックのライブラリの中から、そのハードウェアニーズに合う仮想ファブリックを選択する。既知の技術を用いて、ソフトウェアは、最もよい仮想ファブリックを見つけるために、全ての仮想ファブリックを検査し得るか、または、検査は、ハードウェアニーズに十分に近い仮想ファブリックが見つかれば、終了し得る。この文脈において、「十分に近い」は、全ての必要とされるリソースが仮想ファブリックの中に存在するが、仮想ファブリックが使用されないことがある追加のリソースを有し得ることを意味する。
最後、ステップ807において、ユーザーの論理設計は、従来の合成、配置およびルーティング技術(例えば、Altera Corporationからの前述した市販のQUARTUS(登録商標)IIソフトウェアによって実装され得る技術)を用いて、CDFGから選択された仮想ファブリック上でプログラムされる。もしデバイスが内蔵型ハードプロセッサを含むことも、外部のハードプロセッサが仮想ファブリックを実行するために使用されるべきでもなければ、このステップは、仮想ファブリックを実行するために、ソフトプロセッサを構成することを含み得る。
特定のユーザー設計は、多数の機能を含み得るが、その機能の全てが同時にアクティブにならない。本明細書に説明される仮想ファブリックが、比較的に粗いので、その仮想ファブリックは、比較的に少数の構成ビットを有する。それゆえ、ランタイムで仮想ファブリックの構成を可能にすることは、(実行時間の観点から)非現実であり得る。従って、仮想ファブリックは、第1のグループの機能を含む第1の構成で構成され得、次に、「オンザフライ(on the fly)」は、第2のグループの機能を用いて再構成され得る(第2のグループの機能は、第1のグループの機能と重なり得、すなわち、第2のグループの機能は、第1のグループの機能と同じようないくつかの機能を有し得る)。
このような再構成を用いるためにデバイスをプログラムする方法850が図9に示される。方法850は、方法800と同様に開始し、ステップ801,802、803、804および805を有する。ステップ856において、CDFGは、そのハードウェアニーズを確定するために検査され、次に、ソフトウェアは、仮想ファブリックのライブラリの中から、2つ以上の別個の構成においてそのハードウェアニーズに合い得る仮想ファブリックを選択する。例えば、どの仮想ファブリックを使用すべきかを決定する1つの方法は、仮想ファブリックがどの程度カーネルのリソースニーズと似ているかを計算するコスト機能を使用することであり得る。
ステップ857において、2つ以上の別個の構成は、従来の合成、配置およびルーティング技術(例えば、前述したQUARTUS(登録商標)IIソフトウェアによって実装され得る技術)を用いてプログラムされる。さまざまな構成に対する構成ビットストリームが、ステップ858において格納され、仮想ファブリックは、第1の構成を用いてステップ859において構成される。必要な場合(テスト860、861)、その構成は、ステップ862においてアンロードされ得、2つ以上の構成のうちの別の構成が、ステップ863においてロードされ得る。新しい構成が実行される場合、方法は、ステップ859に戻る。これは、デバイスの所望の機能が完成されるまで、2つ以上の構成のうちの異なる構成がアンロードおよび再ロードされるように、1回より多く発生し得る。
選択された仮想ファブリックが前述された再構成処理中に変更されないので、再構成処理は、物理的デバイスが再構成をオンザフライでサポートするか否かに関わらずに使用され得ることが認識される。仮想ファブリックによって表される仮想デバイスが再構成をオンザフライでサポートすることのみが必要である。物理的デバイスが再構成をオンザフライでサポートする場合、選択された仮想ファブリックの構成がランタイムで変更されることが可能であるだけではなく、仮想ファブリック自身も、(前述のように、必要な場合、ロードされている任意の特定の仮想ファブリックの構成がオンザフライで変更されることより)オンザフライでアンロードおよびロードされることが可能であることがさらに認識される。
ライブラリの中の仮想ファブリックが、前もってハードウェア記述言語表示にコンパイルされるので、仮想ファブリックの所望の構成のユーザー高レベル合成言語表示のみが、ユーザープログラミング処理の一部分としてコンパイルされる必要がある。ユーザーは、なお、所望の回路の完全な高レベル記述を入力し、構成されるデバイスを生成するために、高レベル記述を実行するためのプロセッサがなお存在する。しかしながら、ユーザーの高レベル記述の実行の大部分が事前にコンパイルされた仮想ファブリックの選択を伴うので、伴われたコンパイルは、前述のように比較的に小さな構成問題のみを伴う仮想ファブリックの構成のコンパイルのみである。従って、ユーザーによって見られるコンパイル時間は、全設計が高レベル記述からコンパイルされた場合に必要とされ得る時間よりずっと短く、かつ、ハードウェア言語を用いるときの構成時間に匹敵する。
従って、過度に長いコンパイル時間を必要とせずに、高レベル合成言語を用いてプログラマブルデバイスを構成する方法が提供されていることが分かる。
プログラマブルデバイスをプログラムする本発明に従う方法を実行する命令は、機械読み取り可能な媒体上に符号化され、前述の高レベル合成言語によって記述された構成を用いてPLDまたはプログラマブルデバイスをプログラムまたは構成する本発明の方法を実装するために、適切なコンピュータまたは類似のデバイスによって実行され得る。例えば、パーソナルコンピュータは、PLDが接続され得るインターフェースを装備され得、パーソナルコンピュータは、前述のように、適切なソフトウェアを用いてPLDをプログラムするために、ユーザーによって使用され得る。さらに、同じ機械読み取り可能な媒体、または別個の機械読み取り可能な媒体は、仮想ファブリックのライブラリを用いて符号化され得る。
図10は、磁気データ格納媒体1200の断面を示し、磁気データ格納媒体1200は、前述のパーソナルコンピュータ、または他のコンピュータまたは類似のデバイスのようなシステムによって実行され得る機械実行可能なプログラムを用いて符号化され、または仮想ファブリックのライブラリを用いて符号化され得る。媒体1200は、フロッピー(登録商標)ディスクまたはハードディスク、または磁気テープであり得、媒体1200は、従来的であり得る適切な基板1201と、片側または両側上の従来的であり得る適切なコーティング1202とを有し、コーティング1202は、極性または配向が磁気的に変更され得る磁気領域(見えない)を含む。磁気テープである場合を除いて、媒体1200は、ディスクドライブのスピンドルまたは他のデータ格納デバイスを受け取るための開口部(示されていない)も有し得る。
媒体1200のコーティング1202の磁気領域は、パーソナルコンピュータまたは他のコンピュータまたは類似のシステムのようなプログラミングシステムによる実行のために、機械実行可能なプログラムを従来的であり得る方法を符号化するように偏極または配向され、プログラミングシステムは、本発明に従って、(もしあれば)、その特定された処理ブロックを含むPLDの適切な部分を構成するために、プログラムされるべきPLDが挿入され得るソケットまたは周辺アタッチメントを有する。
図11は、光学的読み取り可能なデータ格納媒体1210の断面を示し、光学的読み取り可能なデータ格納媒体1210は、前述のパーソナルコンピュータ、または他のコンピュータまたは類似のデバイスのようなシステムによって実行され得る機械実行可能なプログラムを用いても符号化され、または仮想ファブリックのライブラリを用いて符号化され得る。媒体1210は、従来のコンパクトディスク読み取り専用メモリ(CD−ROM)またはデジタルビデオディスク読み取り専用メモリ(DVD−ROM)または再書き込み可能な媒体(例えば、CD−R、CD−RW、DVD−R、DVD−RW、DVD+R、DVD+RW、または光学的に読み取り可能、かつ、磁気光学的に再書き込む可能であるDVD−RAMまたは磁気光学ディスクであり得る。媒体1210は、好ましくは、従来的であり得る適切な基板1211と、一般的に基板1211の片側または両側上の従来的であり得る適切なコーティング1212とを有する。
CDベースまたはDVDベースの媒体の場合、周知のように、コーティング1212は、反射性であり、機械実行可能なプログラムを符号化するために、1つ以上の層の上に配列される複数のピット1213を加えられる。ピットの配列は、コーティング1212の表面にレーザー光を反射させることによって読み取られる。保護性コーティング1214は、好ましくは、実質的に透明であり、コーティング1212の上に提供される。
磁気光学ディスクの場合、周知のように、コーティング1212は、ピット1213を有しないが、レーザー(示されていない)によってある温度より上に加熱されたときに、極性または配向が磁気的に変更され得る複数の磁気領域を有する。領域の配向は、コーティング1212から反射されるレーザー光の偏光を測定することによって読み取られ得る。領域の配列は、前述のように、プログラムを符号化する。
本発明に従ってプログラムされたPLD1500は、多くの種類の電子デバイス内に使用され得る。1つの可能な使用は、図12に示されるデータ処理システム1400内に使用される。データ処理システム1400は、以下のコンポーネント:プロセッサ1401、メモリ1402、I/O回路網1403、および周辺デバイス1404のうちの1つ以上を含み得る。これらのコンポーネントは、システムバス1405によって一緒に連結され、エンドユーザーシステム1407内に含まれる回路ボード1406上に装着される。
システム1400は、幅広いさまざまな応用、例えば、コンピュータネットワーク、データネットワーク、計装、ビデオ処理、デジタル信号処理、またはプログラム可能または再プログラム可能な論理の使用の利点が望まれる任意の他の応用において使用され得る。PLD140は、さまざまな異なる論理機能を行うために使用され得る。例えば、PLD1500は、プロセッサ1401と協働して動作するプロセッサまたはコントローラとして構成され得る。PLD1500は、システム1400の共用のリソースへのアクセスを調停するアービターとしても使用され得る。なお別の実施例において、PLD1500は、プロセッサ1401とシステム1400の他のコンポーネントのうちの1つとの間のインターフェースとして構成され得る。システム1400は、例示のみであることと、本発明の真の範囲および精神は、以下の請求項によって示されるべきであることとが留意されるべきである。
さまざまなテクノロジーは、前述のようで本発明を組み込むPLD1500を実装するために使用され得る。
上記説明は、単に本発明の原理の例示であることと、本発明の範囲および精神から逸脱することなしに当業者によってさまざまな変更がなされ得ることとが理解される。例えば、本発明のさまざまな要素は、任意の所望の数および/または配列でPLD上に提供され得る。当業者は、限定ではなく、例示の目的のために示された説明された実施形態以外で実践され得ることと、本発明は、後に続く請求項のみによって限定されることとを認識する。

Claims (24)

  1. 高レベル言語を用いてプログラマブル集積回路デバイスを構成のために準備する方法であって、該方法は、
    該高レベル言語での記述から複数の仮想プログラマブルデバイスをコンパイルすることを含み、該コンパイルすることは、
    該プログラマブル集積回路デバイスのプログラマブルリソースから構成可能なルーティングリソースの構成をコンパイルすることと、
    該プログラマブル集積回路デバイスのプログラマブルリソースから複数の複雑な機能ブロックの構成をコンパイルすることと
    を含む、方法。
  2. 前記高レベル言語は、OpenCLである、請求項1に記載の方法。
  3. 前記構成可能なルーティングリソースの構成をコンパイルすることは、パイプライン化されたストール信号ネットワークをコンパイルすることを含む、請求項1に記載の方法。
  4. 前記パイプライン化されたストール信号ネットワークをコンパイルすることは、両方の方向でパイプライン化されている双方向性ストール信号ネットワークをコンパイルすることを含む、請求項3に記載の方法。
  5. 前記パイプライン化されたストール信号ネットワークをコンパイルすることは、複数のルーティングスイッチを含むネットワークをコンパイルすることを含み、該複数のルーティングスイッチの各々は、
    入力および少なくとも1つの出力と、
    該入力および該少なくとも1つの出力の各々のストール信号のためのそれぞれのレジスタと、
    該少なくとも1つの出力のうちのいずれかのストールの間に、出力データを格納する出力データストールレジスタと、
    該入力のストールの前に、該入力において受信されたデータを格納する第1の入力データストールレジスタと、
    該入力がストールする場合、該入力において存在するデータを格納する第2の入力データストールレジスタと
    を有する、請求項3に記載の方法。
  6. 前記複数の複雑な機能ブロックは、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つを含む、請求項1に記載の方法。
  7. 前記構成可能なルーティングリソースのバランスを保つために、前記複数の複雑な機能ブロックのうちの少なくとも1つの複雑な機能ブロックに対して入力レジスタを構成することを含む、請求項1に記載の方法。
  8. 前記入力レジスタを構成することは、前記複数の複雑な機能ブロックのうちの前記少なくとも1つの複雑な機能ブロックの少なくとも1つの入力においてそれぞれのFIFOを構成することを含む、請求項7に記載の方法。
  9. 前記入力レジスタを構成することは、前記複数の複雑な機能ブロックの各複雑な機能ブロックの各入力においてそれぞれのFIFOを構成することを含む、請求項8に記載の方法。
  10. 前記それぞれのFIFOを構成することは、それぞれの最大予期されたパイプラインアンバランスに等しいそれぞれの深さを有するそれぞれのFIFOを構成することを含む、請求項8に記載の方法。
  11. 前記複数の仮想プログラマブルデバイスをコンパイルすることは、動作中に再構成可能である少なくとも1つの仮想プログラマブルデバイスをコンパイルすることを含む、請求項1に記載の方法。
  12. プログラマブル集積回路デバイスに対する複数のコンパイルされた構成を用いて符号化された不揮発性機械読み取り可能な格納媒体であって、該複数のコンパイルされた構成の各々は、プロセッサに高レベル合成言語を実行することによって該プログラマブル集積回路デバイス上にそれぞれの仮想プログラマブルデバイスのインスタンスを作成させ、該各それぞれの仮想プログラマブルデバイスは、
    それぞれのルーティングリソース構成と、
    複数の複雑な機能ブロックのための構成と
    を含む、不揮発性機械読み取り可能な格納媒体。
  13. 各それぞれのルーティングリソース構成は、パイプライン化されたストール信号ネットワークのインスタンスを作成する、請求項12に記載の不揮発性機械読み取り可能な格納媒体。
  14. 各それぞれのルーティングリソース構成は、両方の方向でパイプライン化されている双方向性ストール信号ネットワークのインスタンスを作成する、請求項13に記載の不揮発性機械読み取り可能な格納媒体。
  15. 各それぞれのルーティングリソース構成は、複数のルーティングスイッチを含むパイプライン化されたストール信号ネットワークのインスタンスを作成し、該複数のルーティングスイッチの各々は、
    入力および少なくとも1つの出力と、
    該入力および該少なくとも1つの出力の各々のストール信号のためのそれぞれのレジスタと、
    該少なくとも1つの出力のうちのいずれかのストール中に、出力データを格納する出力データストールレジスタと、
    該入力のストールの前に、該入力において受信されたデータを格納する第1の入力データストールレジスタと、
    該入力がストールする場合、該入力において存在するデータを格納する第2の入力データストールレジスタと
    を有する、請求項13に記載の不揮発性機械読み取り可能な格納媒体。
  16. 前記複数の複雑な機能ブロックのための構成は、算数関数ブロック、三角関数ブロック、多重化論理ブロック、またはソフトプロセッサブロックのうちの少なくとも1つのための構成を含む、請求項12に記載の不揮発性機械読み取り可能な格納媒体。
  17. 前記複数の複雑な機能ブロックのための構成は、前記構成可能なルーティングリソースのバランスを保つために、該複数の複雑な機能ブロックのうちの少なくとも1つの複雑な機能ブロックに対する入力レジスタのための構成を含む、請求項12に記載の不揮発性機械読み取り可能な格納媒体。
  18. 前記入力レジスタのための構成は、前記複数の複雑な機能ブロックのうちの前記少なくとも1つの複雑な機能ブロックの少なくとも1つの入力におけるそれぞれのFIFOのための構成を含む、請求項17に記載の不揮発性機械読み取り可能な格納媒体。
  19. 前記入力レジスタのための構成は、前記複数の複雑な機能ブロックの各々の各入力におけるそれぞれのFIFのための構成を含む、請求項18に記載の不揮発性機械読み取り可能な格納媒体。
  20. 前記それぞれのFIFOのための構成は、それぞれの最大予期されたパイプラインアンバランスに等しいそれぞれの深さを有するそれぞれのFIFOのための構成を含む、請求項18に記載の不揮発性機械読み取り可能な格納媒体。
  21. 複数の仮想プログラマブルデバイスのための前記複数のコンパイルされた構成は、動作中に再構成可能である仮想プログラマブルデバイスのための少なくとも1つのコンパイルされた構成を含む、請求項12に記載の不揮発性機械読み取り可能な格納媒体。
  22. ストール信号が信号のフローを制御するネットワークにおいて用いるルーティングスイッチであって、該ルーティングスイッチは、
    該ネットワークの他の所からデータを受信する入力と、
    データが該ネットワークの他の所から該入力へ伝搬されることを防ぐために、入力ストール信号を伝搬する入力ストール信号出力と、
    データを該ネットワークの他の位置のそれぞれに伝搬する複数のそれぞれの出力と、
    該それぞれの出力がデータを該他の位置のうちのそれぞれの1つに伝搬することを防ぐために、該他の位置のうちの該それぞれの1つからそれぞれの出力ストール信号を受信する、該それぞれの出力の各々に関連付けられたそれぞれの出力ストール信号入力と
    含む、ルーティングスイッチ。
  23. 前記入力ストール信号のための入力ストール信号レジスタと、
    前記それぞれの出力ストール信号の各々のためのそれぞれの出力ストール信号レジスタと
    をさらに含む、請求項22に記載のルーティングスイッチ。
  24. 前記出力ストール信号のうちの1つのアサーションの前に受信されたデータが伝搬されることが可能になるまで、該出力ストール信号のうちの該1つのアサーションの前に該受信されたデータを保持する入力データレジスタをさらに含む、請求項22に記載のルーティングスイッチ。
JP2013022166A 2012-02-09 2013-02-07 高レベル言語を用いるプログラマブルデバイスの構成 Expired - Fee Related JP6139160B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/369,829 2012-02-09
US13/369,829 US8959469B2 (en) 2012-02-09 2012-02-09 Configuring a programmable device using high-level language

Publications (2)

Publication Number Publication Date
JP2013165490A true JP2013165490A (ja) 2013-08-22
JP6139160B2 JP6139160B2 (ja) 2017-05-31

Family

ID=47747418

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013022166A Expired - Fee Related JP6139160B2 (ja) 2012-02-09 2013-02-07 高レベル言語を用いるプログラマブルデバイスの構成

Country Status (4)

Country Link
US (3) US8959469B2 (ja)
EP (1) EP2626801B1 (ja)
JP (1) JP6139160B2 (ja)
CN (1) CN103324512B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834630A (zh) * 2014-02-10 2015-08-12 瑞萨电子株式会社 运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OpenCL设备
JP2019200736A (ja) * 2018-05-18 2019-11-21 ヤフー株式会社 調整装置、調整方法および調整プログラム
JP2020525907A (ja) * 2017-06-22 2020-08-27 アイキャット・エルエルシー 高スループットプロセッサ

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9069549B2 (en) 2011-10-12 2015-06-30 Google Technology Holdings LLC Machine processor
US9448823B2 (en) 2012-01-25 2016-09-20 Google Technology Holdings LLC Provision of a download script
US20130198325A1 (en) * 2012-01-26 2013-08-01 Motorola Mobility Llc Provision and running a download script
US20130212366A1 (en) * 2012-02-09 2013-08-15 Altera Corporation Configuring a programmable device using high-level language
US8959469B2 (en) 2012-02-09 2015-02-17 Altera Corporation Configuring a programmable device using high-level language
US8850413B2 (en) * 2012-05-31 2014-09-30 Oracle International Corporation Compiling multi-threaded applications for targeted criticalities
US9141745B2 (en) * 2013-10-31 2015-09-22 Taiwan Semiconductor Manufacturing Co., Ltd. Method and system for designing Fin-FET semiconductor device
US10078717B1 (en) 2013-12-05 2018-09-18 The Mathworks, Inc. Systems and methods for estimating performance characteristics of hardware implementations of executable models
US10261760B1 (en) 2013-12-05 2019-04-16 The Mathworks, Inc. Systems and methods for tracing performance information from hardware realizations to models
GB201405755D0 (en) * 2014-03-31 2014-05-14 Irdeto Bv Optimizing and protecting software
US9584594B2 (en) * 2014-04-11 2017-02-28 Maxeler Technologies Ltd. Dynamic provisioning of processing resources in a virtualized computational architecture
US9503093B2 (en) * 2014-04-24 2016-11-22 Xilinx, Inc. Virtualization of programmable integrated circuits
US9547738B1 (en) * 2014-05-08 2017-01-17 Altera Corporation Invariant code optimization in high-level FPGA synthesis
US9846660B2 (en) * 2014-11-12 2017-12-19 Xilinx, Inc. Heterogeneous multiprocessor platform targeting programmable integrated circuits
CN107111663B (zh) * 2014-11-12 2021-01-08 赛灵思公司 目标为可编程集成电路的异构型多处理器程序编译
US9218443B1 (en) * 2014-11-12 2015-12-22 Xilinx, Inc. Heterogeneous multiprocessor program compilation targeting programmable integrated circuits
US9286196B1 (en) * 2015-01-08 2016-03-15 Arm Limited Program execution optimization using uniform variable identification
US11099918B2 (en) * 2015-05-11 2021-08-24 Xilinx, Inc. Accelerating algorithms and applications on FPGAs
CN104850866B (zh) * 2015-06-08 2018-05-01 电子科技大学 基于SoC-FPGA的自重构K-means聚类技术实现方法
US11016742B2 (en) * 2015-06-24 2021-05-25 Altera Corporation Channel sizing for inter-kernel communication
US9977758B1 (en) * 2015-10-19 2018-05-22 Xilinx, Inc. Device profiling for tuning OpenCL applications on programmable integrated circuits
US9690894B1 (en) * 2015-11-02 2017-06-27 Altera Corporation Safety features for high level design
US9735782B1 (en) * 2016-03-29 2017-08-15 Wipro Limited Systems and methods for configuring a field programmable device
US10545739B2 (en) 2016-04-05 2020-01-28 International Business Machines Corporation LLVM-based system C compiler for architecture synthesis
US10516396B2 (en) * 2016-04-29 2019-12-24 University Of Florida Research Foundation, Incorporated Overlay architecture for programming FPGAs
US10223488B2 (en) * 2016-07-19 2019-03-05 Altera Corporation Method and apparatus for improving system operation by replacing components for performing division during design compilation
US10380313B1 (en) * 2016-12-08 2019-08-13 Xilinx, Inc. Implementation and evaluation of designs for heterogeneous computing platforms with hardware acceleration
US10445118B2 (en) * 2017-09-22 2019-10-15 Intel Corporation Methods and apparatus to facilitate field-programmable gate array support during runtime execution of computer readable instructions
US10956241B1 (en) 2017-12-20 2021-03-23 Xilinx, Inc. Unified container for hardware and software binaries
US11163530B2 (en) * 2018-01-12 2021-11-02 Intel Corporation Programmable-logic-directed multiplier mapping
US11144286B2 (en) 2019-01-14 2021-10-12 Microsoft Technology Licensing, Llc Generating synchronous digital circuits from source code constructs that map to circuit implementations
US11275568B2 (en) 2019-01-14 2022-03-15 Microsoft Technology Licensing, Llc Generating a synchronous digital circuit from a source code construct defining a function call
US11113176B2 (en) 2019-01-14 2021-09-07 Microsoft Technology Licensing, Llc Generating a debugging network for a synchronous digital circuit during compilation of program source code
US10810343B2 (en) 2019-01-14 2020-10-20 Microsoft Technology Licensing, Llc Mapping software constructs to synchronous digital circuits that do not deadlock
US11106437B2 (en) 2019-01-14 2021-08-31 Microsoft Technology Licensing, Llc Lookup table optimization for programming languages that target synchronous digital circuits
US11093682B2 (en) * 2019-01-14 2021-08-17 Microsoft Technology Licensing, Llc Language and compiler that generate synchronous digital circuits that maintain thread execution order
EP3701866B1 (en) 2019-02-27 2021-08-25 Ecole Polytechnique Fédérale de Lausanne (EPFL) Sensor system
US10733016B1 (en) 2019-04-26 2020-08-04 Google Llc Optimizing hardware FIFO instructions
US11036477B2 (en) 2019-06-27 2021-06-15 Intel Corporation Methods and apparatus to improve utilization of a heterogeneous system executing software
US10908884B2 (en) 2019-06-27 2021-02-02 Intel Corporation Methods and apparatus for runtime multi-scheduling of software executing on a heterogeneous system
US11269639B2 (en) 2019-06-27 2022-03-08 Intel Corporation Methods and apparatus for intentional programming for heterogeneous systems
CN112347429A (zh) * 2019-08-06 2021-02-09 天津光电通信技术有限公司 一种防止fpga程序泄密的方法、装置、fpga及存储介质
CN111460745B (zh) * 2020-03-31 2023-07-21 深圳市风云实业有限公司 一种设备芯片间连通性检测方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005353061A (ja) * 2004-06-07 2005-12-22 Ip Flex Kk ハードウェア情報を生成する方法
JP2006185423A (ja) * 2004-11-30 2006-07-13 Tokyo Electron Ltd カスタムlsi開発プラットフォーム、命令セット・アーキテクチャ及び論理回路構成情報の生成方法、並びにプログラム
US20060242385A1 (en) * 2004-11-30 2006-10-26 Tokyo Electron, Inc. Dynamically reconfigurable processor
JP2007109101A (ja) * 2005-10-14 2007-04-26 Canon Inc システム設計ツール
US7219342B2 (en) * 2000-08-07 2007-05-15 Altera Corporation Software-to-hardware compiler
JP2008181170A (ja) * 2007-01-23 2008-08-07 Research Organization Of Information & Systems 非同期式回路の制御回路
JP2008219806A (ja) * 2007-03-07 2008-09-18 Mitsubishi Electric Corp 電気機器

Family Cites Families (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1444084A (en) 1972-06-21 1976-07-28 Honeywell Inf Systems Generalized logic device
US4442504A (en) 1981-03-09 1984-04-10 Allen-Bradley Company Modular programmable controller
US5152000A (en) 1983-05-31 1992-09-29 Thinking Machines Corporation Array communications arrangement for parallel processor
US5142625A (en) 1985-06-12 1992-08-25 Minolta Camera Kabushiki Kaisha One-chip microcomputer including a programmable logic array for interrupt control
US5134884A (en) 1986-05-02 1992-08-04 Forrest Anderson Single pulse imaging device
US5068823A (en) 1988-07-11 1991-11-26 Star Semiconductor Corporation Programmable integrated circuit using topological and parametric data to selectively connect and configure different high level functional blocks thereof
EP0419105B1 (en) 1989-09-21 1997-08-13 Texas Instruments Incorporated Integrated circuit formed on a surface of a semiconductor substrate and method for constructing such an integrated circuit
US5128871A (en) 1990-03-07 1992-07-07 Advanced Micro Devices, Inc. Apparatus and method for allocation of resoures in programmable logic devices
US5541849A (en) 1990-04-06 1996-07-30 Lsi Logic Corporation Method and system for creating and validating low level description of electronic design from higher level, behavior-oriented description, including estimation and comparison of timing parameters
US7356620B2 (en) 2003-06-10 2008-04-08 Altera Corporation Apparatus and methods for communicating with programmable logic devices
US5684980A (en) 1992-07-29 1997-11-04 Virtual Computer Corporation FPGA virtual computer for executing a sequence of program instructions by successively reconfiguring a group of FPGA in response to those instructions
US5442792A (en) 1992-08-07 1995-08-15 Hughes Aircraft Company Expert system compilation method
US5535342A (en) 1992-11-05 1996-07-09 Giga Operations Corporation Pld connector for module having configuration of either first PLD or second PLD and reconfigurable bus for communication of two different bus protocols
GB9223226D0 (en) 1992-11-05 1992-12-16 Algotronix Ltd Improved configurable cellular array (cal ii)
US6044211A (en) 1994-03-14 2000-03-28 C.A.E. Plus, Inc. Method for graphically representing a digital device as a behavioral description with data and control flow elements, and for converting the behavioral description to a structural description
US5761484A (en) 1994-04-01 1998-06-02 Massachusetts Institute Of Technology Virtual interconnections for reconfigurable logic systems
US5548228A (en) 1994-09-28 1996-08-20 Altera Corporation Reconfigurable programmable logic device having static and non-volatile memory
GB9508931D0 (en) 1995-05-02 1995-06-21 Xilinx Inc Programmable switch for FPGA input/output signals
US5646545A (en) 1995-08-18 1997-07-08 Xilinx, Inc. Time multiplexed programmable logic device
KR0180058B1 (ko) 1995-09-13 1999-04-01 이민화 Cine메모리에 데이타를 압축 저장하는 초음파진단장치
SE505783C2 (sv) 1995-10-03 1997-10-06 Ericsson Telefon Ab L M Förfarande för att tillverka en digital signalprocessor
US5819064A (en) 1995-11-08 1998-10-06 President And Fellows Of Harvard College Hardware extraction technique for programmable reduced instruction set computers
GB9607528D0 (en) 1996-04-11 1996-06-12 Int Computers Ltd Integrated circuit processor
US5968161A (en) 1996-08-29 1999-10-19 Altera Corporation FPGA based configurable CPU additionally including second programmable section for implementation of custom hardware support
GB2317245A (en) 1996-09-12 1998-03-18 Sharp Kk Re-timing compiler integrated circuit design
US5822570A (en) 1996-10-30 1998-10-13 Microsoft Corporation System and method for parsing and executing a single instruction stream using a plurality of tightly coupled parsing and execution units
US5835734A (en) 1997-03-07 1998-11-10 California Institute Of Technology Electronic processing and control system with programmable hardware
US6085317A (en) 1997-08-15 2000-07-04 Altera Corporation Reconfigurable computer architecture using programmable logic devices
US5987603A (en) 1997-04-29 1999-11-16 Lsi Logic Corporation Apparatus and method for reversing bits using a shifter
US5966534A (en) 1997-06-27 1999-10-12 Cooke; Laurence H. Method for compiling high level programming languages into an integrated processor with reconfigurable logic
US6219628B1 (en) 1997-08-18 2001-04-17 National Instruments Corporation System and method for configuring an instrument to perform measurement functions utilizing conversion of graphical programs into hardware implementations
US6608638B1 (en) 2000-02-07 2003-08-19 National Instruments Corporation System and method for configuring a programmable hardware instrument to perform measurement functions utilizing estimation of the hardware implentation and management of hardware resources
US6226776B1 (en) * 1997-09-16 2001-05-01 Synetry Corporation System for converting hardware designs in high-level programming language to hardware implementations
US5999990A (en) 1998-05-18 1999-12-07 Motorola, Inc. Communicator having reconfigurable resources
US6272664B1 (en) 1998-06-03 2001-08-07 Synopsys, Inc. System and method for using scalable polynomials to translate a look-up table delay model into a memory efficient model
US6282627B1 (en) 1998-06-29 2001-08-28 Chameleon Systems, Inc. Integrated processor and programmable data path chip for reconfigurable computing
US6609088B1 (en) 1998-07-24 2003-08-19 Interuniversitaire Micro-Elektronica Centrum Method for determining an optimized memory organization of a digital device
GB9828381D0 (en) 1998-12-22 1999-02-17 Isis Innovation Hardware/software codesign system
US6477683B1 (en) 1999-02-05 2002-11-05 Tensilica, Inc. Automated processor generation system for designing a configurable processor and method for the same
US6457173B1 (en) 1999-08-20 2002-09-24 Hewlett-Packard Company Automatic design of VLIW instruction formats
US6507947B1 (en) 1999-08-20 2003-01-14 Hewlett-Packard Company Programmatic synthesis of processor element arrays
US6745160B1 (en) * 1999-10-08 2004-06-01 Nec Corporation Verification of scheduling in the presence of loops using uninterpreted symbolic simulation
CN1307406A (zh) * 2000-01-27 2001-08-08 华为技术有限公司 数字锁相环的滤波方法
US6625797B1 (en) 2000-02-10 2003-09-23 Xilinx, Inc. Means and method for compiling high level software languages into algorithmically equivalent hardware representations
US6467075B1 (en) 2000-03-24 2002-10-15 Nec Corporation Resolution of dynamic memory allocation/deallocation and pointers
EP1742159A3 (en) 2000-08-07 2007-06-20 Altera Corporation Software-to-Hardware compiler
US7472259B2 (en) * 2000-12-06 2008-12-30 Analog Devices, Inc. Multi-cycle instructions
US6779169B1 (en) 2002-05-31 2004-08-17 Altera Corporation Method and apparatus for placement of components onto programmable logic devices
US7290240B1 (en) 2004-07-30 2007-10-30 Altera Corporation Leveraging combinations of synthesis, placement and incremental optimizations
JP2006171913A (ja) 2004-12-13 2006-06-29 Canon Inc 情報処理装置、情報処理方法、ならびにプログラム、記憶媒体
US7254801B1 (en) 2005-01-20 2007-08-07 Altera Corporation Synthesis aware placement: a novel approach that combines knowledge of possible resynthesis
US7140235B2 (en) 2005-02-18 2006-11-28 General Motors Corporation Leak detection system for a vehicle fuel tank
WO2007005724A2 (en) 2005-07-01 2007-01-11 The Regents Of The University Of California Fpga circuits and methods considering process variations
CN100458973C (zh) * 2006-05-17 2009-02-04 中国人民解放军国防科学技术大学 高速流水线中长延时多端口sram的快速访问方法
US7996797B1 (en) 2006-08-16 2011-08-09 Altera Corporation Method and apparatus for performing multiple stage physical synthesis
US7555741B1 (en) * 2006-09-13 2009-06-30 Altera Corporation Computer-aided-design tools for reducing power consumption in programmable logic devices
US8296696B1 (en) 2008-03-12 2012-10-23 Altera Corporation Method and apparatus for performing simultaneous register retiming and combinational resynthesis during physical synthesis
WO2012142069A2 (en) * 2011-04-11 2012-10-18 University Of Florida Research Foundation, Inc. Elastic computing
US8959469B2 (en) 2012-02-09 2015-02-17 Altera Corporation Configuring a programmable device using high-level language
US20130212366A1 (en) 2012-02-09 2013-08-15 Altera Corporation Configuring a programmable device using high-level language

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7219342B2 (en) * 2000-08-07 2007-05-15 Altera Corporation Software-to-hardware compiler
JP2005353061A (ja) * 2004-06-07 2005-12-22 Ip Flex Kk ハードウェア情報を生成する方法
US20050283743A1 (en) * 2004-06-07 2005-12-22 Mulholland Philip J Method for generating hardware information
JP2006185423A (ja) * 2004-11-30 2006-07-13 Tokyo Electron Ltd カスタムlsi開発プラットフォーム、命令セット・アーキテクチャ及び論理回路構成情報の生成方法、並びにプログラム
US20060242385A1 (en) * 2004-11-30 2006-10-26 Tokyo Electron, Inc. Dynamically reconfigurable processor
JP2007109101A (ja) * 2005-10-14 2007-04-26 Canon Inc システム設計ツール
JP2008181170A (ja) * 2007-01-23 2008-08-07 Research Organization Of Information & Systems 非同期式回路の制御回路
JP2008219806A (ja) * 2007-03-07 2008-09-18 Mitsubishi Electric Corp 電気機器

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JAMES COOLE;GREG STITT: "Intermediate fabrics: Virtual architectures for circuit portability and fast placement and routing", IEEE/ACM/IFIP INTERNATIONAL CONFERENCE, JPN6016022963, 29 October 2010 (2010-10-29), US, pages 13 - 22, ISSN: 0003340098 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104834630A (zh) * 2014-02-10 2015-08-12 瑞萨电子株式会社 运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OpenCL设备
CN104834630B (zh) * 2014-02-10 2019-08-16 瑞萨电子株式会社 运算控制装置、运算控制方法、存储有程序的非瞬时计算机可读介质以及OpenCL设备
JP2020525907A (ja) * 2017-06-22 2020-08-27 アイキャット・エルエルシー 高スループットプロセッサ
JP7183197B2 (ja) 2017-06-22 2022-12-05 アイキャット・エルエルシー 高スループットプロセッサ
JP2019200736A (ja) * 2018-05-18 2019-11-21 ヤフー株式会社 調整装置、調整方法および調整プログラム
JP7278716B2 (ja) 2018-05-18 2023-05-22 ヤフー株式会社 調整装置、調整方法および調整プログラム

Also Published As

Publication number Publication date
EP2626801A3 (en) 2013-10-16
CN103324512A (zh) 2013-09-25
US8959469B2 (en) 2015-02-17
JP6139160B2 (ja) 2017-05-31
US10366189B2 (en) 2019-07-30
US20160350452A1 (en) 2016-12-01
EP2626801A2 (en) 2013-08-14
CN103324512B (zh) 2018-04-06
US20130212365A1 (en) 2013-08-15
US9449132B2 (en) 2016-09-20
EP2626801B1 (en) 2019-12-04
US20150121321A1 (en) 2015-04-30

Similar Documents

Publication Publication Date Title
JP6139160B2 (ja) 高レベル言語を用いるプログラマブルデバイスの構成
JP6527202B2 (ja) 高レベル言語を用いるプログラマブルデバイスの構成
US10033387B2 (en) Method apparatus for high-level programs with general control flow
Khailany et al. A modular digital VLSI flow for high-productivity SoC design
JP6059413B2 (ja) 再構成可能命令セル・アレイ
Pellauer et al. Buffets: An efficient and composable storage idiom for explicit decoupled data orchestration
JP5045961B2 (ja) 同期回路設計の表現から非同期回路設計の表現へおよび非同期回路設計の表現から同期回路設計の表現への自動変換を実行するためのシステムおよび方法
US8146040B1 (en) Method of evaluating an architecture for an integrated circuit device
US8806403B1 (en) Efficient configuration of an integrated circuit device using high-level language
Koul et al. Aha: An agile approach to the design of coarse-grained reconfigurable accelerators and compilers
Charaf et al. RV-CAP: Enabling dynamic partial reconfiguration for FPGA-based RISC-V system-on-chip
Wolf et al. Ultrasynth: integration of a CGRA into a control engineering environment
Karlström et al. Operation classification for control path synthetization with nogap
Jozwiak et al. Hardware synthesis for reconfigurable heterogeneous pipelined accelerators
Dumitriu et al. A framework of embedded reconfigurable systems based on re-locatable virtual components
Koch UltraSynth: Integration of a CGRA into a Control Engineering Environment
US10303831B1 (en) Method and apparatus for performing and utilizing source code area annotation
Lallet et al. xMAML: A modeling language for dynamically reconfigurable architectures
Chang Concept of Logic Synthesis
CHIRUMAMILLA et al. High performance of Scan Based Register Insertion on Integer Arithmetic Cores for FPGAs
Lanzagorta et al. FPGA Technology
Lokhande RISC Pipelined Controller using FPGA
TW200813767A (en) Branching and behavioral partitioning for a VLIW processor
Oreja et al. Hardware Platform to Test New ISA Extensions
Koster A Parameterizable Processor for Reconfigurable Computing on FPGAs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160616

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20160915

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170403

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170427

R150 Certificate of patent or registration of utility model

Ref document number: 6139160

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees