JP2013122764A - 再構成可能プロセッサ及び再構成可能プロセッサのミニコア - Google Patents

再構成可能プロセッサ及び再構成可能プロセッサのミニコア Download PDF

Info

Publication number
JP2013122764A
JP2013122764A JP2012271447A JP2012271447A JP2013122764A JP 2013122764 A JP2013122764 A JP 2013122764A JP 2012271447 A JP2012271447 A JP 2012271447A JP 2012271447 A JP2012271447 A JP 2012271447A JP 2013122764 A JP2013122764 A JP 2013122764A
Authority
JP
Japan
Prior art keywords
mini
arithmetic element
core
reconfigurable processor
element group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012271447A
Other languages
English (en)
Other versions
JP2013122764A5 (ja
Inventor
Dong Kwan Suh
東 寛 徐
Suk Jin Kim
碩 鎭 金
Hyeong-Suk Yoo
炯 碩 兪
Qi Sok Quan
起 ▲そく▼ 權
Jae-Eun Park
哉 彦 朴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2013122764A publication Critical patent/JP2013122764A/ja
Publication of JP2013122764A5 publication Critical patent/JP2013122764A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7867Architectures of general purpose stored program computers comprising a single central processing unit with reconfigurable architecture
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/3001Arithmetic instructions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3867Concurrent instruction execution, e.g. pipeline or look ahead using instruction pipelines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Power Sources (AREA)
  • Advance Control (AREA)
  • Multi Processors (AREA)

Abstract

【課題】 再構成可能プロセッサ及び再構成可能プロセッサのミニコアを提供する。
【解決手段】 本発明の一態様による再構成可能プロセッサは、第1演算素子グループを含む第1機能ユニットと、第1演算素子グループと異なる第2演算素子グループを含む第2機能ユニットと、第1及び第2機能ユニットを連結するための内部ネットワークを含む多数のミニコアと、それぞれのミニコアを連結するための外部ネットワークと、を含みうる。
【選択図】 図1

Description

本発明は、再構成可能プロセッサ(Reconfigurable Processor)に関する。
通常、再構成可能アーキテクチャー(Reconfigurable Architecture)とは、所定の作業を行うためのコンピュータ装置のハードウェア構成をそれぞれの作業に最適化されるように変更することができるアーキテクチャーを意味する。
所定の作業をハードウェアでのみ処理する場合、固定されたハードウェアの機能によって、作業内容に少しでも変更が加えられれば、これを効率的に処理することは難しい。また、所定の作業をソフトウェアでのみ処理する場合、その作業内容に合わせてソフトウェアを変更して処理することが可能であるが、ハードウェア処理に比べて速度が遅い。
再構成可能アーキテクチャーは、このようなハードウェア/ソフトウェアの長所をいずれも満足させることができる。特に、同じ作業が反復的に行われるデジタル信号処理分野では、このような再構成可能アーキテクチャーが多くの注目を浴びている。
再構成可能アーキテクチャーの種類は、さまざまがあるが、そのうち、コースグレインアレイ(Coarse−Grained Array:CGA)が代表的である。CGAは、複数個の同じ計算機能力を有する機能ユニットからなる。そして、機能ユニット間の連結状態が調節されることによって、所定の作業に最適化することができる。
本発明の目的は、再構成可能プロセッサ及び再構成可能プロセッサのミニコアを提供することである。
本発明の一態様による再構成可能プロセッサは、少なくとも1つのミニコアを含み、前記少なくとも1つのミニコアのそれぞれは、互いに異なる計算機能力を有する少なくとも2つの機能ユニットを含みうる。
本発明の他の態様による再構成可能プロセッサは、第1演算素子グループを含む第1機能ユニットと、前記第1演算素子グループと異なる第2演算素子グループを含む第2機能ユニットと、前記第1及び第2機能ユニットを連結するための内部ネットワークを含む多数のミニコアと、前記それぞれのミニコアを連結するための外部ネットワークと、を含みうる。
本発明のさらに他の態様による再構成可能プロセッサのミニコアは、第1演算素子グループを含む第1機能ユニットと、前記第1演算素子グループと異なる第2演算素子グループを含む第2機能ユニットと、前記第1及び第2機能ユニットを連結するための内部ネットワークと、を含みうる。
本発明の実施形態によると、再構成可能プロセッサ及びそのミニコアの資源消耗を最小化するとともに、優れた拡張性を提供できる。
本発明の一実施形態による再構成可能プロセッサを示す図である。 本発明の一実施形態による再構成可能プロセッサのミニコアを示す図である。 本発明の他の実施形態による再構成可能プロセッサのミニコアを示す図である。 本発明の他の実施形態による再構成可能プロセッサを示す図である。
以下、添付した図面を参照して、本発明の実施のための具体的な例を詳しく説明する。
図1は、本発明の一実施形態による再構成可能プロセッサを示す。図1を参照すると、本実施形態による再構成可能プロセッサ100は、多数のミニコア101a〜101d、及びそれぞれのミニコア101a〜101dを連結する外部ネットワーク102を含みうる。
それぞれのミニコア101a〜101dは、相互に独立して命令、ジョブ、またはタスクなどを処理することができる。例えば、MC#0(101a)とMC#1(101b)は、互いに依存関係がない2つの命令を同時に処理することが可能である。
それぞれのミニコア101a〜101dは、再構成可能プロセッサ100の設計基本単位または拡張基本単位になりうる。例えば、図1では、4個のミニコア101a〜101dが形成されるものを例示したが、これは、理解を助けるためのものであって、8個または16個のように拡張されることが可能である。
それぞれのミニコア101a〜101dは、所定の全計算機能力を有しうる。本実施形態で、計算機能力とは、演算処理能力、すなわち、あるシステムがどれほど多くの種類の演算を処理することができるか否かを表わす。したがって、あるシステムの計算機能力は、そのシステムが提供することができる演算の種類に基づいて定めることができる。例えば、演算Aと演算Bとを提供するシステムと演算Cと演算Dとを提供するシステムは、互いに計算機能力が異なると言える。また、演算A、B、Cを提供するシステムと演算A、B、C、Dを提供するシステムは、互いに計算機能力が異なり、特に、後者のシステムの計算機能力が高い、または多いと言える。参考までに、ここで例示したそれぞれの演算A、B、C、及びDは、‘足し算’、‘掛け算’、‘論理和’、‘論理積’などの演算になりうる。但し、これは、理解を助けるための単純な例に過ぎないものであって、本実施形態の範囲が、例示された演算に限定されず、それ以外に、算術、論理、スカラー、ベクトル演算のように多様な演算にも適用可能であるということは自明である。
それぞれのミニコア101a〜101dは、互いに異なる計算機能力を有する多数の機能ユニットを含みうる。言い換えれば、それぞれのミニコア101a〜101dが有する全計算機能力は、それぞれのミニコア101a〜101d内部の機能ユニットに分けられ、部分計算機能力としてそれらの機能ユニットにマッピングされうる。例えば、MC#0(101a)の内部に形成されたそれぞれの機能ユニットは、MC#0(101a)の全計算機能力を分けて有することが可能である。したがって、MC#0(101a)の内部に形成されたそれぞれの機能ユニットが有する部分計算機能力の組み合わせによって、MC#0(101a)の全計算機能力が定められると見なすこともできる。それぞれのミニコア101a〜101dの内部の具体的な構成は、図2及び図3を参照して後述する。
ミニコア101a〜101dに連結された外部ネットワーク102は、それぞれのミニコア101a〜101dを通信可能になるように互いに連結する。例えば、MC#0(101a)から生成されたデータが、外部ネットワーク102を通じてMC#3(101d)に伝達されうる。それぞれのミニコア101a〜101dは、複数のチャネルを通じて外部ネットワーク102とデータを送受信することができる。
外部ネットワーク102、すなわち、ミニコア101a〜101dの間の接続に関する構成は、別個のメモリ(図示せず)に保存された設定情報によって変更されうる。
ミニコア101a〜101d間の計算機能力は、同一でもあり、異なることもある。
それぞれのミニコア101a〜101dは、専用のローカルレジスタファイル(Local Register File:LRF)(図示せず)を有することもある。
それぞれのミニコア101a〜101dは、専用LRFを用いて他のミニコアの専用LRFにデータをプッシュし、他のミニコアから自分の専用LRFにプッシュされたデータを処理することができる。
本発明のさらに他の追加的態様によって、再構成可能プロセッサ100は、CGA(Coarse Grained Array)プロセッサまたはVLIW(Very Long Instruction Word)プロセッサで動作することができる。例えば、第1モードで、4個のミニコア101a〜101dが、CGAアーキテクチャーに基づいてループ演算を処理し、第2モードで、一部のミニコア(例えば、MC#0(101a)及びMC#2(101c))が、ループ以外の一般演算を処理することが可能である。このようなモード切り替えのために、再構成可能プロセッサ100は、モード切り替え時のLive−In/Live−Outデータを臨時に保存するためのグローバルレジスタファイル(Global Register File:GRF)(図示せず)を含むこともある。
図2は、本発明の一実施形態によるミニコアの構成を示す。図2を参照すると、本実施形態によるミニコア200は、多数の機能ユニット201、202、及びそれぞれの機能ユニット201、202を連結する内部ネットワーク203を含みうる。参考までに、図2では、理解を助けるために、2個の機能ユニット201、202のみを有するものを例示したが、機能ユニットの数は4個、8個、16個、またはそれ以上であってもよいことは自明である。
機能ユニット201は、演算素子A(210)及び演算素子B(211)を含み、機能ユニット202は、演算素子C(212)及び演算素子D(213)を含む。本実施形態で、演算素子A(210)は、演算Aを処理する回路またはモジュールになりうる。例えば、演算Aが‘足し算’であれば、演算素子A(210)は‘加算器’になりうる。
それぞれの機能ユニット201、202は、互いに異なる計算機能力を有しうる。例えば、それぞれの機能ユニット201、202は、ミニコア200が有している全計算機能力を分けて有することが可能である。一例として、ミニコア200が、演算A、B、C、Dを処理する能力(全計算機能力)があると仮定すれば、FU#0(201)は、そのうち演算A及びBを処理する能力(第1部分計算機能力)があり、FU#1(202)は、演算C及びDを処理する能力(第2部分計算機能力)がある。
互いに異なる計算機能力は、保有している演算素子(operation element)の種類によって決定されうる。言い換えれば、FU#0(201)が有する演算素子210、211の種類とFU#1(202)が有する演算素子212、213の種類が、互いに異なりうる。例えば、FU#0(201)は、演算素子A(210)と演算素子B(211)とで構成される第1演算素子グループを有し、FU#1(202)は、演算素子C(212)と演算素子D(213)とで構成される第2演算素子グループを有しうる。但し、それぞれの演算素子が完全に異なる必要はなく、それぞれの機能ユニット201、202が共通しない、すなわち、機能ユニット201、202のうちの如何なるものにも含まれない、演算素子が少なくとも1つ存在すれば十分である。例えば、図2と異なって、FU#0(201)には、演算素子A、Bが形成され、FU#1(202)には、演算素子A、B、Cが形成される場合にも、FU#0(201)とFU#1(202)は、互いに異なる計算機能力を有しうる。
機能ユニット201、202に連結された内部ネットワーク203は、それぞれの機能ユニット201、202を通信可能になるように連結する。例えば、FU#0(201)から生成されたデータが、内部ネットワーク203を通じてFU#1(202)に伝達されうる。
内部ネットワーク203の構成は、設定情報によって変更されうる。例えば、別個のメモリ(図示せず)に保存された設定情報に基づいて、内部ネットワーク203の構成、すなわち、機能ユニット201、202間の連結状態が変更されうる。
追加の態様によって、それぞれの機能ユニット201、202は、専用のローカルレジスタファイル(LRF)(図示せず)を有することもある。それぞれの機能ユニット201、202は、専用LRFを用いて他の機能ユニットの専用LRFにデータをプッシュし、他の機能ユニットから自分の専用LRFにプッシュされたデータを処理することができる。
図3は、本発明の他の実施形態によるミニコアの構成を示す。図3を参照すると、本実施形態によるミニコア300は、多数の機能ユニット301a〜301d、及びそれぞれの機能ユニット301a〜301dを連結する内部ネットワーク302を含みうる。参考までに、図3で、基本構成及び内部ネットワーク302に関する説明は、図2の説明と同一なので、ここでは詳しい説明を省略する。
図3で、ミニコア300は、演算A、B、C、D、Eの処理能力を支援する。言い換えれば、ミニコア300の全計算機能力は、演算A、B、C、D、Eに対応する。
ミニコア300の内部の各機能ユニット301a〜301dは、全計算機能力の一部を有する。例えば、FU#0(301a)及びFU#1(301b)には、演算素子A(320a)と演算素子B(321a)とが形成され、FU#2(301c)には、演算素子A(320c)と演算素子C(322)とが形成され、FU#3(301d)には、演算素子A(320d)と演算素子D(323)、及び演算素子E(324)とが形成されうる。
ミニコア300は、互いに異なる計算機能力を有する少なくとも2つの機能ユニットを含みうる。例えば、計算機能力が一致しない機能ユニットの対が少なくとも1つ存在し、あらゆる機能ユニットに共通的ではない演算素子が少なくとも1つ存在すれば、本実施形態によるミニコア300の要求条件を満足することができる。
言い換えれば、FU#0(301a)とFU#1(301b)のように、ある一部の機能ユニットの計算機能力が同一であるとしても、FU#0(301a)とFU#2(301c)のように、計算機能力が同一ではない機能ユニットが一対でも存在すれば、ミニコア300の全計算機能力は分散されうる。また、演算素子A(320a)のように、ある一部の演算素子が、あらゆる機能ユニット301a〜301dに共通的であるとしても、演算素子B(321b)、C(322)、D(323)、及びE(324)のように、そうではない演算素子が1つでも存在すれば、ミニコア300の全計算機能力は分散されうる。
図4は、本発明の他の実施形態による再構成可能プロセッサを示す。図4を参照すると、再構成可能プロセッサ400は、処理部401、及びモード制御部402を含みうる。
処理部401は、多数のミニコアMC#0〜#19、及びミニコアMC#0〜#19と連結された外部ネットワーク(図示せず、図1の外部ネットワーク102と類似している)を含みうる。すなわち、それぞれのミニコアMC#0〜#19は、本実施形態による再構成可能プロセッサ400の設計基本単位または拡張基本単位になりうる。それぞれのミニコアMC#0〜#19は、図2及び図3のように構成することができる。
処理部401は、2つの実行モードを有しうる。例えば、処理部401は、ループ演算を処理するためのCGAモードとループ演算以外の他の演算を処理するためのVLIWモードとを有しうる。
CGAモードで、処理部401は、CGAモジュール411として動作する。CGAモジュール411は、MC#4ないしMC#19の16個のミニコアと構成メモリ413とを含みうる。構成メモリ413は、処理部401の外部ネットワーク(図示せず)に連結されて、ミニコアMC#4〜#19が外部ネットワークを通じて構成メモリ413に接続させる。それぞれのMC#4ないしMC#19は、あるループを並列処理することが可能である。MC#4ないしMC#19の連結またはネットワーク構造は、CGAモジュール411が処理しようとするループの種類によって最適化されうる。MC#4ないしMC#19の連結構造またはネットワーク構造を表わす設定情報は、構成メモリ413に保存される。言い換えれば、CGAモードで、処理部401は、構成メモリ413に保存された設定情報に基づいて、CGAモジュール411に基づいてあるループを処理することができる。
VLIWモードで、処理部401は、VLIWモジュール412として動作する。VLIWモジュール412は、MC#0ないしMC#3の4個のミニコアとVLIWメモリ414とを含みうる。VLIWメモリ414は、処理部401の外部ネットワーク(図示せず)に連結されて、VILWメモリ414が外部ネットワークを通じて構成メモリ413に接続させる。それぞれのMC#0ないしMC#3は、VLIWメモリ414に保存された超長命令語をVLIWアーキテクチャーによって処理する。言い換えれば、VLIWモードで、処理部401は、VLIWメモリ414に保存された命令によって、VLIWモジュール412に基づいて演算を処理することができる。
追加の態様によって、幾つかのミニコアを、VLIWモード及びCGAモードで共有することができる。例えば、図4で、MC#0ないしMC#4を除き、CGAモジュールで用いられるMC#5ないしMC#8は、VLIWモードでVLIW装置として動作することもできる。
モード制御部402は、CGAモードからVLIWモードへの切り替え、またはVLIWモードからCGAモードへの切り替えを制御する。モード制御部402は、所定のモード切り替え信号またはモード切り替え命令語を生成することができる。例えば、処理部401は、CGAモードでループ演算を処理しながら、モード制御部402のモード切り替え信号によって、VLIWモードに切り替えられ、ループ演算ではない他の演算を処理することができる。この際、ループ実行結果は、グローバルレジスタファイル415に臨時に保存される。また、VLIWモードで動作中である処理部401は、モード制御部402の制御信号によって、CGAモードに切り替えられ、グローバルレジスタファイル415からコンテキスト情報を持って来て、以前に処理するループ演算を引き続き処理することができる。
前述したように、開示された実施形態によれば、全計算機能力を分割して機能ユニットに分配し、その機能ユニットの組み合わせで基本処理単位であるミニコアを設計するために、高周波数環境で不要な資源消耗を最小化すると同時に、性能を高めることが可能である。また、各ミニコアは全計算機能力を有するので、ミニコア単位で再構成可能プロセッサをデザインすれば、優れた拡張性を確保することができる。
CGAは、RISC(Reduced Instruction Set Computer)プロセッサまたはマルチイシュープロセッサ(Multi−Issue Processor)と資源とを共有することができる。前述した再構成可能プロセッサが、マルチイシュープロセッサと資源を共有する時には、マルチイシュープロセッサのそれぞれのイシュースロットは、再構成可能プロセッサのミニコアのうちの1つで形成されるか、再構成可能プロセッサのミニコアのうちの1つの機能ユニットのうちの1つで形成されうる。前述した再構成可能プロセッサは、画像処理プロセッサ(Image Processor:IP)として使われ、ビデオシステム及びオーディオシステムに適用されるか、映像処理及び3Dグラフィック処理に活用されるか、カメラ、MP3プレーヤー、携帯電話、タブレット製品に適用可能である。但し、これは、単に例示に過ぎず、再構成可能プロセッサは、前述した再構成可能プロセッサが提供する長所を活用することができる如何なる活用例にも適用が可能である。
前述した実施形態は、本発明を例示的に説明するためのものであって、本発明の権利範囲が、特定の実施形態に限定されるものではない。
本発明は、再構成可能プロセッサ及び再構成可能プロセッサのミニコア関連の技術分野に適用可能である。
101a〜d、200、300、400 ミニコア
102 外部ネットワーク
201、202、301a〜c 機能ユニット
210〜213、320a〜d、321a〜b、322〜324 演算素子
203、302 内部ネットワーク
401 処理部
402 モード制御部
411 CGAモジュール
412 VLIWモジュール
413 構成メモリ
414 VLIWメモリ
415 グローバルレジスタファイル

Claims (21)

  1. 少なくとも1つのミニコアを含み、
    前記少なくとも1つのミニコアのそれぞれは、互いに異なる計算機能力を有する少なくとも2つの機能ユニットを含む、再構成可能プロセッサ。
  2. 前記それぞれの機能ユニットは、演算を処理するための少なくとも1つの演算素子を含む、請求項1に記載の再構成可能プロセッサ。
  3. 前記それぞれの機能ユニットの計算機能力は、前記それぞれの機能ユニットの内部に形成された前記演算素子の種類に基づいて定められる、請求項2に記載の再構成可能プロセッサ。
  4. 前記それぞれの機能ユニット間に共通しない演算素子が少なくとも1つ存在する、請求項1又は2に記載の再構成可能プロセッサ。
  5. 前記機能ユニットの前記演算素子は、2以上の機能ユニットに含まれる少なくとも1つの演算素子をさらに含む、請求項2乃至4のいずれか一項に記載の再構成可能プロセッサ。
  6. 前記それぞれのミニコアは、前記それぞれの機能ユニットを連結するための内部ネットワークをさらに含む、請求項1乃至5のいずれか一項に記載の再構成可能プロセッサ。
  7. 前記それぞれのミニコアを連結するための外部ネットワークをさらに含む請求項1乃至6のいずれか一項に記載の再構成可能プロセッサ。
  8. 第1演算素子グループを含む第1機能ユニットと、
    前記第1演算素子グループと異なる第2演算素子グループを含む第2機能ユニットと、
    前記第1及び第2機能ユニットを連結するための内部ネットワークを含む複数のミニコアと、
    前記それぞれのミニコアを連結するための外部ネットワークと、
    を含む再構成可能プロセッサ。
  9. 前記第1演算素子グループと前記第2演算素子グループとの間に共通しない演算素子が少なくとも1つ存在する、請求項8に記載の再構成可能プロセッサ。
  10. 前記第1演算素子グループと前記第2演算素子グループは、前記第1演算素子グループと前記第2演算素子グループとにいずれも属する少なくとも1つの演算素子をさらに含む、請求項9に記載の再構成可能プロセッサ。
  11. 前記それぞれのミニコアは、所定の全計算機能力を有し、
    前記第1及び第2機能ユニットは、前記全計算機能力の一部である部分計算機能力を有する請求項1乃至10のいずれか一項に記載の再構成可能プロセッサ。
  12. 前記再構成可能プロセッサは、
    前記ミニコアに基づいたCGA(Coarse Grained Array)またはVLIW(Very Long Instruction Word)プロセッサであることを特徴とする請求項1ないし11のいずれか一項に記載の再構成可能プロセッサ。
  13. 前記それぞれのミニコアは、前記CGAプロセッサまたは前記VLIWプロセッサでの設計基本単位または拡張基本単位と定められる、請求項12に記載の再構成可能プロセッサ。
  14. 前記ミニコアが、コースグレインアレイ(CGA)モードとVLIWモードとを切り換えるように制御するモード制御信号を生成させるモード制御部をさらに含む、請求項1ないし13のいずれか一項に記載の再構成可能プロセッサ。
  15. 前記ミニコアが、前記CGAモードであるときには、第1ミニコアグループがGCAプロセッサで動作し、
    前記ミニコアが、前記VLIWモードであるときには、第2ミニコアグループがVLIWプロセッサで動作する、請求項14に記載の再構成可能プロセッサ。
  16. 前記ミニコアのうちの如何なるものも、前記第1ミニコアグループと前記第2ミニコアグループのいずれにも属しない、請求項15に記載の再構成可能プロセッサ。
  17. 前記ミニコアのうちの少なくとも1つは、前記第1ミニコアグループと前記第2ミニコアグループとにいずれも属する、請求項15に記載の再構成可能プロセッサ。
  18. 前記CGAモードで、前記第1ミニコアグループの間の連結についての設定情報を保存する構成メモリと、
    前記外部ネットワークに連結され、前記CGAモードで、前記第1ミニコアグループのコンテキスト情報を保存するグローバルレジスタファイルと、
    前記外部ネットワークに連結され、前記VLIWモードで、前記第2ミニコアVLIWグループによって処理されるVLIWを保存するVLIWメモリと、
    をさらに含む請求項14乃至17のいずれか一項に記載の再構成可能プロセッサ。
  19. 第1演算素子グループを含む第1機能ユニットと、
    前記第1演算素子グループと異なる第2演算素子グループを含む第2機能ユニットと、
    前記第1及び第2機能ユニットを連結するための内部ネットワークと、
    を含む再構成可能プロセッサのミニコア。
  20. 前記第1演算素子グループと前記第2演算素子グループは、前記第1演算素子グループと前記第2演算素子グループとのうちの如何なるものにも属しない少なくとも1つの演算素子を含む、請求項19に記載の再構成可能プロセッサのミニコア。
  21. 前記第1演算素子グループと前記第2演算素子グループは、前記第1演算素子グループと前記第2演算素子グループとにいずれも属する少なくとも1つの演算素子をさらに含む請求項19又は20に記載の再構成可能プロセッサのミニコア。
JP2012271447A 2011-12-12 2012-12-12 再構成可能プロセッサ及び再構成可能プロセッサのミニコア Pending JP2013122764A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020110133197A KR101912427B1 (ko) 2011-12-12 2011-12-12 재구성가능 프로세서 및 재구성가능 프로세서의 미니 코어
KR10-2011-0133197 2011-12-12

Publications (2)

Publication Number Publication Date
JP2013122764A true JP2013122764A (ja) 2013-06-20
JP2013122764A5 JP2013122764A5 (ja) 2016-02-04

Family

ID=48573130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012271447A Pending JP2013122764A (ja) 2011-12-12 2012-12-12 再構成可能プロセッサ及び再構成可能プロセッサのミニコア

Country Status (4)

Country Link
US (1) US9330057B2 (ja)
JP (1) JP2013122764A (ja)
KR (1) KR101912427B1 (ja)
CN (1) CN103164285B (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101978409B1 (ko) * 2012-02-28 2019-05-14 삼성전자 주식회사 재구성가능 프로세서, 이를 위한 코드 변환 장치 및 방법
KR102204282B1 (ko) * 2013-11-25 2021-01-18 삼성전자주식회사 다수의 기능 유닛을 가지는 프로세서를 위한 루프 스케쥴링 방법
CN103970720B (zh) * 2014-05-30 2018-02-02 东南大学 基于大规模粗粒度嵌入式可重构系统及其处理方法
GB2524346B (en) * 2014-09-19 2016-12-21 Imagination Tech Ltd Separating Cores
CN111158967B (zh) * 2019-12-31 2021-06-08 北京百度网讯科技有限公司 人工智能芯片测试方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508532A (ja) * 2001-03-22 2005-03-31 クイックシルバー テクノロジー、インコーポレイテッド 固定特定用途向け計算要素を有する多様な適応計算装置の異質再構成可能マトリックスを有する適応集積回路
JP2007094847A (ja) * 2005-09-29 2007-04-12 Fujitsu Ltd リコンフィグ可能な集積回路装置
JP2009530924A (ja) * 2006-03-17 2009-08-27 アンテルユニヴェルシテール・ミクロ−エレクトロニカ・サントリュム・ヴェー・ゼッド・ドゥブルヴェ 再構成可能なマルチ処理粗粒アレイ

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4541046A (en) * 1981-03-25 1985-09-10 Hitachi, Ltd. Data processing system including scalar data processor and vector data processor
US5539911A (en) 1991-07-08 1996-07-23 Seiko Epson Corporation High-performance, superscalar-based computer system with out-of-order instruction execution
EP1408403A1 (en) 2001-07-19 2004-04-14 Sony Corporation Calculation apparatus and image processing apparatus
US7194609B2 (en) * 2002-08-08 2007-03-20 Hewlett-Packard Development Company, L.P. Branch reconfigurable systems and methods
JP2005157653A (ja) 2003-11-25 2005-06-16 Ip Flex Kk データ処理装置および処理方法
JP4810090B2 (ja) 2004-12-20 2011-11-09 キヤノン株式会社 データ処理装置
US8082420B2 (en) * 2007-10-24 2011-12-20 International Business Machines Corporation Method and apparatus for executing instructions
CN101236576B (zh) * 2008-01-31 2011-12-07 复旦大学 一种适用于异质可重构处理器的互联模型
KR101636377B1 (ko) * 2009-10-23 2016-07-06 삼성전자주식회사 재구성 프로세서, 재구성 제어 장치 및 방법, 그리고, 스레드 모델링 방법
CN102214158B (zh) * 2011-06-08 2013-05-22 清华大学 一种全互联路由结构动态可重构处理器

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508532A (ja) * 2001-03-22 2005-03-31 クイックシルバー テクノロジー、インコーポレイテッド 固定特定用途向け計算要素を有する多様な適応計算装置の異質再構成可能マトリックスを有する適応集積回路
JP2007094847A (ja) * 2005-09-29 2007-04-12 Fujitsu Ltd リコンフィグ可能な集積回路装置
JP2009530924A (ja) * 2006-03-17 2009-08-27 アンテルユニヴェルシテール・ミクロ−エレクトロニカ・サントリュム・ヴェー・ゼッド・ドゥブルヴェ 再構成可能なマルチ処理粗粒アレイ

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
上野伸也,外3名: "画像認識向け3次元積層アクセラレータ・アーキテクチャの検討", 電子情報通信学会技術研究報告, vol. 第111巻,第259号,(IE2011-61〜76), JPN6016049952, 17 October 2011 (2011-10-17), JP, pages Pages:7〜12 *
弘中哲夫: "粗粒度リコンフィギュラブルプロセッサの動向", 電子情報通信学会技術研究報告, vol. 第105巻,第502号,(CAS2005-70〜74), JPN6016049950, 4 January 2006 (2006-01-04), JP, pages Pages:19〜23 *
武井康浩,外3名: "MIMD演算器アレイ型動的再構成可能アクセラレータを有するヘテロジニアスマルチコアプロセッサのFPGAプラッ", 電子情報通信学会技術研究報告, vol. 第111巻,第259号,(IE2011-61〜76), JPN6016049949, 17 October 2011 (2011-10-17), JP, pages Pages:73〜76 *

Also Published As

Publication number Publication date
CN103164285A (zh) 2013-06-19
US9330057B2 (en) 2016-05-03
KR20130066400A (ko) 2013-06-20
US20130151815A1 (en) 2013-06-13
CN103164285B (zh) 2017-10-27
KR101912427B1 (ko) 2018-10-29

Similar Documents

Publication Publication Date Title
KR101798369B1 (ko) 휴대용 디바이스에서 동기적 태스크 디스패치를 위한 시스템 및 방법
US20150012723A1 (en) Processor using mini-cores
US7020673B2 (en) Reconfigurable arithmetic device and arithmetic system including that arithmetic device and address generation device and interleave device applicable to arithmetic system
US20040019765A1 (en) Pipelined reconfigurable dynamic instruction set processor
JP3559046B2 (ja) データ処理マネージメントシステム
US6108760A (en) Method and apparatus for position independent reconfiguration in a network of multiple context processing elements
US5915123A (en) Method and apparatus for controlling configuration memory contexts of processing elements in a network of multiple context processing elements
US6941446B2 (en) Single instruction multiple data array cell
US9507753B2 (en) Coarse-grained reconfigurable array based on a static router
US20030028750A1 (en) Method and system for digital signal processing in an adaptive computing engine
JP4484756B2 (ja) リコンフィギュラブル回路および処理装置
JP2013122764A (ja) 再構成可能プロセッサ及び再構成可能プロセッサのミニコア
JPH0922404A (ja) 同報通信プロセッサ命令を備えたアレイ・プロセッサ通信アーキテクチャ
US10998070B2 (en) Shift register with reduced wiring complexity
US8024549B2 (en) Two-dimensional processor array of processing elements
US20070074001A1 (en) Reconfigurable integrated circuit device
KR20070061538A (ko) Simd 프로세서 및 데이터 통신 방법
KR20080083417A (ko) 저전력형 컨피규레이션 캐시와 이를 포함하는 재구성형프로세싱 시스템
Abdelhamid et al. MITRACA: A next-gen heterogeneous architecture
JP7250953B2 (ja) データ処理装置、及び人工知能チップ
US20090282223A1 (en) Data processing circuit
Wang et al. Hera: A reconfigurable and mixed-mode parallel computing engine on platform fpgas
EP3089027B1 (en) Simd processing module
JP2007249843A (ja) 再構成可能な演算装置
TWI810262B (zh) 用於計算機器的可變位元寬資料格式的單打包和拆包網路及方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151211

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151211

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170104

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20171003

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180124

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20180201

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20180316