JPH05324694A - 再構成可能並列プロセッサ - Google Patents

再構成可能並列プロセッサ

Info

Publication number
JPH05324694A
JPH05324694A JP4125279A JP12527992A JPH05324694A JP H05324694 A JPH05324694 A JP H05324694A JP 4125279 A JP4125279 A JP 4125279A JP 12527992 A JP12527992 A JP 12527992A JP H05324694 A JPH05324694 A JP H05324694A
Authority
JP
Japan
Prior art keywords
parallel processor
switch circuit
sum
multipliers
multiplier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4125279A
Other languages
English (en)
Inventor
Tomochika Fujioka
与周 藤岡
Mitsutaka Kameyama
充隆 亀山
Tatsuo Higuchi
龍雄 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP4125279A priority Critical patent/JPH05324694A/ja
Publication of JPH05324694A publication Critical patent/JPH05324694A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】 並列プロセッサにおいて、要素プロセッサ
(PE)間の通信オ−バ−ヘッドを減少し、小さな演算
遅れ時間で積和演算の並列処理を実行する。 【構成】 PE1に乗算器2、加算器3、ロ−カルメモ
リ4、スイッチ回路5を備え、各PE1内のスイッチ回
路5間をリング結合網6等の相互結合回路網により結合
する。スイッチ回路5内の接続を切り換えることによ
り、複数個のPE1で種々の個数の乗算器を含む積和演
算器をダイナミックに形成し、積和演算の並列処理を行
う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、スル−プットの向上と
ともに小さな演算遅れ時間が要求される、例えばロボッ
ト制御用などのディジタル制御用高速積和演算並列プロ
セッサに関する。
【0002】
【従来の技術】ロボットマニピュレ−タモデルベ−スト
制御などのディジタル制御では積和演算が主体となる
が、センサ信号が入力されてからマニピュレ−タ制御出
力が行われるまでの演算遅れ時間が小さいことが、制御
特性向上のために必要となる。
【0003】計算量の多い演算を高速に処理する技術と
して、例えば村上による分類(日経エレクトロニクス、
No。521、1991年3月4日号、P165〜P1
85に記載)によると、パイプライン処理などに代表さ
れる時間並列処理と、スーパースカラやVLIWなどに
代表される空間並列処理、及びそれらを組み合わせた時
間+空間並列処理とに大別することができる。
【0004】時間並列処理は、一つの計算結果が出力さ
れてから次の計算結果が出力されるまでの時間を減少す
ることが可能であり、大量の計算を高いスル−プットで
計算することができる。しかし、個々の演算に着目する
と、演算が開始されてから結果が出力されるまでの演算
遅れ時間が大きい。パイプライン段数が多いほど、スル
−プットが向上するが、逆に演算遅れ時間は増加する。
【0005】空間並列処理は、複数個の演算器に均一に
処理を割り当てることにより、原理的に演算遅れ時間を
演算器の台数分の1に減少することが可能である。しか
し、スーパースカラやVLIWでは単一プロセッサチッ
プ内に備えることができる演算器の台数がチップ面積の
制約などにより限られているため、高並列処理が困難で
ある。
【0006】
【発明が解決しようとする課題】複数個の要素プロセッ
サ(PE)を用いる空間並列処理はPEの台数を多くす
ることができ高並列処理が可能であるが、PE間の通信
量が多い場合には遅れ時間が増大する、通信のオ−バ−
ヘッド問題が存在する。従来、制御用並列プロセッサを
構成するためのPEには汎用プロセッサやDSP等が用
いられているが、いずれもプロセッサ外部との入出力に
通信用レジスタへのデータの格納を要するものが多く、
またパラレル入出力ポ−トを1つしか備えていないもの
が大部分である。このようなプロセッサをPEとして用
いた並列プロセッサは、PE間通信に通信用レジスタへ
のデータの格納や同期処理等が必要であり、通信時間が
増大するという問題点があった。
【0007】本発明は、並列プロセッサのPE間通信時
間を減少し、各PEの乗算器や加算器の稼働効率を高め
ることにより、スル−プットの減少とともに演算遅れ時
間の小さいディジタル制御用並列プロセッサを得ること
を目的としており、さらにディジタル制御に必要となる
行列演算等の種類や規模に応じ、PE間データ通信を効
率よくできるように再構成可能並列プロセッサをフレキ
シブルに構成できるPEを提供することを目的としてい
る。
【0008】
【課題を解決するための手段】上記目的を達成するため
に、本発明の並列プロセッサにおいては、PEに乗算
器、加算器、ロ−カルメモリ、スイッチ回路を備えてお
り、複数個のPEのスイッチ回路間を相互結合回路網に
より結合したものである。
【0009】また、PE内に備えられたパイプラインレ
ジスタに対し、その入出力をスイッチ回路に接続し、再
構成された多入力積和演算器へのパイプラインレジスタ
の挿入箇所をダイナミックに設定できるようにすること
が好ましい。
【0010】さらに、PE内の乗算器、加算器の個数は
1個ずつでもよいが、特に各2個以上の乗算器と加算器
をPE内に備えることが効果的である。
【0011】加えて、乗算器、加算器、ロ−カルメモリ
と多入力積和演算器再構成用のスイッチ回路からなる演
算部とともに、再構成を行うための制御部をもPE備
え、1種類のPEにより各種の再構成可能並列プロセッ
サをフレキシブルに構成できるようにするとよい。
【0012】
【作用】上記のように構成された並列プロセッサにおい
て、複数個のPEにより多入力積和演算器を再構成し積
和演算の並列処理を行うと、PE間通信はスイッチ回路
の接続の切換えによる乗算器や加算器などの各入出力間
の直接接続に帰着されるため、従来の並列プロセッサに
おける通信用レジスタへのデータの格納やPE間通信の
同期などが不要となり、通信のオ−バ−ヘッドが大幅に
減少する。
【0013】また、パイプラインレジスタの挿入箇所を
スイッチ回路の切換えにより変更できるようにすること
により、各パイプラインステージ内の演算時間がほぼ等
しくなるようにできるため、再構成された積和演算器を
パイプライン化した場合の演算遅れ時間が小さい。従っ
て、時間+空間並列処理を効率よく行うことが可能とな
り積和演算全体の演算遅れ時間を減少できる。
【0014】さらに、PE内の乗算器、加算器の個数を
2個以上とすることにより、要素プロセッサ内で部分和
を計算することができるため、加算器の最大通過段数が
減少し、小さな演算遅れ時間で多入力積和演算を行うこ
とができる。
【0015】加えて、多入力積和演算を行うための演算
部とともに、PE内に再構成を行うための制御部を備え
ることにより、各種のディジタル制御に対し一種類のP
Eのみを用いてその処理に必要となる積和演算の種類や
計算量に応じ再構成可能並列プロセッサをフレキシブル
に構成できるため、実用性が高い。
【0016】
【実施例】実施例について、図面を参照して説明する
と、図1において、PE1の内部に乗算器2、加算器
3、ロ−カルメモリ4、スイッチ回路5を備える。ロ−
カルメモリ4は読み出しポ−トを3つと書き込みポ−ト
1つを有する4ポ−トRAMである。このうち、2つの
読み出しポ−トを乗算器2の入力に接続する。残りのポ
−トと乗算器2の出力および加算器3の入出力をスイッ
チ回路5に接続する。このスイッチ回路5は図2に示す
ように2つのスイッチ7を相互に接続したものである。
各PE1内のスイッチ回路5をリング結合網6で結合す
る。
【0017】図3に示される実施例では、図1に示され
る実施例に加えてPE11にパイプラインレジスタ16
を備える。まず、ロ−カルメモリ14の4つのポ−トと
乗算器12の出力にパイプラインレジスタ16を挿入す
る。また、1つのパイプラインレジスタ16の入出力を
スイッチ回路15に接続する。このスイッチ回路15は
図4に示すように3つのスイッチ17を相互に接続した
ものである。
【0018】図5に示される実施例では、PE21に2
個の乗算器22、2個の加算器23、ロ−カルメモリ2
4、スイッチ回路25、15個のパイプラインレジスタ
26を備える。ロ−カルメモリ24は9個の読み出しポ
−トと2つの書き込みポ−トを有する11ポ−トRAM
であり、全てのポ−トにパイプラインレジスタ26が挿
入されている。4つの読み出しポ−トは2つの乗算器の
入力に接続されており、残りのポ−トはスイッチ回路2
5に接続されている。また、2つの乗算器22の出力と
2つの加算器23の入出力、および2つのパイプライン
レジスタ26の入出力をスイッチ回路25に接続する。
ここで、乗算器22の出力にはパイプラインレジスタ2
6を挿入する。スイッチ回路25は図6に示すように2
9個のスイッチ27を相互に接続したものである。
【0019】図7に示される実施例では、PE31に乗
算器2、12、22、加算器3、13、23、ロ−カル
メモリ4、14、24、パイプラインレジスタ16、2
6とスイッチ回路5、15、25等から構成される演算
部32と、多入力積和演算器の再構成を制御するための
制御部33を備える。
【0020】
【発明の効果】本発明は、以上説明したように構成され
ているので、以下に記載されるような効果を奏する。
【0021】各PE1のスイッチ回路5内の各スイッチ
7の接続を切り換えることにより、複数のPEによる多
入力積和演算器が再構成される。図1は数1で表される
積和演算を行う場合の再構成例を示している。
【0022】
【数1】
【0023】多入力積和演算器の再構成を行うことによ
り、各PE1間の通信はスイッチ回路5内の各スイッチ
7の切り換えによる乗算器2や加算器3等の各入出力間
の直接接続に帰着される。従って、PE1間の通信のオ
−バ−ヘッドが減少し、小さな遅れ時間で積和演算の並
列処理を行うことができる。
【0024】再構成可能並列プロセッサにおいて、パイ
プライン処理を含む時間+空間並列処理を行う場合、加
算時間が乗算時間と比べて十分小さければ、加算器13
の出力へのパイプラインレジスタ16の挿入箇所をスイ
ッチ回路15により切り換えることで、各パイプライン
ステージの遅れ時間が乗算時間とほぼ等しくなるように
多入力積和演算器を再構成することができる。従って、
全ての加算器13の出力へパイプラインレジスタ16を
挿入する場合と比べてパイプライン段数を少なくするこ
とができるため、演算遅れ時間の小さい時間+空間並列
処理ができる。
【0025】本発明による演算遅れ時間減少効果の例と
して、数2で表される積和演算を図8で示される再構成
可能並列プロセッサにより行う場合と、図10で示され
る並列プロセッサにより行う場合とを比較する。図8で
示される再構成可能並列プロセッサは、PE11を12
個リング結合網46で結合したものである。また、図1
0で示される並列プロセッサは、演算部52、制御部5
3、通信用レジスタ54を備えた従来のプロセッサ51
を12個単一共有バス55により結合したものである。
【0026】
【数2】
【0027】一回の乗算を行う時間を一制御クロック周
期と定義する。PE間通信やロ−カルメモリ14への入
出力を除く一回のPE内の制御を1ステップと定義する
と、加算時間が乗算時間と比較して十分小さい場合図8
の再構成可能並列プロセッサでは図9に示されるように
乗算に1ステップ、加算に1ステップ必要であり、計2
ステップ(2クロック)で数2で表される積和演算を実
行することができる。
【0028】これに対し、図10の並列プロセッサによ
り数2で表される積和演算を行う場合を図11に示す。
積和演算のうち、乗算については1ステップ(1クロッ
ク)で実行することができる。しかし、加算はPE間通
信が必要なため、2ステップ(2クロック)を要する。
PE間通信に要する遅れ時間は、1回のPE間通信を1
クロックで実行できる場合で計9クロックを要するた
め、数2の積和演算を行うために必要となるクロック数
は合計12クロックとなる。しかし、従来のプロセッサ
では1回のPE間通信に数クロックを要するものが多
い。1回の通信に例えば4クロックを要する場合は、数
2の積和演算に要する演算遅れ時間は合計39クロック
となる。
【0029】各2個以上の乗算器と加算器を備えたPE
21による再構成可能並列プロセッサは、PE21内で
部分和を計算することにより、再構成された多入力積和
演算器の最大加算器通過段数を減少することができる。
従って、演算遅れ時間の小さい多入力積和演算を行うこ
とができる。
【0030】演算部32のみを備えたPEによる再構成
可能並列プロセッサは、他に並列プロセッサ全体を制御
するための制御部を必要とする。これに対し、演算部3
2とともにPE31内に制御部33を備えることによ
り、1種類のPE31のみで再構成可能並列プロセッサ
を構成することができる。従って、各種のディジタル制
御に対し、その処理に必要となる積和演算の種類や計算
量に応じて効率よく並列処理を行えるようにフレキシブ
ルに再構成可能並列プロセッサを構成することができ、
実用性が高い。
【図面の簡単な説明】
【図1】再構成可能並列プロセッサの実施例を示す図で
ある。
【図2】図1のスイッチ回路の実施例を示す図である。
【図3】パイプラインレジスタを備えるPEの実施例を
示す図である。
【図4】図3のスイッチ回路の実施例を示す図である。
【図5】各2個の乗算器と加算器を備えるPEの実施例
を示す図である。
【図6】図5のスイッチ回路の実施例を示す図である。
【図7】演算部と制御部を備えるPEの実施例を示す図
である。
【図8】図3のPEからなる再構成可能並列プロセッサ
の実施例を示す図である。
【図9】図8の再構成可能並列プロセッサにより数2で
表される積和演算を実行する場合のステップ数を示す図
である。
【図10】従来のプロセッサからなる並列プロセッサの
実施例を示す図である。
【図11】図10の並列プロセッサにより数2で表され
る積和演算を実行する場合のステップ数を示す図であ
る。
【符号の説明】
1、11、21、31 PE 2、12、22 乗算器 3、13、23 加算器 4、14、24 ロ−カルメモリ 5、15、25 スイッチ回路 6、46 リング結合網 7、17、27 スイッチ 16、26 パイプラインレジスタ 32、52 演算部 33、53 制御部 51 従来のプロセッサ 54 通信用レジスタ 55 単一共有バス

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 乗算器(2、12、22)、加算器
    (3、13、23)、ロ−カルメモリ(4、14、2
    4)と、それらの入出力を互いに接続可能なスイッチ回
    路(5、15、25)とを具備する要素プロセッサ(P
    E)(1、21、31、41)を複数個用い、各スイッ
    チ回路(5、15、25)を相互結合回路網により結合
    し、複数個のPE(1、11、21、31)で種々の個
    数の乗算器を含む積和演算器(以下多入力積和演算器と
    呼ぶ)をダイナミックに形成することができる並列プロ
    セッサ(以下再構成可能並列プロセッサと呼ぶ)。
  2. 【請求項2】 再構成された多入力積和演算器に対する
    パイプラインレジスタ(16、26)の挿入箇所を、各
    パイプラインステージの遅れ時間がほぼ等しくなるよう
    に可変とする方法。
  3. 【請求項3】 各2個以上の乗算器(2、12、2
    2)、加算器(3、13、23)を備えたPE(1、1
    1、21、31)からなる再構成可能並列プロセッサ。
  4. 【請求項4】 乗算器(2、12、22)、加算器
    (3、13、23)、ロ−カルメモリ(4、14、2
    4)、スイッチ回路(5、15、25)等からなる演算
    部(32)に加え、その制御部(33)を備えることに
    より各種のディジタル制御用再構成可能並列プロセッサ
    を容易に構成できるPE(1、11、21、31)。
JP4125279A 1992-05-19 1992-05-19 再構成可能並列プロセッサ Pending JPH05324694A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4125279A JPH05324694A (ja) 1992-05-19 1992-05-19 再構成可能並列プロセッサ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4125279A JPH05324694A (ja) 1992-05-19 1992-05-19 再構成可能並列プロセッサ

Publications (1)

Publication Number Publication Date
JPH05324694A true JPH05324694A (ja) 1993-12-07

Family

ID=14906144

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4125279A Pending JPH05324694A (ja) 1992-05-19 1992-05-19 再構成可能並列プロセッサ

Country Status (1)

Country Link
JP (1) JPH05324694A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219919A (ja) * 1994-01-28 1995-08-18 Mitsubishi Electric Corp 数値演算処理装置
JP2007522699A (ja) * 2003-12-29 2007-08-09 ザイリンクス インコーポレイテッド カスケード接続するdspスライスを備えた集積回路
JP2008090768A (ja) * 2006-10-05 2008-04-17 Nippon Telegr & Teleph Corp <Ntt> 並列演算システム
US7512873B2 (en) 2006-03-22 2009-03-31 Fujitsu Microelectronics Limited Parallel processing apparatus dynamically switching over circuit configuration
US7734896B2 (en) 2005-09-29 2010-06-08 Fujitsu Microelectronics Limited Enhanced processor element structure in a reconfigurable integrated circuit device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07219919A (ja) * 1994-01-28 1995-08-18 Mitsubishi Electric Corp 数値演算処理装置
JP2007522699A (ja) * 2003-12-29 2007-08-09 ザイリンクス インコーポレイテッド カスケード接続するdspスライスを備えた集積回路
US7734896B2 (en) 2005-09-29 2010-06-08 Fujitsu Microelectronics Limited Enhanced processor element structure in a reconfigurable integrated circuit device
US7512873B2 (en) 2006-03-22 2009-03-31 Fujitsu Microelectronics Limited Parallel processing apparatus dynamically switching over circuit configuration
JP2008090768A (ja) * 2006-10-05 2008-04-17 Nippon Telegr & Teleph Corp <Ntt> 並列演算システム

Similar Documents

Publication Publication Date Title
US5226171A (en) Parallel vector processing system for individual and broadcast distribution of operands and control information
JP3573755B2 (ja) 画像処理プロセッサ
US4872133A (en) Floating-point systolic array including serial processors
US5081573A (en) Parallel processing system
US20120278590A1 (en) Reconfigurable processing system and method
Ruetz The architectures and design of a 20-MHz real-time DSP chip set
EP0380100A2 (en) Multiplier
Chalamalasetti et al. MORA-an architecture and programming model for a resource efficient coarse grained reconfigurable processor
EP0395240B1 (en) High speed numerical processor
US5016011A (en) Increased performance of digital integrated circuits by processing with multiple-bit-width digits
Sahin et al. Feasibility of floating-point arithmetic in reconfigurable computing systems
JPH05324694A (ja) 再構成可能並列プロセッサ
US5025257A (en) Increased performance of digital integrated circuits by processing with multiple-bit-width digits
US20070198811A1 (en) Data-driven information processor performing operations between data sets included in data packet
US20210326116A1 (en) High precision decomposable dsp entity
EP1936492A1 (en) SIMD processor with reduction unit
US5034909A (en) Digit-serial recursive filters
Fujioka et al. Design of a reconfigurable parallel processor for digital control using FPGAs
US6792442B1 (en) Signal processor and product-sum operating device for use therein with rounding function
Bhadra et al. Design and Analysis of High-Throughput Two-Cycle Multiply-Accumulate (MAC) Architectures for Fixed-Point Arithmetic
Digeser et al. Instruction set extension in the NIOS II: A floating point divider for complex numbers
Fujioka et al. 2400-MFLOPS reconfigurable parallel VLSI processor for robot control
Sasipriya et al. Vedic Multiplier Design Using Modified Carry Select Adder with Parallel Prefix Adder
JPH07141148A (ja) パイプライン並列乗算器
El-Atfy et al. Accelerating matrix multiplication on fPGAs