JPH0497482A - ベクトル演算装置 - Google Patents

ベクトル演算装置

Info

Publication number
JPH0497482A
JPH0497482A JP21495890A JP21495890A JPH0497482A JP H0497482 A JPH0497482 A JP H0497482A JP 21495890 A JP21495890 A JP 21495890A JP 21495890 A JP21495890 A JP 21495890A JP H0497482 A JPH0497482 A JP H0497482A
Authority
JP
Japan
Prior art keywords
vector
arithmetic device
calculation
vector arithmetic
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP21495890A
Other languages
English (en)
Inventor
Masaharu Kimura
雅春 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP21495890A priority Critical patent/JPH0497482A/ja
Publication of JPH0497482A publication Critical patent/JPH0497482A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 高速数値演算のために多数のデータに対し単一の演算を
行うベクトル演算装置に関し、配線領域を小さくすると
共に、レイアウトを容易に行うことを目的とし、 複数の独立なパンク構成のRAMと、同時に動作する数
が前記RAMの数以下の複数の演算パイプと、前記複数
のRAMの出力と前記複数の演算パイプの入力との間に
設けられたスイッチマトリクス型のセレクタ回路と、前
記複数の演算パイプの出力と前記複数のRAMの入力と
の間に設けられたスイッチマトリクス型のマルチプレク
サ回路とを具備するように構成する。
[産業上の利用分野] 本発明はベクトル演算装置に関し、特に、高速数値演算
のために多数のデータに対し単一の演算を行う(Sin
gle In5truction Multiple 
Data:SIMD)ベクトル演算装置に関する。
近年、計算機処理の高速化の要求は強く、高性能化が新
しい市場を作り出しているのが実情である。ところで、
従来、高性能化は大型計算機などで対応されてきたが、
最近ではワークステーションやパソコンなどの個人が自
由に使える環境としても高速数値計算の要求が強(なっ
ている。そのため、多数のデータに対し単一の演算処理
を行って、高速数値演算をより一層向上させることので
きるベクトル演算装置が要望されている。
〔従来の技術] 従来、数値演算の高速化は、大型汎用計算機、スーパコ
ンピュータ等で行なわれてきており、クロックの高速化
、並列演算(演算パイプライン)の実行、また、最近で
は、VLIW(Very Long In5truct
ionWords)など、処理の高速化が行なわれてい
る。しかし、これらをワークステーションやパソコン(
パーソナルコンピュータ)のレベルで適用しようとする
と、プリント板の増大1発熱、コストの点で問題である
また、数値計算の高速化のために浮動小数点演算用LS
Iなどが開発され、ワークステーションレベルでも使用
されているが、これらは、単一のデータに対して単一の
演算を行う(スカラ演算:ベクトル演算に対比される)
ものであるが、演算データのメモリから読出、書込およ
び演算制御を行うため高速化の面で問題があった。
〔発明が解決しようとする課題〕
ところで、数値処理の高速化のためには、■複数の演算
を同時に実行するために演算回路を複数もち、クロック
に同期して複数のデータを演算する演算パイプラインを
採用すること、■演算パイプラインに連続してデータを
供給する高速なデータバスを使用すること、■クロック
を高速化すること、が有効である。
しかし、クロックの高速化と演算パイプ(演算パイプラ
イン)の演算性能に見合ったデータを供給するために演
算データを外部メモリから毎回転送すると、外部メモリ
のアクセスタイムおよび外部バスの転送速度の制限から
、十分な演算性能を発揮させることができない。具体的
に、例えば、100MFLOPSの演算性能を達成する
には、10nsec、毎にデータを供給する必要がある
が、外部メモリおよび外部バスにより、この性能を満た
すためにはECL回路を採用しなければならず、コスト
的には高価となる。この対策として、演算パイプとラン
ダムアクセスメモリ(RAM)をLSI化するものがあ
る。すなわち、演算データをLSI内部のRAMに格納
しておき、演算をRAMからの読出、演算およびRAM
への格納により実行するものがある。
この場合の問題点は、RAMの入出力データの読み出し
書き込みと演算パイプに連続してデータを供給するため
の制御方法にある。
第11図はベクトル演算装置の一例を示すブロック図で
ある。
この第11図に示すベクトル演算装置は、上述した問題
点に鑑みて、研究・開発されたLSI化に通したベクト
ル演算装置を示すものである。
第11図のベクトル演算装置は、複数の独立なバツク構
成のRAM(RAM#O,RAMII)111,112
と、複数の演算パイプ(ADDER,MULT)121
,122と、RAMIII、 112の出力と演算パイ
プ121、I22の入力との間に設けられたセレクタ回
路(SEL#帆SEL#1)131 、132と、演算
パイプ121 、122の出力とRAMIII、 11
2の入力との間に設けられたマルチプレクサ回路(MP
X#O,MPX#1)14L142とを備えている。こ
こで、RA門11L112の出力は、2系統設けられて
いて、RAMIII、112とセレクタ回路13L 1
32との間および演算パイプ121゜122とマルチプ
レクサ回路141.142との間の配線数は、それぞれ
512本(64x4x2=512)および256本(6
4x4=256)必要となり、配線が占有する領域が広
くなり、レイアウトし難いという問題がある。
第12図は第11図のベクトル演算装置におけるセレク
タ回路の構成を示す図であり、RAMIII、 112
およびセレクタ回路131,132の基本的回路を示す
ものである。同図に示されるように、セレクタ回路13
1 、132をANDゲートおよびORゲートで構成す
ると、RAMIII、 112とセレクタ回路13L1
32Rとの間の配線領域WSは、WS = 512本×
256本×面積係数となり、配線領域−3が相当広くな
り、高集積化および微細化の要求に反することになる。
同図中、参照符号S0およびS、は、選択信号で一方の
選択信号SoまたはS、が高レベルとなることによって
、RAM1121またはRAM112の出力がセレクタ
回路131,132を介して出力されるようになってい
る。
このように、第11図および第12図に示すベクトル演
算装置は、配線が占有する領域が広くなり高集積化およ
び微細化を行うことができず、レイアウトし難いという
課題がある。
本発明は、上述した従来のベクトル演算装置が有する課
題に鑑み、配線領域を小さくすると共に、レイアウトを
容易に行うことを目的とする。
〔課題を解決するための手段〕
第1図は本発明に係るベクトル演算装置の原理を示すブ
ロック回路図である。
本発明によれば、複数の独立なバンク構成のRA?+1
1 、12と、同時に動作する数が前記RAMの数以下
の複数の演算パイプ21、22と、前記複数のRAMI
I。
12の出力と前記複数の演算パイプ21、22の入力と
の間に設けられたスイッチマトリクス型のセレクタ回路
3と、前記複数の演算パイプ21、22の出力と前記複
数のRAMII、12の入力との間に設けられたスイッ
チマトリクス型のマルチプレクサ回路4とを具備するベ
クトル演算装置が提供される。
〔作 用〕
本発明のベクトル演算装置は、第1図に示されるように
、セレクタ回路3およびマルチプレクサ回路4は、横方
向と縦方向に交差するマトリクス型に配線され、各交点
個所には、それぞれスイッチ素子30および40が配置
されている。ここで、l’lAMIL12とセレクタ回
路3との間および演算パイプ21 、22とマルチプレ
クサ回路4との間の配線数は、それぞれ256本(64
x4=256)および128本(64x2・128)で
よいことになり、第11図のベクトル演算装置に比較し
て半分の数で済むことになる。
第1図では、RAMのバンク数および演算パイプの数は
2木とされているが、これらの数が増えると配線数が増
大するが、本発明では、第11図のベクトル演算装置の
配線数の(1/n) ”で済むことになる(nはRAM
の数)。
第2図は本発明のベクトル演算装置におけるセレクタ回
路の構成を示す図であり、RAMII、12およびセレ
クタ回路30基本的回路を示すものである。
同図に示されるように、セレクタ回路3は、スイッチマ
トリクス型として構成されている。すなわち、R静11
.12から横方向に延びる配線と演算パイプ21.22
へ向かう縦方向の配線との各交点個所にN−MOSパス
トランジスタ3oがスイッチ素子としてそれぞれ設けら
れている。ここで、スイッチ素子30としては、選択信
号(コントロール信号)S、、S。
でその入力を出力へ伝播させるが、ハイインピダンスで
オフにするものなら何でも使用することができる。また
、マルチプレクサ回路4のスイッチ素子40についても
同様である。
第3図は第2図のセレクタ回路におけるスイッチ素子の
例を示す図である。同図に示されるように、スイッチ素
子30(マルチプレクサ回路4におけるスイッチ素子4
0)としては、第3図(a)のトライステート素子、第
3図(b)のCMOSパストランジスタ、第3図(c)
のP−MOSパストランジスタ、および、第3図(d)
のクロックゲート等が使用可能である。ここで、上述し
たように、出力が高インピーダンス状態(High−Z
)になるものなら何でもスイッチ素子として使用するこ
とができる。
本発明では、配線領域−3は、WS = 256本×2
56本×配線係数となるため、第12図における配線領
域WSの172となっている。さらに、縦方向の配線と
横方向の配線とを異なる配線層に形成し、スイッチ素子
30 (40)を配線の下に埋め込んで形成することに
より、レイアウトを簡略化できると共に、セレクタ回路
3(マルチプレクサ回路4)が占有する面積を一層減少
させて高集積化および小型化の要求を満足させることが
できる。
第4図は第1図のベクトル演算装置におけるノマツクタ
イミング信号を示す図である。同図に示されるように、
タイミング信号として、RAMのノX゛ツク数に対応し
たバンク信号を出力する回路を設け、そのバンク信号に
従って、RA?lの続出、セレクタ。
演算、 RA?’l書込を行うようにすれば、タイミン
グ制御が簡単になる。すなわち、基本的には、演算パイ
プ(21、22)の本数とRAMのバンク(ICl3)
の数を同一とし、且つ、バンクタイミング信号もパイプ
ライン数と同じにしておけば効率的なパイプライン処理
を行うことができる。
[実施例〕 以下、図面を参照して本発明に係るヘクトル演算装置の
実施例を説明する。
第5図は本発明のベクトル演算装置の基本構成を示す図
であり、演算パイプライン(演算パイプ21、22)を
2本とし、それに対応してRAM(11,12)をバン
ク構成にして2組(2バンク)設けるようにしたものを
示している。そして、本ベクトル演算装置において、R
A?+11.12の出力と演算パイプ21.22の入力
との間にはスイッチマトリクス型のセレクタ回路3が設
けられ、また、演算パイプ21、22の出力とRAMI
I、12の入力との間にはスイッチマトリクス型のマル
チプレクサ回路4が設けられている。
ここで、セレクタ回路3およびマルチプレクサ回路4は
、第2図および第3図を参照して説明したものと、同様
なスイッチマトリクス型の構成となっている。
演算では、2組のデータをRAMII、12から読み出
し、セレクタ回路3により所要の演算パイプ21、22
へデータを供給し、演算パイプ21.22の出力を演算
結果として所要のRAMバンク(RAM)11.12へ
データを書き込む。第5図のベクトル演算装置において
、RAMの読出しは、読み出しデータが2組、書き込み
データが1組の3ポートRA?Iになっているため、ク
ロック信号φに従って、RAMII、12のアドレスが
ラッチ51により順次シフトされる。ここで、シフトの
終りに、加算器によりアドレスが一定値だけ更新される
ようになっており、更新されたアドレスは、アドレスマ
ルチプレクサにより、再度、RAMアドレスとなりベク
トル演算が行なわれる。
ここで、タイミング発生回路は示さないが、基本的なバ
ンク信号として選択信号S0でRAMII (RAM#
O)からデータを読み出して加算し、選択信号S、でそ
の結果をRAMIIへ書込む。同時に、RAM12(R
A?I#1)からデータを読み出し、加算器に入力して
結果を選択信号S0でRAM12へ書き込む。また、書
き込み動作は、乗算についても同様であり、RAAl1
12の読出、演算、書込、加算パイプ(加算パイプライ
ン)乗算パイプ(乗算パイプライン)が、パイプライン
で動作するようになっている。
以上の説明では、ベクトル演算すべきデータは、最初か
らRA?111,12に格納されているものとしたが、
実際には、外部メモリよりベクトル演算すべきデータの
ロード/ストアを演算パイプ(演算パイプライン)の一
種とみなして、動作をさせる必要がある。さらに、上述
のベクトル演算装置は、LSI化し易い構成であり、1
チップにLSI化することは、性能、コスト実装の点で
非常に効果が大きく、そのため、EWS 、パソコンレ
ベルでも安価に高性能のベクトル演算装置を提供するこ
とができ、その効果は非常にわかり易く、且つ、応用範
囲も広いものである。尚、説明のために演算パイプ21
22、RAMII、12のバンク数タイミングは2本と
したが、実際には、この数に限定されるものではないの
はもちろんである。
第6図は本発明のベクトル演算装置の一実施例を示すブ
ロック回路図である。
第6図に示されるように、本実施例のベクトル演算装置
は、N個の独立なバンク構成のRAMII、1213.
14と、同時に動作する数がN個の演算パイプ2122
.23.24(24a、24b)と、RAM11〜14
の出力と演算パイプ21〜24の入力との間に設けられ
たスイッチマトリクス型のセレクタ回路3と、演算パイ
プ21〜24の出力とRAMII〜14の入力との間に
設けられたスイッチマトリクス型のマルチプレクサ回路
4とを備えている。さらに、ベクトル演算装置は、外部
メモリが接続されたデータバスを介して命令を受は取る
命令レジスタ6と、アドレスバスを介してアドレスを受
は取ると共に、該命令レジスタ6の出力を受は取る制御
部7を備えている。この制御部7は、書込アドレス、続
出アドレス1.続出アドレス2を出力してRAM11〜
14の所定の書込および続出アドレスを指定すると共に
、バンク信号(選択信号)So、S+、Sz、S+を出
力して、セレクタ回路3およびマルチプレクサ回路4を
制御するようになっている。このベクトル演算装置は、
集積回路装置として構成するのに適したものである。
17A旧1〜14(RA肘0. RA)I#1 、 R
AM#2. RAM#3)は、1ボートライト/2ボー
トリードの3ボ一トRAMセルにより構成され、対応す
るRA?Iアドレス入力と、 RA?1データ出力(2
ポート)と、 RAMデータ入力(lポート)を有して
いる。第6図に示されるように、N個の演算パイプ21
〜24は、ADDER(21) 、 MtlLT (2
2) 、 D IV (23)およびLOAD/5TO
RE(24;24b、24a)の各回路で構成されてい
る。演算パイプのADDERパイプ21. ?’1UL
Tバイブ22およびDIVパイプ23は、それぞれ2組
のオペランド入力を有し、演算結果を発生する。LOA
D/5TOREパイプ24は、外部データバスから外部
データをロード側バイブ経出でRAMII〜14へ格納
し、RAMII〜14のデータはストア側パイプにより
外部データバスから外部メモリへ転送される。ここで、
ADDERパイプ21 、 ?IULTパイプ22.D
Iシバイブ23およびLOAD/5TOREパイプ24
は、同時動作するがLOAD24bおよび5TORE2
4aは、同時には動作せず、片方ずつ使用されるように
なっている。
RAM0書込アドレスは、制御部7から命令コードをデ
コードすることで発生されるようになっており、クロッ
ク信号φにより次のラッチ51へと順次シフトされ、そ
れぞれのRAMII〜14のアドレス信号となる。また
、各演算パイプ21〜240入出力には、ラッチ52が
設けられていて、データをランチしてパイプライン動作
を行うようになっている。
セレクタ回路3は、バンク信号(選択信号)S0S+、
Sz、S3に従って、所要のRAMバンク11〜14か
らデータを所要の演算パイプ21〜24に演算すべきオ
ペランドデータをセレクトするようになっている。
また、マルチプレクサ回路4は、選択信号S、、S。
S2.S3に従って、演算結果を所要のRAMバンク1
1〜14へ書き込むようにマルチプレクサを行っている
。そして、制御部7は、データバス(外部データバス)
を経由して外部メモリ(図示しない)からベクトル演算
命令を受は取り、命令のデコードおよび演算の起動を行
って、所要のアドレス信号(書込アドレス信号、読出ア
ドレス信号1.読出アドレス信号2)を発生し、且つ、
選択信号So、5tS2+S3を順次発生するようにな
っている。
第7図は第6図のベクトル演算装置におけるバンクタイ
ミング信号を示す図であり、第8図は第6図のベクトル
演算装置で処理されるベクトル命令の例を示す図である
具体的に、例えば、FORTRANでの加算ループは、
以下のようにベクトル命令にコンパイルされる。
DOj−帆3.■ C(i) −A(i) +B(i) ↓ VL  VRO VL  VRI VA  VROVRI VS  VR2 また、ベク なる。
(]) 外部メモリから、 命令(1) 命令(2) 命令(3) 命令(4) 次のように ・・・ νRo  4−A(i) ・・・ VR,← B(i) ・・・ VR2← vR0+vRI ・・・ C(i)  ← VR。
トル演算装置の動作は、 R2 ベク トル命令(1)をフェッ チして命令デコードする。
(2)外部メモリから、オペランドデータA(i)をベ
クトルロードしてVR,)に格納する。
(3)外部メモリからベクトル命令(2)をフェッチし
て命令デコードする。
(4)外部メモリからオペランドデータB (i)をベ
クトルロードしてVR,へ格納する。
(5)外部メモリから、ベクトル命令(3)をフェッチ
して命令デコードする。
(6)  VRoとVR,を加算してVR2へ格納する
(7)外部メモリから、ベクトル命令(4)をフェッチ
して命令デコードする。
(8)外部メモリへ、VR2のデータをベクトルストア
する。
第9図は第6図のベクトル演算装置におけるバンクタイ
ミングとセレクタ/マルチプレクサのタイミング割り当
てを説明するための図である。第6図および第9図に示
されるように、ベクトルアット(V^)命令は、まず、
選択信号S0のタイミングでRAMI 1 (RA?1
tlO)からデータを読み出して八〇D(八〇DER)
パイプ21へ入力する。次いで、選択信号S、のタイミ
ングでRAM12(RAMI1)から次のデータを読出
してADDパイプ21へ入力する。さらに、選択信号S
3のタイミングでADDパイプ21の結果をRAMII
ヘデータ書デーみする。そして、選択信号S。のタイミ
ングで次の結果をRAM12へ書き込む。以下、所要の
データ長まで、この動作をパイプライン的に繰り返す。
ここで、ヘクトルマルチプライ(VM)命令は、タイミ
ングS1でRA?111からデータを読み出し、且つ、
乗算して、タイミングS0で最初の乗算結果をRA?1
11へ書き込む。ベクトルロード(VD)命令は、タイ
ミングS2でRAMIIからデータを読み出し、且つ、
除算して、タイミングSlで最初の除算結果をRAM1
1へ書き込む。ベクトルストア(νS)命令は、タイミ
ングS3でRA?’lllからデータを読み出して外部
メモリへデータ転送する。ベクトルロード(νL)命令
は、タイミングStでRAMIIへ外部メモリのデータ
を転送する。
第10図は第6図のベクトル演算装置におけるパイプラ
イン動作の一例を説明するための図である。
まず、最初のVL命令(ベクトルロード命令)の後、必
要なデータを全て外部メモリから転送してくる。
このとき、データバスが使用中の間、次のVL命令は実
行できない。そして、最初のVL命令が終了すると、次
のνL命令が実行され、次のデータを外部メモリから読
み込む。このとき、同時に、VA命令(ベクトルアンド
命令)が実行開始される。この時点では、ロードパイプ
24 (24b)とADD (八DDER)パイプ21
の2本が同時に動作している。次のVL命令の実行終了
により、データバスが空くので、vS命令(ベクトルス
トア命令)が実行開始される。この時点では、−時的に
、ADDバイブ21とストアパイプ24 (24a)が
同時に動作している。
上述した実施例では、RAMの分割数Nを4としたが、
これは任意の数で良い。さらに、ロード/ストアパイプ
も片方ずつしか同時には動作しないようにしたが、ベク
トル命令入力も含めて端子の割り当ては、LSIの端子
に自由に割り当てることができ、共用してもよく、また
、独立させることもできる。そして、演算パイプの数や
種類等の構成は、上述した実施例に限定されるものでは
なく、また、パイプライン動作も実施例に限定されない
のはいうまでもない。
〔発明の効果〕
以上、詳述したように、本発明のベクトル演算装置は、
複数のI?AMと複数の演算パイプとの間に設けられる
セレクタ回路およびマルチプレクサ回路をスイッチマト
リクスとして構成することによって、配線領域を小さく
すると共に、レイアウトを容易に行うことができる。
【図面の簡単な説明】
第1図は本発明に係るベクトル演算装置の原理を示すブ
ロック図、 第2図は本発明のベクトル演算装置におけるセレクタ回
路の構成を示す図、 第3図は第2図のセレクタ回路におけるスインチ素子の
例を示す図、 第4図は第1図のベクトル演算装置におけるハツクタイ
ミング信号を示す図、 第5図は本発明のベクトル演算装置の基本構成を示す図
、 第6図は本発明のベクトル演算装置の一実施例を示すブ
ロック回路図、 第7図は第6図のベクトル演算装置におけるバンクタイ
ミング信号を示す図、 第8図は第6図のベクトル演算装置で処理されるベクト
ル命令の例を示す図、 第9図は第6図のベクトル演算装置におけるバンクタイ
ミングとセレクタ/マルチプレクサのタイミング割り当
てを説明するための図、第10図は第6図のベクトル演
算装置におけるパイプライン動作の一例を説明するため
の図、第11図はベクトル演算装置の一例を示すブロッ
ク図、 第12図は第11図のベクトル演算装置におけるセレク
タ回路の構成を示す図である。 (符号の説明) ICl3,13.14・・・RAM(バンク構成のRA
M)、21.22,23.24(24a、24b)−演
算バイブ、3・・・セレクタ回路(スイッチマトリクス
型セレクタ回路)、 30・・・セレクタ回路のスイッチ素子、4・・・マル
チプレクサ回路(スイッチマトリクス型マルチプレクサ
回路)、 40・・・マルチプレクサ回路のスイッチ素子、5L5
2・・・ラッチ、 6・・・命令レジスタ、 7・・・制御部、 So、 S+ 、52.Sol・・・選択信号、φ・・
・クロツク信号。 (a) (b) (c) (d) 第2図のセレクタ回路におけるスイ/す素子、1例を示
す図 バ/クタイミ/グ18号を示す図 第4図 タイミング信号を示す図 第7図 ペクトIし口 ド副佇 ベタ1ルストア晶令 ベタ1ルア・ド命令 べ、クトルマルテ6″6片 ベクトルテハイド命令 口]=T■] 口■丁■口 口]=下=■コ ロ■=丁[■口 ロ]−丁[■口 第6図のベクlル演算装置で鷺理づれるベタ1ル品令の
例を示す図 ポ8図

Claims (1)

  1. 【特許請求の範囲】 1、複数の独立なバンク構成のRAM(11、12)と
    、同時に動作する数が前記RAMの数以下の複数の演算
    パイプ(21、22)と、 前記複数のRAMの出力と前記複数の演算パイプの入力
    との間に設けられたスイッチマトリクス型のセレクタ回
    路(3)と、 前記複数の演算パイプの出力と前記複数のRAMの入力
    との間に設けられたスイッチマトリクス型のマルチプレ
    クサ回路(4)とを具備するベクトル演算装置。 2、前記ベクトル演算装置は、1チップ内に形成された
    集積回路として構成されている請求項第1項に記載のベ
    クトル演算装置。 3、前記ベクトル演算装置は、前記RAMの数と等しい
    タイミングのバンク信号を発生するバンク信号発生回路
    をさらに備え、前記スイッチマトリクス型セレクタおよ
    び前記スイッチマトリクス型マルチプレクサが該バンク
    信号のタイミング順序でシーケンシャルに動作するよう
    になっている請求項第1項に記載のベクトル演算装置。 4、前記ベクトル演算装置は、ラッチ回路をさらに具備
    し、該ラッチ回路により前記バンク構成のRAMのアド
    レスが保持され、次のバンクに対してアドレスを遅らせ
    て供給するようになっている請求項第3項に記載のベク
    トル演算装置。 5、前記ベクトル演算装置は、データ転送経路のラッチ
    段数が全て等しくなっている請求項第3項に記載のベク
    トル演算装置。 6、請求項第1項に記載のベクトル演算装置と、外部メ
    モリと、該ベクトル演算装置および該外部メモリを接続
    するバスとを具備するベクトル演算システム。 7、前記ベクトル演算装置が複数個設けられ、該複数の
    ベクトル演算装置から任意の1つを選択する選択手段を
    さらに備えた請求項第6項に記載のベクトル演算システ
    ム。
JP21495890A 1990-08-16 1990-08-16 ベクトル演算装置 Pending JPH0497482A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21495890A JPH0497482A (ja) 1990-08-16 1990-08-16 ベクトル演算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21495890A JPH0497482A (ja) 1990-08-16 1990-08-16 ベクトル演算装置

Publications (1)

Publication Number Publication Date
JPH0497482A true JPH0497482A (ja) 1992-03-30

Family

ID=16664383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21495890A Pending JPH0497482A (ja) 1990-08-16 1990-08-16 ベクトル演算装置

Country Status (1)

Country Link
JP (1) JPH0497482A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293538A (ja) * 2005-04-07 2006-10-26 Renesas Technology Corp 演算システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293538A (ja) * 2005-04-07 2006-10-26 Renesas Technology Corp 演算システム

Similar Documents

Publication Publication Date Title
CN114238204B (zh) 可重构并行处理
KR0125623B1 (ko) 데이타 프로세서 및 데이타 처리방법
US5301340A (en) IC chips including ALUs and identical register files whereby a number of ALUs directly and concurrently write results to every register file per cycle
KR101918464B1 (ko) 스위즐드 버추얼 레지스터 기반의 프로세서 및 스위즐 패턴 제공 장치
JPH03144783A (ja) 入出力システム
JP2012023750A (ja) 専用プロセッサ装置を含むプログラマブルロジック集積回路装置
JPH11212786A (ja) レジスタベースデータ処理のためのデータパスおよび方法
US7409529B2 (en) Method and apparatus for a shift register based interconnection for a massively parallel processor array
TW544603B (en) Designer configurable multi-processor system
US8024549B2 (en) Two-dimensional processor array of processing elements
CN111656339A (zh) 存储器装置及其控制方法
JP3573506B2 (ja) 述語、及びブール式を解くためのコンピュータ・システム、及び方法
US20020032710A1 (en) Processing architecture having a matrix-transpose capability
JP2009059346A (ja) 複数のマルチモードプロセッサに接続するための方法および装置
JPH0497482A (ja) ベクトル演算装置
US7035991B2 (en) Surface computer and computing method using the same
US20020138535A1 (en) SIMD sum of product arithmetic method and circuit, and semiconductor integrated circuit device equipped with the SIMD sum of product arithmetic circuit
KR100960148B1 (ko) 데이터 프로세싱 회로
JP7213095B2 (ja) ベクトルレジスタのアクセス
WO2002015000A2 (en) General purpose processor with graphics/media support
JPH09101889A (ja) パイプライン演算装置
Smith et al. FPC: a floating-point processor controller chip for systolic signal processing
EP0226103A2 (en) Address generation for cellular array processors
WO2003044688A2 (en) Latency tolerant processing equipment
Smith et al. A programmable floating-point cell for systolic signal processing