JPS63104179A - ベクトル処理装置 - Google Patents

ベクトル処理装置

Info

Publication number
JPS63104179A
JPS63104179A JP24962986A JP24962986A JPS63104179A JP S63104179 A JPS63104179 A JP S63104179A JP 24962986 A JP24962986 A JP 24962986A JP 24962986 A JP24962986 A JP 24962986A JP S63104179 A JPS63104179 A JP S63104179A
Authority
JP
Japan
Prior art keywords
data
address
register
vector
sent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24962986A
Other languages
English (en)
Inventor
Meiji Sakata
坂田 明治
Shunichi Torii
俊一 鳥居
Yoshifumi Takamoto
良史 高本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP24962986A priority Critical patent/JPS63104179A/ja
Publication of JPS63104179A publication Critical patent/JPS63104179A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【産業上の利用分野〕 本発明はベクトル処理装置に係り、特にソートや高速フ
ーリエ変換の様に、異なるベクトル要素間の演算に好適
なベクトル処理装置に関する。 〔従来の技術〕 半分ずつがソートされているときに、全体をソートする
バイトニックソート法については、ソーティングアンド
サーチング(SORTING ANDSEARCHIN
G) V OL 、 3  クヌース(Knuth)著
第5章232〜233項に記載されているように、比較
対象となる要素の番号が一定規則に従って変化する。こ
れに対して本出願人発行のHITACS−810処理装
置に記載のようにベクトルレジスタを備えたスーパコン
ピュータは同一要素番号のデータしか比較出来ず、その
ため、従来バイトニックソート法は主記憶と主記憶の間
でのみ行なわれていた。 また、主記憶と主記憶の間で演算を行なう場合において
もデータの間接アドレス等を用いていた。 〔発明が解決しようとする問題点〕 上記従来技術はベクトルレジスタ間の要素番号の異なる
要素間の演算について配慮がされておらず、パイトニッ
クソート法の様に比較する要素番号が異なる要素の演算
を行なうには、一度主記憶にデータを格納した後に、要
素の順序を変えて同一要素間の演算に帰着できる様にベ
クトルレジスタに読み出す必要があった。このため、ベ
クトルレジスタ、主記憶間のデータ転送回数が多くなる
という問題があった。 本発明の目的は、一定規則に従って、異なる要素間の演
算を行ない、特にベクトルレジスタと主記憶間のデータ
転送回数を削減し高速化することにある。 また、主記憶と演算器間の処理では、間接アドレスを生
成することなく演算を可能とする。 〔問題点を解決するための手段〕 上記目的は、ベクトルレジスタまたは主記憶上から演算
器へ転送される要素のアドレスを、加算により生成され
たアドレスのビット列とビットバタン生成回路により生
成されたビット列とから、論理回路により生成すること
により達成される。 〔作用〕 ベクトルレジスタから演算器へのデータ転送において、
転送すべきデータのアドレスは加算により生成されるア
ドレスのビット列とビットバタン生成回路により生成さ
れるビット列から、論理回路により生成されるため、パ
イトニックソートの場合、一定規則に従ってビットバタ
ン生成回路で生成されるビット列を変化させることによ
り、データを要速の順序入れがえのために主記憶に格納
することなくベクトルレジスタ上で全データをソート出
来、従って主記憶との転送回数の削減により高速化する
ことができる。 また、主記憶から演算器へのデータ転送においても同様
の手段により異なる要素番号間での演算を間接アドレス
を生成することなしに行なうことができる。 〔実施例〕 以下、本発明の実施例を図に従って詳細に説明する。 第1図は1本発明の1実施例システムの構成図である6
図中、1は命令語レジスタ、2は命令制御回路、3はビ
ットバタン生成回路、4は最小値最大値算定回路、5は
フェッチ/ストアアドレス生成回路、6,7.8は5と
同じフェッチ/ストアアドレス生成回路、9はベクトル
レジスタ、10は主記憶である。 命令語レジスタ1には主記憶1oがら送られて来た命令
語が格納される。命令語の形式は演算を指定するための
oPコードと、入力データの格納されているベクトルレ
ジスタVRI、VR2と、出力データを格納するための
ベクトルレジスタを指定するVH3,VH2と、1本の
ベクトルレジスタに格納されている要素の数を指定する
VLと、目標ソート長を指定するためのパラメータにと
、ビットバタンを指定するためのパラメータBl。 B2とから成る。 ビットバタン生成回路3において16..17は左シフ
ト演算器である。 最小値最大値算定回路4において11,12゜14.1
5はデータ用レジスタであり、13は比較器である。 フェッチ/ストアアドレス生成回路5において18はセ
レクタであり、19.23はアドレス用レジスタであり
、20はビットバタン用レジスタであり、21はアドレ
ス用加算器であり、22はアドレス変更用排他的OR回
路である。 フェッチ/ストアアドレス生成回路6,7.8はフェッ
チ/ストアアドレス生成回路と同様で、レジスタ24,
25.26はアドレスレジスタ23に対応する。 ベクトルレジスタ9には4組のベクトルレジスタVRI
、VR2,VR3,VH2があり、各組は8個の要素デ
ータをもつ。ベクトルレジスタ9の詳細な説明は第2図
で行なう。 次に動作を説明する。 ビットバタン生成回路3の動作は、命令語レジスタ1か
ら送られて来たビットバタンを指定するパラメータBl
、B2によって、それぞれシフト演算器16.17で“
001”をシフトし、その結果をそれぞれ線71.72
を通してフェッチ/ストアアドレス生成回路のビットバ
タン用レジスタに送る。 フェッチ/ストアアドレス生成回路5の動作は、命令制
御回路2から送られて来た起#(5号によって、セレク
タ18を通して“0”がアドレス用レジスタ19へ格納
される。アドレス用レジスタ19からアドレス加算器2
1へ送られて来たアドレスは+1され再びアドレスレジ
スタ19へ格納される。一方、線74によってアドレス
変更用排他的OR回路に送られて来たアドレスは、ビッ
トバタン用レジスタから線73によって送られて来たビ
ットバタンと排他的ORがとられ、結果はアドレス用レ
ジスタ23へ格納される。このアドレス用レジスタ23
に格納されているアドレスはベクトルレジスタVR2上
のアドレスとして使用される。 フェッチ/ストアアドレス回路6,7.8の動作も同様
であり、アドレス用レジスタ24に格納されているアド
レスはベクトルレジスタVRI上のアドレスとして使用
され、アドレス用レジスタ25に格納されているアドレ
スはベクトルレジスタVR3上のアドレスとして使用さ
れ、アドレス用レジスタ26に格納されているアドレス
はベクトルレジスタVRd上のアドレスとして使用され
る。 最小値最大値算定回路4の動作は、ベクトルレジスタ9
からそれぞれ線80.81を通して送られて来たデータ
が、データレジスタ11.12に格納される。次に、デ
ータレジスタ11.12からデータが比較器13に送ら
れ、大きくない方がデータレジスタ14、小さくない方
がデータレジスタ15に格納されるか、あるいは、逆に
小さくない方がデータレジスタ14、大きくない方がデ
ータレジスタ15に格納される。データレジスタ14.
15に格納されているデータは、それぞれ線82.83
を通してベクトルレジスタ9に格納される。 第2@は第1図のベクトルレジスタ9の詳細な図である
。 図中、33,34,39,40,41.42はデコーダ
であり、35,36..37,38,43゜44.45
,46,47,48,49.50はOR回路であり、2
9 g 30 + 31 t 32 ハヘ’)トルレジ
スタであり、51.52はセレクタである。 第1図の線84は4本の線の束であり、その各各の線は
84−1.84−2.84−3.84−4であり、これ
らは第1図の命令語レジスタ1でそれぞれVRIフィー
ルド、VR2フィールド。 VR3フィールド、VR4フィールドに接続している。 次に動作を説明する6 それぞれ線82.83を通してデコーダ33゜34へ送
られて来たデータは、それぞれ線84−3.84−4を
通して命令語レジスタlから送られて来たVR3フィー
ルドとVR4フィールドにあるレジスタを指定する情報
によって、35から38までのOR回路に振り分けられ
る。また、それぞれ線79,787.通して送られて来
たベクトルレジスタ上の入力用アドレスについても同様
であり、それぞれ線76.77を通して送られて来たベ
クトルレジスタ上の出力用アドレスについても同様であ
る。一方、セレクタ51..52にベクトルレジスタ2
9,30,31.32から送られて来たデータは、それ
ぞれ線84−1.84−2を通して命令語レジスタ1か
ら送られて来たVR1フィールドとVR2フィールドに
ある情報によって、gso、stに送られるデータが決
まる。 第2図を出力データがベクトルレジスタ29から送られ
、入力データがベクトルレジスタ31へ送られるものと
して動作を詳細に説明する。 線82を通して第1図のレジスタ14からデコーダ33
に送られて来たデータは、線84−3を通して送られ来
た情報により、OR回路37へ送られる。一方、デコー
ダ42に第1図のレジスタ25からL&78を通して送
られて来たアドレスは、線84−3を通して送られて来
た情報によりOR回路48へ送られる。OR回路48か
らベクトルレジスタ31へ送られて来るアドレスに従っ
てOR回路37からベクトルレジスタ31へ送られて来
るデータは格納される。線83を通して送られて来たデ
ータがベクトルレジスタ32へ格納されることについて
も同様である。 次に、デコーダ39に第1図のレジスタ24から送られ
て来たアドレスは、線84−1により送られて来た情報
により、OR回路43へ送られる。 OR回路43からベクトルレジスタ29へ送られて来た
アドレスに従い、ベクトルレジスタ29からデータがセ
レクタ51.52へ送られる。ベクトルレジスタ30に
ついても同様である。セレクタ51に1S84−1から
送られて来た情報によりベクトルレジスタ29から送ら
れ来たデータが線80を送して第1図のレジスタ11へ
送られる。 セレクタ52についても同様である。 第3図は、データの処理形態の一例を示した図である。 この図は第1図で線71を通してooo”が送られ、線
72を通して” 010 ”が送らて来た場合である。 第1に、ベクトルレジスタ29から“3″が比較器13
に送られる一方、第1図の排他OR回路22で“010
”と“000”の排他ORが取られた結果である“01
0”なるアドレスに従ってベクトルレジスタ30からは
16が比較器13に送られる。これ等は大きくない方が
ベクトルレジスタ31に送られ、小さくない方がバク1
−ルレジスタ32に送られ指定されたアドレスに従って
格納される。 第2に、バク1−ルレジスタ29から11が比較器13
に送られる一方、” 010”と“Q Q i 11の
排他ORである“011 ”に従ってベクトルレジスタ
30から6が比較器13に送られ、大きくない方がベク
トルレジスタ31に格納され、小さくない方が、ベク1
へルレジスタ32に格納される。 第3に、ベクトルレジスタ29から13が比較器13に
送られる一方、“010”と010″の排他ORである
“OOO”に従いベクトルレジスタ30から7が比較器
13に送られる。このときは第1図の命令制御回路2か
ら線85によって送られて来る信号によって、小さくな
い方をベクトルレジスタ31へ送り、大きくない方をベ
クトルレジスタ32へ送る。 以下、同様である。 第4図はパイプラインの各ステージを表わした図である
。図中AFL、AF2.ASI、AS2はそれぞれ第1
図のアドレスレジスタ24,23゜25.26であり、
DFl、DF2.DSL。 DS2はそれぞれ第1図のデータレジスタ11゜12.
14,15である。 第1サイクルではAFL、AF2の中身はそれぞれ第3
図の3,16のアドレス“ooo”。 ” 010 ”である。 第2サイクルでは、AFL、AF2の中身はそれぞれ第
3図の11,6のアドレス“001”。 “011”であり、ΔSl、AS2の中身はそれぞれ3
,16の格納先アドレス“000”。 “010”であり、DPI、DF2の中身はそれぞれデ
ータ3,16である。 第3サイクルでは、AFl、AF2の中身はそれぞれ第
3図の13,7のアドレス“010″。 “000”であり、ASI、AS2の中身はそれぞれ6
,11の格納先アドレス“OO1” 。 “011 ”であり、DPI、DF2の中身はそれぞれ
データ11,6であり、DSl、DS2の中身はそれぞ
れデータ3,1Gの比較結果である3゜16である。 以下、第8ステージまでは同様である。 第9ステージでは、フェッチ用データアドレスの終了に
より、ASI、AS2の中身はそれぞれデータ5,10
の格納先アドレスである“111”。 ” 101”であり、DPI、DF2の中身は、それぞ
れデータ5,10であり、DSL、DS2の中身はそれ
ぞれ、データ14,4の比較結果である4、14である
。 第10サイクルでは、DSL、DS2の中身がそれぞれ
、データ5,10の比較結果である5゜10でありこれ
等をベクトルレジスタへ格納した時点で処理は完了する
。 第5図、第6図は本実施例で扱われる命令の処理である
。 図中、第1図の命令語をBSRT (VRI。 VH2,VH2,VH4,VL、に、Bl、B2)と書
く。 ここでB1は、VRl、VH2のアドレスの変更を与え
るパラメータであり、B2はVH2゜V R4のアドレ
スの変更を与えるパラメータである。本実施例ではVR
I、VT3のアドレスは変更する必要がないので81=
3とする。B1=3のときは’ OO1”を3ビツト左
にシフトするため結果は” o o o ”となり排他
的ORをとってもアドレスの変更はおこらない。 ベクトルレジスタ29と30との間に書かれている矢印
は互いに比較する要素を指している。第5図は0≦B2
く3のときの処理であり、第6図はB2=3のときの処
理である。 第5図において、ベクトルレジスタ29の第1要素3に
対してベクトルレジスタ30の第82+1要素16が比
較され、大きくない方がベクトルレジスタ31に格納さ
れ、小さくない方がベクトルレジスタ32に格納される
。続いてベクトルレジスタ29の第2要素11とベクト
ルレジスタ30の第B 2+B 2要′M6とが比較さ
れ大きくない方がベクトルレジスタ31に格納され、小
さくない方がベクトルレジスタ32に格納される。 ベクトルレジスタ29の第3要素13に対し、ベクトル
レジスタ30の第1要素7が比較され。 今度は小さくない方がベクトルレジスタ31に格納され
、大きくない方がベクトルレジスタ32に格納される。 続いて、ベクトルレジスタ29の第4要素1に対し、ベ
クトルレジスタ30の第B2要素12が比較され、小さ
くない方がベクトルレジスタ31に格納され、大きくな
い方がバク1−ルレジスタ32に格納される。これがパ
ラメータKによるに個毎の区切りがあるまで繰り返され
る。 パラメータにの指定により今度は逆に、ベクトルレジス
タ29の第5要素2に対し、ベクトルレジスタ30の第
に+82−1−1要素15が比較され、小さくない方が
ベクトルレジスタ31に格納され、大きくない方がベク
トルレジスタ32に格納される。 以下同様であり、K個毎の区切りまで縁り返され、に個
毎の区切りで大小出力を逆転する。 第6図において、即ちB1=B2=3のとき、Kは無視
され、ベクトルレジスタ29とバク1−ルレジスタ30
の同じ要素番号のデータを比較して、大きくない方をベ
クトルレジスタ31に、小さくない方をベクトルレジス
タ32に格納する。 第7図、第8図を用いて、ベクトルレジスタ内にあるデ
ータを、主記憶との転送なしに、ソートする方法につい
て述べる。 第7図において、61により、ベクトルレジスタ間で同
一要素番号間のソートが成される。 ただし、Nは11本のベクトルレジスタに格納可能な要
素の最大個数の2を底とする対数の小数部分を切り上げ
た数。 62でに=2とおくことによって、4個毎のデ′−夕を
ソートする事を目標とする。 ここで4個毎のデータとは2本のベクトルレジスタ上の
両方の第1要素と両方の第2要素の組、両方の第3要素
と両方の第4要素の組等のことである。63は2×2B
個のデータに対してバイトニックソートアルゴリズムを
適用することが目標であることを示す。64はバイトニ
ックソートアルゴリズムの基本演算を適用する事を示し
、65はそのときにベクトルレジスタ上の異なる要素番
号間の比較で生じたデータ格納位置のずれを修正するこ
とを示す、66は目標ソート長までソート出来たかどう
かの判定であり、67はバイトニックソートアルゴリズ
ムの基本演算を繰り返すためのパラメータの更新であり
、68は全体のソートが完了したかどうかの判定であり
、69は目標ソート長の拡大である。 第8図において、最初の矢印は第7図の61を実行した
結果である。その他の矢印は第7図の最内側ループから
出るときを示し、またそのときのベクトルレジスタの状
態が矢印の終点側に書かれている。一番最後に書かれて
いるベクトルレジスタは、第7図の全処理が終了したと
きのベクトルレジスタの状態である。従って、ベクトル
レジスタ上で、ベクトルレジスタ上の全データをソート
できる。 以上、実施例の効果は、ベクトルレジスタ上の全データ
をソースする際に、主記憶との転送を不要とするため、
その分処理が高速化される。 第9図、第10図、第11図は本発明を主記憶と演算器
間で適用した場合の高速フーリエ変換に関する実施例で
ある。 第1図において、101は命令語レジスタ、102は命
令制御回路、103はビットバタン生成回路、104は
フェッチ/ストアアドレス生成回路、105は主記憶、
106は演算器である。 命令語レジスタ101には主記憶105から送られて来
た命令語が格納される。命令語の形式は演算を指定する
ためのOPコードと、出力データを格納する領域の先頭
アドレスSAIと、入力データの先頭アドレスSA2.
SA3と、入力データの個数VLと、ビットバタンを指
定するためのパラメータBとから成る。 ビットバタン生成回路103において107は左シフト
演算器である。 フェッチ/ストアアドレス生成回路104において、1
08,112,120はセレクタであり、109.11
1は出力データ用のアドレスレジスタであり、110は
アドレス加算器であり、138は1ビツトのブリップフ
ロップであり、113゜116.119,121,12
4は入力データ用アドレスレジスタであり、117はピ
ッ1−バタン用レジスタであり、114,122はアド
レス加算器であり、118は排他的OR回路であり、1
15.123は1ビツトのフリップフロップである。 主記憶105において、125,126は入力データで
あり、127は出力データである。 演算器106において、128,129,133は入力
データ用レジスタであり、130,131はセレクタで
あり、132はN0Tu路であり、134.135は乗
算器であり、136は加算器であり、137は出力デー
タ用レジスタである。 次に動作を説明する。 ビットバタン生成回路103の動作は、命令語レジスタ
101から送られて来たビットパタンを指定するパラメ
ータBによって、シフト演算器107で“01″はシフ
トされ、その結果は線151を通してビットバタン用レ
ジスタ117に格納される。 フェッチ/ストアアドレス生成回路104の動作は、命
令制御回路102から送られて来た起動信号によって、
それぞれセレクタ112,120を通して、入力データ
の先頭アドレスSA2゜SA3がアドレスレジスタ11
3,121に格納される。アドレスレジスタ113に格
納されているアドレスは、加算器114とフリップフロ
ップ115と、排他的OR回路118へ送られる。加算
器114へ送られて来たアドレスは+1され再びアドレ
スレジスタ113へ格納される。フリップフロップ11
5へ送られて来たアドレスはアドレスレジスタ116へ
送られ、入力データアドレスとして使用される。排他的
OR回路へ送られて来たアドレスは、ビットバタンレジ
スタ117から送られて来たビットパタンと排他的OR
がとられ、その結果がアドレスレジスタ119へ送られ
。 入力データ用アドレスとして使用される。アドレスレジ
スタ121に格納されているアドレスは、加算器122
と、フリップフロップ123へ送られる。加算器122
へ送られて来たアドレスは+1され再びアドレスレジス
タ121へ格納される。 フリップフロップ123へ送られて来たアドレスはアド
レスレジスタ124へ送られ、入力データ用アドレスと
して使用される。一方、命令制御回路102からセレク
タ108へ送られて来た起動信号によってアドレスレジ
スタ109に出力データの先頭アドレスが格納される。 アドレスレジスタ109に格納されているアドレスは、
加算器110と、フリッププロップ138へ送られろ。 加算器110へ送られて来たアドレスは+1され再びア
ドレスレジスタ109へ格納される。フリップフロップ
138へ送られて来たアドレスは、アドレスレジスタ1
11へ送られ出力データ用アドレスとして使用される。 主記憶105上ではデータ126の先頭アドレスは“O
OO”であるとし、データ127の先頭アドレスは“1
00”であるとする。 演算器106の動作は、線153を通して指定された主
記憶上のデータが、線156を通してデータレジスタ1
29に格納され、線154を通して指定された主記憶−
ヒのデータが、1%158を通してデータレジスタ13
3に格納され、線】52を通して指定された主記憶上の
データが、線157を通してデータレジスタ128に格
納される。 データレジスタ128に格納されているデータはセレク
タ130,131に送られ、命令制御回路102から線
160によって送られて来た信号と、NOT回路132
によって、乗算器134か乗算器135のどちらか一方
にのみ送られる。 乗算器134では、データレジスタ129から送られて
来たデータと、データレジスタ128から送られて来た
データ(又は“1”)と乗算が行なわれその結果が加算
器136へ送られる。乗算器135についても同様であ
る。 加算器136で加算された結果はデータレジスタ137
へ送られる。 データレジスタ137に格納されているデータは線15
5を通して主記憶上に指定されたアドレスに格納される
。 第10図はデータの処理形態の一列を示した図である。 この図は第9図の命令語でB=1とした場合である。以
下、第9図と第10図によって処理を示す。 第9図のアドレスレジスタ124内のアドレスに従いデ
ータ125からは、順次W09 Wol W”9W2が
データレジスタ128へ転送される。アドレスレジスタ
116内のアドレスに従いデータ126からは、順次x
o(0)、xo(1)= xo(2)。 xo(3)がデータレジスタ128へ転送される。 アドレスレジスタ119内のアドレスに従いデータ12
6から、 xo(2)、 xo(3)、 xo(0)。 xo(1)の順でデータレジスタ133へ転送される。 第9図乗算器134では、順次、1とxo(0)の積、
1とxo(1)の積t w”とxo(2)の積。 WZとxo(3)の積が行なわれ加算器136へ送られ
る。乗算器135についても同様である。 第9図加算器136では順次、xo(0)とW’xo(
2)の和、xo(1)とW’xo(3)の和。 W 2x o (2)とxo(0)の和、W”xo(3
)とxo(1)の和が行なわれ結果がデータレジスタ1
37へ送られる。これがデータ127の位置へ格納され
る。 第11図はホ9の命令を用いて高速フーリエ変換を行な
う場合のフローチャートである。 ここでVLは2の巾乗としである。また、第9図の命令
語をデータアドレスの表示を略した上でFFT (VL
、B) と略記する。 第11図において141はビットパタンを与えるパラメ
ータの初期設定である。142は既存の命令による高速
フーリエ変換を与える係数列の生成である。143は本
実施例の命令の適用である。 144は、高速フーリエ変換が終了したかどうかの判定
であり、145はビットパタンを与えるパラメータの更
新である。 たとえば、VL=4(7)場合、第11図141により
B=1となり、142では し、143で本命令を実行し、これは第10図に書かれ
ている通りになる。次に、B=1であることより144
から145へ流れ、B=Oとなる。 今度は、142で生成される係数列はW’、W2tw’
t wsであり、143で命令が実行されることにより
高速フーリエ変換が完了する。 以上、実施例の効果は、命令語から直接演算する要素番
号間の規則が指定出来るため、フェッチ/ストア用の間
接アドレスを生成しなくてすむという効果がある。 〔発明の効果〕 本発明によれば、ベクトルレジスタを備えたスーパコン
ピュータ上で、一定規側に従いベクトルレジスタ上の要
素番号の異なる要素間で演算が行なえるため、データを
主記憶に格納して要素の順序を入れかえた後にベクトル
レジスタにデータを転送することなく、ベクトルレジス
タ間で引き続いて演算が行なえ高速化が図れるという効
果がある。 また、主記憶と演算器間の演算において間接アドレスの
生成を必要としないという効果がある。
【図面の簡単な説明】
第1図は本発明を実施した計算機システムの概要図、第
2図はベクトルレジスタの説明図、第3図は本発明によ
るデータの流れの説明図、第4図はタイムチャート、第
5図は命令の動作の説明図、第6図は命令の動作の説明
図、第7図は全データのソートを行なうためのフローチ
ャート、第8図はベクトルレジスタ上のデータがソート
される過程、第9図は本発明を実施した他の計算機シス
テムの概略図、第10図はデータの流れの説明図、第1
1図は高速フーリエ変換のためのフローチャート。 3・・・ビットバタン生成回路、4・・・最小値最大値
算定回路、5・・・フェッチ/ストアアドレス生成回路
、6・・・ベクトルレジスタ。

Claims (1)

  1. 【特許請求の範囲】 1、ベクトルオペランドを指定する情報として、ベクト
    ルの要素数と、入力データの格納されている記憶域を指
    定する情報と出力データを格納するための記憶域を指定
    する情報と、ベクトルデータ記憶域のアドレスを変更す
    るためパラメータを持ち、前記パラメータを入力として
    アドレス変更用ビット列を生成する手段と、加算による
    アドレス生成回路と、前記アドレスと前記アドレス変更
    用ビット列とから新しいアドレスを生成するための論理
    回路とを備え、アドレス変更用パラメータで指定される
    一定規則に従い、ベクトルデータ記憶域内の要素番号の
    異なる要素間で演算を行なうことを特徴とするベクトル
    処理装置。 2、該入力データが格納されている記憶域、該出力デー
    タを格納するための記憶域はベクトルレジスタであるこ
    とを特徴とする第1項のベクトル処理装置。
JP24962986A 1986-10-22 1986-10-22 ベクトル処理装置 Pending JPS63104179A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24962986A JPS63104179A (ja) 1986-10-22 1986-10-22 ベクトル処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24962986A JPS63104179A (ja) 1986-10-22 1986-10-22 ベクトル処理装置

Publications (1)

Publication Number Publication Date
JPS63104179A true JPS63104179A (ja) 1988-05-09

Family

ID=17195869

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24962986A Pending JPS63104179A (ja) 1986-10-22 1986-10-22 ベクトル処理装置

Country Status (1)

Country Link
JP (1) JPS63104179A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007308071A (ja) * 2006-05-19 2007-11-29 Yanmar Co Ltd 作業車両

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007308071A (ja) * 2006-05-19 2007-11-29 Yanmar Co Ltd 作業車両

Similar Documents

Publication Publication Date Title
EP0240032B1 (en) Vector processor with vector data compression/expansion capability
US6219775B1 (en) Massively parallel computer including auxiliary vector processor
US5081573A (en) Parallel processing system
US4725973A (en) Vector processor
JPS59128670A (ja) ベクトル処理装置
JP2002351858A (ja) 処理装置
US4954947A (en) Instruction processor for processing branch instruction at high speed
JPH0444970B2 (ja)
US4916649A (en) Method and apparatus for transforming a bit-reversed order vector into a natural order vector
US4734877A (en) Vector processing system
JP5549442B2 (ja) Fft演算装置
JP2518293B2 (ja) デ−タフロ−プロセツサ
CN110008436B (zh) 基于数据流架构的快速傅里叶变换方法、系统和存储介质
JPH04503720A (ja) デジタル信号処理装置のフレキシブル制御装置及び方法
JPS61210478A (ja) ベクトル処理装置
JPS63104179A (ja) ベクトル処理装置
JPH10283340A (ja) 演算プロセッサ
JPH0650512B2 (ja) デ−タ処理装置
US10884736B1 (en) Method and apparatus for a low energy programmable vector processing unit for neural networks backend processing
JP3278441B2 (ja) ベクトル処理装置
EP0230383A2 (en) Sequentially performing arithmetic operations on data sets
EP0314342B1 (en) Parallel pipelined computer processor
JP2885197B2 (ja) 演算処理装置及び演算処理方法
TR2021019500A1 (tr) Genel yeni̇den kullanim merkezli̇ cnn hizlandirici
JPH0250258A (ja) ベクトル処理装置