JPH0277882A - ベクトル処理装置 - Google Patents

ベクトル処理装置

Info

Publication number
JPH0277882A
JPH0277882A JP63228326A JP22832688A JPH0277882A JP H0277882 A JPH0277882 A JP H0277882A JP 63228326 A JP63228326 A JP 63228326A JP 22832688 A JP22832688 A JP 22832688A JP H0277882 A JPH0277882 A JP H0277882A
Authority
JP
Japan
Prior art keywords
vector
register
data
write
clock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63228326A
Other languages
English (en)
Other versions
JP2941817B2 (ja
Inventor
Masamori Kashiyama
正守 柏山
Koichi Ishii
石井 幸一
Takashi Kawabe
河辺 峻
Masami Usami
宇佐美 正己
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63228326A priority Critical patent/JP2941817B2/ja
Priority to US07/399,917 priority patent/US5115393A/en
Priority to DE3930313A priority patent/DE3930313A1/de
Publication of JPH0277882A publication Critical patent/JPH0277882A/ja
Application granted granted Critical
Publication of JP2941817B2 publication Critical patent/JP2941817B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8053Vector processors
    • G06F15/8076Details on data register access
    • G06F15/8084Special arrangements thereof, e.g. mask or switch
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30098Register arrangements
    • G06F9/3012Organisation of register space, e.g. banked or distributed register file
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30098Register arrangements
    • G06F9/30141Implementation provisions of register files, e.g. ports

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ベクトル処理装置に係り、特に、スーパーコ
ンピュータ等における超高速マシンサイクルの実現のた
めに用いて好適なベクトル処理装置に関する。
〔従来の技術〕
一般に、スーパーコンピュータの性能を向上させるため
には、ベクトル処理装置内に複数個のパイプライン演算
器と複数個のベクトルレジスタを設け、因果性のない命
令間でのベクトルデータ処理の並列化と、並列処理され
る夫々のベクトルデータを高速にベクトルレジスタから
パイプライン演算器へ、パイプライン演算器からベクト
ルレジスタへ転送すること、すなわち、マシンサイクル
をアップさせることが最も効果的である。
以下、この種ベクトル処理装置の一例を図面により説明
する。
第6図は従来技術によるベクトル処理装置の構成を示す
ブロック図である。第6図において、1はベクトルレジ
スタ、2,3はセレクタ、6はパイプライン演算器、9
は主記憶装置、10はベクトルロードパイプライン、1
1はベクトルストアパイプラインである。
ベクトル処理装置は、高速のランダム・アクセス・メモ
リー(以下、RAMという)で構成されるVRO〜VR
31によるベクトルレジスタ1と、ベクトルレジスタ1
の出力ベクトルデータ信号5を命令により演算器O〜演
算器3によるパイプライン演算器6へ選択して転送する
スイッチマトリックス論理で構成されるセレクタ(以下
、SELという)3と、演算器O〜演算器3によるパイ
プライン演算器6の出力結果パス8を命令により■RO
〜VR31によるベクトルレジスタ1に選択するスイッ
チマトリックス論理で構成されるセレクタ(以下、DI
STという)2と、VRO−VR31によるベクトルレ
ジスタ1へ前記DIST2を通してベクトルデータを主
記憶装置(以下、MSという)9からロードするベクト
ルロードパイプライン10と、VRO〜VR31による
ベクトルレジスタ1に格納されている演算結果ベクトル
データを5EL3を通してMS9へ出力するベクトルス
トアパイプライン11と、演算を実行する演算器0〜演
算器3によるパイプライン演算器6とにより構成されて
いる。
ベクトルロード命令によりMS9から読み出されたベク
トルデータは、ベクトルロードパイプライン10を通し
て命令で示されるベクトルレジスタ10番号へ割当てら
れ、マシンサイクルのクロック速度で供給される前記ベ
クトルデータのベクトル要素順にRAMにアドレッシン
グされ書き込まれる。次に、前記ベクトルデータは、演
算命令によりベクトルレジスタ1から読み出され、パイ
プライン演算器6ヘオペランドとしてベクトル要素順に
マシンサイクルのクロック速度で入力される。パイプラ
イン演算器6による演算結果は、当該命令により演算結
果を格納するベクトルレジスタ1の番号が割当てられ、
その番号の示すベクトルレジスタを構成しているRAM
に書き込まれる。
ベクトル演算は、同一ベクトルデータに対して繰り返し
演算が必要であるため、ベクトルレジスタ1は、高速の
シリコン・バイポーラRAMやガリウム・ヒ素(GaA
s)FET  RAMを使用し、マシンサイクルのクロ
ック速度でオペランドの読み出しと、演算結果格納が実
現できるように構成されている。このことは、ベクトル
演算をMS9との間で直接行った場合に、MS9を構成
している大容量SRAMが一般にMOS系の数十ナノ秒
のアクセスタイムを有するため、読み出しと書き込みに
おけるオーバーヘッドが全体のベクトル処理時間に対し
て大きな部分を占めるようになり、効率の面で不利にな
ることを防止することを可能にしている。さらに、第6
図で示したベクトル処理装置は、マシンサイクルの向上
を目的として実装的遅延時間を短縮するために3次元実
装構造や、D I ST2、ベクトルレジスタ1.5E
L3等の論理、及びRAMを物理的制約の許す範囲で分
割することにより半導体チップで構成することも実現さ
れている。
また、ベクトル演算の特徴である繰り返し演算処理にお
いては、ベクトル演算結果を格納したベクトルレジスタ
が次の命令の処理においてオペランドを供給する場合が
多い。そこで、論理的に同一番号のベクトルレジスタに
対してオペランドデークの読み出しと演算結果の書き込
みを同時に行うチエイニング処理を可能とするために、
前記ベクトルレジスタを構成するRAMを2つの独立し
たアドレッシングが可能なバンク配列とし、一方のバン
クはベクトルデータのすべての偶数要素を保持し、他方
のバンクは前記ベクトルデータのすべての奇数要素を保
持するよう構成し、マシンサイクルのクロック速度で各
バンクへの書き込みと読み出しを可能としたベクトル処
理装置が、例えば、特開昭58−114274号公報に
開示されている。また、例えば、特開昭59−7757
4号公報にはバンク分けされないベクトルレジスタの高
速化技法が開示されている。
〔発明が解決しようとする課題〕
ところで、ベクトルレジスタを前述の2パンクRAM方
式で構成し、マシンサイクルのクロック速度で前記RA
Mの書き込みと読み出しを行うに際して、マシンサイク
ルのクロック速度を決定する要因は、ベクトルデータを
保持するRAMの書き込み時間(ピッチ)性能と、読み
出し時間(ピッチ)性能(アドレス・アクセス・タイム
)である。さらに言えば、セットアツプ時間と書き込み
パルス幅、ホールド時間の合計で規定される書き込みピ
ッチ性能が、単純にアドレス入力で起動される読み出し
ピッチ性能に比較して1.5倍程度時間を要することか
らクロック速度決定に対して支配的である。また、超高
速の化合物半導体(GaAs、HEMT)を使用する場
合においても、メモリ回路の特質として、この傾向は変
わらない。
一方、前述した従来技術からも明らかなようにマシンサ
イクルのクロック速度の高速化がベクトル処理装置の性
能向上に不可欠である。ところが、従来の2バンクRA
M方式のベクトルレジスタは、書き込みと読み出しのク
ロック速度が等しいために数ナノ秒程度の超高速マシン
サイクルを実現する意味においては、読み出しピッチ性
能が目的のクロック速度を上回っていても書き込みピッ
チ性能が下回っている場合には、書き込みピッチ性能が
大きな要因となりマシンサイクルのクロック速度向上を
制限するため、特に、アクセス・タイム1ナノ秒以下の
超高速RAM使用の場合に、読み出し性能を効率的に利
用できないと言う問題があった。
本発明の目的は、前記従来技術の問題点を解決し、2バ
ンクRAM構成のベクトルレジスタが、1つのバンクR
AMに対して連続したサイクル・ピッチで書き込み動作
が起こらないことを生かして、ベクトルレジスタに使用
する超高速RAMの書き込みピッチ性能と読み出しピッ
チ性能の合計時間の1/2をマシンサイクルのクロック
速度とすることにより、書き込みピッチ性能が支配する
2バンクRAM構成ベクトルレジスタの性能向上を図っ
たベクトル処理装置を提供することにある。
〔課題を解決するための手段〕
本発明によれば、前記目的は、論理的に同一番号のベク
トルレジスタを2つの超高速RAMを独立してアドレッ
シング可能なバンク配列とし、−方のバンクにベクトル
データの全ての偶数要素を保持させ、他方のバンクに前
記ベクトルデータの全ての奇数要素を保持させるように
ベクトルレジスタを構成し、2つのバンクRAMに供給
する書き込みアドレスと読み出しアドレスのために、マ
シンサイクルのクロック速度で2倍低速で1/2周期位
相差を持つ書き込みアドレス発生回路と読み出しアドレ
ス発生回路を備え、マシンサイクルのクロック速度を、
ベクトルレジスタの書き込みピッチ性能と読み出しピッ
チ性能の合計時間の1/2に設定することにより達成さ
れる。
また、ベクトルデータの書き込みと読み出しのクロック
速度の設定のために、書き込み動作時にはベクトルレジ
スタ・バンクに使用するRAMの書き込みピッチ性能を
満足するサイクルピッチに設定し、読み出し動作時には
前記RAMの読み出しピッチ性能を満足するサイクルピ
ッチに設定する事のできるクロック・タイミング発生回
路が備えられる。
また、前記RAMに入出力されるベクトルデータのサイ
クルピッチを、ベクトル処理装置のマシンサイクル・ク
ロック速度に変換するために、前記RAMの書き込みデ
ータ・ラッチと読み出しデータ・ラッチに対して位相変
換ラッチが備えられる。さらに、ベクトルレジスタを構
成するLSI内のラッチに供給するクロック・タイミン
グを制御するために、LSI外部から制御できるデイレ
イ可変回路が備えられる。
〔作用〕
ベクトルレジスタが2つの独立にアドレッシング可能な
バンク配列で構成され、書き込みアドレスを発生させる
書き込み制御信号と、読み出しアドレスを発生させる読
み出し制御信号とが、マシンサイクルのクロック速度で
1/2周期位相差を持っていることにより、各RAMバ
ンクに対する書き込みアドレスと読み出しアドレスとが
、前記RAMの書き込みピッチ性能と読み出しピッチ性
能とを満足するクロック・ピッチとなるように、それぞ
れのバンクRAMアドレス・ラッチを駆動するクロック
・タイミングをクロック・タイミング発生回路により設
定することができる。さらに、ベクトルレジスタに人出
するベクトルデータは、クロック・タイミング発生回路
から供給されるクロック・タイミングにより駆動される
位相変換ラッチによりベクトル処理装置のマシンサイク
ル・クロック速度に変換される。これらのことにより、
ベクトル処理装置のマシンサイクル・クロック速度は、
ベクトルレジスタに使用されるRAMの書き込みピッチ
性能を上回るサイクル・ピッチに設定することができる
。正確には、書き込みピッチ性能と読み出しピッチ性能
の合計時間の1/2にベクトル処理装置のマシンサイク
ル・クロック速度を設定することが可能である。また、
LSI内でデイレイ可変回路を制御することによりRA
M書き込みピッチと読み出しピッチの配分を変化させる
ことが可能である。
〔実施例〕
以下、本発明によるベクトル処理装置の一実施例を図面
により詳細に説明する。
第1図は本発明によるベクトルレジスタの詳細な構成を
示すブロック図、第2図はベクトルレジスタの動作を説
明するタイミングチャート、第3図はベクトルレジスタ
の動作を規定するクロックのタイミングチャート、第4
図はクロックタイミング発生回路の構成を示すブロック
図、第5図は本発明によるベクトル処理装置の全体の概
略構成を示すブロック図である。第1図、第4図、第5
図において、101はベクトルレジスタ、102゜10
3はセレクタ、106はパイプライン演算器、109は
主記憶装置(MS)、110はベクトルロードパイプラ
イン、111はベクトルストアパイプライン、112は
書き込み制御回路、115は読み出し制御回路、118
はWAカウンタ、119はRAカウンタ、120,12
1,125゜131.132はセレクタ、122はAバ
ンクRAM、123はBバンクRAM、124.124
a〜124Cはピッチ制御回路、126はAバンクアド
レスレジスタ(AAD) 、127はBパンクアドレス
レジスタ(BAD) 、128はデータレジスタ(WD
ATA) 、128a、128bは位相変換データレジ
スタ(WDATAA、、WDATAB) 、129,1
30,136,137はラッチ、138は位相変換デー
タレジスタ(RDATA) 、138a、138bはデ
ータレジスタ(RDATAA、RDATAB)である。
本発明によるベクトルレジスタをベクトル処理装置に組
み込んだ全体的なシステム構成が第5図に概略的に示さ
れている。第5図に示すベクトル処理装置は、VRO〜
VR31によるベクトルレジスタ101と、スイッチマ
トリックス論理によるセレクタ(以下、DISTという
)102と、スイッチマトリックス論理によるセレクタ
(以下、SELという)103と、パイプライン演算器
106と、ベクトルロードパイプライン110と、ベク
トルストアパイプライン111と、M S 109とに
より構成されている。ベクトルレジスタ101は、それ
ぞれベクトルデータの偶数要素を保持するAバンクRA
M122と奇数要素を保持するBバンクRAM123と
、2つのバンクRAMに対して書き込みアドレスを発生
するWAカウンタ118と、同様に読み出しアドレスを
発生するRAカウンタ119と、それぞれのカウンタか
ら発生されるアドレスをピッチ制御回路124によりR
AMの書き込みピッチ性能と、読み出しピッチ性能を満
足するサイクル・ピッチに切り分けるところのAバンク
RAM122用のセレクタ120と、同様にBバンクR
AM用のセレクタ121と、それぞれのバンクから出力
されるデータをピッチ制御回路124によりRAM読み
出しピッチで選択するセレクタ125とにより構成され
、ベクトル要素を128個保持することができる。また
、ベクトルレジスタ101は、書き込み制御回路112
から書き込み制御信号113と、読み出し制御回路11
5から読み出し制御信号116とがベクトルレジスタ1
01に対してマシンサイクルのクロック速度の1/2周
期位相を変化させた関係で与えられて制御されており、
ベクトル処理装置動作中、命令によりそれぞれのベクト
ルレジスタ101は、並列に制御される。
DIST102は、パイプライン演算器106から演算
結果出力パス108を通してパイプライン演算器106
から送られるベクトルデータとベクトルロードパイプラ
イン110を通して送られるMS109から読み出され
たベクトルデータとを選択するよう構成されている。ま
た、ベクトルデータを選択するセレクタは、マシンサイ
クルのクロック速度で動作するようになっており、第5
図には図示しないがベクトルレジスタ101の数だけ、
詳細には32個用意されている。ベクトル処理装置動作
中は、命令により書き込み制御回路112から出力され
るベクトルレジスタ選択信号114により命令が示すベ
クトルレジスタ101に対応した書き込みデータ・パス
104に前述のベクトルデータが出力される。SEL 
103は、ベクトルレジスタ101から出力される32
本のマシンサイクル・クロック速度で動作しているパス
105を介した読み出しベクトルデータをパイプライン
演算器106への出力パス107とMS109へのベク
トルデータの格納に使用するところのベクトルストアパ
イプライン111に対して選択する論理構成になってい
て各々並列動作可能である。ベクトル処理装置動作中は
、命令により読み出し制御回路115から出力されるベ
クトルレジスタ選択信号117により命令が示すベクト
ルレジスタ101に対応した読み出しデータバス105
から命令が示すパイプライン演算器106およびベクト
ルストアパイプライン111への出力パスへベクトルデ
ータが振り分けられる。
第5図に示すベクトル処理装置全体の処理概要は、従来
例で示した第6図のベクトル処理装置および特開昭58
−114274号と同様であるので省略する。また、ベ
クトルレジスタ101は、物理的に超高速RAMとラン
ダムロジックが混在した構造の半導体チップで構成され
ている。
第1図にVRO〜VR31の32個のベクトルレジスタ
101を構成するところの一つのベクトルレジスタ10
1−0を詳細に示す。また、第1図のベクトルレジスタ
101−0の動作説明の為のタイミングチャートが第2
図である。
(1) クロック ベクトルレジスタ101−0に入力されるクロックは、
第3図に示すマシンサイクルに等しいクロック速度を持
ったクロックTOI相と、TOI層がHIGHレベルに
なる時刻tO+  tl+ ・・・・・・に対してΔを
時間前に切り替わりクロック速度の2倍の周期を持つT
SEL信号とから基本的に構成される。さらに、TO,
TOD、TI、TOIA、TOIB、TID、TIDD
の各クロック相はベクトルレジスタ101−0を構成す
るLSI内部で作られるクロック・タイミングである。
なお、前記クロック・タイミング発生回路は、第1図の
ベクトルレジスタ101−0には図示しないがLSI内
部に含まれるものとする。
第4図は前記To 1.TSEL相クロツクロックされ
るクロック・タイミング発生回路を表現したものである
。第4図の回路により第3図に示したTo、TI、TO
IA、TOIB、TOD、TID、TIDDの各クロッ
ク相が作られる。以下、具体的な動作を説明する。
TOIクロック相(以下TOIと略す)は入力アンプゲ
ート201を通してANDゲート203゜204に入力
される。さらに、TOIのセレクト信号であるTSEL
クロック相(以下TSELと略す)も入力アンプゲート
202を通してP掻出力がANDゲート203に、N極
出力がANDゲート204に入力される。これによりA
NDゲート203,204からはマシンサイクルのクロ
ック速度の2倍長いピッチのクロックが出力され、内部
アンプゲート205からはTo相ツクロック以下TOと
略す)が、内部アンプゲート206からT1相クロック
(以下TIと略す)がLSI内部の各ラッチに出力され
る。またTO,Tlはそれぞれの周期で1/2位相差の
ある関係になる。
ところで、TOIもアンプゲート207を通してLSI
内各ラッチに出力される。さらに、TOIA相クロツク
ロックTOIAと略す)は、Toをデイレイ回路208
を通すことによりdt、時間遅延させた信号TODとT
IとをORゲート209で合成して作られ、アンプゲー
ト210からLSI内各ラッチに出力される。また、T
ODは、アンプゲート220からLSI内各ラッチに出
力される。さらに、TOIB相クロツクロックTOIB
と略す)は、TOIAをデイレイ回路212を通すこと
によりdt、時間遅延させた信号で作られ、アンプゲー
ト213からLSI内各ラッチに出力される。また、デ
イレイ回路208,212は、図示しないがそのデイレ
イ量をLSI外部ピンから制御できる回路構成になって
おり、それぞれTOデイレイ制御ピン、TOIBデイレ
イ制御ピンから入力アンプゲート211,214を介し
てdjc+、dtlの時間量が制御できる構造になって
いる。さらに、TID相クロック(以下TIDと略す)
は、T1をデイレイ回路215を通すことによりdto
時間遅延させた信号で作られ、アンプゲート216から
LSI内各ラッチに出力される。さらに、TIDD相ク
ロツクロックTIDDと略す)は、TIDをデイレイ回
路218を通すことによりdt、時間遅延させた信号で
作られ、アンプゲート219からLSI内各ラッチに出
力される。また、デイレイ回路215は、図示しないが
そのデイレイ量を制御できる回路構成になっており、T
Iデイレイ制御ピンから入力アンプゲート217を介し
てdtoの時間量が制御できる構造になっている。とこ
ろでdt、は、前記ベクトルレジスタ101−0に使用
するところの高速RAMの読み出しピッチ性能を満足す
る値に設定する必要があり、一方、dtoは、マシンサ
イクル・クロック速度時間t。+dt0が、前記RAM
の書き込みピッチ性能を満足する値となるように設定す
る必要がある。第3図でも明らかなように1.−1o時
間で規定されるマシンサイクルのクロック速度はdt、
+dt、で与えられる時間となる。
(2)  ピッチ制御回路124a、124b。
24C ピッチ制御回路124aは、TOクロックで駆動される
ラッチPIKOEA124a−0と、TIDクロックで
駆動されるラッチPIKOLA124a−1と、前記2
つのラッチの出力を排他的論理和するFORゲート12
4a−2とにより構成され、EORゲート124a−2
の出力をピッチ信号124a−3として出力している。
動作を示すと、P I KOA信号139aが入力され
ると、Toクロックに同期したマシンサイクルの2倍周
期の信号がラッチPIKORA124a−0から出力さ
れ、この信号と、この信号をラッチPIKOLAI 2
4a−1によりt0+dt0の時間差を付けた信号とが
EOR124a−2により排他的論理和を取られ、これ
により第2図に示すEOR124a−3信号が得られる
さらに、ピッチ制御回路124bは、T1クロックで駆
動されるラッチPIKOEB124b−0と、TODク
ロックで駆動されるラッチPIKOLB124b−1と
、前記2つのラッチの出力を排他的論理和するEORゲ
ー)124b−2とにより構成され、EORゲート12
4b−2の出力をピッチ信号124b−3として出力し
ている。
動作を示すと、PIKOB信号139bが入力されると
、TIクロックに同期したマシンサイクルの2倍周期の
信号がラッチPIKOEB124b−0から出力され、
この信号と、この信号をラッチPIKOLB124b−
1によりtc+dt。
の時間差を付けた信号との排他的論理和かEOR124
b−2で取られ、これにより、第2図に示すEOR12
4b−3信号が得られる。
さらに、ピッチ制御回路124cは、Toクロックで駆
動されるラッチPIKOEC124cm0と、T1クロ
ックで駆動されるラッチPIKOLC124cm1と、
前記2つのラッチの出力を排他的論理和するEORゲー
)124C−2とにより構成され、EORゲート124
 C−2の出力をピッチ信号124C−3として出力し
ている。
動作を示すと、PIKOA信号139aが入力されると
、Toクロックに同期したマシンサイクルの2倍周期の
信号がラッチPIKOLC124cm1から出力され、
この信号と、この信号をラッチPIKOLC124cm
1によりtcの時間差を付けた信号との排他的論理和が
EOR124C−2で取られ、これにより、第2図に示
すEOR124cm3信号が得られる。
(3)  WAカウンタ118 RAMの書き込みアドレスを発生するWAカウンタ11
8は、TOクロックで駆動されるラッチWINC118
−0と、+1回路118−1と、TOクロックで駆動さ
れる6ビツトのアドレスレジスタWAC11B−2とに
より構成される。またWAカウンタ118は、図示はし
ないがアドレスレジスタWAC118−2をクリアする
構造にもなっている。ベクトル処理装置動作中は、第2
図で示すWINCl 18−0の信号のように書き込み
制御回路112から出力される書き込み制御信号113
によりアドレスデータがカウントアツプされ、アドレス
レジスタWAC118−2にセットされ、WAカウンタ
アドレスデータ118−3として出力される。
(4)   RAカウンタ119 RAMの読みだしアドレスを発生するRAカウンタ11
9は、T1クロックで駆動されるラッチRINC119
−0と、+1回路119−1と、T1クロックで駆動さ
れる6ビツトのアドレスレジスタRACI 19−2と
により構成される。また、IAカウンタ119は、図示
はしないがアドレスレジスタRACI 19−2をクリ
アーする構造にもなっている。ベクトル処理装置動作中
は、第2図で示すRINC119−0の信号のように読
みだし制御回路115から出力される読みだし制御信号
116によりアドレスデータがカウントアツプされ、ア
ドレスレジスタRACI 19−2にセットされ、RA
カウンタアドレスデータ119−3として出力される。
(5) セレクタ120 AバンクRAM122のアドレスデータを選択するセレ
クタ120は、第2図に示すようにPITCH信号EO
R124a−3が”o”のときWAカウンタアドレスデ
ータ118−3を選択し、PITCH信号EOR124
a−3が“1”のときRAカウンクアドレスデータ11
9−3を選択する。さらに、セレクタ120の出力は、
TOIAクロックで駆動される6ビツトのAバンクアド
レスレジスタAAD 126に入力され、AバンクRA
Mアドレスデータ信号126−0としてAバンクRAM
122に入力される。
(6) セレクタ121 BバンクRAM123のアドレスデータを選択するセレ
クタ121は、第2図に示すようにPITCH信号EO
R124b−3が”o″のときWAカウンタアドレスデ
ータll8−3を選択し、PITCH信号EOR124
b−3が“1”のときRAカウンタアドレスデータ11
9−3を選択する。さらに、セレクタ121の出力は、
TOIBクロックで駆動される6ビツトのBバンクアド
レスレジスタBAD127に入力され、BバンクRAM
アドレスデータ信号127−0としてBバンクRAM1
23に入力される。
(7) 書き込みデータ 書き込みデータは、書き込みデータバス104を介して
入力され、TOIクロックで駆動されるレジスタWDA
TA12 Bに入力される。さらに、レジスタWDAT
A128の出力信号は、TIクロックで駆動されるAパ
ンクRAM122用位相変換データレジスタWDATA
Al 28 aを通ってDIパス128a−〇を介して
AバンクRAM122に入力される。さらに、前記レジ
スタWDATA 128の出力信号は、TOクロックで
駆動されるBバンクRAM123用位相変換データレジ
スタWDATAB 128 bを通ってDIパス128
 t)−0を介してBバンクRAM123に入力される
(8)  WE制御回路 WE制御回路は、ベクトルレジスタ101のそれぞれに
設けられており、命令により書き込み制御回路112か
らそれぞれのベクトルレジスタ101が並列に動作でき
るよう制御されている。
WE制御回路は、TOクロックで駆動されるラッチWE
F129と、T1クロツタで駆動されるラッチWES1
30と、セレクタ131と、セレクタ132と、TOI
Aクロックで駆動されるAバンクRAM122のライト
・モード・ラッチWTMDA l 33と、TOIBク
ロックで駆動されるBバンクRAM123のライト・モ
ード・ラッチWTMDB 134と、TIDクロックの
立ち上がりを遅延させRAMの書き込みセットアツプ時
間とTIDクロックのパルス幅を重ね合わせてAバンク
RAMWEのパルス幅および書き込みホールド時間を調
整するライトパルス発生回路135aと、同様にToク
ロックの立ち上がりを遅延させBバンクRAMWEを発
生させるライトパルス発生回路135bと、それぞれの
ライト・モードとそれぞれのライト・パルス発生回路1
35a。
135bの出力パルスと論理積を取るANDゲート13
6,137とにより構成される。ベクトル処理装置動作
中は、第2図に示すようにPITCH信号124a−3
が“0”のときセレクタ131がラッチWEF129の
出力を選択し、PITCH信号124b−3が0”のと
きはセレクタ132がラッチWESI30の出力を選択
する。
すなわち、動作中は全ベクトルデータの偶数要素を保持
するために、書き込み制御信号113−0を出力し、A
バンクRAM122へのWE信号136aを制御するこ
とができる。さらに、全ベクトルデータの奇数要素を保
持するために、書き込み制御信号1111を出力し、B
バンクRAM123へのWE信号136bを制御するこ
とができる。
(9) 読み出しデータ ベクトル処理装置の動作中、AバンクRAM122は、
AバンクアドレスレジスタA A D 126が読み出
しアドレスデータのとき、AバンクRAM122のデー
タ出力122−0をTIクロックで駆動されるデータレ
ジスタRDATAA138aに出力する。−旦保持され
たこの出力は、T01クロツタで駆動される位相変換デ
ータレジスタRDATA 138に送出される。また、
BバンクアドレスレジスタBAD127が読み出しアド
レスデータのとき、BバンクRAM123のデータ出力
123−0は、TIDDクロックで駆動されるデータレ
ジスタTDATAA 138 bに一旦保持され、その
出力は、TOIクロックで駆動され2日 る位相変換データレジスタRDATAI 38に送出さ
れる。さらに、セレクタ125は、当該バンクRAMが
読み出し動作のとき、データレジスタ138a、138
bの当該出力を選択するようピッチ制御回路124Cの
出力信号FOR124C−3で振り分ける構成になって
いる。さらに、位相変換データレジスタRDATAI 
3 Bの出力データは、ベクトルレジスタ読み出しデー
タバス105に出力される。
(10)  レジスタRAM ベクトルレジスタ101の1つを構成する2つの超高速
RAMは、同一アドレスデータ値で同一ベクトルデータ
要素を表現するように配置される。
すなわち、全ベクトルデータの偶数要素を保持するAバ
ンクRAMI 22は、AバンクアドレスレジスタDA
A126の出力126−0でアドレッシングされる。ま
た、ベクトルデータの奇数要素を保持するBバンクRA
M123は、BバンクアドレスレジスタBAD 123
の出力123−0でアドレシングされる。
次に第1図に示すベクトルレジスタ101−0の全体的
動作概要を第2図を参照して説明する。
第2図はベクトルデータの書き込みと読み出しが同時に
行われているチエイニング処理を表している。なお、ベ
クトルデータの要素数は4とし、それぞれ順にe。+ 
 el l  el1  e3とする・まず書き込み時
刻t。にWAカウンタ118のラッチWINC118−
0に対しWAカウンタ118のクリアー信号W。が発行
される。クリア信号W。は、セレクタ120でピッチ信
号EOR124a−3が“0″の間選択されるので、t
+d toの時間幅となってAバンクアドレスレジスタ
AAD 126に入力され、その出力が時刻t1から時
刻t、+dtoまでの間アドレスAW。
としてAバンクRAM122に印加される。さらに、時
刻1oにAバンクRAM122の書き込みとしてラッチ
WEF129に書き込み信号WT。
が入力され、セレクタ131でEOR124a−3“0
″の間選択されるのでt C十a t o co時間幅
となってラッチWTMDA133へ入力される。
さらに、ラッチWTMDA133の出力で、書き込み信
号WT、は時刻1.から時刻t2+dt0まで有効とな
りANDゲート136でライト・パルス発生器135a
の出力パルスとANDを取り時刻t1から時刻t2+d
t0の間AバンクRAM122のWE136aとして印
加される。さらに書き込みベクトルデータe0は時刻t
0にレジスタWDATA 128に入力され、出力は1
0−1゜の時間幅で有効となる。次に、前記出力データ
はレジスタWDATAA128 aに入力され、その出
力は1.−1.の幅で有効になる。すなわち、ベクトル
データの偶数要素の最初であるベクトルデータe0は、
時刻t1から時刻tt+dtoの間にAバンクRAM1
22に書き込まれる。
次に、Bバンク側であるが、前記信号W0は、セレクタ
121でE OR124b −3が0″の間選択される
ので、1.−12の時間幅となってBバンクアドレスレ
ジスタBAD 127に入力され、その出力が時刻t、
+at、から時刻t3までアドレスBWOとしてBバン
クRAM123に印加される。さらに、時刻t、にBバ
ンクRAM123の書き込みとしてラッチWES130
に書き込み信号WT、が入力され、セレクタ132でE
OR124b−3が“0”の間選択されるので、1、か
らt2+dt、の時間幅となってラッチWTMDB 1
34へ入力される。さらに、ラッチWTMDB 134
の出力である書き込み信号WT。
は時刻t、+at、から時刻t3まで有効となり、AN
Dゲート137でライト・パルス発生器135bの出力
パルスとANDを取り時刻t、+at。
から時刻t3の間BバンクRAM123のWE137b
として印加される。さらに、書き込みベクトルデータe
、は時刻1.にレジスタWDATA128に入力され、
出力は12−13の時間幅で有効となる。次に、前記出
力データはレジスタWDATAB 128 bに入力さ
れ、出力は時刻t、+dt、からt、+dt、の時間幅
で有効になる。よって、ベクトルデータの奇数要素の最
初であるベクトルデータe1は、時刻t、+’dt。
からt3の間にBバンクRAM123に書き込まれる。
以下同様に書き込みベクトルデータetr03に対して
WAカウンタ118のラッチWINC118−0へWA
カウンタ118のカウントアツプ信号w、、W2が入力
され、それぞれAバンクRAM122のアドレスAWr
 、AWzおよびBバンクRAM123のアドレスBW
、、BW。
となる。また、ell”3を書き込むためのWEである
wT、、WT、はe!+”3をe、lとし、WT、、W
T、をWT、とし、ellがレジスタWDATA128
に入力される時間をt7で表現すると、WT、lをラッ
チWEF 129  (n=2)と、ラッチWES 1
30 (n=3)に入力する時間をtl’l−1とする
ことにより、8g+63を書き込むことができる。
一方、ベクトルデータeO+  el +  el +
  elの読み出しは、時刻t1にRAカウンタ119
のラッチRINC119−0へRAカウンタ119のク
リアー信号R0を発生することにより行われる。前記ク
リア信号R6は、セレクタ121でEOR124b−3
が“1”の間選択されるので時刻t、+atoから時刻
t2の間有効となり、AバンクアドレスレジスタAAD
 126に入力され、出力が時刻t2+dtoから時刻
t3までアドレスAROとなってAバンクRAM122
に印加される。さらに、PITCH信号FOR124C
−3がa1″のときセレクタ125はAバンクRAM1
22からの出力データであるデータレジスタRDATA
A138 aの出力を選択するので、時刻t2+dto
から時刻t、までAバンクRAM122に印加されてい
るアドレスAR,に対応したベクトルデータe。が出力
され、このベクトルデータe0は、位相変換データレジ
スタRDATA138に入力され、時刻t4から時刻t
5の間、ベクトルレジスタ読み出しデータバス105に
出力される。
つぎに、Bバンク側であるが、前記クリア信号R0は、
セレクタ121でEOR124b−3が“1”の間選択
されるので、時刻t、+dtoから時刻t3の間有効と
なり、BバンクアドレスレジスタB’AD127に入力
され出力が時刻t3から時刻t3+dt、までアドレス
BR,となってBバンクRAM123に印加される。さ
らに、PITCH信号EOR124cm3が“0”のと
きセレクタ125は、BパンクRAM123からの出力
データであるデータレジスタRDATAB138bの出
力を選択するので、時刻t3から時刻t、+dt、まで
BバンクRAM123に印加されているアドレスB R
oに対応したベクトルデータe1が出力され、このベク
トルデータe1は、位相変換データレジスタRDATA
138に入力され、時刻t、から時刻t6の間、ベクト
ルレジスタ読み出しデータバス105に出力される。以
下同様にベクトルデータeZ+  e3を読み出すため
にRAカウンタ119のラッチRINC119−0へR
Aカウンタ119のカウントアツプ信号R8が入力され
、それぞれAバンクRAM122のアドレスAR,およ
びBバンクRAM123のアドレスB R+ となるの
で、第2図で示すように、ベクトルデータeZ+83は
、データレジスタRDDATA13 Bを通ってベクト
ルレジスタ読み出しデータバス105に出力される。
前述したように、第1図に示したベクトルレジスタ10
1−0は、RAM書き込みピッチサイクルを時間tc+
dt、に設定し、RAM読み出しピッチサイクルを時間
dt、に設定してもベクトルレジスタを含むベクトル処
理装置全体のパイプラインピッチサイクルを時間tcと
することが可能である。
さらに、第4図に示すデイレイ回路208゜212.2
15のデイレイ量を変化させることによりRAMの書き
込み読み出し性能ピッチのバラツキに対して柔軟に対処
することが可能である。
なお、デイレイ回路の具体的な実現方法については、前
記回路を構成するゲートのカレントスイッチまたは出カ
ニミツターフォロアー電流量を制御することによりゲー
トデイレイを数Lopsの時間単位で変化させることで
実現する。
ところで、前述の実施例によれば、1相クロツクから全
てのLSI内部タイミングクロックを発生させることが
できるので、クロックスキューを低減できる利点も併せ
て得られる。
〔発明の効果〕
以上説明したように、本発明によれば、ベクトル処理装
置のマシンサイクルクロック速度をベクトルレジスタに
使用されるRAMの書き込みピッチ性能と読み出しピッ
チ性能の合計時間の1/2に設定することが可能であり
、これにより、読み出しピッチ性能に比較して書き込み
ピッチ性能が劣る超高速RAMの書き込みピッチサイク
ル以上にベクトル処理装置のマシンサイクルを設定する
ことができ、ベクトルデータの処理を高、速に行うこと
ができる。
【図面の簡単な説明】
第1図は本発明の一実施例によるベクトルレジスタの詳
細な構成を示すブロック図、第2図はベクトルレジスタ
の動作を説明するタイミングチャート、第3図はベクト
ルレジスタの動作を規定するクロックのタイミングチャ
ート、第4図はクロックタイミング発生回路の構成を示
すブロック図、第5図は本発明によるベクトル処理装置
の全体の概略構成を示すブロック図、第6図は従来技術
によるベクトル処理装置の構成を示すブロック図である
。 1.101・・・・・・・・・ベクトルレジスタ、2.
3゜102.103・・・・・・・・・セレクタ、6,
106・・・・・・・・・パイプライン演算器、9,1
09・・・・・・・・・主記憶装置、10,110・・
・・・・・・・ベクトルロードパイプライン、11,1
11・・・・・・・・・ベクトルストアパイプライン、
112・・・・・・・・・書き込み制御回路、115・
・・・・・・・・読み出し制御回路、118・・・・・
・・・・WAカウンタ、119・・・・・・・・・RA
カウンタ、120,121゜125.131,132・
・・・・・・・・セレクタ、122・・・・・・・・・
AバンクRAM、123・・・・・・・・・BバンクR
AM、 124. 124 a 〜124 c・・・・
・・・・−ピッチ制御回路、126・・・・・・・・・
Aバンクアドレスレジスタ(AAD)、127・・・・
・・・・・Bバンクアドレスレジスタ(BAD) 、1
28・・・・・・・・・データレジスタ(WDATA)
 、128 a、128 b−・・・・−・−・位相変
換データレジスタ(WDATAA、WDATAB)、1
29,130,133,134・・・・・・・・・うッ
チ、138・・・・・・・・・位相変換データレジスタ
(RDATA) 、138 a、  138 b−・・
・・・・データレジスタ(RDATAA、RDATAB
)。

Claims (1)

  1. 【特許請求の範囲】 1、書き込みピッチサイクルが読み出しピッチサイクル
    より遅いRAMにより構成されるベクトルレジスタと、
    パイプライン処理機構とを備えたベクトル処理装置にお
    いて、前記ベクトルレジスタへの書き込みピッチサイク
    ルと読み出しピッチサイクルの合計時間の1/2を、パ
    イプラインのピッチサイクルとすることを特徴とするベ
    クトル処理装置。 2、前記ベクトルレジスタは、2個のRAMバンクによ
    り構成され、それぞれのRAMバンクは独立にアドレッ
    シング可能であることを特徴とする特許請求の範囲第1
    項記載のベクトル処理装置。 3、前記ベクトルレジスタへの書き込みピッチサイクル
    と読み出しピッチサイクルとは、それぞれ可変であるこ
    とを特徴とする特許請求の範囲第1項または第2項記載
    のベクトル処理装置。
JP63228326A 1988-09-14 1988-09-14 ベクトル処理装置 Expired - Lifetime JP2941817B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP63228326A JP2941817B2 (ja) 1988-09-14 1988-09-14 ベクトル処理装置
US07/399,917 US5115393A (en) 1988-09-14 1989-08-29 Vector processor performing data operations in one half of a total time period of write operation and the read operation
DE3930313A DE3930313A1 (de) 1988-09-14 1989-09-11 Vektorprozessor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63228326A JP2941817B2 (ja) 1988-09-14 1988-09-14 ベクトル処理装置

Publications (2)

Publication Number Publication Date
JPH0277882A true JPH0277882A (ja) 1990-03-16
JP2941817B2 JP2941817B2 (ja) 1999-08-30

Family

ID=16874697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63228326A Expired - Lifetime JP2941817B2 (ja) 1988-09-14 1988-09-14 ベクトル処理装置

Country Status (3)

Country Link
US (1) US5115393A (ja)
JP (1) JP2941817B2 (ja)
DE (1) DE3930313A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100522177B1 (ko) * 2000-07-29 2005-10-18 죠지 잉-리앙 후앙 전기 커넥터 및 이를 전기 케이블에 장착하기 위한 방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658397B2 (ja) * 1989-06-13 1997-09-30 日本電気株式会社 マルチプロセッサシステム
JP2607689B2 (ja) * 1989-07-10 1997-05-07 株式会社日立製作所 ベクトル処理装置
US5539891A (en) * 1989-10-13 1996-07-23 Texas Instruments Incorporated Data transfer control circuit with a sequencer circuit and control subcircuits and data control method for successively entering data into a memory
JP3035828B2 (ja) * 1989-12-28 2000-04-24 甲府日本電気株式会社 情報処理装置
US5838984A (en) * 1996-08-19 1998-11-17 Samsung Electronics Co., Ltd. Single-instruction-multiple-data processing using multiple banks of vector registers
KR100476892B1 (ko) * 2002-04-29 2005-03-17 삼성전자주식회사 데이터의 부정조작을 방지하는 방법 및 그것을 이용한데이터 처리 시스템
DE10350281A1 (de) * 2003-10-28 2005-06-16 Infineon Technologies Ag Speicherzugriffsverfahren mit verzögertem Schreibsteuersignal und Datenverarbeitungsvorrichtung
US7797610B1 (en) * 2005-07-19 2010-09-14 Xilinx, Inc. Method and apparatus for virtual quad-port random access memory
DE102011075019B4 (de) 2011-04-29 2019-05-09 BSH Hausgeräte GmbH Filtersperre für einen Staubsauger
US9569211B2 (en) 2012-08-03 2017-02-14 International Business Machines Corporation Predication in a vector processor
US9632777B2 (en) 2012-08-03 2017-04-25 International Business Machines Corporation Gather/scatter of multiple data elements with packed loading/storing into/from a register file entry
US9575755B2 (en) 2012-08-03 2017-02-21 International Business Machines Corporation Vector processing in an active memory device
US9594724B2 (en) * 2012-08-09 2017-03-14 International Business Machines Corporation Vector register file
US9268571B2 (en) 2012-10-18 2016-02-23 Qualcomm Incorporated Selective coupling of an address line to an element bank of a vector register file

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58114274A (ja) * 1981-12-28 1983-07-07 Hitachi Ltd デ−タ処理装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4365294A (en) * 1980-04-10 1982-12-21 Nizdorf Computer Corporation Modular terminal system using a common bus
JPS58220291A (ja) * 1982-06-15 1983-12-21 Nec Corp 信号伝般時間制御回路
JPH0652530B2 (ja) * 1982-10-25 1994-07-06 株式会社日立製作所 ベクトル・プロセッサ
US4661900A (en) * 1983-04-25 1987-04-28 Cray Research, Inc. Flexible chaining in vector processor with selective use of vector registers as operand and result registers
JPS60136870A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd ベクトル処理装置
JPS60253091A (ja) * 1984-05-30 1985-12-13 Fujitsu Ltd 半導体記憶装置
US4945479A (en) * 1985-07-31 1990-07-31 Unisys Corporation Tightly coupled scientific processing system
US4980817A (en) * 1987-08-31 1990-12-25 Digital Equipment Vector register system for executing plural read/write commands concurrently and independently routing data to plural read/write ports

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58114274A (ja) * 1981-12-28 1983-07-07 Hitachi Ltd デ−タ処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100522177B1 (ko) * 2000-07-29 2005-10-18 죠지 잉-리앙 후앙 전기 커넥터 및 이를 전기 케이블에 장착하기 위한 방법

Also Published As

Publication number Publication date
DE3930313A1 (de) 1990-03-15
JP2941817B2 (ja) 1999-08-30
US5115393A (en) 1992-05-19
DE3930313C2 (ja) 1992-12-24

Similar Documents

Publication Publication Date Title
JPH0277882A (ja) ベクトル処理装置
US11675538B2 (en) Apparatuses and methods for in-memory operations
US5448715A (en) Dual clock domain interface between CPU and memory bus
US9251117B2 (en) Reconfigurable circuit with suspension control circuit
US11894045B2 (en) Processing in memory implementing VLIW controller
JPH05224929A (ja) コンピユータ、パイプライン処理方法及び命令処理方法
US4761754A (en) Vector processor wherein outputs of vector registers are fixedly coupled to inputs of vector calculators
JP2005353168A (ja) メモリインターフェース回路及びメモリインターフェース方法
US7343480B2 (en) Single cycle context switching by swapping a primary latch value and a selected secondary latch value in a register file
US5426771A (en) System and method for performing high-sped cache memory writes
WO1983002016A1 (en) Data processing system providing improved data transfer between modules
KR20080049727A (ko) 별도의 직렬 모듈을 지닌 프로세서 어레이
JP6432348B2 (ja) 演算装置及び演算方法
US9317475B2 (en) Multiplexing auxiliary processing element and semiconductor integrated circuit
US5829021A (en) System for controlling operating timing of a cache memory
JP4347352B2 (ja) ベクトルデータ処理装置
JP2514473B2 (ja) 並列処理装置
JPWO2010016097A1 (ja) 演算処理装置
JPH04175949A (ja) キャッシュ制御方式
JP3166781B2 (ja) 加算回路
JP3961473B2 (ja) ベクトル型コンピュータおよびその構成要素であるメモリアクセスリクエスト生成回路
JPS63305448A (ja) メモリインタフェ−ス制御方式
JP6089949B2 (ja) Simd型プロセッサ
JPS60144874A (ja) ベクトルデ−タ処理装置
JPH1064282A (ja) 連想メモリ