JPH0328962A - スコアボードによるアライン制御方式 - Google Patents

スコアボードによるアライン制御方式

Info

Publication number
JPH0328962A
JPH0328962A JP16333489A JP16333489A JPH0328962A JP H0328962 A JPH0328962 A JP H0328962A JP 16333489 A JP16333489 A JP 16333489A JP 16333489 A JP16333489 A JP 16333489A JP H0328962 A JPH0328962 A JP H0328962A
Authority
JP
Japan
Prior art keywords
circuit
scoreboard
vector
request
lrs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP16333489A
Other languages
English (en)
Inventor
Nobuyuki Sugiura
杉浦 信行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP16333489A priority Critical patent/JPH0328962A/ja
Publication of JPH0328962A publication Critical patent/JPH0328962A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔目 次〕 概要 産業上の利用分野 従来の技術と発明が解決しようとする課題課題を解決す
るための手段 作用 実施例 発明の効果 〔概要〕 1マシンサイクル中に、複数個のベクトルエレメントか
らなるリクエストブロックを、同時に処理する並列ベク
トル計算機システムにおいて、少なくとも、リクエスト
発生回路と,プライオリティ制御回路と,アライン回路
,及び、ロードレジスタスタック(LRS)とを備えて
、ベクトルユニット(VU)に対して、ベクトルデータ
(配列データ)を主記憶装置(MSU)からベクトルレ
ジスタ(VR)にロードするロードパイプラインにおけ
るアライン制御方式に関し、 上記プライオリティ制御回路では、エレメント間の優先
順序関係に制限を設けることなく、主記憶装置のアクセ
ス単位にアクセスを行う際のアライン制御を効率よく行
うことを目的とし、上記リクエストブロック内の各ベク
トルエレメントに対応して、データ出力通知信号(DO
W−VO〜)を保持しておくスコアボードを、上記リク
エストブロック内のエレメント数と,上記プライオリテ
ィ制御回路の入力ポート数とで決まり、該プライオリテ
ィ制御回路に同時に参加するリクエストブロック数の分
だけ待つスコアボード回路と、上記スコアボード回路に
、上記データ出力通知信号((lOW− 170〜)と
,上記スコアボード内の情報から、上記ロードレジスタ
スタック(LRS)からの読み出しを決定する論理機構
とを備えて、上記スコアボード回路の上記論理機構から
の出力信号のに基づいて、上記ロードレジスタスタック
(LRS)からベクトルレジスタへの読み出しをwJ御
するように構威する. 〔産業上の利用分野〕 本発明は、■マシンサイクル中に、複数個のベクトルエ
レメントからなるリクエストブロックを、同時に処理す
る並列ベクトル計算機システムにおいて、少なくとも、
リクエスト発土回路と,プライオリティ制御回路と,ア
ライン回路,及び、ロードレジスタスタック(Ll?S
)とを備え、ベクトルユニット(VIJ)に対して、ベ
クトルデータ (配列データ)を主記憶装! (MSU
)がらベクトルレジスタ(Vl?)にロードするロード
バイブラインにおけるアライン制御方式に関する。
最近のデータ処理の複雑化,データ処理の量の増大化に
ともなって、データ処理装置の処理能カの向上に対する
要求は益々強くなっており、ベクトル計’JKIIAシ
ステムに代表される、所謂、スーパーコンピュータに対
しても同じであり、例えば、同時に、複数個のエレメン
トを読み出すことを行うのが一般的になっている. このような、1マシンサイクル中に、複数個のベクトル
エレメントからなるリクエストブロックを、同時に処理
する並列ベクトル計算機システムにおいては、主記憶装
置(MSU)との間のデータ転送のスループットを向上
させる為に、本願出願人は、特願昭62−314745
号で、プログラムを実行する上で規定されるエレメント
間の順序を保証しながら、該主記憶装置(MSU)に対
するアクセスを効率よく行う方式として、毎マシンサイ
クル毎に、任意のエレメントを順次発信できる主記憶ア
クセス制御方式を開示している. この方式では、該主記憶装置(MSU)に対するアクセ
スの順序がランダムである為、咳主記憶装置01SU)
から読み出されたデータをエレメント順に並び替え、然
るべきタイミング迄ロードレジスタスタック(LRS)
に保持しておいて、効率よく、該ロードレジスタスタッ
ク(LRS)からベクトルレジスタ(VR)に読み出す
ことができるアライン制御方式が必要とされる. 〔従来の技術と発明が解決しようとする課題〕第3図は
並列ベクトル計算機の構威例を示した図であり、第4図
は従来の主記憶アクセス制12I方式を説明する図であ
り、第5図は従来のアライン制御方式を説明する図であ
る. 一般に、ベクトル計算機は、第3図に示したように、汎
用計算機の中央処理装f (CPU)に相当するスカラ
ユニット(SU) 8と、主記憶装置(MSU) 7と
、ベクトルデータを格納する為のベクトルレジスタ(V
R) 5と、上記主記憶装!(MSU) 7からベクト
ルデータを読み出して、一旦保持してから上記ベクトル
レジスタ(VR) 5に書き込む処理を連続的に行うロ
ードバイブライン3,4と、逆に、ベクトルレジスタ(
VR) 5からベクトルデータを読み出して、主記憶装
置(MSU) 7に書き込む処理を連続的に行うストア
バイブラインと、該ベクトルレジスタ(VR) 5に格
納されているベクトルデータ同士の演算を行う演算パイ
プライン9と、上記各回路間のデータの流れを制御する
各種制御回路から構威されている. このようなベクトル計算機において、本発明に関連する
アライン動作を伴う、ベクトルロード命令、即ち、ベク
トルデータを主記憶装置(MSU) 7からベクトルレ
ジスタ(VR) 5にロードする命令を実行する場合の
動作について、その概略を説明する. 先ず、スカラユニット(SU) 8から送出されたベク
トルロード命令は、ベクトル命令制御回路に入り、ここ
から、リクエスト発生回路1とパイプライン制御回路6
に送出される. リクエスト発生回路1では、該ベクトルロード命令が指
示するベクトルデニタの各エレメントに対応する主記憶
アドレスと,制御コード(リクエスト)(以下、総称し
て、リクエストという)を、プログラムを実行する上で
の順序性を保ちながら作威し、次のプライオリティ制御
回路2に送出する. (第4図のRQ.,%.。〜R’
4a+3参照)プライオリティ制御回路2においては、
入カポ− } (PRO〜PR3)に人力された上記リ
クエストを、主記憶装置(MSII) 7内のアクセス
単位、例えば、各バンクのビジー状態と,各リクエスト
間のアクセスの競合状態とから、各リクエストの優先順
位を判定して、主記憶装置(MSU) 7に送出する.
(第4図(7) MSU O−GO −MSU 3−G
o  参照)更に、該プライオリティ制御回路2におい
ては、主記憶装置(MSU) 7からのフエツチ(読み
出し)データが出力されるタイミング迄、各エレメント
に対応した上記リクエストを保持しておき、ロードパイ
プライン制御回路(上記パイプライン制御回路6の一部
を構成している)に対して、データ出力通知信号(DO
W−VO−DOW−V3)を送出する.(第4図のDo
n−VO 〜DOW−V3参照)第5図(b)は、従来
のロードパイプライン制御回路の一例を示しており、並
列度が゛4゛、つまり、同時に4エレメント迄のベクト
ルデータを同時にロードすることができる回路の例であ
る。
通常、ベクトルデータにおいては、そのエレメント番号
と、バンク番号とは、必ずしも、一致していないので、
該ロードパイプライン制御回路は、上記データ出力通知
信号(DOW−νO〜ロOH−V3)と,該リクエスト
アドレスの下位ビットから生成されるアライン識別子(
^lign 10) (当該エレメントに対するデータ
が、どのメモリバンクバス(MO〜門3)からくるかを
示す信号}とから、第5図(a)に示したロードアライ
ン回路3に、アライン(並べ替え〉指示,及び、ロード
レジスタスタック(LRS) 4への書き込み指示の信
号を送出し、主記憶装置(MSU) 7から読み出され
たデータを、エレメント番号の順に並べ替えて、上記ロ
ードレジスタスタック(LRS) 4に書き込む制御を
行う。
このとき、従来方式においては、第5図(b)に図示さ
れている如くに、第40千3番目のエレメントのデータ
出力通知信号(DOW−V3)が送られる毎に、1リク
エストブロック分のリクエストの完了、即ち、■リクエ
ストブロンク分のデータが全部、ロードレジスタスタッ
ク(LRS) 4に書き込まれたことを認識して、リク
エスト完了信号(Req−Compl)■を出力し、ロ
ードレジスタスタ・ンク(LRS) 4に溜まっている
データのリクエストブロック数をカウントするカウンタ
(ARSC) 32をインクリメント(プラス1)する
該カウンタ(ARSC) 32の値が゛0“より大きく
なると、特定のタイミングで、該ロードレジスタスタッ
ク(LRS) 4からベクトルデータを毎サイクル、1
リクエストブロック (4エレメント)の割合で読み出
し、ベクトルレジスタ(VR) 5に書き込む(VR−
Write)ように動作する。
このように、従来のアライン制御方式においては、ロー
ドパイプライン制御回路において、エレメント4n+3
のデータ出力通知信号(DOW−V3)を検出して該リ
クエストブロックnのリクエストの完了としていた為、
遅くとも、該エレメント4n+3のプライオリティがと
られる迄に、エレメント4n+o〜2のプライオリティ
がとられていなければならないことになる。
この為、従来のベクトル計算機では、該プライオリティ
制御回路2の優先順位判定回路において、後続エレメン
トが先行エレメントを追い越さないように順序を保証し
ていた。
然し、このような制御方式では、主記憶装置(MSU)
 7でのバンクビジー等によって、先行エレメントのプ
ライオリティの取得が遅れると、同一リクエストブロッ
ク内の後続エレメントがバンクビジーにかかることなく
発信可能であっても上記の制限によって、該エレメント
の発信が遅れてしまい、性能の低下を招くという問題が
あった。
第5図(c)に示した例では、例えば、エレメント0の
プライオリティ {エレメント0は入カポー1− (P
RO)に人力されているので、図中、PROで示してい
る)がバンクビジーによって待たされ、時刻4まで発信
が遅れると、後続のエレメント1〜3 (図中、同様に
、PRI〜PR3で示している)が時刻1で発信可能で
あっても、上記の順序を保証する論理から、図示されて
いる如くに、例えば、時刻8迄遅れてしまい、該リクエ
ストブロックのロードレジスタスタック(LI?S) 
4への格納の完了を示す、上記リクエスト完了信号(R
eq−Compl)■の送出が時刻8{図中では、説明
の便宜上、プライオリティの発信タイミングと同じに扱
っているが、実際には、アクセスタイム後だけずれた時
刻である.}となる。
そこで、上記の性能の低下を抑える方策として、例えば
、本願出願人が先廓している、前述の特願昭62−31
4745号に開示しているように、リクエスト発生回路
1では、プログラムを実行する上での順序性を保証しな
がら、プライオリティ制御回路2では、エレメントの順
序を保証しないで、バンクビジ一の解除されたエレメン
トから順次発信することで、主記憶装置(?ISII)
 7に対する発信効率を向上させる方式をとることが行
われている。
この場合には、もし、該エレメント4n+00プライオ
リティが取得される前に、エレメント4+n3のプライ
オリティが取得されたとすると、該リクエストブロック
nのリクエスト完了信号(Req−Coapl)信号■
が、該リクエストブロックのエレメントOに対応するデ
ータ出力通知信号(DOW−VO)が来る前に送出され
てしまい、該エレメントOが来ていないのに、ロードレ
ジスタスタック(LRS) 4からベクトルレジスタ(
VR) 5への書き込みが行われるという誤動作が起こ
ってしまう。
本発明は上記従来の欠点に鑑み、1マシンサイクル中に
、複数個のベクトルエレメントからなるリクエストブロ
ックを、同時に処理する並列ベクトル計算機システムに
おいて、少なくとも、リクエスト発生回路と,プライオ
リティ制御回路と,アライン回路,及び、ロードレジス
タスタック(LRS)  とを備え、ベクトルユニッl
− (VU)に対して、ヘクトルデータ(配列データ)
を主記憶装置(MSU)からベクトルレジスタ(VR)
にロードするロードパイプラインにおけるアライン制御
を行うのに、該主記憶装置(MSU)に対するアクセス
のプライオリティ制御回路では、エレメント間の優先順
序関係に制限を設けることなく、主記憶装置(MSLI
)のアクセス単位(例えば、バンク)にアクセスを行っ
て、該ベクトル計算機の処理能力の低下を抑止しながら
、ベクトルレジスタ(VR)への書き込みを正しく行う
ことができるアライン制御方式を提供することを目的と
するものである. 〔課題を解決するための手段〕 第1図は本発明の原理構威図であり、(a)はベクトル
長がリクエストブロック内のエレメント数の整数倍の場
合を示し、(b)はベクトル長がリクエストブロック内
のエレメント数の整数倍でなく端数がある場合を示して
いる。
上記の問題点は下記の如くに構威したスコアボードによ
るアライン制御方式によって解決される。
(1)1マシンサイクル中に、複数個のベクトルエレメ
ントからなるリクエストブロックを、同時に処理する並
列ベクトル計算機システムにおいて、少なくとも、リク
エスト発生回路1と,プライオリテ′イ制御回路2と,
アライン回路3,及び、ロードレジスタスタック(LR
S) 4とを備えて、上記プライオリティ制御回路2で
は、エレメント間の優先順序関係に制限を設けることな
く、主記憶装置のアクセス単位にアクセスを行う際のア
ライン制御方式であって、 上記リクエストブロック内の各ベクトルエレメントに対
応して、データ出力通知信号(DOW−VO〜〉を保持
しておくスコアボード31a,b〜を、上記リクエスト
ブロック内のエレメント数と,上記プライオリティ制御
回路2の入力ボートの数とで決まり、該プライオリティ
制御回路2に同時に参加するリクエストブロック数の分
だけ持つスコアボード回路31と、 上記スコアボード回路31に、上記データ出力通知信号
(DOW−VO 〜)と,上記スコアボード31a.b
〜内の情報から、上記ロードレジスタスタック(LRS
) 4からの読み出しを決定する論理機構31cとを備
えて、 上記スコアボード回路31の上記論理機構31cからの
出力信号■に基づいて、上記ロードレジスタスタック(
LRS) 4からベクトルレジスタ5への読み出しを制
御するように構戒する。
(2)上記スコアボード回路31において、lリクエス
トブロック分のスコアボード31aの内容と、上記デー
タ出力通知信号(DOW− VO〜)の値とを、各エレ
メント毎に論理和をとり、該論理和出力について、リク
エストブロック分の総ての論理積をとったものを、ロー
ドレジスタスタック(LRS) 4からの上記読み出し
制御信号■とするように構或する. (3)上記スコアボード31a,bによるアライン制御
方式において、該ベクトル命令の動作開始時に、ベクト
ル長が1リクエストブロック内のエレメント数の整数倍
でない場合の端数部分を抽出して、上記スコアボード回
路31内の複数個のスコアボド31a.b〜の一部に設
定する手段33を設けて、上記プライオリティ制御回路
2に同時に参加するリクエストブロック数に応じて、 最初は、上記ロードレジスタスタック(LRS) 4か
らの読み出し制御信号■の送出を抑止し、上記最初に抑
止したロードレジスタスタノク(L1?S) 4からの
読み出しの数を、最後の上記読み出制御信号■の送出時
に補正して、該読み出し制御信号のを送出するように構
或する。
〔作用〕
即ち、本発明によれば、1マシンサイクル中に、複数個
のベクトルエレメントからなるリクエストブロックを、
同時に処理する並列ベクトル計算機システムにおいて、
少なくとも、リクエスト発生回路と,プライオリティ制
御回路と,アライン回路.及び、ロードレジスタスタッ
ク(LRS)とを備えて、従来の各リクエストブロック
内のエレメント間の順序性を保証してアクセスを行い、
アライン制御回路では、そのリクエストブロックの最後
のエレメントが到達したことを、該エレメントのデータ
出力通知信号(DOW−V3)を認識してリクエスト完
了信号(Req−Compl)■を出力する代わりに、
上記プライオリティ制御回路では、エレメント間の優先
順序関係に制限を設けることなく、記憶装置のアクセス
単位にアクセスの発信を行うようにして、アライン制御
回路では、各リクエストブロック中で、プライオリティ
が取得されたエレメントを記録しておくスコアボード回
路を設けて、該スコアボード回路での記憶内容と、該リ
クエストブロックに対する最後の、データ出力通知信号
(DO−)とから、各サイクルにおけるリクエスト完了
信号(Req−Coa+pl)■、つまり、該リクエス
トブロック内の全エレメントが出揃って、ベクトルレジ
スタ(VR)に書き込める状態であるか否か{ベクトル
レジスタ(νR)には、各リクエストブロック内の全エ
レメントが揃わないと書き込めない}を判定するように
したものであるので、主記憶装置(MSU)から到達し
た順番に、ロードレジスタスタック(LRS)に各エレ
メントを一時格納し、当該リクエストブロックの最後の
エレメントが、該ロードレジスタスタック(LRS)に
到達した段階で、上記リクエスト完了信号(Req−C
oapl)■を得て、該ロードレジスタスタック(LR
S)から、ベクトルレジスタ(VR)にリクエストブロ
ックの各エレメントをロードすることができ、プライオ
リティ制御回路と.ロードアライン回路での制御の高速
化を達成することができる効果がある。
〔実施例〕
以下本発明の実施例を図面によって詳述する。
前述の第1図が本発明の原理構或図であり、第2図は本
発明の一実施例を示した図であって、(a)はスコアボ
ード回路の構威例を示し、(b)はスコアボード回路に
おける動作タイムチャートを示しており、第1図,第2
図における、今度ベクトルレジスタ(VR)に書き込む
べきリクエストブロック(n)の各エレメントに対応し
て、プライオリティの取得が済んだか否かを記録するラ
ッチ群(SCBO−EO〜E3) 31a,及び、その
次に、ベクトルレジスタ(VR)に書き込むべきリクエ
ストブロック(n)の各エレメントに対応して、ブライ
オリテイの取得が済んだか否かを記録するラッチ群(S
CBI−EO〜E3) 31bからなるスコアボード回
路31からのリクエスト完了信号(Req−Coapl
)のに基づいて、カウンタ(ARSC) 32を制御し
、該カウンタ(ARSC) 32の値が゜O′より大き
い時、所定のタイミングでロードレジスタスタック(L
RS) 4から、ベクトルレジスタ(VR) 5にリク
エストブロック(n)の各エレメントをロードする手段
が本発明を実施するのに必要な手段である. 以下、第1図,第2図によって本発明のスコアボードに
よるアライン制御方式を説明する.本発明を実施しても
、プライオリティ制御回路2から主記憶装置(MStl
) 7のロードアクセス制御.及び、主記憶装置(MS
U) 7からのロードデータをロードアライン回路3に
ロードし、アラインする動作の基本的な動作は、特に、
従来方式と変わることはないので詳細は省略し、ここで
は、主記憶装置(MSU) 7から、アクセスの発信の
順序で入ってくる該リクエストブロック(n)内の各エ
レメント4n+O〜3の順序の如何に関わらず、当該リ
クエストブロックの最後のエレメントがアライン回路3
に到達した時点で、リクエスト完了信号(Req−Co
+wpl)のを送出し、カウンタ(ARSC) 32を
制御する動作を中心にして説明する。
上記、本発明のスコアボード回路31は、該プライオリ
ティの判定に同時に参加させることができるリクエスト
ブロック数の段数のラッチ群(本実施例では、SCBO
−EO〜E3, SCBI−EO〜E3の2段)で構成
される。
この、同時にプライオリティの判定に参加させることが
できるリクエストブロック数は、該リクエストブロック
内のエレメント数(本実施例では、4エレメント)と、
プライオリティ制御回路2の入力ボート数(本実施例で
は、第4図から明らかな如< 、PRO−PI?3の4
人カボート)によって決まる。
つまり、上記のように、リクエストブロックのエレメン
ト数と、プライオリティ制御回路2の入力ポート数が同
じであるので、例えば、リクエストブロック1中のエレ
メント2,及び、エレメント3と、次のリクエストブロ
ック2のエレメント0,及び、エレメント1を同時にブ
ライオリテイ制御回路2の入力ポートに保持することが
できる.従って、この場合、同時にブライオリテイの判
定に参加させることができるリクエストブロック数は2
個である. 同様にして、リクエストブロック数のエレメント数が4
で、ブライオリテイ制御回路2の入力ボート数が8ボー
トであると、同時にプライオリティの判定に参加させる
ことができるリクエストブロック数は3個となることは
自明である.以下、伺様にして、同時にプライオリテイ
の判定に参加させることができるリクエストブロック数
は、該リクエストブロック内のエレメント数と、プライ
オリティ制御回路2の入力ボート数によって決まること
になる. 先ず、第2図(b)の動作タイムチャートに示した如く
に、時刻t=0において、第4図のリクエスト発生回路
1からリクエストブロックOの各エレメントのリクエス
トがプライオリティ制御回路2に送出される. ここで、該リクエスト発生回路lから送出される各リク
エストブロックのエレメントの順序性は、従来どおりに
、図示されている如くに保証される.即ち、前のエレメ
ントのリクエストが、プライオリティ回路2に受付られ
ないときには、次のリクエストブロックのエレメントの
送出はしないように動作している. プライオリティffIII11回路2では、該リクエス
トブロック0のエレメント0のリクエストが入っている
ポー} (PRO)に対応する主記憶装置(MSU) 
7のバンクがビジー(図中、’BUSY’で示す)の為
に、該エレメントOのプライオリティはt=1では取得
できないが、エレメント1〜3のプライオリティはt=
1のタイミングで取得される. (図中、リクエストブ
ロックOに対応して“0゜で示す)従来は該プライオリ
ティ制御回路2の優先順位判定回路において制限を受け
ていたので、第5図(c)で説明したように、該エレメ
ント1〜3のプライオリティは取得されなかった. このようにして、エレメント1〜3が発信され、その結
果として、該ブライオリテイ制御回路2からロードバイ
ブライン制御回路中のロードアライン回路3,及び、本
発明のスコアボード回路31へ、データ出力通知信号(
以下、0011−Vl〜v3という)が送出され、これ
によって、ロードアライン回路3が動作して、主記憶装
!(MStl) 7からの読み出しデータがロードレジ
スタスタック(LRS) 4に書き込まれると共に、本
発明の、該プライオリティが取得されたことを記録する
ラッチ(SCBO−ε1〜E3) 31aがt・2{こ
こでも、説明の便宜上、プライオリティの発信タイミン
グと同じに扱っているが、実際には、アクセスタイム後
だけずれた時刻である.以下,同じ}で“オン゛となり
、{第2図(b)のタイムチャートでは、該エレメント
のリクエストブロックの番号に対応して、゛0′印で示
している}以降、第2図(a)に示したスコアボード回
路31の構戒例から明らかな如く、DOW−Vl〜v3
信号は、ループ回路によって該ラッチに保持される. ロードパイプライン制御回路の、上記スコアボード回路
31では、上記エレメントOのロOW−VOがくる迄待
ち、これが、第2図(b)に示した如くに、t・4で送
出されると、第2図(a)に示したスコアボード回路3
1の論理和回路310−EO,及び、論理積回路311
が付勢され、該t=4のタイミングで、リクエスト完了
信号(Req−Compl)■を出力する。
該リクエスト完了信号(Req−Compl)■が出力
されると、第1図(a)の原理構威図に示されているカ
ウンタ(ARSC) 32がカウントアップされ、その
後、該リクエストブロックOのロ一ドデータが、ロード
レジスタスタック(LRS) 3から読み出され、ベク
トルレジスタ(Vl?) 5に書き込まれる.以下、同
様にして、リクエストブロック1〜3のアクセスが行わ
れる。
尚、第2図(a)のスコアボード回路31に示したラッ
チ(SCBI−EO〜E3) 31bは、前のリクエス
トブロック中の遅れているエレメントを待っている間に
、次のリクエストブロックのエレメントのプライオリテ
ィが取得された場合に使用される。
例えば、第2図(b)のタイムチャートにおいて、時刻
t=6〜8において、リクエストブロック1のエレメン
ト0が、エレメント1のバンクビジーによって、ラッチ
(SCB−EO) 31aに保持され待っている間に、
次のリクエストブロック2のエレメント0が取得される
と、これによる、DOW− VOは、上記2段目のラッ
チ(SCBI−EO) 31bに入る (図では、2”
で示している)ように動作する。
ラッチ(SCBO) 31a中のリクエストブロックの
全エレメントが揃い、リクエスト完了信号(Req−C
owpi)■が出力されると、該ラッチ(SCBO) 
31aはリセットされ、後続しているラッチ(SCBI
) 31bの内容がラッチ(SCBO) 31aに移さ
れる。
このようにして、第2図(b)の動作タイムチャートで
示したように、本発明の場合、プライオリティ制御回路
2では、バンクビジー等の条件が揃えば、エレメント間
の順序を保証することなくプライオリティが取得され、
その結果として出力されるDOW−ν1〜v3をロード
パイプライン制御回路中に設けられている本発明のスコ
ア・ボード回路31で順次保持しておき、リクエストブ
ロック中の全エレメントが揃った時点を認識して、リク
エスト完了信号(Req−Compl)のを出力し、該
リクエスト完了信号(Req−Compl)■を契機と
してカウンタ(八RSC) 32をカウントアップし、
ロードレジスタスタック(LRS) 4中に保持されて
いるロードデータをベクトルレジスタ(VR) 5に書
き込むようにした所に特徴がある。
上記の実施例は、ベクトルロード命令が指示するベクト
ル長が、リクエストブロックのエレメント数の整数倍の
場合を例にして説明したが、該ベクトル長が、リクエス
トブロックのエレメント数の整数倍でない場合には、上
記スコアボード回路31では、正しいリクエスト完了信
号(Req−Compl)のを出力することができない
このような場合でも、各ベクトルロード命令が指示する
ベクトルデータの切れ目を簡単に,且つ、正確に認識で
きれば、該ベクトルデータの最後のリクエストブロック
の端数を認識し、その不足するエレメントの部分に擬似
的なエレメントを付加することで、対処できるが、一般
には、主記憶装置(MSυ)7からのベクトルデータは
連続していること,及び、同時に2つのリクエストブロ
ックのエレメントが入ることがあるので、上記各ベクト
ルロ一ド命令に対応した、ベクトルデータの切れ目を認
識することは困難である。
然し、各ベクトルロ一ド命令のベクトルデータ列の間に
、lマシンサイクルの空きを設けるようにすれば、該切
れ目の認識が容易となるが、データ転送速度の低下を招
くので望ましくない。
そこで、本発明においては、第1図(b)に示した端数
制御回路33を設け、ベクトル長(VL)から゜1゜を
引いたイ直(VL−1) (このようにするのは、該端
数を下位の2ビントで正確に認識する為である)をベク
トル長カウンタ(VLC) 330に設定し、そこから
、各リクエストブロックのエレメント数、例えば、゜4
′ を減算したときの、下位2ビットが゜<1゜,“〈
2”,゛<3”である場合を論理禎回路331で検出し
て、該端数(rl〜r3)を認識し、上記スコアボード
回路31のラッチ(SCBO−E1〜E3) 31aを
セットする論理和回路312−El〜E3に、第2図(
a)で点線で示したように人力し、例えば、該ベクトル
ロ一ド命令の実行開始時(’Start’で示す)に、
予め、セットしておくように構成する。
そうすると、最初のリクエストブロックのエレメントの
一部が到達した時点で、誤ったリクエスト完了信号(R
eq−Compl)■を出力してしまうことになるので
、この最初のリクエスト完了信号(ReqCompl)
■の出力タイミングを論理積回路332で検出して論理
積回路34で抑止する。
以後、上記のベクトル長に端数がなかった場合と同様に
動作する。
そして、各リクエストブロックの読み出し毎に、上記ベ
クトル長レジスタ(VLC) 330から゛−4″を行
い(即ち、減算し)、下位2ビットを除く上位ビットが
゛=O′ になって、最後のリクエストブロックである
こと(final)を認識したタイくングでのリクエス
ト完了信号(Req−Comp l)■を検出して、そ
の時には、前述の抑止したリクエスト完了信号(Req
−Compl)■を補正する為に、カウンタ(ARSC
)32を゛+2′するように動作させることで、該カウ
ンタ(AI?SC) 32を正しく動作させことができ
る。
上記の例は、スコアボード回路31が2段構成の場合で
あるが、複数段で構威されている場合には、最初の何回
かのリクエスト完了信号(Req−CoIIIpl)■
を抑止し、最後のリクエスト完了信号(ReqComp
l)■の送出タイミングで、該最初に抑止した回数を補
正することで、どのような段数の構成のスコアボード回
路3Iでも対応することができる。
〔発明の効果〕
以上、詳細に説明したように、本発明のスコアボードに
よるアライン制御方式は、lマシンサイクル中に、複数
個のベクトルエレメントからなるリクエストブロックを
、同時に処理する並列ベクトル計算機システムにおいて
、少なくとも、リクエスト発生回路と,プライオリティ
制御回路と,アライン回路.及び、ロードレジスタスタ
ック(LRS)とを備えて、ベクトルユニット(Vυ)
に対して、ベクトルデーク(配列データ)を主記憶装置
(MSυ)からベクトルレジスタ(Vl?)にロードす
るロドパイプラインにおけるアライン制御を行うのに、
上記リクエストブロック内の各ベクトルエレメントに対
応して、データ出力通知信号(DOW−νO〜)を保持
しておくスコアボードを、上記リクエストブロック内の
エレメント数と,上記プライオリティ制御回路の入力ボ
ート数とで決まり、該プライオリティ制御回路に同時に
参加するリクエストブロック数の分だけ持つスコアボー
ド回路と、上記スコアボード回路に、上記データ出力通
知信号(Dow−vo〜)と,上記スコアボード内の情
報から、上記ロードレジスタスタック(LRS)からの
読み出しを決定する論理機構とを備えて、上記スコアボ
ード回路の上記論理機構からの出力信号{リクエスト完
了信号(Req−Compl) }のに基づいて、上記
ロードレジスタスタック(LRS)からベクトルレジス
タへの読み出しを制御するようにしたものであるので、
主記憶装置(MSU)から到達した順番に、ロードレジ
スタスタック(LRS)に各エレメントを一時格納し、
当該リクエストブロックの最後のエレメントが、該ロー
ドレジスタスタック(LRS)に到達した段階で、リク
エスト完了信号(Req−Compl)のを得て、該ロ
ードレジスタスタック(LRS)から、ベクトルレジス
タ(VR)にリクエストブロックの各エレメントをロー
ドすることができ、プライオリティ制御回路,ロードア
ライン回路での制御の高速化を達戒することができる効
果がある。
【図面の簡単な説明】
第1図は本発明の原理構戒図. 第2図は本発明の一実施例を示した図,第3図は並列ベ
クトル計算機の構成例を示した図.第4図は従来の主記
憶アクセス制御方式を説明する図, 第5図は従来のアライン制御方式を説明する図.である
。 図面において、 ■はリクエスト発生回路, 2はプライオリティ制御回路, 3はロードアライン回路,又は、アライン回路,31は
スコアボード回路. 31a,bはラッチ,又は、スコアボード(SCBO−
EO〜E3,SCBI−EO〜E3), 31cは読み出しを決定する論理機構,310−EO〜
E3は論理和回路, 311は論理積回路.32はカウ7 タ(ARSC) 
,33は端数制御回路, 330はベクトル長レジスタ(VLC) ,331,3
32は論理積回路, 4はロードレジスタスタック(LRS) ,5はベクト
ルレジスタ(VR), 6はパイプライン制御回路, 7は主記憶装置(MSU).  9は演算パイプライン
,8はスカラユニット(SU), ■はリクエスト完了信号(Req−Coapl) +D
ON−VO 〜V34はデータ出力通知信号,をそれぞ
れ示す.

Claims (3)

    【特許請求の範囲】
  1. (1)1マシンサイクル中に、複数個のベクトルエレメ
    ントからなるリクエストブロックを、同時に処理する並
    列ベクトル計算機システムにおいて、少なくとも、リク
    エスト発生回路(1)と、プライオリティ制御回路(2
    )と、アライン回路(3)、及び、ロードレジスタスタ
    ック(LRS)(4)とを備えて、上記プライオリティ
    制御回路(2)では、エレメント間の優先順序関係に制
    限を設けることなく、主記憶装置のアクセス単位にアク
    セスを行う際のアライン制御方式であって、 上記リクエストブロック内の各ベクトルエレメントに対
    応して、データ出力通知信号(DOW−VO〜)を保持
    しておくスコアボード(31a,b〜)を、上記リクエ
    ストブロック内のエレメント数と、上記プライオリティ
    制御回路(2)の入力ポートの数とで決まり、該プライ
    オリティ制御回路(2)に同時に参加するリクエストブ
    ロック数の分だけ持つスコアボード回路(31)と、 上記スコアボード回路(31)に、上記データ出力通知
    信号(DOW−VO〜)と、上記スコアボード(31a
    ,b〜)内の情報から、上記ロードレジスタスタック(
    LRS)(4)からの読み出しを決定する論理機構(3
    1c)とを備えて、 上記スコアボード回路(31)の上記論理機構(31c
    )からの出力信号([1])に基づいて、上記ロードレ
    ジスタスタック(LRS)(4)からベクトルレジスタ
    (5)への読み出しを制御することを特徴とするスコア
    ボードによるアライン制御方式。
  2. (2)上記スコアボード回路(31)において、1リク
    エストブロック分のスコアボード(31a)の内容と、
    上記データ出力通知信号(DOW−VO〜)の値とを、
    各エレメント毎に論理和をとり、該論理和出力について
    、リクエストブロック分の総ての論理積をとったものを
    、ロードレジスタスタック(LRS)(4)から上記読
    み出し制御信号([1])とすることを特徴とする請求
    項1に記載のスコアボードによるアライン制御方式。
  3. (3)上記スコアボード(31a,b)によるアライン
    制御方式において、該ベクトル命令の動作開始時に、ベ
    クトル長が1リクエストブロック内のエレメント数の整
    数倍でない場合の端数部分を抽出して、上記スコアボー
    ド回路(31)内の複数個のスコアボード(31a,b
    〜)の一部に設定する手段を設けて、 上記プライオリティ制御回路(2)に同時に参加するリ
    クエストブロック数に応じて、 最初は、上記ロードレジスタスタック(LRS)(4)
    からの読み出し制御信号([1])の送出を抑止し、上
    記最初に抑止したロードレジスタスタック(LRS)(
    4)からの読み出しの数を、最後の上記読み出制御信号
    ([1])の送出時に補正して、該読み出し制御信号(
    [1])を送出することを特徴とする請求項1,2に記
    載のスコアボードによるアライン制御方式。
JP16333489A 1989-06-26 1989-06-26 スコアボードによるアライン制御方式 Pending JPH0328962A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP16333489A JPH0328962A (ja) 1989-06-26 1989-06-26 スコアボードによるアライン制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP16333489A JPH0328962A (ja) 1989-06-26 1989-06-26 スコアボードによるアライン制御方式

Publications (1)

Publication Number Publication Date
JPH0328962A true JPH0328962A (ja) 1991-02-07

Family

ID=15771887

Family Applications (1)

Application Number Title Priority Date Filing Date
JP16333489A Pending JPH0328962A (ja) 1989-06-26 1989-06-26 スコアボードによるアライン制御方式

Country Status (1)

Country Link
JP (1) JPH0328962A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204748A (ja) * 1992-01-30 1993-08-13 Fujitsu Ltd マイクロプロセッサ

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05204748A (ja) * 1992-01-30 1993-08-13 Fujitsu Ltd マイクロプロセッサ

Similar Documents

Publication Publication Date Title
JPH0463430B2 (ja)
JPS63127368A (ja) ベクトル処理装置の制御方式
EP0363889A1 (en) Vector processor using buffer for preparing vector data
CA1279407C (en) Buffer storage control system
US6571301B1 (en) Multi processor system and FIFO circuit
JPH0328962A (ja) スコアボードによるアライン制御方式
JP2594600B2 (ja) シングルチップマイクロコンピュータ
JPS623361A (ja) ステ−タス通報方式
US7124288B2 (en) Programmable unit with a stack buffer storage device configurable into discrete shadow storage elements accessible by a plurality of command execution units
JPH03158952A (ja) Dmaコントローラおよび情報処理システム
JP3982077B2 (ja) マルチプロセッサシステム
US7457986B2 (en) Apparatus and method for using variable end state delay to optimize JTAG transactions
JPS60164842A (ja) 命令先取り装置
JPS6391756A (ja) 記憶装置の部分書き込み命令処理方式
JPH02234261A (ja) プロセツサ間データ転送装置およびデータ転送方法
JPH0690711B2 (ja) メモリアクセス制御方式
JPS63284673A (ja) 情報処理装置
JPS6342547A (ja) 回線制御装置
EP0098170A2 (en) Access control processing system in computer system
JPH0199141A (ja) 共用拡張記憶制御方法
JPH02183342A (ja) 割込み制御装置
JPH0474266A (ja) 識別子付きアクセス命令の逐次化制御方式
JPS6160161A (ja) マルチプロセツサシステム
JPH0283779A (ja) ベクトル処理装置の命令実行制御方式
JPS62214467A (ja) マルチプロセツサ命令制御方式