JPS58106642A - 並列演算装置 - Google Patents

並列演算装置

Info

Publication number
JPS58106642A
JPS58106642A JP56205013A JP20501381A JPS58106642A JP S58106642 A JPS58106642 A JP S58106642A JP 56205013 A JP56205013 A JP 56205013A JP 20501381 A JP20501381 A JP 20501381A JP S58106642 A JPS58106642 A JP S58106642A
Authority
JP
Japan
Prior art keywords
instruction
register
arithmetic
instruction register
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56205013A
Other languages
English (en)
Inventor
Tsutomu Sakamoto
務 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Tokyo Shibaura Electric Co Ltd filed Critical Toshiba Corp
Priority to JP56205013A priority Critical patent/JPS58106642A/ja
Publication of JPS58106642A publication Critical patent/JPS58106642A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Advance Control (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 発明の技術分野 本発明は/譬イデライン制御方式の並列演算装−に関す
る。
発明の技術的背景 一般にノイデライン制御方式の演算装置は第1図に示さ
れるように構5されている。図中、11け主記憶装置(
以下、−MEMと称する)、12fd MEM 11か
ら先読みされた命令が順次格納される命令パ、7ア(以
下、IBと異称する)である。このlB12に図示せぬ
命令先読み機構によってMEM J Jから命令を先読
みしておくことによって命令の処理を連続的に行なうい
わゆるノ譬イブライン制御が可能となる。なお、この・
中イブライン’I!II 制は本発明の要旨と直接関係
しないので説明を省略する。lB12に先読みされた命
令はタイプ等の解読が行なわれると命令レジスタ(以下
、IRと称する)13に置数される。このときRX型の
命令であれば、MEM Z 7からオペランドが読み出
され、このオーQンドは図示せぬナベランドLノノスタ
に格納される。
IRJJに置数されている命令は演算部14に取り込ま
れ、演算部14による命令実行が行なわれる。演算部J
4Fi図示せぬ制御記憶部を有しており、IRJJから
取り込んだ命令をマイクロ命令Kjl開して対応する処
理を行なう。すなわち、演算部14から取り出されるマ
イクロ命令はマイクロ命令パス15へ送出される。これ
により各種演算エレメント16.〜16アのいくつかが
起動されマイクロ命令に基づく処理が行なわれる。演算
エレメント161〜16.Fiそれぞれ固有の機能を有
しており、例えば演算エレメント161.16.はそれ
ぞれ加算器、雫算器である。これら演算エレメント16
1〜16n間のデータの授受はデータバス17を介して
行なわれる。
背景技術の問題点 このような第1図の・(イブライン制御方式の演算装置
では、たとえばRX型命令を処理する場合、MEM 1
1から命令を読み出す命令読み出しステージIF、オペ
ランドアPレス@)HステF −ノA1オ(ランド読み出しステー)<および実行ステ
ージEの順で処理が行なわれる。そして、各命令は、・
母イブライン制御によってその命令読み出しステージが
1周期(lマシンサイクル)ずつ後方へずれて処理され
る。もし命令してそれぞれ異なるタイミングでMEM 
l I K対する読み出しを行なうとか、MEM 11
の前段に設置されるキヤ、シ息メモリ(図示せず)を命
令格納用メモリと、オペランド格納用メモリとに分離し
て設けて使用するなど公知の技術により同−周期内で処
理することが可能である。しかし、実行ステージEが1
周期(lマシンサイクル)で終了しない命令の場合、後
続する命令の実行ステージと重なった状卵で処理を行な
うことは不可能であった。このため、後続する命令tD
実行、<テーゾEは先行する命令の実行ステージEが終
了するまで待たされていた。したがって第2図に示され
るように先行する命令1゜の実行ステージEがN周期た
とえば4周期(N=4)の実行時間を必要とする命令の
場合、後続する命令11+11+11 ・・・はそれぞ
れ少なくと−N−1周期すなわち38期待たされる。
このように従来のノ母イブライン制御方式の演算装置で
は、先行する命令の実行ステージEが1周期で終了しな
い命令の場合、後続する命令の実行ステージEが待たさ
れて・ヤイデラインの流れが妨げられるため、演算の高
速化を図る上で大きな障害となる欠点があった。
発明の目的 本発明は上記事情に鑑みてなされたものでその目的は、
実行ステージの並列処理が効率よく行なえ、もってノ4
イブラインの流れの乱れを著しく減少することができ、
演算速度の高速化が図れる並列演算装置を提供すること
にある。
発明の概要 命令パ、ファに先読みされた命令が置数される命令レジ
スタと、固有の演算処理機能を有する複数の演算部と、
これら演算部が共用する複数の演算エレメントとを設け
、上記各演算部を、上記命令レジスタを監視し、命令レ
ジスタに置数される命令が自演翼部で処理すべき命令で
あって、かつこの命令を実行するのく使用する演算エレ
メントが使用されていないものと判断した場合には、上
記命令レジスタに置数されている命令を取り込んで命令
の実行を開始するとともに他の演算部に対して上記使用
する演算エレメントが使用中であることを示す信号を出
力し、かつ上記命令レジスタに次に実行すべき命令を胃
散せしめるように構成することによって、命令実行継続
中の演算部の処理動作と並行して、他の演算部が上記命
令レジスタに新た罠置数された後続する命令を取り込ん
で実行するようにしたものである。
更に本発明は、現実行中の命令と次に実行すべき命令中
に含まれているレジスタ指定部の情報を比較する比較回
路を設け、この比較回路の比較出力を、次に実行すべき
命令を取や込んで命令の実行を開始するための一条件と
することによって、汎用レジスタの使用状況に応じて複
数の演算部が汎用レジスタをレジスタレベルで多重に使
用するようにしている。
発明の実施例 11!3図は本発明の一実施例を示すグロ、り図である
。第1図と同一部弄には同一符号を付して詳細な説明を
省略する。図中、201〜2ρ1は固有の演算処理機能
(たとえば固定小数点演算機能、浮動小数点演算機能、
または関数演算機能など)を有する演算部である。演算
部20゜〜j O,は基本的に第1図の演算部14を機
能分散したものであり、それぞれ独立した制御記憶(図
示せず)を有し、他の演算部と並列に動作できる。2ノ
はIRJJの内容を演算部201〜zO□に転送するた
めのオペシーシーン19ス、22は信号ラインOPF、
 I〜OPE nから成るエレメント使用中情報ライン
である。信号ラインOPP: J〜OPE nは、それ
ぞれ演算エレメント16、〜16nが使用中であるか否
かを示すための本ので、各演算部zo1〜20rnに全
て共通に接続されている。本実施例においてこれら信号
ラインOPE 1〜0Pli: nは通常状態でハイレ
ベル(”Hルベル)であり、対応する演算°エレメント
161〜16イが使用される場合に演算部201〜20
mのいずれかの演算部によってローレベル(’L’レベ
ル)にされる、この状態は該当する演算エレメントが解
放されるまで保たれる。PGはロードクロヅク信号ライ
ンである。
信号ラインPGはIRJJのロードクロ、り端子と各演
算部201〜20rlllに共通に接続されている。本
実施例において信号ラインPGは通常状態テ“H″レベ
ルあり、演算部201〜X O,のうちのいずれかの演
算部がIRJJK保持されている命令を取り込んだ場合
にその演算部によって“しルベルにされる。゛この演算
部はマシンクロ、りCLKの1周期後に信号ラインPG
を@H”レベルに戻すようになっている。
次に第3図の構成の動作を第4図のタイミングチャート
、を参照して説明する。今、IRJJには1マシンサイ
クルの実行ステージを要する命令Aが保持されており、
信号ラインPCは”L”レベルにあるものとする。また
、演算部JO。
がIR,13に保持されている命令Aを取り込んで演算
エレメント163を使用して演算処理を実行しているも
のとする。このとき、信号ラインOPE jは演算部2
0.によって@Lルベルとなっており、これにより演算
エレメント16゜が使用状態にあることが示される。こ
のような状態で演算部、201は命令Aを実行してから
1マクンサイクル後(第4図のタイミングチャートでは
第1周期の終了時)に信号ラインPCを”H”レベルに
戻す。この例では、命令Aを実行シてから1マシンサイ
クル後は、命令Aの実行ステージの終了時でもあり、演
算部20には信号ラインOPE jを″″H″H″レベ
ル、演算エレメント16雪を解放する。 □ 信号ラインPGが1H”レベルにカることにより、IB
Jjから出力されている次に実行すべき命令たとえば命
令BがlR13に保持される。この命令B社たとえば4
マシンサイクルの実行ステー・ノを要する命令であるも
のとする。
各演算部201〜20rnはIRf 3に保持されてい
る命令(命令B)をオペレージ■ンノ4ス21を介して
受は取ってデコードし、この命令(命令B)が自演鼻部
゛で実行すべき命令であるか否かを判断している。すな
わち演算部20.〜20ITlはオペレージ1ンパス2
ノに現われる命令を常に監視している。たとえば演算部
201が上記命令Bを実行すべi!ものと判断したもの
とする。このとき演算部201は命令Bを実行するのに
必要な演算エレメントはどれであるかを判断し、当該演
算エレメントが使用中であるか否かを判定する。もし、
使用中であれば演算部201による命令Bの実行は待た
される。本実施例において、命令Bを実行するのに必゛
要な演算エレメントが演算エレメント16nであるもの
とする(1演算エレメントとは限ら゛ない)。演算W 
2’01は演算エレメント1′6nが使用中であるか否
かを信号ラインOPE nの状態(“H”tたは“L″
レー!ルによって判断する。この例では信号ライン0P
Enは°H″レベルにあり、演算部201は演算エレメ
ント16nが非望i状態にあるものと判定する。この結
果、演算部201はlR13に保持されている命令Bを
内部の命令レノスタ(図示せず)に取り込む(演算エレ
メント16tl以外の演算エレメントが使用中であって
もかまわない)、このとき、演算部20、は信号ライン
PGをm L 11レベルにするとともに、信号ライン
OPE nを同じく“L”レベルにする。しかる後、演
算部20:は演算ニレメン)”76F、を用いて命令B
を実行する。
演算部20tは前述した命令Aの実行時と同様に、命令
Bを実行してから1マシンサイクル後(第4図のタイミ
ングチャートでは第2周期の終了時)に信号ラインPG
を1H#レベルに戻す。この結果、IBJjから出力さ
れている次に実行すべき命令たとえば命令CがIRJ 
3に保持される。この命令Cはたとえば命令Aと同じく
1マシンサイクルの実行ステージを要する命令であり、
第4レーシーンパス21を介して各演算部201〜20
mK転送される。演算部20、は命令Bの実行継続中で
あるため、演算部20亀を除く演算部20!〜20.が
オイレーシlンパス21に、現われる命令(命令C)を
監視している。このとき、演算部203が命令Cを実行
すべきものと判断し、かつ命令Cを実行するのに必要な
たとえば演算エレメント16mが(信号ラインOPE 
2の状態によ#))非使用状態にあることを判断したも
のとする。、これにより演算部20.は上記命令Cを内
部の命令レジスタに取り込み、かつ信号ラインPGを@
Lルベルにするとともに信号ラインOPE Jも同じく
″″L#L#エレメント161て命令Cを実行する。
一方、演算部201は演算エレメント16nを用いて命
令Bの実行を継続中である。すなわち、本実施例によれ
ば、先行する命令Bが1マシンサイクルで終了しない命
令であっても、この命令Bの実行ステージが終了するの
を待つことなく、次の命令Cを並列しC実行することが
で話る。以下、命令り、命令E(いずれも1マシンサイ
クルの実行ステージを要する命令)についても、これら
の命令を実行する演算部が命令Bを実行する演算部20
1と重ならず(この例ではそれぞれ演算部20..20
.とする〕、かつ命令Bの実行に使用される演算エレメ
ントが重ならなければ(この例ではそれぞれ演算エレメ
ント161+1’* とする)、命令Cの場合と同様に
命令Bと並列に実行される。したがって第5図に示され
るように先行する命令Bの実行ステージEが4周期の実
行時間を必要とする命令であっても、後続する命令C,
D、に:はそれぞれ1周期ずつ遅れて実行が開始される
だけである。ノ9イブライン制御方式では、通常状態に
おいて後続する命令は先行する命令に対して1周期ずつ
遅れて処理されるようになっており、本実施例によれば
先行する命令の実行ステージEが1周期で終了しない命
令の場合でもパイプラインの流れが妨げられない。した
がって演算速摩の高速化を図ることかで舞る。
次に並列処理ができない場合の動作を説明する。今、演
算部202が演算エレメント16Kを使用して第4図に
示されるように命令Fの演算処理を実行しているものと
する。この命令Fは2マシンサイクルの実行ステージを
要する命令であるものとする。この場合、明らかなよう
に信号ラインOPE lは演算部20雪によって@Lル
ベルとなっている。このような状態で演算部20.は命
令Fを実行してから1マシンサイクル後(第4図のタイ
ミングチャートでは第6周期の終了時)に信号ラインP
Gを′″H#H#レベル。
信号ラインPGが“Hルベルになることにより、次に実
行すべき命令たとえば命令GがlB12からIRJJに
保持される。この命令Gは演算エレメント16Bを使用
して演算部201が実行する命令であるものとする。こ
の場合、上記演算エレメント16には命令Fの処理を継
続している演算部J(llによって使用されているため
、演算部20.け命令Gの実行待ち状態となる。一方、
演算部20.は、命令Fを実行してから2マシンサイク
ル後に命令Fの処理を終了すると、信号ラインOPE 
1を1H”レベルに戻す。演算部20%は信号ライン0
PEIの状態を監視しており、上述したように信号ライ
フ 0PE lが1H2レベルになったことを検出する
と、演算エレメント161が解放された(非使用状態)
ものと判断する。この結果、演算部201は命令Gを内
部の命令レジスタに取り込む、このとき、演算部201
は信号ラインPGを“L”レベルにするとともに、信号
う、イン0PEJを同じく“Lルベルにする。しかる後
、演算部301は演算エレメント161を用いて命令G
を奥行する。
次に本発明の他の実施例を説明する。第6図は本発明の
他の実施例を示すプロ、り図である。
@3図と同一部分には同一符号を付して詳細な説明を省
略する0図中、31は@1図および第3図のIRJ l
と同じ<、xBixから取シ出される命令が保持される
命令レジスタ(第1命令レゾスタ)、J2は命令レジス
タS1(以下、1n31と称する)の保持内容が保持(
ロード)される命令レジスタ(第2命令レジスタ)であ
る。命令レジスタ32(以下、IRJJと称する)のロ
ードクロ、り端子およびクリヤ端子には後述する信号ラ
インLGが接続されておシ、信号ラインLGの状態のた
とえば@H′″#→′″L”への遷移に応じてlR31
の保持内容がロードされ、同じく“L“→“R2へめ遷
移に応じて1 クリヤされるようKなりている。3SはIRJJ。
32に保持されている各命令中に含まれているレジスタ
指定部の情報を比較する比較回路(以下、CMPと称す
る)である。第6図のlR31゜32に記されている符
号OPはオイレーシ、ンツード部、RJ、Rjはそれぞ
れ第1.@2オペランド格納レジスタ指定部であ、9、
RR型命令がIn81.82に保持されている状即が図
示されている。RR型命令中の第1.@2オペランド格
納レジスタ指定部RJ、RJで示されるレジスタ社汎用
レジスタ(図示せず)の一つテするものとする。 CM
P s sはxnsi、szにそれぞれRR型命令が保
持されている場合、IR81内のRR型命令のRJとI
RJJ内のRR型命令のRJ、82との一致/不一致を
それぞれ検出するようになっている。このCMP j3
の比較結果は、先行する命令の演算結果(R4で指定さ
れる汎用レジスタの一つに格納されている)を、次の命
令の第1オー(2ンドCRJで指定される汎用レジスタ
の一つに格納されている)または第2オ(ランl’(R
Jで指定される汎用レジスタの一つに格納されている)
で使用する場合に意味を持つものである。すなわちCM
P J lは次の命令の実行前に、当該命令を実行する
際に使用される汎用レジスタ中の成るレジスタが先行す
る命令の演算結果格納レジスタとして使用されているか
否かを検出するようになっている。 IPGはCMP 
J jの比較結果(一致/不一致検出出力)の出力信号
ラインである。
本実施例において、 CMP J Jの一致検出期間十
IYシンク四、りの間、信号ラインIPGは@L”レベ
ルとなシ、(上記1マシンクロダクの間を除く)不一致
検出期間中信号ラインIPGFi’″H”レベルとなる
ようになっている。すなわちCPM j lは一致検出
状態を更にlマシンクロックの間ホールドするようにな
っている。
401〜40rn社第3図の演算部io1〜20rnと
ほぼ同様の構成の演算部、LGは各演算部401〜40
rnお本びIRJ2のロードクロ、り端子、クリヤ端子
に共通に接続される信号ラインである。演算部401〜
40oの第3図の演算部201〜20mと異なる部分は
次の通りである。演算部401〜40−はIR31から
オヘレーシ冒ンパス21上に送出される命令の監視、信
号ライン0PFXJ〜OPE nの監視のほかに、信号
ライン!にの監視を行なうようになっている・そして、
少なくとも信号ラインIPGが@L”レベルである期間
中、演算部401〜40、は上記命令の取シ込みを待た
される。また、演算部401〜40mは実行状態にある
命令の実行ステージが2マシンサイクル以上を要する命
令である場合、当該命令をxnsiからIRJ2にロー
ドするために信号2インLGを′″H”レベルから′″
L’L’レベルようになっている0本実施例では、演算
[401〜40ffiは命令を実行してから1マシンサ
イクル後に信号ラインLGを″″LLルベル定し、必要
とする実行ステージのlマシンサイクル前に信号5イア
LGt@H”レベルに戻すようになっている。また、演
算部401〜401は信号ラインLGの監視をも行なう
、演算部401〜40mはオペレージ冒ンノ々ス21上
に送出された命令が自演鼻部で実行すべき命令であって
も、轟該命令の実行ステー′ジが2wシンサイクル以上
ヲ要する命令である場合、少なくとも信号ラインLGが
1L”レベルである期間中、上記命令の取9込みを待た
される。これは、lR111が使用状態にあるために、
次の命令をIRjJK続けてロード(退避)できないこ
とを、演算部・401〜46.が命令の内容(2−vシ
ンサイクル以上を要し、IRJjへの■−ドを必要とす
る命令であるか)、および信号ラインLGの状態によっ
てあらかじめ検出し、不具合が発生することを防止する
ためである。
次に@6図の構成の動作を第7図のタイミングチャート
を参照して説明する・今、演算部40sがIRJ I 
K保持されている命令Jを取プ込み、演算エレメント1
6.を使用して演算処理の実行を開始したものとする。
このとき、信号ラインPG、LG、IPG味それぞれ鴫
し−レベル、′H#レベル @ )i IIIレベルテ
する。tた信号ラインOPE 電は“L#レベルである
。上記命令Jが2マシンサイクル以上を要する命令、た
とえば4マシンサイクルを要する命令であるものとする
と、演算部40mは命令Jを実行してから1wシンサイ
クル後(I!7図のタイミングチャートではtX3周期
の終了時)に信号ツインLGt−@L’レベルに設定す
る。これによ)、IRjJK保持されている命令JはI
R31にロードされる。このとき、演算部40mは信号
ラインPGを″IHルベルに戻す。これによシ、IRJ
 1には次に実行すべき命令たとえば命令Kが保持され
る。この命令にはたとえば1wシンサイクルの実行ステ
ージを要する命令である。
IRJ J K保持された命令には、オペレージ1ンバ
ス21を介して各演算部401〜40I!1に転送され
る。ここで演算11A4o、が上記命令Kを実行すべき
ものと判断したものとする。そして、演算部40工が信
号ラインIPGの1H”レベル(CMP J Jがレジ
スタ指定部の不一致を検出)、使用すべき演算エレメン
トたとえば演算ニレメン)11.0非使用状II(信号
ラインOPE Jが″H”レベル)を検出し、かつ命令
Kが1マシンサイクルで終了する命令であることを判断
すると、信号ラインLGO”L”レベルに無関係に命令
Kを内部命令レジスタに取シ込む、このとき演算部4 
offIId信号ラインPGう1L”レベルにするとと
もに、信号ツインOPE jを同じ(@L”レベルにす
る。しかる後、演算部40□は演算エレメント161を
用いて命令Kを実行する・ 演算部40rnは命令Kを実行してから1マシンサイク
ル後(この例では命令実行終了時)に信号ラインPGt
−@H’レベルに戻す、この結果、命令にの次に実行す
べき命令たとえば命令りがIRJ 1に保持される。こ
の命令りはたとえば3マシンサイクルの実行ステージを
要する命令であるeIRJJに保持されている命令りは
オペレージ璽ンパス37を’(?t、て各演算部401
〜46mK転送される。ここで、演算部401が上記命
令りを実行すべきものと判断したものとする。命令りが
上述したようK 2−rシンサイクル以上の実行ステー
ジを要する命令である場合、第7図のタイミングチャー
トに示されるように、たとえ信号ツインIPGが″H”
レベル、使用すべき演算エレメントたとえば演算エレメ
ント111が非使用状態(信号ツインOPK 1が″″
HHルベルあっても、信号ラインLGが1Lmレベルで
あれば、演算部401は上記命令りの取シ込みを信号ラ
インLGが@Hmレベルになるまで待たされる。すなわ
ち命令りが現在実行されている命令Jと並列に実行され
ることが待たされる。これ112−vシンサイクルを必
要とする命令りが命令Jと並列に実行された場合、命令
りを退避すべきIRjJKは命令Jが保持されておシ、
命令りをIRJ 1に退避することが不可能となるから
である。もし、命令りが11シンサイクルで終了する命
令である場合には、命令りの取)込みが行なわれて命令
りが実行されることは明らかである。
演算部40富は命令Jの実行を継続し、命令Jの実行に
要する実行ステーJ)(4マシンサイクル)の1マシン
サイクル前(187図のタイ電ングチャートでは第5周
期の終了時)に信号ラインLGを@H”レベルに戻す、
演算部40には信号ラインLGを監視しておシ、信号ラ
インLG5f@H’レベルになるとIFtJJに保持さ
れている前記命令りを内部の命令レジスタに取9込む、
このとき演算部4o1は信号ラインp。
を1L”レベルにするとともに1演算エレメント16.
が使用状態であることを示すために信号ラインOPE 
Jを@L”レベルにする。しかる後演算部401は演算
エレメント161を用いて命令りを実行する。
演算部401は命令りを実行してからlマシンサイクル
後に信号ラインLGを1L#レベルに設定する。これ罠
よ、D、IRJJに保持されている命令りはIRJJに
ロード(退避)される。
このとき演算部40.は信号ラインPGt−@H”レベ
ルに戻す、これによ・(J 、IRJ Jには次に実行
すべき命令たとえば命令Mが保持される・この命令Mは
たとえば命令りの実行結果(命令りの第1オペランド格
納レジスタ指定部R1で指定されている汎用レジスタ中
の成るレジスタの内容)を用いて演算を行なう命令で、
1マシンサイクルで終了する命令であるものとする。
CMP J 、9はIRJ Jに保持されている命令り
の第1オペランド0格納レジスタ指定部R1の情報が、
lR81に保持されている命令Mの第1オ(ランド格納
レジスタ指定部R1の情報またはwc2オ(2ンド格納
しゾス!指定部R2O情報に一致しているか否かを比較
検出する。この例では、一致が検出されるため、一致検
出期間+1マシンサイクルの開信号ラインIPGはCM
P 3 J Kよって@L”レベルに設定される。一方
、IRJJに保持された命令Mはオイレーシ、ンパス2
1を介して演算部401〜4ornに転送される。
命令りを実行中の演算WI640.を除く各演算部はオ
ペレージlンパス21上に現われる命令を監視しておp
l。′たとえば演算部4o寓が命令Mを実行すべきもの
と判断したものとする。しかし、信号ラインIPGが1
Hmレベルにある場合、たとえ使用すべき演算エレメン
トたとえば演算エレメント16意が非使用状tQ(信号
ライン0PEjが@H”レベル)にあり、かつ命令Mが
1マシンサイクルで終了する命令であっても、演算部4
01は信号2インIPGが1H“レベルになるまで上記
命令Mの取シ込みを待たされる。
これは命令Mが先行する命令りの演算結果を使用する命
令である丸め、命令りの実行ステージが終了する前に命
令Mを実行した場合、その実行結果が誤シとなるためで
ある。
演算部401は命4bの実行を継続し、命令りの実行に
要す、る実行ステージ(3マシンサイクル)の1マシン
サイクル前(第7図のタイミングチャートでは第7周期
の終了時)に信号ラインLGを1Hmレベルに戻す、信
号ラインLGが′″L#→−H’に遷移することにょシ
、IRj Jはクリヤされる。この結果、CMP J 
Jの前述した一致検出は終了するが、CMP J jは
一致検出状態を更に1マシンサイクルの間ホールドする
ため、信号ラインIPGO1Lルベルは命令しの実行終
了時まで保たれる。そして、命令りの実行終了時(第7
図のタイミングチャートでは第8周期の終了時)に信号
ラインIPGが″H”レベルに戻されると、演算部40
mは先行する命令しの実行ステージが終了したものと判
断し、上記命令りで得られ九演算結果(汎用レジスタ中
の成るレジスタの内容)を用いて命令Mの実行を行なう
このように本実尻側によれば、汎用レノスタノ使用状況
をレジスタレベルであらかじめ検出することができるの
で、先行する命令の演算結果を用いて演算を行なう命令
まで先行する命令と並列に実行してしまい、誤った結果
を得るような不具合が防止できる。また、汎用レジスタ
を演算エレメントの一つとすることができる場合、汎用
レジスタの使用状況をし・ノスタレベルで検出しなくて
も上述の不具合は防止できるが、使用レジスタが一致し
ない場合でも稜続する命令の実行が待たされることにな
り、汎用レジスタの使用効率および処理速度が低下する
。これに対し、本実施例では汎用レジスタの使用状況を
レジスタレベルで検出でき、使用レジスタが一致しない
場合には命令の並列実行が行なえるので、汎用レジスタ
の使用効率および処理速度が向上する。
なお、上記他の実施例では、CMP 3 JがRR型命
令の第1オー45ンド格納レジスタ指定部RJ 、@2
オ(ランド格納レジスタ指定部R2の情報を比較する場
合について説明したが、RR型命令とRX型命令、RX
型命令とRR型命令、RX型命令同志におけるレジスタ
指定部(インデックスレジスタ指定部も含む)の情報を
比較する場合についても同様である。ただし、CMP3
3は命令のタイf(型)を判定する機能、この判定結果
に応じて比較対象となるレジスタ指定部の情報をHt3
1,31から選択する機能(或いはIRJJ、51に保
持されている各命令中の比較対象とならない情報をマス
クする機能)を備えている必要がある。
発明の効果 以上詳述したように本発明の並列演算装置によれば、実
行ステージの並列処理が効率よく行なえるので、パイプ
ラインの流れの乱れを著しく減少することができ、演算
速度の高速化が図れる。
【図面の簡単な説明】
第1図は一般的な演算装置の構成を示すプロ、り図、W
cz図は一般的なパイプラインの流れを説明するための
図、第3図は不発明の一実施例を示すプロ、り図、第4
図は上記実施例の動作を説明するためのタイミングチャ
ート、第5図は上記実施例におけるノ4イデラインの流
れを説明するための図、第6図は本発明の他の実施例を
示すブロック図、第7図は上記他の実施例の動作を説明
するためのタイミングチャートである。 11・・・主記憶装置(MEM)、J!・・・命令ノ譬
ν7ア(IB)、13.31.32・・・命令レジスタ
(IR)、14.201〜2o、40s〜40ol・−
演算部、161〜16n・・・演算エレメント、22・
・・エレメント使用中情報ライン、3 J−・・比較回
路(CMP )、OFF、 1〜OPE n 。 PC、LG 、 IPG−・信号ライン。 出願人代理人  弁理士 鈴 江 武 彦307

Claims (7)

    【特許請求の範囲】
  1. (1)主メモリから先読みされた命令が順次格納される
    命令パ、ファと、この命令パ、7アから取り出される命
    令が置数される命令レジスタと、この命令レジスタに置
    数される上記命、令を実行するためにそれぞれ固有の演
    算処理機能を有する複数の演算部と、これら演算部が共
    用する複数の演算エレメントと、上記複数の演算部に共
    通に接続され、上記複数の演算エレメントのうちのいず
    れの演算・エレメントが使用されているかを示すための
    エレメント使用情報ラインとを具備し、上記各演算部は
    上記命令レジスタに置数される上記命令を監視し、この
    命令が自演鼻部で処理すべき命令であるか否か、および
    上記エレメント使用情報ラインの状態に応じて上記命令
    レジスタに置数されている命令を取り込み、対応する上
    記演算エレメントを用いて演算を肴なう一方、この演算
    エレメントが使用中であることを示す信号を上記エレメ
    ント使用情報ラインに出力し、かつ上記命令レジスタに
    上記命令パダファから次に実行すべき命令を置数するよ
    うに構成されていることを特徴とする並列演算装置。
  2. (2)主メモリから先読みされた命令が順次格納される
    命令−・1.フ1と、この命令パ、ファから取り出され
    る命令が置数される@1命令レジスタと、この第1命令
    レジスタKll数されて°いる上記命令が置数される@
    2命令レジスタと、これらI@lおよび第2命令レジス
    タに置数されている各命令中に含まれているレノスタ指
    定部の情報を比較する比較回路と、上記第1命令レジス
    タKft数されている命令を実行するためにそれぞれ1
    有の演算処理機能を有する複数の演算部と、これら各演
    算部が共用する複数の演算エレメントと、上記複数の演
    算部に共通に接続され、上記複数の演算エレメントのう
    ちのいずれの演算エレメントが使用されているかを示す
    ±めのエレメント使用情報ラインとを具備し、上駅各演
    算部は上記第1命令レジスタに置数される上記命令を監
    視し、少なくともこの命令が自演鼻部で処理すべき命令
    であるが否が、上記エレメント使用情報ラインの状態、
    および上記比較回路の比較結果に応じて上記@l命令し
    ノスタKffR数されている命令を取り込み、対応する
    上記演算エレメントを用いて演算を行なう一方、この演
    算エレメントが使用中であることを示す信号を上記エレ
    メント使用情報ラインに出力し、かつ上記第1命令レジ
    スタに置数されている命令を必’IJK応じて上記第2
    命令レゾスタに置数し、かつ上記第1命令レジスタに上
    記命令・ン、ファから次に実行すべき命令を置数するよ
    うに構成されていることを特徴とする並列演j[装置。
  3. (3)上記演算部は少なくとも上記比較回路の一致検出
    出力期間中、上記第1命令レジスタに置数されている命
    令の取り込みを待たされることを特徴とする特許請求の
    範囲@2項記載の並列演算装置。
  4. (4)  上記演算実行状郭にある演算部は上記第1命
    令レジスタに置数されている上記命令の実行ステージが
    2周期以上を要する場合に当該命令を上記第2命令レノ
    スタに置数することを特徴とする特許請求の範囲第3項
    記載の並列演算装置。
  5. (5)  上r演算実行状岬にある演算部は上記軍1命
    令レノスタに置数されている命令を上1rillE2命
    令レジスタに置数するためにロードクロ。 り信号を出力するとともに、この命令の実行ステージが
    終了する1周期前に上記ロードクロ。 り信号の出力を停止することを特徴とする特許請求の範
    囲第4項記載の並列演算装置。
  6. (6)  上記各演I1.部および上記@2命令レノス
    タに共通に接続され、上記ロードクロ、り信号が転送さ
    れるロードクロ、り信号ラインを備えていることを特徴
    とする特許請求の範囲第5項記載の並列演算装置。
  7. (7)  上記演算部は、上記w、l命令レノしタに置
    数されている命令の実行ステージが1周期で終了しない
    命令の場合、少なくとも上記ロードクロ雫り信号ライン
    を介して他の演算部から上記ロードクロ、り信号が転送
    されている期間中、上記飢1命令レジスタに置数されて
    いる命令の取り込みを待たされることを特徴とする特許
    請求の範囲第6項記載の並列演算装置。
JP56205013A 1981-12-18 1981-12-18 並列演算装置 Pending JPS58106642A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56205013A JPS58106642A (ja) 1981-12-18 1981-12-18 並列演算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56205013A JPS58106642A (ja) 1981-12-18 1981-12-18 並列演算装置

Publications (1)

Publication Number Publication Date
JPS58106642A true JPS58106642A (ja) 1983-06-25

Family

ID=16499998

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56205013A Pending JPS58106642A (ja) 1981-12-18 1981-12-18 並列演算装置

Country Status (1)

Country Link
JP (1) JPS58106642A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6027943A (ja) * 1983-07-27 1985-02-13 Hitachi Ltd デ−タ処理装置
JPS62293351A (ja) * 1986-06-12 1987-12-19 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション コンピユ−タ・システム

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS51854A (en) * 1974-06-21 1976-01-07 Hitachi Ltd Deijitarukeisankino senkoseigyohoshiki
JPS5199427A (ja) * 1975-02-27 1976-09-02 Hitachi Ltd
JPS5324753A (en) * 1976-08-20 1978-03-07 Toshiba Corp In formation processing system
JPS5668857A (en) * 1979-11-08 1981-06-09 Mitsubishi Electric Corp Data processing device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS51854A (en) * 1974-06-21 1976-01-07 Hitachi Ltd Deijitarukeisankino senkoseigyohoshiki
JPS5199427A (ja) * 1975-02-27 1976-09-02 Hitachi Ltd
JPS5324753A (en) * 1976-08-20 1978-03-07 Toshiba Corp In formation processing system
JPS5668857A (en) * 1979-11-08 1981-06-09 Mitsubishi Electric Corp Data processing device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6027943A (ja) * 1983-07-27 1985-02-13 Hitachi Ltd デ−タ処理装置
JPS62293351A (ja) * 1986-06-12 1987-12-19 インタ−ナショナル ビジネス マシ−ンズ コ−ポレ−ション コンピユ−タ・システム

Similar Documents

Publication Publication Date Title
US4949241A (en) Microcomputer system including a master processor and a slave processor synchronized by three control lines
JPH08305568A (ja) 情報処理装置
JPS6028015B2 (ja) 情報処理装置
JPH07175666A (ja) データプロセッサおよびその割込み要求処理方法
US5029073A (en) Method for fast establishing a co-processor to memory linkage by main processor
JP3707581B2 (ja) 自己整合スタック・ポインタを有するデータ処理システムおよびその方法
KR970003321B1 (ko) 코프로세서 지정 시스템
JP2000207247A (ja) コンピュ―タシステムおよびこのコンピュ―タシステムを動作させる方法
JP3510729B2 (ja) 命令実行方法および命令実行装置
US4631672A (en) Arithmetic control apparatus for a pipeline processing system
EP0497485A2 (en) Computer for implementing two-operand instructions
US4259718A (en) Processor for a data processing system
US5872954A (en) Method of monitoring registers during emulation
EP0840223B1 (en) Microcomputer capable of accessing an external memory
JPS58106642A (ja) 並列演算装置
KR100241970B1 (ko) 파이프라인 처리를 수행하는 데이터 처리 장치
US6233675B1 (en) Facility to allow fast execution of and, or, and test instructions
US5938762A (en) Method and apparatus for performing exception processing routine in pipeline processing
CN110245096B (zh) 一种实现处理器直接连接扩展计算模块的方法
JPH01243167A (ja) データ処理装置
JP2824484B2 (ja) パイプライン処理計算機
JP2558902B2 (ja) 半導体集積回路装置
JPH06348543A (ja) 入出力シミュレータとの接続方法
JPS5942331B2 (ja) プロセツサソウチノセイギヨホウシキ
CN117667212A (zh) 指令控制装置、方法、处理器、芯片和板卡