JPS60107175A - ベクトルプロセツサ - Google Patents
ベクトルプロセツサInfo
- Publication number
- JPS60107175A JPS60107175A JP58213921A JP21392183A JPS60107175A JP S60107175 A JPS60107175 A JP S60107175A JP 58213921 A JP58213921 A JP 58213921A JP 21392183 A JP21392183 A JP 21392183A JP S60107175 A JPS60107175 A JP S60107175A
- Authority
- JP
- Japan
- Prior art keywords
- machine cycle
- clock
- output
- adder
- mir20
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、データ処理装置に係り、特に、行列演算等の
別学演算を高速で実行するベクトルプロセッサに関する
。
別学演算を高速で実行するベクトルプロセッサに関する
。
パイプライン方式でベクトル演算の高速化を実現する場
合、最大性能はマシンサイクルと、並列に動作できるユ
ニツ1−数によって決まる。例えば、マシンサイクルを
I OOnとし、並列に動作できるフローティング演算
器の個数を2個とすると、最大性能は、2014FL(
IPs (旧IL、1ons of F]、oatj、
ngOperal;jons per 5eCond)
となる。従って、マシンサイクルはできるだけ短かくす
ることが必要である。ここで、パイプラrンステージは
第1図のようにモデル化できる。図において]、2.3
はランチレジスジ、/1.5は論理回路、6,7は制御
回路である。マシンサイクルは、例えば、図のランチレ
ジスタ1から論理量b′84を介してラッチレジスタ2
へ、あるとは、ランチレジスタ2から論理回路5を介し
てランチレジスタ3にデータを転送するに要する伝播返
鉱時間より長くとる必要がある。パイプライン演算B:
)では、通常、いくつかの機能を実行できる構成となっ
ており、これらは制御回路6,7によって指定で・きる
。従って、マシンサイクルは、パイプライン演算器の各
ステージで実行する機能に対する全ての伝播遅延時間よ
り大きくとる必要があり、最も長い伝播遅延時間によっ
て、マシンサイクルが決まる。通常の場合、1」標とし
ているマシンサイクルに対して、それより長くなる伝播
遅延時間は1〜2程度であるが、このため、目標マシン
サイクルが達成できず、マシンサイクルを長くするか、
あるいは、機能を削ることが必要であった。
合、最大性能はマシンサイクルと、並列に動作できるユ
ニツ1−数によって決まる。例えば、マシンサイクルを
I OOnとし、並列に動作できるフローティング演算
器の個数を2個とすると、最大性能は、2014FL(
IPs (旧IL、1ons of F]、oatj、
ngOperal;jons per 5eCond)
となる。従って、マシンサイクルはできるだけ短かくす
ることが必要である。ここで、パイプラrンステージは
第1図のようにモデル化できる。図において]、2.3
はランチレジスジ、/1.5は論理回路、6,7は制御
回路である。マシンサイクルは、例えば、図のランチレ
ジスタ1から論理量b′84を介してラッチレジスタ2
へ、あるとは、ランチレジスタ2から論理回路5を介し
てランチレジスタ3にデータを転送するに要する伝播返
鉱時間より長くとる必要がある。パイプライン演算B:
)では、通常、いくつかの機能を実行できる構成となっ
ており、これらは制御回路6,7によって指定で・きる
。従って、マシンサイクルは、パイプライン演算器の各
ステージで実行する機能に対する全ての伝播遅延時間よ
り大きくとる必要があり、最も長い伝播遅延時間によっ
て、マシンサイクルが決まる。通常の場合、1」標とし
ているマシンサイクルに対して、それより長くなる伝播
遅延時間は1〜2程度であるが、このため、目標マシン
サイクルが達成できず、マシンサイクルを長くするか、
あるいは、機能を削ることが必要であった。
本発明の目的は、伝播遅延時間が、目標マシ〉サイクル
より長い場合も、目標マシンサイクルを実現し、目標と
している最大性能を実現するバク1−ルプロセツサを提
供するにある。
より長い場合も、目標マシンサイクルを実現し、目標と
している最大性能を実現するバク1−ルプロセツサを提
供するにある。
本発明の要点は通常の場合は、目標マシンサイクルに対
してそれより長くなる伝播遅延時間は、1〜2fに!度
であるから、こ才しらの目半票マシンサイクルより長い
処理をあるパイプラインステージが行なう必要が発生し
た時点で、そのステージから、そのマシンサイクルの処
理をニマシンサイクルかけて行なう要求を出し、これに
より、同一ステップをニマシンサイクルかけて実行する
にある。
してそれより長くなる伝播遅延時間は、1〜2fに!度
であるから、こ才しらの目半票マシンサイクルより長い
処理をあるパイプラインステージが行なう必要が発生し
た時点で、そのステージから、そのマシンサイクルの処
理をニマシンサイクルかけて行なう要求を出し、これに
より、同一ステップをニマシンサイクルかけて実行する
にある。
第2図に本発明の実施例を示す。図において1は、マイ
クロプログラム制御部、2は演算ユニット、10は、マ
イクロプロゲラl−メモリ、2oは、マイクロプロゲラ
l−メモリの内容をラッチするメ、\ モリインストラクションレジスタMTR53oは、マイ
クロプログラムメモリ10のアドレスを指定するマイク
ロインストラクションアドレスレジスタ(MTAR)
、 /I Qは、M T R20(1,)内容とMIA
R30の内容のどちらかを選1尺するセレクタ、5゜は
、セレクタ40の出方に■を加える加算器、60−1〜
60−3は、パイプライン加覚器の第一ないし第三ステ
ージ、7o−1〜7o−4は、パイプライン乗算器の第
一・ないし第四ステージ、80.90はメモリ、too
、110は乗算器第4ステージ70’−/]及び加t7
. PH第三ステージ6゜−3の出力を選択するせレク
タ、120はクロック制御回路、130は、加tγ器第
ニスチーシロ。
クロプログラム制御部、2は演算ユニット、10は、マ
イクロプロゲラl−メモリ、2oは、マイクロプロゲラ
l−メモリの内容をラッチするメ、\ モリインストラクションレジスタMTR53oは、マイ
クロプログラムメモリ10のアドレスを指定するマイク
ロインストラクションアドレスレジスタ(MTAR)
、 /I Qは、M T R20(1,)内容とMIA
R30の内容のどちらかを選1尺するセレクタ、5゜は
、セレクタ40の出方に■を加える加算器、60−1〜
60−3は、パイプライン加覚器の第一ないし第三ステ
ージ、7o−1〜7o−4は、パイプライン乗算器の第
一・ないし第四ステージ、80.90はメモリ、too
、110は乗算器第4ステージ70’−/]及び加t7
. PH第三ステージ6゜−3の出力を選択するせレク
タ、120はクロック制御回路、130は、加tγ器第
ニスチーシロ。
−2からのり[」ツクサプレス信号線、140は、クロ
ック許ITr信号線である。クロック許可信号は、第3
し1のラッチレジスタ122を除く全てのレジスタへの
クロック許n(信号となってb)る。
ック許ITr信号線である。クロック許可信号は、第3
し1のラッチレジスタ122を除く全てのレジスタへの
クロック許n(信号となってb)る。
第3図にりIコック制御回路の構成を示す。図に才1い
て、121はNANI)ゲー1〜.122はラッチレジ
スタ、123はN A N 11ゲーl〜、+2/I、
125はクロック信号、】26はNANI)ゲート、1
27゜128はラッチレジスタへのクロック倍旧、12
9はラッチレジスタ出力である。
て、121はNANI)ゲー1〜.122はラッチレジ
スタ、123はN A N 11ゲーl〜、+2/I、
125はクロック信号、】26はNANI)ゲート、1
27゜128はラッチレジスタへのクロック倍旧、12
9はラッチレジスタ出力である。
第4図に第3図の動作を説明するタイ11チヤートを示
す。クロック124、クロック125は二相のクロック
であり、ラッチレジスタ122には、これらのクロック
のNANDをとり、クロック入力としてよ;す、各マシ
ンサイクルで、クロック許可信号+40がラッチさノシ
る。1マシンサイクル「1てはラッチレジスタ出力12
9は、1であり、クロックサプレス信号を0とすると、
Iマシンサイクル[−1のタロツク許可信号け1となり
、1マシンサイクルでクロック128にクロックが入り
、M’rR20にデータがラッチされる。2マシンサイ
クルロでクロックのサプレス信号130が1になると、
ラッチレジスタ出力129も1であるから、クロック許
可倍旧は0となり、2マシンサイクル目では、クロック
信号は人1)す、ラッチレジスタ122にも0がラッチ
される。2マシン」ナイクル目で、+22を除くラッチ
レジスタへのクロックがサプレスされた結果、クロッグ
ザブレス信号は三マシンザイクル口でも1どな−)でい
る。こ才しとラッチレジスタ出力129か0であること
より、クロック許可イ、−1号140は】となり、三マ
シンサイクル目にクロックが入る。即ち、タロツクサプ
レス信号により、−ステップがど4マシンサイクルで実
行されることになる。次の四マシンサイクルロで、タロ
ツクサブ1ノ入信号を0どすると、クロックが入る。
す。クロック124、クロック125は二相のクロック
であり、ラッチレジスタ122には、これらのクロック
のNANDをとり、クロック入力としてよ;す、各マシ
ンサイクルで、クロック許可信号+40がラッチさノシ
る。1マシンサイクル「1てはラッチレジスタ出力12
9は、1であり、クロックサプレス信号を0とすると、
Iマシンサイクル[−1のタロツク許可信号け1となり
、1マシンサイクルでクロック128にクロックが入り
、M’rR20にデータがラッチされる。2マシンサイ
クルロでクロックのサプレス信号130が1になると、
ラッチレジスタ出力129も1であるから、クロック許
可倍旧は0となり、2マシンサイクル目では、クロック
信号は人1)す、ラッチレジスタ122にも0がラッチ
される。2マシン」ナイクル目で、+22を除くラッチ
レジスタへのクロックがサプレスされた結果、クロッグ
ザブレス信号は三マシンザイクル口でも1どな−)でい
る。こ才しとラッチレジスタ出力129か0であること
より、クロック許可イ、−1号140は】となり、三マ
シンサイクル目にクロックが入る。即ち、タロツクサプ
レス信号により、−ステップがど4マシンサイクルで実
行されることになる。次の四マシンサイクルロで、タロ
ツクサブ1ノ入信号を0どすると、クロックが入る。
以上のクロック制御信号にJ、す、第2図の動作は以上
のJ:うになる。グロックザブレス信号130が0のと
きは、マイクロブ[lグラノ、10は、MIR20に読
み出さ、!’t、 h4’712の内容に従って、演覚
ユニツ!−2が制御される。M I R,20の出力の
一部は、MTAR30の出力とともにセレクタ40への
入力どなり、M T R,20で指定された条件分11
「kするか否かの指定に従い、どちらかが選択される。
のJ:うになる。グロックザブレス信号130が0のと
きは、マイクロブ[lグラノ、10は、MIR20に読
み出さ、!’t、 h4’712の内容に従って、演覚
ユニツ!−2が制御される。M I R,20の出力の
一部は、MTAR30の出力とともにセレクタ40への
入力どなり、M T R,20で指定された条件分11
「kするか否かの指定に従い、どちらかが選択される。
セレクタ40の出力は、加′f1器50で1を加えられ
、MTAR3(lにセットされる。演算ユニツ1−では
、MTR20の指定に従い、乗算器70、加算器60及
びメモリ80.90等を制御し、演算を実行する。ここ
で加算器筒1.ステージ60−2からクロックザブレス
信号が130に送出されると、−ステップの命令がニー
マシンサイクルかけて実行されることになる。
、MTAR3(lにセットされる。演算ユニツ1−では
、MTR20の指定に従い、乗算器70、加算器60及
びメモリ80.90等を制御し、演算を実行する。ここ
で加算器筒1.ステージ60−2からクロックザブレス
信号が130に送出されると、−ステップの命令がニー
マシンサイクルかけて実行されることになる。
このようにニマシンザイクルかけて実行する必要がある
命令は1例えば、フローティングデータを整数に変換す
る等極めて限られており、また、この命令自体も特殊で
あり、使用頻度は高くない。
命令は1例えば、フローティングデータを整数に変換す
る等極めて限られており、また、この命令自体も特殊で
あり、使用頻度は高くない。
関数演算命令でこれら変換命令を使用する場合があるが
、そのどき、30ステツプ中1ステツプで、イク、能低
丁は、わずか3%である。通常の乗算、加算は、−ステ
ップ−マシンサイクルで実行できるため、最大性能の低
下はイI:じかい。
、そのどき、30ステツプ中1ステツプで、イク、能低
丁は、わずか3%である。通常の乗算、加算は、−ステ
ップ−マシンサイクルで実行できるため、最大性能の低
下はイI:じかい。
本発明によれば、最(性fiヒの低士なく目標マシンサ
イクルを実現できる。
イクルを実現できる。
図面の簡n1なβ)1明
第1図は、パイプライン演t1器の構成図、第2回は本
発明の一実施()11 (ハブロツ/7回、第3図はフ
クロツク制御[−・1路図、第=1 ti4+は、第3
図のタイムチャー1−である、。
発明の一実施()11 (ハブロツ/7回、第3図はフ
クロツク制御[−・1路図、第=1 ti4+は、第3
図のタイムチャー1−である、。
Claims (1)
- 【特許請求の範囲】 1、演算ユニツI・、メモリ及びそれらを制御するユニ
ットから構成されるベクトルプロセッサにおいて、 クロック制御回路を設け、特定のユニットから、前記ク
ロック制御回路にクロックをサプレスするが否かを示す
信号を入力し、その入力に従い、入力がサプレスを指示
するときは、前記クロック制御回路はそのマシンサイク
ルのクロック印加を許可しない信号を出力し、次のマシ
ンサイクルで許可する信号を出力する手段を設けたこと
を特徴とするベグ1−ルプロセツサ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58213921A JPS60107175A (ja) | 1983-11-16 | 1983-11-16 | ベクトルプロセツサ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP58213921A JPS60107175A (ja) | 1983-11-16 | 1983-11-16 | ベクトルプロセツサ |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS60107175A true JPS60107175A (ja) | 1985-06-12 |
Family
ID=16647243
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP58213921A Pending JPS60107175A (ja) | 1983-11-16 | 1983-11-16 | ベクトルプロセツサ |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS60107175A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04181409A (ja) * | 1990-11-16 | 1992-06-29 | Fujitsu Ltd | パイプライン処理装置 |
-
1983
- 1983-11-16 JP JP58213921A patent/JPS60107175A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04181409A (ja) * | 1990-11-16 | 1992-06-29 | Fujitsu Ltd | パイプライン処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5473554A (en) | CMOS multiplexor | |
US5222240A (en) | Method and apparatus for delaying writing back the results of instructions to a processor | |
JPS6351287B2 (ja) | ||
JP2665081B2 (ja) | マイクロコンピュータのレジスタ間データ転送方式 | |
JPS6227412B2 (ja) | ||
JPH0343827A (ja) | ファジーマイクロコンピュータ | |
JPH04215129A (ja) | 連続指令実行方法及び装置 | |
JPS60107175A (ja) | ベクトルプロセツサ | |
JPS60107141A (ja) | プランチ制御方式 | |
JPS60178580A (ja) | 命令制御方式 | |
JPS63111535A (ja) | デ−タ処理装置 | |
JPS59184944A (ja) | 丸め演算方式 | |
JPH01273132A (ja) | マイクロプロセッサ | |
JPS63316133A (ja) | 演算処理装置 | |
JPS59117640A (ja) | データ処理装置のストア処理方法 | |
JPH0683618A (ja) | フラグ制御回路 | |
JPS59229659A (ja) | デ−タ処理方式 | |
Cho et al. | Experimental design of a 32-bit fully asynchronous microprocessor (FAM) | |
KR970007262B1 (ko) | 데이타패스 및 명령세트 확장이 용이한 risc 구조 | |
JP3573874B2 (ja) | 演算回路 | |
JPH06324868A (ja) | 専用演算器付きディジタル信号処理プロセッサ | |
JPS6225348A (ja) | アドレスバス拡張方式 | |
JPH03280151A (ja) | Dspに付加するioアクセス回路 | |
JPH09146769A (ja) | パイプライン処理装置 | |
JPH0338613B2 (ja) |