JPS61131169A - マルチプロセツサシステム - Google Patents
マルチプロセツサシステムInfo
- Publication number
- JPS61131169A JPS61131169A JP59252950A JP25295084A JPS61131169A JP S61131169 A JPS61131169 A JP S61131169A JP 59252950 A JP59252950 A JP 59252950A JP 25295084 A JP25295084 A JP 25295084A JP S61131169 A JPS61131169 A JP S61131169A
- Authority
- JP
- Japan
- Prior art keywords
- vector
- unit
- instruction
- instructions
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 9
- 230000003139 buffering effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 13
- 230000000694 effects Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 101100327917 Caenorhabditis elegans chup-1 gene Proteins 0.000 description 1
- ATJFFYVFTNAWJD-UHFFFAOYSA-N Tin Chemical compound [Sn] ATJFFYVFTNAWJD-UHFFFAOYSA-N 0.000 description 1
- 235000006732 Torreya nucifera Nutrition 0.000 description 1
- 244000111306 Torreya nucifera Species 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008021 deposition Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000009938 salting Methods 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/80—Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
- G06F15/8053—Vector processors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3836—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution
- G06F9/3851—Instruction issuing, e.g. dynamic instruction scheduling or out of order instruction execution from multiple instruction streams, e.g. multistreaming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/38—Concurrent instruction execution, e.g. pipeline or look ahead
- G06F9/3885—Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Multimedia (AREA)
- Computing Systems (AREA)
- Advance Control (AREA)
- Multi Processors (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
〔産業上の利用分野〕
本発明は大型汎用計算機又は超高速計算機に関し、最少
のハードウェアでオ大の処理能力を得るための構成に関
する〇 〔従来技術とその問題点〕 科学技術用計算機において、高速化を実現するために一
般に以下のような方法が取られている。 ■ 科学技術計算のための命令を処理するユニットのデ
ータ処理能力を大きくする。 ■ マルチシステムにする。 ■の方法では、科学技術計算のための命令とその他の命
令との比率により、高速化の効果の大小が異なる。デー
タ処理能力を2倍にした例を第8図に示す。 人は科学技術計算のための命令の比率が大きい場合で、
全体の錫塩時間が半分程度になる。しかしBのようにそ
の他の命令の比率が大きい場合にはほとんど効果はない
。 従って単に科学技術計算用の命令の能力を大きくしても
、Bのようなプログラムに右いてし1、計算機のバラン
スが悪くなり、大きな高速化の効果は得られない。 シングルシステムで最適な処理能力のバランスを持つ装
置ができたら、それ以上の高速化を実現するためには、
一般に■のマルチシステムの方法を取る。 しかし例iば2台のマルチシステムにした場合、トータ
ルの処理能力は最大でも2倍にしかならない。また、プ
ログラムがひとつしか動いてない時は、シングルシステ
ムと同じ処理能力になりてしまう。 ベクトルプロセッサ(以後vPと呼ぶ)を例にとり、詳
細に説明する。 〔従来技術の詳細な説明〕 VPは科学技術計算のための命令(ベクトル命令)を処
理するベクトルユニット(VU)と、その他の命令(ス
カシ命令)を処理するスカシユニット(SU)とを持つ
。 シングルシステムの構成例を第2図に示し、この構成を
vPlと呼ぶ。 又VUのデータ処理能力5−2倍にした場合の例J1ζ を第3図に示し、これをVF2と呼が。 第2図のVPIに比べVF2のVUのハード量がほぼ2
倍になっている。 VP1ff成のVPU 2台をマルチシステムにした例
をt44図に示し、vpt−Mと呼ぶ。 次に各構成例におけるプログラムの実行の様子を説明す
る。第5図は8U、VU等が命令実行している様子を示
し、■はvPlの場合、■はVF2の場合、■はVP
l−Mの場合であり、白はスカシ
1命令の実行時間、ハツチングはベクトル命令の実行時
間を示す。 VP2では8Uの実行時間は変わらないが、VUの実行
時間が#−分になりている。VPl−Mでは、VPU、
とVPU、で別々のプログラムを実行している。それぞ
れの実行時間はVPlと同じであるが、ジップのスJk
−プツトが2倍になりでいる。 第6図にVUの一般的構成例のブロック図を示ベクトル
命令を制御するユニットで641の制御信号により65
0VEUの命令実行を制御する。VMUはベクトル命令
を実行するユニットで、メモリとのデータ転送を行なう
ロードパイプライン(660)、ストアパイプライン(
661)、およびベクトルデータを保持するVR(ベク
トルレジスタ)670を持つ。 さらにVR,からベクトルデータをリードし演X+行な
い結果をVR,にライトする命令を実行するために、6
80のADD (加算パイプライン)。 681のMULTI (乗算パイプライン)、682の
DIVIDH(除算パイプライン)を持つ。 ひとつのVPUiCおいてMSUからの命令のフェッチ
はSUで行なう。SUは、スカシ命令を7エツチしたら
SU内で実行し、ベクトル命令をフェッチしたらVU+
こ渡す。 VUでの命令+受けるユニットの回路を第7図に示す。 700はスカシユニット、640は第6図のVCUであ
る。ベクトル命令は線701を通して711のVF8E
Llレジスタに人力される。ここで715のvpstt
レジスタに命令がなければ、VFiM aからVFB1
−Lに命令が移動する。VPSI(+に先行命令が人っ
ているかVFRに先行命令が入っている時はVF 81
L カら712 (1)VFR(命令ハy7ア)ICf
ifl令がバッファノングされる。 先行命令がVP8Rからぬける時にVFBに命令が入っ
ていると、VFRから714のセレクタを通って次のタ
イミングRVPSI(、に命令が人力される。以上の制
御は713のフェッチコントロール部により行なわれる
◇ VP81Lは、718による命令デコードおよび719
による例外チェックを行?l:5ための命令レジ8タシ 716のVQ8Rは717による命令発信を制御するπ
めの命令レジスタである。 713は命令フェッチを制御する回路で、vFBのつま
り具合VPSULでの命令の有無を見て、VF’B。 VP’SRへの命令の人力、セレクト制御を行なう。 マタ、VFB ff1一杯1Ctxルト702ノVU
Full信号をSUに送り、SUからの命令の送出を止
める。 717は718から送られるデコード情報及びVQSル
からの情報によってVQRにある命令の命令発信を制御
する。さらに、第6図のVFJUで実行ざ几ている命令
の1理を行なう。これらの制御は641で示されるVg
Uへの制御信号により行なわれる。 VPz、VP2.VPt−M 共i第7図の回路は同じ
である。 VP2では717の命令管理部によってコントロールさ
れる命令実行ユニット(第6図の650)のハードウェ
アがrIJ2倍でありlサイクルに処理できるデータ数
が2倍になると考えてよい。 〔問題点を解決するための手段〕 本発明は、vPを例にとれば、1台のVUに対して複数
の80を接続し、VUにいずれかl含の8Uとの接続を
選択的に行なうことを特よとする。 〔作 用〕 第5図の■において、VUoとVU、の処理時間はとも
に111散的であり、かつ実動率は50哄程度である。 従ってこれらの処理は1台のVUで盛塩可能であること
に注目したものである。 〔発明の実ノー例〕 ベクトルプロセッサを例にとり8Uを2台持つマル牛ン
ステム(VP−i〜1と呼ぶ)について説明する。 構成例を第1図に示す。M8U、MCU、8Uo、SU
。 は@4図と同じ。 第9図にVUのおおまかなブロック図を示す0も 900.910,920(92))はそれぞれ第6図の
GO’0,610,620とMeもの、930のVUf
)うち950は650とほぼ同じもの、従りて960〜
982は660〜682とほぼ同じものを示す0951
は950 と同じハードウェアで、VEUO中に650
のVgUにくらべて2)1!のハードウェアがあること
を示す。これは、VP2のVBUと同じである。 次にVCU 940の回路を第10図に示す。 1000〜1012は第7図の700〜702と同じも
の、tた1030のVFUo、1040のl”U、は回
路#よぴ動作共に基本的にはそれぞれ711〜719と
同じであり、VFUQ、VFU、はそれぞれ独立に動作
し、SUo、8U、との命令転送、命令のバッファリン
グ・デコード、例外検出等を行なう。1031〜103
9および1041〜1049はそれぞれ711〜719
の対応する回路とほとんど同じである。 1050はSU、から送られたベクトル命令(以後0系
のベクトル命令と呼ぶ)とSU、から送られたベクトル
命令(以後l系のベクトル命令と呼ぶ)のどちらを、I
Uで実行するかを選択する制御を行なう。 1052.1053のセレクタに送られる1051のセ
レクト信号によって1061のVQ8Rと10600命
令管理部に人力される情報がθ系かl系か4こ切換えら
れる。 1060〜1062はそれぞれ717.716,720
と同じである。 尚、命令切換コントロール10500ロジンクとしては
、初期状態では例えばO系を高優先にして右き、以降は
一方の系のベクトル命令が途切れたとき、或いは何らか
の事象によって待ちが生じたときに、他系に切換えるこ
とにより達成される。 次にプログラムの実行の様子を第11図に示す。 プログラムの例は第5図と同じである。またVPI−M
との比較も示す。 ToからT、ではSU、、SU、共にスカラ命令を実行
している。ベクトル命令はない。T1では8U、、SU
、両方からベクトル命令がVUに送られ、それぞれVF
U、、VF’U、に人力される。 ここで第1O図の1050によって0系、l系の選択が
行なわれるが、ここではO系のプライオリティを高くし
であるのでT1からはO系のベクトル命令が実行される
。θ系からのベクトル命令のかたまり(命令パケットと
呼ぶンがすべて終了するまで1系のベクトル命令パケッ
トkL%行待ちとなる(rwの期間)。 T、では0系の最初のパケットが終了し、10501こ
よって命令実行が1系に切換わる。 次にVPI−Mとの比較について述べる。 スカラ命令パケットの実行時間は同じである。ベクトル
命令パケットの実行時間はVP−Mの方がVPI−Mの
半分になる。 cれは、VP−MノV U ハV U、まy:+tVU
、に比べて、vEUのハードウェアが2倍(vU、とV
U、を合わせた大きさ)になっているのでデータ処理時
の半分−どなっている。 これ番こより全体の実行時間が
のハードウェアでオ大の処理能力を得るための構成に関
する〇 〔従来技術とその問題点〕 科学技術用計算機において、高速化を実現するために一
般に以下のような方法が取られている。 ■ 科学技術計算のための命令を処理するユニットのデ
ータ処理能力を大きくする。 ■ マルチシステムにする。 ■の方法では、科学技術計算のための命令とその他の命
令との比率により、高速化の効果の大小が異なる。デー
タ処理能力を2倍にした例を第8図に示す。 人は科学技術計算のための命令の比率が大きい場合で、
全体の錫塩時間が半分程度になる。しかしBのようにそ
の他の命令の比率が大きい場合にはほとんど効果はない
。 従って単に科学技術計算用の命令の能力を大きくしても
、Bのようなプログラムに右いてし1、計算機のバラン
スが悪くなり、大きな高速化の効果は得られない。 シングルシステムで最適な処理能力のバランスを持つ装
置ができたら、それ以上の高速化を実現するためには、
一般に■のマルチシステムの方法を取る。 しかし例iば2台のマルチシステムにした場合、トータ
ルの処理能力は最大でも2倍にしかならない。また、プ
ログラムがひとつしか動いてない時は、シングルシステ
ムと同じ処理能力になりてしまう。 ベクトルプロセッサ(以後vPと呼ぶ)を例にとり、詳
細に説明する。 〔従来技術の詳細な説明〕 VPは科学技術計算のための命令(ベクトル命令)を処
理するベクトルユニット(VU)と、その他の命令(ス
カシ命令)を処理するスカシユニット(SU)とを持つ
。 シングルシステムの構成例を第2図に示し、この構成を
vPlと呼ぶ。 又VUのデータ処理能力5−2倍にした場合の例J1ζ を第3図に示し、これをVF2と呼が。 第2図のVPIに比べVF2のVUのハード量がほぼ2
倍になっている。 VP1ff成のVPU 2台をマルチシステムにした例
をt44図に示し、vpt−Mと呼ぶ。 次に各構成例におけるプログラムの実行の様子を説明す
る。第5図は8U、VU等が命令実行している様子を示
し、■はvPlの場合、■はVF2の場合、■はVP
l−Mの場合であり、白はスカシ
1命令の実行時間、ハツチングはベクトル命令の実行時
間を示す。 VP2では8Uの実行時間は変わらないが、VUの実行
時間が#−分になりている。VPl−Mでは、VPU、
とVPU、で別々のプログラムを実行している。それぞ
れの実行時間はVPlと同じであるが、ジップのスJk
−プツトが2倍になりでいる。 第6図にVUの一般的構成例のブロック図を示ベクトル
命令を制御するユニットで641の制御信号により65
0VEUの命令実行を制御する。VMUはベクトル命令
を実行するユニットで、メモリとのデータ転送を行なう
ロードパイプライン(660)、ストアパイプライン(
661)、およびベクトルデータを保持するVR(ベク
トルレジスタ)670を持つ。 さらにVR,からベクトルデータをリードし演X+行な
い結果をVR,にライトする命令を実行するために、6
80のADD (加算パイプライン)。 681のMULTI (乗算パイプライン)、682の
DIVIDH(除算パイプライン)を持つ。 ひとつのVPUiCおいてMSUからの命令のフェッチ
はSUで行なう。SUは、スカシ命令を7エツチしたら
SU内で実行し、ベクトル命令をフェッチしたらVU+
こ渡す。 VUでの命令+受けるユニットの回路を第7図に示す。 700はスカシユニット、640は第6図のVCUであ
る。ベクトル命令は線701を通して711のVF8E
Llレジスタに人力される。ここで715のvpstt
レジスタに命令がなければ、VFiM aからVFB1
−Lに命令が移動する。VPSI(+に先行命令が人っ
ているかVFRに先行命令が入っている時はVF 81
L カら712 (1)VFR(命令ハy7ア)ICf
ifl令がバッファノングされる。 先行命令がVP8Rからぬける時にVFBに命令が入っ
ていると、VFRから714のセレクタを通って次のタ
イミングRVPSI(、に命令が人力される。以上の制
御は713のフェッチコントロール部により行なわれる
◇ VP81Lは、718による命令デコードおよび719
による例外チェックを行?l:5ための命令レジ8タシ 716のVQ8Rは717による命令発信を制御するπ
めの命令レジスタである。 713は命令フェッチを制御する回路で、vFBのつま
り具合VPSULでの命令の有無を見て、VF’B。 VP’SRへの命令の人力、セレクト制御を行なう。 マタ、VFB ff1一杯1Ctxルト702ノVU
Full信号をSUに送り、SUからの命令の送出を止
める。 717は718から送られるデコード情報及びVQSル
からの情報によってVQRにある命令の命令発信を制御
する。さらに、第6図のVFJUで実行ざ几ている命令
の1理を行なう。これらの制御は641で示されるVg
Uへの制御信号により行なわれる。 VPz、VP2.VPt−M 共i第7図の回路は同じ
である。 VP2では717の命令管理部によってコントロールさ
れる命令実行ユニット(第6図の650)のハードウェ
アがrIJ2倍でありlサイクルに処理できるデータ数
が2倍になると考えてよい。 〔問題点を解決するための手段〕 本発明は、vPを例にとれば、1台のVUに対して複数
の80を接続し、VUにいずれかl含の8Uとの接続を
選択的に行なうことを特よとする。 〔作 用〕 第5図の■において、VUoとVU、の処理時間はとも
に111散的であり、かつ実動率は50哄程度である。 従ってこれらの処理は1台のVUで盛塩可能であること
に注目したものである。 〔発明の実ノー例〕 ベクトルプロセッサを例にとり8Uを2台持つマル牛ン
ステム(VP−i〜1と呼ぶ)について説明する。 構成例を第1図に示す。M8U、MCU、8Uo、SU
。 は@4図と同じ。 第9図にVUのおおまかなブロック図を示す0も 900.910,920(92))はそれぞれ第6図の
GO’0,610,620とMeもの、930のVUf
)うち950は650とほぼ同じもの、従りて960〜
982は660〜682とほぼ同じものを示す0951
は950 と同じハードウェアで、VEUO中に650
のVgUにくらべて2)1!のハードウェアがあること
を示す。これは、VP2のVBUと同じである。 次にVCU 940の回路を第10図に示す。 1000〜1012は第7図の700〜702と同じも
の、tた1030のVFUo、1040のl”U、は回
路#よぴ動作共に基本的にはそれぞれ711〜719と
同じであり、VFUQ、VFU、はそれぞれ独立に動作
し、SUo、8U、との命令転送、命令のバッファリン
グ・デコード、例外検出等を行なう。1031〜103
9および1041〜1049はそれぞれ711〜719
の対応する回路とほとんど同じである。 1050はSU、から送られたベクトル命令(以後0系
のベクトル命令と呼ぶ)とSU、から送られたベクトル
命令(以後l系のベクトル命令と呼ぶ)のどちらを、I
Uで実行するかを選択する制御を行なう。 1052.1053のセレクタに送られる1051のセ
レクト信号によって1061のVQ8Rと10600命
令管理部に人力される情報がθ系かl系か4こ切換えら
れる。 1060〜1062はそれぞれ717.716,720
と同じである。 尚、命令切換コントロール10500ロジンクとしては
、初期状態では例えばO系を高優先にして右き、以降は
一方の系のベクトル命令が途切れたとき、或いは何らか
の事象によって待ちが生じたときに、他系に切換えるこ
とにより達成される。 次にプログラムの実行の様子を第11図に示す。 プログラムの例は第5図と同じである。またVPI−M
との比較も示す。 ToからT、ではSU、、SU、共にスカラ命令を実行
している。ベクトル命令はない。T1では8U、、SU
、両方からベクトル命令がVUに送られ、それぞれVF
U、、VF’U、に人力される。 ここで第1O図の1050によって0系、l系の選択が
行なわれるが、ここではO系のプライオリティを高くし
であるのでT1からはO系のベクトル命令が実行される
。θ系からのベクトル命令のかたまり(命令パケットと
呼ぶンがすべて終了するまで1系のベクトル命令パケッ
トkL%行待ちとなる(rwの期間)。 T、では0系の最初のパケットが終了し、10501こ
よって命令実行が1系に切換わる。 次にVPI−Mとの比較について述べる。 スカラ命令パケットの実行時間は同じである。ベクトル
命令パケットの実行時間はVP−Mの方がVPI−Mの
半分になる。 cれは、VP−MノV U ハV U、まy:+tVU
、に比べて、vEUのハードウェアが2倍(vU、とV
U、を合わせた大きさ)になっているのでデータ処理時
の半分−どなっている。 これ番こより全体の実行時間が
【Eだけ短かくなる。
さらにプログラムのスル−プットに注目すると、isだ
け短かくなり、スルーブツトの比はL2− ’10’l
□’ −ro’ となる。 この原因をもう少し詳しく解析する。 まずVP−M、VP l−M共にθ系と1系の両方のベ
クトル命令パケットの終了までの時間は同じである。 Ts−T、 =’l’、’−’r、’ L、 カL、 VP−MではO系のパケットはT!で終
了しておりこの時間から次のスカラ命令のパケットが実
行できる。 V P I M テGt T + ’ 〜T ! ’
Gt O、%l系共にペクトjLz命令パケットが実
行され次にT、′〜T、′に共にスカラ命令パケットが
実行される。 つまりVl’l−MのVUOおよびVU、の稼動率は5
0躯であるのに対し、ME’−MのVUの稼動率は67
壬でありその外性能がよくなりて(・るのであ次に性能
比較を定量的に行なう。 ひとつのプログラムにおけるベクトル命令パケットの時
間北軍は、VPIを基本に考えて第12図のプログラム
で検討する。 第12図において、λはVPIにおける全パケット中の
ベクトルパケットの処理時間の割合を示し、0〈λくl
である。 1)λ≦2/3のときを第13図に示す。 VP−Mではベクトルパケットの処理時間はVPtの半
分なのでλ/2となる。 よって全パケットの処理時間は、 であり、よって全体のスループットは次のようになる。 この場合、スカラパケットの処理時間よりベクトルパケ
ットの処理時間の方が長くなり、スカラパケットの待ち
時間tλを生じる。 、’、t、=t−λ+tλ−二=λ となり、全体のスループットは次のようになる。 尚、VP2のスループットPは久のようになる。 上Me(11、i2) 、 f31式1c ヨQ VP
I 、 VP2 、 ’VPI−M。 VP−Mの相対スルーブツトを比較すると第15図のよ
うになる。 蕗15図カーら汁かるよ5にVP−Mのスループットは
2〜3であり、VPI−Mの2より常に高トが得られる
。 以上は多重処理が行なわれている時である。 矢にひとつのプログラムしか動いていない時にばよい。 よってスループットPは VP2は同様に P=□・・曲・・・曲面・・−・・・曲・・(5)2−
λ vpl−IVIでは第11図■においてl系だけを考え
ればよいっ よってスループットPは p=l ・・・・・・・・・曲・・・・・・・・曲・
・・曲・曲・・+61(41、+51 、161Ell
: リvpl 、VP2 、 VPI−M。 VP−Mの相対スループットを比較すると第」6図のよ
うになる。 VPI−MではVPt と同じスループットテあるf)
S VP−M テ)’1 V P 2と同じスルーブツ
トが得られる。特にλが1に近くなる(ベクトル命令パ
ケットの比率が大きくなる)とVPI−Mの2倍のスル
ープットが得られる。 〔発明の効果〕 本発明によるVP−Mは、ハードウェア量はVP2に比
べて、vCUが第1O図に示したようにVF’U。 および命令切換のための回路1050〜l0530分だ
け多くなり、VPI−Mとほぼ同じになるが、例えばV
U全全体ひとつのプリント板に入るような場合は影響は
ほとんど表われない。 ところが性能面では第15図に示したように、プログラ
ムを多遭処哩した場合のスルーブツトは、VP2に比べ
て平均的にほぼ2倍であり、VPI−MJご比べても1
〜】、5倍となる。 また、プログラムがひとつしか動いていない時では、V
PI−MではVPt と同じスループットになってし
まうが、VP−Mでは悪い時でも、VP2と同じスルー
ブツトが得られる。 さらに上記の比較例ではVP −MのV[JはVPl−
MのVUの2倍の能力にした場合で考えたが、これは必
らずしも必要ではない。VPI と同じVUを用いた場
合には、VPI−Mと同じスループットが、より少ない
ハードウェア(VT’8Uの1台分が不要となる)で得
られることになる。 な・口血のi+1flt+糧デ゛9+1第1図は本発明
の一実施例概略ブロック図、第2図ないし第4図は従来
例の概略ブロック図図を示す。 第5図は第2図ないし第4図の従来例の処理時間を比較
した図、 第6図は従来例(こεけるVUのブロック図、第7図は
従来例におけるVCUのブロック図、第8図はベクトル
処理高速化の効果を示す図、第9図は第1図の本発明の
一実施例に6けるvUのブロック図1 第1o図は第9図の一実施例のVCUのブロック図、 第11図は第1図の例と第4図の例との処理時間の比較
を示す図、 第12図は比較の1−15と−する命令データを示す図
、 を示す図、 第14図はλ≧−のときのVP−41の処理時間を示す
図、 第15図は多重処理時のスループット比較グラフ、 第16図は単独処理時のスループット比較グラフである
。 ta1図1図1−て、M8Uは主記憶ユ二ッ)、MCU
は記憶制御ユニット、VPUはベクトルプロセッサユニ
ット、vUはベクトルユニツ)、SUo〜1はスルーブ
ツトである。 ;’ニー”’” 代理人 弁理士 松 岡 宏四部 ′5.工・ : 参発日月の一策方巳例お禿叫トアロ・17図第 1 図 1芝釆佇11(VPf)の狽I与7℃77図易 2 図 従来例(1/P2)の機断トブロッ7図第3図 イz米rJ (VFIJ’l)f)Mt、Wp7CIツ
7図茅 躬1図のVUの7゛ロ一ノア図 第9図 比較の基環とする俗μ餉ザータ 築n2図 入≦署のときのVP−Mの/I!X工引博藺IF173
図 入2号のとでのvp−Mの処理14県 第14図 P(VPIにjど(r: 柑苅スループ/トンキ スルーアットの匡較τラフ(ル11見理將)第15図
け短かくなり、スルーブツトの比はL2− ’10’l
□’ −ro’ となる。 この原因をもう少し詳しく解析する。 まずVP−M、VP l−M共にθ系と1系の両方のベ
クトル命令パケットの終了までの時間は同じである。 Ts−T、 =’l’、’−’r、’ L、 カL、 VP−MではO系のパケットはT!で終
了しておりこの時間から次のスカラ命令のパケットが実
行できる。 V P I M テGt T + ’ 〜T ! ’
Gt O、%l系共にペクトjLz命令パケットが実
行され次にT、′〜T、′に共にスカラ命令パケットが
実行される。 つまりVl’l−MのVUOおよびVU、の稼動率は5
0躯であるのに対し、ME’−MのVUの稼動率は67
壬でありその外性能がよくなりて(・るのであ次に性能
比較を定量的に行なう。 ひとつのプログラムにおけるベクトル命令パケットの時
間北軍は、VPIを基本に考えて第12図のプログラム
で検討する。 第12図において、λはVPIにおける全パケット中の
ベクトルパケットの処理時間の割合を示し、0〈λくl
である。 1)λ≦2/3のときを第13図に示す。 VP−Mではベクトルパケットの処理時間はVPtの半
分なのでλ/2となる。 よって全パケットの処理時間は、 であり、よって全体のスループットは次のようになる。 この場合、スカラパケットの処理時間よりベクトルパケ
ットの処理時間の方が長くなり、スカラパケットの待ち
時間tλを生じる。 、’、t、=t−λ+tλ−二=λ となり、全体のスループットは次のようになる。 尚、VP2のスループットPは久のようになる。 上Me(11、i2) 、 f31式1c ヨQ VP
I 、 VP2 、 ’VPI−M。 VP−Mの相対スルーブツトを比較すると第15図のよ
うになる。 蕗15図カーら汁かるよ5にVP−Mのスループットは
2〜3であり、VPI−Mの2より常に高トが得られる
。 以上は多重処理が行なわれている時である。 矢にひとつのプログラムしか動いていない時にばよい。 よってスループットPは VP2は同様に P=□・・曲・・・曲面・・−・・・曲・・(5)2−
λ vpl−IVIでは第11図■においてl系だけを考え
ればよいっ よってスループットPは p=l ・・・・・・・・・曲・・・・・・・・曲・
・・曲・曲・・+61(41、+51 、161Ell
: リvpl 、VP2 、 VPI−M。 VP−Mの相対スループットを比較すると第」6図のよ
うになる。 VPI−MではVPt と同じスループットテあるf)
S VP−M テ)’1 V P 2と同じスルーブツ
トが得られる。特にλが1に近くなる(ベクトル命令パ
ケットの比率が大きくなる)とVPI−Mの2倍のスル
ープットが得られる。 〔発明の効果〕 本発明によるVP−Mは、ハードウェア量はVP2に比
べて、vCUが第1O図に示したようにVF’U。 および命令切換のための回路1050〜l0530分だ
け多くなり、VPI−Mとほぼ同じになるが、例えばV
U全全体ひとつのプリント板に入るような場合は影響は
ほとんど表われない。 ところが性能面では第15図に示したように、プログラ
ムを多遭処哩した場合のスルーブツトは、VP2に比べ
て平均的にほぼ2倍であり、VPI−MJご比べても1
〜】、5倍となる。 また、プログラムがひとつしか動いていない時では、V
PI−MではVPt と同じスループットになってし
まうが、VP−Mでは悪い時でも、VP2と同じスルー
ブツトが得られる。 さらに上記の比較例ではVP −MのV[JはVPl−
MのVUの2倍の能力にした場合で考えたが、これは必
らずしも必要ではない。VPI と同じVUを用いた場
合には、VPI−Mと同じスループットが、より少ない
ハードウェア(VT’8Uの1台分が不要となる)で得
られることになる。 な・口血のi+1flt+糧デ゛9+1第1図は本発明
の一実施例概略ブロック図、第2図ないし第4図は従来
例の概略ブロック図図を示す。 第5図は第2図ないし第4図の従来例の処理時間を比較
した図、 第6図は従来例(こεけるVUのブロック図、第7図は
従来例におけるVCUのブロック図、第8図はベクトル
処理高速化の効果を示す図、第9図は第1図の本発明の
一実施例に6けるvUのブロック図1 第1o図は第9図の一実施例のVCUのブロック図、 第11図は第1図の例と第4図の例との処理時間の比較
を示す図、 第12図は比較の1−15と−する命令データを示す図
、 を示す図、 第14図はλ≧−のときのVP−41の処理時間を示す
図、 第15図は多重処理時のスループット比較グラフ、 第16図は単独処理時のスループット比較グラフである
。 ta1図1図1−て、M8Uは主記憶ユ二ッ)、MCU
は記憶制御ユニット、VPUはベクトルプロセッサユニ
ット、vUはベクトルユニツ)、SUo〜1はスルーブ
ツトである。 ;’ニー”’” 代理人 弁理士 松 岡 宏四部 ′5.工・ : 参発日月の一策方巳例お禿叫トアロ・17図第 1 図 1芝釆佇11(VPf)の狽I与7℃77図易 2 図 従来例(1/P2)の機断トブロッ7図第3図 イz米rJ (VFIJ’l)f)Mt、Wp7CIツ
7図茅 躬1図のVUの7゛ロ一ノア図 第9図 比較の基環とする俗μ餉ザータ 築n2図 入≦署のときのVP−Mの/I!X工引博藺IF173
図 入2号のとでのvp−Mの処理14県 第14図 P(VPIにjど(r: 柑苅スループ/トンキ スルーアットの匡較τラフ(ル11見理將)第15図
Claims (3)
- (1)夫々独立に動作し、互いに異なる種類の命令を処
理する第1種及び第2種のプロセッサを含むマルチプロ
セッサシステムであって、上記第2種のプロセッサは複
数の上記第1種プロセッサとのインタフェースを有し、
その複数のインタフェースの中の1つを適宜切換選択し
て、該インタフェースに対応する第1種のプロセッサよ
り該第2種のプロセッサで処理すべき命令を受取って処
理することを特徴とするマルチプロセッサシステム。 - (2)上記第1種のプロセッサはスカラ命令を処理する
スカラプロセッサ、上記第2種のプロセッサはベクトル
命令を処理するベクトルプロセッサであることを特徴と
する特許請求の範囲第(1)項記載のマルチプロセッサ
システム。 - (3)上記インタフェースの切換選択は、現に選択され
ている第1種のプロセッサから受取った命令の該第2種
のプロセッサにおける処理に中断を生じたとき、他の第
1種のプロセッサに切換選択されることを特徴とする特
許請求の範囲第(1)項又は第(2)項記載のマルチプ
ロセッサシステム。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59252950A JPS61131169A (ja) | 1984-11-30 | 1984-11-30 | マルチプロセツサシステム |
AU50454/85A AU557807B2 (en) | 1984-11-30 | 1985-11-28 | Multiprocessor system |
KR1019850008891A KR900001999B1 (ko) | 1984-11-30 | 1985-11-28 | 멀티프로세서 시스템(multiprocessor system) |
BR8506010A BR8506010A (pt) | 1984-11-30 | 1985-11-29 | Sistema multiprocessador |
EP85308697A EP0183560B1 (en) | 1984-11-30 | 1985-11-29 | A multiprocessor system |
DE8585308697T DE3579121D1 (de) | 1984-11-30 | 1985-11-29 | Multiprozessorsystem. |
ES549455A ES8800769A1 (es) | 1984-11-30 | 1985-11-29 | Sistema de procesador multiple |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP59252950A JPS61131169A (ja) | 1984-11-30 | 1984-11-30 | マルチプロセツサシステム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS61131169A true JPS61131169A (ja) | 1986-06-18 |
Family
ID=17244414
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP59252950A Pending JPS61131169A (ja) | 1984-11-30 | 1984-11-30 | マルチプロセツサシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS61131169A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01169572A (ja) * | 1987-12-24 | 1989-07-04 | Fujitsu Ltd | 命令発信制御方式 |
US5530881A (en) * | 1991-06-06 | 1996-06-25 | Hitachi, Ltd. | Vector processing apparatus for processing different instruction set architectures corresponding to mingled-type programs and separate-type programs |
JP2008040614A (ja) * | 2006-08-02 | 2008-02-21 | Fuji Syst Kiki Kk | 画像処理装置、画像処理システム及び画像処理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5947668A (ja) * | 1982-09-03 | 1984-03-17 | Hitachi Ltd | 情報処理装置 |
JPS59106075A (ja) * | 1982-12-10 | 1984-06-19 | Hitachi Ltd | デ−タ処理システム |
-
1984
- 1984-11-30 JP JP59252950A patent/JPS61131169A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5947668A (ja) * | 1982-09-03 | 1984-03-17 | Hitachi Ltd | 情報処理装置 |
JPS59106075A (ja) * | 1982-12-10 | 1984-06-19 | Hitachi Ltd | デ−タ処理システム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01169572A (ja) * | 1987-12-24 | 1989-07-04 | Fujitsu Ltd | 命令発信制御方式 |
US5530881A (en) * | 1991-06-06 | 1996-06-25 | Hitachi, Ltd. | Vector processing apparatus for processing different instruction set architectures corresponding to mingled-type programs and separate-type programs |
JP2008040614A (ja) * | 2006-08-02 | 2008-02-21 | Fuji Syst Kiki Kk | 画像処理装置、画像処理システム及び画像処理方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US4574345A (en) | Multiprocessor computer system utilizing a tapped delay line instruction bus | |
US6219775B1 (en) | Massively parallel computer including auxiliary vector processor | |
JPH0650493B2 (ja) | データ処理装置 | |
JPS6224366A (ja) | ベクトル処理装置 | |
JPH0463430B2 (ja) | ||
JPH06105460B2 (ja) | マルチプロセッサのプロセッサ切換え装置 | |
JPH04336378A (ja) | 情報処理装置 | |
JPS61131169A (ja) | マルチプロセツサシステム | |
KR19990072432A (ko) | 우선순위를가진인터럽트제어기능을구비한정보처리방법및정보처리장치 | |
JPH0282343A (ja) | マルチプロセッサシステムの割込処理方式 | |
JP2001249807A (ja) | データ処理装置 | |
US5465369A (en) | Network structure for parallel software processing | |
US7404048B2 (en) | Inter-cluster communication module using the memory access network | |
JPH05189232A (ja) | 自動化装置およびその作動方法 | |
CN109948785B (zh) | 一种高效的神经网络电路系统和方法 | |
KR900001999B1 (ko) | 멀티프로세서 시스템(multiprocessor system) | |
JPH01271840A (ja) | マイクロコンピュータ | |
JPS60252954A (ja) | プログラム制御回路 | |
JPS6259829B2 (ja) | ||
JPS63141131A (ja) | パイプライン制御方式 | |
JPH0233663A (ja) | マシンチェック処理方法および装置 | |
CN117369876A (zh) | 一种基于多核和资源复用的向量处理器 | |
JPS6240737B2 (ja) | ||
CN117093263A (zh) | 处理器、芯片、板卡及方法 | |
JPS60205647A (ja) | デ−タ処理装置 |