JP2001184340A - Information processor and method for synchronizing plural vector processors - Google Patents

Information processor and method for synchronizing plural vector processors

Info

Publication number
JP2001184340A
JP2001184340A JP36545299A JP36545299A JP2001184340A JP 2001184340 A JP2001184340 A JP 2001184340A JP 36545299 A JP36545299 A JP 36545299A JP 36545299 A JP36545299 A JP 36545299A JP 2001184340 A JP2001184340 A JP 2001184340A
Authority
JP
Japan
Prior art keywords
instruction
vector
unit
synchronization
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP36545299A
Other languages
Japanese (ja)
Inventor
Hideyuki Sato
秀之 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Computertechno Ltd
Original Assignee
NEC Computertechno Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Computertechno Ltd filed Critical NEC Computertechno Ltd
Priority to JP36545299A priority Critical patent/JP2001184340A/en
Publication of JP2001184340A publication Critical patent/JP2001184340A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide an information processor, with which the number of vector pipelines is increased and vector instruction processing time can be shortened, concerning the information processor provided with plural vector processors. SOLUTION: This device is provided with a synchronizing means for executing instructions, which are fetched during the time when a synchronizing instruction command is fetched until a synchronism cancel command is fetched, synchronously among plural vector processors.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は情報処理装置に関
し、特に複数のベクトルプロセッサを備える情報処理装
置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information processing apparatus, and more particularly, to an information processing apparatus having a plurality of vector processors.

【0002】[0002]

【従来の技術】従来のベクトル処理装置は、主記憶装置
に複数のベクトルプロセッサを接続して構成されてい
る。複数のベクトルプロセッサの各々は、 1.複数のベクトルレジスタとこれらの複数のベクトル
レジスタに格納されたベクトルデータを処理する複数の
パイプライン演算器からなる、複数のベクトルパイプラ
イン 2.これらの複数のベクトルパイプラインで実行する命
令を入力、デコード、解読しプロセッサの内部で制御信
号を作成して複数のベクトルパイプラインを制御するベ
クトル制御部を備える。
2. Description of the Related Art A conventional vector processing device is configured by connecting a plurality of vector processors to a main storage device. Each of the plurality of vector processors includes: 1. A plurality of vector pipelines including a plurality of vector registers and a plurality of pipeline arithmetic units for processing vector data stored in the plurality of vector registers. A vector control unit is provided for inputting, decoding, and decoding instructions to be executed by the plurality of vector pipelines, generating control signals inside the processor, and controlling the plurality of vector pipelines.

【0003】この種のベクトル処理機構は、各ベクトル
プロセッサにベクトルパイプラインが複数あるので並列
動作をして、複数のベクトルプロセッサが備わるので多
重化されるという意味において、多重並列パイプライン
とよばれ、ベクトル命令は処理すべき一連のベクトルデ
ータを前記複数のベクトルパイプラインのベクトルレジ
スタに均等に振り分けるようにロードされ前記複数のパ
イプライン演算器で処理するものである。
[0003] This type of vector processing mechanism is called a multiplex parallel pipeline in the sense that each vector processor has a plurality of vector pipelines and operates in parallel. , Vector instructions are loaded so that a series of vector data to be processed are equally distributed to the vector registers of the plurality of vector pipelines, and are processed by the plurality of pipeline arithmetic units.

【0004】[0004]

【発明が解決しようとする課題】前記のベクトル処理装
置においては、各プロセッサはその内部に構成されたベ
クトルパイプライン数でしか動作できないため、並列効
果を使用して演算処理時間を短くする事が出来なかっ
た。また、複数のプロセッサが同期動作する場合には、
全ての命令において同期発行処理をおこなっていたため
命令実行まで無駄な処理時間がかかっていた。
In the above-described vector processing apparatus, since each processor can operate only with the number of vector pipelines configured therein, it is possible to shorten the arithmetic processing time by using the parallel effect. I could not do it. When multiple processors operate synchronously,
Since synchronous issuance processing was performed for all instructions, useless processing time was required until instruction execution.

【0005】本発明は、複数のベクトルプロセッサを備
える情報処理装置において、ベクトルパイプライン数を
増やしベクトル命令処理時間を短くできることを可能と
する情報処理装置を提供することを目的とする。
An object of the present invention is to provide an information processing apparatus having a plurality of vector processors, which can increase the number of vector pipelines and shorten the vector instruction processing time.

【0006】[0006]

【課題を解決するための手段】本発明による情報処理装
置は、同期指示命令をフェッチしてから同期解除命令を
フェッチするまでの間にフェッチした命令を複数のベク
トルプロセッサ間で同期をとって実行する同期化手段を
備えることを特徴とする。
An information processing apparatus according to the present invention synchronously executes instructions fetched between a time when a synchronization instruction instruction is fetched and a time when a synchronization release instruction is fetched, between a plurality of vector processors. It is characterized by comprising a synchronizing means.

【0007】また、本発明による情報処理装置は、上記
の情報処理装置において、前記同期指示命令は、同期を
とるべきベクトルプロセッサを指定するオペランドを有
し、前記同期化手段は同期をとる際に、そのオペランド
で指定されたベクトルプロセッサ間で同期をとることを
特徴とする。
Further, in the information processing apparatus according to the present invention, in the information processing apparatus described above, the synchronization instruction instruction has an operand for designating a vector processor to be synchronized, and the synchronization means performs synchronization when the synchronization is performed. , And is synchronized between the vector processors specified by the operands.

【0008】更に、本発明による情報処理装置は、上記
の情報処理装置において、各ベクトルプロセッサは、命
令制御部、メモリアクセス部、ベクトル制御部、ベクト
ル処理部、プロセッサネットワーク部、パイプラインク
ロスバ部を備えることを特徴とする。
Furthermore, in the information processing apparatus according to the present invention, in the above information processing apparatus, each vector processor includes an instruction control unit, a memory access unit, a vector control unit, a vector processing unit, a processor network unit, and a pipeline crossbar unit. It is characterized by having.

【0009】更に、本発明による情報処理装置は、上記
の情報処理装置において、前記命令処理部は、スカラ処
理部と命令解読部を備えることを特徴とする。
Further, the information processing apparatus according to the present invention is characterized in that, in the above information processing apparatus, the instruction processing section includes a scalar processing section and an instruction decoding section.

【0010】更に、本発明による情報処理装置は、上記
の情報処理装置において、前記ベクトル制御部は、命令
デコード部、同期命令指示部、構成フラグ、要素判定回
路、命令発行部、同期命令検出回路、同期フラグ、命令
発行チェック部、命令発行OKフラグ、外部装置同期フ
ラグ、外部発行OKフラグ、命令実行部、信号線を備え
ることを特徴とする。
Further, in the information processing apparatus according to the present invention, in the above information processing apparatus, the vector control section includes an instruction decoding section, a synchronous instruction designating section, a configuration flag, an element determining circuit, an instruction issuing section, and a synchronous instruction detecting circuit. , A synchronization flag, an instruction issue check unit, an instruction issue OK flag, an external device synchronization flag, an external issue OK flag, an instruction execution unit, and a signal line.

【0011】更に、本発明による情報処理装置は、上記
の情報処理装置において、前記ベクトル処理部は、複数
のレジスタと複数の演算器とパイプ内クロスバを備え
る、複数のベクトルパイプラインを備えることを特徴と
する。
Further, in the information processing apparatus according to the present invention, in the above information processing apparatus, the vector processing section includes a plurality of vector pipelines including a plurality of registers, a plurality of arithmetic units, and a crossbar in a pipe. Features.

【0012】本発明による複数ベクトルプロセッサ間の
同期化方法は、同期指示命令をフェッチしてから同期解
除命令をフェッチするまでの間にフェッチした命令を複
数のベクトルプロセッサ間で同期をとって実行すること
を特徴とする。
According to the method for synchronizing between a plurality of vector processors according to the present invention, an instruction fetched between the time when a synchronization instruction instruction is fetched and the time when a synchronization release instruction is fetched is executed in synchronization between the plurality of vector processors. It is characterized by the following.

【0013】[0013]

【発明の実施の形態】本発明による情報処理装置は、ベ
クトルデータを複数のベクトルプロセッサで処理を行う
処理装置において、複数のプロセッサ間で同期を取る事
により並列動作しベクトル処理時間を少なくするもので
ある。
DESCRIPTION OF THE PREFERRED EMBODIMENTS An information processing apparatus according to the present invention is a processing apparatus for processing vector data with a plurality of vector processors, wherein the plurality of processors synchronize to operate in parallel to reduce vector processing time. It is.

【0014】図1を参照すると、情報処理装置1は、主
記憶装置8とデータの処理を実行する複数のベクトルプ
ロセッサ1、1nで構成され、各ベクトルプロセッサは
主記憶装置8から読み出した命令をスカラ命令とベクト
ル命令に解読し出力する命令制御部2と、主記憶装置8
へのアクセスを制御するメモリアクセス処理部3と、ベ
クトル命令を発行制御するベクトル制御部5と、ベクト
ルデータを処理する複数のパイプライン演算器を保持す
るベクトル処理部6と、ベクトル処理装置と主記憶装置
間でベクトルデータをやり取りするプロセッサネットワ
ーク部4と、複数のベクトルパイプライン演算器間でベ
クトルデータのやり取りをするパイプラインクロスバ部
7とで構成されている。尚、図示されていないが主記憶
装置8と複数のベクトル処理装置1、1n間はクロスバ
で接続されているものとする。上記情報処理装置におい
て、前記複数のプロセッサを個々の命令で独立して処理
する場合と、一つの命令において同期して命令発行から
データ処理までを並列に動作する事を可能とする手段を
具備し、同一命令において複数のプロセッサが同期を取
って動作する場合と同期を取らずに独立して一つのベク
トルデータを処理する動作をする場合を命令によって切
り変える手段を有する。
Referring to FIG. 1, an information processing apparatus 1 includes a main storage device 8 and a plurality of vector processors 1 and 1n for executing data processing. Each vector processor executes an instruction read from the main storage device 8. An instruction control unit 2 for decoding and outputting a scalar instruction and a vector instruction, and a main storage device 8
A memory access processing unit 3 for controlling access to a vector, a vector control unit 5 for issuing and controlling a vector instruction, a vector processing unit 6 for holding a plurality of pipeline arithmetic units for processing vector data, a vector processing device and It comprises a processor network unit 4 for exchanging vector data between storage devices, and a pipeline crossbar unit 7 for exchanging vector data between a plurality of vector pipeline computing units. Although not shown, it is assumed that the main storage device 8 and the plurality of vector processing devices 1 and 1n are connected by a crossbar. In the above information processing apparatus, there are provided a case where the plurality of processors are independently processed by individual instructions, and a unit which enables operations from instruction issue to data processing to be performed in parallel in one instruction in synchronization. Means for switching between a case where a plurality of processors operate in synchronization with the same instruction and a case where they independently operate one vector data without synchronization in accordance with an instruction.

【0015】主記憶装置8と命令制御部2間のインタフ
ェース100は主記憶装置から読み出された命令の信号
線である。
An interface 100 between the main storage device 8 and the instruction control unit 2 is a signal line of an instruction read from the main storage device.

【0016】命令制御部2は、スカラ処理に必要なスカ
ラデータを格納するスカラレジスタやアドレス計算、イ
ンデックス計算、制御変数計算用の演算器で構成される
スカラ処理部20と、主記憶装置8から入力された命令
をスカラ処理部20で処理される命令なのかベクトル処
理部6で処理される命令なのかを判断し各処理部に転送
する命令解読部21とで構成され、ベクトル命令は信号
線101を経てベクトル制御部5に、メモリアクセス命
令は信号線102を経てメモリアクセス処理部3に出力
される。
The instruction control unit 2 includes a scalar processing unit 20 composed of a scalar register for storing scalar data necessary for scalar processing and an arithmetic unit for address calculation, index calculation, and control variable calculation. An instruction decoding unit 21 that determines whether an input instruction is an instruction processed by the scalar processing unit 20 or an instruction processed by the vector processing unit 6 and transfers the instruction to each processing unit. The memory access instruction is output to the vector control unit 5 via the signal line 101 and the memory access processing unit 3 via the signal line 102.

【0017】メモリアクセス処理部3は、信号線102
を経て命令制御部2から送られて来るリクエストコード
を解読すると共にプロセッサネットワーク部4の状態を
管理しメモリアクセス要求を制御する信号線103を経
てプロセッサネットワーク部4に制御信号を送り主記憶
装置8との信号線104とベクトル処理部6との信号線
105とのデータの行き来を制御する。
The memory access processing unit 3 includes a signal line 102
, A control signal is sent to the processor network unit 4 via a signal line 103 which decodes the request code sent from the instruction control unit 2 and manages the state of the processor network unit 4 and controls a memory access request. Of data between the signal line 104 of FIG. 4 and the signal line 105 of the vector processing unit 6 is controlled.

【0018】ベクトル制御部5は、信号線101を経て
命令制御部2から入力されたベクトル命令を解読する命
令デコード部51と、同期指示命令を複数格納保持する
同期命令指示部50と、同期指示プロセッサを示しベク
トルパイプライン演算器数を算出するのに使用する同期
命令指示部50に対応し複数格納保持する構成フラグ5
7と、ベクトル要素数と前記構成フラグ57からベクト
ルパイプライン演算器に均等に割り振った処理ベクトル
要素数を求める要素判定回路58と、前記命令デコード
部で解読された命令を取り込む命令発行部54と、前記
命令デコード部51で解読された命令が前記同期命令指
示部50に登録された命令と一致を取る同期命令検出回
路5Aと、前記同期命令検出回路5Aの検出結果で同期
を取らなければならない命令かを示す同期フラグ52
と、前記命令発行部54に格納された命令が発行出来る
か各リソースのチェックを行う命令発行チェック部55
と、前記命令発行チェック部の結果を格納する命令発行
OKフラグ56と、前記命令発行OKフラグを他の処理
装置に通知する信号線200と、前記同期フラグ52を
格納する同期フラグ53と、他の処理装置に通知する信
号線201と、他の処理装置から信号線203を経て通
知される外部装置同期フラグ580と、同じく他の処理
装置から信号線204を経て通知される外部発行OKフ
ラグ5Bと、前記同期フラグ53、58と命令発行フラ
グ56、5Bの状態をチェックし命令の実行を許可する
命令実行部59と、実行許可をベクトル処理部6に通知
する信号線106と、同じく実行許可をパイプラインク
ロスバ部7に通知する信号線107で構成される。
The vector control unit 5 includes an instruction decoding unit 51 that decodes a vector instruction input from the instruction control unit 2 via the signal line 101, a synchronization instruction instruction unit 50 that stores and holds a plurality of synchronization instruction instructions, A configuration flag 5 that indicates a processor and that stores and holds a plurality of synchronous instruction instructing units 50 used to calculate the number of vector pipeline arithmetic units
7, an element determination circuit 58 for obtaining the number of processing vector elements evenly allocated to the vector pipeline computing unit from the number of vector elements and the configuration flag 57, and an instruction issuing unit 54 for receiving an instruction decoded by the instruction decoding unit. It is necessary to synchronize with the synchronous instruction detecting circuit 5A in which the instruction decoded by the instruction decoding unit 51 matches the instruction registered in the synchronous instruction instructing unit 50 and the detection result of the synchronous instruction detecting circuit 5A. Synchronization flag 52 indicating instruction
And an instruction issuance checking unit 55 for checking each resource to determine whether the instruction stored in the instruction issuing unit 54 can be issued.
An instruction issue OK flag 56 for storing the result of the instruction issue check unit, a signal line 200 for notifying the instruction issue OK flag to another processing device, a synchronization flag 53 for storing the synchronization flag 52, , An external device synchronization flag 580 notified from another processing device via the signal line 203, and an externally issued OK flag 5B also notified from another processing device via the signal line 204. An instruction execution unit 59 for checking the states of the synchronization flags 53 and 58 and the instruction issue flags 56 and 5B and permitting the execution of the instruction; a signal line 106 for notifying the vector processing unit 6 of the execution permission; Is notified to the pipeline crossbar unit 7 by the signal line 107.

【0019】ベクトル処理部6は、複数のベクトルパイ
プライン60、6mで構成され、それぞれにベクトルデ
ータを格納する複数のベクトルレジスタ61と、複数の
演算器62と、ベクトルパイプライン内のデータの転送
を行う為のパイプ内クロスバ63で構成されベクトル制
御部5からの信号線106を経て入力された指示に従っ
て命令を実行する。
The vector processing section 6 is composed of a plurality of vector pipelines 60 and 6m, each of which stores a plurality of vector registers 61 for storing vector data, a plurality of arithmetic units 62, and transfer of data in the vector pipeline. The instruction is executed in accordance with an instruction input through a signal line 106 from the vector control unit 5 which is constituted by an in-pipe crossbar 63 for performing

【0020】パイプラインクロスバ7はベクトル処理部
6からの複数のベクトルパイプライン60、6mからの
ベクトルデータを信号線108を経て入力し、ベクトル
制御部5からの指示が処理装置内の処理ならばベクトル
データを信号線108を経て指示されたベクトルパイプ
ラインに返すが、ベクトル制御部5からの指示が処理装
置間ならば信号線205を経て他の処理装置にベクトル
データを出力する。また信号線206を経て他の処理装
置からベクトルデータを入力すると共に指示に従って処
理した後、信号線108を経てベクトル処理部6のベク
トルパイプラインにデータを返す。 ベクトル処理装置
1nは前記ベクトル処理装置1とまったく同じ構成にな
っており全ての説明に使用された番号にnをつけて後述
する。
The pipeline crossbar 7 inputs the vector data from the plurality of vector pipelines 60 and 6m from the vector processing unit 6 via the signal line 108, and if the instruction from the vector control unit 5 is a process in the processing device. The vector data is returned to the vector pipeline instructed via the signal line 108. If the instruction from the vector control unit 5 is between the processing devices, the vector data is output to another processing device via the signal line 205. Further, after inputting vector data from another processing device via the signal line 206 and processing according to the instruction, the data is returned to the vector pipeline of the vector processing unit 6 via the signal line 108. The vector processing device 1n has exactly the same configuration as the vector processing device 1, and the numbers used in all the description are given n and described later.

【0021】次に、図1の回路の動作について、図を参
照して説明する。図1は本発明の一実施例を示すブロッ
ク図である。図1において主記憶装置8からベクトル処
理装置1、1nに信号線100,100nを経て命令が
命令制御部2に通知される。並列効果を高める場合ベク
トル処理装置1、1nには図2で示す同期指示命令によ
り同期動作しなければならない命令とプロセッサ番号が
通知され同期命令指示部50と構成フラグ57に複数個
格納保持される。また前記同期指示命令により前記同期
命令指示部50と構成フラグ57に格納保持された同期
動作しなければならない命令とプロセッサ番号は解除す
ることも出来る。下記の命令列を参照して1から6まで
の動作を説明する。 1. VLD(V0) 主記憶 → ベクトルレジスタ0番 2. VLD(V1) 主記憶 → ベクトルレジスタ1番 3. VADD (V0+V1→V2) ベクトルレジス
タ0番+ベクトルレジスタ1番 → ベクトルレジスタ2
番 4.同期指示命令 VST命令指示 5. VST(V2→MM) ベクトルレジスタ2番 →
主記憶に格納 6.同期解除命令 VST命令を解除 1番のVLD(V0)命令は、主記憶装置8からベクト
ル処理装置1、1nに信号線100,100nを経て命
令制御部2に通知される。通知された命令は、命令制御
部2の命令解読部21でスカラ処理命令かベクトル処理
命令か解読されベクトル処理命令ならば信号線101、
101nを経てベクトル制御部5に通知され命令デコー
ド部51で解読される。構成フラグ57と命令デコード
部51からベクトルパイプライン数とベクトル要素数が
それぞれ求められ要素判定回路58でベクトルパイプラ
イン演算器で処理されるべき均等なベクトル要素数が求
められる。また、信号線102,102nを経てメモリ
アクセス処理部3、3nに通知されリクエストコードを
解読すると共にプロセッサネットワーク部4、4nの状
態を管理しメモリアクセス要求を制御する信号線10
3、103nを経てプロセッサネットワーク部4、4n
に制御信号を送り主記憶装置8に信号線104,104
nを経てVLDリクエストを送出する。VLD(V0)
は、命令デコード部51で同期発行しなくても良い命令
と判断され命令発行部54に格納され命令発行チェック
部55でリソースのチェックを行い命令発行フラグ56
をセットし同期フラグ53が点灯してないため同期発行
する必要はなく命令実行部59を経て信号線106から
ベクトル処理部6に命令実行を発行する。同じ事が他の
ベクトル処理装置6nでも行われている。一方、主記憶
装置に出力されたリクエストにより読み出されたベクト
ルデータは104,104nを経てプロセッサネットワ
ーク部4に入力され信号線105,105nを経て構成
されるベクトルパイプライン60、6m、60n、6m
nにインタリーブされて入力され、パイプ内クロスバ6
3を経て命令で指示されたベクトルレジスタ61に格納
される。
Next, the operation of the circuit of FIG. 1 will be described with reference to the drawings. FIG. 1 is a block diagram showing one embodiment of the present invention. In FIG. 1, an instruction is notified from the main storage device 8 to the vector processing devices 1 and 1n to the instruction control unit 2 via signal lines 100 and 100n. In order to enhance the parallel effect, the vector processing apparatuses 1 and 1n are notified of the instruction that must be operated synchronously and the processor number by the synchronization instruction instruction shown in FIG. . Further, the synchronization instruction instruction and the processor number and the instruction stored in the synchronization instruction instructing section 50 and the configuration flag 57 which must be operated synchronously can be released. The operations 1 to 6 will be described with reference to the following instruction sequence. 1. 1. VLD (V0) main memory → vector register 0 2. VLD (V1) main memory → vector register 1 VADD (V0 + V1 → V2) Vector register 0 + vector register 1 → vector register 2
Number 4. 4. Synchronization instruction instruction VST instruction instruction VST (V2 → MM) Vector register No.2 →
Store in main memory 6. Synchronization release instruction Release VST instruction The first VLD (V0) instruction is notified from the main storage device 8 to the vector processing devices 1 and 1n to the instruction control unit 2 via the signal lines 100 and 100n. The notified instruction is decoded by the instruction decoding unit 21 of the instruction control unit 2 as a scalar processing instruction or a vector processing instruction.
The instruction is sent to the vector control unit 5 via 101n and decoded by the instruction decoding unit 51. The number of vector pipelines and the number of vector elements are respectively obtained from the configuration flag 57 and the instruction decoding unit 51, and the element determination circuit 58 obtains an equal number of vector elements to be processed by the vector pipeline arithmetic unit. A signal line 10 which is notified to the memory access processing units 3 and 3n through signal lines 102 and 102n to decode the request code, manages the states of the processor network units 4 and 4n, and controls the memory access request.
3, 103n, processor network unit 4, 4n
Control signal to the main memory 8 and the signal lines 104 and 104
Send a VLD request via n. VLD (V0)
Is determined as an instruction that does not need to be synchronously issued by the instruction decoding unit 51, is stored in the instruction issuing unit 54, the resource is checked by the instruction issuing check unit 55, and the instruction issuing flag 56
Since the synchronization flag 53 is not lit, there is no need to issue the instruction synchronously, and the instruction is issued from the signal line 106 to the vector processing unit 6 via the instruction execution unit 59. The same is performed in the other vector processing device 6n. On the other hand, the vector data read by the request output to the main storage device is input to the processor network unit 4 through 104 and 104n, and is input to the vector pipeline 60, 6m, 60n, and 6m configured through the signal lines 105 and 105n.
n, interleaved and input to the crossbar 6 in the pipe.
3 and stored in the vector register 61 designated by the instruction.

【0022】2番目のVLD(V1)命令は先行命令の
VLD(V0)と同じ動作をするので説明を省く。
The second VLD (V1) instruction operates in the same manner as the preceding instruction VLD (V0), and will not be described.

【0023】3番目のVADD(V0+V1→V2)
は、メモリアクセス処理部3、3nに命令を通知する事
はなく信号線101、101nを経てベクトル制御部5
にだけ通知される。ベクトル制御部5に通知されたVA
DD命令は、命令デコード部51で同期発行しなくても
良い命令と判断されると同時に命令発行部54に格納さ
れ命令発行チェック部55でリソースのチェックを行い
命令発行フラグ56をセットし同期フラグ53が点灯し
てないため同期発行する必要はなく命令実行部59を経
て信号線106からベクトル処理部6に命令実行を発行
する。命令実行を受けたベクトル処理部6は、指定を受
けたベクトルレジスタ61(V0、V1)、61m(V
0,V1)からベクトルデータを読み出し演算器62で
演算処理をしてパイプ内クロスバー63に入力され指定
されたベクトルレジスタ61(V2)、61m(V2)
に格納される。ベクトル処理部6nでも前記ベクトル処
理部6と同じ動作をするが、図示していないベクトル処
理装置と主記憶装置間のネットワークのビジーによりベ
クトル処理装置にロードされるベクトルデータの集まり
が遅れ同期命令ではない後続命令はベクトル処理装置内
のリソースのチェックのみで実行するためバラバラに動
作する。
Third VADD (V0 + V1 → V2)
Does not notify the instructions to the memory access processing units 3 and 3n, but transmits the signal to the vector control unit 5 via the signal lines 101 and 101n.
Will be notified only. VA notified to the vector control unit 5
The DD instruction is determined to be an instruction that does not need to be synchronously issued by the instruction decode unit 51, and is stored in the instruction issue unit 54 at the same time as checking the resources by the instruction issue check unit 55, setting the instruction issue flag 56, and Since 53 is not lit, it is not necessary to issue the instruction synchronously, and the instruction is issued from the signal line 106 to the vector processing unit 6 via the instruction executing unit 59. The vector processing unit 6 that has received the instruction executes the vector registers 61 (V0, V1) and 61m (V
0, V1), the vector data is read out from the vector register 61 (V2), 61m (V2) which is input to the crossbar 63 in the pipe and processed by the operation unit 62.
Is stored in The vector processing unit 6n operates in the same manner as the vector processing unit 6, but the collection of vector data loaded into the vector processing device due to the busy network between the vector processing device and the main storage device (not shown) causes a delay synchronization instruction. Unsuccessful subsequent instructions operate independently since they are executed only by checking resources in the vector processing device.

【0024】4番目の同期指示命令(VST命令指示)
によりVST命令が同期命令指示部50に、同期指示プ
ロセッサ番号が構成フラグ57にそれぞれ格納保持され
る。なお、同期指示命令のオペランドには、同期指定プ
ロセッサ番号があり、これにより、同期をとるべき複数
のベクトルプロセッサが指定される。システムのプロセ
ッサ数が定数である場合には、オペランドの各ビットに
各プロセッサを割り当てて、各ビットが1であるか0で
あるかによって、各プロセッサが同期の対象となるか否
かを設定するようなオペランド構成とすれば良い。シス
テムのプロセッサ数が不定である場合には、オペランド
の各ビットに各プロセッサを割り当てるの加え、オペラ
ンドの前部に同期の対象となるプロセッサ数を挿入する
ようなオペランド構成とすれば良い。
Fourth synchronization instruction instruction (VST instruction instruction)
Thus, the VST instruction is stored and held in the synchronization instruction instructing section 50, and the synchronization instruction processor number is stored and held in the configuration flag 57. Note that the operand of the synchronization instruction instruction includes a synchronization designation processor number, which specifies a plurality of vector processors to be synchronized. When the number of processors in the system is a constant, each processor is assigned to each bit of the operand, and whether each processor is to be synchronized is set depending on whether each bit is 1 or 0. Such an operand configuration may be used. If the number of processors in the system is uncertain, the operand configuration may be such that each processor is assigned to each bit of the operand and the number of processors to be synchronized is inserted at the front of the operand.

【0025】5番目のVST命令はメモリアクセス処理
部3、3nに命令を信号線102,102nを経て通知
すると同時に信号線101、101nを経てベクトル制
御部5にも通知される。ベクトル制御部5に通知された
VST命令は、命令デコード部51でデコードされ同期
命令指示部50に保持された命令との間で同期命令検出
回路5Aにて同期発行する命令と判断されると同期フラ
グ52、53をセットし信号線201から他のベクトル
処理装置1nに対して命令発行部54に同期命令がセッ
トされた事を通知する。命令発行部54にセットされた
VST命令は、命令発行チェック部55でリソースのチ
ェックを行い命令発行出来るならば命令発行OKフラグ
56をセットし前記同期フラグと同様に信号線200か
ら他のベクトル処理装置1nに対して通知する。他のベ
クトル処理装置1nは、ベクトル処理装置1と同様VS
T命令が同期命令検出回路5Anで同期発行する命令と
判断されると同期フラグ52n、53nをセットし信号
線201nから他のベクトル処理装置1に対して命令発
行部54nに同期命令がセットされた事を通知する。ベ
クトル処理装置1は、信号線203を経て前記ベクトル
処理装置1nの同期フラグ53nを受け取り外部同期フ
ラグ580をセットし、ベクトル処理装置1nの命令発
行部54nにセットされたVST命令が同期命令である
事を認知する。ベクトル処理装置1nの命令発行部54
nにセットされたVST命令は、命令発行チェック部5
5nでリソースのチェックを行い発行可能であれば命令
発行OKフラグ56nをセットすると同時に信号線20
0nを経てベクトル処理装置1に通知し、信号線204
を経て外部発行OKフラグ5Bをセットする。命令実行
部59は、同期フラグ53と外部同期フラグ58により
ベクトル処理装置1、1nが発行しようとしている命令
が同期命令である事を知ると同時に命令発行OKフラグ
56と外部発行OKフラグ5Bがセットされている事を
確認し命令実行指示をベクトル処理部6に通知する。ベ
クトル処理部6、6nは、同時に命令実行指示を受け、
ベクトルレジスタ61,61m、61n、61mn(V
2)からベクトルデータをそれぞれ読み出し信号線10
5、105nを経てプロセッサネットワーク部4、4n
に同時に取り込まれ信号線104,104nを経て主記
憶装置8に格納される。
The fifth VST instruction is notified to the memory access processing units 3 and 3n through the signal lines 102 and 102n, and is also notified to the vector control unit 5 through the signal lines 101 and 101n. The VST instruction notified to the vector control unit 5 is synchronized with the instruction decoded by the instruction decoding unit 51 and synchronized with the instruction held in the synchronous instruction designating unit 50 by the synchronous instruction detection circuit 5A when the instruction is determined to be synchronous. The flags 52 and 53 are set, and the instruction issuing unit 54 is notified from the signal line 201 to the other vector processing device 1n that the synchronous instruction has been set. The VST instruction set in the instruction issuing unit 54 checks the resources in the instruction issuing check unit 55, and if the instruction can be issued, sets the instruction issuing OK flag 56 and performs other vector processing from the signal line 200 in the same manner as the synchronization flag. Notify the device 1n. The other vector processing device 1n has the same VS as the vector processing device 1.
When it is determined that the T instruction is an instruction issued synchronously by the synchronous instruction detection circuit 5An, the synchronous flags 52n and 53n are set, and the synchronous instruction is set to the instruction issuing unit 54n from the signal line 201n to the other vector processing device 1. Notify the thing. The vector processing device 1 receives the synchronization flag 53n of the vector processing device 1n via the signal line 203, sets the external synchronization flag 580, and the VST instruction set in the instruction issuing unit 54n of the vector processing device 1n is a synchronization instruction. Recognize things. Instruction issuing unit 54 of the vector processing device 1n
The VST instruction set in the instruction issuance check unit 5
5n, the resource is checked, and if it can be issued, the instruction issue OK flag 56n is set and at the same time the signal line 20 is set.
0n to the vector processing device 1 and the signal line 204
, The external issue OK flag 5B is set. The instruction execution unit 59 recognizes from the synchronization flag 53 and the external synchronization flag 58 that the instruction to be issued by the vector processing device 1 or 1n is a synchronous instruction, and sets the instruction issue OK flag 56 and the external issue OK flag 5B at the same time. Then, the instruction execution instruction is notified to the vector processing unit 6. The vector processing units 6 and 6n receive the instruction execution instruction at the same time,
Vector registers 61, 61m, 61n, 61mn (V
2) The vector data is read out from each of the signal lines 10
5, 105n, processor network section 4, 4n
At the same time, and stored in the main storage device 8 via the signal lines 104 and 104n.

【0026】なお、上記の同期をとるためのフラグの送
受信は同期指定命令のオペランドで指定される同期をと
るべきプロセッサ間に限定される。
The transmission and reception of the above-mentioned flag for synchronizing is limited between processors to be synchronized specified by the operand of the synchronizing instruction.

【0027】6.同期解除命令(VST命令解除)は、
4.同期指示命令VST命令指示で同期命令指示部5
0、構成フラグ57に格納保持されたデータを解除す
る。
6. The synchronization release instruction (VST instruction release)
4. Synchronization instruction instruction 5
0, the data stored and held in the configuration flag 57 is released.

【0028】[0028]

【発明の効果】本発明の効果は、プロセッサ間で同期を
取らなければならない命令を設定し、プロセッサ間で同
期発行制御する事によりベクトルパイプライン数を増や
しベクトル命令処理時間を短くできることである。
The effect of the present invention is that the number of vector pipelines can be increased and the vector instruction processing time can be shortened by setting instructions which must be synchronized between the processors and controlling the synchronous issue between the processors.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施形態による情報処理装置の構成を
示すブロック図である。
FIG. 1 is a block diagram illustrating a configuration of an information processing apparatus according to an embodiment of the present invention.

【図2】本発明の実施形態による同期指示命令の構成を
示す図である。
FIG. 2 is a diagram showing a configuration of a synchronization instruction command according to the embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1、1n ベクトルプロセッサ 2 命令制御部 3 メモリアクセス処理部 4 プロセッサネットワーク部 5 ベクトル制御部 5A 同期命令検出回路 5B 外部発行OKフラグ 6 ベクトル処理部 7 パイプラインクロスバ部7 20 スカラ処理部 21 命令解読部 50 同期命令指示部 51 命令デコード部 52 同期フラグ 53 同期フラグ 54 命令発行部 55 命令発行チェック部 56 命令発行OKフラグ 57 構成フラグ 58 要素判定回路 580 外部装置同期フラグ 59 命令実行部 61 ベクトルレジスタ 62 演算器 63 パイプ内クロスバ 106 信号線 107 信号線 200 信号線 201 信号線 8 主記憶装置 1, 1n vector processor 2 instruction control unit 3 memory access processing unit 4 processor network unit 5 vector control unit 5A synchronous instruction detection circuit 5B externally issued OK flag 6 vector processing unit 7 pipeline crossbar unit 7 20 scalar processing unit 21 instruction decoding unit REFERENCE SIGNS LIST 50 synchronization instruction instructing unit 51 instruction decoding unit 52 synchronization flag 53 synchronization flag 54 instruction issuing unit 55 instruction issuing check unit 56 instruction issuing OK flag 57 configuration flag 58 element determination circuit 580 external device synchronization flag 59 instruction execution unit 61 vector register 62 operation Instrument 63 Crossbar in pipe 106 Signal line 107 Signal line 200 Signal line 201 Signal line 8 Main storage device

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】 同期指示命令をフェッチしてから同期解
除命令をフェッチするまでの間にフェッチした命令を複
数のベクトルプロセッサ間で同期をとって実行する同期
化手段を備えることを特徴とする情報処理装置。
1. An information processing apparatus, comprising: a synchronizing means for executing a fetched instruction in synchronization between a plurality of vector processors between a time when a synchronization instruction instruction is fetched and a time when a synchronization release instruction is fetched. Processing equipment.
【請求項2】 請求項1に記載の情報処理装置におい
て、前記同期指示命令は、同期をとるべきベクトルプロ
セッサを指定するオペランドを有し、前記同期化手段は
同期をとる際に、そのオペランドで指定されたベクトル
プロセッサ間で同期をとることを特徴とする情報処理装
置。
2. The information processing apparatus according to claim 1, wherein the synchronization instruction instruction has an operand for designating a vector processor to be synchronized, and the synchronization means uses the operand when synchronizing. An information processing apparatus for synchronizing between designated vector processors.
【請求項3】 請求項1又は2に記載の情報処理装置に
おいて、各ベクトルプロセッサは、命令制御部、メモリ
アクセス部、ベクトル制御部、ベクトル処理部、プロセ
ッサネットワーク部、パイプラインクロスバ部を備える
ことを特徴とする情報処理装置。
3. The information processing device according to claim 1, wherein each vector processor includes an instruction control unit, a memory access unit, a vector control unit, a vector processing unit, a processor network unit, and a pipeline crossbar unit. An information processing apparatus characterized by the above-mentioned.
【請求項4】 請求項3に記載の情報処理装置におい
て、前記命令処理部は、スカラ処理部と命令解読部を備
えることを特徴とする情報処理装置。
4. The information processing apparatus according to claim 3, wherein the command processing unit includes a scalar processing unit and a command decoding unit.
【請求項5】 請求項3に記載の情報処理装置におい
て、前記ベクトル制御部は、命令デコード部、同期命令
指示部、構成フラグ、要素判定回路、命令発行部、同期
命令検出回路、同期フラグ、命令発行チェック部、命令
発行OKフラグ、外部装置同期フラグ、外部発行OKフ
ラグ、命令実行部、信号線を備えることを特徴とする情
報処理装置。
5. The information processing apparatus according to claim 3, wherein the vector control unit includes an instruction decoding unit, a synchronous instruction designating unit, a configuration flag, an element determining circuit, an instruction issuing unit, a synchronous instruction detecting circuit, a synchronous flag, An information processing apparatus comprising: an instruction issue check unit; an instruction issue OK flag; an external device synchronization flag; an external issue OK flag; an instruction execution unit; and a signal line.
【請求項6】 請求項3に記載の情報処理装置におい
て、前記ベクトル処理部は、複数のレジスタと複数の演
算器とパイプ内クロスバを備える、複数のベクトルパイ
プラインを備えることを特徴とする情報処理装置。
6. The information processing apparatus according to claim 3, wherein the vector processing unit includes a plurality of vector pipelines including a plurality of registers, a plurality of arithmetic units, and a crossbar in a pipe. Processing equipment.
【請求項7】 同期指示命令をフェッチしてから同期解
除命令をフェッチするまでの間にフェッチした命令を複
数のベクトルプロセッサ間で同期をとって実行する複数
ベクトルプロセッサ間の同期化方法。
7. A method for synchronizing between a plurality of vector processors, wherein the fetched instruction is executed between the plurality of vector processors in a period from fetching a synchronization instruction instruction to fetching a synchronization release instruction.
JP36545299A 1999-12-22 1999-12-22 Information processor and method for synchronizing plural vector processors Pending JP2001184340A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP36545299A JP2001184340A (en) 1999-12-22 1999-12-22 Information processor and method for synchronizing plural vector processors

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36545299A JP2001184340A (en) 1999-12-22 1999-12-22 Information processor and method for synchronizing plural vector processors

Publications (1)

Publication Number Publication Date
JP2001184340A true JP2001184340A (en) 2001-07-06

Family

ID=18484302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36545299A Pending JP2001184340A (en) 1999-12-22 1999-12-22 Information processor and method for synchronizing plural vector processors

Country Status (1)

Country Link
JP (1) JP2001184340A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6725388B1 (en) * 2000-06-13 2004-04-20 Intel Corporation Method and system for performing link synchronization between two clock domains by inserting command signals into a data stream transmitted between the two clock domains
JP2009054032A (en) * 2007-08-28 2009-03-12 Toshiba Corp Parallel processor

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6725388B1 (en) * 2000-06-13 2004-04-20 Intel Corporation Method and system for performing link synchronization between two clock domains by inserting command signals into a data stream transmitted between the two clock domains
US7689853B2 (en) 2000-06-13 2010-03-30 Intel Corporation Synchronization of network communication link
JP2009054032A (en) * 2007-08-28 2009-03-12 Toshiba Corp Parallel processor

Similar Documents

Publication Publication Date Title
US7281119B1 (en) Selective vertical and horizontal dependency resolution via split-bit propagation in a mixed-architecture system having superscalar and VLIW modes
EP0426393A2 (en) Instructing method and execution system
US6725357B1 (en) Making available instructions in double slot FIFO queue coupled to execution units to third execution unit at substantially the same time
US20150074353A1 (en) System and Method for an Asynchronous Processor with Multiple Threading
JP2011170868A (en) Pipeline accelerator for improved computing architecture, and related system and method
US4348724A (en) Address pairing apparatus for a control store of a data processing system
EP1745367B1 (en) Pipelined asynchronous instruction processor circuit
JP3285629B2 (en) Synchronous processing method and synchronous processing device
US4360869A (en) Control store organization for a data processing system
US5745725A (en) Parallel instruction execution with operand availability check during execution
JP2001184340A (en) Information processor and method for synchronizing plural vector processors
US7111152B1 (en) Computer system that operates in VLIW and superscalar modes and has selectable dependency control
KR20010006787A (en) Processer and system for data processing
JP3526492B2 (en) Parallel processing system
WO2016054780A1 (en) Asynchronous instruction execution apparatus and method
US7143247B1 (en) Method and apparatus for parallel execution pipeline data storage in a computer memory
US4348723A (en) Control store test selection logic for a data processing system
JP2010204913A (en) Vector processor
EP0261685B1 (en) Microprocessor system
JP3526773B2 (en) Multiprocessor device and control method thereof
JP2000293509A (en) Information processor
EP0323080A2 (en) Multiprocessor memory access control system
JPH05108476A (en) Main storage controller
JPS629460A (en) Instruction control system for multi-processor system
SU1559340A1 (en) Arithmetic device with microprogram control

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041019

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050302