JP2771912B2 - Arithmetic control method of vector arithmetic processing unit - Google Patents

Arithmetic control method of vector arithmetic processing unit

Info

Publication number
JP2771912B2
JP2771912B2 JP3201739A JP20173991A JP2771912B2 JP 2771912 B2 JP2771912 B2 JP 2771912B2 JP 3201739 A JP3201739 A JP 3201739A JP 20173991 A JP20173991 A JP 20173991A JP 2771912 B2 JP2771912 B2 JP 2771912B2
Authority
JP
Japan
Prior art keywords
register
data
timing
selector
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3201739A
Other languages
Japanese (ja)
Other versions
JPH0546655A (en
Inventor
浩二 黒田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3201739A priority Critical patent/JP2771912B2/en
Publication of JPH0546655A publication Critical patent/JPH0546655A/en
Application granted granted Critical
Publication of JP2771912B2 publication Critical patent/JP2771912B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は複数の演算器で構成され
るベクトル演算処理装置の演算制御方式に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an arithmetic control system for a vector arithmetic processing device comprising a plurality of arithmetic units.

【0002】[0002]

【従来の技術】従来例を図10〜図14を参照して説明
する。図10は本発明および従来例に適用されるベクト
ル演算処理装置の構成図、図11は同構成のベクトルレ
ジスタの具体例、図12は従来例の演算器の構成図、図
13は従来例の動作タイミングチャート、図14は従来
例の演算器の構成案である。
2. Description of the Related Art A conventional example will be described with reference to FIGS. 10 is a block diagram of a vector operation processing device applied to the present invention and the conventional example, FIG. 11 is a specific example of a vector register having the same configuration, FIG. 12 is a configuration diagram of a conventional arithmetic unit, and FIG. FIG. 14 shows an operation timing chart of a configuration example of a conventional arithmetic unit.

【0003】まず図10を参照してベクトル演算処理装
置の構成を説明する。なお説明を容易にするため、図1
0では演算器が4である場合を示している。11は演算
器であり、プロセッサ15の命令に従って演算処理を実
行する。13はベクトルレジスタであり、演算器11で
演算処理するデータが記録される。14はシステムバス
である。また、12は隣れる演算器にデータを転送する
バスである。
First, the configuration of a vector operation processing device will be described with reference to FIG. In order to facilitate the explanation, FIG.
0 indicates a case where the arithmetic unit is 4. Numeral 11 denotes an arithmetic unit, which executes arithmetic processing according to an instruction of the processor 15. Reference numeral 13 denotes a vector register in which data to be processed by the arithmetic unit 11 is recorded. 14 is a system bus. A bus 12 transfers data to an adjacent computing unit.

【0004】また、ベクトルレジスタ13は、図11に
示すように、XアドレスとYアドレスに対応するメモリ
で構成され、XアドレスのレジスタはXアドレスに対応
する演算器とアクセスされる。ベクトル演算処理装置に
おいては、各種の演算処理が行なわれるが、処理結果の
総和を求める処理も頻繁に行なわれる。すなわち、図1
1で示されるデータD 0 −0〜D3 −4の、例えば、全
てのデータの和を求める処理が頻繁に行なわれる。この
場合、各演算器は各演算器と接続されているベクトルレ
ジスタ13の対応するXアドレスに対するデータの和を
求める。すなわち、演算器11−3はXアドレスからで
あるデータD3 −0〜D3 −4の和を求める。その後、
各演算器で求めた和は、隣れる演算器にデータを転送す
るバス12を介して演算器11−0に転送され、演算器
11−0で総和処理が実行される。本発明は総和演算処
理実行時の演算制御方式に関するものである。
A vector register 13 is shown in FIG.
As shown, the memory corresponding to the X address and the Y address
The register of X address corresponds to X address
Is accessed. Vector arithmetic processing unit
In this case, various types of arithmetic processing are performed.
Processing for obtaining the sum is also frequently performed. That is, FIG.
Data D indicated by 1 0−0 to DThree-4, for example, all
Processing for obtaining the sum of all data is frequently performed. this
In this case, each computing unit is connected to the vector
The sum of data for the corresponding X address of the
Ask. That is, the arithmetic unit 11-3 starts from the X address.
Some data DThree−0 to DThree-4 is obtained. afterwards,
The sum obtained by each operation unit transfers the data to the adjacent operation unit.
Transferred to a computing unit 11-0 via a bus 12
At 11-0, summation processing is executed. The present invention provides a
The present invention relates to an arithmetic control method at the time of execution of processing.

【0005】つぎに、従来の各演算器の構成例を図12
を参照して説明する。R13,R14,R24,R5,
R6およびR7はkバイトのデータm個が記録できるレ
ジスタである。すなわち、8kmビットのデータを記録
できるレジスタである。しかし以後説明を容易にするた
め、以ってk=1,m=4として説明を行なう。
Next, a configuration example of each conventional arithmetic unit is shown in FIG.
This will be described with reference to FIG. R13, R14, R24, R5
R6 and R7 are registers capable of recording m pieces of k-byte data. That is, it is a register that can record 8 km-bit data. However, hereinafter, for the sake of simplicity, the description will be made on the assumption that k = 1 and m = 4.

【0006】また、S1,S2およびS3はセレクタで
あり、レジスタに入力するデータをセレクトする。ベク
トルレジスタ13と演算器11間にkmバイトのデータ
受渡を行うが、隣れる演算器にデータを転送するバス1
2はkバイトの専用バスとなっており、このため、レジ
スタR13はkmバイトのメモリを分割してkバイトm
個で構成してデータを格納できるようになっている。
Further, S1, S2 and S3 are selectors for selecting data to be input to the register. A bus 1 for transferring data of km bytes between the vector register 13 and the arithmetic unit 11 is used to transfer data to an adjacent arithmetic unit.
2 is a k-byte dedicated bus. Therefore, the register R13 divides a km-byte memory into k-byte m buses.
It can be configured as individual and store data.

【0007】また、レジスタR7はレジスタR6の上位
(m−1)kバイトのデータを格納するレジスタR7a
とセレクトS3よりのkバイトのデータを格納するレジ
スタR7bに分割して構成されている。セレクタS3は
レジスタR6のkmバイトのデータをkバイトm個に分
割し、分割されたkバイトのデータとレジスタR13の
よりkバイトのデータのうちの一つを選択し、レジスタ
R7bへ出力する。
The register R7 is a register R7a for storing upper (m-1) k-byte data of the register R6.
And a register R7b for storing the data of k bytes from the select S3. The selector S3 divides the km-byte data of the register R6 into k-byte m data, selects one of the divided k-byte data and the k-byte data from the register R13, and outputs the selected data to the register R7b.

【0008】また、1は算術論理ユニット(ALU)で
ある。つぎに、図11で示したベクトルレジスタに格納
されているデータの総和を求める演算処理を、図13で
示す動作タイミングチャートにしたがって説明する。ま
ず、CPU15は全演算器に対して各演算器に接続され
ているベクトルレジスタ12に記録されているデータの
加算命令を送出し、各演算器は加算処理を実行する。図
13では演算器0で代表して加算処理を示している。
Reference numeral 1 denotes an arithmetic logic unit (ALU). Next, the operation of calculating the sum of the data stored in the vector register shown in FIG. 11 will be described with reference to the operation timing chart shown in FIG. First, the CPU 15 sends an addition instruction of the data recorded in the vector register 12 connected to each operation unit to all the operation units, and each operation unit executes an addition process. FIG. 13 shows the addition process as a representative of the arithmetic unit 0.

【0009】CPU15よりの加算命令を受けると、演
算器0の時間T0 よりT4 で順次図11に示すベクトル
レジスタのデータD0 −0〜D0 −4をリードし、レジ
スタR13に格納、次のタイミングでレジスタR14に
移す(T1 〜T5 )。また、次のタイミングではレジス
タR24R14のデータ加算をALU1で行い、結果
をレジスタR5に格納する(T2 〜T6 )。また、次の
タイミングではレジスタR5のデータをレジスタR24
に移す(T3 〜T6 )。なお、ALU1での加算におい
て、最初と第2回においてはレジスタR24のデータ
(T1 およびT2 時)は0にセットされている。
[0009] Upon receiving the add instruction from the CPU 15, reads the data D 0 -0~D 0 -4 vector registers sequentially shown in FIG. 11 at T 4 from the time T 0 of the arithmetic unit 0, stored in the register R13, transferred to the register R14 at the next timing (T 1 ~T 5). Further, in the next timing perform data addition register R24 and R14 in ALU1, and store the result in register R5 (T 2 ~T 6). At the next timing, the data of the register R5 is transferred to the register R24.
(T 3 to T 6 ). Note that in addition in ALU1, data (time T 1 and T 2) of the register R24 in the first and second times are set to zero.

【0010】したがって、時間T6 においてレジスタR
5にはデータD0 −0,D0 −2およびD0 −4の加算
結果が、またレジスタR24にはデータD0 −1および
0 3の加算結果が格納されている。時間T7 ではレジ
スタR5 のデータがレジスタR14に移され、次の時間
8 でレジスタR5 とR14のデータが加算されてレジ
スタR5 に格納され、次のT 9 でレジスタR24に移さ
れる。
Therefore, the time T6At the register R
5 has data D0−0, D0-2 and D0Addition of -4
The result and the data D are stored in the register R24.0-1 and
D03 is stored. Time T7Then cash register
Star RFiveIs transferred to the register R14, and the next time
T8With register RFiveAnd the data of R14 are added
Star RFiveAnd the next T 9Moved to register R24
It is.

【0011】なお、演算器0以外の演算器でも同様な加
算処理が同時に実行されるが、時間T9 でレジスタR5
のデータはレジスタR6に移される。各演算器での加算
処理が終了するとCPUは各演算器での加算結果の総和
を求める命令が送出され、各演算器は総和終了を開始す
る。
[0011] Note that the same addition process in calculator other than computing unit 0 is performed simultaneously at time T 9 register R5
Is moved to the register R6. When the addition processing in each computing unit is completed, the CPU sends a command for calculating the sum of the addition results in each computing unit, and each computing unit starts terminating the sum.

【0012】まず、演算器1が処理を開始し、レジスタ
R6の4個に分割(m=4)されたkバイトデータを順
次レジスタR7bに移す(T10〜T13)。また次のタイ
ミングでレジスタR7bのデータは専用バス12−1を
使用して演算器0のレジスタR13に転送する(T11
14)。すなわち、T14で演算器1のレジスタR6に格
納されている加算データは演算器0のレジスタR13に
移されたことになる。
[0012] First, the arithmetic unit 1 starts the process, four split register R6 (m = 4) has been transferred to a k-byte data sequentially register R7b the (T 10 ~T 13). The data for the register R7b at the next timing to transfer to the register R13 of the arithmetic unit 0 using a dedicated bus 12-1 (T 11 ~
T 14). That is, the addition data stored in the register R6 of the arithmetic unit 1 in T 14 will be transferred to the register R13 of the arithmetic unit 0.

【0013】演算器0では時間T15でレジスタR13の
データをレジスタR14に移し、T 16で演算器0の加算
データを格納しているレジスタR24との加算が行なわ
れレジスタR5に記録される。レジスタR5のデータは
次の加算のためにT17でレジスタ24に移される。
In the arithmetic unit 0, the time TFifteenIn the register R13
Transfer the data to register R14, 16Addition of arithmetic unit 0
Addition with register R24 storing data is performed
Is recorded in the register R5. The data in register R5 is
T for the next addition17Is transferred to the register 24.

【0014】以上の動作と並行して、演算器2では時間
12〜T15でレジスタR6のデータをレジスタR7bに
移し、次のタイミングで順次演算器1のレジスタR13
の最下位のkバイトを格納するレジスタに移される(T
13〜T16)。また、次のタイミングでレジスタR13の
最下位バイト格納メモリに格納された演算器2よりのデ
ータはセレクタ3を通ってレジスタR7bに(T14〜T
17)、また次のタイミングで演算器0のレジスタR13
に移され(T15〜T18)、演算器1との加算で説明した
と同様の加算処理が実行される。
[0014] In parallel with the above operation, the arithmetic unit in 2 at time T 12 through T 15 were transferred data in the register R6 to register R7b, register sequentially calculator 1 at the next timing R13
Is transferred to the register storing the least significant k bytes of (T
13 ~T 16). Further, following (T 14 data to the register R7b through selector 3 from the arithmetic unit 2 which is stored in the least significant byte storage memory register R13 at the timing ~T
17 ) Also, at the next timing, the register R13
(T 15 to T 18 ), and the same addition processing as described in the addition with the arithmetic unit 1 is performed.

【0015】演算器3の動作も時間T14より開始され、
演算器2で説明したと同様な動作を行い、演算器2およ
び1のレジスタR13およびR7bを通って演算器0の
レジスタR13に転送され、T24でレジスタR5で総和
が格納され、以下レジスタR6およびR7に移され時間
26で総和加算処理は終了する。
[0015] initiated from work time T 14 of the arithmetic unit 3,
Performs the same operation as described in the calculator 2, through the registers R13 and R7b computing units 2 and 1 are transferred to the register R13 of the arithmetic unit 0, the sum is stored in register R5 at T 24, the following registers R6 and total addition processing at the time T 26 is moved to R7 is terminated.

【0016】以上説明した従来例の構成は演算器が4個
であったが、一般的ベクトル演算処理装置においては更
に多くの演算器で構成される。演算器数が多くなると、
各演算器より演算器0へデータを転送するに要する時間
(図13のT9 〜T22)が長くなり、この転送時間を短
かくするために、図14で示す構成案も考えられる。す
なわち、データ転送に関与するレジスタR13およびR
7bを高速で動作するレジスタFRおよびTRに分離し
て構成させる案も考えられる。
Although the configuration of the conventional example described above has four arithmetic units, a general vector arithmetic processing unit is composed of more arithmetic units. When the number of arithmetic units increases,
The time required to transfer data from each arithmetic unit to the arithmetic unit 0 (T 9 to T 22 in FIG. 13) becomes longer. To shorten this transfer time, a configuration shown in FIG. 14 can be considered. That is, the registers R13 and R13 involved in data transfer
It is also conceivable to separately configure the register 7b into registers FR and TR operating at high speed.

【0017】[0017]

【発明が解決しようとする課題】前述したように、従来
のベクトル演算処理装置におけるベクトルレジスタに記
録されているデータの総和を求める処理において、各演
算器の加算結果を総和を求める演算器へのデータ転送に
要する時間が非常に長時間を必要とした。
As described above, in the processing for obtaining the sum of the data recorded in the vector registers in the conventional vector operation processing device, the addition result of each operation unit is sent to the operation unit for obtaining the sum. The time required for data transfer was very long.

【0018】また、この転送時間を短かくするために、
データ転送に関与するレジスタを高速で動作するレジス
タに分離して構成する案も考えられるが、この場合は、
分離構成させるために物量が多くなり複雑かつ高価とな
る。本発明は各演算器のデータを或る演算器に転送する
データ転送時間を短かくするよう改良したベクトル演算
処理装置の演算制御方式を提供することを目的とする。
Further, in order to shorten the transfer time,
It is conceivable to separately configure registers involved in data transfer into registers that operate at high speed. In this case,
Because of the separate configuration, the amount of material increases, and the cost becomes complicated and expensive. SUMMARY OF THE INVENTION It is an object of the present invention to provide an operation control method of a vector operation processing device improved so as to shorten a data transfer time for transferring data of each operation unit to a certain operation unit.

【0019】[0019]

【課題を解決するための手段】前述の課題を解決するた
めに本発明が採用した手段を図1を参照して説明する。
図1は本発明の原理図である。少なくとも、ベクトルレ
ジスタからの第1のオペランドを入力するレジスタR1
3を設け、前記レジスタR13をm分割したレジスタの
それぞれに後段の演算器からのKバイトデータの入力を
可能とし、第2のオペランドと前記レジスタR13との
データに対する演算結果を受取るレジスタR6と、前記
レジスタR6のm分割されたデータと前記レジスタR1
3のkバイトデータのいずれかを選択するセレクタS3
と、前記レジスタR6よりのk(m−1)バイトデータ
を入力するレジスタR7aと前記セレクタS3よりkバ
イトデータを入力するレジスタR7bに分割して構成さ
れるレジスタR7とを備えた演算器を複数個有するベク
トル演算処理装置において、特定命令によって、前記レ
ジスタR13を動作させるクロックタイミングを高速
クロックタイミングに切替えるタイミング切替手段A1
00と、前記レジスタR7bを動作させるクロックタイ
ミングを高速のクロックタイミングに切替えるタイミン
グ切替手段B101と、前記セレクタS3を動作させる
セレクタ信号の生成を高速のクロックタイミングに切替
えて生成するセレクタ切替手段102と、を備える。
Means adopted by the present invention to solve the above-mentioned problems will be described with reference to FIG.
FIG. 1 is a diagram illustrating the principle of the present invention. At least a register R1 for inputting a first operand from a vector register
3, a register R6 that allows input of K-byte data from a subsequent-stage arithmetic unit to each of the registers obtained by dividing the register R13 by m, and receives a second operand and an operation result for the data of the register R13; M divided data of the register R6 and the register R1
Selector S3 for selecting any one of the three k-byte data
And a register R7 divided into a register R7a for inputting k (m-1) -byte data from the register R6 and a register R7b for inputting k-byte data from the selector S3. In a vector operation processing device having a plurality of
Timing switching means A1 for switching to clock timing
00, a timing switching means B101 for switching a clock timing for operating the register R7b to a high-speed clock timing , and a generation of a selector signal for operating the selector S3 to a high-speed clock timing.
Selector switching means 102 for generating the data .

【0020】[0020]

【作用】ベクトル演算処理装置のCPUよりの特定命令
によって、タイミング切替手段A100,タイミング切
替手段B101およびセレクタ切替手段102が動作を
開始し、タイミング切替手段A100によってレジスタ
R13を、またタイミング切替手段B101によってレ
ジスタR7bを高速で動作させ、セレクタ切替手段10
2によってセレクタS3が高速でセレクトされる信号を
送出してセレクタを切替える。
The timing switching means A100, the timing switching means B101, and the selector switching means 102 start operating in response to a specific instruction from the CPU of the vector arithmetic processing unit, and the register R13 is operated by the timing switching means A100 and the timing switching means B101 is operated. By operating the register R7b at high speed, the selector switching means 10
2, the selector S3 sends out a signal for selecting at high speed to switch the selector.

【0021】以上のように、CPUからの特定命令によ
って、後段の演算器より前段の演算器へのデータ転送に
関与するレジスタおよびセレクタが高速で動作するた
め、データ転送時間を非常に短かくすることができる。
As described above, the register and the selector involved in the data transfer to the operation unit at the preceding stage from the operation unit at the subsequent stage operate at high speed by the specific instruction from the CPU, so that the data transfer time is made very short. be able to.

【0022】[0022]

【実施例】本発明の一実施例を図2〜図9を参照して説
明する。図2は本発明の実施例の構成、図3は同実施例
のタイミング制御信号発生回路の具体例、図4は同実施
例のタイミング切替回路Aの具体例、図5は同実施例の
タイミング切替回路Bの具体例、図6は同実施例のセレ
クト信号発生回路の具体例、図7は同実施例のセレクタ
切替回路の具体例、図8は同実施例の動作タイミングチ
ャート、図9は同実施例のタイミングチャートである。
DESCRIPTION OF THE PREFERRED EMBODIMENTS One embodiment of the present invention will be described with reference to FIGS. FIG. 2 shows a configuration of the embodiment of the present invention, FIG. 3 shows a specific example of the timing control signal generation circuit of the embodiment, FIG. 4 shows a specific example of the timing switching circuit A of the embodiment, and FIG. 6 is a specific example of the select signal generation circuit of the embodiment, FIG. 7 is a specific example of the selector switch circuit of the embodiment, FIG. 8 is an operation timing chart of the embodiment, and FIG. 4 is a timing chart of the embodiment.

【0023】図2において、レジスタR13,R14,
R24,R5,R6,R7,セレクタS1,S2,S3
およびALU1については図12で説明したとおりであ
り、タイミング切替手段A100、タイミング切替手段
B101およびセレクタ切替手段102は図1で説明し
たとおりである。
In FIG. 2, registers R13, R14,
R24, R5, R6, R7, selectors S1, S2, S3
ALU1 and ALU1 are as described in FIG. 12, and timing switching means A100, timing switching means B101 and selector switching means 102 are as described in FIG.

【0024】実施例では、タイミング切替手段A100
はカウンタ(Fc)2、タイミング制御信号発生回路3
および切替回路A4で構成され、タイミング切替手段B
101はタイミング切替回路B5で、またセレクタ切
手段102はセレクト信号発生回路6およびセレクタ切
替回路7で構成される。
In the embodiment, the timing switching means A100
Is a counter (Fc) 2, a timing control signal generation circuit 3
And a switching circuit A4.
101 is a timing switching circuit B5, also selector SWITCHING means 102 is composed of a select signal generating circuit 6 and the selector switching circuit 7.

【0025】タイミング制御信号発生回路3は、図3に
示すように、オア回路31a〜fおよびアンド回路32
a〜eで構成される。オア回路に入力される信号Fcn
のnはカウンタ(Fc)2のカウント値nに対応し、カ
ウント値がnのとき「1」が入力される。また、アンド
回路への入力「+演算器0」および「−演算器0」は演
算器0に対応する入力端子にそれぞれ「1」および
「0」を入力し、その他の演算器では演算器0と逆の信
号を入力する。すなわち「1」には「0」を、「0」に
は「1」を入力する。また「SIG」については後で説
明する。
As shown in FIG. 3, the timing control signal generating circuit 3 includes OR circuits 31a to 31f and an AND circuit 32.
a to e. Signal Fcn input to OR circuit
N corresponds to the count value n of the counter (Fc) 2, and when the count value is n, "1" is input. Inputs “+ operation unit 0” and “− operation unit 0” to the AND circuit input “1” and “0” to input terminals corresponding to operation unit 0, respectively. Input the opposite signal. That is, "0" is input for "1", and "1" is input for "0". "SIG" will be described later.

【0026】タイミング切替回路A4は、図4で示され
るように、アンド回路41a〜fおよびオア回路42a
〜dで構成される。カウンタ(Fc)2のカウント値が
0のときはアンド41fの出力は正規クロック、アンド
41eが「0」となり、オア回路42a〜dの出力には
正規クロックによる信号が出力され、レジスタR13の
ライトタイミングが供給される。Fc2のカウント値が
0以外のときは、前記タイミング制御信号発生回路3よ
りの制御信号(R13−0〜−3制御)にもとづいて、
倍クロックのタイミングでレジスタR13−0〜−3に
ライトタイミングが供給される。
As shown in FIG. 4, the timing switching circuit A4 includes AND circuits 41a to 41f and an OR circuit 42a.
To d. When the count value of the counter (Fc) 2 is 0, the output of the AND 41f is a normal clock , the AND 41e is "0", signals of the normal clock are output to the outputs of the OR circuits 42a to 42d, and the write of the register R13 is performed. Timing is provided. When the count value of Fc2 is other than 0, based on the control signal (R13-0 to -3 control) from the timing control signal generation circuit 3,
The write timing is supplied to the registers R13-0 to R3-3 at the timing of the double clock.

【0027】タイミング切替回路B5は、図5に示すよ
うに、アンド回路51aおよびB、オア回路52で構成
される。したがって、レジスタR7aへのライトタイミ
ングは変更ないが、レジスタR7bへのライトタイミン
グは前記タイミング制御信号発生回路3よりのR7b制
御信号にもとづいて、正規クロックと倍クロック信号の
切替えが行なわれる。
As shown in FIG. 5, the timing switching circuit B5 comprises AND circuits 51a and B and an OR circuit 52. Accordingly, although the write timing to the register R7a is not changed, the write timing to the register R7b is switched between the normal clock and the double clock signal based on the R7b control signal from the timing control signal generation circuit 3.

【0028】セレクト信号発生回路6は、図6に示すよ
うに、アンド回路61a〜c、Rsフリップフロップ6
2、カウンタ63および5デコーダ64で構成される。
アンド回路61aに入力されるFc(n)はセレクト信
号発生回路6が実装されている演算器の番号nに対応さ
せ、カウンタ(Fc)2のカウント値がnのとき「1」
が入力されて、RS−FF62をセットし、倍クロック
でカウンタ63の計数を開始する。5デコーダ64はカ
ウンタ63のカウント値が5になったことを検出し、ア
ンド回路61cよりカウンタ63に入力される倍クロッ
ク信号の通過を阻止する。したがって、カウンタ63よ
り出力される信号S3制御は0〜5の値を取る。また、
RS−FF62およびカウンタ63はカウンタ(Fc)
2のカウント値7でリセットされて0になる。
As shown in FIG. 6, select signal generation circuit 6 includes AND circuits 61a-61c, Rs flip-flop 6
2, a counter 63 and a 5-decoder 64.
Fc (n) input to the AND circuit 61a is made to correspond to the number n of the arithmetic unit on which the select signal generation circuit 6 is mounted, and "1" when the count value of the counter (Fc) 2 is n.
Is input, the RS-FF 62 is set, and the counter 63 starts counting at the double clock. The 5-decoder 64 detects that the count value of the counter 63 has become 5, and blocks passage of the double clock signal input to the counter 63 from the AND circuit 61c. Therefore, the control of the signal S3 output from the counter 63 takes a value of 0 to 5. Also,
The RS-FF 62 and the counter 63 are counters (Fc)
It is reset to 0 by the count value 7 of 2.

【0029】セレクタ切替回路7は、図7に示すよう
に、アンド回路71aおよびbとオア回路72で構成さ
れる。セレクタS3へのセレクタ信号はセレクト端子番
号に対応した数値信号でできており、この数値信号の数
値をセレクトS3内の図示しないデコーダがデコードし
て対応する端子をセレクトする。カウンタ(Fc)2の
カウント値が0のときは、正規の制御信号がセレクタS
3に加えられ、カウンタ(Fc)2のカウント値が0以
外のときは、前記セレクト信号発生回路6よりの出力で
あるS3制御信号がセレクタS3に加えられる。
The selector switching circuit 7 includes AND circuits 71a and 71b and an OR circuit 72, as shown in FIG. The selector signal to the selector S3 is formed of a numerical signal corresponding to the select terminal number, and the numerical value of the numerical signal is decoded by a decoder (not shown) in the select S3 to select a corresponding terminal. When the count value of the counter (Fc) 2 is 0, a normal control signal is output from the selector S
When the count value of the counter (Fc) 2 is other than 0, the S3 control signal output from the select signal generating circuit 6 is applied to the selector S3.

【0030】つぎに、実施例の動作を、従来例で説明し
たベクトルレジスタの総和を求める処理と同様な処理に
ついて図8および9を参照してその動作を説明する。図
8において、時間T0 〜T8 は従来例の図13で説明し
たと同様に各演算器でそれぞれのベクトルレジスタのデ
ータ加算が実行される。また、時間T9 〜T 15は図13
で説明したタイミングの2倍のタイミングで、各演算器
で加算され、レジスタR6に記録されているデータが順
次後段より前段の演算器に転送され、演算器0で総和が
求められる。また、時間T16〜T19は従来例の図13で
説明した時間T23〜T26と同様の処理が行なわれる。
Next, the operation of the embodiment will be described with reference to a conventional example.
Processing similar to the processing to calculate the sum of
The operation will be described with reference to FIGS. Figure
8, at time T0~ T8Is explained with reference to FIG.
In the same way as in
Data addition is performed. Also, the time T9~ T FifteenFigure 13
Each operation unit has a timing that is twice the timing described in
And the data recorded in the register R6 is
The data is transferred to the operation unit at the stage before the next stage and the sum is calculated at operation unit 0.
Desired. Also, the time T16~ T19Is the conventional example in FIG.
Explained time Ttwenty three~ T26The same processing as described above is performed.

【0031】時間T9 〜T15の倍クロックでのデータ転
送の開始はカウンタ(Fc)2のカウント開始によって
始められる。カウンタ(Fc)2はカウント値7で繰返
えされ、そのカウント開始はCPU15よりの命令によ
ってカウントを開始する。CPUは各演算器で、それぞ
れベクトルレジスタ13のデータの加算が終了(T8
すると、各演算器の加算結果の総和を求める命令を指令
する。この命令によって、カウント(Fc)2はカウン
トを開始する(T9 )。
The start of data transfer with a double clock of the times T 9 to T 15 is started when the counter (Fc) 2 starts counting. The counter (Fc) 2 is repeated with a count value of 7, and the counting is started by an instruction from the CPU 15. The CPU completes the addition of the data of the vector register 13 in each arithmetic unit (T 8 ).
Then, a command for obtaining the sum of the addition results of the respective arithmetic units is instructed. With this instruction, the count (Fc) 2 starts counting (T 9 ).

【0032】図9において、正規クロックは演算器が通
常動作しているクロックタイミングであり、倍クロック
は正規クロック周波数の2倍の周波数のクロックタイミ
ング、またSIGは正規クロックに対するデュティ50
%のパルスで、実線の期間出力を「1」にする。
In FIG. 9, the normal clock is the clock timing at which the arithmetic unit normally operates, the double clock is the clock timing of twice the normal clock frequency, and the SIG is the duty 50 relative to the normal clock.
%, The output is set to "1" during the period indicated by the solid line.

【0033】まず、演算器0のタイミング制御信号発生
回路3の動作について説明する。演算器0に対しては図
3のアンド回路32a〜dに入力される信号「+演算器
0」は「1」が、アンド回路32eには「0」が入力さ
れるため、アンド回路32aの出力(R13−0制御)
には、カウンタ(Fc)のカウント値が1,3および5
と信号SIGとのアンドがとられた期間パルスが出力さ
れる。また、以外同様に、アンド回路32bおよびcと
オア回路31eに、それぞれ図9に示したR13−1〜
−3制御で示されるパルスが出力される。
First, the operation of the timing control signal generation circuit 3 of the arithmetic unit 0 will be described. 3 is input to the AND circuits 32a to 32d of FIG. 3 as "1" and "0" is input to the AND circuit 32e. Output (R13-0 control)
Have count values of the counter (Fc) of 1, 3 and 5
A pulse is output during a period in which AND of signal and signal SIG is taken. Similarly, the AND circuits 32b and 32c and the OR circuit 31e have R13-1 to R13-1 shown in FIG.
-3 control is output.

【0034】また、演算器0以外の演算器は、前述した
ように、「+演算器0」に「0」,「−演算器0」に
「1」が入力されるため、アンド回路32a〜cに対応
する出力(R13−0〜−2)にはパルスが送出され
ず、オア回路31eのみにカウンタ(Fc)のカウント
値2〜6の期間「1」のR13−3制御で示すパルスを
出力する。
As described above, the operation units other than the operation unit 0 receive "0" to the "+ operation unit 0" and "1" to the "-operation unit 0". No pulse is sent to the output (R13-0 to R13-2) corresponding to c, and only the OR circuit 31e outputs a pulse indicated by the R13-3 control in the period "1" of the count value 2 to 6 of the counter (Fc). Output.

【0035】また、レジスタR7bへの制御信号R7b
制御は全ての演算器でカウンタ(Fc)のカウント値が
1〜7まで「1」が出力される。このようにして発生さ
れたR13−0〜−3制御信号はタイミング切替回路A
4に入力され、前述したようにレジスタR13へのデー
タライトタイミングを2倍にして動作させ、また、R7
b制御信号はタイミング切替回路B7に入力され、前述
したようにレジスタR7bへのデータライトタイミング
を2倍にして動作させる。
The control signal R7b to the register R7b
In control, "1" is output from 1 to 7 in the count value of the counter (Fc) in all the arithmetic units. The R13-0 to -3 control signals generated in this manner are transmitted to the timing switching circuit A.
4, the data write timing to the register R13 is doubled as described above, and the operation is performed.
The b control signal is input to the timing switching circuit B7, and operates by doubling the data write timing to the register R7b as described above.

【0036】また、セレクタ信号発生回路6では、カウ
ンタ(Fc)のカウント値が演算器の番号nに対応する
値と一致したときSR−FF62がセットされ、図6で
示すカウンタ62が倍クロックでカウントを開始する。
したがって、例えば、演算器3のセレクタ信号発生回路
6はカウンタ(Fc)2のカウント値が1よりカウント
を倍クロックで開始し、カウント値が5で停止する。ま
た、カウンタ(Fc)のカウント値が7のときリセット
されて0となる。カウンタ63より出力されるS3制御
信号はセレクタ切替回路7に入力され、セレクタS3を
高速で対応する番号の端子をセレクトし、レジスタR7
bへデータを出力する。
In the selector signal generating circuit 6, when the count value of the counter (Fc) coincides with the value corresponding to the arithmetic unit number n, the SR-FF 62 is set, and the counter 62 shown in FIG. Start counting.
Therefore, for example, the selector signal generation circuit 6 of the arithmetic unit 3 starts counting with a double clock when the count value of the counter (Fc) 2 is 1, and stops when the count value is 5. Also, when the count value of the counter (Fc) is 7, it is reset to 0. The S3 control signal output from the counter 63 is input to the selector switching circuit 7, and the selector S3 selects the terminal of the corresponding number at high speed, and
Output data to b.

【0037】以上説明した動作が行なわれることによ
り、従来例では図13に示すように時間T9 〜T22まで
要した各演算より演算器0へのデータ転送が、図8で示
すように時間T9 〜T14で完了し、処理時間を非常に短
かくすることができる。なお、以上説明した実施例にお
いては演算器の数を4個としたが、個数を4個と限定す
るものではなく、本発明は複数個の演算器に適用され
る。
By performing the operation described above, in the conventional example, the data transfer to the arithmetic unit 0 from each operation required from time T 9 to time T 22 as shown in FIG. complete with T 9 through T 14, it can be very short processing time. Although the number of arithmetic units is four in the embodiment described above, the number is not limited to four, and the present invention is applied to a plurality of arithmetic units.

【0038】また、以上、本発明の一実施例について説
明したが、本発明はこの実施例に限定されるものではな
く、その発明の主旨に従った各種変形が可能である。
Although one embodiment of the present invention has been described above, the present invention is not limited to this embodiment, and various modifications in accordance with the gist of the invention are possible.

【0039】[0039]

【発明の効果】以上説明したように、本発明によれば次
の効果が得られる。CPUからの特定命令によって、後
段の演算器より前段の演算器へのデータ転送に関与する
レジスタおよびセレクタが高速で動作するため、データ
転送時間を非常に短かくすることができる。
As described above, according to the present invention, the following effects can be obtained. The register and the selector involved in the data transfer to the operation unit at the preceding stage from the operation unit at the subsequent stage operate at high speed by the specific instruction from the CPU, so that the data transfer time can be made very short.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の原理図である。FIG. 1 is a principle diagram of the present invention.

【図2】本発明の一実施例の構成図である。FIG. 2 is a configuration diagram of one embodiment of the present invention.

【図3】同実施例のタイミング制御信号発生回路の具体
例である。
FIG. 3 is a specific example of a timing control signal generation circuit of the embodiment.

【図4】同実施例のタイミング切替回路Aの具体例であ
る。
FIG. 4 is a specific example of a timing switching circuit A of the embodiment.

【図5】同実施例のタイミング切替回路Bの具体例であ
る。
FIG. 5 is a specific example of a timing switching circuit B of the embodiment.

【図6】同実施例のセレクト信号発生回路の具体例であ
る。
FIG. 6 is a specific example of a select signal generation circuit of the embodiment.

【図7】同実施例のセレクタ切替回路の具体例である。FIG. 7 is a specific example of the selector switching circuit of the embodiment.

【図8】同実施例の動作タイミングチャートである。FIG. 8 is an operation timing chart of the embodiment.

【図9】同実施例のタイミングチャートである。FIG. 9 is a timing chart of the embodiment.

【図10】本発明および従来例が適用されるベクトル演
算処理装置の構成図である。
FIG. 10 is a configuration diagram of a vector operation processing device to which the present invention and a conventional example are applied.

【図11】ベクトルレジスタの具体例である。FIG. 11 is a specific example of a vector register.

【図12】従来例の演算器の構成図である。FIG. 12 is a configuration diagram of a conventional arithmetic unit.

【図13】従来の動作タイミングチャートである。FIG. 13 is a conventional operation timing chart.

【図14】従来例の演算器構成案である。FIG. 14 is a configuration diagram of a conventional arithmetic unit.

【符号の説明】[Explanation of symbols]

100 タイミング切替手段A 101 タイミング切替手段B102 セレクタ切替手段 1 算術論理ユニット(ALU) 2 カウンタ(Fc) 3 タイミング制御信号発生回路 4 タイミング切替回路A 5 タイミング切替回路B 6 セレクト信号発生回路 7 セレクタ切替回路 11 演算器 12 専用バス 13 ベクトルレジスタ 14 システムバス 15 プロセッサ(CPU) 31,42,52,72 オア回路 32,41,51,61,71 アンド回路 62 RSフリップフロップ(RS−FF) 63 カウンタ 64 5デコーダ R13,R14,R24,R5,R6,R7,FR,T
R レジスタ S1,S2,S3 セレクタ
REFERENCE SIGNS LIST 100 timing switching means A 101 timing switching means B 102 selector switching means 1 arithmetic logic unit (ALU) 2 counter (Fc) 3 timing control signal generating circuit 4 timing switching circuit A 5 timing switching circuit B 6 select signal generating circuit 7 selector switching Circuit 11 Operation unit 12 Dedicated bus 13 Vector register 14 System bus 15 Processor (CPU) 31, 42, 52, 72 OR circuit 32, 41, 51, 61, 71 AND circuit 62 RS flip-flop (RS-FF) 63 Counter 64 5 decoders R13, R14, R24, R5, R6, R7, FR, T
R register S1, S2, S3 selector

Claims (2)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 少なくとも、ベクトルレジスタからの第
1のオペランドを入力するレジスタ(R13)を設け、
前記レジスタ(R13)をm分割したレジスタのそれぞ
れに後段の演算器からのkバイトデータの入力を可能と
し、第2のオペランドと前記レジスタ(R13)とのデ
ータに対する演算結果を受取るレジスタ(R6)と、前
記レジスタ(R6)のm分割されたデータと前記レジス
タ(R13)のkバイトデータのいずれかを選択するセ
レクタ(S3)と、前記レジスタ(R6)よりのk(m
−1)バイトデータを入力するレジスタ(R7a)と前
記セレクタ(S3)よりkバイトデータを入力するレジ
スタ(R7b)に分割して構成されるレジスタ(R7)
とを備えた演算器を複数個有するベクトル演算処理装置
において、 特定命令によって、 前記レジスタ(R13)を動作させるクロックタイミン
グを高速のクロックタイミングに切替えるタイミング切
替手段A(100)と、 前記レジスタ(R7b)を動作させるクロックタイミン
グを高速のクロックタイミングに切替えるタイミング切
替手段B(101)と、 前記セレクタ(S3)を動作させるセレクト信号の生成
を高速のクロックタイミングに切替えて生成するセレク
タ切替手段(102)と、 を備えたことを特徴とするベクトル演算処理装置の演算
制御方式。
1. A register (R13) for inputting at least a first operand from a vector register,
A register (R6) that enables input of k-byte data from a subsequent-stage arithmetic unit to each of the registers obtained by dividing the register (R13) into m, and that receives a second operand and an operation result for the data in the register (R13). A selector (S3) for selecting one of the m-divided data of the register (R6) and the k-byte data of the register (R13); and k (m) from the register (R6).
-1) A register (R7) divided into a register (R7a) for inputting byte data and a register (R7b) for inputting k-byte data from the selector (S3).
In the vector processing unit having a plurality of computing units with bets by the particular instruction, and the timing switching means A (100) for switching the clock timing for operating the register (R13) in the high-speed clock timing, the register (R7b ), The timing switching means B (101) for switching the clock timing to the high-speed clock timing , and the generation of a select signal for operating the selector (S3).
And a selector switching means (102) for generating by switching to a high-speed clock timing .
【請求項2】 前記特定命令が、各演算器のデータを最2. The method according to claim 1, wherein the specific instruction updates data of each arithmetic unit
前段の演算器へ転送させる命令であることを特徴とするIt is a command to be transferred to the preceding computing unit
請求項1記載のベクトル演算処理装置の演算制御方式。An arithmetic control method for the vector arithmetic processing device according to claim 1.
JP3201739A 1991-08-12 1991-08-12 Arithmetic control method of vector arithmetic processing unit Expired - Fee Related JP2771912B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3201739A JP2771912B2 (en) 1991-08-12 1991-08-12 Arithmetic control method of vector arithmetic processing unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3201739A JP2771912B2 (en) 1991-08-12 1991-08-12 Arithmetic control method of vector arithmetic processing unit

Publications (2)

Publication Number Publication Date
JPH0546655A JPH0546655A (en) 1993-02-26
JP2771912B2 true JP2771912B2 (en) 1998-07-02

Family

ID=16446139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3201739A Expired - Fee Related JP2771912B2 (en) 1991-08-12 1991-08-12 Arithmetic control method of vector arithmetic processing unit

Country Status (1)

Country Link
JP (1) JP2771912B2 (en)

Also Published As

Publication number Publication date
JPH0546655A (en) 1993-02-26

Similar Documents

Publication Publication Date Title
US5226171A (en) Parallel vector processing system for individual and broadcast distribution of operands and control information
EP0054243A2 (en) Memory controlling apparatus
US4228498A (en) Multibus processor for increasing execution speed using a pipeline effect
US3997771A (en) Apparatus and method for performing an arithmetic operation and multibit shift
JPH05108341A (en) Microprocessor
JPH1083303A (en) Electronic circuit and method for using coprocessor
JP2752634B2 (en) Sorting device
JP2771912B2 (en) Arithmetic control method of vector arithmetic processing unit
US6584514B1 (en) Apparatus and method for address modification in a direct memory access controller
JP2577071B2 (en) Digital signal processor
US6715058B1 (en) Apparatus and method for a sorting mode in a direct memory access controller of a digital signal processor
JP2812610B2 (en) Pipeline control method
JPH0738155B2 (en) Digital multiplication execution method and apparatus
JPH04326426A (en) Instruction decoding circuit
JPH0267665A (en) Interface circuit
JP2982129B2 (en) Micro program controller
JP2821176B2 (en) Information processing device
JPH0364886B2 (en)
JPH06301641A (en) Electronic computer
JPH02244329A (en) Digital signal processor
JPH05165875A (en) Vector arithmetic processor
JPH0520063A (en) Address calculation device for integrated circuit microprocessor
JPH0467661B2 (en)
JPH0646399B2 (en) Digital signal processing circuit
JPS5985546A (en) Data transfer control system

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19980317

LAPS Cancellation because of no payment of annual fees