JPH0744532A - Vector processing device - Google Patents

Vector processing device

Info

Publication number
JPH0744532A
JPH0744532A JP34278091A JP34278091A JPH0744532A JP H0744532 A JPH0744532 A JP H0744532A JP 34278091 A JP34278091 A JP 34278091A JP 34278091 A JP34278091 A JP 34278091A JP H0744532 A JPH0744532 A JP H0744532A
Authority
JP
Japan
Prior art keywords
data
vector
register
output
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP34278091A
Other languages
Japanese (ja)
Inventor
Yoshiki Senoo
義樹 妹尾
Kiyoshi Asai
浅井  清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Japan Atomic Energy Agency
Original Assignee
Japan Atomic Energy Research Institute
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Atomic Energy Research Institute, NEC Corp filed Critical Japan Atomic Energy Research Institute
Priority to JP34278091A priority Critical patent/JPH0744532A/en
Publication of JPH0744532A publication Critical patent/JPH0744532A/en
Priority to US08/465,902 priority patent/US5553309A/en
Pending legal-status Critical Current

Links

Landscapes

  • Advance Control (AREA)
  • Complex Calculations (AREA)

Abstract

PURPOSE:To enhance the efficiency of the vector processing by selecting vector data read from a vector register so as to apply compression processing to selected data at once. CONSTITUTION:The device is provided with a data selection circuit 5 reading contents of a mask register 4 and an input vector register 1 one by one element and selecting data of the input vector register 1 to an output vector register 2 or 3 depending whether the data read from the mask register 4 is 1 or 0, and compression circuits 6, 7 compressing the selected data, a counter circuit 8 simultaneously counting number of elements counting number of 1s or Os of the data from the mask register 4 and scalar registers 9, 10 storing the output data.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、ベクトル演算方式の大
型情報処理装置などに使用されるベクトル処理装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a vector processing device used in a large-scale information processing device of vector operation type.

【0002】[0002]

【従来の技術】従来、この種のベクトル処理装置は以下
に述べる処理を行っている。たとえば複数の粒子の振る
舞いをシミュレーションするモンテカルロコードにおい
ては、図2に示すようなプログラムの粒子分類処理が頻
出する。プログラムの記法はFORTRAN言語に基づ
いている。この処理は、1からNのIに対してM(I)
が正の値か否かによってA(I)を配列Bと配列Cに分
類するものである。この粒子分類処理は従来のベクトル
処理装置ではマスク演算とコンプレス(圧縮)演算によ
って処理されていた。この場合の処理の流れを図5,6
により説明する。図5,6は従来例における処理のフロ
ーチャートである。
2. Description of the Related Art Conventionally, a vector processing device of this type performs the following processing. For example, in a Monte Carlo code that simulates the behavior of a plurality of particles, the particle classification process of a program as shown in FIG. 2 frequently appears. The notation of the program is based on the FORTRAN language. This process is M (I) for I from 1 to N.
A (I) is classified into array B and array C depending on whether or not is a positive value. In the conventional vector processing device, this particle classification process is performed by a mask calculation and a compression calculation. The processing flow in this case is shown in FIGS.
Will be described. 5 and 6 are flowcharts of processing in the conventional example.

【0003】(1)マスクの生成 M(I).GT.0
の論理式をベクトル演算により評価し、マスクレジスタ
にループの繰り返し毎の評価結果(真なら1、偽なら
0)を格納する。
(1) Mask Generation M (I). GT. 0
Is evaluated by vector operation, and the evaluation result (1 if true, 0 if false) for each loop iteration is stored in the mask register.

【0004】(2)コンプレス1 マスクレジスタの内
容が1に対応する入力ベクトルレジスタ1上のデータA
(I)をコンプレスし、出力ベクトルレジスタ2に格納
する。またマスクレジスタの1の個数を要素数カウント
命令によって求め、レジスタに格納する。またこのレジ
スタの値とJ1INITとを加算した値を、J1のメモ
リ位置にストアする。
(2) Compress 1 Data A on the input vector register 1 whose mask register content corresponds to 1
Compress (I) and store in output vector register 2. Further, the number of 1s in the mask register is obtained by the element number count instruction and stored in the register. The value obtained by adding the value of this register and J1INIT is stored in the memory location of J1.

【0005】(3)ストア1 上記レジスタの値をベク
トル長として、B(J1INIT+1)のメモリ番地を
先頭メモリ位置として、上記でコンプレスされたベクト
ルレジスタ上のデータをベクトルストアする。
(3) Store 1 With the value of the above register as the vector length and the memory address of B (J1INIT + 1) as the head memory location, the data in the above compressed vector register is vector-stored.

【0006】(4)マスクの反転 上記マスクレジスタ
を要素毎に反転する(1は0に、0は1に)。
(4) Inversion of mask The above mask register is inverted element by element (1 becomes 0, 0 becomes 1).

【0007】(5)コンプレス2 マスクレジスタの内
容が1に対応するベクトルレジスタ上のデータA(I)
をコンプレスし、出力ベクトルレジスタ3に格納する。
またマスクレジスタの1の個数を要素数カウント命令に
よって求め、レジスタに格納する。またこのレジスタの
値とJ1INITとを加算した値を、J1のメモリ位置
にストアする。
(5) Compress 2 The data A (I) in the vector register whose mask register content corresponds to 1
Is compressed and stored in the output vector register 3.
Further, the number of 1s in the mask register is obtained by the element number count instruction and stored in the register. The value obtained by adding the value of this register and J1INIT is stored in the memory location of J1.

【0008】(6)ストア2 (5)で求めたレジスタ
の値をベクトル長として、C(J1INIT+1)のメ
モリ番地を先頭メモリ位置として、(5)でコンプレス
されたベクトルレジスタ上のデータをベクトルストアす
る。ただし、ループ長Nの値がベクトル処理可能な最大
ベクトル長を越える場合には、N回のループ繰り返しを
最大ループ長以下の繰り返しを有する複数の操作に分割
して処理する必要がある。
(6) Store 2 With the value of the register obtained in (5) as the vector length and the memory address of C (J1INIT + 1) as the head memory position, the data in the vector register compressed in (5) is vectored. Store. However, when the value of the loop length N exceeds the maximum vector processable vector length, it is necessary to divide N loop iterations into a plurality of operations having iterations equal to or less than the maximum loop length for processing.

【0009】[0009]

【発明が解決しようとする課題】上記で説明した従来の
方法では、マスク反転処理、2回のコンプレス処理およ
び2回の要素数カウント処理が必要となるために、効率
の良いベクトル処理ができないという問題点がある。
In the conventional method described above, since the mask inversion process, the two compression processes and the two element number counting processes are required, efficient vector processing cannot be performed. There is a problem.

【0010】[0010]

【課題を解決するための手段】本発明におけるベクトル
処理装置は、入力オペランドデータを保持する複数の入
力ベクトルレジスタと、ベクトル演算を制御するマスタ
レジスタと、前記入力ベクトルレジスタの保持するベク
トルデータと前記マスタレジスタの保持するデータとを
1組みとして順次読み出しこれを前記マスタレジスタの
データが1であれば第1の出力データとして出力し前記
マスタレジスタのデータが0であれば第2の出力データ
として出力するデータ選択回路と、前記第1の出力デー
タを保持する第1の出力ベクトルレジスタと、前記第2
の出力データを保持する第2の出力ベクトルレジスタと
を備えている。
A vector processing device according to the present invention includes a plurality of input vector registers for holding input operand data, a master register for controlling vector operation, vector data held by the input vector register, and The data held by the master register is sequentially read as one set and is output as the first output data when the data of the master register is 1, and is output as the second output data when the data of the master register is 0. A data selection circuit, a first output vector register that holds the first output data, and a second output vector register
Second output vector register for holding the output data of

【0011】更に、読み出された前記マスタレジスタの
データが1あるいは0である回数をそれぞれ数えるカウ
ンタ回路を備えても良い。
Further, a counter circuit for counting the number of times that the data of the read master register is 1 or 0 may be provided.

【0012】[0012]

【作用】本発明のベクトル処理装置では、入力データを
保持する入力ベクトルレジスタ上のベクトルデータとマ
スクレジスタのデータを一組づつ順次読みだし、マスク
レジスタから読み出されたデータの値が1であれば第1
の出力ベクトルレジスタに、また0であれば第2の出力
ベクトルレジスタに上記ベクトルデータを選択して送出
するデータ選択回路を備えるため、例えばこの回路を用
いて図2に示すような形の粒子分類処理におけるTHE
N節の処理とELSE節の処理を同時に行なうことがで
きる。
In the vector processing device of the present invention, the vector data in the input vector register holding the input data and the data in the mask register are sequentially read one by one, and the value of the data read from the mask register is 1. If the first
2 is equipped with a data selection circuit for selecting and transmitting the above vector data to the output vector register of No. 2 and to the second output vector register if it is 0. For example, this circuit is used to classify particles as shown in FIG. THE in processing
The processing of the N clause and the processing of the ELSE clause can be performed simultaneously.

【0013】又、本願第1の発明におけるベクトル処理
装置ではベクトルレジスタ上に分類されたベクトルデー
タをストアするためのベクトル長を求めるために、マス
クレジスタ上の1あるいは0の数をカウントする処理を
別に行なう必要があるが、マスクレジスタから読み出さ
れたデータの1あるいは0の回数をそれぞれ数えるカウ
ンタ回路を付加することにより、このカウント処理をも
同時に行なうことができる。
Further, in the vector processing device according to the first invention of the present application, in order to obtain the vector length for storing the vector data classified in the vector register, a process of counting the number of 1s or 0s in the mask register is performed. Although it must be performed separately, this counting process can be performed at the same time by adding a counter circuit for counting the number of times 1 or 0 of the data read from the mask register.

【0014】[0014]

【実施例】次に、本発明の一実施例について図を参照し
て説明する。図1は本実施例の構成を示すブロック図で
ある。入力ベクトルレジスタ1は入力オペランドデータ
をベクトル長の個数だけ格納している。図2に示す例で
は入力オペランドは配列Aに相当する。出力ベクトルレ
ジスタ2と出力ベクトルレジスタ3は出力ベクトルデー
タをベクトル長の個数だけ格納している。図2に示す例
では出力ベクトルデータは、処理終了時に配列Bと配列
Cに格納すべきデータに相当する。マスクレジスタ4は
条件付きベクトル演算を制御するためのデータを保持す
るレジスタであり、0または1の1ビットデータをベク
トル長の個数だけ保持している。通常はマスクレジスタ
のi番目のビットデータはベクトルレジスタのi番目の
データに対する処理を制御するのに用いられる。
Next, an embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing the configuration of this embodiment. The input vector register 1 stores input operand data by the number of vector lengths. In the example shown in FIG. 2, the input operand corresponds to the array A. The output vector register 2 and the output vector register 3 store output vector data by the number of vector lengths. In the example shown in FIG. 2, the output vector data corresponds to the data to be stored in the arrays B and C at the end of the processing. The mask register 4 is a register that holds data for controlling conditional vector operation, and holds 1-bit data of 0 or 1 for the number of vector lengths. Normally, the i-th bit data of the mask register is used to control the processing on the i-th data of the vector register.

【0015】データ選択回路5は入力ベクトルレジスタ
1とマスクレジスタ4から、1クロックに1要素ずつの
データを受け取り、マスクレジスタ4から受け取ったビ
ットデータが1の場合にはコンプレス回路6にベクトル
レジスタ1から受け取ったデータを送出し、またマスク
レジスタ4から受け取ったビットデータが0の場合には
コンプレス回路7にベクトルレジスタ1から受け取った
データを送出する。コンプレス回路6は、分配器5から
受け取ったデータを出力ベクトルレジスタ2に送出する
とともに、受け取ったデータが連続して出力ベクトルレ
ジスタ2に格納されるように制御する。コンプレス回路
7は、データ選択回路5から受け取ったデータをベクト
ルレジスタ3に送出するとともに、受け取ったデータが
連続してベクトルレジスタ3に格納されるように制御す
る。
The data selection circuit 5 receives the data of one element per clock from the input vector register 1 and the mask register 4, and when the bit data received from the mask register 4 is 1, the compress circuit 6 receives the vector register. When the bit data received from the mask register 4 is 0, the data received from 1 is sent, and the data received from the vector register 1 is sent to the compress circuit 7. The compress circuit 6 sends the data received from the distributor 5 to the output vector register 2 and controls the received data to be continuously stored in the output vector register 2. The compress circuit 7 sends the data received from the data selection circuit 5 to the vector register 3 and controls the received data to be continuously stored in the vector register 3.

【0016】カウンタ回路8はマスクレジスタ4から1
クロックに1要素ずつビットデータをベクトル長の個数
だけ受け取り、値が1のビットデータを受け取った回数
をカウントしてレジスタ9に格納するとともに、値が1
のビットデータを受け取った回数をレジスタ10に格納
する。
The counter circuit 8 includes mask registers 4 to 1
The bit data is received for each element by the number of vector lengths for each clock, the number of times the bit data having a value of 1 is received is stored in the register 9 and the value is set to 1
The number of times of receiving the bit data of is stored in the register 10.

【0017】次に図1および図3,4を用いて、図2に
示す処理が実行される様子を説明する。初期条件とし
て、ベクトル長を保持する変数Nの値は10であり、M
(1)からM(10)までのそれぞれの値は次の通りで
あるとする。M(1)=3,M(2)=−2,M(3)
=−3,M(4)=1,m(5)=10,M(6)=
2,M(7)=−3,M(8)=2,M(9)=1,M
(10)=−2また、配列Aはベクトルレジスタ1にロ
ードされており、A(I)の値は入力ベクトルレジスタ
1の第I番目の要素として格納されているものとする。
Next, the manner in which the processing shown in FIG. 2 is executed will be described with reference to FIGS. As an initial condition, the value of the variable N holding the vector length is 10, and M
The respective values from (1) to M (10) are as follows. M (1) = 3, M (2) =-2, M (3)
= -3, M (4) = 1, m (5) = 10, M (6) =
2, M (7) =-3, M (8) = 2, M (9) = 1, M
(10) =-2 Further, it is assumed that the array A is loaded in the vector register 1 and the value of A (I) is stored as the I-th element of the input vector register 1.

【0018】(1)マスクの生成 配列Mの各要素を0
と比較し、0より大きければ1を、そうでなければ0を
マスクレジスタ4の対応する要素番号位置に格納する。
これは、一般にベクトル計算機では、配列Mのロード命
令とベクトル比較命令およびマスク生成命令によって実
現できる。
(1) Generation of mask Each element of the array M is set to 0
If it is larger than 0, 1 is stored. If not, 0 is stored in the corresponding element number position of the mask register 4.
In general, this can be realized in a vector computer by a load instruction of the array M, a vector comparison instruction, and a mask generation instruction.

【0019】(2)コンプレス 次に入力ベクトルレジ
スタ1に格納された配列Aのデータとマスクレジスタ4
に格納されたビットデータを1要素ずつデータ選択回路
5に送出し、データ選択回路5は送出されたビットデー
タが1ならばコンプレス回路6へ、ビットデータが0な
らばコンプレス回路7へベクトルレジスタ1から受け取
ったデータを送出する。コプレス回路6とコンプレス回
路7はデータ選択回路5から受け取ったデータを出力ベ
クトルレジスタ2及び出力ベクトルレジスタ3へそれぞ
れ送出するとともに、データ選択回路5から受け取った
データが出力ベクトルレジスタ2及び出力ベクトルレジ
スタ3上で連続して格納されるように出力ベクトルレジ
スタ2,3を制御する。この制御は、たとえば、コンプ
レス回路6,7それぞれが、ベクトルレジスタに次に書
き込むデータ位置をデータ選択回路5からデータが送出
されたときだけ1インクリメントすることにより保持
し、データ送出と同時にベクトルレジスタの書き込み位
置を出力ベクトルレジスタ2,3にそれぞれ送出するこ
とにより行なうことができる。または、カウンタ回路8
を有する場合には、上記ベクトルレジスタ制御用のカウ
ンタと、カウンタ回路8を同一回路で共用することも可
能である。以上に述べた処理により出力ベクトルレジス
タ2,3にデータが生成される。
(2) Compress Next, the data of the array A stored in the input vector register 1 and the mask register 4
The bit data stored in 1 is sent to the data selection circuit 5 one element at a time. The data selection circuit 5 sends to the compress circuit 6 if the sent bit data is 1, and to the compress circuit 7 if the bit data is 0. The data received from the register 1 is transmitted. The compress circuit 6 and the compress circuit 7 send the data received from the data selection circuit 5 to the output vector register 2 and the output vector register 3, respectively, and the data received from the data selection circuit 5 are the output vector register 2 and the output vector register. The output vector registers 2 and 3 are controlled so as to be stored consecutively on the output vector register 3. This control is held by, for example, each of the compress circuits 6 and 7 incrementing the data position to be written next to the vector register by 1 only when the data is sent from the data selecting circuit 5, and at the same time as sending the data. This can be done by sending the writing positions of the above to the output vector registers 2 and 3, respectively. Alternatively, the counter circuit 8
In the case of having the above, it is possible to share the counter for controlling the vector register and the counter circuit 8 in the same circuit. Data is generated in the output vector registers 2 and 3 by the processing described above.

【0020】(3)要素数のカウント カウンタ回路8
を備えたベクトル処理装置においては、以上に述べた処
理と同時に、すなわちデータ選択回路5にマスクレジス
タ4から1要素づつマスクデータを送出するのと同時に
このマスクデータをカウンタ回路8にも送出する。カウ
ンタ回路8はデータ選択回路5から送出された値が1の
データの数と、値が0のデータの数をそれぞれカウント
し、ベクトル長Nの個数のマスクデータが送出された時
点で、それぞれのカウント値をレジスタ9とレジスタ1
0に格納する。
(3) Counting the number of elements Counter circuit 8
In the vector processing device having the above, the mask data is sent to the counter circuit 8 at the same time as the above-described processing, that is, at the same time as the mask data is sent from the mask register 4 to the data selection circuit 5 one element at a time. The counter circuit 8 counts the number of pieces of data having a value of 1 and the number of pieces of data having a value of 0 transmitted from the data selection circuit 5, and when the mask data of the vector length N is transmitted, Count value to register 9 and register 1
Store in 0.

【0021】又、カウンタ回路8を備えていないベクト
ル処理装置においては、マスクレジスタの1の値の数を
カウントするベクトル命令を用いて、ベクトルレジスタ
2の有効ベクトル長を求め、またベクトルレジスタ1の
有効ベクトル長Nの値を保持するレジスタの値から上記
ベクトルレジスタ2の有効ベクトル長を減算することに
よりベクトルレジスタ3の有効ベクトル長を求め、求め
た2つの有効ベクトル長をレジスタ9とレジスタ10に
格納することによりこの処理を行なうことができる。
Further, in the vector processing device which is not provided with the counter circuit 8, the effective vector length of the vector register 2 is obtained by using the vector instruction for counting the number of 1 values in the mask register, and the vector register 1 The effective vector length of the vector register 3 is obtained by subtracting the effective vector length of the vector register 2 from the value of the register holding the value of the effective vector length N, and the obtained two effective vector lengths are stored in the registers 9 and 10. This processing can be performed by storing.

【0022】(4)ストア1,(5)ストア2 レジス
タ9の数をベクトル長として、ベクトルレジスタ2の値
を配列Bの先頭アドレスをストア開始メモリ位置として
ベクトルストアし、またレジスタ10の値をベクトル長
として、ベクトルレジスタ3の値を配列Cの先頭アドレ
スをストア開始メモリ位置としてベクトルストアするこ
とによりこのストア処理を行なうことができる。
(4) Store 1, (5) Store 2 The number of registers 9 is used as the vector length, the value of the vector register 2 is vector-stored with the start address of the array B as the store start memory position, and the value of the register 10 is stored. This store processing can be performed by vector-storing the value of the vector register 3 as the vector length with the start address of the array C as the store start memory position.

【0023】(6)J1,J2のストア 最後に、レジ
スタ9の値とJ1INITの値を加算し、これをJ1に
ストアし、またレジスタ10の値とL2INITの値を
加算し、これをJ2にストアすることにより、図2に示
す処理が完了する。ただし、ループ長Nの値がベクトル
処理可能な最大ベクトル長を越える場合には、N回のル
ープ繰り返しを最大ループ長以下の繰り返しを有する複
数の操作に分割して処理する必要がある。
(6) Storing J1 and J2 Finally, the value of register 9 and the value of J1INIT are added and stored in J1, and the value of register 10 and the value of L2INIT are added and this is stored in J2. By storing, the process shown in FIG. 2 is completed. However, when the value of the loop length N exceeds the maximum vector processable vector length, it is necessary to divide N loop iterations into a plurality of operations having iterations equal to or less than the maximum loop length for processing.

【0024】[0024]

【発明の効果】以上説明したように、本発明は、ベクト
ルデータを選別し選別したそれぞれのデータを同時にコ
ンプレス処理しているので、従来のコンプレス処理に比
べて2倍の高速化が実現できる効果がある。又、カウン
タ回路を備えれば要素長カウントも同時に行うことがで
きるので同様に高速化ができる効果がある。
As described above, according to the present invention, the vector data is selected and the selected data are simultaneously compressed. Therefore, the speed can be doubled as compared with the conventional compression processing. There is an effect that can be done. Further, if the counter circuit is provided, the element length can be counted at the same time, so that the speed can be similarly increased.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の構成を示すブロック図であ
る。
FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention.

【図2】一処理例のプログラム図である。FIG. 2 is a program diagram of a processing example.

【図3】本発明の一実施例の処理手順を示すフローチャ
ートである。
FIG. 3 is a flowchart showing a processing procedure of an embodiment of the present invention.

【図4】本発明の一実施例の処理手順を示すフローチャ
ートである。
FIG. 4 is a flowchart showing a processing procedure of an embodiment of the present invention.

【図5】従来例の処理手順を示すフローチャートであ
る。
FIG. 5 is a flowchart showing a processing procedure of a conventional example.

【図6】従来例の処理手順を示すフローチャートであ
る。
FIG. 6 is a flowchart showing a processing procedure of a conventional example.

【符号の説明】[Explanation of symbols]

1 入力ベクトルレジスタ 2,3 出力ベクトルレジスタ 4 マスクレジスタ 5 データ選択回路 6,7 コンプレス回路 8 カウンタ回路 9,10 スカラレジスタ 1 Input vector register 2, 3 Output vector register 4 Mask register 5 Data selection circuit 6, 7 Compress circuit 8 Counter circuit 9, 10 Scalar register

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 入力オペランドデータを保持する複数の
入力ベクトルレジスタと、ベクトル演算を制御するマス
タレジスタと、前記入力ベクトルレジスタの保持するベ
クトルデータと前記マスタレジスタの保持するデータと
を1組みとして順次読み出しこれを前記マスタレジスタ
のデータが1であれば第1の出力データとして出力し前
記マスタレジスタのデータが0であれば第2の出力デー
タとして出力するデータ選択回路と、前記第1の出力デ
ータを保持する第1の出力ベクトルレジスタと、前記第
2の出力データを保持する第2の出力ベクトルレジスタ
とを備えることを特徴とするベクトル処理装置。
1. A plurality of input vector registers for holding input operand data, a master register for controlling a vector operation, vector data held by the input vector register and data held by the master register as one set in sequence. A data selection circuit that outputs this as first output data if the data in the master register is 1 and outputs it as second output data if the data in the master register is 0; and the first output data. And a second output vector register that holds the second output data, the vector processing device.
【請求項2】 読み出された前記マスタレジスタのデー
タが1あるいは0である回数をそれぞれ数えるカウンタ
回路を備えることを特徴とする請求項1記載のベクトル
処理装置。
2. The vector processing device according to claim 1, further comprising a counter circuit that counts the number of times that the read data of the master register is 1 or 0, respectively.
JP34278091A 1991-11-08 1991-12-25 Vector processing device Pending JPH0744532A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP34278091A JPH0744532A (en) 1991-12-25 1991-12-25 Vector processing device
US08/465,902 US5553309A (en) 1991-11-08 1995-06-06 Device for high speed evaluation of logical expressions and high speed vector operations

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34278091A JPH0744532A (en) 1991-12-25 1991-12-25 Vector processing device

Publications (1)

Publication Number Publication Date
JPH0744532A true JPH0744532A (en) 1995-02-14

Family

ID=18356443

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34278091A Pending JPH0744532A (en) 1991-11-08 1991-12-25 Vector processing device

Country Status (1)

Country Link
JP (1) JPH0744532A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015534189A (en) * 2012-09-28 2015-11-26 インテル・コーポレーション Instruction to shift multiple bits to the left and pull multiple 1s into multiple lower bits

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015534189A (en) * 2012-09-28 2015-11-26 インテル・コーポレーション Instruction to shift multiple bits to the left and pull multiple 1s into multiple lower bits
JP2017107587A (en) * 2012-09-28 2017-06-15 インテル・コーポレーション Instruction for shifting bits left with pulling ones into less significant bits

Similar Documents

Publication Publication Date Title
US10372653B2 (en) Apparatuses for providing data received by a state machine engine
CN108256164B (en) Boolean logic in a state machine lattice
US9535861B2 (en) Methods and systems for routing in a state machine
US9665083B2 (en) Counter operation in a state machine lattice
US10671295B2 (en) Methods and systems for using state vector data in a state machine engine
US20150324129A1 (en) Results generation for state machine engines
US20070038842A1 (en) Data recording processor and method for use in an active memory device
US11580397B2 (en) Tensor dropout using a mask having a different ordering than the tensor
US9570125B1 (en) Apparatuses and methods for shifting data during a masked write to a buffer
US11328209B1 (en) Dual cycle tensor dropout in a neural network
JPH0744532A (en) Vector processing device
JPH06103225A (en) Chain type dma system and dma controller therefor
JPH01284926A (en) Instruction reading system for arithmetic unit
JPH02240784A (en) Data driven data processor
JPH04264620A (en) Status protection circuit using ram
JPS59173874A (en) Vector processor
JPH0683859A (en) Vector processor
JPH03233779A (en) Logical simulation circuit