JPH036663A - ベクトルデータ処理方式 - Google Patents

ベクトルデータ処理方式

Info

Publication number
JPH036663A
JPH036663A JP14042689A JP14042689A JPH036663A JP H036663 A JPH036663 A JP H036663A JP 14042689 A JP14042689 A JP 14042689A JP 14042689 A JP14042689 A JP 14042689A JP H036663 A JPH036663 A JP H036663A
Authority
JP
Japan
Prior art keywords
register
vector
address
vector data
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP14042689A
Other languages
English (en)
Inventor
Yutaka Murata
裕 村田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP14042689A priority Critical patent/JPH036663A/ja
Publication of JPH036663A publication Critical patent/JPH036663A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、高速演算処理のひとつであるベクトル演算
器を用いたベクトルデータ処理方式に関するものである
〔従来の技術〕
第4図は例えば“日経エレクトロニクスNO,312p
p、 131−155.1983.4.11 ”に示さ
れた構成に基づ〈従来のベクトル演算装置を表す図であ
る。図において、1は演算の対象となるベクトルデータ
や演算結果のベクトルデータを格納するベクトル・レジ
スタであり、この例では32語×64ビットのレジスタ
群が256組用意されている。それぞれのレジスタ群は
、独立にベクトル演算器(図においては算術/論理演算
器2として示されている)の人力用レジスタとしても、
演算器からの出力用レジスタとしても使用可能である。
2はベクトル・レジスタ1から読み出したベクトルデー
タに対して図示しない制御回路から指定された演算を施
す算術/論理演算器である。3はベクトル・レジスタ1
に格納されている個々のデータに対して演算を実行する
かしないかを指定する情報を保持するマスク・レジスタ
である。4はマスク・レジスタ3間の演算を行うマスク
演算器である第5図は、第4図に示されたベクトル演算
装置においてマスク・レジスタの内容によりベクトル・
レジスタ間の演算が制御される様子を示す図である。図
において、31はマスク・レジスタ、101および11
1は演算器入力用ベクトル・レジスタ、121は演算結
果格納用のベクトル・レジスタである。この例では、そ
れぞれ6個ずつのベクトルデータと個々のベクトルデー
タに対応した6ビツトのマスク・レジスタが示されてい
る。
斜線はそのベクトルデータに対する演算結果がベクトル
・レジスタC(121)に格納されることを表している
。第5図で示したような演算の形態を“マスク付き演算
°と呼び、この様な演算を行うマスク付き演算命令が用
意されている。
第6図は、第4図に示されたベクトル演算装置において
マスク・レジスタの内容により演算対象に指定されたベ
クトルデータのみを収集し、演算を施した後所定のベク
トル・レジスタの位置に結果を格納する様子を示す図で
ある。図において、102.112はそれぞれ演算対象
となるベクトルデータを格納し、かつ演算器への入力用
となるベクトル・レジスタ、122は演算結果のベクト
ルデータを格納するベクトル・レジスタである。
ベクトル・レジスタA(101ンおよびベクトル・レジ
スタB(111)からマスク・レジスタ31の内容で演
算対象に指定されたベクトルデータのみをベクトル・レ
ジスタA’ (102)およびベクトル・レジスタB”
(112)に移動させる収集命令と、ベクトル・レジス
タC’(122)に得られた演算結果をマスク・レジス
タ31の内容にしたがってベクトル・レジスタC(12
1)の所定の位置に書き戻す拡散命令が用意されている
次に動作について説明する。
ベクトル演算器を用いる場合、通常、プログラム内に存
在するDo小ループ部分をベクトル命令に置き換え(ベ
クトル化と言う)、ベクトルデータに対してパイプライ
ン的に同一の演算を施すことにより高速な演算を可能と
している。しかしDOループ内に条件分岐命令が存在す
ると、個々のループ毎に制御が異なるため、このループ
に対して全て同一の演算を行うような単純なベクトル化
は不可能となる。したがって、条件分岐命令を含むDO
ループでもベクトル化を可能とするため、第4図に示す
ようにマスク・レジスタ3が用意されている。
ベクトル・レジスタ内の個々の要素に対する演算の実行
/非実行をあらかじめ算術/論理演算器2またはマスク
演算器4で求めておき、その結果をマスク・レジスタ3
へ設定しておく。マスク・レジスタ3への値の設定には
様々な方法があるが、例として以下のものをあげること
ができる。
■ふたつのベクトル・レジスタ内の個々の要素ごとに算
術/論理演算器2で大小比較を行い、その結果をマスク
・レジスタ3の対応するビット位置にセットする。
■マスク・レジスタ3の値に対してマスク演算器4で論
理操作をほどこし、その結果をマスク・レジスタ3の対
応するビット位置にセットする。
第5図および第6図は、条件分岐命令を含むDo小ルー
プベクトル化するために、マスク・レジスタを用いた例
を示している。例ではマスク・レジスタ31は6ビツト
構成のものが示されておリ、その内容は100110で
ある。これは、演算に使用するベクトル・レジスタA(
101)およびベクトル・レジスタB(111)のそれ
ぞれ第1.第4、第5番目の要素が実際の演算対象であ
ることを表し、また、その演算結果が結果を格納するベ
クトル・レジスタC(121)の第1.第4.第5番目
の位置に格納されることを表している。
第5図はマスク付き演算の例である。マスク付き演算で
は、ベクトル・レジスタA(101)およびベクトル・
レジスタB(111)に格納されたベクトルデータを先
頭から1要素ずつ取り出して順次算術/論理演算器(第
5図では図示していない)に送出し、演算を行う。この
とき、演算対象のベクトル・レジスタの要素に対応する
マスク・レジスタのビットを検査して、ビットが“1”
であれば演算結果をベクトル・レジスタC(121)の
対応する要素位置に格納し、ビットが“0”であればベ
クトル・レジスタC(12Dへの格納は行わない。
これにより、ベクトル・レジスタの全要素に対して演算
を行うにもかかわらず、マスク・レジスタ31のビット
に1”が立っている位置に対応するベクトル・レジスタ
の要素についてのみ演算を施したことと等価になる。
第6図は収集/拡散命令を用いた演算実行の例であり、
最終的にベクトル・レジスタC(121)に得られる結
果は第5図のマスク付き演算の場合と同一である。まず
、収集命令によりマスク・レジスタのビットに1”が立
っている位置に対応するベクトル・レジスタA(101
)、ベクトル・レジスタB(111)の要素をそれぞれ
ベクトル・レジスタA’ (102ン、ベクトル・レジ
スタB’(112)に収集する。これにより、ベクトル
・レジスタA。
(102)およびベクトル・レジスタB’(112)の
全ての要素は算術/論理演算器(第6図では図示しない
)での演算の対象になる。次に、演算命令によりベクト
ル・レジスタA’(102)およびベクトル・レジスタ
B’(112)の全要素に対して順次演算を行い結果を
ベクトル・レジスタC”(122)に格納していく。更
に、ベクトル・レジスタC゛(122’)に求まった演
算結果を、拡散命令によりマスク・レジスタのビットに
′1”が立っている位置に対応するベクトル・レジスタ
C(121)のワード位置に拡散して格納する。マスク
付き演算では、ベクトル・レジスタ内の全要素に対して
演算実行を施したのに対して、演算命令と収集/拡散命
令を組み合わせて使用することにより、実際に演算対象
となるベクトルデータに対してのみ演算を施すことにな
るので、演算実行の高速化が図れる。
〔発明が解決しようとする課題〕
従来のベクトル演算装置は以上のように構成されている
ので、条件分岐命令を含むDoループをベクトル化した
際の演算実行には、本来の演算実行の対象となるベクト
ルデータに対する演算以外に余分な操作が必要となり、
演算実行性能低下の要因となっていた。具体的には、マ
スク付き演算の場合と収集/拡散命令を用いる場合につ
いて以下のような課題があった。
■マスク付き演算の場合 マスク付き演算では個々のベクトルデータに対する演算
の実行/不実行はマスク・レジスタの指定にしたがって
演算結果をベクトル・レジスタに格納するかしないかを
選択することにより制御される。したがって、不実行と
指定されているベクトルデータに対しても実際には演算
を行っている。
条件分岐の結果演算が不実行となるベクトルデータが多
いほど演算器における無駄な演算が増え、演算実行性能
が低下する。
■収集/拡散命令を用いる場合 収集/拡散命令を用いる場合はマスク付き演算のように
不実行と指定されるベクトルデータに対する演算は行わ
れないので、演算器の使用効率が向上しマスク付き演算
での欠点を解消できる。しかし、演算命令に先立って収
集命令を、また、演算命令の次に拡散命令を実行する必
要があるためこれらの命令実行の要する時間がオーバー
ヘッドとして生ずる。
この発明は上記のような課題を解消するためになされた
ものであり、条件分岐命令を含むDOルプをベクトル化
した際にもオーバーヘッドの少ない効率的な演算を可能
とし、高速な演算を行うことができるベクトルデータ処
理方式を得ることを目的とする。
〔課題を解決するための手段〕
この発明に係るベクトルデータ処理方式は、マスク・レ
ジスタ3に格納する演算実行制御データの内容を判定す
るマスク判定回路51と、このマスク判定回路51の判
定結果に基づいてベクトル・レジスタ1内の演算に使用
するベクトルデータの要素数をカウントする要素数カウ
ンタ52と、その判定結果に基づいて演算に使用するベ
クトルデータのうち隣り合うベクトルデータ同士の相対
的な距離をカウントする距離カウンタ53と、その判定
結果に基づいて距離カウンタ53の内容を蓄積していく
アドレス距離レジスタ55と、ベクトル・レジスタ1を
アクセスしたアドレスを格納するベクトル・アドレス・
レジスタ6と、このベクトル・アドレス・レジスタ6の
内容とアドレス距離レジスタ55の内容とを加算するア
ドレス加算器7とを備え、アドレス加算器7の加算結果
をアドレスとしてベクトル・レジスタl内で離散的に配
置されたベクトルデータを連続的にアクセスし、これら
のベクトルデータを連続的に演算器2へ°供給し、この
演算器2の演算結果をベクトル・レジスタ1内の離散的
な位置へ格納することを特徴とするものである。
〔作用〕
マスク判定回路51はマスク・レジスタ3に格納する演
算実行制御データの内容を判定する。要素数カウンタ5
2はマスク判定回路510判定結果に基づいてベクトル
・レジスタ1内の演算に使用するベクトルデータの要素
数をカウントする。
距離カウンタ53は上記と同じ判定結果に基づいて演算
に使用するベクトルデータのうち隣り合うベクトルデー
タ同士の相対的な距離をカウントする。アドレス距離レ
ジスタ55は上記と同じ判定結果に基づいて距離カウン
タ53の内容を蓄積していく。ベクトル・アドレス・レ
ジスタ6はベクトル・レジスタ1をアクセスしたアドレ
スを格納する。アドレス加算器7はベクトル・アドレス
・レジスタ6の内容とアドレス距離レジスタ55の内容
とを加算する。このような構成により、ベクトル・レジ
スタ1内で離散的に配置されたベクトルデータは、アド
レス加算器7の加算結果をアドレスとして連続的にアク
セスされ、演算器2へ連続的に供給される。そして演算
器2の演算結果はベクトル・レジスタl内の離散的な位
置に格納される。
(発明の実施例〕 第1図はこの発明の一実施例に係るベクトルデータ処理
方式を採用したベクトル演算装置の構成を示すブロック
図であり、第4図に示す構成要素に対応するものには同
一の符号を付し、その説明を省略する。第1図において
、5はマスク・レジスタ3に設定するデータに基づいて
ベクトル・レジスタ1のアドレスに対する演算実行制御
データを生成するマスク制御部、6はベクトル・レジス
タ1をアクセスしたアドレスを格納するベクトル・アド
レス・レジスタ、7はマスク制御部5で生成された制御
データとベクトル・アドレス・レジスタ6の出力とを加
算してその結果によりベクトル・レジスタ1をアドレス
指定するアドレス加算器、8はマスク制御部5で生成さ
れた制御データをアドレス加算器7へ送出するための信
号線である。
第2図は第1図中のマスク制御部5の詳細な構成を含む
ブロック図で、アドレス距離レジスタ55に演算対象と
なるベクトルデータの相対的な位置情報を格納する手順
を説明するための図である。第2図において、31は第
1図中のマスク・レジスタ3に相当し格納内容の一例を
含むマスク・レジスタ、51はマスク・レジスタ3に格
納する演算実行制御データの内容を判定する(算術/論
理演算器2またはマスク演算器4による演算結果を判定
する)マスク判定回路、52はマスク判定回路51の判
定結果に基づいてベクトル・レジスタ1内の演算に使用
するベクトルデータの要素数をカウントする要素カウン
タ、53はその判定結果に基づいて演算に使用するベク
トルデータのうち隣り合うベクトルデータ同士の相対的
な距離をカウントする(演算対象となるベクトルデータ
の相対的な位置をカウントする)距離カウンタ、55は
その判定結果に基づいて距離カウンタ53の内容を蓄積
していく (演算対象となるベクトルデータで隣り合う
データ間の相対的な位置情報を蓄積する)アドレス距離
レジスタ、54はアドレス距離レジスタ55の書き込み
位置を指定するポインタである。マスク判定回路51、
要素数カウンタ52、距離カウンタ53、ポインタ54
、及びアドレス距離レジスタ55は第1図中のマスク制
御部5内に含まれる。
第3図はアドレス距離レジスタ55に格納された情報を
元にマスク・レジスタ31により演算対象に指定された
ベクトルデータに対してのみ演算を行う手順を説明する
ためのブロック図であり、図中の56はアドレス距離レ
ジスタ55の読み出し位置を指定するポインタ、11.
12はそれぞれ演算器2または4への人力データを持つ
ベクトル・レジスタAおよびベクトル・レジスタBであ
る。13は演算結果を格納するベクトル・レジスタCで
ある。
第2図および第3図において、51〜56で示された部
分は、第1図におけるマスク制御部5の内部に含まれる
ものである。また、これらの図においては説明の都合上
ベクトル・レジスタは6語、対応するマスク・レジスタ
は6ビツトとしている。
次に動作について説明する。
第2図において、第1図の算術/論理演算器2またはマ
スク演算器4から得られたマスク演算結果(演算実行制
御データ)をマスク・レジスタ31に格納する。それと
同時にマスク演算結果の内容をマスク判定回路51で判
定する。要素数カウンタ52、距離カウンタ53および
ポインタ54はそれぞれ初期状態はOにリセットされて
おり、マスク判定回路51の判定の結果、マスク演算結
果が“1”であれば以下の操作を行う。
(1)要素数カウンタ52をカウントアツプする。
(2)距離カウンタ53の値をポインタ54で指定され
るアドレス距離レジスタ55のワード位置に格納すると
共に、距離カウンタ53の値を“1”にセットする。
(3)ポインタ54をカウントアツプする。
また、マスク演算結果が“0”であれば以下の操作を行
う。
(1)要素数カウンタ52およびポインタ54の値は変
更しない。
(2)距離カウンタ53をカウントアツプする。このと
きアドレス距離レジスタ55への格納は、行わない。
以上の操作をマスク演算が終了するまで行う。第2図は
、6ビツト構成のマスク・レジスタ31を使用しており
、マスク演算が終了した時点での内容がrloollo
Jとなる例について示している。この例では、マスク演
算が終了した時点でのレジスタ、カウンタの値は次のよ
うに設定される。
要素数カウンタ52=3 距離カウンタ53=2(ただし、アドレス距離レジスタ
には格納 されない) ポインタ54   =3 アドレス距離レジスタ55 アドレスO=0 アドレス1==3 アドレス2=1 第2図においてアドレス距離レジスタ55に設定された
値を元に第3図では演算対象となるベクトルデータの指
定を行う。まずポインタ56およびベクトル・アドレス
・レジスタ6は初期状態では“0”にリセットされてい
る。次に演算命令が起動され、ベクトルデータに対する
演算を開始すルトホインタ56で指定されるアドレス距
離レジスタ55のワードを読み出して信号線8を介して
アドレス加算器7に送る。アドレス加算器7はこのデー
タとベクトル・アドレス・レジスタ6の内容(このとき
初期値″0”が格納されている)を加算してベクトル・
レジスタ11.12.13をアドレス指定する。加算器
7の最初の出力は“0”となり、ベクトル・レジスタA
、B、Cのアドレス0が読み出し及び書き込み用に選択
される。したがってベクトルレジスタのアドレス0のワ
ードを用いて演算が実行される。演算と同時にポインタ
56をカウントアツプし、またアドレス加算器7の出力
をベクトル・アドレス・レジスタ6に格納する。次にカ
ウントアツプされたポインタ56によりアドレス距離レ
ジスタ55のワード(この場合“3”)を読み出し、ベ
クトル・アドレス・レジスタ6の値(この場合“0”)
をアドレス加算器7で加算してベクトル・レジスタA、
B、Cをアドレス指定する。この場合、アドレス加算器
7の出力は“3”となるので、ベクトル・レジスタのア
ドレス3のワードを用いて演算が実行される。更に、ポ
インタ56をカウントアツプし、アドレス加算器7の出
力をベクトル・アドレス・レジスタ6に格納する。同様
の操作を演算命令開始時に要素数カウンタ52に格納さ
れている値(この例では“3゛)の回数だけ繰り返すこ
とにより、演算対象となっているベクトルデータの全て
に対する演算が完了する。
以上説明したように、このベクトルデータ処理方式は、
マスク・レジスタ3に設定するビット・パターンに基づ
いたデータを持つアドレス距離レジスタ55により、ベ
クトル・レジスタ1内に格納されているデータのうち実
際に演算の対象となっ°ているベクトルデータ同士の相
対的な位置を求め、ベクトル・レジスタ1のアドレスを
指定するベクトル・アドレス・レジスタ6とアドレス距
離レジスタ55の内容とを加算するアドレス加算器7を
設け、アドレス加算器7の出力でベクトル・レジスタ1
をアクセスするようにしたものである。
したがって、ベクトル・アドレス・レジスタ6とアドレ
ス距離レジスタ55およアドレス加算器7はベクトル・
レジスタ1をアクセスするごとに動作して次にアクセス
するベクトル・レジスタ1のアドレスを生成するため、
マスク・レジスタ3で演算対象に指定されたベクトルデ
ータだけを順次アクセスでき、その結果不要なベクトル
データに対する演算を省略することができるので、条件
分岐命令を含むDO小ループベクトル化した際にも高速
な演算が可能となる。
なお、上記実施例においてはマスク・レジスタ3のビッ
ト数として6ビツトとし、ベクトル・レジスタ1の容量
を6ワードとしたが、この発明はこれらの容量に限定さ
れるものではないので、任意の容量のマスク・レジスタ
やベクトル・レジスタを持つベクトル演算装置に適用可
能である。また、アドレス距離レジスタ55の容量につ
いても特に制限を設けるものではない。更に、上記実施
例においてはポインタ54とポインタ56とは異なるも
のとして説明を行ったが、これらを同一のものとしても
良い。
〔発明の効果〕
以上のように、この発明によれば、アドレス距離レジス
タによりベクトル・レジスタ内に格納されているデータ
のうち実際に演算の対象となっているベクトルデータ同
士の相対的な位置を求め、ベクトル・アドレス・レジス
タとアドレス距離レジスタの内容とを加算してその結果
でベクトル・レジスタをアクセスするようにしたので、
ベクトル・レジスタ内の一部のベクトルデータのみが演
算対象になっている場合でも連続的に演算実行が可能と
なり、その結果、条件分岐命令を含むり。
ループをベクトル化した場合でもオーバーへンドの少な
い効率的な演算ができ、高速なベクトル演算の実行が可
能となる効果が得られる。
【図面の簡単な説明】
第1図はこの発明の一実施例に係るベクトルデータ処理
方式を採用したベクトル演算装置の構成を示すブロック
図、第2図はこの実施例においてアドレス距離レジスタ
に演算対象となるヘタ1ルデータの相対的な位置情報を
格納する手順を説明するためのマスク制御部5の詳細な
構成を含むブロック図、第3図はこの実施例においてア
ドレス距離レジスタに格納された情報を元にマスク・レ
ジスタにより演算対象に指定されたベクトルブタに対し
てのみ演算を行う手順を説明するためのブロック図、第
4図は例えば“日経エレクトロニクスNO,312pp
、131−155.1983.4.11”に示された従
来のベクトル演算装置の構成を示すブロック図である。 第5図は第4図に示されたベクトル演算装置においてマ
スク・レジスタの内容によりベクトル・レジスタ間の演
算が制御される様子を示す図、第6図は第4図に示され
たベクトル演算装置においてマスク・レジスタの内容に
より演算対象に指定されたベクトルデータのみを収集し
演算を施した後所定のベクトル・レジスタの位置に結果
を格納する様子を示す図である。 1.11,12.13・・・ベクトル・レジスタ、2・
・・算術/論理演算器、3.31・・・マスク・レジス
タ、4・・・マスク演算器、5・・・マスク制御部、6
・・・ベクトル・アドレス・レジスタ、7・・・アドレ
ス加算器、51・・・マスク判定回路、52・・・要素
数カウンタ、53・・・距離カウンタ、55・・・アド
レス距離レジスタ。 第1図

Claims (1)

    【特許請求の範囲】
  1. 演算の対象となるベクトルデータや演算結果のベクトル
    データを格納するベクトル・レジスタと、このベクトル
    ・レジスタ内のベクトルデータに対して演算の実行を制
    御するための演算実行制御データを格納するマスク・レ
    ジスタと、上記ベクトル・レジスタから読み出したベク
    トルデータに対して演算を行いその結果を上記ベクトル
    ・レジスタに格納する演算器とを備えたベクトル演算装
    置において、上記マスク・レジスタに格納する演算実行
    制御データの内容を判定するマスク判定回路と、このマ
    スク判定回路の判定結果に基づいて上記ベクトル・レジ
    スタ内の演算に使用するベクトルデータの要素数をカウ
    ントする要素数カウンタと、その判定結果に基づいて演
    算に使用するベクトルデータのうち、隣り合うベクトル
    データ同士の相対的な距離をカウントする距離カウンタ
    と、その判定結果に基づいて上記距離カウンタの内容を
    蓄積していくアドレス距離レジスタと、上記ベクトル・
    レジスタをアクセスしたアドレスを格納するベクトル・
    アドレス・レジスタと、このベクトル・アドレス・レジ
    スタの内容と上記アドレス距離レジスタの内容とを加算
    するアドレス加算器とを設け、上記アドレス加算器の加
    算結果をアドレスとして上記ベクトル・レジスタ内で離
    散的に配置されたベクトルデータを連続的にアクセスし
    、これらのベクトルデータを連続的に上記演算器へ供給
    し、この演算器の演算結果をベクトル・レジスタ内の離
    散的な位置へ格納することを特徴とするベクトルデータ
    処理方式。
JP14042689A 1989-06-02 1989-06-02 ベクトルデータ処理方式 Pending JPH036663A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14042689A JPH036663A (ja) 1989-06-02 1989-06-02 ベクトルデータ処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14042689A JPH036663A (ja) 1989-06-02 1989-06-02 ベクトルデータ処理方式

Publications (1)

Publication Number Publication Date
JPH036663A true JPH036663A (ja) 1991-01-14

Family

ID=15268416

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14042689A Pending JPH036663A (ja) 1989-06-02 1989-06-02 ベクトルデータ処理方式

Country Status (1)

Country Link
JP (1) JPH036663A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014526758A (ja) * 2011-09-26 2014-10-06 インテル・コーポレーション ストライド機能を有するベクトルロード演算/ストア演算を提供する命令及びロジック
JP2014526757A (ja) * 2011-09-26 2014-10-06 インテル・コーポレーション ベクトル散乱演算機能及びベクトル収集演算機能を提供する命令及びロジック
JP2014530426A (ja) * 2011-09-26 2014-11-17 インテル・コーポレーション ストライド機能及びマスク機能を有するベクトルロード及びベクトルストアを提供する命令及びロジック
JP2016157479A (ja) * 2016-05-02 2016-09-01 インテル・コーポレーション ベクトル散乱演算機能及びベクトル収集演算機能を提供する命令及びロジック
JP2016167291A (ja) * 2016-04-25 2016-09-15 インテル・コーポレーション ストライド機能及びマスク機能を有するベクトルロード及びベクトルストアを提供する命令及びロジック

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014526758A (ja) * 2011-09-26 2014-10-06 インテル・コーポレーション ストライド機能を有するベクトルロード演算/ストア演算を提供する命令及びロジック
JP2014526757A (ja) * 2011-09-26 2014-10-06 インテル・コーポレーション ベクトル散乱演算機能及びベクトル収集演算機能を提供する命令及びロジック
JP2014530426A (ja) * 2011-09-26 2014-11-17 インテル・コーポレーション ストライド機能及びマスク機能を有するベクトルロード及びベクトルストアを提供する命令及びロジック
US9747101B2 (en) 2011-09-26 2017-08-29 Intel Corporation Gather-op instruction to duplicate a mask and perform an operation on vector elements gathered via tracked offset-based gathering
JP2016167291A (ja) * 2016-04-25 2016-09-15 インテル・コーポレーション ストライド機能及びマスク機能を有するベクトルロード及びベクトルストアを提供する命令及びロジック
JP2016157479A (ja) * 2016-05-02 2016-09-01 インテル・コーポレーション ベクトル散乱演算機能及びベクトル収集演算機能を提供する命令及びロジック

Similar Documents

Publication Publication Date Title
JP3442225B2 (ja) 演算処理装置
US5487159A (en) System for processing shift, mask, and merge operations in one instruction
EP0148478B1 (en) A data processor with control of the significant bit lenghts of general purpose registers
CN101048731B (zh) 用于单指令、多数据执行引擎的循环指令
US7418575B2 (en) Long instruction word processing with instruction extensions
US4587632A (en) Lookahead stack oriented computer
JPH0364890B2 (ja)
JPS6363945B2 (ja)
JPH0512750B2 (ja)
CN110490308A (zh) 加速库的设计方法、终端设备及存储介质
US5940625A (en) Density dependent vector mask operation control apparatus and method
JPH036663A (ja) ベクトルデータ処理方式
CN116308989A (zh) 一种全同态快速数论变换的gpu加速方法
JPH0363092B2 (ja)
CN110073332A (zh) 向量生成指令
US20020032845A1 (en) Array indexing with sequential address genarator for a multi-dimensional array having fixed address indices
JPS6150359B2 (ja)
Dugan et al. A study of the utility of associative memory processors
JPS62501940A (ja) マイクロプログラム・コントロ−ラの改良
JP3817073B2 (ja) メモリアクセス処理装置、メモリアクセス処理システム、および記録媒体
JPH0222418B2 (ja)
JPS5846439A (ja) 計算機のプログラム編集方法
JPS60178539A (ja) 情報処理装置におけるバイパス制御方式
JPH1166046A (ja) ベクトル処理装置
JPH06103091A (ja) 並列排他制御命令翻訳方法及びその装置とデータ処理装置