JPH036663A

JPH036663A - ベクトルデータ処理方式

Info

Publication number: JPH036663A
Application number: JP14042689A
Authority: JP
Inventors: Yutaka Murata; 裕村田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1989-06-02
Filing date: 1989-06-02
Publication date: 1991-01-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は、高速演算処理のひとつであるベクトル演算
器を用いたベクトルデータ処理方式に関するものである
。

〔従来の技術〕

第４図は例えば“日経エレクトロニクスＮＯ，３１２ｐ
ｐ、　１３１−１５５．１９８３．４．１１　”に示さ
れた構成に基づ〈従来のベクトル演算装置を表す図であ
る。図において、１は演算の対象となるベクトルデータ
や演算結果のベクトルデータを格納するベクトル・レジ
スタであり、この例では３２語×６４ビットのレジスタ
群が２５６組用意されている。それぞれのレジスタ群は
、独立にベクトル演算器（図においては算術／論理演算
器２として示されている）の人力用レジスタとしても、
演算器からの出力用レジスタとしても使用可能である。

２はベクトル・レジスタ１から読み出したベクトルデー
タに対して図示しない制御回路から指定された演算を施
す算術／論理演算器である。３はベクトル・レジスタ１
に格納されている個々のデータに対して演算を実行する
かしないかを指定する情報を保持するマスク・レジスタ
である。４はマスク・レジスタ３間の演算を行うマスク
演算器である第５図は、第４図に示されたベクトル演算
装置においてマスク・レジスタの内容によりベクトル・
レジスタ間の演算が制御される様子を示す図である。図
において、３１はマスク・レジスタ、１０１および１１
１は演算器入力用ベクトル・レジスタ、１２１は演算結
果格納用のベクトル・レジスタである。この例では、そ
れぞれ６個ずつのベクトルデータと個々のベクトルデー
タに対応した６ビツトのマスク・レジスタが示されてい
る。

斜線はそのベクトルデータに対する演算結果がベクトル
・レジスタＣ（１２１）に格納されることを表している
。第５図で示したような演算の形態を“マスク付き演算
°と呼び、この様な演算を行うマスク付き演算命令が用
意されている。

第６図は、第４図に示されたベクトル演算装置において
マスク・レジスタの内容により演算対象に指定されたベ
クトルデータのみを収集し、演算を施した後所定のベク
トル・レジスタの位置に結果を格納する様子を示す図で
ある。図において、１０２．１１２はそれぞれ演算対象
となるベクトルデータを格納し、かつ演算器への入力用
となるベクトル・レジスタ、１２２は演算結果のベクト
ルデータを格納するベクトル・レジスタである。

ベクトル・レジスタＡ（１０１ンおよびベクトル・レジ
スタＢ（１１１）からマスク・レジスタ３１の内容で演
算対象に指定されたベクトルデータのみをベクトル・レ
ジスタＡ’　（１０２）およびベクトル・レジスタＢ”
（１１２）に移動させる収集命令と、ベクトル・レジス
タＣ’（１２２）に得られた演算結果をマスク・レジス
タ３１の内容にしたがってベクトル・レジスタＣ（１２
１）の所定の位置に書き戻す拡散命令が用意されている
。

次に動作について説明する。

ベクトル演算器を用いる場合、通常、プログラム内に存
在するＤｏ小ループ部分をベクトル命令に置き換え（ベ
クトル化と言う）、ベクトルデータに対してパイプライ
ン的に同一の演算を施すことにより高速な演算を可能と
している。しかしＤＯループ内に条件分岐命令が存在す
ると、個々のループ毎に制御が異なるため、このループ
に対して全て同一の演算を行うような単純なベクトル化
は不可能となる。したがって、条件分岐命令を含むＤＯ
ループでもベクトル化を可能とするため、第４図に示す
ようにマスク・レジスタ３が用意されている。

ベクトル・レジスタ内の個々の要素に対する演算の実行
／非実行をあらかじめ算術／論理演算器２またはマスク
演算器４で求めておき、その結果をマスク・レジスタ３
へ設定しておく。マスク・レジスタ３への値の設定には
様々な方法があるが、例として以下のものをあげること
ができる。

■ふたつのベクトル・レジスタ内の個々の要素ごとに算
術／論理演算器２で大小比較を行い、その結果をマスク
・レジスタ３の対応するビット位置にセットする。

■マスク・レジスタ３の値に対してマスク演算器４で論
理操作をほどこし、その結果をマスク・レジスタ３の対
応するビット位置にセットする。

第５図および第６図は、条件分岐命令を含むＤｏ小ルー
プベクトル化するために、マスク・レジスタを用いた例
を示している。例ではマスク・レジスタ３１は６ビツト
構成のものが示されておリ、その内容は１００１１０で
ある。これは、演算に使用するベクトル・レジスタＡ（
１０１）およびベクトル・レジスタＢ（１１１）のそれ
ぞれ第１．第４、第５番目の要素が実際の演算対象であ
ることを表し、また、その演算結果が結果を格納するベ
クトル・レジスタＣ（１２１）の第１．第４．第５番目
の位置に格納されることを表している。

第５図はマスク付き演算の例である。マスク付き演算で
は、ベクトル・レジスタＡ（１０１）およびベクトル・
レジスタＢ（１１１）に格納されたベクトルデータを先
頭から１要素ずつ取り出して順次算術／論理演算器（第
５図では図示していない）に送出し、演算を行う。この
とき、演算対象のベクトル・レジスタの要素に対応する
マスク・レジスタのビットを検査して、ビットが“１”
であれば演算結果をベクトル・レジスタＣ（１２１）の
対応する要素位置に格納し、ビットが“０”であればベ
クトル・レジスタＣ（１２Ｄへの格納は行わない。

これにより、ベクトル・レジスタの全要素に対して演算
を行うにもかかわらず、マスク・レジスタ３１のビット
に１”が立っている位置に対応するベクトル・レジスタ
の要素についてのみ演算を施したことと等価になる。

第６図は収集／拡散命令を用いた演算実行の例であり、
最終的にベクトル・レジスタＣ（１２１）に得られる結
果は第５図のマスク付き演算の場合と同一である。まず
、収集命令によりマスク・レジスタのビットに１”が立
っている位置に対応するベクトル・レジスタＡ（１０１
）、ベクトル・レジスタＢ（１１１）の要素をそれぞれ
ベクトル・レジスタＡ’　（１０２ン、ベクトル・レジ
スタＢ’（１１２）に収集する。これにより、ベクトル
・レジスタＡ。

（１０２）およびベクトル・レジスタＢ’（１１２）の
全ての要素は算術／論理演算器（第６図では図示しない
）での演算の対象になる。次に、演算命令によりベクト
ル・レジスタＡ’（１０２）およびベクトル・レジスタ
Ｂ’（１１２）の全要素に対して順次演算を行い結果を
ベクトル・レジスタＣ”（１２２）に格納していく。更
に、ベクトル・レジスタＣ゛（１２２’）に求まった演
算結果を、拡散命令によりマスク・レジスタのビットに
′１”が立っている位置に対応するベクトル・レジスタ
Ｃ（１２１）のワード位置に拡散して格納する。マスク
付き演算では、ベクトル・レジスタ内の全要素に対して
演算実行を施したのに対して、演算命令と収集／拡散命
令を組み合わせて使用することにより、実際に演算対象
となるベクトルデータに対してのみ演算を施すことにな
るので、演算実行の高速化が図れる。

〔発明が解決しようとする課題〕

従来のベクトル演算装置は以上のように構成されている
ので、条件分岐命令を含むＤｏループをベクトル化した
際の演算実行には、本来の演算実行の対象となるベクト
ルデータに対する演算以外に余分な操作が必要となり、
演算実行性能低下の要因となっていた。具体的には、マ
スク付き演算の場合と収集／拡散命令を用いる場合につ
いて以下のような課題があった。

■マスク付き演算の場合マスク付き演算では個々のベクトルデータに対する演算
の実行／不実行はマスク・レジスタの指定にしたがって
演算結果をベクトル・レジスタに格納するかしないかを
選択することにより制御される。したがって、不実行と
指定されているベクトルデータに対しても実際には演算
を行っている。

条件分岐の結果演算が不実行となるベクトルデータが多
いほど演算器における無駄な演算が増え、演算実行性能
が低下する。

■収集／拡散命令を用いる場合収集／拡散命令を用いる場合はマスク付き演算のように
不実行と指定されるベクトルデータに対する演算は行わ
れないので、演算器の使用効率が向上しマスク付き演算
での欠点を解消できる。しかし、演算命令に先立って収
集命令を、また、演算命令の次に拡散命令を実行する必
要があるためこれらの命令実行の要する時間がオーバー
ヘッドとして生ずる。

この発明は上記のような課題を解消するためになされた
ものであり、条件分岐命令を含むＤＯルプをベクトル化
した際にもオーバーヘッドの少ない効率的な演算を可能
とし、高速な演算を行うことができるベクトルデータ処
理方式を得ることを目的とする。

〔課題を解決するための手段〕

この発明に係るベクトルデータ処理方式は、マスク・レ
ジスタ３に格納する演算実行制御データの内容を判定す
るマスク判定回路５１と、このマスク判定回路５１の判
定結果に基づいてベクトル・レジスタ１内の演算に使用
するベクトルデータの要素数をカウントする要素数カウ
ンタ５２と、その判定結果に基づいて演算に使用するベ
クトルデータのうち隣り合うベクトルデータ同士の相対
的な距離をカウントする距離カウンタ５３と、その判定
結果に基づいて距離カウンタ５３の内容を蓄積していく
アドレス距離レジスタ５５と、ベクトル・レジスタ１を
アクセスしたアドレスを格納するベクトル・アドレス・
レジスタ６と、このベクトル・アドレス・レジスタ６の
内容とアドレス距離レジスタ５５の内容とを加算するア
ドレス加算器７とを備え、アドレス加算器７の加算結果
をアドレスとしてベクトル・レジスタｌ内で離散的に配
置されたベクトルデータを連続的にアクセスし、これら
のベクトルデータを連続的に演算器２へ°供給し、この
演算器２の演算結果をベクトル・レジスタ１内の離散的
な位置へ格納することを特徴とするものである。

〔作用〕

マスク判定回路５１はマスク・レジスタ３に格納する演
算実行制御データの内容を判定する。要素数カウンタ５
２はマスク判定回路５１０判定結果に基づいてベクトル
・レジスタ１内の演算に使用するベクトルデータの要素
数をカウントする。

距離カウンタ５３は上記と同じ判定結果に基づいて演算
に使用するベクトルデータのうち隣り合うベクトルデー
タ同士の相対的な距離をカウントする。アドレス距離レ
ジスタ５５は上記と同じ判定結果に基づいて距離カウン
タ５３の内容を蓄積していく。ベクトル・アドレス・レ
ジスタ６はベクトル・レジスタ１をアクセスしたアドレ
スを格納する。アドレス加算器７はベクトル・アドレス
・レジスタ６の内容とアドレス距離レジスタ５５の内容
とを加算する。このような構成により、ベクトル・レジ
スタ１内で離散的に配置されたベクトルデータは、アド
レス加算器７の加算結果をアドレスとして連続的にアク
セスされ、演算器２へ連続的に供給される。そして演算
器２の演算結果はベクトル・レジスタｌ内の離散的な位
置に格納される。

（発明の実施例〕第１図はこの発明の一実施例に係るベクトルデータ処理
方式を採用したベクトル演算装置の構成を示すブロック
図であり、第４図に示す構成要素に対応するものには同
一の符号を付し、その説明を省略する。第１図において
、５はマスク・レジスタ３に設定するデータに基づいて
ベクトル・レジスタ１のアドレスに対する演算実行制御
データを生成するマスク制御部、６はベクトル・レジス
タ１をアクセスしたアドレスを格納するベクトル・アド
レス・レジスタ、７はマスク制御部５で生成された制御
データとベクトル・アドレス・レジスタ６の出力とを加
算してその結果によりベクトル・レジスタ１をアドレス
指定するアドレス加算器、８はマスク制御部５で生成さ
れた制御データをアドレス加算器７へ送出するための信
号線である。

第２図は第１図中のマスク制御部５の詳細な構成を含む
ブロック図で、アドレス距離レジスタ５５に演算対象と
なるベクトルデータの相対的な位置情報を格納する手順
を説明するための図である。第２図において、３１は第
１図中のマスク・レジスタ３に相当し格納内容の一例を
含むマスク・レジスタ、５１はマスク・レジスタ３に格
納する演算実行制御データの内容を判定する（算術／論
理演算器２またはマスク演算器４による演算結果を判定
する）マスク判定回路、５２はマスク判定回路５１の判
定結果に基づいてベクトル・レジスタ１内の演算に使用
するベクトルデータの要素数をカウントする要素カウン
タ、５３はその判定結果に基づいて演算に使用するベク
トルデータのうち隣り合うベクトルデータ同士の相対的
な距離をカウントする（演算対象となるベクトルデータ
の相対的な位置をカウントする）距離カウンタ、５５は
その判定結果に基づいて距離カウンタ５３の内容を蓄積
していく　（演算対象となるベクトルデータで隣り合う
データ間の相対的な位置情報を蓄積する）アドレス距離
レジスタ、５４はアドレス距離レジスタ５５の書き込み
位置を指定するポインタである。マスク判定回路５１、
要素数カウンタ５２、距離カウンタ５３、ポインタ５４
、及びアドレス距離レジスタ５５は第１図中のマスク制
御部５内に含まれる。

第３図はアドレス距離レジスタ５５に格納された情報を
元にマスク・レジスタ３１により演算対象に指定された
ベクトルデータに対してのみ演算を行う手順を説明する
ためのブロック図であり、図中の５６はアドレス距離レ
ジスタ５５の読み出し位置を指定するポインタ、１１．
１２はそれぞれ演算器２または４への人力データを持つ
ベクトル・レジスタＡおよびベクトル・レジスタＢであ
る。１３は演算結果を格納するベクトル・レジスタＣで
ある。

第２図および第３図において、５１〜５６で示された部
分は、第１図におけるマスク制御部５の内部に含まれる
ものである。また、これらの図においては説明の都合上
ベクトル・レジスタは６語、対応するマスク・レジスタ
は６ビツトとしている。

次に動作について説明する。

第２図において、第１図の算術／論理演算器２またはマ
スク演算器４から得られたマスク演算結果（演算実行制
御データ）をマスク・レジスタ３１に格納する。それと
同時にマスク演算結果の内容をマスク判定回路５１で判
定する。要素数カウンタ５２、距離カウンタ５３および
ポインタ５４はそれぞれ初期状態はＯにリセットされて
おり、マスク判定回路５１の判定の結果、マスク演算結
果が“１”であれば以下の操作を行う。

（１）要素数カウンタ５２をカウントアツプする。

（２）距離カウンタ５３の値をポインタ５４で指定され
るアドレス距離レジスタ５５のワード位置に格納すると
共に、距離カウンタ５３の値を“１”にセットする。

（３）ポインタ５４をカウントアツプする。

また、マスク演算結果が“０”であれば以下の操作を行
う。

（１）要素数カウンタ５２およびポインタ５４の値は変
更しない。

（２）距離カウンタ５３をカウントアツプする。このと
きアドレス距離レジスタ５５への格納は、行わない。

以上の操作をマスク演算が終了するまで行う。第２図は
、６ビツト構成のマスク・レジスタ３１を使用しており
、マスク演算が終了した時点での内容がｒｌｏｏｌｌｏ
Ｊとなる例について示している。この例では、マスク演
算が終了した時点でのレジスタ、カウンタの値は次のよ
うに設定される。

要素数カウンタ５２＝３距離カウンタ５３＝２（ただし、アドレス距離レジスタ
には格納されない）ポインタ５４　　　＝３アドレス距離レジスタ５５アドレスＯ＝０アドレス１＝＝３アドレス２＝１第２図においてアドレス距離レジスタ５５に設定された
値を元に第３図では演算対象となるベクトルデータの指
定を行う。まずポインタ５６およびベクトル・アドレス
・レジスタ６は初期状態では“０”にリセットされてい
る。次に演算命令が起動され、ベクトルデータに対する
演算を開始すルトホインタ５６で指定されるアドレス距
離レジスタ５５のワードを読み出して信号線８を介して
アドレス加算器７に送る。アドレス加算器７はこのデー
タとベクトル・アドレス・レジスタ６の内容（このとき
初期値″０”が格納されている）を加算してベクトル・
レジスタ１１．１２．１３をアドレス指定する。加算器
７の最初の出力は“０”となり、ベクトル・レジスタＡ
、Ｂ、Ｃのアドレス０が読み出し及び書き込み用に選択
される。したがってベクトルレジスタのアドレス０のワ
ードを用いて演算が実行される。演算と同時にポインタ
５６をカウントアツプし、またアドレス加算器７の出力
をベクトル・アドレス・レジスタ６に格納する。次にカ
ウントアツプされたポインタ５６によりアドレス距離レ
ジスタ５５のワード（この場合“３”）を読み出し、ベ
クトル・アドレス・レジスタ６の値（この場合“０”）
をアドレス加算器７で加算してベクトル・レジスタＡ、
Ｂ、Ｃをアドレス指定する。この場合、アドレス加算器
７の出力は“３”となるので、ベクトル・レジスタのア
ドレス３のワードを用いて演算が実行される。更に、ポ
インタ５６をカウントアツプし、アドレス加算器７の出
力をベクトル・アドレス・レジスタ６に格納する。同様
の操作を演算命令開始時に要素数カウンタ５２に格納さ
れている値（この例では“３゛）の回数だけ繰り返すこ
とにより、演算対象となっているベクトルデータの全て
に対する演算が完了する。

以上説明したように、このベクトルデータ処理方式は、
マスク・レジスタ３に設定するビット・パターンに基づ
いたデータを持つアドレス距離レジスタ５５により、ベ
クトル・レジスタ１内に格納されているデータのうち実
際に演算の対象となっ°ているベクトルデータ同士の相
対的な位置を求め、ベクトル・レジスタ１のアドレスを
指定するベクトル・アドレス・レジスタ６とアドレス距
離レジスタ５５の内容とを加算するアドレス加算器７を
設け、アドレス加算器７の出力でベクトル・レジスタ１
をアクセスするようにしたものである。

したがって、ベクトル・アドレス・レジスタ６とアドレ
ス距離レジスタ５５およアドレス加算器７はベクトル・
レジスタ１をアクセスするごとに動作して次にアクセス
するベクトル・レジスタ１のアドレスを生成するため、
マスク・レジスタ３で演算対象に指定されたベクトルデ
ータだけを順次アクセスでき、その結果不要なベクトル
データに対する演算を省略することができるので、条件
分岐命令を含むＤＯ小ループベクトル化した際にも高速
な演算が可能となる。

なお、上記実施例においてはマスク・レジスタ３のビッ
ト数として６ビツトとし、ベクトル・レジスタ１の容量
を６ワードとしたが、この発明はこれらの容量に限定さ
れるものではないので、任意の容量のマスク・レジスタ
やベクトル・レジスタを持つベクトル演算装置に適用可
能である。また、アドレス距離レジスタ５５の容量につ
いても特に制限を設けるものではない。更に、上記実施
例においてはポインタ５４とポインタ５６とは異なるも
のとして説明を行ったが、これらを同一のものとしても
良い。

〔発明の効果〕

以上のように、この発明によれば、アドレス距離レジス
タによりベクトル・レジスタ内に格納されているデータ
のうち実際に演算の対象となっているベクトルデータ同
士の相対的な位置を求め、ベクトル・アドレス・レジス
タとアドレス距離レジスタの内容とを加算してその結果
でベクトル・レジスタをアクセスするようにしたので、
ベクトル・レジスタ内の一部のベクトルデータのみが演
算対象になっている場合でも連続的に演算実行が可能と
なり、その結果、条件分岐命令を含むり。

ループをベクトル化した場合でもオーバーへンドの少な
い効率的な演算ができ、高速なベクトル演算の実行が可
能となる効果が得られる。

【図面の簡単な説明】

第１図はこの発明の一実施例に係るベクトルデータ処理
方式を採用したベクトル演算装置の構成を示すブロック
図、第２図はこの実施例においてアドレス距離レジスタ
に演算対象となるヘタ１ルデータの相対的な位置情報を
格納する手順を説明するためのマスク制御部５の詳細な
構成を含むブロック図、第３図はこの実施例においてア
ドレス距離レジスタに格納された情報を元にマスク・レ
ジスタにより演算対象に指定されたベクトルブタに対し
てのみ演算を行う手順を説明するためのブロック図、第
４図は例えば“日経エレクトロニクスＮＯ，３１２ｐｐ
、１３１−１５５．１９８３．４．１１”に示された従
来のベクトル演算装置の構成を示すブロック図である。第５図は第４図に示されたベクトル演算装置においてマ
スク・レジスタの内容によりベクトル・レジスタ間の演
算が制御される様子を示す図、第６図は第４図に示され
たベクトル演算装置においてマスク・レジスタの内容に
より演算対象に指定されたベクトルデータのみを収集し
演算を施した後所定のベクトル・レジスタの位置に結果
を格納する様子を示す図である。１．１１，１２．１３・・・ベクトル・レジスタ、２・
・・算術／論理演算器、３．３１・・・マスク・レジス
タ、４・・・マスク演算器、５・・・マスク制御部、６
・・・ベクトル・アドレス・レジスタ、７・・・アドレ
ス加算器、５１・・・マスク判定回路、５２・・・要素
数カウンタ、５３・・・距離カウンタ、５５・・・アド
レス距離レジスタ。第１図

Claims

【特許請求の範囲】

演算の対象となるベクトルデータや演算結果のベクトル
データを格納するベクトル・レジスタと、このベクトル
・レジスタ内のベクトルデータに対して演算の実行を制
御するための演算実行制御データを格納するマスク・レ
ジスタと、上記ベクトル・レジスタから読み出したベク
トルデータに対して演算を行いその結果を上記ベクトル
・レジスタに格納する演算器とを備えたベクトル演算装
置において、上記マスク・レジスタに格納する演算実行
制御データの内容を判定するマスク判定回路と、このマ
スク判定回路の判定結果に基づいて上記ベクトル・レジ
スタ内の演算に使用するベクトルデータの要素数をカウ
ントする要素数カウンタと、その判定結果に基づいて演
算に使用するベクトルデータのうち、隣り合うベクトル
データ同士の相対的な距離をカウントする距離カウンタ
と、その判定結果に基づいて上記距離カウンタの内容を
蓄積していくアドレス距離レジスタと、上記ベクトル・
レジスタをアクセスしたアドレスを格納するベクトル・
アドレス・レジスタと、このベクトル・アドレス・レジ
スタの内容と上記アドレス距離レジスタの内容とを加算
するアドレス加算器とを設け、上記アドレス加算器の加
算結果をアドレスとして上記ベクトル・レジスタ内で離
散的に配置されたベクトルデータを連続的にアクセスし
、これらのベクトルデータを連続的に上記演算器へ供給
し、この演算器の演算結果をベクトル・レジスタ内の離
散的な位置へ格納することを特徴とするベクトルデータ
処理方式。