JPS58146969A

JPS58146969A - インデツクス限定連続演算ベクトルプロセツサ

Info

Publication number: JPS58146969A
Application number: JP57028905A
Authority: JP
Inventors: Isamu Yamazaki; 勇山崎
Original assignee: Toshiba Corp; Tokyo Shibaura Electric Co Ltd
Current assignee: Toshiba Corp
Priority date: 1982-02-26
Filing date: 1982-02-26
Publication date: 1983-09-01
Also published as: JPH036546B2; US4823258A; EP0088544A1; EP0088544B1; DE3373945D1

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は科学技術計算でしばしば必要とされるベクトル
やマトリクスの計算を高速に行なうプロセッサに関する
。

〔発明の技術的背景〕

科学技術計算では少し規模が大きくなるとベクトルやマ
トリクスに対する打算を必要とし、計算機時間がかかる
。これらのベクトルやマ）　ＩＪクスの各要素は通常、
計算機のメモリ中で、そのインデックスの順に一定のア
ドレス間隔で格納されることが多い。そこでこのような
データの集合を１配列”と呼ぶ。ベクトルプロセッサ（
またはアレイプロセッサ）はこのような、一定のアドレ
ス間隔で格納されているデータに対して、パイプライン
技術を用いて、連続的に高速に同一種類の演算を行なう
よう構成されて２妙、これによって、配列に対する計算
のスピードを上げよりとするものである。すなわち従来
のベクトルプロセッサは次のような計算を高速に実行す
ることができる。

（例１）ＤＯ１０Ｉ＝１，１００Ａ（Ｉ）＝Ｂ（Ｉ）米Ｃ（Ｉ）１０　　Ｃ０ＮＴＩＮＵＥ（例２）Ｄｏ　　２０　　Ｊ＝１．９９．２Ｘ（Ｉ、　Ｊ　）＝Ｙ（Ｉ、　Ｊ　）＋Ｚ（Ｊ　”）２
０　　ｃｏＮ’ｒＩＮｕｇしかし実際の応用では次のような要素毎に計算内容が異
なる場合がかなり頻繁に現われる。

（例３）Ｄｏ　　３０　　Ｉ＝１，１００ＩＰ（Ｇ（Ｉ）、ＧＩ’、０．０）　　入（Ｉ　）＝Ａ
（Ｉ　）十〇（Ｉ　）ＩＦ（Ｇ（Ｉ）、ＴＪ、０．０）
　　　人（１）二人（Ｉ）峯Ｄ（Ｊ、Ｉ）３０　　Ｃ０
ＮＴＩＮＵＦｆこの場合には、　Ｂ（Ｉ）の正／ｊｉＬ（の零）により
演算内容が異な９、かつオペランドが異っているので、
パイプラインがその都蜜中断し、その線条従来のベクト
ルプロセッサでは高速に処理できないという問題があっ
た。

〔発明の目的〕

本発明は上記事情に鑑みで為されたものであり、その目
的は指定され九データの性質によって演算内容が異なる
配列の計算についても高速化したインデックス限定連続
演算ベクトルプロセッサを提供することＫある。

〔発明のｃ１！〕上記欠点を克服するため、例えば上記（例３）を次のよ
うに考えなおす。

（第１ステツプ）ｐｏｓ缶（ＩＩＧ（Ｉ））−０）　、■α３．−（ＩＩ
Ｇ（Ｉ）≦Ｏ）（第２ステツプ）ＦＯＲＩｇ　ＰＯ８Ｇ　、Ａ（Ｉ）二人（Ｉ）−）−Ｃ
（Ｉ）（第３ステツプ）ＦＯｆＬ　　ＩＧＮＢＧＧ、Ａ（Ｉ）＝Ａ（２）＊Ｄ（
Ｊ、Ｉ’）ここでＰＯ８ＧはＧ（Ｉ）＞Ｏであるような
インデックスＩの集合、ＮＦ２（追はＧ（Ｉ）＜Ｏであ
るようなインデックスＩの集合である。本発明のベクト
ルプロセッサは、（第１ステツプ）のようなインデック
ス集合を生成し配憶する機能と、（＄２ステップ）。

（第３ステツプ）のよう（、指定したインデックス集合
Ｋ１１ｌするインデックス値に対してのみオペランドア
クセスを連続して行なう機能とを備えることによって、
このような場合でも）くイブツイン感層の効率を失なわ
ないようＫしたものである。

〔発明の効果〕

科学技術計算で何かの臨界―纏の両側である量の評価式
が異なるよう准場合が非常に多く、このようなアプリケ
ージ曹ンでは従来のベタトルプロセッサは非常に能率の
悪いものであったが、本発明のベクトルプロセッサによ
り、そのよつな場合でも問題なく高効率で演算を実行で
きる。

マタ、本発明のベクトルプロセッサは、ある式を評価す
ると同時に、あらかじめ指定した性質によりその評価結
果を分類し、インデックス集合を発生することができる
ので、判断分岐命令のような効率の悪いプログラムをほ
とんど用いずに＠数演算的にプログラムできる。

またスパースマトリクスの場合、マトリクスとベクトル
の積の計算などで零要素との積和をできるだけ行なわな
いようＫすることによって、計算を高速化することかで
暑るが、本発明のベクトルプロセッサでは非零要素のみ
を選択して演算することが容易にできるので、能率的に
スパースマトリクスを取り６つかうことができる（従来
は極めて困難であった）。

〔発明の実施例〕

ｆａ１図に本発明の一実施例を示す。図において。

ｔｏｈベクトル演算部、銭はオペランドアドレス計算部
、Ｕはインデックス計算部、５０はこれらを制御する制
御部である。

ベクトル演算部１０呟、被演算で一タ、演算線束データ
、その他のデータを収容するデータメモリ１１、レジス
タ（Ｂ）１２．レジスタ＠１３、レジスタＣ１４，ＡＬ
ＵＩ　５．レジスタ（Ａ）　１６、及びアドレスレジス
タ（１）Ａ）１７を有し、指定されたデータすなわちベ
クトル又はマトリックス（以下配列）の演算を実行する
。

オペランドアドレス計算部すは、演算に必要なナベラン
ドすなわちデータメモリ１１内における配列のアドレス
を計算するもので１乗数の値を収容するレジスタ（Ｍ人
）２１．レジスタ（ＭＢ）２２％レジスタ（ＭＣ）　２
３．ベースの値を収容するレジスタ（ＢＡ）２４、レジ
スタ（ＢＢ）２５、レジスタ（ａＣ）２６、乗算１８２
７％加算１１２ｇを有する。

インデックス計算１ｓ　ａｏ　Ｆｉ、上述し九（第１ス
テツプ）＃ＩＣ示すようなインデックス集合を生成し記
憶するもので、インデックスメモリ３１．レジスタ（Ｖ
）３２．１／ジスタ■３３、レジスタ（ＩＢｏ）３４、
レジスタ（ＩＢＩ）３５、レジスタ（Ｉ）　３６　、レ
ジスダ（１）３７、加算ａ３８％アドレスレジスタ（■
ム）３９、＋１加算５４０．終了判定回路４１及び正／
員判定回路４２を有する。このベクトルプロセッサは基
本的に次の演算を行なりことができる。

とζＫＦｔＪＮＣ（Ｘ、　Ｙ）はＡＬＵ　１５のもつ２
項スカラー演算（加減乗除算など）、Ｐ（Ｘ）は次の３
種類の命題関数：■Ｘ〉００時真、■Ｘ≧０の時真、■
Ｘ＝Ｏの時真、のいずれか。

Ｕ、　Ｖ、　Ｗｉ　イｙデｙｌスｆｉ−ｖ：Ｉ）　３ｔ
　Ｋ、　Ａ（１）。

Ｂ（Ｉ）　、　Ｃ（Ｉ）はデータメモリ１１に格納され
る。命題関数Ｐ囚は判定回路４２によって判定される。

Ａ（Ｉ）　、　Ｂ（Ｉ）　、　Ｃ（Ｉ）はベクトル（す
なわち１次元の配列）の時は、データメモリ１１のアド
レス順に各要素を格納し、従って、その最初の要素（Ａ
（０）′４）のアドレスをＢＡとすると、一般に人（Ｉ
）のアドレスは、Ｂ入＋工となる。すなわちベクトルの
時は鳩Ｌ　、　ＭＢ　、　ＭＣは１となる。一方Ａ（Ｉ
）　、　Ｂ（Ｉ）　、　Ｃ（Ｉ）が２次元以上の配列〇
一部、例えば入（Ｉ）が３次元配列ＡＡ（Ｋ、　Ｙ、　
Ｚ）ｆＸ＝Ｊ、　Ｙ＝に、　ｚ＝ｉ　　＆どテロる時、
五人（０，０，０）のアドレスをＢ人′とするとＡ（Ｉ
）　：　ＡＡ（Ｊ、　Ｋ、　Ｉ　）のアドレスはＢＡ’
＋Ｊ＋ＸＭＡＸ米Ｋ　＋　ＸＭＡＸ　峯Ｉとなるから、
Ｂ入’　＋Ｊ　＋ＸＭＡＸ秦Ｋを改ためて８人としｓ　
ＸＭＡＸ辛ＹＭＡＸを〜い、とすると、ＢＡ＋ＭＡ半■
となる噌このようにオペランドアドレス計算部２０では３組の配
列Ａ、Ｂ、ＣＫ対し、インデックス値Ｉ重タハＩ’　ト
乗ａＶＡ、ＭＢ、ＭＣトヘーＸノｆｉＢＡ、　ＢＢ。

ＢＣから、乗算５２７と加算ａ２８を用いて、実際のデ
ータメモリアドレスＤＡを計算することができる。

演算を行うべき配列の部分集合は、そのインデックスＩ
の集合として、インデックスメモリ３１に記憶させるが
その形式はインデックス・チェインの形式である。ある
集合（例えばＰ０８Ｇ）とその補集合（ＮｇＧＧ）とは
同時に発生させることができ、１つのインデックスベク
トルエリアに２本のチェインとして記憶される（第２図
６照）、このインデックスベクトルエリアの先頭番地を
ＩＢとすると、インデックスＩＫ対応するインデックス
ベクトル要素のアドレスはＩＢ＋Ｉであり、そこには、
とのＩと同一グループの次のＩ４）値が格納されている
。第２図はＩの降順にチェインが形成されているが、昇
順でもまたランダムでもかまわない。

最後のインデックス値の対応１所には終端記号（・）が
書き込まれる。

このような部分集合（インデックスチェイン）の生成方
法（第１ステツプ）の−例を説明する。

■Ｖレジスタ３２及びＷレジスタ３３に終端記号（ｗ）
をセットする。■レジスタ３６に０をセットする（又は
Ｉ＝Ｘ）とする。

■データメモリ１ｏからデータＧ（Ｉ）をＲｅａｄする
。

■判定回路４２により、データＧ　（Ｉ）の判定を行な
う。

（＋）　Ｇ（Ｉ）＞　０　ナラば、■レジスタ３２７）
内容をインデックスメモリ３１のＩＢ１＋ＩＩ４に書込
み、Ｖレジスタ３２にＩレジスタの内容をセットする。

ｆｉｉ）　Ｇ　ｆＩ）≦０ならば、Ｗレジスタ３３の内
容をインデックスメモリ３１のＩＢｌ＋Ｉ番地に書込み
、Ｗレジスタ３３にＩレジスタ３６の内容をセットする
。

■＋１加算器４ｏにより■レジスタ３６の内容を＋１す
る（またはインデックスメモリ３１のＩＢＩ　＋　Ｉ番
地の内容をエレジスタ３６にセットする）。

■終了判定回路４１により、■レジスタ３６の内容がＩ
の最大値（ま九は終端記号）でろれは次の■へ、そうで
なければ■へもどる。

■ＰＯ８ｅ−ｖ、ＮｇＧＧ−４，！：ｔ　る。

すなわち■レジスタ３２の内容、第２図では＠９曽をＰ
Ｏ８Ｇとし、Ｗレジスタ３３の内容、第２図では“１０
”をＮＥＧＧとする。■、■、＠のステップで（）内を
用いた時は部分集合の部分集合つｔ９積集会を求めるこ
とかで無る。（ＸかつＧ（Ｉ））０など）次に第２ステツプではＩ　　ＰＯ８Ｇに対する演算を行
なう。この場合、まずＰＯ８Ｇすなわち′″９′をＩレ
ジスタ３６にセットし、■の更新タイミング（第３図の
ｍ）で、Ｉ＋ＩＢｏをアドレスとし−Ｃインデックスメ
モリ３１をＲａａｄｌ、、続出したインデックス値をＩ
レジスタ３６にセットするように動作する。これにより
、　Ｇ（Ｉ）＞０である工の値のみが次々とＩレジスタ
３６にセットされ、それに対し同一演算ＦＵＮＣが人Ｌ
Ｕ１５で行なわれた。

この動作を第３図を用いて説明する。本実施例ではＩか
らはじめてＳＲのパイプライン制御を行なっている。第
３図では第（ｎ）サイクルから第（ｎ＋６）サイクルの
みを示している。

第（ｎ）サイクルの初めで■レジスタ３６Ｋａ”５’が
セットされると、オペランドアドレス計算部２０はデー
タＢ（５）のアドレスを計算する。すなわち、乗算５２
７はエレジスタ３６の値５とＭＢレジスタ２２の乗数を
乗算し、この乗算結果にＢＢレジスタ２５０ベースを加
える。との納果得られた値ＢＢ＋５・ＭＢは第（ｎ＋１
　）サイクルの初めでＤＡレジスター７にセットされる
。次にデータメモリー１のアドレスＢＢ＋５・ＭＢの内
容すなわちデータＢ（５）を財ａｄｌ、、第（ｒｌ＋２
　）サイクルの初めでＢレジスター２にセットされた後
、第（ｎ＋３）サイクルの初めでＢルジスター３にセッ
トされる。

一方、同様にして第（ｎ＋１）サイクルでＭＣレジスタ
２３及びＢＣレジスタ２６の内容を用いてオペランドア
ドレス計算部２０はデータＣ１５）のアドレスＢＣ＋５
・ＭＣを求め、第（ｎ＋２）サイクルの初）・：。

めで１）入しジスターフにセットする０次に薯）入Ｖジ
　　・スタ１７の内容で指定されるデータメモリー１の
内容すなわちデータＣ（５）がＲｅａｄされ、＠（ｎ＋
３）サイクルの初めてＣレジスタ１４にセットされる。

人ＬＵ１５はＦＵＮＣの実行に３サイクル（第（ｎ＋３
）〜（ｎ＋５）サイクル）要し、この間Ｂ／レジスタ１
３及びＣレジスタ１４の内容は保持されている。

人ＬＵ１５の演算結果はデータＡ（５）としてデータメ
モリ１１に収容する必要上、第（ｎ＋３　）サイクルの
初めでＩの１を更新（１５”から１３′へ）する直前に
Ｉレジスタ３６の内！！け■入レジスタ３７にセットさ
れる。このＩルジスタ３７に再セットされた値１５＃を
用いて、・窮（ｎ＋５　）サイクルでオペランドアドレ
ス計算部２０はデータＡ　ｆ５）のアドレスをＭ入レジ
スタ２１及び８人レジメタ２４の内容を用いて算出し、
第（ｎ＋８　）サイクルの初めて０人レジスタ１７にセ
ットする。し力為して、第（ｎ＋６）サイクルの初めて
ＡＬＵの演算結果（ＦＵＮＣ（１３を乱Ｃｔ５））　ｉ
）Ｉ　Ａレジスタ１６にセットされると、この内容はデ
ータ人（５）としてデータメモリ１１にＷｒ　ｉ　ｔ　
ｅされる。

このように％　ＡＬＵ１５によるＦＵＮＣの実行が行な
われる３サイクル間、その第１サイクルでは直前の演算
結果のデータメモリ１１への書込みとオーバーラツプし
、第２．第３サイクルでは夫々次に演算すべきオペラン
ドの読出しとオーバーラツプしている。更にこれらデー
タメモリ１１への書込み又は読出しとオーバーラツプし
て、夫々次のサイクルで必要となるオペランドのアドレ
スがオペランドアドレス計算８１２０により実行されて
いる。

このようにしてＩ　Ｐ０８Ｇの演算が実行され、■レジ
スタ３６に終端マーク（→がセットされると終ｒ判定回
路４１はこれを検出し、■レジスタ３６にＮＢＧＧすな
わち”１０”をセットし、以下同様にしてＩεＮｇＧＧ
の演算が実行される。

なお上記実施例ではインデックス値のグループを２組に
分は九が一般に複数組に分けその夫々について異なる演
算を実行してもよい、ｆた、上記実施例ではデータメモ
リ内の１直Ｇ　ｒＩ）に鳩づいてインデックスのグルー
プ分けを行っているが、ＡＬＵの演算結果を用いること
もできる。

【図面の簡単な説明】

Ｉｓ１図は本発明の一実施例を示す図、第２図及び第３
図は本発明の一実施例を説明するための図である。１０・・・ベクトル演算器Ｕ・・・オペランドアドレス計算部３０・・・インデックス計算部５０・・・制御部手続補正書（自４４）１１８ｍ６１ｐｄ２ａ轡許庁長官毅Ｌ　事件の表示Ｗａ和８１％轡願ｇ　ｚｓｓｏｓ号１　発−０４称イｙデツタス隈定連続演算ベタトルグｗ−ｔツナ龜　補
正をすゐ者事件とＯ関係　畳許＆ｆｉ願人（３０７）東京芝ｓｒｓ気株式会社を代厘人〒１００東京都千代回区内◆町１−１−１東京芝瀘電気株式会社東京事務所内（幻　―顔書０４１許−求１）＠＠１）欄（匍　―細書
Ｏ発＠Ｏ詳細なｍ−の― （４）−画６、　補正の内容（１）　　明細書の特許請求のｌ１ｉｌ！を別紙の過多
補正する。（２）　明細書の発明の詳細な説明を以下の正誤表の以
上特許請求ｏｍｖｓデータが格納されているデータメ峰りから、あらかじめ
指定され九項序で連続して読出されるゲインデツクス値
のグループを複数組記憶で自るインデックス・メ篭りと
、上記演算結果！友はデータメ鳴りからの読出データ（
対しあらかじめ指定された性質の有無を判定する判定手
段と、上Ｉ！判定の対象でおる演算請釆ま九はＷＲ＃！
Ｉデー−〇インデックス値を上記判定手段の判定結果に
応じてＶグループ（性質有）まえはＷグループ（性質な
し）Ｋ＃けて上記インデックスメモリに記憶させる手段
と、上記インデックスメモリから指定され九ダシープＯ
イ／デツクス値を連続して貌出す手段と、帥記絖出され
たインデックス値から指定ベタトｋま九はマトリクスの
要素のデータメモリ中のアドレスを計算する手段とを有
することを４１黴とするインデックス限定連続演算ベク
トルプロセツナＯ

Claims

【特許請求の範囲】

データが格納されているデータメモリから、あらかじめ
指定された順序で連続して読出されインデックス値のグ
ループを複数組記憶できるインデックス・メモリと、上
記演算結果または続出データに対しあらかじめ指定され
た性質の有無を判定する判定手段と、上記判定の対象で
ある演算結果または続出データのインデックス値を上記
判定手段の判定結果に応じてＶグループ（性質布）また
はＷグループ（性質なし）に分けて上記インデックスメ
モリに記憶させる手段と、上記インデックスメモリから
指定されたグループのインデックス値を連続して咬出す
手段と、前記読出されたインデックス値から指定ベクト
ルまたはマトリクスの要素のデータメモリ中のアドレス
を計算する手段とを有することを特徴とするインデック
ス限定連続演算ベクトルプロセッサ。