JPH0155506B2

JPH0155506B2 -

Info

Publication number: JPH0155506B2
Application number: JP5049983A
Authority: JP
Inventors: Kazunori Sekido; Akira Maeda
Original assignee: Agency of Industrial Science and Technology
Current assignee: National Institute of Advanced Industrial Science and Technology AIST
Priority date: 1983-03-28
Filing date: 1983-03-28
Publication date: 1989-11-24
Also published as: JPS59176876A

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、パイプラインプロセツサによる疎ベ
クトル処理装置に関するものである。

〔発明の技術的背景とその問題点〕

気象計算、回路網解析などの分野では、汎用高
速計算機をもつてしても計算時間が数百時間にも
およぶ計算があり、スーパコンピユータと呼ばれ
ている超高速計算機、例えばCRAY―１や、さ
らに高速な計算機を必要としている。これらの超
高速計算機は、その非常に高い処理性能を実現す
るため、その基本方式としてベクトル演算方式を
取つているものが多い。このベクトル演算方式と
は、記憶装置内のベクトル（別の言葉で表現する
と配列）の要素間の演算、ベクトル演算を高速に
処理する方式である。例えば、大きさ100の２つ
のベクトルＡ（100），Ｂ（100）の各要素の和を求
め、ベクトルＡ（100）に格納するような演算、
FORTRANで DO １Ｉ＝1100 1A（Ｉ）＝Ａ（Ｉ）＋Ｂ（Ｉ） …(1) と表現できるような演算を高速に実行するのを得
意とする演算方式を言う。これらのベクトル演算
方式では、演算の対象となるデータ、すなわちオ
ペランドを記憶装置から読み出したり、演算結果
を記憶装置に格納したりする場合の番地の計算が
非常に単純で高速化が可能であり、少ないハード
ウエアで高効率な処理が実現できる。

このベクトル演算方式は、演算をパイプライン
方式で処理することによりさらに高速に演算を実
行できる。このパイプライン方式とは、演算過程
のいくつかの基本ステツプに分解し、基本ステツ
プごとに論理回路を置き、各基本ステツプ回路で
別々のデータを処理し、その処理結果を次の基本
ステツプに送ることにより、等価的に多くのデー
タを高速に処理する方式である。パイプライン方
式の例を浮動小数点加算を用いて示す。通常、浮
動少数点加算は、 (1) ２つのオペランドの正規化（正規化とは浮動
小数点の表現をそのシステム内で採用している
形式に変換することを言う。） (2) 仮数部の比較 (3) 桁合せのための仮数部の値の小さいオペラン
ドの真数部のシフト (4) ２つの真数部の加算 (5) 結果の正規化の５ステツプに分けて演算が行なわれることが多
い。先に述べたような２つのベクトルの加算をパ
イプライン方式で行なうには、第１図に示すよう
に上記５基本ステツプに対応した処理を行なう論
理回路１〜５をもうけ次のように動作させる。以
下の説明では加算の各ステツプはτ時間で実行さ
れるものとする。

(1) 最初のτ時間で、１番目のデータに対する上
記(1)の処理を論理回路１で行なう。

(2) 次のτ時間で、１番目のデータに対する上記
(2)の処理と、２番目のデータに対する上記(1)の
処理を、論理回路２と論理回路１でそれぞれ同
時に行なう。

(3) その次のτ時間で、１番目のデータに対する
上記(3)の処理と、２番目のデータに対する上記
(2)の処理と、３番目のデータに対する上記(1)の
処理を論理回路３と論理回路２と論理回路１で
それぞれ同時に行なう。

以下、このように各論理回路で次々と処理を行
なうことによつて、連続的に多くのデータの加算
が行なわれる。このパイプライン方式において
は、１番目のデータに対する演算結果は5τ時間後
にしか得られないが、以後τ時間ごとに２番目以
降のデータに対する演算結果がつぎつぎと得られ
る。この様子を見てみると第２図のようになる。
縦軸は、先に述べた浮動小数点加算の５つのステ
ツプを示し、横軸は時刻をτ時間間隔で表現して
いる。〇を囲んだ数字はデータの順番を示してお
り、例えば、１番目のデータは時刻t₁でステツプ
１を実行し、時刻t₂でステツプ２を実行している
ことが示されている。他も全く同様である。

パイプラインでない計算機では、先行するデー
タの計算が終了しないかぎり次のデータの計算を
始めることができないため、個々のデータごとに
演算の開始から終了までの時間を必要とするのに
対し、パイプライン方式では、前のデータの計算
の最初のステツプが終了すれば次のデータの計算
を開始することができ、ベクトル計算を高速に実
行することが可能である。実際、ベクトルの長
さ、いいかえるとデータの数をＮとし、１つの演
算がｋ個のステツプで実行され、各ステツプにτ
時間かかるとすると、前者のパイプライン方式で
ない計算機では、全データを処理するのにＮ×ｋ
×τ時間かかるが、パイプライン方式の計算機で
は、最初のデータに対する演算結果はｋ×τ時間
後に出てくるが、残りの（Ｎ−１）個のデータに
対する結果はτ時間ごとに次々と得られるため、
全データを処理するにはｋ×τ（Ｎ−１）×τ時間
かかる。この場合１つのデータに対しては平均
（ｋ＋Ｎ−１）×τ／Ｎ時間で計算ができたことに
なり、Ｎが大きいとその値はほぼτ時間となり、
ｋにかかわらず、個々のデータの演算はτ時間で
実行されるとみなすことができる。

しかし、このパイプライン方式で高速に計算で
きるためには、データが次々と読み出され、演算
部へ絶え間なく供給されることが必要である。回
路網解析、潮流解析などから得られる方程式は、
零要素を多数含むベクトル（以後疎ベクトルと呼
ぶ）の形式で表現されることが多い。第３図ａに
示すような疎ベクトルの計算機内での表現を考え
て見よう。ベクトルＶは図に示すように、100個
の要素からできており、そのほとんどの要素が零
で、わずかに第４，７，19，81番目の要素の値の
みが非零である。これらのベクトル全体を計算機
の記憶装置に格納すると、そのほとんどは零要素
を格納するのに用いられ、記憶装置を無駄に利用
しており好ましくない。それゆえ、このような疎
ベクトルは通常その非零要素のみを取り出し、第
３図ｂ，ｃに示すような形式で記憶装置に格納さ
れるのが普通である。すなわち、Ｖの非零要素の
みを第３図ｂに示すように第１の記憶領域に連続
的に格納し、それらの非零要素がもとのベクトル
Ｖの何番目の要素であるかを示すインデツクス
を、第３図ｃに示すように第２の記憶領域に格納
している。なお、疎ベクトル間の演算によつて、
演算前には零であつた要素が、非零になることが
ある（これをfill―inの発生と呼ぶ。）。このため、
fill―inが発生する可能性のある場合は、零要素
であつても第１の記憶領域にその値零を格納し、
第２の記憶領域にそのインデツクスを格納してお
くことが通常おこなわれる。この零要素は、疎ベ
クトル間の演算では非零要素と同じように扱うこ
とができ、以下の説明ではこれを区別することな
く非零要素とみなして説明する。このような形式
で表現された２つの疎ベクトル間の演算では、読
み出した非零要素が何番目の要素であるか、逐一
インデツクスを比較する必要があり、パイプライ
ンに送るべきデータを絶え間なく決めることがで
きず、パイプライン方式の利点が活かしきれなか
つた。

例えば、先にプログラム１で示したベクトル
Ａ，Ｂの加算において、ベクトルＡ，Ｂが疎ベク
トルであるとし、それぞれ第４図ａ，ｂに示すよ
うな非零要素の列とインデツクスの列によつて表
現されているものとする。説明のため、ベクトル
Ａの非零要素のみを格納する配列をAA、そのイ
ンデツクスを格納する配列をIAと名前をつける。
同様にしてベクトルＢに対してBB，IBと名前を
つける。この疎ベクトル間演算は、第５図の流れ
に従つて行なわれる。この演算では、Ｂの要素が
非零であれば、必ず結果がベクトルＡに格納され
ねばならないため、疎ベクトルＢに存在するイン
デツクスは、疎ベクトルＡの中にも存在するとし
ている。すなわち、ベクトルＡのインデツクスと
ベクトルＡのインデツクスを比較し、インデツク
スが一致すれば、そのインデツクスに対応するベ
クトルＡの要素とベクトルＢの要素の加算を行な
い、一致したインデツクスに対応したベクトルＡ
の要素に加算結果を代入し、ベクトルＡの次のイ
ンデツクスとベクトルＢの次のインデツクスの比
較を行なう。この様子を、疎ベクトルＡ，Ｂをア
クセスする２つの補助変数Ｉ，Ｊを用いて、もう
少し詳しくみると第５図に示すようになる。

第５図においてブロツク１０では、Ｉ，Ｊを初
期化している。ブロツク１１で、ＡのＩ番目のイ
ンデツクスとＢのＪ番目のインデツクスの値が一
致するか比較し、一致すれば、ブロツク１２へ進
み、それぞれのインデツクスに対応する要素を加
算し、結果を対応するＡの要素に代入する。次に
ブロツク１３でＩ，Ｊをそれぞれ１加算し、次の
要素を指すようにする。ブロツク１１の比較にお
いて、インデツクスの値が一致しなければ、ブロ
ツク１５へ分岐し、Ａの次のインデツクスを取り
出すためＩを１加算する。ブロツク１４では、変
数Ｊが配列BBの大きさ（疎ベクトルＢの非零要
素の数）を越えたかどうかを判定し、越えていれ
ば終了と判断し、越えていなければ再びブロツク
１１へ戻る。なおブロツク１５で、ベクトルＡの
インデツクスを取り出すためＩを１加算した後、
Ｉが配列AAの大きさ（疎ベクトルＡの非零要素
の数）を越えているかのチエツクを省略し、直ち
にブロツク１１へ戻るのは、ベクトルＢに存在す
るインデツクスは、必ずベクトルＡに存在すると
いう前提があるからである。このように、疎ベク
トルＡの要素と疎ベクトルＢの加算は、インデツ
クスの比較を待たなければならず、データを高速
に読み出し、次々と演算部に絶え間なく送り出す
ことができないので、パイプライン方式で、効率
よく処理することができず、パイプライン方式の
計算機の大きな欠点であつた。このため、パイプ
ライン方式の計算機の適用範囲が大きく制限され
ていた。

〔発明の目的〕

本発明は、上記事情に鑑みなされたもので、そ
の目的とするところは、疎ベクトルに対する演算
を、パイプライン方式の計算機で効率よく処理す
ることを可能ならしめるため、疎ベクトルの各要
素をパイプラインの演算器に、次々と間断なく送
り出すことができる疎ベクトル処理装置を提供す
ることを目的とする。

〔発明の概要〕

本発明は、疎ベクトルをその非零要素のみを第
１の記憶領域に連続的に格納し、そのインデツク
スを第２の記憶領域に格納することにより記憶せ
しむる装置において、疎ベクトル間の演算時に疎
ベクトルを一時格納する作業記憶装置と、該作業
記憶装置を零にクリアする手段と、前記第１の記
憶領域から疎ベクトルの非零要素と第２の記憶領
域から該要素に対応するインデツクスを読み出す
手段と、前記インデツクスより前記作業記憶装置
に対する番地を生成する番地生成手段と、前記第
１の記憶領域から読み出した要素を、前記作業記
憶装置の前記番地生成手段により生成した番地に
格納する手段と、さらに、前記第１の記憶領域か
ら読み出した疎ベクトルの非零要素と、前記作業
記憶装置の前記番地生成手段により生成した番地
から読み出した要素を、演算器に対するオペラン
ドとして送出する手段を有することにより構成さ
れている。

〔発明の効果〕

本発明によれば、疎ベクトル間の演算におい
て、その各要素を次々と間断なく演算装置に送出
することができ、パイプライン方式の計算機にお
いても、疎ベクトル間の演算の高効率、高速実行
が可能となる。また、このように従来のパイプラ
イン方式の計算機では、効率よく実行できなかつ
た疎ベクトルの処理を、本発明によるパイプライ
ン方式の計算機では高速に実行できるので、パイ
プライン方式の計算機を回路網解析や潮流計算な
ど疎ベクトルを扱う問題にも用いることができ、
その適用範囲を大きく広げることが可能となる。

〔発明の実施例〕

以下、本発明をその実施例に基づき詳細に説明
する。第６図は、本発明を適用して構成された疎
ベクトル処理装置の一実施例を示す構成図であ
る。２１は、疎ベクトルの非零要素のみ連続的に
格納している記憶装置、２２は、記憶装置２１に
格納されている非零要素のインデツクスを連続的
に格納している記憶装置、２３は、値をすべて零
にクリアする手段を有し、前記記憶装置２１の非
零要素を一時格納する作業記憶装置、２５は、前
記記憶装置２１から非零要素と前記記憶装置２２
からインデツクスを読出す読出制御部、２６は、
前記記憶装置２２から読み出したインデツクスか
ら前記作業記憶装置２３への番地を生成する番地
生成手段、２７は、疎ベクトル間の演算を行なう
パイプライン方式演算器、２８は、演算結果を格
納すべき記憶装置２１に対する番地を保持するカ
ウンタ、２９は、非零要素を記憶装置２１から読
み出すときに用いる番地と結果を格納するとき用
いる番地を切り変えるマルチプレクサである。

第６図の動作を詳しく説明する前に、この疎ベ
クトル処理装置により、疎ベクトル間の演算がど
のようにして行なわれるかを、第７図に示す例に
従つて説明する。第７図ａは疎ベクトルＡであ
り、５１にその非零要素、５２にインデツクスが
示されている。５１は第６図の記憶装置２１のＡ
＋１番地より連続的に、５２は記憶装置２２の
IA＋１番地より連続的に格納されている。第７
図ｂは疎ベクトルＢであり、同様に、５３，５４
は記憶装置２１，２２のＢ＋１番地、IB＋１番
地から連続的に格納されている。先にプログラム
１で示したベクトルＡ，Ｂの加算は、次のように
実行される。まずベクトルＢの非零要素５３をそ
のインデツクス５４に従い、作業記憶装置２３の
ある領域（B′＋１番地から始まるものとする。）
に、５５に示すように非零要素だけでなく、零要
素も含めた形式で格納する。この処理は、あらか
じめ作業記憶装置２３を零にクリアしておき、ベ
クトルＢの非零要素５３とそのインデツクス５４
を順々に読み出し、読み出した非零要素を、その
非零要素に対応したインデツクスにB′を加えた
作業記憶装置２３の番地に書き込む手順により簡
単に実行できる。つぎに、ベクトルＡに対し、そ
の非零要素とインデツクスを次々と読み出し、加
算を行なうわけであるが、この様子をもう少し詳
しく見てみよう。まず、ベクトルＡの最初の非零
要素１０とそれに対応するインデツクス１を、Ａ
＋１番地、IA＋１番地からそれぞれ読み出し、
読み出した非零要素１０に対応するＢの値を、読
み出したインデツクス１とB′を加えた値（B′＋
１）を番地として作業記憶装置２３より読み出
す。B′＋１番地には、疎ベクトルＢのインデツ
クス１に対応する値１０が入つており、Ａの非零
要素１０と加算して結果２０を得る。次に、Ａ＋
２番地、IA＋２番地の値１９，５を読み出し、
読み出したインデツクス５にB′を加えた値
（B′＋５）を番地として、作業記憶装置２３より
Ａの非零要素１９に対応するＢの値（この場合
０）を読み出し、２つの値を加算して結果１９を
得る。以下同様にして、疎ベクトルＡを次々に読
み出し、対応するＢの値を作業記憶装置２３より
読み出し、加算し、第７図ｄに示した結果が得ら
れる。この例で明らかなように、本発明によれ
ば、第５図のフローチヤートで示すように、逐一
インデツクスを比較することなく次々と加算すべ
きデータ（オペランド）を読み出し間断なく演算
器に送ることができ、パイプライン方式の演算器
を有効に活用することができる。

次に、第６図の動作の詳細な説明をする。疎ベ
クトルＡ，Ｂは、先に述べたように、非零要素を
記憶装置２１のＡ＋１，Ｂ＋１番地からそれぞれ
連続的に、インデツクスを記憶装置２２のIA＋
１，IB＋１番地からそれぞれ連続的に格納され
ている。このように格納されている非零要素とイ
ンデツクスを読み出すため読出制御部２５を用い
る。この２５は、疎ベクトルの非零要素とそれに
対応するインデツクスを順番に指定するためのカ
ウンタ３４と、非零要素が格納されている記憶装
置２１の領域を指定するためのレジスタ３２と、
インデツクスが格納されている記憶装置２２の領
域を指定するためのレジスタ３３と、カウンタ３
４とレジスタ３２の値を加算することによつて記
憶装置２１への番地を生成する加算器３０と、カ
ウンタ３４とレジスタ３３の値を加算することに
よつて記憶装置２２への番地を生成する加算器３
１から成る。

例えば、第７図に示した疎ベクトルＡの非零要
素とそのインデツクスを読み出すには、レジスタ
３２に非零要素の最初の番地から１引いた値Ａを
格納し、レジスタ３３にインデツクスの最初の番
地から１引いた値（IA）を格納し、カウンタ３
４に１を格納する。カウンタ３４の値が１でレジ
スタ３２の値が(A)であるので、加算器３０の結果
はＡ＋１となり記憶装置２１の番地とすることで
疎ベクトルＡの最初の非零要素を読み出すことが
でき、また、カウンタ３４の値が１でレジスタ３
３の値がIAであるので、加算器３１の結果はIA
＋１となり記憶装置２２の番地とすることで疎ベ
クトルＡの最初のインデツクスを読み出すことが
できる。疎ベクトルＡの２番目の非零要素とイン
デツクスを読み出すには、カウンタ３４の値を１
増し２とすることで、加算器３０の加算結果はＡ
＋２となり、記憶装置２１の番地とすることで疎
ベクトルＡの２番目の非零要素を読み出せ、加算
器３１の加算結果はIA＋２となり、記憶装置２
２の番地とすることで疎ベクトルＡの２番目のイ
ンデツクスを読み出すことができる。以下同様に
して、カウンタ３４の値を１増すことで、疎ベク
トルＡの非零要素と対応するインデツクスを次々
と読み出すことができる。なお、３５は、疎ベク
トルの長さ（非零要素の数）を格納するレジスタ
で、カウンタ３４の値がこの３５の値と一致すれ
ば、一連の疎ベクトルの読み出しが終つたことに
なる。３６は、この両者の比較を行う比較器で、
両者が一致すれば、一致信号線３７に一致検出信
号が送出され、疎ベクトルの読み出しが終了す
る。３８は、種々のレジスタ、カウンタにデータ
をセツトするバスである。このバス３８によりレ
ジスタ等にデータをセツトする回路は、通常の計
算機内でのレジスタのセツトと全く同様に構成で
き、さらに、本発明と直接関係がないのでここで
は説明しない。また、番地生成部２６は、作業記
憶装置２３に第７図ｃの形式で格納された疎ベク
トルをアクセスするためにその疎ベクトルを格納
している最初の番地から１引いた値を格納するレ
ジスタ３９と、レジスタ３９の値と記憶装置２２
から読み出したインデツクスを加算して作業記憶
装置２３への番地を生成する加算器４０から成
る。

本実施例によれば先に示したプログラム１の疎
ベクトル間の演算は第９図、第１０図のフローに
従つて実行される。第９図において処理は７０と
７１に分けられる。第１０図に示すように、まず
処理７０に必要なレジスタに初期値をセツトした
後処理７０を起動する。処理７０が終了すると、
次の処理７１に必要なレジスタに初期値をセツト
し、処理７１を起動する。

処理７０においては、記憶装置２２に収容され
ている非零要素のみからなる疎ベクトルＢを零要
素も含めたベクトルB′に展開して作業記憶装置
２３に書き込む。すなわち、第７図ｂに示される
ように、記憶装置２１のＢ＋１番地から非零要素
が格納され、記憶装置２２のIB＋１番地からイ
ンデツクスが格納されている疎ベクトルＢを、第
７図ｃに示されるように、零要素を含んだ形で作
業記憶装置２３のB′＋１番地から格納する。こ
れは次のように実行される。まず作業記憶装置２
３のB′＋１番地から格納するためにレジスタ３
９に値B′を格納する。さらに、疎ベクトルＢを
読み出すために、レジスタ３５にベクトルＢの長
さ３をレジスタ３２に値Ｂを、レジスタ３３に値
IBを、カウンタ３４に値１を格納する。この時、
作業記憶装置２３は、すべて零が格納されていな
ければならないが、その方法は後で詳しく説明す
る。カウンタ３４の値１とレジスタ３２の値Ｂを
加算器３０で加算した結果（Ｂ＋１）が記憶装置
２１の番地となり、記憶装置２１から疎ベクトル
Ｂの最初の非零要素１０を読み出す。また、カウ
ンタ３４の値１とレジスタ３３の値IBを加算器
３１で加算した結果（IB＋１）が記憶装置２２
の番地となり、記憶装置２２から疎ベクトルＢの
最初の非零要素に対するインデツクス１を読み出
す。読み出したインデツクス１は、番地生成手段
２６で、加算器４０によつてレジスタ３９の値
B′を加算され、作業記憶装置２３への番地B′＋
１となる。読み出した疎ベクトルＢの最初の非零
要素１０は、作業記憶装置２３の前記番地生成手
段２６によつて生成された番地B′＋１に格納さ
れる。次に、カウンタ３４の値が１つふえ２とな
ると、加算器３０の結果はＢ＋２となり、記憶装
置２１から疎ベクトルＢの２番目の非零要素２１
を読み出す。また、加算器３１の結果はIB＋２
となり、記憶装置２２から疎ベクトルＢの２番目
の非零要素に対応するインデツクス６を読み出
す。読み出したインデツクス６から、番地生成手
段２６によつて作業記憶装置２３の番地B′＋６
が生成され、読み出した疎ベクトルＢの２番目の
非零要素２１は、作業記憶装置の番地B′＋６に
格納される。以下同様にして、疎ベクトルＢを作
業記憶装置２３に格納して、第７図ｃに示す形式
に格納する。上記の疎ベクトルＢを作業記憶装置
２３に格納する処理は、レジスタ３５の値とカウ
ンタ３４の値が一致したことを、比較器３６で検
出することにより終了する。

処理７１における疎ベクトルＡ，Ｂの加算は次
に述べる手順で実行される。まず疎ベクトルＡを
読み出すために、レジスタ３５にベクトルの長さ
６を、レジスタ３２に値Ａを、レジスタ３３に値
IAを、カウンタ３４に値１を格納する。また、
演算結果の格納のために、カウンタ２８には値Ａ
＋１を格納する。カウンタ３４の値１とレジスタ
３２の値Ａを加算器３０で加算した結果Ａ＋１が
記憶装置２１の番地となり、記憶装置２１から疎
ベクトルＡの最初の非零要素１０を読み出す。ま
た、カウンタ３４の値１とレジスタ３３の値IA
を加算器３１で加算した結果IA＋１が記憶装置
２２の番地となり、記憶装置２２から疎ベクトル
Ａの最初の非零要素に対するインデツクス１を読
み出す。読み出したインデツクス１は、番地生成
手段２６で、加算器４０によつてレジスタ３９の
値B′と加算され、作業記憶装置２３への番地
B′＋１となる。読み出した疎ベクトルＡの最初
の非零要素１０は、作業記憶装置２３内の番地
B′＋１に格納された要素１０とともに、パイプ
ライン方式演算器２７に送られ加算が行なわれ
る。次に、カウンタ３４の値を１増し２となる
と、加算器３０の結果はＡ＋２となり、記憶装置
２１から疎ベクトルＡの２番目の非零要素１９を
読み出す。また、加算器３１の結果はIA＋２と
なり、記憶装置２２から疎ベクトルＡの２番目の
非零要素に対応するインデツクス５を読み出す。
読み出したインデツクス５から、番地生成手段２
６によつて作業記憶装置２３への番地B′＋５が
生成され、読み出した非零要素１９は、作業記憶
装置２３中の番地B′＋５に格納された要素０と
ともに、パイプライン方式演算器２７に送られ加
算が行なわれる。以下同様にして、疎ベクトルＡ
の非零要素を作業記憶装置２３から読み出した対
応するB′の要素とともにパイプライン方式演算
器２７に送る。これらの処理は、レジスタ３５の
値とカウンタ３４の値が一致したことを、比較器
３６によつて検出することにより終了する。パイ
プライン方式加算器２７で求まつた結果は、演算
器２７から出力される毎に、カウンタ２８を番地
として記憶装置２１に格納される。またこの時、
カウンタ２８の値は次の出力を格納するため１増
加される。以上の様に実行することによつて、記
憶装置２１にはＡ＋１番地から第７図ｄに示すよ
うに格納される。

以上のようなことから明らかなように、本発明
によれば、疎ベクトル間の演算においても演算器
にオペランドを間断なく送ることができ、パイプ
ライン方式の演算器を有効に動作させることが可
能となり、疎ベクトル間の演算も高速に処理する
ことができる。

さて、作業記憶装置２３は初期状態としてすべ
て零が格納されている必要があり、一度疎ベクト
ルの非零要素が格納されると、次の処理のために
その部分を零にもどす必要がある。このために、
作業記憶装置２３は、第８図に示すように、２つ
の記憶部６１―１，６１―２、スイツチ回路６
２、クリア回路６３からなる。スイツチ回路６２
は、外部端子６０を２つの記憶装置部６１―２〜
２の一方に接続するとともに、他方の記憶部にク
リア回路６３を接続するはたらきをする。すなわ
ち、実線で示した接続と破線で示した接続のいず
れかの接続形態をとる。なお、外部端子６０は、
この作業記憶装置としてアクセスする場合の端子
である。この回路は次のように動作する。いま、
記憶装置部６１―１が外部端子６０に、記憶部６
１―２がクリア回路６３に接続されており（すな
わちスイツチ回路６２が実線の接続状態であると
する）、この記憶部６１―２はクリア回路６３に
よつてすでに０が格納されているとする。疎ベク
トル間の演算において、零にクリアされた作業記
憶領域が必要となつた時に、スイツチ回路６２に
よつて、記憶部６１―２は外部端子６０に接続さ
れ、記憶部６１―１はクリア回路６３に接続され
る（すなわちスイツチ回路６２は破線で示す状態
とする）。記憶部６１―２が作業記憶領域として
用いられている間に、クリア回路６３によつて記
憶部６１―１は全番地に０が格納され、次の新た
な疎ベクトル間演算に対し零クリアされた作業領
域が準備される。このようにして、連続した疎ベ
クトル処理に対しても、初期状態としてすでに零
にクリアされた作業記憶領域を次々提供すること
ができる。なお、記憶部６１―１あるいは、６１
―２をすべて零にクリアする回路は、カウンタに
より次々と全番地をアクセスし零にクリアすれば
よく、当該業者には自明であるので詳しくは説明
しない。

疎ベクトルＢを作業記憶装置２３に格納する処
理が演算に先き立ち必要であるが、インデツクス
の比較処理よりはるかに高速であり、全体として
従来の本発明によらないパイプライン方式の計算
機に比べて高速処理できる。また、この疎ベクト
ルＢを作業記憶装置に格納する処理は演算器を必
要としないので、他の演算器を必要とする命令と
オーバーラツプさせ実行するように構成すること
もでき、さらに処理時間を短縮することも可能で
ある。

【図面の簡単な説明】

第１図はパイプライン方式加算器の構成図、第
２図はパイプライン方式加算器の処理を時間を横
軸にとつて示した図、第３図は疎ベクトルの格納
方法を示す図、第４図は疎ベクトル間演算を行な
う疎ベクトルの例を示す図、第５図は従来の疎ベ
クトル間処理のフロー示す図、第６図は本発明の
一実施例方式を適用した疎ベクトル処理装置の構
成図、第７図は本発明における疎ベクトルの処理
過程を示す図、第８図は作業記憶装置の構成図、
第９図及び第１０図は本発明の一実施例の動作を
示すフローチヤートである。３２，３３，３５，３９…レジスタ、３０，３
１，４０…加算器、２８，３４…カウンタ、２
１，２２…記憶装置、２３…作業記憶装置、２７
…演算器、６１―１〜２…記憶部、６２…スイツ
チ回路、６３…クリア回路。

Claims

【特許請求の範囲】

１零要素を含む疎ベクトルを、そのすべての非
零要素を少なくとも含む疎ベクトルの一部を第１
の記憶領域に連続的に格納し、該記憶領域に格納
されている要素が、前記疎ベクトルの何番目の要
素であるかを示すインデツクスを、第２の記憶領
域に格納することにより記憶せしむる装置におい
て、疎ベクトル間の演算時に疎ベクトルを一時格
納する作業記憶装置と、該作業記憶装置を零にク
リアする手段と、前記第１の記憶領域から疎ベク
トルの要素と第２の記憶領域から該要素に対応す
るインデツクスを読み出す手段と、前記インデツ
クスより前記作業記憶装置に対する番地を生成す
る番地生成手段と、前記第１の記憶領域から読み
出した要素を、前記作業記憶装置の前記番地生成
手段により生成した番地に格納する手段と、さら
に、前記第１の記憶領域から読み出した疎ベクト
ルの要素と、前記作業記憶装置の前記番地生成手
段により生成した番地から読み出した要素を、演
算器に対するオペランドとして送出する手段とを
有することを特徴とする疎ベクトル処理装置。