JPS60167062A

JPS60167062A - ベクトル内積演算方式

Info

Publication number: JPS60167062A
Application number: JP2149984A
Authority: JP
Inventors: Sukenobu Akita; 秋田　典伸; Jiro Mikami; 三上　次郎; Hiroshi Ina; 伊奈　博; Minoru Tanaka; 稔田中
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1984-02-08
Filing date: 1984-02-08
Publication date: 1985-08-30
Also published as: JPH0320787B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔発明の技術分野〕本発明は、ベクトル計算ｇＫおける複数組の内積演３！
を高速で実行する方式に関する。

〔技術の背景〕

一般に、−次元配列（ａｊ）および（ｂｊ）（ｊ＝１．
　２．・・・・・・、ｎ）の内積Ｓは、Ｓ　＝　ａ１ｂ
１＋　ａ２ｂ２＋−−−−−−ｓ　＋　ａｎｂｎで与え
られる。

従来、汎用計算機上で以下のような二次元配列（ａｉｊ
）と−次元配列（５月によるｎ個の内積Ｓｔ　（量＝１
．２．・・・・・・＋”）をめる場合には、５ｉ（−−、Σ　ａ４３　Ｊ　（’＝Ｌ　２＋　”−＋
　ｎ）Ｊ＝１として割算を行なっていた。こわをベクトル計算機上で
行なうと（ａｉｊ）　と　（ｂｊ）　の積を計算するＶ
Ｍ命令とその結果の総和をとるＶＳＭ命令の２つの６令
をｎ回ずつ実行することが必要となる。

すなわち、ますＶＭ命令により（１）式の各ベクトル要
素間の私合計算し、次ｖｃＶｓＭ命令により、行ごとの総和をめ
るものである。しかし、ＶＳＭ命令は、ベクトル乗算■
Ｍ命令やベクトル加ｑＶＡ命令にくらべて実行に時間が
かかるという問題がある。

〔発明の目的および構成〕

本発明の目的は、複数組の内積を高速にめることにあり
、実行時間が長（なるＶＳＭ命令を使用しない演獅方式
を提供するものである。そのため、従来方式か２次元配
列（ａｊｊ）を行ベクトル（ａ　）、（ａ２ｊｌ　、　
・−・・・−＋　（ａｎｊ　）単位に演算を行なうＪもので慶）つたのに対して、列ベクトル（ａ　１１）　
ｒ　（ａ　Ｉ　２）　！・・・・・、　（ａ、ｎ）に注
目して演算を行なうことにより、連続的なベクトル演舞
を可能にして演算時間を短漸白する。

本発明の構成は、そわにより、二次元配列中の１つの列
ベクトルと一次元配列中の１つの要素とを乗算する手段
と、該乗算結果と前回までの行ごとの内積の途中結果と
を行ごとに順次加算する手段と、該加算結果を行ごとに
順次格納し、上記二次元配列の次の１つの列ベクトルと
一次元配列の次の１つの要素とを乗算する次の段階で上
記加算手段に前回までの行ごとの内積の途中結果として
与える手段とをそなえ、上記各手段を二次元配列の最後
の列ベクトルおよび一次元配列の最後の要素まで繰り返
し動作させ、各行ごとの内積を同時に得ることを特徴と
している。

〔発明の実施例〕

以下に、本発明の詳細を実施例にしたがって説明する。

本発明の１実施例方式では、前記（３）式を縦方向（列
方向）゛ニ分割して各行ベクトル要素を並列に１哩次累
算して行き、Ｓｉ　（ｉ＝１．２．・・・ｔ”）を同時
にめるようにする。こねは、次式で表ゎさゎる。

Ｓｉ　＝Ｓｉ　＋ｐ　ｂ・　（’　＝　’＋　２＋　・
”ｙ　ｎ）　（Ｊ　＝　’＋　２＋”’ｒ　”）　−（
４）Ｊ　Ｊすなわち、まず＃１回目にａ１□ｂ１ａ２□ｂ。

ａ　ｎｓ　ｂ　ｓをめ、第２回目Ｋ（ａ、□ｂ１＋ａ□２ｂ２）（ａ２□ｂ□十ａ２□ｂ２）（ａｎ１ｂ１＋ａｎ２ｂ２）をめ、以下同様にして、第ｎ回目に最終結果の内積（ａ□□ｂ□＋ａ１□ｂ２＋・曲面＋８１ｎｂｎ）（ａ
２□ｂ工＋ａ２□ｂ２＋・・・・川・・＋ａ２ｎｂｎ）
（ａｎ１ｂ１＋ａｎ２ｂ２°＋−＝・十ａｎｎｂｎ）を
得るものである。

伊１第１図は不実施４方式の動作弱側御であり、１乃至４は
そわぞわベクトルレジスタＶＲＩ乃至ＶＲ４を示し、５
はスカラレジスタＩ（、Ａ、６は乗算バイブライン、７
は加算バイブラインを示す。また■乃至■は動作順序を
表わしている。動作は次のように行なわれる。

予めｖＲｔｒは、１番目の列ベクトルデータ（ａ、ｊ）
がセットさね、ＲＡＫはｂｊ　が、ＶＲ，３には前回の
累ｑ結果のベクトルデータが格納さねている。

■　ベクトル・スカラ乗算ＶＭＳ命令により乗算バイツ
ーライン６を起動し、ｖｔｔｉのベクトルデータ（ａｉ
ｊ）に）ＬＡのスカラデータ　ｂ、を乗算し、結果をＶ
Ｒ２に格納する。

■　ベクトル加ＸｖＡ裔令により加算パイプライン７を
起動し、ＶｆｔｚとＶＦＬ３のベクトルデータを加算し
、結果をＶＲ４に格納する。

■　Ｖｌ−ｔ４の訪しい累算結果のベクトルデータを次
の累ｇｃそブよえてＶ）Ｌ３へ転送する。

ここで、Ｖ）Ｌｌ、Ｉｔ　Ａの各内容をｊ＋１１−１目
のデータで更新しておき、上記■乃至■の過程を練り返
すことにより最後にＶＲ３またはＶ　Ｒ４にｎ個の内積
を同時的に得ることができる。

第１図の実施例方式では、各列ベクトルごとの累算ステ
ップの途中結果はＶ　Ｒ４に格納される。

ところが、ベクトル命令（この賜金はＶＡ命令）では、
被演算レジスタと結果を格納するレジスタとは共用宅き
ないので、最初に使用される加算パイプライン７の出力
結果については、■Ｒ４Ｖｃいったん結果を格納し、そ
Ｏ後転送台令によりＶＲ４の内容をＶＲ３に移す必太か
ある。

第２図は本発明の他の実施例方式であり、第１図の実施
例方式における転送命令の使用を不要にしたものである
。本実施例では、前記（４）式の代りに次式を用い、連
続する２つの列ベクトル（ａＩｊｂｊ）および（町、　
ｊ＋１　ｂｊ＋４　）ずつ同時に累算する。

（Ｓｉ　＝　Ｓｉ　＋　ａＨｂｊ＋　ａ、　、ｊ＋１ｂ
ｊ、爪Ｉ−１，２，・・・、ｎ））（Ｊ””１＋３ｓ’
＋”’＊”　’）　”””　（５）そのため、ＶＲ４の
内容（Ｓｉ＋ａ１ｊｂｊ）は、直接ＶＲ３へ転送されず
、加算パイプライン７でＶＲ６の内容（ａｉｌ　Ｊ＋□
ｂ、＋□）と加算し、その結果出力としてＶＲ３へ格納
される（このときＶＲ３は空きである）、そのため、特
別な転送命令は不要となり、演算は高速化される。図中
の■乃至■は動作順序を示している。

〔発明の効果〕

以上のように、本発明によりは、ベクトルの複賂組の内
積演算がＶＭ命令およびＶＡ命令のみによって実行でき
、ＶＳＭ命令は使用されないので、従来方式に（らべて
処理時間を大幅に短縮することができる。

【図面の簡単な説明】

第１図および第２図はそわそわ本発明方式の異なる実施
例を示す。図中、工乃至４はそＪｌぞわベクトルレジスタＶＲＩ乃
至Ｖ　Ｒ，４を示し、５はスカラレジスタ貼、６′は乗
算パイプライン、デは加算パイプラインを示す。また１
１．　２／はそわぞわベクトルレジスタＶＲ５、ＶＲ６
を示し、６′は乗算パイプライン、７′は加算パイプラ
インを示す。特許出願人　富士通株式会社代理人弁理士　長谷用文廣（外１名）

Claims

【特許請求の範囲】

二次元配列中の１つの列ベクトルと一次元配列中の１つ
の要素とを乗算する手段と、該乗算結果と前回までの行
ごとの内積の途中結果とを行ごとに順次加算する手段と
、該加舞結果を行ごとに順次格納し、上記二次元配列の
次の１つの列ベクトルと一次元配列の次の１つの要素と
を乗算する次の段階で上記加算手段に前回までの行ごと
の内積の途中結果として与える手段とをそなえ、上記各
手段を二次元配列の最後の列ベクトルおよび一次元配列
の最後の要素まで繰り返し動作させ、各行ごとの内積を
同時に得ることを％徴とするベクトル内積演算方式。