JPH0236029B2

JPH0236029B2 -

Info

Publication number: JPH0236029B2
Application number: JP58172439A
Authority: JP
Inventors: Shigeru Sasaki
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-09-19
Filing date: 1983-09-19
Publication date: 1990-08-15
Also published as: JPS6065377A

Description

【発明の詳細な説明】 (a) 発明の技術分野本発明は、アレイキヤツシユメモリを有し、１
つの命令で複数台の演算器が同時に動作する並列
計算機に関し、特に少ない演算回数で高速に相関
係数を求める２次元相関係数の並列処理方法に関
する。

(b) 技術の背景地震、気象、原子物理学等の分野では大規模な
シユミレーシヨンを実時間より速く行うため、数
十MIPS（１秒間に実行される命令の数を100万を
単位として表した数、通常ミツプスと読む）以上
の高性能計算機が必要である。これらの計算は、
従来の１台の装置で複数の処理を順番に行うシー
ケンシヤルな計算機では処理能力が不十分であ
り、並列処理によつて速度を向上させる必要があ
る。しかし、これらのものは特殊目的のものが大
部分であり、２次元相関係数を高速に並列演算処
理するのに必ずしも適したものではない。従つ
て、上記のような並列処理可能な高性能計算機の
特徴を有効に組合せ活用した２次元相関係数の高
速演算処理方法の開発が要望される。

(c) 従来技術と問題点相関係数の計算は統計処理、音声信号処理、画
像処理等に主に利用される。しかしながら、これ
らの処理を行うには膨大な情報量を取り扱うこと
になるため情報処理を高速に処理する必要があ
る。従来の情報処理方式を用いて上記の各種処理
を行う場合、(1)現在一般的に利用されているシー
ケンシヤルな計算機を用いる方式、(2)並列処理可
能な計算機の１つであるベクトルプロセツサを用
いる方式、(3)同じく並列処理可能な計算機の１つ
であるアレイプロセツサを用いる方式等がある
が、(1)の方式は本来の演算計算以上にアドレス計
算と情報転送が多くなり、高速化が期待出来な
い。又、(2)の方式は２次元状の情報を扱う場合に
情報構造を処理するのに困難な点があり、(3)の方
式は２次元並列演算をするのに各処理要素間で情
報転送するのに時間が掛かつてしまう等の欠点が
ある。

(d) 発明の目的本発明は、上記欠点を解消した新規な２次元相
関係数の並列処理方法を提供することを目的と
し、特にアレイキヤツシユメモリを有するSIMD
型計算機（SIMD型計算機は１つの命令で複数の
情報の演算を実行する計算機）を用いることによ
り、２次元情報の相関を演算（基本演算Σx、
Σy、Σx²、Σy²、Σxy）する際に、情報転送回数
と演算回数を減らし、高速計算が可能な２次元相
関係数の並列処理方法を実現することにある。

(e) 発明の構成本発明は、単一の命令で互いに同期して動作す
る複数の演算器をもつてなる並列計算機と、前記
複数の演算器にそれぞれ対応するメモリより並列
に１度に情報転送可能であり、且つメモリ間で演
算器の介入なしに情報転送を可能とするアレイキ
ヤツシユメモリとを備え、２次元相関係数演算に
おける複数の基本演算を、前記アレイキヤツシユ
メモリにて演算結果を並列アレイシフトしながら
１つの命令で並列演算処理することにより、情報
転送回数と演算回数を減らし、高速計算が実現出
来ることを特徴とする２次元相関係数の並列処理
方法により達成することが出来る。

(f) 発明の実施例以下本発明を図面を参照して説明する。

第１図は本発明に係るアレイキヤツシユメモリ
を有するSIMD型計算機の概要図、第２図は本発
明に係るアレイキヤツシユメモリの構成図で、Ａ
はメモリ要素間の結合図、Ｂは１メモリ要素の回
路図、第３図は本発明に係るアレイキヤツシユメ
モリのシフト状況図をそれぞれ示す。

図において、１は制御装置、２はSIMD型計算
機、３はアレイキヤツシユメモリ（以下ACMと
略称する）、４はデータマルチプレクサ、５はレ
ジスタ回路、６はアドレスマルチプレクサをそれ
ぞれ示す。

尚MEij（ME11〜ME84等）はACM３のメモリ
エレメント、PEi（PE1〜PE16等）はSIDM型ア
レイプロセツサの各処理要素（プロセツシングエ
レメント）、〜はACM３のシフト方向をそれ
ぞれ示す。

具体的な演算例を説明する前に、SIMD型計算
機２とACM３について図面を参照して説明する。

第１図に示すSIMD型計算機２は４×４の処理
要素をPEiを持つ例を示している。尚SIMD型計
算機２の各処理要素PEiは隣接処理要素間の接続
は無く、真下（点線で示す部分）のACM３の１
メモリエレメントMEijと結合しているのみであ
る。従つて各処理要素PEi間の情報転送は結合し
ているメモリエレメントMEijを介して行われる。

以上のようなSIMD型計算機２はこれらを管理
する制御装置１から同一の命令を受取り、同時に
同じ演算を並列実行することが出来る。

一方、ACM３はメモリエレメントMEijが４×
８の大きさで構成されており、この内４×４の部
分がSIMD型計算機２の各処理要素PEi（PE1〜
PE16）と接続されている。メモリエレメント
MEijは第２図Ａに示すように隣接エレメント間
の接続がなされている。即ち、メモリエレメント
MEijは隣接メモリエレメントME（ｉ−１、ｊ−
１）、ME（ｉ−１、ｊ）、ME（ｉ−１、ｊ＋１）、
ME（ｉ、ｊ−１）、ME（ｉ、ｊ）、ME（ｉ、ｊ＋
１）、ME（ｉ＋１、ｊ−１）、ME（ｉ＋１、ｊ）、
ME（ｉ＋１、ｊ＋１）とSIMD型計算機２とで結
合されている。但しｉ＝１〜４、ｊ＝１〜８。

又１メモリエレメントMEijは第２図Ｂに示す
通りで、10方向から送られてくる情報の内１つの
情報を選択するデータマルチプレクサ４、データ
マルチプレクサ４を一時的に格納するレジスタ
５、書込みアドレスと読み出しアドレスを選択す
るアドレスマルチプレクサ６とメモリエレメント
MEijから構成される。

第３図はACM３のシフトの状況を示す。即ち、
平面上シフト（１メモリセル分）、平面左シ
フト（１メモリセル分）、平面右シフト（１メ
モリセル分）、平面下シフト（１メモリセル
分）、深さ方向平面シフトの平面的なシフトを
同時に１回で行う。又SIMD型アレイプロセツサ
PEiに接続されてない４×４のACM３部分は、
全処理をパイプライン化する時に主記憶装置（図
示してない）からのデータを一時格納するバツフ
アメモリ部の役割りも果たす。

次に２次元相関係数の式は下記のように定義さ
れる。

定義式において、相関係数はΣXi、ΣYi、Σ
（Xi・Yi）、ΣX²i、ΣY²iを計算すれば良いことが
分かる。又Xiを相関を求めるための対象データ、
Yiを入力データとし、対象データ数をＮとする
とΣXiとΣX²iは本実施例では、全体の処理のう
ち最初の１度だけ計算すれば良いことになる。

〔共分散〕 Sxy＝Σ（Xi−Ｘ／―）（Yi−Ｙ／―）／Ｎ−１
＝１／Ｎ−１｛Σ（Xi・Yi）−（ΣXi）・（ΣYi）／Ｎ
｝〔相関係数〕 Rxy＝Sxy／（Sxx・Syy）^1/2 次に上記の定義式により基本演算（ΣXi、
ΣYi、Σ（Xi・Yi）、ΣX²i、ΣY²i）の計算例を下
記に説明する。

≪ΣXi、ΣX²iの計算≫ （前提条件）Ｎ＝16、ｉ＝１〜16とする。

（ステツプ−１）：制御装置１の指示により主記
憶装置（図示してない）から第１図に示す
ACM３の右の４×４部分（SIMD型計算機２
に接続されてない４×４のACM３部分）へデ
ータX1〜X16をロードする。

（ステツプ−２）：ACM３を平面左シフトを４
回行いACM３の左の４×４部分（SIMD型計
算機２に接続されている４×４のACM３部分）
へデータX1〜X16を移動する。

（ステツプ−３）：SIMD型計算機２の各処理要
素であるアレイプロセツサPEiにS1＝Ｘ、S2＝
X²を設定する。

（ステツプ−４）：ACM３を平面上シフトを１
回行う。

（ステツプ−５）：SIMD型計算機２の各処理要
素であるアレイプロセツサPEiで自分の下の
ACM３のメモリエレメントMEijからデータを
ロードし、S1＝S1＋Ｘ、S2＝S2＋X²とする。

（ステツプ−６）：（ステツプ−４）を行う。

（ステツプ−７）：（ステツプ−５）を行う。

（ステツプ−８）：（ステツプ−４）を行う。

（ステツプ−９）：（ステツプ−５）を行う。

（ステツプ−10）：ACM３を平面左シフトを１
回行う。

（ステツプ−11）：（ステツプ−５）を行う。

（ステツプ−12）：（ステツプ−10）を行う。

（ステツプ−13）：（ステツプ−５）を行う。

（ステツプ−14）：（ステツプ−10）を行う。

（ステツプ−15）：（ステツプ−５）を行う。

以上でSIMD型計算機２の各処理要素であるア
レイプロセツサPEi上にはS1＝ΣXi、S2＝ΣX²iが
求められている。

≪ΣYi、ΣY²i、Σ（Xi・Yi）の計算≫ 尚本例ではACM３の右の４×４部分（SIMD
型計算機２の各処理要素であるアレイプロセツサ
PEiに接続されてない４×４のACM３部分）を
パイプライン的に利用する。

（前提条件）Ｙ＝｛Yj｝、ｊ＝１〜ｍとする。

（ステツプ−１）：制御装置１の指示により主記
憶装置（図示してない）からACM３の右の４
×４部分（SIMD型計算機２の各処理要素であ
るアレイプロセツサPEiに接続されてない４×
４のACM３部分）へデータX1〜X16をロード
する。

（ステツプ−２）：ACM３の平面左シフトを４
回行いACM３の左の４×４部分（SIMD型ア
レイプロセツサPEiに接続されている４×４の
ACM３部分）へデータX1〜X16を移動する。

（ステツプ−３）：SIMD型計算機２の各処理要
素であるアレイプロセツサPEiでS3＝Ｙ、S4＝
Y²、S′5＝XYを設定する。

（ステツプ−４）：ACM３を平面上シフトを１
回行う。

（ステツプ−５）：SIMD型計算機２の各処理要
素であるアレイプロセツサPEiで自分の下の
ACM３のメモリエレメントMEijからデータを
ロードし、S3＝S′3＋S3、S4＝S′4＋S4、S5＝
S′5＋S5とする。

（ステツプ−６）：（ステツプ−４）を行う。

（ステツプ−７）：（ステツプ−５）を行う。

（ステツプ−８）：（ステツプ−４）を行う。

（ステツプ−９）：（ステツプ−５）を行う。

（ステツプ−10）：ACM３上のS′3、S′4、S′5を
SIMD型計算機２の各処理要素であるアレイプ
ロセツサPEi内にロードする。

（ステツプ−11）：ACM３を平面右シフトを４
回行う。

（ステツプ−12）：ACM３上にS′3、S′4、S′5を
セーブする。

（ステツプ−13）：ACM３を平面左シフトを１
回行う。

（ステツプ−14）：SIMD型計算機２の各処理要
素であるアレイプロセツサPEiで自分の下の
ACM３のメモリエレメントMEijからデータを
ロードし、S3＝S′3＋S3、S4＝S′4＋S4、S5＝
S′5＋S5とする。

（ステツプ−15）：（ステツプ−13）を行う。

（ステツプ−16）：（ステツプ−14）を行う。

（ステツプ−17）：（ステツプ−13）を行う。

（ステツプ−18）：（ステツプ−14）を行う。

以上で４×４のSIMD型計算機２の各処理要素
であるアレイプロセツサPEi上にはΣY、ΣY²、
ΣXYが求められている。

以上の例のような２次元情報の相関は、特に画
像処理において対象データＸと入力データＹとの
間で位置合わせを行うとか、類似度を計算すると
かの場合に非常に有効であり、頻繁に利用される
計算である。

本発明方法を用いて計算した場合と従来方法で
計算した場合（シーケンシヤルな計算機を用いる
場合）の各基本演算における演算回数とデータ転
送回数の比較を下記に示す。

≪ΣXi、ΣX²iの計算≫ 項本方法従来方法乗算回数１回 16回加算回数 12回 30回 ACMシフト 10回 − アドレス計算 − α ≪ΣYi、ΣY²i、Σ（Xi・Yi）の計算≫ 項本方法従来方法乗算回数２回 32回加算回数 18回 45回 ACMシフト 10回 − アドレス計算 − β 以上のように乗算回数、加算回数において計算
回数を減らすことが出来る。

(g) 発明の効果以上の本発明によれば、大量情報処理計算が必
要な相関係数を求める計算方法で、乗算回数、加
算回数等の計算回数を減らすことが出来、更に一
般のシーケンシヤルな計算機では乗算回数、加算
回数以上に計算回数を必要とするアドレス計算を
不要とすることにより、大幅に計算回数を減ら
し、高速に計算処理が出来る２次元相関係数の並
列処理方法を提供出来ると言う効果がある。

【図面の簡単な説明】

第１図は本発明に係るアレイキヤツシユメモリ
を有するSIDM型計算機の概要図、第２図は本発
明に係るアレイキヤツシユメモリの構成図、第３
図は本発明に係るアレイキヤツシユメモリのシフ
ト状況図をそれぞれ示す。図において、１は制御装置、２はSIMD型計算
機、３はACM、４はデータマルチプレクサ、５
はレジスタ回路、６はアドレスマルチプレクサを
それぞれ示す。

Claims

【特許請求の範囲】

１単一の命令で互いに同期して動作する複数の
演算器をもつてなる並列計算機と、前記複数の演
算器にそれぞれ対応するメモリより並列に１度に
情報転送可能であり、且つメモリ間で演算器の介
入なしに情報転送を可能とするアレイキヤツシユ
メモリとを備え、２次元相関係数演算における複
数の基本演算を、前記アレイキヤツシユメモリに
て並列アレイシフトしながら、１つの命令で並列
に演算処理することを特徴とする２次元相関係数
の並列処理方法。