JPS63238653A

JPS63238653A - データ処理装置とその処理方法

Info

Publication number: JPS63238653A
Application number: JP62298606A
Authority: JP
Inventors: Junichi Takahashi; 淳一高橋; Takashi Kimura; 隆木村
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1986-11-27
Filing date: 1987-11-26
Publication date: 1988-10-04
Anticipated expiration: 2012-08-06
Also published as: JP2637749B2; EP0269995A3; DE3786330D1; EP0269995A2; EP0269995B1; US5138704A; DE3786330T2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（発明の属する技術分野）本発明は、データ処理装置間でのデータ通信を伴うシス
テムのデータ処理において、データ処理’Ａ置間のデー
タ転送処理と各データ処理装置でのデータ演算処理とを
並列に行なうための技術に関するものである。

（従来の技術）従来、データ処理装置間でのデータ通信を伴うシステム
のデータ処理の一例としての、アレイプロセッサにおけ
るデータ演算処理では、処理要素間のデータ転送処理に
おいて、データ送・受信及びデータ演算処理は処理要素
の共通のデータ格納領域（メモリ等）を使っていたため
、処理要素間のデータ授受を待ってデータ演算処理を実
行しなければならなかった。

そのため、データ転送とデータ演算処理を交互に繰り返
し行わなければならなかった。特に、ベクトルデータの
転送を伴う行列乗算等の処理では転送データ量が多いた
め、アレイプロセッサの処理速度は処理要素間のデータ
転送のオーバヘッドにより低下するという欠点があった
。

例えば、第１６図に示すようなアレイプロセッサで、行
列Ａ、Ｂの乗算処理を実行する場合について説明する。

各処理要素は、行列Ａの成分データの受信、送信及びデ
ータ演算処理用に共通のデータ格納領域をもち、また、
行列Ｂの成分データの受信及び演算ユニットへのデータ
供給及び演算結果の受は取り用のデータ格納領域をもつ
。

（Ｑ、ｍ）行列Ａ　＋　（ｍ　＋　ｎ　）行列ＢをＡ　
＝＝（Ｑｉ’、　ｎ２’、　”’Ｈｎｉ’、　”・［１
７’）’　；　（１≦ｉ≦Ｑ）Ｂ＝（Ｔｏ、、　ｂ２．
−、　Ｔｏ、、−、Ｔｏ、）　；　（１≦Ｊ≦ｎ）と定
義すると１行列Ｃ＝ＡＸＢの５列ベクトルＣ４はｃ、”
＝（ｃｍｊ＋　ＱｚＪ＋　”’＋　Ｑ目＋　”’ｔ　Ｑ
ｔｒ）＝（（ｉ％Ｔ）　ｊｙ　ｎ２・Ｔｏ　４．　”’
、　（Ｌｌ’Ｔｏ４．　”’ｇ　［ｌＬｚ”ｂ４）で表
わされる。

従って１行列Ａを表わすベクトルデータ列（ｎ　、）と
行列Ｂを表わすベクトルデータ列（ｂ、）を第１６図に
示すようなデータフローに従ってアレイプロセッサに入
力することによって、各処理要素において行列Ｃの各成
分をパイプライン処理で計算できる。

Ｑ＝５．ｎ＝５の場合の処理動作例を第１７図Ａないし
第１７図Ｃに示す。

この例では、データ授受とデータ演算処理のデータ格納
領域を共有しているため、処理要素間のベクトルデータ
の転送とベクトルデータ間の内積演算はシリアルに行わ
れる。

例えば、時刻３においては、ＰＥＩはデータｏ２を入力
すると同時にそれまで保持していたデータ０工をＰＥ２
に転送する。さらに、ベクトルデータ間工を入力する。

ＰＥ２はこれと同時にＰＥＩからデータ０□を受信し、
外部からベクトルデータＴｏ、を入力する。

時刻４においては、時刻３で入力したデータに対して内
積演算処理を実行する。上記のような処理では、処理要
素間のデータ転送に要する時間がオーバヘッドになり、
処理の高速化が図れない。

（発明の目的）本発明の目的は、上記のようなデータ処理装置間でのデ
ータ通信を伴うシステムのデータ処理において、データ
処理装置間のデータ転送処理と各データ処理装置でのデ
ータ演算処理とを並列化し。

データ処理装置間のデータ転送に要する時間のオーバヘ
ッドを低減し、上記のシステムの並列処理の高効率化を
達成できるデータ処理装置を提供することにある。

（発明の構成）本発明装置は、１）データ受信端子を介して外部からデータを受信する
データ受信用のデータ格納領域、２）データ送信端子を
介して外部へデータを送信する送信データ用のデータ格
納領域、３）演算実行ユニットに対するデータの供給並
びに演算結果の受取りを行うためのデータ演算処理用の
データ格納領域をもち、上記の各データ格納領域は互いに排他的かつ循環的にデ
ータ受信用、データ送信用、データ演算処理用に切り換
わることができ、上記の各データ格納領域のデータ受信、データ送信、デ
ータ演算処理の各役割の切り換えを制御する手段と、所望の演算を実行する手段と、演算内容を制御する手段を有するデータ処理装置であっ
て、データ処理装置間のデータ通信を伴うシステムでの
データ処理におけるデータ通信時間のオーバヘッドを低
減し、処理速度の向上を図るものである。

（実施例）以下、本発明の実施例の図面を用いて１発明の詳細な説
明する。

［実施例１コ（１２，ｍ）行列Ａと（ｍ、ｎ）行列Ｂの乗算を一次元
アレイプロセッサで処理する例を示す。

行列Ａ、ＢをＡ＝＝（ｎ１’、　ｎ２’、　”’ｇ　（Ｌ　ｌ’ｔ　
”’ＨＱ、？）’　Ｈ（１≦ｉ≦Ω）ｎ＝（Ｔｏ、、　
Ｔｏ、、　・−・−、ｂ、、　＝・、　ｂａ）　；　（
１≦ｊ≦ｎ）と定義する。ここで、　［Ｌｉ、　Ｔｏｊ
はそれぞれ行ベクトル、列ベクトルでｒＸ！”（ａ　ｉｌｌ　ａｉｔｓ　”’ｔ　８１＋　”
’ｌ　ａＩ＋ｅ装置ベクトルを表わす。

行列Ｃ＝ＡＸＢ、Ｃの（ｉ、ｊ）成分をＣｉｊで表わす
とするとｃｌ、＝Σａ　１　ｋｂ　ｙ　４　”　（１１”Ｄ　ｊ
　（’は内積演算）である。

行列Ｃの５列ベクトルをｃｊ′＝（０１３２０ｍ、・・・＋ＱｉＪ＋　・・、ｃ
ｒｔ）；（１≦ｊ≦ｎ）と定義すると、ＣＩ′＝（０１＋ＴｏＪＩＱｚＴＴｏ１．°°゛ｔΩｉ
’Ｊ、　”’、　ｎ／”Ｔｏｊ）である。

第１図に示すｎ個の処理要素からなる一次元アレイプロ
セッサで、行列Ｃを求める場合のアレイプロセッサの処
理動作を、Ｑ＝：ｎ＝＝５の場合にっいて第２図Ａ、第
２図Ｂに示す。上記のアレイプロセッサに人力されるデ
ータは、ベクトル列（０工。

ｏ２．・・・、０．）及びベクトルデータ列（Ｔｏｌ、
ｂ２．・・・。

！ｂｏ）である。

第３図は本発明を処理要素の構成にもつ一実施例を概略
的に示すブロック図であり、１，２．３はデータ格納領
域、４は演算実行ユニット、５はコントロールユニット
、６はデータ受信端子、７はデータ送信端子、８，９は
レジスタを示す。

各処理要素は、本発明の構成であるデータ受信用、デー
タ送信用、データ演算処理用のデータ格納領域をもち、
それらの容量は各ベクトルデータを格納できる大きさ、
すなわち、ｍ個のデータ格納領域をもつ。

各処理要素はまた、ベクトルデータ列（Ｔｏｌ、！ｂ、
、。

・・・、ｂｌ）の各ベクトルデータ並びに演算途中結果
を格納するためのデータ格納領域をもち、内積演算を実
行する手段、データ授受並びに上記のデータ格納領域の
各々のデータ受信、データ送信、データ演算処理の各役
割を制御する手段をもつ。

第２図Ａ、第２図Ｂの動作例では、各ベクトルデータ列
を互いに同期させて、各処理要素にパイプライン転送す
る規則的なデータフローにより、各処理要素は並列に行
列Ｃの各成分の演算処理を行う。

各処理要素の各データ格納領域は、各時刻毎に第６図に
示されるように１次のような循環的な各役割の切り換え
を行う。（ここで、時刻の単位は行列Ｃの各成分計算ま
たはベクトルデータ転送に要する時間とする。）具体的に、時刻３，４，５でのＰＥＩの３面のデータ格
納領域の処理動作について説明する。

時刻３において、データ受信用でベクトルデータｏ３を
受信したデータ格納領域は、時刻４でデータ送信用にな
り、このデータをＰＥ２に転送する。また、時刻５にお
いてデータ演算処理用になり、このデータ０．と時刻１
において入力し、保持されたベクトルデータＴｏｌとの
内積演算処理に使われる。

一方、他の２つのデータ格納領域は、時刻３において、
それぞれベクトルデータ０□とベクトルデータｌｂ、と
の内積演算処理用のデータ格納領域（データ演算処理用
）、時刻２で受信したベクトルデータｏ２をＩ）　Ｅ　
２へ転送するデータ送信用のデータ格納領域（データ送
信用）である。

また１時刻４においては、それぞれバク１−ルデータ０
４のデータ入力用のデータ格納領域（データ受信用）、
ベクトルデータ０−２とベクトルデーモ演算処理用）で
ある。

時刻５においては、それぞれベク１へルデータｏ４をＰ
Ｅ２へ転送するデータ送信用のデータ格納領域（データ
送信用）、ベクトルデータ０．の入力用のデータ格納領
域（データ受信用）として使用される。

このような行列乗算の処理では５本発明のデータ受信、
データ送信、データ演算処理の３つの役割が互いに排他
的かつ循環的に切り換わるようなデータ格納領域の構成
により、常に処理要素内での内積演算処理と処理要素間
のデータ転送処理を並列に実行でき、アレイプロセッサ
での処理要素間のデータ転送に要する時間のオーバヘッ
ドを低減して効率的な処理が達成できる。

以下１本実施例による効果を定量的に評価する。

内積演算処理に要する時間をｔＰ＋ベクトルデータ０．
またはＴｏ、の入力または転送に要する時間をｔｌｒ＋
アレイプロセッサ全体で演算処理を開始するまでに必要
となるデータの初期ロードに要する時間をｔｏと定義す
ると、（Ｑ、ｍ）行列Ａと（ｍ、ｎ）行列Ｂの乗算処理
に要する時間Ｔは、Ｔ＝ｔ６＋（Ｒ＋ｎ）Ｘｍａｘ［ｔ
ｐ、　　ｔ、、コ−（１）で表わされる。ここで、ｍａ
ｘ［ｘ＋　ｙｌはＸｔ　ｙのうちの最大値を表わす、ｔ
Ｐ≧ｔｊｒの場合には、式（１）は’Ｌ”　＝　ｔ　、
　＋　（Ｑ　＋　ｎ　）　ｔ　ｐであり、データ転送処
理が演算処理に隠され、総時間は演算処理時間だけに依
存する。

また、１　、＜　１　、、の場合には、式（１）はＴ＝
ｔｏ＋（Ｑ＋ｎ）ｔ、、であり、データ演算処理がデー
タ転送処理に隠され、総時間はデータ転送処理だけに依
存する。

演算処理とデータ転送をシリ゛アルに実行する手段、す
なわち、データ転送用のデータ格納領域とデータ演算処
理用のデータ格納領域を共有し、データ転送用とデータ
演算処理用の各役割を時分割して用いる従来の技術では
行列の乗算処理に要する総時間Ｔ′は、Ｔ’＝ｔ、’＋（Ｑ＋ｎ）Ｘ（ｔ、＋ｔ、、）　　・＝
　（２）で表わされる。

式（１）、　（２）より式（３）の分母、分子の第一項のｊｏ’＋　ｊＯは第二
項である。

従って、式（４）よりＴ≦Ｔ′であり５本発明の構成に
より、従来よりも高速の処理を達成できる。

ｔｐ”ｔａｒの場合には、従来の２倍の処理速度向上を
実現でき得る。

次に、コン１〜ロールユニツ１〜の具体例について説明
する。

コントロールユニットのブロック回路図を第５図に示す
。なおこのコントロールユニットは本発明の全実施例に
共通する。Ａｄｄｒｅｓｓ　Ｃｏｕｎｔｅｒ　１　。

２．３は、各データ格納領域■、■、■をアドレシング
するカウンタで、Ｂａ５ｅ　Ａｄｄｒｅｓｓ　Ｒｅｇ、
　　１　。

２．３はこれらのＡｄｄｒｅｓｓ　Ｃｏｕｎｔｅｒのア
ドレス値との比較対象となるデータを保持するレジスタ
である。各Ａｄｄｒｅｓｓ　Ｃｏｕｎｔｅｒと対応する
Ｂａ５ｅＡｄｄｒｅｓｓ　Ｒｅｇ、との値は、−数棟出
回路によって比較される。各−数棟出回路は、アドレス
値の一致を示すフラグを発生する。各−数棟回路の出力
するフラグは、各データ格納領域の役割に対応して、デ
ータ送信、データ受信、データ演算用の各格納領域に対
するデータの授受動作状態を表わすフラグとして定義で
き、各マルチプレクサは、各々データ送信状態、データ
受信状態のフラグを切換え、これを送信状態フラグ（Ｓ
Ｆ）、受信状態フラグ（ＲＦ）としてモードコントロー
ル制御回路に送る。これらのフラグは、データ送信また
は。

受信状態にあるデータ格納領域がデータの送信または、
受信を完了したことを示すものである。

詳細には、各Ａｄｄｒｅｓｓ　Ｃｏｕｎｔｅｒに送信ま
たは受信するデータ群の初期アドレスを、対応する！３
ａｓｅ　Ａｄｄｒｅｓｓ　Ｒｅｇ、にその！＃アドレス
を設定し、Ｃｏｕｎｔｅｒはデータを１つ送信または受
信するごとにインクリメントし、三の値が［１ａｓｅ　
ＡｄｄｒｅｓｓＲｅｇ、に一致したところでインクリメ
ン１ル動作を終了し、一致のフラグが検出され、送信ま
たは受信が完了する。

モードコントロール制御回路は、各データ格納領域の役
割状態を制御する。

制御信号ＭＣ（Ｍｏｄｅ　Ｃｈａｎｇｅ　Ｓｉｇｎａｌ
）は、各データ格納領域の役割遷移を起動する信号であ
り、Ｓｒ１．Ｓｒ１はそれぞれ、玉状ｔ（循環状態遷移
。

六状態循環状態遷移（後述する）の各過程を指定する制
御信号である。制御信号Ｐｎ、Ｒｎ、５ｎ（ｎ＝１，２
．３）は、それぞれのデータ格納領域（ｎ＝１の時は■
、ｎ＝２の時は■、ｎ＝３の時は■）のデータ演算用、
データ受信用、データ送信用の役割状態に示す信号であ
る。制御信号ＭＤＦは入状態循環遷移の制御を行う信号
である。

デコー回路は、モードコントロール制御回路から各デー
タ格納領域の役割状態を示す制御信号とデータ演算処理
時のデータ格納領域の書込み、読出しを示す制御信号Ｗ
Ｒ，ＲＤ及びデータ送・受信時の書込み、読出しを示す
制御信号ＡＳＷＲ。

ＡＳＲＤとから個々のデータ格納領域のデータ読出し、
書込みイネーブル信号ＲＥＮｎ、ＷＥＮｎ（ｎ＝１．２
．３）を発生する。

第６図に、モードコントロール回路の詳細論理図を示す
。

ＢＭｎ　（ｎ＝１．２．３）は、各データ格納領域の役
割状態を表し、Ｐｎ、Ｓｎ、Ｒｎ　（ｎ＝１’。

２．３）のいずれかが、”）ｌｉｇｈ”であることを示
す。レジスタＩＩ〜１６は、各データ格納領域の、■。

■の役割状態値を制御するレジスタ群で、データ格納領
域■の状態はレジスタ１１，１４、■の状態はレジスタ
１２．１５．■の状態はレジスタ１３．１６、の各レジ
スタ値によって定義される（データ演算用に対しては１
１１１”、データ受信用に対しては′１１０１＋、デー
タ送信用に対しては′０１”）。また、このレジスタ群
において、［Ｆ］は、リセット時に初期値″１”を保持
し、■は“０″を保持するレジスタである。レジスタ１
１〜１３．レジスタ１４〜１６は、シフトレジスタとし
て動作する。

第７図にデコーダ回路の論理図を示し、第８図。

第９図に王状態循環遷移制御、入状態循環遷移制御にお
けるモードコントロール回路の動作のタイムチャートを
示す。

第８図において、各データ格納領域の状態値を示すシフ
トレジスタは、制御信号ＭＣが１マシンサイクル入るご
とにシフト動作し、各データ格納領域の状態を示す信号
ＢＭｎ　（ｎ＝１．２．３）が互いに排他的に変化し、
三状態循環遷移を実現する。

第９図においては、各データ格納領域の状態値を示すシ
フトレジスタは、制御信号ＭＣが２マシンサイクル入る
ごとに１回シフト動作し、制御信号ＭＤＦは、制御信号
ＭＣが１マシンサイクル入るごとにセットまたはリセッ
トされる。制御信号ＭＤＦがｔｉＬｏ、＋″の時は、各
データ格納領域の状態は、ＢＭｎ　（ｎ＝１．２．３）
の値により定義し、ＭＤＦが“ｌｌｉｇｈ”の時は、Ｂ
　Ｍ　ｎ　＝　Ｐ　ｎのデータ格納領域をデータ演算の
データ読出し専用に、Ｂ　Ｍ　ｎ　＝＝　Ｓ　ｎのデー
タ格納領域をデータ演算のデータ書込み専用の役割状態
として定義することにより、二面のデータ格納領域をデ
ータ演算の読出し、書込み専用に割当てる状態と、各々
のデータ格納領域をそれぞれデータ演算用、データ受信
用、データ送信用に割当てる状態とをＭＣが１マシンサ
イクルごとに交互に切換え、入状態循環遷移を現実する
。

口実流側２］たたみ込み演算を一次元アレイプロセッサで実行する例
を示す。

重み係数データ列をＷ　”（ｗ、、　ｗ２．　’−，ｗ
ｋ）。

入力データ列をＸ＝（ｘ、、ｘ、、・・・、　ｘ、、）
とすると、たたみ込み演算は ’Ｉ　＋　：ＷＬＸ　Ｉ＋　Ｗ２　Ｘ　ｉ＋１　＋”°
°”　＋　ＷｋＸ　１ｎｋ−ｓで表わされる。

本実施例に対する本発明の構成を第５図に示す。

処理要素は第３図の構成をもつ。ここで、データ受信、
データ送信、データ演算処理用の各役割を担うデータ格
納領域はレジスタである。

第１０図に示すようなに個の処理要素からなる一次元ア
レイプロセッサでのたたみ込み演算処理の動作を、ｋ＝
５、ｎ＝７の場合について第１１図Ａ。

第１１図Ｂに示す。

ここで、各処理要素は本発明の構成である上記の３種類
の役割を担うデータ格納領域（この例では、各データが
スヵラデータであるので、各データ格納領域はレジスタ
でよい）をもち、乗算及び加算の機能、各データ格納領
域の処理モード及びデータ授受の制御手段をもつ。

また、入力データＸのデータ格納領域をもち。

この格納領域は外部からのデータ六カとデータ演算処理
用に同時に用いることができるものとする。

さらに、演算途中結果の格納、保持する手段をもつもの
とする。

各々データ格納用レジスタは、データ受信、データ送信
、データ演算処理の各役割を互いに排他的かつ循環的に
切り換えることができる。

具体的に、時刻４，５，６でのＰＥＩの各データ格納用
レジスタの動作について説明する。

時刻４において、データ受信用でｗ４を受信したデータ
格納用レジスタは、時刻５においてデータ送信用になり
データｗ４をＰＥ２に送信する。

また、時刻６において、データ演算処理用になり、時刻
４で人力し、保持されているｘ４との乗算用に使用され
る。ここで、時刻５で入力データｘ、１を人力した入力
データ用格納領域は、時刻６でデータ演算処理用として
使用される。

一方、他の２つのデータ格納用レジスタは、時刻４にお
いてそれぞれｙｏの成分ｗ２ｘ２の乗算処理用（データ
演算処理用）、時刻３で入力したデータＷ、をＰＥ２へ
転送するデータ転送用（データ送信用）として使用され
る。

また１時刻５においては、それぞれ、データ受信用での
データｗ５の入力用、データ演算処理用でのｙ工の成分
ｗ３　Ｘ３の乗算処理用として使用される。

時刻６においては、それぞれ時刻５で入力したデータｗ
５をデータ送信用でＰＥ２に送信、データ受信用で空デ
ータの受信用として使用される。

人力データ列Ｘは、各時刻毎に全処理要素に同時転送さ
れる。

上記のように、たたみ込み演算処理では、本発明のデー
タ受信、データ送信、データ演算処理の３種類の役割が
互いに排他的かつ循環的に切り換わる。

データ格納領域の構成により、常に処理要素でのｙ、の
成分計算と処理要素間のデータ転送処理が並列に実行で
き、アレイプロセッサ上で処理要素間のデータ転送のオ
ーバヘッドなく、ｙ、の演算がパイプライン並列処理で
実現できる。

演算結果は時刻７，８．９において、それぞれ１）　Ｅ
　ｌではｙ□、ＰＥ２ではｙａｔＰＥ３ではｙ。

が得られる。

以下、本実施例の効果を定是的に示す。データｗｐ（１
≦ｐ≦ｋ）を入力、転送するために要する時間をｔｌｒ
、各処理要素で乗算ＷｐＸ＋＋ｐ−ｘ及びこの時刻まで
の計算結果Σ　ＷｐＸｉ、、−□とこの乗算結果の加算
に要する時間を１．とすると、結果ｙ。

を求めるためにかかる総時間′ｒは、Ｔ＝ｔ６　＋　（ｋ　＋　（ｎ　＋　１　　　ｋ））Ｘ
ｍａｘ［ｔ、　、ｒ＊　ｔｐ］＝　　ｔ　０＋（ｎ　　
＋　　１）Ｘｍａｘ［ｔ　　Ｉｒｌ　　ｔ、コ−＝−（
５）で表わされる。ここで、ｔｏは初期データロードに
要する時間であり、ｍａｘ［ｘ、　ｙｌはＸｔ　ｙのう
ちの最大値を表わすものとする。

本実施例に示すたたみ込み演算処理では、処理要素間の
データ転送は１個のスカラデータ転送であるので、ｔｌ
ｒ＜ｔｐである。従って、Ｔ＝ｔ、）＋（ｎ＋１）Ｘｔ
、　　・・・・・・・・・・・・・・・・・・（６）従
来の演算処理とデータ転送をシリアルに行う技術では、
総時間Ｔ′はＴ’＝　ｔ０’＋（ｎ　＋１）（ｔ、＋　ｔ　ｔｒ）　
　−・・・・・（７）である。

式（６）、　（７）より、Ｔ’　　ｔＰ＋ｔ・・＝１＋工土Ｌ・・・・・・・・・
・・・・・（８）′ｒ　　　　ｔ　、　　　　　　ｔ　
。

式（８）より、’１’＜Ｔ’であり１本発明の構成によ
り処理速度は（１＋互ユ）倍向上する。

１゜［実施例３］音声認識処理のＤＩ）（ダイナミックプログラミング）
に基づくパターンマツチング処理におけるベクトル距離
計算を、本発明の構成を搭載した処理要素（ＰＥ）から
成る一次元アレイプロセッサで実行する例を示す。

このベクトル距離計算（以後、ｄ算計と呼ぶ）は、ｄ　
ｉ＋ｊ＝Σｌ　ｕ＋１に−１１”ｊ’１２で表される。

ここで、ｌ＋　ｊは、マツチングする人カバターンデー
タ時系列（ｕｌ）の第ｉフレーム、標準パターンデータ
時系列（ｒ、）の第ｊフレームを表し、ｋは各バク１〜
ルデータの次数を表す。

具体例として、ｉ＝５．ｊ＝５の場合をＰＥ数＝５の一
次元アレイプロセッサで処理する場合について説明する
。

各ＰＥで実行するｄ計算の処理フローを第１２図Ａない
し第１２図Ｃに示す。各ＰＥは、三面のデータ格納領域
の他に演算実行ユニツ１−とのデータ授受を行なうこと
のできるワーキング用のデータ格納領域をもち、外部の
バスからデータを入力することができる。

各ＰＥは、バスから標準パターンデータを人力してこれ
をワーキング用のデータ格納領域に格納し、三面のデー
タ格納領域構成を使ったパイプライン処理によって人カ
バターンデータを人力する。

この処理フローは、一つのｄ計算に要する処理時間を時
刻単位として示されており、各１３　Ｅの三面のデータ
格納領域の役割に各時刻毎に互いに排他的にかつ循環的
にデータ受信用、データ送信用。

データ演算処理用に切り換わる。ＰＥ３の時刻Ｌ＋（３
におけるｄ計算を例に、詳細な処理を説明する。

時刻ｔ＋６において、Ｉ）　Ｅ　３は、ＰＥ２から標準
パターンベクトルデータｒ、をデータ受信状態のデータ
格納領域に受信し、これと並行して時刻ｔ＋５でＰＥ２
から受信した標準パターンベクトルデータ＋ｒ４をＰＥ
４に送信する。また、このＰＥ間データ転送と並行して
時刻ｔ＋３において受信した標準パターンベクトルデー
タ「、と時刻ｔ＋２においてバスからワーキング用のデ
ータ格納領域に人力した入カバターンベクトルデータＵ
。

とのベクトル距離計算処理（ｄ、３）を実行する。

ＰＥ３の三面の各データ格納領域の役割状態は、時刻ｔ
＋４　　　　時刻ｔ＋５　　　時匂Ｊｔ＋６のように互
いに排他的に切り換わる。

各ＰＥは、各時刻において同一の処理を行なう。

以上のように、互いに排他的かつ循環的に三状態の役割
を切り換えることができる三面のデータ格納領域構成に
よって、ＰＥ間のデータ転送をデータ演算処理に隠すこ
とができ、データ転送のオーバヘッドのない高速なりＰ
に基づくパターンマツチングの並列ベクトル距離計算が
実現できる。

［実施例４コこの実施例においては、３つのデータ格納領域の各々を
循環的且つ排他的に、データ受信用、データ送信用、デ
ータ演算処理用の３状態に順次切換える状態Ａと、前記
３つのうちの２つのデータ格納領域をデータ演算書込み
専用およびデータ演算読出し専用とする状態Ｂを交互に
切換え、上記の３つのデータ格納領域の各々をデータ演
算処理用（状態Ａ）、データ演算の書込み専用（状態Ｂ
）、データ送信用（状態Ａ）、ノーオペレーション（状
態Ｂ）、データ受信用（状態Ａ）、データ演算の読出し
専用（状態Ｂ）、続いてデータ受信用（状態Ａ）と６状
態に順次循環的に切換え、データ受信、データ送信、デ
ータ演算処理を並列に実行する。

音声認識処理のＤＰ（ダイナミックプログラミング）に
基づくパターンマツチング処理における累積距離計算を
、本発明の構成を搭載した処理要Ｊ　（ＰＥ）から成る
一次元アレイプロセッサで実行する例を示す。

この累積距離計算（以後、ｇ計算と呼ぶ）は、ｇ　Ｌ　
−ｚ　＋ｉ−１＋　２　ｄ　ｔ−１＋４　　・・・・・
・（１）ｇ　ｌ　＊ｊ”　ｄｉ　、１＋ｍｉｎ　　　ｇ
　Ｉ−１＋ｊ−１”　ｄｉ　＋４　　　　”””（２）
ｇ　ｉ　−１＋ｊ−ｘ＋　２　ｄ　１ｙｉ−１・・・・
・・（３）１　＋　−ｚ　＋４−１　＋Ｌ　　　　ｉｆ
　　（１）１ｉ、ｉ”　　　ｌ　１−１−ｊ−、＋　ｋ
ｘ　　　Ｌｆ　　（２）１　＋−１＋ｊ−２＋　Ｌ　　
　ｉｆ　　（３）で表される。ここで−１＋　ｊは、マ
ツチングする入カバターンデータ時系列の第ｉフレーム
、標準パターンデータ時系列の第ｊフレームを表す。

各ＰＥで実行するｇ計算の処理フローを第１４図Ａに示
す。各ＰＥは、三面のデータ格納領域の他に演算実行ユ
ニットとのデータ授受を行なうことのできるワーキング
用のデータ格納領域をもち、その一部の領域に距離値ｄ
Ｉｐ４のテーブルが格納されているものとする。この処
理フローでは、各ＰＥは、隣接するＰＥからそのＰＥの
ｇ計算に必要なデータ群を受信し、このデータとワーキ
ング用のデータ格納領域に保持されているデータとを使
って隣接するＰＥがそのｇ計算で必要とするデータ群を
話算して、隣接するＰＥへ送信する。そして、各ＰＥは
、このデータ送信と並行してそのＰＥのｇｅＱ値を計算
する。

第１４図Ａにおいて、ｇ、Ω　　：対象となるｇ値、ｇ値。

ｇ−１，Ω−に一時刻前のｇ値、ｇ値、送信、受信用の
格納領域には、データ群（ｎｊ＋　Ｐａｙａｎｔ　ＰＣ
，１ｃ）　、ワーキングの格納領域には、データ群（Ｐ
ｂ＋　ｅｂ＋　ｇ−１＋　（１−”＋　ｇａ９ｇｂ＋　
ｇｃ）及びｄ　ｉｊ子テーブル格納される。

このＰＥの処理フローに従って、−次元アレイプロセッ
サでのｇ計算の並行処理フローを第１４図Ｂに示す、各
ＰＥは第１４図Ａのステップａ−ｅをこの処理フローに
従って実行するが、あるＰＲのステップａ、ｄは隣接す
るＰＥのステップｄ、ａに相当するので、アレイプロセ
ッサの処理では、隣接するＰＥの間でステップａとｄを
対応させた並列処理が実行できる。すなわち、データ演
算処理と並列にＰＥ間データ転送が実行できる。

この処理フローを本発明の構成で実行した場合を第１５
図Ａないし第１５図Ｅに示す。

ここでは、Ｄ、−、’はデータ群を表し、と定義する。

第１５図Ａないし第１５図Ｅは、一つのｇ値を計算する
のに要する時間を処理の時刻単位として処理フローを示
している。ＰＥ３の時刻ｔ＋４におけるｇ３３の計算を
例に、詳細な処理を説明する。

各ＰＥの三面のデータ格納領域は、各時刻に二つの役割
状態をとる。すなわち、二面がそれぞれデータ演算処理
用の読出し、書込み専用に割当てられる状態、三面がそ
れぞれデータ送信、データ受信、データ演算処理用に割
当てられる状態である。

時刻ｔ＋４において、ＰＥ３は、データ演算処理の読出
し専用状態のデータ格納領域から時刻ｔ＋３においてＰ
Ｅ２から受信したデータｎ）、’を読出し、これとＰＥ
３内部のワーキングのデータ格納領域に格納されていた
データから、送信用のデータＩＬ）３：Ｉを計算し、デ
ータ演算処理の書込み専用の状態にあるデータ格納領域
にこれを格納する。

そして、三面のデータ格納領域をデータ送信用。

データ受信用、データ演算処理用の状態にして。

求めたデータ１Ｄ３３をデータ送信用のデータ格納領域
（書込み専用の状態にあったデータ格納領域）から隣接
するＰＥへ送信すると同時に、データ受信用の状態にあ
るデータ格納領域に時刻ｔ＋５計算に必要となるデータ
１）２４を受信する。さらに、これと並列に、データ演
算処理用のデータ格納領域（読出し専用の状態にあった
データ格納領域）からのデータとワーキング用のデータ
格納領域からのデータを使ってｇ３３＋　Ｑｘ□を計算
し、時刻ｔ＋４でのｇ、Ω計算を終了する。

［）Ｉ＝（ｎｉ＋　ｇｔｚ＋２　ｄｚｓ＋　ｇ２２＋　
Ω□２．Ω２□）であり、ワーキング用のデータ格納領
域にはｇ２□＋２ｄｚｚ−０２！が格納されているので
、ｇ３３゜Ω、３はこれらのデータにより求められる。

各時刻において、各ＰＥは、上記と同様の処理を行なう
。

以上のような各ＰＥでの処理を、六つの役割状態の循環
的な遷移をもつ三面のデータ格納領域構成を使って実行
することにより、データ転送をデータ演算処理に隠すこ
とができデータ転送によるオーバヘッドのない高速なり
Ｐに基づくパターンマツチングの並列歯ｖＬ距踵計算を
実現できる。

（発明の効果）本発明によれば、データ処理装置間でのデータ通信を伴
うシステムのデータ処理において、データ処理装置間の
データ転送処理と各データ処理装置でのデータ演算処理
の並列処理を可能とし、処理速度の向上を実現できる。

【図面の簡単な説明】

第１図及び第２図Ａ、第２図Ｂは、それぞれ行列の乗算
処理において、本発明の実施例のアレイプロセッサの構
成とその処理動作を示す。第３図及び第４図は１本発明の実施例を概略的に示すブ
ロック図とその状態の遷移を示す。第５図は本発明の実施例のコントロールユニットのブロ
ック回路図を示す。第６図は本発明の第５図の実施例のモードコントロール
回路の論理図を示す。第７図は第５図の実施例のデコーダ回路の論理図を示す
。第８図は、モードコントロール回路の三状態循環で移制
御のタイムチャートを示す。第９図は、モードコン１−ロール回路の六状態循環遷移
制御のタイムチャートを示す。第１Ｏ図及び第１１図Ａ、第１１図Ｂはそれぞれ、たた
み込み演算処理における本発明の詳細な説明するための
アレイプロセッサの構成とその処理動作を示す。第１２図Ａないし第１２図Ｃは、バク１ヘル距計算算の
処理フローを示す。第１３図は、３つのデータ格納領域の入状態循環遷移を
示す。第１４図Ａは、−次元アレイプロセッサの累積距離計算
並列処理フローを、第１４図ＢはＰＥの累積距離計算フ
ローをそれぞれ示す。第１５図Ａないし第１５図Ｅは、本発明の構成で実行し
た場合の、累積処理計算の並列処理フローを示す。第１６図及び第１７図Ａないし第１７図Ｃは、それぞれ
、従来の技術を説明するためのアレイプロセッサの構成
とその処理動作を示す。１．２．３　・・・データ格納領域、４　・・・演算実
行ユニット、５　・・・コン１−ロールユニット、６・
・・データ受信端子、７・・・データ送信端子、８，９
　・・・　レジスタ、１１〜１６・・・　レジスタ、０
．〜０Ｉ、・・・行列Ａのベクトルデータ列、ｂ工〜ｂ
、・・・行列Ｂのベクトルデータ列、ＰＥＩ〜ＰＥｎ　
・・・処理要Ｊ、ｘ□〜ｘｆｌ・・・入力データ列、Ｗ
□〜Ｗｌ。・・・重み係数データ列。寸　　　　　　　Ｏψ　　　　　　　ト■　　　　　　
　　　　　■ Ｏ− 第４図第１３図テ゛−タ涜ＩＬ（Ｒ１；　　す゛′−タ涜算処匣呵【゛
読田し暮刑第１４図（Ａ）第１５図（Ａ）ＰＥ　Ｉ　　　　　　　　ＰＥ　２第１５図（Ｅ）テ―り格＃Ｉ３４！賊ｔ−ｎ ■　　　　　　　■　　　　　　　Ｏｑコ　　　　　　　　　　　　　　　　　　　　　　　
　　　　　　　　　　　　に−Ｃ％Ｊ　　　　　　　　
　　ｒ’）　　　　　　　　　　ぐｊ　　　　　　　　
　　ＣＤ嘴ｉロト　　　　　　　ω

Claims

【特許請求の範囲】

（１）３つのデータ格納領域を具え、上記３つのデータ
格納領域の各々は、データ受信端子を介して外部からデ
ータを受信する手段、データ送信端末を介して外部へデ
ータを送信する手段および演算実行ユニットへのデータ
の供給並びに演算結果の受取りを行なうための手段をそ
れぞれもち、上記３つのデータ格納領域の各々は、互い
に排他的且つ循環的に、データ受信用、データ送信用、
データ演算の書込み、読出し用の状態に切換わることが
それぞれでき、さらに、上記の状態切換を制御する手段と、上記のデー
タに基いて所望の演算を実行する手段と、上記の演算を制御する手段とを具えたことを特徴とする並列データ処理装置。
（２）３つのデータ格納領域の各々を循環的且つ排他的
に、データ受信用、データ送信用、データ演算用の３状
態に順次切換え、データ受信用のデータ格納領域への外
部からのデータの受信、データ送信用のデータ格納領域
からの外部へのデータの送信、およびデータ演算用のデ
ータ格納領域と演算ユニットとのデータ授受によるデー
タ演算処理、とを並列に実行することを特徴とする並列
データ処理方法。
（３）３つのデータ格納領域の各々を、循環的且つ排他
的に、データ受信用、データ送信用、データ演算用の３
状態に順次切換える状態Ａと、前記の３つのうちの２つ
のデータ格納領域をデータ演算書込み専用およびデータ
演算読出し専用とする状態Ｂを交互に切換え、上記３つ
のデータ格納領域の各々をデータ演算用（状態Ａ）、デ
ータ演算の書込み専用（状態Ｂ）、データ送信用（状態
Ａ）、ノーオペレーション（状態Ｂ）、データ受信用（
状態Ａ）、データ演算の読出し専用（状態Ｂ）、続いて
データ受信用（状態Ａ）と６状態に順次循環的に切換え
、データ受信、データ送信、データ演算処理を並列に実
行することを特徴とする並列データ処理方法。