JPH03263164A - データ並列処理方式 - Google Patents

データ並列処理方式

Info

Publication number
JPH03263164A
JPH03263164A JP6230990A JP6230990A JPH03263164A JP H03263164 A JPH03263164 A JP H03263164A JP 6230990 A JP6230990 A JP 6230990A JP 6230990 A JP6230990 A JP 6230990A JP H03263164 A JPH03263164 A JP H03263164A
Authority
JP
Japan
Prior art keywords
data
processing
section
input
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6230990A
Other languages
English (en)
Inventor
Riyouichi Danki
亮一 段木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JFE Steel Corp
Original Assignee
Kawasaki Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kawasaki Steel Corp filed Critical Kawasaki Steel Corp
Priority to JP6230990A priority Critical patent/JPH03263164A/ja
Publication of JPH03263164A publication Critical patent/JPH03263164A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、入力データに対して様々な知的処理を高速
で行うようにしたデータ並列処理方式に係り、特に画像
解析、画像認識、音声認識や、ニューラル・ネットワー
ク等の処理情報量が多い処理に好適なデータ並列処理方
式に関する。
〔従来の技術〕
従来のデータ並列処理方式としては、例えば複数の汎用
プロセッサを共通データバスに接続してマルチプロセッ
サシステムを構築し、このマルチプロセッサシステムで
入力データを並列処理するようにしているのが一般的で
ある。
しかしながら、このマルチプロセッサシステムによるデ
ータの並列処理においては、各プロセッサ間の通信を共
通データバスを使用して行うので、ある並列度を境とし
て処理されるデータの転送が制限を受けるようになる、
並列化による処理速度の向上に一定の限度があると共に
、プロセッサ間の通信のための処理時間が実際のデータ
処理時間に対して無視できない程大きな割合を占めるこ
とになり、ある一定の並列化以上の処理の展開は無意味
となる等、処理速度を向上させながら並列化の拡大させ
ることが困難であるという問題点があった。
この問題点を解決するために、VLS I技術の高度化
によって、4本の直列伝送回路を内蔵したマイクロプロ
セッサで構成されるトランスピユータが開発され、これ
によって並列度と処理速度とを線型とすることができる
アーキテクチャが可能となった。
すなわち、第8図に示すように、入力端に入力された画
像データを入力側フレームメモリlに格納し、このフレ
ームメモリ1に格納された入力データが格子結合された
多数のトランスピユータ・T o o + T r t
 + T lz・・・・・・で処理されて、その処理デ
ータが出力側フレームメモリ2に格納され、この出力側
フレームメモリ2に格納された処理データが出力端から
読出される。
ここで、入力側フレームメモリl及び第1のトランスピ
ユータT0゜、最終トランスピユータTXY及び出力側
フレームメモリ2、並びに各隣接するトランスピユータ
間は、夫々1ビツトのリンク・インタフェースL0゜、
LNM及びLIJを介して接続され、これらリンク・イ
ンタフェースLljによって例えば20Mbit/sの
データ転送速度でデータ転送が行われる。
〔発明が解決しようとする課題〕
しかしながら、上記従来のデータ並列処理方式にあって
は、現在までのところトランスピユータを256個以上
接続した並列度を実現した例もあるが、これらは、入力
側フレームメモリlから続出された1ビツトの入力デー
タは、先ずリンク・インタフェースL0゜を介して第1
のトランスピユータT0゜に転送されて、この第1のト
ランスピユータT0゜に取込まれ、次いでリンク・イン
タフェースL ll+  LID’・・・・・を介して
他のトランスピユータにデータが転送されて処理される
ことになるため、リンク・インタフェースL0゜+Ll
l・・・・・・の情報通信量は、多い順からり。@>L
++>L+1・・・・・となり、各トランスピユータに
取込まれるデータ量が、各トランスピユータで処理され
るデータ量を下回る場合には、リンク・インタフェース
L0゜よりボトル・ネックが発生し、トランスピユータ
の並列度を増しても処理能力は向上しないことになる。
したがって、このような並列処理用に開発されたトラン
スピユータであっても、処理情報が膨大である場合には
、並列度を上げても、処理速度の向上が制限されると共
に、単位時間当たりの処理情報量が制限されるという未
解決の課題があった。
この未解決の課題を解決するために、「日経エレクトロ
ニクスJ 19B9年7月24日号、第140頁〜第1
44真に記載されているように、2つのトランスピユー
タを内蔵した複数のコンピュート・カードを32ビツト
バスに並列に接続すると共に、各トランスピユータのリ
ンク・インタフェースをクロスバ・スイッチを介して接
続し、コンビュート・カード同士がデータの授受を行う
場合に、先ずバスをアクセスし、これが競合したときに
は、クロスバ・スイッチを介して通信を行うようにした
ネットワークを構成することも提案されている。
しかしながら、上記トランスピユータを使用したネット
ワークにあっては、32ビツトバスを介してデータの授
受を行うことができるので、単位時間当たりの処理情報
量を向上させることはできるが、画像解析処理の画像情
報等の1フレーム内の画像データ処理を行う場合のよう
に情報量が多いときには、32ビツトバス及びクロスバ
・スイッチによるデータ授受には限界があり、処理速度
を向上させるには一定の限度があるという課題は解決す
ることができない。
そこで、この発明は、上記従来例の未解決の課題に着目
してなされたものであり、データ処理部の並列度を上げ
ることにより処理速度を向上させると共に、単位時間当
たりの処理情報量を多くすることができるデータ並列処
理方式を提供することを目的としている。
[課題を解決するための手段〕 上記目的を達成するために、請求項(1)に係るデータ
並列処理方式は、入力データを並列処理するようにした
データ並列処理方式において、前記入力データを分割し
て記憶する複数の入力データ記憶部と、マトリックス配
列された複数のデータ処理部と、行又は列単位の各デー
タ処理部を前記入力データ記憶部に接続する所定ビット
幅のデータバスと、隣接する独立なデータ処理部間でデ
ータ通信を行う通信手段と、行又は列単位のデータ処理
部と個別にバス接続されて処理データを格納する複数の
出力データ記憶部と、各出力データ記憶部の格納データ
を多重化して出力データを形成する出力データ形成部と
、前記各データ処理部からの記憶部アクセス要求に基づ
いて前記入力データ記憶部、出力データ記憶部、データ
処理部及び出力データ形成部の転送制御を行う転送制御
手段とを備え、入力データ記憶部に格納された入力デー
タをデータバスを介して行又は列単位の複数のデータ処
理部に順次転送し、当該データ処理部で他のデータ処理
部との間で前記通信手段を介して処理情報の交換を行い
、該交換処理情報を用いたデータ処理を行って、最終処
理データをバスを介して各出力データ記憶部に格納する
と共に、各出力データ記憶部に格納された処理データを
出力データ形成部で多重化して出力するようにしている
また、請求項(2)に係るデータ並列処理方式は、入力
データを並列処理するようにしたデータ並列処理方式に
おいて、前記入力データを分割して記憶する複数の入力
データ記憶部と、マトリックス配列された複数のデータ
処理部と、行又は列単位の各データ処理部を前記入力デ
ータ記憶部に接続する所定ビット幅のデータバスと、隣
接する独立なデータ処理部間でデータ通信を行う通信手
段と、前記データ処理部の何れか1つに前記通信手段を
介して接続されて処理データを格納する出力データ記憶
部と、前記各データ処理部からのアクセス要求に応じて
前記入力データ記憶部及びデータ処理部のデータ転送制
御を行う転送制御手段とを備え、入力データ記憶部に格
納された入力データをデータバスを介して行又は列単位
の複数のデータ処理部に順次転送し、当該データ処理部
で他のデータ処理部との間で前記通信手段を介して処理
情報の交換を行い、該交換処理情報を用いたデータ処理
を行って、最終処理データを前記通信手段を介して出力
データ記憶部に格納するようにしている。
さらに、請求項(3)に係るデータ並列処理方式は、入
力データを並列処理するようにしたデータ並列処理方式
において、前記入力データを分割して記憶する複数の入
力データ記憶部と、マトリックス配列された複数のデー
タ処理部と、行又は列単位の各データ処理部を前記入力
データ記憶部に接続する所定ビット幅のデータバスと、
隣接する独立なデータ処理部間でデータ通信を行う通信
手段と、前記行又は列単位の最終データ処理部に前記通
信手段を介して個別に接続されて最終処理データを多重
化して出力データを形成する出力データ形成部と、前記
各データ処理部からのアクセス要求に応じて前記入力デ
ータ記憶部、データ処理部及び出力データ形成部のデー
タ転送制御を行う転送制御手段とを備え、入力データ記
憶部に格納された入力データをデータバスを介して行又
は列単位の複数のデータ処理部に順次転送し、当該デー
タ処理部で他のデータ処理部との間で前記通信手段を介
して処理情報の交換を行い、該交換処理情報を用いたデ
ータ処理を行って、最終処理データを前記通信手段を介
して出力データ形成部に転送し、当該出力データ形成部
で多重化して出力するようしている。
またさらに、請求項(4)に係るデータ並列処理方式は
、前記データ処理部は、少なくとも演算処理部と、これ
に所定ビット幅の内部データバスを介して接続され且つ
入力データ記憶部及び出力データ記憶部にデータバスを
介して接続される外部メモリインタフェースと、前記演
算処理部に前記内部データバスを介して接続され且つ隣
接するトランスピユータとの通信を行う複数のリンク・
インタフェースとを備えたトランスピユータで構成され
ている。
〔作用〕
請求項(1)に係るデータ並列処理方式においては、デ
ータ処理部がマトリックス状に配列され、その行又は列
単位のデータ処理部が入力データ記憶部とデータバスを
介して並列に接続されているので、入力データ記憶部に
入力データを行又は列単位の各データ処理部毎に互いに
関連のない分割データとして格納して、これらを行又は
列単位の各データ処理部で処理するに当たり、通信手段
を介して他の行又は列のデータ処理部間で情報交換を行
うことにより、画像データ処理やデータ間の相関を必要
とするニューラル・ネットワーク、高速フーリエ変換(
FFT)処理等の並列化に好適なアーキテクチャを構築
することができ、データ処理速度及び単位時間当たりの
処理情報量をより向上させることができる。
また、請求項(2)に係るデータ並列処理方式において
は、マトリックス状に配列されたデータ処理部の行又は
列単位のデータ処理部が入力データ記憶部とデータバス
を介して並列接続されているので、上記請求項(1)と
同様の作用を得ることができる他、各データ処理部の処
理結果データを途中のデータ処理部を介して出力データ
記憶部に直接記憶するようにしているので、全体の構成
を簡略化することができ、処理情報量が少ない場合に好
適なアーキテクチャを提供することができる。
さらに、請求項(3)に係るデータ並列処理方式におい
ては、行又は列単位の最終データ処理部が個別の通信手
段を介して出力データ形成部に接続され、この出力デー
タ形成部で各行又は列単位のデータ処理部の処理結果デ
ータが多重化されるので、請求項(2)に係るデータ並
列処理方式に比較して、最終データ処理部でのデータ転
送負荷を減少させて処理速度を向上させることができる
またさらに、請求項(4)に係るデータ並列処理方式に
おいては、トランスピユータを構成する演算処理部から
外部メモリインタフェースを介して直接入力データ記憶
部及び出力データ記憶部をアクセスすることができ、デ
ータ処理部での処理能力を向上させることができる。
〔実施例] 以下、この発明の実施例を図面に基づいて説明する。
第1図はこの発明の原理構成図であって、図中FM、、
FM、・・・・・・FMyは、画像処理の撮像装置から
入力される画像データが所定の分割方式で分割された分
割画像データが入力される複数(Y+1)個の入力側フ
レームメモリである。これら各フレームメモリFM、〜
FMvは、夫々例えばデータバスBx−Bvを介してマ
トリックス状に配列された(X+1)X (Y+1)個
のトランスピユータTAJ(i=1.2・・・・・・X
、j=1.2・・・・・・Y)の列方向に配列されたト
ランスピユータT、J〜TX4に接続され、さらに各ト
ランスピユータT。j−’−T、JがデータバスB、〜
Byを介して出力側データ記憶部としてのデュアルポー
トメモリDM。
〜D M vに接続され、各デュアルポートメモリDM
0〜DMVに格納された処理結果データが出力データ形
成手段としての多重化回路MUXで正規のデータ順に多
重化されて出力側フレームメモリFMorに格納され、
この出力側フレームメモリFM0.に格納された出力画
像データがデータ出力端から出力される。
各トランスピユータT0゜〜TVXの夫々は、第2図に
示すアーキテクチャを有する。すなわち、フローティン
グ・ポイント・ユニット(FPU)11に32ビツト幅
の内部データバス12を介してマイクロプロセッサユニ
ット(MPU)13、リンクサービス14、通信手段と
してのリンク・インタフェースL、−L4、RAMI 
5及び外部メモリインタフェース(EMI)16等が接
続されていると共に、システムサービス17及びタイマ
18を内蔵している。ここで、リンク・インタフェース
L l”’ L aは内部データバス12を介して伝送
される並列データを1ビツトの直列データに変換して外
部に出力し、外部から入力される直列入力データを並列
データに変換して内部データバス12に送出する。また
、外部メモリインタフェース16は、32ビツトの内部
データバス12を直接外部のデータバスB、に接続する
ことができる。したがって、各行のトランスピユータT
。j〜TXjのマイクロプロセッサユニット13から4
GBのメモリ空間を有する入力側フレームメモリFM、
及びデュアルポートメモリDMjをデータバスBJを介
して直接アクセスすることができ、このとき入力側フレ
ームメモリFMjからデータ処理が可能となって時点で
、前記メモリ制御装置1fMCにデータ受信要求を出力
し、データ処理が完了した時点でメモリ制御袋fMCに
データ送信要求を出力する。さらに、リンク・インタフ
ェースL。
〜L4からのデータ入力と外部メモリインタフェース1
6のデータ入力とは等価なものとして取り扱うことがで
きる。
そして、各行の隣接するトランスピユータT0゜〜TX
jの一方のトランスピユータにおけるリンク・インタフ
ェースL2がこれと対向する他方のトランスピユータに
おけるリンク・インタフェースL4と接続されていると
共に、各列の隣接するトランスピユータTム。〜Tty
(i=1.2・・・・・・X)の一方のトランスピユー
タにおけるリンク・インタフエースL1がこれと対向す
る他方のトランスピユータにおけるリンク・インタフェ
ースL3と接続されて、各トランスピユータT0゜〜T
XVが格子結合されている。このため、トランスピユー
タ同士でリンク・インタフェースLl”””’L4を介
して1ビツトのシリアル双方向通信を行うことができる
。この結果、隔たったトランスピユータ間でも、途中の
トランスピユータを介在させて双方向通信を実現するこ
とも可能となる。
また、入力側フレームメモリFM、−FMY。
デュアルポートメモリDM、〜DMv、各トランスピユ
ータTo0〜TXY、及び多重化回路MUXは、各列の
1つのトランスピユータTXjにリンク・インタフェー
スL4を介して接続された転送制御手段としての転送制
御装置1jMDによって制御される。
この転送制御装置MDは、各トランスピユータTi1か
らデータ読込要求を受けたときに、アクセスの認識及び
調停(アービトレーション)を行った後、該当するフレ
ームメモリFM、のデータを読出し、これをデータバス
B、を介してトランスピユータT i jに転送すると
共に、各トランスピユータT i jからデータ送信要
求を受けたときに同様にアクセスの認識及び調停を行っ
た後、該当するトランスピユータT i jの処理デー
タをデュアルポートメモリDM、に書込み、全てのトラ
ンスピユータT i jの処理データが各デュアルポー
トメモリDM、に書込まれると、多重化制御信号を多重
化回路MUXに出力して多重化を実行させる。
したがって、画像情報等の1フレーム内のデータ処理を
行う場合、夫々異なったデータしか扱えない構成(即ち
入力側フレームメモリFM、−FMvには各行における
トランスピユータT。、〜TXjが扱うデータのみが格
納される)でありながら、リンク・インタフェースL1
〜L4によって相互に情報を交換することにより、互い
に相関のある画像データの処理を実行することができる
また、演算過程で必要な情報を、相互通信を確保するこ
とにより互いに授受することができるので、データ間の
相関を必要とするニューラル・ネット、高速フーリエ変
換(FFT)等の並列処理による高速化を実現すること
ができる。
次に、上記原理に基づく具体例を第3図及び第4図につ
いて説明する。
この具体例では、第3図に示すように6行4列の格子結
合を有する構成とし、各列が1つのユニットU、〜U、
として構成されている。
すなわち、第4図に示すように、外部から入力される8
ビツトの画像データが並列展開部DMUXに供給され、
この並列展開部DMUXで画像データを各列単位で処理
させる8ビツト×4の並列データに展開する。この並列
データへの展開は、外部から入力される書込指示信号W
Cが供給されるROM、及びフリップフロップFF、で
構成されるROMシーケンサSQoからのセレクト信号
SLによって制御されて、各ユニットUo〜U。
内の後述する入力データ記憶部を構成する先入れ先出し
メモリ(以下、FIFOと称す)20〜23に書込まれ
る。
ここで、外部から入力される書込指示信号WCは8ビツ
トの並列データであり、そのうちの1ビツトがスタート
命令、2ビツトが後述する各ユニットU0〜U、に含ま
れるPIF020〜23のバンク指定、残りの5ビツト
で映像信号の取込みデータ数を32通り指定し、各PI
F020〜23に書込む。
各ユニットU0〜U3は、第4図に示すように、前述し
た並列展開部DMUXに8ビツトのデータバスB、。〜
Bjffを介して接続されたPIF020〜23を有し
、これらP I F020〜23にROMシーケンサS
Q、から書込信号WS、〜WS。
が供給されることにより、並列展開部DMUXから出力
されるユニットU0〜U、に対する展開画像データが選
択的に書込まれると共に、後述する転送制御装置MDで
各トランスピユータT i jからのデータ読込要求を
受け、これを(iI認した後に、そのROMシーケンサ
SQ、から出力される読出信号R3,j%Rs、jによ
って、書込まれた展開画像データを順次32ビツトの内
部データバスb0、〜b、jを介して列を構成する6個
のトランスピユータT、j”−T、、の外部メモリイン
タフェース16に個別に転送する。
また、トランスピユータT Oj ”’−T S jの
マイクロプロセッサ13で処理を終了した処理結果デー
タは、同様に内部データバスb、。〜b=sを介してデ
ュアルポートメモリDM、に格納される。これらデュア
ルポートメモリDMJの夫々は、後述する転送制御装置
MDで各トランスピユータT i jからのデータ送信
要求を受けて、これを認識した後に、そのROMシーケ
ンサSQ2を介して供給される書込制御信号によって起
動されるROMシーケンサSQ、と同様の構成を有する
ROMシーケンサSQ、から書込信号WS、が供給され
ることによって処理結果データを格納し、この格納した
処理結果データを各トランスピユータTijからのデー
タ送信要求を後述する転送制御装置MDで受けて、認識
した後に、そのROMシーケンサSQ3から供給される
読出信号R3,によって読出し、この読出された処理結
果データが多重化回路MUXに送出されて、多重化され
ることによって8ビツトの画像処理データとして出力さ
れる。
また、各ユニットU0〜U、における各トランスピユー
タT。j ””−T S jはリンク・インタフェース
L2及びL4で直列に接続され、ユニットUo〜U、の
最終列のトランスピユータT0.〜T3Sのリンク・イ
ンタフェースL4が転送制御装置jMDに接続されてい
る。
この転送制御装置MDは、ユニットUo及びUlの最終
列のトランスピユータTO5及びT1.のリンク・イン
タフェースL、にリンク・インタフェースL4及びL+
が個別に接続された制御用トランスピユータTC,と、
ユニットU2及びU3の最終列のトランスピユータT2
.及びT’ssのリンク・インタフェースL4にリンク
・インタフェースL。
及びL4が個別に接続され且つリンク・インタフェース
Ltが前記制御用トランスピユータTC。
のリンク・インタフェースL4に接続された制御用トラ
ンスピユータTC,と、各制御用トランスピユータTC
,及びTC,から出力される直列制御データがインタフ
ェースIF、及びIF、で8ビツトの並列制御データに
変換されて供給されるROMシーケンサSQz及びSQ
3とを備えている。
ここで、制御用トランスピユータTC,は、夫々各ユニ
ットUo、U+及びUz、Uzの各トランスピユータT
。j ”’ T S jからのデータ読込要求を直接及
び制御用トランスピユータTC,を介して受信すると、
これらを認識及び調停した後、各ユニットU0〜U3の
P I F020〜23に対するシリアル続出制御情報
を生威し、この続出制御情報がインタフェースIF、で
直並列変換されてROMシーケンサSQzに供給され、
このROMシーケンサSQ、から各ユニットU0〜U3
のPIF020〜23に対して読出信号R3,。〜R3
,,が出力され、これらPIF020〜23から読出さ
れる並列データが読込要求を行ったトランスピユータT
1に転送される。また、トランスピユータTiからデー
タ送信要求を受信すると、これらを認識及び調停した後
、デュアルポートメモリDMjに対するシリアル書込制
御情報を生成し、これが同様にインタフェースIF、で
直並列変換されてROMシーケンサSQzを介して各ユ
ニットUjのROMシーケンサSQ、に送出され、この
ROMシーケンサSQ+によってデュアルポートメモI
JDMJに対して書込信号WSJを送出し、データ送信
要求を行ったトランスピユータT i jからの処理結
果データを格納する。
一方、制御用トランスピユータTC,は、各ユニットU
@〜U3の各トランスピユータT0゜〜T、4の処理結
果データが全てデュアルポートメモリDM、に書込まれ
た時点即ち制御用トランスピユータTC,で全てのトラ
ンスピユータT0゜〜T、4からのデータ送信要求の実
行を終了した時点で、各デュアルポートメモリDM、〜
DM、に対してシリアル続出制御情報をインタフェース
IF、で直並列変換してROMシーケンサSQ、に出力
し、このROMシーケンサSQ、からデュアルポートメ
モリDM、−DM、に対して読出信号を出力すると共に
、多重化回路MUXに対して多重化制御信号MSを出力
し、この多重化回路MUXで正しいデータ順で各デュア
ルポートメモリDM、〜DM、に格納されている処理デ
ータを多重化して画像処理データとして出力する。
ここで、制御用トランスピユータTC,,TC。
リンク・インタフェースIF0.IF、及びROMシー
ケンサSQ2.SQ、で転送制御装置MDが槽底されて
いる。
そして、各トランスピユータT0゜〜T1.の外部動作
速度は例えば5MHzに設定され、各ROMシーケンサ
SQ、〜SQ、は例えば20MHzのクロック信号によ
って動作される。
次に、上記具体例の動作を第5図のタイミングチャート
を伴って説明する。
今、各ユニットU0〜U、の各トランスピユータT、。
〜T”sffの処理時間が等しいものと仮定する。
先ず、画像データが並列展開部MUXに入力されると共
に、ROMシーケンサSQoに書込指示信号WCが入力
されると、このROMシーケンサSQ、から選択信号S
Lが並列展開部MUXに出力されることにより、並列展
開部MUXから各ユニットU0〜U、毎の8ビツトの分
配データが順次出力され、これと同時にROMシーケン
サSQ。
から各ユニットU0〜UユのPIF020〜23に対し
て選択的に書込信号WSj、〜WS、が送出されること
により、各FIFO20〜23に分配データが格納され
る。
このように、各ユニットU、〜U、のFIF020〜2
3に分配データが格納された状態で、各ユニットU、〜
U3のトランスピユータT、J−T1.は処理を開始し
ていないので、これらの全てからデータ読込要求が制御
用トランスピユータTC。
に出力されている。このため、制御用トランスピユータ
TC,では、第5図の時点t1でデータ送信要求を調停
して例えば第1列のトランスピユータT (10−” 
T (+3に対してデータを転送するように、各ユニッ
トU0〜U、の各PIF020〜23に対して読出信号
R3,〜R3,を送出すると共に、トランスピユータT
。o’−To、に対してデータ読込許可を与えることに
より、PIF020〜23から読出される分配データを
、第5図(a)及び(ハ)に示すように、内部データバ
スb0゜〜b03を介して各トランスピユータT0゜〜
T、3に転送する。
そして、分配データが転送されたトランスピユータT0
゜〜TO3は、データ転送が終了した時点L2からデー
タ処理を開始する。
制御用トランスピユータTC,は第1行のトランスピユ
ータTOO%TOffへのデータ転送が終了した時点L
2で、第2行のトランスピユータT−0〜T1.に対し
て前記と同様に分配データの転送を開始し、この転送が
終了した時点t、で第3行のトランスピユータT2゜〜
Tt、に対する分配データの転送を開始する。以後、時
点t4で第4行、時点t5て第5行、時点t、で第6行
の各トランスピユータに対して順次分配データの転送が
行われる。
その後、第6行のトランスピユータT!!、%T、。
に対するデータ転送が終了した時点t、で、第1行のト
ランスピユータT0゜〜TO3のデータ処理が終了し、
処理データを送信するためのデータ送信要求が制御用ト
ランスピユータTC,に送出されると、この制御用トラ
ンスピユータT Coから書込情報が出力され、これに
よってROMシーケンサSQ、からデュアルポートメモ
リDM、−DM3に対して書込信号が出力されると共に
、各トランスピユータT0゜〜TO3に対して送信許可
が与えられ、これらトランスピユータT0゜〜TO3の
処理データがデュアルポートメモリD M o〜DM、
に格納される。
このようにして、処理を終了した各列のトランスピユー
タの処理データが順次データバスb0〜b3を介して順
次デュアルポートメモリDM、〜D M 3に格納され
る。
一方、データ処理を終了したトランスピユータT0゜〜
T0.は、データ読込要求を制御用トランスピユータT
C,に送出するが、行方向に隣接するトランスピユータ
との間で情報交換を行う必要があるときには、これら間
のリンク・インタフェースを介して、第5図(C)に示
すように、情報交換を行ってからデータ読込要求を送出
する。
その後、時点L13で全てのトランスピユータT。。〜
T’s3の処理データがデュアルポートメモリDM0〜
D M sに格納されると、制御用トランスピュータT
C,から処理データ読出情報が送出され、これに応じて
ROMシーケンサSQ、から各デュアルポートメモリD
M、〜D M sに対して読出信号RS oo= RS
 oxが出力され、各デュアルポートメモリDM、〜D
 M 3から読出された処理データが多重化回路MUX
に入力される。この多重化回路MUXには、ROMシー
ケンサSQ3からの多重化制御信号が入力されているの
で、この多重化制御信号によって、各処理データが正し
い順に整列されて8ビツトの画像処理データとして出力
される。
これと同時に、時点t11で第1列のトランスピユータ
T0゜〜T03からデータ読込要求が制御用トランスピ
ユータTC,に送出されることにより、これらトランス
ピユータT0゜〜TO3に対してPIF020〜23か
ら新たな分配データの転送が開始される。
以上のようにして、第5図(b)に示すように、常に内
部データバスb0〜b3が100%有効に使われること
になる。但し、この有効利用を実現するためには、トラ
ンスピユータTJ0〜TJ3とFIF020〜23及び
デュアルポートメモリDM。
〜D M 3 との間の転送時間をTBtrとし、トラ
ンスピユータでのデュアルポートメモリDM、〜DM、
への処理データ転送が終了してからPIF020〜23
から新たなデータが転送開始されるまでの通信時間をT
 p r oとしたとき、下記(1)式を満足させる最
大並列度m、、、が規定される。
T pr(+≧TBtrXm      ・・・・・・
・・・・・・(1)一方、各トランスピユータT。。〜
Ts3は転送された分配データの処理が終了した時点か
ら次の分配データの転送が終了するまでの期間T2□は
データ処理を行わないが、この間を第5図(C)に示す
ように、リンク・インタフェースを介して行方向のトラ
ンスピユータとの情報交換に割当てることにより、トラ
ンスピユータを常に処理状態におくことができる。但し
、この処理状態を満足させるためには、下記(2)式を
満足させる最大並列度n、、。
が規定される。
Tpr+  = 2 X T Btr+TpP。
≧TL、、Xn        ・・・・・・・・・・
・・(2)したがって、両最大並列度mい、X及びnl
、8を満足することにより、最も効率的な処理を実行す
ることができる。ここで、トランスピユータT i j
の転送時間TBt、と処理時間T prとは、TBtr
(T prの関係があるため、非常に高い並列度(m。
n)を達成することができる。
次に、この発明の第2実施例を第6図について説明する
この第2実施例は、前述した第1図の原理構成図におい
て、デュアルポートメモリDM、〜DM1、多重化回路
MUXが省略され、各トランスピユータT i jでデ
ータ処理を終了してデータ送信要求がメモリ制御装置M
Dに送出されたときに、このメモリ制御装置MDで各ト
ランスピユータT i jの処理結果データを、所定順
序で各トランスピユータ間のリンクインタフェースL、
〜L4を使用してトランスピユータT”xoまで転送し
、このトランスピユータT、10から出力される処理結
果データをリンク・インタフェースL1.で直並列変換
して直接出力フレームメモリFM、、に書込むようにし
たことを除いては前記第1図と同様の構成を有し、第1
図との対応部分には同一符号を付し、その詳細説明はこ
れを省略する。
この第2実施例によると、デュアルポートメモIJDM
、〜DMV及びその制御系を必要としないので、全体の
構成を簡易化することができ、情報処理量が少ない場合
に有効となる。
次に、この発明の第3実施例を第7図について説明する
この第3実施例においては、前記第2実施例において、
各列の最終トランスピユータTXo−T)(yのリンク
・インタフェースL4が個別にリンク・インタフェース
Ll。〜L1.を介して多重化回路MUXに接続され、
各最終トランスピユータT8゜〜T”xyから出力され
る各列のトランスピユータT、j%TX、の処理結果デ
ータを多重化回路MUXで多重化して出力側フレームメ
モリFMorに書込むようにしたことを除いては前記第
6図と同様の構成を有し、第6図との対応部分には同一
符号を付し、その詳細説明はこれを省略する。
この第3実施例によると、各列の最終トランスピユータ
T’xo〜TXVで処理結果データを個別のリンク・イ
ンタフェースLln〜LIvを介して多重化回路MUX
に送出するので、第2実施例に比較して各最終トランス
ピユータでの情報転送負荷を低減させることができ、処
理結果データの情報転送時間を短縮することができる。
なお、上記各実施例においては、トランスピユータT0
゜〜T”xvとして、32ビツトのマイクロプロセッサ
を搭載した構成としたが、これに限定されるものではな
く、データ処理量に応じて任意ビット数のマイクロプロ
セッサを適用することができ、これに応じてトランスピ
ユータの内部バス及びトランスピユータとFIFO及び
デュアルポートメモリDMとの間のバスのビット幅を変
更すればよい。
またさらに、上記実施例においては、データ処理部とし
てトランスピユータを適用した場合について説明したが
、これに限定されるものではなく、FPU、CPU等の
演算処理部と、これに所定ビット幅の内部バスを介して
接続される外部メモリインタフェース及び複数のリンク
・インタフェースを備えた構成を有するものであれば、
他のデータ処理装置を適用することができる。
〔発明の効果〕
以上説明したように、請求項(1)に係るデータ並列処
理方式によれば、データ処理部を格子結合してその行単
位のデータ処理部と入力データ記憶部及び出力データ記
憶部との間をバス接続し、各出力データ記憶部に格納さ
れた処理データを出力データ形成手段で多重化させるよ
うにし、且つ隣接するデータ処理部間に通信手段を設け
ているので、複数の入力データ記憶部に画像入力データ
等の入力データを分割して格納し、各入力データ記憶部
にデータバスを介して接続された各行又は列単位のデー
タ処理部でデータ処理を行うに当たり、隣接する行又は
列単位のデータ処理部と通信手段を介して情報交換を行
うことができるので、情報量の多い画像処理やデータ間
の相関を必要とするニューラルネットワークや高速フー
リエ変換処理等の並列処理を単位時間当たりの情報処理
量を向上させながら高速で処理することができる効果が
得られる。
また、請求項(2)に係るデータ並列処理方式によれば
、各データ処理部でデータ処理を終了した処理結果デー
タを通信手段を介し、途中のデータ処理部を介して特定
のデータ処理部に転送し、このデータ処理部から処理結
果データを出力データ記憶部に直接書込むことができる
ので、全体の構成を簡易化することができ、特に処理情
報量が少ない場合に好適なアーキテクチャを提供するこ
とができる効果が得られる。
さらに、請求項(3)に係るデータ並列処理方式によれ
ば、行又は列単位のデータ処理部の処理結果データを行
又は列の最終データ処理部に順次転送し、これら最終デ
ータ処理部から出力される処理結果データを出力データ
形成手段で多重化して出力するようにしたので、上記請
求項(2)に係るデータ並列処理方式に比較して最終デ
ータ処理部のデータ転送負荷を低減して処理速度を向上
させることができる効果が得られる。
またさらに、請求項(4)に係るデータ並列処理方式に
よれば、データ処理部が、演算処理部に内部バスを介し
て接続された外部メモリインタフェース及びリンク・イ
ンタフェースを備えているので、処理装置から入力デー
タ記憶部及び出力データ記憶部を直接アクセスすること
ができると共に、リンク・インタフェースを介して他の
データ処理部との情報交換を行うことができ、データ処
理部のデータ処理能力を向上させることができる効果が
得られる。
【図面の簡単な説明】
第1図はこの発明の概略構成を示すブロック図、第2図
はトランスピユータのアーキテクチャを示すブロック図
、第3図及び第4図は夫々この発明の具体例を示す概略
説明図及びブロック図、第5図は第4図の動作の説明に
供するタイムチャート、第6図及び第7図はこの発明の
他の実施例を示すブロック図、第8図は従来例を示すブ
ロック図である。 図中、FM、〜FM、は入力端フレームメモリ(入力デ
ータ記憶部)、81〜B、はデータバス、Too”−T
xYはトランスピユータ、MUXは多重化回路(出力デ
ータ形成部)、MDは転送制御装置(転送制御手段)、
DM、〜DMvはデュアルポートメモリ(出力データ記
憶部)、FMOFは出力側フレームメモリ、11はフロ
ーティング・ポイント・ユニット、12は内部データバ
ス、13はマイクロプロセッサ、16は外部メモリイン
タフェース、LI〜L4はリンク・インタフェース、D
MLIXは並列展開部、U0〜U3はユニット、boj
〜b、ljは内部データバス、20〜23はFIFO,
SQ、〜SQ3はROMシーケンサ、TCo、TC,は
制御用トランスピユータである。 図 L2B

Claims (4)

    【特許請求の範囲】
  1. (1)入力データを並列処理するようにしたデータ並列
    処理方式において、前記入力データを分割して記憶する
    複数の入力データ記憶部と、マトリックス配列された複
    数のデータ処理部と、行又は列単位の各データ処理部を
    前記入力データ記憶部に接続する所定ビット幅のデータ
    バスと、隣接する独立なデータ処理部間でデータ通信を
    行う通信手段と、行又は列単位のデータ処理部と個別に
    バス接続されて処理データを格納する複数の出力データ
    記憶部と、各出力データ記憶部の格納データを多重化し
    て出力データを形成する出力データ形成部と、前記各デ
    ータ処理部からの記憶部アクセス要求に基づいて前記入
    力データ記憶部、出力データ記憶部、データ処理部及び
    出力データ形成部のデータ転送制御を行う転送制御手段
    とを備え、入力データ記憶部に格納された入力データを
    データバスを介して行又は列単位の複数のデータ処理部
    に順次転送し、当該データ処理部で他のデータ処理部と
    の間で前記通信手段を介して処理情報の交換を行い、該
    交換処理情報を用いたデータ処理を行って、最終処理デ
    ータをバスを介して各出力データ記憶部に格納すると共
    に、各出力データ記憶部に格納された処理データを出力
    データ形成部で多重化して出力するようにしたことを特
    徴とするデータ並列処理方式。
  2. (2)入力データを並列処理するようにしたデータ並列
    処理方式において、前記入力データを分割して記憶する
    複数の入力データ記憶部と、マトリックス配列された複
    数のデータ処理部と、行又は列単位の各データ処理部を
    前記入力データ記憶部に接続する所定ビット幅のデータ
    バスと、隣接する独立なデータ処理部間でデータ通信を
    行う通信手段と、前記データ処理部の何れか1つに前記
    通信手段を介して接続されて処理データを格納する出力
    データ記憶部と、前記各データ処理部からのアクセス要
    求に応じて前記入力データ記憶部及びデータ処理部のデ
    ータ転送制御を行う転送制御手段とを備え、入力データ
    記憶部に格納された入力データをデータバスを介して行
    又は列単位の複数のデータ処理部に順次転送し、当該デ
    ータ処理部で他のデータ処理部との間で前記通信手段を
    介して処理情報の交換を行い、該交換処理情報を用いた
    データ処理を行って、最終処理データを前記通信手段を
    介して出力データ記憶部に格納するようにしたことを特
    徴とするデータ並列処理方式。
  3. (3)入力データを並列処理するようにしたデータ並列
    処理方式において、前記入力データを分割して記憶する
    複数の入力データ記憶部と、マトリックス配列された複
    数のデータ処理部と、行又は列単位の各データ処理部を
    前記入力データ記憶部に接続する所定ビット幅のデータ
    バスと、隣接する独立なデータ処理部間でデータ通信を
    行う通信手段と、前記行又は列単位の最終データ処理部
    に前記通信手段を介して個別に接続されて最終処理デー
    タを多重化して出力データを形成する出力データ形成部
    と、前記各データ処理部からのアクセス要求に応じて前
    記入力データ記憶部、データ処理部及び出力データ形成
    部のデータ転送制御を行う転送制御手段とを備え、入力
    データ記憶部に格納された入力データをデータバスを介
    して行又は列単位の複数のデータ処理部に順次転送し、
    当該データ処理部で他のデータ処理部との間で前記通信
    手段を介して処理情報の交換を行い、該交換処理情報を
    用いたデータ処理を行って、最終処理データを前記通信
    手段を介して出力データ形成部に転送し、当該出力デー
    タ形成部で多重化して出力するようにしたことを特徴と
    するデータ並列処理方式。
  4. (4)前記データ処理部は、演算処理部と、これに所定
    ビット幅の内部データバスを介して接続され且つ入力デ
    ータ記憶部及び出力データ記憶部にデータバスを介して
    接続される外部メモリインタフェースと、前記演算処理
    部に前記内部データバスを介して接続され且つ他のトラ
    ンスピュータとの通信を行う複数のリンク・インタフェ
    ースとを備えたトランスピュータで構成されていること
    を特徴とする請求項(1)乃至(3)の何れかに記載の
    データ並列処理方式。
JP6230990A 1990-03-13 1990-03-13 データ並列処理方式 Pending JPH03263164A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6230990A JPH03263164A (ja) 1990-03-13 1990-03-13 データ並列処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6230990A JPH03263164A (ja) 1990-03-13 1990-03-13 データ並列処理方式

Publications (1)

Publication Number Publication Date
JPH03263164A true JPH03263164A (ja) 1991-11-22

Family

ID=13196407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6230990A Pending JPH03263164A (ja) 1990-03-13 1990-03-13 データ並列処理方式

Country Status (1)

Country Link
JP (1) JPH03263164A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6662203B1 (en) 1998-11-16 2003-12-09 Telefonaktiebolaget Lm Ericsson (Publ) Batch-wise handling of signals in a processing system
US6714961B1 (en) 1998-11-16 2004-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Multiple job signals per processing unit in a multiprocessing system
JP2007128124A (ja) * 2005-11-01 2007-05-24 Hitachi Ltd リコンフィギュラブルプロセッサまたは装置
JP2007221582A (ja) * 2006-02-17 2007-08-30 Toshiba Corp 監視システム及び画像処理装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6662203B1 (en) 1998-11-16 2003-12-09 Telefonaktiebolaget Lm Ericsson (Publ) Batch-wise handling of signals in a processing system
US6714961B1 (en) 1998-11-16 2004-03-30 Telefonaktiebolaget Lm Ericsson (Publ) Multiple job signals per processing unit in a multiprocessing system
JP2007128124A (ja) * 2005-11-01 2007-05-24 Hitachi Ltd リコンフィギュラブルプロセッサまたは装置
JP4720436B2 (ja) * 2005-11-01 2011-07-13 株式会社日立製作所 リコンフィギュラブルプロセッサまたは装置
JP2007221582A (ja) * 2006-02-17 2007-08-30 Toshiba Corp 監視システム及び画像処理装置

Similar Documents

Publication Publication Date Title
NL192637C (nl) Stelselprocessor.
KR100812225B1 (ko) 멀티프로세서 SoC 플랫폼에 적합한 크로스바 스위치구조
KR940001274B1 (ko) 정보처리장치용 버스시스템
US5659687A (en) Device for controlling memory data path in parallel processing computer system
JP2511397B2 (ja) 多重プロセッサデ―タ処理システム及びその操作方法
JPH10507023A (ja) 共用メモリシステム
JP5360061B2 (ja) マルチプロセッサシステム及びその制御方法
US7581049B2 (en) Bus controller
EP1187028B1 (en) Immediate grant bus arbiter for bus system
CN114564434B (zh) 一种通用多核类脑处理器、加速卡及计算机设备
JPH0668053A (ja) 並列計算機
JPH03263164A (ja) データ並列処理方式
JPH0470946A (ja) Dmaコントローラを内蔵した処理装置
JP2000259609A (ja) データ処理プロセッサおよびシステム
JP2875448B2 (ja) データ転送装置及びマルチプロセッサシステム
JPH09223103A (ja) 情報処理システム
JPH0358163A (ja) 疎結合型マルチプロセッサシステム
Al-Mouhamed Multiprocessor system for realtime robotics applications
JP2002342295A (ja) マルチプロセッサシステム
JPH0471060A (ja) 半導体集積回路
JP2705955B2 (ja) 並列情報処理装置
JPH064401A (ja) メモリアクセス回路
KR20020051545A (ko) 실시간 고속의 데이터 처리용 디엠에이 제어기 및 제어방법
JP3449156B2 (ja) モジュール装置
CN115796248A (zh) 一种基于分布式片上存储的多核张量处理器