WO2002027513A1

WO2002027513A1 - Systeme multiprocesseurs, systeme de traitement de donnees, procede de traitement de donnees et programme d'ordinateur

Info

Publication number: WO2002027513A1
Application number: PCT/JP2001/008434
Authority: WO
Inventors: Nobuo Sasaki
Original assignee: Sony Computer Entertainment Inc.
Priority date: 2000-09-27
Filing date: 2001-09-27
Publication date: 2002-04-04
Also published as: ATE500556T1; US7017158B2; KR20020059430A; TWI229265B; AU2001292269A1; JP2002175288A; JP3426223B2; DE60144155D1; US20020059509A1; EP1324209B1; CN1392985A; EP1324209A4; EP1324209A1; KR100866730B1; CN1258154C

Description

明細^ マルチプロセッサシステム、データ処理システム、デ一夕処理方法、コンビユー夕プログラム技術分野

本発明は、複数のデータ処理手段によりデータ処理を行うデータ処理システム、例えばマルチプロセッサシステム及びデ一夕処理方法に関する。背景技術

高度情報化社会が進み、コンピュータ等のデ一夕処理装置によるデータ処理量は増大する傾向にある。また、デ一夕処理の内容も複雑化、高度化している。従来、 C P U (Central Process ing Uni t) などのプロセッサの高性能化や、複数のプロセッサによるマルチプロセッサ化により、データ処理装置全体の処理能力の向上を図っている。

しかし、近年、要求されるデータ処理能力の増大のスピードは、プロセッサの高性能化のスピードを凌駕するまでになっている。プロセッサの高性能化は、その開発期間が長いこともあり一朝一夕に行えるものではない。

一方、例えばマルチプロセッサによるデ一夕処理能力は、使用するプロセッサの数や、その処理方法により決まり、個々のプロセッサの高性能化への依存度が小さい。そのために、データ処理装置の処理能力を向上させるための有効な手段の一つとなっている。

マルチプロセッサによるデ一夕処理方法を、一つのプロセッサがデ一夕処理時に必要とするデ一夕の範囲により分類すると、以下のようになる。

( 1 ) データ処理を行うプロセッサが、隣接して接続されるプロセッサにより処理されたデータのみを使用する - このような制御は、セル 'オートマトン、画像フィルタ、布や波の運動の計算、曲面からのポリゴン生成の計算等に向いている。 ( 2 ) デ一夕処理を行うプロセッサが、すべてのプロセッサにより処理されたデータを使用する

このような制御は、連想記憶器、 4色問題 . トラべリングセ一ルスマン問題等の最適化、ラジオシティ、クラスタリング、多重リンクシミュレーション、学習等に向いている。

( 3 ) デ一夕処理を行うプロセッサが、複数のプロセッサのうちの一部のプ口セッサにより処理されたデ一夕のみを使用する

このような制御は、自己組織化計算、視覚を使った判断による群アルゴリズム、多対多の衝突判定、データベース検索、連続曲面の生成 ·変形計算、ボーンアニメーション、インバースキネマテイクス等に向いている。

上記の（1 ) の場合のデータ処理は、従来の並列プロセッサによって、効率よく実現可能である。しかし、（2 )、 ( 3 ) のデータ処理は、並列プロセッサ間の通信速度によりシステム全体の処理速度が制限されてしまい、各プロセッサの処理速度を十分に発揮できない。例えば、すべてのプロセッサ間をクロスバ一接続することにより、（2 )、 ( 3 ) のデータ処理を高速に行うことも可能であるが、この場合、必要なハ一ドウエアが膨大になり、現実的ではない。

本発明の目的は、種々のマルチプロセッサシステム、データ処理システム、デー夕処理方法、コンピュータプログラム及び半導体デバイスを提供することにある。発明の開示

上記課題を解決するため、本発明は、以下のような種々のマルチプロセッサシステム、デ一夕処理システム、データ処理方法、コンピュータプロダラム及び半導体デパイスを提供する。

第 1のマルチプロセッサシステムは、データ処理を行う複数のプロセッサと、前記複数のプロセッサに対してデータ処理に用いるデータを含むブロードキャストデ一夕をプロ一ドキャストするコントローラとを備えており、前記複数のプロセッサの各々が、前記コントローラによりブロードキャストされた前記ブロードキャストデータから、自らが行うデ一夕処理に必要なデータのみを取捨選択してデータ処理を行うものである。

このようなマルチプロセッサシステムでは、複数のプロセッサの各々が、ブロードキャストされたデータから自らが必要とするデータのみを取捨選択してデータ処理を行うために、データの競合が起こらず、全体として高速な処理が実現される。

各プロセッサがそれぞれ他のプロセッサによる処理結果を利用したり、あるいは他のプロセッサによる処理結果を参照したりすることを可能にする場合、コントローラは、前記複数のプロセッサの各々から前記デ一夕処理による処理結果を取得するとともに、取得した処理結果を前記ブロードキャストデータとしてブロードキャストするように構成される。

好ましくは、複数のプロセッサの各々に、当該プロセッサを識別するための識別データを割り当てておき、前記コントローラを、前記処理結果に当該処理結果の取得元のプロセッサの識別デ一夕が付されたブロードキャストデ一夕を生成し、このブロ一ドキャストデ一夕をブロードキャストするように構成する。このようにすれば、各プロセッサが、この識別データに基づいて、次のタイミングで自らが行うべきデータ処理に必要な処理結果を容易に取捨選択できるようになる。また、識別デ一タにより、各プロセッサは、ブロードキャストされた処理結果がどのプロセッサによる処理結果かを容易に知ることができるようになる。

データ処理を終了した複数のプロセッサが競合する可能性がある場合は、各々のプロセッサからその識別データを取得し、取得した識別データを所定の順序で前記コントローラへ送出するソート機構をさらに備えてマルチプロセッサシステムを構成する。そして、前記コントローラが、前記ソ一ト機構より受け取つた識別データをもとに前記処理結果を取得するように構成する。この場合、前記コントローラにおける前記処理結果の読み取り順序を定める優先度データを生成する手段をさらに備え、前記データ処理を終了したプロセッサが自らの識別データと共にその処理についての前記優先度データを前記ソート機構に送出するように構成するとともに、前記ソート機構が前記優先度データに基づいて前記識別デ一夕の送出順序を決定するように構成する。ソート機構を備えることにより、例えばマルチプ口セッサシステム全体として処理の順序が決まっている場合などに、コントローラが必要な順序で処理結果を取得でき、システム全体として複雑な処理を効率よく実行できるようになる。

ソート機構は、例えば、前記プロセッサと同数のレジス夕と、各プロセッサから送出された前記識別データ及び優先度データを当該プロセッサに対応する前記レジス夕に記録させる手段と、各レジスタに記録されている識別デ一夕の順序性を前記優先度データ同士の比較によって判定する比較器とを備え、この比較器による判定結果に基づいて識別データの送出順序を決定するように構成する。

第 1のマルチプロセッサシステムにおけるコントローラは、例えば、デー夕記録用のメモリと、前記ソート機構より受け取つた識別デー夕により特定されるプロセッサから前記処理結果を取得して前記メモリに記録する記録制御手段と、前記メモリに記録されている前記処理結果を読み出すとともにその処理結果及び前記受け取った識別データを含んで前記ブロードキャストデ一夕を生成するデータ生成手段とを備えることにより、その実現が可能である。

また、前記複数のプロセッサの各々は、より具体的には、前記ブロードキャストデータに自らが行うデータ処理に必要なデ一夕が含まれているか否かを判断し、前記必要なデ一夕が含まれている場合にそのデ一夕のみを取捨選択してデータ処理を行うデータ処理機構と、前記コントローラからの要請に応じて前記データ処理機構で行ったデータの処理結果を自らの識別データと共に前記コントローラへ送出する手段と、データ処理の終了を契機に自らの識別デ一タを含む処理終了通知デ一夕を前記ソート機構へ送出する手段とを含んで構成することにより、その実現が可能である。第 2のマルチプロセッサシステムは、それぞれ、入力される入力データとの比較対象となるテンプレートデータを保持する複数のプロセッサと、前記複数のプロセッサに対して前記入力データをブロードキャス卜するコント口ーラと、前記複数のプロセッサの各々の出力を比較する比較機構とを備えたものである。前記複数のプロセッサが保持するテンプレートデ一夕は、それぞれ他のプロセッサが保持するテンプレートデータとは異なるものである。複数のプロセッサの各々は、コントローラによりブロードキャストされた入カデ一夕の特徴と自らが保持するテンプレートデ一夕の特徴との差分値を算出するとともに、算出した前記差分値と自らを識別するための識別データとのペアデータを前記比較機構へ送出するものであり、比較機構は、複数のプ口セッサの各々から受け取った前記差分値に基づいていずれか一つの差分値を選択し、選択した差分値とペアデータとなる識別デ一タを前記コント口一ラへ送出するものであり、コントローラは、比較機構から受け取った識別デ一夕に基づいて複数のプロセッサの中から一つのプロセッサを特定するものである。

このような構成のマルチプロセッサシステムにより、データの類似の判断が高速に行えるようになる。

第 3のマルチプロセッサシステムは、データ処理を行う複数のプロセッサと、前記複数のプロセッサに対してデータ処理に用いるデータをブロードキヤストするコントローラと、前記複数のプロセッサによるデータの処理結果の総和を算出する総和回路とを備えたものである。複数のプロセッサの各々は、コントローラによりブロードキャストされた前記データから処理に必要なデータのみを取捨選択してデータ処理を行うとともに、処理結果を前記総和回路へ送信するものであり、総和回路は、複数のプロセッサの各々から送信された前記処理結果の総和を算出してコントローラへ送出するものであり、コントローラは、総和回路から送信された前記処理結果の総和を複数のプロセッサにブロードキャストするものである。

データ処理結果の総和は、ニューロ等の最適化計算において、正規化計算のためにしばしば必要とされる。計算された総和をブロードキャストして、各プロセッサに送信するようにしてもよい。以上の構成のマルチプロセッサシステムにより、これらの処理も高速に行える。

なお、上記の各マルチプロセッサシステムにおいて、複数のプロセッサの少なくとも一部を共有メモリを介して互いにリング接続し、リング接続されたプロセッサ間で前記共有メモリを介してデータの受け渡しを行うように構成するようにしてもよい。

本発明が提供するデ一夕処理方法は、それぞれデータの処理を行う複数のデ一夕処理手段と、前記複数のデータ処理手段の各々の動作を制御する制御手段とを有する装置又はシステムにおいて実行される方法であって、

前記制御手段が、前記複数のプロセッサのうちデータ処理を行ったものから所定の順序でデータの処理結果を取得するとともに取得した処理結果及び取得元のデータ処理手段を識別するための識別データとを含むブロードキヤストデータを生成し、このブロードキャストデータを前記複数のデータ処理手段宛にブロードキャストする段階と、

前記複数のデータ処理手段の少なくとも一つが、前記制御手段より受け取つたブロードキャストデ一夕の中から、それに含まれる前記識別データに基づいて特定した一部の処理結果のみを選択してデータ処理を行い、その処理結果を、自らを表す識別データと共に前記制御手段宛に送出する段階と、を有することを特徴とする。

本発明が提供する第 1のデータ処理システムは、データ処理を行う複数のデータ処理手段と、前記複数のデータ処理手段の一部又は全部より受け取つたデータ処理結果及び少なくとも一つの前記データ処理手段によるデータ処理に用いるデータを含むブロードキャストデータをブロ^ "ドキャストする制御手段とを備えており、前記複数のデータ処理手段の各々が、前記制御手段によりブロードキャストされた前記ブロードキャストデ一夕から自らが行うデータ処理に必要なデータのみを取捨選択してデータ処理を行うとともに、その処理結果を前記制御手段に送出するものである。第 2のデータ処理システムは、データ処理を行う複数のデータ処理手段の各々との間で双方向通信を行うシステムであって、少なくとも一つの前記デ一夕処理手段を特定するとともに特定したデータ処理手段の識別情報とそのデータ処理手段宛のデータ処理用データとを含むブロードキャストデータを生成する手段と、前記複数のデータ処理手段の一部又は全部から当該デ一夕処理手段で行われたデ一夕の処理結果を取得する手段と、受け取った前記処理結果を前記ブロードキャストデータに含め、当該ブロードキャストデータを前記複数のデ一夕処理手段の各々にブロードキャストする手段とを備えたものである。

本発明が提供するコンピュータプログラムは、データ処理を行う複数のデ一夕処理手段の各々との間で双方向通信を行う、コンピュータ搭載の装置に於いて、前記コンピュータに以下の機能を形成させるためのコンピュータプログラムであり、本発明が提供する半導体デバイスは、データ処理を行う複数のデータ処理手段の各々との間で双方向通信を行う、コンピュータ搭載の装置に組み込まれることにより、前記コンピュータに以下の機能を形成させる半導体デバイスである。

( 1 ) 少なくとも一つの前記データ処理手段を特定するとともに特定したデ一夕処理手段の識別情報とそのデータ処理手段宛のデータ処理用デ一夕とを含むブロードキャストデータを生成する機能、

( 2 ) 前記複数のデータ処理手段の一部又は全部から当該データ処理手段で行われたデータの処理結果を取得する機能、，

( 3 ) 受け取った前記処理結果を前記ブロードキャストデータに含め、当該プロ一ドキャストデータを前記複数のデ一夕処理手段の各々にブロードキヤス卜する機能。図面の簡単な説明

第 1図は、本発明を適用したマルチプロセッサシステムの構成例を示した図であり、第 2図は、本発明による B C M Cの構成例を示す図であり、第 3図は、本発明によるセルプロセッサの構成例を示す図であり、第 4図は、本発明による WTA ·総和回路の構成例を示す図であり、第 5図は、本実施形態によるマルチプロセッサシステムにより実行される処理の流れを示すフローチャートであり、

第 6図は、本発明による隣接するプロセッサのデータ処理結果を使用する概念図であり、

第 7図は、本発明による一部のプロセッサのデ一夕処理結果を使用する概念図であり、

第 8図は、本発明による格子点デ一夕をグループ化した例示図であり、第 9図は、本発明によるオブジェクトをクラスタに分けた場合の例示図であり、

第 1 0図は、本発明による衝突判定アルゴリズムの処理の流れを示すフロ一チヤ一トである。発明を実施するための最良の形態

以下に、本発明をデータ処理システムの一例となるマルチプロセッサシステムに適用した場合の実施の形態を説明する。

<全体構成 >

第 1図は、マルチプロセッサシステムの構成例を示した図である。このマルチプロセッサシステム 1は、デ一夕処理及びデータ記録及び読み出しのための制御手段であるブロードキャストメモリコントローラ（以下、「B C M C (Broadcas t Memory Cont ro l l er)」という。） 1 0と、各々データ処理手段の一例となる複数のセルプロセッサ 2 0と、デ一夕処理のための所要の機能を種々形成するための複数の WT A (Winner Take Al l ) '総和回路 3 0と、を含んで構成されている。

B C M C 1 0とすべてのセルプロセッサ 2 0とは、プロ一ドキャストチヤネル（一斉送出可能な通信チャネル）により接続されている。このマルチプロセッサシステム 1は、各セルプロセッサ 20によるデータ処理結果の一例となる状態変数値を B CMC 10で管理し、 BC.MC 10からすべてのセルプロセッサ 20の状態変数値を、参照用数値の一例としてブロードキャストにより送出するものである。これにより、各セルプロセッサ 20は、高速に他のセルプロセッサ 20において発生した状態変数値を参照可能とする。

ブロードキャストチャネルは、 B CMC 10と複数のセルプロセッサ 20 との間の伝送経路であって、ァドレスの受け渡しに使用されるアドレスバスと、状態変数値などのデータの受け渡しに使用されるデータバスとを含んで構成される。アドレスには、個々のセルプロセッサ 20を特定するためのセルァドレスと、すべてのセルプロセッサ 20を対象とするブロードキャストァドレスとがある。

セルアドレスは、メモリ上のアドレス（物理アドレス又は論理アドレス）に対応しており、セルプロセッサ 20からの状態変数値は、常に、当該セルプロセッサ 20を示すセルァドレスに対応するァドレスに記憶されるようになっている。各セルプロセッサ 20には、各々を識別するための識別情報として、 I D (identification) が付されている。セルアドレスは、この I D にも対応するようになっている。これにより、状態変数値がどのセルプロセッサ 20から出力されたのかを、セルァドレスによって特定することができる。

WTA .総和回路 30は、第 1図に示すように接続される。即ち、 WTA •総和回路 30は、セルプロセッサ 20側を一段目としてピラミツド状に接続される。一段目の WTA ·総和回路 30の入力端には 2つのセルプロセッサ 20が接続され、出力端は二段目の WT A ·総和回路 30の入力端に接続される。

二段目以降は、入力端の各々に下位の段の 2つの WT A ·総和回路 30の出力端が接続され、出力端に上位の段の WT A ·総和回路 30の入力端が接続される。最上段の WTA '総和回路 30は、入力端に下段の 2つの WTA -総和回路 30の出力端が接続され、出力端は B CMC 10に接続される。なお、図示の接続形態の他に、 WTA ·総和回路 30をカスケードに接続しても、本発明を実施することが可能である。この場合、一段目の WTA · 総和回路 30の入力端には 2つのセルプロセッサ 20を接続し、出力端を上位の段の入力端に接続する。二段目以降の WT A ·総和回路 30の入力端には、下位の段の WTA ·総和回路 30の出力端とセルプロセッサ 20が接続され、出力端は上位の段の入力端に接続される。最上段の" WTA *総和回路 30は、入力端に下位の段の WT A ·総和回路 30の出力端とセルプロセッサ 20とが接続され、出力端は B CMC 10に接続される。

次に、 BCMC 10、セルプロセッサ 20、 WTA ·総和回路 30のそれぞれについて詳細に説明する。

<BCMC>

B CMC 10は、ブロードキャストチャネルによりすベてのセルプロセッサ 20にデータをブロードキャストするとともに、各セルプロセッサ 20からの状態変数値を取り込んで保持する。第 2図に B CMC 10の構成例を示す。

B CMC 10は、マルチプロセッサシステム 1全体の動作を制御する C P Uコア 101と、 SRAM (Static Random Access Memory) などの書き換え可能なメインメモリ 102と、 DMAC (Direct Memory Access Controller) 103とがバス B 1で接続されて構成される。 CPUコア 10 1は、メインメモリ 102と協働し、所定のコンピュータプログラムを読み込んで実行することにより、本発明の特徴的なデ一夕処理を行うための機能を形成するコンピュー夕搭載の半導体デバイスである。メインメモリ 102は、システム全体の共有メモリとして使用されるようになっている。

バス B 1には、最上段の WTA ·総和回路 30の出力端及びハードデイスクゃ可搬性メディア等の外部メモリも接続される。

CPUコア 101は、起動時に上記の外部メモリから起動プログラムを読み込み、その起動プログラムを実行してオペレーティングシステムを動作させる。また、データ処理に必要となる種々のデ一夕を上記の外部メモリから読み出し、これをメインメモリ 1 0 2に展開する。メインメモリ 1 0 2には、各セルプロセッサ 2 0の状態変数値などのデータも記憶されるようにする。状態変数値は、当該状態変数値を算出したセルプロセッサ 2 0のセルアドレスに応じたメインメモリ 1 0 2のァドレスに記憶される。

C P Uコア 1 0 1は、また、メインメモリ 1 0 2から読み出したデータに基づいて、各セルプロセッサ 2 0に対してブロードキャストするブロードキヤストデ一夕を生成する。ブロードキャストデータは、例えば、状態変数値と当該状態変数値を算出したセルプロセッサ 2 0を示すセルァドレスとの組からなるペア（組）データである。ペアデータは、 1組又は複数組生成される。

D MA C 1 0 3は、メインメモリ 1 0 2と各セルプロセッサ 2 0との間のダイレクトメモリアクセス転送制御を行う半導体デバイスである。例えば、各セルプロセッサ 2 0に対しては、ブロードキャストチャネルを介して、ブロードキャストデ一夕をブロードキャストする。また、各セルプロセッサ 2 0のデータ処理結果を個別に取得して、メインメモリ 1 0 2に書き込む。 <セルプロセッサ >

各セルプロセッサ 2 0は、ブロードキャストデ一夕の中から必要となるデ一夕を取捨選択してデータ処理を行い、データ処理の終了時に、その旨を W T A ·総和回路 3 0へ報告する。データ処理結果である状態変数値を、 B C M C 1 0からの指示により、 B C M C 1 0へ送出する。各セルプロセッサ 2 0間は、図示しない共有メモリを介してリング接続される。各セルプロセッサ 2 0は、データ処理を同期的なクロックで行ってもよく、各々異なるクロックで行ってもよい。第 3図にセルプロセッサ 2 0の構成例を示す。

セルプロセッサ 2 0は、セル C P U 2 0 1と、入力バッファ 2 0 2と、出力バッファ 2 0 3と、 WT Aバッファ 2 0 4と、プログラムコントローラ 2 0 5と、命令メモリ 2 0 6と、データメモリ 2 0 7と、を含んで構成される。セル C P U 2 0 1は、プログラマブルな浮動小数点演算器を備えたプロセッサであり、セルプロセッサ 20内の動作を制御して、データ処理を行うものである。セル CPU 20 1は、 B CMC 10からブロードキャストされたブロードキャストデータを入力バッファ 202を介して取得し、ペアデータのセルァドレスにより自己が行うべき処理に必要なデータか否かを判断し、必要であればデ一夕メモリ 207の対応するアドレスに状態変数値を書き込む。また、データメモリ 207から状態変数値を読み出してデータ処理を行い、デ一夕処理結果を出力バッファ 203に書き込み、 WT A ·総和回路 3 0にデ一夕処理の終了を示すデ一夕を送る。

入力バッファ 202は、 B CMC 10からブロ一ドキャストされたブロードキャストデータを保持するものである。保持されたブロードキャストデー夕は、セル C PU201からの要求により、セル CPU201へ送られる。出力バッファ 203は、セル C PU 201の状態変数値を保持するものである。保持された状態変数値は、 B CMC 10からの要求により、 BCMC 10へ送信される。

入力バッファ 202及び出力バッファ 203は、この他に制御用のデータ等の送受を行ってもよい。

WTAバッファ 204は、セル CPU 201によるデータ処理の終了時に、セル CPU 201からデータ処理の終了を示すデータを受信して、これを W TA ·総和回路 30へ送信することにより、デ一夕処理の終了を WT A ·総和回路 30に報告するものである。データ処理の終了を示す終了データには、例えば、自セルプロセッサ 20の I Dと、出力バッファ 203に保存された状態変数値が B CMC 10へ読み取られるときの優先度を決める優先度デー夕とが含まれる。

プログラムコントローラ 205は、セルプロセッサ 20の動作を規定するプログラムを B CMC 10から取り込むものである。セルプロセッサ 20の動作を規定するプログラムには、セルプロセッサ 20で実行されるデータ処理のためのプログラムや、当該セルプロセッサ 20で処理に必要なデータを決めるデータ選択プログラム、処理結果が BCMC 10へ読み取られるときの優先度を決める優先度決定プログラムなどがある。

命令メモリ 2 0 6は、プログラムコントローラ 2 0 5により取り込んだプログラムを保存するものである。保存したプログラムは、必要に応じてセル C P U 2 0 1に読み込まれる。

データメモリ 2 0 7は、セルプロセッサ 2 0において処理されるデータを保存するものである。セル C P U 2 0 1により必要と判断されたブロードキャストデータが書き込まれる。ブロードキャストデータは、セルアドレスに応じたァドレスに保存される。

また、本実施形態ではデ一タメモリ 2 0 7の一部は共有メモリを介して隣接するセルプロセッサ 2 0に繋がっており、. 1サイクル毎に隣接するセルプ口セッサ 2 0とデータの送受が可能となっている。

複数の WT A ·総和回路 3 0は、各セルプロセッサ 2 0から送られるデー夕処理の終了を示すデータにより、 B C M C 1 0がセルプロセッサ 2 0から状態変数値を取り込む順序を決めて B CM C 1 0へ報告する。

第 4図に WTA ·総和回路 3 0の構成例を示す。

各 WT A ·総和回路 3 0は、 2つの入力レジスタ A、 B (以下、第 1入力レジスタ 3 0 1、第 2入力レジスタ 3 0 2 ) と、切換器 3 0 3と、比較器 3 0 4と、加算器 3 0 5と、出力レジスタ 3 0 6と、を含んで構成される。第 1入力レジスタ 3 0 1及び第 2入力レジスタ 3 0 2は、それぞれ整数レジス夕及び浮動小数点レジスタを備えている。整数レジス夕には、例えばセルプロセッサ 2 0から送られるデータ処理の終了を示す終了デ一夕のうち、 I Dが書き込まれ、浮動小数点レジスタには、例えば優先度データが書き込まれる。

切換器 3 0 3は、比較器 3 0 4及び加算器 3 0 5のいずれか一方を活性化する。具体的には、動作モードに従って一方のみを使用可能とする。動作モードは、例えば B C M C 1 0からの指示により決められる。動作モードについては後述する。比較器 3 0 4は、第 1入力レジスタ 3 0 1及び第 2入力レジスタ 3 0 2の各々の浮動小数点レジス夕が保持する浮動小数点値の比較を行い、大きい方 (又は小さい方）の値と、それに付随する整数とを、出力レジスタ 3 0 6へ書き込む。

加算器 3 0 5は、第 1入力レジス夕 3 0 1及び第 2入力レジスタ 3 0 2の各々の浮動小数点レジスタが保持する浮動小数点値の和を算出し、算出結果を出力レジスタ 3 0 6へ書き込む。

出力レジスタ 3 0 6は、第 1入力レジス夕 3 0 1及び第 2入力レジスタ 3 0 2とほぼ同じに構成される。つまり、整数レジスタ及び浮動小数点レジス夕を備えている。整数レジス夕には I Dが書き込まれ、浮動小数点レジス夕には優先度データが書き込まれるようになつている。

WTA ·総和回路 3 0は、以下に説明する 3つの動作モードをもつ。

最大値（WT A) モ一ド：

切換器 3 0 3により、比較器 3 0 4が活性化される。比較器 3 0 4は、第 1入力レジスタ 3 0 1及び第 2入力レジスタ 3 0 2の各々の浮動小数点レジス夕が保持する浮動小数点値 A、 Bの比較を行い、大きい方（又は小さい方）の値と、それに付随する整数値を出力レジスタ 3 0 6に書き込む。出力レジスタ 3 0 6への書き込みが終了すると、第 1入力レジスタ 3 0 1及び第 2入力レジスタ 3 0 2をクリアする。出力レジスタ 3 0 6の内容は、上位の段の WT A ·総和回路 3 0の入力レジス夕に書き込まれる。このとき、書き込み先の入力レジスタがクリアされていないときは、書き込^がストールして、そのサイクルでは書き込みを行わず、次のサイクルで書き込むようにする。加算モ一ド：

切換器 3 0 3により、加算器 3 0 5が活性化される。加算器 3 0 5により、第 1入力レジス夕 3 0 1及び第 2入力レジス夕 3 0 2の各々の浮動小数点レジス夕が保持する浮動小数点値 A、 Bの和を算出し、算出結果を出力レジスタ 3 0 6に書き込む。出力レジスタ 3 0 6の内容は、上位の段の WT A *総和回路 3 0の入力レジス夕に書き込まれる。近似ソートモード：

切換器 3 0 3により、比較器 3 0 4が活性化される。比較器 3 0 4は、第 1入力レジスタ 3 0 1及び第 2入力レジスタ 3 0 2の各々の浮動小数点レジス夕が保持する浮動小数点値 A、 Bの比較を行い、大きい方（又は小さい方）の値と、それに付随する整数値とを出力レジスタ 3 0 6に書き込む。

その後、出力レジス夕 3 0 6に書き込まれた値を保持していた入力レジス夕のみをクリアし、出力レジスタ 3 0 6の内容を、上位の段の WT A '総和回路 3 0の入力レジス夕に書き込む。書き込み先の入力レジス夕がクリアされていない場合は、書き込みがストールし、そのサイクルでは書き込みを行わない。ただし、下位の段の WT A ·総和回路 3 0の出力レジスタ 3 0 6からの書き込み動作は行われる。

近似ソートモードにより、 B C M C 1 0が WT A ·総和回路 3 0の最上段の出力レジスタ 3 0 6から受け取るデータが、浮動小数点が大きい順或いは小さい順にソートされた（並び替えられた）ものとなる。

なお、各モードに入る前には、すべての WT A ·総和回路 3 0の第 1入力レジスタ 3 0 1、第 2入力レジスタ 3 0 2及び出力レジスタ 3 0 6がクリアされる。

各モードを切替えて使用することにより、複数の WT A ·総和回路 3 0全体として、上記のソートのための機構（ソート機構）及び/又は総和回路として機能する。つまり、近似ソ一トモ一ドで動作するときは、ソート機構を実現するものとなり、加算モードで動作するときは、総和回路を実現するものとなる。

最大値モード、近似ソートモードで動作する WT A ·総和回路 3 0は、次に示すようにして実現してもよい。

すなわち、セルプロセッサ 2 0と同数の入力レジスタと、切換器と、比較器と、加算器と、出力レジス夕とを含んで WT A ·総和回路が構成される。入力レジスタがセルプロセッサ 2 0の数と同じだけ用意されており、それぞれが、第 1レジスタ 3 0 1、第 2レジスタ 3 0 2と同様に、整数レジスタ及び浮動小数点レジスタを備える。比較器は、すべての入力レジス夕の浮動小数点レジスタが保持する浮動小数点値の比較を行う。加算器は、すべての入力レジスタの浮動小数点レジス夕が保持する浮動小数点値の和を算出する。出力レジス夕は、第 4図の WT A ·総和回路 3 0の出力レジスタと同様である。

比較器により、各入力レジスタの浮動小数点レジスタが保持する優先度デ —夕を比較して、優先度の高い順に、付随する I Dを順次出力レジスタに書き込む。これにより、 I Dを、優先度の高い順序で B C M C 1 0へ送ることができる。

加算器により、各浮動小数点レジス夕が保持するデータを加算して、その総和を求めることができる。

このような WT A ·総和回路は、第 1図に示すような接続形態をとらなくとも、一つで、本発明におけるソート機構、総和回路として機能する。

<データ処理方法 >

本実施形態におけるマルチプロセッサシステム 1は、以下のように動作することにより、所要のデータ処理を実行する。第 5図は、このマルチプロセッサシステム 1において実行される処理の流れを示すフローチャートである。

B C M C 1 0のメインメモリ 1 0 2には、すべてのセルプロセッサ 2 0の状態変数値の初期値が予め記憶される。

B C M C 1 0は、このセルプロセッサ 2 0の状態変数値とセルプロセッサ 2 0を示すセルァドレスとからなるぺアデ一夕により、ブロードキャストデ —夕を作成する（ステップ S 1 0 1 )。そして、作成したブロードキャストデ一夕を、すべてのセルプロセッサ 2 0へブロードキャストする（ステップ S 1 0 2 )。

各セルプロセッサ 2 0は、ブロードキャストデータを、入力バッファ 2 0 2に取り込む。セル C P U 2 0 1は、命令メモリ 2 0 6に記憶されたデータ選択プログラムにより、入力バッファ 2 0 2が保持するブロードキャストデ一夕のセルアドレスを調べて、自セルプロセッサ 2 0が行うデータ処理に要する状態変数値があるか否かを確認する（ステップ S 1 0 3 )。自らが行うデ一夕処理に要する状態変数値が無い場合、セルプロセッサ 2 0は、処理動作を終了する（ステップ S 1 0 3 ：無）。自らが行うデータ処理に要する状態変数値が有る場合は（ステップ S 1 0 3 ：有）、該当する状態変数値を、この状態変数値とペアデータを組むセルアドレスに対応するデ一タメモリ 2 0 7上のアドレスへ上書きする（ステップ S 1 0 4 )。

以上により、 B C M C 1 0から各セルプロセッサ 2 0へのデータのブロードキャストが終了する。

ブロードキャストが終了すると、各セルプロセッサ 2 0は、命令メモリ 2 0 6に記憶されたデータ処理のプログラムにより、データメモリ 2 0 7に記録された状態変数値をデータ処理して新たな状態変数値を生成する。新たな状態変数値は、データメモリ 2 0 7に書き込まれるとともに、出力バッファ 2 0 3にも書き込まれる（ステップ S 1 0 5 )。新たな状態変数値は、データメモリ 2 0 7上の、自らのセルアドレスに対応するアドレスに、上書きされる。

データ処理が終了する—と、セル C P U 2 0 1は、 WT Aバッファ 2 0 4を介して 1段目の W T A ·総和回路 3 0の入力レジス夕へ I Dと優先度データとを含む終了デ一タを送信して、データ処理の終了を報告する（ステップ S 1 0 6 )。優先度デ一夕は、データ処理の前又は後に、所定の優先度決定プログラムによって生成される。

1段目の WT A ·総和回路 3 0は、各セルプロセッサ 2 0から送られる終了デ一夕のうち、 I Dを入力レジスタの整数レジスタへ、優先度デ一夕を浮動小数点レジスタでそれぞれ保持する。ここで、 WT A *総和回路 3 0は近似ソートモードで動作する。そのために、切換器 3 0 3は、比較器 3 0 4を活性化する。

WT A ·総和回路 3 0の第 1入力レジス夕 3 0 1及び第 2入力レジスタの整数レジスタは、各々異なるセルプロセッサ 2 0から送られた I Dを保持する。また、各々の浮動小数点レジスタは、 I Dに付随した優先度データを保持する。比較器 304は、第 1入力レジスタ 301及び第 2入力レジスタ 3 02の浮動小数点レジス夕からそれぞれ優先度データを読み出し、優先度を比較する。比較の結果、優先度が高い方の優先度データ及びそれに付随した I Dを、出力レジス夕 306の浮動小数点レジスタ及び整数レジス夕へ書き込む。出力レジス夕 306へ内容が書き込まれた入力レジスタは、その内容がクリアされる。出力レジスタ 306へ書き込まれた I D及び優先度データは、上位の段の WT A ·総和回路 30の入力レジスタへ書き込まれる。

このような処理を各段の WT A ·総和回路 30で行う。最上段の WTA · 総和回路 30は、出力レジスタ 306の整数レジスタに書き込まれた I Dを B CMC 10へ送る。

以上のような処理により、 WT A ·総和回路 30全体としては、 I Dを、優先度の高い順序で B CMC 10へ送ることとなる（ステップ S 107)。

B CMC 1 0は、 WTA ·総和回路 30から送られる I Dに該当するセルプロセッサ 20の出力バッファ 203から、データ処理された状態変数値を取得する。取得した状態変数値は、 BCMC 10内のメインメモリ 102上の、処理を行ったセルプロセッサ 20を示すセルァドレスに対応するァドレスに上書きされる（ステップ S 108)。

以上で、状態変数値の処理動作の 1サイクルが終了する。

BCMC 10が、各セルプロセッサ 20からデータ処理結果を取得し、これによりブロードキャストデータを生成する。

各セルプロセッサ 20は、ブロードキャストデータから自分に必要となるデータのみを取捨選択してデータ処理を行う。このブロードキャストデータを用いてデータ処理を行うことにより、他のすべてのセルプロセッサ 20により処理されたデ一夕を利用する処理が可能となる。また、ブロードキャストデータを、各セルプロセッサ 20からのデータ処理結果とこのデータ処理結果を生成したセルプロセッサ 20を示すセルァドレスとからなるペアデー夕により作成することにより、特定のセルプロセッサ 20のデ一夕処理結果のみを用いる処理が可能となる。さらに、隣接するセルプロセッサ 20間は共有メモリを介して接続されているので、従来と同様に、隣接するセルプロセッサ 2 0間の処理も可能である。

各セルプロセッサ 2 0が、メインメモリ 1 0 2に、直接、自セルプロセッサ 2 0で必要とするデータを取り込みに行くことがなく、ブロードキャストデ一夕から必要となるデータを選択して、各セルプロセッサ 2 0内にデータを保持して処理を行うので、デ一夕の競合が起こらずに高速処理が可能となる。

[実施例 1 ]

次に、上記のマルチプロセッサシステム 1の実施例を具体的に説明する。この実施例では、あるセルプロセッサ 2 0とそれに隣接する他のセルプロセッサ 2 0により処理されたデ一夕のみを使用する場合の例を、第 6図を参照して説明する。

第 6図において、「〇」はセルプロセッサを表しており、網掛された「〇」がデータ処理を行うセルプロセッサ、「秦」が必要とされるデータを保持するセルプロセッサである。

n X n ( nは 2以上の自然数）の格子の各格子点についてのデータ（格子点データ）に対して、次のようなフィルタ計算を連続的に実行する場合を考える。

X i，j = (X i-1, j + Xi+l. j + X i, j-l + X i, i + l) Z 4

i ：格子点の行番号、 j ：格子点の列番号

B C M C 1 0は、格子点デ一夕を行又は列でグループ化したブロードキヤストデ一夕として、 n個のセルプロセッサ 2 0にブロードキャストする。第 8図は、格子点データをグループ化した例示図であり、「〇」で示される格子点デー夕を 5個ずつグループ化してある。一つのグループ化した格子点データが、一つのセルプロセッサ 2 0で処理される。

セルプロセッサ 2 0では、ブロードキャストデ一夕から必要とするグループ化された格子点デ一タをデ一夕メモリ 2 0 7に保存する。データメモリ 2 0 7から、格子点データを順次読み出してデータ処理する。共有メモリを介して接続されるセルプロセッサ 2 0との間では、共有メモリを用いてデータ転送を行う。共有メモリへのデータの書込動作を 1サイクルとすると、セルプロセッサ 2 0間のグループ化されたデータの転送は、 2 nサイクルで行うことができる。

各セルプロセッサ 2 0を同期的に動作させ、共有メモリへの書き込みと演算とをパイプライン処理のように同時に実行することにより、セルプロセッサ 2 0間の通信と演算を同時に行うことができる。

次のブロードキャストデ一夕は、グループ化された格子点データのデータ処理が終了する度に、 B C M C 1 0によりブロードキャストされる。セルフ。口セッサ 2 0は、ブロードキャストされるデータの i、 jにより、必要なデ一夕か否かを判断する。

ブロードキャストデータをグループ化することにより行又は列方向のデ一夕を処理可能であり、共有データを介してデータ転送することにより列又は行方向のデータ処理が可能となる。

[実施例 2 ]

この実施例では、すべてのセルプロセッサ 2 0のうち、一部のセルプロセッサ 2 0により処理されたデ一夕のみを使用する場合の例を、第 7図を参照して説明する。第 7図において、「〇」はセルプロセッサを表しており、網掛された「〇」がデータ処理を行うセルプロセッサ、「秦」が必要とされるデータを保持するセルプロセッサである。このようなマルチプロセッサシステムは、ホップフィールドの連想記憶器の実現に有用である。

各セルプロセッサ 2 0は、データ処理結果である状態変数値とその状態変数値の重要度を表す重み係数とを保持するものとする。また、セルプロセッサ 2 0には、番号が付されており、 B C M C 1 0は、番号順にセルプロセッサ 2 0から状態変数値を取り込む。

B C M C 1 0は、すべてのセルプロセッサ 2 0から取り込んだ状態変数値をブロードキャストデータとしてブロードキャストする。各セルプロセッサ 2 0は、ブロードキャストデータから必要な状態変数値のみを選択して重み係数との積和演算を行い、状態変数値を更新する。必要な状態変数値が、ブ口一ドキャストデータに含まれるすべての状態変数値の場合、すべてのプロセッサにより処理されたデータを使用する処理に該当することとなる。

[実施例 3 ]

次に、パターンマッチング計算処理の例を説明する。

ここでは、入力データの特徴に最も類似するデータを保持するセルプロセッサ 2 0を特定する処理を行う。この処理は、以下のようにして行う。

各セルプロセッサ 2 0は、予め比較対象となるテンプレートデータを保持する。

B C M C 1 0は、入力データをすベてのセルプロセッサ 2 0にブロードキャストする。各セルプロセッサ 2 0は、自らが保持するテンプレートデータの特徴と入力デ一夕の特徴との差分値を算出する。差分値は、 I Dとともに WTA ·総和回路 3 0へ送られる。

WT A *総和回路 3 0は、最大値モードで動作する。入力レジス夕の整数レジスタは I Dを保持し、浮動小数点レジスタは差分値を保持する。差分値を比較器 3 0 4により比較して、小さい方の差分値とそれに付随する I Dを出力レジス夕 3 0 6へ送る。これを WT A ·総和回路 3 0全体で行い、最も小さい差分値とそれに付！ ¾ίする I Dを求める。この I D及び差分値を B C M C 1 0へ送る。

B C M C 1 0は、 I Dによりセルプロセッサ 2 0を特定する。これにより、入力データの特徴に最も類似するテンプレートデ一夕と、入力デ一夕と最も類似するテンプレートデータとの差分値とが検出できる。

[実施例 4 ]

次に、画像処理等の際に用いられる、動くオブジェクトの衝突判定アルゴリズムの処理例について説明する。「衝突判定アルゴリズム」は、ある空間内に存在する n個のオブジェクト（物体）が互いに他のオブジェクトと衝突するかどうか、衝突する場合はどの程度の強度かを判定するアルゴリズムである。 n個のオブジェクトの空間分布には偏りがあり、 m個のクラスタに分かれているとする。ここでは、例えば、 1個のオブジェクトが、他の（n— 1 ) 個のオブジェク卜のいずれと最も強く衝突するかについて判定するものとする。

第 9図は、このような空間内のオブジェクトの例示図であり、「〇」で表されるォブジェクトを矩形で囲んで 1クラスタとしており、第 9図ではォブジェクトが 5個のクラス夕に分けられている。オブジェクトを示すデータは、 B C M C 1 0からブロードキャストされ、クラスタ毎にセルプロセッサ 2 0 に取り込まれる。セルプロセッサ 2 0は、取り込んだ 1つのクラス夕に含まれるオブジェクトに関する空間内での位置、運動についての処理を行う。第 9図の例では、セルプロセッサ A〜Eにより 5個のクラスタに分けられたオブジェクトに関する処理が行われる。

第 1 0図により、衝突判定アルゴリズムの処理の流れを説明する。

B C M C 1 0は、オブジェクトの位置や速度のデータを含むオブジェクトデータと、当該オブジェクトが属するクラスタを示すクラスタデ一夕とを含むブロードキャストデ一夕を生成し、すべてのセルプロセッサ 2 0にブロードキャストする（ステップ S 2 0 1 )。各セルプロセッサ 2 0は、ブロードキヤストデータから、オブジェクトデータをクラスタデータに基づいて取捨選択して取り込む。

オブジェクトデータを取り込んだセルプロセッサ 2 0は、オブジェクトの現在の位置データと速度データとから、単位時間後の新しい位置データを算出する。新しい位置データから、新しいパウンデイングボックスの値を得る (ステップ S 2 0 2 )。パウンデイングボックスとは、例えば、第 9図における、オブジェクトを囲む矩形である。パウンデイングボックスの値とは、例えば、パウンデイングボックスの頂点の座標である。

B C M C 1 0は、オブジェクトの新しい位置データを各セルプロセッサ 2 0から取り込んで位置データを更新する（ステップ S 2 0 3 )。

次に、 B C M C 1 0は、取得した新しい位置データ等を含むオブジェクトデータを一つずつ全セルプロセッサ 20にブロードキャストする（ステップ S 204)o つまり、衝突判定の対象となる 1個のオブジェクト（以下、「判定対象オブジェクト」という）の位置を表す位置デ一夕を全セルプロセッサ 20に送る。

各セルプロセッサ 20では、まず、ステップ S 202で計算したパウンデイングボックスを用いて、判定対象オブジェクトが衝突する可能性があるか否かを判断する（ステップ S 205)。具体的には、判定対象オブジェクトの位置がバウンディングボックス内にあるか否かを判断する。

衝突する可能性がある場合、つまり、判定対象オブジェクトがバウンディングボックス内にある場合は（ステップ S 205 ： Y)、そのセルプロセッサ 20で処理される、パウンディングボックス内の各ォブジェクトとの距離計算を順次行い（ステップ S 206)、衝突の判定を行う（ステップ S 207)。判定対象オブジェクトがバウンディングボックス内のいずれかのォブジェクトと衝突する場合には（ステップ S 207 : Υ)、その衝突による衝撃の強さを定量的に表すデータ（衝突強度データ）、衝突による判定対象オブジェクトへの影響を表すデータ等を含む衝突デ一夕を生成する（ステップ S 208)。また、セルプロセッサ 20は、生成した衝突データのうち衝突強度データを、その I Dとともに WTA ·総和回路 30に送る（ステップ S 209)。

判定対象オブジェクトがバウンディングボックス外にある場合 (ステップ S 205 : Ν)、または距離計算の結果、衝突しないと判定した場合（ステツプ S 207 ： Ν)、各セルプロセッサ 20は、 WTA *総和回路 30に、例えば「― 1. 0」を、衝突強度デ一夕として送る（ステップ S 210)。

WTA ·総和回路 30は最大値モードで動作する。 WTA ·総和回路 30 は、セルプロセッサ 20から送られる衝突強度データを比較して、最も衝突による衝撃の強さが大きいことを表す衝突強度デ一夕を検出して（ステップ S 21 1)、検出した衝突強度デ一夕を生成したセルプロセッサ 20を特定する。そして特定したセルプロセッサ 20を表す I Dを B CMC 10へ送る。

BCMC 10は、 WTA ·総和回路 30の最上段から送られた I Dにより表されるセルプロセッサ 2 0から衝突データを取得する（ステップ S 2 1 2 )。ステップ S 2 0 4以降の処理をすベてのオブジェクトについて行うことにより、空間内のすべてのオブジェクト間の衝突判定が行われる。

[実施例 5 ]

次に、 WTA ·総和回路 3 0の加算器 3 0 5を用いる場合の例を説明する。各セルプロセッサ 2 0は、デ一夕処理結果を WT A ·総和回路 3 0へ入力する。 WT A ·総和回路 3 0では、加算器 3 0 5によりデータ処理結果を加算し、最終的に、すべてのセルプロセッサ 2 0のデータ処理結果の総和を得る。このようにして、 WT A ·総和回路 3 0により高速にデータ処理結果の総和を得ることが可能である。

データ処理結果の総和は、 B C M C 1 0に送られて、各セルプロセッサ 2 0にブロードキャストにより、高速に送信可能である。データ処理結果の総和は、例えば、ニュ一口などの最適化計算において、正規化計算に用いられる。

以上の説明において、 B C M C 1 0と WT A ·総和回路 3 0とは各々独立したものとしたが、 B C M C 1 0に WT A ·総和回路 3 0を組み込んだ一つのブロックとして、コントローラを構成してもよい。

なお、.以上の説明は、デ一夕処理手段がセルプロセッサ 2 0であり、制御手段がコントローラ（B C M C 1 0 ) である場合の例であるが、本発明の構成要素は、このような例に限定されるものではない。

例えば複数のデータ処理端末を広域ネットワークを介して双方向通信が可能な形態で接続し、そのうちの一つ又は複数のデ一タ処理端末を制御手段、他の複数のデ一夕処理端末をデータ処理手段として動作させ、制御手段に、複数のデータ処理手段の一部又は全部より受け取ったデータ処理結果及び少なくとも一つのデータ処理手段によるデータ処理に用いるデー夕を含むブ口一ドキャストデータをブロードキャストする機能をもたせ、複数のデ一タ処理手段の各々に、制御手段によりブロードキャストされたブロードキャストデータから自らが行うデ一夕処理に必要なデータのみを取捨選択してデータ処理を行うとともに、その処理結果を制御手段に送出させる機能をもたせるようにしてもよい。

また、複数のデータ処理手段として、予め定めた識別情報（例えば上述した識別データ）によりそれを特定できる汎用のデータ処理端末を用い、これらの汎用のデータ処理端末と双方向通信可能なサ一パ、あるいは C P U及びメモリを内蔵した半導体デバイスを搭載した装置をのみをもってデ一夕処理システムを構成するようにしてもよい。

この場合のサーバ又は装置は、その内部の C P Uが所定のコンピュータプログラムを読み込んで実行することにより、サーバ本体又は装置内に、少なくとも一つのデータ処理手段としてのデータ処理端末を特定するとともに特定したデ一夕処理端末の識別情報とそのデータ処理端末宛のデータ処理用デ一夕とを含むブロードキャストデータを生成する機能と、複数のデータ処理端末の一部又は全部から当該データ処理端末で行われたデ一夕の処理結果を取得する機能と、受け取った処理結果をブロードキャストデータに含め、当該ブロードキャストデータを複数のデータ処理端末の各々にブロードキャストする機能とを形成するものである。

以上のような本発明により、複数のデ一夕処理手段を用いる場合のデータ処理手段間のデータ処理を効率的に行えるようになる。

本発明の技術思想および範囲を逸脱することなしに、種々の実施例および変更が可能である。上記した実施例は本発明の例示にすぎず、本発明の範囲を制限するものではない。本発明の範囲は、実施例.ではなく、添付の請求の範囲により示されている。本発明の請求の範囲及びその均等範囲内でなされた種々の実施例は本発明の範囲内に含まれるものである。

Claims

請求の範囲

1 . データ処理を行う複数のプロセッサと、前記複数のプロセッサに対してデータ処理に用いるデータを含むプロ一ドキャストデータをブロードキヤストするコントローラとを備えており、

前記複数のプロセッサの各々は、前記コントローラによりブロードキャストされた前記ブロードキャストデータから、自らが行うデー夕処理に必要なデータのみを取捨選択してデータ処理を行うものである、

マルチプロセッサシステム。

2 . 前記コントローラは、デ一夕処理を行った各々のプロセッサから処理結果を取得するとともに、取得した処理結果を前記ブロードキャストデ一タとしてすベてのプロセッサ宛にブロードキャストするものである、 .

請求の範囲第 1項記載のマルチプロセッサシステム。

3 . 前記複数のプロセッサの各々には、各々のプロセッサを識別するための識別データが割り当てられており、

前記コントローラは、前記処理結果にその取得元のプロセッサの識別デ一夕が付されたブロードキャストデ一夕を生成してブロードキャストするものであり、

前記複数のプロセッサは、受け取った前記ブロードキャストデ一夕に含まれる前記識別データに基づいて次のタイミングで自らが行うべきデータ処理に必要な前記処理結果を取捨選択するものである、，

請求の範囲第 1項記載のマルチプロセッサシステム。

4 . 前記複数のプロセッサのうちデータ処理を終了したプロセッサからその識別データを取得し、取得した識別データを所定の順序で前記コントローラへ送出するソート機構をさらに備えており、

前記コントローラが、前記ソート機構より受け取った識別データをもとに前記処理結果を取得するように構成されている、

請求の範囲第 3項記載のマルチプロセッサシステム。

5 . 前記コント口一ラにおける前記処理結果の読み取り順序を定める優先度データを生成する手段を備えており、

前記データ処理を終了したプロセッサは、自らの識別データと共にその処理についての前記優先度データを前記ソート機構に送出するように構成されており、

前記ソート機構は、前記優先度データに基づいて前記識別データの送出順序を決定するように構成されている、

請求の範囲第 4項記載のマルチプロセッサシステム。

6 . 前記ソート機構が、前記プロセッサと同数のレジスタと、

各プロセッサから送出された前記識別データ及び優先度データを当該プロセッサに対応する前 ^レジスタに記録させる手段と、

各レジスタに記録されている識別データの順序性を前記優先度データ同士の比較によって判定する比較器とを備え、

この比較器による判定結果に基づいて前記識別データの送出順序を決定するように構成されている、

請求の範囲第 5項記載のマルチプロセッサシステム。

7 . 前記コントローラは、データ記録用のメモリと、前記ソート機構より受け取つた識別デ一夕により特定されるプロセッサから前記処理結果を取得して前記メモリに記録する記録制御手段と、

前記メモリに記録されている前記処理結果を読み出すとともにその処理結果及び前記受け取った識別デ一夕を含んで前記ブロードキャストデータを生成するデータ生成手段とを有するものである、

請求の範囲第 4項記載のマルチプロセッサシステム。

8 . 前記複数のプロセッサの各々が、

前記ブロードキャストデータに自らが行うデータ処理に必要なデータが含まれているか否かを判断し、前記必要なデ一夕が含まれている場合にそのデ一夕のみを取捨選択してデータ処理を行うデータ処理機構と、

前記コントローラからの要請に応じて前記データ処理機構で行ったデータの処理結果を自らの識別デ一夕と共に前記コントローラへ送出する手段と、データ処理の終了を契機に自らの識別デ一タを含む処理終了通知データを前記ソート機構へ送出する手段とを含んで構成されている、

請求の範囲第 4項記載のマルチプロセッサシステム。

9 . それぞれ、入力される入力データとの比較対象となるテンプレートデ一夕を保持する複数のプロセッサと、前記複数のプロセッサに対して前記入力データをブロードキャストするコントローラと、前記複数のプロセッサの各々の出力を比較する比較機構とを備えており、

前記複数のプロセッサが保持するテンプレー卜データは、それぞれ他のプ口セッサが保持するテンプレートデ一夕とは異なるものであり、

前記複数のプロセッサの各々は、前記コントローラによりブロードキャストされた前記入力データの特徴と自らが保持するテンプレートデータの特徴との差分値を算出するとともに、算出した前記差分値と自らを識別するための識別データとのペアデータを前記比較機構へ送出するものであり、

前記比較機構は、前記複数のプロセッサの各々から受け取った前記差分値に基づいていずれか一つの差分値を選択し、選択した差分値とペアデ一夕となる識別データを前記コントローラへ送出するものであり、

前記コントローラは、前記比較機構から受け取った識別データに基づいて前記複数のプロセッサの中から一つのプロセッサを特定するものである、マルチプロセッサシステム。

1 0 . データ処理を行う複数のプロセッサと、前記複数のプロセッサに対してデータ処理に用いるデータをプロ—ドキャストするコントローラと、前記複数のプロセッサによるデータの処理結果の総和を算出する総和回路と、を備えており、

前記複数のプロセッサの各々は、前記コントローラによりブロードキャストされた前記データから処理に必要なデータのみを取捨選択してデータ処理を行うとともに、処理結果を前記総和回路へ送信するものであり、

前記総和回路は、前記複数のプロセッサの各々から送信された前記処理結果の総和を算出して前記コントローラへ送出するものであり、前記コントロ一ラは、前記総和回路から受け取つた前記処理結果の総和を前記複数のプロセッサにブロードキャストするものである、

マルチプロセッサシステム。

1 1 . 前記複数のプロセッサの少なくとも一部が共有メモリを介して互いにリング接続されており、リング接続されたプロセッサ間では前記共有メモリを介してデ一夕の受け渡しを行うように構成されている、

請求の範囲第 1項記載のマルチプロセッサシステム。

1 2 . 前記複数のプロセッサの少なくとも一部が共有メモリを介して互いにリング接続されており、リング接続されたプロセッサ間では前記共有メモリを介してデー夕の受け渡しを行うように構成されている、

請求の範囲第 9項記載のマルチプロセッサシステム。

1 3 . 前記複数のプロセッサの少なくとも一部が共有メモリを介して互いにリング接続されており、リング接続されたプロセッサ間では前記共有メモリを介してデ一夕の受け渡しを行うように構成されている、

請求の範囲第 1 0項記載のマルチプロセッサシステム。

1 4 . それぞれデータの処理を行う複数のデータ処理手段と、前記複数のデータ処理手段の各々の動作を制御する制御手段とを有する装置又はシステムにおいて実行される方法であって、

前記制御手段が、前記複数のプロセッサのうちデ一夕処理を行ったものから所定の順序でデータの処理結果を取得するとともに取得した処理結果及び取得元のデータ処理手段を識別するための識別デ一夕とを含むブロードキヤス卜データを生成し、このブロードキャストデ一夕を前記複数のデータ処理手段宛にブロードキャストする段階と、

前記複数のデ一夕処理手段の少なくとも一つが、前記制御手段より受け取つたブロードキャストデ一夕の中から、それに含まれる前記識別データに基づいて特定した一部の処理結果のみを選択してデータ処理を行い、その処理結果を、自らを表す識別データと共に前記制御手段宛に送出する段階と、を有することを特徴とする、データ処理方法。.

1 5 . データ処理を行う複数のデータ処理手段と、前記複数のデータ処理手段の一部又は全部より受け取ったデータ処理結果及び少なくとも一つの前記データ処理手段によるデータ処理に用いるデータを含むブロードキャストデ一夕をブロードキャストする制御手段とを備えており、

前記複数のデータ処理手段の各々は、前記制御手段によりブロードキャストされた前記ブロードキャストデータから自らが行うデー夕処理に必要なデ一夕のみを取捨選択してデータ処理を行うとともに、その処理結果を前記制御手段に送出するものである、

データ処理システム。

1 7 . データ処理を行う複数のデータ処理手段の各々との間で双方向通信を行うシステムであって、

少なくとも一つの前記データ処理手段を特定するとともに特定したデータ処理手段の識別情報とそのデータ処理手段宛のデータ処理用データとを含むブロードキャス卜デ一夕を生成する手段と、

前記複数のデータ処理手段の一部又は全部から当該データ処理手段で行われたデータの処理結果を取得する手段と、

受け取った前記処理結果を前記ブロードキャストデータに含め、当該プロ ―ドキャストデ一夕を前記複数のデータ処理手段の各々にブロードキャストする手段とを備えてなる、データ処理システム。

1 8 . データ処理を行う複数のデータ処理手段の各々との間で双方向通信を行う、コンピュータ搭載の装置に於いて、前記コンピュータに以下の機能を形成させるためのコンピュータプログラム。

( 1 ) 少なくとも一つの前記データ処理手段を特定するとともに特定したデ一夕処理手段の識別情報とそのデータ処理手段宛のデータ処理用デ一夕とを含むブロードキャストデータを生成する手段、

( 2 ) 前記複数のデータ処理手段の一部又は全部から当該データ処理手段で行われたデータの処理結果を取得する手段、 ( 3 ) 受け取った前記処理結果を前記ブロードキャストデータに含め、当該ブロードキャス卜データを前記複数のデータ処理手段の各々にブロードキヤストする手段。

1 6 . データ処理を行う複数のデータ処理手段の各々との間で双方向通信を行う、コンピュータ搭載の装置に組み込まれることにより、前記コンビュ —夕に以下の機能を形成させる半導体デバイス。

( 2 ) 前記複数のデータ処理手段の一部又は全部から当該データ処理手段で行われたデータの処理結果を取得する手段、

( 3 ) 受け取った前記処理結果を前記ブロードキャストデータに含め、当該ブロードキャストデ一夕を前記複数のデータ処理手段の各々にブロードキヤストする手段。