JP2002175288A - マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム - Google Patents

マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム

Info

Publication number
JP2002175288A
JP2002175288A JP2001289588A JP2001289588A JP2002175288A JP 2002175288 A JP2002175288 A JP 2002175288A JP 2001289588 A JP2001289588 A JP 2001289588A JP 2001289588 A JP2001289588 A JP 2001289588A JP 2002175288 A JP2002175288 A JP 2002175288A
Authority
JP
Japan
Prior art keywords
data
data processing
processing
processors
broadcast
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001289588A
Other languages
English (en)
Other versions
JP3426223B2 (ja
Inventor
Nobuo Sasaki
伸夫 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Computer Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Computer Entertainment Inc filed Critical Sony Computer Entertainment Inc
Priority to JP2001289588A priority Critical patent/JP3426223B2/ja
Priority to US09/964,247 priority patent/US7017158B2/en
Priority to AT01972530T priority patent/ATE500556T1/de
Priority to DE60144155T priority patent/DE60144155D1/de
Priority to KR1020027006766A priority patent/KR100866730B1/ko
Priority to TW090123900A priority patent/TWI229265B/zh
Priority to EP01972530A priority patent/EP1324209B1/en
Priority to PCT/JP2001/008434 priority patent/WO2002027513A1/ja
Priority to CNB018029167A priority patent/CN1258154C/zh
Priority to AU2001292269A priority patent/AU2001292269A1/en
Publication of JP2002175288A publication Critical patent/JP2002175288A/ja
Application granted granted Critical
Publication of JP3426223B2 publication Critical patent/JP3426223B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Multi Processors (AREA)
  • Image Processing (AREA)
  • Hardware Redundancy (AREA)

Abstract

(57)【要約】 【課題】 マルチプロセッサシステムによる高速なデー
タ処理を実現する。 【解決手段】 データ処理を行う複数のセルプロセッサ
20と、複数のセルプロセッサに対してデータ処理に用
いるデータを含むブロードキャストデータをブロードキ
ャストするBCMC10とを備えており、複数のセルプ
ロセッサの各々が、BCMCによりブロードキャストさ
れたブロードキャストデータから、自セルプロセッサが
行うデータ処理に必要なデータのみを取捨選択してデー
タ処理を行う。BCMCが、すべてのセルプロセッサの
データ処理結果を取得して、ブロードキャストデータと
してすべてのセルプロセッサへ供給可能であるので、セ
ルプロセッサ間のデータ処理結果を高速に送受でき、シ
ステム全体として高速なデータ処理が可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、複数のデータ処理
手段によりデータ処理を行うデータ処理システム、例え
ばマルチプロセッサシステム及びデータ処理方法に関す
る。
【0002】
【発明の背景】高度情報化社会が進み、コンピュータ等
のデータ処理装置によるデータ処理量は増大する傾向に
ある。また、データ処理の内容も複雑化、高度化してい
る。従来、CPU(Central Processing Unit)などの
プロセッサの高性能化や、複数のプロセッサによるマル
チプロセッサ化により、データ処理装置全体の処理能力
の向上を図っている。しかし、近年、要求されるデータ
処理能力の増大のスピードは、プロセッサの高性能化の
スピードを凌駕するまでになっている。プロセッサの高
性能化は、その開発期間が長いこともあり一朝一夕に行
えるものではない。一方、例えばマルチプロセッサによ
るデータ処理能力は、使用するプロセッサの数や、その
処理方法により決まり、個々のプロセッサの高性能化へ
の依存度が小さい。そのために、データ処理装置の処理
能力を向上させるための有効な手段の一つとなってい
る。
【0003】マルチプロセッサによるデータ処理方法
を、一つのプロセッサがデータ処理時に必要とするデー
タの範囲により分類すると、以下のようになる。 (1)データ処理を行うプロセッサが、隣接して接続さ
れるプロセッサにより処理されたデータのみを使用する このような制御は、セル・オートマトン、画像フィル
タ、布や波の運動の計算、曲面からのポリゴン生成の計
算等に向いている。 (2)データ処理を行うプロセッサが、すべてのプロセ
ッサにより処理されたデータを使用する このような制御は、連想記憶器、4色問題・トラベリン
グセールスマン問題等の最適化、ラジオシティ、クラス
タリング、多重リンクシミュレーション、学習等に向い
ている。 (3)データ処理を行うプロセッサが、複数のプロセッ
サのうちの一部のプロセッサにより処理されたデータの
みを使用する このような制御は、自己組織化計算、視覚を使った判断
による群アルゴリズム、多対多の衝突判定、データベー
ス検索、連続曲面の生成・変形計算、ボーンアニメーシ
ョン、インバースキネマティクス等に向いている。
【0004】上記の(1)の場合のデータ処理は、従来
の並列プロセッサによって、効率よく実現可能である。
しかし、(2)、(3)のデータ処理は、並列プロセッ
サ間の通信速度によりシステム全体の処理速度が制限さ
れてしまい、各プロセッサの処理速度を十分に発揮でき
ない。例えば、すべてのプロセッサ間をクロスバー接続
することにより、(2)、(3)のデータ処理を高速に
行うことも可能であるが、この場合、必要なハードウェ
アが膨大になり、現実的ではない。
【0005】本発明の課題は、例えば上記の(2)、
(3)のデータ処理を従来よりも効率よく行うことので
きるデータ処理システム及びデータ処理方法を提供する
ことにある。
【0006】
【課題を解決するための手段】上記課題を解決するた
め、本発明は、以下のような種々のマルチプロセッサシ
ステム、データ処理システム、データ処理方法、コンピ
ュータプログラム及び半導体デバイスを提供する。第1
のマルチプロセッサシステムは、データ処理を行う複数
のプロセッサと、前記複数のプロセッサに対してデータ
処理に用いるデータを含むブロードキャストデータをブ
ロードキャストするコントローラとを備えており、前記
複数のプロセッサの各々が、前記コントローラによりブ
ロードキャストされた前記ブロードキャストデータか
ら、自らが行うデータ処理に必要なデータのみを取捨選
択してデータ処理を行うものである。このようなマルチ
プロセッサシステムでは、複数のプロセッサの各々が、
ブロードキャストされたデータから自らが必要とするデ
ータのみを取捨選択してデータ処理を行うために、デー
タの競合が起こらず、全体として高速な処理が実現され
る。各プロセッサがそれぞれ他のプロセッサによる処理
結果を利用したり、あるいは他のプロセッサによる処理
結果を参照したりすることを可能にする場合、コントロ
ーラは、前記複数のプロセッサの各々から前記データ処
理による処理結果を取得するとともに、取得した処理結
果を前記ブロードキャストデータとしてブロードキャス
トするように構成される。
【0007】好ましくは、複数のプロセッサの各々に、
当該プロセッサを識別するための識別データを割り当て
ておき、前記コントローラを、前記処理結果に当該処理
結果の取得元のプロセッサの識別データが付されたブロ
ードキャストデータを生成し、このブロードキャストデ
ータをブロードキャストするように構成する。このよう
にすれば、各プロセッサが、この識別データに基づい
て、次のタイミングで自らが行うべきデータ処理に必要
な処理結果を容易に取捨選択できるようになる。また、
識別データにより、各プロセッサは、ブロードキャスト
された処理結果がどのプロセッサによる処理結果かを容
易に知ることができるようになる。
【0008】データ処理を終了した複数のプロセッサが
競合する可能性がある場合は、各々のプロセッサからそ
の識別データを取得し、取得した識別データを所定の順
序で前記コントローラへ送出するソート機構をさらに備
えてマルチプロセッサシステムを構成する。そして、前
記コントローラが、前記ソート機構より受け取った識別
データをもとに前記処理結果を取得するように構成す
る。この場合、前記コントローラにおける前記処理結果
の読み取り順序を定める優先度データを生成する手段を
さらに備え、前記データ処理を終了したプロセッサが自
らの識別データと共にその処理についての前記優先度デ
ータを前記ソート機構に送出するように構成するととも
に、前記ソート機構が前記優先度データに基づいて前記
識別データの送出順序を決定するように構成する。ソー
ト機構を備えることにより、例えばマルチプロセッサシ
ステム全体として処理の順序が決まっている場合など
に、コントローラが必要な順序で処理結果を取得でき、
システム全体として複雑な処理を効率よく実行できるよ
うになる。ソート機構は、例えば、前記プロセッサと同
数のレジスタと、各プロセッサから送出された前記識別
データ及び優先度データを当該プロセッサに対応する前
記レジスタに記録させる手段と、各レジスタに記録され
ている識別データの順序性を前記優先度データ同士の比
較によって判定する比較器とを備え、この比較器による
判定結果に基づいて識別データの送出順序を決定するよ
うに構成する。
【0009】第1のマルチプロセッサシステムにおける
コントローラは、例えば、データ記録用のメモリと、前
記ソート機構より受け取った識別データにより特定され
るプロセッサから前記処理結果を取得して前記メモリに
記録する記録制御手段と、前記メモリに記録されている
前記処理結果を読み出すとともにその処理結果及び前記
受け取った識別データを含んで前記ブロードキャストデ
ータを生成するデータ生成手段とを備えることにより、
その実現が可能である。また、前記複数のプロセッサの
各々は、より具体的には、前記ブロードキャストデータ
に自らが行うデータ処理に必要なデータが含まれている
か否かを判断し、前記必要なデータが含まれている場合
にそのデータのみを取捨選択してデータ処理を行うデー
タ処理機構と、前記コントローラからの要請に応じて前
記データ処理機構で行ったデータの処理結果を自らの識
別データと共に前記コントローラへ送出する手段と、デ
ータ処理の終了を契機に自らの識別データを含む処理終
了通知データを前記ソート機構へ送出する手段とを含ん
で構成することにより、その実現が可能である。
【0010】第2のマルチプロセッサシステムは、それ
ぞれ、入力される入力データとの比較対象となるテンプ
レートデータを保持する複数のプロセッサと、前記複数
のプロセッサに対して前記入力データをブロードキャス
トするコントローラと、前記複数のプロセッサの各々の
出力を比較する比較機構とを備えたものである。前記複
数のプロセッサが保持するテンプレートデータは、それ
ぞれ他のプロセッサが保持するテンプレートデータとは
異なるものである。複数のプロセッサの各々は、コント
ローラによりブロードキャストされた入力データの特徴
と自らが保持するテンプレートデータの特徴との差分値
を算出するとともに、算出した前記差分値と自らを識別
するための識別データとのペアデータを前記比較機構へ
送出するものであり、比較機構は、複数のプロセッサの
各々から受け取った前記差分値に基づいていずれか一つ
の差分値を選択し、選択した差分値とペアデータとなる
識別データを前記コントローラへ送出するものであり、
コントローラは、比較機構から受け取った識別データに
基づいて複数のプロセッサの中から一つのプロセッサを
特定するものである。このような構成のマルチプロセッ
サシステムにより、データの類似の判断が高速に行える
ようになる。
【0011】第3のマルチプロセッサシステムは、デー
タ処理を行う複数のプロセッサと、前記複数のプロセッ
サに対してデータ処理に用いるデータをブロードキャス
トするコントローラと、前記複数のプロセッサによるデ
ータの処理結果の総和を算出する総和回路とを備えたも
のである。複数のプロセッサの各々は、コントローラに
よりブロードキャストされた前記データから処理に必要
なデータのみを取捨選択してデータ処理を行うととも
に、処理結果を前記総和回路へ送信するものであり、総
和回路は、複数のプロセッサの各々から送信された前記
処理結果の総和を算出してコントローラへ送出するもの
であり、コントローラは、総和回路から送信された前記
処理結果の総和を複数のプロセッサにブロードキャスト
するものである。データ処理結果の総和は、ニューロ等
の最適化計算において、正規化計算のためにしばしば必
要とされる。計算された総和をブロードキャストして、
各プロセッサに送信するようにしてもよい。以上の構成
のマルチプロセッサシステムにより、これらの処理も高
速に行える。
【0012】なお、上記の各マルチプロセッサシステム
において、複数のプロセッサの少なくとも一部を共有メ
モリを介して互いにリング接続し、リング接続されたプ
ロセッサ間で前記共有メモリを介してデータの受け渡し
を行うように構成するようにしてもよい。
【0013】本発明が提供するデータ処理方法は、それ
ぞれデータの処理を行う複数のデータ処理手段と、前記
複数のデータ処理手段の各々の動作を制御する制御手段
とを有する装置又はシステムにおいて実行される方法で
あって、前記制御手段が、前記複数のプロセッサのうち
データ処理を行ったものから所定の順序でデータの処理
結果を取得するとともに取得した処理結果及び取得元の
データ処理手段を識別するための識別データとを含むブ
ロードキャストデータを生成し、このブロードキャスト
データを前記複数のデータ処理手段宛にブロードキャス
トする段階と、前記複数のデータ処理手段の少なくとも
一つが、前記制御手段より受け取ったブロードキャスト
データの中から、それに含まれる前記識別データに基づ
いて特定した一部の処理結果のみを選択してデータ処理
を行い、その処理結果を、自らを表す識別データと共に
前記制御手段宛に送出する段階と、を有することを特徴
とする。
【0014】本発明が提供する第1のデータ処理システ
ムは、データ処理を行う複数のデータ処理手段と、前記
複数のデータ処理手段の一部又は全部より受け取ったデ
ータ処理結果及び少なくとも一つの前記データ処理手段
によるデータ処理に用いるデータを含むブロードキャス
トデータをブロードキャストする制御手段とを備えてお
り、前記複数のデータ処理手段の各々が、前記制御手段
によりブロードキャストされた前記ブロードキャストデ
ータから自らが行うデータ処理に必要なデータのみを取
捨選択してデータ処理を行うとともに、その処理結果を
前記制御手段に送出するものである。
【0015】第2のデータ処理システムは、データ処理
を行う複数のデータ処理手段の各々との間で双方向通信
を行うシステムであって、少なくとも一つの前記データ
処理手段を特定するとともに特定したデータ処理手段の
識別情報とそのデータ処理手段宛のデータ処理用データ
とを含むブロードキャストデータを生成する手段と、前
記複数のデータ処理手段の一部又は全部から当該データ
処理手段で行われたデータの処理結果を取得する手段
と、受け取った前記処理結果を前記ブロードキャストデ
ータに含め、当該ブロードキャストデータを前記複数の
データ処理手段の各々にブロードキャストする手段とを
備えたものである。
【0016】本発明が提供するコンピュータプログラム
は、データ処理を行う複数のデータ処理手段の各々との
間で双方向通信を行う、コンピュータ搭載の装置に於い
て、前記コンピュータに以下の機能を形成させるための
コンピュータプログラムであり、本発明が提供する半導
体デバイスは、データ処理を行う複数のデータ処理手段
の各々との間で双方向通信を行う、コンピュータ搭載の
装置に組み込まれることにより、前記コンピュータに以
下の機能を形成させる半導体デバイスである。 (1)少なくとも一つの前記データ処理手段を特定する
とともに特定したデータ処理手段の識別情報とそのデー
タ処理手段宛のデータ処理用データとを含むブロードキ
ャストデータを生成する手段、(2)前記複数のデータ
処理手段の一部又は全部から当該データ処理手段で行わ
れたデータの処理結果を取得する手段、(3)受け取っ
た前記処理結果を前記ブロードキャストデータに含め、
当該ブロードキャストデータを前記複数のデータ処理手
段の各々にブロードキャストする手段。
【0017】
【発明の実施の形態】以下に、本発明をデータ処理シス
テムの一例となるマルチプロセッサシステムに適用した
場合の実施の形態を説明する。
【0018】<全体構成>図1は、マルチプロセッサシ
ステムの構成例を示した図である。このマルチプロセッ
サシステム1は、データ処理及びデータ記録及び読み出
しのための制御手段であるブロードキャストメモリコン
トローラ(以下、「BCMC(BroadcastMemory Contro
ller)」という。)10と、各々データ処理手段の一例
となる複数のセルプロセッサ20と、データ処理のため
の所要の機能を種々形成するための複数のWTA(Winn
er Take All)・総和回路30と、を含んで構成されて
いる。BCMC10とすべてのセルプロセッサ20と
は、ブロードキャストチャネル(一斉送出可能な通信チ
ャネル)により接続されている。
【0019】このマルチプロセッサシステム1は、各セ
ルプロセッサ20によるデータ処理結果の一例となる状
態変数値をBCMC10で管理し、BCMC10からす
べてのセルプロセッサ20の状態変数値を、参照用数値
の一例としてブロードキャストにより送出するものであ
る。これにより、各セルプロセッサ20は、高速に他の
セルプロセッサ20において発生した状態変数値を参照
可能とする。
【0020】ブロードキャストチャネルは、BCMC1
0と複数のセルプロセッサ20との間の伝送経路であっ
て、アドレスの受け渡しに使用されるアドレスバスと、
状態変数値などのデータの受け渡しに使用されるデータ
バスとを含んで構成される。アドレスには、個々のセル
プロセッサ20を特定するためのセルアドレスと、すべ
てのセルプロセッサ20を対象とするブロードキャスト
アドレスとがある。セルアドレスは、メモリ上のアドレ
ス(物理アドレス又は論理アドレス)に対応しており、
セルプロセッサ20からの状態変数値は、常に、当該セ
ルプロセッサ20を示すセルアドレスに対応するアドレ
スに記憶されるようになっている。各セルプロセッサ2
0には、各々を識別するための識別情報として、ID
(identification)が付されている。セルアドレスは、
このIDにも対応するようになっている。これにより、
状態変数値がどのセルプロセッサ20から出力されたの
かを、セルアドレスによって特定することができる。
【0021】WTA・総和回路30は、図1に示すよう
に接続される。即ち、WTA・総和回路30は、セルプ
ロセッサ20側を一段目としてピラミッド状に接続され
る。一段目のWTA・総和回路30の入力端には2つの
セルプロセッサ20が接続され、出力端は二段目のWT
A・総和回路30の入力端に接続される。二段目以降
は、入力端の各々に下位の段の2つのWTA・総和回路
30の出力端が接続され、出力端に上位の段のWTA・
総和回路30の入力端が接続される。最上段のWTA・
総和回路30は、入力端に下段の2つのWTA・総和回
路30の出力端が接続され、出力端はBCMC10に接
続される。
【0022】なお、図示の接続形態の他に、WTA・総
和回路30をカスケードに接続しても、本発明を実施す
ることが可能である。この場合、一段目のWTA・総和
回路30の入力端には2つのセルプロセッサ20を接続
し、出力端を上位の段の入力端に接続する。二段目以降
のWTA・総和回路30の入力端には、下位の段のWT
A・総和回路30の出力端とセルプロセッサ20が接続
され、出力端は上位の段の入力端に接続される。最上段
のWTA・総和回路30は、入力端に下位の段のWTA
・総和回路30の出力端とセルプロセッサ20とが接続
され、出力端はBCMC10に接続される。
【0023】次に、BCMC10、セルプロセッサ2
0、WTA・総和回路30のそれぞれについて詳細に説
明する。
【0024】<BCMC>BCMC10は、ブロードキ
ャストチャネルによりすべてのセルプロセッサ20にデ
ータをブロードキャストするとともに、各セルプロセッ
サ20からの状態変数値を取り込んで保持する。図2に
BCMC10の構成例を示す。BCMC10は、マルチ
プロセッサシステム1全体の動作を制御するCPUコア
101と、SRAM(Static Random Access Memory)
などの書き換え可能なメインメモリ102と、DMAC
(Direct Memory Access Controller)103とがバス
B1で接続されて構成される。CPUコア101は、メ
インメモリ102と協働し、所定のコンピュータプログ
ラムを読み込んで実行することにより、本発明の特徴的
なデータ処理を行うための機能を形成するコンピュータ
搭載の半導体デバイスである。メインメモリ102は、
システム全体の共有メモリとして使用されるようになっ
ている。バスB1には、最上段のWTA・総和回路30
の出力端及びハードディスクや可搬性メディア等の外部
メモリも接続される。
【0025】CPUコア101は、起動時に上記の外部
メモリから起動プログラムを読み込み、その起動プログ
ラムを実行してオペレーティングシステムを動作させ
る。また、データ処理に必要となる種々のデータを上記
の外部メモリから読み出し、これをメインメモリ102
に展開する。メインメモリ102には、各セルプロセッ
サ20の状態変数値などのデータも記憶されるようにす
る。状態変数値は、当該状態変数値を算出したセルプロ
セッサ20のセルアドレスに応じたメインメモリ102
のアドレスに記憶される。CPUコア101は、また、
メインメモリ102から読み出したデータに基づいて、
各セルプロセッサ20に対してブロードキャストするブ
ロードキャストデータを生成する。ブロードキャストデ
ータは、例えば、状態変数値と当該状態変数値を算出し
たセルプロセッサ20を示すセルアドレスとの組からな
るペア(組)データである。ペアデータは、1組又は複
数組生成される。
【0026】DMAC103は、メインメモリ102と
各セルプロセッサ20との間のダイレクトメモリアクセ
ス転送制御を行う半導体デバイスである。例えば、各セ
ルプロセッサ20に対しては、ブロードキャストチャネ
ルを介して、ブロードキャストデータをブロードキャス
トする。また、各セルプロセッサ20のデータ処理結果
を個別に取得して、メインメモリ102に書き込む。
【0027】<セルプロセッサ>各セルプロセッサ20
は、ブロードキャストデータの中から必要となるデータ
を取捨選択してデータ処理を行い、データ処理の終了時
に、その旨をWTA・総和回路30へ報告する。データ
処理結果である状態変数値を、BCMC10からの指示
により、BCMC10へ送出する。各セルプロセッサ2
0間は、図示しない共有メモリを介してリング接続され
る。各セルプロセッサ20は、データ処理を同期的なク
ロックで行ってもよく、各々異なるクロックで行っても
よい。図3にセルプロセッサ20の構成例を示す。セル
プロセッサ20は、セルCPU201と、入力バッファ
202と、出力バッファ203と、WTAバッファ20
4と、プログラムコントローラ205と、命令メモリ2
06と、データメモリ207と、を含んで構成される。
【0028】セルCPU201は、プログラマブルな浮
動小数点演算器を備えたプロセッサであり、セルプロセ
ッサ20内の動作を制御して、データ処理を行うもので
ある。セルCPU201は、BCMC10からブロード
キャストされたブロードキャストデータを入力バッファ
202を介して取得し、ペアデータのセルアドレスによ
り自己が行うべき処理に必要なデータか否かを判断し、
必要であればデータメモリ207の対応するアドレスに
状態変数値を書き込む。また、データメモリ207から
状態変数値を読み出してデータ処理を行い、データ処理
結果を出力バッファ203に書き込み、WTA・総和回
路30にデータ処理の終了を示すデータを送る。
【0029】入力バッファ202は、BCMC10から
ブロードキャストされたブロードキャストデータを保持
するものである。保持されたブロードキャストデータ
は、セルCPU201からの要求により、セルCPU2
01へ送られる。出力バッファ203は、セルCPU2
01の状態変数値を保持するものである。保持された状
態変数値は、BCMC10からの要求により、BCMC
10へ送信される。入力バッファ202及び出力バッフ
ァ203は、この他に制御用のデータ等の送受を行って
もよい。WTAバッファ204は、セルCPU201に
よるデータ処理の終了時に、セルCPU201からデー
タ処理の終了を示すデータを受信して、これをWTA・
総和回路30へ送信することにより、データ処理の終了
をWTA・総和回路30に報告するものである。データ
処理の終了を示す終了データには、例えば、自セルプロ
セッサ20のIDと、出力バッファ203に保存された
状態変数値がBCMC10へ読み取られるときの優先度
を決める優先度データとが含まれる。
【0030】プログラムコントローラ205は、セルプ
ロセッサ20の動作を規定するプログラムをBCMC1
0から取り込むものである。セルプロセッサ20の動作
を規定するプログラムには、セルプロセッサ20で実行
されるデータ処理のためのプログラムや、当該セルプロ
セッサ20で処理に必要なデータを決めるデータ選択プ
ログラム、処理結果がBCMC10へ読み取られるとき
の優先度を決める優先度決定プログラムなどがある。命
令メモリ206は、プログラムコントローラ205によ
り取り込んだプログラムを保存するものである。保存し
たプログラムは、必要に応じてセルCPU201に読み
込まれる。
【0031】データメモリ207は、セルプロセッサ2
0において処理されるデータを保存するものである。セ
ルCPU201により必要と判断されたブロードキャス
トデータが書き込まれる。ブロードキャストデータは、
セルアドレスに応じたアドレスに保存される。また、本
実施形態ではデータメモリ207の一部は共有メモリを
介して隣接するセルプロセッサ20に繋がっており、1
サイクル毎に隣接するセルプロセッサ20とデータの送
受が可能となっている。
【0032】<WTA・総和回路>複数のWTA・総和
回路30は、各セルプロセッサ20から送られるデータ
処理の終了を示すデータにより、BCMC10がセルプ
ロセッサ20から状態変数値を取り込む順序を決めてB
CMC10へ報告する。図4にWTA・総和回路30の
構成例を示す。各WTA・総和回路30は、2つの入力
レジスタA、B(以下、第1入力レジスタ301、第2
入力レジスタ302)と、切換器303と、比較器30
4と、加算器305と、出力レジスタ306と、を含ん
で構成される。
【0033】第1入力レジスタ301及び第2入力レジ
スタ302は、それぞれ整数レジスタ及び浮動小数点レ
ジスタを備えている。整数レジスタには、例えばセルプ
ロセッサ20から送られるデータ処理の終了を示す終了
データのうち、IDが書き込まれ、浮動小数点レジスタ
には、例えば優先度データが書き込まれる。切換器30
3は、比較器304及び加算器305のいずれか一方を
活性化する。具体的には、動作モードに従って一方のみ
を使用可能とする。動作モードは、例えばBCMC10
からの指示により決められる。動作モードについては後
述する。比較器304は、第1入力レジスタ301及び
第2入力レジスタ302の各々の浮動小数点レジスタが
保持する浮動小数点値の比較を行い、大きい方(又は小
さい方)の値と、それに付随する整数とを、出力レジス
タ306へ書き込む。加算器305は、第1入力レジス
タ301及び第2入力レジスタ302の各々の浮動小数
点レジスタが保持する浮動小数点値の和を算出し、算出
結果を出力レジスタ306へ書き込む。出力レジスタ3
06は、第1入力レジスタ301及び第2入力レジスタ
302とほぼ同じに構成される。つまり、整数レジスタ
及び浮動小数点レジスタを備えている。整数レジスタに
はIDが書き込まれ、浮動小数点レジスタには優先度デ
ータが書き込まれるようになっている。
【0034】WTA・総和回路30は、以下に説明する
3つの動作モードをもつ。
【0035】・最大値(WTA)モード:切換器303
により、比較器304が活性化される。比較器304
は、第1入力レジスタ301及び第2入力レジスタ30
2の各々の浮動小数点レジスタが保持する浮動小数点値
A、Bの比較を行い、大きい方(又は小さい方)の値
と、それに付随する整数値を出力レジスタ306に書き
込む。出力レジスタ306への書き込みが終了すると、
第1入力レジスタ301及び第2入力レジスタ302を
クリアする。出力レジスタ306の内容は、上位の段の
WTA・総和回路30の入力レジスタに書き込まれる。
このとき、書き込み先の入力レジスタがクリアされてい
ないときは、書き込みがストールして、そのサイクルで
は書き込みを行わず、次のサイクルで書き込むようにす
る。
【0036】・加算モード:切換器303により、加算
器305が活性化される。加算器305により、第1入
力レジスタ301及び第2入力レジスタ302の各々の
浮動小数点レジスタが保持する浮動小数点値A、Bの和
を算出し、算出結果を出力レジスタ306に書き込む。
出力レジスタ306の内容は、上位の段のWTA・総和
回路30の入力レジスタに書き込まれる。
【0037】・近似ソートモード:切換器303によ
り、比較器304が活性化される。比較器304は、第
1入力レジスタ301及び第2入力レジスタ302の各
々の浮動小数点レジスタが保持する浮動小数点値A、B
の比較を行い、大きい方(又は小さい方)の値と、それ
に付随する整数値とを出力レジスタ306に書き込む。
その後、出力レジスタ306に書き込まれた値を保持し
ていた入力レジスタのみをクリアし、出力レジスタ30
6の内容を、上位の段のWTA・総和回路30の入力レ
ジスタに書き込む。書き込み先の入力レジスタがクリア
されていない場合は、書き込みがストールし、そのサイ
クルでは書き込みを行わない。ただし、下位の段のWT
A・総和回路30の出力レジスタ306からの書き込み
動作は行われる。近似ソートモードにより、BCMC1
0がWTA・総和回路30の最上段の出力レジスタ30
6から受け取るデータが、浮動小数点が大きい順或いは
小さい順にソートされた(並び替えられた)ものとな
る。
【0038】なお、各モードに入る前には、すべてのW
TA・総和回路30の第1入力レジスタ301、第2入
力レジスタ302及び出力レジスタ306がクリアされ
る。
【0039】各モードを切替えて使用することにより、
複数のWTA・総和回路30全体として、上記のソート
のための機構(ソート機構)及び/又は総和回路として
機能する。つまり、近似ソートモードで動作するとき
は、ソート機構を実現するものとなり、加算モードで動
作するときは、総和回路を実現するものとなる。
【0040】最大値モード、近似ソートモードで動作す
るWTA・総和回路30は、次に示すようにして実現し
てもよい。すなわち、セルプロセッサ20と同数の入力
レジスタと、切換器と、比較器と、加算器と、出力レジ
スタとを含んでWTA・総和回路が構成される。入力レ
ジスタがセルプロセッサ20の数と同じだけ用意されて
おり、それぞれが、第1レジスタ301、第2レジスタ
302と同様に、整数レジスタ及び浮動小数点レジスタ
を備える。比較器は、すべての入力レジスタの浮動小数
点レジスタが保持する浮動小数点値の比較を行う。加算
器は、すべての入力レジスタの浮動小数点レジスタが保
持する浮動小数点値の和を算出する。出力レジスタは、
図4のWTA・総和回路30の出力レジスタと同様であ
る。
【0041】比較器により、各入力レジスタの浮動小数
点レジスタが保持する優先度データを比較して、優先度
の高い順に、付随するIDを順次出力レジスタに書き込
む。これにより、IDを、優先度の高い順序でBCMC
10へ送ることができる。加算器により、各浮動小数点
レジスタが保持するデータを加算して、その総和を求め
ることができる。このようなWTA・総和回路は、図1
に示すような接続形態をとらなくとも、一つで、本発明
におけるソート機構、総和回路として機能する。
【0042】<データ処理方法>本実施形態におけるマ
ルチプロセッサシステム1は、以下のように動作するこ
とにより、所要のデータ処理を実行する。図5は、この
マルチプロセッサシステム1において実行される処理の
流れを示すフローチャートである。
【0043】BCMC10のメインメモリ102には、
すべてのセルプロセッサ20の状態変数値の初期値が予
め記憶される。BCMC10は、このセルプロセッサ2
0の状態変数値とセルプロセッサ20を示すセルアドレ
スとからなるペアデータにより、ブロードキャストデー
タを作成する(ステップS101)。そして、作成した
ブロードキャストデータを、すべてのセルプロセッサ2
0へブロードキャストする(ステップS102)。各セ
ルプロセッサ20は、ブロードキャストデータを、入力
バッファ202に取り込む。セルCPU201は、命令
メモリ206に記憶されたデータ選択プログラムによ
り、入力バッファ202が保持するブロードキャストデ
ータのセルアドレスを調べて、自セルプロセッサ20が
行うデータ処理に要する状態変数値があるか否かを確認
する(ステップS103)。自らが行うデータ処理に要
する状態変数値が無い場合、セルプロセッサ20は、処
理動作を終了する(ステップS103:無)。自らが行
うデータ処理に要する状態変数値が有る場合は(ステッ
プS103:有)、該当する状態変数値を、この状態変
数値とペアデータを組むセルアドレスに対応するデータ
メモリ207上のアドレスへ上書きする(ステップS1
04)。以上により、BCMC10から各セルプロセッ
サ20へのデータのブロードキャストが終了する。
【0044】ブロードキャストが終了すると、各セルプ
ロセッサ20は、命令メモリ206に記憶されたデータ
処理のプログラムにより、データメモリ207に記録さ
れた状態変数値をデータ処理して新たな状態変数値を生
成する。新たな状態変数値は、データメモリ207に書
き込まれるとともに、出力バッファ203にも書き込ま
れる(ステップS105)。新たな状態変数値は、デー
タメモリ207上の、自らのセルアドレスに対応するア
ドレスに、上書きされる。データ処理が終了すると、セ
ルCPU201は、WTAバッファ204を介して1段
目のWTA・総和回路30の入力レジスタへIDと優先
度データとを含む終了データを送信して、データ処理の
終了を報告する(ステップS106)。優先度データ
は、データ処理の前又は後に、所定の優先度決定プログ
ラムによって生成される。
【0045】1段目のWTA・総和回路30は、各セル
プロセッサ20から送られる終了データのうち、IDを
入力レジスタの整数レジスタへ、優先度データを浮動小
数点レジスタでそれぞれ保持する。ここで、WTA・総
和回路30は近似ソートモードで動作する。そのため
に、切換器303は、比較器304を活性化する。WT
A・総和回路30の第1入力レジスタ301及び第2入
力レジスタの整数レジスタは、各々異なるセルプロセッ
サ20から送られたIDを保持する。また、各々の浮動
小数点レジスタは、IDに付随した優先度データを保持
する。比較器304は、第1入力レジスタ301及び第
2入力レジスタ302の浮動小数点レジスタからそれぞ
れ優先度データを読み出し、優先度を比較する。比較の
結果、優先度が高い方の優先度データ及びそれに付随し
たIDを、出力レジスタ306の浮動小数点レジスタ及
び整数レジスタへ書き込む。出力レジスタ306へ内容
が書き込まれた入力レジスタは、その内容がクリアされ
る。出力レジスタ306へ書き込まれたID及び優先度
データは、上位の段のWTA・総和回路30の入力レジ
スタへ書き込まれる。このような処理を各段のWTA・
総和回路30で行う。最上段のWTA・総和回路30
は、出力レジスタ306の整数レジスタに書き込まれた
IDをBCMC10へ送る。以上のような処理により、
WTA・総和回路30全体としては、IDを、優先度の
高い順序でBCMC10へ送ることとなる(ステップS
107)。
【0046】BCMC10は、WTA・総和回路30か
ら送られるIDに該当するセルプロセッサ20の出力バ
ッファ203から、データ処理された状態変数値を取得
する。取得した状態変数値は、BCMC10内のメイン
メモリ102上の、処理を行ったセルプロセッサ20を
示すセルアドレスに対応するアドレスに上書きされる
(ステップS108)。以上で、状態変数値の処理動作
の1サイクルが終了する。
【0047】BCMC10が、各セルプロセッサ20か
らデータ処理結果を取得し、これによりブロードキャス
トデータを生成する。各セルプロセッサ20は、ブロー
ドキャストデータから自分に必要となるデータのみを取
捨選択してデータ処理を行う。このブロードキャストデ
ータを用いてデータ処理を行うことにより、他のすべて
のセルプロセッサ20により処理されたデータを利用す
る処理が可能となる。また、ブロードキャストデータ
を、各セルプロセッサ20からのデータ処理結果とこの
データ処理結果を生成したセルプロセッサ20を示すセ
ルアドレスとからなるペアデータにより作成することに
より、特定のセルプロセッサ20のデータ処理結果のみ
を用いる処理が可能となる。さらに、隣接するセルプロ
セッサ20間は共有メモリを介して接続されているの
で、従来と同様に、隣接するセルプロセッサ20間の処
理も可能である。各セルプロセッサ20が、メインメモ
リ102に、直接、自セルプロセッサ20で必要とする
データを取り込みに行くことがなく、ブロードキャスト
データから必要となるデータを選択して、各セルプロセ
ッサ20内にデータを保持して処理を行うので、データ
の競合が起こらずに高速処理が可能となる。
【0048】[実施例1]次に、上記のマルチプロセッ
サシステム1の実施例を具体的に説明する。この実施例
では、あるセルプロセッサ20とそれに隣接する他のセ
ルプロセッサ20により処理されたデータのみを使用す
る場合の例を、図6を参照して説明する。図6におい
て、「○」はセルプロセッサを表しており、網掛された
「○」がデータ処理を行うセルプロセッサ、「●」が必
要とされるデータを保持するセルプロセッサである。n
×n(nは2以上の自然数)の格子の各格子点について
のデータ(格子点データ)に対して、次のようなフィル
タ計算を連続的に実行する場合を考える。 Xi,j=(Xi-1,j+Xi+1,j+Xi,j-1+Xi,j+1)/4 i:格子点の行番号、j:格子点の列番号
【0049】BCMC10は、格子点データを行又は列
でグループ化したブロードキャストデータとして、n個
のセルプロセッサ20にブロードキャストする。図8
は、格子点データをグループ化した例示図であり、
「○」で示される格子点データを5個ずつグループ化し
てある。一つのグループ化した格子点データが、一つの
セルプロセッサ20で処理される。セルプロセッサ20
では、ブロードキャストデータから必要とするグループ
化された格子点データをデータメモリ207に保存す
る。データメモリ207から、格子点データを順次読み
出してデータ処理する。
【0050】共有メモリを介して接続されるセルプロセ
ッサ20との間では、共有メモリを用いてデータ転送を
行う。共有メモリへのデータの書込動作を1サイクルと
すると、セルプロセッサ20間のグループ化されたデー
タの転送は、2nサイクルで行うことができる。各セル
プロセッサ20を同期的に動作させ、共有メモリへの書
き込みと演算とをパイプライン処理のように同時に実行
することにより、セルプロセッサ20間の通信と演算を
同時に行うことができる。
【0051】次のブロードキャストデータは、グループ
化された格子点データのデータ処理が終了する度に、B
CMC10によりブロードキャストされる。セルプロセ
ッサ20は、ブロードキャストされるデータのi、jに
より、必要なデータか否かを判断する。ブロードキャス
トデータをグループ化することにより行又は列方向のデ
ータを処理可能であり、共有データを介してデータ転送
することにより列又は行方向のデータ処理が可能とな
る。
【0052】[実施例2]この実施例では、すべてのセ
ルプロセッサ20のうち、一部のセルプロセッサ20に
より処理されたデータのみを使用する場合の例を、図7
を参照して説明する。図7において、「○」はセルプロ
セッサを表しており、網掛された「○」がデータ処理を
行うセルプロセッサ、「●」が必要とされるデータを保
持するセルプロセッサである。このようなマルチプロセ
ッサシステムは、ホップフィールドの連想記憶器の実現
に有用である。各セルプロセッサ20は、データ処理結
果である状態変数値とその状態変数値の重要度を表す重
み係数とを保持するものとする。また、セルプロセッサ
20には、番号が付されており、BCMC10は、番号
順にセルプロセッサ20から状態変数値を取り込む。B
CMC10は、すべてのセルプロセッサ20から取り込
んだ状態変数値をブロードキャストデータとしてブロー
ドキャストする。各セルプロセッサ20は、ブロードキ
ャストデータから必要な状態変数値のみを選択して重み
係数との積和演算を行い、状態変数値を更新する。必要
な状態変数値が、ブロードキャストデータに含まれるす
べての状態変数値の場合、すべてのプロセッサにより処
理されたデータを使用する処理に該当することとなる。
【0053】[実施例3]次に、パターンマッチング計
算処理の例を説明する。ここでは、入力データの特徴に
最も類似するデータを保持するセルプロセッサ20を特
定する処理を行う。この処理は、以下のようにして行
う。各セルプロセッサ20は、予め比較対象となるテン
プレートデータを保持する。BCMC10は、入力デー
タをすべてのセルプロセッサ20にブロードキャストす
る。各セルプロセッサ20は、自らが保持するテンプレ
ートデータの特徴と入力データの特徴との差分値を算出
する。差分値は、IDとともにWTA・総和回路30へ
送られる。WTA・総和回路30は、最大値モードで動
作する。入力レジスタの整数レジスタはIDを保持し、
浮動小数点レジスタは差分値を保持する。差分値を比較
器304により比較して、小さい方の差分値とそれに付
随するIDを出力レジスタ306へ送る。これをWTA
・総和回路30全体で行い、最も小さい差分値とそれに
付随するIDを求める。このID及び差分値をBCMC
10へ送る。BCMC10は、IDによりセルプロセッ
サ20を特定する。これにより、入力データの特徴に最
も類似するテンプレートデータ及び入力データの特徴と
最も類似するテンプレートデータとの差分値も検出でき
る。
【0054】[実施例4]次に、画像処理等の際に用い
られる、動くオブジェクトの衝突判定アルゴリズムの処
理例について説明する。「衝突判定アルゴリズム」は、
ある空間内に存在するn個のオブジェクト(物体)が互
いに他のオブジェクトと衝突するかどうか、衝突する場
合はどの程度の強度かを判定するアルゴリズムである。
n個のオブジェクトの空間分布には偏りがあり、m個の
クラスタに分かれているとする。ここでは、例えば、1
個のオブジェクトが、他の(n−1)個のオブジェクト
のいずれと最も強く衝突するかについて判定するものと
する。図9は、このような空間内のオブジェクトの例示
図であり、「○」で表されるオブジェクトを矩形で囲ん
で1クラスタとしており、図9ではオブジェクトが5個
のクラスタに分けられている。オブジェクトを示すデー
タは、BCMC10からブロードキャストされ、クラス
タ毎にセルプロセッサ20に取り込まれる。セルプロセ
ッサ20は、取り込んだ1つのクラスタに含まれるオブ
ジェクトに関する空間内での位置、運動についての処理
を行う。図9の例では、セルプロセッサA〜Eにより5
個のクラスタに分けられたオブジェクトに関する処理が
行われる。図10により、衝突判定アルゴリズムの処理
の流れを説明する。
【0055】BCMC10は、オブジェクトの位置や速
度のデータを含むオブジェクトデータと、当該オブジェ
クトが属するクラスタを示すクラスタデータとを含むブ
ロードキャストデータを生成し、すべてのセルプロセッ
サ20にブロードキャストする(ステップS201)。
各セルプロセッサ20は、ブロードキャストデータか
ら、オブジェクトデータをクラスタデータに基づいて取
捨選択して取り込む。オブジェクトデータを取り込んだ
セルプロセッサ20は、オブジェクトの現在の位置デー
タと速度データとから、単位時間後の新しい位置データ
を算出する。新しい位置データから、新しいバウンディ
ングボックスの値を得る(ステップS202)。バウン
ディングボックスとは、例えば、図9における、オブジ
ェクトを囲む矩形である。バウンディングボックスの値
とは、例えば、バウンディングボックスの頂点の座標で
ある。BCMC10は、オブジェクトの新しい位置デー
タを各セルプロセッサ20から取り込んで位置データを
更新する(ステップS203)。
【0056】次に、BCMC10は、取得した新しい位
置データ等を含むオブジェクトデータを一つずつ全セル
プロセッサ20にブロードキャストする(ステップS2
04)。つまり、衝突判定の対象となる1個のオブジェ
クト(以下、「判定対象オブジェクト」という)の位置
を表す位置データを全セルプロセッサ20に送る。各セ
ルプロセッサ20では、まず、ステップS202で計算
したバウンディングボックスを用いて、判定対象オブジ
ェクトが衝突する可能性があるか否かを判断する(ステ
ップS205)。具体的には、判定対象オブジェクトの
位置がバウンディングボックス内にあるか否かを判断す
る。衝突する可能性がある場合、つまり、判定対象オブ
ジェクトがバウンディングボックス内にある場合は(ス
テップS205:Y)、そのセルプロセッサ20で処理
される、バウンディングボックス内の各オブジェクトと
の距離計算を順次行い(ステップS206)、衝突の判
定を行う(ステップS207)。判定対象オブジェクト
がバウンディングボックス内のいずれかのオブジェクト
と衝突する場合には(ステップS207:Y)、その衝
突による衝撃の強さを定量的に表すデータ(衝突強度デ
ータ)、衝突による判定対象オブジェクトへの影響を表
すデータ等を含む衝突データを生成する(ステップS2
08)。また、セルプロセッサ20は、生成した衝突デ
ータのうち衝突強度データを、そのIDとともにWTA
・総和回路30に送る(ステップS209)。
【0057】判定対象オブジェクトがバウンディングボ
ックス外にある場合(ステップS205:N)、または
距離計算の結果、衝突しないと判定した場合(ステップ
S207:N)、各セルプロセッサ20は、WTA・総
和回路30に、例えば「−1.0」を、衝突強度データ
として送る(ステップS210)。WTA・総和回路3
0は最大値モードで動作する。WTA・総和回路30
は、セルプロセッサ20から送られる衝突強度データを
比較して、最も衝突による衝撃の強さが大きいことを表
す衝突強度データを検出して(ステップS211)、検
出した衝突強度データを生成したセルプロセッサ20を
特定する。そして特定したセルプロセッサ20を表すI
DをBCMC10へ送る。BCMC10は、WTA・総
和回路30の最上段から送られたIDにより表されるセ
ルプロセッサ20から衝突データを取得する(ステップ
S212)。ステップS204以降の処理をすべてのオ
ブジェクトについて行うことにより、空間内のすべての
オブジェクト間の衝突判定が行われる。
【0058】[実施例5]次に、WTA・総和回路30
の加算器305を用いる場合の例を説明する。各セルプ
ロセッサ20は、データ処理結果をWTA・総和回路3
0へ入力する。WTA・総和回路30では、加算器30
5によりデータ処理結果を加算し、最終的に、すべての
セルプロセッサ20のデータ処理結果の総和を得る。こ
のようにして、WTA・総和回路30により高速にデー
タ処理結果の総和を得ることが可能である。データ処理
結果の総和は、BCMC10に送られて、各セルプロセ
ッサ20にブロードキャストにより、高速に送信可能で
ある。データ処理結果の総和は、例えば、ニューロなど
の最適化計算において、正規化計算に用いられる。
【0059】以上の説明において、BCMC10とWT
A・総和回路30とは各々独立したものとしたが、BC
MC10にWTA・総和回路30を組み込んだ一つのブ
ロックとして、コントローラを構成してもよい。
【0060】なお、以上の説明は、データ処理手段がセ
ルプロセッサ20であり、制御手段がコントローラ(B
CMC10)である場合の例であるが、本発明の構成要
素は、このような例に限定されるものではない。例えば
複数のデータ処理端末を広域ネットワークを介して双方
向通信が可能な形態で接続し、そのうちの一つ又は複数
のデータ処理端末を制御手段、他の複数のデータ処理端
末をデータ処理手段として動作させ、制御手段に、複数
のデータ処理手段の一部又は全部より受け取ったデータ
処理結果及び少なくとも一つのデータ処理手段によるデ
ータ処理に用いるデータを含むブロードキャストデータ
をブロードキャストする機能をもたせ、複数のデータ処
理手段の各々に、制御手段によりブロードキャストされ
たブロードキャストデータから自らが行うデータ処理に
必要なデータのみを取捨選択してデータ処理を行うとと
もに、その処理結果を制御手段に送出させる機能をもた
せるようにしてもよい。
【0061】また、複数のデータ処理手段として、予め
定めた識別情報(例えば上述した識別データ)によりそ
れを特定できる汎用のデータ処理端末を用い、これらの
汎用のデータ処理端末と双方向通信可能なサーバ、ある
いはCPU及びメモリを内蔵した半導体デバイスを搭載
した装置をのみをもってデータ処理システムを構成する
ようにしてもよい。この場合のサーバ又は装置は、その
内部のCPUが所定のコンピュータプログラムを読み込
んで実行することにより、サーバ本体又は装置内に、少
なくとも一つのデータ処理手段としてのデータ処理端末
を特定するとともに特定したデータ処理端末の識別情報
とそのデータ処理端末宛のデータ処理用データとを含む
ブロードキャストデータを生成する機能と、複数のデー
タ処理端末の一部又は全部から当該データ処理端末で行
われたデータの処理結果を取得する機能と、受け取った
処理結果をブロードキャストデータに含め、当該ブロー
ドキャストデータを複数のデータ処理端末の各々にブロ
ードキャストする機能とを形成するものである。
【0062】
【発明の効果】以上のような本発明により、複数のデー
タ処理手段を用いる場合のデータ処理手段間のデータ処
理を効率的に行えるようになる。
【図面の簡単な説明】
【図1】本発明を適用したマルチプロセッサシステムの
構成例を示した図。
【図2】BCMCの構成図。
【図3】セルプロセッサの構成図。
【図4】WTA・総和回路の構成図。
【図5】本実施形態によるマルチプロセッサシステムの
処理の流れを示すフローチャート。
【図6】隣接するプロセッサのデータ処理結果を使用す
る概念図。
【図7】一部のプロセッサのデータ処理結果を使用する
概念図。
【図8】格子点データをグループ化した例示図。
【図9】オブジェクトをクラスタに分けた場合の例示
図。
【図10】衝突判定アルゴリズムの処理の流れを示すフ
ローチャート。
【符号の説明】
10 BCMC 101 CPUコア 102 メインメモリ 103 DMAC 20 セルプロセッサ 201 セルCPU 202 入力バッファ 203 出力バッファ 204 WTAバッファ 205 プログラムコントローラ 206 命令メモリ 207 データメモリ 30 WTA・総和回路 301 第1入力レジスタ 302 第2入力レジスタ 303 切換器 304 比較器 305 加算器 306 出力レジスタ

Claims (16)

    【特許請求の範囲】
  1. 【請求項1】 データ処理を行う複数のプロセッサと、
    前記複数のプロセッサに対してデータ処理に用いるデー
    タを含むブロードキャストデータをブロードキャストす
    るコントローラとを備えており、 前記複数のプロセッサの各々は、前記コントローラによ
    りブロードキャストされた前記ブロードキャストデータ
    から、自らが行うデータ処理に必要なデータのみを取捨
    選択してデータ処理を行うものである、 マルチプロセッサシステム。
  2. 【請求項2】 前記コントローラは、データ処理を行っ
    た各々のプロセッサから処理結果を取得するとともに、
    取得した処理結果を前記ブロードキャストデータとして
    すべてのプロセッサ宛にブロードキャストするものであ
    る、 請求項1記載のマルチプロセッサシステム。
  3. 【請求項3】 前記複数のプロセッサの各々には、各々
    のプロセッサを識別するための識別データが割り当てら
    れており、 前記コントローラは、前記処理結果にその取得元のプロ
    セッサの識別データが付されたブロードキャストデータ
    を生成してブロードキャストするものであり、 前記複数のプロセッサは、受け取った前記ブロードキャ
    ストデータに含まれる前記識別データに基づいて次のタ
    イミングで自らが行うべきデータ処理に必要な前記処理
    結果を取捨選択するものである、 請求項1記載のマルチプロセッサシステム。
  4. 【請求項4】 前記複数のプロセッサのうちデータ処理
    を終了したプロセッサからその識別データを取得し、取
    得した識別データを所定の順序で前記コントローラへ送
    出するソート機構をさらに備えており、 前記コントローラが、前記ソート機構より受け取った識
    別データをもとに前記処理結果を取得するように構成さ
    れている、 請求項3記載のマルチプロセッサシステム。
  5. 【請求項5】 前記コントローラにおける前記処理結果
    の読み取り順序を定める優先度データを生成する手段を
    備えており、 前記データ処理を終了したプロセッサは、自らの識別デ
    ータと共にその処理についての前記優先度データを前記
    ソート機構に送出するように構成されており、 前記ソート機構は、前記優先度データに基づいて前記識
    別データの送出順序を決定するように構成されている、 請求項4記載のマルチプロセッサシステム。
  6. 【請求項6】 前記ソート機構が、前記プロセッサと同
    数のレジスタと、 各プロセッサから送出された前記識別データ及び優先度
    データを当該プロセッサに対応する前記レジスタに記録
    させる手段と、 各レジスタに記録されている識別データの順序性を前記
    優先度データ同士の比較によって判定する比較器とを備
    え、 この比較器による判定結果に基づいて前記識別データの
    送出順序を決定するように構成されている、 請求項5記載のマルチプロセッサシステム。
  7. 【請求項7】 前記コントローラは、データ記録用のメ
    モリと、前記ソート機構より受け取った識別データによ
    り特定されるプロセッサから前記処理結果を取得して前
    記メモリに記録する記録制御手段と、 前記メモリに記録されている前記処理結果を読み出すと
    ともにその処理結果及び前記受け取った識別データを含
    んで前記ブロードキャストデータを生成するデータ生成
    手段とを有するものである、 請求項4記載のマルチプロセッサシステム。
  8. 【請求項8】 前記複数のプロセッサの各々が、 前記ブロードキャストデータに自らが行うデータ処理に
    必要なデータが含まれているか否かを判断し、前記必要
    なデータが含まれている場合にそのデータのみを取捨選
    択してデータ処理を行うデータ処理機構と、 前記コントローラからの要請に応じて前記データ処理機
    構で行ったデータの処理結果を自らの識別データと共に
    前記コントローラへ送出する手段と、 データ処理の終了を契機に自らの識別データを含む処理
    終了通知データを前記ソート機構へ送出する手段とを含
    んで構成されている、 請求項4記載のマルチプロセッサシステム。
  9. 【請求項9】 それぞれ、入力される入力データとの比
    較対象となるテンプレートデータを保持する複数のプロ
    セッサと、前記複数のプロセッサに対して前記入力デー
    タをブロードキャストするコントローラと、前記複数の
    プロセッサの各々の出力を比較する比較機構とを備えて
    おり、 前記複数のプロセッサが保持するテンプレートデータ
    は、それぞれ他のプロセッサが保持するテンプレートデ
    ータとは異なるものであり、 前記複数のプロセッサの各々は、前記コントローラによ
    りブロードキャストされた前記入力データの特徴と自ら
    が保持するテンプレートデータの特徴との差分値を算出
    するとともに、算出した前記差分値と自らを識別するた
    めの識別データとのペアデータを前記比較機構へ送出す
    るものであり、 前記比較機構は、前記複数のプロセッサの各々から受け
    取った前記差分値に基づいていずれか一つの差分値を選
    択し、選択した差分値とペアデータとなる識別データを
    前記コントローラへ送出するものであり、 前記コントローラは、前記比較機構から受け取った識別
    データに基づいて前記複数のプロセッサの中から一つの
    プロセッサを特定するものである、 マルチプロセッサシステム。
  10. 【請求項10】 データ処理を行う複数のプロセッサ
    と、前記複数のプロセッサに対してデータ処理に用いる
    データをブロードキャストするコントローラと、前記複
    数のプロセッサによるデータの処理結果の総和を算出す
    る総和回路と、を備えており、 前記複数のプロセッサの各々は、前記コントローラによ
    りブロードキャストされた前記データから処理に必要な
    データのみを取捨選択してデータ処理を行うとともに、
    処理結果を前記総和回路へ送信するものであり、 前記総和回路は、前記複数のプロセッサの各々から送信
    された前記処理結果の総和を算出して前記コントローラ
    へ送出するものであり、 前記コントローラは、前記総和回路から受け取った前記
    処理結果の総和を前記複数のプロセッサにブロードキャ
    ストするものである、 マルチプロセッサシステム。
  11. 【請求項11】 前記複数のプロセッサの少なくとも一
    部が共有メモリを介して互いにリング接続されており、
    リング接続されたプロセッサ間では前記共有メモリを介
    してデータの受け渡しを行うように構成されている、 請求項1、9又は10記載のマルチプロセッサシステ
    ム。
  12. 【請求項12】 それぞれデータの処理を行う複数のデ
    ータ処理手段と、前記複数のデータ処理手段の各々の動
    作を制御する制御手段とを有する装置又はシステムにお
    いて実行される方法であって、 前記制御手段が、前記複数のプロセッサのうちデータ処
    理を行ったものから所定の順序でデータの処理結果を取
    得するとともに取得した処理結果及び取得元のデータ処
    理手段を識別するための識別データとを含むブロードキ
    ャストデータを生成し、このブロードキャストデータを
    前記複数のデータ処理手段宛にブロードキャストする段
    階と、 前記複数のデータ処理手段の少なくとも一つが、前記制
    御手段より受け取ったブロードキャストデータの中か
    ら、それに含まれる前記識別データに基づいて特定した
    一部の処理結果のみを選択してデータ処理を行い、その
    処理結果を、自らを表す識別データと共に前記制御手段
    宛に送出する段階と、を有することを特徴とする、デー
    タ処理方法。
  13. 【請求項13】 データ処理を行う複数のデータ処理手
    段と、前記複数のデータ処理手段の一部又は全部より受
    け取ったデータ処理結果及び少なくとも一つの前記デー
    タ処理手段によるデータ処理に用いるデータを含むブロ
    ードキャストデータをブロードキャストする制御手段と
    を備えており、 前記複数のデータ処理手段の各々は、前記制御手段によ
    りブロードキャストされた前記ブロードキャストデータ
    から自らが行うデータ処理に必要なデータのみを取捨選
    択してデータ処理を行うとともに、その処理結果を前記
    制御手段に送出するものである、 データ処理システム。
  14. 【請求項14】 データ処理を行う複数のデータ処理手
    段の各々との間で双方向通信を行うシステムであって、 少なくとも一つの前記データ処理手段を特定するととも
    に特定したデータ処理手段の識別情報とそのデータ処理
    手段宛のデータ処理用データとを含むブロードキャスト
    データを生成する手段と、 前記複数のデータ処理手段の一部又は全部から当該デー
    タ処理手段で行われたデータの処理結果を取得する手段
    と、 受け取った前記処理結果を前記ブロードキャストデータ
    に含め、当該ブロードキャストデータを前記複数のデー
    タ処理手段の各々にブロードキャストする手段とを備え
    てなる、データ処理システム。
  15. 【請求項15】 データ処理を行う複数のデータ処理手
    段の各々との間で双方向通信を行う、コンピュータ搭載
    の装置に於いて、前記コンピュータに以下の機能を形成
    させるためのコンピュータプログラム。 (1)少なくとも一つの前記データ処理手段を特定する
    とともに特定したデータ処理手段の識別情報とそのデー
    タ処理手段宛のデータ処理用データとを含むブロードキ
    ャストデータを生成する手段、(2)前記複数のデータ
    処理手段の一部又は全部から当該データ処理手段で行わ
    れたデータの処理結果を取得する手段、(3)受け取っ
    た前記処理結果を前記ブロードキャストデータに含め、
    当該ブロードキャストデータを前記複数のデータ処理手
    段の各々にブロードキャストする手段。
  16. 【請求項16】 データ処理を行う複数のデータ処理手
    段の各々との間で双方向通信を行う、コンピュータ搭載
    の装置に組み込まれることにより、前記コンピュータに
    以下の機能を形成させる半導体デバイス。 (1)少なくとも一つの前記データ処理手段を特定する
    とともに特定したデータ処理手段の識別情報とそのデー
    タ処理手段宛のデータ処理用データとを含むブロードキ
    ャストデータを生成する手段、(2)前記複数のデータ
    処理手段の一部又は全部から当該データ処理手段で行わ
    れたデータの処理結果を取得する手段、(3)受け取っ
    た前記処理結果を前記ブロードキャストデータに含め、
    当該ブロードキャストデータを前記複数のデータ処理手
    段の各々にブロードキャストする手段。
JP2001289588A 2000-09-27 2001-09-21 マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム Expired - Fee Related JP3426223B2 (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP2001289588A JP3426223B2 (ja) 2000-09-27 2001-09-21 マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム
US09/964,247 US7017158B2 (en) 2000-09-27 2001-09-26 Multi-processor system, data processing system, data processing method, and computer program
DE60144155T DE60144155D1 (de) 2000-09-27 2001-09-27 Multiprozessorsystem, datenverarbeitungssystem, datenverarbeitungsverfahren und rechnerprogramm
KR1020027006766A KR100866730B1 (ko) 2000-09-27 2001-09-27 다중 프로세서 시스템, 데이터 처리 시스템, 데이터 처리방법 및 컴퓨터 프로그램
TW090123900A TWI229265B (en) 2000-09-27 2001-09-27 Multi-processor system, data processing system, data processing method, and computer readable recording media
EP01972530A EP1324209B1 (en) 2000-09-27 2001-09-27 Multiprocessor system, data processing system, data processing method, and computer program
AT01972530T ATE500556T1 (de) 2000-09-27 2001-09-27 Multiprozessorsystem, datenverarbeitungssystem, datenverarbeitungsverfahren und rechnerprogramm
PCT/JP2001/008434 WO2002027513A1 (fr) 2000-09-27 2001-09-27 Systeme multiprocesseurs, systeme de traitement de donnees, procede de traitement de donnees et programme d'ordinateur
CNB018029167A CN1258154C (zh) 2000-09-27 2001-09-27 多处理器系统、数据处理系统和数据处理方法
AU2001292269A AU2001292269A1 (en) 2000-09-27 2001-09-27 Multiprocessor system, data processing system, data processing method, and computer program

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2000294732 2000-09-27
JP2000-294732 2000-09-27
JP2001289588A JP3426223B2 (ja) 2000-09-27 2001-09-21 マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003106871A Division JP3872034B2 (ja) 2000-09-27 2003-04-10 マルチプロセッサシステム、データ処理方法、データ処理システム、コンピュータプログラム、半導体デバイス

Publications (2)

Publication Number Publication Date
JP2002175288A true JP2002175288A (ja) 2002-06-21
JP3426223B2 JP3426223B2 (ja) 2003-07-14

Family

ID=26600866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001289588A Expired - Fee Related JP3426223B2 (ja) 2000-09-27 2001-09-21 マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム

Country Status (10)

Country Link
US (1) US7017158B2 (ja)
EP (1) EP1324209B1 (ja)
JP (1) JP3426223B2 (ja)
KR (1) KR100866730B1 (ja)
CN (1) CN1258154C (ja)
AT (1) ATE500556T1 (ja)
AU (1) AU2001292269A1 (ja)
DE (1) DE60144155D1 (ja)
TW (1) TWI229265B (ja)
WO (1) WO2002027513A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285778A (ja) * 2005-04-01 2006-10-19 Hitachi Ltd ストレージシステム及び記憶制御方法
JP2006309586A (ja) * 2005-04-28 2006-11-09 Fujitsu Ltd バッチスケジューリングプログラム、バッチスケジューリング方法およびバッチスケジューリング装置
WO2010095476A1 (ja) * 2009-02-18 2010-08-26 日本電気株式会社 プロセッサ及びデータ収集方法
US8271587B2 (en) 2008-03-21 2012-09-18 International Business Machines Corporation Object movement control system, object movement control method, server and computer program
WO2020084693A1 (ja) * 2018-10-23 2020-04-30 富士通株式会社 演算処理装置及び演算処理装置の制御方法

Families Citing this family (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6989843B2 (en) * 2000-06-29 2006-01-24 Sun Microsystems, Inc. Graphics system with an improved filtering adder tree
US8015567B2 (en) * 2002-10-08 2011-09-06 Netlogic Microsystems, Inc. Advanced processor with mechanism for packet distribution at high line rate
US8478811B2 (en) 2002-10-08 2013-07-02 Netlogic Microsystems, Inc. Advanced processor with credit based scheme for optimal packet flow in a multi-processor system on a chip
US9088474B2 (en) 2002-10-08 2015-07-21 Broadcom Corporation Advanced processor with interfacing messaging network to a CPU
US7346757B2 (en) 2002-10-08 2008-03-18 Rmi Corporation Advanced processor translation lookaside buffer management in a multithreaded system
US8037224B2 (en) 2002-10-08 2011-10-11 Netlogic Microsystems, Inc. Delegating network processor operations to star topology serial bus interfaces
US8176298B2 (en) 2002-10-08 2012-05-08 Netlogic Microsystems, Inc. Multi-core multi-threaded processing systems with instruction reordering in an in-order pipeline
US7334086B2 (en) * 2002-10-08 2008-02-19 Rmi Corporation Advanced processor with system on a chip interconnect technology
US20050120185A1 (en) * 2003-12-01 2005-06-02 Sony Computer Entertainment Inc. Methods and apparatus for efficient multi-tasking
US7444525B2 (en) * 2005-05-25 2008-10-28 Sony Computer Entertainment Inc. Methods and apparatus for reducing leakage current in a disabled SOI circuit
US7970956B2 (en) * 2006-03-27 2011-06-28 Ati Technologies, Inc. Graphics-processing system and method of broadcasting write requests to multiple graphics devices
US9596324B2 (en) 2008-02-08 2017-03-14 Broadcom Corporation System and method for parsing and allocating a plurality of packets to processor core threads
US7958341B1 (en) 2008-07-07 2011-06-07 Ovics Processing stream instruction in IC of mesh connected matrix of processors containing pipeline coupled switch transferring messages over consecutive cycles from one link to another link or memory
US7870365B1 (en) 2008-07-07 2011-01-11 Ovics Matrix of processors with data stream instruction execution pipeline coupled to data switch linking to neighbor units by non-contentious command channel / data channel
US8327114B1 (en) 2008-07-07 2012-12-04 Ovics Matrix processor proxy systems and methods
US8131975B1 (en) 2008-07-07 2012-03-06 Ovics Matrix processor initialization systems and methods
US8145880B1 (en) 2008-07-07 2012-03-27 Ovics Matrix processor data switch routing systems and methods
CN101478785B (zh) * 2009-01-21 2010-08-04 华为技术有限公司 资源池管理系统及信号处理方法
KR101651871B1 (ko) * 2009-12-28 2016-09-09 삼성전자주식회사 멀티코어 시스템 상에서 단위 작업을 할당하는 방법 및 그 장치
US8850262B2 (en) * 2010-10-12 2014-09-30 International Business Machines Corporation Inter-processor failure detection and recovery
CN102306371B (zh) * 2011-07-14 2013-09-18 华中科技大学 一种分层并行的模块化序列图像实时处理装置
KR101863605B1 (ko) 2011-09-19 2018-07-06 삼성전자주식회사 스트림 데이터를 고속으로 처리하는 프로세서
US9710768B2 (en) 2011-09-23 2017-07-18 Elwha Llc Acquiring and transmitting event related tasks and subtasks to interface devices
US20130081052A1 (en) * 2011-09-23 2013-03-28 Elwha LLC, a limited liability company of the State of Delaware Acquiring tasks and subtasks to be carried out by interface devices
CN106936994B (zh) 2017-03-10 2019-10-01 Oppo广东移动通信有限公司 一种广播接收者的控制方法、装置及移动终端
JP7038608B2 (ja) * 2018-06-15 2022-03-18 ルネサスエレクトロニクス株式会社 半導体装置
CN111290697B (zh) * 2018-12-07 2022-01-28 上海寒武纪信息科技有限公司 数据压缩方法、编码电路和运算装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61283976A (ja) 1985-06-11 1986-12-13 Sanyo Electric Co Ltd パタ−ン認識装置
US4739476A (en) * 1985-08-01 1988-04-19 General Electric Company Local interconnection scheme for parallel processing architectures
JPH0247757A (ja) 1988-08-09 1990-02-16 Sanyo Electric Co Ltd 情報処理装置
JPH0814816B2 (ja) 1988-09-19 1996-02-14 富士通株式会社 並列計算機
EP0360527B1 (en) 1988-09-19 1995-01-04 Fujitsu Limited Parallel computer system using a SIMD method
EP0411497B1 (en) 1989-07-31 2000-01-26 Hitachi, Ltd. Data processing system and data transmission and processing method
JP2850387B2 (ja) 1989-07-31 1999-01-27 株式会社日立製作所 データ伝送方式
JP2642039B2 (ja) * 1992-05-22 1997-08-20 インターナショナル・ビジネス・マシーンズ・コーポレイション アレイ・プロセッサ
US5511212A (en) * 1993-06-10 1996-04-23 Rockoff; Todd E. Multi-clock SIMD computer and instruction-cache-enhancement thereof
JPH0784966A (ja) 1993-08-06 1995-03-31 Toshiba Corp データ処理装置
US6516403B1 (en) * 1999-04-28 2003-02-04 Nec Corporation System for synchronizing use of critical sections by multiple processors using the corresponding flag bits in the communication registers and access control register

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006285778A (ja) * 2005-04-01 2006-10-19 Hitachi Ltd ストレージシステム及び記憶制御方法
JP2006309586A (ja) * 2005-04-28 2006-11-09 Fujitsu Ltd バッチスケジューリングプログラム、バッチスケジューリング方法およびバッチスケジューリング装置
JP4555145B2 (ja) * 2005-04-28 2010-09-29 富士通株式会社 バッチスケジューリングプログラム、バッチスケジューリング方法およびバッチスケジューリング装置
US8407709B2 (en) 2005-04-28 2013-03-26 Fujitsu Limited Method and apparatus for batch scheduling, and computer product
US8271587B2 (en) 2008-03-21 2012-09-18 International Business Machines Corporation Object movement control system, object movement control method, server and computer program
WO2010095476A1 (ja) * 2009-02-18 2010-08-26 日本電気株式会社 プロセッサ及びデータ収集方法
JP2010191696A (ja) * 2009-02-18 2010-09-02 Nec Corp プロセッサ及びデータ収集方法
JP4539889B2 (ja) * 2009-02-18 2010-09-08 日本電気株式会社 プロセッサ及びデータ収集方法
WO2020084693A1 (ja) * 2018-10-23 2020-04-30 富士通株式会社 演算処理装置及び演算処理装置の制御方法
JPWO2020084693A1 (ja) * 2018-10-23 2021-09-02 富士通株式会社 演算処理装置及び演算処理装置の制御方法
JP7004083B2 (ja) 2018-10-23 2022-01-21 富士通株式会社 演算処理装置及び演算処理装置の制御方法

Also Published As

Publication number Publication date
CN1258154C (zh) 2006-05-31
KR100866730B1 (ko) 2008-11-03
ATE500556T1 (de) 2011-03-15
KR20020059430A (ko) 2002-07-12
EP1324209A1 (en) 2003-07-02
US7017158B2 (en) 2006-03-21
EP1324209B1 (en) 2011-03-02
AU2001292269A1 (en) 2002-04-08
TWI229265B (en) 2005-03-11
EP1324209A4 (en) 2008-12-17
WO2002027513A1 (fr) 2002-04-04
US20020059509A1 (en) 2002-05-16
JP3426223B2 (ja) 2003-07-14
CN1392985A (zh) 2003-01-22
DE60144155D1 (de) 2011-04-14

Similar Documents

Publication Publication Date Title
JP3426223B2 (ja) マルチプロセッサシステム、データ処理システム、データ処理方法、コンピュータプログラム
CN109104876B (zh) 一种运算装置及相关产品
US11074717B2 (en) Detecting and estimating the pose of an object using a neural network model
JP2624733B2 (ja) イメージ理解マシーン用のコンピュータ装置
US5325510A (en) Multiprocessor system and architecture with a computation system for minimizing duplicate read requests
TW201917566A (zh) 深度視覺處理器
JPH02501599A (ja) 多重プロセッサ・アレイにおける仮想処理手法および仮想プロセッサ
CN101467160A (zh) Simd处理器上的模式检测
US8165386B1 (en) Apparatus and method for measuring audience data from image stream using dynamically-configurable hardware architecture
CN110059797B (zh) 一种计算装置及相关产品
WO2017116517A1 (en) Data driven scheduler on multiple computing cores
CN111783966A (zh) 一种深度卷积神经网络硬件并行加速器的硬件装置及方法
JPH07104948B2 (ja) イメージ理解マシーンおよびイメージ分析方法
US20220147804A1 (en) Computation unit, related apparatus, and method
CN110738317A (zh) 基于fpga的可变形卷积网络运算方法、装置和系统
CN114554279A (zh) 基于远程分析的触发器响应剪辑提取
Peng et al. Adaptive runtime exploiting sparsity in tensor of deep learning neural network on heterogeneous systems
CN111199276B (zh) 数据处理方法及相关产品
JP3872034B2 (ja) マルチプロセッサシステム、データ処理方法、データ処理システム、コンピュータプログラム、半導体デバイス
CN113095476A (zh) 一种用于通用张量计算的硬件加速装置及方法
JP2002140717A (ja) 画像処理方法及び装置、コンピュータプログラム
Borges AlexNet deep neural network on a many core platform
Zhang et al. An effective 2-dimension graph partitioning for work stealing assisted graph processing on multi-FPGAs
WO2020125092A1 (zh) 计算装置及板卡
WO2017056168A1 (ja) 情報処理システムおよび情報処理方法

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030422

R150 Certificate of patent or registration of utility model

Ref document number: 3426223

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090509

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090509

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100509

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110509

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120509

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130509

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140509

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees