JPH11232247A

JPH11232247A - データフロー計算機およびデータフロー制御方法

Info

Publication number: JPH11232247A
Application number: JP2881898A
Authority: JP
Inventors: Takashi Nakamoto; 貴士中本; Hiroshi Yamada; 博山田; Junko Nakase; 純子中瀬
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1998-02-10
Filing date: 1998-02-10
Publication date: 1999-08-27

Abstract

(57)【要約】【課題】多量のデータを高速にデータフロー的に処理す
る。【解決手段】制御用プロセッサエレメント３０８は、処
理内容を示すフローＩＤと、処理されるべきデータが記
憶されている、共有メモリ３０３内の記憶位置を指すソ
ースポインタと、処理の結果データを格納すべき、共有
メモリ３０３内の記憶位置を指すデスティネーションポ
インタとを含む命令トークンを演算用プロセッサエレメ
ント３０７Ａまたは３０７Ｂに供給する。そのプロセッ
サエレメントは、ソースポインタで指摘されたデータを
共有メモリより読み出し、フローＩＤで指定される処理
をそのデータに対して実行し、共有メモリ３０３内のデ
スティネーションポインタにより指定される記憶位置に
処理結果データを格納し、上記命令トークンを制御用プ
ロセッサエレメント３０８に転送し、その命令トークン
を処理したことを通知する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、複数の処理エレメ
ントをデータフロー制御にしたがって並列に動作させる
データフロー計算機およびデータフロー制御方法に関す
る。

【０００２】

【従来の技術】動画像データに代表される大量のデータ
に対する演算を高速に処理するには、複数の処理エレメ
ント例えばプロセッサエレメントあるいは専用の演算器
を並列に動作させることが望ましい。これに適したプロ
セッサとしてデータフロー計算機が知られている。例え
ば、中野肇監修「入門と実習ニューロコンピュー
タ」（平１−９−１５）技術評論社Ｐ．１３８−１４
１参照。この種のプロセッサでは、トークンと呼ばれる
データパケットが演算の実行を制御する。トークンは、
被演算データとそのデータに対する処理を指定する情報
とを含む一つのまとまったデータパケットである。異な
るプロセッサエレメントの間でトークンが交換される。
各プロセッサエレメントは他からトークンを受信したと
きに、そのことを契機として、そのトークン内のデータ
を処理する命令あるいは命令列を実行する。その実行に
より生成されたデータとそのデータに対して施すべき処
理を指定するための情報とを含むトークンを生成し、他
のプロセッサエレメントに転送する。当該他のプロセッ
サエレメントも同様にして受信したトークンを処理す
る。各プロセッサエレメントが実行すべき処理のフロー
を事前に定めることにより、これらのプロセッサエレメ
ントを効率よく並列に動作させることができる。

【０００３】

【発明が解決しようとする課題】従来のデータフロー計
算機では、トークンには被演算データが含まれる。一つ
のトークンに長いデータを含ませた場合、トークンを、
トークン制御用のプロセッサエレメントと処理エレメン
トの間あるいは異なる処理エレメントの間で転送するの
に時間が掛かる。トークン制御用のプロセッサエレメン
ト内での処理にも時間が掛かる。しかも、一つのトーク
ンに含まれるデータの長さには上限があるのが普通であ
る。したがって、処理すべきデータの全量が多くなるほ
ど、処理すべきトークンの数が多くなる。トークンの数
が増大すると、それらのトークンをトークン制御用のプ
ロセッサエレメントと処理エレメントの間あるいは異な
る処理エレメントの間で転送するのに時間が掛かる。こ
のように、動画像データに代表される多量のデータを従
来のデータフロー計算機で処理させると、処理時間が長
くなる。

【０００４】従って、本発明の目的は、多量のデータを
高速に処理可能なデータフロー計算機を提供することで
ある。

【０００５】本発明のより具体的な目的は、動画像デー
タに代表される多量のデータを高速に処理可能なデータ
フロー制御の信号処理プロセッサを提供することであ
る。

【０００６】

【課題を解決するための手段】本発明によるデータフロ
ー計算機は、複数の処理エレメントと、これらに対する
共有メモリと、上記複数の処理エレメントに対して処理
の実行を要求する命令トークンを供給する制御回路とを
有し、上記制御回路は、いずれかの処理を起動するとき
に、その処理に使用可能なデータが記憶された、上記共
有メモリ内の記憶位置を指定する第１の情報と、上記処
理の実行により得られる結果データを格納すべき、上記
メモリ内の記憶位置を指定する第２の情報とを有する命
令トークンを、上記複数の処理エレメントの内、その処
理を実行可能な処理エレメントに供給し、各処理エレメ
ントは、上記制御回路により命令トークンを供給された
ときに、その供給された命令トークン内の上記第１の情
報により指定される、上記共有メモリ内の記憶位置から
処理すべきデータを読み出し、そのデータに対して処理
を実行し、その実行の結果データを、上記供給された命
令トークン内の上記第２の情報により指定される、上記
共有メモリ内の記憶位置に記憶する。

【０００７】本データフロー計算機では、処理すべきデ
ータは命令トークンには含まれず、そのデータの記憶位
置を指定する情報が含まれる。したがって、処理エレメ
ントの間では処理の結果データは転送されない。このデ
ータは共有メモリを介してそれらの処理プロセッサエレ
メント間で受け渡しされる。以上のことから、本データ
フロー計算機は多量のデータを高速に処理できる。

【０００８】

【発明の実施の形態】＜従来の技術とその問題点＞本発
明の実施の形態を説明する前に、前述の文献に記載の従
来のデータフロー制御のプロセッサシステムを説明す
る。図１８に示すように、このプロセッサでは、４つの
イメージパイプラインドプロセッサ（ＩｍＰＰ）チップ
（１１５０）の直列接続がデータ転送を司るマジックと
称するチップ（１１６０）に接続されている。このマジ
ックチップ１１６０にはイメージメモリ１１７０、デー
タバッファ１１８０、Ｉ／Ｏポートデコーダ１１８１、
ＤＭＡコントローラ１１８２が接続されている。各Ｉｍ
ＰＰチップ１１５０は、図１９に示すように構成されて
いる。インプットコントローラ１１０４とアウトプット
コントローラー１１０１とは、他のＩｍＰＰチップおよ
びマジックチップ１１６０との間でトークンを交換す
る。この交換されるトークンは、データとリンク情報
（ＩＤ）とを含む。インプットコントローラ１１０４が
受信したトークンは、リンクテーブル１１０５、ファン
クショナルテーブル１１０６、データメモリ１１０３、
キュー１１０２、プロセッシングユニット１１０７によ
り処理される。プロセッシングユニット１１０７による
処理の結果、新たなトークンが生成され、リンクテーブ
ル１１０５に供給される。リンクテーブル１１０５から
プロセッシングユニット１１０７がトークンを処理する
ためのパイプライン・リンクを構成する。

【０００９】リンクテーブル１１０５は、インプットコ
ントローラ１１０４あるいはプロセッシングユニット１
１０７より与えられたトークン内のリンク情報ＩＤによ
り、オペレーションコードアドレス（ＯＰＡ）とトーク
ンが上記パイプライン・リンクにより処理された結果生
成される次のトークンに付すべき次のリンク情報ＩＤ’
との対をそのテーブル内部から読み出し、これらの新た
な情報と入力トークンに含まれたデータとよりなる新た
なトークンをファンクショナルテーブル１１０６に供給
する。ファンクショナルテーブル１１０６は、オペレー
ションコードアドレス（ＯＰＡ）により、そのトークン
がリングを一周する間に実行すべき命令の演算コード
（ＯＰ）をそのテーブルの内部より読み出す。受信した
トークンが、データメモリのアドレスの生成（ＡＧ）の
コードあるいはフロー制御（ＦＣ）のコードを持ってい
る場合には、ファンクショナルテーブル１１０６に付属
するＡＧ−ＦＣ部（図示せず）によりそのコードが処理
される。データメモリ１１０３は、ＡＧ−ＦＣ部により
生成されたデータメモリアドレスにトークン内のデータ
を一時的に書き込むか、あるいはすでにこのメモリに書
き込まれた常数あるいは先に書き込まれたデータをデー
タＢとして読み出し、元のデータ（これはデータＡとし
て扱われる）とこのデータＢ、リンク情報ＩＤ’、ＯＰ
Ａを含む新たなトークンをキュー１１０２に供給する。
キュー１１０２内のトークンの内、さらに処理をされる
べきトークンは、プロセッシングユニット１１０７に供
給される。このプロセッシングユニット１１０７はその
トークンを処理して新たなトークンを生成し、リンクテ
ーブル１１０５に供給する。その後、以上の処理がこの
供給されたトークンに対して繰り返される。その結果、
キュー１１０２に、さらに処理を要しないトークンが格
納される。このようなトークンは、アウトプットコント
ローラー１１０１によりこのプロセッサエレメントの外
部に送出される。

【００１０】以上から明らかなように、入力トークンに
含まれたデータは、そのデータに対する処理が完了する
まで、パイプライン・リング上を転送される。したがっ
て、画像データのごとく処理すべきデータの総量が多い
場合には、より多数のトークンを処理しなければならな
くなり、処理時間が掛かる。

【００１１】また、複数のＩｍＰＰチップ１１５０がシ
リアルに接続されているために、異なる処理を並列に実
行するには、処理速度に制限があるという問題もある。

【００１２】以下、本発明に係るデータフロー制御のプ
ロセッサシステムを図面に示したいくつかの実施の形態
を参照してさらに詳細に説明する。なお、以下において
は、同じ参照番号は同じものもしくは類似のものを表す
ものとする。また、発明の第２の実施の形態以降におい
ては、発明の第１の実施の形態との相違点を主に説明す
るに止める。

【００１３】＜発明の実施の形態１＞図１において、デ
ータフロー制御の信号処理プロセッサは、信号処理に必
要な複数の処理を並列に実行するための処理エレメント
して、いずれも複数の処理を実行可能なプログラム制御
の演算用プロセッサエレメント（ＰＥ１，ＰＥ２）３０
７Ａ，３０７Ｂを使用する。このプロセッサは、これら
の演算用プロセッサエレメントにより共有される共有メ
モリ３０３と、このメモリへのアクセス要求のアービト
レーションを行うメモリアービトレーション回路３０４
と、インプットコントローラ３０２と、アウトプットコ
ントローラ３０６と、制御用プロセッサエレメント３０
８とを有する。制御用プロセッサエレメント３０８は、
汎用のプログラム制御のマイクロコンピュータにより構
成される。図においてブロック３０８内には、このプロ
セッサエレメントにより実行される、トークンの処理の
ための複数のプログラムモジュール３１４、３１１、３
０９および制御用プロセッサエレメントのメモリ（図示
せず）内に設けられたテーブル３１５、スタックメモリ
３１３およびキュー３１０等を示している。演算用プロ
セッサエレメント３０７Ａ，３０７Ｂはいずれも種々の
演算を実行可能な演算器（図示せず）を有する。この信
号処理プロセッサは、一つのＬＳＩチップ上に構成され
る。

【００１４】インプットコントローラ３０２は、入力デ
ータを外部から受け取ると、そのデータを共有メモリ３
０４の特定のアドレスの位置に書き込む。以下、インプ
ットコントローラ３０２およびアウトプットコントロー
ラ３０６がデータを外部と交換するのに用いるデータパ
ケットをデータトークンと呼び、演算用プロセッサエレ
メント３０７Ａ、３０７Ｂが実行するトークンを命令ト
ークンと呼ぶ。インプットコントローラ３０２は、その
後そのデータトークンの処理が終了したことを通知する
命令トークンを生成し、制御用プロセッサエレメント３
０８に供給する。この命令トークンには上記共有メモリ
アドレスが含まれる。

【００１５】制御用プロセッサエレメント３０８は、こ
の命令トークンに応答して、そのデータを処理するため
の命令トークンを発生し、演算用プロセッサエレメント
３０７Ａあるいは３０７Ｂの内、処理を実行可能な状態
にある演算用プロセッサエレメントにその命令トークン
を供給する。この命令トークンには、その入力データの
アドレスとその入力データに対して施すべき処理を示す
情報と、その処理の結果データを記憶すべき、共有メモ
リ３０３内のアドレスを含む。その演算用プロセッサエ
レメントは、この命令トークン内のアドレスによりその
入力データを共有メモリ３０３から読み出し、この命令
トークンにより指定された上記処理を実行し、その結果
データを上記命令トークンが指定する、共有メモリ３０
４内のアドレスの位置に書き込む。その後、この命令ト
ークンの実行が終了したことを知らせるために、この命
令トークンを制御用プロセッサエレメント３０８に供給
する。制御用プロセッサエレメント３０８は、演算用プ
ロセッサエレメント３０７Ａあるいは３０７Ｂから供給
された命令トークンに応答して、後続の命令トークンを
生成する。この命令トークンは、上に述べた最初の命令
トークンと同様に処理させる。以下、同様の処理が繰り
替えされる。最終結果データはアウトプットコントロー
ラ３０６により、共有メモリ３０３から読み出され外部
に転送される。

【００１６】このように、本実施の形態では、処理され
るべきデータに代えて、そのデータのメモリアドレスが
命令トークンに含まれ、演算用プロセッサエレメント３
０７Ａあるいは３０７Ｂと制御用プロセッサエレメント
３０８との間では、データは直接には転送されない。演
算結果データを生成した演算用プロセッサエレメントと
それに対して演算を行う演算用プロセッサエレメントの
間では、その演算結果データはトークンを介してではな
く共有メモリ３０３を介して受け渡される。

【００１７】各演算用プロセッサエレメントが実行可能
な複数の処理の例は、動画像符号化データの復号処理を
行うのに必要な、可変長復号（ＶＬＤ）処理，逆量子化
（ＩＱ）処理，逆ＤＣＴ（ＩＤＣＴ）処理，動き保証
（ＭＣ）である。しかし、以下の説明においては、図３
に示したように、本実施の形態の信号処理プロセッサで
実行される処理は、処理１から４を含む処理であると仮
定し、これらの処理を引用しながら本実施の形態の信号
処理プロセッサの動作を説明する。ここで、処理１は入
力データＡを処理し、処理３は入力データＢを処理す
る。処理２は、処理１の結果データを処理し、処理４は
処理２の結果データと処理３の結果データとを処理し、
結果データＣを生成する。処理４は、複数のデータに対
する処理である。このような処理を以下では複数項演算
と呼ぶことがある。例えば、算術四則演算、あるいは論
理積演算あるいは論理和演算等の論理演算が複数項演算
である。本実施の形態では、複数項演算が使用するデー
タの数は２と仮定する。

【００１８】本実施の形態では、共有メモリ３０３のア
ドレスを含む命令トークンを使用するために、共有メモ
リ３０３上に各処理に対応して、その処理が使用するデ
ータを格納する領域を予め定めておく。例えば、図４に
示すように、領域ａは処理１で使用される領域であり、
入力データＡとＢは、それぞれこの領域ａ内のアドレス
ａ１とａ２の領域に記憶される。領域ｂは処理２により
使用される領域であり、処理１の結果データがこの領域
ｂ内のアドレスｂ１の領域に記憶される。領域ｃは処理
４により使用される領域であり、処理２と３の結果デー
タがそれぞれこの領域ｃ内のアドレスｃ１とｃ２の領域
に記憶される。領域ｄは、アウトプットコントローラ３
０により使用される領域であり、具体的には処理４の結
果データＣがこの領域ｄ内のアドレスｄ１の領域に記憶
される。これらの領域ａからｄは、互いに他と重複しな
いように定められる。

【００１９】本実施の形態で使用される命令トークン
は、図２のフォーマット３２１に示されるように、フロ
ー識別子（フローＩＤ）、演算タグ、ソースポインタ、
デスティネーションポインタという４つのフィールドか
らなる。フローＩＤは処理の種類を表す。演算タグは、
フローＩＤが指定する処理が複数のデータを使用する処
理（複数項演算）であるときに、それらのデータを区別
するためのものである。例えば、同じ処理に使用される
最初のデータに対しては番号１を使用し、同じ処理に使
用する第２のデータに対しては番号２を使用する。一つ
の処理が使用するデータが一つの時には、そのデータに
対しては演算タグは使用されない。ソースポインタは、
処理されるべきデータが記憶されている、共有メモリ３
０３上のアドレスを示す。デスティネーションポインタ
は、その命令トークンが要求する処理の結果データを格
納すべき、共有メモリ３０３上のアドレスを示す。

【００２０】本実施の形態で使用されるデータトークン
は、図２のフォーマット３２２で示されるように、デー
タの入力を示すフローＩＤと、処理されるべきデータと
を含む。

【００２１】インプットコントローラ３０２は、線３０
１を介してデータトークンを外部から受信し、このトー
クン内のデータを共有メモリ３０３に書き込むととも
に、そのデータトークンの処理が終了したことを通知す
るための命令トークンを生成してトークン発生部３１４
に転送する回路である。図３の処理１が使用すべきデー
タＡが入力されデータトークンの場合、インプットコン
トローラ３０２は、共有メモリ３０３内の領域ａに属す
る領域ａ１（図４）のアドレスを作成し、そのデータト
ークンを受信したときに、このアドレスを使用してデー
タトークンに含まれたデータＡをこの領域ａ１に記憶す
る。同様に、処理３が使用すべきデータＢが入力される
データトークンの場合、インプットコントローラ３０２
は、そのデータトークンを受信したときに、領域ａ２の
アドレスを作成し、データＢをこの領域ａ２に記憶す
る。なお、インプットコントローラ３０２は、共有メモ
リ３０３に対するアクセスを監視し、そこからデータが
読み出されたときにはその読み出し位置を検出し、この
検出結果に基づいて、入力されたデータＡあるいはＢに
対する処理が終了したことを判断し、領域ａ内の空き領
域を検出する回路を有する。インプットコントローラ３
０２はこの検出された空き領域に入力データを書き込
む。

【００２２】入力データの書き込みの完了後に、インプ
ットコントローラ３０２は書き込みの完了を通知するた
めの命令トークンを生成し、トークン発生部３１４に供
給する。この命令トークンでは、フローＩＤは、データ
ＡまたはＢの入力を示し、デスティネーションポインタ
は、その入力データが書き込まれた、共有メモリ３０３
内のアドレスを示す。ソースポインタおよび演算タグは
有効でない。

【００２３】図５にインプットコントローラ３０２の概
略構造を示す。入力データはＦＩＦＯ（１８０１）に一
旦格納される。書き込みを開始するアドレスを書き込み
開始アドレスレジスタ１８０５と書き込みアドレスレジ
スタ１８０４に格納し、共有メモリ８０３に書き込みア
ドレスとして供給する。前記ＦＩＦＯ（１８０１）に格
納されたデータは、レジスタ１８０２を経由して共有メ
モリ８０３（図１３）に供給され、レジスタ１８０４内
のアドレスを用いて、共有メモリ８０３が許す期間に格
納される。インクリメンタ１８０３により書き込みアド
レスレジスタ１８０４内のアドレスを逐次インクリメン
トする。以上の動作は入力データの後続の部分に対して
逐次繰り返される。こうして、多量の入力データが逐次
共有メモリ８０３に書き込まれる。比較器１８０７は、
レジスタ１８０５内の書き込み開始アドレスとレジスタ
１８０４内の現在の書き込みアドレスとを比較すること
により、所定量のデータの書き込みが終了したか否かを
示す比較結果を出力する。制御回路１８０８はこの出力
が所定量のデータの書き込みの完了を示すときに、書き
込み動作を終了し、レジスタ１８０６内に入力完了を示
すフローＩＤを有する命令トークンを生成し、バス８２
０を介して制御用プロセッサエレメント３０８に供給す
る。このトークン内のディスティネーションにはレジス
タ１８０５内の書き込み開始アドレスが使用される。な
お、インプットコントローラ３０２に含まれた空き領域
を検出する前述の回路は簡単化のために図示していな
い。

【００２４】トークン発生部３１４は、インプットコン
トローラ３０２あるいは演算用プロセッサエレメント３
０７Ａあるいは３０７Ｂから供給される命令トークンに
応答して、リンクテーブル３１５を参照しながら新たな
命令トークンを発生するプログラムモジュールである。
この新たな命令トークンは、供給された命令トークンが
通知する、実行が終了した処理の次に実行すべき処理を
指定する命令トークンである。トークン発生部３１４
は、生成した命令トークンを被演算データ組検索部３１
１に転送する。

【００２５】リンクテーブル３１５は、トークン発生部
３１４に供給される可能性があるいろいろの命令トーク
ンが指定する処理に対応して一つのエントリを有し、そ
のエントリには、その処理の次に実行されるべき処理に
割り当てられたフローＩＤと、当該次の処理を受けるべ
きデータに付すべき演算タグを予め記憶する。図７に
は、図３に例示された処理を実行するときにリンクテー
ブル３１５に記憶される内容を示す。例えば、トークン
発生部３１４に供給された命令トークンが、データＡあ
るいはＢの入力を示すとき、次の処理は、それぞれ処理
１または３である。後に説明するようにトークン発生部
３１４に処理１の実行の完了を示す命令トークンが供給
されたとき、次に実行すべき処理は処理２である。次に
実行すべき処理が処理１、２または３であるとき、これ
らの処理はいずれも一つのデータのみを使用するので、
これらの処理を指定する命令トークンには演算タグは使
用されない。トークン発生部３１４に処理２または３の
実行の完了を示す命令トークンが供給されたとき、次に
実行すべき処理は処理４である。この処理は二つのデー
タを使用する複数項演算である。したがって、これらの
処理２と３のいずれか一方の実行完了を示す命令トーク
ンがトークン発生部３１４に供給されたとき、次に実行
すべき処理４を示す命令トークンに含まれるべき演算タ
グは１となる。処理２と３の他方の実行完了を示す命令
トークンがトークン発生部３１４に供給されたとき、次
に実行すべき処理４を示す命令トークンに含まれるべき
演算タグは２となる。最後に、処理４の実行が完了した
ときに、次に実行すべき処理は結果データＣの外部への
出力である。このデータ出力を示す命令トークンにも演
算タグは使用されない。トークン発生部３１４は、この
命令トークンを、処理４の実行完了を示す一組の命令ト
ークンがトークン発生部３１４に供給されたとき生成す
るようになっている。

【００２６】具体的には、トークン発生部３１４は、リ
ンクテーブル３１５を参照して図６に示すように動作す
る。すなわち、通常は命令トークンの到着待ちの状態に
あり、命令トークンが到着したか否かを繰り返しチェッ
クしている。命令トークンが到着すると、リンクテーブ
ル３１５内のその命令トークンが指定する処理に対応す
るエントリから、その処理の次の処理に対するフローＩ
Ｄを読み出す。このフローＩＤが複数項演算に対するも
のであるか否か判別し、もしそうであればそのエントリ
からタグを読み出す。発生した命令トークンに含まれた
デスティネーションポインタを上記次の処理のためのソ
ースポインタとして取り出す。さらに、後に説明する方
法により上記次の処理のためのデスティネーションポイ
ンタを決定する。取り出されたフローＩＤ、演算タグ、
ソースポインタおよび決定されたデスティネーションポ
インタを用いて、上記次の処理のための命令トークンを
発生し、被演算データ組検索部３１１に転送する。その
後、トークン発生部３１４は待機状態に戻る。

【００２７】トークン発生部３１４は、図８に示す手順
にて上記次の処理のためのデスティネーションポインタ
を決定する。トークン発生部３１４は、共有メモリ３０
３中の使用中の領域のアドレスを保持する図示しないア
ドレススタックを有する。したがって、このアドレスス
タックには、トークン発生部３１４に到着した命令トー
クン内のソースポインタがすでに格納されている。この
命令トークンの到着時点ではこのソースポインタを有す
る記憶領域はすでに使用済みとなっている。したがっ
て、このソースポインタを上記アドレススタックから削
除する。上記命令トークン内のデスティネーションポイ
ンタを、上記次の処理のためのソースポインタとして取
り出した後に、この新たなソースポインタをこのアドレ
ススタックに格納する。その後、上記次の処理の結果デ
ータを格納する領域として共有メモリ３０３内の空き領
域、すなわち、このアドレススタックに登録されたアド
レス以外のアドレスを有する領域を検索する。検索され
た領域のアドレスを上記次の処理のためのデスティネー
ションポインタとして使用する。さらに、このデスティ
ネーションポインタを上記アドレススタックに登録す
る。

【００２８】被演算データ組検索部３１１は転送された
命令トークンが複数項演算を要求するとき、その命令ト
ークンが必要とする二つのデータがそろうまで、その命
令トークンをスタックメモリ３１３に格納し、後に同じ
複数項演算を要求する命令トークンがトークン発生部３
１４から供給されたときに、これらの二つの命令トーク
ンを実行可能な命令トークンとしてトークンキュー制御
部３０９に転送する。もしトークン発生部３１４から供
給された命令トークンが、複数項演算を要求しないとき
には、被演算データ組検索部３１１は、その命令トーク
ンをそのまま実行可能な命令トークンとしてトークンキ
ュー制御部３０９に転送する。

【００２９】より具体的には、被演算データ組検索部３
１１は図１０に示すように動作する。まず被演算データ
組検索部３１１は命令トークンの到達待ち状態にあり、
トークン発生部３１４から命令トークンが到着したか否
かを検出している。命令トークンが到着すると、トーク
ン内のフローＩＤにより到着した命令トークンが複数項
演算を要求するか否かを判別する。もし、命令トークン
が複数項演算を要求しないときには、到着した命令トー
クンをそのままトークンキュー制御部３０９に出力す
る。命令トークンが複数項演算を要求するときには、到
着した命令トークンと組となるべき他の命令トークンを
スタックメモリ３１３から検索する。この他の命令トー
クンは、到着した命令トークンと同じフローＩＤを有
し、異なる演算タグを有するものである。組となるべき
他の命令トークンがスタックメモリ３１３内に存在しな
ければ、転送されてきた命令トークンをスタックメモリ
３１３に格納する。組となるべき他の命令トークンがス
タックメモリ３１３内に存在したときには、当該他の命
令トークンをスタックメモリ３１３から読み出し、到着
した命令トークンとともに実行可能な命令トークンとし
てトークンキュー制御部３０９に転送する。

【００３０】トークンキュー制御部３０９は、図１０に
示すように、命令トークンの待ち合わせルーティン（図
１０（ａ））と命令トークンの発行ルーティン（図１０
（ｂ））とを実行する。命令トークンの待ち合わせルー
ティンでは、トークンキュー制御部３０９は、命令トー
クンが被演算データ組検索部３１１から到達するごと
に、到着した命令トークンをトークンキュー３１０に格
納する。命令トークンの発行ルーティンでは、トークン
キュー制御部３０９は、演算用プロセッサエレメント３
０７Ａ、３０７Ｂの動作状況を監視し、処理の実行を終
了し待機状態に入った演算用プロセッサエレメントがあ
れば、トークンキュー３１０から演算用プロセッサエレ
メントにより処理されるべき命令トークンを取り出し、
その演算用プロセッサエレメントにバス３２０を介して
転送する。なお、トークンキュー３１０に保持された命
令トークンが、複数項演算を要求するときには、そお命
令トークンと、その命令トークンが要求する処理と同じ
処理を要求し、演算タグの値が異なる他の命令トークン
との組を同じ演算用プロセッサエレメントに供給する。
なお、全ての演算用プロセッサエレメント３０７Ａ、３
０７Ｂがいずれもビジー状態にある間は、トークンキュ
ー３１０に格納された命令トークンはそのまま保持され
る。

【００３１】演算用プロセッサエレメント３０７Ａまた
は３０７Ｂは複数の命令トークンにより指定されうる複
数の処理をすべてを実行できるものである。トークンキ
ュー制御部３０９から命令トークンが供給されると、演
算用プロセッサエレメント３０７Ａまたは３０７Ｂは、
その命令トークン内のソースポインタにより指定される
データを共有メモリ３０３から読み出す。その命令トー
クンが複数項演算を要求するときには、その命令トーク
ンに含まれた第１のソースポインタと、その命令トーク
ンと対をなす他の命令トークンに含まれた第２のソース
ポインタにより指定される二つのデータを共有メモリ３
０３より読み出す。読み出された一つまたは二つのデー
タに対してその命令トークンが要求する処理を実行し、
共有メモリ３０３内の、その命令トークンのデスティネ
ーションポインタにより指定された記憶領域に、実行の
結果得られたデータを格納する。その処理の実行完了後
に、上記処理された命令トークンをトークン発生部３１
４にバス３２１を介して供給する。トークン発生部３１
４は、既に述べたと同様にしてこの命令トークンの後続
の命令トークンを発生する。こうして、インプットコン
トローラ３０２に外部より供給されたデータを処理する
ために一連の命令トークンが生成され、実行される。そ
の結果、最終的には外部にデータを出力することを要求
する命令トークンがトークン発生部３１４により生成さ
れ、トークンキュー制御部３０９に転送されることにな
る。

【００３２】トークンキュー制御部３０９は、トークン
キュー３１０内にデータ出力を指示する命令トークンが
含まれているときには、その命令トークンをアウトプッ
トコントローラ３０６に供給する。アウトプットコント
ローラ３０６は、供給された命令トークン内のソースポ
インタで指定されるデータを共有メモリ３０４から読み
出し、線３０５を介して外部に転送する。

【００３３】図１１は、このアウトプットコントローラ
３０６の概略構成を示す。デコーダ１９０２が到達した
トークン１９０１のフローＩＤを解読した結果、この命
令トークンが出力処理を要求することを確認する。読み
出しアドレスレジスタ１９０４には、このトークン内の
ソースポインタをセレクタ１９０８を介してセットし、
読み出しアドレスとして共有メモリ８０３に供給し、共
有メモリ８０３上のソースポインタが示す記憶位置から
データを読み出す。読み出されたデータはレジスタ１９
０７を介してＦＩＦＯ（１９０６）に格納される。ＦＩ
ＦＯ（１９０６）に格納されたデータは出力データとし
て外部に転送される。その後、インクリメンタ１９０５
とセレクタ１９０８を使用してレジスタ１９０４内の読
み出しアドレスを繰り返し更新することにより、所定数
の後続のデータを共有メモリ８０３から読み出し、外部
に供給する。

【００３４】次に具体的に図３で示す処理１、処理２、
処理３、処理４からなる一連の処理を本発明の信号処理
プロセッサで実行した場合の動作を図１２を参照して説
明する。インプットコントローラ３０２はデータＡを含
むデータトークンを外部から受信すると、入力データ領
域ａ（図４）内の現在使っていない記憶位置にデータＡ
を格納し、さらにこのデータの入力を通知するトークン
ｒ１を発生する。同様に、データＢを含むデータトーク
ンを受信すると、入力データ領域ａ内の現在使っていな
い場所にデータＢを格納し、このデータの入力を通知す
る命令トークンｒ２を発生する。トークン発生部３１４
では、インプットコントローラ３０２から発生された命
令トークンｒ１，ｒ２のそれぞれに対して次の処理と共
有メモリ３０３上のデスティネーションポインタとを割
り付け、それぞれ処理１，３の実行を要求する命令トー
クンｔ１，ｔ２を発生する。

【００３５】命令トークンｔ１，ｔ２は今の例では複数
項演算を要求しないので、被演算データ組検索部３１１
はそのままこれらの命令トークンｔ１，ｔ２をトークン
キュー制御部３０９に送り、トークンキュー３１０に格
納する。トークンキュー制御部３０９は、演算用プロセ
ッサエレメント３０７Ａ、３０７Ｂの動作状況を監視
し、処理を実行可能な演算用プロセッサエレメントにこ
れらの命令トークンを転送する。今の場合、プロセッサ
エレメントＰＥ１に命令トークンｔ１を転送し、プロセ
ッサエレメントＰＥ２に命令トークンｔ２を転送すると
仮定する。プロセッサエレメントＰＥ１，ＰＥ２は転送
された命令トークンｔ１，ｔ２に基づき処理１、処理３
をそれぞれ共有メモリ３０３をアクセスしながら実行す
る。プロセッサエレメントＰＥ１，ＰＥ２は、それぞれ
命令トークンｔ１，ｔ２の実行が終了したときに、それ
ぞれの命令トークンをそのまま命令トークンｒ３，ｒ７
としてトークン発生部３１４に転送する。

【００３６】トークン発生部３１４は命令トークンｒ
３，ｒ７を受け、処理２，４をそれぞれ要求する命令ト
ークンｔ３，ｔ４を新たに発生する。処理２のトークン
ｔ３は前記トークンｔ１，ｔ２と同様にトークンキュー
３１０を経て演算用プロセッサエレメント、例えばＰＥ
１に送られ、そこで実行される。その後、命令トークン
ｒ４がトークン発生部３１４に転送される。一方、処理
４を行う命令トークンｔ４は複数項演算を要求するの
で、被演算データ組検索部３１１が組となる、処理４を
要求し、もう一つの演算タグがついた命令トークンをス
タックメモリ３１３から検索する。今の場合、このよう
な命令トークンはスタックメモリ３１３にはまだ到達し
ていないため、被演算データ組検索部３１１は命令トー
クンｔ４をスタックメモリ３１３に格納する。

【００３７】一方、命令トークンｒ４を受けたトークン
発生部３１４は次の処理を実行するための命令トークン
として、処理４を要求する命令トークンｔ５を発生す
る。被演算データ組検索部３１１は、命令トークンｔ５
と組となるタグ２の命令トークンを検索する。ここで
は、スタックメモリ３１３にすでに格納された命令トー
クンｔ４を発見し、命令トークンｔ４，ｔ５を実行可能
な命令トークンとしてトークンキュー３１０に転送す
る。トークンキュー制御部３０９は、処理を実行可能な
演算用プロセッサエレメント、例えばＰＥ１にこれらの
一組の命令トークンを転送する。その演算用プロセッサ
エレメントＰＥ１は、これらの一組の命令トークンを用
いて処理４を実行したのち、その一組の命令トークンを
そのまま一組の命令トークンｒ５、ｒ６としてトークン
発生部３１４に転送する。トークン発生部３１４はこれ
らの一組の命令トークンｒ５，ｒ６を受けてアウトプッ
トコントローラ３０６にデータ出力を指示する命令トー
クンｔ６を発行する。アウトプットコントローラは命令
トークンｔ６を受けデータの出力を行う。

【００３８】以上に説明したように、本実施の形態で
は、演算用プロセッサエレメント３０７Ａ、３０７Ｂ
は、共有メモリ３０３上の被演算データに対し演算を行
い、共有メモリ３０３に演算結果データを格納するが、
演算結果データを演算用プロセッサエレメント間で伝達
されることがない。したがって、多量のデータを高速に
処理することができる。従来のように命令トークンに処
理されるべきデータを含める方法では、一つのトークン
に含まれうるデータの長さに制限があり、長いデータを
処理する場合には命令トークンの数を増大する必要があ
る。しかし、本実施の形態のように、共有メモリ３０３
を介してデータを転送する方法では、一時に転送できる
データの長さはそのような制限された長さより長くでき
る。したがって、多量のデータを処理するときでも、ト
ークンの数を増やす必要がなく、しかもデータを制御用
プロセッサエレメント内のいろいろのモジュールの間を
転送する必要はない。これらのことより、本実施の形態
では、多量のデータを高速に処理できる。また、データ
転送に関わる演算用プロセッサエレメント間のアービト
レーションの必要がなく、共有メモリ３０３のデータを
管理するだけで良い。

【００３９】＜発明の実施の形態２＞本実施の形態は、
複数の処理エレメントとして、実施の形態１で使用され
た演算用プロセッサエレメントに代えて、限定された処
理のみを行うことが出来る専用演算器、具体的にはアク
セラレータを用いるデータフロー制御の信号処理プロセ
ッサを提供する。図１３に示すように、このプロセッサ
は、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅｓＥｘ
ｐｅｒｔｓＧｒｏｕｐ）の復号処理を行うもので、専
用演算器として可変長復号（ＶＬＤ）処理のアクセラレ
ータ（ＶＬＤアクセラレータ）８０７Ａ，逆量子化（Ｉ
Ｑ）処理のアクセラレータ（ＩＱアクセラレータ）８０
７Ｂ，逆ＤＣＴ（ＩＤＣＴ）処理のアクセラレータ（Ｉ
ＤＣＴアクセラレータ）８０７Ｃ，動き補償（ＭＣ）処
理のアクセラレータ（ＭＣアクセラレータ）８０７Ｄ、
インプットコントローラ８０５、アウトプットコントロ
ーラ８０６を持ち、これらの回路はメモリバススイッチ
８０４を介して共有メモリ８０３に接続されている。図
示のプロセッサは望ましくは一つのＬＳＩチップ上に構
成される。共有メモリ８０３は別々のメモリ８０３Ａか
ら８０３Ｆにより構成され、それぞれは互いに並列にア
クセス可能である。入力データ８０１はインプットコン
トローラ８０５により共有メモリ８０３に書き込まれ、
また出力データはアウトプットコントローラ８０６によ
り共有メモリ８０３から読み出される。

【００４０】各アクセラレータは、制御用プロセッサエ
レメント３０８から転送される命令トークンにより指定
されるデータを共有メモリ８０３から読み出し、各アク
セラレータが担当する処理をそのデータに対して施す。
その結果データを再び共有メモリ８０３に格納し、その
命令トークンをそのまま処理が終了した命令トークンと
して制御用プロセッサエレメント３０８に転送する。命
令トークンの生成と実行タイミングの制御は制御用プロ
セッサエレメント３０８が行う。制御用プロセッサエレ
メント３０８は、実施の形態１（図１）と同様に、トー
クン発生部３１４、リンクテーブル３１５、被演算デー
タ組検索部３１１、トークンキュー制御部３０９、トー
クンキュー３１０を含む。実施の形態１と異なり、トー
クンキュー制御部３０９は、実行可能な命令トークンが
指定する処理を実行できる特定のアクセラレータが処理
を実行可能な状態にあるか否かを判別し、そのアクセラ
レータが実行可能なときに、その命令トークンをそのア
クセラレータに供給する。

【００４１】図１４に、図１３の信号処理プロセッサに
より実行される復号処理のフローを示す。入力データＡ
に対して可変長復号処理（ＶＬＤ）が行われる。その結
果データＢに対して逆量子化処理（ＩＱ）が行われる。
その結果データＣに対して逆ＤＣＴ（ＩＤＣＴ）処理が
行われる。その結果データＤと予め共有メモリ上に格納
されたデータＥに対して動き補償処理（ＭＣ）が行われ
る。これは以前の処理結果データを再び使用する動き補
償処理の特徴による。その結果データＦは最終的に信号
Ｇとして外部に出力される。

【００４２】以上の復号処理の実行のために発行される
命令トークンとそれらの命令トークンが処理するデータ
が記憶されているメモリを図１５に示す。以下、図１５
を参照して、図１４の処理の実行の模様を説明する。ま
ず、データＡが入力されると、インプットコントローラ
８０５は、メモリ８０３Ａ上のアドレスａ１の位置にデ
ータＡを格納し、データの入力の完了を通知する命令ト
ークンｔ１を発生し、制御用プロセッサエレメント３０
８に供給する。

【００４３】図１５に戻り、命令トークンｔ１を受けた
制御用プロセッサエレメント３０８は次の処理を指定す
る命令トークンｔ２を発生し、ＶＬＤアクセラレータ８
０７Ａに転送する。命令トークンｔ２はＶＬＤ処理をメ
モリ８０３Ａ上のアドレスａ１のデータに対して行い、
メモリ８０３Ｂ上のアドレスｂ１の位置に結果データＢ
を格納することを要求する。ＶＬＤアクセラレータ８０
７Ａは命令トークンｔ２で指定される処理を行い、処理
が終了した段階で命令トークンｔ２をそのまま命令トー
クンｔ３として制御用プロセッサエレメント３０８に転
送する。

【００４４】命令トークンｔ３を受けた制御用プロセッ
サエレメント３０８は次の処理を実行する命令トークン
ｔ４を発行する。命令トークンｔ４はＩＱ処理をメモリ
８０３Ｂ上のアドレスｂ１のデータに対して行い、メモ
リ８０３Ｃ上のアドレスｃ１の位置に結果データＣを格
納する命令である。ＩＱアクセラレータ８０７Ｂはこの
命令トークンｔ４で指定される処理を行い、処理が終了
した段階で命令トークンｔ４をそのまま命令トークンｔ
５として制御用プロセッサエレメント３０８に転送す
る。

【００４５】命令トークンｔ５を受けた制御用プロセッ
サエレメント３０８は次の処理を実行する命令トークン
ｔ６を発行する。命令トークンｔ６はＩＤＣＴ処理をメ
モリ８０３Ｃ上のアドレスｃ１のデータに対して実行
し、メモリ８０３Ｄ上のアドレスｄ１の記憶位置に結果
データＤを格納する命令である。ＩＤＣＴアクセラレー
タ８０７Ｃはこの命令トークンｔ６で指定される処理を
行い、処理が終了した段階で命令トークンｔ６をそのま
ま命令トークンｔ７として制御用プロセッサエレメント
３０８に転送する。

【００４６】命令トークンｔ７を受けた制御用プロセッ
サエレメント３０８は次の処理を実行する命令トークン
ｔ８を発行する。命令トークンｔ８は２つの命令トーク
ンからなる。ＭＣ処理は、複数項演算を要求し、これら
の二つの命令トークンはＭＣ処理に使用されるべき複数
のデータの一方を指定する。すなわち、一つの命令トー
クンは、結果データＤに対してＭＣ処理を実行すること
を要求し、他の命令トークンは、メモリ８０３Ｆ上のア
ドレスｅ１の位置のデータＥに対しＭＣ処理を行うこと
を要求する。ＭＣアクセラレータ８０７Ｄはこの命令ト
ークンｔ８で指定される処理を行い、処理が終了した段
階で命令トークンｔ８をそのまま命令トークンｔ９とし
て制御用プロセッサエレメント３０８に転送する。図１
５ではメモリ８０３からのデータの読み出しを実行する
命令トークンは簡単化のために示していない。

【００４７】命令トークンｔ９を受けた制御用プロセッ
サエレメント３０８は最後の処理を実行する命令トーク
ンｔ１０を発行する。命令トークンｔ１０はデータ出力
をメモリ８０３Ｆ上のアドレスｇ１のデータに対して行
う命令である。アウトプットコントローラ８０９はこの
命令トークンｔ１０で指定されるデータ出力を行い、処
理が終了した段階で命令トークンｔ１０をそのまま命令
トークンｔ１１として制御用プロセッサエレメント３０
８に転送する。

【００４８】以上の処理で入力されたデータに対する一
連の処理が終わるが、実際にはこの一連の処理が行われ
ている最中に次の入力データがインプットコントローラ
８０５に入り、それに対する一連の処理をアクセラレー
タ８０７Ａから８０７Ｄにより並列に実行されることに
なる。

【００４９】上述の動作説明から明らかなように、各ア
クセラレータの動作タイミングは、そのアクセラレータ
が処理できる特定の処理を要求する命令トークンの到着
に依存している。このことが各アクセラレータの並列動
作の効率を通常のパイプライン処理に比較して高いもの
とし、信号処理プロセッサ全体の処理能力を上げる結果
につながっている。このことを示しているのが図１６の
タイミング図である。ある処理を単一のアクセラレータ
が実行し、次の処理を別のアクセラレータが実行する場
合、各アクセラレータをパイプライン動作にして動作さ
せるのが一般的である。このようなパイプライン動作を
実現させるためには、各アクセラレータが処理に要する
時間の内、最長期間を見積もり、それを一サイクルとし
てパイプライン動作を行わせることが多い。図１６の上
側に示した通常のパイプライン制御のタイミングは、最
初にＶＬＤ処理（ＶＬＤ１）を実行する３サイクル中
に、ＩＱ処理およびＩＤＣＴ処理をそれぞれ四回行うこ
とを基本にしてパイプライン動作を設計したときのタイ
ミングチャートである。このような設計によれば、いず
れかのＶＬＤ処理が、例えば２番目に行われたＶＬＤ処
理のように、２．５サイクルで終了したとしても、次の
ＶＬＤ処理を行うのは２番目のＶＬＤ処理の３サイクル
後に行うのが通常である。

【００５０】これに対して、本実施の形態のように各ア
クセラレータの動作開始を命令トークンの到着で制御す
る場合には、各アクセラレータは、被演算データが準備
出来ていれば、サイクルの制約なしに処理の実行を開始
できる。すなわち、図１６の下側に示したように２番目
のＶＬＤ処理が２．５サイクルかかって終了した場合、
第３のＶＬＤ処理をすぐに開始できる。このように本実
施の形態によれば、一サイクル以内の無駄な待ち時間を
削減することができ、全体の処理速度を向上させること
が可能である。このことは実施の形態１にもあてはま
る。逆に実施の形態１と同様に、本実施の形態でもデー
タを命令トークンに含めないで、共有メモリを介して異
なる処理エレメント（アクセラレータ）間で転送する。
したがって、より多量のデータを高速に処理可能であ
る。

【００５１】＜発明の実施の形態３＞実施の形態１と２
では、トークン発生部３１４がいずれかの命令トークン
を受信したときに、トークン発生部３１４はその命令ト
ークンが指定する処理の次の処理としてリンクテーブル
３１５に予め記憶された処理を要求する命令トークンを
生成した。したがって、前述の信号処理プロセッサによ
り実行される処理の流れは固定的であった。しかし、こ
のような処理の流れを動的にすることもできる。

【００５２】すなわち、ある処理エレメント（実施の形
態１における演算用プロセッサエレメントあるいは実施
の形態２におけるアクセラレータ）は、いずれかの処理
を実行したときに、そのことを知らせる命令トークンを
トークン発生部３１４に供給していた。この命令トーク
ンにフラグを付加し、その値を適宜変更することによ
り、処理の流れを変更できる。すなわち、そのフラグの
値により二つの処理の流れの一方に分岐できるようにす
る。具体的には、処理１の結果データに対して処理３を
行い、その結果データＢを出力する処理の流れと、処理
１の結果データに対して処理２を行った後に処理３を行
い、結果データＢを出力する処理の流れとに分岐可能で
ある。この分岐は以下のようにして実現される。

【００５３】図１７にこのフラグを利用した処理フロー
の変更の例を示す。この例では、ある処理エレメント
は、そこに供給された命令トークンｔ１に従って、入力
データＡに対して処理１を実行し、その命令トークンｔ
１にフラグを付けて新たな命令トークンｔ２を生成し、
トークン発生部３１４に転送する。このフラグの値は、
処理の実行の結果データに依存して値１または０を採
る。トークン発生部３１４は、このフラグの値が０か１
かにより命令トークンｔ３またはｔ４を発行する。命令
トークンｔ３は、処理１の実行結果に対して処理３の実
行を要求する命令トークンである。このように異なる処
理を要求する命令トークンを切り替えて発行するには、
リンクテーブル３１５に、同一の処理の後に実行すべき
次の処理として、フラグの値により選択可能な複数の処
理を記憶させておく。

【００５４】もし、命令トークンｔ２に対して命令トー
クンｔ３が発生された場合、この命令トークンｔ３を転
送された適当な処理エレメントは、処理１の結果データ
に対して処理３を実行し、その結果、命令トークンｔ７
を出力する。この処理の流れでは、処理３の実行結果デ
ータがデータＢとして使用される。一方、命令トークン
ｔ２に対して命令トークンｔ４が発生された場合、この
命令トークンｔ４が転送された適当な処理エレメント
は、処理１の結果データに対して処理２を実行し、命令
トークンｔ５を発生する。トークン発生部３１４は、こ
の命令トークンｔ５を受け取ったときに処理２の実行結
果データに対して処理３を実行することを要求する命令
トークンｔ６を発行する。ある処理エレメントは、命令
トークンｔ６に従って処理３を実行する。このように、
第２の処理の流れでは処理２が余分に実行される。

【００５５】＜変形例＞本発明は以上の実施の形態に限
定されるのではなく、以下に例示する変形例および他の
いろいろの変形例として実施可能である。

【００５６】（１）実施の形態１では二つの演算用プロ
セッサエレメントを使用したが、演算用プロセッサエレ
メントを増やすことが可能である。このとき、演算用プ
ロセッサエレメントを制御しているトークン発生部３１
４、トークン検索部、トークンキュー等の構成をまった
く変更することは必要はない。演算用プロセッサエレメ
ントの数を増やすことにより並列に実行できる処理が増
え、高速に多量のデータの演算を行うことが可能とな
る。

【００５７】（２）実施の形態１あるいは２では、制御
用プロセッサエレメント３０８として汎用のマイクロコ
ンピュータを使用した。しかし、これに代えて、専用の
回路を使用することもできる。

【００５８】（３）実施の形態１あるいは２で使用した
命令トークンは、他のフォーマットのものでもよい。ま
た、命令トークンに含まれたフローＩＤ、演算タグは、
それぞれ処理の種類および被演算データの数を識別する
他の種類の情報でもよい。

【００５９】（４）実施の形態１あるいは２で使用した
技術は、複数の処理を並列にデータフロー制御により起
動する計算機一般に適用できる。

【００６０】

【発明の効果】以上から明らかなように、本発明によれ
ば、命令トークンにデータを含ませないでデータフロー
制御を実現するので、多量のデータを高速に処理できる
データフロー計算機が得られる。

【図面の簡単な説明】

【図１】本発明に掛かるデータフロー制御の信号処理プ
ロセッサの概略構成図。

【図２】図１の装置に使用するいくつかのトークンのフ
ォーマットを示す図。

【図３】図１の装置で実行される例示的な処理のフロー
図。

【図４】図１の装置で使用される共有メモリにおける領
域割り当てを示す図。

【図５】図１の装置で使用されるインプットコントロー
ラの概略構成図。

【図６】図１の装置で使用されるトークン発生部の処理
のフロー図。

【図７】図１の装置で使用されるリンクテーブルの構造
を示す図。

【図８】図１の装置で使用されるトークン発生部が実行
する共有メモリのアドレス管理処理のフロー図。

【図９】図１の装置で使用される被演算データ組検索部
の処理のフロー図。

【図１０】図１の装置で使用されるトークンキュー制御
部の処理のフロー図。

【図１１】図１の装置で使用されるアウトプットコント
ローラの概略構成図。

【図１２】図１の装置の動作のタイミングチャート。

【図１３】本発明に掛かる他のデータフロー制御の信号
処理プロセッサの概略構成図。

【図１４】図１３の装置で実行される例示的な処理のフ
ロー図。

【図１５】図１３の装置の動作を説明する図。

【図１６】実施の形態２における動作と従来の装置にお
ける動作を示すタイミングチャート。

【図１７】本発明による命令トークンの他の実行手順を
示すフローチャート。

【図１８】従来のデータフロー制御のマルチプロセッサ
の概略構成図。

【図１９】図１８の装置に用いるプロセッサの概略構成
図。

Claims

【特許請求の範囲】

【請求項１】複数の処理エレメントと、これらに対する共有メモリと、上記複数の処理エレメントに対して処理の実行を要求す
る命令トークンを供給する制御回路とを有し、上記制御回路は、いずれかの処理を起動するときに、そ
の処理に使用可能なデータが記憶された、上記共有メモ
リ内の記憶位置を指定する第１の情報と、上記処理の実
行により得られる結果データを格納すべき、上記メモリ
内の記憶位置を指定する第２の情報とを有する命令トー
クンを、上記複数の処理エレメントの内、その処理を実
行可能な処理エレメントに供給し、各処理エレメントは、上記制御回路により命令トークン
を供給されたときに、その供給された命令トークン内の
上記第１の情報により指定される、上記共有メモリ内の
記憶位置から処理すべきデータを読み出し、そのデータ
に対して処理を実行し、その実行の結果データを、上記
供給された命令トークン内の上記第２の情報により指定
される、上記共有メモリ内の記憶位置に記憶するデータ
フロー計算機。
【請求項２】上記複数の処理エレメントは、それぞれ複
数の処理を実行できるプログラム制御のプロセッサから
なる請求項１記載のデータフロー計算機。
【請求項３】上記複数の処理エレメントは、それぞれ互
いに異なる処理を実行する専用の回路からなる請求項１
記載のデータフロー計算機。
【請求項４】上記制御回路は、プログラム制御のプロセ
ッサからなる請求項１記載のデータフロー計算機。
【請求項５】複数の処理エレメントと、これらに対する共有メモリと、上記複数の処理エレメントをデータフロー制御により起
動する制御回路とを有し、上記制御回路は、いずれかの処理を起動するときに、そ
の処理に使用可能なデータが記憶された、上記共有メモ
リ内の記憶位置を指定する第１の情報と、上記処理の実
行により得られる結果データを格納すべき、上記メモリ
内の記憶位置を指定する第２の情報とを、上記複数の処
理エレメントの内、その処理を実行可能な処理エレメン
トに供給し、各処理エレメントは、上記制御回路により起動されたと
きに、上記制御回路から供給された上記第１の情報によ
り指定される、上記共有メモリ内の記憶位置から処理す
べきデータを読み出し、そのデータに対して処理を実行
し、上記制御回路から供給された上記第２の情報により
指定される、上記共有メモリ内の記憶位置に、その実行
の結果データを記憶するデータフロー計算機。
【請求項６】上記制御回路は、起動すべき処理エレメン
トに、上記第１，第２の情報と、実行されるべき処理を
指定する第３の情報とを供給し、各処理エレメントは、上記制御回路により起動されたと
きに、上記制御回路から供給された上記第３の情報によ
り指定される処理を実行する請求項５記載のデータフロ
ー計算機。
【請求項７】複数の処理の内のいずれか一つの処理を実
行する毎に、その実行の結果生成されたデータを使用す
る他の処理を実行するように、複数の処理を起動するデ
ータフロー計算機において、いずれか一つの処理を起動するときに、その処理が使用
可能なデータが記憶されている、所定のメモリ内の記憶
位置を指定する第１の情報と、その処理の結果生成され
るデータを記憶すべき、上記メモリ内の記憶位置を指定
する第２の情報とを上記起動すべき処理に通知し、上記起動すべき処理の実行時に、上記第１の情報で指定
されるデータを上記メモリから読み出し、読み出されたデータに上記一つの処理を実行し、その実行の結果得られたデータを、上記第２の情報によ
り指定される、上記メモリ内の記憶位置に記憶するデー
タフロー制御方法。