JP2005222142A - アレイ型プロセッサ - Google Patents

アレイ型プロセッサ Download PDF

Info

Publication number
JP2005222142A
JP2005222142A JP2004026800A JP2004026800A JP2005222142A JP 2005222142 A JP2005222142 A JP 2005222142A JP 2004026800 A JP2004026800 A JP 2004026800A JP 2004026800 A JP2004026800 A JP 2004026800A JP 2005222142 A JP2005222142 A JP 2005222142A
Authority
JP
Japan
Prior art keywords
data
context
code
instruction
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004026800A
Other languages
English (en)
Other versions
JP4502650B2 (ja
Inventor
Takeshi Inuo
武 犬尾
Nobuki Kajiwara
信樹 梶原
Takao Toi
崇雄 戸井
Toru Awashima
亨 粟島
Hirokazu Kami
弘和 紙
Taro Fujii
太郎 藤井
Kenichiro Anjo
健一朗 安生
Kouichirou Furuta
浩一朗 古田
Masato Motomura
真人 本村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Electronics Corp
NEC Corp
Original Assignee
NEC Electronics Corp
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Electronics Corp, NEC Corp filed Critical NEC Electronics Corp
Priority to JP2004026800A priority Critical patent/JP4502650B2/ja
Priority to US11/049,305 priority patent/US7650484B2/en
Publication of JP2005222142A publication Critical patent/JP2005222142A/ja
Application granted granted Critical
Publication of JP4502650B2 publication Critical patent/JP4502650B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8023Two dimensional arrays, e.g. mesh, torus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30036Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3877Concurrent instruction execution, e.g. pipeline, look ahead using a slave processor, e.g. coprocessor
    • G06F9/3879Concurrent instruction execution, e.g. pipeline, look ahead using a slave processor, e.g. coprocessor for non-native instruction execution, e.g. executing a command; for Java instruction set
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline, look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline, look ahead using a plurality of independent parallel functional units
    • G06F9/3887Concurrent instruction execution, e.g. pipeline, look ahead using a plurality of independent parallel functional units controlled by a single instruction for multiple data lanes [SIMD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Multi Processors (AREA)
  • Advance Control (AREA)

Abstract

【課題】 コンピュータプログラムのデータ容量が記憶容量を超過していても、そのコンピュータプログラムに対応した動作を実行できるアレイ型プロセッサを提供する。
【解決手段】 アレイ型プロセッサが、コンピュータプログラムをデータ記憶している外部のプログラムメモリから所定個数の連携する一部の命令コードをデータ取得し、データ取得された所定個数の命令コードのみを一時保持して動作する。そして、一時保持した命令コードでの動作を完了するごとに継続する命令コードをデータ取得するので、コンピュータプログラムのデータ容量が記憶容量を超過していても、そのコンピュータプログラムに対応した動作が実行される。
【選択図】 図1

Description

本発明は、状態管理部とデータパス部とを有しており、データパス部に複数のプロセッサエレメントと複数のスイッチエレメントとがマトリクス配列されているアレイ型プロセッサに関する。
現在、各種のデータ処理を自在に実行できるプロセッサユニットとしては、いわゆるCPU(Central Processing Unit)やMPU(Micro Processor Unit)と呼称される製品が実用化されている。
このようなプロセッサユニットを利用したデータ処理システムでは、複数の動作命令が記述された各種のオブジェクトコードと各種の処理データとがメモリデバイスに格納され、プロセッサユニットはメモリデバイスから動作命令や処理データを順番にデータ読出して複数のデータ処理を逐次実行する。
このため、一個のプロセッサユニットで各種のデータ処理を実現できるが、そのデータ処理では複数のデータ処理を順番に逐次実行する必要があり、その逐次処理ごとにプロセッサユニットがメモリデバイスから動作命令をデータ読出する必要があるので、複雑なデータ処理を高速に実行することは困難である。
一方、実行するデータ処理が1つに限定されている場合には、そのデータ処理を実行するように論理回路をハードウェアで形成すれば、プロセッサユニットがメモリデバイスから複数の動作命令を順番にデータ読出して複数のデータ処理を順番に逐次実行するような必要はない。このため、複雑なデータ処理を高速に実行することが可能であるが、当然ながら1つのデータ処理しか実行することができない。
つまり、オブジェクトコードを切換自在としたデータ処理システムでは、各種のデータ処理を実行できるが、ハードウェアの構成が固定されているのでデータ処理を高速に実行することが困難である。一方、ハードウェアからなる論理回路では、データ処理を高速に実行することが可能であるが、オブジェクトコードを変更できないので1つのデータ処理しか実行できない。
このような課題を解決するため、本出願人はソフトウェアに対応してハードウェアの構成が変化するプロセッサユニットとしてアレイ型プロセッサを創案した。このアレイ型プロセッサでは、小規模の多数のプロセッサエレメントとスイッチエレメントとがマトリクス配列されており、このデータパス部に状態管理部が並設されている。
複数のプロセッサエレメントは、個々にデータ設定される動作命令に対応してデータ処理を個々に実行し、複数のスイッチエレメントは、個々にデータ設定される動作命令に対応して複数のプロセッサエレメントの接続関係を個々に切換制御する。
つまり、アレイ型プロセッサは複数のプロセッサエレメントと複数のスイッチエレメントとの動作命令を切り換えることでハードウェアの構成が変化するので、各種のデータ処理を実行することができ、ハードウェアとして小規模の多数のプロセッサエレメントが簡単なデータ処理を並列に実行するので、全体では複雑なデータ処理を高速に実行することができる。
そして、上述のような複数のプロセッサエレメントと複数のスイッチエレメントとの動作命令からなるコンテキストを状態管理部がオブジェクトコードに対応して動作サイクルごとに順次切り換えるので、アレイ型プロセッサはオブジェクトコードに対応して並列処理を連続的に実行することができる(例えば、特許文献1〜7、非特許文献1参照)。
さらに、複数のデータ処理装置を並列に接続して煩雑なデータ処理を分担するデータ処理システムも実用化されており、このようなデータ処理システムとしては、同一構造の複数のデータ処理装置を接続した同種結合タイプと、構造が相違する複数のデータ処理装置を接続した異種結合タイプとがある。
同種結合タイプのデータ処理システムでは、1つのデータ処理を同一構造の複数のデータ処理装置で分担するので、高い並列度でデータ処理を実行することができる。異種結合タイプのデータ処理システムでは、1つのデータ処理を複数種類のデータ処理装置で分担するので、データ処理装置ごとに得意のデータ処理を実行することができる。そして、上述のような異種結合タイプのデータ処理システムとして、一般的なMPUとアレイ型プロセッサとを混載したものも、本出願人は提案した(例えば、特許文献8参照)。

特許3269526号 特開2000−138579号 特開2000−224025号 特開2000−232354号 特開2000−232162号 特開2003−076668号 特開2003−099409号 特開2003−196248号 "Introduction to the Configurable, Highly Parallel Computer"、Lawrence Snyder著、Purdue University、"IEEE Computer, vol.15, No.1, Jan. 1982, pp47-56"
上述のようなアレイ型プロセッサを実際に使用する場合、そのオブジェクトコードであるコンピュータプログラムをプログラムメモリにデータ格納し、そのプログラムメモリをアレイ型プロセッサにシステムバスなどで接続することになる。そして、アレイ型プロセッサは、外部のプログラムメモリからコンピュータプログラムをデータ取得してデータ保持し、そのデータ保持したコンピュータプログラムに対応して動作する。
しかし、アレイ型プロセッサがコンピュータプログラムをデータ記憶する記憶容量は有限であるが、そのコンピュータプログラムはアレイ型プロセッサの利用者が自由に作成するため、コンピュータプログラムのデータ容量がアレイ型プロセッサの記憶容量を超過する可能性がある。
これを防止するためには、アレイ型プロセッサの記憶容量を充分に確保しておくことが想定できるが、それではアレイ型プロセッサの回路規模が増大して回路サイズと製造コストも増加することになり、コンピュータプログラムが小容量の場合にはアレイ型プロセッサの記憶容量が無駄となる。
本発明は上述のような課題に鑑みてなされたものであり、コンピュータプログラムのデータ容量が記憶容量を超過していても、そのコンピュータプログラムに対応した動作を実行できるアレイ型プロセッサを提供することを目的とする。
本発明のアレイ型プロセッサは、データパス部、状態管理部、コード取得手段、を有しており、データパス部には、複数のプロセッサエレメントと複数のスイッチエレメントとがマトリクス配列されている。複数のプロセッサエレメントは、順次遷移される複数の動作状態ごとにコンピュータプログラムにデータ記述されている命令コードに対応してデータ処理を個々に実行し、複数のスイッチエレメントは、命令コードに対応して複数のプロセッサエレメントの接続関係を個々に切換制御し、状態管理部は、データパス部の動作状態ごとの命令コードからなるコンテキストを命令コードと適宜入力されるイベントデータとに対応して動作状態ごとに順次遷移させる。
ただし、コード取得手段は、コンピュータプログラムをデータ記憶している外部のプログラムメモリから所定個数の連携する一部の動作状態の命令コードを対応する一部のコンテキストの命令コードとともにデータ取得するので、状態管理部は、データ取得された所定個数の動作状態の命令コードのみを一時保持して動作するとともにデータパス部がデータ取得された所定個数のコンテキストの命令コードのみを一時保持して動作する。そして、状態管理部とデータパス部とが一時保持した命令コードでの動作を完了するごとにコード取得手段は継続する動作状態およびコンテキストの命令コードをデータ取得するので、コンピュータプログラムのデータ容量が記憶容量を超過していても、そのコンピュータプログラムに対応した動作が実行される。
なお、本発明で云う各種手段は、その機能を実現するように形成されていれば良く、例えば、所定の機能を発揮する専用のハードウェア、所定の機能がコンピュータプログラムにより付与されたデータ処理装置、コンピュータプログラムによりデータ処理装置に実現された所定の機能、これらの組み合わせ、等として実現することができる。
また、本発明で云う各種手段は、かならずしも個々に独立した存在である必要はなく、複数の手段が1個の部材として形成されていること、ある手段が他の手段の一部であること、ある手段の一部と他の手段の一部とが重複していること、等も可能である。
また、本発明で云うデータ処理装置とは、コンピュータプログラムをデータ読取して対応するデータ処理を実行できるハードウェアであれば良く、例えば、MPUを主体として、これに、ROM、RAM(Random Access Memory)、I/F(Interface)ユニット、等の各種デバイスが接続されたハードウェアなどで良い。
また、本発明で云うイベントデータとは、状態管理部やデータパス部などが各種動作を実行するために各種情報を相互に通達するもので、例えば、データパス部が状態管理部に動作状態を次段に遷移させることを通達する所定コード、状態管理部が初期状態や現在の動作状態や動作遷移の継続不可をコード取得手段に通達する所定コード、コード取得手段が状態管理部に動作開始を通達する所定コード、等からなる。
本発明のアレイ型プロセッサは、コンピュータプログラムのデータ容量が記憶容量を超過していても、そのコンピュータプログラムに対応した動作を実行することができるので、無為に回路規模を増大させることなく各種容量のコンピュータプログラムに対応することができる。
[実施の形態の構成]
本発明の実施の一形態を図面を参照して以下に説明する。本実施の形態のデータ処理システム1000は、図1に示すように、複数のデータ処理装置として1個のアレイ型プロセッサ100と1個のMPU200とを有しており、これらのアレイ型プロセッサ100とMPU200とが外部バス300とデータライン301とで互いに接続されている。
また、データ処理システム1000では、アレイ型プロセッサ100のコンピュータプログラムが格納されているプログラムメモリ302と、MPU200のコンピュータプログラムが格納されているプログラムメモリ303と、が各々専用に設けられており、これらが外部バス300に接続されている。
アレイ型プロセッサ100は、自身のコンピュータプログラムをプログラムメモリ302からデータ読出し、そのコンピュータプログラムに対応してデータ処理を実行する。そのとき、入力される処理データがデータパス部106でデータ処理されて出力され、そのデータ処理に対応してデータパス部106でイベントデータが発行される。
また、MPU200は、I/F回路、プロセッサコア、内部レジスタ、等のハードウェアを有しており(図示せず)、プログラムメモリ303に格納されているコンピュータプログラムに対応して動作することにより、データ入力手段、データ処理手段、データ記憶手段、データ出力手段、等の各種手段が各種機能として論理的に形成されている。
データ入力手段は、コンピュータプログラムに対応してプロセッサコアがI/F回路の入力データを認識する機能に相当し、処理データとイベントデータとが入力される。データ処理手段は、プロセッサコアがデータ処理を実行する機能に相当し、入力される処理データをコンピュータプログラムとイベントデータとに対応してデータ処理する。
データ記憶手段は、プロセッサコアが処理データを内部レジスタに格納する機能に相当し、処理データなどの各種データを一時記憶する。データ出力手段は、プロセッサコアがI/F回路のデータ出力を制御する機能に相当し、処理された処理データとイベントデータとを出力する。
ただし、データ処理システム1000のMPU200は、処理データの少なくとも一部とイベントデータとをアレイ型プロセッサ100から入力し、データ処理の少なくとも一部に対応して新規のイベントデータを発行し、処理データの少なくとも一部と新規に発行されたイベントデータとをアレイ型プロセッサ100に出力する。
アレイ型プロセッサ100は、I/F回路101、プロセッサコア102、仮想認識手段でありアドレス発行回路であるメモリコントローラ103、データ読出回路であるリードマルチプレクサ104、等を有しており、プロセッサコア102は、図1および図3に示すように、状態管理部105とデータパス部106とを有している。
データパス部106は、図2および図3に示すように、複数のプロセッサエレメント107、複数のスイッチエレメント108、データバスの一部である多数のmb(m-bit)バス109、データバスの一部である多数のnb(n-bit)バス110、等を有しており、複数のプロセッサエレメント107と複数のスイッチエレメント108とがマトリクス配列されて多数のm/nbバス109,110によりマトリクス接続されている。
また、図2(b)に示すように、プロセッサエレメント107は、メモリ制御回路111、コンテキスト記憶手段であるインストラクションメモリ112、インストラクションデコーダ113、mbレジスタファイル115、nbレジスタファイル116、mbALU(Arithmetic and Logical Unit)117、nbALU118、内部可変配線(図示せず)、等を各々有しており、スイッチエレメント108は、バスコネクタ121、入力制御回路122、出力制御回路123、等を各々有している。
I/Fユニット101は、図1に示すように、プロトコル制御部131、コード取得手段であるコード取得回路150、メモリアクセス部132、同期制御回路133、を有しており、これらが順番に接続されている。プロトコル制御部131は、外部バス300に接続されており、メモリアクセス部132は、メモリコントローラ103とリードマルチプレクサ104とに接続されており、同期制御回路133は、プロセッサコア102の状態管理部105とデータパス部106とに接続されている。
プロトコル制御部131は、外部バス300と共通のバスプロトコルがデータ設定されており、このバスプロトコルに対応して外部バス300と各種データを通信するとともに、より単純な手法でコード取得回路150を介してメモリアクセス部132と各種データを通信する。
このメモリアクセス部132は、図1に示すように、MPU200から外部バス300を介してプロトコル制御部131に入力される各種データをメモリコントローラ103とデータパス部106と同期制御回路133とに伝送し、これらから伝送される各種データをプロトコル制御部131から外部バス300を介してMPU200に出力する。
同期制御回路133は、MPU200から外部バス300を介してプロトコル制御部131に入力されるイベントデータを一時保持するとともに、状態管理部105から入力されるイベントデータを一時保持する。
図1に示すように、MPU200から同期制御回路133に入力されて一時保持されたイベントデータはデータパス部106を介して状態管理部105に取得され、状態管理部105から同期制御回路133に入力されて一時保持されたイベントデータはMPU200に取得される。
メモリコントローラ103は、I/Fユニット101のメモリアクセス部132から伝送される各種データをプロセッサコア102の状態管理部105とデータパス部106とに伝送し、リードマルチプレクサ104は、状態管理部105やデータパス部106の保持データを読み出してメモリアクセス部132に伝送する。
より詳細には、図3に示すように、状態管理部105は、インストラクションデコーダ138、遷移テーブルメモリ139、状態記憶手段であるインストラクションメモリ140、ステートメモリ141、を有しており、そのインストラクションデコーダ138は命令バス142でメモリコントローラ103に接続されている。
さらに、インストラクションデコーダ138は遷移テーブルメモリ139とインストラクションメモリ140とに接続されており、その遷移テーブルメモリ139はステートメモリ141に接続されている。
また、前述のようにリードマルチプレクサ104は状態管理部105やデータパス部106の保持データを読み出すので、状態管理部105の各種メモリ139〜141がデータバス143で接続されており、データパス部106のプロセッサ/スイッチエレメント107、108がm/nbデータバス109,110で接続されている。
また、プロセッサエレメント107は、図3および図6に示すように、X行Y列(XとYとは“2”以上の自然数)に配列されており、メモリコントローラ103からリードマルチプレクサ104まで並列に接続されたX行の命令バス142が1行ごとにY列のプロセッサエレメント107のメモリ制御回路111に接続されている。
さらに、状態管理部105の1個のインストラクションデコーダ138にはY列のアドレスバス144が接続されており、このアドレスバス144が1列ごとにX行のプロセッサエレメント107のメモリ制御回路111に接続されている。
プログラムメモリ302にデータ格納されているアレイ型プロセッサ100のコンピュータプログラムは、データパス部106にマトリクス配列された複数のプロセッサエレメント107と複数のスイッチエレメント108との命令コードが、順次切り換わるコンテキストとしてデータ記述されており、このコンテキストを動作サイクルごとに切り換える状態管理部105の命令コードが、順次遷移する動作状態としてデータ記述されており、順次遷移される複数の動作状態の相対関係が遷移ルールとしてデータ記述されている。
このため、状態管理部105では、詳細には後述するが、コード取得回路150によりプログラムメモリ302からデータ読出されるコンピュータプログラムがインストラクションデコーダ138でデコードされ、その命令コードがインストラクションメモリ140にデータ格納されるとともに、複数の動作状態の遷移ルールが遷移テーブルメモリ139にデータ格納される。
状態管理部105は、遷移テーブルメモリ139の遷移ルールに対応して動作状態を順次遷移させ、インストラクションメモリ140の命令コードに対応して複数のプロセッサエレメント107と複数のスイッチエレメント108とのインストラクションポインタを各々発生する。
なお、遷移テーブルメモリ139で一時保持されている遷移ルールにより現在の動作状態が判明するので、この現在の動作状態がステートメモリ141に一時保持される。さらに、インストラクションメモリ140には複数の動作状態に対応した複数の命令コードがデータ格納されるので、その複数のアドレスデータもメモリコントローラ103から状態管理部105に伝送される。
また、状態管理部105に命令バス142で伝送される命令コードには、命令コードがデータ格納されるプロセッサエレメント107のアドレスデータもエンコードされてデータ設定されているので、これがインストラクションデコーダ138でデコードされ、Y列のアドレスバス144から選択された1つで一列のプロセッサエレメント107に伝送される。
同時に、プロセッサエレメント107のインストラクションメモリ112に命令コードがデータ格納されるとき、メモリコントローラ103によりX行の命令バス142から1つが選択されて命令コードが伝送される。これで1個のプロセッサエレメント107に命令コードとアドレスデータとが伝送されるので、そのアドレスデータに対応したインストラクションメモリ112の1つのアドレス空間に命令コードがデータ格納される。
図2(b)に示すように、スイッチエレメント108は、隣接するプロセッサエレメント107のインストラクションメモリ112を共用しているので、状態管理部105は、発生したプロセッサエレメント107とスイッチエレメント108との1組のインストラクションポインタを対応するプロセッサエレメント107のインストラクションメモリ112に供給する。
このインストラクションメモリ112は、プログラムメモリ302からデータ読出されるプロセッサエレメント107とスイッチエレメント108との命令コードを一時保持するので、状態管理部105から供給されるインストラクションポインタでプロセッサエレメント107とスイッチエレメント108との命令コードが指定される。インストラクションデコーダ113は、インストラクションポインタで指定された命令コードをデコードし、スイッチエレメント108、内部可変配線、m/nbALU117,118、等の動作を制御する。
mbバス109はmbである“8(bit)”の処理データを伝送し、nbバス110はnbである“1(bit)”の処理データを伝送するので、スイッチエレメント108は、インストラクションデコーダ113の動作制御に対応してm/nbバス109,110による複数のプロセッサエレメント107の接続関係を制御する。
より詳細には、スイッチエレメント108のバスコネクタ121は、mbバス109とnbバス110とが四方から連通しており、このように連通している複数のmbバス109の互いの接続関係と連通する複数のnbバス110の互いの接続関係とを制御する。
このため、アレイ型プロセッサ100は、プログラムメモリ302にデータ設定されたコンピュータプログラムに対応して状態管理部105がデータパス部106のコンテキストを動作サイクルごとに順次切り換え、その段階ごとに複数のプロセッサエレメント107は個々に設定自在なデータ処理で並列動作する。
入力制御回路122は、図2(b)に示すように、mbバス109からmbレジスタファイル115およびmbALU117へのデータ入力の接続関係と、nbバス110からnbレジスタファイル116およびnbALU118へのデータ入力の接続関係とを制御する。
出力制御回路123は、mbレジスタファイル115およびmbALU117からmbバス109へのデータ出力の接続関係と、nbレジスタファイル116およびnbALU118からnbバス110へのデータ出力の接続関係とを制御する。
プロセッサエレメント107の内部可変配線は、インストラクションデコーダ113の動作制御に対応して、プロセッサエレメント107の内部でのmbレジスタファイル115およびmbALU117の接続関係とnbレジスタファイル116およびnbALU118の接続関係とを制御する。
mbレジスタファイル115は、内部可変配線に制御される接続関係に対応して、mbバス109などから入力されるmbの処理データを一時保持してmbALU117などに出力する。nbレジスタファイル116は、内部可変配線に制御される接続関係に対応して、nbバス110などから入力されるnbの処理データを一時保持してnbALU118などに出力する。
mbALU117は、インストラクションデコーダ113の動作制御に対応したデータ処理をmbの処理データで実行し、nbALU118は、インストラクションデコーダ113の動作制御に対応したデータ処理をnbの処理データで実行するので、処理データのビット数に対応してm/nbのデータ処理が適宜実行される。
このデータパス部106での処理結果は必要により状態管理部105にイベントデータとしてフィードバックされるので、この状態管理部105は入力されたイベントデータにより動作状態を次段の動作状態に遷移させるとともにデータパス部106のコンテキストを次段のコンテキストに切り換える。
本形態のアレイ型プロセッサ100は、基本的に上述のようにプログラムメモリ302から命令コードをデータ読出して状態管理部105とデータパス部106とに一時保持させることで、その状態管理部105とデータパス部106とが命令コードに対応して動作する。
しかし、状態管理部105とデータパス部106とは命令コードを所定個数ずつしか一時保持できないので、プログラムメモリ302にコンピュータプログラムとしてデータ格納されている一連の命令コードを状態管理部105とデータパス部106とが全部は一時保持できないこともある。
このような場合、I/Fユニット101のコード取得回路150が、プログラムメモリ302から所定個数の連携する一部の動作状態の命令コードを対応する一部のコンテキストの命令コードとともにデータ取得するので、状態管理部105は、データ取得された所定個数の動作状態の命令コードのみを一時保持して動作し、データパス部106は、データ取得された所定個数のコンテキストの命令コードのみを一時保持して動作する。
そして、状態管理部105とデータパス部106とが一時保持した命令コードでの動作を完了するごとにコード取得回路150は継続する動作状態およびコンテキストの命令コードをデータ取得するので、アレイ型プロセッサ100はコンピュータプログラムを一部しか保持できなくとも一連の動作を実行することができる。
より具体的には、コード取得回路150は、例えば、ASIC(Application Specific Integrated Circuit)からなり、図4に示すように、イベント入力手段であるイベント入力回路151、状態取得手段である状態取得回路152、動作取得手段である動作取得回路153、コンテキスト検出手段であるコンテキスト検出回路154、コンテキスト取得手段であるコンテキスト取得回路156、コード設定手段であるコード設定回路157、イベント出力手段であるイベント出力回路158、関係生成手段である関係生成回路159、関係設定手段である関係設定回路161、重複検出手段である重複検出回路162、更新制御手段である更新制御回路163、等をハードウェアとして有している。
状態管理部105は、命令コードを一時保持していない初期状態か、所定個数だけ一時保持した命令コードでの動作完了か、を検出すると継続不可のイベントデータをコード取得回路150に出力する。このコード取得回路150のイベント入力回路151は、例えば、I/O(Input/Output)ポートなどに相当し、状態管理部105から入力される継続不可のイベントデータを受け付ける。
状態取得回路152は、イベント入力回路151に継続不可のイベントデータが入力されると状態管理部105のステートメモリ141から現在の動作状態をデータ取得するとともに、データパス部106から次段の動作状態を指定するイベントデータを取得する。動作取得回路153は、状態取得回路152でデータ取得された動作状態とイベントデータとに対応して継続する所定個数の動作状態の命令コードを所定のアルゴリズムによりプログラムメモリ302からデータ取得する。
つまり、本形態のアレイ型プロセッサ100は、前述のように状態管理部105が動作状態を次段に遷移させるとともに、データパス部106のコンテキストを次段に遷移させることで動作するが、その場合、データパス部106は、データ設定されたコンテキストでデータ処理を実行すると、次段のコンテキストに移行するために次段の動作状態を指定するイベントデータを状態管理部105に出力する。
そこで、この状態管理部105は入力されたイベントデータに対応して自身の動作状態を次段に遷移させるとともに、データパス部106のコンテキストを次段に遷移させる。このため、アレイ型プロセッサ100が動作を停止したとき、その状態管理部105の現在の動作状態とデータパス部106のイベントデータとが取得されると、次段の動作状態が判明することになる。
例えば、図5(a)に示すように、アレイ型プロセッサ100のコンピュータプログラムが8つの状態およびコンテキスト“0〜7”の命令コードからなり、状態管理部105とデータパス部106とのインストラクションメモリ141,112は4つの命令コードのみ一時保持できるとする。
そして、アレイ型プロセッサ100の電源が投入された直後の初期状態では、当然ながら状態管理部105のステートメモリ141には現在の動作状態がデータ保持されていないので、状態取得回路152は動作状態がデータ保持されていないことをデータ検出する。
すると、動作取得回路153は、自動的に“0”から継続する4つの命令コードをプログラムメモリ302からデータ取得する。この場合、図示するように、4つの命令コードを“0→1→(2,3)”なるパターンでデータ取得する他、“0→1→2→4”“0→1→2→5”“0→1→3→5”なるパターンでもデータ取得が可能であるが、例えば、動作取得回路153は、公知の幅優先探索法などのアルゴリズムにより適正なパターンで命令コードをデータ取得する。
コンテキスト検出回路154は、動作取得回路153でデータ取得された命令コードの動作状態に対応する所定個数のコンテキストをデータ検出し、コンテキスト取得回路156は、コンテキスト検出回路154でデータ検出されたコンテキストの命令コードをプログラムメモリ302からデータ取得する。
コード設定回路157は、動作取得回路153とコンテキスト取得回路156とでデータ取得された動作状態とコンテキストとの命令コードを状態管理部105とデータパス部106とにデータ設定し、イベント出力回路158は、コード設定回路157による命令コードのデータ設定が完了すると動作開始のイベントデータを状態管理部105に出力する。
関係生成回路159は、コンテキスト検出回路154でデータ検出されたコンテキストと動作状態との対応関係をデータ生成し、関係設定回路161は、関係生成回路159でデータ生成された対応関係も状態管理部105にデータ設定する。つまり、プロセッサエレメント107のインストラクションメモリ112では複数のコンテキストごとに命令コードが一時保持されるが、その命令コードとメモリアドレスとの関係は任意である。
一方、状態管理部105はインストラクションメモリ112のメモリアドレスでコンテキストの命令コードを指定するので、この指定に必要なコンテキストと動作状態との対応関係が関係生成回路159でデータ生成されて関係設定回路161により状態管理部105にデータ設定される。
そこで、この状態管理部105は、動作開始のイベントデータが入力されると、データ格納された命令コードと遷移ルールとに対応して動作状態の順次遷移を開始し、データ設定された対応関係に対応して順次遷移させる動作状態ごとにデータパス部106のコンテキストを順次遷移させる。
また、重複検出回路162は、コンテキスト検出回路154でデータ検出された前回の複数のコンテキストと今回の複数のコンテキストとの重複を検出し、更新制御回路163は、重複検出回路162で重複が検出されたコンテキストの命令コードのコンテキスト取得回路156によるプログラムメモリ302からのデータ取得とコード設定回路157によるデータパス部106へのデータ設定とを無用とする。
例えば、図5(b)に示すように、前回が“0→1→(2,3)”なる4つのコンテキストからなり、図5(c)に示すように、今回が“4→7→1→3”なる4つのコンテキストからなる場合、これらでは“1,3”なる2つのコンテキストが重複している。そこで、このようなコンテキストの重複を重複検出回路162が検出すると、そのデータ取得とデータ設定とが実行されないように更新制御回路163がコンテキスト取得回路156とコード設定回路157とを動作制御する。
なお、図4では図示を簡単とするため、コード取得回路150に状態管理部105とデータパス部106とプログラムメモリ302とが直接に接続されている構造を例示しているが、図1に示すように、実際にはコード取得回路150はメモリアクセス部132を介して状態管理部105とデータパス部106とに接続されているとともにプロトコル制御部131を介してプログラムメモリ302に接続されている。このため、上述のようなコード取得回路150と各部とのデータ通信も、実際にはメモリアクセス部132やプロトコル制御部131などを介して実行される。
[実施の形態の動作]
上述のような構成において、本実施の形態のデータ処理システム1000では、MPU200がメインプロセッサとして機能するとともにアレイ型プロセッサ100がコプロセッサとして機能することにより、そのアレイ型プロセッサ100とMPU200とのデータ処理が連動する。
その場合、アレイ型プロセッサ100およびMPU200は、プログラムメモリ302,303から自身のコンピュータプログラムをデータ読出して対応する処理動作を実行することにより、データライン301から入力される処理データでデータ処理を実行し、データ処理を実行した処理データをデータライン301に出力する。
アレイ型プロセッサ100のコンピュータプログラムは、複数のプロセッサエレメント107と複数のスイッチエレメント108との命令コードが順次切り換わるコンテキストとしてデータ記述されており、このコンテキストを動作サイクルごとに切り換える状態管理部105の命令コードが順次遷移する動作状態としてデータ記述されている。
このようなコンピュータプログラムに対応して動作するアレイ型プロセッサ100では、状態管理部105が動作状態を順次遷移させるとともに、データパス部106のコンテキストを動作サイクルごとに順次遷移させる。このため、その動作サイクルごとに複数のプロセッサエレメント107が個々に設定自在なデータ処理で並列動作し、その複数のプロセッサエレメント107の接続関係を複数のスイッチエレメント108が切換制御する。
このとき、データパス部106での処理結果は必要により状態管理部105にイベントデータとしてフィードバックされるので、この状態管理部105は入力されたイベントデータにより動作状態を次段の動作状態に遷移させるとともにデータパス部106のコンテキストを次段のコンテキストに切り換える。
本形態のアレイ型プロセッサ100は、上述のようにプログラムメモリ302から命令コードをデータ読出して状態管理部105とデータパス部106とに一時保持させることで、その状態管理部105とデータパス部106とが命令コードに対応して動作する。
しかし、本形態のアレイ型プロセッサ100では、状態管理部105とデータパス部106とが命令コードを所定個数ずつしか一時保持しないので、プログラムメモリ302にコンピュータプログラムとしてデータ格納されている一連の命令コードを全部は一時保持できないこともある。
このような場合、I/Fユニット101のコード取得回路150が、プログラムメモリ302から所定個数の連携する一部の動作状態の命令コードを対応する一部のコンテキストの命令コードとともにデータ取得するので、状態管理部105は、データ取得された所定個数の動作状態の命令コードのみを一時保持して動作し、データパス部106は、データ取得された所定個数のコンテキストの命令コードのみを一時保持して動作する。
そして、状態管理部105とデータパス部106とが一時保持した命令コードでの動作を完了するごとにコード取得回路150は継続する動作状態およびコンテキストの命令コードをデータ取得するので、アレイ型プロセッサ100はコンピュータプログラムを一部しか保持できなくとも一連の動作を実行する。
より詳細には、本形態のアレイ型プロセッサ100が起動されると、当然ながら状態管理部105の各種メモリ139〜141には保持データが存在しないので、状態管理部105は命令コードを一時保持していない初期状態を検出して継続不可のイベントデータをI/F回路101のコード取得回路150に出力する。
すると、図4に示すように、このコード取得回路150はイベント入力回路151で継続不可のイベントデータを受け付け、この入力に対応して状態取得回路152で状態管理部105のステートメモリ141から現在の動作状態をデータ取得する。前述のようにアレイ型プロセッサ100の起動直後の初期状態では、状態管理部105のステートメモリ141にも動作状態がデータ保持されていないので、これにより状態取得回路152は状態管理部105が初期状態であることを検出する。
すると、この検出された初期状態と入力されたイベントデータとに対応して動作取得回路153が継続する所定個数の動作状態の命令コードをプログラムメモリ302からデータ取得するので、初期状態の場合には第1番目の動作状態を起点とする所定個数の命令コードがデータ取得される。
つぎに、このデータ取得された命令コードの動作状態に対応する所定個数のコンテキストがコンテキスト検出回路154でデータ検出され、このデータ検出されたコンテキストの命令コードがコンテキスト取得回路156でプログラムメモリ302からデータ取得される。
例えば、図5(a)に示すように、アレイ型プロセッサ100のコンピュータプログラムが8つの状態およびコンテキスト“0〜7”の命令コードからなり、状態管理部105とデータパス部106とのインストラクションメモリ141,112が4つの命令コードのみ一時保持する場合、図5(b)に示すように、初期状態の場合には4つの命令コードが“0→1→(2,3)”などのパターンでデータ取得される。
そして、上述のように動作状態とコンテキストとの命令コードがデータ取得されると、これがコード設定回路157により状態管理部105とデータパス部106とにデータ設定される。また、データ検出されたコンテキストと動作状態との対応関係が関係生成回路159でデータ生成されるので、このデータ生成された対応関係も関係設定回路161により状態管理部105にデータ設定される。
そして、上述のような命令コードと対応関係とのデータ設定が完了すると、動作開始のイベントデータがイベント出力回路158により状態管理部105に出力されるので、この状態管理部105は、データ格納された命令コードと遷移ルールとに対応して動作状態の順次遷移を開始し、データ設定された対応関係に対応して順次遷移させる動作状態ごとにデータパス部106のコンテキストを順次遷移させる。なお、状態管理部105は、上述のように動作状態を順次遷移させるとき、その現在の動作状態をステートメモリ141でデータ保持する。
上述のようにアレイ型プロセッサ100が動作するとき、前述のように状態管理部105とデータパス部106とにはコンピュータプログラムの多数の命令コードが所定個数しかデータ保持されていないと、その命令コードに対応した動作を継続できない状態となることがある。
その場合も、状態管理部105は、継続不可のイベントデータをコード取得回路150に出力するので、このコード取得回路150は継続不可のイベントデータが入力されると、状態管理部105のステートメモリ141から現在の動作状態をデータ取得するとともに、データパス部106から次段の動作状態を指定するイベントデータを取得する。
前述のように、状態管理部105の次段の動作状態はデータパス部106のイベントデータにより指定されるので、コード取得回路150は、このイベントデータと状態管理部105の現在の動作状態から次段の動作状態を特定し、この動作状態を起点とする所定個数の命令コードをプログラムメモリ302からデータ取得する。
例えば、図5(a)に示すように、コンピュータプログラムの8つの命令コード“0〜7”のうち、図5(b)に示すように、4つの命令コード“0→1→(2,3)”でアレイ型プロセッサ100が動作し、命令コード“2”から命令コード“4”に移行する時点で停止した場合、現在の動作状態は“2”となり、これから動作状態“4”に移行することがイベントデータにより指定されるので、コード取得回路150は、“4”を起点として4つの命令コードをデータ取得する。
ただし、このコード取得回路150は、上述のように継続する命令コードをデータ取得するとき、前回と複数のコンテキストと今回の複数のコンテキストとの重複を検出し、重複が検出されたコンテキストの命令コードのデータ取得とデータパス部106へのデータ設定とを無用とする。
例えば、図5(b)に示すように、前回が“0→1→(2,3)”なる4つのコンテキストからなり、図5(c)に示すように、今回が“4→7→1→3”なる4つのコンテキストからなる場合、これらでは“1,3”なる2つのコンテキストが重複している。そこで、このようなコンテキストの重複が検出されると、今回は“4,7”なるコンテキストのみデータ取得される。
そして、コード取得回路150は、上述のように動作状態とコンテキストとの命令コードをデータ取得すると、その命令コードを状態管理部105とデータパス部106とにデータ設定する。ただし、前述のように重複を検出した命令コードのデータ設定は省略され、新規の命令コードは前回の無用な命令コードの位置に上書きされる。
例えば、図5(b)(c)に示すように、前回の“0→1→(2,3)”なる4つのコンテキストを今回の“4→7→1→3”なる4つのコンテキストに更新する場合、その“0,2”なるコンテキストに“4,7”なるコンテキストが上書きされる。
また、コード取得回路150は、データ検出したコンテキストと動作状態との対応関係もデータ生成して状態管理部105にデータ設定し、上述のような命令コードと対応関係とのデータ設定が完了すると、動作開始のイベントデータを状態管理部105に出力する。
そこで、この状態管理部105は、データ格納された命令コードと遷移ルールとに対応して動作状態の順次遷移を開始し、データ設定された対応関係に対応して順次遷移させる動作状態ごとにデータパス部106のコンテキストを順次遷移させる。本形態のアレイ型プロセッサ100では、データ設定された命令コードでの状態管理部105とデータパス部106との動作が停止するごとに、上述のようなコード取得回路150の動作が繰り返される。
[本実施の形態の効果]
本形態のアレイ型プロセッサ100は、データ設定された命令コードでの状態管理部105とデータパス部106との動作が停止するごとに上述のようなコード取得回路150の動作が繰り返されるので、状態管理部105とデータパス部106とがコンピュータプログラムの多数の命令コードを一部しかデータ保持できなくとも、そのコンピュータプログラムに対応した一連の処理動作を実行することができる。
しかも、コード取得回路150が所定個数の動作状態およびコンテキストの命令コードのみ更新するとき、前回の複数のコンテキストと今回の複数のコンテキストとの重複が検出され、重複が検出されたコンテキストの命令コードのプログラムメモリ302からのデータ取得とデータパス部106へのデータ設定とが無用とされる。このため、命令コードのデータ更新の処理負担と所要時間を削減することができ、アレイ型プロセッサ100の消費電力を低減するとともに処理速度を向上させることができる。
さらに、本形態のアレイ型プロセッサ100は、上述のようにプログラムメモリ302から一連の多数の命令コードを一部ずつデータ取得して状態管理部105とデータパス部106とにデータ設定する処理動作を実現するコード取得回路150がハードウェアとして内蔵されているので、上記動作を単独で高速に実行することができる。
[本実施の形態の変形例]
本発明は上述の実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で各種の変形が可能である。例えば、上記形態ではアレイ型プロセッサ100とMPU200とプログラムメモリ302,303とが外部バス300で接続されているデータ処理システム1000を例示したが、アレイ型プロセッサ100とプログラムメモリ302のみからなるデータ処理システム(図示せず)なども実施可能である。
また、上記形態ではコード取得回路150がプロトコル制御部131とメモリアクセス部132との中間に位置することを例示したが、このコード取得回路150は機能が実現される範囲で各種の位置に配置することが可能である。さらに、上記形態ではコード取得回路150に各種手段が各種回路151〜163としてハードウェアで形成されていることを例示したが、例えば、その一部ないし全部がマイクロプロセッサとソフトウェアとの組み合わせでコード取得回路150に形成されていることも可能である。
同様に、コード取得回路150の各種回路151〜163の一部ないし全部が、ソフトウェアによりMPU200に実現されていることも可能である。このようにコード取得回路150の機能がMPU200で実現される場合、速度の観点では不利となるが、プログラムメモリ303にデータ格納するMPU200のコンピュータプログラムによりコード取得回路150の機能が実現されるので、アレイ型プロセッサ100の構造を変更する必要がなく、その実現が容易である。
例えば、コード取得回路150の全部の機能をMPU200により実現する場合、そのコンピュータプログラムは、アレイ型プロセッサ100の状態管理部105から入力される継続不可のイベントデータを受け付けること、継続不可のイベントデータが入力されると状態管理部105から現在の動作状態をデータ取得するとともに、データパス部106から次段の動作状態を指定するイベントデータを取得すること、データ取得された動作状態とイベントデータとに対応して継続する所定個数の動作状態の命令コードを所定のアルゴリズムによりプログラムメモリ302からデータ取得すること、データ取得された命令コードの動作状態に対応する所定個数のコンテキストをデータ検出すること、データ検出されたコンテキストの命令コードをプログラムメモリ302からデータ取得すること、データ取得された動作状態とコンテキストとの命令コードを状態管理部105とデータパス部106とにデータ設定すること、データ検出された前回の複数のコンテキストと今回の複数のコンテキストとの重複を検出すること、重複が検出されたコンテキストの命令コードのデータ取得とデータ設定とを無用とすること、データ検出されたコンテキストと動作状態との対応関係をデータ生成すること、データ生成された対応関係も状態管理部105にデータ設定すること、命令コードと対応関係とのデータ設定が完了すると動作開始のイベントデータを状態管理部105に出力すること、等をMPU200に実行させるコンピュータプログラムとしてプログラムメモリ303にデータ格納される。
さらに、コード取得回路150の各種回路151〜163の一部ないし全部の機能を、アレイ型プロセッサ100に外部バス300などで接続されるASICなどの専用回路により実現することも可能であり(図示せず)、このような専用回路をアレイ型プロセッサ100のプログラムメモリ302と一体に形成しておくことも可能である(図示せず)。
また、上記形態ではコード取得回路150が状態管理部105とデータパス部106との命令コードをデータ更新するとき、前回と今回とで重複するコンテキストの命令コードはデータ取得とデータ設定とが省略されることを例示した。しかし、このような重複の検出と処理動作の省略とを実行することなく、毎回全部の命令コードをデータ更新することも可能である。
この場合、命令コードのデータ更新の処理負担と所要時間を削減することはできないが、命令コードの重複の検出と動作省略の制御とが無用となるので、重複検出回路162と更新制御回路163との形成が無用となり、その処理負担と所要時間とを削減することができる。
換言すると、所定個数ずつデータ更新する命令コードに多数の重複が発生することが予測される場合には、重複検出回路162と更新制御回路163とを形成しておくことが好適であり、所定個数ずつデータ更新する命令コードにほとんど重複が発生しないことが予測される場合には、重複検出回路162と更新制御回路163とを形成しておかないことが好適である。
また、上記形態ではコンテキストのデータ更新の処理負担を軽減して所要時間を削減するため、コード取得回路150に重複検出回路162と更新制御回路163とを形成し、今回と前回とのコンテキストの重複のみ検出して命令コードのデータ取得とデータ設定とを省略することを例示した。
しかし、コード取得回路150に、コンテキストの複数種類の更新手法が更新コストとともにデータ登録されている更新記憶手段と、前回の複数のコンテキストと今回の複数のコンテキストとの組み合わせから更新コストの合計が最少となる更新手法をデータ検出する手法検出手段とを形成し(図示せず)、更新制御回路163の動作制御によりコード設定回路157にデータ検出された更新手法でデータパス部106のコンテキストのデータ更新を実行させることも可能である。
上述のような更新記憶手段は、例えば、複数種類の更新手法がコンピュータプログラムとしてデータ格納されたメモリ回路で形成することができ、手法検出手段は、例えば、実装されているコンピュータプログラムに対応してメモリ回路から所定のコンピュータプログラムをデータ読出して処理動作を実行するマイクロプロセッサで形成することができる(ともに図示せず)。
また、第1の更新手法としては、例えば、前回と今回とのコンテキストで相違する命令コードのみコンテキスト取得回路156にデータ取得させ、今回の命令コードを前回との差分のみコード設定回路157にデータ設定させることが可能である。さらに、このような更新手法において、前回と今回とのコンテキストで相違する命令コードが複数の場合、差分の更新コストの合計が最少となる組み合わせを選択することも可能である。
また、第2の更新手法としては、前回と今回とのコンテキストの所定の組み合わせでは、データパス部106の前回のコンテキストを初期化してから今回のコンテキストをコード設定回路157にデータ設定させることが可能である。
さらに、第3の更新手法としては、前回と今回との複数のコンテキストの所定の組み合わせでは対応する前回のコンテキストを前回の他のコンテキストで上書きしてから今回のコンテキストと相違する命令コードのみコンテキスト取得回路156にデータ取得させてコード設定回路157にデータ設定させることも可能である。
より具体的には、図5(b)に示すように、前回が“0→1→(2,3)”なる4つのコンテキストからなり、図5(c)に示すように、今回が“4→7→1→3”なる4つのコンテキストからなる場合、重複している“1,3”なる2つのコンテキストはデータ更新されず、“0,2”なるコンテキストが“4,7”なるコンテキストにデータ更新されることになる。
しかし、コンテキストはX行Y列のプロセッサエレメント107の命令コードからなるので、例えば、“0”なるコンテキストと“4”なるコンテキストでは大部分のプロセッサエレメント107で命令コードが共通していることもある。このような場合、第1の更新手法として、“0”なるコンテキストを“4”なるコンテキストにデータ更新するため、差分の命令コードのみデータ取得してデータ格納すれば、その処理負担を軽減して動作速度を向上させることが可能である。
さらに、上述のように“0,2”なるコンテキストが“4,7”なるコンテキストに差分の命令コードのみデータ更新される場合、“0→4,2→7”と“0→7,2→4”との更新コストの合計を比較して最少の一方を選択すれば、さらに処理負担を軽減して動作速度を向上させることが可能である。
また、前述のように“0”なるコンテキストを“4”なるコンテキストにデータ更新するとき、“0”なるコンテキストではX行Y列のプロセッサエレメント107の全部に命令コードがデータ設定されるが、“4”なるコンテキストではX行Y列のプロセッサエレメント107の一部しか命令コードがデータ設定されないこともある。
しかし、このような場合には、今回の“4”なるコンテキストで命令コードをデータ設定しないプロセッサエレメント107に前回の命令コードが残存するため、これを初期化する必要がある。命令コードの初期化は命令コードのデータ格納と同様に、X行Y列のプロセッサエレメント107を1個ずつ順番に選択して実行するため、その更新コストは命令コードのデータ格納と同一である。
そこで、X行Y列のプロセッサエレメント107の全部の命令コードを一括に初期化できるように形成しておけば、第2の更新手法として“0”なるコンテキストを初期化してから“4”なるコンテキストを新規にデータ格納することで、更新コストを低減することが可能となる。
さらに、“0→1→(2,3)”の“0”なるコンテキストを“4→7→1→3”の“4”なるコンテキストにデータ更新する場合、例えば、“0”と“4”とでは大部分の命令コードが相違しており、データ更新しない“1”とデータ更新する“4”とで大部分の命令コードが共通していることもある。
このような場合、“0→1→(2,3)”の“1”なるコンテキストで“0”なるコンテキストを一括に上書きしてから、その“1”なるコンテキストを“4”なるコンテキストに差分の命令コードのみデータ更新すれば、その処理負担を軽減して動作速度を向上させることが可能である。
なお、既存のアレイ型プロセッサ100では、上述のように保持しているコンテキストを他のコンテキストに一括に上書きする機能はない。また、命令コードの初期化は命令コードのデータ格納と同様に、X行Y列のプロセッサエレメント107を1個ずつ順番に選択して実行するため、上述のようにコンテキストをデータ更新する過程で全部のプロセッサエレメント107を初期化しても更新コストは増加することになる。
このため、上述のような更新手法で更新コストを低減するためには、X行Y列のプロセッサエレメント107の命令コードを一括に初期化する機能や、保持しているコンテキストを他のコンテキストに一括に上書きする機能が必要である。そこで、このようなコンテキストの初期化や上書きを簡単に迅速に実行するハードウェアの構造を以下に具体的に説明する。
まず、図6に示すように、プロセッサエレメント107のインストラクションメモリ112を、コンテキストごとの命令コードを一層ごとにデータ保持するZ(Zは“2”以上の自然数)層の多段構造に形成しておき、そのZ層のアドレスデータ“z”も状態管理部105のインストラクションデコーダ138でデコードされる命令コードに設定しておく。
さらに、X行Y列のプロセッサエレメント107を1個ずつ選択するアドレスデータ“x,y”を無効としてX行Y列のプロセッサエレメント107の全部を同時に選択するセット信号“set”、データパス部106に命令コードとして一時保持されているZ個のコンテキストから1つを選択するセレクト信号“sel”、も発行するように状態管理部105を形成しておく。
そして、図7に示すように、コード初期化手段およびコード上書手段となる一括設定回路170をプロセッサエレメント107ごとに形成しておき、その一括設定回路170をインストラクションメモリ112の各層に接続しておく。
この一括設定回路170は、アンドゲート171,172、オアゲート173、セレクタ回路174〜176、等で形成された論理回路からなり、従来と同様に外部入力されるコンテキストごとの命令コード“data”をインストラクションメモリ112の一層にデータ格納する他、インストラクションメモリ112に一時保持されている命令コードをコンテキストごとに初期化すること、インストラクションメモリ112に一時保持されている任意のコンテキストの命令コードを任意のコンテキストの命令コードに一括に上書きすること、も実行する。
つまり、アンドゲート171は、X行Y列のプロセッサエレメント107を1個ずつ選択するアドレスデータ“x,y”が入力されており、Z個のアンドゲート172は、アンドゲート171の出力信号とインストラクションメモリ112の各層のアドレスデータ“z”とが入力されている。
このアンドゲート172の出力信号はインストラクションメモリ112の各層に入力されているので、X行Y列のプロセッサエレメント107から1個がアドレスデータ“x,y”により選択され、そのプロセッサエレメント107のインストラクションメモリ112のZ層から一層がアドレスデータ“z”により選択される。
ただし、アンドゲート171の出力信号は前述のセット信号“set”とともにオアゲート173に入力されているので、セット信号“set”が発行された場合にはアドレスデータ“x,y”は無効となって全部のプロセッサエレメント107でアドレスデータ“z”に対応したインストラクションメモリ112の一層が選択される。
また、Z個のセレクタ回路174は、一方の入力端子にインストラクションメモリ112の各層が個々に接続されており、他方の入力端子には接地などにより初期値“def”が入力されている。セレクタ回路174は、前述のアドレスデータ“z”が制御信号として外部入力されるので、通常は自身に接続されているインストラクションメモリ112の一層の命令コードをデータ出力するが、自身に接続されているインストラクションメモリ112の一層のアドレスデータ“z”が外部入力されると、初期値“def”をデータ出力する。
これらZ個のセレクタ回路174の出力信号はセレクタ回路175に入力されており、このセレクタ回路175にはセレクト信号“sel”が外部入力されている。このセレクタ回路175は、外部入力されるセレクト信号“sel”によりインストラクションメモリ112のZ層から一層を選択する。
このセレクタ回路175の出力信号は命令コード“data”とともにセレクタ回路176に入力されており、このセレクタ回路176には前述のセット信号“set”が外部入力されている。このセレクタ回路176は、セット信号“set”により外部入力される命令コード“data”かセレクタ回路175からデータ出力される命令コードかを選択するので、その選択された命令コードが前述のように選択されたインストラクションメモリ112の一層にデータ格納される。
例えば、全部のプロセッサエレメント107で複数のコンテキストの1つを一括に初期化する場合は、セット信号“set”により全部のプロセッサエレメント107が選択された状態で、アドレスデータ“z”によりインストラクションメモリ112の一層が選択される。
すると、そのアドレスデータ“z”によりセレクタ回路174は初期値“def”をデータ出力するので、上述のインストラクションメモリ112の一層がセレクト信号“sel”により選択されると、セレクタ回路175は初期値“def”を選択することになる。
この初期値“def”はセット信号“set”によりセレクタ回路176でも選択され、上述の選択されたインストラクションメモリ112の一層にデータ格納されるので、これで全部のプロセッサエレメント107で特定のコンテキストの命令コードが一括に初期化されることになる。
また、前回の所定のコンテキストで前回の他のコンテキストを一括に上書きする場合は、セット信号“set”により全部のプロセッサエレメント107が選択された状態で、上書きされるインストラクションメモリ112の一層がアドレスデータ“z”により選択される。
このような状態で上書きするインストラクションメモリ112の一層がセレクト信号“sel”により選択されるので、これで選択されたコンテキストの命令コードがセット信号“set”によりセレクタ回路176でも選択される。この選択された命令コードがアドレスデータ“z”により選択されているインストラクションメモリ112の一層にデータ格納されるので、これで全部のプロセッサエレメント107で前回の所定のコンテキストで前回の他のコンテキストが一括に上書きされることになる。
なお、上述のような一括設定回路170において、セット信号“set”によりセレクタ回路175が選択されたときには外部入力される命令コード“data”は無効となるので、この命令コード“data”をセレクタ回路175の制御信号として専用のセレクト信号“sel”の発行を無用とすることも可能である。
また、上記形態ではプログラムメモリ302にアレイ型プロセッサ100のコンピュータプログラムが1つのみデータ格納されており、アレイ型プロセッサ100がプログラムメモリ302から1つのコンピュータプログラムのみをデータ取得して1つの処理動作のみを実行することを例示した。
しかし、プログラムメモリ302にアレイ型プロセッサ100の複数のコンピュータプログラムがデータ格納されており、アレイ型プロセッサ100がプログラムメモリ302から複数のコンピュータプログラムを時分割にデータ取得して複数の処理動作を時分割に並列実行することも可能である。
その場合、複数のコンピュータプログラムの対応する動作状態とコンテキストとの命令コードを状態管理部105とデータパス部106とのインストラクションメモリ140,112とに一時保持させ、一時保持された複数のコンピュータプログラムの1つで状態管理部105とデータパス部106とが動作しているときに、コード取得回路150に他のコンピュータプログラムの所定個数の連携する一部の動作状態の命令コードを対応する一部のコンテキストの命令コードとともにデータ取得させる。
例えば、“A”なるコンピュータプログラムが“a1〜a4”なるコンテキストおよび動作状態からなり、“B”なるコンピュータプログラムが“b1〜b4”なるコンテキストおよび動作状態からなり、状態管理部105とデータパス部106とのインストラクションメモリ140,112とが動作状態およびコンテキストを4つずつ一時保持するならば、最初にインストラクションメモリ140,112に“a1,a2”を一時保持させて状態管理部105とデータパス部106とに処理動作を実行させる。
この“a1,a2”の実行中にインストラクションメモリ140,112の空き領域に“b1,b2”を一時保持させ、“a1,a2”の実行が完了すると“b1,b2”の実行を開始する。この“b1,b2”の実行中にインストラクションメモリ140,112の“a1,a2”を“a3,a4”にデータ更新し、“b1,b2”の実行が完了すると“a3,a4”の実行を開始する。
この“a3,a4”の実行中にインストラクションメモリ140,112の“b1,b2”を“b3,b4”にデータ更新し、“a3,a4”の実行が完了すると“b3,b4”の実行を開始する。このようにすることで、アレイ型プロセッサ100が複数のコンピュータプログラムでの処理動作を時分割に連続的に実行できるので、複数のコンピュータプログラムの処理動作を全体的に高効率に実行することができる。
なお、上述のような複数のコンピュータプログラムでの並列動作を実現する場合、より具体的には、コード取得回路150に、動作停止手段である動作停止回路、停止取得手段である停止取得回路、停止保持手段である停止保持回路、切換設定手段である切換設定回路、を形成しておく(図示せず)。
動作停止回路は、イベント入力回路151にプログラム切換のイベントデータが入力されると状態管理部105とデータパス部106との動作を停止させ、停止取得回路は、停止した状態管理部105の動作状態とデータパス部106の処理データとをデータ取得する。
停止保持回路は、データ取得された動作状態と処理データとを複数のコンピュータプログラムごとに一時保持し、切換設定回路は、一時保持が完了すると他のコンピュータプログラムの動作状態と処理データとを停止保持回路からデータ読出して状態管理部105とデータパス部106とにデータ設定する。
そして、イベント出力回路158はデータ設定が完了すると動作開始のイベントデータを状態管理部105に出力し、この状態管理部105は動作開始のイベントデータが入力されると動作状態の順次遷移を開始する。なお、上述のようなプログラム切換のイベントデータは、例えば、前述の継続不可のイベントデータと兼用することが可能である。
上述のような各種回路をコード取得回路150に形成しておくことで、アレイ型プロセッサ100は、複数のコンピュータプログラムでの処理動作を時分割に並列実行することができる。なお、当然ながら、上述のような各種回路の一部ないし全部をマイクロプロセッサとコンピュータプログラムとの組み合わせで実現することも可能であり、外部のMPU200や専用回路で実現することも可能である。
さらに、上述のように複数のコンピュータプログラムでの処理動作を時分割に並列実行する場合、その複数のコンピュータプログラムに優先度を設定することも可能である。より具体的には、上述のような場合、コード取得回路150に、優先検出手段である優先検出回路、コード増減手段であるコード増減回路、を形成しておく(図示せず)。
優先検出回路は、インストラクションメモリ140とインストラクションメモリ112とで一時保持されている複数のコンピュータプログラムの一部の命令コードごとに使用頻度を優先度として積算することにより、インストラクションメモリ140とインストラクションメモリ112とで命令コードが一部のみ一時保持されている複数のコンピュータプログラムの優先度を検出する。
コード増減回路は、例えば、使用頻度が低い命令コードを優先的に削減させるように、ンストラクションメモリ140とインストラクションメモリ112とで一部のみ一時保持される命令コードの個数を優先度に対応して複数のコンピュータプログラムで相互に増減させる。
例えば、前述のようにコンピュータプログラム“A”と“B”とがあり、状態管理部105とデータパス部106とのインストラクションメモリ140,112とが動作状態およびコンテキストを4つずつ一時保持する場合、インストラクションメモリ140,112が優先度に対応してコンピュータプログラム“A”のコンテキストおよび動作状態を3つ一時保持するとともに“B”のコンテキストおよび動作状態は1つのみ一時保持するようなことが可能である。このようにすることで、アレイ型プロセッサ100での複数のコンピュータプログラムの並列実行の効率を、さらに向上させることが可能となる。
本発明の実施の形態のデータ処理システムの回路構造を示すブロック図である。 アレイ型プロセッサのm/nbバスなどの回路構造を示すブロック図である。 命令バスなどの回路構造を示すブロック図である。 コード取得手段であるコード取得回路の回路構造を示すブロック図である。 コンピュータプログラムの論理構造を示す模式図である。 変形例のアレイ型プロセッサの要部を示す模式図である。 プロセッサエレメントの内部回路を示すブロック図である。
符号の説明
100 アレイ型プロセッサ
105 状態管理部
106 データパス部
107 プロセッサエレメント
108 スイッチエレメント
112 コンテキスト記憶手段であるインストラクションメモリ
140 状態記憶手段であるインストラクションメモリ
150 コード取得手段であるコード取得回路
151 イベント入力手段であるイベント入力回路
152 状態取得手段である状態取得回路
153 動作取得手段である動作取得回路
154 コンテキスト検出手段であるコンテキスト検出回路
156 コンテキスト取得手段であるコンテキスト取得回路
157 コード設定手段であるコード設定回路
158 イベント出力手段であるイベント出力回路
159 関係生成手段である関係生成回路
161 関係設定手段である関係設定回路
162 重複検出手段である重複検出回路
163 更新制御手段である更新制御回路
200 データ処理装置であるMPU
302,303 情報記憶媒体であるプログラムメモリ

Claims (20)

  1. データパス部と状態管理部とを有しており、前記データパス部には複数のプロセッサエレメントおよび複数のスイッチエレメントがマトリクス配列されており、前記プロセッサエレメントは、順次遷移される複数の動作状態ごとにコンピュータプログラムにデータ記述されている命令コードに対応してデータ処理を個々に実行し、前記スイッチエレメントは、前記命令コードに対応して複数の前記プロセッサエレメントの接続関係を個々に切換制御し、前記状態管理部は、前記データパス部の前記動作状態ごとの前記命令コードからなるコンテキストを前記命令コードと適宜入力されるイベントデータとに対応して前記動作状態ごとに順次遷移させるアレイ型プロセッサであって、
    前記コンピュータプログラムをデータ記憶している外部のプログラムメモリから所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得するコード取得手段も有しており、
    前記状態管理部がデータ取得された所定個数の前記動作状態の命令コードのみを一時保持して動作するとともに前記データパス部がデータ取得された所定個数の前記コンテキストの命令コードのみを一時保持して動作し、
    前記状態管理部と前記データパス部とが一時保持した前記命令コードでの動作を完了するごとに前記コード取得手段は継続する前記動作状態および前記コンテキストの前記命令コードをデータ取得するアレイ型プロセッサ。
  2. 前記状態管理部は前記動作完了または初期状態を検出して継続不可のイベントデータを前記コード取得手段に出力し、
    前記コード取得手段は、
    前記継続不可のイベントデータが入力されるイベント入力手段と、
    前記継続不可のイベントデータが入力されると前記状態管理部から現在の前記動作状態をデータ取得するとともに前記データパス部から次段の前記動作状態を指定する前記イベントデータを取得する状態取得手段と、
    データ取得された前記動作状態と入力された前記イベントデータとに対応して継続する所定個数の前記動作状態の命令コードを前記プログラムメモリからデータ取得する動作取得手段と、
    データ取得された前記命令コードの動作状態に対応する所定個数の前記コンテキストをデータ検出するコンテキスト検出手段と、
    データ検出された前記コンテキストの命令コードを前記プログラムメモリからデータ取得するコンテキスト取得手段と、
    データ取得された前記動作状態と前記コンテキストとの前記命令コードを前記状態管理部と前記データパス部とにデータ設定するコード設定手段と、
    前記命令コードのデータ設定が完了すると動作開始のイベントデータを前記状態管理部に出力するイベント出力手段と、
    を有しており、
    前記状態管理部は前記動作開始のイベントデータが入力されると前記動作状態の順次遷移を開始する請求項1に記載のアレイ型プロセッサ。
  3. 前記コード取得手段は、
    前記コンテキスト検出手段でデータ検出された前記コンテキストと前記動作状態との対応関係をデータ生成する関係生成手段と、
    データ生成された前記対応関係も前記状態管理部にデータ設定する関係設定手段と、
    も有しており、
    前記状態管理部はデータ設定された前記対応関係に対応して順次遷移させる前記動作状態ごとに前記データパス部の前記コンテキストを順次遷移させる請求項2に記載のアレイ型プロセッサ。
  4. 前記コード取得手段は、
    前回の複数の前記コンテキストと今回の複数の前記コンテキストとの重複を検出する重複検出手段と、
    重複が検出された前記コンテキストの命令コードの前記プログラムメモリからのデータ取得と前記データパス部へのデータ設定とを無用とする更新制御手段と、
    も有している請求項3に記載のアレイ型プロセッサ。
  5. 前記コード取得手段は、
    前記コンテキストの複数種類の更新手法が更新コストとともにデータ登録されている更新記憶手段と、
    前回の複数の前記コンテキストと今回の複数の前記コンテキストとの組み合わせから前記更新コストの合計が最少となる前記更新手法をデータ検出する手法検出手段と、
    データ検出された前記更新手法で前記データパス部の前記コンテキストのデータ更新を実行させる更新制御手段と、
    も有している請求項3または4に記載のアレイ型プロセッサ。
  6. 前記更新制御手段は、前記更新記憶手段にデータ登録されていて前記手法検出手段にデータ検出される前記更新手法として前回と今回との前記コンテキストで相違する前記命令コードのみ前記コンテキスト取得手段にデータ取得させて今回の前記命令コードを前回との差分のみ前記コード設定手段にデータ設定させる請求項5に記載のアレイ型プロセッサ。
  7. 前記更新制御手段は、前回と今回との前記コンテキストで相違する前記命令コードが複数の場合に前記差分の前記更新コストの合計が最少となる組み合わせを選択する請求項6に記載のアレイ型プロセッサ。
  8. 前記データパス部は、所定個数の前記コンテキストごとに前記命令コードを一時保持するコンテキスト記憶手段と、一時保持されている前記命令コードを前記コンテキストごとに一括に初期化するコード初期化手段と、を有しており、
    前記更新制御手段は、前記更新記憶手段にデータ登録されていて前記手法検出手段にデータ検出される前記更新手法として前回と今回との前記コンテキストの所定の組み合わせでは前回の前記コンテキストを前記コード初期化手段に初期化させてから今回の前記コンテキストを前記コード設定手段にデータ設定させる請求項5ないし7の何れか一項に記載のアレイ型プロセッサ。
  9. 前記データパス部は、所定個数の前記コンテキストごとに前記命令コードを一時保持するコンテキスト記憶手段と、前記コンテキスト記憶手段に一時保持されている任意の前記コンテキストの命令コードを任意の前記コンテキストの命令コードに一括に上書きするコード上書手段と、を有しており、
    前記更新制御手段は、前記更新記憶手段にデータ登録されていて前記手法検出手段にデータ検出される前記更新手法として前回と今回との複数の前記コンテキストの所定の組み合わせでは対応する前回の前記コンテキストを前回の他の前記コンテキストで前記コード上書手段に上書きさせてから今回の前記コンテキストと相違する前記命令コードのみ前記コンテキスト取得手段にデータ取得させて前記コード設定手段にデータ設定させる請求項5ないし8の何れか一項に記載のアレイ型プロセッサ。
  10. 前記プログラムメモリに複数の前記コンピュータプログラムがデータ格納されており、
    前記状態管理部は複数の前記動作状態ごとに前記命令コードを一時保持する状態記憶手段を有しており、
    前記データパス部は複数の前記コンテキストごとに前記命令コードを一時保持するコンテキスト記憶手段を有しており、
    複数の前記コンピュータプログラムの対応する前記動作状態と前記コンテキストとの前記命令コードが前記状態記憶手段と前記コンテキスト記憶手段とで一時保持され、
    一時保持された複数の前記コンピュータプログラムの1つで前記状態管理部と前記データパス部とが動作しているときに前記コード取得手段が他の前記コンピュータプログラムの所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得する請求項1ないし9の何れか一項に記載のアレイ型プロセッサ。
  11. 前記イベント入力手段にプログラム切換の前記イベントデータが入力されると前記状態管理部と前記データパス部との動作を停止させる動作停止手段と、
    停止した前記状態管理部の前記動作状態と前記データパス部の前記処理データとをデータ取得する停止取得手段と、
    データ取得された前記動作状態と前記処理データとを複数の前記コンピュータプログラムごとに一時保持する停止保持手段と、
    前記一時保持が完了すると他の前記コンピュータプログラムの前記動作状態と前記処理データとを前記停止保持手段からデータ読出して前記状態管理部と前記データパス部とにデータ設定する切換設定手段と、
    も有しており、
    前記イベント出力手段は前記データ設定が完了すると動作開始のイベントデータを前記状態管理部に出力し、
    前記状態管理部は前記動作開始のイベントデータが入力されると前記動作状態の順次遷移を開始する請求項10に記載のアレイ型プロセッサ。
  12. 前記状態記憶手段と前記コンテキスト記憶手段とで前記命令コードが一部のみ一時保持されている複数の前記コンピュータプログラムの優先度を検出する優先検出手段と、
    前記状態記憶手段と前記コンテキスト記憶手段とで一部のみ一時保持される前記命令コードの個数を前記優先度に対応して複数の前記コンピュータプログラムで相互に増減させるコード増減手段も有している請求項10または11に記載のアレイ型プロセッサ。
  13. 前記優先検出手段は、前記状態記憶手段と前記コンテキスト記憶手段とで一時保持されている複数の前記コンピュータプログラムの一部の前記命令コードごとに使用頻度を前記優先度として積算し、
    前記コード増減手段は、前記使用頻度が低い前記命令コードを優先的に削減させる請求項12に記載のアレイ型プロセッサ。
  14. データ処理装置とプログラムメモリとが接続されているデータ処理システムであって、
    前記データ処理装置が請求項1ないし13の何れか一項に記載のアレイ型プロセッサからなり、
    このアレイ型プロセッサの前記コンピュータプログラムを前記プログラムメモリがデータ記憶しているデータ処理システム。
  15. コンピュータプログラムとイベントデータとに対応して各種のデータ処理を各々実行する複数のデータ処理装置が並列に接続されており、
    複数の前記データ処理装置の少なくとも1個がアレイ型プロセッサからなり、
    このアレイ型プロセッサの前記コンピュータプログラムをデータ記憶しているプログラムメモリも有しており、
    前記アレイ型プロセッサが、データパス部と状態管理部とを有しており、前記データパス部には複数のプロセッサエレメントおよび複数のスイッチエレメントがマトリクス配列されており、前記プロセッサエレメントは、順次遷移される複数の動作状態ごとに前記コンピュータプログラムにデータ記述されている命令コードに対応してデータ処理を個々に実行し、前記スイッチエレメントは、前記命令コードに対応して複数の前記プロセッサエレメントの接続関係を個々に切換制御し、前記状態管理部は、前記データパス部の前記動作状態ごとの前記命令コードからなるコンテキストを前記命令コードと適宜入力されるイベントデータとに対応して前記動作状態ごとに順次遷移させる、データ処理システムであって、
    複数の前記データ処理装置の少なくとも1個が、前記プログラムメモリから所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得するコード取得手段を有しており、
    前記アレイ型プロセッサの前記状態管理部がデータ取得された所定個数の前記動作状態の命令コードのみを一時保持して動作するとともに前記データパス部がデータ取得された所定個数の前記コンテキストの命令コードのみを一時保持して動作し、
    前記状態管理部と前記データパス部とが一時保持した前記命令コードでの動作を完了するごとに前記コード取得手段は継続する前記動作状態および前記コンテキストの前記命令コードをデータ取得するデータ処理システム。
  16. 請求項15に記載のデータ処理システムの前記アレイ型プロセッサではない前記データ処理装置であって、
    前記プログラムメモリから所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得するコード取得手段を有しているデータ処理装置。
  17. 請求項16に記載のデータ処理装置のためのコンピュータプログラムであって、
    前記アレイ型プロセッサの前記コンピュータプログラムをデータ記憶している外部のプログラムメモリから所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得することを前記データ処理装置に実行させるためのコンピュータプログラム。
  18. アレイ型プロセッサと、前記アレイ型プロセッサのコンピュータプログラムをデータ記憶しているプログラムメモリと、が接続されており、
    前記アレイ型プロセッサが、データパス部と状態管理部とを有しており、前記データパス部には複数のプロセッサエレメントおよび複数のスイッチエレメントがマトリクス配列されており、前記プロセッサエレメントは、順次遷移される複数の動作状態ごとに前記コンピュータプログラムにデータ記述されている命令コードに対応してデータ処理を個々に実行し、前記スイッチエレメントは、前記命令コードに対応して複数の前記プロセッサエレメントの接続関係を個々に切換制御し、前記状態管理部は、前記データパス部の前記動作状態ごとの前記命令コードからなるコンテキストを前記命令コードと適宜入力されるイベントデータとに対応して前記動作状態ごとに順次遷移させる、データ処理システムであって、
    前記プログラムメモリから所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得するコード取得回路も前記アレイ型プロセッサに接続されており、
    このアレイ型プロセッサの前記状態管理部がデータ取得された所定個数の前記動作状態の命令コードのみを一時保持して動作するとともに前記データパス部がデータ取得された所定個数の前記コンテキストの命令コードのみを一時保持して動作し、
    前記状態管理部と前記データパス部とが一時保持した前記命令コードでの動作を完了するごとに前記コード取得回路は継続する前記動作状態および前記コンテキストの前記命令コードをデータ取得するデータ処理システム。
  19. 請求項18に記載のデータ処理システムのコード取得回路であって、
    前記プログラムメモリから所定個数の連携する一部の前記動作状態の命令コードを対応する一部の前記コンテキストの命令コードとともにデータ取得するコード取得回路。
  20. 前記プログラムメモリと一体に形成されている請求項19に記載のコード取得回路。
JP2004026800A 2004-02-03 2004-02-03 アレイ型プロセッサ Expired - Fee Related JP4502650B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004026800A JP4502650B2 (ja) 2004-02-03 2004-02-03 アレイ型プロセッサ
US11/049,305 US7650484B2 (en) 2004-02-03 2005-02-03 Array—type computer processor with reduced instruction storage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004026800A JP4502650B2 (ja) 2004-02-03 2004-02-03 アレイ型プロセッサ

Publications (2)

Publication Number Publication Date
JP2005222142A true JP2005222142A (ja) 2005-08-18
JP4502650B2 JP4502650B2 (ja) 2010-07-14

Family

ID=34805852

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004026800A Expired - Fee Related JP4502650B2 (ja) 2004-02-03 2004-02-03 アレイ型プロセッサ

Country Status (2)

Country Link
US (1) US7650484B2 (ja)
JP (1) JP4502650B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114059A1 (ja) * 2006-04-05 2007-10-11 Nec Corporation データ処理装置
WO2008107969A1 (ja) * 2007-03-06 2008-09-12 Fujitsu Microelectronics Limited 演算装置
JP5330384B2 (ja) * 2008-06-25 2013-10-30 パナソニック株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP5347974B2 (ja) * 2008-02-01 2013-11-20 日本電気株式会社 多分岐予測方法及び装置
US9021235B2 (en) 2009-08-25 2015-04-28 Nec Corporation Data processing device
US9021234B2 (en) 2009-01-30 2015-04-28 Nec Corporation Indirect designation of physical configuration number as logical configuration number based on correlation information, within parallel computing

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7478222B2 (en) * 2005-03-29 2009-01-13 Karl M. Fant Programmable pipeline array
US9164945B2 (en) * 2008-12-01 2015-10-20 Micron Technology, Inc. Devices, systems, and methods to synchronize parallel processing of a single data stream
US10157060B2 (en) * 2011-12-29 2018-12-18 Intel Corporation Method, device and system for control signaling in a data path module of a data stream processing engine
GB2514618B (en) * 2013-05-31 2020-11-11 Advanced Risc Mach Ltd Data processing systems
US10331583B2 (en) 2013-09-26 2019-06-25 Intel Corporation Executing distributed memory operations using processing elements connected by distributed channels
US10402168B2 (en) 2016-10-01 2019-09-03 Intel Corporation Low energy consumption mantissa multiplication for floating point multiply-add operations
US10558575B2 (en) 2016-12-30 2020-02-11 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10416999B2 (en) 2016-12-30 2019-09-17 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10572376B2 (en) 2016-12-30 2020-02-25 Intel Corporation Memory ordering in acceleration hardware
US10474375B2 (en) 2016-12-30 2019-11-12 Intel Corporation Runtime address disambiguation in acceleration hardware
US10467183B2 (en) 2017-07-01 2019-11-05 Intel Corporation Processors and methods for pipelined runtime services in a spatial array
US10445451B2 (en) 2017-07-01 2019-10-15 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with performance, correctness, and power reduction features
US10515049B1 (en) 2017-07-01 2019-12-24 Intel Corporation Memory circuits and methods for distributed memory hazard detection and error recovery
US10515046B2 (en) 2017-07-01 2019-12-24 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator
US10387319B2 (en) 2017-07-01 2019-08-20 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with memory system performance, power reduction, and atomics support features
US10469397B2 (en) 2017-07-01 2019-11-05 Intel Corporation Processors and methods with configurable network-based dataflow operator circuits
US10445234B2 (en) 2017-07-01 2019-10-15 Intel Corporation Processors, methods, and systems for a configurable spatial accelerator with transactional and replay features
US10496574B2 (en) 2017-09-28 2019-12-03 Intel Corporation Processors, methods, and systems for a memory fence in a configurable spatial accelerator
US11086816B2 (en) 2017-09-28 2021-08-10 Intel Corporation Processors, methods, and systems for debugging a configurable spatial accelerator
US10445098B2 (en) 2017-09-30 2019-10-15 Intel Corporation Processors and methods for privileged configuration in a spatial array
US10380063B2 (en) 2017-09-30 2019-08-13 Intel Corporation Processors, methods, and systems with a configurable spatial accelerator having a sequencer dataflow operator
US10417175B2 (en) 2017-12-30 2019-09-17 Intel Corporation Apparatus, methods, and systems for memory consistency in a configurable spatial accelerator
US10565134B2 (en) 2017-12-30 2020-02-18 Intel Corporation Apparatus, methods, and systems for multicast in a configurable spatial accelerator
US10445250B2 (en) 2017-12-30 2019-10-15 Intel Corporation Apparatus, methods, and systems with a configurable spatial accelerator
US10564980B2 (en) 2018-04-03 2020-02-18 Intel Corporation Apparatus, methods, and systems for conditional queues in a configurable spatial accelerator
US11307873B2 (en) 2018-04-03 2022-04-19 Intel Corporation Apparatus, methods, and systems for unstructured data flow in a configurable spatial accelerator with predicate propagation and merging
US10891240B2 (en) 2018-06-30 2021-01-12 Intel Corporation Apparatus, methods, and systems for low latency communication in a configurable spatial accelerator
US10459866B1 (en) 2018-06-30 2019-10-29 Intel Corporation Apparatuses, methods, and systems for integrated control and data processing in a configurable spatial accelerator
US10853073B2 (en) 2018-06-30 2020-12-01 Intel Corporation Apparatuses, methods, and systems for conditional operations in a configurable spatial accelerator
US11200186B2 (en) 2018-06-30 2021-12-14 Intel Corporation Apparatuses, methods, and systems for operations in a configurable spatial accelerator
US10678724B1 (en) 2018-12-29 2020-06-09 Intel Corporation Apparatuses, methods, and systems for in-network storage in a configurable spatial accelerator
US11029927B2 (en) 2019-03-30 2021-06-08 Intel Corporation Methods and apparatus to detect and annotate backedges in a dataflow graph
US10817291B2 (en) 2019-03-30 2020-10-27 Intel Corporation Apparatuses, methods, and systems for swizzle operations in a configurable spatial accelerator
US10965536B2 (en) 2019-03-30 2021-03-30 Intel Corporation Methods and apparatus to insert buffers in a dataflow graph
US10915471B2 (en) 2019-03-30 2021-02-09 Intel Corporation Apparatuses, methods, and systems for memory interface circuit allocation in a configurable spatial accelerator
US11037050B2 (en) 2019-06-29 2021-06-15 Intel Corporation Apparatuses, methods, and systems for memory interface circuit arbitration in a configurable spatial accelerator
US11907713B2 (en) 2019-12-28 2024-02-20 Intel Corporation Apparatuses, methods, and systems for fused operations using sign modification in a processing element of a configurable spatial accelerator

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6039248A (ja) * 1983-08-11 1985-03-01 Nippon Telegr & Teleph Corp <Ntt> 資源管理方式
JPS6286439A (ja) * 1985-10-11 1987-04-20 Fujitsu Ltd デ−タ処理装置
JPH10240549A (ja) * 1997-02-24 1998-09-11 Hitachi Ltd 並列ジョブ多重スケジューリング方法及び装置
JP2000124317A (ja) * 1998-10-21 2000-04-28 Fuji Xerox Co Ltd 情報処理システム
JP2003196246A (ja) * 2001-12-26 2003-07-11 Nec Corp データ処理システム、アレイ型プロセッサ、データ処理装置、コンピュータプログラム、情報記憶媒体

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3287703A (en) * 1962-12-04 1966-11-22 Westinghouse Electric Corp Computer
US4943912A (en) * 1987-10-13 1990-07-24 Hitachi, Ltd. Parallel processor system having control processor and array control apparatus for selectively activating different processors
US5717947A (en) * 1993-03-31 1998-02-10 Motorola, Inc. Data processing system and method thereof
US6697935B1 (en) * 1997-10-23 2004-02-24 International Business Machines Corporation Method and apparatus for selecting thread switch events in a multithreaded processor
US6122719A (en) * 1997-10-31 2000-09-19 Silicon Spice Method and apparatus for retiming in a network of multiple context processing elements
JP3576837B2 (ja) 1998-10-30 2004-10-13 日本電気株式会社 プログラマブルロジックlsiの基本セル及び基本セル2次元アレイ
JP3444216B2 (ja) 1999-01-28 2003-09-08 日本電気株式会社 プログラマブルデバイス
JP3269526B2 (ja) 1999-02-09 2002-03-25 日本電気株式会社 プログラマブルロジックlsi
JP3616518B2 (ja) 1999-02-10 2005-02-02 日本電気株式会社 プログラマブルデバイス
US6606704B1 (en) * 1999-08-31 2003-08-12 Intel Corporation Parallel multithreaded processor with plural microengines executing multiple threads each microengine having loadable microcode
US7051329B1 (en) * 1999-12-28 2006-05-23 Intel Corporation Method and apparatus for managing resources in a multithreaded processor
JP3528922B2 (ja) 2001-08-31 2004-05-24 日本電気株式会社 アレイ型プロセッサ、データ処理システム
JP3708853B2 (ja) * 2001-09-03 2005-10-19 松下電器産業株式会社 マルチプロセッサシステムおよびプログラム制御方法
JP3921367B2 (ja) 2001-09-26 2007-05-30 日本電気株式会社 データ処理装置および方法、コンピュータプログラム、情報記憶媒体、並列演算装置、データ処理システム
JP2003196248A (ja) 2001-10-19 2003-07-11 Japan Research Institute Ltd 自動情報収集システムおよび自動情報収集プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6039248A (ja) * 1983-08-11 1985-03-01 Nippon Telegr & Teleph Corp <Ntt> 資源管理方式
JPS6286439A (ja) * 1985-10-11 1987-04-20 Fujitsu Ltd デ−タ処理装置
JPH10240549A (ja) * 1997-02-24 1998-09-11 Hitachi Ltd 並列ジョブ多重スケジューリング方法及び装置
JP2000124317A (ja) * 1998-10-21 2000-04-28 Fuji Xerox Co Ltd 情報処理システム
JP2003196246A (ja) * 2001-12-26 2003-07-11 Nec Corp データ処理システム、アレイ型プロセッサ、データ処理装置、コンピュータプログラム、情報記憶媒体

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007114059A1 (ja) * 2006-04-05 2007-10-11 Nec Corporation データ処理装置
US8069333B2 (en) 2006-04-05 2011-11-29 Nec Corporation Converting logical to real number to access shared configuration information in event driven state transiting reconfigurable system
JP5131188B2 (ja) * 2006-04-05 2013-01-30 日本電気株式会社 データ処理装置
WO2008107969A1 (ja) * 2007-03-06 2008-09-12 Fujitsu Microelectronics Limited 演算装置
US8150949B2 (en) 2007-03-06 2012-04-03 Fujitsu Semiconductor Limited Computing apparatus
JP5347974B2 (ja) * 2008-02-01 2013-11-20 日本電気株式会社 多分岐予測方法及び装置
JP5330384B2 (ja) * 2008-06-25 2013-10-30 パナソニック株式会社 情報処理装置、情報処理方法及び情報処理プログラム
US9021234B2 (en) 2009-01-30 2015-04-28 Nec Corporation Indirect designation of physical configuration number as logical configuration number based on correlation information, within parallel computing
US9021235B2 (en) 2009-08-25 2015-04-28 Nec Corporation Data processing device

Also Published As

Publication number Publication date
US20050172103A1 (en) 2005-08-04
US7650484B2 (en) 2010-01-19
JP4502650B2 (ja) 2010-07-14

Similar Documents

Publication Publication Date Title
JP4502650B2 (ja) アレイ型プロセッサ
JP6017034B2 (ja) 状態機械エンジンが受信したデータを取り扱うための方法およびシステム
US7350054B2 (en) Processor having array of processing elements whose individual operations and mutual connections are variable
US10002103B2 (en) Low-pin microcontroller device with multiple independent microcontrollers
JP3987783B2 (ja) アレイ型プロセッサ
US10002102B2 (en) Low-pin microcontroller device with multiple independent microcontrollers
JP2017531375A (ja) マイクロコード化シーケンサを伴うアナログ/デジタル変換
JP2006099719A (ja) 処理装置
US7287146B2 (en) Array-type computer processor
CN104636289A (zh) 半导体装置
JP3693013B2 (ja) データ処理システム、アレイ型プロセッサ、データ処理装置、コンピュータプログラム、情報記憶媒体
JP2004133780A (ja) アレイ型プロセッサ
JP2008152409A (ja) 半導体集積回路
JP2008204177A (ja) 遅延調整回路を有するアレイ型プロセッサ
JP4664724B2 (ja) 半導体集積回路装置および半導体集積回路装置の設計装置
JP3861898B2 (ja) データ処理システム、アレイ型プロセッサ、データ処理装置、コンピュータプログラム、情報記憶媒体
US20130212362A1 (en) Image processing device and data processor
WO2007029169A2 (en) Processor array with separate serial module
JP2006011924A (ja) 再構成可能演算装置および半導体装置
JP3987805B2 (ja) アレイ型プロセッサ
US7058832B2 (en) Idle power reduction for state machines
JPH0444151A (ja) プロセッサ
KR100681427B1 (ko) 다중 프로세서 시스템을 위한 리셋 회로
JP2004362446A (ja) 計算機及び計算方法
JP2007179567A (ja) データ処理システム

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060224

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061114

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071205

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080924

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081125

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091104

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100202

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100215

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100407

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100420

R150 Certificate of patent or registration of utility model

Ref document number: 4502650

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130430

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140430

Year of fee payment: 4

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees