JPS59501183A - 機能プログラマブル短絡プレーン - Google Patents
機能プログラマブル短絡プレーンInfo
- Publication number
- JPS59501183A JPS59501183A JP50224483A JP50224483A JPS59501183A JP S59501183 A JPS59501183 A JP S59501183A JP 50224483 A JP50224483 A JP 50224483A JP 50224483 A JP50224483 A JP 50224483A JP S59501183 A JPS59501183 A JP S59501183A
- Authority
- JP
- Japan
- Prior art keywords
- data
- array
- processor
- column
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Multi Processors (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。
Description
【発明の詳細な説明】
モノーラーアレイプロセッサに使用する、列を短絡し、かつ全アレイを短絡した
機能プレーン発明の背景
この発明は一般にコンピュータを用いたデータ分析の分野に関し、特に2次元構
造のデータ群、一般には画像データと呼ばれるデータ群を処理することのできる
、セルラアレイプロセ、す(CAP )として知られる高度の専用コンピュータ
に関する。
両澹迅理の分野では、セルラアレイプロセ、すはそのアーキテクチャが画像処理
のタスクに特に適−したコンビー−タフステムとして一般に矧られている。実際
■L理同容が異几ば、それに合せて設計も実質的に(σ異6であろうが、てルラ
アレイプロセ、すの一般的なアーキテクチャはきわめて独特である。一般には、
7ステムは汎用デデインのコントロールプロセッサによって制御される高度の専
用アレイデロセ、すを有している。アレイプロセ、すば、順に正則行列内の各セ
ルとして分配された多くのエレメントプロセ、すから形成されている。(このた
め゛セルラアレイプロセッサ″′という名前が付けられた)このエレメントプロ
セッサは必然的にみな同じであり、一般には機能プログラマブルロジ、り回路と
メモリレノスタを有している。
このプログラマブルロジック回路は一般には、コントロールプロセッサによって
供給されたデータと結合し−C,各メモリレジスタ内に格納されたデータにAN
D″、″’OR”、”反転″および゛ローテート″といったような限られた数の
基本的な論理算術機能を選択的に行うことができる。コントロールプロセ、すは
、共通命令パスを介してエレメントプロセッサにリンクする。従4りて全エレメ
ントデロセ、すは各メモリレジスタに格納されたデータに共通の論理機能を施す
場合、別個にしかも同期を取って励作する(これを単一命令多重データすなわち
SIMDオペレーションと共通(で呼ぶ)。
セルラアレイプロセッサシステムは、特に画像処理のアプリケーションに適して
いる。これはセルラアレイ中のメモリレジスタによりX4像のデノタル表示を直
接プロセッサ内でマツピングできるからである。
従って1.2次元構造のデータ群内のデータの空間的相互関係は本質的に保持さ
れる。所望の画像処理アルコ゛リズムの遂行に対応して選択されたSIMD論理
オ論理オシレーションケンスをアレイプロセッサに貸わせることにより、画像の
各ポイントデータは必須的に並列処理できる。当然、エレメントプロセッサを増
やせば、処理される画像の文・1処理速度(エレメントプロセッサによって実行
される毎秒当シの命令の数と同時に動作スるエレメントプロセッサの数の積)と
分解能を高めることができる。
セルラアレイプロセッサのアーキテクチャはコンビーータを用いたデータ分析と
−うさらに一般的な分野では比較的最近開発されたけれども、実質的にはこのア
ーキテクチャを用いた多くのシステムが開発されている。このようなシステムの
多くは特に汎用として設計されているけれども、かなう専用のアプリケーション
用に相当数設計されている。多くの汎用アブリヶーンヨンシステムの記述が見ら
れる。例えばS、 F。
Reddaway著、1973年r EFJFJ刊“コンピュータアーキテクチ
ャに関する第1回ンンポジウムの手順″の第61頁乃至65頁に記載された°”
DAP−分散型プ°ロセッサ”が挙げられる。さらに1974年6月4日にA
aron H,Westerに付与された米国特許第3,815,095号”汎
用アレイプロセ、す”、1976年9月7日にStewart Reddawa
yに付与された米国特許第3.979.728号の67レイプロセツサ”(K、
E、Batcher ) 、 1979年発行の゛航空宇宙会議2におけるコン
ビーータの手順″の93頁乃至97頁に記載された6大景並列プロセッサ(MP
P )システム”、1979年3月13日にC1aude Tim5itに付与
された米国特許4.144.566号の“スタック補助高速メモリを有した並列
型プロセッサ″′が挙げられる。又多くの専用システムが記載されている。例え
ば、1972年10月31日にRichard 5hivetyに付与された米
国特許第3,701,976号のパ並列処理コンビーータ用浮動小数点演算装置
”、1977年12月27日にHermann Schomberg他に付与さ
れた米国特許第4,065,808号“ネットワークコンピュータシステム”、
2よび1978年7月18日にRichard 5tokas他に付与された米
国特許第4.101,960号”科学計算プロセ、す″が挙げられる。
これらのシステムのいずれも実流;Cあたっては、予測されるアプリケーション
にアレイゾロセラf e X整するように、橿めて異ったエレメントプロセッサ
の設計手法を用いている。これは基本的には可能なアプリケーションが極めて広
範囲であり、又利用し得るサグコンノー坏ントも多種であることによる。しかし
ながら、これらの工1/メントプロセ、すに共通して言えることは、エレメント
プロセッサの処理スピード全最適化するために高度のコンポーネントの相互接続
を行っていることである。
エレメントプロセッサを高度に最適化するような設計手法を用いた場合の欠点と
しては、特に、予測されるデータ処理アプリケーションに何らかの重大な変更力
あった場合、システム全体の処理能力と効率を維持するためには、エレメントプ
ロセッサを実質的に再設計しなければならなくなる。この結果必然的に、サブコ
ンポーネントをあ一4pにも専用化して相互接続してしまうと、エレメントプロ
セッサのコンポーネントの構成を大幅に拡張あるいは変更しようとしてもできな
くなる。
発明の要約
独特ノモジュールエレメントプロセッサの設計手法ヲ用いたアレイプロセッサア
ーキテクチャは同時係属出願に開示されている。このアレイプロセッサは複数の
モノユールエレメントプロセノブから成る。データ交換サブシステムは各エレメ
ントプロセッサモジュールを相互接続し、データの転送を行う。これらのモジュ
ールはその機能が多種にわたっている。例えば、これらのモジュールはメモリや
アキュムレータであり、名目上入力プログラマブルロノック回路および密接に関
係するメモリレジスタを有している。各エレメントプロセッサがアーキテクチャ
土産いに並列になるようにアレイゾロセッサの各モジュールが結合している。
エレメントプロセッサのデータ変換サブシステムの同時データ転送に基づく、ア
レイプロセッサ内のデータ転送は、それによ逆並列に行われる。これらのモジュ
ールは又、エレメントプロセッサと交叉して配置される機能プレーンとしてアー
キテクチャに結合している。
それゆえ機能プレーンは、各モジニールが別個のエレメントプロセッサに結合し
たモジーールアレイで構成されている。さらに、機能プレーンのモジュールハ機
能が共通である。これにより機能プレーンモジー−ルのメモリレジスタ内にある
2次元構造のデータ群ハ、特定の機能を有した機能プレーンに連続的に送られる
ことによシ同一かつ並列処理が成される。
制御プロセッサはアレイプロセッサの動作を指示するのに使用される。これらの
制御プロセッサはアレイ/制御プロセッサインタフェース手段により相互接続さ
れている。このインタフェースにより、制御プロセ、すは、各アレイプロセ、す
の機能プレーンをランダムにアドレッシングしかつ構成する。さらにこのインタ
フェースにより制御デロセ、すはアレイプロセッサとデータ交換することができ
る。
アレイプロセッサのアーキテクチャに2いて、との発明はアレイプロセ、すのデ
ータ交換す、ブンステムからの、データ又は前記サブシステムへのデータを転送
又は短絡する手段を提供する。この発明によれば、前記手段は列短絡および全ア
レイを短絡した機能プレーンによシ得られる。この機能プレーンは表面上アレイ
プロセッサの他の機能プレーンのモジュールアレイに相当する疑似モジールアレ
イを有している。従って疑似モジュールはエレメントプロセッサの各々に存在す
る。
短絡した機能プレーン内では、疑似モノー−ルは、短絡された列データ交換サブ
システムによって各々−AE相互接続された列として関係している。これらの列
は、j@ ic各々が列メモリレノスタを有した列制御ロノック回路とI関係し
ている。モードデコードロジ、り回路は列制御ロノ、り回路の動作構成を決定す
る。
短絡した機能プレーンは、多くの異るモードに対して任意に構成し得る。これら
のモードとして次のものがある。(1)制御プロセ、すからアレイプロセッサの
全データ交換サブシステムに共通にデータ転送を行う。
(2)第1行目のコーナの疑似モノニールのデータ交換サブシステムから残りの
データ交換サブシステムへ共通にデータ転送を行う。(3)列メモリレジスタか
ら各疑似モノエール列のデータ交換サブ/ステムに共通にデータ5 送を行う。
(4)1行目の類似モノ=−ルのデータ交換サブシステムから各疑似モノーール
のデータ交換サブ/ステムへ共通にデータ転送を行う。(5)アレイプロセ、す
の全データ交換サブシステムから、制御プロセッサへORを取ったデータの転送
を行う。(6)各列の疑似モジュールのデータ交換サブシステムから各々対応す
る列メモリレジスタへORを取ったデータの転送を行う。
制御プロセッサと列メモリレジスタ内のデータを転送するユーティリティモード
も設けられている。
この発明によれば、全画像データ群tアレイプロセッサの1つ以上の機能プレー
ンと転送するに必要な時間を短縮することができる。
さらに、共通データを同時に、アレイプロセッサの全エレメントプロセッサに供
給することができる。
さらに異るデータをアレイプロセッサの各列のエレメントプロセッサに同時に転
送し、共通データを所定列のエレメントプロセッサの各々に転送することができ
る。
サラニ単一エレメントプロセ、す又は多くのエレメントプロセッサにより供給さ
れたデータから作られた全画像データ群は同時に作られ、アレイプロセッサの1
つ以上の機能プレーンに転送することができる。
さらにアレイプロセッサの全エレメントプロて。
すにより供給されたデータから派生したデータあるいはアレイデロセ、すの異る
列からのデータを、アレイプロでツサ内に存在するデータの性質を示すものとし
て制御デロセ、すに供給することができる。
さらに、複数の機能プレーンをアレイプロでツサ内に設け、列並びに行データの
転送をアレイプロセ。
す内で行えるように位置決めを行うことができる。
図面の簡単な説明
この発明は、添附図面と関連して下記詳細説明を参照することにより、さらに良
く理解することができ上述の利点および附随利煮を即評価することができるなお
各図面において同一部には同一符号を付しである第1図はモジュラアレイプロセ
ッサの概略ブロック図;
第2図はアレイプロセッサの動作を指示するのに適した制御プロセッサの概略プ
ロ、り図;ロックおよび回路図;
第9図はアキームレータ機能型モジーールの概略ブロックおよび回路図;
第10図はアレイレベルのアキュムレータモジュールを構成するアキームレータ
壜能プレーンの概略ブロック図;
第11図はカウンタ機能型モジュールのメモリレジスタと入力プログラマブルロ
ジ、り回路の概略ブロックおよび回路図:
第12図は、コン・ぐレータ機能壓モジーールのメモリレジスタと入力プログラ
マプルロジック回路の概略プロ、りおよび回路図;
第13図はこの発明によるアレイプロセッサのデータレベルシフト動作を説明す
る概略タイミング図:第、14図は第7図のメモリ機能プレーンのデータ横シフ
ト動作を説明する概略タイミング図;第15a図および第15b図は、第8図に
示すI10機能プレーンのシリアル入出力データ交換を説明する概略タイミング
図:
第16図は、この発明による列短絡および全アレイ短絡した機能プレーンの概略
ブロック図;第17図は第16図に示す短絡した機能プレーン、のモードデコー
ドロノックブロックの概略回路図;第18図は第16図に示す短絡した機能プレ
ーンの列制御ロジックブロックの概略回路図:第19図は、第16図に示す短絡
した機能プレーンの最終列の制御ロジックブロックの概略回路図:第20図は、
短絡17た機能プレーン疑似アレイのコーナ疑似モジュールの概略回路図;
第21図は、短絡した機能プレーン疑似モジーールアレイの最上列の概略回路図
;および第22図は短絡した機能プレーン疑似アレイの標準疑似モノー−ルの概
略回路図である。
発明の詳細な説明
■、モジュラアレイプロセッサアーキテクチャの全体
上述したように1一般的なセルラアレイプロセッサ(CAP )システムは2つ
の基本要素で構成されている。すなわち、アレイプロセッサと、このアレイプロ
セッサの動作を指示するのに使用する制御プロセッサである。この発明は、CA
Pシステムに特に適した柔軟性の高い、アーキテクチャ設計であるモジュール構
造のアレイプロセッサを提供する。しかしながら、この発明は、実際(てId1
開示されたモジュールアーキテクチャである。たとえ物理用語を用いて最良と記
述したとしても、特定の物理実施例とは、慨念的に識別できる。しかしながら、
この発明を物理的に具現化しようとしたモードは、1981年6月23日にJa
nGrinberg他に付与された米国特許第4,275,410号″3次元構
造を有したマイクロエレクトロニクス装置″および、1980年12月16日に
Jon H,Myer他に付与された米国特許第4,239,312号゛′プレ
ーナアレイの並列相互接続”に開示されている。この2つのUSPは、この発明
の譲受人に譲渡されて贋る。
従って、この発明の好適アーキテクチャ実施例であるアレイレベル、す61とプ
ロセッサインタフェース63を第1図に示しである。アレイプロセッサ61は正
NXNアレイ内にセルとして分配された複数のエレメントプロセッサ6θから成
り、それゆえある画像の画素分布あるいは2次元構造のデータ群のデータ点と幾
伺学的に一致する。これは代表的なCAPシステムデザインと調和している。
エレメントプロセッサ60は必須的に同一であり、各々は共通データバス66を
使用したデータ交換サブ7ステムにより動作可能に相互接続される複数の動作モ
ジュール58で構成される。アーキテクチャ的には、エレメントプロセッサ60
1ri、アレイフロセッサ60を形成するに際し、3次元空間を専用し、モジュ
ール58は並行かつ互いに重シ合う複数のアレイレベル上に分配され名。エレメ
ントプロセッサ60はこれらのアレイレベルを横切って並列に延びているので、
各プロセッサは異るアレイレベル上に存在する、対応したNXNモジュールアレ
イの内の1つのモノニールを有している。
モノー−ル58は、一般に、設計1互いに同様である。これらのモジュールは、
各エレメントプロセッサ60内では必須的に独立したユニ、)であシ、一般に入
力プログラマプルロジック回路2よび緊密に相関したメモリレジスタとで構成さ
れる。ロジック回路は対応するメモリレジスタのデータと結合してデータ交換サ
ブシステムから受取ったデータに多くの相関する論理動作2よびデータ操作のた
めの動作を行うようにビット−シリアル回Fak用いている。ロノ、り回路は入
力端子に適切に組合わせた論理信号を作ることにより、特定の論理動作を行うよ
うに特にプログラムされ、又は構成されている。
すなわち各プログラマブル入力信号の論理状態によシ、論理回路の対応するセク
ション又はサブファンクションがイネーブルされたかあるいはディスエーブルさ
れたかが判断され、それによって特定の論理動作のだめのロジック回路を構成し
ている。
しかしながら、モジュール58は、多くの機能的に識別し得るタイプのモジュー
ルであシ、各モジーールは、基本的には同様の設計だが、異る入力プログラマプ
ルロジック回路を有している。これらの機能の異るモジュールはメモリ、アキュ
ムレータ、カウンタお:びコン・やレータとして機能するモノニールを含むこと
ができる。これらの設計例は第6図、第9図、第11図および第12図に示され
、下記に詳述する。ロジ、り回路の設計が前記設計例と同じである限シ、エレメ
ントプロセッサ60内のモジュール58として、実際には何らかの基礎データ操
作機能を実行することができる。すなわち、入力プログラマプルロジック回路は
(1)ビ、トーシリアル演算のように標漁の論理設計?有し、(2)データの転
送および格納を含む、汎用機能型と一致しかつ汎用機能量に必要な論理動作およ
びデータ操作動作を行うことができ、(3)モノー−ル58が共通のデータ交換
手段を共有するように、一般にはデータ)ランスミ、り/レシーバから構成され
るデータ転送回路を有する。従ってモノー−ルの機能の種類は上述し・たものに
限られない。
エレメントデロセ、す6θは、このようにそれぞレノデータ交換サブシステム7
4によ)、動作可能に相互接読された複数のモジュール58から成っている。
各複数のモジュール群58ば、各々の機能の種類について任意数持つことができ
る。しかしながら、各エレメントプロセッサすなわちセルが1能的に同一である
ことを必要とする汎用CAPシステム設計と同調するよウニ、複合エレメントプ
ロセッサ60の各々が同数の機能種類のモノニール58を有する必要がある。さ
ら6
に、アレイプロセッサ61が汎用CAPシステム設計と同調してSIMDマシン
として動作するには、アーキテクチャ上告アレイレベルに存在するモノニール5
8は同じ機能の種類のものでなければならない。従って各モジュールアレイはア
レイプロセッサ61内のエレメントデロセ、す60に交叉して配置されるメモリ
プレーンやアキュムレータプレーンのような機能プレーンを形成している。さら
に、所定の機能プレーンを形成するモジュール58は、共通の論理機能を常に同
時に実行し、それによって固有にアレイゾロセッサ61のSIMD動作を行わせ
るように制御するため動作可能に共通に接続しなければならない。
上述したように、複合エレメントプロセッサ60内のモノー−ル群58は、第5
a図に示すようなデータ交換サブシステムによるモジュール間のデータ転送のた
めに、主として相互接続されている。このサブシステムはデータバス66と複合
エレメントプロセ、す60の各モジュール58にある、必須的に同一な複数のデ
ータバスインタフェース回路76a−nで構成される。これらのパスインタフェ
ース76は、実際にはそれぞれ対応する入力プログラマプルロジック回路の不可
欠なセクションである。
データバス66に、複合エレメントプロセ、す60のモジュール58にある全パ
スインタフェース群7
76が共通に相互接続される。この共通性により、任意の数のモジュール58を
、アーキテクチャ的(および電気的〕に他と等間隔に、エレメントプロセッサ6
0に組込むことができる。従って、エレメントデロセ、す60は、適当数の機能
種類のモノー−ル58を組込むことにより、特定又は汎用のアプリケ−7ヨンに
対して最適に構成し得る。
データ交換サブシステム74によシ、複合エレメントプロセッサ60内の任意数
のモノニール58間でシリアルデータの転送を行うことができる。シリアルデー
タをコモンデータ/?ス66に供給するには、各メモリレジスタから7リアルに
データ/4ス66にシフトされるので、そのデータを転送するために少くとも1
ツノバスインタフエース76を作らねばなラナイ。一般にそ・れぞれ異るデータ
をシリアルに転送するのに2つ以上のモジュール58を作った場合を考えると、
このサブシステムは、これらのデータのANDを取るように機能する。これによ
り、データーぐス66に論理Oを強制的に転送して各シリアルデータのビット衝
突を解決している。データが1つ以上のモジュール58によって受取られるため
には、それぞれの・ぐスインタフエース76は、データ/(スからのシリアルデ
ータを各入力プログラマブルロジ、り回路に転送するように構成しなければなら
ない。この結果データは71ノアルに各メモリレジスタにシフトできるかあるい
は入力プログラマブルロジ、り回路により動作できる。この回路かラノ積が次に
メモリし/ノスタにシフト入力される。従って、2つ以上のモジュール58が同
時にデータを受取る場合、データは単に多くのメモリレジスタにコピーサれるか
、あるいは複合エレメントプロセ、す6θにあるいずれかのモノニール機能の種
類と同じ論理動作をするか、あるいはその両方が成される。最終的には、データ
を送信又は受信するようには作られていないモノニール58は実効的に、機能的
にデータフ4 ス66から切離される。これはパス66にロジカル°1を連続的
に送出するように・くスインタフエース76を構成することにより行われる。こ
れにより、サブシステムは、そのデータ衝突解消能力によシ、データを実際には
送信又は受信しないモノニール58を効果的に無視することができる。従って弁
動作モノニール58は、電子的には接続されているが、揖能的には各データ・ぐ
ス66と切離される。
第2図に示す制御プロセ、す10は、第1図に示すプロセッサインタフェース6
3によりアレイプロセッサ61のモノニール58に動作可能に接続される。
このプロセッサインタフェース63は、第3図に示すような複数のインタフェー
ス回路49で構成されている。インタフェース回路49はアーキテクチャ上各ア
レイレベルに存在し、アドレスデコーダ50とコンフィギーレーションラッチ回
路52とで構成され、各入力端子は、それぞれアドレスバス20とコントロール
パス24により制御プロセッサ10に接続されている。
コンフィギュレーンヨンラ、チ回路52の出力端子は次に対応する機能プl/−
ンすなわち各アレイレベルにあるモジ−・−ル5gに含まれる入力プログラマプ
ルロジック回路のプログラマブル入力に接続されている。特に、ロジ、り回路の
対応するプログラマブル入力端子は各々−緒に接続され、従って各入力端子はコ
ンフィギユレーションパス56によりコンフィギユレーションラッチ回路52の
別の出力端子に接続されている。従って、コントロールプロセ、す10は各コン
フィギユレーションラッチ回路52を選択的にアドレノノングし、あらかじめ決
められたコントロールワードを書き込むことができる。コントロールワードの各
ビットは対応する入力プログラマプルロジック回路の共通入力信号のロソック状
態を表わしているので、コントロールワードば、各機能プレーン内にある全モジ
ュール58の機能構成を効率良く定義することができる。従って、コントロール
ゾロセッサ10ば、アレイプロモツプ61内に各機能プレーンを別すに構成する
簡単な手段を有し、ている。
上述したように、了レイプロセッサ61の一般的な動作は第2図に示すコントロ
ールプロセッサ10によす指示される。コントロールプロセ、す10は一般的な
設計のコンピュータシステム12を有し、プログラムの格r1とプログラムシー
ケンサの機能、データ格納と■ンデータパッファリングおよびアレイプロセッサ
インタフェース63のインタフェース回路49へのランダムアクセスの機能を有
している。
コントロールプロセッサ10によって実行されるプログラムは当然画像処理アル
ゴリズムに基づいている。これらのアルゴリズムは一般に公知技術であり、アレ
イプロセッサ61と協働することによシ、フーリエ変換およびマ) IJクス乗
算を含む信号解析および、コントラストの強調、ニップ定義およびオブジェクト
ロケーンヨンを含む画像解析のようなタスクを行うことができる。各アルゴリズ
ムは、所望の情報を抽出するために画像データ群に成される特定の論理機能群を
作り出す。これらの論理機能はアレイプロセ、す61によシ簡単に行うことがで
きる。すなわち、ある機能プレーンのメモリレジスタにマツプしていたデータ群
を所望の機能を有した他のプレーンのメモリレジスタに転送するようにアレイプ
ロセ、す61に指示すれば良い。最小限の異る機能上ジ=−ル58であっても、
これらデータ群の連続転送、あるいはレベルシフトを用いても、任意の画像処理
アルゴリズムを実行させることができる。レベルシフトを行うに必要な特定のス
テ、プを第13図に示し、以下詳述する。
■、モノーラアレイプロセッサの詳細な説明A、コントロールプロセッサ
第2図に示したように、コントロールプロセッサシステム10はアレイプロセッ
サ61の動作を指示するのに必要である。このシステム10はアドノ々ンスマイ
クロデバイス社製AM 2901マイクロプロセツサをペースにしたシステムに
代表される、高速、ピットスライスシステムのような一般的設計のデノタルコン
ヒ一タシステム12を有する必要がある。しかしながら、この発明はコントロー
ルプロセッサ10の設計にポイントがあるわけで(dなく、むしろ、コントロー
ルプロセフス
イント力ある。従って、コントロールプロセッサに要求される能力2よび、これ
らの能力を供給する手段子、完全を期するため以下に述べる。
コントロールプロセ、す10は、アレイレベル。
す61を制御するために、アレイプロセッサインタフェース63とインタフェー
スするのに必要な全1言号を供給することができなければならない。従って、コ
ントロールパスセ、す10はプロセッサインタフェース63のインタフェース回
路49をランダムにアクセスするために、アドレス・々ス20上のアレイレベル
選択1
アドレスを供給することができなければならない。アドレスバス20を構成する
ライン・数は望しくは10゜少くともランダムに選択可能なアレイレベル数の置
数を2とした場合の対数値である。コントロールプロセフすはコントロールパス
24に16ビツトのコントロールワードを供給できなければならず、従って16
ラインで構成するのが望しい。アドレスおよびコントロールワードと関連して、
コントロールプロセ、す10はアドレスバリッドライン22にアドレス/ぐリッ
ド信号を供給し、アドレスと対応する制御ワードが各・ぐス上で安定状態にある
ことを示す必要がある。最後に、コントロールプロセ、す1θはリセットライン
26にコンフィギュレーションラッチリセ、)信号を供給シ、プロセッサインタ
フェース63にあるコンフィギユレーションラ、チの全ビットを非動作状態にリ
セットできなければならない。
コントロールプロセ、す10は更に安定した高速(望しくは約10 MHz )
/ステムクロ、り信号(5ysCK )を供給できなければならない。必要な
SYS CK倍信号システムクロ、クライン28に供給するために標率クロ7ク
ノエネレータ14を使用することができる。さらにジェネレータ14はライン3
0に信号を供給し、究極的ニコンピュータシステム12とアレイプロセッサ61
との同期をとることができる。
コントロールパスセ、す10 u 更+c 、SYS CK カら出力される、
あらかじめ決められた数のクロック・ぐルス”jiJ” −)制御して、アレイ
プロセッサクロック(CK )ライン38に送出できなけtばならない。これは
、標準ダウンカウンタ回路とANDケ゛−トを有するクロックカウンタとダート
16を用いて行うことができる。CK /#ルスのカウント数は単方向データバ
ス32により、クロックカウンタおよびp−ト16人カラ、子回路に供給される
。クロックカウンタおよびダート16の動作はコントロールライン34のダウン
カウントイネーブル信号によシ開始される。これに応答して、クロ、クカウンタ
およびr−ト16はANDダート手段によりCKライン38上にSYS CKA
?ルスの転送をイネーブルにし、他方あらかじめ決められた数のSYS CKA
ルスをカウントダウンする。ダウンカウントが終了すると、クロックカウンタお
よびケ”−トzeはSYS CK、Jルスの転送をディスエーブルし、コンピュ
ータシステム12に、コントロールライン36上のダウンカウント終了信号を供
給する。
最後ニ、コントロールプロセッサシステム10は、データ人力/データ出カライ
ン46.48上で、アレイプロセッサ61とのシリアルデータ交換(データI1
0 )を行うことができなければならない。これはシリアル−/4’ラレルおよ
び/?ラレルーシリア変換618(変換器〕を使用することにより可能である。
コンピータシステム12に一時的に格納されていた、あるいにバッファリングさ
れていた2次元構成のデータ群からの1デ一タワード群は並列に双方向性データ
バス40により変換器18に供給される。16ビツトの好適ワード長を有した、
各並列データワードはデータ出力ライン(Do)48を介して、アレイレベル、
す61にシリアルに転送される。逆に、プレイプロセッサ61に格納されたデー
タ群からのシリアルデータワードはデータ入力(DI)ライン46を介して、変
換器18に転送し得る。従ってデータワードは並列に変換され、データバス40
を介してコンピュータシステム12に転送される。
コントロールライン42 オヨ(j 4414、コア eエータシステム12に
よシ供給され、変換器18のシリアルデータ入力/’PラレルデータワードIJ
−1’オペレーシヨンおよびパラレルデータワードライト、シリアルデータ出
力オペレーションをそれぞ几制御する。変換器18によるデータのシリアル/・
ヤラレル変換は、クロ、り信号ライン38を介して変換器18にクロックカウン
タおよびダート16から供給されるCK =ルスに応答し、かつ同期が取られる
。CK−#ルスはさらにアレイプロセッサ6)にも同時に供給される。従って、
クロックのダウンカウント数が直接コントロールプロセッサ10とアレイプロセ
ッサ61との間で交換されるデータのワード長を決定する。第3図に示すように
、CK 、 I)■およびDoライン311,46.48は各インタフェース回
路49を介して、対応するアレイレベルの機能プレーンに配線されている。
B、アレイプロセッサ
上述したように、アレイプロセッサ61は複数のエレメントプロセ、す6oで構
成され、ニレメンドブoセ、teaは機能の異る複数のモジュールssc構成す
れる。概念的に、各エレメントプロセ、 サ60 カ並列であり、それによって
アレイレベル、す61内のデータの流れを並列化するように各モジュール58が
関連し合って1ハる。各エレメントプロセ、す6oのモジュール58は、それぞ
れのデータ交換サブ/ステムの車−データバス66によってのみ相互接続されて
いるので、そこでのデータの流れは正確にはビットシリアルと言える。しかしな
がら、並列エレメントプロセッサ60の共通かつ同時動作によシワードパラレル
とも言える。このワードノ4ラレル、ビアトンリアル動作によシ、アレイプロセ
ッサ61は効果的に、全画像を一度に処理することができる。さらに、この種の
動作により、種々の機能のモノー−ルのロノック回路を作るのにかなシ簡単な7
リモ
ができる。
共通のワード・ぐラレル、ビットシリアルモード動作を行うために、モノー−ル
58はさらに、エレメントプロセッサ60と交叉して、機能プレーンとして関連
している。各プレーンは、アレイプロセッサ61のアレイレベルLにある共通機
能のモノー−ル58で構成されている。そり、によっていくつかの種類のモノー
−ル58が、メモリ、アキュムレータ、カウンタ2よびコンパ1ノー夕というよ
うな機能プレーンとして動作コントロールプロセッサ10ば、第1図に示したプ
ロセッサインタフェース63を共に構成する各インタフェース回路49によう各
機能プレーンと動作可能に相関する。第3図を参照すると、各インタフェース回
路49は、単一の、望しくけ16ビツト幅のワードパラレルデータラッチ回路と
相関されるアドレスデコーダ5θで構成される。アドレスデコーダ5oのアドレ
ス入力端子およびアドレスバリッド入力端子2よびコンフィギユレーションラッ
チ回路52のデータ入力端子およびう、チリセット入力端子は、プロセッサイン
タフェース63のインタフェース回路49の対応スる全入力端子と共に、アドレ
スバス20の並列ライン、アドレスバリッドライン22、コントロールパス24
およびコンフィギュレーションラ、チリセットライン26に接続されている。各
アドレスデコーダ50は更に1作可能に、ラッチイネーブルライン54により各
コンフィギーレーションラッチ回路52に接続されている。このようにして供給
されるコンフィギーレーシコンラッチ回路52のデータ出力ラインは、アレイプ
ロセッサ61の別個の機能プし・・−ンと動作的に相関するり数のコンフィギユ
レーションパス56を形成する。
次にプロセッサインタフェース63の動作について述べる。インタフェース63
内のアドレスデコーダ50はアト9レス/ぐヌ2θ上のコントロール7−ド、す
10により供給される特定のアレイレベル選択アドレスに応答する。従って、特
定のインタフェース回路49の動作は、アドレスバリッドライン22上にアドレ
スバリッド信号がある場合に、アドレスデコーダ50が対応するアトし・スをア
ドレスバス20上に検出すると、始動される。このとき、アドレスデコーダ50
はう、ティネーブルライン54上にう、チイネーブル信号を発生する。これに応
答して、コンフィギーレーシミンラ、チ回路52け、アレ、プレベル選択アドレ
スに関連して、コントロールプロセッサ10により供給されるコントロールワー
ド、すなわち現在コントロールパス24上のコントロール’7 Fk7+y+す
る。
一度ラッチされると、コントロール7−ドの各ビットがコンフィギユレーション
バス56の各並列ラインにある信号のロジック状態を直接表わす。ラッチ回路5
2にラッチされているコントロールワードは、新しいコントロールワードがラッ
チ回路52にアドレッシングされるかあるいはコンフィギユレーションラッチリ
セット信号がリセットライン26に受信されるかする迄変わらない。
D、メモリ機能プレーン
特定のモジュール58の機能の種類ならびにその対応する機能プレーンは入力プ
ログラマプルロジック回路の特定の設計によシ決定される。メモリ機能の入力プ
ログラマプルロジック回路は第6図に示され・る。
種々のプログラマブル入力信号をその機能の定義と共にテーブルIにリストアツ
ブする。
メモリモノー−ルは2つの主機能を有するように設計される。その第1は2次元
構成のデータ群から単一データワードを路網することである。これにより全体の
画像がメモリ機能プレーンに直接マツピングされ、それにより、構成データワー
ドの空間相互関係を固有に保持することができる。第2の機能はデータワードを
、隣接するエレメントデロセ、すの対応するメモリモノニール、すなわち機能プ
レーン内の最も近接する4つのモジュールの1つに横方向に転送することである
。この機能は、全体のメモリ機能プレーンという点から考えると、画像の空間保
全状態を損うことなくプレーン内の4つの直交方向のいずれかの方向に横方向に
全画像をシフトすることを可能にする。次に、これらの機能を供給し得るメモリ
ロジック回路について説明する。
第6図に示すように、メモリロジック回路102の中心構成部は当然メモリし・
ノスタ118であり2.16ビノト長であることが望しい。クロックイネ−プレ
信号は、瓜ケ’−ト12oのCLKプログラマブル入力に印加されると、コント
ロールプロセッサ10によりCKライン38上に供給される所定数のクロックツ
ぐルスをメモリレジスタ118に印刀口することを可能にする。印加された各ク
ロ、クツやルスによシフモリレジスタ118内のデータが1ビ、トだけ右てシフ
トされ、それにより、メモリレジスタ1xtH)hらの又はメモリレジスタ11
8への双方向のデータのシリアル転送が得られる。従って、CKパルスが印加さ
れると、メモリレジスタ118の最上位ピッ) (MSB )又は最下位ビ、
ト(LSB )からのシリアルデータが、MSBプログラマブル入力信号125
のロジック状態によシ、データセレクタ回路124を介して、最も近くの出力ラ
イン104に伝送される。これによって各機能プレーン内の最も近接する4つの
メモリモノー−ルの各々にシリアルデータが供給可能になる。最も近接する出力
ライン104上のデータはさらに極性選択回路150に供給され、POLプログ
ラマブル入力信号148のロノ。
り状態により、データの型性が反転される。そこからのデータは次にデータライ
ン82を介してメモリモジュールのデータバスインタフェース回路76のデータ
転送セクションに併給される。そこで、データはNORダート80により0プロ
グラマブル入力ライン84上ノ出カイネーブル信号と結合される。この結果オー
プンコレクタ出力バッフγ86によりデータ又はロジック1のいずれかをデータ
パスライン66上にバッファリングし、それによって各エレメントプロセッサ6
゜の他の七ノー〜ル58に供給可能にする。第5b図に示すような漂準オ〜プン
コレクタ、エミッタ接地バイポーラ出カバ、ファあるいは第5c図に示すような
オープンドレイン、ソース接地の出力−ぐッファを、使用するロジックファミリ
ーに応じて用い、モジュールロジ、り回路を構成することができる。
データはさらに、CKパルスが印加されるとMSBを介してメモリレジスタ11
8にシリアルに入力される。
この入力データは多くの異るデータ源からのデータ積として多入力NANDゲー
ト126によシ供給される。このようなデータ源の1つがデータバスインタフェ
ース回路76のデータレジ〜パセクションである。ソコテ、ロジカルNALND
ダート88を用いて、■プログラマブル入カライン92上のデータ人力イネーブ
ル信号とデータパス66上のデータとを結合する。受信したシリアルデータ又は
ロジックlが、その結果として入力ライン93を介してNANDケ゛−ト126
に、データ人力イネーブル信号のロジック状態に応じて供給される。
もう一つのデータ源はメモリレジスタ118目身である。レジスタから最も近接
するデータ出力ライン104上へのデータ出力は、NANDダート12BのRE
Cプログラマブル入力端子130へ印加される再循環イネーブル信号と結合され
る。これにより、メモリレジスタ118の出力端子から再循環された反転データ
又はロジ、り1のいずれかが、入力ライン129を介してNANDダート126
に供給される。
残)のデータ源は、4つの最も近接したメモリモジュールである。いずれの場合
にも、最も近接データ出力ライン106.1011,110,112上のデータ
は、各ロジカルNAMD’f”−)J 32 、136 、14θ。
144のSI、WI、NIおよびEIのプログラマブル入力端子134.138
,142,146の方向性入力イネーブル信号と結合される。最も近接するモジ
ーールからの反転データ又はロジカル1のいずれかが、NAND r −ト12
6への入力信号として供給される。
エレメントプロセッサ60と交叉するアレイプロセッサ61の断面として概念的
に見たメモリ機能プレーン100を第7図に示す。メモリ人力プログラマプルロ
ジック回路102を有するモジュール58はNXNのアレイに構成されている。
メモリ機能プレーン100のロジック回路102は、双方向のシリアルデータの
転送のために、4つの最も近接するロジック回路の各各(て相互接、続される。
機能プレーンlθ0のコーナモジュール1021,1′;i−考えると、このモ
ノニールはデータを最も近接するデータ出力ライン104によう、隣接する七ジ
ニ/’l/ 1021.2 + 1772.’、nおよび102n、1にデータ
を供給する。コーナモノニールx o 21.1Bすらに、それぞれ最も近接す
るデータ出力ライン108゜112.110.106により容量も近接するモジ
ニールからのデータを受取る。従って、図かられかるように、最も近接する相互
接続ラインがメモリ機能プレーン100のモジュールアレ・イの回りを取り巻い
ているので、NXNアレーイの工、デ境界でデータを損失することが無い。
制御のために、モノニールのロジック回%102は、メモリ機能プレーン100
に対応したインタフェース回、路49のコンフィギユレーションパスに共通VC
接続されている。各モジュール入力プログラマブルロジ、り回路102のプログ
ラマブル入力端子は、パス56の各並列ラインが所定のプログラマブル入力端子
の全てに共通に接続されるように、接続される。従ってメモリ機能プレーン10
0内にある全モジュール入力プログラマブルロジ、り回路102は常に動作可能
に:かつ互いに同じに構成される。これは、これらのプログラマブル入力端子の
ロジック状態が、対応するプロセッサインタフェース回路49のデータラッチ回
路6
52にあるコントロールワードにより作られるからである。
最後に、コントロールプロセッサ1oのクロックカウンタおよびダート16によ
シ発生されるクロックi4ルスがクロックライン38により、入力プログラマブ
ルロジノク回路に共通に供給される。
E、 I乃機能プレーン
第8図に示すようKIん機能プレーン152は、コントロールプロセッサ1oに
ょシリアルデータ交換を可能にするようにモアファイされたメモリ機能プレーン
である。テーブル■ば、I10機能プレーンたより要求される種々の人出方のリ
ストと機能を説明したものである。
I10機能プレーン152は実質的にはメモリ機能プレーン100と同一であ、
る。しかしながら、これらハ、Ilo 機ml プレーン152が、コントロー
ルプロセッサ10によりDOライン48上に供給されるデータと、隣接するメモ
リモジュール1o21.nにょ)、最も隣接するデータ出力ライン112上に供
給されるデータとの間のデータを選択するシリアルデータレシーバ/セレクタ1
54を有しているという点で異る。いずれかのデータ源からのデータは東データ
入カライン112′上のメモリロジ、り回路102,1に供給される。これら2
つのデータ源間の選択は、EXIOプログラマブル入カライカライン156上外
部I10信号に依存する。さら17c I10機能プレーン152はさらにシリ
アルデータトランスミッタ回路155を有している。この回路は、パスインタフ
ェース回路76のデータ送信部と機能的に同一である。メモリロジック回路10
2 の最も隣接するデータ出力ライン160はデータをデータ送信回路155に
供給する。このデータはNORケゞ−ト8゜によすEXIOプログラマブル入カ
ライカライン156上I10信号と結合され、オープンコレクタパ、ファ回路1
36t/CよりDIライン46上にバッファリングされる。
データバスインタフェース回路76の動作と同様に、最も隣接するデータ出力ラ
イン160上にあるデータ又はロジック1のいずれかが送信され、この選択はE
XIO信号のロジック状態による。従って、プログラマブル入力端子156上の
EXIO信号がロジック0のとき、データレシーバ/セレクタ回路154は最上
性のコーナのメモリロジック回路1021゜1に最も隣接するデータ出力ライン
112からのデータを供給し他方データこの構成では、■10機能プレーン15
2は動作的にメモリ機能プレーン100と同一である。逆の構成の場合には、E
XIO信号がロジック1のとき、データレシーバ/セレクタ154は、最上性、
コーナのメモリロジック回B 109 KDoライン48を介してコン−1,1
トロールデロセ、す10からのデータを供給し、他方データ送信回路155は最
下行コーナのメモリロジック回路102 D最も隣接するデータ出力ライン16
0からのデータをシリアルに、DIライン46を介してコントロールワード、す
10に供給する。
)
苓
世
+X。
F、ア2ユムレータ機能プレーン
アキュムレータ機能プレーンのモノニール、5B(6各々第9図)て示すような
アマ−ζレータ型のへカプログラマブルロノック回路172を有している。表3
はアキュムレータロノック回路172およびアキュムレータ3能プレーンと同等
の各プログラマブル入力のリストと機能の説明をしたものである。
アキュムレータモジュールば7リアルに2つのデータワードを合計し、その結果
を格納する。従って第9図に示すように、アキュムレータロノ、り回路172は
実質的に、望しくは16ビツト長のメモリレノ2り180と、ヤマリー回路13
2を有した1ビ、トフルアダーとで溝成される。メモリロノック回路102の場
合のように、NANDゲート184を用いて、CKライン38上て、クロックカ
ウンタ2よびケ9−ト16により発生されるクロ、クツやルスをCLKプログラ
マブル入カツカライン186上ロ、クイネーブルと結合する。これにより、クロ
ックパルスをメモリレジスタ180へ選択的に印加することが可能となる。クロ
ック・2ルスを印加する毎に、メモリレジスタ180はシリアルシフトレノスタ
として作動し、レノスタ内のデータを1ビツト右にシフトする。データはデータ
セレクタ回路174を介してメモリレジスタ180からデータバスインタフェー
ス回路76に出力される。データセレク夕回路174は一般的な設計のものであ
り、メモリレジスタ180の最上位ビット又は最下位ビットのいずれかからの出
力データを、MSBfログラマプル入カライカライン176上位ビット信号のロ
ジック状態に応じてデータ出力ラインに出力データを選択的に出力する。データ
セレクタ出力ライン175上にあるデータのデータバス66への転送はバスイン
タフェース回路のOプログラマブル入カライン84上の出力信号に依存する。こ
のデータはRECプログラマブル入力177上にある再循環信号のロジック状態
に応じて、再循環NANDダート178を介して再循環することができ、究極的
にはメモリレジスタ180に循環さnる。キャリーkq(、た1ビ、トフルアダ
ーは1ビ、トフルアダーと1ビットキャリーラ、子回路として動作する、適切に
接続さnたフリ、fフロッグ19θで構成さnるのが望しい。キャリー付エビッ
トフルアダ−182はメモリレジスタ1goに再循環されるデータ2よびバスイ
ンタフェース76により供給さnるデータバスライン66からの入力データのい
ずれかあるいは両方を受取る。データの累算前に各グログラマプル入カライン1
92.193上に、ADD信号又はSUB信号があるかどうかおよび入力r−夕
が真かあるいは反転さnているかどうかに応じてこのデータの和又は差がキャリ
ー付1ビツトフルアダー182からクロックに同期して出力され、メモリレジス
タ18θに入力される。
従って2つのデータワードを加算するのて2ステツプの手続が必要である。第1
のステ、プはバスインタフェース76からの第1データワードをメモリレジスタ
180にシリアルに加算することである。と扛は従前にメモリレジスタ180に
あったデータの再循環をディスエーブルすることにより成される。次に第2デー
タワードがバスインタフェース76がらシリアルに入力される。同時に第1デー
タワードがメモリレジスタ180から再循環され、両データは同期してキャリ付
1ビツトフルアダー182に印加される。こ、の結果得らn、た/リアル合計値
がシフトされ又同期をとってメモリレジスタ180に入力さnる。この合計値は
更に付加データと加算されるかあるいは各エレメントプロセ、す6o内の他のモ
ジュール58にシリアルに転送さnる。
苓
1;
11:
、j
NXNマレイのアキュムレータモジュール168で構成されるアキュムレータ機
能プレーン166は、第10図に示されており、各々アキームレータ入カプログ
ラマプルロジック回路172を有している。メモリおよびI10機能プレーンの
場合のように、アキュムレータモノニール1611(4コンフイギユレーシヨン
ノ々ス56により対応するプロセッサインタフェース回路49に共通に接続され
ている。従って、アキュムレータロジック回路172の対応するプログラマブル
入力ラインは共通接続され、さらにコンフイギーレーションパス56の各並列ラ
インに接続されている。これによす、コントロールプロセッサ10によシコンフ
イギュレーシ田ンラッチ回路56に選択され、書込まれたコントロールワードが
、アキュムレータ回路172の各プログラマブル入力信号のロジック状態を共通
に作ることができる。従って、コントロールワード、す10によシ直接選択され
るアキュムレータ機能プレーンに共通構成のアキュムレータロジック回路群17
2カ゛アル。コントロールプロセッサ10のクロックカウンタおよびダート16
によシ発生する所定数のクロックツぐルスは、クロノクライン38により各アキ
ュムレ−タモジュール168およびロジック回路172に共通に設けられている
O
G、カウンタ機能プレーン
カウンタ入力プログラマプルロジック回路を第11図に示す。プログラマブル入
力信号および対応するカウンタ機能プレーンのリストと記述を表4に示す。
カウンタロジック回路200はデータバス66上のデータのビットの加算を行う
ように設計されている。
従って、カウンタロジック回路200は必須的に標準5段バイナリカウンタ20
4と対応する5ビツトメモリレジスタ202で構成されている。動作中、データ
はパスインタフェース回路を介してチー タハス66 カらバイナリカウンタ2
04の第1段により受信される。
・ぐスインタフニース回路76の受信部は先にイネーブルになり、データバス6
6から各データビットを受取っり後スぐディスエーブルされる。受信した各ロノ
。
り1のデータビットがバイナリカウンタ204の第1段をクロ、りし、他方ロジ
ック0を受信した場合には、バイナリカウンタには何の影響もない。従って、バ
イナリカウンタ204は、データバス66上にシーケンシャルに存在するロジッ
ク1データビツトの数をカウントする。これによシ、カウンタ204は1ビ、ト
フルアダーとして機能する。バイナリカウンタ204の出力信号から連続的に得
られるバイナリカウント値は、)やラレルデータセット信号をSETプログラマ
ブル入カシカライン21θ加することによりzeラレルイン、シリアルアウトメ
モリレノスタ202に転送することができる。このカウント値は、CLI(プロ
グラマブル入力ライン206に、クロックイネーブル信号によりイネーブルにな
ったCKライン38上のクロツクノヤルスを印加するのに応答して、)々スイン
タフエース回路の送信部に最小位ビットを先頭にしてメモリレノスタ202から
シフト出力される。ノシイナリカウンタ204は1ノセツ) M 号ヲRプログ
ラマブル入カライン208に印加することにより、いつでもクリアできる。
制御のために、カウンタ機能プレーンとしてのカウンタロノ、り回路200の相
互接続は、アキュムレータ機能プレーン166内のアキュムレータロジ、り回路
172の相互接続ときわめて類似している。カウンタロジック回路200の対応
するプログラマブル入力ラインはそれぞれ一緒に接続され、さらに対応するコン
フィギュレーションノクス56の並列ラインニ接続されている。従って、カウン
タ機能プレーンのカウンタロジック回路200の動作は共に共通かつ同期してい
る。
市 匈 1 会 、
Ho コンノ4レータ機能プレーン
コンノ4レータ入力プログラマプルロジ、り回路216は第12図に示されてい
る。表5はこのロジック回路216の各プログラマブル入力信号および同等の対
応する機能プレーンのプログラマブル入力のリストと機能説明を示している。コ
ンパレータコシツク回路216は2つのデータワードを比較するのに3ステツプ
の手続を取っている。第1ステ、プにおいて、パスインタフェース回路76によ
りデータバス66からのデータ7−ドが受信され、メモリレジスタ218に入力
される。これは、 CLKプログラマブル入カシカライン222上ロ、クイネー
ブル信号【よりNAND ’r″−ト220を介して供給されたクロックパルス
の印加に応答シてメモリレジスタ218の最上位ビット位置を介してデータワー
ドをシリアルにシフト入力することにより行われる。このステップはメモリレジ
スタ218に従前にあるデータの再循環を行うことなしに行われる。すなわちロ
ジックOがRFCプログラマブル入カシカライン226加され、それによりデー
タの再循環をディスエーブルにする。第2ステツプはメモリレジスタ218内に
現在あるデータと、データバス66を介してロジック回路216にシリアルに供
給された第2データとの比較を実際に行うことである。この2つのワードは、最
小位ビットを先頭にしてコンパレータサブ回路223の各入力端子に同時にシリ
アルに印加される。第1データワードはメモリレジスタ218にあるデータワー
1−の再循環をイネーブルにすることにょシコンパレータサブ回路223のA入
力ラインに印加される。第2データワードはCMPプログラマブル入カシカライ
ン228上ンベアイネーブル信号にょシイネーブル器でなったコンベアNAND
ダート229にょシコンパレータサブ回路223の3人カラインに、データバス
66から直接伝送される。この2つのデータはシリアルに印加されるので、コン
パレータサブ回路223ば対するビットを比較し、その県債結果がコンパレータ
ステート出力ラッチ回M224により格納される。
すなわち、コンパレータステート出カラ、子回路224は2つのデータワードの
比較状態を連続的に表わす、太き込、小さいシよび等しいという3つの出方信号
を作る。比較後コンパレータステート出力ラッチ回路224からの3つの出力信
号はラッチされ、それにょシリセット信号がRプログラマブル入カライン236
上に印加されることにょ)リセットさiLる迄、累積比較の状態を保持する。当
然、第2の、すなわちシリアル比較のステップは両データワードの最上位ビット
が比較されたとき終了する。第3の最終ステップの比較子Ficハコンパレータ
ステート出カラッチ回路224の出力信号の特定の比較状態をテストすることで
ある。
このために、ラッチ回路224の出力信号がそれぞれる。この3つのNAND
r −)の出力信号は、その出力信号がバスインタフェース回路76に供給され
る3人力NAND f −) 338によシ結合される。これらのダート231
.233,235は、それぞれG、L、Eの入力ラインを有している。これらの
ラインはA>B又はA>Bのようにコンパレータ出力ラッチ状態のいずれか1つ
又はその組合に対して選択的にテストするのに使用することができる。従って2
つのデータワード間の比果結果が、第1データワードが第2データワードよシ大
きい場合、第2ステツプの手続に続いて、コンパレータステート出力ラッチ回路
のA>B出力がロジック1になる。さらに1゛大きい”および1等しい”の各信
号、がそれぞれGおよびEプログラマブル入カライン230,234に第3ステ
ツプで印加される。この結果3人力NANDダート238は、第1データワード
が第2データワードよシ大きいか又は等しいのいずれかであることを示すロジッ
ク1信号をパスインタフェース回路76に転送する。
へ
Iへ 心 心 知合
カウンタ機能プレーンに関し、制御のためにコンz417一タ機能プレーン内の
コンノ(レータロジック回%216の相互接続はアキュムレータプレーン166
内のアキュムレータロノ、り回路172の相互接続にきわめて類似しているコン
パレータロジック回路216の対応するプログラマブル入力ラインはそれぞれ接
続サレ、サラニ対応するコンフィギユレーションパス56の並列ラインに接続さ
れている。従ってコンノやレータ機能プレーンのコンパレータロノ、り回路21
6の動作は共通かつ同期が取られている点で固有である。
■、データ交換サブシステム
上述したように、第5a図に示すデータ交換サブシステムは、複合エレメントプ
ロセッサ60内のいずfかのモジュールが、データバス66に、同期してデータ
を送信したりあるいはデータバス66からのデータを同期して受取ることが可能
なように作動する。データ交換サブシステムは更にデータバス66かう、非励作
モノ亡−ルを機能的に切離す。これらの機能を供給するために、データバスサブ
システム74はデータバス66、抵抗負荷78、データバス66上のデータ信号
のロジック状態を検出するデータバス66に動作可能に接続された多くのデータ
レシーバおよびデータバス66に動作可能に接続された多くのデータトランスミ
ッタを石している。エレメントプロセッサ60のモノー−ル58を相互接続する
のに使用されるデータ交換サブシステムの場合、これらのデータトランスミッタ
およびレシーバは対唇なって複数の:同−データー寸スインタフエース回路76
− を形成することができ、各回路は複合エレメントプロセ、す60の各モノー
ールに組込むことができるっ抵抗負荷78は抵抗であシ、抵抗性を有して接続さ
れたFgTすなわ−)導電性パスライン66と電圧源(図示せず)との間(て2
1TXされたFETであることが望しい。この電圧源はデータバス66を通常ロ
ノ、り1に保持するのに十分な電圧である。
バスインタフェース回路762よびデータトランスミ、りおよびレシーバの好適
設計例をセク7ヨン■、上記りのメモリ人カプログラマブルロノ、り回路102
に関連して述べる。この回’4102の特徴(は次の通りである。(1)回路7
6のトランスミッタ部のデータ出力パッ7ア86は第5b−c図に示すようKf
−コンコレクタ設計である。(2)出力イネーブル信号がOプログラマブル入カ
ライン84に印加されると、データライン82上のパスインタフェース回%76
に供給されるデータはデータバス66に送信される。(3)出力イネーブル信号
がOプログラマブル入カライン84から消えると、バスインタフェース回路はロ
ノ、り1を発生しプル信号がエプログラマブル入カライン92に印加されると、
データ・ぐス66から受信したデータがデータライン93に送られる。従ってデ
ータを送信するときハ、各バスインタフェース回路76はデータバス66のロー
ノ、り状態をロジカル0状態にする能力を有しさえすれば艮い。従ってデータバ
ス66のロジ、り状態がロジック1であるのは、全バスインタフェース回路76
− がロジック1を送信しているときか、各モノーールをデータ・ぐス66から
機能的に切離したときである。逆に、いずれかのバスインタフェース回路がロジ
カル0を送信している場合には、データバス66はロジカル0状態にある。従っ
てデータ交換サブシステムは効果的にデータバス66上に送信される全データの
ワイギド、ANDf、、データを受取るように構成されたバスインタフェース回
路76に供給する。従って、送信されるデータの衝突が、ロジカルAND条件の
適用により回避される。この所望の帰結は、機能プレーン間でデータが転送され
るときはいつでもアレイプロセ、す66によりデータに応じた処理が可能になる
ということである。すなわち、アレイプロセ、す61のデータ交換サブシステム
の衝突回避能力は2種類以上の画像を機能プレーン間で同時に転送させることに
より、意図的に生じさせることができる。各データ交換サブシステムにより実際
に送信されるデータは当然各エレメントプロセノブ60の送信モジュール58に
含まれる各データによる。従ってアレイプロセッサ51は、結果として得られる
画像が2つ以上の画像の各データに依存するようなデータ依存動作すなわち学参
寺寺マヌキング動作を行うことができる。この特徴は、後述するセクションQl
)Eの例によ)さらに説明する。
人力プログラマプルロノック回路を各データバス66に接続するために共通のパ
スインタフェース76を使用することは実質的に、エレメントプロセッサ60の
全体の複雑さ、それゆえ全体のアレイプロセッサ61の複雑を減少させる。これ
により、全体として互いに依存しないのであれば、大刀プログラムの要求ビット
シリアル演算2よびデータ操作およびパスインタフェース76の使用にのみ限定
した設計KL、実施するこ七ができる。蛍−データバス66を介してエレメント
プロセッサモジュールの相互接続を共通にすることによシ、(これは従来技術の
゛セル”エレメントコンポーネントの高度に相互接読されたサブコン2−ネンに
相当する)エレメントプロセッサ6oのアーキテクチャが簡単になる。
データ交換サツシステムは又エレメントプロセッサ60の変更又は拡張を′間単
にする。各モノーール58はパスインタフェース76のデータ送信2よび受信の
両方に共通の単一データライン9Qを介して各データバス66に接続されるので
、モジュール58はデータバス66からデータライン9oを適切に接続又は切離
すことによシエレメントプロセッサに付けたり、切離したりできる。さらに、こ
のアーキテクチャはエレメントプロセッサの最適化2よび速度に何らの直接の影
響を与えずに拡張することができる。複合エレメントプロセッサ60に存在し得
るモジュール58の数を制限するものはパスライン66の長手方向に沿った信号
伝搬遅延の制約である・
しかしながらデータ交換サブシステムは、エレメントプロセッサ60のモジュー
ル58を相互接続することにのみ使用が制限されているわけではない。パスライ
ンを介して多くのロジック回路間で、シリアルデータを交換しなければならない
所では効果的に使用することができる。
例えば、機能的に等価なデータ交換サブシステムを用いて、アレイプロセッサ6
1のI10機能面の全部とコントロールプロセッサ10のノ4ラレル/シリアル
コンバータ18を相互接続する仁とができる。第2図に示す抵抗性負荷78はロ
ジック1状態でDIデータバス46に接続され、通常維持する。データをDIデ
ータバス46上に送出する各1乃機能プレーン(第8図参照)上にあるデータト
ランスミッタ155(7)出カパッファ86は、オープコレクタの設計になって
bる。データトランスミ、り155のディスエーブル状態は、DIデータバス4
6上にロジック1を送出する。当然、I10デーク交換サブシステムのデータレ
シーバはシリアル/ノぐラレルコンバータ18で69、CKライン38に供給さ
れるクコツク・ぐルスにより、データの受信がイ坏−ブルに々る。
従って全I10機能プレーンはI/aデータ交換サブすステムによす、コントロ
ールプロセッサ10のコンバータ18に共通に接続される。
データ交換サブシステムは、並列データワードを、並列に操作するのは容易であ
る。
m、動作
ん レベルシフト
上述したように、ある画像処理において、アレイプレセ、す6ノの基不動作は連
続する機能プレーンを介して、画像構成データを並列に、連続ソフトすることで
ある。これらのレベルシフトは、適切な種類の連、続する機能プレーンを介して
補助のすなわち画像が引き出したデータ群と共に画像データ群をシフトすること
によシ所望の画像処理アルゴリズムの特別のステップを実施するように使用する
ことができる。
多くの機能プレーンを含むレベルシフトを行うのに必要な特定のステップが第1
3図のシステムタイミング図に示される。tlにおいて、コントロールプロ1
セッサ10はコンフィギュレーンヨンラッチリセット信号をラッチリセットライ
ン26を介してプロセッサインタフェース63に出す。この信号は対応するプロ
グラマブル入力ラインの非動作状態に全コンフィギユレーションラッチ回路52
のデータビットをする。次にコントロールプロセ、す1 ou、、 各コンフィ
ギユレーションラッチ回路52にコントロールワードを書いて、プロセッサイン
タフェース63の任意数のインタフェース回路49に連続的にアドレッシングす
る。当然これらの各コントロールワード1θ、アドレッシングされるインタフェ
ース回路49に対応する機能プレーンに関してのみ機能的に定義される。特定の
機能を形成するように9能プレーンを構成するためのコントロールワードは表1
−Vの助けにより定義できる。例エバ、メモリレジスタに含孟れるデータのレベ
ルシフト用メモリ機能プレーンを構成する一方で各モノニール内の再循環を介し
てデータを保持するためには表1を参照して表■に示す所望のコントロールワー
ドを作れば良い。第13図を参照すると、それぞれt2 。
t3およびt4におりて、3つの機能プレーンをコントロールプロセッサ10が
1成する。上述したように、各インタフェース回路49のアドレスデコーダ5o
がアドレッシングされるので、ラッチイネーブル・君号が発生され、それにより
、対応するコンフィギーレーンコンラッチ回路52がコントロールワードをラッ
チ入力する。これをコンフィギユレーションサイク・レト呼ぶ。レベルシフト中
に動作状態にある機能プレーンのコンフィギユレーションサイクルが一度実行さ
れると、アレイデロセ、す61内の残りの機能プレーンが未攬成のままであシ、
それゆえ非動作状態にあり、コントロールプロセッサ10はt5においてクロッ
クのダウンカウント数をクロ、クヵウンタ2よびダート16に供給する。ダウン
カウント数はクロックカウンタおよびr−ト16にクロ、フカラントイネーブル
信号によりt6でう、チされる。この信号はさらにダウンカウントシーケンスを
開始し、ダウンカウント数で定義される。所定数のクロ、クパルスをCKライン
38上に供給する。これら各クロ、クパルスに応答して、実際の機能プレーンは
、構成に応じて、蛍−データピラトラ、データ交換サブシステムを介して送信又
は受信する。
従って第13図に示すように、16ビツト長のデータワードから成る全画像は、
16のクロックダウンカウント数てより、機能プレーン間でレベルシフトするこ
とができる。t7において、ダウンカウントシーケンスが終シ、クロ、クカウン
タおよびダート16はクロツクカウント終了1言号をコンビ=−タンステム12
に供給シ、レベルソフト動作が完了したことを示す。
表 6
コントロールワード ビット機能
□ (11−1リ 末期用
B、横方向シフト
アレイプロセ、す61のもう一つの基本的な動作はアレイの横方向のシフトであ
る。このシフトは、基本的な動作ではあるけれども、メモリおよびI10機能プ
レーンのように、最も隣接するシリアルデータを転送する能力を有した機能プレ
ーンに限定されている。
横方向のシフト動作中は、これらの機能プレーンの1つにある画像が、画像の空
間保全状態を損うことなく機能プレーン内の4つの直交方向の1つに横シフトさ
れる。画像の保全状態は、NxNモノーールアレイの北と南の端および東と西の
端に位置するモノー−ル間の循環する最も隣接する相互接続により保持される。
これにより対応する対向端に再現するようにアレイの端上でデータの数字のシフ
トが可能にする。さらに、画像は各々異る機能プレーンにあるので、任意数の画
像を、同期してかつ全体に、方向に無関係知横方向シフトすることができる。
第14図の状態タイミング図は横方向シフト動作に必要な特定のステ、デを示し
ている。レベルシフト動作のように、横シフトはコントロールワード、す10が
コントロールラッチリセット信号ttlで発生することによシ開始する。次にt
2において、コントロールプロセッサ10は1つ以上の機能プレーンを構成して
横シフトを行う。そのような場合の1コンフイギユレーシヨンサイクルを第14
図に示しである。例として、横シフトを行うためにメモリ機能プレーンを構成す
るのに必要なコントロールワードを表■に示ず。
このコントロールワードはメモリ機能プレーンを構成して、この機能プレーンに
含まれる画像の東の横方向シフトを行う。t3において、再びレベルシフト動作
のように、コントロールプロセッサ10はクロックダウンカウント数をクロ、ク
カウンタおよびデート16に出力する。t4で発生されたクロックダウンカウン
トイネーブル信号によりダウンカウント数がう、チされ、ダウンカウントシル呪
ンスを開始し、所定数のクロックパルスをCKライン38上に出力する。これに
応答して、データワードはモジエール102からシリアルにシフト出力きれ、各
東の最も隣接するモジュール102に入力される。t5でダウンカウント数
7クカウンタおよびr−ト16はクロ、フカラント完了信号をコンぎニータンス
テム12に供給シ、横シフトの終了を示す。
イ(l
コントロールワード ビット機能
C6データ入出力
従前の2つの基本動作は一般にプレイプロセッサ61内の画像の移動すなわち移
行を取扱う。しかしながら、データ入出力力作はコントロールプロセッサ10の
コンピュータシステム12とアレイプロセッサ61の入出力機能プレーン152
間の全体画像のシリアル転送を行う。
説明のためにデータ入出力動作を画像データ出力サブ動作と、画像人力サブ動作
とに分ける。これらの動作の基本部分を示すシステムタイミング図はそれぞれ第
15a図および第15b図に示される。画像データ出力動作に2いては、画像が
コントロールワード。
+f1Oからアレイプロセッサ61に転送される。この転送は2ヌテツプで行わ
れる。第15a図を参照すると、第1ステ、プはtlで開始する。このときプロ
セッサインタフェース63の全コンフィギエレーシコンラッチ回路52は名非動
作状態となるようにリセットされる。t2において、コントロールプロセッサ1
θハコンフイギーレーシヨンサイクルヲ実行シ、データ入力、横シフト東動作の
ために入出力機能プレーン152を構成する。このとき必要なコントロールワー
ドば、セフ・ンコンIll (B)で述べたようにメモリ機能プレーン横シフト
東動作を行うのに必要なコントロールワードと必須的に同一である。唯一の例外
は、EXIOビット(ビット11)がロジカル1にセットされ、■/10入カデ
ータレシーノク/セレクタ154および工り出力データトランスミッタ回路15
5がイネーブルになる。
次にt3において、コンピュータシステム12はコンバータ18に画像データ群
の第1データワード全供給する。この第1データがワードが双方向性データ/ぐ
ス40で安定状態になると、CWコントロールライン44上の負ロノックコンー
々−タ書込信号によシコンーマータ18にラッチされる。次にコンピュータシス
テム12ばt4でクロ、クダウンカウント数をクロックカウンタ2よびデート1
6に供給し、この数字は工109 *巨プレーン152のデータワードとメモ1
ルノスタ118の両方のビット長に等しいこと−7>E望し1ハ。j5jC>い
テ、コンピュータシステム12はクロックカウントイネーブルは号を供給踵それ
によシタ9ウンカウント数は、クロック・ヤルスに応答して、シ1ノアルに画像
データワードをDoライン48上に送信する。この画像データワードは、I/1
0機能プレーン152のメモ1ノモノユンスはt6で終了し、このとき全体画像
データワードがメモリモノニール102の、工/′O機肯ヒプレーンのNXNア
レイの最上行のコーナモジュール102,1に転送されたことになる。
t3で開始し、t6で終るデータ出力動作の第1ステツプ部:S次にN −1回
繰返される。その繰返しの都度、画像データ群からの新しいデータが最上行のコ
ーナモノー−ル102,1に供給され、従前そとにあったデータは連続して横方
向にソフトされ、東の最も隣接しだモノー−ル102,1から1021.nへ移
る。明らかな如<、I10機能プレーン152の全部の行には、画像の一部が供
給される。
データ出力動作の第2ステ、プでは、1行南のモノニール102の最上行のデー
タがシフトされる。これはIlo 機能プレーン152上で画像を雨に横シフト
することにより行われる。雨への横ソフトは東への横シフトと同じであり、異る
点はビット9がビット8のかわシにセットされることである。
これら2つのステップは、コントロールプロセッサ10からアレイプロセッサの
■ん機能プレーン152に全体の画像データが転送される迄連続的に繰返される
。それゆえ、動作中は、データワードの流れが西から東2よび北から南である。
第[データワードは最終的に最下行のコーナモジュール102 (で格納され、
lt 終データワードが最下行コーナモジュール102.。
に格納される。この通常のデータの流れは画像を簡単かつ効率良く、入出力機能
プレーン152のメモリレジスタ118にマツプすることができる。
アレイプロセッサ61からの画像を、コンピュータシステム12ヘミ送するデー
タ入力動作は実質的に1、でプロセッサインタフェース63のコンフィギユレー
ションラッチ回路52Iiリセットされ、tzでコントロールプロセy ? 1
0 カコンフィギュレーシコンサイクルを実行してIlo 4能プレーン152
を実行し、データ人力動作を行う。このコンフィギュレーンコンは従前のデータ
出力動作に使用されたそれと同じであ#)、EXIOM号がデータトランスミ、
り155並びにデータレンーパ/セレクタ154をイネーブルにする。
しかしtsで、コンピュータシステム12はクロックダウン、カウント数を出力
し、t4で、クロックダウンカウントイネーブル信号を出してダウンカウントシ
ーケンスを開始する。CK /4’ルスに応答して、最も隣接したデータ出力ラ
イン160上にある最下行モジュール102 のメモリレジスタ118からのデ
ータはデーIn
タトランスミッタ回路155を介してDIライン46上に送られる。このように
して出力されたシリアルデータはクロックに同期してコン・々−タ18に入力さ
れる。
ダウンカウントシーケンスの終了であるtsで、最下行のコーナモジュール10
2n5nに従前あったデータワ2
一ドがコンバータ18に転送されたことになる。従って、tsでコンビエータシ
ステム12がクロックダウンカウント完了信号を受取った後、tsで負のコノ。
クコンバータリード信号ヲCRコントロールライン42上上読出し、コンバータ
18(Cある並列変換されたデータワードを読む。tsで始まる事象とtsで終
了する事象のシーケンスは、N−1回繰返され、■A機能プレーン152内の最
下行のモジュール102からの全データワードがコンピュータシステム12に転
送される。従って、アレイプロセッサ61からの全体画像をコンピュータシステ
ム12に転送するために、横シフト肩励作を伴う上述のステ、プが操返される。
この操返しは、最初にモジュールの最下行にあったデータが最下行に整り、さら
に最下行コーナモ・クユール102n、nを介して横方向;(シフトする血行わ
れる。
画像データ人カサブオ被し−シコンと画像データ出力サブオペレー/−Iンは、
説明のためくのみ別個に説明した。これらの、f被し−ゾコンは並列に動作する
シリアル入力、シリアル出力コンバータ18を用いて、別間に動作させても良い
し、同期して動作させても良い。同時((画像全交換する場合、データ入力サブ
オペレーションとデータ出力サブオペレーションはオー/Jラップするので、各
ダウンカウントシーケンスの前に、データワードをコンバータ18に書込み、ダ
ウンカラ3
ントシーケンスの後、コンバータ18からデータワードをリードする。従って、
ダウンカウントシーケンス中は、アレイプロセッサ6ノからのデータワードがシ
リアルにコンー々−タ18にシフト入力され、アレイプロセッサ61に同時シフ
ト入力されるデータと入れ替わる。上述の両サブオペレーションのシフトンーケ
ンスが同一であることを考えると、この:うにして交換されたデータワードが各
画像データ群内の同一相対ロケーションにリード、ライトされることがわ刀)る
。従って、全画像データ群あるいは、各データ群の部分は、コントロールプロて
ッサ10とアレイプロセッサ61との間で簡単に交換することができる。上記て
クンコノ■のI10データ交換サブシステムの説明かられかるように、任意数の
画像データ群を、アレイプロでアサ6ノ内(Cある同数のr、”o @能プレー
ン152からコントロールプロセッサIOに同時に転送することができる。この
ようにするには、■A機能プレーン152は各データiDIパスライン46上に
送出するように共通に構成することができる。従ってダウンカウントシーケンス
〒に・−くつかの画像データ群からの対応するデータワードがコンバータ18に
供給される。
E、例
上述したアレイブロセ、す61の基本動作金種々の機能プレーンと組合わせるこ
とにょ)、実際にどのような画像処理アルゴリズムでも行うことができる。
アルゴリズムt−笑行するアレイプロセッサ6ノの一般的動作を説明するために
、−例金以下述べる。
サイン無し乗算例
次の′”プログラム”は−万の画像データ群刀ムら他方の画像データ群のサイン
無し乗算を行う。仮乗数が一方のメモリ機能プレーン(fvIEMZ )に供給
され、乗数が第2メモIJ i能ブレーン(W、EM2 )に供給さnる。これ
らメモリ倭罷プレー7の位置的に対応するモジーールにめるデータワードが乗算
され、中間のそして究極的に最終の汝かアキュムレータ機能プレーン(Accl
)の同様に対応するモジュールにたくゎえらnる。
前記“プログラム”に工っで行われる乗算アルゴリズムは、簡単な“シフトおよ
び加算″技術を用いている。乗算データワードは、各シリアル加算間で1ビツト
ノフトされる。この例では、必要でないが、カウンタの機能プレーン(CNT2
)を設けて、位置的に対応するモジュールの各々において、乗算データワードの
ビットサムを作シ、その動作を説明する。
被乗算および乗算データ群は、互いに補助データ群と考えることができる。乗算
積とカウンタピットサムデータ群は画像導かん数データ群と考えることかでさる
。
この例では、データワード群は4ビツト長で、モジュールメモリレジスタは、8
ビツト長でるる。このデータワードは各メモリレジスタの下位4ビツトにセット
さn、上位4ビツトなoである。
プログラム
ラ・イン アドレッシン アクティブにセ 実行さnるコンFロールノに グさ
nる機、トさnる対応 プロセ、す万ベレーシコノ1、 AC(J、 ADD、
CLK コンフィギュレーンコノサイクル2 CNTl Rコンフィ千、17′
−ソコノサイクル5 MEMI REC,O,CLK コンフィギユレーション
サイクル6 MEM2 0 コンフィギユレーションサイクル7 AC(J R
EC,I、CLK :Iンフイ−1’ユL/−ショアサイクル8 8クロ、クバ
ルスを出力
IQ MEMI RgC,CLK コンフィギユレーションサイクル13 ME
M2 REC,CLK、0 コンフィギユレーションブイクル14 CNTl
I コンフィギユレーションアイクル15 CNTl (fて非ml1作) コ
ンフィギーレーシコノプイクル16 1クロツクパルスを出力
18 4回行う迄ライン5乃至ラ
イン16のプログラム(i−4行
19 CNTl ・・・SET コンフィギュレーンコノサイクル
20 コンフィギユレーションラッチをリセット
ライン
参照番号 コ メ ン ト
1−4 AC(Jデータワードがクリアされ、加算を行うモジュールがセットさ
れ、CNT1カウンタかりセットされる。
5−9 被乗数データワードが、データ交換サブシステムの手段により乗数デー
タワ
ードのLSBと連続的に脚が取られ、
それぞn従前のアキュムレータデータ
ワードに加算される@この条件付すな
わちデータ依存型加算によシ、被乗数
と乗数のLSBとが効率良く加算される。
10−12 被乗数データワードは左に1ビツトシフトさn、次の乗算の小数点
を調整す
る。1ビ、ト左ンフトは右へ7ビノト
シフトすることによ)成される。
13−17 乗数データワードは右へ1ビ、トシフトされ、被乗数は乗数データ
ワードの
次の上位ビットと乗算さする。ノット
さ几た乗数ビットは各カウンタycよシビットブムが取らnる。
18 ライン5乃至17は乗数データの谷ビットに対し一度行われる。丁なわち
こ
の例では、4回行われるので、アキュ
ムレータデータワードは谷被乗叡デー
タワードと乗数データワードの損でめ
1−9−20 乗数データワードのビットカウントは各カワンタモジーールメモ
リレジスタ
にう、チされる。
次のようなイニンヤルデータワード群を例示したモジュールに有した単一エレメ
ントグロセノブを考えると、上述のプログラムは、次のような最終積を得る。
プログラム
イニシャル 00001110 00000101 不定 (不定)本ライン4
00001110 00000101 00000000 (00000)ラ
イン17゜
ループ1 00011100 10000010 00001110 (000
01)ライン17゜
ループ2 00111000 01000001 00001110 (000
01)ライン17゜
ループ3 01110000 10100000 olooono (ooot
o>ライン17゜
ループ4 11100000 01010000 01000110 (000
10)ライン19. 11100000 01010000 01000110
(00010)*()内の数は刀ウンタ回路の出力値でめる。
4、発明の詳細な説明
A6 カラム短絡およびフルアレイ短絡した機能プレーンこの発明は、アレイプ
ロ’Cノブ6ノ内2よびアレイブロセ、す6ノとコントロールプロセ、す10間
の多くの独特かつ刀ムなり専門化さ7″Lfcデータおよび画像の転送全可能に
する、実質的に第16図に示す、カラム短絡され、かつフルアレイ短絡されfc
懺能能プレーン240全提供る。
第16図を参照すると、カラム短絡かつフルアレイ短絡された機能プレーン24
0はモードデコーダ252、多数の刀ラムコントローラ248−250お78
よび疑似モジュール242,244.246のプレイを有している。第3図に示
す標準インタフェース回路も又、短絡されたプレーン240に含まれ、コントロ
ーにフo セフ f 10と短絡したプレーンモードデコーダ252を相互接続
する。テーブル8は、短絡したプレーン240に関して割当てられた機能ヲ有す
るインタフェース回路49のコンフィギユレーションラッチ回路52の各ビット
のリストと機能を示す。
短絡し罠ブレーン24θの疑似モジュール242゜244.246のアレイはア
レイプロ七ノブ6ノ内の種々の機能プレーンのモジュールアレイに相当する。
疑似モジュールプレイには、多くの異る種類の疑似モジュールがのる。これらの
モジュールはコーナ疑似モジュール244(第21図)、2よび標準疑似モジー
ール242(第22図)を有している。疑似モジュールアレイは、通常、最上性
疑似モジーール244でめル疑似モジュールアレイの最上新円に位置するので、
多くのカラムとして定義される。この例外として、アレイの一端に位置する刀ラ
ムの最上性にめる疑似モジュールがコーナ疑似モジュール246であるというこ
とである。各列の疑似モジュールは列データバス256により相互接続される。
列データバス256は、第5a図に示すエレメントプロセッサデータ交換サブン
ステム74と機能的に同等の列データ交換サブシステムの特表昭59−5008
3 (22)
一部である。
疑似モジュールの列には、多くの列コントローラ248.250が相関している
。第18図に示す標準列コントローラ248は、第19図に示ず経列コントロー
ラ250に相関する端列を除いて疑似モジュールアレイの各列と相関している。
列コントローラ248゜250は、それぞれの列データ交換サブシステムの列デ
ータバス256により、疑似モジュール列と相互接続されている。列コンl−ロ
ーラ24s、tsou更K、各コーナ又は上列の疑似モジュール246.244
から上列データライン258にょシデータを得ている。
列コントローラ248.250はさらに多くのチータラインおよびコントロール
ライン254(これには第17図、第18図2よび第19図に示すライン276
゜278.280,282−7fi含まれる)、 26z4e4゜274により
相互Haされている。
疑似モジュールアレイのコーナおよび最上列疑似モジュール246.244およ
び列コントローラ248゜250は、コントロールラインおよびデータライン2
54.262,264.274によりモードデコーダ2.52 、コーナ疑似モ
ジュール246の最上列チータライン258および最上列モードセレクトおよび
アレイデータイネーブルライン266.268に相互接続されている。モードデ
コーダ252は、インタフェース回路49およびコンフィギユレーションバス5
6ヲ介シてコントロールプロセッサ10により供給さnるコントロールワードを
デコードするように設けられている。従って、短絡され1ヒ硯罷プレーン240
の対応する動作構成が作られる。システムクロ、り(CK )ライン38は、D
Oう1ン48およびDIライン46と共ニ、コントロールライン、す102よび
モードデコーダ252に相互接続さnている。短絡さnfc機能プレーン240
の種々の講成部とその動作構■が後述す表 8
列短絡2よびフルアレイ
短絡された機能プレーン
ビット コ媚沖、り 名称 動作状態 機 能1 工 入力 ハイ データ交換
サブンステムを介してデータ入力をイネーブルにす
る。
2 0 出力 ハイ データ交換サブン2テムを介してデータ出力をイ坏−ブル
にす
のメモリレジスタへの転送全イ
ジスタへデータの転送をイネ−
する列のメモリレジスタへ転送
することをイネーブルにする。
ビット シ崎沖ツク 名称 動作状態 硯 能9 ADE 7L/1データ ノ
・イ 疑似モジュー)しからおよび疑似イネゴル モジュールへのデータの転送
を選択する。データは選択さ0尺
モードに従って、それぞれ、フ
ルアレイ又は列の残りの疑似モ
ジーールに、コーナ又は最上性
疑似モジュールのいずれ7J為から
転送される。
ロウ 疑似モジュールから又は疑似モ
ジュールへのいずt〃1のデータ
の転送を選択する。データ源は
α圧信号およびMS信号に応じ
てDOライン又にカラムメモリ
1そり″ DIライン上にデータの転送tイネーブルにする。データに出
力信号およびMS信号に応じて
Noが取らnる。
B、疑似モジュールアレイ
標準の、最上列およびコーナ疑似モジュール242゜244.246は、各モジ
ュールが、第5a図のエレメントプロセッサデータ交換サブシステム74に使用
さnるものと実質的に同一の相関アレイプロセッサデータバスライン66、カラ
ムデータバス256、および1対のデータトランスミ、りをMしている。データ
トランスミッタは、822図の標準疑似モジュール242に、最も明瞭に示され
ている。データトランスミ、夕は、エレメントプロセッサデータバス66と列デ
ータバス256との間に、方向全反対にして並列に接続さnゐ。第1のデータト
ランスミッタに椰ケート326と反転万一ブンコレクタ出カバ、ファ86とで構
成さfている。
第1トランスミツタはエレメントプロセッサデータバス66からのデータを受取
り、反転して、■プログラマブル入カライン328上の入力信号の印加により、
ANDゲート326がイ坏−ブルになると、列データバス256上に送信する。
従って列データバス256は各相関する疑似モジュール群の第1データトランス
ミツタにより供給された反転データを集合的にANDヲ取る。見てわかるように
、この列データは、第1データトランスミ、りにより受信した集合データのOR
’i(取るように順次反転される。第2テータトランスミッタ5
も、ANDゲート327と反転オープンコレクタ出力)(ラフ766で構成され
、補償機能を行う。すなわち列データバス256からデータ金受取り、反転し、
コンフィギュレーンコノノくス56上のコントロールプロセッサ10により供給
さnる、0プロゲラマフ゛ル入カライン330上の出力信号により椰ゲー)32
y7);イネーブルになると、エレメントプロセ、サデータフ(ス66上に出力
する。し刀・しながら、送信されたデータは実際には反転されない。というの(
,1、夕1jデータノくス256上の疑似モジュールに供給さnる前に又反転さ
nibからでりる。
こnらの凛準疑f以モジュール242は多くの疑似モジュールアレイでaHさル
ている0当然)最終行の疑似モジュールアレイにめる標準疑似モジ=゛−7・し
242に相関する列データフくス256は、第1テータトランヌミツタの万一ブ
ンコレククノ(ラフ786の出力2よび第2データトランクミ、りの后のゲート
327のデータ入力に接続された後ターミネーションさ几、乙。
最上性疑似モジーール244は必然的4で標準疑似モジュール242と同一であ
る。し刀)しな刃1ら、第2−プルにする付加回路tモジー−/し244(ζM
している点でモジュール242と異る。この打力ロ回路はインバータ334とN
ANDケート332を石している。出刃信号がN4NDゲート332の0プログ
ラマブルン330′に印加され、コーナ疑似モジュール246により発生され、
最上行出力デイスエーフ゛ルライン27286
テム74に出力される。
第20図に示す、コーナ疑似モジュール246を参照すると、モジュール246
内の付刀口回路は、最上列疑似モジュール244にもめるインバータ334およ
びNANI)ゲート332と共にANDゲート336を有している。コンフィギ
ユレーションバス56フc介してコントロールプロセッサ1oにょ)供給される
アレイデータイネーブル信号i ADEプログラマブル入カシカライン286上
ンバータ334に印刀口さルる。この信号はハイレベルになると第2テータトラ
ンスミ、りによるデータの転送をディスエーブルにする。丁度同様に最上列の出
力ディスエーブル信号はハイレベルになると、最上列の疑似モジュール244の
第2テータトランスミノタtナイスエーブルにする。アレイデータイイ、−プル
信号は、MSプログラマブル入カライン288上に供給されるモードセレクト信
号と共にANDゲート336に印加さn1最上列の出力ディスエーブル信号を発
生する。モードセレクト信号の状態により、アレイデータイネーブル信号が最上
列の出力ディスエーブルライン272上でゲート制御され、そこから最上列の出
力ディスエーブル信号のように全ての最上列の疑似モジュールに供給される。従
って、モードセレクト信号がロウレベルのとき、最上列の出力ディスエーブル信
号が、アレイデータイネーブル信号の状態にががわらず非動作状態に保持さする
。このような状態では、アレイデータイ坏−プル信号がハイレベルになると、コ
ーナ疑似モジュール246の第2テータトランスミノタのみがディスエーブルに
なる。これにょシコーナエレメントグロセノブデータバス66がらのデータが対
応する列コントローラ248およびモードデコーダ252に最上列データライン
258を介して入力が可能でうり、他方、短絡された疑似モジュールアレイ内に
りる他のすべての疑似モジュールに相関するエレメントグロセノブデータ又換サ
ブシステムに出力される。
C3列コントローラ
分離列コン)o−ラ24B、250は各列の疑似モアニールアレイに相関してい
る。列コントローラ248.250は災質的に他と同一である。標準列コントロ
ーラ248と終刊コントローラ:zsO(疑似モジーールアレイの端にめる焚似
モジーール列と相関している)との差は後述の如く明ら刀)である・第18図全
参照すると、標準列コントローラ248は3つの主サブユニットで構成さnてい
る。こnらのサブユニ、トハ列メモリレジスタ318.3万同テータセレクタ3
04および4万同テ一タセレクタ/列データトランスミ、り320でめる。連続
して@接する標準列コントローラ248のいずれ刀・1つを考えると、メモリレ
ジスタデータ転送ライン264全介して、そ8
の前に隣接した標準列コントローラ248からメモリレジスタ318の最上位ビ
ラトラ介してシリアルデータが入力される。データは、内部クロノクライン29
6に供給された一連のクロックパルスに応答してレジスタにシリアルにクロック
入力される。データはメモリレジスタデータ出力ライン341.343f介して
最上位ビット又は最下位ビット位置のいずれ刀・〃・ら3方向データセレクタ3
04に供給される。前記データ出カライン341,343は対応するMSBプロ
グラマブル入カシカラインびLSBプログラマブル入カシカライン34042の
最上位ピントの状態により選択さnる。3方向テータセレクタ304への第3デ
ータ源は連続して隣接する列コントローラ248の列データ又換すブンステムデ
ータバス256である。各列コントローラ248.250に2いて、インバータ
322は対応する列データバス2567)hら、OR’z取った列データライン
262上の先行するm=する列コントローラ248へのデータ全バ、ファリング
するために設けらnている。従って、刀うムデータに、ORを取った列データラ
イン262’(、連続する隣舐する列コントローラ248.250のORを取っ
た列データライン262)上に3方向データセレクタ304によシ受信され、O
UTプログラマブル入カシカライン290上給されたOUT信号によりイネーブ
ルになると、メモリレジスタテータ転送うイン264′上の連続する隣接列コン
トローラ248.250に戻る。この煤果ORを取ったデータが列データ変換サ
ブシステムにより果めらn、インバータ322が対応する列メモリレジスタ31
&VC6送さnlこれによりアレイプロセッサ61円の特定の列のエレメントプ
ロセッサ内に=2+るデータの属性の夛示を得ることかでさる。3方向データセ
レクタ304〃)らのデータは列コントローラ248内の4方向テータセレクタ
/トランスミツタ320にも供給さnる。
このデータは、4ウエイテータてレジタ/トランスミッタ320がモードデコー
ダ252により発生さn1メモリレジスタテータリターンライン282上に供給
さfるメモリレジスタデータリターン信号全受取ると、列データ父換すブンステ
ムデータバス256上に出力さγしら。4ワエイテータ/セレクタトランスミ、
り3201g、よるデータ出力は反転万一プンコレクタ出カバ、ファ86を介し
てデータバス256上に出力される。抵抗負荷を設けることによシ、4ウエイテ
ータセレクタ/トランスミツタ320は機能的に各列データ交換サブシステムデ
ータバス256に相関するデータトランスミッタのいずれかに等しい。
4ウエイテータセレクタ/トランスミ、り320はさらに、最上行データライン
258を介して対応するコーナ又は最上性疑似モジュール246.244のエレ
メントプロセッサデータバス66からのデータをも受取る。列データバス256
へのこのデータの転送はモードデコーダ252により発生され、最上行データリ
ターンイ坏−ブルライン276上に供給さ扛る最上行データリターンイネーブル
信号によりイ坏−ブルになS0同様に、コーナデータリターンライン280上の
コーナ疑似モジュール246のエレメントプロセッサデータバス66、およびア
レイデータ入カライン27?:上のコントロールプロセ、す10刀ムらの列コン
トローラ248,250の全部の4ウエイデータセレクタ/トランスミツタ32
0にデータが供給さ0る。
この最後の2つのデータ源はデータ全2者択−で供給する。すなわち、いずnか
が非動作のとさ、油に対してこのデータがイ坏−プル信号として作用し、ぞnに
ニジアクティブなデータ源全各列データフくス256上にバッファリングする。
/I!r標準列コントローラ248はさらに、全体のアレイのエレメントプロセ
ッサ60からのORi取ったデータを得るのに使用される。これi ANDゲー
ト324會用いて、連続して隣接する列コントローラ248゜250のORを取
るアレイデータライン274′上に供給されるデータを対応する列データフくス
256からのデータと結合する。次にこのデータは、OR會取ったアレイデータ
ライン274上の先行して隣接する標準列コントローラ248に供給される。こ
れによ)、アレイプロセッサ61に含まれるデータの属性を示すように、各列デ
ータバス256〃・らのデータが連続して結合される。
第19図を参照すると、終刊コントローラ250は実質的に標準列コントローラ
248に同一でめる。
2種類の列コントローラ間の違いは、終刊コントローラ250は連続して隣接す
る列コントローラを有しないということに基く。従って相関するメモリレジスタ
318からデータを選択するには2ウエイデータセレクタ306のみ必要になる
。2ウエイテータセレクタ306からのデータ出力は、終刊データリターンライ
ン270を介してモードデコーダ252に供給される。
又、ANDケート324は不要となシ、相関する列データバス256からのデー
タが、ORi取ったアレイデータライン274上の先行して隣接する標準列コン
トローラ248に直接供給される。
D、モードデコーダ
モードデコーダ252は列コントローラ248゜250およびコーナ疑似モジュ
ール246および短絡されたプレーンインタフェース回路49のコンフィギュレ
ーンコノラッチ回路52との間のインタフェースとして動作する。茨8はインタ
フェース回Wr49/−Eニードデコーダ252インタフェースにある信号ノリ
ストと機能説明を表わしたものである。これらの信号の状態は、上述のセクショ
ン3.Aで述べたような適切なコンフィギーレーシコノサイクルを実行するとさ
、コントロールグロ(ノブ10により作り出されるのが望しい。
モードデコーダ252と列コントローラ248゜250との間のインタフェース
は、モードデコーダ252が単に先行する隣接列コントローラとして見えるよう
に、設けられている。ANDゲート300は、クロックイイ、−プル信号がCL
Kプログラマブル入カシカライン294上るときに、CKライン38からの7ス
テムクロノクバルスを内部クロ、クライン296上に選択的にゲート制御するの
に使用される。モードデコーダ252は更に2ウエイデータセレクタ298に有
し、7リアルデータを、メモリレジスタデータ転送ライン264′上の標準列コ
ントローラ群248の一番口コントローラに供給する。データは初めにアレイプ
ロセ。
すDOライン48から受取り、データ出力イネーブル信号−7E Dogプログ
ラマブル入カライン292に供給されたとさ、后のゲート302により2ウエイ
データセレクタの入力ライン303の−1にゲート制御して出力する。このデー
タを2ウエイデータセレクタ298の出力に転送するにid、MSプログラマブ
ル入カライン上のモード選択信号が存在しなければならない。データは更に第1
の連続的に隣接する標準列コントローラ248のORi取った列データライン2
62′から2ウエイテータてレクタに供給でれる。このORヲ取った列データは
OUT信号がOUTプログラマブル入カシカライン290上在するとき、2ウエ
イデータでレクタ298の出力に転送される。
デコーダプロ、り30Bはモードセレクトおよびアレイデータイネーブル信号全
デコードし、2ウエイデータセレクタ入カライン303からのデータと、コーナ
疑似モジュール246から最上性チータラインを得、それにより最上行データリ
ターンイネーブル信号およびメモリレジスタデータリターンイネーブル信号全発
生する。コーナ疑似モジュール246のエレメントプロセッサデータバス66が
らのデータの受信と、コントロールプロセッサ10からコーナデータリターンラ
イン280およびアレイデータ入カライン276への転送とを、デコーダブロッ
ク308刀工行う。NANDゲート344は、2ウ工イデータセレクタ人カライ
ン303 @−らのシリアルデータを、インバータ312によって反転されたモ
ード選択信号によシイネーブルになったとき、シリアルデータライン/コーナデ
ータリターンイネーブルライン278に転送する。ANDケート346は、イン
バータ340によシ反転されたアレイデータイ坏−ブル信号とモード選択信号を
結合する94
ことにより、ライン282上にメモリレジスタデータリターンイネーブル信号を
供給する。
最後に、最上行チータライン258上にらるコーナ疑似モジエール246からの
データが、NANDケート350によりゲート制御され、コーナデータリターン
ライン/シリアルデータイネーブルライン280上に出力される。このデータ転
送は、インバータ312により反転されたモードセレクト信号とアレイデータイ
ネーブル信号と全結合することにより、イネーブル信号を発生するANDゲート
348によりイイープルになる。
モードデコーダ252は更にデュアルデータトランスミ、タブロック310を有
し、/リア8データ全1DIライン46全介してコントロールプロ47す10に
供給する。データは終刊データリターンライン270およびOR七取りたアレイ
データライン274’ IFlgtc iれたデュアルデータトランスミッタプ
ロ、り310によ)受信さnる。トランスミ、りは標準のデータトランスミッタ
講瓜でめシ、谷々はNORゲート802よびオープンコレクタ出カバ、ノア8G
全有している。
NANDゲート316は、終刊データリターンライン270からのデータの転送
をイネーブルにするために設けられている。イネーブル信号は、ADIプログラ
マブル入カシカライン284上給されたモードセレクト信号お95 1N表昭5
9−50118 :3 (2のよびアレイデータ人力イネ−プル信号との結合力
)ら発生される。同様に、NANDゲート317はインバータ312によシ反転
したモードセレクト信号と、インバータ314により反転された、0R−f(取
ったアレイデータの、DIライン46への転送をイネーブルにするアレイデータ
人力イネ−プル信号とを結合する。
最終的に、モードデコーダ252は、MS>よびAJ)Eプログラマブル入カラ
イン288,256上にろるモードセレクト信号およびアレイデータイネーブル
信号を供給することにより、コーナ疑似モシー−ル短絡した機能プレーン240
は、アレイグロセノブ6ノ内2よびコントロールプロセ、す10およびアレイプ
ロセ、す61間のデータ又は画像データ群を操作および転送するためのいくつか
の独特の万ベレーシコノモードで動作できる。しかし、必然的には、8つの基本
的な短絡したブし・−ン機能モードがある。これらの8つの基本モードは、ユー
ティリティモード、短絡プレーンモー ド、めるいはOR上取ったデータモード
として分類される。この8つの基本モードを、カテゴリおよび対応するコントロ
ールワードと共に畏4に示す。
ユーティリティモードは、シリアルデータDI 466
ラインおよびD048ラインを介して、列コントローラ248.250のコント
ロールプロセ、す10と列メモリレジスタ318間のデータの転送を供給すS0
従って2つの基本的なユーティリティモードがある。この第1モードは“シリア
ルデータ出力刀)ら列メモリレジスタ″への転送全供給する。DOライン48上
のデータが、DOFJプログラマブルライン292上に62データ出カイ坏−プ
ル信号によ一すイネーブルさnる氏ゲート302f介して、さらに、応プログラ
マプル入カライン288上のモードセレクト信号に工りイ不一プルになる2ウェ
イデータセレクタ298t−介して、列メモリレジスタデータ転送ライン264
′上にゲート制御され、出力される。このデータは、CLKプログラマブル入カ
シカライン294上ロ、クイネーブル信号によシイ子−プルになる、ライン38
上の7ステムクロツク(CK )信号に応答して連続する列メモリレジスタ31
8に、クロックに同期して入力される。このデータは、所望のデータが各列メモ
リレジスタ318にある迄、列メモリレジスタ318および列コントローラ24
11.250の各々の3ウエイデータセレクタ304を介してシリアルに転送さ
れる。
第2の基本ユーティリティモードは、“列メモリレジスタからシリアルデータ入
力”ラインからのデータの転送を供給する。このモードでは、各列メモリレジス
タデータは連続する列メモリレジスタ318および相関する3ウエイデータセレ
クタ304を介して、クロックに同期している。そこからのデータは終刊コント
ローラ250の列メモリレジスタ318を介して送られ、さらに相関する2ウエ
イデータセレクタ306を経て終刊データリターンライン270上に出力さnる
。このデータは、モードデコーダ252のテユアルデータトランスミノタブロッ
ク310によりシリアルデータDIライン46上に転送される。短絡したプレー
ン240のコントロールプロセ、す10と列メモリレジスタ318との間でデー
タの同時又換金行うように、2つの基本ユーティリティモードヲ結合することが
できる。さらに、これらのデータ転送は、それぞれMSBプログラマブル入カシ
カライン34θよびLSBプログラマブル入カシカライン342給さnる最上位
ビットおよび最下位ビットの状態に応じて、最上位ビットか、るるいにフルデー
タワードとして、オプションで選択できる。さらにデータ転送中にシステムクロ
ック(CK)パルスの数を、短絡したプレーン240に供給するこ00
サデータ交換すブンステム74を介してアレイプロセッサ61の種々の機能プレ
ーンにデータ転送する。4つの基本的な短絡プレーンモードの第1モードはコン
トロールプロセ、す10から、全エレメントブロセ。
サデータ交換サブシステム74にデータ転送を行う。
これをフルアレイ短絡モードと呼ぶことができる。コントロールグロで、す10
によジノリアルデータDOライン48上に供給されるデータはシリアルデータラ
イン/コーナデータリターンイイ・−プルライン275に転送され、そこから列
コントローラ248,250の4ウエイデータセレクタ/トランスミツタ320
の各科に転送さnる。このデータは次に、疑似モジュール242.244.24
6の第2データトランスミツタを介して各列データ交換サブシステムデータバス
256に出刃さn、さらに相関するエレメントプロセッサデータ交換サブシステ
ムデータバス66に出力される。
これにより、上述のセクション3.Aに言述したように標準アレイプロセノブレ
ペルンフト動作中に、単一シリアルデータヮードヲDOライン48上に出力する
ことによシ、アレイプロセッサ61内の共通データワード群の画像データ群を作
ることができる。
第2の基本的な短絡モードは、フルアレイ短絡モードの主たる変形である。この
モードは、コーナ疑似モジュール246に相関するエレメントプロセラサブ01
一タ交換サブシステムデータバス66から得たデータt ’A リのエレメント
プロセッサデータバス66に供給する。コーナ疑似モジュール246の第2デー
タトランスミ、りはADFJプログラマブル入カライカライン286上されるア
レイデータイネーブル信号によりディスエーブルされ、コーナ疑似モジュールの
エレメントプロセッサデータバス66上のデータ衝突全防止している。そこから
受取ったデータはモードデコーダ252のデコーダブロック308を介して、列
コントローラ248.250の4ウエイデータセレクタ/トランスミ、り320
の各々にゲート出力され、そこから、フルアレイ短絡モードで残シの疑似モジュ
ールアレイに送られる。このコーナからフルアレイ迄短絡するモードによシ、標
準アレイプロセ、サレペルラフト万ペレーンコノ中に共通データワード群の画像
データ群の発生が可能になる。共通データワードは、万すジナルの画像データ群
内に従前めった単一データ〃・ら派生しているので、発生した画像データ群はデ
ータに依存していることは明らかである。又あるオリジナルの画像データ群内に
あるデータワードが、オリジナルの画像データ群に対して、上述セクション3.
Bの適切な数の標単横シフト動作を行うことによシ、共通データワードとして選
択できることも明らかでらる。このコーナからフルアレイ迄短絡するモードは、
データ依存の共通値画像データ群を発生し、それを使用して、データを正規化す
るように、画像データ群からの共通値をそれ自身に加算又は減算、あるいは、他
の画像データ群の共通値に加算又は減算することができる。
第3の基本的な短絡プレーンモードは、列メモリレジスタ318から、各列デー
タ交換サブシステムへデータを転送し、そこから対応するエレメントプロセッサ
データバス66へ転送することができる。この列短絡したモードでは、データは
、列メモリレジスタ318から、相関する3ウエイデータセレクタ304および
2ウエイデータセレクタ3θ6を介して、列コントローラ248.250の4ウ
エイデータセレクタ/トランスミ、り320に、クロックに同期して送られる。
モードデコーダ252のデコーダブロック30&により発生するメモリレジスタ
データリターンイネーブル信号によシイネーブルになる4ウエイデータセレクタ
/トランスミツタ320は、データ全各列データ交換サブンステムデータバス2
56に転送する。0プログラマブル入カライン330,330’上に供給された
出力信号によりイネーブルになる疑似モジュール242.244,246の第2
データトランスミツタはデータを各相関するエレメントプロセッサデータ交換サ
ブシステムデータバス66に供給する。従って標準アレイプロセッサレベルシフ
トオペレーション中に102
列メモリレジスタ318からデータが転送されるので、各列メモリレジスタ31
8にあるセパレートデータに対応する共通データ刀・ら成る画像データ群がプレ
イプロセッサ61円で作られる。このような画像データ群は、マトリックス乗算
を行うのに必要な乗算画像データ群として有効である。
基本的な短絡プレーンモードの最後のモードは列短絡モードのデータ依存変形例
である。コーナおよび最上列疑似モジュール244,246に相関するエレメン
トプロセッサデータバス66からのデータを、実質的に列短絡されたモードで残
シの疑似モジュールアレイに相関するエレメントプロセッサデータバスに供給す
る。従って、このモードは最上行−列短絡モードと呼ぶことができる。このモー
ドでは、コーナおよび、最上性疑似モジュール244.246の第2データトラ
ンスミ、り244.246の全てが、MSライン288およびADEプログラマ
ブル入カシカライン286上−ドセンクトおよびアレイデータイネーブル信号を
供給することによりディスエーブルされる。これによシ、コーナ3よび最上性疑
似モジュール244.246に相関するエレメントグロセソサデータフくス66
からのデータが、データ衝突なしに各列コントローラ248゜250の4ワエイ
データセレクタ/ドライノく320に転送可能になる。モードデコーダ252の
デコーダブ103 翁表昭59−501183 (28)ロック308によシ発
生する最上行データリターンイネーブル信号によりイネーブルになる4ウエイデ
ータセレクタ/トランスミツタ320は、このデータを相関する列データ交換サ
ブシステムデータバス256に転送する。データはそこから、0プログラマブル
入カライン330に供給される出力信号によシイネーブルになる標準疑似モジュ
ール242の第2データトランスミ、りを介して、相関するエレメントプロセッ
サデータバス66に転送される。従って、最上行−列短絡モートによす、標準レ
ベルンフトオペレーシコノ中ニオリジナルの画像データ群にるる最上性のデータ
から同時にコピーされる同一行のデータで構成されるアレイプロセッサ6ノ内に
画像データケ作ることができる。
このモードは、被乗数マトリックスがコントロールプロセッサ10内に同時に無
い場合のマトリ、クス乗算に特に使用される。最上行−列短絡モードのデータ依
存の性質により、乗算を行うのに必要な乗算マトリ。
クスを決定するようにコントロールプロセッサ10に被乗算マトリックスを転送
する必要が無い。
プレイプロセッサ61内では、他の機能プレーンとのモジュールアレイに対して
短絡プレーン疑似モジュールアレイの位置決めは、厳格でない。従って、いくつ
かの短絡された機能プレーンを互いに直交する列配置を有するアレイプロセッサ
61内にもうけること04
ができる。これにより、プレイプロセッサ61はプレイプロセッサ61内の列煙
絡および行短絡されたオペレーションの両方を行うことができる。データ依存動
作を含む基本的に短絡されたプレーンモードを使用してて、短絡データを送信す
る短絡プレーン疑似モジュールアレイの部分に相関するエレメントプロセッサデ
ータ交換サブシステムデータバス66上のデータ衝突を防止する。適切なマスク
画像の使用を後述するセクション4.Fに例示する。
最後の2の基本短絡されたプレーン配置はORデータモードと呼ぶことができる
。これらのモードによシ、コントロールブロセ、す10は早急に全画像データ群
又は各列のデータ内にあるデータの性質の聚示を得ることができる。OR’iz
取ったデータフルアレイ短絡モードは、エレメントプロセッサデータ交換サブシ
ステムデータバス66上の全データのORi取り、その結果全ソリアルデータD
Iライ/46金介してコントロールプロセ、す10に供給する。特に、エレメン
トプロセッサデータバス66上に66データが■プログラマブル入カライン32
8上に供給される入力信号にようイネーブルになる疑似モジュール242,24
4.246の第1データトランスミツタにより受取られる。このデータは第1デ
ータトランスミツタのオープンコレクタ出力バッファにより反転される。これに
よ)各列デ05
一タバス256の状態を、相関するエレメントプロセッサデータバス66上にめ
るデータのNORに反訳させる。このデータは先行して隣接する列の疑似モジュ
ールアレイの対応データとANDが取られ、モードデコーダ252に供給される
。このモードデコーダ252で、インバータ314によ逆反転され、デュアルデ
ータトランスミツタブロック310によりシリアルデータD■ライン46に転送
される。従って、エレン7 ) 7’ 。
セッサデータバス66上にめるデータがロジ、り1であれば、DIライン46の
状態もロジック1になる。この動作は画像データ群がノンゼロデータ全有してい
るかどうか全部判断するのに特に使用さ0る。
第2の基本的なORデータモードはORフルアL/イ短絡モードの列配置バージ
ョンを供給する。ORデータ列短絡モードでは、各列データ交換ザブ7ステムデ
ータバス256上にめるデータは先行する隣接標準列コントローラ248の3ウ
エイデータセレクタ304又はモードデコーダ252の2ウエイデータセレクタ
298、およびインバータ322を介して対応する列メモリレジスタ318に転
送される。従って、データ金各疑似モジュール列の各々に相関するエレメントプ
ロセッサデータバス66に供給することにより、列データのORが各列メモリレ
ジスタ318に同期シフトされる。
従って、カラムメモリレジスタデータはカラムメモリ106
レジスタからシリアルアータ入力への動作によりコントロールブロセ、す10に
転送することができる。これにより各列メモリレジスタ31Bからのデータがコ
ントロールプロセ、す10に、各列の画像データ群がノンゼロデータを有してい
るかどうか、更にノンゼロビットデータの特定のビット位置に関して直接衰示を
行う。この動作は、画像データ群内にノンゼロデータが存在することに9示して
ORデデーフルアレイ短絡モード万ペレーショコノ行われるとき特に使用される
。
次にORを取ったデータ列短絡モードオペレーションによシノンゼロデータが、
現在ある列およびその列データ内のビット位置に関してローカライズすることが
できる。当然、直交方向に配置された疑似モジュール列を有するプレイプロセッ
サ61内にある第2短絡機能プレーン240は、ノンゼロデータが存在する行を
ローカライズすることによりノンゼロデータを更にローカライズするのに使用す
ることができる。
21例
アレイプロセ、す61FE3の短絡機能ブレーン240の基本動作は任意数の画
像処理アプリケーションにおいて画像データの処理を迅速に処理するのに使用す
ることができる。当然、短絡機能ブレーン240の動作は上述した基本動作に限
定されない。しかしながら、シーケンシャル又は同時に基本動作モードを結合し
、107 viiao59−5ona3(29)短絡機能プレーン240の全有
効動作モードを構成することができる。アレイプロセッサ61内の短絡機能デー
タ依存例
短絡動作例
次の゛プログラム″はデータ依存画像データ群を発生するように最上行−列短絡
モードオペレーションを行う際に短絡機能プレーン240を使用する場合のもの
でめる。万すジナルの画像データ群は一方のメモブレーン(MEM2)は中間画
像データ群ストレージとして使用される。第3メモリ機能プレーン(MEM3)
は短レーンにコントロールプロセッサ10によシ供給されるマスク画像データ群
を受取シ格納するのに使用される。最後に、最上行−列短絡モード万ベレーシコ
ノを行うのに単一短絡機能ブレーン240(SFPl)が供給される。
この例のためにデータワードとメモリレジスタは所定の8ピツ)−&’e有して
いる。
08
プログラム
アドレス付動作状態にセ
l l101 CLK コンフィギユレーションサイクル2 1CKパルスを出
力
4 Ilo J CLK、EXIO,コンフィギユレーションサイクルEI、M
SB
5 Doライン上に供給される全ロ
ジック1のシリアルデータス
トリングと同期してNCKパル
スを出力する。
6 コンフィギュレーンコノラッチ全
すセ、ド
ア MEMI CLK、O,RECコンフィギュレー/ヨ/サイクル8 110
1 0、MSB コラフィギーレーショ/サイクル9 MF、M2 CLK、I
コンフィギユレーションサイクル10 8CKパルスを出力
11 コンフ全イセレーションラッチ全リセ、ト
12 Ilo 1 0.MP+B、POL コ7フイキュl/ ’/*:/サイ
クル13 MEMJ CLK、I、RFCコンフィギユレーションサイクル14
8CKパルスを出力
15 コンフィギュレーションラ、、チfリセット
09
アドレス付動作状態にセ
ラインされた機能 、トされた対応 実行されるコントロール16 MEM、?
CLK、0.RECコンフィギユレーションサイクル17 3FPJ O,M
S、ADE コンフィギユレーションサイクル18 MEM3 CLK、I コ
ンフィギユレーションサイクル19 8CKパルスを出力
20 コンフィギユレーションラッチをリセット
1−3 Ilo 1マスクプレーンにおいて、メモリレジスタの最上位ビットが
クリアされる。
7トがクリアされる。
7−11 ソースイメージデータとマスクイメージデータのレベルシフトが、中
間画像データ群ストレージプレーンを■Y2にセットする。データ交換サブシス
テムはオリジナル画像(、MEMl)と、マスク画像データ群(IloZ)のク
ロ。
りされない最上位ビットのANDを取シ中間データ群を形成する。最上性のデー
タが万すジナル画像のデータに相当し、ibO行がすべてロジックOのデータを
有してい110
12−15 h(EM2中間中間画像データトストレージブレーンしてマスク画
像が反転され、再びレベルシフトされる。このプレーンで画像が、中間画像デー
タ群の再循環データとORが取られる。残シの中間画像データ群はオリジナル画
像のデータに対応する最上性のデータを有し、残シの行は全てロジック1のデー
タを有している。
16−20 5FPJ短絡機能プレーンを介してMEM3画像デスティネーショ
ンブレーンに中間画像のレベルシフトを行う。
MEM2最上行モジ=−ルのセパレートデータは相関するエレメントプロセッサ
データ交換サブシステムに対する各列データ交換サブ/ステムによシ短絡される
。■溝3に格納される残りのデスティ2−7コノ画像はソース画像の最上性に対
応する行データ1石し、各列内のデータは共通で)る。
2列×4行エレメントプロセッサセクションのアレイプロセッサ61を考えると
、上述のプログラムはイニシャル IL 1 b lX X X X −X X
IL2b2 XX XX ’ XX
a3b3 XX XX −XX
a 4 b 4 X X X X X Xライン4 albloo XX −−
×;<j2b2 oo xx −−XX
a3b3 00 XX −−XX
111 待表昭59−501183 (30)ライン7 aIJ 11 XX
−XXa2b2 QQ XX XX
a3b3 00 XX −−XX
a4b4 00 XX −XX
ライン1.2 aIJ 11 alJ −−XXa2b2 00 00 −−
XX
a3bs 00 00 −− XX
a4b4 00 00 XX
ライン16 albl 00” albl −−XXIL2b2 11 11
−一 〆×
a3b3 11 11 XX
a(b4 11 11 −− xX
END ILlbll 1 albl−albla2b2 00 11 a1b
1
a3b3 00 11 a1b1
a4b4 00 11 alb□
××=不特定データ
本 MSB (7)みを表わすデータ
本*、、 SFP 1プレーンにデータが格納されないす 極性反転によるM列
データ
システムとのデータ転送のための列短絡およびフルアレイ短絡された機能プレー
ンについて開示した。この12
機能プレーンにより、モジーラアレイプロセ、すは迅速かつ効率良く、マトリク
ス操作やノンゼロデータ検出およびノンゼロデータ配置のような多くの特殊なデ
ータ処理動作を行うことができる。
上述の好適実施例の説明からこの発明は種々変形実施できることは明らかである
。それゆえ添付したクレームで述べたこの発明の精神と範囲から逸脱することな
く、この発明が、上述の実施例以外にも実施できるO
ig3
60
Figl○
Fig13
フロノア 、 tllllllllllliIL−一一Fig14
シヌ7′へ70・/7 1111111111111111111111111
1111111111111 1 II
↑I’2 ’3↑4 ’5
手続補正書(方刻
昭和59忽4月)7日
1、事件の表示
P CT / U S83 / (+ 09532、発明の名称
モジュラ−アレイプロでツサに使用する一列をytrjL、、かつ事件との間際
特許出跳人
名称 ヒユーズ・エアクラフトeカンパニー5 補正命令の日付
国際調査報告
Claims (1)
- 【特許請求の範囲】 1、複数のレギュラープレーナアレイとして相関する多数の機能モジュール(5 8)を有し、前記アレイによシ各モジュールは機能プレーンを形層し、さらに複 数のエレメントプロセッサ(6o)として相関し、各プロセッサは動作可能に相 関したデータバス(66)を有し、前記アレイプロセッサ(61)の動作はコン トロールプロセッサ(10)により指示され、前記コントロールプロセッサ(1 0)は前記アレイプロ七ノf’(6iJ)との間でデータを交換するデータバス (46゜48)を有するモジュールアレイプロセラ?において、a)前記慨能プ レーンのモジュールアレイニ相当するレギュラープレーナアレイとして相関し、 各々が前記複数のエレメントブロセ、す(60)の各々のデータバスに動作可能 に相互接続されたデータバスインタフェース(76)を有した複数の疑似モジュ ール(242,244,246)と、 b)各々が前記疑似モジュールのプレーナアレイの各列に動作可能に相関し、各 々が前記疑似モジュールの各列との間のデータ転送を行う手段と、列コントロー ラの他の疑似モジュールへのデータ転送を行う手段とを有した複数の列コントロ ーラ(xs、zso)と、および c)前記コントロールプロセッサ(10)と前記14 列コントローラ(2411,250)とに動作可能に相関し、前記モードデコー ダ(252)は、多くのオペレーションモードに相当する前記短絡したプレーン を介してデータの転送をイネーブルにする手段を有し、前記モードは、前記短絡 プレーンを介して、前記制御プロセッサ(10)又は少くとも前記モジュールプ レイの1つのいずれρ為から、前記他のモジュールアレイの少くとも1つ又は前 記コントロールプロセ、す(1o)のいずれか、又はその両方にデータを転送す るモードを有し、前記イネーブル手段は、前記コントロールプロセッサにより選 択される前記モードの各々に対応し、それにより前記短絡したプレーンの慨能が 前記コントロールプロセッサによりプログラムすることのできる入力プログラマ プルモードデコーダ(252)とで構成されることを特徴とする機能プログラマ ブル短絡プレ2 前記各列コントローラ(248,250)は、前記疑似モジュ ール(z42.;rt4.24e)の各列との間で転送され、前記列コントロー ラ(248,250)の他の1つ刀・ら受信されるデータを一時的に格納する列 メモリレジスタ(318)を更に有したことを特徴とする請求の範囲1に記載の 短絡プレーン。 3 前記オペレーションモードは、前記コントロールプロセッサ(10)からの 共通データを、前記短絡115 したプレーン(240)f介して、前記アレイプロセッサ(61)の少くとも1 つの前記機能プレーンのモジュール(58)に転送するモードを有すること全特 徴とする請求の範囲1又は2に記載の短絡プレーン。 4、前記共通データの転送は、前記アレイプロセッサ(61)にデータを送るの に必要な時間を実質的に減少するように前記機能ブレーンの少くとも1つのモジ ュール(58)に対して同時に行われることを特徴とする請求の範囲3に記載の 短絡プレーン。 ’ 前記オペレーションモードは、1以上の前記モジュール(58)から、前記 短絡したプレーン(240)を介して1以上の前記機能ブレーンのモジュール( 58)にデータを転送するモードを有することを特徴とする請求の範囲1又は2 に記載の短絡プレーン。 6、前記1以上のモジュール(58)からのデータ転送は;前記1のエレメント プロセッサ(60)から前記他のすべてのエレメントプロセ、す(60)に同時 に送られる共通データで6D、それによって、前記プレイプロセッサ(6))内 でのデータ七実施するのに必要な時間を実質減少することを特徴とする請求の範 囲5に記載の短絡プレーン。 7、前記1以上のモジュール(58)からのデータの転送は前記複数のエレメン トプロセッサ(60)からであり、各プロセ、すは前記機能プレーンのモジュー ルアレイのセパレート列に相関し、セパレートデータを供給し、前記アレイプロ でノブ(6))の前記機能プレーン列モジュール内の列データを実施するに必要 な時間を実質的に減少するように前記機能プレーンの各列に相関する前記エレメ ントプロセッサ(60)の他のすべてのプロ’eノブに共通に前記データが転送 されることを特徴とする請求の範囲5に記載の短絡プレーン。 8、 前記オペレーションモードは、前記アレイフロセッサ(61)から前記コ ントロールプロセ、す(10)へのデータ転送モードを有し、前記データは、前 記プロてノブ(,6i))円にめるデータの性質を、前記コントロールブロセ、 す(10)に表示するように、前記プレイプロセッサ(61)の全エレメントブ ロセ、す(60)により供給されるデータの論理ORでろることr%徴とする請 求の範囲1又は2に記載の短絡プレーン0 9、前記号ベレーションモードは前記機能プレーンの各モジュールアレイから前 記コントロールプロセッサ(10)へデータを転送するモードを有し、前記モジ ュールアレイ列によ砂供給された各データは、前記アレイプロセ、す(61)の 各モジュールアレイ列内にるるデータの性質を前記コントロールプロセッサ(1 0)に表示するように、前記アレイプロセッサ17 (6))の各モジュールアレイ列に相関するエレメントプロてノブ(60)によ 砂供給されるデータの論理ORであることを特徴とする請求の範囲1又は2に記 載の短絡プレーンC 浄書(内容に変更なし)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US1983/000953 WO1984000226A1 (en) | 1982-06-25 | 1983-06-23 | Interconnecting plane for modular array processor |
US392207 | 1989-08-10 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS59501183A true JPS59501183A (ja) | 1984-07-05 |
JPH0347551B2 JPH0347551B2 (ja) | 1991-07-19 |
Family
ID=22175293
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50224483A Granted JPS59501183A (ja) | 1982-06-25 | 1983-06-23 | 機能プログラマブル短絡プレーン |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59501183A (ja) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS50153840A (ja) * | 1974-05-31 | 1975-12-11 | ||
JPS56101262A (en) * | 1979-12-31 | 1981-08-13 | Goodyear Aerospace Corp | Matrix and array for multiple processing element |
JPS56123069A (en) * | 1980-03-04 | 1981-09-26 | Nippon Telegr & Teleph Corp <Ntt> | Data processing device |
JPS56164464A (en) * | 1980-05-21 | 1981-12-17 | Tatsuo Nogi | Parallel processing computer |
-
1983
- 1983-06-23 JP JP50224483A patent/JPS59501183A/ja active Granted
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS50153840A (ja) * | 1974-05-31 | 1975-12-11 | ||
JPS56101262A (en) * | 1979-12-31 | 1981-08-13 | Goodyear Aerospace Corp | Matrix and array for multiple processing element |
JPS56123069A (en) * | 1980-03-04 | 1981-09-26 | Nippon Telegr & Teleph Corp <Ntt> | Data processing device |
JPS56164464A (en) * | 1980-05-21 | 1981-12-17 | Tatsuo Nogi | Parallel processing computer |
Also Published As
Publication number | Publication date |
---|---|
JPH0347551B2 (ja) | 1991-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2930341B2 (ja) | データ並列処理装置 | |
US4745546A (en) | Column shorted and full array shorted functional plane for use in a modular array processor and method for using same | |
US5218709A (en) | Special purpose parallel computer architecture for real-time control and simulation in robotic applications | |
US8443169B2 (en) | Interconnection network connecting operation-configurable nodes according to one or more levels of adjacency in multiple dimensions of communication in a multi-processor and a neural processor | |
US5682544A (en) | Massively parallel diagonal-fold tree array processor | |
US5361367A (en) | Highly parallel reconfigurable computer architecture for robotic computation having plural processor cells each having right and left ensembles of plural processors | |
JP4447770B2 (ja) | 相互接続システム及び並列プロセッサとその形成方法 | |
US4314349A (en) | Processing element for parallel array processors | |
JPS58144971A (ja) | アレイプロセツサ装置 | |
GB2178572A (en) | A processor array | |
EP0485690A2 (en) | Parallel associative processor system | |
EP0086052A2 (en) | Segregator functional plane for use in a modular array processor | |
JP2021510219A (ja) | マルチキャストネットワークオンチップに基づいた畳み込みニューラルネットワークハードウェアアクセラレータおよびその動作方式 | |
Jenq et al. | Reconfigurable mesh algorithms for the Hough transform | |
JPS63233459A (ja) | 大容量並行配列処理システム | |
JPH05242065A (ja) | 情報処理装置及びシステム | |
JPH0619862A (ja) | スケーラブル超並列グループ分割対角線折畳みスイッチング・ツリー型コンピューティング装置 | |
JPS59501183A (ja) | 機能プログラマブル短絡プレーン | |
Treleaven | Parallel architecture overview | |
EP0223849B1 (en) | Super-computer system architectures | |
Eshaghian-Wilner et al. | The systolic reconfigurable mesh | |
Pagano et al. | Parallel implementation of associative memories for image classification | |
Uhr | Pyramid Multi-Computers and Extensions and Augmentations | |
JPS5999568A (ja) | プロセツサセル及び該プロセツサセルから形成されるアレ− | |
Duncan | Parallel Computer Construction Outside the United States |