JPH0282378A - 並列計算機におけるイベントスケジューリング処理方式 - Google Patents

並列計算機におけるイベントスケジューリング処理方式

Info

Publication number
JPH0282378A
JPH0282378A JP23454688A JP23454688A JPH0282378A JP H0282378 A JPH0282378 A JP H0282378A JP 23454688 A JP23454688 A JP 23454688A JP 23454688 A JP23454688 A JP 23454688A JP H0282378 A JPH0282378 A JP H0282378A
Authority
JP
Japan
Prior art keywords
address
processor
circuit
processors
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP23454688A
Other languages
English (en)
Other versions
JP2518902B2 (ja
Inventor
Tatsuya Shindo
達也 進藤
Kaoru Kawamura
薫 河村
Masanobu Umeda
梅田 政信
Toshiyuki Shibuya
利行 澁谷
Hideki Mito
三渡 秀樹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63234546A priority Critical patent/JP2518902B2/ja
Priority to EP94104303A priority patent/EP0605401B1/en
Priority to EP89309445A priority patent/EP0360527B1/en
Priority to DE68920388T priority patent/DE68920388T2/de
Priority to US07/409,613 priority patent/US5230057A/en
Publication of JPH0282378A publication Critical patent/JPH0282378A/ja
Priority to US08/503,595 priority patent/USRE36954E/en
Application granted granted Critical
Publication of JP2518902B2 publication Critical patent/JP2518902B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 SIMD型計算型環算機いて、多数のプロセッサを効率
よく動作させることができるようにした並列計算機にお
けるイベントスケジューリング処理方式に関し 高い負荷分散を得ることができる制御を可能とした並列
計算機を提供することを目的とし。
並列計算機におけるプロセッサを、複数個ずつアドレス
に関する制御単位となる複数の制御グループにグループ
化し、各制御グループごとに、隣接する制御グループか
らの処理対象データ群に対するアドレスを指定するイベ
ントを受信し管理するスケジューリング回路と、このス
ケジューリング回路によって管理されるイベントに基づ
いて決定されるベースアドレスと2上記コントローラか
ら供給されるアドレスとにより、その制御グループに属
するプロセッサが処理すべきデータのアドレスを生成す
る実アドレス生成回路とを備えるように構成する。
〔産業上の利用分野〕
本発明は、SIMD型計算型環算機いて、多数のプロセ
ッサを効率よく動作させることができるようにした並列
計算機におけるイベントスケシュリング処理方式に関す
る。
例えば、配線処理等のLS I−CADを含む大規模組
み合わせ問題は、非常に高速な演算能力を必要とする。
これを解決するためには、多数のプロセッサを用いて構
成する超並列計算機によって高速演算処理を行うことが
有望であり、多数のプロセッサを効率よ(動作させる技
術が必要となる。
〔従来の技術〕
並列計算機の構成として、複数のプロセッサが個別の命
令によってそれぞれ与えられたデータを処理するM I
 M D (Multiple In5tructio
n stream Multiple Data st
ream)型のものや、すべてのプロセッサが、同一の
命令の流れによってそれぞれ与えられたデータを処理す
るS I MD (SingleInstructto
n  stream  Multiple  Data
  stream)  型のものなどがある。
プロセッサ数が数十〜数百のシステムでは1MIMD型
の構成をとることによって、それぞれプ0セツサが処理
すべきデータを独立に扱い、負荷分散を上げることがで
きる。しかしながら、MIMD型の並列計算機では、プ
ロセッサごとに制御回路を用意しなければならないので
、物量が多くなり2例えば数万規模の構成をとることは
、現実的に不可能である。
一方、SIMD型の並列計算機では、数万規模の構成の
ものが実現されている(例:  TllinkingM
achines  社のコネクション・マシン)。
STMD型の並列計算機では、同一の命令の流れで、各
プロセッサを制御するので、非常に多数のプロセッサを
持つ構成を実現することができる。
〔発明が解決しようとする課題〕
SIMD型の場合、多数のプロセッサを持つ並列計算機
を実現できる反面、すべてのプロセッサに対し、同じ動
作をさせることになるため、負荷分散が難しいという問
題がある。例えば、SIMD型の並列計算機を、LSI
設計における配線処理に用いた場合、迷路法におけるウ
ェーブフロント等を担当するプロセッサは9 はんの一
部であり大部分のプロセッサは、実質的に休止の状態と
なる。このような応用分野に限らず、SIMD型の並列
計算機では、多(のプロセッサを無駄なく動作させると
いうことが困難である。
本発明は上記問題点の解決を図り1高い負荷分散を得る
ことができる制御を可能とした並列計算機を提供するこ
とを目的としている。また、各プロセッサが処理するデ
ータの連携を、効率的に行う手段を提供することを目的
としている。
〔課題を解決するための手段〕
第1図は本発明の構成例を示す。
第1図において、10はコントローラ、11はイベント
のスケジューリングを行うスケジューリング回路、12
は実アドレスを生成する実アドレス生成回路、14はプ
ロセッサ(P E : Processing Ele
ment) 、  15は擬似隣接プロセッサ、Gl〜
G4はアドレスに関する制御単位となる制御グループを
表す。
プロセッサ14は、各々、処理対象となるブタを記憶す
る回路と演算回路とを持ち、コントローラ10から送ら
れてくる制御信号による同一の命令の流れによって、各
プロセッサ14に与えられたデータを処理する。処理対
象となるデータは各プロセッサ14に個別に用意された
メモリに格納され、コントローラ10からのアドレス信
号によって、そのデータが読み・書きされる。
本発明では、プロセッサ14は、複数個ずつアドレスに
関する制御単位となる複数の制御グループG1.G2.
・・・にグループ化される。そして各制御グループG1
、G2.・・・ごとに、スケジューリング回路11と実
アドレス生成回路12とが設けられる。
スケジューリング回路11は、隣接する制御グループか
らの処理対象データ群に対するアドレスを指定するイベ
ントを受信し、そのイベントによって指定されたアドレ
スをキュー等によって管理する回路である。
実アドレス生成回路12は、スケジューリング回路11
によって管理されるイベントに基づいて決定されるベー
スアドレスと、コントローラ1゜から供給されるアドレ
スとにより、その制御グルプに属するプロセッサ14が
処理ずべきデータのメモリ上における実際のアドレスを
生成する回路である。
また、各制御グループC1,G2.・・・間の境界部周
辺に、必要に応じて、擬似隣接プロセッサ15が設けら
れる。擬似隣接プロセッサ15は、各制御グループ間の
境界部周辺に位置するプロセッサ14が、隣接する制御
グループにおける隣接プロセッサ14とデータの授受を
行うときに、あたかも処理対象領域が連続しているかの
ように、それぞれのプロセッサが扱うデータのアドレス
に対応するデータを送出する機構を持つ。
〔作用〕
従来のSIMD型計算型環算機、各プロセッサは同一の
命令の流れで制御され、その各プロセッサが持つメモリ
のアドレスも同一のものが供給されるため、処理対象領
域は単一的である。
本発明では、プロセッサ14が、いくつかの制御グルー
プに分割され、各制御グループごとに異なる領域を、処
理対象として扱うことができる構成になっている。すな
わち、各制御グループごとに、スケジューリング回路1
1が指定するペースアドレスと、コントローラ10から
の相対アドレスとによって、実際にデータが存在するア
ドレスが生成されるようになっている。従って、各プロ
セッサ14における処理対象領域を、各制御グループに
おいて実際に処理が必要なデータが存在する個所に持っ
ていくことができる。処理が必要であるかどうかは、隣
接する制御グループ間で通知されるイベントを管理する
ことによって判別する。
実装されているプロセッサ14と、それが扱う処理対象
データのアドレスとが、各制御グループごとに可変化さ
れて制御されるので2処理対象データに着目して見た場
合、1つのプロセッサ14上で、複数の仮想的なプロセ
ッサが動作しているかのように見ることができる。この
ように、仮想プロセッサとイベントの概念を導入するこ
とにより、プロセッサ14の負荷分散が可能となる。
処理対象領域の連続性を保証する必要がある場合には、
各制御グループ間の境界部周辺に、擬似隣接プロセッサ
15を設けることにより、アドレスの調整が可能である
。擬似隣接プロセッサ15がない場合、制御グループ間
でアドレスを調整し相手が必要とするデータを送るため
の制御フェーズを設ければよいが、その分だけ効率が悪
くなる。
〔実施例〕
第2図は本発明の実施例で用いられるプロセッサの構成
例、第3図は本発明の実施例に係る仮想プロセッサの概
念を説明する図、第4図は本発明の実施例に係るウィン
ドウ分割説明図1第5図は本発明の実施例に係るアドレ
ス割り付けの例、第6図は本発明の実施例に係る制御グ
ループの側梁7図は本発明の実施例に係るスケジューリ
ング回路接続例、第8図は本発明の実施例に係る擬似隣
接プロセッサ説明図、第9図は本発明の実施例に係るス
ケジューリング回路ブロック図、第10図は第9図に示
すウィンドウ番号入力部の例、第11図は第9図に示す
連続性検出部の例、第12図は第9図に示すイヘント入
力部の例、第13図は第9図に示すイヘント解釈回路論
理説明図、第14図は第9図に示すFIFO回路の例、
第15図は第9図に示す登録フラグの列、第16図は第
9図に示すアドレス計算回路説明図3第17図は本発明
の実施例に係る実アドレス生成回路の例を示す。
本実施例の並列計算機は、第2図に示すようなプロセッ
サ14を格子状に結合した構成になっている。以下、格
子結合されたマルチプロセッサを例に説明するが1本発
明は、格子結合に限らず超立方体結合やその他の結合に
よる並列計算機にも、同様に適用することができる。
各プロセッサ14ば、内部に、演算対象となるデータを
保持するデータレジスタ21と、入出力データおよびデ
ータレジスタ21に記憶されているデータについての演
算を行う演算回路(ALU)22を持つ。また、データ
レジスタ21へのロード対象となるデータを記憶する外
部メモリ20を持つ。外部メモリ20のアドレスは、各
制御グループごとに設けられた実アドレス生成回路12
から供給される。本発明は、主として、この外部メモリ
20に対するアドレス制御に関連している。
各プロセッサ14は、第1図に示すコントローラ10か
ら送られる同一の制御信号で制御される。
この制御信号には、データレジスタ21のアドレス、演
算回路22に対するオペレーション・コード等が含まれ
る。
プロセッサ14は、東(E)、西(W)、南(S)、北
(N)の4方向の隣接プロセッサとの通信を行うための
EWNSポートを持つ。また全プロセッサ14に対して
、コントローラ10から同し値を与えるためのグローバ
ルデータ入力の端子と、コントローラ10へのデータ出
力の端子を持つ。
第2図に示すプロセッサ14は、1ビット・プロセッサ
であり、データレジスタ21への入出力や外部とのデー
タ入出力は2ずべで1ビツトを基本としている。1ビツ
トより大きいデータは、その大きさに応して1ビツトず
つ、上位ビ・71−または下位ビット側から連続して処
理する。これにより、何ビン1〜のデータでも処理する
ことができるようになっている。もちろん2本発明は、
この例のような1ビツト・プロセッサに限らず、複数ビ
ットの入出力を行うプロセッサにも同様に適用すること
が可能である。
本発明では、並列計算機上に実装されているプロセッサ
14の数より、多数のプロセッサがあるかのように取り
扱い可能とするため、仮想プロセッサの概念を導入する
。例えば、LSI設計における配線処理を並列計算機に
よって行う場合、プロセッサ数よりも大きな配線領域を
扱うことができることが必要となり、そのような配線処
理のプログラムを、実際のプロセッサ数を気にしないで
記述できるようにすることが望まれる。
そのため、第3図に示すように、実装されているプロセ
ッサが一時点で直接処理対象とする領域よりも大きな二
次元のメモリ空間30内を、実プロセツサ(P E)群
が移動して処理していくことで、メモリ空間30の大き
さを持つ仮想PE群があるかのように見せる。
具体的には、第4図に示すように、メモリ空間30の仮
想領域について1例えば128X128個の仮想PEの
大きさを単位とするウィンドウ31を、最大256個用
いて管理する。すなわち仮想領域を:nxmのウィンド
ウ31による任意の矩形で組み合わせて管理する。各ウ
ィンドウ31は、第4図に示すように20からnm−1
までのウィンドウ番号によって識別する。
1個の実PEに着目してみると、第5図(イ)に示すよ
うに、IPEの外部メモリ20を分割しその1つ1つを
仮想PEのメモリ空間として利用することになる。この
例では、実PEのメモリ空間が、 oooo番地からI
IFFF番地までの16ビツトのアドレス空間を持ち、
仮想PEのメモリ空間をそれぞれ12ビツトのアドレス
空間としている。
1個の実PEが16個の仮想PEを担当することになる
外部メモリ20に対するアト”レスは、第5図(ロ)に
示すように生成される。ウィンドウ番号は1個々の仮想
PEのメモリ空間の先頭を示すベースアドレスとなる。
ウィンドウは、最大256個設けることができるため、
ウィンドウ番号として8ビツト用意されるが、この例の
ように516分割した場合には、ウィンドウ番号の下位
4ビツトを“0゛′とする。
仮想PEアドレスは、各仮想PEのメモリ空間における
相対アドレスである。この仮想PRアドレスは、処理対
象データへのアクセスが必要な場合に、第1図に示すコ
ントローラ10から、各プロセッサ14に対して共通に
送られるアドレスである。仮想PEアドレスは、ウィン
ドウの個数に応して、その上位ビットに“O”が詰めら
れる。
16個のウィンドウに分割されている場合、実質的な仮
想PEアドレスは12ビツトである。
第5図(ロ)に示すように、ウィンドウ番号と仮想PE
アドレスとを加算する。または論理和をとることにより
、外部メモリ20に対する実アドレスが生成されること
になる。
仮想PEにおける処理の実行は、担当する実PEが9分
割されたメモリ空間内のデータを順に処理していくこと
で行う。この最も単純な実現法として、実PEが、常に
、担当するすべての仮想PEを順に処理していくことが
考えられる。しかし仮想PEの中で2本当に処理が必要
なものだけを抽出して実行させることができるならば、
その部分だけを選択的に実行制御することにより、処理
の効率化を図ることが可能である。そのため、イベント
の概念を導入し、無駄な仮想PEの処理を省く制御を行
う。
イベントは、仮想PHの処理すべき条件が成立したとき
に起動されるものである。イベントが伝播された仮想P
Eは、実PEにおける処理の対象として扱われる。イベ
ントの例として、配線処理においては、ラベリング時に
ラベルの値が書き換わること、ハックトレース時にトレ
ース信号が伝播することなどが挙げられる。どちらも配
線領域内において、それらが発生した部分についての処
理(ラベル値の評価、トレース処理)を行うべき事象で
ある。何をイベントとして扱うかは、各プロセッサ14
を制御するコントローラ10が、プログラムに応じて決
定する。
次に5以上のような仮想PEの具体的な実現のし方につ
いて説明する。
まず、第6図に示すように、プロセッサ14群を、制御
グループと呼ぶ矩形の集合に分ける。第6図に示す例で
は、128X128個のプロセッサ14を、32X32
個のプロセッサ14を持つ16個の制御グループG1、
G2.・・・に分割した構成になっている。
この各制御グループG1、G2.・・・ごとに、仮想P
E上の担当する領域の中から、イベントの起こったとこ
ろを次々に処理していく。従って、制御グループ内では
、連続した領域を扱うことになるが2制御グループ間の
境界では、必ずしも連続した領域とはならない。このよ
うにPE全体ではなく、それを分割した単位で、任意の
領域を処理できるようにすることで、各プロセッサ14
の稼動率を上げる。稼動率の点だけを考えると、制御グ
ループを構成するPE数を小さくしたほうが好ましいが
、その実現に必要な物量が増加することになる。
上述したイベントの管理のために、第7図に示すように
、各制御グループG1、G2.・・・ごとにスケジュー
リング回路11を設け、また実アドレス生成回路12を
設ける。
スケジューリング回路11は、各制御グループのPE群
からイベントを受信し、処理すべき仮想PEを管理する
。イベントにより処理対象となった仮想PRの番号、す
なわちウィンドウ番号はスケジューリング回路11にお
いてキューイングされ、キューの先頭から順に処理され
る。
処理実行の順がまわってきた仮想PEの処理はスケジュ
ーリング回路11が、その仮想PEに対応するベースア
ドレスを、実アドレス生成回路12に送ることにより行
われる。このように、スケジューリング回路11が行う
べき処理は、イベントの伝播した仮想PEのキューイン
グと、それらに対する実PEの割り付けである。
実アドレス生成回路12は、コントローラから全PEに
対し共通に送られて(る制御信号の1つである仮想PE
の相対アドレスと、スケジューリング回路11が決定し
た仮想PEのベースアドレスとから、実アドレスを生成
し、各制御グループG1.G2.・・・に存在する実P
Eへ供給する。
スケジューリング回路11は、それぞれ隣接する4方向
の制御グループに属するPE群およびその隣接制御グル
ープのスケジューリング回路11と、自分の担当する制
御グループ内のPE群とに接続される。主な入出力信号
は、以下のとおりである。
(a)  イベント信号〔入力〕 隣接する制御グループ境界上のPEから伝えられるイベ
ント信号(全部で32PE分)のオア(OR)論理をと
ったもので、E−W−N・Sの各方向に対して、各1ビ
ツトの入力信号である。
(bl  ウィンドウ番号〔入力〕 隣接するスケジューリング回路11のウィンドウ番号出
力が入力される。各方向に対して8ビツトの入力信号で
ある。イベント信号がアクティブになったときに、その
方向のウィンドつ番号を入力しキューイングする。
(C1自己(seLf)イベント信号〔入力〕自分が担
当する制御グループ内PEのイベント信号(全部で32
X32PE分)のOR論理をとった1ビツトの入力信号
である。
(dl  ウィンドウ番号〔出力〕 隣接するスケジューリング回路11へのウィンドウ番号
出力で、各方向ごとに8ビツトである。
(el  ベースアドレス〔出力〕 キューの先頭から取り出された仮想PEのうイントウ番
号に対応するアドレスを示す実アドレス生成回路12へ
の出力信号である。
if)  各種制御信号〔入力、出力〕コントローラか
らの入力またはコントローラへの出力信号であり3次の
仮想PEをキューから取り出すことを指示する制御信号
(next)人力データの流れる東西南北の方向を示す
制御信号(dir)入力、クロック信号入力、キューが
空になったことを示す制御信号(empty)出力等が
ある。
次に、制御グループ間の領域の連続性を効率よく保証す
るために用いる擬似隣接プロセッサについて、第8図に
従って説明する。
第8図において、14A、14Bは制御グループの境界
を越えて互いに隣接するプロセッサである。このプロセ
ッサ14A、14Bに対応して擬似隣接プロセッサ15
A、15Bが設けられる。
隣接する制御グループが、異なるウィンドウを処理対象
としているとき、制御グループの境界を越えて、隣接す
るPEの値をそのまま受は取ると必要とするウィンドウ
内の値を受は取ることができなくなる。
そのため、第8図に示すように、制御グループの境界部
における1接続ごとに、相手側のウィンドウに相当する
データを送り出すためのPEを余分に置き、擬似隣接プ
ロセッサ15A、15Bとする。この擬似隣接プロセッ
サ15A、15Bを設けることにより、扱う領域が不連
続となる制御グループ間の境界部においても、隣接する
PEの値を用いた計算の実行を保証することができる。
扱うウィンドウが、隣接する制御グループ間で連続して
いる場合には、セレクタS1、S2を切り換えることに
より1擬似隣接プロセツサ15A15Bを用いないで、
直接、隣接するプロセッサ14A、14B間でアクセス
する。
すなわち、プロセッサ14Aは、自分の外部メモリ20
Aに対して、リード/ライト (R/W)するとき、ラ
イト・データについては、擬似隣接プロセッサ15Aの
外部メモリ20aにも同時に書き込む。プロセッサ14
Bへ、プロセッサ14入側からデータを送り出す場合、
擬似隣接プロセッサ15Aが、外部メモリ20aの値を
読み出して、プロセッサ14Aの代わりに、その値を送
信する。その外部メモリ20aのアドレスは、プロセソ
ザ14B側が処理しているウィンドウのアドレスとする
。プロセッサ14.B側からプロセッサ14Aへ値を送
る場合も同様である。
第8図では、1次元方向の接続だけを示しているが、実
際には、2次元格子における制御グループの境界部にお
いて、2次元方向に同様の接続を行う。
本実施例に係るスケジューリング回路は、第9図に示す
ような構成になっている。
第9図において、50はウィンドウ番号入力部51は登
録テーブル、52は連続性検出部、53はイベント入力
部、54はイベント解釈回路、55はFIF○(Fir
st In First 0ut)回路、56は登録フ
ラグ、57はアドレス保持フラグ、58はアドレス計算
回路、R1−R4はパイプライン制御のためのレジスタ
である。
第9図に示すウィンドウ番号入力部50は、隣接する4
方向の制御グループから通知されるウィンドウ番号を入
力する回路であり、第10図に示すような構成になって
いる。第10図に示す各レジスタRIOは、東西南北(
EWNS)の各方向からのウィンドウ番号を保持するレ
ジスタである。
セレクタSIOは2プロセッサ間通信の方向を示すコン
トローラからの制御信号d’+rに応じて、出力を選択
する。
第9図に示す登録テーブル51は、ウィンドウ番号が登
録されているかどうかを示すフラグ群からなるテーブル
であり、最大256個の各ウィンドウに対して、それぞ
れ1ビツトが割り当てられている。ウィンドウ番号入力
部50からのウィンドウ番号が、登録テーブル51のア
ドレスとなる。
これによって、ウィンドウ番号の二重登録が抑止される
ようになっている。
第9図に示す連続性検出部52は、現在扱っている領域
が、隣接する制御グループの領域と連続しているかどう
かを判定するための回路である。
内部構成は5第11図に示すようになっている。
第11図において、COMPは比較回路、60はエンコ
ーダ、ORはオア回路、CB、CW、CN、C3はリセ
ント信号resetがくるまで、連続性の検出結果を記
憶するレジスタである。
自制御グループで現在扱っているアドレスの上位ビット
(bits)と、ウィンドウ番号入力部50からの入力
ウィンドウ番号とを、比較回路COMPで比較し、それ
が一致するときに、EWNSの方向に応じて、レジスタ
CB、CW、CN、C3に連続性を記憶する。その結果
は9セレクタS20を介して出力される。
第9図に示すイベント入力部53は、各方向からのイベ
ント信号を入力する回路であり、第12図に示すような
構成になっている。各レジスタRは、イベント・クリア
信号evclrによってクリアされる。その後、イベン
ト信号がロードされるとアンド回路ANDおよびセレク
タS30を介して制御信号clirに応じたイベント信
号が出力される。
第9図に示すイベント解釈回路54は、ウィンドウ番号
をキューイングするかどうか、また現在のアドレスを保
持し続けるかどうかを判断する回路である。第13図に
示すような論理で出力を決定する。ウィンドウ番号のキ
ューイングを指示する登録信号は、イベント入力部53
の出力だけがアクティブ(T)になったときに出力され
る。連続性出力およびイベント入力がアクティブになっ
たとき、または自己イベントがアクティブ゛になったと
き、アドレス保持信号が出力される。
第9図に示すFIFO回路55は、伝播されたイベント
により、処理しなければならないウィンドウの番号を記
憶しておく回路である。通常用いられているIIFOメ
モリでよく1例えば第14図に示すような構成になって
いる。
第14図において、MEMは8ビツト×256の容量を
持つメモリ、R40〜R43はレジスタ234、0はセ
レクタ、WCNTは書き込みアドレスを出力するライト
カウンタ、’RCNTは読み出しアドレスを出力するリ
ードカウンタ、COMPは比較回路、ORはオア回路、
ANDはアンド回路NOTはノット回路である。
レジスタR41に登録信号がセントされると所定のタイ
ミングで、レジスタR40にセントされたウィンドウ番
号が、ライトカウンタWCNTに示されるメモリMBM
のアドレスに書き込まれる。また、読み出しを指示する
制御信号nextにより、リードカウンタRCNTの示
すアドレスのメモリMEMの内容が読み出されて、レジ
スタR43を介して出力される。
ライトカウンタWCNTとリードカウンタRCNTの値
が一致したとき、空を示す信号emptyが出力される
第9図に示す登録フラグ56は、第15図に示すような
構成になっており、どの方向からのウィンドウ番号が登
録されたかを、レジスタRに記憶する。
第9図に示すアドレス計算回路58は、FIFO回路5
5から読み出されたウィンドウ番号に基づいて、隣接す
る制御グループに通知するウィンドウ番号および実アド
レスの生成に使用するアドレス上位ビットを出力する回
路である。
隣接制御グループ間インタフェースとして、隣接制御グ
ループにイヘントを伝えたときに、伝えられた先が登録
すべきウィンドウ番号を出力する。
ウィンドう境界以外では、現在担当しているウィンドつ
番号を送る。
ウィンドウ境界では、第16図(イ)に示すように、水
平方向には、ウィンドウ番号A±1を送り2垂直方向に
は、ウィンドウ番号A十Bを送る。
ここで、Bは仮想領域の大きさをウィンドウを単位とし
て分割した場合の横方向のウィンドウ数である。なお、
仮想領域の境界では、それより外にイヘントが伝わらな
いように、イヘントを打ち消す。
ウィンドウの境界は、第16図(ロ)に示す各方向別の
境界印80によって識別する。境界印80の値は、初期
設定時に、コントローラによって設定される。
アドレス計算回路58の概要構成は、第16図(ハ)に
示すようになっており、演算回路ALUは、第16図(
0)に示す境界印8oの値によって、ウィンドウ番号A
、 A±1.A±Bのいずれかを算出する。
なお、コントローラから送られてくるアドレスを、現在
のウィンドウ番号に関係なく、絶対アドレスとして使用
するモードを持つ。これが、第16図(ハ)の入力の1
つであるアドレス指定値であり、そのオペレーションが
指示された場合には。
そのアドレス指定値が、セレクタS80.382を介し
て、実アドレス生成回路へ送られる。これにより、メモ
リ内に仮想PE間の共通領域を実現することなどが可能
になっている。
第1図に示す実アドレス生成回路12は1本実施例では
、第17図に示すような構成になっている。第17図に
おいて、R100〜R105はレジスタ、3100〜5
103はセレクタ、ORはオア回路である。
実アドレス生成回路の入力は、コントローラから送られ
てくる仮想PEの相対アドレスと、第9図に示すアドレ
ス計算回路58の出力であるアドレス上位ビットと、ウ
ィンドウ番号入力部50からの隣接グループウィンドウ
番号である。
自分の制御グループ内に属するPRに対する実アドレス
は、レジスタR100に設定された相対アドレスと5 
レジスタR101に設定されたアドレス上位ヒントとを
加算することにより生成する。
すなわち、第5図(ロ)に示す演算を行う。ここでは、
上位8ビツトで重なりあう部分は、一方を“0”とする
こととし、オア回路ORによる論理和で加算を実現して
いる。なお、実アドレスの下位8ビツトは、コントロー
ラから送られてきたものをそのまま使用する。
また、第8図に示す擬似隣接プロセッサ用の実アドレス
を生成するために、レジスタR102〜R105に隣接
グループのウィンドウ番号を設定し、セレクタ8100
〜5103によって、ロード(L)時には隣接グループ
のアドレス、セーブ(S)時には自分のアドレス(se
lf)と同じになるように制御する。
本実施例で説明した1つの制御グループ、スケジューリ
ング回路11.実アドレス生成回路12を個別に、また
ばまとめてLSI化することが可能である。スケジュー
リング回路11および実アドレス生成回路12の詳細な
例を示したが、同様な機能を持つものを他の回路構成に
よっても、実現できることは言うまでもない。また、格
子結合のマルチプロセッサを例に説明したが、制御グル
ープによるグループ化は、超立方体結合などの他の結合
によるマルチプロセッサでも同様に実現できることは明
らかである。
〔発明の効果〕
以上説明したように2本発明によれば、実プロセツサが
、多数の仮想プロセッサを担当し、仮想プロセッサの中
で真に処理を必要とするものを抽出して、実プロセツサ
による処理を遂行することができるので、高い負荷分散
が可能になり、処理の効率化が可能になる。
【図面の簡単な説明】
第1図は本発明の構成例 第2図は本発明の実施例で用いられるプロセッサの構成
例。 第3図は本発明の実施例に係る仮想プロセッサの概念を
説明する図。 第4図は本発明の実施例に係るウィンドウ分割説明図。 第5図は本発明の実施例に係るアドレス割り付けの例。 第6図は本発明の実施例に係る制御グループの例 第7図は本発明の実施例に係るスケジューリング回路接
続例。 第8図は本発明の実施例に係る擬似隣接プロセソザ説明
図。 第9図は本発明の実施例に係るスケジューリング回路ブ
ロック図。 第10図は第9図に示すウィンドウ番号入力部の例。 第11図は第9図に示す連続性検出部の例。 第12図は第9図に示すイヘント入力部の側梁13図は
第9図に示すイヘント解釈回路論理説明図。 第14図は第9図に示すFIF○回路の側梁15図は第
9図に示す登録フラグの列。 第16図は第9図に示すアドレス計算回路説明図 第17図は本発明の実施例に係る実アドレス生成回路の
例を示す。 図中、10はコントローラ、11はスケジューリング回
路、12は実アドレス生成回路、GIG2.・・・は制
御グループ、14はプロセッサ、15は擬似隣接プロセ
ッサを表す。

Claims (1)

  1. 【特許請求の範囲】 [1]処理対象となるデータを記憶する回路と演算回路
    とをそれぞれ有する複数のプロセッサ(14)と、これ
    らのプロセッサを制御するコントローラ(10)とを備
    え、コントローラから送出する一連の命令によって、各
    プロセッサに与えられたデータを処理する並列計算機に
    おいて、 上記プロセッサを、複数個ずつ、アドレスに関する制御
    単位となる複数の制御グループ(G1、G2、…)にグ
    ループ化し、 各制御グループごとに、 隣接する制御グループからの処理対象データ群に対する
    アドレスを指定するイベントを受信し管理するスケジュ
    ーリング回路(11)と、 このスケジューリング回路によって管理されるイベント
    に基づいて決定されるベースアドレスと、上記コントロ
    ーラから供給されるアドレスとにより、その制御グルー
    プに属するプロセッサが処理すべきデータのアドレスを
    生成する実アドレス生成回路(12)とを備えたことを
    特徴とする並列計算機におけるイベントスケジューリン
    グ処理方式。 [2]上記各制御グループ間の境界部周辺に位置する各
    プロセッサに対し、そのプロセッサが扱うデータのアド
    レスに対応するデータを送出する擬似隣接プロセッサ(
    15)を、隣接する制御グループにおける隣接プロセッ
    サに対応して備えたことを特徴とする請求項1記載の並
    列計算機におけるイベントスケジューリング処理方式。
JP63234546A 1988-09-19 1988-09-19 並列計算機におけるイベントスケジュ―リング処理方式 Expired - Fee Related JP2518902B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP63234546A JP2518902B2 (ja) 1988-09-19 1988-09-19 並列計算機におけるイベントスケジュ―リング処理方式
EP94104303A EP0605401B1 (en) 1988-09-19 1989-09-18 Parallel computer system using a SIMD method
EP89309445A EP0360527B1 (en) 1988-09-19 1989-09-18 Parallel computer system using a SIMD method
DE68920388T DE68920388T2 (de) 1988-09-19 1989-09-18 Paralleles Rechnersystem mit Verwendung eines SIMD-Verfahrens.
US07/409,613 US5230057A (en) 1988-09-19 1989-09-19 Simd system having logic units arranged in stages of tree structure and operation of stages controlled through respective control registers
US08/503,595 USRE36954E (en) 1988-09-19 1995-07-19 SIMD system having logic units arranged in stages of tree structure and operation of stages controlled through respective control registers

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63234546A JP2518902B2 (ja) 1988-09-19 1988-09-19 並列計算機におけるイベントスケジュ―リング処理方式

Publications (2)

Publication Number Publication Date
JPH0282378A true JPH0282378A (ja) 1990-03-22
JP2518902B2 JP2518902B2 (ja) 1996-07-31

Family

ID=16972717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63234546A Expired - Fee Related JP2518902B2 (ja) 1988-09-19 1988-09-19 並列計算機におけるイベントスケジュ―リング処理方式

Country Status (1)

Country Link
JP (1) JP2518902B2 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167459A (en) * 1998-10-07 2000-12-26 International Business Machines Corporation System for reassigning alias addresses to an input/output device
US6170023B1 (en) 1998-10-07 2001-01-02 International Business Machines Corporation System for accessing an input/output device using multiple addresses
US6185638B1 (en) 1998-10-07 2001-02-06 International Business Machines Corporation Method and system for dynamically assigning addresses to an input/output device
US6202095B1 (en) 1998-10-07 2001-03-13 International Business Machines Corporation Defining characteristics between processing systems
CN1297889C (zh) * 2003-06-03 2007-01-31 松下电器产业株式会社 信息处理装置以及机器语言程序变换装置
JP2010167203A (ja) * 2009-01-26 2010-08-05 Yoshifuji Kk 運動用手袋

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3987783B2 (ja) 2002-10-11 2007-10-10 Necエレクトロニクス株式会社 アレイ型プロセッサ
JP3987784B2 (ja) 2002-10-30 2007-10-10 Necエレクトロニクス株式会社 アレイ型プロセッサ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167459A (en) * 1998-10-07 2000-12-26 International Business Machines Corporation System for reassigning alias addresses to an input/output device
US6170023B1 (en) 1998-10-07 2001-01-02 International Business Machines Corporation System for accessing an input/output device using multiple addresses
US6185638B1 (en) 1998-10-07 2001-02-06 International Business Machines Corporation Method and system for dynamically assigning addresses to an input/output device
US6202095B1 (en) 1998-10-07 2001-03-13 International Business Machines Corporation Defining characteristics between processing systems
CN1297889C (zh) * 2003-06-03 2007-01-31 松下电器产业株式会社 信息处理装置以及机器语言程序变换装置
JP2010167203A (ja) * 2009-01-26 2010-08-05 Yoshifuji Kk 運動用手袋

Also Published As

Publication number Publication date
JP2518902B2 (ja) 1996-07-31

Similar Documents

Publication Publication Date Title
CN106462396B (zh) 处理器核心及其执行程序指令的方法
US6128720A (en) Distributed processing array with component processors performing customized interpretation of instructions
JPH02501599A (ja) 多重プロセッサ・アレイにおける仮想処理手法および仮想プロセッサ
KR20030064239A (ko) 화상을 처리하는 장치 및 방법과 이 장치에 이용되는컴파일러
CN111630505B (zh) 深度学习加速器系统及其方法
JPH07152722A (ja) Simdマルチプロセッサ用動的再構成可能スイッチ装置
GB2178572A (en) A processor array
CN103999051A (zh) 用于着色器核心中着色器资源分配的策略
JP5285915B2 (ja) マイクロプロセッサアーキテクチャ
US20200050486A1 (en) Configuration of Application Software on Multi-Core Image Processor
Li et al. PAAG: A polymorphic array architecture for graphics and image processing
JPH0282378A (ja) 並列計算機におけるイベントスケジューリング処理方式
KR100765567B1 (ko) 산술 논리 유닛 및 스택을 가지는 데이터 프로세서, 멀티미디어 장치 및 컴퓨터 판독가능 기록 매체
KR20080106129A (ko) 복수의 다중 모드 프로세서를 연결하는 방법과 장치
KR20190003512A (ko) 서브그룹 간 데이터 공유
Siegel et al. PASM: A reconfigurable parallel system for image processing
JPH04291659A (ja) 並列コンピュータシステムおよびその動作方法
Siegel et al. Parallel memory system for a partitionable SIMD/MIMD machine
JPS59761A (ja) 複数プロセツサによる画像処理方式
JP2543306B2 (ja) アレイ・プロセッサ
EP4155959A1 (en) Embedded programmable logic device for acceleration in deep learning-focused processors
JP3607548B2 (ja) ベクトル演算装置
JPH09106346A (ja) 並列計算機
US20040215838A1 (en) Method of obtaining interleave interval for two data values
JPH0236008B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees