JPS5899869A - 並列処理方式 - Google Patents

並列処理方式

Info

Publication number
JPS5899869A
JPS5899869A JP19739181A JP19739181A JPS5899869A JP S5899869 A JPS5899869 A JP S5899869A JP 19739181 A JP19739181 A JP 19739181A JP 19739181 A JP19739181 A JP 19739181A JP S5899869 A JPS5899869 A JP S5899869A
Authority
JP
Japan
Prior art keywords
processor
memory
processors
instruction
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP19739181A
Other languages
English (en)
Inventor
Hiroshi Hatsuda
発田 弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp, Nippon Electric Co Ltd filed Critical NEC Corp
Priority to JP19739181A priority Critical patent/JPS5899869A/ja
Publication of JPS5899869A publication Critical patent/JPS5899869A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/02Addressing or allocation; Relocation
    • G06F12/08Addressing or allocation; Relocation in hierarchically structured memory systems, e.g. virtual memory systems
    • G06F12/0802Addressing of a memory level in which the access to the desired data or data block requires associative addressing means, e.g. caches
    • G06F12/0806Multiuser, multiprocessor or multiprocessing cache systems

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の属する技術分野〕 本発明はデータ処理装置における並列処理方式に関する
ものである。
〔従来技術の説明〕
従来、演算処理を高速化する方法の一つとして並列処理
が広く知られている。この並列処理は処理すべきプログ
ラムの中で並列に実行できる部分を各々異なるプロセッ
サで実行し、y台のプロセッサで理想的にはy倍の性能
を特徴とする特許である(実際には並列に実行できない
部分があるのでこれ以下の性能しか得られないが)。
従来の一例を第1図に示す。この例ではN台のプロセッ
サL、 、L、%・・・・−%L、がメモリスイッチ2
を介してN台のメモリL、 、L、 、・・・・・・、
3−MKアクセスし、各プロセッサ1−1 (i=1〜
N)は各々独立にプログラムを実行できるように構成さ
れている。制御プロセッサ5は通信インタフェース6全
通してプロセッサ1−4.1−2、・−・・・% LN
にプログラムの実行開始を指示し、かつ通信インタフェ
ース7を通して各プロセッサ1−1からプログラムの実
行終了の通知を受理−するように構成されている。この
制御プロセッサ5の制御により、N台のプロセッサi−
,% i−2%・・・・・・、1−Nは解くべきプログ
ラム中の並列処理部分について分担して実行する。たと
えば、 al −)−b、 # a2+b2 e =” ”” 
e ”H+bNという計算であれば1番目のプロセッサ
が&1+ blを計算する。
従来このような並列処理システムの性能を高めるKは各
プロセッサの性能を高くするか、または台数を増やす必
要がある。従来、各プロセッサの性能を高めると、プロ
セッサの物理的サイズが大きくなり多数並べることが困
難になるため装置の大きさの点で限界かあね、またプロ
セッサの台数を増やすと、メモリスイッチの構成が複雑
になり実現が困難になる。たとえば、完全なりロスバス
イツチで考えると、プロセッサ台数とメモリ台数を2倍
にするとスイッチの規模は4倍になる。また、こうした
制約のためにメそり台数を少なくすると、メモリの性能
(スループット)が隘路となり、プロセッサの性能が高
くてもメモリ待ち罠なって十分に性能を発揮することが
できない。従来、上記欠点のために大規模で超高性能の
並列処理システムはほとんど実用化されていない。
〔発明の目的〕
本発明の目的は、並列処理を分担する各プロセッサに多
重命令ストリームプロセッサ方式を採用するととによシ
、上記欠点を解決して、大規模で超高性能の並列処理シ
ステムを提供するところKある。
〔発明の要旨〕
本発明は、6各が異なるプログラムを実行できる仮想プ
ロセッナ複数台とこの全仮想プロセッサで共有されるプ
四グラム格納用メモリ装置とこの全仮想プロセッサで共
有されるデータ格納用の第一のメモリ装置とを含む多重
命令ストリーム方式の演算処理装置複数台と、並列処理
データが記憶される複数台の第二のメモリ装置と、任意
の上記演算処理装置から任意の上記第二のメモリ装置へ
のアクセスを可能にするメモリスイッチと、このメモリ
スイッチおよび上記演算処理装置を制御する制御プロセ
ッサと、この制御プロセッサから上記全仮想プロセッサ
にプログラムの実行開始を指示する通信手段と、上記各
仮想プロセッサから上記制御プロセッサにプログラムの
実行終了を通知する通信手段とを備え、上記制御プロセ
ッサの制御により一つのプログラム中の並列処理部分を
上記全仮想プロセッサにより並行に実行することを特徴
とする。
なお上記第一のメモリ装置は、キャッシュメモリまたは
上記第二のメモリ装置とは別のアドレス指定方法でアク
セスできるローカルメモリであることが好ましい。
〔発明の原理と作用〕
本発明では並列処理を分担する各プロセッサに多重命令
ストリーム方式を採用して1台の物理的プロセッサ中に
複数の仮想プロセッサを実現し、物理的なプロセッサ台
数を増やさずに実効的なプロセッサ台数を増やしている
ここで多重命令ストリーム方式プロセッサの原理につい
て簡単に説明する(詳しくはM、、T、IPlynn「
8har@d工nterna’l Re5ources
 in a Multiprooes−sorJ pp
565−569.Proc、of工nformatio
n Proaess−ing 71,1iorfh−H
ollansl Publishing Co、(19
72)などに報告されている)。この方式のプロセッサ
では「命令語の取出・解読」、「オペランドの取出」、
「演算」という命令の実行の段階がパイプラインで構成
され、取出した命令は各段階毎に独立した処理回路を通
って行く過程で実行される。すなわち第2図に多重命令
ストリーム方式のプロセッサの動作の一例を示す、第2
図において命令■は命令取出・解読回路で取出されて解
読されると、次のオペランド取出の処理回路にその結果
がわたされ、そこでオペランドが取出されると演算回路
に取出されたオペランドがわたされる。演算回路もパイ
プライン化されていて演算1と演算2の処理を経て実行
が完了する。
ここで各段階での処理時間をΔTとすれば、上記処理に
4Xノτ時間かかることKなる。一方命令取出・解読回
路は命令■に対する処理を完了すると、次の17時間に
は命令■の取出・解読をはじめるが、このとき命令■は
命令■と異なるプログラムから取出す、この例では第3
図に示すように4つの独立なプログラムがあり、そのプ
ログラムの中から順番に命令を取出す。その利点は、も
し同一のプログラムから続けて次の命令(この例では命
令■′)を取出すと、命令■の実行が完了するまてその
命令の実行条件が定まらないことがあるので(たとえば
命令■で演算した結果を次の命令がオペランドとして使
用する場合など)、その命令は無条件には実行すること
ができず、命令を実行してよいか否かを判断するのに機
械な制御を必要とする上、もし次の命令が前の命令の演
算結果に基づくときKは、前の命令の実行が完了するま
で待たねばならず演算回路の使用効率が低下するのに対
し、独立なプログラムの命令であれば無条件に実行でき
制御が簡単でしかも演算回路の遊休化も避けられる点に
ある。
同一プローグラム内ではある命令の実行が完了してから
次の命令(第3図のプログラム◆1では命令■の次に命
令■′)を取出す−ようKすれば上記の間、題がなく、
この例では4個以上のプログラムの命令を順番に実行す
ればその条件が満される。
その場合1台のプロセッサの中で4つの命令ストリーム
(プログラム)が並行して処理されていることになシ、
これは4台の仮想プロセッサが存在してそれぞれのプロ
グラムを実行していると見ることもできる。
一般にパイプラインを8段にすると8個のプログラム(
命令ストリーム)を実行することができ、8台の仮想プ
ロセッサが実現される。当然のことな、がら8個以上の
プログラムを実行するようKし、8台以上の仮想プロセ
ッサを実現することもできる。この場合N台のプロセッ
サがあればソフトウェア的にはMXS台の(仮想の)プ
ロセッサが存在するのと等しくなる。これを並列処理シ
ステムに応用すればN台のプロセッサに対するメモリス
イッチで8Xli台のプロセッサと等価のシステムを構
成できることにな9、従来方式のように8×N台の実プ
ロセツサを並べるのに比しメモリスイッチの規模がはる
かに小さくなる。
これを利用した並列処理システムは、第1図においてプ
ロセッサl、 、L2、・−・・・、1−Nヲ多重命令
ス) IJ−人吉式の演算処理装置としたもので、この
多重命令ストリームプロセッサが8台の仮想プロセッサ
を含むとすれば、合計BXM台のプロセッサ(仮想プロ
セッサ)Kよる並列処理が実現する。各仮想プロセッサ
は制御プロセッサ5からの並列処理開始指示を受けて、
与えられたグログラムの実行を開始し、それが終了する
と制御プロセッサに通知する。
本システムではこのための両方向の通信手段が必要であ
るが、従来方式に比し賽プロセッサの台数が少ないので
この通信手段を実現する上でも有利である。すなわち制
御プロセッサ5から仮想プロセッサへ通信する場合には
実プロセツサがやけてその中の仮想プロセッサに分配す
ればよく、もし8台の仮想プロセッサが各実プロセツサ
中にあるとすれば178のインタフェースで済む、仮想
プロセッサから制御プロセッサへの通信についても同様
である。
各演算処理装置(実プロセツサ)はメモリスイッチに接
続され、このメモリスイッチを介して同じくメモリスイ
ッチに接続されている複数のメモリ装置の中の任意のメ
モリ装置にアクセスすることができる。このメモリ装置
中には並列処理のためのデータが格納される。
このようなシステムではメモリスイッチおよびメモリ装
置の能力がシステムの隘路になりがちであシ、各演算処
理装置内にキャッシュメモリを設けて、この演算処理装
置内の全仮想プロセッサによってこのキャッシュメモリ
を共用することでこの問題を軽減できる。す表わちある
仮想プロセッサがメモリ装置中のデータにアクセスする
と、このデータを含むブロック(通常歌語〜数十語)が
キャッシュメモリ中に取込まれるが、同一演算処理装置
内の他の仮想プロセッサはそのブロック中のデータを処
理に使用する可能性が高い(あるいは高くなるようにプ
ログラムの構造を考えることが可能である)ので、ラン
ダムにメモリ装置へのアクセスが発生することが避けら
れる。これは−語句のランダムなアクセスよりもブロッ
ク単位のアクセスの方がスループットを高めるためKは
有利だからである。さらKこれにより、平均のアクセス
タイムも短縮できる。
またキャッシュメモリでなく、これをプログラムから見
える特別のメモリ装置にして同様の効果を出すこともで
きる。この場合には各プロセッサに内蔵される高速メモ
リとし、前記メモリ装置とは別のアドレス指定方法によ
りアクセスされる。
各仮想プロセッサが実行するプログラムは各演算処理装
置にプログラム用の専用メモリを内蔵させてここに格納
する。一般に並列処理の場合には。
各仮想プロセッサは同一の処理手順(命令ストリーム)
を実行し、データのみが異なることで十分なものが多い
のでこのプログラム用メモリlc格納された1つの処理
手順を複数の仮想プロセッサが共用すればメモリの節約
になるとともにメモリスイッチ2を介してメモリL、%
  L、% ・・・・・・、3−Mへアクセスする頻度
を減らすことができるのて、メモリスイッチλおよびメ
モリ3がシステム性能の隘路となることを避けられる(
前記キャッシュメモリとの併用でより効果が大きくなる
)。−同一の処理手順を実行しても各々の仮想プロセッ
サ毎にデータ社員なるので条件分岐の条件が異なり、す
べてが同一の命令を同一の順序で実行するとは限らない
。当然各仮想プロセッサ毎に異なるプログラムを実行さ
せることもできる。
〔実施例による説明〕
次に本発明について図面を参照して詳細に説明する。
第4図は本発明一実施例システムの構成図である。第4
図において各符号は第1図の各符号にそ、れぞれ対応す
る6本実施例の特徴ある構成は、プロセッサlの台数N
−1!、メモリ3の台数M=52であって、各プロセッ
サ1−x (1=1〜16)は多重命令ストリーム方式
のプロセッサである。各プロセッサ1−1の中で8個の
プログラムストリームが実行される。
メモリ3−j (j工1〜32)は完全なりロスパ一方
式により構成され、複数のプロセッサ1−1から同時に
メモリアクセスが発生しても同一のプロセッサ1ヘアク
セスしないかぎり競合は起らないようになっている。ま
た制御プロセッサ5には、2台の専用の制御プロセッサ
メモリ9−1.9−2 カ11続される。また制御プロ
セッサ5は、メモリスイッチ2を介してメモリ3−1.
3−2、・−・・・・、3−S!に接続され、各メモリ
ljへもアクセスできるようKなつ(いる、i5らにw
4aプロセッサ5は通信インタフェースlOを介して各
プロセッサ1−1に接続され、各プロセッサ1−1との
間で通信できるように構成される。第5図り、第4図に
示した1台のプロセッサ1の詳細なブロック構成図であ
る。
11は多重(この例では8個)の命令ストリームを実行
するための制御メモリで、この制御メモ+711の内容
は各命令ストリームに対応した8個の領域に分割される
。各分割された領域内に社命令ストリームを実行するの
に必要な命令アドレス、演算用レジスタなどが格納され
ている。12はプログラム格納用メモリで、このプロセ
ッサ1が実行すべきプログラムが格納される。
13はパイプライン方式で構成された演算回路で、一定
時間(4丁)間隔でオペランドを豐は演算して結果を出
力する。 14はメモリスイッチ2を介してメモリ3に
アクセスするための制御回路で、キャッシュメモリ16
を内蔵する。また15は通信制御回路であって、制御プ
ロセッサ5との通信を制御し、通信インタフェースlO
と接続され、制御プロセッサ5からの指定(特定の仮想
プロセッサに対するもの、あるいはこのプロセッサ1の
中の全仮想プロセッサに対するもの)K従って制御情報
を各仮想プロセッサに与える。
制御情報の例としては命令ストリームの実行を開始する
「8TARτ」、止めるrsTop」などがある。これ
らの情報は各仮想プロセッサに対応した制御メモリ11
の中の領域に格納する表どの方法により記憶され、その
後のプロセッサ1(すなわち各命令ストリーム)の動作
を制御するのに用いられる。プロセッサ1は「β丁AR
TJ指令を受けて動作を開始し、所定の条件を満したと
き、あるいは「8TOPJ指令を受けたときに動作を中
止する。
また、通信制御回路15はプロセッサ1側から制御プロ
セッサ5へ通信インタフェースlOを介シて情報を伝え
るためKも用いられ、たとえばr8TART」指令を受
けて実行開始後、特定の仮想プロセッサが実行を終了し
たなどの条件を満したときKその実行終了を制御プロセ
ッサ5に伝えるのも通信制御回路15である。
この実施例では1台のプロセッサ1内で8個の命令スト
リーム(すなわちプログラム)が時分割的に並列処理さ
れるがそれは以下のように実現される。
まず制御回路14t;を制御メモリ11の中のプログラ
ムφ1の命令ストリーム用の命令アドレスレジスタを読
出してそのアドレスに従ってプログラム格納用メモリ1
2から命令を取出し、同時に命令アドレスレジスタの内
容を更新する。この命令は解読されて、必要なオペラン
ドが取出され8へ送られる。このオペランドはプログラ
ムφIK対応した演算レジスタまたはメモリ3から取出
され、あるいはキャッシュメモリ16内にあればここか
ら取出され、メモリ3へはアクセスしない。演算回路1
3から演算結果が出力されると、それは命令の指定に従
って制御メモリ11の中のプログラム≠1に対応した演
算レジスタのいずれかに格納される0次に再び命令アド
レスレジスタを読出し次の命令の実行に移る。
以上はプログラム÷1の命令ストリームのみに注目して
述べているが、プロセッサlは前述した多重命令ストリ
ーム方式のプロセッサで命令の取出しから実行まですべ
てをパイプライン方一式で処理シ、プログラムφ2〜Φ
8の命令ストリームも各々47時間のずれで順番に命令
が取出され実行される。したがって一つの命令ストリー
ムに着目すれば8×Δ丁時間で一つの命令が実行される
Kすぎないが、プロセッサl内の8個の命令ストリーム
全体では11時間毎に1個の命令が実行されているとと
になる。またこの動作は一つの命令ストリームに着目し
てみれば、1台の通常の方式のコンピュータで命令を実
行していく場合とまったく同じで、1台の8×ΔTの命
令実行速度をもつ仮想プロセラすがその命令ストリーム
を専門に処理していると考えることができる。
本シス゛テムにおいてプログラムを実行するときの動作
は次のようになる。例として各々128個のデータム1
、jl(i=1〜12B)K対して28 Σ(ムl+Bす 1■1 を計算する場合をとりあげる。演算開始前にデータAl
、B1を制御プロセッサ5がメモリ3−jK入れる。た
とえばム、〜A11はメモリ3−1%A9〜ム、6はメ
モリ3−2に格納し、ム、2゜〜A+2atiメモリ3
−16に格納する。同様KB、〜B、はメモリ3−、ア
、B。
〜B14はメモリ3−18、B120− ”128はメ
モリ3−、、 K格納する。
各プロセッサL1はム1十B1を計算し結果をメモリ3
弓中の領域C1に格納する。これを計算するための命令
ストリーム(すなわち各仮想プロセッサのプログラム)
はプログラム格納用メモリ12に格納されるが、すべて
の仮想プロセッサはデータが異なるのみで命令の組合わ
せは同じ(すなわちA1十B1→01という動作はすべ
てのプロセッサi−1が同じ)であるので、プロセッサ
1−1にインデックスレジスタ等アドレス修飾の機能が
あれば、全プロセッサ1に対して1つの処理手順(プロ
グラム)があればよい。各プロセッサ1−1中の命令ア
ドレスレジスタKFiそのプロセッサ1−1が実行すべ
き命令ストリームのアドレスが設定される。各プロセッ
サ1−1中には同時に実行される8つの命令ストリーム
に対応して8つの命令アドレスレジスタ(すなわち8台
の仮想プロセッサ)があり、その各々に設定される必要
がある。これらの設定は制御プロセッサ5の制御の下に
メモリLjからメモリスイッチ2を介して行われるか、
あるいは通信インタフェース10を介して行われる。
以上の準備は制御プロセッサ5が行い、準備が完了する
と通信インタフェースを通して全プロセッサ1にr8T
ARTJ指令を送出する。各プロセッサLiは制御メモ
リHの中の命令アドレスレジスタ÷1に従って命令を取
出し、以下◆2〜+8の命令アドレスレジスタの内容を
順次取出して実行していく。プロセッサ1−1を例にと
れば、ム1+B1→C1の処理は命令アドレスレジスタ
ナ1で示される命令ストリーム(すなわち仮想プロセッ
サφ1)で処理され、以下ム2+B2→C2からムs+
B・→08までの処理は仮想プロセッサφ2〜φ8によ
り多−束に処理される。
なお本例ではすべての仮想プロセッサの命令ストリーム
が同じ動作(ム1十B1→Oi)をするとしているが、
それぞれ異なっていてもよいし、条件分岐の入る場合に
は仮想プロセッサ毎に途中から動作が変わってくる可能
性がある。
ム1十B1→01の処理を完了すると、処理の終了通知
を制御プロセッサ5に通信制御回路15および通信イン
タフェースlOを介して行う。これKより制御プロセッ
サ5は全仮想プロセッサの実行が終了したことを知って 28 ΣC1 1尊1 の処理をする。C1がメモリ3−j中にあるとすればそ
れを順次取出して加算していく、プロセッサ1−1から
制御プロセッサ5への終了通知は、各仮想プロセッサで
処理が終る毎に通知する方法も考えられるが、この例の
ような場合には各プロセッサ1−。
内の全仮想プロセッサで処理が終了したとき圧制御プロ
セッサ5に通知すればよく、制御を簡単化できる。
またこの例では総和の計算を制御プロセッサ5が直列に
やるとしているが、プロセッサl−1で途中まで行えば
もつと高速化できる。すなわちたとえばC1+02+・
・・・・・+0−は1台のプロセッサ1−1の中で次の
ようKすればよい* (Ot +Oz )% (Os+
04)、(Cs+ 04 )、(Oy+0@)の4つの
計算を4つの仮想プロセッサを使って並列に行い、その
結果をそれぞれDl、D2、DB%D4とすると、次K
 (DI +D2 )、(Di +D4 )を並列に行
い、その結果を”1 % ”2とすると最後1c B、
−HC2を行う。
これを各プロセッサ1−1でやれば、制御プロセッサ5
は16台のプロセッサ1の残した16の結果の総和をと
るだけでよい(前の例では128の加算を制御プロセラ
、す5がやることKなる)。
またこの例では、プロセッサの台数を16台、各プロセ
ッサの中で処理されるプログラムストリーム数を8個と
する例を示したが、この数に限定されるものではない。
またメモリの台数を32台としたが、これはプロセッサ
の台数やメモリのアクセスタイム、メモリへのアクセス
頻度によって定められ、この数に限定されるものではな
い、またメモリの構成を完全なりロスバ一方式としたが
、他の構成の方式によりてもよい。
さらに制御プロセッサメモリの台数を2台としたが、こ
の数に限定さnるもので杜ない。
このようKこのシステムでは物理的に16台のプロセッ
サで128の並列演算ができ、128台のプロセッサを
置いたのと同じ効果をもっている。もし実際に128台
のプロセッサを置いたとすると、メモリスイッチの規模
は本例のように16X32でなく、128×s2以上に
しなければならず、コスト、装置の大きさ、性能などの
面で装置の実現上はるかに不利になる。
また本例におけるキャッシュメモリの効果は以下のよう
である。プロセッサL、を例として考えると、このプロ
セッサl−1中の仮襲プロセッサ÷1がデータム1をメ
モリ3−1へ取りに行ったとき、このメモリ3−1内に
データム4、ム2、・・・・・・、A8が連続して格納
されていて1ブロツク内圧あれば(仁のブロックサイズ
は種々あり得るがここでは説明の便宜上8語で1ブロツ
クとする)、A1、A2、・・・・・・、ム8が全てキ
ャッシュメモリ中に持ってこられ、仮想プロセッサ÷2
〜+8が使用するデータム2〜ムロはメモリ装置へ行か
すにキャッシュメモリから取出すことができる。すなわ
ちランダムな8回のメモリアクセスを1回のブロックア
クセスで代替できたことKなる。B1についても同様で
ある。
またキャッシュメモリは一般にプログラムから見えない
が、これをプログラムに見える特別の高速メモリにして
もよい、この場合にはメモリ3をアクセスする場合とは
別のアドレス指定により命令で直接指定し、どの場所に
どのデータを入れておくかはその効果を考えてプログラ
ムが制御することKなる。キャッシュメモリではこの制
御はハード9エア回路が画一的に行なわれるのでプログ
ラム制御の方が効率を高められる可能性を持っているが
、プログラム作成祉離しくなる。たとえばすべての仮想
プロセッサが共通に使用する定数や、〈抄返し使用する
定数などをこのキャッシュメモリに入れる仁とによって
メモリ3へのアクセス回数を効果的に低減できる。
〔発明の効果〕
本発明は以上説明したように、多重命令ス) IJ−人
吉式のプロセッサを複数個おき、制御プロセッサの制御
の下に並列動作させるように構成することにより、物理
的な演算装置台数以上の並列処理を行うことができ、か
つ並列処理できない部分は制御プロセッサで処理するこ
とで融通性が増し、応用分野が拡大し大規模で超高性能
の優れた並列処理システムが得られる。
とくにプロセッサ内圧プログラム格納用メモリおよびキ
ャッシュメモリ等を設けることにより、メモリスイッチ
およびメモリの能力がシステム性能の隘路となることが
避けられ、より効率よく並列処理を行うことができる。
【図面の簡単な説明】
第1図は従来例並列処理プロセッサシステムの構成図。 第2図は多重命令ストリーム方式プロセッサの動作原理
を示す図。 第3図は第2図のプロセッサが実行する4個のプログラ
ムを示す図。 第4図は本発明一実施例システムの構成図。 第5図はそのプロセッサの詳細なブロック構成図。 l・・・プロセッサ、2・・・メモリスイッチ、3・・
・メモリ、5−・制御プロセッサ、6.7・・・通信イ
ンタフェース、9・・・制御プロセッサメモIJ、lO
・・・通信インタフェース、ll・・・制御メモリ、1
2・・・プログラム格納用メモリ、13・・・演算回路
、14・・・制御回路、15・・・通信制御回路、16
・・・キャッシュメモリ。 特許出願人 日本電気株式会社297、第1図 第2図 プログラム 第3図

Claims (1)

  1. 【特許請求の範囲】 (1)  各各が異なるプログラムを実行できる仮想プ
    ロセッサ複数台とこの全仮想プロセッサで共有されるプ
    ログラム格納用メモリ装置とこの全仮想プロセッサで共
    有されるデータ格納用の第一のメモリ装置とを含む多重
    命令ス) IJ−人吉式の演算処理装置複数台と、並列
    処理データが記憶される複数台の第二のメモリ装置と、
    任意の上記演算処理装置から任意の上記第二のメモリ装
    置へのアクセスを可能にするメモリスイッチと、このメ
    モリスイッチおよび上記演算処理装置を制御する制御プ
    ロセッサと、この制御プロセッサから上記全仮想プロセ
    ッサにプログラムの実行開始を指示する通信手段と、上
    記各仮想プロセッサから上記制御プロセッサにプログラ
    ムの実行終了を通知する通信手段とを備え、上記制御プ
    ロセッサの制御により一つのプログラム中の並列処理部
    分を上記全仮想プロセッサにより並行に実行することを
    特徴とする並列処理方式。 (2)  第一のメモリ装置がキャッシュメモリである
    特許請求の範囲第(1)項記載の並列処理方式。 (5)  第一のメモリ装置が第二のメモリ装置と別の
    アドレス指定方法でアクセスできるローカルメモリであ
    る特許請求の範囲第(1)項記載の並列処理方式。
JP19739181A 1981-12-08 1981-12-08 並列処理方式 Pending JPS5899869A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19739181A JPS5899869A (ja) 1981-12-08 1981-12-08 並列処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19739181A JPS5899869A (ja) 1981-12-08 1981-12-08 並列処理方式

Publications (1)

Publication Number Publication Date
JPS5899869A true JPS5899869A (ja) 1983-06-14

Family

ID=16373721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19739181A Pending JPS5899869A (ja) 1981-12-08 1981-12-08 並列処理方式

Country Status (1)

Country Link
JP (1) JPS5899869A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61117665A (ja) * 1984-11-13 1986-06-05 Nippon Telegr & Teleph Corp <Ntt> 演算装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE CATALOG=1978 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61117665A (ja) * 1984-11-13 1986-06-05 Nippon Telegr & Teleph Corp <Ntt> 演算装置

Similar Documents

Publication Publication Date Title
EP0087978B1 (en) Information processing unit
US7139899B2 (en) Selected register decode values for pipeline stage register addressing
JPH0769812B2 (ja) データ処理装置
EP0521486B1 (en) Hierarchical structure processor
JPH02130635A (ja) 複数命令同時処理方式
US6725355B1 (en) Arithmetic processing architecture having a portion of general-purpose registers directly coupled to a plurality of memory banks
JPS5899869A (ja) 並列処理方式
JPS6116335A (ja) 情報処理装置
JPS6347835A (ja) パイプライン計算機
JPH0512751B2 (ja)
JPS5899868A (ja) 並列処理方式
JP3982077B2 (ja) マルチプロセッサシステム
JPS6153754B2 (ja)
JP2744152B2 (ja) データ駆動型データ処理装置
JP3526773B2 (ja) マルチプロセッサ装置およびその制御方法
JP2586690B2 (ja) 命令プリフェッチ装置
JP3704367B2 (ja) スイッチ回路
JPS5899846A (ja) 並列処理方式
JPH07325805A (ja) ベクトル処理装置
JPS60105050A (ja) パイプライン制御方式
JP2504535B2 (ja) バスユニットの構成方法
JPH08235135A (ja) 通信レジスタ付並列計算機
JPH01224870A (ja) 情報処理装置における主記憶アクセス命令実行制御方式
JPS6217777B2 (ja)
JPH0267602A (ja) 数値演算装置