JPS61148564A - 並列処理計算機 - Google Patents

並列処理計算機

Info

Publication number
JPS61148564A
JPS61148564A JP59270898A JP27089884A JPS61148564A JP S61148564 A JPS61148564 A JP S61148564A JP 59270898 A JP59270898 A JP 59270898A JP 27089884 A JP27089884 A JP 27089884A JP S61148564 A JPS61148564 A JP S61148564A
Authority
JP
Japan
Prior art keywords
processors
processor
row
bus connection
parallel processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59270898A
Other languages
English (en)
Other versions
JPH0438017B2 (ja
Inventor
Yukio Nagaoka
幸夫 長岡
Fumio Takahashi
文夫 高橋
Iwao Harada
原田 厳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59270898A priority Critical patent/JPS61148564A/ja
Priority to US06/810,278 priority patent/US4816993A/en
Priority to DE8585116294T priority patent/DE3584767D1/de
Priority to EP85116294A priority patent/EP0186150B1/en
Priority to CN85109763A priority patent/CN1008017B/zh
Priority to KR1019850009782A priority patent/KR930009760B1/ko
Publication of JPS61148564A publication Critical patent/JPS61148564A/ja
Publication of JPH0438017B2 publication Critical patent/JPH0438017B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/80Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors
    • G06F15/8007Architectures of general purpose stored program computers comprising an array of processing units with common control, e.g. single instruction multiple data processors single instruction multiple data [SIMD] multiprocessors
    • G06F15/8015One dimensional arrays, e.g. rings, linear arrays, buses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • G06F15/163Interprocessor communication
    • G06F15/173Interprocessor communication using an interconnection network, e.g. matrix, shuffle, pyramid, star, snowflake
    • G06F15/17337Direct connection machines, e.g. completely connected computers, point to point communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multi Processors (AREA)
  • Complex Calculations (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、並列処理計算機に係り、特に偏微分方程式の
数値解を並列処理により高速に求めるのに好適な、多重
命令流多重データ流型(MIMDm>並列処理計算機に
関するものである。
〔発明の背景〕
従来から、科学技術計算、特に偏微分方程式の数値解を
高速に求めるために、複数のプロセッサで並列に処理す
る並列処理計算機が開発されてきた。その代表的なもの
はACM T ransact 1onson Com
puter  Systems 、  Mol 1. 
A3゜Auqust 1983. I)195−221
に@PAC8:Aparallel Micropro
cessor Array forScientifi
c Ca1culations”と題する論文に示され
ている。
この計算機は、隣接プロセッサ間を接続して1次元また
は2次元的配列のアレイプロセッサを構成した近接接続
盤と呼ばれるものでアシ、プロセフサ間の接続が簡単で
ある利点を有する反面、離れたプロセッサ間のデータ転
送時間が大きい弱点があった。
また、プロセッサの配列がハードウェア的に固定されて
いるものであるため、以下の例に示すようくい処理する
問題によって計算効率が悪くなるという問題点がある。
(1)2次元配列のプロセッサで1次元問題(例えaφ
 δ2φ ばi〒=、−1−)を処理する場合は、第2図(a)の
ように1行または1列の今のプロセッサを使用するが、
同図(b)のような計算格子点割当を行うのが一般的で
ある。前者の場合はプロセッサ1台あたりが受は持つ格
子点が多くなり計算時間が長くなる。後者はプロセッサ
の場所によりデータ転送方向が異なるため、この判定に
余分なりスプリシャット差分解法)の処理は、1次元配
列プロセッサでは2次元配列プロセッサよシ転送データ
数が多くなるため、処理時間が長くなる。例えば16X
16格子点の計算を16台の1次元配列プロセッサと4
X4の2次元配列プロセッサで処理する場合、どちらも
格子点16個の計算を受は持つが、隣接プロセッサ間の
転送データ数は、2次元配列では16個に対して1次元
配列では32個となる。
以上のように、同じ問題でもプロセッサの配列により、
転送データ数が多くなったり、1台のプロセッサ当シの
処理量が多くなることがあシ、プロセッサ配列が固定さ
れているものでは、これらの問題に対しては効率の低下
を招いていた。
〔発明の目的〕
ことにある。
〔発明の概要〕
複数プロセッサによる並列処理で偏微分方程式の数値解
を求める場合、プロセッサ間のデータ転送を伴なう。し
だがってデータ転送に要する時間を短縮することは、全
体の演算時間短縮につながる。データ転送時間を短縮す
る手段には、転送速度を上げることと転送データ数を減
らすことが考えられるが、本発明では後者の転送データ
数の減(t:時間、Xs)”行、列方向位置、φ:求め
る変数)をイクスプリシット差分解法により解く場合の
、プロセッサ配列と計算格子点配列に対するブ・セッサ
間の転送デーレ数を示したものである。同図で()を付
した部分は、プロセッサ列数が計算格子点列数より多い
ため、同じ行のプロ竿ツサでも異なる行の計算格子点を
受は持つととがプロセッサの配列により、転送データ数
が異なったり、本来の計算以外の処理が増すことを示し
ており、M/N=m/n (M、N :プロセッサの行
列数、m、n:計算格子点の行2列数)に近い程効率が
良くなることを表わしている。
そこで、本発明では2次元配列したプロセッサにおいて
、異なる行または列のプロセッサを一次元接続する機能
を設け、適用問題の格子配列に応じてプロセッサ間の転
送データ数が最小となるように、プロセッサの配列を変
更できるようにした。
〔発明の実施例〕
以下、本発明の実施例を図面を用いて説明する。
第1図は本発明の並列処理計算機の構成を示すブロック
図である。第1図において、PL、j(i=1〜yx、
j=1〜N)はプロセッサ、SI (121〜M−1)
はバス接続機構、CUはコントロールプロセッサを示す
。プロセッサPIJは2次1行のプロセッサの間にあり
、i行の最終プロセッサP+、に及びi+1行の先頭プ
ロセッサ2国−とデータ転送バスで接続される。また、
隣接のバス接続機構(Stと8 +4及び5r−s 1
間もデータ転送ユ(スで接続される。
バス接続機構S1は4つのバス入出力ボートport1
〜port 4間の接続及び切離しを行うものであシ、
第4図にブロック図を示す。第4図において、11はゲ
ート制御回路、21〜24はゲート回路である。ゲート
回路21〜24は、ゲート制御信号gcl、 gC2が
ONのとき入出力線を電気的に導通せしめ、OFFのと
きは入出力線間を電気的に絶縁する機能を持つ。ゲート
制御回路11はコントロールプロセッサCUからのバス
接続制御信号bc、により、ゲート制御信号gcl、 
gC2のどちらかをONにする。
ゲート制御信号gc1がONのときはゲート回路21及
び22が導通状態となるので、portlとport3
及びport2とport4が接続される。
同様に、ゲート制御信号gc2がONのときはゲート回
路23.24が導通し、portlとport2及びp
or t 3とport4が接続される。
ここで、第1図よシバス接続機構8 IOport 1
には1行最終列プロセッサが、port’lにはi+1
行先頭列プロセッサのデータ転送バスが接続されておシ
、port3.port4は隣接バス接続機構81−1
,8t*+のport4.port3とそれぞれ接続さ
れている。このため、ゲート制御信号gc1がONによ
りi行とi+1行プロセッサは切離され、gc2がON
のときはi+1行のプロセッサは1行最終列プロセッサ
の後に接続され、i行とi + 1行は同一行となる。
したがって、全てのバス接続機構8l−8Nl=1でゲ
ート制御信号gc1をONにすnば行間の接続はなくM
行N列の2次元配列プロセッサとなり、逆に全てgc2
がONならば全行が接続されるためMXN台の1次元配
列プロセッサが形成される。
さらに、個々のバス接続機構SIに対して接続。
切離しを行えば種々のプロセッサ配列が形成される。
第5図はプロセッサ配列の構成例を示したもので、この
例では16台のプロセッサから成る4行4列の2次元配
列を基本構成とし、各行間に3つ ′の・バス接続機構
8s=8gを設けている。バス接続機*Stに与えるバ
ス接続制御信号bc、が′O”のとき行間切離し、1”
のとき行間接続を行うものとすると、各バス接続機構S
rK与えるバス接続制御信号bc3の組合せにより、第
5図に示すように正方形、長方形、及び凹凸のある複雑
な形状のプロセッサ配列が形成できる。
ただし、列方向のデータ転送バスの接続は常に基本構成
と変ちずPI’、 J−pH,j→・旧・・→P w、
 J→PI、Jであるため、プロセッサ配列を変更する
と列方向のデータ転送距離は長くなる。例えば第5図(
0に示した2行8列構成では、Pl−の次行同列はP3
−であるが、実際のデータ転送はPl−→P2−→P3
−の経路で実行される。゛しならず、実質的に隣接プロ
セッサとのデータ転送と同じ扱いができる。
第6図は第4図に示したバス接続機構sIを論理回路で
具体的に示したものである。第6図においてはバス接続
制御信号beは、行間の接続が切離しかを′1”(接続
、′0”(切離し)で指定する接続信号cncと、接続
、切離し動作を実行させるトリガ信号trgよ構成るも
のとする。PFはD型スリップ70ツブ、01〜G4は
スリースチートイ(?7アと一般に呼ばれている論理素
子であシ、第4図のゲート制御回路11は1個のD型ス
リップ70ツブくい ゲート回路21〜24はそれぞれ
1組のスリーステートバッファ01〜G4を用いて、極
めて簡単に実現できる。
以上のように、本発明の並列処理計算機ではプロセッサ
配列が可変であシ、処理する問題の格子  “点記列形
状に合わせて最も効率良いプロセッサ配列を形成するこ
とが可能である。
なお、前述の実施例では各行にバス接続機構を設けたも
のを示したが、各列に設けても同様の機能が得られるこ
とは明らかである。さらに、行及び列の両方にバス接続
機構を設け、適用問題にょシ随時使い分けることも可能
である。
コントロールプロセッ?CUH1個々ノハス接続機構S
Iに対してバス接続制御信号bcIを与える機能を持つ
ものである。この例としては、最も簡単なものは各バス
接続制御信号bc、に対応させたスイッチを設け、手動
により各々のバス接続機構SLの制御を行うものである
。あるいは、プロセッサとディジタル信号出力回路を用
いて、計算格子点配列から最適プロセッサ配列をプロセ
ッサで求め、その結果によりデイジタル信号出力回路を
介してバス接続機構S+にバス接続信号bc、を与える
ことも可能である。
第7図は計算格子点配列から最適プロセッサ配列を求め
る計算方法の1例を示したものである。
この例において、計算格子点打1列数をm、’n。
プロセッサの行2列欽をM、Nとし、格子点数はプロセ
ッサ数以上とする。具体的手順は次の様である。
(1)初期値として計算格子点の行列比aとプロセッサ
の行列比αを求め、配列変更回数I=Oとする。
(2)計算格子点行列比aとプロセッサ行列比αを比較
し、a〉αならばプロセッサ配列を変更するために配列
変更回数工を更新し、プロセッサ行列比αを変更する。
(8)a=αまたはaくαとなるまで(2)を繰シ返し
、途中でαがプロセッサ台数以上になったら打切る。
(4)以上の手jI[で得られた配列変更回数工よシ、
バス接続制御信号を作成する。M−1ビツトの2進デー
タBCを考え、下位ビットより順にバス接続機構SI*
S鵞・・・・・・5M−1へのバス接続制御信号になる
とし、1″のとき隣接行と接続するものとする。
2進データBCは、 K=2’と置き、下位よシi−[(i=l。
2、・・・・・・)ビットを′″0″とし、他のビット
を′″1″にすることにより作られる。
次に本発明の並列処理計算機による計算例を示す。
2時間、x、y:行2列方向位置、φ:求める変数)の
差分解法を考える。すなわち、 (h+l)     (k) φ  =λφ  +(1−2λ)φ (k)+λφ(k
)急、 I         I −鳳、J、    
            lJlφ11+λφ  +(
1−2λ)φ(k)+λφ (k3―) 1、J−11,j     、  l、j中1(λ;Δ
t/Δx2=Δt/Δy!、Δt:時間間隔、ΔX、Δ
y:格子点間隔、i、J”2次元格子の配列を表わす温
時、K:時間ステップ)を、境界条件 (k)   に)    (k)    リφ =C、
φ   =C ・、j    @ ノ     −φ鳳、J     
mφ1j(IIO(k)    に)   (ト))φ
 =C・φ  =C 暢、・     1 、・     1mφ1    
   1 、鳳φ重を与えて、各格子点”p  Jでの
φIjを計算する。
ここで、プロセッサ台数は256台を考え、基本構成M
行N列を16行16列とする。また計算格子点は16行
256列を考える。具体的な計算手順を以下に示す。
(1)  φIJの計算実行前にコントロールプロセラ
CUにより、前述の手順でプロセッサ配列を変あシプロ
セッサ行列比は1であるので、前述の計算方法に従えば
、配列変更回数は2となシ、プロセッサ配列は4行64
5列に変更される。これにより、各プロセッサで計算を
受持つ格子点配列は4行4列となる。
(1i)各プロセッサにおいて、4行4列の計算格子点
配列の端辺のデータ合計16個を隣接プロセッサに転送
する。子なわち、格子点の添字を1/。
1〜4)を上、φ z(j’=1〜4)を下の4、j プロセッサに転送する。
011)各プロセッサは自己プロセッサが持っている(
iv) kを更新して(ii ) (iii )を繰シ
返す。
この問題をプロセッサ配列を変更せずに実行した場合は
、各プロセッサは1行16列の格子点計算を行うことに
なる。したがって、この場合ブロセッサ間で転送するデ
ータ数はlX2−t−16x2=34個とな9、本発明
による計算の2倍以上となる。
考える。プロセッサ台数は16行16列の256台とし
、計算格子点はプロセッサ数と同じ256点とする。
計算手順は2次元問題と全く同様であり、以下の様であ
る。
(1)  プロセッサ配列を1行256列に変更する。
φ(時を転送する。
(iii)自己プロセッサのデータφ(呻と左右からの
データを用いてφ@9りを計算する。
(iV) kを更新し−c (ii) (iii)を繰
返す。
この問題をプロセッサ配列を変更せずに計算する場合、
各プロセッサへの格子点割当ては第2図に示した・よう
になる。第2図(a)のよj5に1行のプロセッサのみ
を使用した場合は、各プロセッサでは16格千点の計算
を行うことになり、本発明の方法に比べ計算時間が大幅
に増大することは明らかである。また、第2図伽)のよ
うな格子点割当を行うと、各プロセッサが受は持つ格子
点数は1点となり、本発明のものと同じであるが、デー
タ転送方向が各行の中央部と端で異なる。すなわち、中
央部ではデータを左右のプロセッサに転送するが、左端
及び右端のプロセッサでは位置により左または右と上ま
たは下となる。このためデータ転送処理時に自己プロセ
ッサの位置の判定とこれに°よる転送方向判断の処理が
必要となる。したがって、これらの処理増加により、本
発明の方法より計算時間が増す結果となる。
なお、以上の実施例では、複数個のバス接続機構を設け
ているが、パス接続機構内のスイッチング回路の数を増
加させることにより1個のバス接続機構で任意の複数行
または列のプロセッサを一次元接続することもできる。
〔発明の効果〕
以上述べたように、本発明によれば適用問題の格子点形
状に応じてプロセッサの配列変更ができ、プロセッサ間
の転送データ数を最小にすることかでをるため、データ
転送に要する時間の短縮すなわち計算効率が向上する効
果がある。
【図面の簡単な説明】
第1図は本発明の並列処理計算機の構成を示すブロック
図、第2図は従来の並列処理計算機による一次元問題処
理時の格子点割当例、第3図はプロセッサ配列と計算格
子点配列による転送データ数の差を示す表、第4図は第
1図におけるバス接続機構の構成を示すブロック図、第
5図はプロセッサ配列の構成例、第6図はバス接続機構
の論理回路例、第7図はプロセッサ配列計算手順を示す
フローチャートである。 PL、1・・・プロセッサ、8K・・・バス接続機構、
CU・・・コントロールプロセッサ、11・・・ゲート
制御回路、21〜24・・・ゲート回路、bcl・・・
バス接続(久ノ (b)       ′ 第30 第5(D − 手続補正書(方式)

Claims (1)

  1. 【特許請求の範囲】 1、複数のプロセッサを2次元配列し、各々の行及び列
    でプロセッサ間を結合して成る並列処理計算機において
    、任意数の異なる行または列のプロセッサ間を直列接続
    する機能を持つバス接続機構を設けたことを特徴とする
    並列処理計算機。 2、特許請求の範囲第1項記載の並列処理計算機におい
    て、上記バス接続機構は各行または列に対応して複数個
    設けられ、各バス接続機構は、スイッチング回路の入出
    力端子がプロセッサのバスまたは他のバス接続機構に接
    続された4個のスイッチング回路と、各スイッチング回
    路の開閉制御を行なう制御回路とからなることを特徴と
    する並列処理計算機。 3、特許請求の範囲第2項記載の並列処理計算機におい
    て、上記バス接続機構内の制御回路は、1個のコントロ
    ールプロセッサからのバス接続制御信号により同時に開
    閉制御されることを特徴とする並列処理計算機。
JP59270898A 1984-12-24 1984-12-24 並列処理計算機 Granted JPS61148564A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP59270898A JPS61148564A (ja) 1984-12-24 1984-12-24 並列処理計算機
US06/810,278 US4816993A (en) 1984-12-24 1985-12-18 Parallel processing computer including interconnected operation units
DE8585116294T DE3584767D1 (de) 1984-12-24 1985-12-19 Parallelverarbeitungsrechner.
EP85116294A EP0186150B1 (en) 1984-12-24 1985-12-19 Parallel processing computer
CN85109763A CN1008017B (zh) 1984-12-24 1985-12-23 并行处理计算机
KR1019850009782A KR930009760B1 (ko) 1984-12-24 1985-12-24 병렬처리계산기

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59270898A JPS61148564A (ja) 1984-12-24 1984-12-24 並列処理計算機

Publications (2)

Publication Number Publication Date
JPS61148564A true JPS61148564A (ja) 1986-07-07
JPH0438017B2 JPH0438017B2 (ja) 1992-06-23

Family

ID=17492513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59270898A Granted JPS61148564A (ja) 1984-12-24 1984-12-24 並列処理計算機

Country Status (1)

Country Link
JP (1) JPS61148564A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408676A (en) * 1992-01-07 1995-04-18 Hitachi, Ltd. Parallel data processing system with plural-system bus configuration capable of fast data communication between processors by using common buses

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5408676A (en) * 1992-01-07 1995-04-18 Hitachi, Ltd. Parallel data processing system with plural-system bus configuration capable of fast data communication between processors by using common buses

Also Published As

Publication number Publication date
JPH0438017B2 (ja) 1992-06-23

Similar Documents

Publication Publication Date Title
US5243704A (en) Optimized interconnect networks
EP0186150A2 (en) Parallel processing computer
JPS6359651A (ja) デ−タ処理装置
US5887182A (en) Multiprocessor system with vector pipelines
JPH01150963A (ja) 計算機におけるipl方法
KR20080106129A (ko) 복수의 다중 모드 프로세서를 연결하는 방법과 장치
JPS61148564A (ja) 並列処理計算機
US5142629A (en) System for interconnecting MSUs to a computer system
JPS59114665A (ja) 並列計算機システム
Siegel et al. Parallel memory system for a partitionable SIMD/MIMD machine
JP2522406B2 (ja) 全結合型ネットワ―ク並列処理方法と装置
JPS63240667A (ja) 並列デ−タ処理装置
EP0398678B1 (en) Optimized interconnect systems
SU1330635A1 (ru) Устройство дл решени дифференциальных уравнений
JP2602852B2 (ja) モジユール化並列計算機
JPH0126108B2 (ja)
JPS6020263A (ja) 入出力装置の選択方式
KR100520605B1 (ko) 멀티 세그먼티드 버스들을 사용하는 디지털 신호 처리장치 및 방법
JPH0346078A (ja) ベクトル処理システム
JPS644218B2 (ja)
JPS6248864B2 (ja)
JPH09179840A (ja) 並列計算機におけるプロセッサ間結合網
JPH03206547A (ja) クロスバーネットワーク装置
JPS62122145A (ja) マスタスライス方式lsi
JPS6265158A (ja) 並列処理方式

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees