JPS62233873A - 並列計算機システム - Google Patents

並列計算機システム

Info

Publication number
JPS62233873A
JPS62233873A JP61076492A JP7649286A JPS62233873A JP S62233873 A JPS62233873 A JP S62233873A JP 61076492 A JP61076492 A JP 61076492A JP 7649286 A JP7649286 A JP 7649286A JP S62233873 A JPS62233873 A JP S62233873A
Authority
JP
Japan
Prior art keywords
task
cluster
level
computer system
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61076492A
Other languages
English (en)
Other versions
JPH0516066B2 (ja
Inventor
Mamoru Sugie
杉江 衛
Mitsugi Yoneyama
米山 貢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Original Assignee
Agency of Industrial Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agency of Industrial Science and Technology filed Critical Agency of Industrial Science and Technology
Priority to JP61076492A priority Critical patent/JPS62233873A/ja
Publication of JPS62233873A publication Critical patent/JPS62233873A/ja
Publication of JPH0516066B2 publication Critical patent/JPH0516066B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は複数のプロセッサ・エレメントからなる並列計
算機システムに係り、特に、知識処理に好適な並列計算
機システムに関する。
〔従来の技術〕
計算機性能の飛躍的向上に対して、100〜10.00
0台規模あるいはそれ以上のプロセッサ・エレメントを
並列動作させるアーキテクチャが有望視されている。特
に、知識処理向きの11算機では、従来性能の飛騨的向
上が不可欠であること、実行するプログラム自身が並列
性を有することから、上記のアーキテクチャが一般に採
用されている。
並列計算機の構成に関しては、「イリノ、イ大学・コン
ピュータ・サイエンス・デパートメン1〜・レボ−1−
・No、83−1123J  (Universjシy
of  I 1linois aj Urband −
Champaign、 D C5Rcporj No、
 83−1123 (Cedar Doc。
No、5))に示されているように、プロセッサ・エレ
メントをクラスタに分割し、クラスタの内外をネッI−
ワークで結合する方式が知られている。
また、数台規模の並列計算機システムでは、rMVS/
拡張アーキテクチャ・オーバービュー。
GC28−13480,File No、5370−3
 4  J   (M V  S  / E xしen
ded  Δrchi仁ecture○varview
、 GC2813480、FileNo、5370−3
4)に示されているように、プロセッサ・エレメントが
メモリを共有し、この共有メモリを介して結合するとい
う方式も知られている。
〔発明が解決しようとする問題点〕
上記従来技術には、高性能が得られないという問題があ
った。並列計算機の性能は、プロセッサ・エレメントの
単体性能と並列動作するプロセッサの台数との積で決定
さ九る。第1の従来技術では、各プロセッサ・エレメン
トがネットワークを介して結合されているので独立性が
高く、高い並列性が得られる。しかしながら、タスクを
分配するにあたって、親タスクの識別子、タスクの環境
データ等の情報をバケツ1〜の形態で転送しなければな
らず、タスク分配のオーバーヘッドが大きくなって、プ
ロセッサ・エレメント単体の性能が低下してしまう。一
方、第2の従来技術では、全てのプロセッサ・エレメン
トが同一のメモリをアクセスするためにメモリのアクセ
ス衝突が生じて高々数台程度しか結合できず、高い並列
性が得られない。
本発明の目的は、高いプロセッサ・エレメント単体性能
を保持しつつ、高い並列性を得ることのできるilel
針列機システムを提供することにある。
〔問題点を解決するための手段〕
」二記目的は1階層を形成しているクラスタのうち最下
層のクラスタについて、ネットワークによるプロセッサ
・エレメントの結合の代りに、共有メモリによる結合を
導入することによって達成される。
〔作用〕
階層構造9α列計算機システムでは、プロセッサ・エレ
メントからなるクラスタを結合し、これを階層的に積み
上げて、システムを構成する。そして、各rP1層の結
合に対しては、上層から下層に向うほど、スループット
を大きくする、これは、下層のクラスタはどそれに属す
るプロセッサ・ニレメン1−の数が少ないので、スルー
プットを大きくすることができるためである。
こうした階層構造−)η列計算機システムでは、並列処
理の効率を上げるため、タスクのクラスタへの閉じ込め
を図る。即ち、クラスタ内のプロセッサ・エレメントが
実行するタスクから派生したタスクはその大部分を同一
クラスタ内のプロセッサ・ニレメン1−で実行し、何分
の1かを他のクラスタへ分配する。これは、クラスタ内
のプロセッサ・エレメント間のデータ交信に対して、異
なるクラスタに属するプロセッサ・ニレメン1−間のデ
ータ交信に対するよりも大きなスループットが得られる
からである。
本発明では、最下層のクラスタ内のプロセッサ・エレメ
ントが共有メモリを介して結合されている。タスクの分
配等に伴なうデータ転送に対して。
このクラスタ内のプロセッサ・ニレメン1へ間では。
そのデータが共有メモリに格納されているので、アドレ
ス・ポインタを転送するだけで、実際にデータをバケツ
1−として送る必要がない。そのためタスク分配のオー
バーヘッドが著しく軽減されこれによって、高いプロセ
ッサ・エレメント単体性能を得ることができる。また、
クラスタはネットワーク等によって階層的に結合されて
いるので。
100台以上の高並列性も達成できる。
本発明では、最も交信の多い最下層クラスタ内のプロセ
ッサ・エレメント間のデータ転送に共有メモリを用いる
ので、その効果が最も大きい。
〔実施例〕
以下1本発明の一実施例を第1図により説明する。並列
計算機は、#O〜#nのレベル1クラスタ30.メイン
メモリ10.レベル1ネツトワーク20から構成されて
いる。レベル1クラスタ30はレベル1ネツトワーク2
0によって結合されており、レベル1クラスタコントロ
ーラ200がレベル1クラスタ301?ilの負荷分1
校を11ノ御する。
各レベル1クラスタ30は#0〜#nレベル2クラスタ
40.レベル2ネットワーク100.レベル1クラスタ
コントローラ200からなる6各レベル2クラスタ40
は、#0〜#Qのプロセッサ・エレメント70.共有メ
モリ50.レベル2クラスタコン1ヘローラ300から
なり、レベル2クラスタコントローラ300がレベル2
クラスタ間の負荷分散を制御する。
レベル1クラスタコントローラ200は、まず、メイン
メモリ10に置かれたタスクを取り込み、あるレベル2
クラスタ、例えば#0の共有メモリ50上のタスク・キ
ューにつなぐ。タスクの取り込みとは、親タスクの識別
子、タスクの環境データ、実行するプログラムへのポイ
ンタ等の転送を言う。
プロセッサ・エレメント70は、共有メモリ50上のタ
スク・キューからタスクを取り出して実行し、その結果
、子タスクを生成して、これを共有メモリ50上のタス
ク・キューにつなぐ。共有メモリ50上のタスク・キュ
ーからのタスクの取り込みは、タスクの実行の終了時又
は中断時に行なう。
レベル2クラスタコントローラ300は、共有メモリ5
0上のタスク・キューに貯えられているタスクのうち、
同一レベル1クラスタに属する他のレベル2クラスタ又
は、他のレベル1クラスタに分配するタスクを選択して
、親タスクの識別子。
タスクの環境データ等を目的のクラスタへ送出する。他
のレベル1クラスタに送出する場合には。
一旦、同一レベル1クラスタに属するレベル1クラスタ
コントローラ200にパケットを送出し、このレベル1
クラスタコントローラ200が、送出先のレベル1クラ
スタ30に属するレベル1クラスタコントローラ200
にパケットを送出する。
送出先のレベル1クラスタコントローラ200は、送ら
れたパケットを、あるレベル2クラスタ40の共有メモ
リ50へ書き込み、タスク・キューにつなぐ。
レベル1クラスタ数を1、レベル2クラスタ数を10.
クラスタ内のプロセッサ・エレメント数をIO、タスク
の実行時間をT、共有メモリへの子タスクの登録に要す
る時間を0.IT、ネットワークを介してのタスクの転
送に要する時間を10×T、他へのクラスタへのタスク
の分配確率を0,1とすると、全体性能P9は次式で表
わされる。
P5=−−二一−x 100 T+0.IT+0.I  X 10XT一方、レベル2
クラスタ#0〜#m内のプロセッサ・エレメントをネッ
トワークで結合した場合の牡能P 11は次式のように
なる。
したがって、クラスタ内のプロセッサ・エレメントをも
ネットワークで結合した場合に比して、5−3 (P 
s/ P n)の性能改善が得られる。
〔発明の効果〕
本発明によれば、最下層クラスタにおける並列動作のた
めのオーバーヘッドを軽減できるので5個々のプロセッ
サ・エレメントの性能を低下させることなく高い並列性
を達成するのに効果がある。
これによって、並列計算機システムの全体性能向上が図
れる。
【図面の簡単な説明】
第1図は本発明の一実施例の構成を示す図である。

Claims (1)

    【特許請求の範囲】
  1. 1、複数のプロセッサ・エレメントを結合してクラスタ
    を構成し、該クラスタを結合して次階層のクラスタを構
    成し、各プロセッサ・エレメントを並列に動作させる階
    層構造並列計算機システムにおいて、最下層のクラスタ
    内のプロセッサ・エレメント間のデータ交信に、該クラ
    スタ内の全プロセッサ・エレメントがアクセス可能な共
    有メモリを用いることを特徴とする並列計算機システム
JP61076492A 1986-04-04 1986-04-04 並列計算機システム Granted JPS62233873A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61076492A JPS62233873A (ja) 1986-04-04 1986-04-04 並列計算機システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61076492A JPS62233873A (ja) 1986-04-04 1986-04-04 並列計算機システム

Publications (2)

Publication Number Publication Date
JPS62233873A true JPS62233873A (ja) 1987-10-14
JPH0516066B2 JPH0516066B2 (ja) 1993-03-03

Family

ID=13606717

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61076492A Granted JPS62233873A (ja) 1986-04-04 1986-04-04 並列計算機システム

Country Status (1)

Country Link
JP (1) JPS62233873A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63168761A (ja) * 1987-01-07 1988-07-12 Fujitsu Ltd 並列処理系構成方式
JPH04218861A (ja) * 1990-02-28 1992-08-10 Hughes Aircraft Co 多重クラスタ信号プロセッサ
US7783747B2 (en) 2006-07-24 2010-08-24 International Business Machines Corporation Method and apparatus for improving cluster performance through minimization of method variation

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001167067A (ja) * 1999-12-13 2001-06-22 Fujitsu Ltd マルチプロセッサシステム及びデータ転送方法
JP2001167069A (ja) * 1999-12-13 2001-06-22 Fujitsu Ltd マルチプロセッサシステム及びデータ転送方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518720A (en) * 1978-07-24 1980-02-09 Toshiba Corp Multiple computer system
JPS5723166A (en) * 1980-07-17 1982-02-06 Fujitsu Ltd Parallel data processing system driven by tree structure data
JPS57187759A (en) * 1981-05-04 1982-11-18 Ibm Multi-processor system
JPS59103166A (ja) * 1982-12-02 1984-06-14 Fujitsu Ltd 階層型並列デ−タ処理装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5518720A (en) * 1978-07-24 1980-02-09 Toshiba Corp Multiple computer system
JPS5723166A (en) * 1980-07-17 1982-02-06 Fujitsu Ltd Parallel data processing system driven by tree structure data
JPS57187759A (en) * 1981-05-04 1982-11-18 Ibm Multi-processor system
JPS59103166A (ja) * 1982-12-02 1984-06-14 Fujitsu Ltd 階層型並列デ−タ処理装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63168761A (ja) * 1987-01-07 1988-07-12 Fujitsu Ltd 並列処理系構成方式
JPH0511340B2 (ja) * 1987-01-07 1993-02-15 Fujitsu Ltd
JPH04218861A (ja) * 1990-02-28 1992-08-10 Hughes Aircraft Co 多重クラスタ信号プロセッサ
US7783747B2 (en) 2006-07-24 2010-08-24 International Business Machines Corporation Method and apparatus for improving cluster performance through minimization of method variation

Also Published As

Publication number Publication date
JPH0516066B2 (ja) 1993-03-03

Similar Documents

Publication Publication Date Title
US4247892A (en) Arrays of machines such as computers
JP2677744B2 (ja) 分散メモリ式デジタル計算システム
EP1602030B1 (en) System and method for dynamic ordering in a network processor
Boukerche et al. Dynamic load balancing strategies for conservative parallel simulations
EP0520749B1 (en) A method and apparatus for network computer systems management group administration
Siegel et al. Using the multistage cube network topology in parallel supercomputers
Muhammad Faseeh Qureshi et al. RDP: A storage-tier-aware Robust Data Placement strategy for Hadoop in a Cloud-based Heterogeneous Environment
Lin et al. Adaptive multicast wormhole routing in 2D mesh multicomputers
EP0492174B1 (en) Parallel processor
JPS62233873A (ja) 並列計算機システム
Steenkiste A high-speed network interface for distributed-memory systems: architecture and applications
Khalil et al. Survey of Apache Spark optimized job scheduling in Big Data
CN110647399A (zh) 一种基于人工智能网络的高性能计算系统及方法
Hamdi et al. Dynamic load-balancing of image processing applications on clusters of workstations
Wang et al. A BSP-based parallel iterative processing system with multiple partition strategies for big graphs
Mithila et al. Latency-based vector scheduling of many-task applications for a hybrid cloud
Rajasekaran et al. Parallel algorithms for relational coarsest partition problems
JPH02118756A (ja) マルチプロセッサ・システムにおけるメッセージ通信制御システム
Liu et al. Portable and scalable algorithm for irregular all-to-all communication
Dixit-Radiya et al. Clustering and intra-processor scheduling for explicitly-parallel programs on distributed-memory systems
KR20210061644A (ko) 전력빅데이터 분석 및 처리를 위한 병렬 알고리즘
CN1324026A (zh) 基于自主附网虚拟盘阵列的集群视频服务器及方法
Tavangarian Local-area and wide-area computing: architectures and tools
JPH0438815A (ja) 荷電ビーム描画用データの作成方法及び作成装置
Armstrong et al. A network of workstations (NOW) approach to spatial data analysis: The case of distributed parallel interpolation

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term