JPH05165792A - タイマ同期化方式 - Google Patents

タイマ同期化方式

Info

Publication number
JPH05165792A
JPH05165792A JP3331045A JP33104591A JPH05165792A JP H05165792 A JPH05165792 A JP H05165792A JP 3331045 A JP3331045 A JP 3331045A JP 33104591 A JP33104591 A JP 33104591A JP H05165792 A JPH05165792 A JP H05165792A
Authority
JP
Japan
Prior art keywords
timer
network
processors
packet
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3331045A
Other languages
English (en)
Inventor
Masayuki Ikeda
正幸 池田
Moriyuki Takamura
守幸 高村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP3331045A priority Critical patent/JPH05165792A/ja
Publication of JPH05165792A publication Critical patent/JPH05165792A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 マルチプロセッサシステムのタイマ同期化方
式に関し、各プロセッサ(PE)のタイマの時刻間の誤
差を小さくし、各PEの事象の記録のデバッグおよびチ
ューニングを容易にすることを目的とする。 【構成】 データ転送のための立ち上りおよびスループ
ットがいずれも大きい第1のネットワークと、スループ
ット、立ち上り共に小さい第2のネットワークで各PE
間を接続し、第1のネットワークを通じて各プロセッサ
にタイマ設定値を転送し、転送が終了した後第2のネッ
トワークを通じて全プロセッサに対してトリガを送り、
タイマに時刻設定データを一斉にセットさせるように構
成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】航空宇宙技術における空気力学的
シミュレーション等、各種の分野においては、近い将
来、計算機の演算速度を現在の100倍以上に向上しな
ければ所期の目的が達成されなくなると言われており、
計算機の演算速度の飛躍的な向上が要求されている。
【0002】上記要求に応ずるためには、多数のプロセ
ッサをネットワークによって結合し、並列演算を行わせ
るマルチプロセッサシステムが必須とされ開発が進めら
れている。
【0003】上記マルチプロセッサシステムにおいて
は、各プロセッサはプロセッサエレメントPEと呼ばれ
る。マルチプロセッサシステムには、各PEが主記憶を
共用する共用メモリ型と各PEがそれぞれ固有の主記憶
(ローカルメモリ)を有する分散メモリ型とがある。
【0004】分散メモリ型マルチプロセッサシステム
は、多数の演算が並列実行可能であること、メモリアク
セスタイムの短縮が可能なこと、システム全体として高
いスループットが得られること等の利点を有し、大規模
なシミュレーションのための計算システムとしては最適
と考えられている。
【0005】多数のPEからなるマルチプロセッサシス
テムによって大規模なシミュレーションを行うには、各
PEに別々の処理を並列に行わせる。各PEの処理は相
互に密接な関係を有するので、シミュレーション実行中
の各PE間の時間を合わせるチューニングおよびシミュ
レーション後に各プロセッサの事象間の対応付けを行う
ためのデバッグ作業が重要である。
【0006】そのため、各PEはそれぞれ固有のタイマ
を保有しており、各PEでの事象の記録をタイムスタン
プ(タイマ値)と共にメモリに保存する。全PEのタイ
マはシステムの立ち上り時等に標準時刻に合わせてセッ
ト(タイマ同期化)される。
【0007】
【従来の技術】従来のマルチプロセッサシステムにおい
て、各PEは、PE間のバスのバイト幅が広く汎用的で
あるがデータ転送のための手順が複雑な多段スイッチネ
ットワーク、例えば、クロスバー網によって相互に接続
されていた。このような多段スイッチネットワークはス
ループットは大きいがデータ転送の立ち上りが大きい。
【0008】図4は従来のマルチプロセッサシステムの
タイマ同期化方式を示す。図4において、N個のPE1
−i(i=1〜N)は、それぞれCPUおよび主記憶
(ローカルメモリ)LMを有し、それぞれのプログラム
によって独立に演算を実行する。各PE1−i(i=1
〜N)は、パケットを送信するための送信線5−iおよ
びパケットを受信するための受信線6−iによってネッ
トワーク2と接続されている。
【0009】ネットワーク2は、N行N列のクロスバー
網3を有する。クロスバー網3は、N行のバー、N列の
バー、および第i行バーと第j列バーの各交点に配列さ
れたスイッチ4ij(○印で示す)からなる。
【0010】各スイッチ4ijは制御信号によってオン
オフし、オンの時第i行バーと第j列バーとを接続し、
オフの時それ等を切断する。第i行バーにはPE1−i
の送信線5−iが1対1で接続され、第j列バーにはP
E1−jの受信線6−jが1対1で接続されている。
【0011】PE1−iにおいてプログラム上でPE1
−jの主記憶にアクセスするための命令が解読される
と、ネットワークコントロールに通報され、ネットワー
ク2のスイッチ4ijがオンに制御される。その結果、
第i行バーと第j列バーが接続され、従って、PE1−
iからPE1−jへのパケットの送信経路が形成され
る。例えば、スイッチ41Nがオンとなると発信PE1−
1から受信PE1−Nへの送信経路が形成される。
【0012】クロスバー網3は、PE1−iからPE1
−jへのパケットの送信およびPE1−kからPE1−
1へのパケットの送信がi≠kおよびj≠1の条件で衝
突しないという特長がある。
【0013】図5は、ネットワーク2を通じて転送され
るパケットの形式を示す。図5において、パケット7
は、パケットヘッダ7Aとボディデータ7Bとからな
る。
【0014】パケットヘッダ7Aは、パケットの転送先
PE番号、ボディデータの長さを示すボディ長、データ
の読み出しか書き込みかを示す転送命令コード、発信P
Eのデータ格納領域の先頭アドレスを示す送信ベースア
ドレス、受信PEのデータ格納領域の先頭アドレスを示
す受信ベースアドレス等を含む。
【0015】パケット7のボディ7Bは、IPL(イニ
シャルプログラムロード)、タイマセット、I/O起動
等に必要な情報を含んでいる。PE1−iのタイマをセ
ットするためには、パケットヘッダ7Aの命令コード部
にタイマセット命令のコードを格納し、ボディ7Bにタ
イマにセットすべき設定値を格納した上で、PE1−i
へ送信する。
【0016】PE1−iは、受信したパケット7A内の
命令コードを解読することによりタイマセット命令であ
ることを知り、パケット7B内の設定値を自己のタイマ
にセットする。
【0017】
【発明が解決しようとする問題点】上記のように、各P
E間をクロスバー網3によって結合するマルチプロセッ
サシステムにおけるタイマ同期化はつぎのように行われ
ていた。
【0018】まず一つのPE、例えばPE1−1をマス
タプロセッサとする。マスタプロセッサは他のPE1−
2〜1−Nに対して順次タイマ情報を転送する。タイマ
情報を受領したPEは、自己のタイマを受領したタイマ
情報に従ってセットする。
【0019】上記従来のタイマ同期化方式によれば、各
PE毎のパケットの作成に時間がかかる上に、各PEの
タイマ情報受領時刻が異なるために、各PEのタイマの
設定時刻間に誤差が生じていた。この誤差は、システム
内のPEの数が大きくなる程増加し、チューニングおよ
びデバッグ上問題となっていた。
【0020】本発明は、それぞれ時計を持つ多数のプロ
セッサからなるマルチプロセッサシステムにおいて、各
プロセッサの時刻を精密に合わせ、プログラムのデバッ
グおよびチューニングを容易にするタイマ同期化方式を
提供することを目的とする。
【0021】
【課題を解決するための手段】本発明によるタイマ同期
化方式は、それぞれ独立のタイマを有する多数のプロセ
ッサからなるマルチプロセッサシステムにおいて、多数
のプロセッサ間を接続する、スループットが大で立ち上
りも大である第1の通信ネットワークと、多数のプロセ
ッサ間を接続する、スループットが小で立ち上りも小で
ある第2の通信ネットワークと、全プロセッサに対し
て、それぞれのタイマに設定すべき値を第1の通信ネッ
トワークを介して通知する手段と、各プロセッサのタイ
マに設定すべき値を通知し終った後、設定すべき値を各
プロセッサのタイマに設定させるトリガを第2の通信ネ
ットワークを介して供給する手段とを備えて構成され
る。
【0022】
【作用】上記構成により、まず多数のプロセッサに対し
て、立ち上りは遅いがスループットの大きい第1の通信
ネットワークを通じて、それぞれのタイマに設定すべき
値を通知する。
【0023】例えば、第1の通信ネットワークをクロス
バー網で構成した場合、一つのプロセッサをマスタと
し、このマスタプロセッサから他のプロセッサに対し
て、それぞれのタイマに設定すべき値を順次転送する。
【0024】各プロセッサのタイマに設定すべき値を通
知し終った後、マスタプロセッサから第2の通信ネット
ワークを通じて、全プロセッサに対して、一斉にトリガ
を送り、全プロセッサのタイマに設定値をセットさせ
る。
【0025】第2の通信ネットワークはスループットが
小さいがトリガの送信には十分であり、また、転送の立
ち上りは小さいから各プロセッサのトリガ受信時刻間の
誤差は僅小である。従って、各プロセッサの時刻間の誤
差は僅小となる。
【0026】
【実施例】以下、本発明の実施例について図面を参照し
て詳細に説明する。図1は、本発明によるタイマ同期化
方式の構成を示す。
【0027】図1において、それぞれタイマを有するプ
ロセッサPEi(i=0〜N−1)は、ネットワークN
W1およびネットワークNW2に接続される。
【0028】ネットワークNW1は、スループットは大
きいがデータ転送のための立ち上りも大きいネットワー
ク、例えば、バスのバイト幅が広く、汎用的であるがデ
ータ転送のための手順が複雑で時間がかかる多段スイッ
チネットワークである。
【0029】本実施例ではNW1はクロスバー網を適用
する。クロスバー網は前述のように、PE間にバス幅の
大きい1対1のパケット転送経路を形成するのでスルー
プットは大きい。しかし、パケットの作成に時間がかか
り立ち上り時間が大きい。
【0030】また、クロスバー網は一時に1対1のPE
間接続しかできないため、全PEへの情報転送(ブロー
ドキャスト)を行う場合には、各PEのデータ受信時刻
間の差が大きい。
【0031】ネットワークNW2は、全PE間を少ない
本数の信号線によってN対Nで完全接続する。信号線の
本数は少ないのでスループットは小さいが、情報を全P
Eに対して極めて小さい立ち上り時間で転送することの
できる同期用ブロードキャストネットワークである。従
って、ネットワークNW2による各PEのデータ受信時
刻間の誤差は僅小である。
【0032】図2は、各PEのタイマ同期化回路を示
す。タイマ同期化回路は、ネットワークNW1およびN
W2にそれぞれ接続されるデータ転送部10および2
0、データ転送部10および20に接続されるタイマ3
0、データ転送部20およびタイマ30に接続されるC
PU40、ならびに、データ転送部10およびCPU4
0に接続される主記憶50を有する。
【0033】データ転送部10は、ネットワークNW1
からのパケットを受信するパケット受信制御部11、パ
ケットに含まれる転送命令を解釈し実行する転送命令解
釈実行部12、および、転送命令解釈実行部12からの
転送命令の解釈によって主記憶50へのアクセス(読み
出し又は書き込み)を制御する主記憶アクセス制御部1
3を有する。
【0034】データ転送部20は、ネットワークNW2
からのパケットを受信するパケット受信制御部21、パ
ケット受信制御部21で受信されたパケット内の転送命
令を解釈し実行する転送命令解釈実行部22、および、
転送命令解釈実行部22で解釈された命令に基づきCP
U40へのアクセスを制御するCPUアクセス制御部2
3を有する。
【0035】ネットワークNW1からデータ転送部10
に入力するパケットに含まれる命令がタイマの設定に関
する命令である時、転送命令解釈実行部12はパケット
に含まれる時刻データを取り出し、タイマ30へ送る。
タイマ30はこの時刻データを保持する。
【0036】ネットワークNW2からデータ転送部20
に入力するパケットに含まれる命令がタイマ設定実行を
指示するものである時、転送命令解釈実行部22はタイ
マ30に対してタイマのカウント開始指示を出力する。
【0037】タイマ30は転送命令解釈実行部22から
のカウント開始指示を受領すると、保持している時刻デ
ータを開始時刻として計時を開始する。
【0038】以下、本発明によるタイマ同期化方式の動
作例について説明する。図3は、PE0をマスタPEと
して、全PEの時刻を同期化する場合のPE0の動作を
示すフローチャートである。図3においてマスタPE0
は、ネットワークNW1を介して他のPE1〜N−1に
対してタイマ設定値を含むパケットを順次送信する(S
1)。
【0039】パケットは、ヘッダのみからなり、受信P
E番号、タイマ設定命令コードおよびタイマ設定値(ゼ
ロ)を含む。送信ベースアドレスおよび受信ベースアド
レスは任意とする。
【0040】各受信PE1〜N−1は、パケットを受信
すると、命令コードをデコードし、タイマ設定命令であ
ることを知り、タイマ設定値0を保持する。
【0041】最後のPE(N−1)へのパケットの転送
を終了すると、マスタPE0はネットワークNW2を介
して、全PE(PE0も含む)に対してタイマ開始指示
を行う。全PEはタイマ開始指示を受領すると、CPU
40の制御によって、タイマ設定値0をタイマにセット
する(S2)。
【0042】上述のように、第1段階でマスタPEから
他のPEに対してネットワークNW1を通じて同一のタ
イマ設定値を順次通報し、全PEに通報し終った時点
で、ネットワークNW2を通じて全PEに対してほぼ一
斉にタイマ設定のトリガを与えるので、全PEはほぼ同
時に同一時刻から計時を開始し、従って各PEの時刻間
の誤差は極めて小さいオーダーとなる。
【0043】
【発明の効果】上述のように、本発明によれば、それぞ
れタイマを有する多数のプロセッサからなるマルチプロ
セッサシステムにおいて、プロセッサ間の時刻の誤差が
極めて小さいオーダーとなる。
【0044】従って、多数のプロセッサにそれぞれ独自
のプログラムを並列に実行させるシミュレーション等に
おいて、各プロセッサの事象の記録の対応付けを行うた
めのデバッグ作業、ならびにシミュレータの性能向上の
ためのチューニング作業が容易になる。
【図面の簡単な説明】
【図1】本発明の構成を示す図である。
【図2】図1の各プロセッサの内部回路図である。
【図3】マスタプロセッサの動作を示すフローチャート
である。
【図4】従来技術を示す図である。
【図5】パケットの構成を示す図である。
【符号の説明】
1−1〜1−N プロセッサ(PE) 2 ネットワーク 3 クロスバー網 4 スイッチ 5−1〜5−N 送信線 6−1〜6−N 受信線 7 パケット 7A パケットヘッダ 7B パケットボディ 10,20 データ転送部 11,21 パケット受信制御部 12,22 転送命令解釈実行部 13 主記憶アクセス制御部 23 CPUアクセス制御部 30 タイマ 40 CPU 50 主記憶 NW1,NW2 ネットワーク S1,S2 フローチャートのステップ PE0〜PE(N−1) プロセッサ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 それぞれ独立のタイマを有する多数のプ
    ロセッサからなるマルチプロセッサシステムにおいて、 前記多数のプロセッサ間を接続する、スループットが大
    で立ち上りも大である第1の通信ネットワークと、 前記多数のプロセッサ間を接続する、比較的スループッ
    トが小で立ち上りも小である第2の通信ネットワーク
    と、 前記多数のプロセッサに対して、それぞれのタイマに設
    定すべき値を第1の通信ネットワークを介して通知する
    手段と、 各プロセッサのタイマに設定すべき値を通知し終った
    後、前記設定すべき値を各プロセッサのタイマに設定さ
    せるトリガを第2の通信ネットワークを介して供給する
    手段とを備えることを特徴とするタイマ同期化方式。
  2. 【請求項2】 第1の通信ネットワークは、クロスバー
    網を用いたネットワークである請求項1記載のタイマ同
    期化方式。
JP3331045A 1991-12-16 1991-12-16 タイマ同期化方式 Pending JPH05165792A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3331045A JPH05165792A (ja) 1991-12-16 1991-12-16 タイマ同期化方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3331045A JPH05165792A (ja) 1991-12-16 1991-12-16 タイマ同期化方式

Publications (1)

Publication Number Publication Date
JPH05165792A true JPH05165792A (ja) 1993-07-02

Family

ID=18239226

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3331045A Pending JPH05165792A (ja) 1991-12-16 1991-12-16 タイマ同期化方式

Country Status (1)

Country Link
JP (1) JPH05165792A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140118600A (ko) * 2013-03-29 2014-10-08 한국전자통신연구원 복수의 프로세서와 라인 인터페이스를 갖는 데이터 통신 시스템의 프로세서 시각 동기화 장치 및 그 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254364A (ja) * 1984-05-31 1985-12-16 Nec Corp タイマ設定方式
JPH02114360A (ja) * 1988-10-24 1990-04-26 Nec Corp マルチプロセッサシステムにおけるクロック同期方法
JPH03282959A (ja) * 1990-03-30 1991-12-13 Toshiba Corp マルチプロセッサシステム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254364A (ja) * 1984-05-31 1985-12-16 Nec Corp タイマ設定方式
JPH02114360A (ja) * 1988-10-24 1990-04-26 Nec Corp マルチプロセッサシステムにおけるクロック同期方法
JPH03282959A (ja) * 1990-03-30 1991-12-13 Toshiba Corp マルチプロセッサシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140118600A (ko) * 2013-03-29 2014-10-08 한국전자통신연구원 복수의 프로세서와 라인 인터페이스를 갖는 데이터 통신 시스템의 프로세서 시각 동기화 장치 및 그 방법

Similar Documents

Publication Publication Date Title
Bhuyan et al. Performance of multiprocessor interconnection networks
US7984448B2 (en) Mechanism to support generic collective communication across a variety of programming models
US7246052B2 (en) Bus master and bus slave simulation using function manager and thread manager
EP1145129B1 (en) Parallel computing system
US5280607A (en) Method and apparatus for tolerating faults in mesh architectures
US8448029B2 (en) Multiprocessor system having multiple watchdog timers and method of operation
CN104216862A (zh) 一种用户进程与系统服务之间的通信方法、装置
JPS6345670A (ja) プロセツサ間同期装置
Tabe et al. Statistical analysis of communication time on the IBM SP2
JPH05165792A (ja) タイマ同期化方式
LALA Advanced information processing system
US6901359B1 (en) High speed software driven emulator comprised of a plurality of emulation processors with a method to allow high speed bulk read/write operation synchronous DRAM while refreshing the memory
EP1192570B1 (en) Circuit logic event simulation
EP1552402B1 (en) Integrated circuit and method for sending requests
JPH03132848A (ja) アプリケーションプログラム間通信シミュレート方式
US20060107004A1 (en) Recovery from failure in data storage systems
Banerjee et al. The design, analysis and simulation of a fault-tolerant interconnection network supporting the fetch-and-add primitive
JPS59167710A (ja) シ−ケンサのデ−タ転送方式
Alger et al. Performance evaluation of a realtime fault tolerant distributed system
Tambwekar et al. LiBRA-a load balancing tool for a reconfigurable parallel computer
Kain et al. CHIMPNET: a network testbed
Niranjan et al. An Efficient Algorithm in Fault Tolerance for Electing Coordinator in Distributed Systems
JPS6049464A (ja) マルチプロセッサ計算機におけるプロセッサ間通信方式
CN115643281A (zh) 设备测试方法、装置、测试控制端及存储介质
JPH04225430A (ja) ストリーム型言語におけるバッファリング方式

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19980407