JP2742245B2 - Parallel computer - Google Patents

Parallel computer

Info

Publication number
JP2742245B2
JP2742245B2 JP7102541A JP10254195A JP2742245B2 JP 2742245 B2 JP2742245 B2 JP 2742245B2 JP 7102541 A JP7102541 A JP 7102541A JP 10254195 A JP10254195 A JP 10254195A JP 2742245 B2 JP2742245 B2 JP 2742245B2
Authority
JP
Japan
Prior art keywords
communication register
register
communication
address
arithmetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP7102541A
Other languages
Japanese (ja)
Other versions
JPH08297647A (en
Inventor
憲行 安藤
Original Assignee
甲府日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 甲府日本電気株式会社 filed Critical 甲府日本電気株式会社
Priority to JP7102541A priority Critical patent/JP2742245B2/en
Priority to EP96102910A priority patent/EP0730237A1/en
Priority to CA 2170468 priority patent/CA2170468A1/en
Publication of JPH08297647A publication Critical patent/JPH08297647A/en
Application granted granted Critical
Publication of JP2742245B2 publication Critical patent/JP2742245B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、複数個の演算プロセッ
サからなる演算処理装置、主記憶装置、通信レジスタ装
置及びこれら各装置を結合する相互結合網より構成され
るマルチプロセッサ構成の並列計算機に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a multi-processor parallel computer comprising an arithmetic processing unit comprising a plurality of arithmetic processors, a main storage unit, a communication register unit, and an interconnection network connecting these units. .

【0002】[0002]

【従来の技術】複数個の演算プロセッサより構成される
並列計算機においては、主記憶装置と比較してアクセス
タイムが高速である記憶装置、または主記憶装置と比較
してアクセススループットが大きい記憶装置、または双
方の利点を兼ねそろえた記憶装置を持たせることによ
り、各プロセッサ間の同期制御、排他制御、及び通信制
御の為の共有変数を、この記憶装置に割り当て、各演算
プロセッサはこの記憶装置にアクセスすることにより、
上記制御の処理時間を低減させることができる。例え
ば、2個の演算プロセッサ間で、共有変数へのリード/
ライト処理を介して通信を行う場合、アクセスタイムの
速い記憶装置を介するほうが、主記憶装置を介するよ
り、通信処理は高速に実行できる。この記憶装置を以
下、通信レジスタと呼ぶことにする。
2. Description of the Related Art In a parallel computer comprising a plurality of arithmetic processors, a storage device having an access time faster than a main storage device, or a storage device having an access throughput higher than a main storage device; Alternatively, by providing a storage device having both advantages, a shared variable for synchronization control, exclusive control, and communication control between the processors is assigned to the storage device, and each arithmetic processor is assigned to the storage device. By accessing,
The processing time of the above control can be reduced. For example, a read / shared variable between two arithmetic processors
When communication is performed via the write processing, the communication processing can be executed at a higher speed through a storage device having a shorter access time than through the main storage device. This storage device is hereinafter referred to as a communication register.

【0003】これら同期制御、排他制御、及び通信制御
は、並列計算機で実行する並列処理において、並列実行
が十分になされない制御であり、高並列になるに従い、
これらの制御が全体の性能に及ぼす影響は非常に大きく
なる。従って、このような制御の処理時間を低減するこ
とを目的とする通信レジスタ構成が、並列計算機の性能
向上に及ぼす効果は非常に大きいものである。
[0003] These synchronous control, exclusive control, and communication control are controls in which parallel execution is not sufficiently performed in parallel processing executed by a parallel computer.
The effect of these controls on overall performance is very large. Therefore, the effect of the communication register configuration aimed at reducing the processing time of such control on the performance improvement of the parallel computer is very large.

【0004】通常、通信レジスタの使用方法として、通
信レジスタを複数個のワードから成るセットに分割し、
1つのプロセスに対し1つのセットが割り当てられる。
但し、ここでのプロセスとは複数個に分割され、並列実
行される単位(スレッドと言う)から成る1つの処理単
位である。1つのスレッドは、演算プロセッサのいづれ
かにおいて実行され、複数個のスレッドが同時に複数台
の演算プロセッサで並列に実行処理される。セット内の
複数個のワードの使用方法は、各プログラムにより規定
されており、例えば、あるワードは排他制御のためのロ
ック用フラグとして用いられ、また他のあるワードは同
期制御のためのカウンタに用いられる。さらに、プロセ
スが1つのセットの通信レジスタワード数のみで足りな
い場合には、そのプロセスに複数個のセットを割り当て
るという処理もありうる。
[0004] Usually, a communication register is used by dividing the communication register into a set including a plurality of words.
One set is assigned to one process.
However, the process here is one processing unit that is divided into a plurality of units and includes units (called threads) that are executed in parallel. One thread is executed in any of the arithmetic processors, and a plurality of threads are simultaneously executed in parallel by a plurality of arithmetic processors. The usage of a plurality of words in a set is defined by each program.For example, one word is used as a lock flag for exclusive control, and another word is used as a counter for synchronous control. Used. Further, when a process requires only one set of communication register words, a plurality of sets may be assigned to the process.

【0005】プロセスが実行を開始する場合、オペレー
ティングシステム(OS)に対し通信レジスタのセット
を要求する。OSはその要求に対し、あるセットをその
プロセスに与える。実際には、そのセット番号をプロセ
スに与えることになる。プロセスはセット使用権を受け
取ったならば、各種設定を行った後、並列実行を開始す
る。並列実行終了後は、その旨をOSに通知し、使用し
たセットを開放する。
When a process starts executing, it requests the operating system (OS) to set a communication register. The OS gives a set to the process in response to the request. In effect, we will give that set number to the process. When the process receives the set usage right, it performs various settings and starts parallel execution. After the end of the parallel execution, the OS is notified to that effect and the used set is released.

【0006】[0006]

【発明が解決しようとする課題】上述した従来の通信レ
ジスタ装置付きの並列計算機においては、通信レジスタ
のワード数は、主記憶装置に比較して高速アクセスタイ
ム、高スループット性能を得る為に、論理構成上、回路
実装上の制約より、小容量にせざるを得ない。
In the above-described conventional parallel computer with a communication register device, the number of words in the communication register is determined by a logical value in order to obtain a high-speed access time and a high throughput performance as compared with the main storage device. Due to restrictions on the circuit configuration, the capacity must be reduced.

【0007】しかし、並列計算機の演算プロセッサ数が
多数台数になり、その上で多数個のプロセスが並列実行
される処理環境においては、通信レジスタのセットが数
多く必要になる。従って、並列実行したいプロセス数が
セット数を上回る状況になれば、セット数の枯渇により
プロセスの実行が待たされることになる。また、プロセ
スが複数個のセットを要求するならば、さらに状況が悪
化する。
However, in a processing environment in which the number of arithmetic processors of a parallel computer is large and a large number of processes are executed in parallel, a large number of communication registers are required. Therefore, if the number of processes to be executed in parallel exceeds the number of sets, the execution of the process is delayed due to the exhaustion of the number of sets. Also, if the process requires multiple sets, the situation is even worse.

【0008】高並列状態にて通信レジスタセットが枯渇
する1つの理由として、以下のケースが考えられる。各
演算プロセッサは、タイムシュアリング処理により異る
プロセスを同時並行に実行するが、実際には、ある時間
に実行するプロセスは1つに限られる。この時、他のプ
ロセスは、I/O同期待ちや他演算プロセッサとの同期
待ち等により休止している。オペレーティングシステム
のタイムシュアリングプロセス制御部は、あるプロセス
が休止した場合、他の実行可能なプロセスに切替える。
しかし、休止したプロセスの通信レジスタのセット領域
は確保して置く必要がある。もちろん、休止プロセス切
替え時に、これの通信レジスタセット領域をメモリ等に
一時的に退避する処理を行うことも可能であるが、この
ようなプロセス切替え処理では、切替えオーバヘッドが
非常に大きくなる可能性がある。
One reason why the communication register set is depleted in the highly parallel state is as follows. Each arithmetic processor executes different processes at the same time in parallel by the time-sharing process, but actually, only one process is executed at a certain time. At this time, the other processes are suspended due to waiting for I / O synchronization or synchronization with another processor. When a certain process is suspended, the time sharing process control unit of the operating system switches to another executable process.
However, it is necessary to secure the communication register set area of the suspended process. Of course, it is possible to perform a process of temporarily saving the communication register set area in a memory or the like when the idle process is switched. However, in such a process switching process, the switching overhead may become extremely large. is there.

【0009】[0009]

【課題を解決するための手段】本発明の並列計算機は、
複数個の演算プロセッサからなる演算処理装置、主記憶
装置、複数個の演算プロセッサ間の同期制御、排他制
御、通信制御を実行することを目的とし、複数個の記憶
ワードより構成される通信レジスタ装置が相互結合網に
より結合されたマルチプロセッサ構成の並列計算機にお
いて、各演算プロセッサに、演算プロセッサで実行する
プログラムでの通信レジスタワードが指定する論理通信
レジスタアドレスから、通信レジスタ装置内の通信レジ
スタワードを指定する物理通信レジスタアドレスへ変換
する通信レジスタアドレス変換テーブルを設け、また前
記各演算プロセッサは、通信レジスタが枯渇した場合、
殆んど使用されていない通信レジスタセットを主記憶に
一時的にスワップアウトする機能を有することを特徴と
する。
According to the present invention, there is provided a parallel computer comprising:
An arithmetic processing unit including a plurality of arithmetic processors, a main storage device, and a communication register device including a plurality of storage words for performing synchronization control, exclusive control, and communication control among the plurality of arithmetic processors. In a multi-processor parallel computer connected by an interconnection network, each arithmetic processor sends a communication register word in a communication register device from a logical communication register address specified by a communication register word in a program executed by the arithmetic processor. A communication register address conversion table for converting to a specified physical communication register address is provided, and each of the arithmetic processors, when the communication registers are exhausted,
It is characterized in that it has a function of temporarily swapping out a communication register set that is hardly used to a main memory.

【0010】[0010]

【実施例】以下、本発明の実施例を図を用いて説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Embodiments of the present invention will be described below with reference to the drawings.

【0011】図2は本発明が適用される通信レジスタ装
置を持つ並列計算機の概略構成を示している。10、1
1…1nは、各演算プロセッサ、2は主記憶装置、3は
通信レジスタ装置を示す。4は、演算プロセッサ10,
11…1n、主記憶装置2および通信レジスタ装置3を
接続する相互結合網を示す。各演算プロセッサ10,1
1…1nが主記憶アクセス、もしくは通信レジスタアク
セスを行う場合、リクエストを相互結合網4に対してリ
クエストを送出し、相互結合網4は複数個の演算プロセ
ッサから送られて来る複数個のリクエストを競合調停
し、リクエストが要求する主記憶装置12、もしくは通
信レジスタ装置3へルーティングする。主記憶装置2、
通信レジスタ装置3に到着したリクエストは、各装置内
でリードアクセス処理、モシクハライトアクセス処理が
実行される。リードアクセスの場合は、再度、相互結合
網4を介して演算プロセッサにリードデータが返却され
る。
FIG. 2 shows a schematic configuration of a parallel computer having a communication register device to which the present invention is applied. 10, 1
1... 1n each arithmetic processor, 2 a main storage device, and 3 a communication register device. 4 is an arithmetic processor 10,
11 ... 1n, an interconnection network connecting the main storage device 2 and the communication register device 3 is shown. Each arithmetic processor 10, 1
When 1... 1n perform main memory access or communication register access, the request is sent to the interconnection network 4, and the interconnection network 4 receives a plurality of requests sent from a plurality of arithmetic processors. The contention is arbitrated, and the request is routed to the main storage device 12 or the communication register device 3 requested by the request. Main storage device 2,
The request arriving at the communication register device 3 is subjected to a read access process and a mosh write access process in each device. In the case of read access, read data is returned to the arithmetic processor via the interconnection network 4 again.

【0012】通信レジスタ装置3は、複数個のワードよ
り構成される通信レジスタと、通信レジスタアクセスを
制御する制御部より構成される。通信レジスタは0番地
から連続的にアドレス番号が振られている。以下この通
信レジスタワードに対し付けられているアドレスのこと
を物理アドレスと呼ぶ。物理アドレスは論理的に2つの
フィールドに分割され、上位フィールドを物理セット番
号、下位フィールドをセット内オフセットと呼ぶ。例え
ば、物理セットフィールドがnビット、セット内オフセ
ットがmビットの物理アドレスが合計(n+m)ビット
より構成されているならば、物理セット数は2のn乗
個、セット内ワード数は2のm乗個の合計2の(n+
m)乗個のワードより通信レジスタは構成されているこ
とになる。演算プロセッサ10〜1nからの通信レジス
タアクセスでは、物理アドレスを指定することにより、
アクセスする通信レジスタのワードを決めることが出来
る。
The communication register device 3 includes a communication register composed of a plurality of words and a control unit for controlling access to the communication register. The communication register is assigned an address number continuously from address 0. Hereinafter, the address assigned to this communication register word is called a physical address. The physical address is logically divided into two fields, the upper field is called a physical set number, and the lower field is called an offset within a set. For example, if a physical address having a physical set field of n bits and an offset within the set of m bits is composed of a total of (n + m) bits, the number of physical sets is 2 n and the number of words in the set is 2 m (N +
m) The communication register is composed of the power words. In the communication register access from the arithmetic processors 10 to 1n, by specifying a physical address,
The word of the communication register to be accessed can be determined.

【0013】図3に通信レジスタアクセス命令の命令フ
ォーマットを示す。通信レジスタ命令はオペコードフィ
ールド201とオペランドフィールドより構成される。
オペランドフィールドは、さらにスカラレジスタ番号を
指定する第一オペランドフィールド202と通信レジス
タアドレスを指定する第二オペランドフィールド203
より構成される。ロードアクセスの場合は第二オペラン
ドフィールド203で指定された通信レジスタワードに
格納されている値を、第一オペランドフィールド202
で指定されたスカラレジスタへ転送する。ストアアクセ
スの場合は、このソースとディストネーションの関係が
逆になる。
FIG. 3 shows an instruction format of a communication register access instruction. The communication register instruction includes an operation code field 201 and an operand field.
The operand field further includes a first operand field 202 for specifying a scalar register number and a second operand field 203 for specifying a communication register address.
It is composed of In the case of load access, the value stored in the communication register word specified in the second operand field
Transfer to the scalar register specified by. In the case of store access, the relationship between the source and the destination is reversed.

【0014】この第二オペランドフィールド203で指
定するアドレスのことを論理アドレスという。論理アド
レスは論理セット番号とセット内オフセットに分けるこ
とができる。ここで、論理セット番号はn’ビット構
成、セット内オフセットはmビット構成であり、論理ア
ドレスは合計(n’+m)ビット構成とする。従って、
論理的な通信レジスタ空間は、論理セット数は2のn’
乗個、セット内ワード数は2のm乗個の合計2の(n’
+m)乗個のワードより論理空間は構成されていること
になる。
The address specified in the second operand field 203 is called a logical address. Logical addresses can be divided into logical set numbers and offsets within sets. Here, the logical set number has an n'-bit configuration, the offset in the set has an m-bit configuration, and the logical address has a total (n '+ m) -bit configuration. Therefore,
The logical communication register space is such that the number of logical sets is 2 and n '
The number of words in the set and the number of words in the set are 2 to the power of m, for a total of 2
+ M) to form a logical space.

【0015】ここで、論理通信レジスタアドレスと物理
通信レジスタアドレスの関係を述べる。論理通信レジス
タアドレスのセット内オフセットと物理通信レジスタア
ドレスのセット内オフセットは同じmビットであり、即
ち、セット内のワード数は同じ2のm乗ワードである。
セット番号は、n’>mである。即ち、論理通信レジス
タアドレス空間でのセット数は物理通信レジスタアドレ
ス空間でのセット数より多いことになる。
Here, the relationship between the logical communication register address and the physical communication register address will be described. The offset in the set of the logical communication register address and the offset in the set of the physical communication register address are the same m bits, that is, the number of words in the set is the same 2 m words.
The set number is n '> m. That is, the number of sets in the logical communication register address space is larger than the number of sets in the physical communication register address space.

【0016】相互結合網4を流れるリクエストは、アク
セス先が主記憶装置2なのか通信レジスタ装置3なのか
を示すアクセス種別フィールド、アクセスがロードなの
かストアなのか等を示すコードフィールド、アクセスす
るワードの物理アドレス番地を示すアドレスフィール
ド、および書き込みデータフィールドより構成される。
物理アドレスフィールドはさらに、セット番号とセット
内オフセット分割され、各々にアクセスする通信レジス
タに対するセット番号とセット内オフセットが格納され
る。ロードアクセスの場合は、リプライとして読みだし
データが相互結合網4を逆向きに流れることになる。
The request flowing through the interconnection network 4 includes an access type field indicating whether the access destination is the main storage device 2 or the communication register device 3, a code field indicating whether the access is a load or a store, and a word to be accessed. And a write data field.
The physical address field is further divided into a set number and an offset within the set, and the set number and the offset within the set for the communication register accessing each are stored. In the case of load access, read data flows as a reply through the interconnection network 4 in the reverse direction.

【0017】通信レジスタ装置3では、相互結合網4よ
りリクエストを受け取ったならば、アドレスフィールド
で示されたセット番号とセット内オフセットで指定され
る通信レジスタのワードに対し、コードフィールドで示
される内容がストアならば、該ワードにデータフィール
ドの値を書き込み、ロードならば、該ワードの内容を詠
みだし、これをリプライのデータフィールドとして構成
し、相互結合網4に送出する。
In the communication register device 3, when a request is received from the interconnection network 4, the contents of the communication register specified by the set number and the offset in the set indicated by the address field and the contents indicated by the code field are set. If the data is stored, the value of the data field is written in the word. If the data is loaded, the contents of the word are written, and this is configured as the data field of the reply and transmitted to the interconnection network 4.

【0018】図1は本発明の一実施例であり、演算プロ
セッサ10〜1nのそれぞれに設けられるアドレス変換
部の構成を示している。このアドレス変換部は複数個の
エントリーワードよりなる変換テーブル301,論理セ
ットレジスタ302,論理オフセットレジスタ303,
物理セットレジスタ304,物理オフセットレジスタ3
07,判定器308,論理通信レジスタアドレスレジス
タ309及び物理通信レジスタアドレスレジスタ310
を有する。変換テーブル301の各エントリーは物理通
信レジスタセット番号が入る物理アドレスフィールド3
12、アクセスする論理アドレスが物理アドレス上にマ
ッピングされているか否かを示すUAフィールド311
から構成される。UAフィールド311は1ビット長で
あり、AVAILABLEあらばマッピングされている
ことを意味し、UNAVAILABLEならばマッピン
グされていないことを意味する。
FIG. 1 shows an embodiment of the present invention, and shows a configuration of an address conversion unit provided in each of the arithmetic processors 10 to 1n. The address conversion unit includes a conversion table 301 including a plurality of entry words, a logical set register 302, a logical offset register 303,
Physical set register 304, physical offset register 3
07, decision unit 308, logical communication register address register 309, and physical communication register address register 310
Having. Each entry of the conversion table 301 is a physical address field 3 in which a physical communication register set number is entered.
12. UA field 311 indicating whether a logical address to be accessed is mapped on a physical address
Consists of The UA field 311 has a length of 1 bit, which means that AVAILABLE means that the data is mapped, and that UAVAILABLE means that the data is not mapped.

【0019】アドレス変換部は、演算プロセッサ10〜
1nが発行した通信レジスタアクセスを論理セット番号
から物理セット番号に変換する。それには、論理セット
番号が示すアドレスのエントリーを選択し、この内容を
読み出す。読み出されたエントリーは物理セットレジス
タ304に格納される。
The address conversion unit includes arithmetic processors 10 to 10
The communication register access issued by 1n is converted from a logical set number to a physical set number. To do so, the entry at the address indicated by the logical set number is selected and its contents are read. The read entry is stored in the physical set register 304.

【0020】この時、UAフィールド305がAVAI
LABLEならば、物理セット番号フィールド306
が、示す物理セット番号は有効である。従って、この物
理セット番号を上位フィールドとし、セット内オフセッ
トを下位フィールドとしてこれを連結することにより、
通信レジスタの物理アドレスは生成される。物理アドレ
スが生成されたならば、このアクセスは通信レジスタア
クセスリクエストとして構成され相互結合網4に送出さ
れ、通信レジスタ装置3に至る。
At this time, the UA field 305
If it is LABLE, the physical set number field 306
However, the physical set number shown is valid. Therefore, by linking this physical set number as the upper field and the offset in the set as the lower field,
The physical address of the communication register is generated. Once the physical address is generated, this access is configured as a communication register access request and sent out to the interconnection network 4 to reach the communication register device 3.

【0021】一方、UAフィールド305がUNAVA
ILABLEならば、この論理アドレスが示す通信レジ
スタは物理通信レジスタ上にマッピングされていないこ
とを意味するので、判定器308はこのことを演算プロ
セッサ制御部に割り込みとして通知する。演算プロセッ
サ制御部はこの割り込みを受け付けたならば、現在実行
中の処理を一時的にサスペンドし、これに対する割り込
み処理を実行開始する。
On the other hand, if the UA field 305 is UNAVA
In the case of IABLE, it means that the communication register indicated by the logical address is not mapped on the physical communication register, and thus the determiner 308 notifies the arithmetic processor control unit of this as an interrupt. Upon receiving this interrupt, the arithmetic processor control unit temporarily suspends the process currently being executed, and starts executing an interrupt process for the process.

【0022】割り込み処理は、アローケートされずに主
記憶内にスワップアウトされている内容を、通信レジス
タのいずれかのワードにスワップインする処理となる。
このとき、スワップインするワードを選択する方法はい
くつか考えられるが、例えば、最も使用していないワー
ドを選択する方法がある。さらに、スワップアウト先に
拡張記憶装置を選んでもよい。このスワップアウト/ス
ワップイン処理は、オペレーティングシステムがソフト
的に処理する方法が一番簡単であるが、ハードウェア的
にこれら機能をサポートする構成も考えられる。
The interrupt process is a process of swapping the contents swapped out in the main memory without being allocated to any word of the communication register.
At this time, there are several methods of selecting a word to be swapped in. For example, there is a method of selecting a least used word. Further, an extended storage device may be selected as a swap-out destination. This swap-out / swap-in processing is the simplest way for the operating system to perform the processing in software, but a configuration that supports these functions in hardware is also conceivable.

【0023】スワップインが完了したならば、スワップ
インした通信レジスタの物理アドレう値を、変換テーブ
ル301の論理アドレスが示すエントリーの物理アドレ
スフィールド312に更新する。この後、割り込み処理
は終了し、割り込み前の地点よりプログラムを再実行す
る。割り込みを起こした通信レジスタアクセスは再度ア
ドレス変換部において変換処理することになり、今後は
AVAILABLEで物理アドレスが引けるため通信レ
ジスタアクセスを完了することができる。
When the swap-in is completed, the physical address value of the swapped-in communication register is updated in the physical address field 312 of the entry indicated by the logical address in the conversion table 301. Thereafter, the interrupt processing ends, and the program is re-executed from the point before the interrupt. The access to the communication register that caused the interrupt is converted again by the address conversion unit. Since the physical address can be obtained by AVAILABLE in the future, the communication register access can be completed.

【0024】[0024]

【発明の効果】本発明は、以上の構成を採用することに
より、物理的に用意された通信レジスタ容量より、シス
テムとして使用可能な通信レジスタ容量多く見せること
が可能となる。従って、通信レジスタの枯渇によるプロ
セス投入のホールド状態を低減することが可能となり、
並列計算機上でのシステムループット向上に寄与するこ
とになる。
According to the present invention, by adopting the above configuration, it is possible to make the communication register capacity usable as a system larger than the physically prepared communication register capacity. Therefore, it is possible to reduce the hold state of the process input due to the exhaustion of the communication register,
This contributes to improving the system throughput on a parallel computer.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の一実施例を示すブロック図である。FIG. 1 is a block diagram showing one embodiment of the present invention.

【図2】本発明の適用される並列計算機の概略構成図で
ある。
FIG. 2 is a schematic configuration diagram of a parallel computer to which the present invention is applied.

【図3】本発明の使用される通信レジスタアクセス命令
のフォーマットを示す図である。
FIG. 3 is a diagram showing a format of a communication register access instruction used in the present invention.

【符号の説明】[Explanation of symbols]

10〜1n 演算プロセッサ 2 主記憶装置 3 通信レジスタ装置 4 相互結合網 201 オペコードフィールド 202 第一オペランドフィールド 203 第二オペランドフィールド 301 変換レジスタ 302 論理セットレジスタ 303 論理オフセットレジスタ 304 物理セットレジスタ 305,311 UAフィールド 306 物理セット番号フィールド 307 物理オフセットレジスタ 308 判定器 309 論理通信レジスタアドレスレジスタ 310 物理通信レジスタアドレスレジスタ 312 物理アドレスフィールド。 10-1n Arithmetic processor 2 Main storage device 3 Communication register device 4 Interconnection network 201 Opcode field 202 First operand field 203 Second operand field 301 Conversion register 302 Logical set register 303 Logical offset register 304 Physical set register 305, 311 UA field 306 Physical set number field 307 Physical offset register 308 Judge 309 Logical communication register address register 310 Physical communication register address register 312 Physical address field.

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 複数個の演算プロセッサからなる演算処
理装置、主記憶装置、複数個の演算プロセッサ間の同期
制御、排他制御、通信制御を実行することを目的とし、
複数個の記憶ワードより構成される通信レジスタ装置が
相互結合網により結合されたマルチプロセッサ構成の並
列計算機において、 各演算プロセッサに、演算プロセッサで実行するプログ
ラムでの通信レジスタワードが指定する論理通信レジス
タアドレスから、通信レジスタ装置内の通信レジスタワ
ードを指定する物理通信レジスタアドレスへ変換する通
信レジスタアドレス変換テーブルを設け、また前記各演
算プロセッサは、通信レジスタが枯渇した場合、殆んど
使用されていない通信レジスタセットを主記憶に一時的
にスワップアウトする機能を有することを特徴とする並
列計算機。
An object of the present invention is to execute an arithmetic processing device including a plurality of arithmetic processors, a main storage device, a synchronization control, an exclusive control, and a communication control among the plurality of arithmetic processors.
In a multiprocessor parallel computer in which a communication register device composed of a plurality of storage words is connected by an interconnection network, a logical communication register specified by a communication register word in a program executed by the arithmetic processor is assigned to each arithmetic processor. A communication register address conversion table for converting an address to a physical communication register address designating a communication register word in the communication register device is provided, and each of the arithmetic processors is almost unused when the communication register is exhausted. A parallel computer having a function of temporarily swapping out a communication register set to a main memory.
【請求項2】 前記スワップアウトする対象を個々の通
信レジスタワードとしたことを特徴とする請求項1記載
の並列計算機。
2. The parallel computer according to claim 1, wherein the objects to be swapped out are individual communication register words.
【請求項3】 前記通信レジスタのスワップアウト先を
拡張記憶装置としたことを特徴とする請求項2記載の並
列計算機。
3. The parallel computer according to claim 2, wherein a swap-out destination of said communication register is an extended storage device.
JP7102541A 1995-02-28 1995-04-26 Parallel computer Expired - Fee Related JP2742245B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP7102541A JP2742245B2 (en) 1995-04-26 1995-04-26 Parallel computer
EP96102910A EP0730237A1 (en) 1995-02-28 1996-02-27 Multi-processor system with virtually addressable communication registers and controlling method thereof
CA 2170468 CA2170468A1 (en) 1995-02-28 1996-02-27 Multi-processor system with virtually addressable communication registers and controlling method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7102541A JP2742245B2 (en) 1995-04-26 1995-04-26 Parallel computer

Publications (2)

Publication Number Publication Date
JPH08297647A JPH08297647A (en) 1996-11-12
JP2742245B2 true JP2742245B2 (en) 1998-04-22

Family

ID=14330127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7102541A Expired - Fee Related JP2742245B2 (en) 1995-02-28 1995-04-26 Parallel computer

Country Status (1)

Country Link
JP (1) JP2742245B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02116949A (en) * 1988-10-27 1990-05-01 Nec Corp Information processing system
JPH04111153A (en) * 1990-08-31 1992-04-13 Toshiba Corp Information processor
JP3182000B2 (en) * 1992-10-20 2001-07-03 富士通株式会社 Extended storage device in complex information processing system
JP3098344B2 (en) * 1992-12-18 2000-10-16 富士通株式会社 Data transfer processing method and data transfer processing device

Also Published As

Publication number Publication date
JPH08297647A (en) 1996-11-12

Similar Documents

Publication Publication Date Title
EP1247168B1 (en) Memory shared between processing threads
US6532509B1 (en) Arbitrating command requests in a parallel multi-threaded processing system
KR100613923B1 (en) Context pipelines
JPH11232173A (en) Data processing system provided with remote cache incorporated in local memory and cc-numa (cache consistent type non-uniform memory access) architecture
JPS6353678A (en) Vector processor
JPS61141055A (en) Information processor
US6101589A (en) High performance shared cache
JP2004234123A (en) Multithread computer
KR20040017822A (en) Data transfer mechanism
JPH0512126A (en) Device and method for address conversion for virtual computer
JPH1124992A (en) Limited virtual address aliasing in multiset virtual cache with no back map and fast context switch
JP2561261B2 (en) Buffer storage access method
EP0730237A1 (en) Multi-processor system with virtually addressable communication registers and controlling method thereof
JP3970705B2 (en) Address translator, address translation method, and two-layer address translator
JP3088303B2 (en) Cache memory bank controller
JP2742245B2 (en) Parallel computer
JP2602241B2 (en) Parallel computer
JPH10254775A (en) Memory controller having common cache memory
JPS6336012B2 (en)
JPH05158793A (en) Parallel cache memory
JPH11212900A (en) System controller
JP2731743B2 (en) Parallel computer with communication register
JPH03129543A (en) Main storage device control system
JPH0877072A (en) Cache memory device
JPH01284960A (en) Use priority determining system for memory device

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19971224

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080130

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090130

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100130

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110130

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110130

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120130

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130130

Year of fee payment: 15

LAPS Cancellation because of no payment of annual fees