JP2002229963A - Parallel computer system and crossbar switch - Google Patents

Parallel computer system and crossbar switch

Info

Publication number
JP2002229963A
JP2002229963A JP2001030614A JP2001030614A JP2002229963A JP 2002229963 A JP2002229963 A JP 2002229963A JP 2001030614 A JP2001030614 A JP 2001030614A JP 2001030614 A JP2001030614 A JP 2001030614A JP 2002229963 A JP2002229963 A JP 2002229963A
Authority
JP
Japan
Prior art keywords
data
control signal
path
paths
transmission
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001030614A
Other languages
Japanese (ja)
Other versions
JP3661932B2 (en
Inventor
Tadayuki Sakakibara
忠幸 榊原
Masaru Koyanagi
勝 小柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001030614A priority Critical patent/JP3661932B2/en
Publication of JP2002229963A publication Critical patent/JP2002229963A/en
Application granted granted Critical
Publication of JP3661932B2 publication Critical patent/JP3661932B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Multi Processors (AREA)
  • Bus Control (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a parallel computer system in which crossbars of the same structure are applied and a communication path width and the number of connectable nodes are made variable. SOLUTION: To a crossbar switch 3 for the connection between computation nodes of the parallel computer, more than one pairs of a control signal path Ci and a data path Di are made connectable, in a connection pattern that, to each computer node, a pair of the control signal path and the data path is allocated, the crossbar switch 3, in response to the control information on each control signal path Ci, routes the transmission data individually on the corresponding data path Di, and in a connection pattern that, to each computing node, more than one data paths Di are allocated, on the basis of the control information on a control signal path Ci, the crossbar switch 3 collectively routes every pieces of the transmission data on more than one data paths Di.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、並列計算機システ
ムに関し、更に詳しくは、複数の演算ノードを接続する
ためのクロスバスイッチおよびこのクロスバスイッチを
適用した並列計算機システムに関する。
The present invention relates to a parallel computer system, and more particularly to a crossbar switch for connecting a plurality of operation nodes and a parallel computer system to which the crossbar switch is applied.

【0002】[0002]

【従来の技術】膨大な計算処理を高速に実行するため
に、複数の計算機をネットワークで接続したクラスタ構
成、あるいは、一つの計算機を複数のCPUで構成した
SMP(Symmetric Parallel) 構成の並列計算機システ
ムが知られている。例えば、特開平2-228760号公報に
は、複数の計算機を専用のクロスバスイッチで接続する
ことによって高性能化したクラスタ構成の並列計算機が
提案されている。SMP構成の並列計算機システムで
も、CPUの接続台数が増加すると、それぞれ複数のC
PUを含む複数の演算ノードをネットワークで接続した
システム構成が採用される。例えば、特開平9-293060号
公報には、専用のクロスバを用いることによって32台
〜64台以上のCPUを接続したSMP構成の並列計算
機システムが提案されている。
2. Description of the Related Art A parallel computer system having a cluster configuration in which a plurality of computers are connected via a network or an SMP (Symmetric Parallel) configuration in which one computer is configured with a plurality of CPUs in order to execute a huge amount of calculation processing at high speed. It has been known. For example, Japanese Patent Laying-Open No. 2-228760 proposes a cluster-structured parallel computer in which a plurality of computers are connected by a dedicated crossbar switch to achieve high performance. Even in the parallel computer system of the SMP configuration, when the number of connected CPUs increases, a plurality of C
A system configuration in which a plurality of operation nodes including PUs are connected via a network is employed. For example, Japanese Patent Application Laid-Open No. 9-293060 proposes a parallel computer system having an SMP configuration in which 32 to 64 or more CPUs are connected by using a dedicated crossbar.

【0003】演算ノード間の接続に専用のクロスバスイ
ッチを用いたシステムでは、例えば、ノード間通信が頻
繁に発生したり、ノード間通信に大きなスループットを
必要とするアプリケーションを実行する場合、各ノード
とクロスバとの間のスループットがシステム全体の性能
に大きく影響する。このため、クロスバを用いた並列計
算機システムでは、対象となるアプリケーションの目標
性能に応じたスループットが得られるようにクロスバL
SIを設計する必要がある。
In a system in which a dedicated crossbar switch is used for connection between operation nodes, for example, when an inter-node communication frequently occurs or an application that requires a large throughput for the inter-node communication is executed, each node is connected to the other node. The throughput with the crossbar greatly affects the performance of the entire system. For this reason, in a parallel computer system using a crossbar, the crossbar L is adjusted so that a throughput corresponding to the target performance of the target application is obtained.
It is necessary to design SI.

【0004】然るに、クロスバのスループットは、LS
Iの動作周波数とデータ幅とを増やすことによって改善
できるが、LSI製造技術上の制約から、各LSIの動
作周波数と搭載できる外部接続ピンの数には限度があ
る。このために、実際の応用においては、例えば、1つ
のクロスバを複数のLSIに分割し、各演算ノードの送
受信データをこれらの複数のLSIに分割することによ
って、個々のクロスバLSIの送受信データ幅が少なく
て済むようにした構成が採用される。例えば、演算ノー
ド間で8バイト並列の高速データ転送を行う場合に、ノ
ード間に介在するクロスバを1つのLSIで構成しよう
とすると、各入、出力ポートに少なくとも64ビット幅
のデータピンが必要となる。この場合、クロスバを4つ
のLSIに分割すれば、各LSIでは、1ポート当たり
の送受信データ幅が2バイト(16ビット)で済むた
め、既存のLSI技術でも実現可能となる。また、クロ
スバを多段接続すれば、各ノードとクロスバとの間の送
受信データ幅を縮小することなく、接続ノード数を増加
することが可能となる。
However, the throughput of the crossbar is LS
Although improvement can be achieved by increasing the operating frequency and data width of I, there are limitations on the operating frequency of each LSI and the number of external connection pins that can be mounted due to restrictions on LSI manufacturing technology. For this reason, in an actual application, for example, by dividing one crossbar into a plurality of LSIs and dividing transmission / reception data of each operation node into the plurality of LSIs, the transmission / reception data width of each crossbar LSI is reduced. A configuration that can be reduced is adopted. For example, when performing 8-byte parallel high-speed data transfer between operation nodes, if an attempt is made to configure a crossbar interposed between the nodes with one LSI, each input / output port requires at least a 64-bit data pin. Become. In this case, if the crossbar is divided into four LSIs, the transmission / reception data width per port can be 2 bytes (16 bits) in each LSI, so that the existing LSI technology can be used. If the crossbars are connected in multiple stages, it is possible to increase the number of connected nodes without reducing the transmission / reception data width between each node and the crossbar.

【0005】[0005]

【発明が解決しようとする課題】並列計算機システムの
アプリケーションの中には、クロスバに大きなスループ
ットを必要としないものや、クロスバのスループットは
低くても、できるだけ多数の演算ノードを接続した方が
高い性能が得られるものもある。このようにノード間の
通信速度が低くてもよいアプリケーションを対象とした
並列計算機システムでは、高価な高速クロスバは不要で
あり、スループット性能に応じた低コストのクロスバが
あればよい。
Some of the applications of the parallel computer system do not require a large crossbar throughput. Even if the crossbar throughput is low, it is better to connect as many processing nodes as possible. Some are obtained. In such a parallel computer system for applications where the communication speed between nodes may be low, an expensive high-speed crossbar is not required, and a low-cost crossbar according to the throughput performance is sufficient.

【0006】本発明の目的は、同一構造のLSIを適用
して異なるデータ幅の演算ノード間通信を実現できる並
列計算機システムを提供することにある。本発明の他の
目的は、多様なスループットのデータ転送に適合できる
クロスバスイッチを提供することにある。本発明の他の
目的は、演算ノードが必要とするスループットに応じて
接続ノード数を可変にした並列計算機システムおよびノ
ード間接続方式を提供することにある。
An object of the present invention is to provide a parallel computer system capable of realizing communication between operation nodes having different data widths by applying LSIs having the same structure. It is another object of the present invention to provide a crossbar switch that can be adapted to data transfer with various throughputs. Another object of the present invention is to provide a parallel computer system and an inter-node connection method in which the number of connection nodes is made variable according to the throughput required by the operation nodes.

【0007】[0007]

【課題を解決するための手段】上記目的を達成するため
に、本発明では、複数の演算ノードをクロスバスイッチ
で接続した並列計算機システムにおいて、各演算ノード
とクロスバスイッチとの間の接続パス幅を演算ノードが
必要とするスループットに応じて可変にしたことを特徴
とする。更に詳述すると、本発明は、複数の演算ノード
をクロスバスイッチで接続した並列計算機システムにお
いて、上記クロスバスイッチが、入力用および出力用と
してそれぞれ複数対の制御信号パスとデータパスを収容
できるように配置された複数の入、出力ポートを備えて
おり、各演算ノードに上記制御信号パスとデータパスを
1対ずつ割り当てたノード接続形態では、上記クロスバ
スイッチが、各制御信号パス上の制御情報に基づいて、
該制御信号パスと対をなす各データパス上の送信データ
を個別にルーティングし、各演算ノードに上記制御信号
パスとデータパスを1組ずつ割り当てたノード接続形態
では、上記クロスバスイッチが、各組を代表する1つの
制御信号パス上の制御情報に基づいて、各組の複数のデ
ータパス上の送信データを一括してルーティングするよ
うにしたことを特徴とする。
In order to achieve the above object, according to the present invention, in a parallel computer system in which a plurality of operation nodes are connected by a crossbar switch, a connection path width between each operation node and the crossbar switch is reduced. It is characterized by being variable according to the throughput required by the operation node. More specifically, the present invention provides a parallel computer system in which a plurality of operation nodes are connected by a crossbar switch, such that the crossbar switch can accommodate a plurality of pairs of control signal paths and data paths for input and output, respectively. In a node connection configuration in which a plurality of input and output ports are arranged, and a pair of the control signal path and the data path are assigned to each operation node, the crossbar switch transmits control information on each control signal path. On the basis of,
In a node connection configuration in which transmission data on each data path paired with the control signal path is individually routed and one set of the control signal path and one data path is assigned to each operation node, the crossbar switch is , Transmission data on a plurality of data paths in each set is routed collectively based on control information on one control signal path representing the above.

【0008】本発明のクロスバスイッチは、m対の制御
信号パスとデータパス(但し、m>1の整数)を1組と
して、入力用と出力用にそれぞれ複数組分の制御信号パ
スとデータパスを収容できるように配置された複数の
入、出力ポートと、入力用の各制御信号パスから受信し
た制御情報応じて、該制御信号パスと対をなす1つのデ
ータパス上の送信データを個別に転送制御する第1の転
送モードと、各組を代表する1つの制御信号パスから受
信した制御情報応じて、1組複数本のデータパス上の送
信データを一括して転送制御する第2の転送モードとを
切替えるための手段を有し、各演算ノードの送信部と受
信部に上記制御信号パスとデータパスを1対ずつ割り当
てたノード接続形態と、各演算ノードの送信部と受信部
に上記制御信号パスとデータパスを1組ずつ割り当てた
ノード接続形態とを可能としたことを特徴とする。尚、
上記クロスバスイッチが第2の転送モードで動作する時
は、上記各組を代表する制御信号パス以外の他の制御信
号パスを省略した形で、クロスバスイッチと演算ノード
とが接続される。
In the crossbar switch of the present invention, a plurality of sets of control signal paths and data paths are provided for input and output, respectively, as a set of m pairs of control signal paths and data paths (where m> 1 is an integer). According to control information received from each of a plurality of input and output ports arranged so as to be capable of accommodating each control signal path for input, transmission data on one data path forming a pair with the control signal path is individually transmitted. A first transfer mode for performing transfer control, and a second transfer for collectively controlling transmission of transmission data on a plurality of data paths in one set in accordance with control information received from one control signal path representing each set. A node connection mode in which a pair of the control signal path and the data path is assigned to the transmission unit and the reception unit of each operation node, and the transmission unit and the reception unit of each operation node have Control signal path And characterized in that enabling and node topology assigned a data path one set. still,
When the crossbar switch operates in the second transfer mode, the crossbar switch and the operation node are connected in a form omitting the control signal paths other than the control signal path representative of each group.

【0009】本発明の好ましい実施例では、上記クロス
バスイッチに接続される各演算ノードは、例えば、上記
クロスバスイッチに接続された複数のデータパスで並列
的にデータを送受信する高速転送モードと、上記クロス
バスイッチに接続された1つのデータパスで複数ブロッ
クに分割されたデータを時系列的に送受信する低速転送
モードとを切替え可能な送受信部を備える。
In a preferred embodiment of the present invention, each operation node connected to the crossbar switch includes, for example, a high-speed transfer mode for transmitting and receiving data in parallel through a plurality of data paths connected to the crossbar switch; A transmission / reception unit is provided which can switch between a low-speed transfer mode in which data divided into a plurality of blocks is transmitted / received in a time series with one data path connected to the crossbar switch.

【0010】[0010]

【発明の実施の形態】以下、本発明の実施例を図面を参
照して詳細に説明する。図1は、2つの演算ノード(ノ
ード1とノード2)とクロスバスイッチ(以下、単にク
ロスバと言う)3とからなる本発明による並列計算機シ
ステムの基本的なシステム構成を示す。ここに示したシ
ステム構成では、ノード1、ノード2とクロスバ3が、
各ノードの送受信データ幅をフルに利用できる接続関係
となっている。
Embodiments of the present invention will be described below in detail with reference to the drawings. FIG. 1 shows a basic system configuration of a parallel computer system according to the present invention comprising two operation nodes (node 1 and node 2) and a crossbar switch (hereinafter simply referred to as a crossbar) 3. In the system configuration shown here, node 1, node 2 and crossbar 3
The connection is such that the transmission / reception data width of each node can be fully used.

【0011】図において、TX1とRX1は、ノード1
の送信部と受信部を示し、 TX2とRX2は、ノード
2の送信部と受信部を示す。クロスバ3は、制御信号パ
スC1〜C4用の入力ポートと、データパスD1〜D4
用の入力ポートと、制御信号パスC11〜C14用の出
力ポートと、データパスD11〜D14用の出力ポート
とを備えており、データパスD1〜D4、 D11〜D
14は、それぞれ同一のデータ幅をもっている。
In the figure, TX1 and RX1 are nodes 1
TX2 and RX2 denote the transmission unit and the reception unit of the node 2, respectively. The crossbar 3 includes input ports for control signal paths C1 to C4 and data paths D1 to D4.
Input ports, output ports for control signal paths C11 to C14, and output ports for data paths D11 to D14, and data paths D1 to D4, D11 to D14.
14 have the same data width.

【0012】ノード1の送信部TX1は、制御信号パス
C1とデータパスD1、D2を介してクロスバ3に接続
され、Nバイト(またはビット)送信データの上位1/
2をデータパスD1に、下位1/2をデータパスD2に
並列的に送出する。ノード2の送信部TX2は、制御信
号パスC3とデータパスD3、D4を介してクロスバ3
に接続され、ノード1の送信部TX1と同様、送信デー
タの上位1/2をデータパスD3に、下位1/2をデー
タパスD4に送出する。この場合、制御信号パスC2、
C4は未使用となり、データパスD1、D2への送信デ
ータは、制御信号パスC1上の制御情報によってルーテ
ィングされ、データパスD3、D4への送信データは、
制御信号パスC3上の制御情報によってルーティングさ
れる。
The transmission section TX1 of the node 1 is connected to the crossbar 3 via the control signal path C1 and the data paths D1 and D2, and is connected to the upper 1 / N byte (or bit) transmission data.
2 to the data path D1 and the lower half to the data path D2 in parallel. The transmission unit TX2 of the node 2 transmits the signal to the crossbar 3 via the control signal path C3 and the data paths D3 and D4.
And transmits the upper half of the transmission data to the data path D3 and the lower half to the data path D4, similarly to the transmission unit TX1 of the node 1. In this case, the control signal path C2,
C4 becomes unused, transmission data to the data paths D1 and D2 is routed by control information on the control signal path C1, and transmission data to the data paths D3 and D4 is
It is routed by control information on the control signal path C3.

【0013】ノード1の受信部TR1は、制御信号パス
C11とデータパスD11、D12を介してクロスバ3
に接続され、他ノードからの送信データの上位1/2を
データパスD11から、下位1/2をデータパスD12
から並列的に受信し、これらのデータと対応する制御情
報を制御信号パスC11から受信する。これと同様に、
ノード2の受信部TR2は、制御信号パスC13とデー
タパスD13、D14を介してクロスバ3に接続され、
他ノードからの送信データの上位1/2をデータパスD
13、下位1/2をデータパスD14から並列的に受信
し、制御情報を制御信号パスC13から受信する。
The receiving section TR1 of the node 1 is connected to the crossbar 3 via a control signal path C11 and data paths D11 and D12.
, The upper half of the transmission data from the other node from the data path D11 and the lower half of the transmission data from the data path D12.
, And the control information corresponding to these data is received from the control signal path C11. Similarly,
The receiving unit TR2 of the node 2 is connected to the crossbar 3 via a control signal path C13 and data paths D13 and D14,
Data path D
13. The lower half is received in parallel from the data path D14, and control information is received from the control signal path C13.

【0014】図2は、図1と同一構造のクロスバ3によ
って4つの演算ノード(ノード1〜ノード4)を相互接
続した本発明による並列計算機システムのもう1つのシ
ステム構成を示す。図2に示したシステム構成では、上
記各ノードの送信部TX1〜TX4が、それぞれ1対の
制御信号パスとデータパス(C1とD1、 C2とD
2、C3とD3、C4とD4)によってクロスバ3に接
続され、上記各ノードの受信部RX1〜RX4が、それ
ぞれ1対の制御信号パスとデータパス(C11とD1
1、 C12とD12、C13とD13、C14とD1
4)によってクロスバ3に接続されている。
FIG. 2 shows another system configuration of a parallel computer system according to the present invention in which four operation nodes (nodes 1 to 4) are interconnected by a crossbar 3 having the same structure as in FIG. In the system configuration shown in FIG. 2, the transmission units TX1 to TX4 of each of the above-described nodes respectively provide a pair of control signal paths and data paths (C1 and D1, C2 and D1).
2, C3 and D3, C4 and D4), and the receiving units RX1 to RX4 of the above-mentioned nodes respectively provide a pair of control signal paths and data paths (C11 and D1).
1, C12 and D12, C13 and D13, C14 and D1
4) is connected to the crossbar 3.

【0015】上記システム構成において、クロスバ3
は、データパスD1〜D4からの受信データを各データ
パスと対をなす制御信号パスC1〜C4上の制御情報に
従ってルーティングする。この場合、各ノードは、クロ
スバ3に送信するデータ幅が、図1の各ノードがもつデ
ータ幅の半分となっているため、ノード間のデータ転送
速度は遅くなっている。従って、図2に示したシステム
構成は、図1に示したように高スループットにも適合で
きるクロスバ3を用いて、高速データ転送を必要としな
い演算ノードを多数個接続するのに適した構成と言え
る。
In the above system configuration, the crossbar 3
Routes the received data from the data paths D1 to D4 according to the control information on the control signal paths C1 to C4 paired with the respective data paths. In this case, since the data width of each node transmitted to the crossbar 3 is half the data width of each node in FIG. 1, the data transfer speed between the nodes is low. Therefore, the system configuration shown in FIG. 2 has a configuration suitable for connecting a large number of operation nodes that do not require high-speed data transfer by using the crossbar 3 that can be adapted to high throughput as shown in FIG. I can say.

【0016】図3と図4は、上記クロスバ3への接続に
適したデータ転送速度を可変にした演算ノードの1実施
例を示す。図3は、図1におけるノード1の送信部TX
1の構成を示す。図において、10は、CPUやメモ
リ、I/O装置など、演算ノードの主要部を構成するノ
ード内部ユニットを示す。ノード内部ユニットで発生し
た他ノード宛の送信データ(例えば、アドレストランザ
クションやデータトランザクション等)は、 Nバイト
(またはビット)単位で内部パス102に出力され、そ
れに付随する制御情報が、パス101に出力される。
FIGS. 3 and 4 show an embodiment of an operation node in which the data transfer speed suitable for connection to the crossbar 3 is variable. FIG. 3 is a block diagram of the transmission unit TX of the node 1 in FIG.
1 is shown. In the figure, reference numeral 10 denotes a node internal unit, such as a CPU, a memory, and an I / O device, which constitutes a main part of an arithmetic node. Transmission data (for example, an address transaction or a data transaction) destined for another node generated in the node internal unit is output to the internal path 102 in units of N bytes (or bits), and control information accompanying the output is output to the path 101. Is done.

【0017】送信バッファコントローラ12は、パス1
01に現れた制御情報に応じて、上記制御情報と送信デ
ータを送信バッファ11に書き込み、これらをFIFO
形式で読み出す。送信バッファ11から読み出された制
御情報は、パス103に出力され、送信データは、その
上位1/2がパス104に、下位1/2がパス105に
分離して出力される。パス103に読み出された制御情
報は、出力ラッチ14に入力され、パス104に読み出
された上位1/2の送信データは、セレクタ13を介し
て出力ラッチ14に入力される。パス105に読み出さ
れた下位1/2の送信データは、セレクタ13と出力ラ
ッチ14に並列的に入力される。
The transmission buffer controller 12 has a path 1
01, the control information and the transmission data are written into the transmission buffer 11 and these are stored in the FIFO.
Read in format. The control information read from the transmission buffer 11 is output to the path 103, and the transmission data is output with the upper half divided into the path 104 and the lower half divided into the path 105. The control information read to the path 103 is input to the output latch 14, and the upper half transmission data read to the path 104 is input to the output latch 14 via the selector 13. The lower half transmission data read to the path 105 is input to the selector 13 and the output latch 14 in parallel.

【0018】上記セレクタ13は、送信バッファコント
ローラ12によって制御され、ノード1が、図1に示し
たように、出力データパスD1とD2をフルに利用する
高速転送(フルスループット)モードで運用された場
合、セレクタ13は、常にパス104を選択するように
制御される。ノード1が、図2に示したように、データ
パスD1のみを利用する低速転送(低スループット)モ
ードで運用された場合は、セレクタ13は、送信サイク
ル毎に入力パスを切替え、パス104とパス105から
の入力データを交互にパス106に出力するように制御
される。
The selector 13 is controlled by the transmission buffer controller 12, and the node 1 is operated in a high-speed transfer (full throughput) mode in which the output data paths D1 and D2 are fully used as shown in FIG. In this case, the selector 13 is controlled to always select the path 104. When the node 1 is operated in the low-speed transfer (low throughput) mode using only the data path D1 as shown in FIG. 2, the selector 13 switches the input path every transmission cycle, and It is controlled so that the input data from 105 is output to the path 106 alternately.

【0019】ノード1が高速転送モードに設定されてい
た場合、送信バッファコントローラ12は、各送信サイ
クルで1つのトランザクションが処理されるように送信
バッファ11の読み出しポインタを更新する。従って、
高速転送モードでは、送信サイクル毎に、送信バッファ
11からNバイト幅の新たな送信データと、これに付随
する新たな制御情報とが読み出され、これらが出力ラッ
チ14を介して制御信号パスC1とデータパスD1、D
2に出力される。
When the node 1 is set in the high-speed transfer mode, the transmission buffer controller 12 updates the read pointer of the transmission buffer 11 so that one transaction is processed in each transmission cycle. Therefore,
In the high-speed transfer mode, new transmission data having an N-byte width and new control information associated therewith are read from the transmission buffer 11 every transmission cycle, and these are transmitted via the output latch 14 to the control signal path C1. And data paths D1, D
2 is output.

【0020】ノード1が低速転送モードに設定されてい
た場合、送信バッファコントローラ12は、2サイクル
に一回の低い送信レートで、送信バッファ11に制御情
報と送信データを書き込み、送信サイクル毎にセレクタ
13を切替えながら、2サイクル続けて同一の制御情報
と送信データを読み出すように、送信バッファ11の読
み出しポインタを更新する。これによって、最初の送信
サイクルでは、パス103に読み出された制御情報と、
パス104に読み出された上位1/2の送信データ部分
が、出力ラッチ14を介して制御信号パスC1とデータ
パスD1に出力され、次の送信サイクルでは、パス10
3に読み出された同一の制御情報と、パス105に読み
出された下位1/2の送信データ部分が、出力ラッチ1
4を介して制御信号パスC1とデータパスD1に出力さ
れる。尚、ノード1が低速転送モードで運用された場合
は、図3に示したデータパスD2は、クロスバ3には未
接続となるため、パス105を介して出力ラッチ14入
力された下位1/2のデータは無用となる。
When the node 1 is set to the low-speed transfer mode, the transmission buffer controller 12 writes control information and transmission data in the transmission buffer 11 at a low transmission rate once every two cycles, and selects the selector every transmission cycle. While switching 13, the read pointer of the transmission buffer 11 is updated so that the same control information and transmission data are read for two consecutive cycles. Thereby, in the first transmission cycle, the control information read to the path 103 and
The upper half transmission data portion read out on the path 104 is output to the control signal path C1 and the data path D1 via the output latch 14, and in the next transmission cycle, the path 10
3 and the lower half transmission data portion read out to the path 105 are output from the output latch 1.
4 to the control signal path C1 and the data path D1. When the node 1 is operated in the low-speed transfer mode, the data path D2 shown in FIG. 3 is not connected to the crossbar 3, so that the lower half input to the output latch 14 via the path 105 Data is useless.

【0021】図4は、ノード1の受信部TR1の構成を
示す。ノード1の受信部TR1は、クロスバ3から出力
された制御情報とデータを一時的に格納するための受信
バッファ21と、上記受信バッファ21へのデータの書
き込みと読み出しを制御する受信バッファコントローラ
22と、該受信バッファコントローラ22によって制御
されるセレクタ23とを備える。
FIG. 4 shows the configuration of the receiving section TR1 of the node 1. The reception unit TR1 of the node 1 includes a reception buffer 21 for temporarily storing control information and data output from the crossbar 3, a reception buffer controller 22 for controlling writing and reading of data to and from the reception buffer 21, and And a selector 23 controlled by the reception buffer controller 22.

【0022】ノード1が高速転送モードに設定された場
合、セレクタ23は、常にデータパスD12の入力デー
タをパス120に出力するように制御される。従って、
クロスバ3から制御信号パスC11に出力された制御情
報と、データパスD11に出力されたNバイト(ビッ
ト)送信データの上位1/2と、データパスD12に出
力された送信データの下位1/2とが、それぞれ並列的
に受信バッファ21に入力される。受信バッファコント
ローラ22は、これらの制御情報と送信データを各送信
サイクル毎に受信バッファに書き込み、FIFO形式で
読み出して、ノード内部ユニット10に転送する。
When the node 1 is set to the high-speed transfer mode, the selector 23 is controlled to always output the input data of the data path D12 to the path 120. Therefore,
The control information output from the crossbar 3 to the control signal path C11, the upper half of the N-byte (bit) transmission data output to the data path D11, and the lower half of the transmission data output to the data path D12. Are input to the reception buffer 21 in parallel. The reception buffer controller 22 writes the control information and the transmission data into the reception buffer for each transmission cycle, reads out the data in a FIFO format, and transfers it to the node internal unit 10.

【0023】ノード1が低速転送モードで運用された場
合は、データパスD12は未使用となり、Nバイト送信
データの上位1/2に相当するデータブロックと下位1
/2に相当するデータブロックとがデータパスD11に
交互に現れる。従って、低速転送モードのノード1で
は、受信バッファコントローラ22が、各送信サイクル
毎にセレクタ23の入力パスを交互に切替え、例えば、
最初のサイクルでは、制御信号パスC11から入力され
た制御情報と、データパスD11から入力された送信デ
ータの上位1/2を受信バッファ21の1つのエントリ
領域に書き込み、次のサイクルでは、上記エントリ領域
にパス120から入力された送信データの下位1/2を
追加し、2サイクルに一回の割合で、1エントリ分の制
御情報と送信データを読み出すように、読み出しアドレ
スポインタとバッファ入力を制御する。以上、ノード1
の送信部TX1と受信部RX1について説明したが、他
のノードも同様の構成とすることができる。
When the node 1 is operated in the low-speed transfer mode, the data path D12 is not used, and the data block corresponding to the upper half of the N-byte transmission data and the lower one
/ 2 data blocks alternately appear in the data path D11. Therefore, in the node 1 in the low-speed transfer mode, the reception buffer controller 22 alternately switches the input path of the selector 23 for each transmission cycle.
In the first cycle, the control information input from the control signal path C11 and the upper half of the transmission data input from the data path D11 are written into one entry area of the reception buffer 21. The read address pointer and buffer input are controlled so that the lower half of the transmission data input from the path 120 is added to the area, and the control information and transmission data for one entry are read once every two cycles. I do. Node 1
Although the transmission unit TX1 and the reception unit RX1 have been described, other nodes may have the same configuration.

【0024】図5は、クロスバ3の詳細構成の1例を示
す。本発明のクロスバ3は、高速転送(フルスループッ
ト)モードで収容可能なノード数に相当した複数個のク
ロスバ受信制御部30Rと、複数個のクロスバ送信制御
部40Tと、これらを接続する内部パス301〜304
とからなる。ここでは、図1に合わせて、2つのクロス
バ受信制御部30R1、20R2と、2つのクロスバ送
信制御部40T1、40T2を備えたクロスバ3につい
て説明する。
FIG. 5 shows an example of a detailed configuration of the crossbar 3. The crossbar 3 of the present invention includes a plurality of crossbar reception control units 30R corresponding to the number of nodes that can be accommodated in the high-speed transfer (full throughput) mode, a plurality of crossbar transmission control units 40T, and an internal path 301 connecting these. ~ 304
Consists of Here, a crossbar 3 including two crossbar reception control units 30R1 and 20R2 and two crossbar transmission control units 40T1 and 40T2 will be described with reference to FIG.

【0025】クロスバ受信制御部30R1は、制御信号
パスC1とデータパスD1とを収容するための入力ポー
トPc1、Pd1に接続された第1の受信バッファ31
と、該受信バッファ31へのデータの書き込みと読み出
しを制御する第1の受信バッファコントローラ32と、
制御信号パスC2とデータパスD2とを収容するための
入力ポートPc2、Pd2に接続された第2の受信バッ
ファ33と、該受信バッファ33へのデータの書き込み
と読み出しを制御する第2の受信バッファコントローラ
32と、上記第2の受信バッファ33に対して、上記第
1、第2の受信バッファコントローラを選択的に作用さ
せるためのセレクタ35とを含む。
The crossbar reception controller 30R1 includes a first reception buffer 31 connected to input ports Pc1 and Pd1 for accommodating the control signal path C1 and the data path D1.
A first reception buffer controller 32 that controls writing and reading of data to and from the reception buffer 31;
A second reception buffer 33 connected to the input ports Pc2 and Pd2 for accommodating the control signal path C2 and the data path D2, and a second reception buffer controlling writing and reading of data to and from the reception buffer 33 It includes a controller 32 and a selector 35 for causing the first and second reception buffer controllers to selectively act on the second reception buffer 33.

【0026】第1の受信バッファコントローラ32は、
制御信号パスC1から入力された制御情報に応答して、
上記制御信号パスC1からの入力制御情報とデータパス
D1から入力された送信データとを受信バッファ31に
書き込むための制御信号S32を発生する。これと同様
に、第2の受信バッファコントローラ34も、制御信号
パスC2から入力された制御情報に応答して、上記制御
信号パスC2からの入力制御情報とデータパスD2から
入力された送信データとを受信バッファ33に書き込む
ための制御信号S34を発生する。
The first reception buffer controller 32
In response to the control information input from the control signal path C1,
A control signal S32 for writing input control information from the control signal path C1 and transmission data input from the data path D1 to the reception buffer 31 is generated. Similarly, the second receiving buffer controller 34 also responds to the control information input from the control signal path C2, and receives the input control information from the control signal path C2 and the transmission data input from the data path D2. Is generated in the reception buffer 33.

【0027】クロスバ3に接続された各ノードが高速転
送モードで運用されている場合は、図1に示したよう
に、制御信号パスC2は使用されず、制御信号パスC1
がデータパスD1とD2に共用される。この場合、制御
信号パスC2に接続された第2の受信バッファコントロ
ーラ34から出力される制御信号S34は無効となり、
セレクタ35は、第1の受信バッファコントローラ32
から出力された制御信号S32を第2の受信バッファ3
3に与えるように設定される。すなわち、高速転送モー
ドのノードを収容したクロスバでは、第1の受信バッフ
ァコントローラ32で、第1、第2の受信バッファ3
1、32への書き込みと読み出しを同時に制御する。
When each node connected to the crossbar 3 is operated in the high-speed transfer mode, as shown in FIG. 1, the control signal path C2 is not used, and the control signal path C1 is not used.
Are shared by the data paths D1 and D2. In this case, the control signal S34 output from the second reception buffer controller 34 connected to the control signal path C2 becomes invalid,
The selector 35 is connected to the first reception buffer controller 32
Control signal S32 output from the second receiving buffer 3
3 is set. That is, in the crossbar accommodating the nodes in the high-speed transfer mode, the first reception buffer controller 32 controls the first and second reception buffers 3.
The writing and reading to 1, 32 are simultaneously controlled.

【0028】クロスバ3に接続された各ノードが低速転
送モードで運用された場合は、図2に示したように、制
御信号パスC2にデータパスD2の送信データに付随し
た制御情報が出力されている。この場合は、セレクタ3
5が、第2の受信バッファコントローラ34から出力さ
れた制御信号S34を第2の受信バッファ33に与える
ように設定される。すなわち、低速転送モードのノード
を収容したクロスバでは、第1、第2の受信バッファコ
ントローラを互いに独立して機能させることによって、
第1、第2の受信バッファ31、32へのデータの書き
込みと読み出しが別々に制御される。上記第1の受信バ
ッファ31に格納された制御情報とデータは、第1内部
パス301に読み出され、第2の受信バッファ33に格
納された制御情報とデータは、第2内部パス302に読
み出される。
When each node connected to the crossbar 3 is operated in the low-speed transfer mode, as shown in FIG. 2, control information accompanying transmission data of the data path D2 is output to the control signal path C2. I have. In this case, the selector 3
5 is set so as to supply the control signal S 34 output from the second reception buffer controller 34 to the second reception buffer 33. That is, in the crossbar accommodating the nodes in the low-speed transfer mode, the first and second reception buffer controllers function independently of each other,
Writing and reading of data to and from the first and second receiving buffers 31 and 32 are separately controlled. The control information and data stored in the first reception buffer 31 are read out to the first internal path 301, and the control information and data stored in the second reception buffer 33 are read out to the second internal path 302. It is.

【0029】クロスバ受信制御部30R2も、上記クロ
スバ受信制御部30R1と同様、制御信号パスC3とデ
ータパスD3を収容するための入力ポートPc3、Pd
3に接続された第1の受信バッファと、制御信号パスC
4とデータパスD4を収容するための入力ポートPc
4、Pd4に接続された第2の受信バッファとを有し、
上記第1の受信バッファに格納された制御情報とデータ
は、第3内部パス303に読み出され、第2の受信バッ
ファに格納された制御情報とデータは、第4内部パス3
04に読み出される。
Similarly to the crossbar reception control unit 30R1, the crossbar reception control unit 30R2 also has input ports Pc3, Pd for accommodating the control signal path C3 and the data path D3.
3 and a control signal path C
4 and an input port Pc for accommodating the data path D4
4, a second reception buffer connected to Pd4,
The control information and data stored in the first reception buffer are read out to the third internal path 303, and the control information and data stored in the second reception buffer are read out to the fourth internal path 303.
04 is read.

【0030】クロスバ送信制御部40T1は、上記第1
〜第4内部パス301〜304に接続された第1、第2
のセレクタ41、43と、上記第1セレクタ41を制御
するための第1のアービタ42と、上記第2セレクタ4
3を制御するための第2のアービタ44と、上記第2セ
レクタ43に上記第1、第2のアービタを選択的に作用
させるためのセレクタ45とを含む。上記第1のセレク
タ41の出力は、制御信号パスC11とデータパスD1
1を収容するための出力ポートPc11、Pd11に接
続され、上記第2のセレクタ43の出力は、制御信号パ
スC12とデータパスD12を収容するための出力ポー
トPc12、Pd12に接続されている。
The crossbar transmission control unit 40T1 is provided with the first
1st and 2nd connected to 4th internal path 301-304
Selectors 41 and 43, a first arbiter 42 for controlling the first selector 41, and a second arbiter 4
3 and a selector 45 for selectively causing the first and second arbiters to act on the second selector 43. The output of the first selector 41 is connected to the control signal path C11 and the data path D1.
1, and the output of the second selector 43 is connected to output ports Pc12, Pd12 for accommodating the control signal path C12 and the data path D12.

【0031】クロスバ3に接続された各ノードが高速転
送モードで運用されている場合は、第2アービタ44か
らの制御信号S44は無効になる。この場合、セレクタ
45が、第1アービタ42から出力された制御信号S4
2を第2セレクタ43に与えるように設定され、データ
パスD11、D12へのデータ転送が第1アービタ42
で同時に制御される。クロスバ3に接続された各ノード
が低速転送モードで運用されている場合は、セレクタ4
5は、第2アービタ44から出力された制御信号S44
を第2セレクタ43に与えるように設定され、データパ
スD11、D12へのデータ転送が第1、第2アービタ
で別々に制御される。
When each node connected to the crossbar 3 is operating in the high-speed transfer mode, the control signal S44 from the second arbiter 44 becomes invalid. In this case, the selector 45 outputs the control signal S4 output from the first arbiter 42.
2 to the second selector 43, and the data transfer to the data paths D11 and D12 is performed by the first arbiter 42.
Are controlled simultaneously. When each node connected to the crossbar 3 is operated in the low-speed transfer mode, the selector 4
5 is a control signal S44 output from the second arbiter 44.
Is provided to the second selector 43, and data transfer to the data paths D11 and D12 is separately controlled by the first and second arbiters.

【0032】上記各アービタには、第1〜第4内部パス
301〜304から分岐された各制御情報が入力されて
いる。第1アービタ42は、これらの制御情報に基づい
て、第1セレクタ41が、第1〜第4内部パス301〜
304の中からデータパスD11に転送すべきデータを
もつ内部パス30jを選択するように、セレクタ制御信
号S42を発生する。各ノードが高速転送モードで運用
されている時は、上記制御信号S42によって、第2セ
レクタ43が、上記内部パス30jと対をなす内部パス
30j+1を選択する。各ノードが低速転送モードで運
用されている時、第2アービタ44も上記第1アービタ
42と同様に動作し、第2セレクタ43が、第1〜第4
内部パス301〜304の中からデータパスD12に転
送すべきデータをもつパスを選択するように、セレクタ
制御信号S44を発生する。
Each control information branched from the first to fourth internal paths 301 to 304 is input to each arbiter. The first arbiter 42 determines whether the first selector 41 determines the first to fourth internal paths 301 to 301 based on the control information.
The selector control signal S42 is generated so as to select the internal path 30j having the data to be transferred to the data path D11 from among the 304. When each node is operated in the high-speed transfer mode, the second selector 43 selects the internal path 30j + 1 paired with the internal path 30j by the control signal S42. When each node is operated in the low-speed transfer mode, the second arbiter 44 operates similarly to the first arbiter 42, and the second selector 43
A selector control signal S44 is generated so as to select a path having data to be transferred to the data path D12 from the internal paths 301 to 304.

【0033】第1アービタ42は、上記セレクタ制御信
号S42の発生に伴って、選択された内部パス30jへ
のデータの送信元となる受信バッファコントローラに対
して、次のデータ送信を許可する制御信号AB1を発生
する。第2アービタ44も同様に、内部パスの選択の都
度、送信元に制御信号AB2を発生する。クロスバ送信
制御部40T2も、上記クロスバ送信制御部40T1と
同様、第1、第2のアービタを有し、それぞれデータパ
スD13、D14へのデータ転送を制御すると共に、送
信元への制御信号AB3、AB4を発生する。クロスバ
受信制御部30R1、30R2の各受信バッファコント
ローラは、制御信号AB1〜AB4で許可されるのを待
って、受信バッファから次のデータを内部パスに読み出
す。
The first arbiter 42 generates a control signal for permitting the next data transmission to the reception buffer controller which is the transmission source of the data to the selected internal path 30j with the generation of the selector control signal S42. Generate AB1. Similarly, the second arbiter 44 generates a control signal AB2 at the transmission source every time an internal path is selected. The crossbar transmission control unit 40T2, similarly to the crossbar transmission control unit 40T1, has first and second arbiters, controls data transfer to the data paths D13 and D14, respectively, and controls the control signal AB3 to the transmission source. Generate AB4. Each of the reception buffer controllers of the crossbar reception control units 30R1 and 30R2 reads the next data from the reception buffer to the internal path, after being permitted by the control signals AB1 to AB4.

【0034】上記実施例では、説明を簡単にするため
に、高速転送モードで2つのノードを収容可能な小規模
なクロスバスイッチについて説明したが、クロスバスイ
ッチを構成する受信制御部30Rと送信制御部30Tの
個数を増加することによって、収容ノード数の大きい並
列計算機システムを構築できる。また、上記実施例で
は、高速転送モードにおいて、各ノードからの送信デー
タを2つのデータパスで並列的に受信し、低速転送モー
ドにおいて、各データパスを個別に利用することによっ
て、収容ノード数を高速転送モード時の2倍にできるク
ロスバスイッチを示したが、高速転送モードで並列的に
使用するデータパスの本数を増加すれば、同一構造のク
ロスバスイッチを適用した更に多様の並列計算機システ
ムの構築が可能となる。
In the above embodiment, for the sake of simplicity, a small crossbar switch capable of accommodating two nodes in the high-speed transfer mode has been described. However, the reception control unit 30R and the transmission control unit constituting the crossbar switch are described. By increasing the number of 30Ts, a parallel computer system having a large number of accommodation nodes can be constructed. Further, in the above embodiment, in the high-speed transfer mode, the transmission data from each node is received in parallel by two data paths, and in the low-speed transfer mode, each data path is used individually, thereby reducing the number of accommodated nodes. The crossbar switch that can be doubled in the high-speed transfer mode has been described. However, if the number of data paths used in parallel in the high-speed transfer mode is increased, a variety of parallel computer systems using the same structure of the crossbar switch can be constructed. Becomes possible.

【0035】例えば、図5に示した各クロスバ受信制御
部30Rに、受信バッファと受信バッファコントローラ
を4組用意し、高速転送モードでは、第1のコントロー
ラ32で同時の4つの受信バッファを制御し、低速転送
モードでは、4つの受信バッファを個別に制御し、中間
速度の転送モードでは、第1のコントローラで第1、第
2の受信バッファを制御し、第2のコントローラで第
3、第4の受信バッファを制御するようにすれば、同一
のクロスバスイッチを適用して、3段階のデータ転送速
度と3段階のシステム規模を選択可能な、より柔軟性の
ある並列計算機システムの構築が可能となる。尚、図
3、図4では、ノード内部で所定のデータ幅を有し、高
速、低速の2つのデータ転送モードに選択的に適用でき
る演算ノードの構成を例示したが、例えば、低速転送モ
ードを必要とせず、図1に示した高速転送モードのみで
固定的に運用されるノードの送受信部は、セレクタ1
3、23を持たない構成としてもよい。
For example, four sets of reception buffers and reception buffer controllers are prepared in each crossbar reception control unit 30R shown in FIG. 5, and in the high-speed transfer mode, the first controller 32 controls four simultaneous reception buffers. In the low-speed transfer mode, four reception buffers are individually controlled. In the intermediate-speed transfer mode, the first controller controls the first and second reception buffers, and the second controller controls the third and fourth buffers. , It is possible to construct a more flexible parallel computer system that can select three stages of data transfer speed and three stages of system scale by applying the same crossbar switch. Become. In FIGS. 3 and 4, the configuration of the operation node having a predetermined data width inside the node and selectively applicable to two high-speed and low-speed data transfer modes has been exemplified. The transmission / reception unit of the node which is not required and is fixedly operated only in the high-speed transfer mode shown in FIG.
It is good also as composition which does not have 3 and 23.

【0036】[0036]

【発明の効果】以上の説明から明らかなように、本発明
によれば、同一構造のクロスバをノード間データ転送速
度の異なる多様の並列計算機システムに適用できるた
め、量産効果によってクロスバLSIのコストが下が
り、システム価格を低減することが可能となる。また、
クロスバに接続される各ノードの送受信部を予め複数種
類の送受信データ幅に選択的に適合できる構成にしてお
けば、並列計算機システムの適用対象となるアプリケー
ションに応じて、クロスバとの間の転送データ幅を変更
し、クロスバの収容ノード数をデータ転送速度に応じて
容易に増減することが可能となる。
As is apparent from the above description, according to the present invention, the crossbar having the same structure can be applied to various parallel computer systems having different data transfer speeds between nodes. And the system price can be reduced. Also,
If the transmission / reception unit of each node connected to the crossbar is configured in advance to be selectively adaptable to a plurality of types of transmission / reception data widths, the transfer data between the crossbar and the target application of the parallel computer system can be adjusted. By changing the width, the number of nodes accommodated in the crossbar can be easily increased or decreased according to the data transfer speed.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明による並列計算機システムの基本的な構
成を示す図。
FIG. 1 is a diagram showing a basic configuration of a parallel computer system according to the present invention.

【図2】本発明による並列計算機システムの他の構成例
を示す図。
FIG. 2 is a diagram showing another configuration example of the parallel computer system according to the present invention.

【図3】本発明の並列計算機システムにおける演算ノー
ド送信部の1実施例を示す図。
FIG. 3 is a diagram showing one embodiment of an arithmetic node transmitting unit in the parallel computer system of the present invention.

【図4】本発明の並列計算機システムにおける演算ノー
ド受信部の1実施例を示す図。
FIG. 4 is a diagram showing one embodiment of an arithmetic node receiving unit in the parallel computer system of the present invention.

【図5】本発明の並列計算機システムにおけるクロスバ
の1実施例を示す図。
FIG. 5 is a diagram showing one embodiment of a crossbar in the parallel computer system of the present invention.

【符号の説明】[Explanation of symbols]

TX1〜TX4:ノード送信部、RX1〜RX4:ノー
ド受信部、3:クロスバ、10:ノード内部ユニット、
11:送信バッファ、12:送信バッファコントロー
ラ、13:セレクタ、14:出力ラッチ、21:受信バ
ッファ、22:受信バッファコントローラ、23:セレ
クタ、30R:クロスバ受信制御部、40T:クロスバ
送信制御部、31、33:受信バッファ、32、34:
受信バッファコントローラ、41、43:セレクタ、4
2、44:アービタ、Pc1〜Pc14:制御パス接続
ポート、Pd1〜Pd14:データパス接続ノード。
TX1 to TX4: node transmission unit, RX1 to RX4: node reception unit, 3: crossbar, 10: node internal unit,
11: transmission buffer, 12: transmission buffer controller, 13: selector, 14: output latch, 21: reception buffer, 22: reception buffer controller, 23: selector, 30R: crossbar reception control unit, 40T: crossbar transmission control unit, 31 , 33: receive buffer, 32, 34:
Receive buffer controller, 41, 43: selector, 4
2, 44: arbiter, Pc1 to Pc14: control path connection port, Pd1 to Pd14: data path connection node.

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B045 BB16 BB31 KK08 5B061 FF02 GG11 GG16  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5B045 BB16 BB31 KK08 5B061 FF02 GG11 GG16

Claims (6)

【特許請求の範囲】[Claims] 【請求項1】複数の演算ノードをクロスバスイッチで接
続した並列計算機システムにおいて、 上記クロスバスイッチが、入力用および出力用としてそ
れぞれ複数対の制御信号パスとデータパスを収容できる
ように配置された複数の入、出力ポートを備えており、 上記制御信号パスとデータパスを各演算ノードに1対ず
つ割り当てたノード接続形態では、上記クロスバスイッ
チが、各制御信号パス上の制御情報に基づいて、該制御
信号パスと対をなす各データパス上の送信データを個別
にルーティングし、 複数対の制御信号パスとデータパスを1組にして、上記
制御信号パスとデータパスを各演算ノードに1組ずつ割
り当てたノード接続形態では、上記クロスバスイッチ
が、上記何れかの制御信号パス上の制御情報に基づい
て、各組の複数のデータパス上の送信データを一括して
ルーティングするようにしたことを特徴とする並列計算
機システム。
1. A parallel computer system in which a plurality of operation nodes are connected by a crossbar switch, wherein the crossbar switch is arranged so as to accommodate a plurality of pairs of control signal paths and data paths for input and output. In the node connection configuration in which the control signal path and the data path are assigned to each operation node in pairs, the crossbar switch is configured to perform the control signal path and the data path based on the control information on each control signal path. The transmission data on each data path forming a pair with the control signal path is individually routed, and a plurality of pairs of control signal paths and data paths are combined into one set. In the assigned node connection mode, the crossbar switch is configured to control each set of a plurality of sets based on control information on any of the control signal paths. Parallel computer system to collectively transmit data on Tapasu characterized by being adapted to routing.
【請求項2】各演算ノードが、前記クロスバスイッチに
接続された複数のデータパスで並列的にデータを送受信
する高速転送モードと、前記クロスバスイッチに接続さ
れた1つのデータパスで複数ブロックに分割されたデー
タを時系列的に送受信する低速転送モードと選択可能な
送受信部を備えたことを特徴とする請求項1に記載の並
列計算機システム。
2. A high-speed transfer mode in which each operation node transmits and receives data in parallel through a plurality of data paths connected to the crossbar switch, and a plurality of blocks is divided into a plurality of blocks by one data path connected to the crossbar switch. 2. The parallel computer system according to claim 1, further comprising a transmission / reception unit capable of selecting a low-speed transfer mode for transmitting / receiving the selected data in a time-series manner.
【請求項3】複数の演算ノードをクロスバスイッチで接
続した並列計算機システムにおいて、上記クロスバスイ
ッチが、 m対の制御信号パスとデータパス(但し、m>1の整
数)を1組として、入力用と出力用にそれぞれ複数組分
の制御信号パスとデータパスを収容できるように配置さ
れた複数の入、出力ポートと、 入力用の各制御信号パスから受信した制御情報に応じ
て、該制御信号パスと対をなす1つのデータパス上の送
信データを個別に転送制御する第1の転送モードと、各
組を代表する入力用の1つの制御信号パスから受信した
制御情報に応じて、1組複数本のデータパス上の送信デ
ータを一括して転送制御する第2の転送モードとを切替
えるための手段とを有し、 上記クロスバスイッチが上記第2の転送モードで動作す
る時は、上記各組を代表する制御信号パスによって上記
クロスバスイッチと演算ノードとが接続されることを特
徴とする並列計算機システム。
3. In a parallel computer system in which a plurality of operation nodes are connected by a crossbar switch, the crossbar switch sets a pair of m pairs of control signal paths and data paths (where m> 1 is an integer) as a set for input. And a plurality of input and output ports arranged to accommodate a plurality of sets of control signal paths and data paths for output and output signals, respectively, in accordance with control information received from each control signal path for input. A first transfer mode for individually controlling transfer of transmission data on one data path forming a pair with a path, and one set according to control information received from one input control signal path representing each set. Means for switching between a second transfer mode for collectively controlling transmission data on a plurality of data paths, and when the crossbar switch operates in the second transfer mode, Parallel computer system, characterized in that the said crossbar switch and operation nodes are connected by a control signal path representative of serial each set.
【請求項4】前記第2の転送モードで動作する時は、前
記各演算ノードが、入、出力用のm本のデータパスで並
列的にデータを送受信し、該データに付随する制御情報
を前記各組を代表する制御信号パスで送受信することを
特徴とする請求項3に記載の並列計算機システム。
4. When operating in the second transfer mode, each of the operation nodes transmits and receives data in parallel through m data paths for input and output, and transmits control information accompanying the data. The parallel computer system according to claim 3, wherein transmission and reception are performed through control signal paths representing the respective sets.
【請求項5】複数のノードに接続され、ノード間で制御
信号とデータを転送するためのクロスバスイッチであっ
て、 m対の制御信号パスとデータパス(但し、m>1の整
数)を1組として、入力用と出力用にそれぞれ複数組分
の制御信号パスとデータパスを収容できるように配置さ
れた複数の入、出力ポートと、 入力用の各制御信号パスから受信した制御情報に応じ
て、該制御信号パスと対をなす1つのデータパス上の送
信データを個別に転送制御する第1の転送モードと、各
組を代表する入力用の1つの制御信号パスから受信した
制御情報に応じて、1組複数本のデータパス上の送信デ
ータを一括して転送制御する第2の転送モードとを切替
えるための手段とを有し、 各演算ノードの送信部と受信部に上記制御信号パスとデ
ータパスを1対ずつ割り当てた第1のノード接続形態
と、各演算ノードの送信部と受信部に上記制御信号パス
とデータパスを1組ずつ割り当てた第2のノード接続形
態とを可能としたことを特徴とするクロスバスイッチ。
5. A crossbar switch connected to a plurality of nodes for transferring control signals and data between the nodes, wherein m pairs of control signal paths and data paths (where m> 1 is an integer) are set to 1 A plurality of input and output ports arranged to accommodate a plurality of sets of control signal paths and data paths for input and output, respectively, according to control information received from each control signal path for input. A first transfer mode in which transmission data on one data path paired with the control signal path is individually controlled, and a control information received from one input control signal path representing each set. Means for switching to a second transfer mode for collectively controlling transmission of transmission data on a plurality of data paths in a set. The control signal is transmitted to a transmission unit and a reception unit of each operation node. One path and one data path And a second node connection mode in which the control signal path and the data path are assigned to the transmission unit and the reception unit of each operation node in pairs. Crossbar switch.
【請求項6】請求項5に記載のクロスバスイッチにおい
て、 前記各組に対応して設けられた複数の受信制御部および
送信制御部と、上記受信制御部と送信制御部との間を接
続するための複数の内部パスを有し、 上記各受信制御部が、それぞれ1対の入力用の制御信号
パスとデータパスから受信された制御情報とデータとを
一時的に格納するm個の受信バッファと、それぞれ上記
制御情報とデータの上記受信バッファへの書き込みと読
み出しを制御するm個の受信バッファコントローラと、
前記第1の転送モードでは、上記各受信バッファコント
ローラが発生する制御出力をそれに付随する受信バッフ
ァに個別に作用させ、前記第2の転送モードでは、上記
受信バッファコントローラのうちの1つが発生する制御
出力を上記m個の受信バッファに作用させるための制御
信号選択手段とを有し、 上記各内部パスが、前記受信制御部の受信バッファ毎に
設けられ、 上記各送信制御部が、それぞれ上記複数の内部パスの1
つを選択的に前記出力ポートの1つに接続するm個のセ
レクタと、上記各セレクタに付随して設けられたm個の
アービタと、前記第1の転送モードでは、上記各アービ
タが発生する制御出力をそれに付随するセレクタに個別
に作用させ、前記第2の転送モードでは、上記アービタ
のうちの1つが発生する制御出力を上記m個のセレクタ
に作用させるための制御信号選択手段とを有し、 上記各アービタが、それぞれ上記複数の内部パスから抽
出された制御情報に基づいて、セレクタ制御出力を発生
することを特徴とする請求項5に記載のクロスバスイッ
チ。
6. The crossbar switch according to claim 5, wherein a plurality of reception control units and transmission control units provided corresponding to the respective sets are connected to each other, and between the reception control unit and the transmission control unit. M reception buffers, each of which has a plurality of internal paths, and each of the reception control units temporarily stores control information and data received from a pair of input control signal paths and data paths, respectively. And m reception buffer controllers for controlling writing and reading of the control information and data to and from the reception buffer, respectively,
In the first transfer mode, the control output generated by each of the receive buffer controllers is individually applied to the associated receive buffer, and in the second transfer mode, the control output generated by one of the receive buffer controllers is performed. Control signal selecting means for causing an output to act on the m number of reception buffers; wherein each of the internal paths is provided for each reception buffer of the reception control unit; One of the internal paths of
M selectors for selectively connecting one to one of the output ports, m arbiters provided in association with the selectors, and the arbiters are generated in the first transfer mode. A control signal selecting means for causing a control output to be individually applied to a selector associated therewith, and in the second transfer mode, applying a control output generated by one of the arbiters to the m selectors. The crossbar switch according to claim 5, wherein each of the arbiters generates a selector control output based on control information extracted from each of the plurality of internal paths.
JP2001030614A 2001-02-07 2001-02-07 Parallel computer system and crossbar switch Expired - Fee Related JP3661932B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001030614A JP3661932B2 (en) 2001-02-07 2001-02-07 Parallel computer system and crossbar switch

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001030614A JP3661932B2 (en) 2001-02-07 2001-02-07 Parallel computer system and crossbar switch

Publications (2)

Publication Number Publication Date
JP2002229963A true JP2002229963A (en) 2002-08-16
JP3661932B2 JP3661932B2 (en) 2005-06-22

Family

ID=18894806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001030614A Expired - Fee Related JP3661932B2 (en) 2001-02-07 2001-02-07 Parallel computer system and crossbar switch

Country Status (1)

Country Link
JP (1) JP3661932B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010064661A1 (en) * 2008-12-04 2010-06-10 日本電気株式会社 Parallel computation system, and method and program therefor
CN104111911A (en) * 2013-04-18 2014-10-22 富士通株式会社 Information Processing System, Control Apparatus, And Method Of Controlling Information Processing System
CN114968902A (en) * 2022-07-28 2022-08-30 沐曦科技(成都)有限公司 Multiprocessor interconnection system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010064661A1 (en) * 2008-12-04 2010-06-10 日本電気株式会社 Parallel computation system, and method and program therefor
US8824317B2 (en) 2008-12-04 2014-09-02 Nec Corporation Parallel calculation system, and method and program thereof
CN104111911A (en) * 2013-04-18 2014-10-22 富士通株式会社 Information Processing System, Control Apparatus, And Method Of Controlling Information Processing System
CN114968902A (en) * 2022-07-28 2022-08-30 沐曦科技(成都)有限公司 Multiprocessor interconnection system

Also Published As

Publication number Publication date
JP3661932B2 (en) 2005-06-22

Similar Documents

Publication Publication Date Title
KR100250437B1 (en) Path control device for round robin arbitration and adaptation
JP2558393B2 (en) Multi-cluster signal processor
Saastamoinen et al. Interconnect IP node for future system-on-chip designs
CN101477512B (en) Processor system and its access method
US5630162A (en) Array processor dotted communication network based on H-DOTs
US6061345A (en) Crossbar routing switch for a hierarchical crossbar interconnection network
EP0271492A1 (en) A data processing device
US8589614B2 (en) Network system with crossbar switch and bypass route directly coupling crossbar interfaces
US20070140280A1 (en) Computer chip for connecting devices on the chip utilizing star-torus topology
US20060212619A1 (en) Data processing system
US6567909B2 (en) Parallel processor system
JP3709322B2 (en) Multidimensional crossbar network and parallel computer system
JP3661932B2 (en) Parallel computer system and crossbar switch
US7218638B2 (en) Switch operation scheduling mechanism with concurrent connection and queue scheduling
JP2009282917A (en) Interserver communication mechanism and computer system
KR20030084971A (en) A communication system
EP0982898B1 (en) Switching apparatus comprising at least one switch core access element for the attachment of various protocol adapters
US7272151B2 (en) Centralized switching fabric scheduler supporting simultaneous updates
JPH05274279A (en) Device for parallel processing and device therefor
JPH06266684A (en) Interprocessor routing system
KR100798302B1 (en) System on Chip with Hybrid Communication Architecture of On-Chip BUS and On-Chip Network
JPS63257052A (en) Multiprocessor system
CN113544658A (en) Computing architecture for permuting torus network interconnections
JP2004056590A (en) Image forming device
JP2003178038A (en) Node-to-node data transferring method and device therefor

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040720

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050317

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090401

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees