JP2008176394A - Multiprocessor system - Google Patents
Multiprocessor system Download PDFInfo
- Publication number
- JP2008176394A JP2008176394A JP2007007098A JP2007007098A JP2008176394A JP 2008176394 A JP2008176394 A JP 2008176394A JP 2007007098 A JP2007007098 A JP 2007007098A JP 2007007098 A JP2007007098 A JP 2007007098A JP 2008176394 A JP2008176394 A JP 2008176394A
- Authority
- JP
- Japan
- Prior art keywords
- transaction
- nodes
- node
- port
- ports
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Multi Processors (AREA)
Abstract
Description
本発明は、マルチプロセッサシステムに係り、特に、複数のノードを相互接続して構成されるマルチプロセッサシステムに関する。 The present invention relates to a multiprocessor system, and more particularly to a multiprocessor system configured by interconnecting a plurality of nodes.
複数のポートを持つノードの複数を相互に接続して構成されるマルチプロセッサシステム(以下、SMPシステムという)は、ノード間の相互接続の性能がシステムの性能に極めて大きな影響を与えている。ある程度小規模で、レイテンシ及びバンド幅の要求が厳しいSMPシステムは、ノード相互間を完全メッシュに相互接続して構成される場合が多い。しかし、完全メッシュのトポロジを採用する場合、ノード間の相互接続に用意される各ノードのポート数は、SMPシステムを構成する最大のノード数に合わせて設計されるため、ある数のノード数に合わせて設計したノードを、その最大数に満たないノード数のSMPシステムに採用してSMPシステムを構成すると、モードが持つポートが余ってしまうことになる。 In a multiprocessor system (hereinafter referred to as an SMP system) configured by connecting a plurality of nodes having a plurality of ports to each other, the performance of the interconnection between the nodes has a great influence on the performance of the system. An SMP system that is small to some extent and has high latency and bandwidth requirements is often configured by interconnecting nodes in a complete mesh. However, when adopting a full mesh topology, the number of ports of each node prepared for interconnection between nodes is designed according to the maximum number of nodes constituting the SMP system. If the SMP system is configured by adopting the nodes designed together in the SMP system having the number of nodes less than the maximum number, the ports of the mode are left over.
このような問題を回避する方法に関する従来技術として、例えば、非特許文献1等に記載された技術が知られている。この従来技術は、完全メッシュで接続するSMPシステムのノード数に応じてハイパートランスポートのリンク幅を変化させるというものである。
一般に、SMPシステム内を流れるトランザクションは、その性質からブロードキャスト、マルチキャスト、ユニキャスト等に分類することができる。複数のノードを備えて構成されるSMPシステムは、コヒーレンシ制御の簡易さ等の理由から、ノード間の相互接続を、前述のトランザクションの分類毎にパスを分けて設計する手法が採用されることがある。一方で、ノード数毎に各トランザクション種に必要なバンド幅の比率は変化する。 In general, transactions flowing in the SMP system can be classified into broadcast, multicast, unicast, and the like because of their nature. In an SMP system configured with a plurality of nodes, a method of designing interconnections between nodes for each of the above-described transaction classifications may be adopted for reasons such as easy coherency control. is there. On the other hand, the bandwidth ratio required for each transaction type changes for each number of nodes.
このため、最大ノード数でのパスのバンド幅の比率では、最大未満のノード数で構成されたSMPシステムは、最適なバンド幅の比率とならない場合があるという問題点を生じさせる。 For this reason, the path bandwidth ratio with the maximum number of nodes causes a problem that an SMP system configured with a node number less than the maximum may not have an optimal bandwidth ratio.
本発明の目的は、前述したような点に鑑み、SMPシステムを構成するノード数に応じて、ノード相互間接続におけるトランザクション種へのビット割り当てを変更可能とすることにより、SMPシステムを構成する最大数のノード数に合わせて設計したノードを、その最大数に満たない数備えてSMPシステムを構成した場合にも、より高性能なノード間の相互接続を行うことができるマルチプロセッサシステムを提供することにある。 In view of the above-described points, the object of the present invention is to make it possible to change the bit allocation to the transaction type in the node-to-node connection according to the number of nodes constituting the SMP system. Provided is a multiprocessor system capable of performing higher-performance interconnection between nodes even when an SMP system is configured with less than the maximum number of nodes designed to match the number of nodes. There is.
本発明によれば前記目的は、複数のノードを相互に接続して構成されるマルチプロセッサシステムにおいて、前記複数のノードのそれぞれは、他のノードと相互接続するための複数のポートと、コンフィグレーションユニットと、トランザクション送信ユニットと、トランザクション受信ユニットとを備えて構成され、前記コンフィグレーションユニットは、複数のトランザクション種を定義し、トランザクション種によって前記ポートにおいて使用するビットを分別すると共にポートの宛先を変更するように、トランザクション送信ユニットと、トランザクション受信ユニットとに指示を行い、また、ポート内のビット割り付けを変更して、トランザクション種毎に使用するビット幅を変更するように、トランザクション送信ユニットと、トランザクション受信ユニットとに指示を行うことにより達成される。 According to the present invention, the object is to provide a multiprocessor system configured by connecting a plurality of nodes to each other, wherein each of the plurality of nodes includes a plurality of ports for interconnecting with other nodes, and a configuration. The configuration unit comprises a transaction unit, a transaction transmission unit, and a transaction reception unit. The configuration unit defines a plurality of transaction types, sorts bits used in the port according to transaction types, and changes the port destination. To instruct the transaction transmission unit and the transaction reception unit, and change the bit allocation in the port to change the bit width to be used for each transaction type, It is achieved by giving an instruction to the transaction receiving unit.
本発明によれば、マルチプロセッサシステムを構成する最大数のノード数に合わせて設計したノードを、その最大数に満たない数備えてマルチプロセッサシステムを構成した場合にも、より高性能なノード間の相互接続を行うことができる。 According to the present invention, even when a multiprocessor system is configured with less than the maximum number of nodes designed for the maximum number of nodes constituting the multiprocessor system, it is possible to achieve higher performance between nodes. Can be interconnected.
以下、本発明によるマルチプロセッサシステム(以下、SMPシステムという)の実施形態を図面により詳細に説明する。 Embodiments of a multiprocessor system (hereinafter referred to as an SMP system) according to the present invention will be described below in detail with reference to the drawings.
図1は本発明の第1の実施形態によるSMPシステムの構成を示すブロック図である。このSMPシステム100は、4つのノードが完全メッシュに相互接続されて構成されている例である。
FIG. 1 is a block diagram showing the configuration of the SMP system according to the first embodiment of the present invention. This
すなわち、図1に示すSMPシステム100は、それぞれがLSIにより構成される計算機装置としての第1のノード201と、第2のノード202と、第3のノード203と、第4のノード204との合計4個のノードを有して構成されている。ノード201〜204のそれぞれは、ノードコントローラ300、少なくとも1個のプロセッサ310、典型的にはメモリサブシステム320、I/Oサブシステム330を備えて構成される。各ノードのノードコントローラ300は、ワイヤのみから構成されるパッシブバックプレーン400によって相互接続ネットワーク410を形成して相互に接続されている。相互接続ネットワーク410のトポロジは、完全メッシュ型である。
That is, the
そして、各ノードのノードコントローラ300は、ポートA301、ポートB302、ポートC303の合計3ポートを備えている。ノード201のポートA301とノード202のポートA301とは、パッシブバックプレーン400の中のワイヤ401により接続され、同様に、他のポート相互間もワイヤ402〜406により図1に示す形態で接続されてネットワーク410を形成している。
The
図2は本発明の第2の実施形態によるSMPシステムの構成を示すブロック図である。このSMPシステム101は、1個のメインボード上に、図1に示したと同一の構成を持つノードを2つ設けて構成されている例である。
FIG. 2 is a block diagram showing the configuration of the SMP system according to the second embodiment of the present invention. This
すなわち、図2に示すSMPシステム101は、2個のノードコントローラ300a、300bを含んで構成され、ノードコントローラ300a、300bは、図1に示したノードコントローラ300と同じLSIであり、それぞれに、プロセッサ310a、310b、メモリサブシステム320a、320b、I/Oサブシステム330a、330bが接続されている。
That is, the
そして、このSMPシステム101は、ノードコントローラ300aのポートA301a〜C303aと、ノードコントローラ300bのポートA301b〜C303bとをメインボード上のワイヤ421〜423により相互に接続して構成される。
The
本発明は、同一構成のノードを使用して図1に示すSMPシステムを構成した場合にも、また、図2に示すSMPシステムを構成した場合にも、より高性能なノード間の相互接続を行うことができるマルチプロセッサシステムを提供するものであり、次に、そのためのノードの構成について説明する。 In the present invention, even when the SMP system shown in FIG. 1 is configured using nodes having the same configuration, and when the SMP system shown in FIG. A multiprocessor system that can be performed is provided. Next, a configuration of a node for this purpose will be described.
図3はノードが備えるノードコントローラ300(300a、300bも同様)の構成を示すブロック図である。ノードコントローラは、プロセッサインターフェースユニット(以下、PIUという)501、メモリインターフェースユニット(以下、MIUという)502、I/Oインターフェースユニット(以下、IIUという)503、トランザクション送信ユニット(以下、TXUという)504、トランザクション受信ユニット(以下、RXUという)505、コンフィグレーションユニット(以下、CUという)500の6個のユニットから構成される。 FIG. 3 is a block diagram showing a configuration of a node controller 300 (same for 300a and 300b) included in the node. The node controller includes a processor interface unit (hereinafter referred to as PIU) 501, a memory interface unit (hereinafter referred to as MIU) 502, an I / O interface unit (hereinafter referred to as IIU) 503, a transaction transmission unit (hereinafter referred to as TXU) 504, A transaction receiving unit (hereinafter referred to as RXU) 505 and a configuration unit (hereinafter referred to as CU) 500 are composed of six units.
図1、図2に示したSMPシステム100、101において、ノードコントローラ内及びノードコントローラ間のトランザクションは、自己を含めブロードキャストを必要とするトランザクション(以下、BCトランザクションという)と、1つの要求元と1つ宛先との間で転送を行うトランザクション(以下、1to1トランザクションという)と、BCに対するコヒーレンシ応答トランザクション(以下、GCoHトランザクションという)に大別される。これに伴いノードコントローラ内部のユニット間パス511〜513、521〜523、531〜533、541〜543を含めたノード間相互接続、TXU504とRXU505との間のループバックパス534は、それぞれ、BCトランザクション、1to1トランザクション、GCoHトランザクション用に独立したパスが設けられている。但し、以下に説明する本発明の実施形態ではGCoHトランザクションのパスについては記述を省略している。
In the
図4はTXU504の構成を示すブロック図である。図4に示すTXU504において、図3に示したPIU501からTXU504へのパス511は、128bit幅の1to1アドレスパス511a、256bit幅の1to1データパス511b、128bit幅のBCパス511cにさらに分かれる。MIU502及びIIU503からのパスについても同様である。ここで、1to1アドレスパス511a〜513a及びBCパス511c〜513cに転送されてくる情報は、データ以外の情報をも含み、コマンド、ランザクション情報、メモリアドレスが含まれる。各ユニットからの1to1トランザクションは、そのアドレスが1to1送信調停器610に入力されると共に、対応するデータがデータキュー621〜623に格納される。1to1送信調停器610は、入力される各ユニットからのトランザクションの調停を行い、勝った1to1トランザクションをCU500により設定されたルーティング情報パス554aのルーティング情報と、N2モードパス554bのモード情報(SMPシステムが4ノードで構成されているか、2ノードで構成されているかを示す信号)とに従って宛先ノードから宛先ポートを解決しコマンドを含むアドレスの送信を開始すると共に、セレクタ631〜635、642〜644、652、653をセレクトして、データキュー621〜623内のデータの送信を開始する。各ユニットからのBCトランザクションは、BC送信調停器600に入力され、調停されたトランザクションは、すべての有効なポートにブロードキャストされる。1to1トランザクション、BCトランザクションは、それぞれ、TXU504からの出力時にポート単位に纏められるが、互いに独立したタイミングで転送される。
FIG. 4 is a block diagram showing the configuration of the TXU 504. In the TXU 504 shown in FIG. 4, the
図5はRXU505の構成を示すブロック図である。図5に示すRXU505において、図3に示すノードコントローラのポートA301〜C303から受信したトランザクションは、内部パス541〜543を通りRXU505に入力される。TXU504からループバック用として出力されたトランザクションはポートDを経て、LSI内のループバックパス534を通してRXU505に入力される。1to1トランザクションは、アドレス、データ共に受信ポートA541〜C543、D534に対応した受信バッファ741〜744に格納される。受信バッファの先頭のエントリから1to1アドレスの情報が1to1受信調停器710に入力されると、それらのエントリが調停に参加する。1to1受信調停器710は、あるエントリが調停に勝つと、1to1アドレスパス521a〜523aの中から宛先に対応したパスにトランザクションを出力する。さらに、当該エントリがデータ付きのトランザクションの場合、セレクタ721〜723を制御し、受信バッファ741〜744内のデータを、同時に1to1データパス521b〜523bの内の対応するパスへアドレス内にあるトランザクション情報のデータ長に応じた長さのデータとして出力を開始する。1to1受信調停器710は、アドレス及びデータの出力が完了すると、受信バッファのリードポインタを次のエントリに進める。一方、RXU505に入力されたBCトランザクションは、BC受信調停器700に入力され、ルーティング情報パス555bのルーティング情報とN2モードパス555aのN2モードの情報に従って有効なポートからのBCトランザクションを調停し、内部ユニットPIU501、MIU502、IIU503にブロードキャストする。
FIG. 5 is a block diagram showing the configuration of the
次に、前述のように構成されるノードを4個使用して図1に示して説明したSMPシステム100を構成した場合のトランザクションの処理の流れについて説明する。
Next, the flow of transaction processing when the
図6はSMPシステム100のそれぞれのノード201〜204において、CU500からTXU504及びRXU505に渡されるルーティング情報及びN2モードの設定情報を説明する図である。
FIG. 6 is a diagram illustrating routing information and N2 mode setting information passed from the
ノード201〜204によりSMPシステム100が構成されている場合、ノード201には、図6(a)に示すようにように、ルーティング情報として自ノード番号“0”、ポートA301〜ポートC303の各ポートの宛先ノード番号としてそれぞれに1、2、3が設定され、各ポートの有効を示す“1”が設定される。また、N2モードには、無効を示す“0”が設定される。同様に、ノード202には、図6(b)に示すように、ルーティング情報として自ノード番号“1”、ポートA301〜ポートC303の各ポートの宛先ノード番号としてそれぞれに0、3、2が設定され、各ポートの有効を示す“1”が設定される。また、N2モードには、無効を示す“0”が設定される。同様に、ノード203には、図6(c)に示すように、ルーティング情報として自ノード番号“2”、ポートA301〜ポートC303の各ポートの宛先ノード番号としてそれぞれに3、0、1が設定され、各ポートの有効を示す“1”が設定される。また、N2モードには、無効を示す“0”が設定される。同様に、ノード204には、図6(d)に示すように、ルーティング情報として自ノード番号“3”、ポートA301〜ポートC303の各ポートの宛先ノード番号としてそれぞれに2、1、0が設定され、各ポートの有効を示す“1”が設定される。また、N2モードには、無効を示す“0”が設定される。
When the
次に、前述のような設定がされたSMPシステム100でのトランザクション処理の流れをTXU、RXUでの動作を中心に説明する。
Next, the flow of transaction processing in the
まず、1to1トランザクション処理の例として、ノード201のプロセッサ310にからノード202のメモリサブシステム320へ128Byteのライト要求が発行されたものとして、この場合の処理について説明する。
First, as an example of 1to1 transaction processing, the processing in this case will be described assuming that a 128-byte write request is issued from the
ノード201のPIU501は、プロセッサ310からのライト要求を内部トランザクションとして128Byteのデータ付1to1トランザクションに変換し、アドレスをパス511aに発行し、データをパス511bに発行する。このトランザクションは、アドレスとして16Byteを持ち、データとして128Byteを持つ。ノード201のTXU504は、パス511aからアドレスを受信すると、これを1to1送信調停器610に入力して調停に参加させる。このトランザクションが1to1送信調停器610により発行可となると、宛先ノードが“1”である、ポートA301の送信パス531に対してアドレス及びデータをルーティングする。具体的には、1to1送信調停器610は、まず、セレクタ641をアドレス側に選択し、ポートA301の送信パス531にアドレス16Byteを2サイクルで送信する。次に、セレクタ641をデータ側に選択し、128Byteのデータを16サイクルで送信する。
The
図8はSMPシステム100で1to1トランザクション処理を行う場合のノード201の送信パス531及びノード202のポートA受信パス541の様子を示す図である。送信パス531及び受信パス541は、96ビット幅を持つが、図8に示すように、1to1トランザクション処理で使用されるのは、その内の64ビット幅であり、パスの64ビット幅分を用いて、前述したように、アドレス16Byte及びデータ128Byteを18サイクルで送信している。なお、後述するが、残りの32ビットは、BCトランザクションのために使用される。このように、1to1トランザクションと、BCトランザクションとが、パス上のビット幅を分割して割り付けられて利用しているので、1to1トランザクションと、BCトランザクションとは、同時に処理することができる。
FIG. 8 is a diagram illustrating a state of the
ノード202のRXU505は、ポートA301の受信パス541からのトランザクションを受信して、逐次、受信バッファ741に格納する。そして、1to1アドレスが1to1受信調停器710に読み出され、1to1受信調停器710により、このトランザクションが調停されると、アドレスに含まれる宛先がMIU502となっているため、このトランザクションをMIU502に対してルーティングする。具体的には、1to1アドレスをMIU502宛1to1アドレスパス522aに1サイクルで送信し、1to1データをMIU502宛1to1データパス522bに32Byteずつ4サイクルで送信する。ノード202のMIU502は、このトランザクションを受け取ると、アドレスに含まれるメモリアドレスに対し1to1データとして送られてきた128Byteのデータをメモリサブシステム320に書き込み、このトランザクションの処理を完了する。
The
次に、BCトランザクション処理の例として、ノード201のプロセッサ310からあるキャッシュラインのフラッシュ要求が発行されたものとして、この場合の処理について説明する。
Next, as an example of the BC transaction process, a process in this case will be described assuming that a cache line flush request is issued from the
ノード201のPIU501は、プロセッサ310からのキャッシュラインのフラッシュ要求を内部トランザクションとしてBCトランザクションに変換し、このBCトランザクションをBCパス511cに送信する。このBCトランザクションは、16Byteのアドレスを持つ。TXU504は、BCパス511cからこのBCトランザクションを受信すると、BC送信調停器600に入力して調停に参加させる。TXU504は、BC送信調停器600により、このBCトランザクションが発行可能となると、このBCトランザクションをポートA531〜D534の送信パスの全てに4サイクルで同時に送信する。SMPシステム100の場合、図6により説明したように、N2モードは無効に設定されているため、セレクタ652、653は、パス554b上のN2モードの信号により常にBCトランザクションを選択する。
The
図9はSMPシステム100で、BCトランザクションを各ノード202〜204に転送する場合のポートA〜Cの様子を示す図である。各ポートを接続するパスは、図8でも説明したように、96ビット幅を持つが、図9に示すように、BCトランザクションの転送には、その内の32ビットだけが使用されて、前述したように、16Byteのアドレスが4サイクルで送信される。
FIG. 9 is a diagram illustrating the states of ports A to C when the BC transaction is transferred to each of the
送信されたBCトランザクションは、ノード201自身のRXU505へはポートDのループバックパス534により転送される。ノード201〜204のRXU505は、このBCトランザクションを受信すると、このBCトランザクションをBC受信調停器700に入力して調停に参加させる。BC受信調停器700により、このBCトランザクションが発行可能になると、521c〜523cの全てのパスに対してこのBCトランザクションの送信を行う。ノード201〜204のPIU501、IIU503は、このトランザクションの処理結果をGCoHトランザクションのパスを用いて要求元に返送する。ノード201のPIU501は、全てのユニットからのGCoHトランザクションを受け取ると、このトランザクションの終了処理を行う。
The transmitted BC transaction is transferred to the
次に、SMPシステム100の場合と同様に構成されたノードを2個使用して図2に示して説明したSMPシステム101を構成した場合のトランザクションの処理の流れについて説明する。
Next, the flow of transaction processing when the
図7はSMPシステム101のそれぞれのノードコントローラ300a、300bに設定されるルーティング情報及びN2モード設定を説明する図である。
FIG. 7 is a diagram for explaining routing information and N2 mode setting set in the
ノードコントローラ300a、300bを含むノードによりSMPシステム101が構成されている場合、ノードコントローラ300aには、図7(a)に示すように、仮想的にノード番号“0”が設定される。また、ポートA301a〜C303cの各ポートの宛先ノード番号として全てに“1”が設定され、ポートの有効を示す“1”が設定される。N2モードには、有効を示す“1”が設定される。同様に、ノードコントローラ300bには、図7(b)に示すように、仮想的にノード番号“1”が設定される。また、ポートA301a〜C303cの各ポートの宛先ノード番号として全てに“0”が設定され、ポートの有効を示す“1”が設定される。N2モードには、有効を示す“1”が設定される。
When the
次に、前述のような設定がされたSMPシステム101でのトランザクション処理の流れをTXU、RXUでの動作を中心に説明する。
Next, the flow of transaction processing in the
まず、1to1トランザクション処理の例として、SMPシステム100の場合と同様に、ノードコントローラ300aのプロセッサ310によりノードコントローラ300bのメモリサブシステム320へ128Byteのライト要求が発行されたものとして、この場合の処理について説明する。
First, as an example of 1to1 transaction processing, it is assumed that a 128-byte write request is issued to the
ノードコントローラ300aのPIU501は、プロセッサ310からのライト要求を内部トランザクションとして128Byteデータ付1to1トランザクションに変換し、アドレスをパス511aに発行し、データをパス511bに発行する。ノードコントローラ300aのTXU504は、パス511aからアドレスを受信すると、このアドレスを1to1送信調停器610に入力して調停に参加させる。1to1送信調停器610により、このトランザクションが発行可となると、宛先ノードが“1”となっているトランザクションに対して、ポートA〜Cの宛先は、図7により説明したように、全てノード“1”宛に設定されているので、ポートA531〜C533の送信パスに対してアドレス及びデータをルーティングする。
The
すなわち、1to1送信調停器610は、まず、セレクタ641、642をアドレス側に選択し、ポートA531、B532の送信パスにアドレス16Byteを1サイクルで送信する。次に、1to1送信調停器610は、セレクタ641〜643をデータ側に選択し、さらに、パス554b上のN2モードが有効となっているため、SMPシステム100の場合にBC送信ポートB、Cとして使用されていたパスを1本の1to1データ送信ポートXとして使用する。この結果、1to1データ送信ポートは、合計で32Byte幅となるので、128Byteのデータを4cycleで送信することができる。
That is, the
図10はSMPシステム101で1to1トランザクション処理を行う場合のポートA〜Cの様子を示す図である。図10から判るように、SMPシステム101では、128Byteデータ付の1to1トランザクションは、5サイクルで転送することが可能となる。そして、この場合、ポートAの32ビット分がBCトランザクションに割り振られている。
FIG. 10 is a diagram showing the states of ports A to C when 1to1 transaction processing is performed in the
ノードコントローラ300bのRXUは、ポートA受信パス541〜ポートC受信パス543からトランザクションを受信し、このトランザクションを逐次受信バッファ741〜743に格納する。さらに、N2モードが有効に設定されているため、ポートXに相当するデータを受信バッファ745に格納する。1to1受信調停器710は、N2モードが有効に設定されていると、1to1アドレスが受信バッファ741、742からの読み出しを結合し、ノード“0”からの1to1アドレスとして調停を行う。このアドレスに含まれる宛先がMIU502となっているため、このトランザクションは、調停後MIU502に対してルーティングされる。
The RXU of the
前述で説明した本発明の第1、第2の実施形態において、1つのノードコントローラが、各サブシステムから受け取るノード間1to1トランザクションの数をx、BCトランザクションの数をyとすると、n個のノード間で発生するトランザクション数は、1to1ではnx、BCではny(n−1)となる。従って、前述で説明した第1の実施形態によるSMPシステム100と第2の実施形態による101SMPシステムとでx、yが変化しないとすれば、SMPシステム101におけるノード間トランザクション数は、SMPシステム100におけるノード間のトランザクション数と比較して、1to1では1/2、BCでは1/6となる。
In the first and second embodiments of the present invention described above, assuming that the number of 1 to 1 transactions between nodes received by each node controller is x and the number of BC transactions is y, n nodes The number of transactions occurring between them is nx for 1to1, and ny (n-1) for BC. Therefore, if x and y do not change between the
これに対して、本発明の第2の実施形態によるSMPシステム101の持つ帯域は、3本のポートをSMPシステム100の場合と同じ割当てで使用した場合、1to1、BC共に1/2となるので、SMPシステム100のノード間トランザクション数当たりの帯域と比較すると1to1では等倍、BCでは3倍となり、BCが相対的に余裕がある状態となる。
On the other hand, the bandwidth of the
一方、N2モードを有効とした場合、帯域は、1to1では4/3、BCでは1/6となり、SMPシステム100のノード間のトランザクション数当たりの帯域との比較では、SMPシステム101は、1to1では8/3倍、BCでは等倍となり、システム100と比較して、1to1の帯域に余裕ができる状態となる。1to1トランザクションでは、付属するデータ長が大きくなるほど1トランザクションでより多くの帯域を消費するため、本発明の第2の実施形態によるSMPシステム101は、1to1の帯域に余裕を持たせたN2モードの方がトータルのノード間のスループットをより向上させることができる。
On the other hand, when the N2 mode is enabled, the bandwidth is 4/3 for 1 to 1 and 1/6 for BC. In comparison with the bandwidth per number of transactions between nodes of the
100、101 SMPシステム
201〜204 ノード
300、300a、300b ノードコントローラ
301〜303、301a〜303a、301b〜303b ポートA〜C
310、310a、310b プロセッサ
320、320a、320b メモリサブシステム
330、330a、330b I/Oサブシステム
400 パッシブバックプレーン
500 コンフィグレーションユニット
501 プロセッサインタフェースユニット(PIU)
502 メモリインタフェースユニット(MIU)
503 I/Oインタフェースユニット(IIU)
504 トランザクション送信ユニット(TXU)
505 トランザクション受信ユニット(RXU)
100, 101 SMP system 201-204
310, 310a,
502 Memory Interface Unit (MIU)
503 I / O interface unit (IIU)
504 Transaction sending unit (TXU)
505 Transaction receiving unit (RXU)
Claims (2)
前記複数のノードのそれぞれは、他のノードと相互接続するための複数のポートと、コンフィグレーションユニットと、トランザクション送信ユニットと、トランザクション受信ユニットとを備えて構成され、
前記コンフィグレーションユニットは、複数のトランザクション種を定義し、トランザクション種によって前記ポートにおいて使用するビットを分別すると共にポートの宛先を変更するように、トランザクション送信ユニットと、トランザクション受信ユニットとに指示を行い、また、ポート内のビット割り付けを変更して、トランザクション種毎に使用するビット幅を変更するように、トランザクション送信ユニットと、トランザクション受信ユニットとに指示を行うことを特徴とするマルチプロセッサシステム。 In a multiprocessor system configured by connecting a plurality of nodes to each other,
Each of the plurality of nodes includes a plurality of ports for interconnecting with other nodes, a configuration unit, a transaction transmission unit, and a transaction reception unit.
The configuration unit defines a plurality of transaction types, sorts the bits used in the port according to the transaction types, and instructs the transaction sending unit and the transaction receiving unit to change the port destination, A multiprocessor system characterized by instructing a transaction transmission unit and a transaction reception unit to change a bit allocation in a port and change a bit width used for each transaction type.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007007098A JP2008176394A (en) | 2007-01-16 | 2007-01-16 | Multiprocessor system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007007098A JP2008176394A (en) | 2007-01-16 | 2007-01-16 | Multiprocessor system |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008176394A true JP2008176394A (en) | 2008-07-31 |
Family
ID=39703393
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007007098A Pending JP2008176394A (en) | 2007-01-16 | 2007-01-16 | Multiprocessor system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008176394A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012053504A (en) * | 2010-08-31 | 2012-03-15 | Hitachi Ltd | Blade server device |
JP5440602B2 (en) * | 2009-03-30 | 2014-03-12 | 富士通株式会社 | Data transfer control device, system and method |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002096566A (en) * | 2000-09-25 | 2002-04-02 | Fujicopian Co Ltd | Method for forming color image |
JP2004114654A (en) * | 2002-09-30 | 2004-04-15 | Toppan Printing Co Ltd | Printed matter and packaging material using it |
-
2007
- 2007-01-16 JP JP2007007098A patent/JP2008176394A/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002096566A (en) * | 2000-09-25 | 2002-04-02 | Fujicopian Co Ltd | Method for forming color image |
JP2004114654A (en) * | 2002-09-30 | 2004-04-15 | Toppan Printing Co Ltd | Printed matter and packaging material using it |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5440602B2 (en) * | 2009-03-30 | 2014-03-12 | 富士通株式会社 | Data transfer control device, system and method |
JP2012053504A (en) * | 2010-08-31 | 2012-03-15 | Hitachi Ltd | Blade server device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10282338B1 (en) | Configuring routing in mesh networks | |
EP3140748B1 (en) | Interconnect systems and methods using hybrid memory cube links | |
KR100812225B1 (en) | Crossbar switch architecture for multi-processor SoC platform | |
US8737392B1 (en) | Configuring routing in mesh networks | |
US8151088B1 (en) | Configuring routing in mesh networks | |
US20140092740A1 (en) | Adaptive packet deflection to achieve fair, low-cost, and/or energy-efficient quality of service in network on chip devices | |
JP4818920B2 (en) | Integrated data processing circuit having a plurality of programmable processors | |
US10282343B2 (en) | Semiconductor device | |
EP3729261B1 (en) | A centralized-distributed mixed organization of shared memory for neural network processing | |
CN114338824A (en) | Message protocol for data processing system | |
WO2021114768A1 (en) | Data processing device and method, chip, processor, apparatus, and storage medium | |
US11730325B2 (en) | Dual mode interconnect | |
Alimi et al. | Network-on-chip topologies: Potentials, technical challenges, recent advances and research direction | |
CN114564434B (en) | General multi-core brain processor, acceleration card and computer equipment | |
US11704270B2 (en) | Networked computer with multiple embedded rings | |
US20100110934A1 (en) | Optimized cache consistency algorithm in a point-to-point interconnected multiple processor system | |
US11934334B2 (en) | CCIX port management for PCI express traffic | |
EP2405362B1 (en) | A connection arrangement | |
JP2008176394A (en) | Multiprocessor system | |
JP4687925B2 (en) | Priority arbitration system and priority arbitration method | |
US11860811B2 (en) | Message protocol for a data processing system | |
Alimi et al. | Network-on-Chip Topologies: Potentials, Technical Challenges, Recent Advances and Research Direction | |
US10990552B1 (en) | Streaming interconnect architecture for data processing engine array | |
US20230370392A1 (en) | Network-on-chip architecture for handling different data sizes | |
CN115550235B (en) | Single-period router oriented to neural network platform |