JP2005242500A - Read request arbitration control system and its method - Google Patents
Read request arbitration control system and its method Download PDFInfo
- Publication number
- JP2005242500A JP2005242500A JP2004048861A JP2004048861A JP2005242500A JP 2005242500 A JP2005242500 A JP 2005242500A JP 2004048861 A JP2004048861 A JP 2004048861A JP 2004048861 A JP2004048861 A JP 2004048861A JP 2005242500 A JP2005242500 A JP 2005242500A
- Authority
- JP
- Japan
- Prior art keywords
- read request
- request
- latency
- read
- arbitration control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 30
- 230000015654 memory Effects 0.000 claims abstract description 41
- 230000004044 response Effects 0.000 claims 4
- 230000006872 improvement Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Images
Landscapes
- Multi Processors (AREA)
- Memory System (AREA)
Abstract
Description
本発明はリードリクエスト調停制御システム及びその方法に関し、特にNUMA(NonUniform Memory Access)型分散共有メモリ並列計算機におけるリードリクエスト調停制御方式に関するものである。 The present invention relates to a read request arbitration control system and method, and more particularly to a read request arbitration control system in a NUMA (Non Uniform Memory Access) type distributed shared memory parallel computer.
従来の共有メモリシステムの一例として、図17に示すようなUMA(Uniform Memory Access )システムがある。このシステムでは、物理アドレスに依存することなく、メモリアクセスレイテンシが同じであるとして、各プロセッサ801〜804の主記憶ユニット806に対するリードリクエストのリプライは、制御ユニット805によって、当該リードリクエストの発行順に返却されるようになっている。
As an example of a conventional shared memory system, there is a UMA (Uniform Memory Access) system as shown in FIG. In this system, it is assumed that the memory access latency is the same without depending on the physical address, and the reply of the read request to the
よって、リードリクエスト間の調停は必要なく、図18に示すように、リードリクエスト調停ユニット11内において、リードリクエスト110をリードリクエスト登録テーブル102に登録しておき、登録した順番にリードリクエストを発行する、いわゆるFIFO(First In First Out:先入れ先出し)方式を採用することで、何等問題を生ずることはなかった。
Therefore, arbitration between read requests is not necessary, and as shown in FIG. 18, the
近年、コストの面でのメリットのために、図19に示すようなNUMA(Non-Uniform Memory Access )システムがある。図を参照すると、本システムは、複数のプロセッサノード20,21と、これ等ノード間を接続するプロセッサ間接続装置40とを含んでいる。各プロセッサノード20,21は同一構成であり、例えば、プロセッサノード20は、複数のプロセッサ200a,200bと、プロセッサノード接続ユニット202と、主記憶ユニット201とを有している。
In recent years, there has been a NUMA (Non-Uniform Memory Access) system as shown in FIG. 19 because of cost advantages. Referring to the figure, this system includes a plurality of
このシステムでは、物理アドレスに依存してメモリアクセスレイテンシが異なるために、リードリクエストを、従来のように、リクエスト順に発行するFIFO方式では、リードリクエスト転送の効率が悪化し、ノード間データ転送の実効性能が低下する。 In this system, the memory access latency differs depending on the physical address. Therefore, in the conventional FIFO method in which read requests are issued in the order of requests, the efficiency of read request transfer deteriorates and the data transfer between nodes is effective. Performance decreases.
ここで、特許文献1を参照すると、各プロセッサのメモリアクセスタイムを均等化することを目的としたマルチプロセッサシステムが開示されており、デー転送経路上に、リクエスト間の調停を行う調停部を設け、この調停部で、リクエスト元からの蓄積された(リクエストに付加された)伝達時間を元に、最も長い伝達時間を有する(つまり、リクエスト元で発行されてから、最も長く待たされている)リクエストから、優先して発行するというものである。すなわち、この技術では、複数のリクエスト元から、一つのリクエスト先へのリクエストの性能向上を図るようになっている。
Here, referring to
上述した図4に示したNUMA型分散共有メモリ並列計算機では、物理アドレスに依存してメモリアクセスレイテンシが異なるために、リードリクエストを、従来のように、リクエスト順に発行するFIFO方式では、リードリクエスト転送の効率が悪化し、ノード間データ転送の実効性能が低下するという課題の他に、他社の既存のシステムを組み合わせて、一部を自社開発するということが行われ他社製品には変更が難しいので、汎用的な方法でないと、自社開発部分だけで性能を向上させることが難しいという課題もある。 In the NUMA type distributed shared memory parallel computer shown in FIG. 4 described above, the memory access latency differs depending on the physical address. Therefore, in the conventional FIFO method in which read requests are issued in the order of requests, read request transfer is performed. In addition to the problem that the effective performance of inter-node data transfer deteriorates, the existing systems of other companies are combined and some of them are developed in-house, so it is difficult to change to other companies' products. However, if it is not a general-purpose method, there is a problem that it is difficult to improve the performance only by the in-house developed part.
また、上述した特許文献1の技術では、複数のリクエスト元から、一つのリクエスト先へのリクエストの性能向上を図るものであって、一つのリクエスト元から複数のリクエスト先へのリクエストの場合の性能向上を図ることはできないという課題がある。また、この技術においては、リクエストに特殊なプライオリティ情報を付加することが必要であり、よってこの技術の実際の適用に当たっては、システム変更が必要になるという欠点があり、よってNUMA型分散共有メモリ並列計算機に汎用的に適用できないという課題がある。
Further, in the above-described technology of
本発明の目的は、NUMA型分散共有メモリ並列計算機に汎用的に適用でき、データ転送を効率化することにより、データ転送実効性能の向上を可能としたリードリクエスト調停制御システム及びその方法を提供することである。 SUMMARY OF THE INVENTION An object of the present invention is to provide a read request arbitration control system and method that can be applied universally to a NUMA type distributed shared memory parallel computer and can improve data transfer effective performance by improving data transfer efficiency. That is.
本発明によるリードリクエスト調停制御システムは、一以上のプロセッサと主記憶装置を有する複数のノードでシステムを構成する分散型共有メモリ並列計算機におけるリードリクエスト調停制御システムであって、リードリクエストのリクエスト先アドレスに対するアクセスレイテンシに応じて、前記リードリクエストの調停制御をなす制御手段を含むことを特徴とする。 A read request arbitration control system according to the present invention is a read request arbitration control system in a distributed shared memory parallel computer comprising a plurality of nodes having one or more processors and a main storage device, and a request destination address of a read request Control means for performing arbitration control of the read request in accordance with the access latency for.
本発明によるリードリクエスト調停制御方法は、一以上のプロセッサと主記憶装置を有する複数のノードでシステムを構成する分散型共有メモリ並列計算機におけるリードリクエスト調停制御方法であって、リードリクエストのリクエスト先アドレスに対するアクセスレイテンシに応じて、前記リードリクエストの調停制御をなす制御ステップを含むことを特徴とする。 A read request arbitration control method according to the present invention is a read request arbitration control method in a distributed shared memory parallel computer that forms a system with a plurality of nodes having one or more processors and a main storage device, and a request destination address of a read request And a control step of performing arbitration control of the read request in accordance with the access latency with respect to.
本発明によるプログラムは、一以上のプロセッサと主記憶装置を有する複数のノードでシステムを構成する分散型共有メモリ並列計算機におけるリードリクエスト調停制御方法をコンピュータに実行させるためのプログラムであって、リードリクエストのリクエスト先アドレスに対するアクセスレイテンシに応じて、前記リードリクエストの調停制御をなす処理を含むことを特徴とする。 A program according to the present invention is a program for causing a computer to execute a read request arbitration control method in a distributed shared memory parallel computer that forms a system with a plurality of nodes having one or more processors and a main storage device. Including a process for performing arbitration control of the read request in accordance with the access latency for the request destination address.
本発明の作用を述べる。一般に、NUMA型分散共有メモリ並列計算機内での、データ転送においては、リードリクエスト間では、オーダリングの保障は必要がないために、リクエスト先物理アドレスから当該リクエストのアクセスレイテンシを算出し、リクエスト先物理アドレスのレイテンシがより長いリクエストを優先するようにオーダリングを変更してリードリクエストを発行するよう構成する。これにより、リードリクエストの転送を効率化し、結果として、データ転送効率の性能向上を可能とする。 The operation of the present invention will be described. In general, in data transfer in a NUMA type distributed shared memory parallel computer, since it is not necessary to guarantee ordering between read requests, the access latency of the request is calculated from the request destination physical address, and the request destination physical A configuration is made such that a read request is issued by changing the ordering so that a request with a longer address latency is given priority. Thereby, the transfer of the read request is made efficient, and as a result, the performance of the data transfer efficiency can be improved.
本発明による第1の効果は、NUMA型分散共有メモリ並列計算機内のデータ転送の特徴であるリクエスト物理アドレスに依存したアクセスレイテンシに合わせて、リクエスト先物理アドレスへのアクセスレイテンシが長いリクエストを優先するように、オーダリングを変更して、リードリクエストを発行しているので、リードリクエスト転送が効率化されデータ転送実効性能を向上できるということである。 The first effect of the present invention is to give priority to a request having a long access latency to the request destination physical address in accordance with the access latency depending on the request physical address, which is a feature of data transfer in the NUMA type distributed shared memory parallel computer. As described above, since the read request is issued by changing the ordering, the read request transfer is made efficient and the data transfer effective performance can be improved.
本発明による第2の効果は、一般的に計算機内のデータ転送でオーダリング保証の必要の無いリードリクエスト間に対してオーダリングを変更しているので、特に何等の制約なく、NUMA型分散共有メモリ並列計算機に対して適用可能となって、データ転送実効性能を向上できるということである。 The second effect of the present invention is that, in general, the ordering is changed between read requests that do not require ordering guarantee in the data transfer in the computer. Therefore, the NUMA type distributed shared memory parallelism is not particularly limited. It can be applied to computers, and the data transfer effective performance can be improved.
本発明による第3の効果は、リードリクエスト調停ユニットを、データ転送系路上で、リードリクエスト間の調停が出来る任意の箇所に設けることができるので、NUMA型分散共有メモリ並列計算機のプロセッサノード、I/Oノード、または、ノード間接続装置内等、任意の箇所に設けることにより、データ転送実効性能を向上できるということである。 The third effect of the present invention is that the read request arbitration unit can be provided at any location where arbitration between read requests can be performed on the data transfer path, so that the processor node of the NUMA type distributed shared memory parallel computer, I This means that the data transfer effective performance can be improved by providing it at any location such as in the / O node or the inter-node connection device.
以下に、図面を参照しつつ本発明の実施の形態について説明する。図1は本発明の実施の形態を示すブロック図である。図1においては、本発明の一実施の形態としてのNUMA型分散共有メモリ並列計算機が示されている。同図に示すように、NUMA型分散共有メモリ並列計算機は、複数のプロセッサノード20〜23、複数のI/Oノード30〜33、およびこれらノード間を接続するノード間接続装置40からなる。本例では、プロセッサノード数およびI/Oノード数がそれぞれ4であるが、実際には任意の数で実現可能である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an embodiment of the present invention. FIG. 1 shows a NUMA type distributed shared memory parallel computer as an embodiment of the present invention. As shown in the figure, the NUMA type distributed shared memory parallel computer includes a plurality of
図2を参照すると、図1のブロックの各々の詳細な構成が示されている。プロセッサノード20は、一以上のプロセッサ200a〜200b、主記憶ユニット201、プロセッサノード制御ユニット202からなり、プロセッサ200およびプロセッサノード制御ユニット202は、システムバス210で接続されている。I/Oノード30は、I/Oノード制御ユニット300からなる。
Referring to FIG. 2, the detailed structure of each of the blocks of FIG. 1 is shown. The
また、ノード間接続装置40は、ノード間接続制御ユニット400からなる。さらに本実施例では、データ転送経路上、つまりプロセッサノード20とノード間接続装置の間、およびI/Oノード制御30とノード間接続装置40の間に、本発明によるリードリクエスト調停ユニット10が接続される。リードリクエスト調停ユニット10は、データ転送経路上に備えるので、本実施例のように各ノード内に備えることも、図3に示すように、ノード間接続ユニット400内に備えることも、あるいは、その両方に備えることも可能である。
The
分散共有メモリは、各プロセッサノード20〜23の主記憶ユニット201に分散配置されている。分散配置の第一の例は、図4に示すように、各プロセッサノードの主記憶をスタックしてシステムの主記憶空間を形成するもの、つまりメモリアドレス上位ビットでプロセッサノードを指定する方式がある。
The distributed shared memory is distributed in the
本実施例では、主記憶空間のアドレス000(16進数)から3FF番地がプロセッサノード20に、400から7FF番地がプロセッサノード21に、800からBFF番地がプロセッサノード22に、C00から最後のFFF番地までがプロセッサノード23にそれぞれ分散配置され、アドレス上位2ビットでプロセッサノードを指定する。
In this embodiment, from the address 000 (hexadecimal) of the main storage space, the 3FF address is the
分散配置の第二の例は、特許文献2に開示の如く、すなわち、図5に示すように、各プロセッサノード20〜23に、ノード間インタリーブ制御ユニットを備え、各プロセッサノードの主記憶ユニット間でインタリーブを行う方式、つまりアドレス途中ビットでノードを指定する方式がある。
A second example of the distributed arrangement is disclosed in
本例では、主記憶空間のアドレス000(16進数)から0FF番地と400から4FF番地と800から8FF番地とC00からCFF番地までがプロセッサノード20に、アドレス100から1FF番地と500から5FF番地と900から9FF番地とD00からDFF番地までがプロセッサノード21に、アドレス200から2FF番地と600から6FF番地とA00からAFF番地とE00からEFF番地までがプロセッサノード22に、アドレス300から3FF番地と700から7FF番地とB00からBFF番地とF00から最後のFFF番地までがプロセッサノード23に、それぞれ256バイト単位でインタリーブされて分散配置され、アドレス下位8ビットよりも上2ビットでプロセッサノードを指定する。
In this example, main memory space address 000 (hexadecimal) to address 0FF,
図6を参照すると、図2に示した本発明によるリードリクエスト調停ユニット10の詳細な構成が示されている。図において、物理アドレス別レイテンシ検索テーブル101は、物理アドレス毎のメモリアクセスレイテンシつまり、リクエストを発行してからリプライが返ってくるまでの時間を、予め保持しており、リクエスト物理アドレス111を入力するとアクセスレイテンシ112が出力される。
Referring to FIG. 6, there is shown a detailed configuration of the read
本例では、例えば、図4に示したように、主記憶空間が各プロセッサノードに分散配置されている場合、図7に示すように、物理アドレス別レイテンシ検索テーブル101は、アクセスレイテンシを保持するエントリー120と、選択回路121とにより構成される。このとき、各プロセッサノードに対して1エントリー、全部で4エントリー必要であり、例えば、プロセッサノード20〜23の各々に対するアクセスレイテンシが、それぞれ200nS、400nS、600nS、800nSと、予め保持されている。また、選択回路121は、11ビットのリクエスト先物理アドレス111の上位2ビット、つまりビット11およびビット10で、エントリーが選択される。
In this example, for example, as shown in FIG. 4, when the main storage space is distributed in each processor node, as shown in FIG. 7, the latency search table 101 by physical address holds the access latency. An
また、例えば、図5に示したように、主記憶空間が各プロセッサノードにインタリーブされて分散配置されている場合も、図8に示すように、物理アドレス別レイテンシ検索テーブル101は、アクセスレイテンシを保持するエントリー120と、選択回路122とにより構成される。このときも、各プロセッサノードに対して1エントリー、全部で4エントリー必要であり、例えば、プロセッサノード20〜23の各アクセスレイテンシが、それぞれ200nS、400nS、600nS、800nSと、予め保持されている。また、選択回路122は、11ビットのリクエスト先物理アドレス111の下位8ビットより上位2ビット、つまりビット9およびビット8で、エントリーが選択される。
Also, for example, as shown in FIG. 5, even when the main storage space is interleaved and distributed in each processor node, as shown in FIG. 8, the latency search table 101 by physical address shows the access latency. An
リードリクエスト登録テーブル102は、図9にその詳細が示されるように、複数のエントリーからなり、一つのエントリーには、リクエスト先物理アドレスおよびリクエストデータ長等の、通常のリードリクエスト110のリードリクエスト情報、物理アドレス別レイテンシ検索テーブル101によりリクエスト先物理アドレス111から得られたアクセスレイテンシ112、およびリードリクエスト登録時にタイマ103から出力される登録時刻113が格納される。
As shown in detail in FIG. 9, the read request registration table 102 includes a plurality of entries, and one entry includes read request information of a
調停手段100は、図10にその詳細を示すように、リードリクエスト登録テーブル102の各エントリーに対して、タイマ103が示す現在時刻115からリクエスト登録時刻130を引いた、登録されてからの待ち時間131を算出し、さらにアクセスレイテンシ132を加えて登録時刻からのレイテンシ133を算出し、その登録時刻からのレイテンシ133が最長であるリードリクエスト116を選択して発行する。タイマ103は現在時刻を保持する。
As shown in detail in FIG. 10, the arbitrating
以上、詳細に実施例の構成を述べたが、図1のNUMA型分散共有メモリ並列計算機、図2のプロセッサノード20、I/Oノード30、ノード間接続装置40、および図4、図5の分散共有メモリの分散配置方式は、当業者にとってよく知られており、また本発明とは直接関係しないので、その詳細な構成は省略する。
The configuration of the embodiment has been described in detail above. The NUMA type distributed shared memory parallel computer of FIG. 1, the
次に、図6に示したリードリクエスト調停ユニット10の動作を説明する。リードリクエスト調停ユニット10は、リードリクエスト110の発生からリードリクエスト登録テーブル102のエントリーへの登録動作および、調停手段100により、リードリクエスト登録テーブル102に登録されているリードリクエスト間で調停を行い、リクエスト116を発行する動作からなる。
Next, the operation of the read
まず、図11を使用してリードリクエスト110発生からリードリクエスト登録テーブル102のエントリーへの登録動作を説明する。図において、リードリクエスト110がリードリクエスト調停ユニット10に与えられると、リードリクエスト110のリクエスト先物理アドレス111およびリクエストデータ長等のリードリクエスト情報が、リードリクエスト登録テーブル102の空きエントリーに登録される(図11(a))。
First, the registration operation from the generation of the read
また、このときの時刻113をタイマ103から得て、登録時刻として同エントリーに登録する(図11(b))。さらに、リードリクエスト110のリクエスト先物理アドレス111が物理アドレス別レイテンシ検索テーブル101に与えられ(図14(c))、その物理アドレスへのアクセスレイテンシ112つまり、リードリクエストを発行してからリプライが返ってくるまでの時間が出力されるので、アクセスレイテンシとして同エントリーに登録する(図11(d))。
Further, the
なお、リードリクエスト登録テーブル102に空きエントリーがなくなると、リクエスト元に対してフロー制御等が行われるが、当業者にとってよく知られており、また本発明とは直接関係しないので、その詳細な構成は省略する。 When there is no empty entry in the read request registration table 102, flow control or the like is performed on the request source. This is well known to those skilled in the art and is not directly related to the present invention. Is omitted.
次に、図10を使用して、調停手段100により、リードリクエスト登録テーブル102に登録されているリードリクエスト間で調停を行い、リクエスト116を発行する動作を説明する。図10において、フローコントロール等の結果により、リードリクエスト116が発行可能となると、リードリクエスト登録テーブル102に登録されているエントリーに対して、タイマ103から得られる現在時刻115からリクエスト登録時刻130を引き算し、リクエストが登録されてから現在時刻までの待ち時間131を算出する(図10(a))。
Next, with reference to FIG. 10, description will be given of an operation in which the
次に、この待ち時間131にアクセスレイテンシ132を加算して、登録時刻からリードリプライを受け取るまでのレイテンシ133を得る(図10(b))。調停手段100では、空きエントリ以外の全てのエントリーに対してこれら登録時間からのレイテンシ133を算出し、レイテンシ最長のリクエストを選択し、リードリクエスト116として発行する(図10(c))。発行したリードリクエスト116は、占めていたエントリーから削除される。
Next, the
さらに、具体例を用いて実施例の動作を説明する。図3に示されるI/Oノード30において、I/Oノード制御ユニット300で4Kバイトのリードリクエストが発生し、調停ユニット10に対してI/Oノード制御ユニット300から256バイトに分割されたリードリクエストが16個発行されたとする。フロー制御により、調停ユニット10からは25nSに1回リクエストが発行されるものとする。
Further, the operation of the embodiment will be described using a specific example. In the I /
図4に示すように、主記憶空間が各プロセッサノードに分散配置されている場合、従来のようにリクエスト順に発行するFIFO方式では、図12に示すように、0nS後から25nS間隔でリードリクエストが発行され、最後のリクエストのリプライは、1275nS後に返る。 As shown in FIG. 4, when the main storage space is distributed to each processor node, in the conventional FIFO method in which requests are issued in the order of requests, read requests are sent at intervals of 25 nS after 0 nS, as shown in FIG. The reply of the last request issued is returned after 1275 nS.
一方、図7に示す物理アドレス別レイテンシ検索テーブルを持つ本発明による調停ユニット10を備えた場合は、図13に示すように、リクエスト先物理アドレスへのアクセスレイテンシが長いリクエストを優先するようにオーダリングを変更し、リードリクエストを発行しているので、0nS後から25nS間隔でリードリクエストが発行され、最後のリクエストのリプライは、875nS後に返る。つまり、従来よりも400nS早くリプライが返り、リードリクエスト転送が効率化されデータ転送実効性能が向上されていることがわかる。
On the other hand, when the
また、図5に示すように、主記憶空間が各プロセッサノードにインタリーブ分散配置されている場合も、従来のようにリクエスト順に発行するFIFO方式では、図14に示すように、0nS後から25nS間隔でリードリクエストが発行され、最後のリクエストのリプライは、1275nS後に返る。 As shown in FIG. 5, even when the main storage space is distributed in an interleaved manner in each processor node, in the conventional FIFO method in which requests are issued in the order of requests, as shown in FIG. A read request is issued, and the reply of the last request is returned after 1275 nS.
一方、図8に示す物理アドレス別レイテンシ検索テーブルを持つ本発明による調停ユニット10を備えた場合は、図15に示すように、リクエスト先物理アドレスへのアクセスレイテンシが長いリクエストを優先するようにオーダリングを変更し、リードリクエストを発行しているので、0nS後から25nS間隔でリードリクエストが発行され、最後のリクエストのリプライは、875nS後に返る。つまり、従来よりも400nS早くリプライが返り、リードリクエスト転送が効率化されデータ転送実効性能が向上されていることがわかる。
On the other hand, when the
本発明の他の実施の形態として、その基本的構成は上記の通りであるが、物理アドレス別レイテンシ検索テーブル101について、先の実施の形態では、予め設定されていた物理アドレスに依存したアクセスレイテンシを、実際のリードリクエストとそのリプライを元に、動的に設定するように、更に工夫している。 As another embodiment of the present invention, the basic configuration is as described above. With regard to the latency search table 101 for each physical address, in the previous embodiment, the access latency depending on the physical address set in advance is used. Is further devised so that it is dynamically set based on the actual read request and its reply.
その構成を図16に示す。本図において、調停手段100によりリードリクエスト116が発行されると、レイテンシ計算手段104にアクセス先物理アドレスおよびタイマ103から得られるリクエスト発行時刻140を登録する(図16(a))。リードリクエスト116に対するリードリプライ117が返却されると、タイマ103から得られるリプライ到着時刻141を登録する(図16(b))。更に、リプライ到着時刻141からリクエスト発行時刻140を引き算したアクセスレイテンシ118を計算する(図16(c))。最後に、物理アドレス別レイテンシ検索テーブル101の、物理アドレス119に対応するアクセスレイテンシをアクセスレイテンシ118で更新する(図16(d))。
The configuration is shown in FIG. In this figure, when the read
このように、本例では、先の実施の形態では予め設定されていた物理アドレスに依存したアクセスレイテンシを、実際のリードリクエストとそのリプライをもとに動的に更新するようにしているので、初期設定が必要なく、また、NUMA型分散共有メモリ並列計算機の動的な構成変更や実行ジョブの負荷に応じて、動的にデータ転送が最適化されデータ転送実効性能が向上するという効果が得られる。 As described above, in this example, the access latency depending on the physical address set in advance in the previous embodiment is dynamically updated based on the actual read request and its reply. There is no need for initialization, and the data transfer is dynamically optimized according to the dynamic configuration change of the NUMA-type distributed shared memory parallel computer and the load of the execution job, and the data transfer effective performance is improved. It is done.
本構成において、レイテンシ計算手段104を複数備え、複数のリードリクエストに対してアクセスレイテンシを動的に設定することできる。また、一回のリクエストだけでなく複数回のリクエストのレイテンシの平均を求め物理アドレス別レイテンシ検索テーブル101を更新する構成にしてもよい。 In this configuration, a plurality of latency calculation means 104 are provided, and the access latency can be dynamically set for a plurality of read requests. Further, the latency search table 101 for each physical address may be updated by calculating the average latency of not only a single request but also a plurality of requests.
なお、上述した各実施の形態の動作は、予めROMなどの記録媒体にその動作手順を記録しておき、これをコンピュータにより読み取らせて実行させるように構成することができることは明白である。 It is obvious that the operation of each of the above-described embodiments can be configured such that the operation procedure is recorded in advance on a recording medium such as a ROM and is read and executed by a computer.
10 ノードリクエスト調停ユニット
20〜23 プロセッサノード
30〜33 I/Oノード
40 ノード間接続装置
100 調停手段
101 物理アドレスレイテンシ検索テーブル
102 リードリクエスト登録テーブル
103 タイマ
200a,200b プロセッサ
201 主記憶ユニット
202 プロセッサノード制御ユニット
300 I/Oノード制御ユニット
10 Node request arbitration unit
20-23 processor node
30-33 I / O node
40 Internode connection device
100 Mediation means
101 Physical address latency search table
102 Read request registration table
103
201 Main memory unit
202 processor node control unit
300 I / O node control unit
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004048861A JP4019056B2 (en) | 2004-02-25 | 2004-02-25 | Read request arbitration control system and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004048861A JP4019056B2 (en) | 2004-02-25 | 2004-02-25 | Read request arbitration control system and method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005242500A true JP2005242500A (en) | 2005-09-08 |
JP4019056B2 JP4019056B2 (en) | 2007-12-05 |
Family
ID=35024204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004048861A Expired - Fee Related JP4019056B2 (en) | 2004-02-25 | 2004-02-25 | Read request arbitration control system and method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4019056B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235761A (en) * | 2005-02-22 | 2006-09-07 | Nec Corp | Distributed shared memory unit, and memory access method |
JP2009064360A (en) * | 2007-09-07 | 2009-03-26 | Canon Inc | Memory controller and its controlling method |
KR101533405B1 (en) * | 2014-02-21 | 2015-07-03 | 한국과학기술원 | Shared memory management method for numa system |
WO2016117190A1 (en) * | 2015-01-22 | 2016-07-28 | ソニー株式会社 | Memory controller, storage device, information processing system, and method for controlling memory |
CN116225346A (en) * | 2023-05-09 | 2023-06-06 | 此芯科技(上海)有限公司 | Memory data access method and electronic equipment |
-
2004
- 2004-02-25 JP JP2004048861A patent/JP4019056B2/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006235761A (en) * | 2005-02-22 | 2006-09-07 | Nec Corp | Distributed shared memory unit, and memory access method |
JP4725130B2 (en) * | 2005-02-22 | 2011-07-13 | 日本電気株式会社 | Distributed shared memory device and memory access method |
JP2009064360A (en) * | 2007-09-07 | 2009-03-26 | Canon Inc | Memory controller and its controlling method |
KR101533405B1 (en) * | 2014-02-21 | 2015-07-03 | 한국과학기술원 | Shared memory management method for numa system |
WO2016117190A1 (en) * | 2015-01-22 | 2016-07-28 | ソニー株式会社 | Memory controller, storage device, information processing system, and method for controlling memory |
US10318210B2 (en) | 2015-01-22 | 2019-06-11 | Sony Corporation | Memory controller, storage device, information processing system, and method of controlling memory |
CN116225346A (en) * | 2023-05-09 | 2023-06-06 | 此芯科技(上海)有限公司 | Memory data access method and electronic equipment |
Also Published As
Publication number | Publication date |
---|---|
JP4019056B2 (en) | 2007-12-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6542909B2 (en) | File operation method and apparatus | |
US7380102B2 (en) | Communication link control among inter-coupled multiple processing units in a node to respective units in another node for request broadcasting and combined response | |
JP4820566B2 (en) | Memory access control circuit | |
JP4687729B2 (en) | Cache memory, vector processing apparatus, and vector data alignment method | |
JP4085389B2 (en) | Multiprocessor system, consistency control device and consistency control method in multiprocessor system | |
US8102855B2 (en) | Data processing system, method and interconnect fabric supporting concurrent operations of varying broadcast scope | |
JP2002373115A (en) | Replacement control method for shared cache memory and device therefor | |
US8117392B2 (en) | Method and apparatus for efficient ordered stores over an interconnection network | |
JP4019056B2 (en) | Read request arbitration control system and method | |
JP2009015509A (en) | Cache memory device | |
JP2005209206A (en) | Data transfer method for multiprocessor system, multiprocessor system, and processor for executing the method | |
US7809004B2 (en) | Data processing system and processing unit having an address-based launch governor | |
JP4729490B2 (en) | Data processing system | |
JP7493311B2 (en) | BUS SYSTEM AND CONTROL METHOD THEREOF | |
US20190042342A1 (en) | Techniques for managing a hang condition in a data processing system with shared memory | |
JP2006235761A (en) | Distributed shared memory unit, and memory access method | |
JP5549179B2 (en) | Data access device, data access control method, and data access control program | |
JPH05290000A (en) | Parallel computer and data exchange control device | |
JP4900381B2 (en) | Memory control device and control method of memory control device | |
JP2006260395A (en) | Program loading method and its device | |
JP2830780B2 (en) | Multiprocessor system | |
JP2012093944A (en) | Information processor and information processing method | |
JP2009301102A (en) | Memory system for using cache memory, its method, and its program | |
JP2009088622A (en) | Packet transfer device having buffer memory and method thereof | |
JP5338452B2 (en) | Memory management system, memory management method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070604 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070921 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4019056 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100928 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110928 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120928 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130928 Year of fee payment: 6 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |