JP5621918B2

JP5621918B2 - 情報処理装置、並列計算機システムおよび演算処理装置の制御方法

Info

Publication number: JP5621918B2
Application number: JP2013508690A
Authority: JP
Inventors: 雄一郎安島; 智宏井上; 新哉平本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2011-04-07
Filing date: 2011-04-07
Publication date: 2014-11-12
Anticipated expiration: 2031-04-07
Also published as: US9164907B2; EP2696289B1; JPWO2012137339A1; EP2696289A1; CN103502959A; EP2696289A4; US20140040558A1; WO2012137339A1; CN103502959B

Description

本発明は、情報処理装置、並列計算機システムおよび演算処理装置の制御方法に関する。

従来、複数の情報処理装置が相互にデータの送受信を行い、演算処理を実行する並列計算機システムが知られている。このような並列計算機システムの一例として、メモリ空間を共有しない複数の情報処理装置を、相互結合網を介して相互に接続した並列計算機システムが知られている。

このような並列計算機システムが有する情報処理装置は、演算に利用するデータを記憶する主記憶装置であるメインメモリと、演算を行う演算処理装置と、他の情報処理装置との間で演算に利用するデータの送受信を行う通信装置とを有する。このような情報処理装置が有する通信装置は、相互結合網を介して、他の情報処理装置と演算に関わるデータの送受信を行い、受信したデータをメインメモリに格納する。

また、演算処理装置は、演算処理装置の外部のメインメモリからデータを読み出す際に用いられる周波数よりも高速で動作するので、演算に利用するデータがメインメモリに格納されている場合には、演算処理装置の内部のキャッシュメモリに格納されているデータと比較して効率良く演算処理を実行できない。このため、演算処理装置は、データの読出しや書込みをメインメモリよりも高速で行う事ができるキャッシュメモリを内部に有し、演算に利用するデータをキャッシュメモリに格納することで、演算時におけるデータの読出しを高速化し、効率良く演算処理を実行する。

ここで、一般的な通信装置は、他の情報処理装置からデータを受信した場合には、演算処理装置に、データ受信に関する一連の処理を演算処理に対する割り込み処理として実行させる。しかし、演算処理装置は、データの受信に関する一連の処理を割り込み処理として実行する場合には、処理の切替えに伴って多数の演算レジスタや設定レジスタ等が保持するデータの退避や退避したデータの復元を行うので、通信遅延を増加させてしまう。

並列計算機システムにおいては、複数の情報処理装置が情報処理装置間における通信遅延が所定の遅延時間に収まるように、インタコネクトで接続されている。また、並列計算機システムが有する演算処理装置は、他の情報処理装置から送信されたデータの受信を待って演算処理を実行し、演算処理の実行結果を他の情報処理装置に送信する処理を繰り返す。このため、演算処理装置は、データの受信に関する一連の処理を割り込み処理として実行し、処理の切替えに伴う通信遅延を増加させた場合には、並列計算機システムにおける計算処理の効率を悪化させてしまう。

そこで、並列計算機システムにおいては、通信装置が他の情報処理装置から受信したデータをメインメモリに格納するまでの間、演算処理装置がデータを格納するメモリアドレスに対して読出しを繰り返すポーリング処理を行う。このようなポーリング処理を実行する演算処理装置は、データの受信に関する処理と演算処理との切替えを行わないので、通信遅延を削減し、計算処理の効率を保持する。

また、通信装置によって受信されたデータを演算処理装置がデータ受信用のバッファを介さずに直接取得した場合には、データ受信用のバッファを介して取得する場合よりも通信遅延を削減できる。しかしながら、情報処理装置間において送受信されるデータ量は大きいため、データ受信用のバッファを新たに演算処理装置に持たせることは現実的ではない。このため、通信装置が受信したデータを演算処理装置が有するキャッシュメモリに格納する技術が知られている。

このような技術が適用された情報処理装置は、通信装置が他の情報処理装置から受信したデータを演算処理装置が有するキャッシュメモリに直接格納する。このため、演算処理装置は、演算に利用するデータをキャッシュメモリから高速で読み出すことができるので、通信遅延を削減する。

特開平１１−０３９２１４号公報国際公開第２００７／１１０８９８号

Ram Huggahalli, Ravi Iyer, Scott Tetrick,"Direct Cache Access for High Bandwidth Network I/O," ISCA '05 Proceedings of the 32nd annual international symposium on Computer Architecture

しかしながら、上述した受信したデータを演算処理装置が有するキャッシュメモリに格納する技術では、演算に利用されないデータを受信した場合にも演算処理装置が有するキャッシュメモリに格納する。このため、演算処理装置が効率的に演算処理を実行することができず、計算処理速度が低下してしまうという問題があった。

つまり、情報処理装置は、演算に利用しているデータがキャッシュメモリに格納されている際に、新たなデータを受信した場合には、受信したデータをキャッシュメモリに格納するため、演算に利用しているデータをキャッシュメモリから吐き出す場合がある。このような場合には、情報処理装置は、演算を実行するために、キャッシュメモリから吐き出したデータをメインメモリから読み出すので、効率的に演算処理を実行することができず、計算処理速度を低下させてしまう。

本願に開示の技術は、上述した問題に鑑みてなされたものであって、計算処理速度の低下を抑える。

１つの側面では、複数の情報処理装置を備える並列計算機システムを構成する情報処理装置である。また、情報処理装置は、データを保持する主記憶装置と、主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、主記憶装置又はキャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部とを有する演算処理装置を有する。また、情報処理装置は、他の情報処理装置の演算処理装置が待ち合わせているデータに、他の情報処理装置の演算処理装置が有するキャッシュメモリ部に書き込む旨の制御情報を付加したデータを他の情報処理装置に送信する送信部と、他の情報処理装置から受信したデータに、制御情報が付加されているか否かを判定する判定部と、受信したデータに制御情報が付加されていると判定部が判定した場合は、複数の演算処理部のキャッシュメモリ部のうち、受信したデータの書込先アドレスが示す主記憶装置の格納領域に格納されているデータを保持しているキャッシュメモリ部に受信したデータを格納し、受信したデータに制御情報が付加されていないと判定部が判定した場合は、受信したデータを主記憶装置に格納する格納部とを有する通信装置を有する。

本願に開示の技術は、一つの態様によれば、計算処理速度の低下を抑える。

図１は、実施例１に関わる並列計算機システムを説明するための図である。図２は、メモリアドレスの一例を説明するための図である。図３は、実施例１に関わるキャッシュメモリの一例を説明するための図である。図４は、実施例１に関わる通信装置の一例を説明するための図である。図５は、実施例１に関わるパケット生成部が生成するパケットの一例を説明するための図である。図６は、実施例１に関わる通信装置が実行する処理の流れを説明するためのフローチャートである。図７は、実施例２に関わる並列計算機システムの一例を説明するための図である。図８は、実施例２に関わる通信装置を説明するための図である。図９は、実施例３に関わる並列計算機システムの一例を説明するための図である。図１０は、実施例４に関わる並列計算機システムを説明するための図である。図１１は、実施例４に関わる通信装置の一例を説明するための図である。図１２は、書き込み先アドレステーブルの一例を説明するための図である。図１３は、実施例４に関わる通信装置が実行する処理の流れを説明するためのフローチャートである。図１４は、実施例５に関わる並列計算機システムの一例を説明するための図である。図１５は、実施例５に関わる通信装置の一例を説明するための図である。図１６は、実施例３に関わる並列計算機システムを説明するための図である。

以下に添付図面を参照して本願に係る情報処理装置、並列計算機システムおよび演算処理装置の制御方法について説明する。なお、以下に説明する各実施例は、矛盾しない範囲において、適宜組み合わせることができる。

以下の実施例１では、図１を用いて、並列計算機システムの一例を説明する。図１は、実施例１に関わる並列計算機システムを説明するための図である。

図１に示すように、並列計算機システム１は、複数の情報処理装置２、２ａ、各情報処理装置２、２ａを接続するバス８を有する。なお、図１に示す例では、情報処理装置２および２ａが記載されているが、並列計算機システム１は、さらに多数の情報処理装置を有してもよい。並列計算機システム１は、任意の数の情報処理装置を有してよい。また、以下の説明においては、情報処理装置２ａは、情報処理装置２と同様の処理を実行するものとして、説明を省略する。

情報処理装置２は、プロセッサ３、メモリ６、通信装置１０を有する。プロセッサ３、メモリ６、通信装置１０は、それぞれ情報処理装置２が有するバスによって接続される。プロセッサ３は、演算処理を実行する演算処理装置である。具体的には、プロセッサ３は、演算を行うプロセッサコア４を有する。また、プロセッサコア４は、キャッシュメモリ５を有する。

以下、メモリ６、キャッシュメモリ５に格納されるデータについての説明を行い、その後、プロセッサコア４および通信装置１０が実行する処理について説明する。

メモリ６は、情報処理装置２が有するメインメモリであり、プロセッサコア４が演算に用いるデータを保持する。以下、図２、図３を用いて、メモリ６の一例について説明する。図２は、メモリアドレスの一例を説明するための図である。例えば、メモリ６の格納領域を示すメモリアドレスは、プロセッサ３が４０ビットのメモリアドレス空間を有する場合には、例えば４０ビット長のメモリアドレスとなる。このような場合には、メモリアドレスを、例えば、図２中（Ａ）に示す範囲の上位「３４−Ｎ」ビットをタグとして、続く図２中（Ｂ）に示す範囲の「Ｎ」ビットをインデックスとして、図２中（Ｃ）に示す範囲の下位「６」ビットをオフセットとして分割することができる。ここで、インデックスのサイズは、任意のビット数を設定することができるものとし、以下の説明においては「Ｎ」ビットがインデックスとして設定されたものとする。

キャッシュメモリ５は、プロセッサコアが演算に利用するデータを記憶する記憶装置であり、メモリ６よりも高速でデータの出し入れを行う事ができる。以下、キャッシュメモリ５の一例について説明する。図３は、実施例１に関わるキャッシュメモリの一例を説明するための図である。例えば、キャッシュメモリ５は、ラインサイズが６４バイトである２^Ｎ個のキャッシュラインを有し、全体の記憶容量が２^Ｎ＋６バイトであるキャッシュメモリである。

ここで、各キャッシュラインには、キャッシュライン番号「０」〜「２^Ｎ−１」が付与されている。また、各キャッシュラインには、図３中（Ａ）で示す２ビットの状態データ、図３中（Ｂ）で示す「３４−Ｎ」ビットのタグデータ、および図３中（Ｃ）で示す６４バイトのデータが格納される。ここで、状態データのうち、一方のビットは、対応するキャッシュラインに格納されたデータが有効であるか否かを示すＶａｌｉｄビットである。例えば、Ｖａｌｉｄビットに「１」が格納されていた場合には、対応するキャッシュラインに格納されたデータが有効であることを示し、Ｖａｌｉｄビットに「０」が格納されていた場合には、対応するキャッシュラインに格納されたデータが無効であることを示す。

また、状態データのうち、もう一方のビットは、対応するキャッシュラインに格納されたデータとメモリ６に格納されたデータとの同一性を保持するための情報であるＤｉｒｔｙビットである。例えば、Ｄｉｒｔｙビットに「１」が格納されている場合には、対応するキャッシュラインに格納されたデータがプロセッサコア４によって更新されているため、データをメモリ６に書き戻す必要があることを示す。Ｄｉｒｔｙビットに「０」が格納されている場合には、対応するキャッシュラインに格納されたデータがプロセッサコア４によって更新されておらず、当該キャッシュラインに格納されたデータとメモリ６に格納されたデータと同一である旨を表す。例えば、Ｖａｌｉｄビットが「１」でＤｉｒｔｙビットが「１」であるキャッシュラインに格納されたデータは、有効なデータであり、かつ、プロセッサコア４による書換え等のためにキャッシュ元であるメモリ６に格納されたデータと同一ではない。

また、キャッシュメモリ５はダイレクトマップ方式が採用されており、メモリ６のデータがキャッシュされる場合には、キャッシュ元データが格納されていたメモリアドレスのインデックスに応じたキャッシュラインに格納する。例えば、キャッシュメモリ５は、キャッシュ元のデータが格納されていたメモリアドレスのインデックスが「ｉ」である場合には、キャッシュライン番号が「ｉ」のキャッシュラインに格納する。ただし、キャッシュメモリ５には、複数のキャッシュウェイを有するセットアソシエイティブ方式が採用されてもよい。

図１に戻って、プロセッサコア４は、データを用いて演算を行う演算処理部である。具体的には、プロセッサコア４は、メモリ６またはキャッシュメモリ５に格納されたデータを用いて、演算処理を実行する。また、プロセッサコア４は、メモリ６に格納されていたデータを取得し、取得したデータをキャッシュメモリ５に格納する。すなわち、プロセッサコア４は、メモリ６に格納されていたデータをキャッシュメモリ５に保持する。そして、プロセッサコア４は、キャッシュメモリ５に格納したデータを用いて、演算処理を実行する。

また、プロセッサコア４は、情報処理装置２ａ等の他の情報処理装置による演算の結果を用いて演算処理を実行する場合には、他の演算処理装置から送信されたデータを通信装置１０が受信するまで待機する。つまり、プロセッサコア４は、他の情報処理措置による演算結果のデータを待ち合わせるポーリング処理を実行する。そして、プロセッサコア４は、ポーリング処理の対象となるデータを通信装置１０が受信した場合には、受信したデータを取得し、取得したデータをキャッシュメモリ５とメモリ６とに格納する。

ここで、プロセッサコア４が受信したデータをキャッシュメモリ５およびメモリ６に格納する処理の例について説明する。例えば、プロセッサコア４は、後述する通信装置１０からデータとメモリ６に格納するデータとして受信した場合には、メモリ６に受信したデータを格納する。

また、プロセッサコア４は、通信装置１０からデータをキャッシュメモリ５に書き込むデータとして受信した場合には、以下の処理を実行する。すなわちプロセッサコア４は、受信したデータをメモリ６に格納するとともに、受信したデータをキャッシュメモリ５に格納する。つまり、プロセッサコア４は、キャッシュメモリ５に格納するデータとして通信装置１０からデータを受信した場合には、受信したデータをキャッシュメモリ５とメモリ６とに格納する。

ここで、プロセッサコア４は、受信したデータをキャッシュメモリ５に格納する場合には、キャッシュメモリ５に格納されているデータとメモリ６に格納されているデータとの同一性を保持するための情報を参照する。そして、プロセッサコア４は、参照した同一性を保持するための情報に基づいて、キャッシュメモリ５に格納されていたデータをメモリ６に吐き出し、その後、受信したデータをキャッシュメモリ５に格納する。その後、プロセッサコア４は、キャッシュメモリ５に格納したデータ、すなわちポーリング処理の対象となるデータを用いて、演算処理を実行する。

また、プロセッサコア４は、演算の結果、算出したデータを他の情報処理装置へ送信する場合には、送信先の情報処理装置を示す情報と、算出したデータとを通信装置１０へ送信する。この際、プロセッサコア４は、算出したデータが他の情報処理装置が有するプロセッサコアが待ち合わせているデータであるか否かを判定する。そして、プロセッサコア４は、算出したデータが他の情報処理装置が有するプロセッサコアが待ち合わせているデータであると判定した場合には、プロセッサコアが待ち合わせているデータである旨とを通信装置１０へ送信する。

次に、プロセッサコア４が実行する処理の一例を説明する。例えば、プロセッサコア４は、通信装置１０からデータをメモリ６に格納するデータとして受信した場合には、以下の処理を実行する。すなわち、プロセッサコア４は、データを格納するメモリアドレスのインデックスと対応するキャッシュラインの状態データであるＶａｌｉｄビットとＤｉｒｔｙビットとを参照する。そして、プロセッサコア４は、参照したＶａｌｉｄビットが「１」であり、かつ、Ｄｉｒｔｙビットが「１」であれば、以下の処理を実行する。

すなわち、プロセッサコア４は、キャッシュメモリ５に格納されているキャッシュされたデータを用いて、メモリ６に格納されていたキャッシュ元のデータを最新のデータに更新する。そして、プロセッサコア４は、参照したＶａｌｉｄビットを「１」から「０」に更新し、その後、通信装置１０から受信したデータを、データと共に受信したメモリ６のメモリアドレスに格納する。

また、プロセッサコア４は、参照したＶａｌｉｄビットが「０」である場合、または、Ｖａｌｉｄビットが「１」でＤｉｒｔｙビットが「０」である場合には、Ｖａｌｉｄビットを「０」に更新し、受信したデータをメモリ６に格納する。

次に、プロセッサコア４が通信装置１０からデータをキャッシュメモリ５に格納するデータとして受信した場合について説明する。このような場合には、プロセッサコア４は、受信したデータを格納するキャッシュラインのＶａｌｉｄビットとＤｉｒｔｙビットとタグデータとを参照する。つまり、プロセッサコア４は、受信したデータを格納するメモリアドレスのインデックスに対応するキャッシュラインのＶａｌｉｄビットとＤｉｒｔｙビットとを参照する。そして、プロセッサコア４は、参照したＶａｌｉｄビットが「０」または参照したタグデータが受信したメモリアドレスのタグデータと一致しない場合には、受信したデータをメモリ６に格納する。

また、プロセッサコア４は、参照したＶａｌｉｄビットが「１」、かつ、参照したタグデータが受信したデータを格納するメモリアドレスのタグと一致する場合には、以下の処理を実行する。すなわち、プロセッサコア４は、通信装置１０から受信したデータを状態データとタグデータとを参照したキャッシュラインに格納する。

図１に戻って、通信装置１０は、バス８を介して、情報処理装置２ａ等の他の情報処理装置からパケット化されたデータを受信する。ここで、パケット化されたデータには、データと、データを格納するメモリ６のメモリアドレスとが格納されている。通信装置１０は、他の情報処理装置２ａからデータを受信した場合には、受信したデータが、プロセッサコア４が待ち合わせているデータであるか否かを判定する。

そして、通信装置１０は、受信したデータが、プロセッサコア４が待ち合わせているデータであると判定した場合には、データをキャッシュメモリ５に格納するデータとしてプロセッサコア４に送信する。つまり、通信装置１０は、データをキャッシュメモリ５に格納するデータとしてプロセッサコア４に送信することで、受信したデータをキャッシュメモリ５とメモリ６に格納する。

一方、通信装置１０は、受信したデータが、プロセッサコア４が待ち合わせているデータではないと判定した場合には、データをメモリ６に格納するデータとしてプロセッサコア４に送信する。つまり、通信装置１０は、データをメモリ６に格納するデータとしてプロセッサコア４に送信することで、受信したデータをメインメモリ６に格納する。

また、通信装置１０は、プロセッサコア４からデータと送信先の他の情報処理装置２ａを示す情報とを受信した場合には、受信したデータをパケット化し、バス８を介して、送信先の他の情報処理装置２ａへパケットを送信する。また、通信装置１０は、プロセッサコア４から他の情報処理装置２ａが有するプロセッサが待ち合わせているデータである旨を合わせて受信した場合には、受信したデータをパケット化するとともに、ポーリング処理の対象である旨を示す制御情報をパケットに付加する。そして、通信装置１０は、制御情報を付加したパケットを送信先の他の情報処理装置２ａへ送信する。

以下、図４を用いて、通信装置１０の一例を説明する。図４は、実施例１に関わる通信装置の一例を説明するための図である。図４に示す例では、通信装置１０は、パケット生成部１１、パケット送信部１２、パケット受信部１３、判定部１４、格納部１５を有する。

パケット生成部１１は、図４中（Ａ）に示すように、他の情報処理装置２ａのプロセッサコアが待ち合わせているデータを送信する場合には以下の処理を実行する。すなわち、パケット生成部１１は、送信するデータをパケット化し、送信先の他の情報処理装置２ａやデータを格納する送信先の他の情報処理装置２ａが有するメモリのメモリアドレス等をパケットに格納する。また、パケット生成部１１は、他の情報処理装置２ａのプロセッサコアが有するキャッシュメモリに書き込む旨の制御情報をパケットに付加する。そして、パケット生成部１１は、生成したパケットをパケット送信部１２へ送信する。

ここで、図５は、実施例１に関わるパケット生成部が生成するパケットの一例を説明するための図である。図５中（Ａ）に示すように、従来のパケットは、送信先の他の情報処理装置２ａを示すアドレスが格納されたヘッダ部と、データを格納するデータ部とを有する。一方、パケット生成部１１は、図５中（Ｂ）に示すパケットを生成する。具体的には、パケット生成部１１は、図５中（Ｃ）に示すように、パケットのヘッダとデータとの間に制御情報を格納する１ビットのフラグ領域を追加する。

そして、パケット生成部１１は、送信するデータが送信先の他の情報処理装置２ａのプロセッサコアが待ち合わせるデータである場合には、制御情報としてフラグ領域に「１」を格納する。また、パケット生成部１１は、送信するデータが送信先の情報処理装置のプロセッサコアが待ち合わせるデータではない場合には、制御情報としてフラグ領域に「０」を格納する。なお、上記した制御情報が格納されたパケットは、情報処理装置２だけではなく、情報処理装置２ａ等の他の情報処理装置も同様のパケットを生成するものとする。

図４に戻って、パケット送信部１２は、パケット生成部１１が生成したパケットを受信した場合には、図４中（Ｂ）に示すように、バス８を介して、他の情報処理装置２ａ等の送信先となる他の情報処理装置へ送信する。

パケット受信部１３は、図４中（Ｃ）に示すように、バス８を介してパケットを受信した場合には、受信したパケットを判定部１４に転送する。判定部１４は、受信したパケットのフラグ領域に「１」が格納されているか否かを判定する。

そして、判定部１４は、パケットのフラグ領域に「１」が格納されている場合には、パケットに格納されていたデータがキャッシュメモリ５に格納するデータであると判定する。また、判定部１４は、パケットのフラグ領域に「０」が格納されている場合には、パケットに格納されていたデータをメモリ６に格納するデータであると判定する。その後、判定部１４は、判定した内容とパケットに格納されていたデータとを格納部１５に送信する。

格納部１５は、パケットに格納されていたデータがキャッシュメモリ５に格納するデータであると判定部１４が判定した場合には、以下の処理を実行する。すなわち、格納部１５は、図４中（Ｄ）に示すようにパケットに格納されたデータをキャッシュメモリ５とメモリ６とに格納するデータとしてプロセッサコア４に送信する。また、格納部１５は、パケットに格納されていたデータをメモリ６に格納するデータであると判定部１４が判定した場合には、パケットに格納されたデータをメモリ６に格納するデータとしてプロセッサコア４に送信する。

具体的には、格納部１５は、パケットのフラグ領域に「１」が格納されていた場合には、判定部１４から受信したデータとデータをキャッシュメモリ５に格納する旨の通知とをプロセッサコア４に送信する。また、格納部１５は、パケットのフラグ領域に「０」が格納されていた場合には、データをプロセッサコア４に送信する。つまり、格納部１５は、メモリ６に格納するデータとして受信したデータをプロセッサコア４に送信する。

上述したように、通信装置１０は、他の情報処理装置２ａが有するプロセッサコアが待ち合わせているデータ、つまりポーリング対象となるデータを送信する場合には、以下の処理を実行する。すなわち、通信装置１０は、送信するパケットのフラグ領域に制御情報として「１」を格納し、送信先の他の情報処理装置２ａへ送信する。また、情報処理装置２ａ等の他の情報処理装置が有する通信装置も、プロセッサコア４が待ち合わせているデータを送信する場合には、フラグ領域に「１」を格納したパケットを送信する。

そして、通信装置１０は、受信したパケットのフラグ領域に「１」が格納されている場合には、受信したパケットに格納されたデータをキャッシュメモリ５に書き込むべきデータとしてプロセッサコア４に送信する。プロセッサコア４は、メモリ６に格納されているデータのうち受信したデータを書き込むべきメモリアドレスに格納されたデータをキャッシュメモリ５にキャッシュしている場合には、通信装置１０から受信したデータをキャッシュメモリ５にキャッシュする。このため、プロセッサコア４は、待ち合わせていたデータをメモリ６ではなく、キャッシュメモリ５から読み出すことができるので、効率的に演算処理を実行することができる。

一方、通信装置１０は、受信したパケットのフラグ領域に「０」が格納されている場合には、受信したパケットに格納されたデータをメモリ６に書き込むべきデータとしてプロセッサコア４に送信する。このような場合には、プロセッサコア４は、データをメモリ６に書き込む。つまり、情報処理装置２は、プロセッサコア４が待ち合わせているデータを他の情報処理装置２ａから受信した場合にのみプロセッサコア４が有するキャッシュメモリ５に格納し、それ以外のデータについてはメモリ６に格納する。このため、演算に使用するか不明なデータによってキャッシュメモリ５に格納された演算に使用するデータが吐き出されることが防がれる結果、並列計算機システム１は、計算処理速度の低下を防ぐことができる。

例えば、プロセッサ３、プロセッサコア４、パケット生成部１１、パケット送信部１２、パケット受信部１３、判定部１４、格納部１５は、ＬＳＩ(Large Scale Integrated circuit)などの集積回路により実現される。

また、メモリ６とは、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ（flash memory）などの半導体メモリ素子である。また、キャッシュメモリ５とは、プロセッサコア４の内部メモリである。

［通信装置１０の処理の流れ］
次に、図６を用いて、通信装置１０が実行する処理の流れについて説明する。図６は、実施例１に関わる通信装置が実行する処理の流れを説明するためのフローチャートである。図６に示す例では、通信装置１０は、バス８を介して情報処理装置２を送信先とするパケットを受信したことをトリガとして処理を開始する。

まず、通信装置１０は、受信したパケットのフラグ領域に「１」が格納されているか否かを判定する（ステップＳ１０１）。そして、通信装置１０は、受信したパケットのフラグ領域に「１」が格納されている場合には（ステップＳ１０１肯定）、受信したパケットに格納されていたデータをキャッシュメモリ５に格納するデータとしてプロセッサコア４へ送信する（ステップＳ１０２）。一方、通信装置１０は、受信したパケットのフラグ領域に「０」が格納されている場合には（ステップＳ１０１否定）、受信したパケットに格納されていたデータをメモリ６に格納するデータとしてプロセッサコア４へ送信する（ステップＳ１０３）。その後、通信装置１０は、処理を終了する。

［実施例１の効果］
上述したように、情報処理装置２は、他の情報処理装置２ａからデータを受信した場合には、受信したデータをプロセッサコア４が待ち合わせているか否かを判定する。そして、情報処理装置２は、受信したデータをプロセッサコア４が待ち合わせていると判定した場合には、受信したデータをキャッシュメモリ５に格納する。また、情報処理装置２は、受信したデータをプロセッサコア４が待ち合わせていないと判定した場合には、受信したデータをキャッシュメモリ５ではなくメモリ６に格納する。

このため、情報処理装置２は、プロセッサコア４が演算に利用しないデータを受信した際に、キャッシュメモリ５に格納されたデータの吐き出しを防止する。この結果、並列計算機システム１は、各情報処理装置２、２ａが有するプロセッサコアがキャッシュメモリに格納されたデータを用いて効率的な処理を実行することができるので、計算処理速度の低下を防止することができる。

また、各情報処理装置２、２ａは、他の情報処理装置が有するプロセッサコアが待ち合わせているデータを送信する場合には、送信するパケットにプロセッサコアが待ち合わせている旨を示す制御情報を格納する。そして、各情報処理装置２、２ａは、受信したパケットに制御情報が格納されていた場合には、受信したパケットのデータをキャッシュメモリ５に格納する。また、各情報処理装置２、２ａは、受信したパケットに制御情報が格納されていない場合には、受信したパケットのデータをメモリ６に格納する。このため、各情報処理装置２、２ａは、受信したデータをキャッシュメモリに格納すべきか否かを容易に判定することができる。

実施例２では、複数のプロセッサコアを有するプロセッサが設置された情報処理装置を複数有する並列計算機システムについて説明する。図７は、実施例２に関わる並列計算機システムの一例を説明するための図である。図７に示す例では、並列計算機システム１ａは、複数の情報処理装置２ｂ、２ｃを有する。なお、情報処理装置２ｃは、情報処理装置２ｂと同様の処理を実行するものとして、説明を省略する。

また、情報処理装置２ｂが有する各部のうち、情報処理装置２が有する各部と同様の機能を発揮するものについては、同じ符号を付し、以下の説明を省略する。

情報処理装置２ｂは、プロセッサ３ａを有する。また、プロセッサ３ａは、複数のプロセッサコア４ａ〜４ｃを有する。なお、プロセッサ３ａ内のプロセッサコアは、任意の数が適用可能である。各プロセッサコア４ａ〜４ｃは、それぞれキャッシュメモリ５ａ〜５ｃを有する。なお、以下の説明においては、プロセッサコア４ｂ、４ｃはプロセッサコア４ａと同様の機能を発揮するものとし、説明を省略する。また、キャッシュメモリ５ｂ、５ｃは、キャッシュメモリ５ａと同様の機能を発揮するものとして、説明を省略する。

キャッシュメモリ５ａは、実施例１に関わるキャッシュメモリ５と同様に、状態データ、タグデータおよびデータを格納する複数のキャッシュラインを有する。ここで、キャッシュメモリ５は、タグ情報と同じキャッシュラインに格納されたデータと他のキャッシュメモリ５ｂ、５ｃに格納されたデータとメモリ６に格納されたデータとの関係を示す同一性情報が格納される。

例えば、キャッシュメモリ５は、状態データとしてＭＥＳＩプロトコル（イリノイ・プロトコル）に基づくキャッシュラインの状態を示す情報を格納する。詳細には、状態データに「Ｍ：Ｍｏｄｉｆｙ」が格納されている場合には、同じキャッシュラインに格納されたデータを排他的にキャッシュしており、かつ、キャッシュしたデータがプロセッサコア４ａによって最新の状態に更新されていることを示す。

また、状態データに「Ｅ：Ｅｘｃｌｕｓｉｖｅ」が格納されている場合には、同じキャッシュラインに格納されたデータを排他的にキャッシュしており、かつ、キャッシュしたデータがプロセッサコア４ａによって更新されていない状態を示す。また、状態データに「Ｓ：Ｓｈａｒｅｄ」が格納されている場合には、他のキャッシュメモリ５ｂ、５ｃが同一の共有データをキャッシュしていることを示す。また、状態データに「Ｉ：Ｉｎｖａｌｉｄ」が格納されている場合には、同一キャッシュラインのデータが無効であることを示す。

プロセッサコア４ａは、各プロセッサコア４ａ〜４ｃが待ち合わせていないデータを通信装置１０ａが受信した場合には、受信したデータをメモリ６に格納する。また、プロセッサコア４ａは、通信装置１０ａが受信したデータが、自身が待ち合わせているデータであって、メモリ６のうち受信したデータを格納するメモリアドレスに格納されていたデータをキャッシュメモリ５ａに保持している場合には、以下の処理を実行する。

すなわち、プロセッサコア４ａは、キャッシュメモリ５ａに保持したデータを他のプロセッサコア４ｂ、４ｃがキャッシュしているか否かを判定し、保持していると判定した場合には、受信したデータをメモリ６に格納する。また、プロセッサコア４ａは、キャッシュメモリ５ａに保持したデータを他のプロセッサコア４ｂ、４ｃがキャッシュしていないと判定した場合には、受信したデータをキャッシュメモリ５ａのみに格納する。

次に、プロセッサコア４ａが実行する処理の一例を説明する。例えば、プロセッサコア４ａは、通信装置１０ａからデータをメモリ６に格納するデータとして受信した場合には、以下の処理を実行する。すなわち、プロセッサコア４ａは、キャッシュメモリ５ａのうち、受信したデータを格納するメモリ６のメモリアドレスのインデックスに対応するキャッシュラインの状態データを参照する。

そして、プロセッサコア４ａは、参照した状態データに「Ｍ」が格納されている場合には、参照した状態データと同じキャシュラインに格納されているデータをメモリ６へ書き出す。次に、プロセッサコア４ａは、参照した状態データを「Ｍ」から「Ｉ」に更新する。その後、プロセッサコア４ａは、受信したデータをメモリ６に格納する。また、プロセッサコア４ａは、参照した状態データが「Ｍ」以外である場合には、参照した状態データを「Ｉ」に更新し、受信したデータをメモリ６に格納する。

一方、プロセッサコア４ａは、通信装置１０ａからデータをキャッシュメモリに格納するデータとして受信した場合には、以下の処理を実行する。すなわち、プロセッサコア４ａは、キャッシュメモリ５ａのうち、受信したデータを格納するメモリ６のメモリアドレスのインデックスに対応するキャッシュラインの状態データとタグデータとを参照する。

そして、プロセッサコア４ａは、参照した状態データに「Ｉ」が格納されていた場合、又は、受信したデータを格納するメモリアドレスのタグと参照したタグデータとが一致しない場合には、受信したデータをメモリ６に格納する。また、プロセッサコア４ａは、参照した状態データに「Ｓ」が格納され、かつ、受信したデータを格納するメモリアドレスのタグと参照したタグデータとが一致した場合には、受信したデータをメモリ６に格納し、参照した状態データを「Ｓ」から「Ｉ」に更新する。

また、プロセッサコア４ａは、参照した状態データが「Ｍ」または「Ｅ」で、かつ、受信したデータを格納するメモリアドレスのタグと参照したタグデータとが一致した場合には、以下の処理を実行する。すなわち、プロセッサコア４ａは、受信したデータをキャッシュメモリ５ａに格納し、参照した状態データを「Ｍ」に更新する。

つまり、各プロセッサコア４ａ〜４ｃは、キャッシュメモリに格納するデータとして通信装置１０ａからデータを受信した場合には、受信したデータを格納するメモリアドレスのインデックスに対応するキャッシュラインの状態データとタグデータとを参照する。そして、各プロセッサコア４ａ〜４ｃは、参照した状態データとタグデータとから、受信したデータが、自身のポーリング処理の対象となるデータであって、受信したデータを格納するメモリアドレスに格納されていたデータを自身のキャッシュメモリが保持しているか否かを判別する。つまり、各プロセッサコア４ａ〜４ｃは、自身のキャッシュメモリに対してポーリング処理を行っているか否かを判別する。

通信装置１０ａは、情報処理装置２ｃ等の他の情報処理装置からパケットを受信した場合には、受信したパケットのフラグ領域に「１」が格納されているか否かを判定する。そして、通信装置１０ａは、受信したパケットのフラグ領域に「１」が格納されていた場合には、以下の処理を実行する。すなわち、通信装置１０ａは、受信したデータを各プロセッサコア４ａ〜４ｃに対して、キャッシュメモリに保持するデータとして受信したデータを送信する。

一方、通信装置１０ａは、受信したパケットのフラグ領域に「０」が格納されている場合には、受信したデータをメモリ６に格納するデータとして、各プロセッサコア４ａ〜４ｃに送信する。

次に、図８を用いて、通信装置１０ａが有する各部について説明する。図８は、実施例２に関わる通信装置を説明するための図である。図８に示す例では、通信装置１０ａは、パケット生成部１１、パケット送信部１２、パケット受信部１３、判定部１４、格納部１５ａを有する。

格納部１５ａは、判定部１４がパケットのフラグ領域に「１」が格納されていると判定した場合には、図８中（Ａ）に示すように、キャッシュメモリにキャッシュするデータとして受信したデータを各プロセッサコア４ａ〜４ｃへ送信する。つまり、格納部１５ａは、判定部１４がパケットのフラグ領域に「１」が格納されていると判定した場合には、受信したデータを格納するメモリ６のメモリアドレスに格納されていたデータを保持しているキャッシュメモリに受信したデータを格納する。

また、格納部１５ａは、判定部１４がパケットのフラグ領域に「０」が格納されていると判定した場合には、図８中（Ａ）に示すように、メモリ６に格納するデータとして受信したデータを各プロセッサコア４ａ〜４ｃへ送信する。つまり、格納部１５ａは、判定部１４がパケットのフラグ領域に「０」が格納されていると判定した場合には、受信したデータをメモリ６に格納する。

［実施例２の効果］
上述したように、情報処理装置２ｂは、複数のプロセッサコア４ａ〜４ｃを有するプロセッサ３ａを有する。また、各プロセッサコア４ａ〜４ｃは、それぞれキャッシュメモリ５ａ〜５ｃを有する。そして、情報処理装置２ｂは、情報処理装置２ｃ等の他の情報処理装置からパケットを受信した場合には、受信したパケットのフラグ領域に制御情報として「１」が格納されているか否かを判定する。そして、情報処理装置２ｂは、制御情報として「１」が格納されている場合には、受信したパケットのデータを格納するメモリ６のメモリアドレスに格納されていたデータをキャッシュしているキャッシュメモリに受信したパケットのデータを格納する。また、情報処理装置２ｂは、制御情報として「０」が格納されている場合には、受信したパケットのデータをメモリ６に格納する。

このため、情報処理装置２ｂは、各プロセッサコア４ａ〜４ｃによるポーリング処理の対象とするデータを受信した場合には、受信したデータをキャッシュメモリ５ａ〜５ｃに直接格納することができる。このため、情報処理装置２ｂは、プロセッサ３ａが複数のプロセッサコア４ａ〜４ｃを有するマルチコアプロセッサである場合にも、プロセッサ３ａが実行する演算処理を効率的に行わせることができる。

また、情報処理装置２ｂは、各プロセッサコア４ａ〜４ｃによるポーリング処理の対象ではないデータを受信した場合には、受信したデータをメモリ６に格納する。このため、情報処理装置２ｂは、各プロセッサコア４ａ〜４ｃが演算処理に利用するデータが受信したデータによってキャッシュメモリ５ａ〜５ｃから吐き出されることを防ぐことができる。このため、並列計算機システム１ａは、計算処理速度を低下させることなく、プロセッサ３ａに効率的な演算処理を実行させることができる。

また、各キャッシュメモリ５ａ〜５ｃは、自身に保持したデータと他のキャッシュメモリ５ａ〜５ｃに保持されたデータとメモリ６に格納されたデータとの関係を示す同一性情報が格納される。そして、各プロセッサコア４ａ〜４ｃは、キャッシュメモリに格納するデータとしてデータを受信した場合には、自身のキャッシュメモリ５ａ〜５ｃにキャッシュしたデータと、受信したデータを格納するメモリアドレスのデータとの同一性情報をそれぞれ保持する。

この際、各プロセッサコア４ａ〜４ｃは、自身のキャッシュメモリ５ａ〜５ｃに格納された同一性情報に基づいて、キャッシュしたデータとメモリ６に格納されているデータとの同一性を保持する。その後、各プロセッサコア４ａ〜４ｃは、通信装置１０から受信したデータをキャッシュメモリ５ａ〜５ｃに格納する。このため、並列計算機システム１ａは、各プロセッサコア４ａ〜４ｃが独自のキャッシュメモリ５ａ〜５ｃを有する場合にも、データのコヒーレンシを保持し、適切な演算処理を各情報処理装置２ｂ、２ｃに実行させることができる。

実施例３では、それぞれ独自のＬ１キャッシュメモリを有する複数のプロセッサコアと各プロセッサコアが共用する１つのＬ２キャッシュメモリを有するプロセッサが設置された情報処理装置を複数有する並列計算機システムについて説明する。図９は、実施例３に関わる並列計算機システムの一例を説明するための図である。図９に示す例では、並列計算機システム１ｂは、複数の情報処理装置２ｅ、２ｆを有する。なお、情報処理装置２ｆは、情報処理装置２ｅと同様の処理を実行するものとして、説明を省略する。

また、並列計算機システム１ｂが有する各部のうち、並列計算機システム１ａが有する各部と同様の機能を発揮するものについては、同じ符号を付し、以下の説明を省略する。

情報処理装置２ｅは、プロセッサ３ｂを有する。また、プロセッサ３ｂは、複数のプロセッサコア４ｄ〜４ｆと各プロセッサコア４ｄ〜４ｆが共用するレベル２キャッシュメモリ７を有する。また、各プロセッサコア４ｄ〜４ｆは、それぞれレベル１キャッシュメモリ５ｄ〜５ｆを有する。なお、各プロセッサコア４ｅ、４ｆは、プロセッサコア４ｄと同様の機能を発揮するものとし、説明を省略する。

各レベル１キャッシュメモリ５ｄ〜５ｆは、ラインサイズ６４バイトのキャッシュラインを複数有する。各レベル１キャッシュメモリ５ｄ〜５ｆは、「２^Ｎ１」個のキャッシュラインを有し、各キャッシュラインに「２」ビットの状態データ、「３４−Ｎ_１」ビットのタグデータ、６４バイトのデータを格納する「２^Ｎ１＋６」バイトのキャッシュメモリである。ここで、「Ｎ_１」とは、各レベル１キャッシュメモリ５ｄ〜５ｆが、自身の各キャッシュラインと対応付けるインデックスのサイズである。

なお、各レベル１キャッシュメモリ５ｄ〜５ｆの各キャッシュラインに格納される各情報は、キャッシュメモリ５ａ〜５ｃが有する各キャッシュラインに格納される各情報と同様の情報であるものとする。また、各レベル１キャッシュメモリ５ｄ〜６ｆの各キャッシュラインに格納される状態データは、以下の同一性を示す同一性情報である。すなわち状態データは、同一キャッシュラインに格納されたデータと、他のレベル１キャッシュメモリ５ｄ〜５ｆに格納されたデータと、レベル２キャッシュメモリ７に格納されたデータとの同一性を示す。

レベル２キャッシュメモリ７は、各レベル１キャッシュメモリ５ｄ〜５ｆと同様に、それぞれ６４ビットのデータを格納する「２^Ｎ２」個のキャッシュラインを有する。また、レベル２キャッシュメモリ７は、各キャッシュラインに「２」ビットの状態データ、「３４−Ｎ_２」ビットのタグデータ、６４バイトのデータを格納する「２^Ｎ２＋６」バイトのキャッシュメモリである。ここで、「Ｎ_２」は、レベル２キャッシュメモリ７が自身の各キャッシュラインと対応付けるインデックスのサイズである。また、レベル２キャッシュメモリ７の各キャッシュラインに格納される状態データは、同一キャッシュラインに格納されたデータと、メモリ６に格納されたデータとの同一性を示す。

なお、各レベル１キャッシュメモリ５ｄ〜５ｆ、および、レベル２キャッシュメモリ７は、ダイレクトマップ方式のキャッシュメモリである。例えば、各レベル１キャッシュメモリ５ｄ〜５ｆ、および、レベル２キャッシュメモリ７は、メモリ６のメモリアドレス「ｉ」に格納されたデータを保持する場合には、キャッシュライン番号が「ｉ」のキャッシュラインにデータを保持するものとする。

プロセッサコア４ｄは、各プロセッサコア４ｄ〜４ｆが待ち合わせていないデータを通信装置１０ａが受信した場合には、受信したデータをメモリ６に格納する。また、プロセッサコア４ｄは、自身が待ち合わせているデータを通信装置１０ａが受信した場合には、以下の処理を実行する。すなわち、プロセッサコア４ｄは、メモリ６のうち、受信したデータを格納するメモリアドレスが示す格納領域に格納されていたデータを１次キャッシュメモリとしてのレベル１キャッシュメモリ５ｄにキャッシュしているか判定する。

そして、プロセッサコア４ｄは、メモリアドレスが示すメモリ６の格納領域に格納されていたデータをレベル１キャッシュメモリ５ｄに保持していると判定した場合には、受信したデータをレベル１キャッシュメモリ５ｄにキャッシュする。また、プロセッサコア４ｄは、メモリアドレスが示すメモリ６の格納領域に格納されていたデータをレベル１キャッシュメモリ５ｄに保持していないと判定した場合には、受信したデータをメモリ６に格納する。

次に、プロセッサコア４ｄが実行する処理の一例を説明する。例えば、プロセッサコア４ｄは、通信装置１０ａからデータをメモリ６に格納するデータとして受信した場合には、以下の処理を実行する。すなわち、プロセッサコア４ｄは、レベル１キャッシュメモリ５ｄのうち、受信したデータが格納されるメモリアドレスのインデックスと対応するキャッシュラインに格納された状態データを参照する。そして、プロセッサコア４ｄは、参照した状態データが「Ｍ」である場合には、参照した状態データと同一キャッシュラインのデータをメモリ６に書き出し、参照した状態データを「Ｍ」から「Ｉ」に更新する。そして、プロセッサコア４ｄは、受信したデータをメモリ６に格納する。

一方、プロセッサコア４ｄは、通信装置１０ａからデータをキャッシュメモリ５ｄ〜５ｆに格納するデータとして受信した場合には、以下の処理を実行する。すなわち、プロセッサコア４ｄは、受信したデータを格納するメモリアドレスのインデックスと対応するキャッシュラインのうち、状態データとタグデータとを参照する。そして、プロセッサコア４ｄは、参照した状態データに「Ｉ」が格納されている場合、または、参照したタグデータが受信したデータを格納するメモリアドレスのタグと異なる場合には、受信したデータをメモリ６に格納する。

また、プロセッサコア４ｄは、参照した状態データに「Ｓ」が格納され、かつ、参照したタグデータが受信したデータを格納するメモリアドレスのタグと一致する場合には、受信したデータをメモリ６に格納するとともに、参照した状態データを「Ｓ」から「Ｉ」に更新する。また、プロセッサコア４ｄは、参照した状態データに「Ｍ」又は「Ｅ」が格納され、かつ、参照したタグデータが受信したデータを格納するメモリアドレスのタグと一致する場合には、以下の処理を実行する。すなわち、プロセッサコア４ｄは、受信したデータを自身が有するキャッシュメモリ、すなわちレベル１キャッシュメモリ５ｄに格納し、参照した状態データを「Ｍ」に更新する。この際、プロセッサコア４ｄは、受信したデータをメモリ６には格納しない。

なお、プロセッサコア４ｄは、受信したデータをメモリ６に格納する場合には、書き込みに先立って、キャッシュメモリ５ａ〜５ｃとメインメモリ６間のデータの整合性であるデータのコヒーレンシを保持する処理を実行する。すなわち、プロセッサコア４ｄは、レベル２キャッシュメモリ７のうち、受信したデータを格納するメモリアドレスのインデックスに対応するキャッシュラインの状態データとタグデータとを参照する。そして、プロセッサコア４ｄは、参照した状態データが「Ｍ」であり、タグデータが受信したデータを格納するメモリアドレスのタグと一致する場合には、参照した状態データと同じキャッシュラインに格納されているデータをメモリ６に格納する。その後、プロセッサコア４ｄは、参照した状態データを「Ｍ」から「Ｉ」に更新し、さらに、受信したデータをメモリ６に格納する。

つまり、プロセッサコア４ｄは、プロセッサコア４ｄ〜４ｆのいずれかがポーリング処理の対象とする情報を通信装置１０ａが受信した場合には、受信したデータをレベル１キャッシュメモリ５ｄに格納するデータとして受信する。このような場合には、プロセッサコア４ｄは、受信したデータを格納するメモリ６の格納領域に格納されていたデータをレベル１キャッシュメモリ５ｄに排他的にキャッシュしているか否かを判定する。そして、プロセッサコア４ｄは、受信したデータを格納するメモリ６の格納領域に格納されていたデータをレベル１キャッシュメモリ５ｄに排他的にキャッシュしている場合には、受信したデータをレベル１キャッシュメモリ５ｄにキャッシュする。

通常、プロセッサコア４ｄは、ポーリング処理の対象となるデータが格納されるメモリアドレスのデータがキャッシュされている。このため、情報処理装置２ｅは、通信装置１０ａによってプロセッサコア４ｄが待ち合わせているデータを受信した場合には、受信したデータをメモリ６ではなく、レベル１キャッシュメモリ５ｄに格納する。この結果、並列計算機システム１ｂは、各情報処理装置２ｅ、２ｆに、効率的に処理を実行させることができる。

［実施例３の効果］
上述したように、情報処理装置２ｅは、複数のプロセッサコア４ｄ〜４ｆを有するプロセッサ３ｂを有する。また、各プロセッサコア４ｄ〜４ｆは、それぞれレベル１キャッシュメモリ５ｄ〜５ｆを有する。そして、情報処理装置２ｅは、情報処理装置２ｆ等の他の情報処理装置からパケットを受信した場合には、受信したパケットのフラグ領域に制御情報として「１」が格納されているか否かを判定する。

そして、情報処理装置２ｅは、制御情報として「１」が格納されている場合には、受信したデータを格納するメモリアドレスのデータをキャッシュしているレベル１キャッシュメモリ５ｄ〜５ｆに受信したデータを格納する。また、情報処理装置２ｅは、制御情報として「０」が格納されている場合には、受信したパケットのデータをメモリ６に格納する。

このため、情報処理装置２ｅは、各プロセッサコア４ｄ〜４ｆによるポーリング処理の対象とするデータを受信した場合には、受信したデータをレベル１キャッシュメモリ５ｄ〜５ｆに直接格納することができる。このため、情報処理装置２ｅは、プロセッサ３ｂが実行する演算処理を効率的に行わせることができる。

また、情報処理装置２ｅは、各プロセッサコア４ｄ〜４ｆによるポーリング処理の対象ではないデータを受信した場合には、受信したデータをメモリ６に格納する。このため、情報処理装置２ｅは、各プロセッサコア４ｄ〜４ｆが演算処理に利用するデータが受信したデータによってレベル１キャッシュメモリ５ｄ〜５ｆから吐き出されることを防ぐことができる。このため、並列計算機システム１ｂは、計算処理速度を低下させることなく、効率的な演算処理を実行することができる。

また、各レベル１キャッシュメモリ５ｄ〜５ｆは、自身にキャッシュされたデータと他のレベル１キャッシュメモリ５ｄ〜５ｆに格納されたデータとレベル２キャッシュメモリ７に格納されたデータとの関係を示す状態データである第１同一性情報が格納される。また、レベル２キャッシュメモリ７には、自身にキャッシュされたデータとメモリ６にキャッシュされたデータとの関係を示す状態データである第２同一性情報が格納される。そして、各プロセッサコア４ｄ〜４ｆは、第１同一性情報および第２同一性情報に基づいて、レベル１キャッシュメモリ５ｄ〜５ｆに格納されたデータとレベル２キャシュメモリ７に格納されたデータとメモリ６に格納されたデータとの同一性を保持する。

このため、並列計算機システム１ｂは、各プロセッサコア４ｄ〜４ｆが独自のレベル１キャッシュメモリ５ｄ〜５ｆを有し、レベル２キャッシュメモリ７を共用する場合にも、データの同一性を適切に保持し、適切な演算処理を実行させることができる。

以下の実施例４では、図１０を用いて、並列計算機システムの一例を説明する。図１０は、実施例４に関わる並列計算機システムを説明するための図である。図１０に示すように、並列計算機システム１ｃは、複数の情報処理装置２ｆ、２ｇを有する。なお、図１０では省略したが、並列計算機システム１ｃは、さらに多数の情報処理装置を有してもよい。また、情報処理装置２ｇは、情報処理装置２ｆと同様の処理を実行するものとして、以下の説明を省略する。また、実施例１〜４に関わる各部と同様の処理を実行するものについては、同一の符号を付すものとし、以下の説明を省略する。

情報処理装置２ｆは、プロセッサ３ｃ、メモリ６、通信装置１０ｂを有する。プロセッサ３ｃは、プロセッサコア４ｇを有する。プロセッサコア４ｇは、キャッシュメモリ５を有する。また、通信装置１０ｂは、書き込み先アドレステーブル１６を有する。

プロセッサコア４ｇは、実施例１に関わるプロセッサコア４と同様の処理を実行する。つまり、プロセッサコア４ｇは、通信装置１０ｂからデータをメモリ６に格納するデータとして受信した場合には、プロセッサコア４と同様の処理を実行し、受信したデータをメモリ６に格納する。また、プロセッサコア４ｇは、通信装置１０ｂからデータをキャッシュメモリ５に格納するデータとして受信した場合には、プロセッサコア４と同様の処理を実行し、受信したデータをキャッシュメモリ５に格納する。このため、プロセッサコア４ｇがデータをキャッシュメモリ５またはメモリ６に格納する処理の説明については、省略する。

さらに、プロセッサコア４ｇは、受信データを待ち合わせるポーリング処理を実行する場合には、直前に、通信装置１０ｂの書き込み先アドレステーブル１６に、ポーリング処理の対象となるデータを格納するメモリ６のメモリアドレスを登録する。具体的には、プロセッサコア４ｇは、ポーリング処理の対象となるデータを格納するメモリ６のメモリアドレスを通信装置１０ｂに送信し、後述する通信装置１０ｂの更新部１７に、送信したメモリアドレスを書き込み先アドレステーブル１６に格納させる。

また、プロセッサコア４ｇは、ポーリング処理の対象とするデータを通信装置１０ｃから受信し、受信したデータをキャッシュメモリ５に格納した場合には、ポーリング処理の対象とするデータをキャッシュメモリ５に格納した旨を通信装置１０ｃへ通知する。例えば、プロセッサコア４ｇは、ポーリング処理の対象とするデータをキャッシュメモリ５に格納した旨とともに、キャッシュメモリ５に格納したデータを格納するメモリ６のメモリアドレスとを通信装置１０ｂに送信する。

通信装置１０ｂは、キャッシュメモリ５へのデータの書き込みを制御する制御アドレスを保持する書き込み先アドレステーブル１６を有する。そして、通信装置１０ｂは、情報処理装置２ｇ等の他の情報処理装置から受信したデータの書き込み先アドレスが、書き込み先アドレステーブル１６に保持された制御アドレスと一致する場合には、以下の処理を実行する。すなわち、通信装置１０ｂは、受信したデータをキャッシュメモリ５に格納するデータとしてプロセッサコア４ｇに送信する。

また、通信装置１０ｂは、受信したデータの書き込み先アドレスが、書き込み先アドレステーブル１６に保持された制御アドレスと一致しない場合には、受信したデータをメモリ６に格納するデータとしてプロセッサコア４ｇに送信する。

また、通信装置１０ｂは、プロセッサコア４ｇからポーリング処理の対象とするデータをキャッシュメモリ５に格納した旨の通知を受けた場合には、以下の処理を実行する。すなわち、通信装置１０ｂは、書き込み先アドレステーブル１６からキャッシュメモリ５に格納したデータを格納するメモリ６のメモリアドレスを削除する。

例えば、通信装置１０ｂは、プロセッサコア４ｇからポーリング処理の対象とするデータをキャッシュメモリ５に格納した旨とともに、キャッシュメモリ５に格納したデータを格納するメモリ６のメモリアドレスとを受信する。このような場合には、通信装置１０ｂは、受信したメモリアドレスを書き込み先アドレステーブル１６から検索し、検索したメモリアドレスを書き込み先アドレステーブル１６から削除する。

以下、通信装置１０ｂについて、図１１、および、図１２を用いて説明する。まず、図１１を用いて、通信装置１０ｂが有する各部について説明する。図１１は、実施例４に関わる通信装置の一例を説明するための図である。図１１に示すように、通信装置１０ｂは、パケット生成部１１、パケット送信部１２、パケット受信部１３、判定部１４ａ、格納部１５、書き込み先アドレステーブル１６、更新部１７を有する。

書き込み先アドレステーブル１６は、プロセッサコア４ｇのポーリング処理の対象とするデータが格納されるメモリアドレスを保持する。ここで、図１２は、書き込み先アドレステーブルの一例を説明するための図である。図１２に示す例では、書き込み先アドレステーブル１６は、メモリアドレスを格納するライン番号が「０」〜「Ｎ−１」のＮ個のラインメモリを有する。

例えば、各ラインメモリは、図１２中（Ａ）に示す１ビットの領域に有効ビットが格納され、図１２中（Ｂ）に示す６４ビットの範囲にメモリアドレスが格納される。ここで有効ビットとは、対応するラインメモリに格納されたメモリアドレスが有効なデータであるか否かを示すビットである。例えば、有効ビットに「０」が格納されている場合には、対応するラインメモリに格納されたメモリアドレスのデータは無効であることを示す。また、例えば、有効ビットに「１」が格納されている場合には、対応するラインメモリに格納されたメモリアドレスのデータは、有効であることを示す。なお、書き込み先アドレステーブル１６とは、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ（flash memory）などの半導体メモリ素子である。

判定部１４ａは、パケット受信部１３からパケットを受信した場合には、受信したパケットに格納されていたデータを格納するメモリ６のメモリアドレスを取得する。また、判定部１４ａは、取得したメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６に格納されているか否かを判定する。

すなわち、判定部１４ａは、書き込み先アドレステーブル１６が有する各ラインメモリのうち、有効ビット「１」と対応するラインメモリに格納されたメモリアドレスと取得したメモリアドレスとを比較する。そして、判定部１４ａは、有効ビットに「１」が格納されているラインメモリに格納されたメモリアドレスと取得したメモリアドレスとが一致した場合には、受信したパケットに格納されていたデータをキャッシュメモリ５に格納するデータであると判定する。

一方、判定部１４ａは、有効ビット「１」と対応するラインメモリに格納されたメモリアドレスと取得したメモリアドレスとが一致しないと判定した場合には、受信したパケットに格納されていたデータをメモリ６に格納するデータであると判定する。

更新部１７は、図１１中（Ａ）に示すように、プロセッサコア４ｇからポーリング処理の対象とするデータを格納するメモリ６のメモリアドレスを受信した場合には、受信したメモリアドレスを書き込み先アドレステーブル１６に追加する。また、更新部１７は、プロセッサコア４ｇからポーリング処理の対象とするデータを取得した旨の通知を受けた場合には、ポーリング処理の対象とするデータを格納するメモリ６のメモリアドレスを書き込み先アドレステーブル１６から削除する。

例えば、更新部１７は、プロセッサコア４ｇからポーリング処理の対象とするデータを格納するメモリ６のメモリアドレスを受信した場合には、書き込み先アドレステーブル１６が有する各ラインメモリのうち、対応する有効ビットが「０」であるラインメモリを選択する。そして、更新部１７は、選択したラインメモリにプロセッサコア４ｇから受信したメモリアドレスを格納するとともに、選択したラインメモリの有効ビットを「１」に更新する。

また、更新部１７は、プロセッサコア４ｇからポーリング処理の対象とするデータをキャッシュメモリ５に格納した旨とともに、キャッシュメモリ５に格納したデータを格納するメモリ６のメモリアドレスとを受信した場合には、以下の処理を実行する。すなわち、更新部１７は、書き込み先アドレステーブル１６が有する各ラインメモリのうち、対応する有効ビットが「１」であるラインメモリであって、プロセッサコア４ｇから受信したアドレスが格納されているラインメモリを検索する。そして、更新部１７は、検索したラインメモリと対応する有効ビットを「０」に更新する。なお、更新部１７とは、電子回路である。ここで、電子回路の例として、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの集積回路、またはＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）などを適用する。

［通信装置１０ｂの処理の流れ］
次に、図１３を用いて、通信装置１０ｂが実行する処理の流れについて説明する。図１３は、実施例４に関わる通信装置が実行する処理の流れを説明するためのフローチャートである。図１３に示す例では、通信装置１０ｂは、バス８を介して情報処理装置２ｆを送信先とするパケットを受信したことをトリガとして処理を開始する。

まず、通信装置１０ｂは、受信したパケットに格納されたデータの書き込み先アドレスと書き込み先アドレステーブル１６に格納されているメモリアドレスとが一致するか否かを判別する（ステップＳ２０１）。つまり、通信装置１０ｂは、受信したデータを格納するメモリ６のメモリアドレスが書き込み先アドレステーブル１６に登録されているか否かを判別する。

そして、通信装置１０ｂは、受信したパケットに格納されたデータの書き込み先アドレスと書き込み先アドレステーブル１６に格納されているメモリアドレスとが一致する場合には（ステップＳ２０１肯定）、以下の処理を実行する。すなわち、通信装置１０ｂは、受信したパケットのデータをキャッシュメモリ５に格納するデータとしてプロセッサコア４ｇへ送信する（ステップＳ２０２）。

一方、通信装置１０ｂは、受信したパケットに格納されたデータの書き込み先アドレスと書き込み先アドレステーブル１６に格納されているメモリアドレスとが一致しない場合には（ステップＳ２０１否定）、以下の処理を実行する。すなわち、通信装置１０ｂは、受信したパケットのデータをメモリ６に格納するデータとしてプロセッサコア４ｇへ送信する（ステップＳ２０３）。その後、通信装置１０ｂは、処理を終了する。

［実施例４の効果］
上述したように、情報処理装置２ｆは、プロセッサコア４ｇがポーリング処理の対象とするデータを格納するメモリアドレスを保持する書き込み先アドレステーブル１６を有する。また、情報処理装置２ｆは、プロセッサコア４ｇがポーリング処理を実行する場合には、ポーリング処理の対象となるデータが格納されるメモリアドレスを書き込み先アドレステーブル１６に格納する。

そして、情報処理装置２ｆは、情報処理装置２ｇ等の他の情報処理装置からデータを受信した場合には、受信したデータを格納するメモリアドレスが書き込み先アドレステーブル１６に格納されているか否かを判定する。また、情報処理装置２ｆは、受信したデータを格納するメモリアドレスが書き込み先アドレステーブル１６に格納されていると判定した場合には、受信したデータをキャッシュメモリ５に格納する。また、情報処理装置２ｆは、受信したデータを格納するメモリアドレスが書き込み先アドレステーブル１６に格納されていないと判定した場合には、受信したデータをメモリ６に格納する。

このため、情報処理装置２ｆは、プロセッサコア４ｇが演算に利用しないデータを受信した際に、キャッシュメモリ５に格納されたデータの吐き出しを防止する。この結果、並列計算機システム１ｃは、各情報処理装置２ｆ、２ｇが有するプロセッサコアがキャッシュメモリに格納されたデータを用いて効率的な処理を実行することができるので、計算処理速度の低下を防止することができる。

実施例５では、複数のプロセッサコアを有するプロセッサが設置された情報処理装置を複数有する並列計算機システム１ｄについて説明する。図１４は、実施例５に関わる並列計算機システムの一例を説明するための図である。図１４に示す例では、並列計算機システム１ｄは、情報処理装置２ｈ、２ｉをはじめとする複数の情報処理装置を有する。なお、情報処理装置２ｉ等の各情報処理装置は、情報処理装置２ｈと同様の処理を実行するものとして、説明を省略する。また、情報処理装置２ｈが有する各部のうち、情報処理装置２ｂが有する各部と同様の処理を実行するものについては、同一の符号を付し、説明を省略する。

情報処理装置２ｈは、複数のプロセッサコア４ｈ〜４ｊを有するプロセッサ３ｄ、メモリ６、通信装置１０ｃを有する。各プロセッサコア４ｈ〜４ｊは、キャッシュメモリ５ａ〜５ｃを有する。また、通信装置１０ｃは、書き込み先アドレステーブル１６ａを有する。

プロセッサコア４ｈは、実施例２に関わるプロセッサコア４ａと同様に、通信装置１０ｃからメモリ６に格納するデータを受信した場合には、受信したデータをメモリ６に格納する。また、プロセッサコア４ｈは、通信装置１０ｃからキャッシュメモリ５ａに格納するデータを受信した場合には、受信したデータをキャッシュメモリ５ａに格納する。

また、プロセッサコア４ｈは、受信したデータをキャッシュメモリ５ａ、又は、メモリ６に格納する場合には、以下の処理を実行する。つまり、プロセッサコア４ｈは、プロセッサコア４ａと同様に、キャッシュメモリ５ａに格納された同一性情報に基づいて、キャッシュメモリ５ａに格納されたデータとメモリ６に格納されたデータとのコヒーレンシを保持する。

具体的には、プロセッサコア４ｈは、キャッシュメモリ５ａが有する各キャッシュラインに格納された状態データに応じて、キャッシュメモリ５ａとメモリ６とに格納されたデータの整合性であるデータのコヒーレンシを保持する。その後、プロセッサコア４ｈは、受信したデータをキャッシュメモリ５ａ又はメモリ６に格納する。なお、プロセッサコア４ｈがキャッシュメモリ５ａとメモリ６とに格納されたデータのコヒーレンシを保持する詳細な処理については、プロセッサコア４ａが実行する処理と同様の処理を行うものとして、説明を省略する。

さらに、プロセッサコア４ｈは、実施例４に関わるプロセッサコア４ｇと同様に、ポーリング処理を実行する場合には、直前に、通信装置１０ｃの書き込み先アドレステーブル１６にポーリング処理の対象となるデータの書き込み先アドレスを登録する。この際、プロセッサコア４ｈは、書き込み先アドレスとともに、自身のキャッシュメモリ５ａを示す書込先キャッシュメモリ識別情報をメモリアドレスと対応付けて登録する。

通信装置１０ｃは、受信したデータを格納するメモリアドレスと、各キャッシュメモリ５ａ〜５ｃを識別する書込先キャッシュメモリ識別情報とを対応付けて保持する書き込み先アドレステーブル１６ａを有する。そして通信装置１０ｃは、実施例４に関わる通信装置１０ｂと同様に、情報処理装置２ｉ等の他の情報処理装置からパケットを受信した場合には、以下の処理を実行する。すなわち、通信装置１０ｃは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ａに格納されているか否かを判別する。

そして、通信装置１０ｃは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ａに格納されている場合には、以下の処理を実行する。すなわち、通信装置１０ｃは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスに対応付けられた書込先キャッシュメモリ識別情報が示すキャッシュメモリを有するプロセッサコアを判定する。そして、通信装置１０ｃは、判定したプロセッサコアに対して、受信したデータをキャッシュメモリに格納するデータとして送信する。

一方、通信装置１０ｃは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ａに格納されていない場合には、受信したデータをメモリ６に格納するデータとして、各プロセッサコア４ｈ〜４ｊに送信する。

次に、図１５を用いて、通信装置１０ｃが有する各部について説明する。図１５は、実施例５に関わる通信装置の一例を説明するための図である。なお、通信装置１０ｃが有する各部のうち、実施例１〜４に示す各部と同様の処理を実行するものについては、同一の符号を付し、説明を省略する。

図１５に示す例では、通信装置１０ｃは、格納部１５ｂ、判定部１４ｂ、書き込み先アドレステーブル１６ａ、更新部１７ａを有する。書き込み先アドレステーブル１６ａは、実施例４に関わる書き込み先アドレステーブル１６と同様に、ポーリング処理の対象となるデータを格納するメモリアドレスを保持する。さらに、書き込み先アドレステーブル１６ａは、保持するメモリアドレスに、ポーリング処理を行うプロセッサコアが有するキャッシュメモリを識別する書込先キャッシュメモリ識別情報を対応付けて保持する。

例えば、書き込み先アドレステーブル１６ａは、書き込み先アドレステーブル１６の各ラインメモリに書込先キャッシュメモリ識別情報を格納する格納領域をさらに追加した複数のラインメモリを有する。そして、書き込み先アドレステーブル１６ａは、対応付けるメモリアドレスと書込先キャッシュメモリ識別情報とを同一ラインメモリに格納する。

判定部１４ｂは、パケット受信部１３が受信したパケットに格納されていたデータを格納するメモリ６のメモリアドレスを取得する。そして、判定部１４ｂは、取得したメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ａに格納されているか否かを判定する。

そして、判定部１４ｂは、取得したメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ａに格納されている場合には、以下の処理を実行する。すなわち、判定部１４ｂは、書き込み先アドレステーブル１６ａに格納されていたメモリアドレスと対応付けて記憶された書込先キャッシュメモリ識別情報を取得する。そして、判定部１４ｂは、受信したパケットに格納されていたデータを、取得した書込先キャッシュメモリ識別情報が示すキャッシュメモリに格納するデータであると判定する。

一方、判定部１４ｂは、取得したメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ａに格納されていない場合には、受信したパケットに格納されていたデータをメモリ６に格納するデータであると判定する。

格納部１５ｂは、受信したデータをキャッシュメモリに格納するデータであると判定部１４ｂが判定した場合には、以下の処理を実行する。すなわち、格納部１５ｂは、判定部１４ｂが取得した書込先キャッシュメモリ識別情報が示すキャッシュメモリを有するプロセッサコアに、キャッシュメモリに格納するデータとして、受信したデータを送信する。例えば、格納部１５ｂは、判定部１４ｂが受信したデータをキャッシュメモリ５ａに格納するデータであると判定した場合には、受信したデータをプロセッサコア４ｈに送信する。

一方、格納部１５ｂは、判定部１４ｂが受信したパケットに格納されていたデータをメモリ６に格納するデータであると判定した場合には、受信したデータをメモリ６に格納するデータとして、プロセッサコア４ｈ〜４ｊに送信する。

更新部１７ａは、図１５中（Ａ）に示すように、各プロセッサコア４ｈ〜４ｊからポーリング処理の対象となるデータを格納するメモリアドレスを受信する。これと同時に、更新部１７ａは、各プロセッサコア４ｈ〜４ｊが有する各キャッシュメモリ５ａ〜５ｃを示す書込先キャッシュメモリ識別情報を受信する。このような場合には、更新部１７ａは、受信したデータと書込先キャッシュメモリ識別情報とを書き込み先アドレステーブル１６ａが有する１つのメモリラインに格納する。

また、更新部１７ａは、更新部１７と同様、各プロセッサコア４ｈ〜４ｊからポーリング処理の対象となるデータをキャッシュメモリに格納した旨とともに、メモリアドレスを受信した場合には、以下の処理を実行する。すなわち、更新部１７ａは、受信したメモリアドレスが格納されているラインメモリを書き込み先アドレステーブル１６ａから検索し、検索したラインメモリと対応する有効ビットを「０」に更新する。

例えば、このような各部を有する情報処理装置２ｈは、プロセッサコア４ｈがポーリング処理を実行する場合には、以下の処理を実行する。すなわち、情報処理装置２ｈは、ポーリング処理の対象となるデータを格納するメモリアドレスとキャッシュメモリ５ａを示す書込先キャッシュメモリ識別情報とを対応付けて書き込み先アドレステーブル１６ａに格納する。そして、情報処理装置２ｈは、情報処理装置２ｉ等からパケットを受信した場合には、受信したパケットに格納されていたデータを格納するメモリアドレスが書き込み先アドレステーブル１６ａに格納されているか否かを判別する。

この際、受信したパケットに格納されていたデータがプロセッサコア４ｈがポーリング処理の対象となるデータである場合には、格納するメモリアドレスが書き込み先アドレステーブル１６ａに格納されている。このため、情報処理装置２ｈは、受信したデータを格納するメモリアドレスと対応付けて記憶されたキャッシュメモリ５ａを示す書込先キャッシュメモリ識別情報から、ポーリング処理を行っているプロセッサコアがプロセッサコア４ｈであると判定する。そして、情報処理装置２ｈは、受信したデータをプロセッサコア４ｈに送信し、キャッシュメモリ５ａに格納する。

［実施例５の効果］
上述したように、情報処理装置２ｈは、ポーリング処理の対象となるデータを格納するメモリアドレスとキャッシュメモリを示す書込先キャッシュメモリ識別情報と対応付けて書き込み先アドレステーブル１６ａに格納する。そして、情報処理装置２は、受信したパケットのデータを格納するメモリアドレスが書き込み先アドレステーブル１６ａかに格納されているか否かを判別し、格納されている場合には以下の処理を実行する。すなわち、情報処理装置２ｈは、対応付けて格納されていた書込先キャッシュメモリ識別情報が示すキャッシュメモリに受信したデータを格納する。

このため、情報処理装置２ｈは、各プロセッサコア４ｈ〜４ｊによるポーリング処理の対象とするデータ受信した場合には、受信したデータをキャッシュメモリ５ａ〜５ｃに直接格納することができる。このため、並列計算機システム１ｄは、各情報処理装置２ｈ、２ｉが有するプロセッサが複数のプロセッサコアを有するマルチコアプロセッサである場合にも、演算処理を効率的に行わせることができる。

また、情報処理装置２ｈは、他の実施例に関わる情報処理装置２〜２ｇと同様に、プロセッサコア４ｈ〜４ｊが演算に利用しないデータを受信した際に、キャッシュメモリ５ａ〜５ｃに格納されたデータの吐き出しを防止する。この結果、並列計算機システム１ｄは、計算処理速度の低下を防止することができる。

また、情報処理装置２ｈは、情報処理装置２ｆと同様に、キャッシュメモリ５ａに格納された同一性情報に基づいて、キャッシュメモリ５ａに格納されたデータとメモリ６に格納されたデータとの同一性を保持する。このため、並列計算機システム１ｄは、各情報処理装置２ｈ、２ｉに適切な処理を実行させることができる。

実施例６では、それぞれ独自のＬ１キャッシュメモリを有する複数のプロセッサコアと各プロセッサコアが共用する１つのＬ２キャッシュメモリを有するプロセッサが設置された情報処理装置を複数有する並列計算機システムについて説明する。図１６は、実施例３に関わる並列計算機システムを説明するための図である。

図１６に示すように、並列計算機システム１ｅは、情報処理装置２ｊ、２ｋ等の複数の情報処理装置を有する。なお、情報処理装置２ｋ等は、情報処理装置２ｊと同様の処理を実行するものとして、説明を省略する。

また、並列計算機システム１ｅが有する各部のうち、並列計算機システム１ｂと同様の処理を実行するものについては、同一の符号を付し、以下の説明を省略する。

情報処理装置２ｊは、複数のプロセッサコア４ｋ〜４ｍを有するプロセッサ３ｅと、各プロセッサコア４ｋ〜４ｍが共用するレベル２キャッシュメモリ７を有する。また、各プロセッサコア４ｋ〜４ｍは、それぞれ、レベル１キャッシュメモリ５ｄ〜５ｆを有する。なお、プロセッサコア４ｌ、４ｍは、プロセッサコア４ｋと同様の処理を実行するものとして、以下の説明を省略する。

プロセッサコア４ｋは、実施例５に関わるプロセッサコア４ｈと同様に、通信装置１０ｄが受信したデータをレベル１キャッシュメモリ５ｄに格納するデータとして受信した場合には、受信したデータをレベル１キャッシュメモリ５ｄに格納する。また、プロセッサコア４ｋは、通信装置１０ｄが受信したデータをメモリ６に格納するデータとして受信した場合には、受信したデータをメモリ６に格納する。

また、プロセッサコア４ｋは、データをレベル１キャッシュメモリ５ｄまたはレベル２キャッシュメモリ７に格納する場合には、実施例３に関わるプロセッサコア４ｄと同様の処理を実行する。すなわち、プロセッサコア４ｋは、第１同一性情報と、第２同一性情報とに基づいて、レベル１キャッシュメモリ５ｄ、レベル２キャッシュメモリ７、メモリ６に格納されたデータの同一性を保持する。

また、プロセッサコア４ｋは、ポーリング処理を実行する場合には、ポーリング処理の対象となるデータを格納するメモリアドレスとレベル１キャッシュメモリ５ｄを示す書込先キャッシュメモリ識別情報とを通信装置１０ｄに送信する。つまり、プロセッサコア４ｋは、ポーリング処理の対象となるデータを格納するメモリアドレスとレベル１キャッシュメモリ５ｄを示す書込先キャッシュメモリ識別情報とを対応付けて書き込み先アドレステーブル１６ｂに格納する。

また、プロセッサコア４ｋは、ポーリング処理の対象となるデータをレベル１キャッシュメモリ５ｄに格納した場合には、データをレベル１キャッシュメモリ５ｄに格納した旨とデータを格納するメモリアドレスとを通信装置１０ｄに送信する。つまり、プロセッサコア４ｋは、ポーリング処理の対象となるデータを格納するメモリアドレス等を書き込み先アドレステーブル１６ｂから削除する。

通信装置１０ｄは、書き込み先アドレステーブル１６ｂを有する。書き込みアドレステーブル１６ｂには、書き込み先アドレステーブル１６ａと同様に、以下の情報が対応付けて格納されている。すなわち、書き込み先アドレステーブル１６ｂには、ポーリング処理の対象となるデータを格納するメモリアドレスと各レベル１キャッシュメモリ５ｄ〜５ｆを識別する書込先キャッシュメモリ識別情報とが対応付けられて格納されている。

そして、通信装置１０ｄは、通信装置１０ｃと同様に、情報処理装置２ｋ等の他の情報処理装置からパケットを受信した場合には、以下の処理を実行する。すなわち、通信装置１０ｄは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ｂに格納されているか否かを判別する。

そして、通信装置１０ｄは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ｂに格納されている場合には、以下の処理を実行する。すなわち、通信装置１０ｄは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスに対応付けられた書込先キャッシュメモリ識別情報が示すレベル１キャッシュメモリを有するプロセッサコアを判定する。そして、通信装置１０ｄは、判定したプロセッサコアに対して、受信したデータをキャッシュメモリに格納するデータとして送信する。

一方、通信装置１０ｄは、受信したパケットを格納するメモリアドレスと同一のメモリアドレスが書き込み先アドレステーブル１６ｂに格納されていない場合には、受信したデータをメモリ６に格納するデータとして、各プロセッサコア４ｋ〜４ｆに送信する。

例えば、このような各部を有する情報処理装置２ｊは、プロセッサコア４ｋがポーリング処理を実行する場合には、以下の処理を実行する。すなわち、情報処理装置２ｊは、ポーリング処理の対象となるデータを格納するメモリアドレスとレベル１キャッシュメモリ５ｄを示す書込先キャッシュメモリ識別情報とを対応付けて書き込み先アドレステーブル１６ｂに格納する。そして、情報処理装置２ｊは、情報処理装置２ｋ等の他の情報処理装置からパケットを受信した場合には、受信したパケットに格納されていたデータを格納するメモリアドレスが書き込み先アドレステーブル１６ｂに格納されているか否かを判別する。

この際、受信したパケットに格納されていたデータがプロセッサコア４ｋがポーリング処理の対象となるデータである場合には、格納するメモリアドレスが書き込み先アドレステーブル１６ｂに格納されている。このため、情報処理装置２ｊは、受信したデータを格納するメモリアドレスと対応付けて記憶されたレベル１キャッシュメモリ５ｄを示す書込先キャッシュメモリ識別情報から、ポーリング処理を行っているプロセッサコアがプロセッサコア４ｋであると判定する。そして、情報処理装置２ｊは、受信したデータをプロセッサコア４ｋに送信し、レベル１キャッシュメモリ５ｄに格納する。

また、情報処理装置２ｊは、各レベル１キャッシュメモリ５ｄ〜５ｆおよびレベル２キャッシュメモリ７に格納された第１同一性情報および第２同一性情報を用いて、以下の処理を実行する。つまり、情報処理装置２ｊは、各レベル１キャッシュメモリ５ｄ〜５ｆ、レベル２キャッシュメモリ７、メモリ６に格納されているデータの同一性を保持し、その後、受信したデータを各レベル１キャッシュメモリ５ｄ〜５ｆ、または、メモリ６に格納する。

［実施例６の効果］
上述したように、情報処理装置２ｊは、ポーリング処理の対象となるデータを格納するメモリアドレスと、ポーリング処理を実行するプロセッサコアが有するレベル１キャッシュメモリを示す書込先キャッシュメモリ識別情報とを対応付けて記憶する。そして、情報処理装置２ｊは、受信したデータを格納するメモリアドレスが記憶したメモリアドレスと一致する場合には、対応付けて記憶した書込先キャッシュメモリ識別情報が示すレベル１キャッシュメモリに受信したデータを格納する。このため、並列計算機システム１ｅは、各プロセッサコア４ｋ〜４ｍに効率的に演算処理を実行することができる。

また、情報処理装置２ｊは、ポーリング処理の対象ではないデータを受信した場合には、受信したデータをメモリ６に格納する。このため、並列計算機システム１ｅは、計算処理速度を低下させることなく、効率的な演算処理を実行することができる。

また、情報処理装置２ｊは、各レベル１キャッシュメモリ５ｄ〜５ｆに格納された第１同一性情報およびレベル２キャッシュメモリ７に格納された第２同一性情報を用いて、以下の処理を実行する。すなわち、情報処理装置２ｊは、各レベル１キャッシュメモリ５ｄ〜５ｆ、レベル２キャッシュメモリ７、メモリ６に格納されたデータの同一性を適切に保持する。この結果、並列計算機システム１ｅは、適切な演算処理装置を実行することができる。

これまで本発明の実施例について説明したが実施例は、上述した実施例以外にも様々な異なる形態にて実施されてよいものである。そこで、以下では実施例７として本発明に含まれる他の実施例を説明する。

（１）並列計算機システムが有する情報処理装置について
上述した説明における各並列計算機システム１、１ｃは、キャッシュメモリ５を有するプロセッサコア４、４ｇを有していた。しかし、実施例はこれに限定されるものではなく、例えば、各並列計算機システム１、１ｃは、レベル１キャッシュメモリを有するプロセッサコアとレベル２キャッシュメモリを有するプロセッサを有しても良い。そして、並列計算機システム１、１ｃが有するプロセッサコアは、レベル１キャッシュメモリおよびレベル２キャッシュメモリに格納された第１同一性情報と第２同一性情報とを用いて、データのコヒーレンシを保持することとしてもよい。

すなわち、情報処理装置は、受信したデータがポーリング処理の対象となるデータであるか否か判定し、ポーリング処理の対象となるデータであると判定した場合には、受信したデータをキャッシュメモリに格納する。また、情報処理装置は、受信したデータがポーリング処理の対象となるデータではないと判定した場合には、受信したデータをメインメモリに格納する。つまり、情報処理装置は、このような処理を実行する情報処理装置であれば、任意の構成を有することができる。

（２）並列計算機システムについて
上述した各並列計算機システム１〜１ｅは、それぞれ同様の機能を発揮する複数の情報処理装置を有していた。しかし、実施例はこれに限定されるものではなく、各実施例における任意の情報処理装置をそなえた並列計算機システムであってもよい。つまり、情報処理装置は、受信したパケットに制御情報として「１」が格納されているか否かに基づいて、受信したパケットのデータがポーリング処理の対象となるデータであるか否かを判定するとともに、書き込み先アドレステーブルにメモリアドレスが格納されているか否かを判定する。そして、情報処理装置は、いずれかの条件を満たした場合には、ポーリング処理の対象となるデータであると判定してもよい。

１〜１ｅ並列計算機システム
２〜２ｋ情報処理装置
３〜３ｅプロセッサ
４〜４ｍプロセッサコア
５〜５ｃキャッシュメモリ
５ｄ〜５ｆレベル１キャッシュメモリ
６メモリ
７レベル２キャッシュメモリ
１０〜１０ｄ通信装置
１１パケット生成部
１２パケット送信部
１３パケット受信部
１４〜１４ｂ判定部
１５〜１５ｂ格納部
１６、１６ａ書き込み先アドレステーブル
１７、１７ａ更新部

Claims

複数の情報処理装置を備える並列計算機システムを構成する情報処理装置において、
データを保持する主記憶装置と、
前記主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、前記主記憶装置又は前記キャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部を有する演算処理装置と、
他の情報処理装置の演算処理装置が待ち合わせているデータに、前記他の情報処理装置の演算処理装置が有するキャッシュメモリ部に書き込む旨の制御情報を付加したデータを前記他の情報処理装置に送信する送信部と、前記他の情報処理装置から受信したデータに、制御情報が付加されているか否かを判定する判定部と、受信したデータに制御情報が付加されていると前記判定部が判定した場合は、前記複数の演算処理部のキャッシュメモリ部のうち、前記受信したデータの書込先アドレスが示す主記憶装置の格納領域に格納されているデータを保持しているキャッシュメモリ部に前記受信したデータを格納し、前記受信したデータに制御情報が付加されていないと判定部が判定した場合は、前記受信したデータを前記主記憶装置に格納する格納部とを有する通信装置と
を有することを特徴とする情報処理装置。
前記情報処理装置において、
前記キャッシュメモリ部は、自身が保持するデータと他のキャッシュメモリ部が保持するデータと前記主記憶装置が保持するデータとの関係を示す同一性情報を前記データと対応付けて記憶し、
前記演算処理部は、前記データを前記主記憶装置または自身のキャッシュメモリ部に格納する場合には、自身のキャッシュメモリ部が記憶する前記同一性情報に基づいて、自身のキャッシュメモリ部に格納されたデータと前記主記憶装置に格納されたデータとの同一性を保持し、受信したデータを前記主記憶装置または自身のキャッシュメモリ部に格納することを特徴とする請求項１記載の情報処理装置。
前記情報処理装置において、
前記演算処理装置はさらに、
前記複数の演算処理部が共有する共有キャッシュメモリ部を有し、
前記キャッシュメモリ部は、自身が保持するデータと他のキャッシュメモリ部が保持するデータと前記共有キャッシュメモリ部が保持するデータとの関係を示す第１同一性情報を前記データと対応付けて記憶し、
前記共有キャッシュメモリ部は、自身が保持するデータと前記主記憶装置が保持するデータとの関係を示す第２同一性情報を前記データと対応付けて記憶し、
前記演算処理部は、前記データを前記主記憶装置、または、前記自身のキャッシュメモリ部に格納する場合には、自身のキャッシュメモリ部が記憶する前記第１同一性情報と、前記共有キャッシュメモリ部が記憶する前記第２同一性情報とに基づいて、前記自身のキャッシュメモリ部に格納されたデータと前記共有キャッシュメモリ部に格納されたデータと前記主記憶装置に格納されたデータとの同一性を保持し、その後、受信したデータを前記主記憶装置、または、前記自身のキャッシュメモリ部に格納することを特徴とする請求項１記載の情報処理装置。
複数の情報処理装置を備える並列計算機システムを構成する情報処理装置において、
データを保持する主記憶装置と、
前記主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、前記主記憶装置又は前記キャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部を有する演算処理装置と、
前記キャッシュメモリ部への書き込みを制御する制御アドレスを保持するアドレス保持部を有し、他の情報処理装置から受信したデータの書込先アドレスが、前記アドレス保持部に保持された制御アドレスと一致する場合は、前記受信したデータを前記キャッシュメモリ部に格納し、他の情報処理装置から受信したデータの書込先アドレスが、前記アドレス保持部に保持された制御アドレスと一致しない場合には、前記受信したデータを前記主記憶装置に格納する通信装置と
を有し、
前記複数の演算処理部の各々は、待ち合わせるデータの書込先アドレスを前記制御アドレスとして前記アドレス保持部に保持させるとともに、前記複数の演算処理部のキャッシュメモリ部のうち前記待ち合わせるデータの書込先であるキャッシュメモリ部を識別する書込先キャッシュメモリ識別情報を、前記アドレス保持部に保持させる
ことを特徴とする情報処理装置。
前記情報処理装置において、
前記キャッシュメモリ部は、自身が保持するデータと他のキャッシュメモリ部が保持するデータと前記主記憶装置が保持するデータとの関係を示す同一性情報を前記データと対応付けて記憶し、
前記演算処理部は、前記データを前記主記憶装置、または、前記自身のキャッシュメモリ部に格納する場合には、自身のキャッシュメモリ部が記憶する前記同一性情報に基づいて、自身のキャッシュメモリ部に格納されたデータと前記主記憶装置に格納されたデータとの同一性を保持し、その後、受信したデータを前記主記憶装置、または、前記自身のキャッシュメモリ部に格納することを特徴とする請求項４記載の情報処理装置。
前記情報処理装置において、
前記演算処理装置はさらに、
前記複数の演算処理部が共有する共有キャッシュメモリ部を有し、
前記キャッシュメモリ部は、自身が保持するデータと他のキャッシュメモリ部が保持するデータと前記共有キャッシュメモリ部が保持するデータとの関係を示す第１同一性情報を前記データと対応付けて記憶し、
前記共有キャッシュメモリ部は、自身が保持するデータと前記主記憶装置が保持するデータとの関係を示す第２同一性情報を前記データと対応付けて記憶し、
前記演算処理部は、前記データを前記主記憶装置、または、前記自身のキャッシュメモリ部に格納する場合には、自身のキャッシュメモリ部が記憶する前記第１同一性情報と、前記共有キャッシュメモリ部が記憶する第２同一性情報とに基づいて、前記自身のキャッシュメモリ部に格納されたデータと前記共有キャッシュメモリ部に格納されたデータと前記主記憶装置に格納されたデータとの同一性を保持するとともに、受信したデータを前記主記憶装置、または、前記自身のキャッシュメモリ部に格納することを特徴とする請求項４記載の情報処理装置。
複数の情報処理装置を有する並列計算機システムであって、
前記情報処理装置は、
データを保持する主記憶装置と、
前記主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、前記主記憶装置又は前記キャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部を有する演算処理装置と、
他の情報処理装置の演算処理装置が待ち合わせているデータに、前記他の情報処理装置の演算処理装置が有するキャッシュメモリ部に書き込む旨の制御情報を付加したデータを前記他の情報処理装置に送信する送信部と、前記他の情報処理装置から受信したデータに、制御情報が付加されているか否かを判定する判定部と、受信したデータに制御情報が付加されていると前記判定部が判定した場合は、前記複数の演算処理部のキャッシュメモリ部のうち、前記受信したデータの書込先アドレスが示す主記憶装置の格納領域に格納されているデータを保持しているキャッシュメモリ部に前記受信したデータを格納し、前記受信したデータに制御情報が付加されていないと判定部が判定した場合は、前記受信したデータを前記主記憶装置に格納する格納部とを有する通信装置と
を有することを特徴とする並列計算機システム。
複数の情報処理装置を有する並列計算機システムであって、
前記情報処理装置は、
データを保持する主記憶装置と、
前記主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、前記主記憶装置又は前記キャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部を有する演算処理装置と、
前記キャッシュメモリ部への書き込みを制御する制御アドレスを保持するアドレス保持部を有し、他の情報処理装置から受信したデータの書込先アドレスが、前記アドレス保持部に保持された制御アドレスと一致する場合は、前記受信したデータを前記キャッシュメモリ部に格納し、他の情報処理装置から受信したデータの書込先アドレスが、前記アドレス保持部に保持された制御アドレスと一致しない場合には、前記受信したデータを前記主記憶装置に格納する通信装置と
を有し、
前記複数の演算処理部の各々は、待ち合わせるデータの書込先アドレスを前記制御アドレスとして前記アドレス保持部に保持させるとともに、前記複数の演算処理部のキャッシュメモリ部のうち前記待ち合わせるデータの書込先であるキャッシュメモリ部を識別する書込先キャッシュメモリ識別情報を、前記アドレス保持部に保持させる
ことを特徴とする並列計算機システム。
データを保持する主記憶装置と、前記主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、前記主記憶装置又は前記キャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部と、通信装置とを有する並列計算機システムに含まれる演算処理装置の制御方法であって、
前記通信装置が、他の情報処理装置の演算処理装置が待ち合わせているデータに、前記他の情報処理装置の演算処理装置が有するキャッシュメモリ部に書き込む旨の制御情報を付加したデータを前記他の情報処理装置に送信し、
前記通信装置が、前記他の情報処理装置から受信したデータに、制御情報が付加されているか否かを判定し、
前記通信装置が、受信したデータに制御情報が付加されていると判定した場合は、前記複数の演算処理部のキャッシュメモリ部のうち、前記受信したデータの書込先アドレスが示す主記憶装置の格納領域に格納されているデータを保持しているキャッシュメモリ部に前記受信したデータを格納し、前記受信したデータに制御情報が付加されていないと判定部が判定した場合は、前記受信したデータを前記主記憶装置に格納する
ことを特徴とする演算処理装置の制御方法。
データを保持する主記憶装置と、前記主記憶装置に保持されたデータの一部を保持するキャッシュメモリ部を有し、前記主記憶装置又は前記キャッシュメモリ部に保持されたデータを用いて演算を行う複数の演算処理部と、通信装置とを有する並列計算機システムに含まれる演算処理装置の制御方法であって、
前記複数の演算処理部の各々が、待ち合わせるデータの書込先アドレスを制御アドレスとして前記通信装置が有するアドレス保持部に保持させるとともに、前記複数の演算処理部のキャッシュメモリ部のうち前記待ち合わせるデータの書込先であるキャッシュメモリ部を識別する書込先キャッシュメモリ識別情報を、前記アドレス保持部に保持させ、
前記通信装置が、他の情報処理装置から受信したデータの書込先アドレスが、前記アドレス保持部に保持された制御アドレスと一致する場合は、前記受信したデータを前記キャッシュメモリ部に格納し、他の情報処理装置から受信したデータの書込先アドレスが、前記アドレス保持部に保持された制御アドレスと一致しない場合には、前記受信したデータを前記主記憶装置に格納する
ことを特徴とする演算処理装置の制御方法。