WO2012077400A1

WO2012077400A1 - マルチコアシステム、及びそのコアのデータ読み出し方法

Info

Publication number: WO2012077400A1
Application number: PCT/JP2011/072206
Authority: WO
Inventors: 彩南; 洋一三輪
Original assignee: インターナショナル・ビジネス・マシーンズ・コーポレーション
Priority date: 2010-12-09
Filing date: 2011-09-28
Publication date: 2012-06-14
Also published as: GB2499765A; GB201311211D0; DE112011104329T5; CN103370696A; CN103370696B; GB2499765B; US20120151152A1; US8918590B2

Abstract

コアによるメモリの新規なデータ読出しを具備するリングバス型マルチコアのシステムを提供する。 1つのコア（リクエスターコア）がメモリに存在するデータのＲｅａｄリクエストをするリングバス型マルチコアのシステムである。このシステムは、１つのメモリと、メモリをリングバスに接続するメインメモリコントローラと、リングバスに接続された複数のコアとを備え、コアは更にキャッシュ用インタフェース及びそのインタフェースを制御するキャッシュコントローラを含み、メインメモリコントローラは更に全てのコアのキャッシュのデータ保持の履歴を含む。リクエスターコアからメインメモリコントローラまでの所定の経路方向に流れるレクエストをリングバスに接続された各コアのキャッシュコントローラは、キャッシュ用インタフェースを介してリクエスト内容を覗くこと、所定の経路方向に接続されたコアのキャッシュが目的データを保持している場合、コアがリクエストを受取りリクエスターコアにデータを返すことを実行する。メインメモリコントローラは、経路方向に接続されたコアのキャッシュがデータを保持していない場合、各コアの履歴を参照する。所定の経路方向と逆経路方向のリングバスに接続されたコアがデータを保持している場合、コアのキャッシュに対してレクエストを送り、コアのキャッシュコントローラにキャッシュが保持するデータをリクエスターコアに送らせる。所定の経路方向と逆経路方向のリングバスに接続されたコアが該当データを保持していない場合、メモリからデータを読み出してリクエスターコアに送るステップとを実行する。本発明のコアシステムの特徴は、履歴が各コアについてメモリのデータの保持及び他のコアへの書出しフラグを含むことである。各コアのデータ読み出しは、メインメモリコントローラの負荷を軽減、及び全体のメモリアクセスの所要時間を短縮する。

Description

マルチコアシステム、及びそのコアのデータ読み出し方法

　本発明は、一つのメモリインタフェースを複数のＣＰＵコア（単にＣＰＵ、プロセッサ、又はコアとも言う)で共有するリングバス型マルチコアシステムにおけるコアのデータ読み出しに関する。

　一つのメモリインタフェースを複数コアで共有するリングバス型マルチコアＣＰＵにおいて、メインメモリへのアクセスは集中する。通常の動作では、各ＣＰＵコアがそれぞれにキャッシュを持ち、共有のメインメモリから実際に読み出す。１つのメインメモリから詠み出す代わりに　各ＣＰＵコアで保存されているキャッシュデータから読み出しを行う方法が考えられる。

　例えば、読み出し（Ｒｅａｄ）リクエストは、あるＣＰＵコア（このＣＰＵコアを「リクエスターコア」と呼ぶ）から出される。従来のマルチコア構成では、メインメモリコントローラがメインメモリから読み出す代わりに、他のＣＰＵコアへキャッシュの有無の問い合わせを行う。問い合わせを受けたＣＰＵコアは自分のキャッシュを検索する。

　マルチコアの動作環境では、いずれかのＣＰＵコアが、メインメモリの同じアドレスのデータ（アドレスデータと言う）をキャッシュに持ち合わせている場合が多い。この場合メインメモリコントローラが、キャッシュの内容をリクエスターコアに対して転送するよう命令を出すことによってデータが送られるという従来の方式がある。
しかし、この方法は各コアへの問い合わせを順番にする必要があるため　搭載されるコア数に比例して時間を要する。また、各ＣＰＵコアへの問い合わせのためメインメモリコントローラの負荷も高いという欠点がある。

　複数のＣＰＵコア構成において、それぞれのキャッシュが保持するデータの一致性（コヒーレンシ）を確保するためのコヒーレンスのためのスヌープ（Ｓｎｏｏｐｉｎｇ）について説明する。キャッシュメモリを備えたマルチプロセッサでは、複数のプロセッサ間で処理に使用されるデータの一致性（コヒーレンシ）を保つことが必要である。従来のプロセッサでは、データのコヒーレンシを保つためにバス・スヌープが多く採用されている。バス・スヌープとは、各プロセッサ間で共有されるメモリインターフェイスバス上のトランザクションを観察し、自身に割り当てられているキャッシュメモリ上にあるデータにかかるトランザクションが発生したか否かを検出する機能である。

　特定のプロセッサに割り当てられたキャッシュメモリ上にあるデータのトランザクションが発生した場合、そのプロセッサは、キャッシュメモリの該当するエントリを更新する。他の各プロセッサは、この更新をスヌープにより知り、自信のキャッシュに保存されているデータにdirtyのFlagを立てて使わないようにし、マルチプロセッサシステム全体としてデータを管理する。

　特許文献１は、マルチプロセッサシステムにおいて、プロセッサ間でデータのコヒーレンシを動作効率よく保つことができるキャッシュメモリを備えたプロセッサを提供する。しかし、特許文献１は、複数のプロセッサコアが単一のキャッシュを持つモデルなのであり、それぞれのプロセッサコアがそれぞれキャッシュを持つモデルとは異なる。

　特許文献２は、複数のプロセッサコアがそれぞれキャッシュを持ち、またそれぞれのプロセッサコアが持っているキャッシュデータを有効利用する技術を開示する。この技術は、あるプロセッサコアがメインメモリからデータを取りにいった時に、異なるプロセッサコアが同じメモリのデータを取りに行ったときの処理方法を示す。

特開２００６－２４４４６０号公報特開２００９－１７６１７９号公報

　ところで特許文献等は、スヌープ技術をアドレスデータのコヒーレンシの為に更新しるためである。しかしながら、リングバス状に接続された複数のコアＣＰＵコアの読み取り時において、各コアがバスのトランザクションの参照に利用されていない。つまり、従来では、リングバス状に接続された複数のＣＰＵコアのアドレスデータ読み取り時において、各コアがバスのトランザクションをスヌープすることは示していない。

　そこで、本発明の目的は、一つのメモリインタフェースを複数コアで共有するリングバス型マルチコアのシステム、及び各コアによるデータ読み出し方法を提供することである。

　上記の目的を達成する本発明は、一つのメモリインタフェースを複数コアで共有し、1つのコア（リクエスターコア）がメモリに存在するデータのＲｅａｄリクエストをする場合にリングバス型マルチコアある。このリングバス型マルチコアは、１つのメモリと、
　前記メモリをリングバスに接続するメインメモリコントローラと、リングバス状に接続された複数のコアとを備え、前記コアは更にキャッシュ用インタフェース及びそのインタフェースを制御又は管理するキャッシュコントローラを含み、前記リングバス状に接続された各コアの前記キャッシュコントローラは、
　（１）前記キャッシュ用インタフェースを介して前記リクエストのデータを覗くステップと、　
　（２）前記コアのキャッシュが前記データを保持している場合、前記コアが前記リクエストを受取り前記リクエスターコアに前記データを返すステップと、を実行し
　（３）前記コアのキャッシュが前記データを保持していない場合、前記メインメモリコントローラは、
前記メモリから前記データを読み出して前記リクエスターコアに送るステップとを実行する、ことを特徴とする。

　上記の目的を達成する本発明は、一つのメモリインタフェースを複数コアで共有し、1つのコア（リクエスターコア）がメモリに存在するデータのＲｅａｄリクエストをするリングバス型マルチコアである。このリングバス型マルチコアは、１つのメモリと、前記メモリをリングバスに接続するメインメモリコントローラと、リングバス状に接続された複数のコアとを備え、前記コアは更にキャッシュ用インタフェース及びそのインタフェースを制御するキャッシュコントローラを含み、前記メインメモリコントローラは更に全ての前記コアのキャッシュのデータ保持の履歴を含み、
リクエスターコアから前記メインメモリコントローラまでの所定の経路方向に流れる前記レクエストを前記リングバス状に接続された各コアの前記キャッシュコントローラは、
　（１）前記キャッシュ用インタフェースを介して前記リクエストのデータを覗くステップと、　
　（２）前記所定の経路方向に接続されたコアのキャッシュが前記データを保持している場合、前記コアが前記リクエストを受取り前記リクエスターコアに前記データを返すステップとを実行し
　（３）前記経路方向に接続されたコアのキャッシュが前記データを保持していない場合、前記メインメモリコントローラは、
　（ａ）前記各コアの履歴を参照し、
　（ｂ）前記所定の経路方向と逆経路方向のリングバス状に接続されたコアが該当データを保持している場合、前記コアに対して前記レクエストを送り、前記コアのキャッシュコントローラに前記キャッシュが保持するデータを前記リクエスターコアに送らせるステップと、
　（ｃ）前記所定の経路方向と逆経路方向のリングバスに接続されたコアが該当データを保持していない場合、前記メモリから前記データを読み出して前記リクエスターコアに送るステップとを実行することを特徴とする。

　このメモリアクセス装置の特徴は、前記履歴は、前記各コアについて前記メモリのアドレスのデータ（アドレス・データ）の保持のフラグ及び他のコアへの書出しフラグを含むことである。

　このメモリアクセス装置の特徴は、前記所定の経路方向は、前記キャッシュコントローラにより前記レクエスターコアからメインメモリコントローラまで２つの経路方向に接続されたコア数の多い経路方向を選択することである。

　このメモリアクセス装置の特徴は、前記キャッシュコントローラは、前記履歴を参照して前記データ保持フラグからリングバスのトラフィックを計算し、前記トラフィックの小さい経路方向を前記所定の経路方向として選択することである。

　このメモリアクセス装置の特徴は、前記メインメモリコントローラは、前記履歴を参照し前記所定の経路方向と逆経路に接続されたコアに前記データが存在する確認することである。

　更に上記の目的を達成する本発明は、１つのメモリインタフェースを複数コアで共有するリングバス型マルチコアＣＰＵにおいて、1つのコア（リクエスターコア）がメモリに存在するデータの読み出す方法である。この方法は、前記マルチコアＣＰＵは、１つのメモリと、前記メモリをリングバスに接続するメインメモリコントローラと、前記リングバス状に接続された複数のコアとを備え、前記コアは更にキャッシュ用インタフェースとそのインタフェースを制御又は管理するキャッシュコントローラを含み、前記メインメモリコントローラは更に全ての前記コアのキャッシュのデータ保持の履歴を含み、
　リクエスターコアから前記コントローラまでの所定の経路方向に流れる前記レクエストを前記リングバス状に接続された各コアの前記キャッシュコントローラは、
　（１）前記キャッシュ用インタフェースを介して前記リクエストのデータを覗くステップと、　
　（２）前記経路方向に接続されたコアのキャッシュが前記データを保持している場合、前記コアが前記リクエストを受取り前記リクエスターコアに前記データを返すステップと、を含み、
　（３）前記経路方向に接続されたコアのキャッシュが前記データを保持していない場合、前記メインメモリコントローラは、
（ａ）前記各コアの履歴を参照し、
　（ｂ）前記経路方向と逆経路方向のリングバス状に接続されたコアが該当データを保持している場合、前記コアに対して前記レクエストを送り、前記コアのキャッシュコントローラに前記キャッシュが保持するデータを前記リクエスターコアに送らせるステップと、（ｃ）前記経路方向と逆経路方向のリングバス状に接続されたコアが該当データを保持していない場合、前記メモリから前記データを読み出して前記リクエスターコアに送るステップとを含む、ことを特徴とする。

　以上の本発明によれば、一つのメインメモリを共有するリングバス型マルチコアにおいて、メインメモリコントローラの負荷を軽減、及び全体のメモリアクセスの所要時間を短縮できる。

一つのメモリインタフェースを複数コアで共有するリングバス型マルチコアの全体構成を示す。各ＣＰＵコアにおけるキャッシュ用インタフェース２、及びとメインメモリへＲｅａｄ／Ｗｒｉｔｅリクエスト用インタフェース３を示す。リングバス型マルチコアの全体構成において、データの読み出しトランザクションの流れをステップ（１）～（５）の矢印で示す。本発明のデータ読み出しのステップ（１）～（５）のフローチャートを示す。メインメモリコントローラが保持する各コアのアクセス履歴の内容を示す。

　メモリインタフェースを複数のＣＰＵコアで共有するリングバス型マルチコアにおけるデータ読み出しの本発明の実施形態（以下「実施例」という）を説明する。以下の実施例は、例示であり本発明の内容を限定するものではない。

　本発明のリングバス型マルチコアを搭載するチップは、次を備えるものとする。
１：各ＣＰＵコアにキャッシュ用インタフェースを搭載する。このインタフェースにより、メインメモリ側コントローラから、及び各コアから、他のコアのキャッシュの内容を直接読み出すことができる。キャッシュの内容は、メインメモリのアドレスに指定された固定長のデータ（アドレスデータと呼ぶ）である。
２：メインメモリコントローラは、すべてのＣＰＵコアキャッシュの内容を履歴（アドレス履歴という）として保持している。アドレス履歴は、図５に示されるように。各コアのキャッシュアドレスデータの保持の有無を保管している。

　図１は、一つのメモリインタフェースを複数コアで共有するリングバス型マルチコアの全体構成を示す。
１．メインメモリコントローラ７は、各コア６からのメモリアクセスの状況のログをアクセス履歴で管理する。アクセス履歴は、どのＣＰＵコアのキャッシュがどのアドレスデータを持っているか把握している
２．各ＣＰＵコア六は、メインメモリコントローラ７からキャッシュ１１の内容を読めるようキャッシュコントローラが搭載される。　　

　あるＣＰＵコアがリングバスを通して、メインメモリコントローラに特定のアドレスデータの読み出しリクエストを出し。このＣＰＵコアをリクエスターコアと呼ぶ。メインメモリコントローラ７までのリングバス上に接続されている各コアのキャッシュコントローラ１１は、流れてくる読み出しリクエストの内容を覗く。各コアは、自分のキャッシュ１１に該当データを持っていればそこでリクエストを拾いリクエスターコアへデータを返す。

　まず、メインメモリ１０までの道のり（第１の経路）に該当するデータを持っているＣＰＵコア６が無い場合がある。この場合は、メインメモリコントローラ７がリクエストを受け各コアのアクセス履歴８を参照する。次にリクエストが流れてきた方向とは逆のリング上（第２の経路）に接続されているＣＰＵコア６が持っている場合がある。その場合には、メインモリ１０ではなくアドレスデータを持つＣＰＵコア６に対してキャッシュ１１の読み出しリクエストを投げる。

　第１の経路では、キャッシュコントローラは、キャッシュ用インタフェース２を介してＣＰＵコアのキャッシュ１１からアドレスデータを送り出す。このコントローラの覗きにより、あたかもリクエスターコア６がアドレスデータを持つコアへ読み出しリクエストを出しているように見せかけている。この場合メインメモリコントローラ７を介さず、読み出しアドレスデータをリクエスターコアに送ることができる。

　第２の経路では、メインメモリコントローラは、リクエスターコアに成りすまし、直接各コアへのキャッシュへ読み出しリクエストを出す。各ＣＰＵコア（リクエスターコアも、キャッシュを持っていて読み出される方のコアも）には余分な負荷はかからない。
本発明の方法はメインメモリコントローラの負荷が減るという点（第１の経路でのメインメモリ負荷低減効果）、及びコア全体でのメモリアクセス所要時間を減らせるという点（第２の経路での各コア負荷低減効果）で有効である。

　図２は、各ＣＰＵコアにおけるキャッシュ用インタフェース２、及びとメインメモリへＲｅａｄ／Ｗｒｉｔｅリクエスト用インタフェース３を示す。
本アイディアはチップ内にＣＰＵのコアを複数搭載し、メインメモリコントローラを通して　メモリが接続される構成を元に考えている。各ＣＰＵコアとメインメモリはコヒーレンシを持つリングバスで接続される。各ＣＰＵコアにはキャッシュ用インタフェース２と、ＣＰＵコアがメインメモリへアクセスするインタフェース３が搭載される。なお、２つのインタフェース２及び３は必ずしも区別して設ける必要はなく、例えばインタフェース３により２つのインタフェースを兼用させてもよい。リングバスのトラックをＳｎｏｏｐすることと、各コアがメインメモリにデータの読み書きリクエストすることとのインタフェースを区別して各処理の遅延を回避できる。

　図３は、リングバス型マルチコアの全体構成において、データの読み出しトランザクションの流れの順番をステップ（１）～（５）の矢印で指示する。また、図４は、本発明の典型実施例として、データ読み出しのステップ（１）～（５）のフローチャートを示す。

　（１）：ＣＰＵコアＸが、メインメモリコントローラへＲｅａｄコマンドを投げる。第１の経路のとして、近い方のバスを選ぶこととする。この場合、メインメモリコントローラまでの距離として、例えば、リクエスターコアのキャッシュコントローラにより、近い方、遠い方、どちらのバスを選ぶかは混雑さなどの要素も含めた上で決定される。
・近い方の距離：より少ないＣＰＵコアをメインメモリコントローラに行き着くまでに経由することになる。
・遠い方の距離：より多いＣＰＵコアを経由することでより多くのＣＰＵコアにＳｎｏｏｐされるためヒットする確立はあがる。

　（２）：ＣＰＵコアＹ、ＣＰＵコアＺはアクセスをスヌープしている。　
もし該当データを自分が持っている場合はリクエストを自分が受信し、データをＣＰＵコアＸに返す。その後自分が処理をしたというフラグをつけて、リクエストの内容をメインメモリコントローラへ送る。受信後メインメモリコントローラはキャッシュのアクセス履歴をＵｐｄａｔｅする。例えばＣＰＵコアＺが持っているとした場合、ＣＰＵコアＺがＣＰＵＸへデータを返す。

　（３）：もしＣＰＵコアＹ、ＣＰＵコアＺがリクエストされている該当データを持っていない場合には、メインメモリコントローラはリクエストを受ける。メインメモリコントローラはアクセス履歴を参照する。各ＣＰＵコアのメモリアクセスログを参照し逆側のバス上（第２の経路）にあるＣＰＵコアＡ～Ｗが該当アドレスデータをキャッシュにもっていないか確認する。

　（４）：アクセス履歴に例えばＣＰＵコアＢのキャッシュに該当データがある場合である。メインメモリコントローラは、ＣＰＵコアＸからのＲｅａｄリクエストの代わりにＣＰＵコアＢのキャッシュコントローラにＲｅａｄコマンドを送る。ＣＰＵコアＢのキャッシュ用インタフェースからみた際には、ＣＰＵコアＸからの読み出し（Ｒｅａｄ）リクエストを直接受けたように見える。

　（５）：ＣＰＵコアＢのキャッシュコントローラは、該当アドレスデータをＣＰＵコアＸに対して送る。ＣＰＵコアＸは、メインメモリコントローラへ出したＲｅａｄコマンドに対するデータとしてＣＰＵコアＢから情報を受け取ることになる。　

　図５は、メインメモリコントローラが保持する各コアのアクセス履歴の内容を示す。この履歴は、メインメモリコントローラにより保持される。各コアＡ～Ｚがメインメモリのアドレスのデータ（アドレスデータ）をキャシュに保持しているかを記録する。アドレスデータは固定長が一般的である。書出しフラグは、Ｙの時はリクエスターコアＸに要求データを書き出したことを意味する。この時コアＢのキャッシュ用インタフェースはリングバスのトランザクションをスヌープして、コアＸのアドレスデータを自分が保持していることを確認する。コアＢが直接コアＸのＲｅａｄ要求に応えることにより、メインメモリコントローラの介在を省略できる点で読み取りパフォーマンスの向上が図られる。コアＢがリクエスターコアＸにデータを送る処理を完了後に、メインメモリコントローラはアクセス履歴を更新する。

　図４のステップ３において、メインメモリコントローラは、逆回りのバスのコアＡ～Ｗの何れかのキャッシュのどれかが、要求データを保持しているかをアクセス履歴テーブルにおいて確認する。アクセス履歴テーブルの参照により、メインメモリコントローラは、第２の経路の途中においてコアＢのキャッシュがアドレスデータ０１を保持していることを早く確認できる。コントローラは、コアＢにＲｅａｄ要求を送りＸにデータを送る命令を送信する。

　本発明の特長は次の通りである。まず、各ＣＰＵコアではなく、各キャッシュ自体へ直接読み出しができることで各ＣＰＵへの負荷をかけない。また、メインメモリへのバスの間に各コアがスヌープし、直接返すことでリングバス上を流れるトランザクションを省き混雑を回避することにもつながる。更に、メインメモリコントローラが他コアのキャッシュへ読み出しを行う際に、その回答が直接リクエスターコアに渡されるためメインメモリコントローラを介した際にもトランザクション数を減らすことができる。つまり、メインメモリコントローラ側　が一旦各ＣＰＵコアキャッシュから読み出しを行い　データを受けとった後　読み出しＣＰＵへ返す方式に比べ　トランザクショション数は少ない。

　本発明のマルチコア化したＣＰＵのシステムにおいて　アクセスが集中すると思われるメインメモリコントローラへの混雑を回避できる。ＣＰＵコアの数が多いほど本発明の効果が高まると考えられる。例えばＰｏｗｅｒＰＣのアーキテクチャとして１２８コアなどのＣＰＵ構想がマルチコアＣＰＵとして提案されている。本発明によれば、特に数多いコア数のマルチコアのアーキテクチャにおいて効果を発揮する。

１…キャッシュ用インタフェース
２…メインメモリへのＷｒｉｔｅ／Ｒｅａｄ用インタフェース
５…リングバス、
６…ＣＰＵコア、
７…メインメモリコントローラ、
８…アクセス履歴、
９…ロジック、
１０…メインメモリ（実メモリ）、
１１…キャッシュ又はキャッシュコントローラ、

Claims

　１つのコア（リクエスターコア）がメモリに存在するデータの読み出し要求をするマルチコアシステムであって、
　１つのメモリと、
　前記メモリをリングバスに接続するメインメモリコントローラと、
　リングバスに接続された複数のコアとを備え、
　前記コアは更にキャッシュ用インタフェース及びそのインタフェースを制御するキャッシュコントローラを含み、
　前記リングバスに接続された各コアの前記キャッシュコントローラは、
　　前記キャッシュ用インタフェースを介して前記要求のデータを覗くステップと、　
　　前記コアのキャッシュが前記データを保持している場合、前記コアが前記リクエストを受取り前記リクエスターコアに前記データを返すステップと、を実行し
　　前記コアのキャッシュが前記データを保持していない場合、前記メインメモリコントローラは、前記メモリから前記データを読み出して前記リクエスターコアに送るステップとを実行する、マルチコアＣＰＵのシステム。
　１つの前記コア（リクエスターコア）が前記メモリに存在するデータの読出し要求をするマルチコアシステムであって、
　１つのメモリと、
　前記メモリをリングバスに接続するメインメモリコントローラと、
　リングバスに接続された複数のコアとを備え、
　前記コアは更にキャッシュ用インタフェース及びそのインタフェースを制御するキャッシュコントローラを含み、
　前記メインメモリコントローラは更に全ての前記コアのキャッシュの履歴を含み、
　リクエスターコアから前記メインメモリコントローラまでの所定の経路方向に流れる前記レクエストを前記リングバスに接続された各コアの前記キャッシュコントローラは、
　　前記キャッシュ用インタフェースを介して前記要求のデータを覗くステップと、　
　　前記所定の経路方向に接続されたコアのキャッシュが前記データを保持している場合、前記コアが前記リクエストを受取り前記リクエスターコアに前記データを返すステップと、を実行し
前記経路方向に接続されたコアのキャッシュが前記データを保持していない場合、前記メインメモリコントローラは、
　　　前記各コアの履歴を参照し、
　　　前記所定の経路方向と逆経路方向のリングバスに接続されたコアが該当データを保持している場合、前記コアのキャッシュに対して前記レクエストを送り、前記コアのキャッシュコントローラに前記キャッシュが保持するデータを前記リクエスターコアに送らせるステップと、
　　　前記所定の経路方向と逆経路方向のリングバスに接続されたコアが該当データを保持していない場合、前記メモリから前記データを読み出して前記リクエスターコアに送るステップとを実行する、マルチコアシステム。
　前記履歴は、前記各コアについて前記メモリのアドレスのデータの保持のフラグ及び他のコアへの書出しフラグを含む請求項２に記載のマルチコアシステム。
　前記所定の経路方向は、前記キャッシュコントローラにより前記レクエスターコアからメインメモリコントローラまで２つの経路方向に接続されたコア数の多い経路を選択する請求項３に記載のマルチコアシステム。
　前記キャッシュコントローラは、前記履歴を参照して前記データ保持フラグからリングバスのトラフィックを計算し、前記トラフィックの小さい経路方向を前記所定の経路方向として選択する請求項４に記載のマルチコアシステム。
　前記メインメモリコントローラは、前記履歴を参照し前記所定の経路方向と逆経路に接続されたコアに前記データが存在する確認する請求項５に記載のマルチコアシステム。
　リングバス型マルチコアＣＰＵにおいて1つのコア（リクエスターコア）がメモリに存在するデータの読出す方法であって、
　前記マルチコアＣＰＵは、１つのメモリと、前記メモリをリングバスに接続するメインメモリコントローラと、前記リングバスに接続された複数のコアとを備え、
　前記コアは更にキャッシュ用インタフェースとそのインタフェースを制御するキャッシュコントローラを含み、前記メインメモリコントローラは更に全ての前記コアの保持データの履歴を含み、
　リクエスターコアから前記コントローラまでの所定の経路方向に流れる前記レクエストを前記リングバスに接続された各コアの前記キャッシュコントローラは、
前記キャッシュ用インタフェースを介して読出し要求のデータを覗くステップと、
前記経路方向に接続されたコアのキャッシュが前記データを保持している場合、前記コアが前記を受取り前記リクエスターコアに前記データを返すステップと、を含み、
前記経路方向に接続されたコアのキャッシュが前記データを保持していない場合、前記メインメモリコントローラは、
前記各コアの履歴を参照し、
　　前記経路方向と逆経路方向のリングバスに接続されたコアが該当データを保持している場合、前記コアに対して前記レクエストを送り、前記コアのキャッシュコントローラに前記キャッシュが保持するデータを前記リクエスターコアに送らせるステップと、
　　前記経路方向と逆経路方向のリングバスに接続されたコアが該当データを保持していない場合、前記メモリから前記データを読み出して前記リクエスターコアに送るステップとを含む、データの読み出す方法。