JP2008512772A

JP2008512772A - キャッシュ競合の解決

Info

Publication number: JP2008512772A
Application number: JP2007531199A
Authority: JP
Inventors: ギルバート，ジェフリー; ツァイ，ジョン−ニン; リュー，イェン−チェン; シストラ，クリシュナカント
Original assignee: インテルコーポレイション
Priority date: 2004-09-09
Filing date: 2005-08-26
Publication date: 2008-04-24
Also published as: JP5714733B2; CN100498739C; CN101425043A; CN101425043B; CN101425042B; WO2006031414A2; WO2006031414A3; JP2014089760A; CN101425042A; US9727468B2; CN101010670A; US20170337131A1; JP5535991B2; US10078592B2; DE112005002180T5; JP2011227921A; US20060053257A1

Abstract

マイクロプロセッサ内及び／又はコンピュータ・システム内のキャッシュ競合の防止。特に、本発明の実施例は、特定のキャッシュ又はキャッシュ群へいくつかのアクセスを行い得るプロセッサ内及び／又はコンピュータ・システム内のキャッシュ・アクセス競合を管理するための手法に関する。

Description

本発明の実施例は、マイクロプロセッサ及びマイクロプロセッサ・システムに関する。特に、本発明の実施例は、同じキャッシュ又はキャッシュ群へのいくつかのアクセスが生じるプロセッサ又はコンピュータ・システム内のキャッシュ・アクセス競合の解決に関する。

従来技術のプロセッサ及びコンピュータ・システムは、同時に管理可能な特定のキャッシュ又はキャッシュ群へのアクセスの数において制限され得る。この課題に対処するのに用いられる従来技術手法の１つは、1つ又は複数のプロセッサのコア特有のキャッシュ（レベル１（L1）キャッシュなど）のキャッシュ・エントリにキャッシュ・エントリが対応する包含的なキャッシュ構造を用いることである。すなわち、従来技術のマルチコア・プロセッサ、及び／又はマルチプロセッサ・コンピュータ・システムは、共有された包含的なキャッシュ構造（最終レベル・キャッシュ（LLC）など。包含的なキャッシュ構造が対応するプロセッサ・コア又はエージェントのキャッシュ・エントリの全てを含んでいる）にキャッシュ・アクセスの一部を単に導くことによってコア・キャッシュ内のキャッシュ・アクセス競合を削減しようとしてきた。しかし、マルチコア・プロセッサ内のコアからのキャッシュ・アクセスの場合、コアは通常、それ自身のキャッシュからまずデータをアクセスし、次いで、共有キャッシュに頼ろうとする。共有された包含的なキャッシュ構造は、過剰なキャッシュ・アクセスからコア・キャッシュを、よって、他のエージェントからバス・トラフィックを、コアのキャッシュの代わりに包含的なキャッシュから前述のエージェントに要求データを供給することによって遮蔽するので、場合によっては「キャッシュ・フィルタ」と呼ばれる。

種々のエージェントからのキャッシュ要求を処理するためにキャッシュ構造（LLCなど）を用いる従来技術手法は、例えば、特定のプロセッサ・コアによってデータが排他的に所有又は修正されない場合、プロセッサ・コアのキャッシュに頼ることなく必要なデータを要求エージェントが得ることを可能にする一助となる。エージェント（プロセッサやプロセッサ・コアなど）が、要求エージェントがアクセスしようとしている、そのキャッシュのキャッシュ線を所有している範囲で、キャッシュ構造（LLCなど）によって、要求エージェントが、所有しているエージェントがデータを共有するのを待つのではなく、要求しているデータを得ることが可能になる。

しかし、LLCを用いてキャッシュ要求を処理する場合、他の競合が生じ得る。例えば、図１は、アクセスされた線のLLCからの立ち退きの間にLLCの同じキャッシュ線をアクセスしようとする２つのコアを示す。特に、コア１が新たなデータのライトバックを起動させている間、コア０は、コア１のキャッシュ内の線への（LLCスヌープを介した）コア・キャッシュ要求を、その線がLLCから立ち退かされている時点とほぼ同時点で起動させている。この場合、コア0は、コア１からのライトバックが行われる前にコア０の要求が行われた場合、誤ったデータをLLCから取り出し得る。特定の場合、コア０のコア要求を満たすために、スヌープをLLCによってコア１のキャッシュに行う必要があり得る（「クロス・スヌープ」）。これによって、コア０の要求と、コア１への、LLCのクロス・スヌープと、LLCの立ち退きと、LLCへの、更新データのコア１のライトバックとの間で４重競合が生じる。

図１に表した従来技術の問題点は、プロセッサ・コアやその他のバス・エージェントの数がシステムにおいて増加するにつれ、悪化する。例えば、図１に表す競合は、図１に示す２つのコアの代わりに４つのコアを含むマルチコア・プロセッサにおいては倍増し得る。同様に、プロセッサ数がコンピュータ・システムにおいて増加するにつれ、何れかの特定のコア・キャッシュへのアクセスの数も増加する。それによって、ＬＬＣ立ち退きの間に生じ得る競合の数が増加する。

キャッシュ競合（図１に表したキャッシュ競合など）は、プロセッサ性能に不利な影響を与え得る。要求エージェントは、LLC立ち退き及び対応するライトバックの完了を待つか、又は競合の結果、誤ったデータの取り出しを検出し、そうした取り出しから回復するからである。よって、特定のキャッシュ構造にアクセスすることができるエージェントの数は、従来技術のプロセッサ及び／又はコンピュータ・システムにおいて制限され得る。

本発明の実施例は、マイクロプロセッサ内及び／又はコンピュータ・システム内のキャッシュ・アーキテクチャに関する。特に、本発明の実施例は、特定のキャッシュ又はキャッシュ群へいくつかのアクセスを行い得るプロセッサ内及び／又はコンピュータ・システム内のキャッシュ・アクセス競合を管理するための手法に関する。

本発明は、限定としてではなく例として添付図面の図に示す。同様な参照符号は同様な構成要素を示す。

本明細書には、同じキャッシュ線をいくつかの要求エージェントがアクセスしようとする場合の競合の解決及び回避をはじめとする、マルチプロセッサ内及び／又はマルチコア・コンピュータ・システム内の従来技術のキャッシュ手法に関連した課題を解決するための、本発明の種々の実施例を記載している。本発明の少なくとも１つの実施例では、関連したキャッシュ（レベル１（L1）キャッシュなど）を有するいくつかのプロセッサ又はプロセッサ・コアとともに、包含的なキャッシュ構造（最終レベル・キャッシュ（LLC）など）を用いる。包含的なキャッシュ構造（LLCなど）は、包含的なキャッシュ構造が対応する他のキャッシュと少なくとも同じデータを含む構造を含む。包含的なキャッシュ構造と、対応するコア及び／プロセッサ・キャッシュとの間のコヒーレンスを維持することによって、対応するコア／プロセッサ・キャッシュへのアクセスは、包含的なキャッシュによって処理される。それによって、対応するコア／プロセッサへのバス・トラフィックが削減され、コア／プロセッサに余裕が与えられる。

包含的なキャッシュ構造が用いられる本発明の実施例は、包含的なキャッシュ構造内の同じキャッシュ線をいくつかのプロセッサ及び／又はプロセッサ・コアがアクセスしようとする場合に生じ得る競合の数及び／又はタイプを削減又は軽減することも可能である。例えば、本発明の少なくとも１つの実施例は、コア・キャッシュとして立ち退かされており、立ち退かされており、かつ同じ組へのLLCへの別のフィルの結果である、包含的キャッシュ構造内（LLC内など）の線への、マルチプロセッサ・システム内のプロセッサからの、かつ／又はマルチコア・プロセッサ内のコアからのキャッシュ要求、及び線が対応する、立ち退かされているコアからのライトバックによってもたらされるキャッシュ競合を軽減する。更に、少なくとも１つの実施例は、フィルされている、共有された包含的キャッシュ内（LLC内など）の線への、マルチプロセッサ・システム内のプロセッサからの、かつ／又はマルチコア・プロセッサ内のコアからのキャッシュ要求、及び結果として生じる、共有された包含的キャッシュの線の立ち退きによってもたらされるキャッシュ競合を軽減する。他の実施例は、種々の要求エージェントから、立ち退かされた包含的なキャッシュ線への複数アクセスから生じる他の競合を解決することができる。

図２は、立ち退かされた包含的なキャッシュ線へのいくつかのアクセス間の競合を解決する、本発明の一実施例によるキャッシュ・ブリッジ・アーキテクチャを示す。特に、図２のキャッシュ・ブリッジ・アーキテクチャは、コンピュータ・システム相互接続インタフェース２０５（フロントサイド・バス・インタフェースやポイントツーポイント・インタフェースなど）を介して外部エージェントによってアクセスすることができるLLC２０１を示す。更に、LLCは、コア0（２１０）及び／又はコア１（２１５）によってコア相互接続インタフェース２１３及び２１７それぞれを介してアクセスすることができる。キャッシュ・ブリッジ・スケジューリング及びオーダリング（CBSO）ロジック２２０は、本発明の少なくとも１つの実施例において、外部エージェント及び／又はコア・エージェントによって行われる、LLCへのアクセスに対応するコマンド、アドレス、及び／又はデータを記憶するのに用いることが可能な内部要求キュー２２５及び外部要求キュー２３０それぞれを用いて、外部エージェント及びコア・エージェントからのLLCへのアクセスを管理する。

本発明の少なくとも１つの実施例では、CBSOロジックを用いて、LLCルックアップ、LLCキャッシュ立ち退き、LLC線のフィル、及びクロス・スヌープ、のトランザクションをはじめとするいくつかのトランザクションから生じる競合を管理し、解決することができる。

LLCルックアップには通常、所望のキャッシュ線を読み取るか、そうしたキャッシュ線の所有権を得るためにLLCにアクセスするコアからの読み取り、及び所有権のための読み取りのトランザクションが関係する。LLCルックアップがミスをもたらした場合、コンピュ―タ・システム相互接続インタフェースに対応する外部要求キューに要求を割り当てることができる。しかし、LLCルックアップがヒットをもたらしており、対応するLLC線が、別のコア又はプロセッサによって排他的に所有されるものでない場合、要求を完了し、要求しているコアにデータを戻すことが可能である。要求エージェントからの特定のコアへのアクセスは、LLCの要求線を別のコアが排他的に所有しているか否かのレコードを保持することによって削減することができる。レコードは、プロセッサ内のコアの数に対応する、レジスタ内のビット数であり得る。各ビットは、対応するコア／プロセッサが、要求LLC線を所有しているか否かを示している。しかし、レコードは他のやり方で実現することができる。

LLC立ち退きには、LLCキャッシュ線を入れ替えるために1つ又は複数のコア若しくはプロセッサへのスヌープ（「バック・スヌープ」）が必要であり得る。バック・スヌープが複数のコア又はプロセッサに送出された場合、バック・スヌープを1つ又は複数のコア／プロセッサが受信しない状態が存在し得る。よって、協業が生じ得る。

LLCへのフィルは通常、元の要求がLLCをミスした場合に、コア又はプロセッサがデータをLLCに書き込むことによって生じる。メモリ・エージェント（ダイ上のメモリ・コントローラ又はダイ外のメモリ・コントローラであり得る）から、新たなデータ及びコヒーレンス状態を得ることが可能である。要求しているコアに新たなデータ及びコヒーレンス状態を戻した後、この線はLLCにフィルインされる。フィルが行われているキャッシュ組が満杯の場合、LLCからの立ち退きが行われる。この立ち退きは、LLCにおける容量の制約によってもたらされるので「容量立ち退き」と、場合によっては呼ばれている。フィルは、フィルする対象のLLC線が対応するコアに応じて、マルチコア・プロセッサ内のコアからのものであり得る。更に、本発明の一実施例では、フィルされたLLC線は、いくつかの所有状態（共有、排他的や修正など）にあり得る。特定のマルチコア・プロセッサでは、LLCコヒーレンシ状態は、マルチコア・プロセッサの外部のエージェントへキャッシュ線の状態を示すのに対してコアにキャッシュ線の状態を示すための拡張状態を含み得る。例えば、特定の実施例では、LLCコヒーレンシ状態ESは、フィルされたLLC線が共有されている旨を他のコアに示す一方で、フィルされたLLC線が特定のコアによって排他的に所有されている旨を、マルチコア・プロセッサの外部のエージェントに示す。同様に、MSコヒーレンシ状態は、LLC線が共有されている旨をコアに示す一方で、LLC線が修正されていることを外部エージェントに示し得る。

LLC線が別のコア又はエージェントによって所有されていることを、コアや他のエージェントからの所有要求が判定する場合に、LLCへのクロス・スヌープ・トランザクションが通常、生じる。この場合、所有を要求するコア／エージェントは、線を所有しているコア／エージェントへのスヌープ（「クロス・スヌープ」）を行う。これにより、用いられる特定のコヒーレンシ・プロトコルに応じて線状態が「排他的」から「無効」又は「共有」に変動し得る。

前述のトランザクション（バック・スヌープ、クロス・スヌープ、読み取り及び立ち退き）の何れかがほぼ同時に起こる場合、プロセッサ及び／又はシステムの性能に不利な影響を及ぼす競合が生じ得る。よって、本発明の一実施例は、前述のトランザクションのうちの２つの間の競合を防止するか、又は少なくとも管理する（「２重競合」管理）。更に、本発明の別の実施例は、前述のトランザクションのうちの３つの間の競合を防止するか、又は少なくとも管理する（「３重競合」管理）。

本発明の一実施例では、CBSOロジックは、LLCから立ち退かされている線へのコア・エージェント又は外部バス・エージェントからのLLCへのライトバックからもたらされる競合を管理又は防止する。立ち退かされている同じLLC線にライトバックが行われている場合、ライトバックを行っているコア又はエージェントとは別のコア又はエージェントからバック・スヌープがデータを取り出していれば、立ち退きから生じるバック・スヌープとライトバック処理との間で競合が生じ得る。競合によって、誤ったデータが、立ち退かされたLLC線に書き込まれることになり得る。

別の実施例では、CBSOロジックは、図２のコンピュータ・システム・インタフェース上のエージェントからのLLC線へのスヌープ、コアからのLLC線へのライトバック、及びラインをフィルするためのLLCバック・スヌープから生じる競合を管理又は防止する。バック・スヌープ及びライトバックが行われている同じLLC線に外部スヌープが行われる場合、外部エージェントは、誤ったデータを取り出しかねない。LLC線は、コアからのライトバック、又はバック・スヌープから生じるコアからのデータによってフィルすることが可能であるからである。

図３は、本発明の一実施例による、通常のクロス・スヌープ・トランザクションに関連した処理を示す状態図である。アイドル状態３０１から、LLCへの読み取りトランザクション（マルチコア・プロセッサ内のコアからなど）によって、状態図が保留状態３０３に遷移する。要求エージェントに線を付与することが可能になった時点で状態はルックアップ状態３０５に変わる。ルックアップ状態の間、LLCは、要求された線のコヒーレンシ状態（別のコアが現在、要求された線を所有している旨を示し得る）を、要求しているコアに戻す。LLC内の要求された線を別のコアが所有している場合、状態３０８で、別のコア又はエージェントへのLLCからのクロス・スヌープが起動される。肯定応答が、クロス・スヌープを起動させる対象のコアから送出された後、状態３１０で、クロス・スヌープが発行される。クロス・スヌープ・データがコアから取り出された後、状態３１３で、クロス・スヌープは完了し、状態３１５で、クロス・スヌープ・データは要求しているコアに供給される。状態３２０で、LLCはクロス・スヌープ・データによって更新され、アイドル状態に戻される。

状態３０８乃至３２０の間、クロス・スヌープは、要求が対応するLLCの立ち退きから生じる処理との競合を受け得る。クロス・スヌープと競合し得る、LLC立ち退きから生じる処理の１つは、立ち退かされたLLC線が対応するコアからのライトバックである。LLC内の立ち退かされた線にライトバックをそこから行うそのコアへのクロス・スヌープを読み取り要求がもたらす場合に別の競合が生じ得る。クロス・スヌープの前にライトバックが行われた場合、間違ったデータが、要求しているコア又はエージェントに戻され得る。更に、立ち退き、クロス・スヌープ及びライトバックと同じLLCアドレスを伴う外部スヌープがLLCにほぼ同時に行われる場合に競合が生じ得る。

本発明の一実施例では、LLCにおいて要求が行われる対象の線のコヒーレンス情報を一時的な記憶場所に複製し、後のトランザクション（「アトミック」）に線が無効に見えるように、対応するLLC線を無効にし、それによって、要求から生じるクロス・スヌープとトランザクションが競合することになり得る、LLC線の立ち退きがないようにすることによって、前述の競合がないようにすることが可能である。読み取り要求を受信した後にLLC線コヒーレンシ情報を記憶することによって、結果として生じるクロス・スヌープによって、最新のデータを要求者に供給することが保証される。更に、LLC線をアトミックに無効にすることによって、LLCの立ち退きが、後のトランザクションによって回避され、したがって、LLC線への競合LLC立ち退きは何ら生じないことになる。

要求されたデータを要求者に供給した後、データ及びコヒーレンシ情報を、無効化LLC線に記憶して包含を維持することができる。別の実施例では、一機構を用いて、LLCへのアクセスがクロス・スヌープをもたらさないようにし得るトランザクションを何れも取り消すことができる。この状態は、例えば、LLC線への読み取りの後にLLC線へのライトバックが行われる場合に生じ得る。

図４は、本発明の一実施例に関係した処理を示す流れ図である。処理４０１では、コア・キャッシュ線への読み取り要求が検出され、対応するコア・キャッシュへの読み取り要求から「ミス」が生じた場合に、それに応じて、対応するLLC線がアクセスされる。処理４０５では、LLC線のコヒーレンシ状態情報が保存される。一実施例では、コヒーレンシ状態データが、図２のCBSOロジック内のレジスタに保存される。他の実施例では、コヒーレンシ情報は、メモリ又は特定の他の記憶構造に保存することができる。コヒーレンシ状態情報が保存された後、要求がクロス・スヌープをもたらすことになり、CBSOロジックによって取り消し信号が何ら検出されなかった場合に、LLC線が無効にされていると後のトランザクションがみなすことになるようにLLC内の対応する線が処理４１０でアトミックに無効にされる。処理４１５で、適切なコア又はプロセッサへのLLCによるクロス・スヌープによって、要求されたデータがコア又はプロセッサから、要求エージェントに戻されることになる。

本発明の一実施例では、図４に示す処理の少なくとも一部は、図２のCBSOロジックによって行われる。別の実施例では、処理は、他の手段（ソフトウェアなど）、又は、図２のキャッシュ・ブリッジ・アーキテクチャ内の特定の他のロジックによって行うことができる。

図５は、本発明の一実施例を用い得るフロントサイドバス（FSB）コンピュータ・システムを示す。プロセッサ５０５が、レベル１（L1）キャッシュ・メモリ５１０及び主メモリ５１５からデータをアクセスする。本発明の他の実施例では、キャッシュ・メモリは、コンピュータ・システム・メモリ階層内のレベル２（L２）キャッシュや他のメモリであり得る。更に、特定の実施例では、図５のコンピュータ・システムは、コヒーレンシ・データがL1キャッシュとL2キャッシュとの間で共有される包含的なキャッシュ階層を備えるL1キャッシュ及びL2キャッシュを含み得る。

図５のプロセッサ内には、本発明の一実施例５０６を示す。特定の実施例では、図５のプロセッサはマルチコア・プロセッサであり得る。

種々のメモリ・ソース（動的ランダムアクセス・メモリ（DRAM）、ハード・ディスク・ドライブ（HDD）５２０など）、又は種々の記憶装置及び技術を含む、ネットワーク・インタフェース５３０を介してコンピュータ・システムから離れた場所にあるメモリ・ソースにおいて実現することができる。キャッシュ・メモリは、プロセッサ内、又はプロセッサ近接（プロセッサの局所バス５０７上）にあり得る。更に、キャッシュ・メモリは、速度が比較的高いメモリ・セル（６トランジスタ型（６Ｔ）のセルなど）や、アクセス速度がほぼ等しいか、又は更に高い他のメモリ・セルを含み得る。

図５のコンピュータ・システムは、ポイントツ―ポイント・ネットワーク（PtP）上の各エージェントに特化したバス信号を介して通信するバス・エージェント（マイクロプロセッサなど）から成るPtPであり得る。記憶処理をバス・エージェント間で迅速に促進することが可能であるように、本発明の少なくとも一実施例５０６が、各バス・エージェント内にあるか、又は各バス・エージェントに少なくとも関係付けられている。

図６は、ポイントツーポイント（PtP）構成に配置されたコンピュータ・システムを示す。特に、図６は、プロセッサ、メモリ、及び入出力装置が、いくつかのポイントツーポイント・インタフェースによって相互接続されるシステムを示す。

図６のシステムは、いくつかのプロセッサ（明瞭にするためにこのうち、２つのプロセッサ（プロセッサ６７０、６８０）のみを示している）も含み得る。プロセッサ６７０、６８０はそれぞれ、メモリ６２、６４と接続するための局所メモリ・コントローラ・ハブ（MCH）６７２、６８２を含む。プロセッサ６７０、６８０は、ポイントツーポイント（PｔP）インタフェース６５０を介してPtPインタフェース回路６７８、６８８を用いてデータを交換することができる。プロセッサ６７０、６８０はそれぞれ、ポイントツーポイント・インタフェース回路６７６、６９４、６８６、６９８を用いて個々のPtPインタフェース６５２、６５４を介してチップセット６９０とデータを交換することができる。チップセット６９０は、高性能グラフィックス・インタフェース６３９を介して高性能グラフィックス回路６３８とデータを交換することもできる。

本発明の少なくとも１つの実施例は、プロセッサ６７０内及びプロセッサ６８０内にあり得る。しかし、本発明の他の実施例は、図６のシステム内の他の回路内、ロジック・ユニット内、又はデバイス内に存在し得る。更に、本発明の他の実施例を、図６に示すいくつかの回路、ロジック・ユニット、又はデバイスにわたって分散させることができる。

本明細書記載の本発明の実施例は、相補性金属酸化膜半導体デバイス若しくは「ハードウェア」を用いた回路によって、又は、マシン（プロセッサなど）によって実行されると、本発明の実施例に関連した処理を行う、媒体に記憶された命令組、若しくは「ソフトウェア」を用いて実現することができる。あるいは、本発明の実施例は、ハードウェア及びソフトウェアの組み合わせを用いて実現することができる。

例証的な実施例を参照して本発明を説明したが、この説明は、限定的な意味合いで解されることを意図するものでない。本発明が関係する当該技術分野における当業者に明らかである例証的な実施例の種々の修正及びその他の実施例は、本発明の趣旨及び範囲内に収まるものと認められる。

従来技術のプロセッサ又はコンピュータ・システムにおける同じキャッシュ線へのいくつかのアクセス間の競合を示す図である。本発明の一実施例によるキャッシュ・ブリッジ・アーキテクチャを示す図である。本発明の一実施例に関して用いるプロセッサのクロス・スヌープ状態マシンを示す図である。本発明の少なくとも１つの実施例とともに用いる処理を示す流れ図である。本発明の少なくとも１つの実施例を用い得るフロントサイドバスを示す図である。本発明の少なくとも１つの実施例を用い得るポイントツーポイント・コンピュータ・システムを示す図である。

Claims

装置であって、
第１のキャッシュ線への読み取りアクセスと、前記第１のキャッシュ線へのライトバック・アクセスとの間のキャッシュ・アクセス競合を防止するためのオーダリング・ロジックを備える装置。
請求項1記載の装置であって、キャッシュ線が、共有された包含的キャッシュ・メモリ内にある装置。
請求項１記載の装置であって、前記第１のキャッシュ線への読み取りアクセスが、共有された包含的キャッシュ・メモリからコア・キャッシュ・メモリへのクロス・スヌープ・アクセスである装置。
請求項１記載の装置であって、前記第１のキャッシュ線への、キャッシュ線のフィルが、共有された包含的キャッシュ・メモリ内のキャッシュ線の立ち退きをもたらす装置。
請求項１記載の装置であって、前記読み取りアクセスが、マルチコア・プロセッサ内の第１のコアからであり、前記ライトバック・アクセスが、前記マルチコア・プロセサ内の第２のコアからである装置。
請求項１記載の装置であって、前記読み取りアクセスが、マルチプロセッサ・システム内の第１のプロセッサからであり、ライトバックが、前記マルチコア・プロセサ内の第１のコアからである装置。
請求項１記載の装置であって、前記第１のキャッシュ線に関するコヒーレンシ状態情報を前記読み取りアクセスに応じて一時的に記憶するための記憶装置を更に備える装置。
請求項７記載の装置であって、前記コヒーレンシ状態情報は、前記読み取りアクセスの結果として前記第１のキャッシュ線がアトミックに無効にされている旨を示すための少なくとも一ビットを含む装置。
システムであって、
共有された包含的キャッシュを備える第１のプロセッサを備え、前記共有された包含的キャッシュは、前記第１のプロセッサ内の別のコアからのスヌープに応じて無効状態を有する第１のキャッシュ線を含み、前記無効状態は、前記第１のキャッシュ線が無効である旨を、読み取りアクセスの完了に先行してではあるが読み取りアクセスに後続してトランザクション全てに示すシステム。
請求項９記載のシステムであって、前記第１のキャッシュ線のコヒーレンシ情報を前記スヌープに応じて記憶するための記憶装置を備えるシステム。
請求項１０記載のシステムであって、対応する少なくとも１つのコア・キャッシュをそれぞれが有する複数のプロセッサ・コアを備えるシステム。
請求項１１記載のシステムであって、前記共有された包含的キャッシュが、前記対応する少なくとも１つのコア・キャッシュ内に記憶された同じデータを記憶するための最終レベル・キャッシュであるシステム。
請求項１２記載のシステムであって、前記第１のプロセッサは、前記無効状態を設定し、前記スヌープに応じて前記コヒーレンシ情報を記憶するためのロジックを備えるシステム。
請求項１３記載のシステムであって、前記第１のプロセッサは、前記複数のプロセッサ・コア及び第２のプロセッサとの間でのアクセスをそれぞれ記憶するための内部要求キュー及び外部要求キューを備えるシステム。
請求項１４記載のシステムであって、前記第１のプロセッサ及び前記第２のプロセッサが、ポイントツーポイント相互接続を介して互いに結合されるシステム。
請求項１４記載のシステムであって、前記第１のプロセッサ及び前記第２のプロセッサが、フロントサイドバス相互接続を介して互いに結合されるシステム。
方法であって、
包含的キャッシュ構造の、同じ線への複数のアクセスを行う工程と、
複数のプロセッサ・コアから前記線への前記複数のアクセス間の競合を防止する工程であって、前記複数のアクセスが、前記線の外部スヌープ、前記線の立ち退き、前記包含的キャッシュからのクロス・スヌープ、及び前記線へのライトバックから成る群のうちの何れか２つのトランザクションによってもたらされる工程とを備える方法。
請求項１７記載の方法であって、前記防止する工程は、前記複数のアクセスのうちの１つに応じて前記線のコヒーレンシ情報を記憶する工程を備える方法。
請求項18記載の方法であって、前記防止する工程は、前記複数のアクセスのうちの１つに応じて前記線をアトミックに無効にする工程を更に備える方法。
請求項19記載の方法であって、前記複数のアクセスのうちの前記１つの完了に応じて前記線の前記コヒーレンシ情報を再記録する工程を更に備える方法。
請求項20記載の方法であって、前記複数のアクセスのうちの前記１つの完了に応じて前記線を有効状態に設定する工程を更に備える方法。
プロセッサであって、
第１のキャッシュ線への読み取りアクセスと、前記第１のキャッシュ線へのライトバック・アクセスとの間のキャッシュ・アクセス競合を防止する手段を備えるプロセッサ。
請求項22記載のプロセッサであって、前記キャッシュ線が、共有された包含的キャッシュ・メモリ内にあるプロセッサ。
請求項22記載のプロセッサであって、前記第１のキャッシュ線への前記読み取りアクセスが、共有された包含的キャッシュ・メモリからコア・キャッシュ・メモリへのクロス・スヌープ・アクセスであるプロセッサ。
請求項22記載のプロセッサであって、前記第１のキャッシュ線への、キャッシュ線のフィルが、共有された包含的キャッシュ・メモリ内のキャッシュ線の立ち退きをもたらすプロセッサ。
請求項22記載のプロセッサであって、前記読み取りアクセスが、マルチコア・プロセッサ内の第１のコアからであり、前記ライトバック・アクセスが、前記マルチコア・プロセッサ内の第２のコアからであるプロセッサ。
請求項22記載のプロセッサであって、前記読み取りアクセスが、マルチプロセッサ・システム内の第１のプロセッサからであり、ライトバックが、マルチコア・プロセッサ内の第１のコアからであるプロセッサ。
請求項22記載のプロセッサであって、前記第１のキャッシュ線に関するコヒーレンシ状態情報を前記読み取りアクセスに応じて一時的に記憶するための記憶装置を更に備えるプロセッサ。
請求項28記載のプロセッサであって、前記コヒーレンシ状態情報は、前記読み取りアクセスの結果として前記第１のキャッシュ線がアトミックに無効にされている旨を示すための少なくとも一ビットを含むプロセッサ。