DE19943938B4

DE19943938B4 - Dynamischer Daten-Vorabruf auf Basis eines Programmzähler- und Adressierungsmodus

Info

Publication number: DE19943938B4
Application number: DE19943938.9A
Authority: DE
Inventors: Muhammad Afsar; Klaus Oberländer
Original assignee: Infineon Technologies AG
Current assignee: Infineon Technologies AG
Priority date: 1998-10-26
Filing date: 1999-09-14
Publication date: 2014-05-22
Anticipated expiration: 2019-09-15
Also published as: US6401193B1; DE19943938A1

Abstract

Ein Vorabruf von Daten an einen Niedrigere-Ebene-Speicher eines Computersystems (50) wird erreicht, indem ein Befehlsortindikator verwendet wird, der sich auf einen bevorstehenden Befehl bezieht, um einen Nächste-Daten-Vorabruf-Indikator (94) zu identifizieren und dann den Nächsten-Daten-Vorabruf-Indikator zu verwenden, um die korrespondierenden Vorabrufdaten innerhalb des Speichers (60, 64 und 68) des Computersystems zu lokalisieren. Die Vorabrufdaten werden so plaziert, daß die Vorabrufdaten zu einem Primärpuffer übertragen werden können, wo die Daten schnell von einem Prozessor (52) vorabgerufen werden können, wenn der bevorstehende Befehl ausgeführt wird. Der nächste Daten-Vorabruf-Indikator wird erzeugt durch Ausführen der Adressierungsmodusfunktion (96), die in einem Befehl nur dann eingebettet ist, wenn der Adressierungsmodus des Befehls ein deterministischer Adressierungsmodus wie etwa ein sequentieller ist. Der nächste Daten-Vorabruf-Indikator, vorzugsweise in der Form einer effektiven Adresse, wird durch den Befehlsortindikator, vorzugsweise in der Form eines Programmzählers, identifiziert durch Inbeziehungsetzen der berechneten nächsten effektiven Adressen zu den korrespondierenden Programmzählerkennzeichen in einer durchsuchbaren Tabelle.

Description

Hintergrund der Erfindung
Die Erfindung bezieht sich im allgemeinen auf den Vorabruf von Daten für den Zugriff durch einen Prozessor. Im spezielleren bezieht sich die Erfindung auf die Vorhersage der nächsten Datenentnahme, so dass die vorhergesagten Daten für den schnellen Puffer der niedrigsten Ebene vorabgerufen werden können, bevor die vorhergesagten Daten von dem Prozessor angefordert werden.
Beschreibung der diesbezüglichen Technik
Die Befehlsausführungsgeschwindigkeiten im Prozessor sind viel schneller als die Zeit, die für den Zugriff auf Befehle im Hauptspeicher eines Computers erforderlich ist. Die langsamere Hauptspeicherzugriffszeit kann Ausführungsengpässe erzeugen, wenn ein Prozessor gezwungen ist, auf von dem Hauptspeicher zum Prozessor zu übertragende, abgerufene Befehle zu warten. Um die Lücke zwischen Prozessorgeschwindigkeit und Hauptspeicherzugriffszeit zu minimieren, wird ein Pufferspeicher mit höherer Geschwindigkeit benutzt, um zeitweilig Befehle zu Puffern, derart, dass gepufferte Befehle dem Prozessor mit minimaler Verzögerungszeit bereitgestellt werden. 1 ist eine Abbildung einer typischen Prozessor- und Speicheranordnung, welche Pufferspeicher mehrerer Ebenen benutzt, um einen Prozessor zu versorgen. In 1 ist der Prozessor 10 mit einem Puffer 14 der Ebene Null (L0), einem Puffer 16 der Ebene Eins (L1) und einem Hauptspeicher 18 durch einen Bus 22 verbunden. Andere Ausgestaltungen sind möglich und können z. B. den L0-Puffer auf dem gleichen Chip plaziert haben wie der Prozessor und können mit dem Prozessor verbunden sein durch eine Schaltungsanordnung auf dem Chip oder es können die Pufferebenen direkt mit dem Prozessor verbunden sein. Der Prozessor kann ein beliebiger Prozessor sein, der häufig als ein Mikroprozessor oder eine Zentralprozessoreinheit bezeichnet wird und der einen Computercode wie beispielsweise einem Assemblierungssprachcode verarbeitet. Der Pufferspeicher ist häufig ein Hochgeschwindigkeitsspeicher wie beispielsweise ein statischer Direktzugriffsspeicher (SRAM) und der Hauptspeicher kann z. B. ein dynamischer Direktszugriffsspeicher (DPAM) und/oder ein Flash-Speicher sein. Der Pufferspeicher ist typischerweise in der Herstellung teurer als der Hauptspeicher und deshalb ist der Pufferspeicher üblicherweise dahingehend ausgelegt, um nur einen kleinen Anteil der Speicherkapazität des Hauptspeichers zu speichern.
Bei typischen Comutersystemen werden die Befehle in Assemblierungssprache an den Prozessor von dem Speicher geliefert und dann durch den Prozessor ausgeführt. Bezugnehmend auf 2 umfasst ein Befehl 26 in Assemblierungssprache typischerweise einen Opcode-Anteil 28 und einen Operandenanteil 30. Der Opcode (für Operationscode) informiert den Prozessor darüber, welche Operation ausgeführt wird. Opcode-Befehle umfassen z. B. Ladebefehle, Addierbefehle und Subtrahierbefehle. Bezugnehmend auf 3 umfasst ein typischer Befehl 32 einen Opcode 38, auf den Bezug genommen wird durch einen Programmzähler (PC) 36. Der Programmzähler ist ein Befehlsortindikator, der die Adresse des gewünschten Befehls innerhalb des Speichers identifiziert, und der Befehl leitet die Ausführung der Funktionen wie etwa Datenladen, Datenaddieren oder Datensubtrahieren. Der Operand umfasst den symbolischen Namen für die Speicheradresse der Daten, die durch den Befehl abgearbeitet werden sollen, oder in einigen Fällen die Speicheradressen eines anderen Befehls. Bezugnehmend auf 3 kann der Operand Informationen über die Quelladresse 40 oder -Adressen und die Bestimmungsadresse 42 oder -Adressen umfassen, wo die Quelladresse der Ort der Daten ist, die durch den Befehl bearbeitet werden sollen, und wo die Bestimmungsadresse der Zielort für Daten ist, welche das Ergebnis der laufenden Operationen sind. Die Quell- und Bestimmungsadressen können Adressierungsmodi umfassen, bei denen die Adressierungsmodi Algorithmen sind, welche die zutreffende Quell- oder Bestimmungsadresse für in dem Speicher gespeicherte Daten festlegt. Datenadressierungsmodi können unterschieden werden in Direktzugriffsadressierungsmodi oder deterministischen Adressierungsmodi. Direktzugriffsadressierungsmodi umfassen absolutes Adressieren, Register-Indirektadressieren und Basis-Plus-Offset-Adressieren. Deterministische Adressierungsmodi umfassen sequentielle Adressierungsmodi wie etwa Register-Indirektadressieren mit Vorher-/Nachher-Inkrementieren, zirkulares Adressieren und/oder Bit-Umkehr-Adressieren.
Da – bezugnehmend wieder auf 1 – der Pufferspeicher nicht das gesamte Informationsvolumen speichern kann, das in dem Hauptspeicher 18 gespeichert ist, kann nicht die gesamte vom Prozessor 10 benötigte Information in dem L0-Puffer 14 zur selben Zeit gespeichert werden, und es werden sich Pufferverluste ergeben, wenn der Prozessor Daten anfordert, die nicht in dem L0-Puffer gespeichert sind. Um das Trefferverhältnis des L0-Puffers zu erhöhen, können Befehle und/oder Daten von dem Hauptspeicher zum L0-Puffer 14 oder zum L1-Puffer 16 vorabgerufen werden als Vorwegnahme eines Datenabrufs durch den Prozessor. Der Vorabruf von Befehlen an den Puffer wird erleichtert durch eine sequentielle Art der Befehlsausführung im Computerprogramm. Das heißt, dass Computerprogramme häufig Routinen durchlaufen, die Programmbefehle in einer sequentiellen Reihenfolge benötigen. Als Ergebnis kann ein Strang von Befehlen vorabgerufen werden von dem Hauptspeicher an den Puffer mit einem bestimmten Grad an Sicherheit, dass die Befehle bald von dem Prozessor gebraucht werden. Zwei Zielpuffer können verwendet werden zum Vorabrufen von Befehlen, die sequentielle Charakteristika nicht aufweisen.
Im Gegensatz zu Vorabrufsbefehlen kann auf Daten häufig auf eine mehr zufällige Weise zugegriffen werden derart, so dass ein Vorabruf schwieriger auszuführen ist. Eine übliche für den Abruf von Daten verwendete Technik ist jene, dass beim Auftreten eines Pufferverlustes die laufende Pufferlinie von dem Hauptspeicher mit den gewünschten Abrufdaten aufgefüllt wird und eine nächste Pufferlinie mit einem Datenblock aus dem Hauptspeicher aufgefüllt wird, der räumlich den verloren gegangenen Daten nahekommt. Obwohl der Blockpufferungsansatz bei einigen Anwendungen zufriedenstellend arbeiten mag, hat er Nachteile. Genauer gesagt, der Block mit zusätzlichen Daten wird von dem Hauptspeicher vorabgerufen ohne irgendein Wissen über das Datenzugriffsmuster des laufenden Programms und als folge davon kann, wenn das Datenelement, auf das gegenwärtig zugegriffen wird, nicht Teil einer sequentiellen Datenstruktur ist, der Daten-Vorabruf den Puffer mit nicht gebrauchten Daten füllen anstelle von Daten, die bald von dem Prozessor gebraucht werden könnten.
Zusätzlich zum Block-Daten-Vorabruf bedienen sich andere Techniken zum Daten-Vorabruf der Erkennung von Zugriffsmustern, die aus vorherigen Datenzugriffen entwickelt werden und dann die erkannten Muster extrapolieren, um neue Vorabrufadressen zu erzeugen. Z. B. ist eine Mustererkennungstechnik beschrieben in dem US-Patent mit der Nummer US 5,694,568 A und dem Titel ”Auf komplexe Speicherzugriffsschemata anwendbares Vorabrufsystem”, das Harrison III et al. erteilt wurde. Obwohl diese Technik zufriedenstellend arbeiten mag für seinen beabsichtigten Zweck, beruht die Technik auf der Erkennung von Zugriffsmustern, die auf vergangenen Datenzugriffen basieren, bei denen die vergangenen Muster in unzutreffender Weise zukünftige Datenzugriffsmuster vorhersagen.
Als weiterer Stand der Technik werden die US 5,790,823 A und die DE 692 24 084 T2 genannt.
Im Hinblick auf die Unzulänglichkeiten des bekannten Standes der Technik ist das, was gebraucht wird, ein Verfahren und eine Vorrichtung zum Daten-Vorabruf, das/die eine hohe Puffertrefferrate aufweist.
Zusammenfassung der Erfindung
Diese Aufgabe wird durch ein Verfahren gemäß Patentanspruch 1 und eine Vorrichtung gemäß Patentanspruch 3 gelöst.
Ein Verfahren und eine Vorrichtung zum Daten-Vorabruf an einen Niedrige-Ebene-Speicher eines Computersystems bedient sich eines Befehlsortindikators, der sich auf einen bevorstehenden Befehl bezieht, um einen nächsten Daten-Vorabruf-Indikator zu identifizieren und dann den nächsten Daten-Vorabruf-Indikator zu nutzen, um die korrespondierenden Vorabrufdaten innerhalb des Hauptspeichers des Computersystems zu lokalisieren. Die Vorabrufdaten werden lokalisiert derart, dass die Vorabrufdaten zu dem Niedrige-Ebene-Speicher transferiert werden können, wo die Daten durch einen Prozessor schnell abgearbeitet werden können bevor der bevorstehende Befehl ausgeführt wird. Der nächste Daten-Vorabruf-Indikator wird erzeugt durch Ausführen der Adressiermodusfunktion, welche in einen Befehl nur dann eingebettet ist, wenn der Adressierungsmodus des Befehls ein deterministischer Adressierungsmodus wie etwa ein sequentieller Adressierungsmodus ist. Der Nächste-Daten-Vorabruf-Indikator wird durch Zuordnen korrespondierender Nächste-Daten-Vorabruf-Indikatoren zu Befehlsortindikatoren in einer durchsuchbaren Tabelle identifiziert.
Bei der bevorzugten Ausführungsform wird eine Daten-Vorabruf-Vorhersagetabelle erzeugt, welche den Nächste-Daten-Vorabruf-Indikator befähigt, basierend auf dem bald auszuführenden Programmzähler eines Befehls identifiziert zu werden. Eingaben in die Daten-Vorabruf-Vorhersagetabelle werden aus Befehlen gebildet, die deterministische Adressierungsmodi zum Identifizieren der effektiven Adresse der Quelldaten benutzt. Die Daten-Vorabruf-Vorhersagetabelleneingaben umfassen einen Programmzählerkennzeichen und einen Nächste-Daten-Vorabruf-Indikator. Das Programmzählerkennzeichen ist der auf den aktuellen Befehl bezogene Programmzähler, und das Programmzählerkennzeichen erlaubt es, dass die Daten-Vorabruf-Vorhersagetabelle durch den Programmzähler durchsucht werden, der auf einen bestimmten Befehl bezogen ist. Der Nächste-Daten-Vorabruf-Indikator ist die effektive Adresse der Daten, welche wahrscheinlich beim nächsten Mal, bei dem der gleiche Befehl ausgeführt wird, benötigt werden. Der Nächste-Daten-Vorabruf-Indikator wird berechnet durch Ausführen der Adressierungsmodusfunktion, welche mit dem Befehl verknüpft ist. Da die Adressierungsmodusfunktion eine deterministische Funktion ist, besteht eine hohe Wahrscheinlichkeit, dass die berechnete nächste effektive Adresse die tatsächliche effektive Adresse sein wird, die das nächste Mal, wenn der Befehl mit demselben Programmzählerwert ausgeführt wird, abgerufen wird.
Die Elemente eines Computersystems gemäss einer bevorzugten Ausführungsform der Erfindung umfassen einen Prozessor, einen Puffer der Ebene Null, einen Puffer der Ebene Eins, einen Hauptspeicher und eine Daten-Vorabruf-Maschine. Bei der bevorzugten Ausführungsform ist der Prozessor ein beliebiger üblicher Prozessor mit einem Programmzähler, welcher die Adresse von Befehlen identifiziert, die ausgeführt werden sollen. Der Puffer der Ebene Null ist vorzugsweise ein SRAM, welches die schnellste Datentransfer-Rate zum Prozessor bietet und welches physikalisch nahe dem Prozessor plaziert ist. Der Puffer der Ebene Eins ist vorzugsweise ein SRAM, das eine langsamere Datentransferrate zum Prozessor bietet und das auf der Systemhauptleiterplatte, welche mit dem Prozessor über einen Systembus verbunden ist, plaziert ist. Der Hauptspeicher ist ein Speicher hoher Kapazität, welcher einen relativ langsamen Datentransfer zum Prozessor aufweist. Der Hauptspeicher kann DRAN, Flash-Speicher oder andere geeignete Speichertypen umfassen. Der Hauptspeicher ist mit dem Prozessor über einen Systembus verbunden.
Die Daten-Vorabruf-Maschine wird vorzugsweise in den Prozessor integriert und bewerkstelligt den Daten-Vorabruf zwischen dem Puffer der Ebene Null, dem Puffer der Ebene Eins und dem Hauptspeicher. Die Daten-Vorabruf-Maschine bedient sich zum Vorhersagen der effektive Adresse der nächsten gewünschten Datenspeicherreferenz und zum Übertragen der mit der vorhergesagten Datenspeicherreferenz korrespondierenden Daten zum Puffer der niedrigsten Ebene eines Nächste-Daten-Vorabruf-Controllers, einem Daten-Vorabruf-Prediktor und eines Auffüllmanagers, um die beste Gelegenheit für einen Puffertreffer auf die Ausführung eines bestimmten Befehls zu erzeugen.
Der Nächste-Daten-Vorabruf-Controller sortiert Befehle mit nicht deterministischen Adressierungsmodi aus und verwendet Befehle mit deterministischen Adressierungsmodi wie etwa sequentielle Adressierungsmodi, um eine Daten-Vorabruf-Vorhersagetabelle aufzubauen, welche dazu verwendet wird, den nächsten Vorabruf vorherzusagen. Das Erzeugen einer Daten-Vorabruf-Vorhersagetabelleneingabe beinhaltet das Berechnen der auf den aktuellen Befehl bezogenen nächsten effektiven Adresse durch Ausführen der auf den aktuellen Befehl bezogenen Adressierungsmodusfunktion. Der Daten-Vorabruf-Prädiktor bedient sich der durch den Nächste-Daten-Vorabruf-Controller gebildeten Daten-Vorabruf-Vorhersagetabelle, um schnell die nächste effektive Adresse für einen auf einen bevorstehenden Befehl bezogenen Daten-Vorabruf zu identifizieren. Der Daten-Vorabruf-Prädiktor hält die Daten-Vorabruf-Vorhersagetabelle in einen inhaltsadressierbaren Speicher aufrecht, welcher schnell durch ein Programmzählerkennzeichen durch sucht werden kann. Ein Auffüllmanager der Daten-Vorabruf-Maschine ist verantwortlich für das Übertragen von Vorabrufdaten, welche nicht in dem Puffer der niedrigsten Ebene gefunden werden, zu dem Puffer in der niedrigsten Ebene, wenn ein Vorabrufverlust auftritt beim Puffer der niedrigsten Ebene. Der Auffüllmanager erzeugt Vorabrufanfragen für einen Speicher auf höherer Ebene, bis die gewünschten Vorabrufdaten lokalisiert und zu dem Puffer in der niedrigsten Ebene übertragen worden sind.
Im Betrieb erzeugt der Nächste-Daten-Vorabruf-Controller die Daten-Vorabruf-Vorhersagetabelle unter Verwendung ausgeführter Befehle, welche deterministische Adressierungsmodi darstellen.
Die Daten-Vorabruf-Vorhersagetabelle ist in dem Daten-Vorabruf-Prädiktor plaziert und wird fortlaufend erneuert durch den Nächste-Daten-Vorabruf-Controller. Wenn ein neuer Befehl identifiziert wird als ein Befehl, der bald ausgeführt werden soll, wird der auf den Befehl bezogene Programmzähler an den Daten-Vorabruf-Prädiktor weitergeleitet. Der auf den Befehl bezogene Programmzähler wird durch den Daten-Vorabruf-Prädiktor dazu verwendet, um die Programmzähler-Kennzeichenspalte der Daten-Vorabruf-Vorhersagetabelle nach einem übereinstimmenden Programmzählerkennzeichen zu durchsuchen. Wenn ein übereinstimmendes Programmzählerkennzeichen identifiziert wird, wird der nächste Daten-Vorabruf-Indikator aus der Tabelleneingabe extrahiert und der Indikator wird dazu verwendet, den Puffer auf niedrigster Ebene in dem Computersystem zu durchsuchen nach einer Pufferlinie, welch mit der effektiven Adresse des nächsten Daten-Vorabruf-Indikators übereinstimmt. Wenn ein Puffertreffer auftritt beim Puffer in der niedrigsten Ebene wird kein Vorabruf notwendig. Wenn andererseits ein Pufferverlust auftritt beim Puffer der niedrigsten Ebene, dann erzeugt der Auffüllmanager eine Vorabrufanforderung unter Verwendung des Nächste-Daten-Vorabruf-Indikators, welcher die Speicher der höheren Ebenen in die Lage versetzt, nach Daten mit der korrespondierenden effektiven Adresse zu suchen. Sobald die Daten mit der korrespondierenden nächsten effektiven Adresse lokalisiert sind, überträgt der Auffüllmanager die lokalisierten Daten zu dem Puffer in der niedrigsten Ebene im Computersystem. Mit dem zu dem Puffer in der niedrigsten Ebene übertragenen Zielvorabrufdaten ist der auf den aktuellen Befehl bezogene Vorabruf-Prozess komplett. Wenn der aktuelle Befehl schliesslich durch den Prozessor ausgeführt wird, besteht eine höhere Wahrscheinlichkeit, dass die durch den aktuellen Befehl angeforderten Daten in den Puffer der niedrigsten Ebene platziert sind, wobei ein schnellstmöglicher Datenzugriff gestattet wird.
Kurze Beschreibung der Zeichnungen
1 zeigt einen Prozessor und einen Mehrebenen-Speicher nach dem Stand der Technik,
2 zeigt einen Assemblierungssprachbefehl nach dem Stande der Technik,
3 zeigt spezielle Teile eines Assemblierungssprachbefehls nach dem Stande der Technik,
4 zeigt einen Prozessor, einen Mehrebenen-Speicher und eine Daten-Vorabruf-Maschine gemäss der Erfindung,
5 zeigt eine Daten-Vorabruf-Tabelleneingabe gemäss der Erfindung,
6 zeigt eine Daten-Vorabruf-Vorhersagetabelle gemäss der Erfindung,
7 zeigt in einem Flussdiagramm das Zusammenspiel zwischen Elementen des Systems aus 6 gemäss der Erfindung,
8 zeigt in einem Prozessflussdiagramm ein bevorzugtes erfindungsgemäßes Verfahren.
Detaillierte Beschreibung
4 zeigt eine bevorzugte Architektur eines Computersystems 50 gemäss der Erfindung. Die bevorzugte Architektur umfasst einen Prozessor 52, eine Daten-Vorabruf-Maschine 56, einen Puffer 60 der Ebene Null (L0), einen Puffer 64 der Ebene Eins (L1) und einen Hauptspeicher 68. Bei der bevorzugten Ausführungsform ist der Prozessor 52 irgendein üblicher Prozessor einschließlich eines Prozessors, der eine oder mehrere Datenspeicherreferenzen in einem einzigen Taktzyklus erzeugen kann. Der Prozessor 52 umfasst einen Programmzähler, der die Adressen von auszuführenden Befehlen identifiziert, einen Befehlsdecoder, der den Operanden vom Opcode trennt und den Opcode in eine Reihe elektrischer Signale umwandelt, welche die durch den Opcode repräsentierte Anweisung ausführen, einen Adressdecoder, der innerhalb des Speichers den physikalischen Ort der benötigten Daten festlegt, einen Akkumulator, der zeitweilig Werte speichert, und eine Arithmetik-Logik-Einheit, welche die mathematischen Funktionen des Prozessors ausführt.
Die bevorzugte Architektur eines Computersystems 50 umfasst ein Speicherteilsystem 54 mit einer Mehrebenen-Pufferanordnung, bei der die Ebenen des Pufferspeichers hinsichtlich Grösse und Latenzzeit unterschieden werden. Der L0-Puffer 60 (auch bekannt als Primärpuffer) bietet die schnellste Datenübertragungsrate zum Prozessor 52. Der L0-Puffer 60 ist physikalisch nahe dem Prozessor 52 angeordnet und ist vorzugsweise ein SRAM. Obwohl zum Zwecke der Beschreibung der L0-Puffer 60 als mit dem Prozessor 52 über einen Bus 72 verbunden dargestellt ist, wird der L0-Puffer 60 vorzugsweise auf dem Prozessorchip mit integriert und mit dem Prozessor 52 durch eine auf dem Chip befindliche Schaltungsanordnung mit hoher Bandbreite verbunden. Der L1-Puffer 64 (auch bekannt als Sekundärpuffer) hat eine größere Speicherkapazität als der L0-Puffer 60, bietet aber eine langsamere Datentransferrate zum Prozessor 52. Der L1-Puffer 64 ist vorzugsweise ein SRAM auf dem Chip, es kann aber auch eine andere Speicherform wie etwa ein SRAM, das in das auf der Systemhauptleiterplatte befindliche System-RAN integriert sein kann. Bei der bevorzugten Ausführungsform speichern der L0-Pufferspeicher und der L1-Pufferspeicher nur Operandendaten, welche von dem Prozessor 52 benötigt werden, und Opcode-Befehle, die vom Prozessor 52 benötigt werden, werden in einem nicht dargestellten separaten Puffer gespeichert. Obwohl eine geteilte Pufferanordnung beschrieben wird, kann ein vereinigter Puffer, der sowohl Daten als auch Befehle kombiniert, ebenfalls implementiert werden. Der L0-Puffer 60 erstreckt sich typischerweise von 1 Kb bis zu 64 Kb und der L1-Puffer 64 erstreckt sich typischerweise von 64 Kb bis zu 1 Mb, obwohl dies nicht kritisch ist. Obwohl eine Zweiebenen-Pufferanordnung beschriebenen ist, sind andere Pufferanordnungen möglich einschließlich z. B. mehreren Pufferebenen (1 bis x) und/oder ein Pufferspeicher, der auf andere Weise mit einem Prozessor 52 verbunden ist. Die exakte Pufferausgestaltung ist für die Erfindung nicht kritisch.
Der Hauptspeicher 68 ist ein Speicher hoher Kapazität, der eine relativ langsame Datentransferrate zum Prozessor 52 bietet. Der Hauptspeicher 68 kann ein DRAM, ein SRAM, ein Flash-Speicher und ein FRAM miteinschließen. Das Speicherteilsystem kann des Weiteren mit Eingabe-/Ausgabe-Einheiten verbunden sein, wie beispielsweise einen magnetischen Speicher. Der Hauptspeicher 68 ist auch mit dem Prozessor 52 über den Bus 72 verbunden.
Die bevorzugte Architektur des Computersystems 50 umfasst die Daten-Vorabruf-Maschine 56, die den Vorabruf von Daten zwischen dem L0-Puffer 60, dem L1-Puffer 64 und dem Hauptspeicher 68 verwaltet. Die Daten-Vorabruf-Maschine 56 ist der Brennpunkt der Erfindung und bedient sich eines Nächste-Daten-Vorabruf-Controllers 76, eines Daten-Vorabruf-Prädiktors 80 und eines Auffüllmanagers 84, um die effektive Adresse der nächsten gewünschten Datenspeicherreferenz vorherzusagen und die mit der vorhergesagten Datenspeicherreferenz korrespondierenden Daten zu dem Puffer der niedrigsten Ebene zu übertragen, um die beste Chance für einen Puffertreffer auf die Ausführung eines gegebenen Befehls zu erzeugen.
Die erste Einheit in der Daten-Vorabruf-Maschine 56 ist der Nächste-Daten-Vorabruf-Controller 76. Der Nächste-Daten-Vorabruf-Controller 76 untersucht Programmbefehle und verwendet ausgewählte Befehle zum Aufbau einer Daten-Vorabruf-Vorhersagetabelle 100, die dazu verwendet wird, um den nächsten Daten-Vorabruf vorherzusagen. Der Nächste-Daten-Vorabruf-Controllerauswahlprozess beinhaltet das Untersuchen einer Befehlslinie, vorzugsweise in Bezug auf einen ausgeführten Befehl, für eine bestimmte Charakteristik. Im besonderen untersucht der Nächste-Daten-Vorabruf-Controller 76 den mit der Quellen-Adresse, welche in dem Befehl eingebettet ist, den verbundenen Adressierungsmodus, wobei nach Adressierungsmodi gesucht wird, die in die deterministische Adressierungsmoduskategorie fallen. Bei der bevorzugten Ausgestaltung wird der Adressierungsmodus durch einen 3-Bit-Vektor identifiziert und der Adressierungsmodusvektor des Befehls wird durch einen fest verdrahteten Komparator geleitet, um festzulegen, ob der Adressierungsmodusvektor mit irgendwelchen voreingestellten deterministischen Adressierungsmodusvektoren übereinstimmt, welche durch einen System-Setup identifiziert worden sind. Bei der bevorzugten Ausgestaltung umfassen die deterministischen Adressierungsmodi sequentielle Adressierungsmodi wie etwa Prä- und Post-Inkrementieren, zirkulares Adressieren und Bit-Umkehr-Adressierungsmodi.
Wenn der Adressierungsmodusvektor eines Befehls einen deterministischen Adressierungsmodus identifiziert, wird der Befehl weiterverarbeitet zu einer Daten-Vorabruf-Vorhersagetabelleneingabe, die dann dazu benutzt wird, um die Daten-Vorabruf-Vorhersagetabelle 100 zu schaffen. Wenn jedoch der Adressierungsmodusvektor einen nicht deterministischen Adressierungsmodus identifiziert, dann wird der Befehl in dem aktuellen Vorabrufprozess nicht weiter betrachtet. Befehle, die sich deterministischer Adressierungsmodi bedienen, werden in die Daten-Vorabruf-Vorhersagetabelle mit eingebracht, da sie eine bekannte Funktion bereit stellen, welche dazu verwendet werden kann, die effektive Adresse zu berechnen, die beim nächsten Mal identifiziert wird, wenn der gleiche Befehl erneut zur Ausführung aufgerufen wird. In Programmen, die zu den gleichen Befehlen viele Male zurückkehren, korrespondiert häufig die nächste effektive Adressenvorhersage mit dem tatsächlichen effektiven Adressabruf, wobei eine höhere Puffertrefferrate geschaffen wird.
Die Erzeugung eines Daten-Vorabruf-Vorhersagetabelleneintrags 90 wird durchgeführt durch den Nächste-Daten-Vorabruf-Controller 76 und beinhaltet das Berechnen der nächsten auf den aktuellen Befehl bezogenen effektiven Adresse und der Verwendung des deterministischen Adressierungsmodus, der durch den Befehl identifiziert wird. Ein bevorzugter Daten-Vorabruf-Vorhersagetabelleneintrag 90 ist in 5 dargestellt und umfasst die folgenden Vektoren; ein Programmzählerkennzeichen 92, einen Nächste-Daten-Vorabruf-Indikator 94, den Quellenadressierungsmodus 96 und einen Gültiger-Eintrag-Vektor 98. Das Programmzählerkennzeichen 92 ist der auf den aktuellen Befehl bezogene Programmzähler. Das Programmzählerkennzeichen 92 erlaubt der Daten-Vorabruf-Vorhersagetabelle 100, durch den Programmzähler durchsucht zu werden, der auf einen bestimmten Befehl bezogen ist. Der nächste Daten-Vorabruf-Indikator 94 ist ein Vektor, der die effektive Adresse der nächsten Pufferlinie identifiziert, die dann angefordert werden würde, wenn z. B. die sequentielle Adressierungsmodusfunktion des aktuellen Befehls ausgeführt wird, um die nächste effektive Adresse zu berechnen. Ein Beispiel der Berechnung einer nächsten effektiven Adresse (EA) unter einem postinkrementierenden Adressierungsmodus ist wie folgt: Aktuelle EA = A₀ Nächste EA = A₀ + Konstante.
Ein Beispiel für das Berechnen einer nächsten effektiven Adresse unter einem präinkrementierenden Adressierungsmodus ist wie folgt: Aktuelle EA = A₀ + Konstante A₀ = A₀ + Konstante und Nächste EA = A₀ + Konstante + Konstante.
Die zum Identifizieren einer effektiven Adresse erforderliche Anzahl von Bits in den nächsten Daten-Vorabruf-Indikatorvektor ist eine Funktion der Speicherorganisation auf dem Computersystem. Bei der bevorzugten Ausgestaltung ist der Nächste-Daten-Vorabruf-Indikatorvektor 12 Bits.
Der Quellenadressierungsmodusvektor 96 bei der Daten-Vorabruf-Vorhersagetabelleneingabe ist ein Vektor, der den Adressierungsmodus der Daten-Vorabruf-Vorhersagetabelleneingabe repräsentiert. Es ist bereits bekannt, dass der Quellenadressierungsmodus in die deterministische Adressierungsmoduskategorie fällt, da der Befehl aussortiert worden wäre, wenn der Befehl einen nicht deterministischen Adressierungsmodus hätte. Jedoch ist der Adressierungsmodus in der Daten-Vorabruf-Vorhersagetabelleneingabe enthalten, denn die Kenntnis des bestimmten involvierten Adressierungsmodus kann bei der Feinabstimmung des Systems hilfreich sein. Der Gültiger-Eintrag-Vektor 98 eines Tabelleneintrags 90 ist ein 1-Bit-Vektor, der den Daten-Vorabruf-Vorhersagetabelleneintrag als gültigen Eintrag identifiziert. Obwohl der Quellenadressierungsmodusvektor nicht kritisch für die Erfindung ist, ist dieser in der bevorzugten Ausgestaltung enthalten, um deren Verhalten zu verbessern. Der Quellenadressierungsmodus kann von dem Tabelleneintrag 90 entfernt werden, um die Tabelleneingabegröße zu vermindern.
Unter Bezugnahme nochmals auf 4 ist die nächste Einheit in der Daten-Vorabruf-Maschine 56 der Daten-Vorabruf-Prädiktor (DPP) 80. Der Daten-Vorabruf-Prädiktor 80 bedient sich der aus verschiedenen Tabelleneinträgern 90 gebildeten Daten-Vorabruf-Vorhersagetabelle 100, um schnell die nächste effektive Adresse für den Daten-Vorabruf zu identifizieren. Der Daten-Vorabruf-Prädiktor 80 hält die Daten-Vorabruf-Vorhersagetabelle 100 im Speicher wie etwa einem inhaltsadressierbaren Speicher, der schnell durch das Programmzählerkennzeichen 92 durchsucht werden kann, in Stand. 6 ist eine Darstellung einer beispielhaften Daten-Vorabruf-Vorhersagetabelle 100 mit verschiedenen Tabelleneingaben. Die Daten-Vorabruf-Vorhersagetabelle 100 wird wie ein normaler Puffer behandelt, da sie nicht alle Befehle speichern kann. Pufferersatzmechanismen wie etwa direkt geplante, zweiwege-satz-verknüpfte, voll-satz-verknüpfte oder irgendwelche andere Speicherersatzmechanismen können verwendet werden.
Die nächste Einheit in der Daten-Vorabruf-Maschine 56 ist der Auffüllmanager 84. Der Auffüllmanager 84 ist verantwortlich für das Übertragen von in einem Speicher in höherer Ebenen gefundenen Vorabrufdaten zu dem Puffer in niedrigster Ebene 60.
Der Auffüllmanager 84 erkennt, wenn ein Vorabrufverlust beim Puffer in niedrigster Ebene 60 auftritt und erzeugt dann eine Vorabrufanforderung für einen Speicher in höherer Ebene bis die Zielvorabrufdaten lokalisiert und zu den Puffer in niedrigster Ebene 60 übertragen worden sind. Es ist darauf hinzuweisen, dass obwohl die Funktionen der Daten-Vorabruf-Maschine separat von dem Prozessor 52 zum Zwecke der Beschreibung dargestellt sind, bei der bevorzugten Ausgestaltung die Teileinheiten der Daten-Vorabruf-Maschine 56 auf dem gleichen Chip wie der Prozessor 52 integriert sind.
Der Betrieb des Computersystems 50 aus 4 ist mit Bezug auf 7 beschrieben. 7 ist ein Flussdiagramm, das die Interaktion zwischen den bezüglich 4 beschriebenen Elementen darstellt, wobei gleiche Elemente die gleichen Bezugszeichen haben. Um den Vorabrufprozess zu beginnen, wird das Datenreferenzverhalten verfolgt, um die Daten-Vorabruf-Vorhersagetabelle 100 zu entwickeln. Um die Daten-Vorabruf-Vorhersagetabelle 100 zu erzeugen, selektiert der nächste Daten-Vorabruf-Controller 76 die ausgeführten Befehle vom Prozessor 52, welche sich deterministischer Adressierungsmodi bedienen, um effektive Adressen als die nächsten Daten-Vorabruf-Indikatoren 94 zu erzeugen. Daten-Vorabruf-Vorhersagetabelleneinträge 90 – wie in 5 gezeigt – werden aus den abgearbeiteten Befehlen durch Ausführen der Adressierungsmodusfunktion eines Befehls erzeugt, um die effektive Adresse der Daten zu berechnen, welchen vorhergesagt wird, dass sie als nächstes von dem Prozessor 52 benötigt werden. Die erzeugten Tabelleneinträge 90 werden zu dem Daten-Vorabruf-Prädiktor 80 weitergeleitet, um die Daten-Vorabruf-Vorhersagetabelle 100 zu erzeugen. Sobald eine anfängliche Daten-Vorabruf-Vorhersagetabelle 100 erzeugt ist, wird die Tabelle kontinuierlich aktualisiert.
Nachdem die Daten-Vorabruf-Vorhersagetabelle 100 erzeugt ist, wird ein Programmzähler vom Prozessor 52 zu dem Daten-Vorabruf-Prädiktor 80 übertragen. Der Programmzähler ist ein Look-Ahead-Programmzähler, der einen zukünftigen Befehl repräsentiert, welcher bald ausgeführt werden soll. Der Programmzähler wird in den Daten-Vorabruf-Prädiktor 80 eingespeist und wird dazu verwendet, um die Programmzählerkennzeichenspalte der Daten-Vorabruf-Vorhersagetabelle 100 auf ein übereinstimmendes Programmzählerkennzeichen 92 hin zu durchsuchen. Wenn der aktuelle Programmzähler vom Prozessor 52 mit einem Programmzählerkennzeichen 92 der Daten-Vorabruf-Vorhersagetabelle 100 übereinstimmt, dann stellt die Daten-Vorabruf-Vorhersagetabelle 100 die nächste effektive Adresse bereit, welche dazu verwendet wird, den Puffer höchster Priorität, z. B. den L0-Puffer 60, nach einer übereinstimmenden Pufferlinie zu durchsuchen. Wenn andererseits kein übereinstimmender Tabelleneintrag 90 gefunden wird in der Daten-Vorabruf-Vorhersagetabelle 100, dann kann der Vorabruf fortgesetzt werden mit einem anderen Ansatz, wie etwa einem Blockvorabruf oder der Vorabruf kann unterbrochen werden.
Das Durchsuchen des L0-Puffers 60 beinhaltet die Verwendung des Nächste-Daten-Vorabruf-Indikators 94, insbesondere der nächsten effektiven Adresse, welcher von dem passenden Daten-Vorabruf-Vorhersagetabelleneintrag 90 extrahiert wird, um zu sehen, ob die identifizierte Pufferlinie in dem L0-Puffer 60 bereits existiert. Würde die durch die berechnete nächste effektive Adresse identifizierte Pufferlinie bereits im L0-Puffer 60 existieren, dann ist keine weitere Aktion notwendig, da die wahrscheinlich von einem nächsten Befehl benötigten Daten bereits an dem den schnellsten Datenzugriff auf den Prozessor 52 bietenden Speicherplatz platziert sind. Wenn andererseits die Pufferlinie in dem L0-Puffer 60 nicht existent ist, dann gibt es einen Vorabrufverlust und der Auffüllmanager 84 ist aufgerufen, die Vorabrufdaten zu lokalisieren und die Daten zum L0-Puffer 60 zu übertragen. Der Pufferspeicher wird vorzugsweise auf einer Prioritätsbasis durchsucht, wobei der Puffer auf niedrigster Ebene die höchste Priorität und der Puffer auf höchster Ebene die niedrigste Priorität hat.
Wenn ein Vorabrufverlust im L0-Puffer 60 auftritt, erzeugt der Auffüllmanager 84 eine Vorabrufanfrage und leitet die Vorabrufanfrage an den nächsten Speicher 104 auf niedrigerer Ebene, z. B. den L1-Puffer 64, weiter. Wenn die gewünschten Vorabrufdaten in einer Pufferlinie des L1-Puffers 64 existent sind, dann wird die durch die berechnete effektive Adresse identifizierte Pufferlinie zum L0-Puffer 60 übertragen, und der Vorabruf ist komplett. Wenn andererseits die Vorabrufdaten in einer Pufferlinie des L1-Puffers 64 nicht existent sind, dann übermittelt der Auffüllmanager 84 eine Vorabrufanfrage an den nächsten Speicher 104 in einer niedrigen Ebene, in diesem Fall dem Hauptspeicher 68. Sobald die Vorabrufdaten in dem Hauptspeicher gefunden worden sind, können die Daten zu dem L0- oder L1-Puffer 60, 64 nach Bedarf übertragen werden. Aufgrund der durch die L0- und L1-Pufferverluste verursachte Verzögerung kann das System Zyklusnachteile erleiden anstelle von Vorabrufaufwand. Wenn jedoch der Vorabruf in der Lage ist, die vorhergesagten Daten zum L0-Puffer 60 zu bringen und der Prozessor 52 dahin gelangt, die vorhergesagten Daten abzurufen, dann ist die Effizienz des Prozessors 52 verbessert durch den Vorabrufprozess, da die Datenzugriffszeit für die an den Prozessor 52 bereitgestellten Daten minimiert worden ist. Wenn die vorabgerufenen Daten von der Befehlsausführung nicht angefordert werden, dann ist der Vorabrufalgorithmus nicht erfolgreich gewesen beim Vorhersagen der von dem aktuellen Befehl benötigten Daten. Der Vorabrufprozess wird während des Betriebes des Prozessors 52 schnell wiederholt. Es kann auch ein Schema implementiert werden, bei dem der Vorabruf annulliert wird, wenn erkannt wird, dass die Eingabe in die Vorhersagetabelle 100 nicht mit der wirklichen Adresse des Befehls mit demselben Programmzählerkennzeichen 92 übereinstimmt, wobei der Nachteil für die falsche Vorhersage verringert wird. Des Weiteren kann der Grund für die falsche Vorhersage festgestellt werden und der Tabelleneintrag 90 kann entfernt werden, bevor sie eine andere falsche Vorhersage erzeugt.
8 zeigt das Prozessflussdiagramm eines bevorzugten Verfahrens der Erfindung. Bei einem ersten Schritt 110 wird eine Daten-Vorabruf-Vorhersagetabelle 100 erzeugt. Die Daten-Vorabruf-Vorhersagetabelle 100 bezieht Programmzählerwerte auf effektive Adressen, welche berechnet werden unter Verwendung der auf einem Befehl bezogenen deterministischen Adressierungsmodusfunktion. Bei einem nächsten Schritt 112 wird ein Programmzähler für einen bevorzustehenden Befehl identifiziert. Der Programmzähler ist ein Look-Ahead-Zähler, der es ermöglicht, dass die notwendigen Daten vorabgerufen werden. Bei einem nächsten Schritt 114 wird die Daten-Vorabruf-Vorhersagetabelle 100 durchsucht unter Verwendung des Programmzählers von dem bevorstehenden Befehl, um eine passende Eingabe von der Daten-Vorabruf-Vorhersagetabelle 100 zu finden. Bei einem nächsten Schritt 116 wird ein berechneter Nächste-Daten-Vorabruf-Indikator 94 in Form einer effektiven Adresse von der passenden Daten-Vorabruf-Vorhersagetabelleneingabe extrahiert, um das Computerspeicherteilsystem nach den gewünschten Daten zu durchsuchen. Bei einem nächsten Schritt 118 wird das Computerspeicherteilsystem nach Daten durchsucht, die durch den extrahierten Nächste-Daten-Vorabruf-Indikator 94 identifiziert werden. Bei einem nächsten Schritt 120 werden, sobald die gewünschten Daten innerhalb des Computerspeicherteilsystems lokalisiert worden sind, die gewünschten Daten zu dem Puffer in der niedrigeren Ebene übertragen, wenn die Daten noch nicht in dem Puffer der niedrigsten Ebene gegenwärtig sind.

Claims

Verfahren zum Vorabruf von Daten in einen Niedrige-Ebene-Speicher (60) eines Computersystems, das einen Prozessor (52) und mehrere Speicherebenen (60, 64, 68) umfasst, mit den Schritten: Erzeugen (110) einer Daten-Vorabruf-Vorhersage-Tabelle (100) für eine Vielzahl von ausgeführten Befehlen mit deterministischem Adressierungsmodus, mit einer Verknüpfungen zwischen Befehlsortindikatoren (92) zur Lokalisierung von Befehlen und Nächste-Daten-Vorabruf-Indikatoren (94) zur Lokalisierung der Vorabrufdaten, wobei die Nächste-Daten-Vorabruf-Indikatoren (94) durch Ausführen des deterministischen Adressierungsmodus des jeweiligen Befehls berechnnet werden; Identifizieren eines Befehlsortindikators für einen bevorstehenden Befehl (112); Bestimmen des mit dem Befehlsortindikator verknüpften Nächste-Daten-Vorabruf-Indikators (114, 116); Übertragen der auf den nächsten Daten-Vorabrufindikator bezogenen Daten an den Niedrige-Ebene-Speicher (60) des Computersystems, wenn diese nicht im Niedrig-Ebene-Speicher existent sind.
Verfahren nach Anspruch 1, bei dem der Schritt des Ausführens der Funktion des dederministischen Adressierungsmodus (96) ein Schritt des Ausführens eines aus einem Präinkrementierungs-, Postinkrementierungs-, zirkularen Adressierungs- und/oder Bit-Umkehr-Adressierungsmodus ist, wie durch einen gegenwärtig ausgeführten Befehl angezeigt wird.
Vorrichtung zum Daten-Vorabruf an einen Niedrige-Ebene-Speicher eines Computersystems mit mehreren Speicherebenen (60, 64, 68) und einem Prozessor (52), das aufweist: Einen Nächste-Daten-Vorabruf-Controller (76) zum Erzeugen eines Nächste-Daten-Vorabruf-Indikators (94) durch Ausführen einer Adressierungsmodusfunktion eines Computerbefehls mit deterministischem Adressierungsmodus, bei der der Computerbefehl einen Befehlsortindikator (92) hat; einen Daten-Vorabruf-Prädiktor (80) zum Identifizieren eines nächsten Daten-Vorabruf-Indikators (94) für einen bald auszuführenden Computerbefehl unter Verwendung des Befehlsortindikators (92) des bald auszuführenden Computerbefehls (112) mit einem inhaltsadressierbaren Speicher mit einer Daten-Vorabruf-Vorhersagetabelle (100) mit einer Verknüpfung zwischen einem Programmzählerkennzeichen (92), dem Nächste-Daten-Vorabruf-Indikator (94) einem Eintrag über den Quellenadressierungsmodus (96) und einem Gültiger-Eintrag-Vektor (98); eine Vorabruf-Maschine (56) zum Durchsuchen der Speicherebenen des Computersystems, um Daten zu lokalisieren, die bezogen sind auf den Nächsten-Daten-Vorabruf-Indikator (94) für den bald auszuführenden Computerbefehl (112); und einen Auffüllmanager (84) zum Übertragen der lokalisierten Daten, die auf den Nächsten-Daten-Vorabruf-Indikator (94) für den bald auszuführenden Computerbefehl (112) bezogen sind, von einem Höhere-Ebene-Speicher (64, 68) zu einem Niedrigere-Ebene-Speicher (60), wenn diese im Niedrigere-Ebene-Speicher (60) nicht existent sind.