EP4020228B1

EP4020228B1 - Vorrichtung, system und verfahren zum selektiven löschen von prefetch-befehlen für software

Info

Publication number: EP4020228B1
Application number: EP21197392.0A
Authority: EP
Inventors: Wim Heiman; Ibrahim Hur
Original assignee: Intel Corp
Current assignee: Intel Corp
Priority date: 2020-12-23
Filing date: 2021-09-17
Publication date: 2023-07-12
Anticipated expiration: 2041-09-17
Also published as: EP4020228A1; CN114661626A; US20220197821A1

Claims

Prozessor (101, 300), der Folgendes umfasst:
einen Translation-Lookaside-Buffer- bzw. TEB-Manager (115, 315), umfassend eine Schaltungsanordnung zum:
Detektieren einer ersten Vorabrufanweisung, wobei ein erster Eintrag eines TLB (110, 310) basierend auf der ersten Vorabrufanweisung erzeugt wird; und

Bereitstellen, basierend auf der ersten Vorabrufanweisung, von ersten Nutzungsinformationen, die dem ersten Eintrag entsprechen, wobei die ersten Nutzungsinformationen angeben, dass erste Daten, die durch eine Ausführung der ersten Vorabrufanweisung vorabgerufen werden, als nicht ausreichend genutzt klassifiziert sind, wobei die ersten Nutzungsinformationen eine Anweisungskennung umfassen, die der ersten Vorabrufanweisung entspricht; wobei der Prozessor dadurch gekennzeichnet ist, dass er Folgendes umfasst:

einen Registermanager (117, 317), der mit dem TLB-Manager (115, 315) gekoppelt ist zum:
Detektieren einer Ausräumung des ersten Eintrags, während die ersten Nutzungsinformationen angeben, dass erste Daten als nicht ausreichend genutzt klassifiziert sind, wobei die ersten Daten als nicht ausreichend genutzt klassifiziert werden, wenn die ersten Daten noch mindestens eine vorbestimmte Anzahl von Malen zur Verwendung in einer Ausführungs-Pipeline (106) des Prozessors (101, 300) zu laden sind;

Erzeugen, basierend auf der Ausräumung und der Anweisungskennung, eines zweiten Eintrags eines Registers (116, 316) von Vorabrufanweisungen, wobei der zweite Eintrag die Anweisungskennung und einen Wert, der einen Zählwert von zu verwerfenden Vorabrufanweisungen repräsentiert, umfasst; und

eine Vorabrufsteuerung (118, 318), die mit dem Register (116, 316) gekoppelt ist, umfassend eine Schaltungsanordnung zum Verhindern einer Ausführung einer zweiten Vorabrufanweisung basierend auf dem zweiten Eintrag, wobei der Registermanager (117, 317) basierend auf einer Detektion der zweiten Vorabrufanweisung ferner ausgelegt ist zum Aktualisieren des Werts zum Dekrementieren des Zählwerts von zu verwerfenden Vorabrufanweisungen, und

wobei die Vorabrufsteuerung (118, 318) ausgelegt ist zum:
Durchführen einer ersten Durchsuchung des TLB (110, 310) basierend auf einer Adresse, die der zweiten Vorabrufanweisung entspricht;

Detektieren eines Miss basierend auf der ersten Durchsuchung;

als Reaktion auf den Miss, Durchführen einer zweiten Durchsuchung des Registers (116, 316) von Vorabrufanweisungen basierend auf einer Anweisungskennung, die der zweiten Vorabrufanweisung entspricht; und

Detektieren eines Hit des zweiten Eintrags basierend auf der zweiten Durchsuchung;

wobei die Vorabrufsteuerung (118, 318) zum Verhindern der Ausführung der zweiten Vorabrufanweisung basierend auf dem zweiten Eintrag die Vorabrufanweisung (118, 318) zum Verhindern der Ausführung basierend auf dem Hit umfasst.
Prozessor (101, 300) nach Anspruch 1, wobei der erste Eintrag die ersten Nutzungsinformationen umfasst.
Prozessor (101, 300) nach Anspruch 1, wobei die Vorabrufsteuerung (118, 318) ferner ausgelegt ist zum Detektieren, basierend auf dem Hit des zweiten Eintrags, dass der Zählwert von zu verwerfenden Vorabrufanweisungen größer als null ist; und
wobei die Vorabrufsteuerung (118, 318) zum Verhindern der Ausführung basierend auf dem Hit die Vorabrufanweisung (118, 318) zum Verhindern der Ausführung basierend auf dem Zählwert umfasst.
Prozessor (101, 300) nach Anspruch 1 oder Anspruch 2, wobei die Anweisungskennung auf einem Wert eines Anweisungszeigers basiert.
Prozessor (101, 300) nach Anspruch 1 oder Anspruch 2, wobei der TLB-Manager (115, 315) ferner ausgelegt ist zum:
Detektieren einer dritten Vorabrufanweisung, wobei der dritte Eintrag des TLB (110, 310) basierend auf der dritten Vorabrufanweisung erzeugt wird;

Bereitstellen von zweiten Nutzungsinformationen, die dem dritten Eintrag entsprechen, wobei die zweiten Nutzungsinformationen angeben, dass zweite Daten, die durch eine Ausführung der dritten Vorabrufanweisung vorabgerufen werden, als nicht ausreichend genutzt klassifiziert sind, wobei die zweiten Nutzungsinformationen eine zweite Anweisungskennung umfassen, die der dritten Vorabrufanweisung entspricht;

Detektieren einer Verwendung der zweiten Daten durch die Ausführungs-Pipeline (106); und

Aktualisieren der zweiten Nutzungsdaten basierend auf der Nutzung, um anzugeben, dass die zweiten Daten als ausreichend genutzt klassifiziert sind.
Prozessor (101, 300) nach Anspruch 5, wobei der Registermanager (117, 317) ferner ausgelegt ist zum:
Detektieren einer zweiten Ausräumung des dritten Eintrags nach dem Aktualisieren;

Durchführen einer Auswertung der zweiten Nutzungsinformation basierend auf der zweiten Ausräumung; und

basierend auf der Auswertung, Verhindern einer Erzeugung eines vierten Eintrags des Registers (116, 316).
Prozessor (101, 300) nach Anspruch 1 oder Anspruch 2, wobei:
der Registermanager (117, 317) ferner ausgelegt ist zum Auswählen eines durch den zweiten Eintrag zu ersetzenden dritten Eintrags des Registers (116, 316);

der dritte Eintrag einen Wert umfasst, der einen Zählwert von zu verwerfenden Vorabrufanweisungen umfasst; und

der Registermanager (117, 317) ausgelegt ist zum Auswählen der dritten Schaltungsanordnung basierend auf einem der Folgenden:
einer Angabe durch den Wert, dass der Zählwert gleich null ist; oder

einer Angabe durch den Wert, dass der Zählwert gleich einem niedrigsten Zählwert von mehreren Zählwerten ist, die jeweils durch einen anderen jeweiligen Eintrag des Registers (116, 316) repräsentiert werden.
Verfahren an einem Prozessor (101, 300), wobei das Verfahren Folgendes umfasst:,
mit einem Translation-Lookaside-Buffer- bzw. TEB-Manager (115, 315):
Detektieren (210) einer ersten Vorabrufanweisung, wobei ein erster Eintrag eines Translation Lookaside Buffer, TLB, (110, 310) basierend auf der ersten Vorabrufanweisung erzeugt wird; und

basierend auf dem Detektieren, Bereitstellen (212) von ersten Nutzungsinformationen, die dem ersten Eintrag entsprechen, wobei die ersten Nutzungsinformationen angeben, dass erste Daten, die durch eine Ausführung der ersten Vorabrufanweisung vorabgerufen werden, als nicht ausreichend genutzt klassifiziert sind, wobei die ersten Nutzungsinformationen eine Anweisungskennung umfassen, die der ersten Vorabrufanweisung entspricht;

mit einem Registermanager (117, 317):
Detektieren (214) einer Ausräumung des ersten Eintrags, während die ersten Nutzungsinformationen angeben, dass erste Daten als nicht ausreichend genutzt klassifiziert sind, wobei die ersten Daten als nicht ausreichend genutzt klassifiziert werden, wenn die ersten Daten noch mindestens eine vorbestimmte Anzahl von Malen zur Verwendung in einer Ausführungs-Pipeline (106) des Prozessors (101, 300) zu laden sind;

basierend auf der Ausräumung und der Anweisungskennung, Erzeugen (216) eines zweiten Eintrags eines Registers (116, 316) von Vorabrufanweisungen, wobei der zweite Eintrag die Anweisungskennung und einen Wert, der einen Zählwert von zu verwerfenden Vorabrufanweisungen repräsentiert, umfasst;

mit einer Vorabrufsteuerung (118, 318), Verhindern (218) einer Ausführung einer zweiten Vorabrufanweisung basierend auf dem zweiten Eintrag; und

mit dem Registermanager (117, 317) basierend auf einer Detektion der zweiten Vorabrufanweisung, Aktualisieren des Werts zum Dekrementieren des Zählwerts von zu verwerfenden Vorabrufanweisungen,

wobei das Verfahren ferner Folgendes umfasst:
durch die Vorabrufsteuerung (118, 318):
Durchführen (512) einer ersten Durchsuchung des TLB (110, 310) basierend auf einer Adresse, die der zweiten Vorabrufanweisung entspricht;

Detektieren (514) eines Miss basierend auf der ersten Durchsuchung;

als Reaktion auf den Miss, Durchführen (518) einer zweiten Durchsuchung des Registers (116, 316) von Vorabrufanweisungen basierend auf einer Anweisungskennung, die der zweiten Vorabrufanweisung entspricht; und

Detektieren (520) eines Hit des zweiten Eintrags basierend auf der zweiten Durchsuchung;

wobei das Verhindern der Ausführung der zweiten Vorabrufanweisung basierend auf dem zweiten Eintrag Verhindern der Ausführung basierend auf dem Hit umfasst.
Verfahren nach Anspruch 8, wobei der erste Eintrag die ersten Nutzungsinformationen umfasst.
Verfahren nach Anspruch 8, wobei das Verfahren ferner Folgendes umfasst: mit der Vorabrufsteuerung (118, 318), Detektieren, basierend auf dem Hit des zweiten Eintrags, dass der Zählwert von zu verwerfenden Vorabrufanweisungen größer als null ist; und
wobei das Verhindern der Ausführung basierend auf dem Hit Verhindern der Ausführung basierend auf dem Zählwert umfasst.
Verfahren nach Anspruch 8 oder Anspruch 9, wobei die Anweisungskennung auf einem Wert eines Anweisungszeigers basiert.