DE112007003007T5 - Verfahren und Vorrichtung für die Energieverwaltung bei einem Prozessor - Google Patents

Verfahren und Vorrichtung für die Energieverwaltung bei einem Prozessor Download PDF

Info

Publication number
DE112007003007T5
DE112007003007T5 DE112007003007T DE112007003007T DE112007003007T5 DE 112007003007 T5 DE112007003007 T5 DE 112007003007T5 DE 112007003007 T DE112007003007 T DE 112007003007T DE 112007003007 T DE112007003007 T DE 112007003007T DE 112007003007 T5 DE112007003007 T5 DE 112007003007T5
Authority
DE
Germany
Prior art keywords
performance
state
core
processor
turbo mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE112007003007T
Other languages
English (en)
Inventor
Efraim Rotem
Anil Portland Aggarwal
Russell Beaverton Fenger
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp of America
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of DE112007003007T5 publication Critical patent/DE112007003007T5/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/324Power saving characterised by the action undertaken by lowering clock frequency
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Abstract

Verfahren zum Einstellen eines Zustandes des Leistungsverhaltens eines Prozessors, für den ein Turbomodus aktiviert ist, das aufweist:
Bestimmen eines effektiven Zustandes des Leistungsverhaltens über eine vorbestimmte Zeitdauer basierend auf einem Verhältnis aus einer geforderten Kernfrequenz und einer tatsächlichen Kernfrequenz; und
Setzen des Prozessors, für den ein Turbomodus aktiviert ist, basierend auf dem effektiven Zustand des Leistungsverhaltens in einen Zustand des Leistungsverhaltens für den Turbomodus.

Description

  • HINTERGRUND DER ERFINDUNG
  • Bei Computersystemen, zum Beispiel Computersystemen, die einen universellen Mehrkern (on die Chip Multi-Processing(CMP))-Prozessor und genauer einen CMP-Prozessor, der adaptive Energieverwaltungsstrategien einsetzt, verwenden, passt sich der Zustand des Leistungsverhaltens (P-Zustand) des Prozessors auf Anforderung an. Wenn die Auslastung der zentralen Verarbeitungseinheit (CPU – Central Processor Unit) abnimmt, kann der Prozessor in einen Zustand niedrigeren Leistungsverhaltens übergehen, um Energie zu sparen. Wenn die Auslastung der CPU zunimmt, kann der Prozessor in einen Zustand höheren Leistungsverhaltens übergehen und darf mehr Energie verbrauchen.
  • Bei vorhandenen Betriebssystemen basiert die Auswahl eines ins Ziel gefassten P-Zustandes auf der Kombination der Auslastung der CPU und dem letzten ausgewählten P-Zustand. Bei einem Prozessor, der zu einem Turbomodus (TM – Turbo Mode) in der Lage ist, kann bei dem zuletzt ausgewählten P-Zustand die Frequenz des Prozessors auf eine höchste Frequenz wachsen, die verfügbar ist, wenn thermische Randbedingungen sie erlauben, wobei die tatsächliche Frequenz, mit der der Prozessor läuft, nicht immer dem letzten ausgewählten P-Zustand entsprechen muss. Dies wird zu einer unrichtigen Auswahl des ins Ziel gefassten P-Zustands führen, was eine unerwünschte Verschlechterung des Leistungsverhaltens nach sich zieht.
  • Advanced Configuration and Power Interface (ACPI) ist ein Energieverwaltungssystem, das es dem Betriebssystem eines Computers erlaubt, die Menge an Energie zu steuern, die von der CPU und dem Peripheriegeräten des Computersystems verbraucht wird. Bei einem vorhandenen ACPI-Prozessor, der Information über den P-Zustand enthält, ist jede auswählbare Kernfrequenz mit entsprechender Steuer-, Status- und Wartezeitinformation dargestellt. Ein Ersetzen der höchsten Frequenz des letzten ausgewählten P-Zustandes durch eine TM-Frequenz kann zu einem erhöhten Verbrauch zusätzlicher Verarbeitungsenergie führen, wenn dies gar nicht nötig ist. Weiterhin kann dieses zu einer Verschlechterung des Leistungsverhaltens führen, hervorgerufen durch Fluktuationen des P-Zustandes aufgrund unnötiger Übergänge in den TM.
  • KURZBBESCHREIBUNG DER ZEICHNUNGEN
  • Der Gegenstand, der als die Erfindung betrachtet wird, ist in dem abschließenden Bereich des Dokuments (Ansprüche) besonders dargelegt und eindeutig beansprucht. Die Erfindung jedoch, sowohl was die Organisation als auch das Betriebsverfahren betrifft, zusammen mit Aufgaben, Merkmalen und ihren Vorteilen, kann am Besten durch Bezugnahme auf die folgende genaue Beschreibung verstanden werden, wenn sie zusammen mit dem begleitenden Zeichnungen gelesen wird, in denen:
  • 1 eine schematische Veranschaulichung eines Blockschaubildes eines Computersystems gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung ist;
  • 2 eine schematische Veranschaulichung eines Blockschaubildes eines Teils einer Prozessorplattform gemäß einer beispielhaften Ausführungsform der Erfindung ist; und
  • 3 eine Veranschaulichung eines Ablaufdiagramms eines Verfahrens zum Berechnen eines ins Ziel gefassten P-Zustand bei Prozessoren, die zu einem Turbomodus in der Lage sind, gemäß beispielhafter Ausführungsformen der Erfindung ist.
  • Es wird verstanden werden, dass aus Gründen der Einfachheit und Klarheit der Veranschaulichung Elemente, die in den Figuren gezeigt sind, nicht notwendigerweise maßstabsgetreu gezeichnet sind. Zum Beispiel können die Abmessungen einiger der Elemente aus Gründen der Klarheit in Bezug auf andere Elemente übertrieben sein. Weiter können, wenn dies als zweckmäßig angesehen wird, Bezugsziffern bei den Figuren wiederholt werden, um entsprechende oder analoge Elemente anzuzeigen.
  • GENAUE BESCHREIBUNG DER ERFINDUNG
  • In der folgenden genauen Beschreibung sind zahlreiche bestimmte Einzelheiten aufgeführt, um für ein gründliches Verständnis der Erfindung zu sorgen. Es wird jedoch von den Durchschnittsfachleuten verstanden werden, dass die vorliegende Erfindung ohne diese bestimmten Einzelheiten in die Praxis umgesetzt werden kann. In anderen Fällen sind gut bekannte Ver fahren, Prozeduren, Komponenten und Schaltungen nicht in Einzelheiten beschrieben worden, um die vorliegende Erfindung nicht zu verschleiern.
  • Einige Teile der genauen Beschreibung, die folgen, sind in Form von Algorithmen und symbolischen Darstellungen von Arbeitsschritten auf Datenbits oder binären digitalen Signalen innerhalb eines Speichers eines Computers dargestellt. Diese algorithmischen Beschreibungen und Darstellungen können die Techniken sein, die von den Fachleuten auf dem Gebiet der Datenverarbeitung verwendet werden, um das Wesen ihrer Arbeit an andere Fachleute weiterzugeben.
  • Wenn es nicht anders besonders angegeben ist, wie es aus den folgenden Diskussionen deutlich wird, wird verstanden, dass in der Beschreibung Diskussionen, die Ausdrücke so wie ”Verarbeiten”, ”Berechnen”, ”Ausrechnen”, ”Bestimmen” oder dergleichen sich auf die Tätigkeit und/oder Prozesse eines Computers oder eines Rechensystems oder einer ähnlichen elektronischen Rechenvorrichtung beziehen, die Daten, die als physikalische, so wie elektronische, Größen innerhalb der Register und/oder Speicher des Rechensystems dargestellt sind, manipulieren und/oder in andere Daten umwandeln, die in ähnlicher Weise als physikalische Größen innerhalb der Speicher, Register oder anderer derartiger Informationsspeicher des Systems, in Sende- oder Anzeigevorrichtungen dargestellt sind. Zusätzlich kann der Ausdruck ”Vielzahl” in der Beschreibung verwendet werden, um zwei oder mehr Komponenten, Baugruppen, Elemente, Parameter und dergleichen zu beschreiben. Zum Beispiel beschreibt ”Vielzahl von Befehlen” zwei oder mehr Befehle.
  • Es sollte verstanden werden, dass die vorliegende Erfindung in einer Vielfalt von Anwendungen verwendet werden kann. Obwohl die vorliegende Erfindung in dieser Hinsicht nicht beschränkt ist, können die Schaltungen und Techniken, die hierin offenbart sind, in vielen Vorrichtungen eingesetzt werden, so wie Computersystemen, Prozessoren, einer CPU oder dergleichen. Prozessoren, für die beabsichtigt ist, dass sie im Umfang der vorliegenden Erfindung enthalten sind, umfassen, lediglich beispielhaft, einen Computer mit verringertem Befehlssatz (RISC – Reduced Instructions Set Computer), einen Prozessor, der eine Pipeline hat, einen Computer mit komplexem Befehlssatz (CISC – Complex Instruction Set Computer), einen Mehrkernprozessor, eine Computerplattform und dergleichen.
  • Einige Ausführungsform der Erfindung können implementiert werden, indem zum Beispiel ein maschinenlesbares Medium oder ein Gegenstand verwendet werden, die einen Befehl oder einen Satz aus Befehlen speichern können, der, wenn er von einer Maschine ausgeführt wird (zum Beispiel von einem Prozessor und/oder von anderen geeigneten Maschinen), bewirkt, dass die Maschine ein Verfahren und/oder Arbeitsschritte gemäß Ausführungsformen der Erfindung ausführt. Eine derartige Maschine kann zum Beispiel irgendeine geeignete Verarbeitungsplattform, Rechenplattform, Recheneinheit, Verarbeitungseinheit, ein Rechensystem, Verarbeitungssystem, Computer, Prozessor oder dergleichen umfassen und kann implementiert werden, indem irgendeine geeignete Kombination aus Hardware und/oder Software verwendet wird. Das maschinenlesbare Medium oder der Gegenstand können zum Beispiel irgendeinen geeigneten Typ einer Speichereinheit, Speicherbaugruppe, einen Speichergegenstand, ein Speichermedium, eine Ablagebeugruppe, einen Ablagegegenstand, ein Ablagemedium und/oder eine Ablageeinheit umfassen, zum Beispiel Speicher, entfernbare oder nicht entfernbare Medien, löschbare oder nicht löschbare Medien, beschreibbare oder wiederbeschreibbare Medien, digitale oder analoge Medien, eine Festplatte, eine Floppy-Disk, einen Nur-Lese-Speicher als Compact Disk (CD-ROM – Compact Disk Read Only Memory), eine beschreibbare Compact Disk (CD-R – Compact Disk Recordable), eine wiederbeschreibbare Compact Disk (CD-RW – Compact Disk Rewriteable), eine optische Platte, magnetische Medien, verschiedene Typen digitaler Mehrzweckplatten (DVDs – Digital Versatile Disks), ein Band, eine Kassette oder dergleichen. Die Befehle können irgendeinen geeigneten Codetyp umfassen, zum Beispiel Quellencode, kompilierten Code, interpretierten Code, ausführbaren Code, statischen Code, dynamischen Code oder dergleichen, und können implementiert werden, indem irgendeine geeignete objektorientierte, visuelle, kompilierte und/oder interpretierte Programmiersprache auf hoher Ebene oder niedriger Ebene verwendet wird, z. B. C, C++, Java, BASIC, Pascal, Fortran, Cobol, Assembliersprache, Maschinencode oder dergleichen.
  • Der 1 zugewandt ist ein Blockschaubild eines Computersystems 100 gemäß einer beispielhaften Ausführungsform der Erfindung gezeigt. Obwohl der Umfang der vorliegenden Erfindung in dieser Hinsicht nicht beschränkt ist, kann das Computersystem 100 ein Personal Computer (PC), ein persönlicher digitaler Assistent (PDA – Personal Digital Assistant), eine Internetanwendung, ein Mobiltelefon, ein Laptop-Computer, eine mobile Einheit, ein drahtloses Kommunikationsgerät und/oder irgendeine anderes Verarbeitungsgerät sein.
  • Gemäß beispielhaften Ausführungsformen der Erfindung kann das Computersystem 100 eine Hauptverarbeitungseinheit 110 umfassen, die von einer Energieversorgung 120 versorgt wird. Gemäß beispielhaften Ausführungsformen der vorliegenden Erfindung kann die Hauptverarbeitungseinheit 110 einen Prozessor 130, der zu einem Turbomodus (TM) in der Lage ist, umfassen, der elektrisch über eine System-Kopplungsstruktur 135 mit einer Speichereinheit 140 und einer oder mehreren Schnittstellenschaltungen 150 gekoppelt ist. Zum Beispiel kann die System-Kopplungsstruktur 135 ein Adress/Datenbus sein, falls dies gewünscht ist. Es sollte verstanden werden, dass andere Kopplungsstrukturen als Busse verwendet werden können, um den TM-fähigen Prozessor 130 mit der Speichereinheit 140 zu verbinden. Zum Beispiel können eine oder mehrere besondere Leitungen und/oder ein Crossbar verwendet werden, um den Prozessor 130 mit der Speichereinheit 140 zu verbinden.
  • Gemäß einigen Ausführungsformen der Erfindung kann der TM-fähige Prozessor 130 ein Betriebssystem 139 und eine CPU 136 umfassen, die einen oder mehrere Kerne 137 enthält. Das Betriebssystem 139 kann eine ACPI 132 und eine Energieverwaltungsanwendung 134 für das Betriebssystem (OSPM – Operating System Power Management) ausführen, wenn dies gewünscht wird. Zusätzlich kann der Prozessor 130 einen Cache-Speicher (nicht gezeigt) enthalten, so wie zum Beispiel einen statischen Speicher mit wahlfreiem Zugriff (SRAM – Static Random Access Memory) und dergleichen oder irgendeinen anderen Typ eines internen integrierten Speichers. Die Speichereinheit 140 kann einen dynamischen Speicher mit wahlfreiem Zugriff (DRAM – Dynamic Random Access Memory), einen nicht flüchtigen Speicher oder dergleichen umfassen. Bei einem Beispiel kann die Speichereinheit 140 ein Softwarepro gramm speichern, das von dem Prozessor 130 ausgeführt werden kann, wenn dies gewünscht ist.
  • Obwohl der Umfang der vorliegenden Erfindung in dieser Hinsicht nicht beschränkt ist, kann die/können die Schnittstellenschaltung(en) 150 eine Ethernet-Schnittstelle und/oder eine universelle serielle Bus(USB – Universal Serial Bus)-Schnittstelle und/oder dergleichen umfassen. Bei einigen beispielhaften Ausführungsformen der Erfindung können eine oder mehrere Eingabevorrichtungen 160 mit den Schnittstellenschaltungen 150 verbunden sein, um Daten und Befehle in die Hauptverarbeitungseinheit 110 einzugeben. Zum Beispiel können die Eingabevorrichtungen 160 eine Tastatur, eine Maus, einen Berührungsbildschirm, einen Trackpad, eine Rollkugel, einen Isopointer, ein Spracherkennungssystem und/oder dergleichen umfassen.
  • Obwohl der Umfang der vorliegenden Erfindung in dieser Hinsicht nicht beschränkt ist, können die Ausgabevorrichtungen 170 betrieblich über eine oder mehrere der Schnittstellenschaltungen 150 mit der Hauptverarbeitungseinheit 110 gekoppelt sein und können eine oder mehrere Anzeigen, Drucker, Lautsprecher und/oder andere Ausgabevorrichtungen umfassen, wenn dies gewünscht ist. Zum Beispiel kann eine der Ausgabevorrichtungen eine Anzeige sein. Die Anzeige kann eine Kathodenstrahlröhre (CRT – Cathode Ray Tube), eine Flüssigkristallanzeige (LCD – Liquid Crystal Display) oder irgendein anderer Typ einer Anzeige sein.
  • Gemäß einigen Ausführungsformen der Erfindung kann das Computersystem 100 eine oder mehrere Speichereinheiten 180 umfassen. Zum Beispiel kann das Computersystem 100 ein oder mehrere Festplattenlaufwerke, ein oder mehrere Laufwerke für Compact Disks (CD), ein oder mehrere Laufwerke für digitale Mehrzweckplatten (DVD) und/oder weitere Eingabe/Ausgabe(I/O – Input/Output)-Einheiten für Computermedien umfassen, wenn dies gewünscht ist.
  • Gemäß einer beispielhaften Ausführungsform der vorliegenden Erfindung kann das Computersystem 100 Daten mit anderen Einheiten über eine Verbindung zu einem Netzwerk 190 austauschen. Die Netzwerkverbindung kann irgendeinen Typ einer Netzwerkverbindung umfassen, so wie eine Ethernet-Verbindung, eine digitale Teilnehmerleitung (DSL – Digital Subscriber Line), eine Telefonleitung, ein Koaxialkabel usw. Das Netzwerk 190 kann irgendein Typ eines Netzwerks sein, so wie das Internet, ein Telefonnetzwerk, ein Kabelnetzwerk, ein drahtloses Netzwerk, so wie zum Beispiel ein Netzwerk, das mit dem IEEE-Standard 802.11, 1999, verträglich ist, einschließlich einem oder mehreren mit dem IEEE 802.11 verwandten Standards, dem IEEE802.16 für drahtlose Mittelbereichsnetzwerke und/oder dergleichen.
  • Gemäß einer beispielhaften Ausführungsform der Erfindung kann der TM-fähige Prozessor 130 mit zwei oder mehr Betriebsfrequenzen arbeiten. Eine Auswahl der Betriebsfrequenz für den TM-fähigen Prozessor 130 kann durch die OSPM 134 basierend auf der Belastung des TM-fähigen Prozessors 130 geschehen, die über ein Zeitfenster beobachtet wird, falls dies gewünscht ist. Im Turbomodus kann die ACPI 132 einen ins Ziel gefassten P-Zustand an die OSPM 134 liefern. Die OSPM 134 kann einen Zielpunkt für den Energieverbrauch einstellen und kann die Betriebsfrequenz und/oder -spannung des Prozessors entsprechend dem ausgewählten Eintrag in dem ins Ziel gefassten P-Zustand abändern. Bei einigen Ausführungsformen der Erfindung kann der ins Ziel gefasste P-Zustand, der zu dem Turbomodus des Prozessors in Bezug steht, von einem Basis-Eingabe/Ausgabe-System (BIOS – Basic Input Output System) 145 zur Verfügung gestellt werden. Dieser turbobezogene P-Zustand kann sich auf die höchste Betriebsfrequenz des Prozessors im Turbomodus beziehen. Die Logik der OSPM 134 kann den geeigneten P-Zustand, der benötigt wird, um die Anforderungen des Leistungsverhaltens des Computersystems 100 zu erfüllen, genau auswählen. Es sollte verstanden werden, dass die ACPI 132 und/oder die OSPM 134 in Hardware, in Software und/oder durch irgendeine Kombination aus Hardware und/oder Software implementiert werden können.
  • Der 2 zugewandt ist ein Blockschaubild eines Teiles einer Verarbeitungsplattform 200 gemäß einer beispielhaften Ausführungsform der Erfindung gezeigt. Obwohl der Umfang der vorliegenden Erfindung in dieser Hinsicht nicht beschränkt ist, kann der Teil der Verarbeitungsplattform 200 ein Betriebssystem 205 umfassen, das eine OSPM 210 und eine ACPI 220, eine CPU 225, die Kerne 1 ... N 230 enthält, und ein BIOS 245, das einen Turbomodus 240 und einen oder mehrere Tabellen 250 für P-Zustände enthält, umfassen. Gemäß dieser beispielhaften Ausführungsformen können ein Zähler für tatsächliche Zählwerte (ACNT – Actual Counts) 260 und ein Zähler für maximale Zählwerte (MCNT – Maximum Counts) 270 jeweils mit einem der Kerne 1 ... N 230 betrieblich gekoppelt sein.
  • Gemäß beispielhaften Ausführungsformen der Erfindung kann die TM-fähige Verarbeitungsplattform 200 eine OSPM 210, eine ACPI 220, einen ACNT 260 und einen MCNT 270 und Tabellen 250 für den P-Zustand verwenden, um für die Kerne 1 ... N 230 der Verarbeitungsplattform 200 einen optimalen P-Zustand einzustellen, während der TM-fähige Prozessor im Turbomodus 240 läuft.
  • Gemäß beispielhaften Ausführungsformen der Erfindung können die Tabellen 230 für P-Zustände die nachstehende Tabelle, z. B. Tabelle 1, für jeden Kern 1 ... N der Verarbeitungsplattform 200 umfassen.
    P-Zustand PSS-Frequenz % der maximalen Frequenz Zuwachswert Abnahmewert
    P0 3001 100 101 98
    P1 3000 99 98 84
    P2 2666 88 85 73
    P3 2333 77 74 62
    P4 2000 66 63 0
    Tabelle 1
  • Die Tabelle 1 kann eine Vielzahl auswählbarer P-Zustände (z. B. P0, P1 ... P4) enthalten. Die OSPM 210 kann einen ausgewählten P-Zustand verwenden, um eine Betriebsfrequenz und eine Betriebsspannung für jeden der Kerne 1 ... N 230 unabhängig einzustellen. Weiterhin kann die Tabelle 1 ein Befehlswort enthalten, das mit jedem P-Zustand verknüpft ist. Das Befehlswort kann Parameter des ausgewählten P-Zustands (z. B. PSS-Frequenz, % der maximalen Frequenz, Zuwachswert, Abnahmewert und dergleichen) herunterladen, um die CPU 225 in den gewünschten P-Zustand zu steuern und zu setzen. Zum Beispiel können die auswählbaren P-Zustände P1–P4 eine tatsächlich auswählbare Betriebsfrequenz (z. B. eine PSS-Frequenz) der CPU 225 enthalten. Wenn zum Beispiel P1 ausgewählt wird, kann die Betriebsfrequenz der CPU 225 auf 3000 MHz eingestellt werden.
  • Obwohl der Umfang der vorliegenden Erfindung nicht auf diese beispielhafte Tabelle für die P-Zustände beschränkt ist, ist P0 ein P-Zustand für den Turbomodus und kann ausgewählt werden, wenn der TM-fähige Prozessor im Turbomodus 240 läuft. Die PSS-Frequenz von P0 stellt jedoch keine tatsächlich auswählbare Frequenz dar, sondern umfasst ACPI-Information über die TM-Frequenz (z. B. 3333 MHz), die durch eine Zahl dargestellt ist, die höher ist als die tatsächlich auswählbare Frequenz für den Kern. Zum Beispiel ist in Tabelle 1 die Zahl für den Zustand P0 die tatsächlich höchste ausgewählte Frequenz plus 1 (z. B. 3001 MHz). Das Schreiben eines Steuerwortes und/oder eines Befehls in die CPU 225 oder in einen ihrer Kerne (z. B. Kern 1 ... N 230), um die Frequenz von P1 auf die von P0 zu ändern, wird die CPU 225 in den TM bringen. Zum Beispiel kann das Schreiben des Befehlswortes, das mit 3001 MHz in Tabelle 1 verknüpft ist, die CPU so einstellen, dass sie mit einer höchstmöglichen Frequenz, z. B. 3333 MHz, läuft, die dann unterschiedlich von der Frequenz ist, die in Tabelle 1 angegeben ist (z. B. 3001 MHz). Die Nicht-Turbo-Frequenz von 3001 MHz bei diesem Beispiel kann als ”garantierte” Frequenz betrachtet werden, die in der CPU-Tabelle dargelegt wird, während die 3333 MHz die tatsächliche ”Turbo”-Frequenz sind, obwohl der Umfang der vorliegenden Erfindung in dieser Hinsicht nicht beschränkt ist.
  • Gemäß einigen Ausführungsformen der Erfindung kann P0 nur ausgewählt werden, wenn ein Kern der Verarbeitungsplattform 200 im Turbomodus 240 arbeitet. Im Zustand P0 können die CPU 225 und/oder wenigstens einer ihrer Kerne 1 ... N 230 ihre maximalen Möglichkeiten für das Leistungsverhalten nutzen und dürfen maximale Energie verbrauchen. Andere Zustande aus den Tabellen für die P-Zustände können den Energieverbrauchszustand der Kerne 1 ... N 230 während des normalen Betriebsmodus darstellen. Zum Beispiel stellt der Zustand P1 eine tatsächliche garantierte Frequenz (z. B. 3000 MHz) dar. Bei diesem Leistungszustand für das Leistungsverhalten ist die Möglichkeit des Leistungsverhaltens des Prozessors unter sein Maximum beschränkt, und er verbraucht weniger als die maximale Energie. In den P-Zuständen P2–P4 kann die Möglichkeit des Leistungsverhaltens des Prozessors bis zu seinem minimalen Wert (bei P4) vermindert sein, und er verbraucht minimale Energie, wobei er in einem aktiven Zustand verbleibt.
  • Obwohl der Umfang der vorliegenden Erfindung in dieser Hinsicht nicht beschränkt ist, können die Einstellungen für einen hohen und einen niedrigen P-Zustand in den ”maschinenspezifischen Registern (MSRs – Machine Specific Registers)” der CPU gespeichert werden, während zusätzliche Kombinationen der P-Zustände im BIOS 245 gespeichert werden können. Indem zusätzliche Einstellungen für die P-Zustände zur Verfügung gestellt werden, kann das Betriebssystem 205 die CPU 225 oder wenigstens einen ihrer Kerne 1 ... N 230 mit größerer Genauigkeit auf das optimale Leistungsverhalten und die Energieeinstellung für eine bestimmte Arbeitslast feinabstimmen.
  • Gemäß einigen weiteren Ausführungsformen der Erfindung muss die Tabelle 1 die Frequenz nicht direkt kodieren. Statt dessen kann die Tabelle die Einstellung für einen Multiplikator speichern, mit dem eine Frequenz des Frontside-Bus multipliziert wird, um die Kernfrequenz zu erzeugen. Bei diesem Ansatz kann der TM nur verwendet werden, wenn die Kernauslastung die Notwendigkeit nach zusätzlicher Verarbeitungsleistung erfordert, und da die TM-Frequenz nicht garantiert ist, kann die OSPM 210 den P-Zustand basierend auf dem Zuwachs und der Abnahme bei der Kernauslastung erhöhen oder erniedrigen.
  • Gemäß einigen Ausführungsformen der Erfindung können der ACNT 260 und der MCNT 270 verwendet werden, um einen ins Ziel gefassten P-Zustand einzustellen. Zum Beispiel kann der MCNT 270 die maximale Anzahl von Ausführungstakten an der maximalen Kernfrequenz im Nicht-Turbomodus zählen und der ACNT 260 kann die Anzahl der Ausführungs takte bei der tatsächlichen Kernfrequenz zählen. Das Verhältnis von (ACNT/MCNT)·100 kann von der OSPM 210 verwendet werden, um den geeigneten P-Zustand genau auszuwählen, der benötigt wird, um die Anforderungen an das Leistungsverhalten des Systems zu erfüllen. Wenn zum Beispiel das Verhältnis größer ist als 100%, kann dies angeben, dass der Kern im Turbomodus ist, und P0 kann ausgewählt werden. Die OSPM 210 kann der ACPI 220 befehlen, die Frequenz auf die maximale Betriebsfrequenz zu erhöhen, falls dies gewünscht ist. Der Befehl kann in einem Befehlsregister (nicht gezeigt) gespeichert sein und kann eine Zahl (z. B. 3.4, 3.2 usw.) enthalten. Die Zahl kann die gewünschte Betriebsfrequenz des Kerns entsprechend dem ausgewählten P-Zustand darstellen.
  • Der 3 zugewandt ist eine Veranschaulichung eines Ablaufdiagramms eines Verfahrens zum Berechnen des ins Ziel gefassten P-Zustands bei Prozessoren, die zu einem Turbomodus in der Lage sind, gemäß beispielhafter Ausführungsformen der Erfindung gezeigt. Gemäß einigen Ausführungsformen der Erfindung kann das Verfahren zum Berechnen des ins Ziel gefassten P-Zustandes bei TM-fähigen Prozessoren (z. B. dem TM-fähigen Prozessor 130) eine über Hardware koordinierte Rückkopplung verwenden, die von den Zählern (tatsächlicher Zählwert) ACNT und (maximaler Zählwert) MCNT zur Verfügung gestellt wird. Der MCNT kann die maximale Anzahl von Ausführungstakten bei der maximalen Kernfrequenz im Nicht-Turbomodus zählen und der ACNT kann die Anzahl der Ausführungstakte bei der tatsächlichen Kernfrequenz zählen.
  • Gemäß diesem beispielhaften Verfahren des Berechnens des ins Ziel gefassten P-Zustandes wird, um einen effektiven P-Zustand über eine vorbestimmte Zeitdauer festzulegen, das Verhältnis ACNT/MCNT berechnet (Textblock 310). Zum Beispiel kann der effektive P-Zustand P-Zustandeffektiv = (ACNT/MCNT)·100 sein. Wenn das P-Zustandeffektiv größer als 100% ist, kann die OSPM den P-Zustand auf einen P-Zustand im Turbomodus gesetzt haben.
  • Gemäß dieser beispielhaften Ausführungsform der Erfindung wird der ins Ziel gefasste P-zustand berechnet, indem der berechnete effektive P-Zustand (z. B. P-Zustandeffektiv) mit einem Auslastungswert der CPU (z. B. % ausgelastet) multipliziert wird. P-ZustandZiel = ausgelastet·P-Zustandeffektiv (Textblock 320). Wenn der ins Ziel gefasste P-Zustand vom aktuellen P-Zustand verschieden ist (Entscheidungsblock 330), dann kann die OSPM einen logischen Prozessor oder einen Kern in einen neuen P-Zustand bringen und die Zähler ACNT und MCNT zurücksetzen (Textblock 340). Wenn der ins Ziel gefasste P-Zustand im Wesentlichen gleich dem aktuellen P-Zustand ist, kann der aktuelle P-Zustand ungeändert bleiben, obwohl der Umfang der vorliegenden Erfindung in keiner Weise in dieser Hinsicht beschränkt ist.
  • Gemäß beispielhaften Ausführungsformen der Erfindung kann bei TM-fähigen Prozessoren, wenn der Prozessor im Turbomodus läuft, das Verhältnis von ACNT/MCNT größer als 100% sein, und die OSPM-Logik kann den P-Zustand für den TM auswählen. Zusätzlich kann ein ACPI P-Zustand-Steueralgorithmus einen Energieverbrauch über die Laufzeit des TM-fähigen Prozessors entsprechend dem gewünschten Leistungsverhalten des Prozessors optimieren. Ein ACPI P-Zustand-Steueralgorithmus kann dynamisch die Betriebsfrequenz jedes Kerns eines TM-fähigen Prozessors entsprechend einer Belastung des Prozessors bei der Ausführung von Software anpassen.
  • Obwohl bestimmte Merkmale der Erfindung hierin veranschaulicht und beschrieben worden sind, werden nun den Fachleuten viele Modifikationen, Substitutionen, Änderungen und Äquivalente in den Sinn kommen. Es soll daher verstanden werden, dass die angefügten Ansprüche so gedacht sind, dass sie alle derartigen Modifikationen und Änderungen abdecken, wenn sie in den wahren Gedanken der Erfindung fallen.
  • ZUSAMMENFASSUNG
  • Kurz gesagt, einen Prozessor und ein Verfahren zum Einstellen eines Zustandes des Leistungsverhaltens bei einem Prozessor, für den ein Turbomodus aktiviert ist. Das Verfahren umfasst das Bestimmen eines effektiven Zustandes des Leistungsverhaltens über eine vorbestimmte Zeitdauer hinweg, das Berechnen eines ins Ziel gefassten Zustandes des Leistungsverhaltens basierend auf der Auslastung des Kerns und dem effektiven Zustand des Leistungsverhaltens über die vorbestimmte Zeitdauer hinweg und das Setzen des Prozessors mit aktiviertem Turbomodus in einen Zustand des Leistungsverhaltens im Turbomodus.

Claims (19)

  1. Verfahren zum Einstellen eines Zustandes des Leistungsverhaltens eines Prozessors, für den ein Turbomodus aktiviert ist, das aufweist: Bestimmen eines effektiven Zustandes des Leistungsverhaltens über eine vorbestimmte Zeitdauer basierend auf einem Verhältnis aus einer geforderten Kernfrequenz und einer tatsächlichen Kernfrequenz; und Setzen des Prozessors, für den ein Turbomodus aktiviert ist, basierend auf dem effektiven Zustand des Leistungsverhaltens in einen Zustand des Leistungsverhaltens für den Turbomodus.
  2. Verfahren nach Anspruch 1, das aufweist: Bestimmen eines effektiven Zustandes des Leistungsverhaltens über eine vorbestimmte Zeit als ein Verhältnis von Ausführungstakten bei einer tatsächlichen Kernfrequenz und Ausführungstakten bei einer maximalen Kernfrequenz im Nicht-Turbomodus.
  3. Verfahren nach Anspruch 1, das aufweist: Berechnen eines ins Ziel gefassten Zustandes des Leistungsverhaltens basierend auf dem effektiven Zustand des Leistungsverhaltens und einer Kernauslastung des Prozessors, für den ein Turbomodus aktiviert ist.
  4. Verfahren nach Anspruch 2, das aufweist: Vergleichen des ins Ziel gefassten Zustand des Leistungsverhaltens mit einem aktuellen Zustand des Leistungsverhaltens; und Neueinstellen des Zustandes des Leistungsverhaltens, wenn der ins Ziel gefasste Zustand des Leistungsverhaltens von dem aktuellen Zustand des Leistungsverhaltens unterschiedlich ist.
  5. Verfahren nach Anspruch 1, bei dem das Einstellen des Prozessors, für den ein Turbomodus aktiviert ist, auf den Zustand des Leistungsverhaltens in dem Turbomodus aufweist: Anfragen eines Zustandes des Leistungsverhaltens im Turbomodus, dargestellt durch eine Zahl, die mit einer höchsten tatsächlichen Kernfrequenz des Prozessors, für den ein Turbomodus aktiviert ist, verknüpft ist.
  6. Verarbeitungsplattform, die aufweist: ein Betriebssystem, um das Leistungsverhalten zweier oder mehrerer Kerne zu steuern; und eine Tabelle für Zustände des Leistungsverhaltens, die einen ersten Eintrag, um eine Information über das Leistungsverhalten im Turbomodus bei einem Kern aus den zwei oder mehr Kernen zur Verfügung stellt, und wenigstens einen zweiten Eintrag, der eine Leistungsverhaltensinformation über den Zustandsmodus des Leistungsverhaltens des Kerns zur Verfügung stellt, umfasst.
  7. Verarbeitungsplattform nach Anspruch 6, bei der das Betriebssystem aufweist: eine Energieverwaltung für das Betriebssystem, um einen Zustand des Leistungsverhaltens des Prozessors entsprechend dem ersten und dem wenigstens zweiten Eintrag der Tabelle zur Steuerung des Leistungsverhaltens des Kerns einzustellen.
  8. Verarbeitungsplattform nach Anspruch 6, bei der das Betriebssystem aufweist: eine Advanced Configuration and Power Interface, die zwei oder mehr Informationen über den Zustand des Leistungsverhaltens umfasst, um es der Energieverwaltung des Betriebssystems zu ermöglichen, den Energieverbrauch von Kernen entsprechend den zwei oder mehr Informationen über den Zustand des Leistungsverhaltens zu steuern.
  9. Verarbeitungsplattform nach Anspruch 8, die aufweist: einen ersten Zähler, der betrieblich mit dem Kern gekoppelt ist, um eine maximale Anzahl von Ausführungstakten bei einer maximalen Kernfrequenz im Nicht-Turbomodus über eine vorbestimmte Zeitdauer zu zählen; und einen zweiten Zähler, der betrieblich mit dem Kern gekoppelt ist, um eine Anzahl von Ausführungstakten bei einer tatsächlichen Kernfrequenz über die vorbestimmte Zeitdauer zu zählen, wobei die Advanced Configuration and Power Interface derart konfiguriert ist, dass sie einen effektiven Zustand des Leistungsverhaltens basierend auf einem Verhältnis des ersten Zählers zu dem zweiten Zähler berechnet.
  10. Verarbeitungsplattform nach Anspruch 8, die aufweist: einen Kern, und bei der die Advanced Configuration and Power Interface in der Lage ist, einen ins Ziel gefassten Zustand des Leistungsverhaltens basierend auf einem effektiven Zustand des Leistungsverhaltens und einem Auslastungswert des Kerns zu berechnen.
  11. Verarbeitungsplattform nach Anspruch 1, bei der das Modul für die Energieverwaltung des Betriebssystems so konfiguriert ist, dass es den Zustand des Leistungsverhaltens entsprechend einer Differenz zwischen dem ins Ziel gefassten Zustand des Leistungsverhaltens und einem aktuellen Zustand des Leistungsverhaltens des Prozessors einstellt.
  12. Verarbeitungsplattform nach Anspruch 9, bei der die Tabelle für Zustände des Leistungsverhaltens aufweist: einen ausgewählten Turbozustand des Leistungsverhaltens und einen oder mehrere auswählbare tatsächliche Zustände des Leistungsverhaltens, wobei der auswählbare Turbozustand des Leistungsverhaltens ausgewählt wird, wenn der effektive Zustand des Leistungsverhaltens höher als 100% liegt.
  13. Computersystem, das aufweist: eine Flüssigkristallanzeige, die betrieblich mit einer Rechenplattform gekoppelt ist, wobei die Rechenplattform aufweist: ein Betriebssystem, um das Leistungsverhalten von zwei oder mehr Kernen zu steuern; und eine Tabelle für Zustände des Leistungsverhaltens, die einen ersten Eintrag, um Information über das Leistungsverhalten eines Kernes aus den zwei oder mehr Kernen im Turbomodus zur Verfügung zu stellen, und wenigstens einen zweiten Eintrag, um Leistungsverhaltensinformation des Zustandsmodus des Leistungsverhaltens des Kerns zur Verfügung zu stellen, umfasst.
  14. Computersystem nach Anspruch 13, bei dem das Betriebssystem aufweist: eine Energieverwaltung für das Betriebssystem, um einen Zustand des Leistungsverhaltens des Prozessors gemäß dem ersten und den wenigstens zweiten Eintrag der Tabelle zum Steuern des Leistungsverhaltens des Kerns einzustellen.
  15. Computersystem nach Anspruch 13, bei dem das Betriebssystem aufweist: eine Advanced Configuration and Power Interface, die zwei oder mehr Informationen über den Zustand des Leistungsverhaltens umfasst, um es der Energieverwaltung des Betriebssystems zu ermöglichen, den Energieverbrauch von Kernen entsprechend den zwei oder mehr Informationen über den Zustand des Leistungsverhaltens zu steuern.
  16. Computersystem nach Anspruch 15, bei dem die Rechenplattform aufweist: einen ersten Zähler, der betrieblich mit dem Kern gekoppelt ist, um eine maximale Anzahl von Ausführungstakten bei einer maximalen Kernfrequenz in einem Nicht-Turbo-Modus über eine vorbestimmte Zeitdauer zu zählen; und einen zweiten Zähler, der betrieblich mit dem Kern gekoppelt ist, um eine Anzahl von Ausführungstakten bei einer tatsächlichen Kernfrequenz über die vorbestimmte Zeitdauer zu zählen, wobei die Advanced Configuration and Power Interface so konfiguriert ist, dass sie einen effektiven Zustand des Leistungsverhaltens basierend auf einem Verhältnis des ersten Zählers zu dem zweiten Zähler berechnet.
  17. Computersystem nach Anspruch 15, bei dem die Rechenplattform aufweist: einen Kern, und bei dem die Advanced Configuration and Power Interface in der Lage ist, einen ins Ziel gefassten Zustand des Leistungsverhaltens basierend auf einem effektiven Zustand des Leistungsverhaltens und einem Auslastungswert des Kerns zu berechnen.
  18. Computersystem nach Anspruch 17, bei dem das Modul für die Energieverwaltung des Betriebssystems so konfiguriert ist, dass es den Zustand der Leistungsfähigkeit entsprechend einer Differenz zwischen dem ins Ziel gefassten Zustand der Leistungsfähigkeit und einem aktuellen Zustand der Leistungsfähigkeit des Prozessors einstellt.
  19. Computersystem nach Anspruch 17, bei dem die Tabelle für Zustände des Leistungsverhaltens aufweist: einen auswählbaren Turbozustand des Leistungsverhaltens und einen oder mehrere auswählbare tatsächliche Zustände des Leistungsverhaltens, wobei der auswählbare Turbozustand des Leistungsverhaltens ausgewählt wird, wenn der effektive Zustand des Leistungsverhaltens höher als 100% liegt.
DE112007003007T 2006-12-14 2007-10-30 Verfahren und Vorrichtung für die Energieverwaltung bei einem Prozessor Ceased DE112007003007T5 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US68370006A 2006-12-14 2006-12-14
US11/683,700 2006-12-14
PCT/US2007/082959 WO2008073597A1 (en) 2006-12-14 2007-10-30 Method and apparatus of power management of processor

Publications (1)

Publication Number Publication Date
DE112007003007T5 true DE112007003007T5 (de) 2009-10-15

Family

ID=39512073

Family Applications (1)

Application Number Title Priority Date Filing Date
DE112007003007T Ceased DE112007003007T5 (de) 2006-12-14 2007-10-30 Verfahren und Vorrichtung für die Energieverwaltung bei einem Prozessor

Country Status (3)

Country Link
CN (1) CN101558383B (de)
DE (1) DE112007003007T5 (de)
WO (1) WO2008073597A1 (de)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9098274B2 (en) 2009-12-03 2015-08-04 Intel Corporation Methods and apparatuses to improve turbo performance for events handling
US8793515B2 (en) * 2011-06-27 2014-07-29 Intel Corporation Increasing power efficiency of turbo mode operation in a processor
CN102708784A (zh) * 2012-07-02 2012-10-03 深圳市开立科技有限公司 一种显示屏上电管理系统和方法
US9996400B2 (en) * 2013-05-23 2018-06-12 Renesas Electronics Corporation Multi-CPU system and multi-CPU system scaling method
JP6986136B2 (ja) * 2018-03-28 2021-12-22 富士フイルム株式会社 画像処理システム、画像処理方法、及び情報処理装置
KR102105681B1 (ko) * 2018-10-23 2020-04-28 울산과학기술원 이기종 컴퓨팅 시스템의 제어 방법 및 장치

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6988211B2 (en) * 2000-12-29 2006-01-17 Intel Corporation System and method for selecting a frequency and voltage combination from a table using a selection field and a read-only limit field
US7089430B2 (en) * 2001-12-21 2006-08-08 Intel Corporation Managing multiple processor performance states
US7076672B2 (en) * 2002-10-14 2006-07-11 Intel Corporation Method and apparatus for performance effective power throttling
US7290161B2 (en) * 2003-03-24 2007-10-30 Intel Corporation Reducing CPU and bus power when running in power-save modes
US7240223B2 (en) * 2003-05-07 2007-07-03 Apple Inc. Method and apparatus for dynamic power management in a processor system
CN100365543C (zh) * 2006-03-10 2008-01-30 浙江大学 内核动态调节处理器频率的节能方法

Also Published As

Publication number Publication date
CN101558383B (zh) 2012-11-14
CN101558383A (zh) 2009-10-14
WO2008073597A1 (en) 2008-06-19

Similar Documents

Publication Publication Date Title
DE112012003701B4 (de) Dynamisches Zuordnen eines Leistungsbudgets über mehrere Domänen eines Prozessors
DE102009058426B4 (de) Verfahren und Vorrichtung zum Power-Management eines Prozessors
DE112007001215B4 (de) Vorhersage der Leistungsnutzung von Rechenplattformspeicher
DE102010045743B4 (de) Verfahren und Vorrichtung, um Turboleistung für das Event-Handling zu verbessern
DE112009004875B4 (de) Umhüllungsleistungssteuerung
DE102014001914B4 (de) Dynamische Steuerung einer maximalen Betriebsspannung für einen Prozessor
DE112011103193B4 (de) Bereitstellung einer Pro-Kern-Spannungs-und Frequenzsteuerung
DE112008000758B4 (de) Dynamische Stromreduzierung
DE102020120019A1 (de) Proaktive di/dt-spannungs-dachabfall-abschwächung
DE112013005278T5 (de) Dynamisches Abgleichen von Leistung über eine Mehrzahl von Prozessordomänen gemäß Leistungsabgleichsteuerungs-BIAS
DE102013104328B4 (de) Aufgabenzuteilung in großen und kleinen Kernen
DE112005002672B4 (de) Dynamische Neukonfiguration eines Cache-Speichers
DE60116650T2 (de) Strommodus-übergang für einen prozessor
DE102011102871B4 (de) Adaptive Skalierung der Speicherfrequenz
DE112007001056T5 (de) PRO-Chip-Spannungsprogammierung für den Energie-Effizienten integrierten Schaltkreis (IC) Betrieb
CN110196767B (zh) 服务资源控制方法、装置、设备和存储介质
US20080148027A1 (en) Method and apparatus of power managment of processor
DE112012002664T5 (de) Erhöhen der Energieeffizienz des Turbo-Modus-Betriebs in einem Prozessor
DE112007003007T5 (de) Verfahren und Vorrichtung für die Energieverwaltung bei einem Prozessor
DE112011105867T5 (de) Kollaboratives Prozessor- und Systemleistungs- und Energiemanagement
DE102011102238A1 (de) Speicherenergiemanagement über dynamische Speicherbetriebszustände
DE102009019824A1 (de) Auslastungsbasierte Bestimmung von betrieblichen Kennlinien
JP2010518525A (ja) 計算装置のための最大電力使用設定値
DE102015102689A1 (de) Steuern von Flankensteilheiten eines Prozessors auf der Basis eines Batterieladezustands
DE112011106028B4 (de) Mechanismus zum Bereitstellen von Energiesparoptionen für Computergeräte

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
R016 Response to examination communication
R016 Response to examination communication
R082 Change of representative

Representative=s name: MFG PATENTANWAELTE MEYER-WILDHAGEN MEGGLE-FREU, DE

R081 Change of applicant/patentee

Owner name: SONY CORPORATION OF AMERICA (N.D.GES.D. STAATE, US

Free format text: FORMER OWNER: INTEL CORPORATION, SANTA CLARA, CALIF., US

Effective date: 20141009

R082 Change of representative

Representative=s name: MFG PATENTANWAELTE MEYER-WILDHAGEN MEGGLE-FREU, DE

Effective date: 20141009

R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final