DE102005033270B4 - Digitale Logikeinheit - Google Patents

Digitale Logikeinheit Download PDF

Info

Publication number
DE102005033270B4
DE102005033270B4 DE102005033270A DE102005033270A DE102005033270B4 DE 102005033270 B4 DE102005033270 B4 DE 102005033270B4 DE 102005033270 A DE102005033270 A DE 102005033270A DE 102005033270 A DE102005033270 A DE 102005033270A DE 102005033270 B4 DE102005033270 B4 DE 102005033270B4
Authority
DE
Germany
Prior art keywords
clock
logic unit
clock signals
digital logic
clock signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE102005033270A
Other languages
English (en)
Other versions
DE102005033270A1 (de
Inventor
Dieter Merk
Markus Koesler
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Deutschland GmbH
Original Assignee
Texas Instruments Deutschland GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Deutschland GmbH filed Critical Texas Instruments Deutschland GmbH
Priority to DE102005033270A priority Critical patent/DE102005033270B4/de
Priority to US11/457,929 priority patent/US20070018688A1/en
Publication of DE102005033270A1 publication Critical patent/DE102005033270A1/de
Application granted granted Critical
Publication of DE102005033270B4 publication Critical patent/DE102005033270B4/de
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • G06F1/10Distribution of clock signals, e.g. skew
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/04Generating or distributing clock signals or signals derived directly therefrom
    • G06F1/10Distribution of clock signals, e.g. skew
    • G06F1/105Distribution of clock signals, e.g. skew in which the distribution is at least partially optical

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Manipulation Of Pulses (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)

Abstract

Digitale Logikeinheit, die mit einem Haupttaktsignal betrieben wird und welche umfaßt:
ein Taktverteilungsmittel, das verteilte Taktsignale (Φ1, Φ2, Φ3) mit der gleichen Haupttaktfrequenz, die von dem Haupttakt mit zueinander verschobenen Phasen abgeleitet werden, bereitstellt,
Logikschaltungen mit Verarbeitungsstufen (402, 403, 405, 406), die in der Lage sind, logische Operationen innerhalb eines Bruchteils der Periode des Haupttaktsignals mittels der verteilten Taktsignale (Φ1, Φ2, Φ3) auszuführen,
eine Multiplexervorrichtung (401), welche die verteilten Taktsignale selektiv zu aufeinander folgenden Verarbeitungsstufen der Logikschaltung umschaltet, wobei aufeinander folgende Verarbeitungsstufen jeweils ein Eingaberegister (402, 403) aufweisen und die verteilten Taktsignale (Φ1, Φ2, Φ3) an die Takteingänge der Eingaberegister (402, 403) angelegt werden.

Description

  • Die Erfindung bezieht sich auf eine digitale Logikeinheit, die mit einem Haupttaktsignal betrieben wird.
  • Digitale integrierte Schaltungen (ICs), insbesondere CPU-Kerne, verwenden Transistoren mit kleinen Abmessungen, um eine hohe Rechenleistung bei einer erhöhten Taktgeschwindigkeit zu erreichen. Dies führt dazu, daß die für dieselbe Funktionalität benötigte Fläche auf dem Chip kleiner ist, oder anders ausgedrückt, es können mehr Funktionen auf derselben Chipfläche implementiert werden.
  • Die Transistoren auf der Chipfläche erzeugen jedoch eine große Menge an Wärme, die sich nicht leicht beseitigen läßt. Des weiteren stellt der Energieverbrauch ein Problem dar, da viele Anwendungen batteriebetrieben sind, wodurch die Laufzeit der gesamten Vorrichtung eingeschränkt wird.
  • Die Offenlegungsschrift DE 197 54 884 A1 offenbart einen Phasenregelkreis, der einen Vergleicher, eine VCO-Steuereinrichtung und einen spannungsgesteuerten Oszillator VCO mit einem mehrstufigen Oszillatorteil und einem Kombinationslogikteil aufweist. Der mehrstufige Oszillatorteil schwingt mit einer VCO-Taktfrequenz während eines stationären Zustands und erzeugt eine Vielzahl von Taktphasen mit der VCO-Taktfrequenz. Das Kombinationslogikteil spricht auf zumindest einige der Vielzahl von Taktphasen an und kombiniert die Taktphasen, um einen Ausgangstakt mit einer Ausgangstaktfrequenz zu erzeugen, die einem Vielfachen der Eingangstaktfrequenz entspricht. Die hier offenbarte Implementierung vermag zwar auf Seiten des VCO Leistung einzusparen, da die Taktfrequenz des VCO reduziert werden kann, jedoch werden die digitalen Logikblöcke nach wie vor mit einer Taktfrequenz betrieben, welche einem Vielfachen der Eingangstaktfrequenz entspricht.
  • Es ist daher Aufgabe der vorliegenden Erfindung, eine digitale Logikeinheit bereitzustellen, die bei gleicher Verarbeitungsgeschwindigkeit weniger Leistung verbraucht und weniger Wärme erzeugt als herkömmliche Logikeinheiten.
  • Die Erfindung stellt eine digitale Logikeinheit bereit, die mit einem Haupttaktsignal betrieben wird und die nachfolgenden Komponenten umfaßt: ein Taktverteilungsmittel, das verteilte Taktsignale mit der gleichen Haupttaktfrequenz, die von dem Haupttakt mit zueinander verschobenen Phasen abgeleitet werden, bereitstellt, Logikschaltungen mit Verarbeitungsstufen, die in der Lage sind, logische Operationen innerhalb eines Bruchteils der Periode des Haupttaktsignals mittels der verteilten Taktsignale auszuführen, eine Multiplexervorrichtung, welche die verteilten Taktsignale selektiv zu aufeinander folgenden Verarbeitungsstufen der Logikschaltung umschaltet, wobei aufeinander folgende Verarbeitungsstufen jeweils ein Eingaberegister aufweisen und die verteilten Taktsignale an die Takteingänge der Eingaberegister angelegt werden.
  • Dieser Ansatz nutzt das Leistungsvermögen bestimmter Verarbeitungsstufen in der digitalen Logikeinheit optimal, um wesentliche logische Operationen im Vergleich zu der Dauer einer Haupttaktperiode sehr schnell auszuführen. Die verteilten Taktsignale erwecken den Eindruck einer viel höheren Taktfrequenz, indem sie innerhalb einer Periode des Haupttaktsignals einfach mehr Taktsignalflanken bereitstellen. Somit kann die Leistungsfähigkeit der Logikeinheit zumindest für gewisse logische Operationen drastisch verbessert werden, ohne die Frequenz des Haupttakts zu erhöhen, und somit ohne eine Erhöhung des Stromverbrauchs.
  • Ein weiterer Vorteil dieses Ansatzes ist es, dass die digitale Logik Energie effizienter verbraucht, wodurch sich z.B. für eine batteriebetriebene Anwendung eine erhöhte Laufzeit oder eine höhere Leistungsfähigkeit mit derselben Energiemenge ergibt.
  • Des Weiteren muss das Haupttaktsignal keine hohe Frequenz für die gesamte digitale Logikeinheit aufweisen, falls lediglich ein Teil der Einheit eine hohe Taktgeschwindigkeit benötigt, um die notwendige Rechenleistung zu realisieren. Die verteilten Taktsignale liefern mehr „Taktflanken" für diejenigen Teile der Einheit, die eine hohe Taktgeschwindigkeit benötigen, während das Haupttaktsignal auf eine Geschwindigkeit festgesetzt wird, die für die restliche digitale Logikeinheit gerade ausreichend schnell ist.
  • Somit ist es möglich, die Geschwindigkeit einer bestimmten logischen Operation zu erhöhen, ohne dass es nötig ist, die (Haupt-) Taktfrequenz zu erhöhen. Des Weiteren ist es vorteilhaft, dass lediglich eine aktive Verarbeitungsstufe eine Taktflanke zur Verarbeitung erhält, während sich die anderen Stufen in einem Ruhezustand befinden. Anders ausgedrückt wird die entsprechende Stufe lediglich dann getaktet, wenn sie benötigt wird.
  • Noch ein weiterer Vorteil der beschriebenen Vorrichtung ist die erhöhte Verarbeitungsgeschwindigkeit für Teile der Logikeinheit, die für eine hohe Verarbeitungsleistung ausgelegt sind und diese auch benötigen. Hierdurch wird es möglich, Daten schneller durch die Kette von Registerbänken zu transportieren, als es möglich wäre, wenn die Register alle denselben Takt verwendeten. Deshalb ist dieser Ansatz bei gleicher Verarbeitungszeit (d.h. die Zeit zwischen Dateneingabe und Datenausgabe) viel schneller als eine rein synchrone Ausführung.
  • Als ein Ausführungsbeispiel kann die digitale Logikeinheit eine digitale Prozessoreinheit sein.
  • In einem Ausführungsbeispiel werden die verteilten Taktsignale von dem Haupttaktsignal mit derselben Haupttaktfrequenz abgeleitet. Dies führt zu phasenverschobenen Signalen mit derselben Frequenz.
  • Weiterhin umfasst die digitale Logikeinheit eine Multiplexervorrichtung, die die verteilten Taktsignale selektiv zu aufeinander folgenden Verarbeitungsstufen der Logikschaltung umschaltet. Somit kann die Multiplexereinheit die Verarbeitungsstufen abhängig von deren entsprechenden Verarbeitungsfähigkeiten effizient steuern.
  • Ferner haben die aufeinander folgenden Verarbeitungsstufen jeweils ein Eingaberegister, und die verteilten Taktsignale werden an die Takteingänge der Eingaberegister angelegt. Hierdurch wird eine phasenverschobene Verarbeitung der entsprechenden Verarbeitungsstufen innerhalb einer Haupttaktperiode ermöglicht. Je nach Leistungsfähigkeit einer Verarbeitungsstufe kann die folgende Verarbeitungsstufe (über ihr Eingaberegister) durch einen phasenverschobenen Takt innerhalb beispielsweise einer kurzen Verzögerung nach dem vorhergehenden (verteilten) Taktsignal angesteuert werden. Dies führt zu einer schnellen und effizienten Ausnutzung der Rechengeschwindigkeit der Verarbeitungsstufen und ferner zu einer erheblich verbesserten Gesamtleistung der digitalen Logikeinheit.
  • In einem weiteren Ausführungsbeispiel folgt auf eine letzte der aufeinander folgenden Verarbeitungsstufen ein durch eines der verteilten Taktsignale getaktetes Ergebnisregister.
  • Des Weiteren kann das an das Ergebnisregister angelegte verteilte Taktsignal phasengleich mit dem Haupttaktsignal sein. Somit wird die gesamte Verarbeitung der Verarbeitungsstufen zwischen den Eingabe- und den Ergebnisregistern innerhalb einer (oder mehrerer) Periode(n) eines Haupttaktzyklus ausgeführt.
  • Außerdem können die verteilten Taktsignale aus den Abgriffen eines chipinternen Ringoszillators gewonnen werden. In vielen Fällen umfassen digitale Logikeinheiten derartige Oszillatoren, die durch Abgreifen der erforderlichen Taktsignale an den Ausgängen von aufeinander folgenden Invertern verwendet werden können. Somit ist keine separate Erzeugung der verteilten Taktsignale erforderlich.
  • Gemäß einem bevorzugten Ausführungsbeispiel wird ein (komplexer) Verarbeitungsvorgang von aufeinander folgenden Verarbeitungsstufen innerhalb einer einzelnen Periode des Haupttaktsignals ausgeführt. Alternativ hierzu kann der (komplexe) Verarbeitungsvorgang von aufeinander folgenden Verarbeitungsstufen in mehreren Perioden des Haupttaktsignals ausgeführt werden.
  • In einem weiteren Ausführungsbeispiel können die verteilten Taktsignale dynamisch veränderte Phasenverschiebungsverhältnisse umfassen. Hierdurch wird es möglich, die Rechenleistung z.B. abhängig von der verfügbaren Energie, z.B. Batteriestrom, effizient zu verwenden. Es ist auch möglich, Operationen mit hoher Priorität mit einer höheren Geschwindigkeit zu berechnen als Operationen, die als weniger wichtig eingestuft sind. Es ist ferner möglich, eine Aufheizung der Einheit zu vermeiden, indem die Rechengeschwindigkeit dynamisch verringert wird durch Vergrößerung der Phasenverschiebungen beispielsweise der ansteigenden Flanken, die die entsprechenden Register der schnellen (aber warmen) Verarbeitungsstufen ansteuern.
  • Als weiteren Vorteil weisen integrierte Schaltungen, die weniger Wärme absorbieren, einen niedrigeren Stromverlust als warme Schaltkreise auf. Dies führt zu einem verringerten Energieverbrauch der Vorrichtung.
  • Ausführungsbeispiele der Erfindung werden in den folgenden Figuren gezeigt und veranschaulicht.
  • 1 ist ein schematisches Blockdiagramm eines Taktgenerators, der aus einem Haupttaktsignal Taktsignale mit wechselseitiger Phasenverschiebung erzeugt;
  • 2 ist ein Signaldiagramm des Haupttaktsignals und der von dem Generator aus 1 erzeugten Taktsignale mit wechselseitiger Phasenverschiebung;
  • 3 ist eine schematische Darstellung sequentieller Datenverarbeitungsstufen, wobei jede ein Eingaberegister aufweist und von einem separaten Taktsignal gesteuert wird;
  • 4 ist ein Ringoszillator, der Taktsignale mit wechselseitiger Phasenverschiebung erzeugt, die in eine für die Steuerung einer Logikeinheit verwendeten Multiplexerstruktur eingespeist werden;
  • 5 ist eine Multiplizierstruktur, die auf herkömmliche Weise ein Haupttaktsignal verwendet;
  • 6 ist ein Signaldiagramm, das zu der Multiplizierstruktur gemäß 5 gehört;
  • 7 ist eine Multiplizierstruktur, die ein Haupttaktsignal und drei phasenverschobene Taktsignale verwendet; und
  • 8 ist ein Signaldiagramm, das den Betrieb der Multiplizierstruktur gemäß 7 veranschaulicht.
  • 1 zeigt einen Taktgenerator 101, der ein Haupttaktsignal ΦMaster empfängt und drei Taktsignale Φ0, Φ1 und Φ2 mit wechselseitig verschobenen Phasen bereitstellt. Das zugehörige Signaldiagramm, das die Taktsignale ΦMaster, Φ0, Φ1 und Φ2 darstellt, ist in 2 gezeigt. Alle Taktsignale haben dieselbe Frequenz, das Taktsignal Φ0 hat dieselbe Phase wie das Haupttaktsignal ΦMaster, das Taktsignal Φ1 hat eine Phasenverschiebung (im Vergleich zu dem Taktsignal Φ0) von ΔΦ = 120°, und das Taktsignal Φ2 ist im Vergleich zu dem Taktsignal Φ1 um weitere ΔΦ = 120° phasenverschoben. Der Begriff „verteilte Taktsignale" bezeichnet hierin jedes beliebige von dem Haupttaktsignal abgeleitete Taktsignal, einschließlich des Haupttaktsignals selbst.
  • Diese Umsetzung ermöglicht es, mehr Taktflanken (innerhalb der Periode des Haupttaktsignals) für diejenigen Teile einer digitalen Logikeinheit zu erzeugen, die in der Lage sind, mit einer höheren Taktgeschwindigkeit als der des Haupttakts zu arbeiten.
  • Phasenverschobene Takte können in digitalen Entwürfen mit mehrstufigen Registerbänken und Verarbeitungsstufen ohne den Nachteil des erneuten Taktens des vorhergehenden Registers verwendet werden, um einem Register eine Taktflanke zu einem Zeitpunkt zu liefern, zu dem der vorhergehende Verarbeitungsblock (Stufe) seine Berechnungen abgeschlossen hat. 3 zeigt eine Folge von Verarbeitungsstufen, umfassend die Register 301 bis 303 und die Datenverarbeitungsblöcke 304 und 305. Die Taktsignale Φ0, Φ1, Φn werden an die Register 301, 302 bzw. 303 angelegt. Das Register 301 hat einen Eingang „Data in", und das Register 3030 hat einen Ausgang „Data out". Jedes Register 301 bis 303 wird durch ein anderes der verteilten Taktsignale Φ0 bis Φn mit wechselseitig verschobenen Phasen, wie in 2 gezeigt, getaktet. Somit kann der Energieverbrauch für einen Verarbeitungszyklus verringert werden, da nur die tatsächlich aktive Verarbeitungsstufe eine Taktflanke von dem entsprechenden Taktsignal empfangt, während sich die anderen Stufen in einem Ruhezustand befinden.
  • Um der beschriebenen Implementierung zu entsprechen, benötigen die digitalen Zellen der digitalen Logikeinheit, die mit dem Haupttaktsignal getaktet sind, und die abgeleiteten Taktsignale eine höhere maximale Verarbeitungsgeschwindigkeit als die Haupttaktgeschwindigkeit. Wenn zum Beispiel drei phasenverschobene Takte mit einer Haupttaktfrequenz von 200MHz verwendet werden, muss die Zelle in der Lage sein, das Dreifache der Haupttaktfrequenz zu verarbeiten, d.h. mindestens 600MHz: fcell_max > ≈ n·fclock (1) mit
  • fcell_max
    maximale Frequenz, die von der Zelle unterstützt werden muss;
    fclock
    Haupttaktfrequenz;
    n
    Anzahl von phasenverschobenen Taktsignalen.
  • 4 zeigt einen spannungsgesteuerten Oszillator VCO, der als Ringoszillator implementiert ist. Ein solcher Ringoszillator ist in den meisten Mikroprozessorsystemen als Teil eines multiplizierenden Phasenregelkreises (PLL) enthalten. Die phasenverschobenen Signale Φ0 bis Φ6 können aus den Abgriffen des Ringoszillators gewonnen werden. In dem in 4 gezeigten Beispiel gestattet es ein differentieller 3-Stufen-Ringoszillator, 6 konstante Phasen in gleichen Abstanden von 60 Grad abzuleiten. Die verschiedenen Phasen, d.h. die phasenverschobenen Signale Φ0 bis Φ6 können über einen Multiplexer 401 an die Register 402 bis 404 angelegt werden. Der Multiplexer 401 wird über das Signal 407 von einer Logik (nicht gezeigt) gesteuert. Zu verarbeitende Daten „DATA_in" werden dem Register 402 zugeführt, das durch das Taktsignal Φ1 ausgelöst wird. Das Ausgangssignal des Registers 402 wird einer Kombinationslogik 405 und danach dem Register 403 zugeführt, das mit dem Taktsignal Φ2 getaktet ist. Das Ausgangssignal des Registers 403 wird an eine Kombinationslogik 406 und weiter an das Register 404 weitergeleitet, das durch das Taktsignal Φ3 ausgelöst wird. Das Ausgangssignal des Registers 404 ist die verarbeitete Datenausgabe „DATA_out" dieses Beispiels. Der Multiplexer legt die Taktsignale Φ1, Φ2, Φ3 an die entsprechenden Register 402 bis 404 an. Diese Ausführung kann sich an die Komplexität der Kombinationslogik anpassen, d.h. die schnelle Verarbeitung durch die entsprechende Kombinationslogik 405 und 406 kann ausgenutzt werden, indem die nachfolgenden phasenverschobenen Taktsignale an nachfolgende Verarbeitungsstufen angelegt werden, um mehrere Operationen dynamisch innerhalb der Dauer eines Haupttaktzyklus auszuführen.
  • 5 zeigt eine Multiplizierstruktur, die durch ein Haupttaktsignal CLK ausgelöst wird. Diese Struktur multipliziert zwei 4-Bit-Werte A und B, woraus sich ein 8-Bit-Ergebniswert „Result output" ergibt. Für die Berechnung werden 4 Registerstufen „Reg. R1", Reg. R2", Reg. R3" und „Result Output" verwendet, wobei jede das Ergebnis jeder Addition speichert, die zur Ausführung einer Multiplikation benötigt werden.
  • Wenn der Wert für A „0101" und der Wert für B „1100" ist, wird die Multiplikation wie folgt verarbeitet: A wird mit dem Bit mit dem höchsten Stellenwert („most significant bit", MSB) von B durch ein UND-Gatter verknüpft, das Ergebnis „01010" wird in dem Register „Reg. R1" gespeichert. Das nächste UND-Gatter erzeugt „0101", was zu „01010" addiert wird und „0011110" ergibt, was in dem Register „Reg. R2" gespeichert wird. Die nächsten zwei Stufen addieren „0000", woraus sich der 8-Bit-Wert „0011 1100" ergibt.
  • Alle Register sind mit demselben Haupttaktsignal CLK getaktet. 6 zeigt das Signaldiagramm der Multiplizierstruktur während der Multiplikation der Werte A und B. Die beschriebene Multiplikation erfordert 5 Taktzyklen des Haupttaktsignals CLK.
  • 7 zeigt einen im Allgemeinen ähnlichen Multiplizierer wie in 5. Dieser Multiplizierer empfängt jedoch ein Haupttaktsignal CLK und drei phasenverschobene Taktsignale CLK1, CLK2 und CLK3, wobei das Signal CLK1 um 90° phasenverschoben ist, CLK2 um 180° phasenverschoben ist und CLK3 um 270° phasenverschoben ist, jeweils verglichen mit dem Haupttaktsignal CLK.
  • Das Signal CLK1 wird an das Register „Reg. R1" angelegt, das Signal CLK2 wird an das Register „Reg. R2" angelegt, und das Signal CLK3 wird an das Register „Reg. R3" angelegt. Das Haupttaktsignal CLK wird an die Eingangsstufen und an das Ergebnisausgaberegister des Multiplizierers angelegt.
  • 8 zeigt ein ähnliches Signaldiagramm wie 6, aber es zeigt deutlich eine verringerte Verarbeitungszeit. Das Ergebnis ist in dem Ergebnisregister einen Haupttaktzyklus später verfügbar, nachdem die Werte für A und B in die Eingaberegister geladen wurden. Die Hardwareumsetzung aus 7 gleicht der aus 5, mit der Ausnahme, dass die Takte für jedes Register innerhalb jeder Haupttaktperiode verteilt sind, und nicht nur das Haupttaktsignal verwendet wird.
  • In dem Beispiel führt dies für die Multiplizierstruktur zu einem um den Faktor 4 verringerten Energieverbrauch, da jedes Register nur einmal getaktet werden muss, bis das Ergebnis verfügbar ist. Außerdem steht das Ergebnis 4-mal schneller als in der Ausführung mit lediglich dem Haupttaktsignal zur Verfügung.
  • Als eine Alternative zu der Umsetzung gemäß 7 ist es auch möglich, den Multiplikationsprozess z.B. 2 Haupttaktzyklen andauern zu lassen. Dies könnte dann als nützlich erachtet werden, wenn die Kombinationslogik nicht schnell genug ist, um die in einer einzelnen Haupttaktperiode verteilten Taktsignale zu bewältigen.
  • Des Weiteren ist es möglich, das Phasenverschiebungsverhältnis dynamisch während einer laufenden Anwendung zu ändern. Somit könnte die zu einem gegebenen Zeitpunkt benötigte Verarbeitungsleistung angepasst werden.
  • Als Beispiel beträgt die Frequenz des Haupttaktsignals fcycle = 100MHz (tcycle = 10ns). In einer synchronen Ausführung empfängt jede Stufe ein Taktsignal, selbst wenn es keinen Bedarf für ein Taktsignal gibt. Die gesamte, durch einen solchen Multiplizierer verbrauchte Energie ist definiert durch Psync.
  • Noch immer Bezug nehmend auf das Beispiel ermöglicht die mit dieser Erfindung bereitgestellte Methode nicht nur eine Verringerung der für die angeforderte Operation benötigten Energie um den Faktor 4, sondern auch eine Verringerung der für diese Operation benötigten Zeit um denselben Faktor, wenn 4 Taktsignale mit wechselseitig verschobenen Phasen als verteilte Taktsignale angelegt werden.
  • Ein Vergleich der mit der Erfindung bereitgestellten Methode mit herkömmlichen Methoden zeigt die folgenden Nachteile, die durch die hiermit bereitgestellte Lösung bewältigt werden:
    Mit der Verwendung von gattergesteuerten Taktsignalen für jede Stufe kann der Energieverbrauch um einen Faktor 4 verringert werden, da lediglich die Stufe, die die Berechnung ausführt, ein Taktsignal erhält, während die anderen Stufen nichts erhalten. Somit kann der Energieverbrauch des gattergesteuerten Multiplizierers definiert werden als Pgated ≈ Psync/4, wobei tgated = tsync, da für die Multiplikation von A und B noch immer 4 Taktzyklen benötigt werden. Außerdem wird eine Zustandsmaschine zur Abwicklung der Gattersteuerung der Taktsignale benötigt. Eine weitere Möglichkeit zur Verringerung der Energie ist die Verwendung lediglich einer Registerstufe mit einer Rückkopplung. Alle 4 für die Durchführung der Multiplikation benötigten Taktzyklen verwenden immer dieselbe Registerstufe. Dies hilft bei der Verringerung der auf dem Chip benötigten Größe, die benötigte Energie ist ähnlich wie bei der obigen gattergesteuerten Version, aber es gibt keinen Vorteil in Bezug auf die benötigte Zeit (es werden noch immer 4 Taktzyklen benötigt).

Claims (8)

  1. Digitale Logikeinheit, die mit einem Haupttaktsignal betrieben wird und welche umfaßt: ein Taktverteilungsmittel, das verteilte Taktsignale (Φ1, Φ2, Φ3) mit der gleichen Haupttaktfrequenz, die von dem Haupttakt mit zueinander verschobenen Phasen abgeleitet werden, bereitstellt, Logikschaltungen mit Verarbeitungsstufen (402, 403, 405, 406), die in der Lage sind, logische Operationen innerhalb eines Bruchteils der Periode des Haupttaktsignals mittels der verteilten Taktsignale (Φ1, Φ2, Φ3) auszuführen, eine Multiplexervorrichtung (401), welche die verteilten Taktsignale selektiv zu aufeinander folgenden Verarbeitungsstufen der Logikschaltung umschaltet, wobei aufeinander folgende Verarbeitungsstufen jeweils ein Eingaberegister (402, 403) aufweisen und die verteilten Taktsignale (Φ1, Φ2, Φ3) an die Takteingänge der Eingaberegister (402, 403) angelegt werden.
  2. Digitale Logikeinheit gemäß Anspruch 1, bei der auf eine letzte der aufeinander folgenden Verarbeitungsstufen ein durch eines der verteilten Taktsignale getaktetes Ergebnisregister (404) folgt.
  3. Digitale Logikeinheit gemäß Anspruch 2, bei der das an das Ergebnisregister (404) angelegte verteilte Taktsignal phasengleich mit dem Haupttaktsignal (CLK) ist.
  4. Digitale Logikeinheit gemäß einem der vorhergehenden Ansprüche, bei der die verteilten Taktsignale von Abgriffen eines chipinternen Ringoszillators (VCO) gewonnen werden.
  5. Digitale Logikeinheit gemäß einem der vorhergehenden Ansprüche, bei der ein Verarbeitungsvorgang von aufeinander folgenden Verarbeitungsstufen innerhalb einer einzelnen Periode des Haupttaktsignals (CLK) ausgeführt wird.
  6. Digitale Logikeinheit gemäß einem der Ansprüche 1 bis 5, bei der ein Verarbeitungsvorgang von aufeinander folgenden Verarbeitungsstufen in mehreren Perioden des Haupttaktsignals (CLK) ausgeführt wird.
  7. Digitale Logikeinheit gemäß einem der vorhergehenden Ansprüche, bei der die verteilten Taktsignale (CLK1, CLK2, CLK3) dynamisch veränderte Phasenverschiebungsverhältnisse aufweisen.
  8. Digitale Logikeinheit gemäß einem der vorhergehenden Ansprüche, bei der die Logikeinheit eine Prozessoreinheit ist.
DE102005033270A 2005-07-15 2005-07-15 Digitale Logikeinheit Expired - Fee Related DE102005033270B4 (de)

Priority Applications (2)

Application Number Priority Date Filing Date Title
DE102005033270A DE102005033270B4 (de) 2005-07-15 2005-07-15 Digitale Logikeinheit
US11/457,929 US20070018688A1 (en) 2005-07-15 2006-07-17 Digital Logic Unit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005033270A DE102005033270B4 (de) 2005-07-15 2005-07-15 Digitale Logikeinheit

Publications (2)

Publication Number Publication Date
DE102005033270A1 DE102005033270A1 (de) 2007-01-25
DE102005033270B4 true DE102005033270B4 (de) 2007-11-29

Family

ID=37575539

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005033270A Expired - Fee Related DE102005033270B4 (de) 2005-07-15 2005-07-15 Digitale Logikeinheit

Country Status (2)

Country Link
US (1) US20070018688A1 (de)
DE (1) DE102005033270B4 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015161431A1 (zh) * 2014-04-22 2015-10-29 京微雅格(北京)科技有限公司 Lvds数据恢复方法及电路
JPWO2018029782A1 (ja) * 2016-08-09 2019-06-06 オリンパス株式会社 演算処理装置、画像処理装置、および撮像装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19754884A1 (de) * 1996-12-11 1998-08-06 Vlsi Technology Inc Phasenregelkreis mit einem Spannungs-gesteuerten Oszillator mit Mehrfrequenzausgang

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0310377B1 (de) * 1987-10-02 1992-06-10 Kawasaki Steel Corporation Programmierbare Eingangs-/Ausgangsschaltung
US5259006A (en) * 1990-04-18 1993-11-02 Quickturn Systems, Incorporated Method for substantially eliminating hold time violations in implementing high speed logic circuits or the like
US5434520A (en) * 1991-04-12 1995-07-18 Hewlett-Packard Company Clocking systems and methods for pipelined self-timed dynamic logic circuits
US6127865A (en) * 1997-05-23 2000-10-03 Altera Corporation Programmable logic device with logic signal delay compensated clock network
US6064232A (en) * 1997-12-18 2000-05-16 Advanced Micro Devices, Inc. Self-clocked logic circuit and methodology
US6127864A (en) * 1998-08-19 2000-10-03 Mission Research Corporation Temporally redundant latch for preventing single event disruptions in sequential integrated circuits
US6369624B1 (en) * 1998-11-03 2002-04-09 Altera Corporation Programmable phase shift circuitry
US6535043B2 (en) * 2000-05-26 2003-03-18 Lattice Semiconductor Corp Clock signal selection system, method of generating a clock signal and programmable clock manager including same
US6552619B2 (en) * 2001-02-05 2003-04-22 Pmc Sierra, Inc. Multi-channel clock recovery circuit
JP3860075B2 (ja) * 2002-05-30 2006-12-20 シャープ株式会社 テスト回路を有する自己同期型論理回路および自己同期型論理回路のテスト方法
US6873187B1 (en) * 2002-10-29 2005-03-29 Lattice Semiconductor Corporation Method and apparatus for controlling signal distribution in an electronic circuit
US7107477B1 (en) * 2003-01-31 2006-09-12 Altera Corporation Programmable logic devices with skewed clocking signals

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19754884A1 (de) * 1996-12-11 1998-08-06 Vlsi Technology Inc Phasenregelkreis mit einem Spannungs-gesteuerten Oszillator mit Mehrfrequenzausgang

Also Published As

Publication number Publication date
DE102005033270A1 (de) 2007-01-25
US20070018688A1 (en) 2007-01-25

Similar Documents

Publication Publication Date Title
DE10041048B4 (de) Nicht-Ganzzahliger Frequenzteiler
DE102004062911B4 (de) Verfahren zum Betrieb eines Prozessors und zugehöriges Prozessorsystem
DE69834678T2 (de) Selbstgetaktetes Pipeline-Übertragungssystem und asynchrone Signalsteuerungsschaltung
DE69532226T2 (de) Taktssteuerungseinheit
DE69837775T2 (de) Dynamische logische Schaltung und selbstgetaktetes Pipeline-Datenwegsystem
DE2846117C2 (de) Datenprozessor
DE60202749T2 (de) Schnittstelle von synchron zu asynchron zu synchron
DE3901995C2 (de)
DE112008002355T5 (de) Verfahren und Vorrichtung zur Taktzyklenunterdrückung
DE3719181A1 (de) Finite zustandsmaschine
DE69817713T2 (de) Verfahren und System zum Erzeugen eines Prozessortaktes mit schnellem Startvorgang
DE19852457C2 (de) Verfahren und Vorrichtung zur Phasendrehung in einem Phasenregelkreis
DE19754884A1 (de) Phasenregelkreis mit einem Spannungs-gesteuerten Oszillator mit Mehrfrequenzausgang
DE69909924T2 (de) Verfahren und Vorrichtung zur Reduzierung der Verlustleistung in einer Schaltung
DE102004042900B4 (de) Ringoszillator, Signalerzeugungsverfahren und Speichersystem
DE102005033270B4 (de) Digitale Logikeinheit
DE60121618T2 (de) Vorrichtung und verfahren zur frequenzteilung durch eine ungerade zahl
DE60101169T2 (de) Logikschaltkreis mit Pipeline-Struktur
DE69829270T2 (de) Frequenzsynthetisierer
DE10231186B4 (de) Frequenzteiler
DE60316342T2 (de) Multiplizierer mit nachschlagetabellen
DE4120903A1 (de) Verzoegerungsschaltung
DE102014217753A1 (de) Taktgeneratorschaltung mit automatischem Schlafmodus
EP1099192B1 (de) Getaktete integrierte halbleiterschaltung und verfahren zum betreiben einer solchen
DE102004010370A1 (de) Integrationssystem und -Verfahren für mehrere Verzögerungs-Regelschleifen

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R082 Change of representative

Representative=s name: ZELLER, ANDREAS, DE

R119 Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee