Die
folgenden Patentanmeldungen, die am Anmeldungstag der vorliegenden
Anmeldung für denselben
Anmelder und im Namen derselben Erfinder angemeldet worden sind,
offenbaren verwandte Gegenstände,
wobei der Gegenstand jeder Anmeldung vollumfänglich durch Bezugnahme in
er vorliegenden Anmeldung aufgenommen wird:
Memory Module with
Hierarchical Functionality, Anwaltsnr. 40050/B600/JFO; High Precision
Measurement Circuit, Anwaltsnr. 37079/B600/JFO; Single-Ended Sense
Amplifier with Sample-and-Hold Reference, Anwaltsnr. 37362/B600/JFO;
Limited Switch Driver Circuit, Anwaltsnr. 37361/B600/JFO; Fast Decoder
with Asynchronous Reset with Row Redundancy; Anwaltsnr. 37115/600/JFO;
Diffusion Replica Delay Circuit, Anwaltsnr. 37360/B600/JFO; Sense
Amplifier with Offset Cancellation and Charge-Share Limited Swing
Drivers, Anwaltsnr. 37363/B600/JFO; Memory Architecture with Single-Port
Cell and Dual-Port (Read and Write) Functionality, Anwaltsnr. 37364B600/JFO;
Memory Redundancy Implementation, Anwaltsnr. 37496B600/JFO; und
A Circuit Technique for High Speed Low Power Data Transfer Bus, Anwaltsnr.
37497/B600/JFO.The following patent applications filed with the same Applicant and in the name of the same inventors on the filing date of the present application disclose related matters, the subject matter of each application being incorporated in its entirety by reference in the present application:
Memory Module with Hierarchical Functionality, Att. 40050 / B600 / JFO; High Precision Measurement Circuit, Att. 37079 / B600 / JFO; Single-Ended Sense Amplifier with Sample-and-Hold Reference, Att. 37362 / B600 / JFO; Limited Switch Driver Circuit, Att. 37361 / B600 / JFO; Fast Decoder with Asynchronous Reset with Row Redundancy; Anwaltsnr. 37115/600 / JFO; Diffusion Replica Delay Circuit, Att. 37360 / B600 / JFO; Sense Amplifier with Offset Cancellation and Batch Share Limited Swing Drivers, Att. 37363 / B600 / JFO; Memory Architecture with Single-Port Cell and Dual-Port (Read and Write) Functionality, Att. 37364B600 / JFO; Memory Redundancy Implementation, Att. 37496B600 / JFO; and A Circuit Technique for High Speed Low Power Data Transfer Bus, Att. 37497 / B600 / JFO.
HINTERGRUND DER ERFINDUNGBACKGROUND OF THE INVENTION
1. Gebiet der Erfindung1. Field of the invention
Die
vorliegende Erfindung bezieht sich auf Speichervorrichtungen, insbesondere
auf Halbleiter-Speichervorrichtungen, und im Besonderen auf skalierbare,
leistungsfähige
Halbleiter-Speichervorrichtungen.The
The present invention relates to memory devices, in particular
on semiconductor memory devices, and in particular on scalable,
powerful
Semiconductor memory devices.
2. Hintergrund der Technik2. Background of the art
Speicherstrukturen
sind zu integralen Teilen moderner VLSI-Systeme, einschließlich digitaler
Signalverarbeitungssysteme, geworden. Obwohl es typischerweise erwünscht ist,
möglichst
viele Speicherzellen in einen vorgegebenen Bereich aufzunehmen, ist
die Speicherzelldichte normalerweise durch andere Gestaltungsfaktoren,
beispielsweise Layout-Effizienz, Leistung, Energieerfordernisse
und Geräuschempfindlichkeit,
begrenzt.storage structures
are integral parts of modern VLSI systems, including digital ones
Signal processing systems, become. Although it is typically desirable
preferably
is to include many memory cells in a given range is
the storage cell density normally by other design factors,
For example, layout efficiency, performance, energy requirements
and noise sensitivity,
limited.
In
Anbetracht des Trends zu kompakten, hochleistungsfähigen integrierten
Computernetzen mit hoher Bandbreite, tragbaren Rechnern und mobilen
Kommunikationsgeräten
können
die vorgenannten Einschränkungen
der Ausgestaltung der Speicherstruktur schwerwiegende Bedingungen
auferlegen, die traditionelle Spei chersysteme und Unterbestandteil-Implementationen
möglicherweise
nicht umgehen können.In
Considering the trend towards compact, high performance integrated
High bandwidth, portable and mobile computer networks
communications equipment
can
the aforementioned limitations
the design of the memory structure severe conditions
impose traditional storage systems and sub-part implementations
possibly
can not handle.
Eine
Art des Grundspeicherelements ist das Static Random Access Memory
(SRAM), das seinen Speicherzustand beibehalten kann, ohne aktualisiert (refreshed)
zu werden, solange die Zelle mit Energie versorgt wird. Bei einer
SRAM-Vorrichtung wird der Speicherzustand normalerweise als Spannungsdifferential
in einem bistabilen funktionalen Element, z.B. einer Inverterschleife,
gespeichert. Eine SRAM-Zelle ist komplexer als ihr Gegenstück, eine
Dynamic RAM (DRAM)-Zelle, und benötigt mehr Einzelbestandteile, vorzugsweise
Transistoren. Demgemäss
verbrauchen SRAM-Vorrichtungen normalerweise mehr Energie und geben
mehr Wärme
ab als ein DRAM mit vergleichbarer Speicherdichte und gleicher Effizienz; SRAM-Vorrichtungs-Designs
mit niedrigerer Energie sind besonders geeignet für VLSI-Systeme,
die hochdichte SRAM-Bestandteile benötigen, vorausgesetzt, dass
diese Speicherbestandteile die häufig strengen
Gesamtdesign-Beschränkungen
des bestimmten VLSI-Systems beachten. Des weiteren sind die SRAM-Untersysteme
vieler VLSI-Systeme häufig in
Bezug auf bestimmte Design-Implementierungen integriert, wobei bestimmte
Anpassungen des SRAM-Untersystems die Skalierbarkeit des SRAM-Untersystem-Designs
einschränken
oder sogar ausschließen.
Als Folge hiervon können SRAM-Speicher-Untersystemdesigns,
auch diejenigen, die als „skalierbar" angesehen werden,
Designbedingungen häufig
nicht erfüllen,
wenn diese Speicher-Untersystemdesigns zum Einsatz in einem VLSI-System
mit dem Bedarf größerer Speicherzellpopulation
und/oder -dichte vergrößert werden.A
The type of basic memory element is Static Random Access Memory
(SRAM) that can maintain its memory state without being refreshed
to become, as long as the cell is supplied with energy. At a
SRAM device, the memory state is usually called voltage differential
in a bistable functional element, e.g. an inverter loop,
saved. An SRAM cell is more complex than its counterpart, a
Dynamic RAM (DRAM) cell, and requires more individual components, preferably
Transistors. Accordingly,
SRAM devices usually consume more energy and give
more heat
as a DRAM with comparable storage density and efficiency; SRAM device designs
lower energy are particularly suitable for VLSI systems,
require the high-density SRAM components, provided that
these storage components often stringent
Overall design constraints
of the specific VLSI system. Further, the SRAM subsystems
many VLSI systems frequently in
Integrated with specific design implementations, with specific ones
Adaptations of the SRAM subsystem The scalability of the SRAM subsystem design
restrict
or even exclude.
As a consequence, SRAM memory subsystem designs,
even those that are considered "scalable"
Design conditions often
do not fulfill,
when using these memory subsystem designs for use in a VLSI system
with the need of larger storage cell population
and / or density are increased.
Es
besteht ein Bedarf für
eine effiziente, skalierbare, hochleistungsfähige Speicherstruktur mit niedriger
Energie, die es einem Systemdesigner ermöglicht, ein SRAM-Speicher-Untersystem
zu generieren, das strenge Auflagen hinsichtlich Vorrichtungsbereich,
Energie, Leistung, Geräuschempfindlichkeit,
etc. erfüllt.It
there is a need for
an efficient, scalable, high-performance memory structure with lower
Energy that enables a system designer to have an SRAM storage subsystem
to generate strict conditions with regard to the device area,
Energy, performance, noise sensitivity,
etc. fulfilled.
Die
US-A-5,751,648 bezieht sich auf eine zweistufige Lesetechnik für große Static
Random Access Memory (SRAM)-Vorrichtungen.The
US-A-5,751,648 relates to a two stage reading technique for large static
Random Access Memory (SRAM) devices.
Die JP 10 134 573 bezieht sich
auf eine Hauptverstärkungsschaltung
für einen
Halbleiterspeicher, die mit einer WRITE-Verstärkungsschaltung zusammenarbeitet.The JP 10 134 573 relates to a main amplifier circuit for a semiconductor memory, which cooperates with a WRITE amplification circuit.
Die
US-A-5,247,479 bezieht sich auf einen Leseverstärker zum Einsatz im Zusammenhang
mit einem Static Random Access Memory (SRAM)-Array.The
US-A-5,247,479 relates to a sense amplifier for use in the context
with a static random access memory (SRAM) array.
Die
US-A-6,009,024 bezieht sich auf einen hochintegrierten Halbleiterspeicher
mit reduziertem Bereich.The
US-A-6,009,024 relates to a highly integrated semiconductor memory
with reduced area.
Die
EP-A-0 745 995 bezieht sich auf eine Flash-EEPROM-Speichervorrichtung
zum Durchführen
verschiedener Operationen in verschiedenen Sektoren, z.B. Löschen eines
Sektors, während gleichzeitig
ein anderer Sektor gelesen wird.EP-A-0 745 995 relates to a flash EEPROM memory device for feedthrough various operations in different sectors, eg deleting one sector while at the same time reading another sector.
Es
ist Aufgabe der vorliegenden Erfindung, eine Dual Port Funktionalität aus einer
hierarchischen Speicherstruktur mit Single Port zu erhalten. Diese
Aufgabe wird durch das Verfahren der Ansprüche 1 und 2 gelöst. Vorteilhafte
Ausführungsformen der
Erfindung sind in den Unteransprüchen
definiert.It
Object of the present invention, a dual port functionality of a
hierarchical storage structure with single port. These
Task is solved by the method of claims 1 and 2. advantageous
Embodiments of
Invention are in the subclaims
Are defined.
Die
vorliegende Erfindung erfüllt
den vorgenannten Bedarf durch Bereitstellen eines Speichermoduls
mit hierarchischer Funktionalität.
Die vorliegende Erfindung stellt des weiteren eine hierarchische
Speicherstruktur bereit, die aus derartigen Speichermodulen zusammengesetzt
ist. Das Speichermodul selbst kann abgestuft und hierarchisch sein, so
dass eine „globale" Vorrichtung in einer
bestimmten Stufe als „lokale" Vorrichtung in Bezug
auf eine in der Hierarchie unmittelbar höhere Stufe klassifiziert werden
kann. Andererseits kann eine „lokale" Vorrichtung in derselben
bestimmten Stufe als „globale" Vorrichtung in Bezug
auf eine in der Hierarchie unmittelbar niedrigere Stufe klassifiziert
werden.The
present invention
the aforementioned need by providing a memory module
with hierarchical functionality.
The present invention further provides a hierarchical one
Memory structure prepared, composed of such memory modules
is. The memory module itself can be tiered and hierarchical, so
that a "global" device in one
certain stage as a "local" device in relation
be classified to a level immediately higher in the hierarchy
can. On the other hand, a "local" device in the same
certain level as a "global" device in relation
classified to a level immediately lower in the hierarchy
become.
In
der Grundstufe oder ersten Stufe kann ein Speichermodul eine oder
mehrere Speicherzellen aufweisen, die mit einem lokalen Leseverstärker gekoppelt
sind. Ein oder mehrere lokale Leseverstärker können mit einem globalen Leseverstärker gekoppelt sein
und so eine spaltenorientierte Speicherstruktur bilden. Ein Speicherzustandssignal
von dem Speicher wird von dem lokalen Leseverstärker empfangen, der wiederum
an den globalen Leseverstärker ein
lokales Speicherzustandssignal abgibt. Der globale Leseverstärker kann
dieses lokale Speicherzustandssignal empfangen und im Ansprechen
darauf ein globales Speicherzustandssignal bereitstellen. Mehrere
Spaltenstrukturen können
in Gruppen zusammengefasst werden, um für eine gegebene Stufe ein zweidimensionales
Speicherarray zu bilden. In aufeinanderfolgenden höheren Stufen
kann ein Speichermodul ein oder mehrere einzelne Speichermodule
aufweisen, die aus einer niedrigeren Stufe aufgebaut sind. Gruppen
einzelner Speichermodule können
selektiv mit lokalen Leseverstärkern
gekoppelt werden, die wiederum mit einem globalen Leseverstärker gekoppelt
sind, der ein Signal entsprechend einer Speicherstelle entweder
an die nächsthöhere Stufe
oder, wenn in der höchsten
Stufe der Hierarchie angeordnet, an die Speicherstruktur-E/A-Puffer,
ausgeben kann.In
At the basic level or first level, a memory module can be one or
have a plurality of memory cells coupled to a local sense amplifier
are. One or more local sense amplifiers may be coupled to a global sense amplifier
and thus form a column-oriented memory structure. A memory state signal
from the memory is received by the local sense amplifier, which in turn
to the global sense amplifier
outputs local memory state signal. The global sense amplifier can
receive this local memory state signal and in response
then provide a global memory state signal. Several
Column structures can
be grouped together to form a two-dimensional one for a given stage
Storage array to form. In successive higher levels
For example, a memory module can have one or more individual memory modules
have, which are composed of a lower level. groups
single memory modules can
selective with local sense amplifiers
coupled, which in turn coupled with a global sense amplifier
which is a signal corresponding to a memory location either
to the next higher level
or, if in the highest
Level of the hierarchy, to the memory structure I / O buffers,
can spend.
Auch
in der ersten Stufe können
eine oder mehrere Zellen in dem Speichermodul mit einem lokalen
Wortleitungs- oder -zeilen-Decoder gekoppelt sein. Ein oder mehrere
lokale Wortleitungs-Decoder können
mit einer globalen Wortleitung gekoppelt sein, wodurch eine zeilenorientierte
Speicherstruktur gebildet wird. Ein globaler Wortleitungs-Decoder empfängt ein
globales Selektionssignal entsprechend selektierten Speicherzellen
und leitet dieses Signal an lokale Wortleitungs-Decoder weiter.
Die lokalen Wortleitungs-Decoder empfangen dieses Signal und stellen
ein lokales Selektionssignal zur Verfügung, das die selektierten
Speicherzellen aktiviert. Wie bei den Spaltenstrukturen können mehrere
Zeilen in Gruppen zusammengefasst werden, um ein zweidimensionales
Speicherarray für
eine gegebene Stufe zu bilden. In aufeinanderfolgenden höheren Stufen
kann ein Speichermodul ein oder mehrere einzelne Speichermodule
einer niedrigeren Stufe aufweisen. Gruppen einzelner Speichermodule
können selektiv
mit lokalen Wortleitungs-Decodern gekoppelt werden, die wiederum
mit globalen Wortleitungs-Decodern gekoppelt sind, die ein Selektionssignal
entsprechend einer Speicherstelle entweder von der nächsthöheren Stufe
oder, wenn in der obersten Stufe der Hierarchie angeordnet, von
den von den Adresseingängen
getriebenen Predecoder-/Wortleitungs-Treibern empfangen.Also
in the first stage can
one or more cells in the memory module with a local one
Word line or line decoder coupled. One or more
local word line decoders can
be coupled to a global wordline, resulting in a row-oriented
Memory structure is formed. A global wordline decoder receives
global selection signal corresponding to selected memory cells
and forwards this signal to local wordline decoders.
The local word line decoders receive this signal and set
a local selection signal is available that the selected ones
Memory cells activated. As with the column structures, several
Lines are grouped together to form a two-dimensional
Memory array for
to form a given level. In successive higher levels
For example, a memory module can have one or more individual memory modules
have a lower level. Groups of individual memory modules
can be selective
coupled with local word line decoders, which in turn
are coupled to global word line decoders, which are a selection signal
according to a storage location either from the next higher level
or, if arranged at the top level of the hierarchy, from
that from the address entrances
received Predecoder / Word Line Drivers.
Signale
mit begrenzter Spannungsschwankung können von den Speicherzellen,
den lokalen Leseverstärkern,
den globalen Leseverstärkern,
den lokalen Wortleitungs-Decodern, den globalen Wortleitungs-Decodern,
oder Kombinationen hiervon bereitgestellt werden. Wo Speicherzellen
Signale mit begrenzter Spannungsschwankung erzeugen, spricht der
entsprechende lokale Leseverstärker auch
auf ein solches Signal an. Vorzugsweise werden überall Signale mit begrenzter
Spannungsschwankung eingesetzt, um den Energieverbrauch zu minimieren
und die Arbeitsgeschwindigkeit des Speichermoduls und der hieraus
zusammengesetzten Speicherstruktur zu maximieren. Zu diesem Zweck
umfasst ein Aspekt der vorliegenden Erfindung einen einpolig geerdeten
(single-ended) Leseverstärker
mit Abtast- und Haltereferenz (Sample-and-Hold Reference). Bei einem
anderen Aspekt der vorliegenden Erfindung wird ein Charge-Share schwankungsbegrenzter
Treiber-Leseverstärker (charge-share
limited-swing-driver) verwendet. Zusätzlich zur Begrenzung von Spannungsschwankungen
ist es auch erwünscht,
synchrone Schaltungen, beispielsweise Predecoder und getaktete Wortleitungs-Decoder,
von asynchronen Schaltungen, beispielsweise lokalen Wortleitungs-Decodern,
zu isolieren. Daher stellt ein weiterer Aspekt der vorliegenden
Erfindung einen asynchron zurücksetzbaren
Zeilendecoder zur Verfügung.signals
with limited voltage fluctuation can be detected by the memory cells,
the local sense amplifiers,
the global sense amplifiers,
the local word line decoders, the global word line decoders,
or combinations thereof. Where memory cells
Produce signals with limited voltage fluctuation, speaks the
corresponding local sense amplifier too
to such a signal. Preferably, signals are more limited everywhere
Voltage fluctuation used to minimize energy consumption
and the operating speed of the memory module and the resulting
to maximize composite memory structure. To this end
For example, one aspect of the present invention includes a single ended grounded one
(single-ended) sense amplifier
with sample and hold reference. At a
In another aspect of the present invention, a batch share becomes more fluctuation limited
Driver sense amplifier (charge-share
limited-swing-driver). In addition to limiting voltage fluctuations
it is also desirable
synchronous circuits, for example predecoder and clocked word line decoder,
asynchronous circuits, such as local word line decoders,
to isolate. Therefore, another aspect of the present invention
Invention asynchronously resettable
Row decoder available.
Da
es erwünscht
ist, Signalspannungsdauer und -abfall zu steuern und dadurch Signale
mit begrenzter Spannungsschwankung einzuschränken, sind Vorrichtungen vorgesehen,
die ein Signal genau beenden, einschließlich einer hochgenauen Verzögerungsmessungsschaltung
und einer Diffusionsreplikations-Verzögerungs schaltung (diffusion
replica delay circuit). Die hochgenaue Verzögerungsmessschaltung kann außergewöhnlich genaue
Zeitmessungen, beispielsweise eine Halb-Gate-Verzögerung,
zur Verfügung
stellen. Die hochgenaue Verzögerungsmessschaltung
kann mit einem mehrstufigen Ringoszillator realisiert werden, der
mit mehreren Schwingungssignaldetektoren gekoppelt sein kann, die
Zähler
und Signalflanken-Ermittlungsschaltungen sein
können,
die jeweils die Zahl der Schwingungen durch die Schaltung zählen und
den Umfang bestimmen, in dem sich ein bestimmtes Schwingungssignal in
dem Oszillator fortpflanzt.Since it is desired to control signal voltage duration and decay and thereby limit signals with limited voltage fluctuation, devices are provided which accurately terminate a signal, including a high accuracy delay measurement circuit and a diffusion replication delay circuit delay circuit). The high accuracy delay measurement circuit can provide exceptionally accurate time measurements, such as a half gate delay. The high accuracy delay measurement circuit can be realized with a multi-stage ring oscillator which can be coupled to a plurality of oscillation signal detectors, which can be counters and signal edge detection circuits respectively counting the number of oscillations through the circuit and determining the extent to which a particular oscillation signal enters the oscillator propagates.
Die
Diffusionsreplikations-Verzögerungsschaltung
schränkt
das Signal mit begrenzter Spannungsschwankung durch wesentliches
Replizieren einer Verzögerungscharakteristik
eines vorgegebenen Speicherstruktur-Bestandteils, z.B. einer Bitleitung
ein, so dass ein lokalisiertes Timingsignal erzeugt werden kann,
wodurch eine hochlokalisierte Entscheidungsfindung zur Verfügung gestellt
wird, was z.B. die eigenständige
Operation von und den Zugriff auf Speicherstrukturzeilen ermöglicht.
Eine Ausführungsform
dieses Aspekts der Erfindung umfasst eine Diffusionskapazität, die im
allgemeinen mit der Gesamtkapazität der assoziierten Struktur
(z.B. Bitleitung) zusammenpasst, und einen Transistor, der im allgemeinen
die gesammelten Charakteristiken der Transistoren, die ggf. verwendet
werden, um auf die assoziierte Struktur zuzugreifen, repliziert.
Eine weitere Ausführungsform
dieses Aspekts der Erfindung kann Dummy-Zellen umfassen, die mit
einem selektierten Wortleitungs-Decoder
und einem selektierten Leseverstärker
wirksam gekoppelt sind. Auch kann eine gespaltene Dummy-Bitleitung
mit einer bestimmten Wortleitung assoziiert werden, wodurch eine übermäßige Verzögerung von
gruppierter Wortleitungs-Assoziierung vermieden wird. Bei einem weiteren
Aspekt der vorliegenden Erfindung ist ein Datentransfer-Bus vorgesehen,
um eine begrenzte, gesteuerte Spannungsschwankung auf einen Datenbus
anzuwenden, mit dem die verschiedenen Bestandteile der vorliegenden
Erfindung gekoppelt werden können.
Zusätzlich
kann der Datentransfer-Bus einen programmierbaren Treiber aufweisen,
der logische Signale an den Datenbus anlegen kann, einschließlich codierter
Signale, logische Signale mehrerer Pegel, oder beides. Außerdem ist
auch eine bidirektionale Datentransfer-Busschaltung vorgesehen.The
Diffusion replication delay circuit
restricts
the signal with limited voltage fluctuation by essential
Replicate a delay characteristic
a given memory structure component, e.g. a bit line
a, so that a localized timing signal can be generated,
thus providing highly localized decision making
becomes what e.g. the independent ones
Operation of and access to memory structure lines allows.
An embodiment
This aspect of the invention comprises a diffusion capacity, which in the
general with the total capacity of the associated structure
(e.g., bitline), and a transistor, in general
the collected characteristics of the transistors that may be used
are replicated to access the associated structure.
Another embodiment
This aspect of the invention may include dummy cells associated with
a selected word line decoder
and a selected sense amplifier
are effectively coupled. Also can be a split dummy bitline
be associated with a particular wordline, causing excessive delay of
grouped wordline association is avoided. At another
Aspect of the present invention, a data transfer bus is provided,
a limited, controlled voltage swing on a data bus
apply with which the various components of the present
Invention can be coupled.
additionally
the data transfer bus may have a programmable driver,
which can apply logic signals to the data bus, including coded ones
Signals, logic signals of multiple levels, or both. Besides that is
also provided a bidirectional data transfer bus circuit.
Um
robuste Speicherstrukturen mit hohem Ertrag bereitzustellen, insbesondere
in eingebetteten Zusammenhängen,
sind mehrere Redundanzvorrichtungen vorgesehen. Bei einer Ausführungsform
des Redundanzaspekts der vorliegenden Erfindung sind eine redundante
Gruppe von Speicherzellen und ein Redundanzregler vorgesehen. Der
Redundanzregler ersetzt eine bestimmte Speichergruppe durch die
re dundante Gruppe im Ansprechen auf eine Speicherbedingung, typischerweise
eine inoperable oder „FAILED" Speichergruppe.
Die redundante Speichergruppe kann eine Speicherzeile, eine Speicherspalte,
ein vorher gewählter
Abschnitt eines Speichermoduls, ein wählbarer Abschnitt eines Speichermoduls, ein
Speichermodul und eine Kombination hiervon sein. Diese Ausführungsform
der Redundanz kann während
der Herstellung, beispielsweise durch Verwenden von Sicherungen
und Decodern, implementiert werden. Oder sie kann dynamisch „vor Ort", z.B. durch Verwendung
programmierbarer Schalter, implementiert werden. Die Redundanz kann
auch auf andere Arten implementiert werden. Bei einer weiteren Ausführungsform
der Redundanz gemäß der vorliegenden
Erfindung ist ein Wortleitungs-Decoder mit Zeilenredundanz vorgesehen.
Der Wortleitungs-Decoder kann mit zwei Speicherzeilen gekoppelt
sein. Während
der typischen Operation wählt
der Wortleitungs-Decoder die erste Speicherzeile aus und decodiert
sie. Im Ansprechen auf ein Andere-Zeile-Auswählen-Signal, das z.B. aus einem
Zeilenversagen resultiert, wählt
der Wortleitungs-Decoder jedoch stattdessen die zweite Speicherzeile
aus und decodiert sie. Bei einer weiteren Ausführungsform des Redundanz-Aspekts
der vorliegenden Erfindung kann der vorgenannte asynchron zurücksetzbare
Zeilendecoder so modifiziert werden, dass er die oben erwähnte Zeilenredundanz
aufweist. Das Speichermodul und die hierarchische Speicherstruktur
gemäß der vorliegenden
Erfindung können
in einem Halbleiter-Bauelement, einer optischen Vorrichtung, oder
einer Kombination hieraus, beispielsweise in einem Kommunikationsgerät, untergebracht
sein.Around
To provide robust high-yield storage structures, in particular
in embedded contexts,
Several redundancy devices are provided. In one embodiment
The redundancy aspects of the present invention are redundant
Group of memory cells and a redundancy controller provided. Of the
Redundancy controller replaces a specific memory group by the
re dundante group in response to a storage condition, typically
an inoperable or "FAILED" storage group.
The redundant storage group can be a storage line, a storage column,
a previously chosen one
Section of a memory module, a selectable section of a memory module
Memory module and a combination thereof. This embodiment
the redundancy can be during
manufacturing, for example by using fuses
and decoders. Or it can be dynamic "on-site", for example by use
programmable switch, to be implemented. The redundancy can
can also be implemented in other ways. In a further embodiment
the redundancy according to the present
Invention is provided a word line decoder with line redundancy.
The wordline decoder can be coupled to two memory lines
be. While
the typical operation chooses
the word line decoder outputs the first memory line and decodes
she. In response to another line select signal, e.g. from a
Row failure results, chooses
the word line decoder, however, the second memory line instead
out and decode it. In a further embodiment of the redundancy aspect
The present invention can be asynchronously reset
Row decoders are modified to provide the above-mentioned row redundancy
having. The memory module and the hierarchical memory structure
according to the present
Invention can
in a semiconductor device, an optical device, or
a combination thereof, for example, in a communication device housed
be.
Die
vorliegende Erfindung weist auch ein Verfahren zum Erlangen von
Dual Port Funktionalität aus
einer hierarchischen Speicherstruktur mit Single Port auf. Ein Aspekt
dieser Ausführungsform
führt zu einer
WRITE-AFTER-READ-Operation ohne einen separaten, zwischen die READ
und WRITE Zyklen geschalteten, PRECHARGE Zyklus, wobei die gesamte
WRITE-AFTER-READ-Operation innerhalb eines Speicherzugriffszyklusses
der hierarchischen Speicherstruktur durchgeführt wird. Wo erste Daten von
einer ersten Speicherstelle abgerufen und zweite Daten an einer
zweiten Speicherstelle gespeichert werden sollen, weist das Verfahren
das lokale Selektieren der ersten Speicherstelle auf, von der die
ersten Daten abgerufen werden sollen; das lokale Lesen der ersten
Daten (d.h. die READ-Operation); das globale Selektieren der zweiten
Speicherstelle; im wesentlichen gleichzeitig mit dem globalen Selektieren das
globale Lesen der ersten Daten an der ersten Speicherstelle; das
Ausgeben der ersten Daten nach dem globalen Lesen; das Eingeben
der zweiten Daten im wesentlichen unmittelbar nach dem Ausgeben der
ersten Daten; das lokale Selektieren der zweiten Speicherstelle;
und das Speichern der zweiten Daten (d.h. die WRITE-Operation).
Wo es notwendig ist, kann ein Vorladen der erforderlichen Bitleitungen durchgeführt werden,
bevor die ersten Daten lokal gelesen werden (d.h. eine PRECHARGE-Operation). Aufgrund
der Effizienz, die durch eine erfindungsgemäße hierarchische Speicherstruktur
realisiert wird, einschließlich
der Eliminierung einer zweiten PRECHARGE-Operation unmittelbar vor
der WRITE-Operation, kann eine derartige PRECHARGE/READ/WRITE-Operation
in weniger als einem einzigen Speicherzugriffszyklus der hierarchischen Speicherstruktur
durchgeführt
werden. Tatsächlich können, wo
es der Zusammenhang der gesamten hierarchischen Speicherstruktur
(z.B. lange Zwischenschaltungsleitungen, große Gesamtspeicherstruktur,
etc.) erlaubt, mehrere PRECHARGE/READ/WRITE-Operationen in weniger
als einem Speicherzugriffszyklus durchgeführt werden. Bei einer weiteren
Ausführungsform
dieses Verfahrens kann eine WRITE-AFER-READ-Operation durch Zwischenschalten
einer PRECHARGE-Operation zwischen aufeinanderfolgende WRITE-Operationen durchgeführt werden.
Diese Ausführungsform
des erfindungsgemäßen Verfahrens
umfasst das globale Selektieren der ersten Speicherstelle, an der
die ersten Daten gespeichert werden sollen; das Vorladen von Bitleitungen,
die mit der ersten Speicherstelle gekoppelt sind (PRECHARGE1-Operation);
das lokale Selektieren der ersten Speicherstelle; das Speichern der
ersten Daten (WRITE1-Operation); das globale Selektieren der zweiten
Speicherstelle, an der die zweiten Daten gespeichert werden sollen;
im wesentlichen gleichzeitig mit dem globalen Selektieren der zweiten
Speicherstelle das Vorladen von Bitleitungen, die mit der zweiten
Speicherstelle gekoppelt sind (PRECHARGE2-Operation); das lokale
Selektieren der zweiten Speicherstelle; und das Speichern der zweiten
Daten (WRITE2-Operation). Trotz der zwischengeschalteten PRECHARGE2-Operation
ermöglichen
es die Effizienzen, die durch eine erfindungsgemäße hierarchische Speicherstruktur
bereitgestellt werden, dass eine oder mehrere WRITE-AFTER-WRITE-Operationen
in weniger als einem einzigen Speicherzugriffszyklus der hierarchischen
Speicherstruktur durchgeführt
werden.The present invention also includes a method for obtaining dual port functionality from a single port hierarchical storage structure. One aspect of this embodiment results in a WRITE AFTER READ operation without a separate PRECHARGE cycle coupled between the READ and WRITE cycles, where the entire WRITE AFTER READ operation is performed within a memory access cycle of the hierarchical memory structure. Where first data is to be retrieved from a first storage location and second data stored at a second storage location, the method comprises locally selecting the first storage location from which the first data is to be retrieved; local reading of the first data (ie the READ operation); the global selection of the second memory location; essentially simultaneously with the global selecting, the global reading of the first data at the first memory location; outputting the first data after global reading; inputting the second data substantially immediately after outputting the first data; local selecting the second memory location; and storing the second data (ie the WRITE operation). Where necessary, precharge the required bitlines before the first data is read locally (ie a PRECHARGE operation). Due to the efficiency realized by a hierarchical memory structure according to the invention, including the elimination of a second PRECHARGE operation immediately before the WRITE operation, such a PRECHARGE / READ / WRITE operation can be performed in less than a single memory access cycle of the hierarchical memory structure. In fact, where the context of the entire hierarchical memory structure (eg, long interconnect lines, large total memory structure, etc.) permits, multiple PRECHARGE / READ / WRITE operations can be performed in less than one memory access cycle. In another embodiment of this method, a WRITE-AFER-READ operation may be performed by interposing a PRECHARGE operation between successive WRITE operations. This embodiment of the method according to the invention comprises the global selection of the first memory location at which the first data is to be stored; precharging bitlines coupled to the first memory location (PRECHARGE1 operation); local selecting the first memory location; storing the first data (WRITE1 operation); global selecting the second memory location where the second data is to be stored; substantially simultaneously with globally selecting the second memory location, precharging bitlines coupled to the second memory location (PRECHARGE2 operation); local selecting the second memory location; and storing the second data (WRITE2 operation). Despite the intermediate PRECHARGE2 operation, the efficiencies provided by a hierarchical storage structure according to the invention allow one or more WRITE AFTER WRITE operations to be performed in less than a single memory access cycle of the hierarchical storage structure.
Die
vorliegende Erfindung wird durch die nachfolgende detaillierte Beschreibung
der Ausführungsformen
zusammen mit den beigefügten
Zeichnungen besser verstanden werden.The
The present invention will become apparent from the following detailed description
the embodiments
together with the attached
Drawings are better understood.
KURZE BESCHREIBUNG DER
ZEICHNUNGENBRIEF DESCRIPTION OF THE
DRAWINGS
Diese
und weitere Merkmale, Aspekte und Vorteile der vorliegenden Erfindung
werden besser verstanden, wenn sie in Bezug auf die folgende detaillierte
Be schreibung, die beigefügten
Ansprüche und
die begleitenden Zeichnungen betrachtet werden. Es zeigt:These
and other features, aspects and advantages of the present invention
will be better understood if they detail in relation to the following
Description, attached
Claims and
the accompanying drawings are considered. It shows:
1 ein
Blockdiagramm einer beispielhaften Static Random Access Memory (SRAM)-Architektur; 1 a block diagram of an exemplary static random access memory (SRAM) architecture;
2 ein
allgemeines Schaltungsschema einer beispielhaften CMOS-SRAM-Speicherzelle mit sechs
Transistoren; 2 a general circuit diagram of an exemplary six-transistor CMOS SRAM memory cell;
3 ein
Blockdiagramm einer Ausführungsform
eines hierarchischen Speichermoduls unter Verwendung lokalen Bitleitungs-Abtastens,
gemäß der vorliegenden
Erfindung; 3 a block diagram of an embodiment of a hierarchical memory module using local bit line scanning, according to the present invention;
4 ein
Blockdiagramm einer Ausführungsform
eines hierarchischen Speichermoduls unter Verwendung einer alternativen
lokalen Bitleitungs-Abtastungs-Struktur; 4 a block diagram of an embodiment of a hierarchical memory module using an alternative local bitline scanning structure;
5 ein
Blockdiagramm einer beispielhaften zweidimensionalen, zweistufigen
hierarchischen Speicherstruktur, die mehrere lokale Bitleitungs-Abtastungs-Module
der 3 verwendet; 5 a block diagram of an exemplary two-dimensional, two-stage hierarchical memory structure, the plurality of local bit line sampling modules of 3 used;
6 ein
Blockdiagramm einer beispielhaften hierarchischen Speicherstruktur,
das ein Speichermodul zeigt, das sowohl lokale Wortleitungs-Decodierungs-
als auch lokale Bitleitungs-Abtastungs-Strukturen verwendet; 6 10 is a block diagram of an exemplary hierarchical memory structure showing a memory module using both local word line decoding and local bit line sampling structures;
7 eine
perspektivische Darstellung einer hierarchischen Speicherstruktur
mit einer Drei-Stufen-Hierarchie, gemäß der vorliegenden Erfindung; 7 a perspective view of a hierarchical storage structure with a three-level hierarchy, according to the present invention;
8 ein
Schaltungsschema eines asynchron zurücksetzbaren Decoders gemäß einem
Aspekt der vorliegenden Erfindung; 8th a circuit diagram of an asynchronously resetable decoder according to an aspect of the present invention;
9 ein
Schaltungsschema einer Treiberschaltung mit begrenzter Schwankung
gemäß einem Aspekt
der vorliegenden Erfindung; 9 a circuit diagram of a limited fluctuation driver circuit according to one aspect of the present invention;
10 ein
Schaltungsschema einer einpolig geerdeten Leseverstärker-Schaltung
mit Abtast- und Haltereferenz (Sample-and-Hold Reference) gemäß einem
Aspekt der vorliegenden Erfindung; 10 a circuit diagram of a single-ended sense amplifier sample and hold reference (SAMPLE) reference circuit according to one aspect of the present invention;
11 ein
Schaltungsschema einer Charge-Share, schwankungsbegrenzten Treiber-Leseverstärker-Schaltung
gemäß einem
Aspekt der vorliegenden Erfindung; 11 a circuit diagram of a charge-share, fluctuation-limited driver-sense amplifier circuit according to one aspect of the present invention;
12 ein
Blockdiagramm, das eine Ausführungsform
hierarchischer Speichermodul-Redundanz zeigt; 12 a block diagram showing an embodiment of hierarchical memory module redundancy;
13 ein
Blockdiagramm, das eine andere Ausführungsform hierarchischer Speichermodul-Redundanz
zeigt; 13 a block diagram showing another embodiment of hierarchical memory module redundancy;
14 ein
Blockdiagramm einer Speicherredundanz-Vorrichtung, das eine weitere
Ausführungsform
hierarchischer Speichermodul-Redundanz zeigt; 14 a block diagram of a memory redundancy device, the another embodiment of hierarchical memory module redundancy shows;
15A eine Diagrammdarstellung des Signalflusses
eines beispielhaften fehlerlosen Speichermoduls mit spaltenorientierter
Redundanz; 15A a diagram of the signal flow of an exemplary error-free memory module with column-oriented redundancy;
15B eine Diagrammdarstellung des verschobenen
Signalflusses des beispielhaften fehlerhaften Speichermoduls, das
in 15A gezeigt ist; 15B 5 is a diagrammatic representation of the shifted signal flow of the exemplary faulty memory module which is shown in FIG 15A is shown;
16 ein
verallgemeinertes Blockdiagramm einer Redundanz-Auswählschaltung,
das eine weitere Ausführungsform
der hierarchischen Speichermodul-Redundanz zeigt; 16 a generalized block diagram of a redundancy selection circuit showing another embodiment of the hierarchical memory module redundancy;
17 ein
Schaltungsschema einer Ausführungsform
eines globalen Zeilendecoders mit Zeilenredundanz gemäß der vorliegenden
Erfindung; 17 a circuit diagram of an embodiment of a global row decoder with row redundancy according to the present invention;
18 ein
Blockdiagramm, das Dual Port Funktionalität in einer hierarchischen Speicherstruktur
mit Single Port unter Verwendung hierarchischer Speichermodule gemäß der vorliegenden
Erfindung zeigt. 18 12 is a block diagram showing dual port functionality in a single port hierarchical memory structure using hierarchical memory modules according to the present invention.
19 ein
schematisches Diagramm einer Ausführungsform einer hochgenauen
Verzögerungsmessschaltung
gemäß der vorliegenden
Erfindung; 19 a schematic diagram of an embodiment of a high-precision delay measurement circuit according to the present invention;
20 ein
vereinfachtes Blockdiagramm eines Aspekts der vorliegenden Erfindung
unter Verwendung einer Ausführungsform
einer Diffusionsreplikations-Verzögerungsschaltung; 20 a simplified block diagram of an aspect of the present invention using an embodiment of a diffusion replication delay circuit;
21 ein
vereinfachtes Blockdiagramm eines Aspekts der vorliegenden Erfindung
unter Verwendung einer weiteren Ausführungsform einer Diffusionsreplikations-Verzögerungsschaltung; 21 a simplified block diagram of an aspect of the present invention using a further embodiment of a diffusion replication delay circuit;
22A ein schematisches Diagramm eines weiteren
Aspekts einer Ausführungsform
der vorliegenden Erfindung unter Verwendung einer Hochgeschwindigkeits-Datentransfer-Busschaltung
mit niedriger Energie; und 22A a schematic diagram of another aspect of an embodiment of the present invention using a high-speed low-energy data transfer bus circuit; and
22B ein schematisches Diagramm eines weiteren
Aspekts einer Ausführungsform
der vorliegenden Erfindung unter Verwendung einer Hochgeschwindigkeits-Datentransfer-Busschaltung
mit niedriger Energie. 22B a schematic diagram of another aspect of an embodiment of the present invention using a high-speed low-power data transfer bus circuit.
DETAILLIERTE BESCHREIBUNG
DER AUSFÜHRUNGSFORMENDETAILED DESCRIPTION
THE EMBODIMENTS
Wie
der Fachmann weiß,
weisen die meisten VLSI-Systeme einschließlich Kommunikationssystemen
und DSP-Vorrichtungen VLSI-Speicher-Untersysteme auf. Moderne Anwendungen
von VLSI-Speicher-Untersystemen erfordern nahezu durchwegs hocheffiziente
Hochleistungsimplementierungen, die Gestaltungskompromisse bei Layout-Effizienz,
Geschwindigkeit, Energieverbrauch, Skalierbarkeit, Designtoleranzen
und ähnlichem
erhöhen.
Die vorliegende Erfindung verringert diese Kompromisse durch Verwendung
einer neuartigen hierarchischen Architektur. Das Speichermodul der
vorliegenden Erfindung kann auch einen oder mehrere neuartige Bestandteile
einsetzen, die weiter zur Effizienz und Robustheit der Speichermodule
beitragen.As
the expert knows
Most VLSI systems include communication systems
and DSP devices include VLSI memory subsystems. Modern applications
VLSI memory subsystems almost always require high efficiency
High performance implementations, design compromises in layout efficiency,
Speed, power consumption, scalability, design tolerances
and the like
increase.
The present invention reduces these trade-offs by use
a novel hierarchical architecture. The memory module of
The present invention may also include one or more novel ingredients
use that further enhances the efficiency and robustness of the memory modules
contribute.
Im
folgenden ist es, jedoch nur zu Zwecken der Darstellung, hilfreich,
die verschiedenen Aspekte und Ausführungsformen der vorliegenden
Erfindung im Zusammenhang mit einer SRAM-Speicherstruktur zu beschreiben,
die CMOS-SRAM-Speicherzellen verwendet.
Für den
Fachmann ist es jedoch selbstverständlich, dass die vorliegende
Erfindung nicht auf Verfahren auf CMOS-Basis beschränkt ist,
und dass die vorliegenden Aspekte und Ausführungsformen mutatis mutandis
auch in von SRAM verschiedenen Kategorien von Speicherprodukten,
einschließlich,
jedoch nicht beschränkt
auf, DRAM, ROM, PLA und ähnlichem,
egal ob in einem VLSI-System
eingebettet oder als eigenständige
Speichervorrichtung, verwendet werden können.in the
the following is helpful, but only for purposes of illustration,
the various aspects and embodiments of the present invention
To describe the invention in the context of an SRAM memory structure,
uses the CMOS SRAM memory cells.
For the
However, it is obvious to a person skilled in the art that the present invention
Invention is not limited to CMOS-based methods,
and that the present aspects and embodiments are mutatis mutandis
also in SRAM different categories of memory products,
including,
but not limited
on, DRAM, ROM, PLA and the like,
whether in a VLSI system
embedded or as independent
Storage device, can be used.
BEISPIELHAFTES SRAM-MODUL
UND BEISPIELHAFTE SPEICHERZELLEEXEMPLARY SRAM MODULE
AND EXAMPLE STORAGE CELL
1 ist
ein funktionales Blockdiagramm der SRAM-Speicherstruktur 100,
das die Grundmerkmale der meisten SRAM-Untersysteme aufzeigt. Das Modul 100 weist
einen Speicherkern 102, eine Wortleitungssteuerung 104,
eine Vorladungs-Steuerung 112,
Speicheradresseingänge 114 und
eine Bitleitungs-Steuervorrichtung 116 auf. Der Speicherkern 102 ist
aus einem zweidimensionalen Array von K-Bits von Speicherzellen 103 zusammengesetzt, der
so angeordnet ist, dass er C Spalten und R Zeilen von Bitspeicherstellen
aufweist, wobei K = (C × R). Die üblichste
Konfiguration des Speicherkerns 102 verwendet eine Einzelwortleitung 106,
um Zellen 103 auf gepaarten differentialen Bitleitungen 118 zu
verbinden. Im allgemeinen ist der Kern 102 als Array von 2P Wortleitungen angeordnet, basierend auf
einem Satz von P Speicheradresseingangsleitungen 114, d.h.
R = 2P. Daher wird die p-Bit Adresse von
dem Zeilenadressdecoder 110 und dem Spaltenadressdecoder 122 decodiert.
Der Zugriff auf eine gegebene Speicherzelle 103 wird in
einem derartigen Einzelkern-Speicher durch Aktivieren der Spalte 105 und der
Zeile 106 entsprechend der Zelle 103 durchgeführt. Die
Spalte 105 wird durch Auswählen, und Schalten, aller Bitleitungen
in der bestimmten Spalte entsprechend der Zelle 103 aktiviert. 1 is a functional block diagram of the SRAM memory structure 100 which shows the basic features of most SRAM subsystems. The module 100 has a memory core 102 , a wordline control 104 , a precharge control 112 , Memory address inputs 114 and a bit line control device 116 on. The memory core 102 is a two-dimensional array of K bits of memory cells 103 arranged to have C columns and R rows of bit storage locations, where K = (C × R). The most common configuration of the storage core 102 uses a single word line 106 to cells 103 on paired differential bitlines 118 connect to. In general, the core is 102 arranged as an array of 2 P word lines, based on a set of P memory address input lines 114 , ie R = 2 P. Therefore, the p-bit address of the row address decoder 110 and the column address decoder 122 decoded. The access to a given memory cell 103 is in such a single-core memory by activating the column 105 and the line 106 according to the cell 103 carried out. The gap 105 is selected by, and switching, all of the bitlines in the particular column corresponding to the cell 103 activated.
Die
bestimmte Zeile, auf die zugegriffen werden soll, wird durch selektives
Aktivieren des Zeilenadressdecoders 110 ausgewählt, und
entspricht normalerweise nur einer vorgegebenen Zeile, oder Wortleitung,
die alle Zellen 103 in der bestimmten Zeile umfasst. Der
Worttreiber 108 kann die ausgewählte Wortleitung 106 so
treiben, dass die ausgewählte Speicherzelle 103 auf
einem bestimmten Paar von Bit leitungen 118 beschrieben
oder ausgelesen werden kann, gemäß der an
die Speicheradresseingänge 114 gelieferten
Bitadresse.The particular row to be accessed is enabled by selectively activating the row address decoder 110 is selected, and usually corresponds to only one given line, or word line, all cells 103 in the particular line. The word driver 108 can select the selected word line 106 so drive that the selected memory cell 103 on a particular pair of bit lines 118 can be written or read according to the memory address inputs 114 supplied bit address.
Die
Bitleitungs-Steuervorrichtung 116 kann Vorladungs-Zellen 120,
Spalten-Multiplexer 122,
Leseverstärker 124 und
Eingangs-/Ausgangs-Puffer 126 aufweisen. Da differentiale
Lesen/Schreiben-Schemata typischerweise für Speicherzellen verwendet
werden, ist es erwünscht,
dass Bitleitungen in einen definierten Zustand versetzt werden,
bevor auf sie zugegriffen wird. Vorladungs-Zellen 120 können verwendet
werden, um den Zustand der Bitleitungen 118 durch einen
PRECHARGE-Zyklus gemäß einem
vordefinierten Vorladungs-Schema einzurichten. In einem statischen
Vorladungs-Schema können
die Vorladungs-Zellen 120 ständig angelassen werden. Obwohl
es oft einfach zu implementieren ist, kann das statische Vorladen
der aktiven Operation der Vorrichtung eine große Energielast aufbürden. Dynamische
Vorladungs-Schemata können zum
Laden der Bitleitungen getaktete Vorladungs-Zellen 120 verwenden
und können
so das Energiebudget der Struktur 100 reduzieren. Zusätzlich zum
Herstellen eines definierten Zustands auf den Bitleitungen 118 können die
Bitleitungen 120 auch verwendet werden, um eine Angleichung
von Differentialspannungen auf den Bitleitungen 118 vor
einer Lese-Operation zu bewirken. Leseverstärker 124 ermöglichen
es, dass die Größe der Speicherzelle 103 durch
Abtasten der Differentialspannung auf der Bitleitung 118,
die deren Zustand angibt, und durch Umwandeln dieser Differentialspannung
in ein Signal mit logischem Pegel reduziert wird.The bit line control device 116 can pre-charge cells 120 , Column multiplexer 122 , Sense amplifier 124 and input / output buffers 126 exhibit. Since differential read / write schemes are typically used for memory cells, it is desirable that bitlines be put into a defined state before being accessed. Precharge cells 120 can be used to control the state of the bitlines 118 through a PRECHARGE cycle according to a predefined precharge scheme. In a static precharge scheme, the precharge cells 120 be started constantly. Although often easy to implement, static precharging of the active operation of the device can impose a large energy load. Dynamic precharge schemes may use precharge cells clocked to charge the bitlines 120 use and so can the energy budget of the structure 100 to reduce. In addition to establishing a defined state on the bitlines 118 can the bitlines 120 also used to approximate differential voltages on the bitlines 118 before a read operation. sense amplifier 124 allow it to be the size of the memory cell 103 by sampling the differential voltage on the bit line 118 , which indicates its state, and is reduced by converting this differential voltage into a logic-level signal.
Im
allgemeinen wird eine READ-Operation durch Aktivieren des Zeilendecoders 110 durchgeführt, der
eine bestimmte Zeile auswählt.
Die Ladung auf einer Bitleitung 118 jedes Paars von Bitleitungen in
jeder Spalte entlädt
sich durch die aktivierte Speicherzelle 103, die den Zustand
der aktiven Zellen 103 in dieser Spalte 105 repräsentiert.
Der Spaltendecoder 122 aktiviert nur eine der Spalten und
verbindet die Bitleitungen 118 mit dem Eingangs-/Ausgangs-Puffer 126.
Die Leseverstärker 124 stellen
die Treiberfähigkeit
zum Liefern von Strom an den Eingangs-/Ausgangs-Puffer 126 zur
Verfügung.
Wenn der Leseverstärker 124 aktiviert
wird, führen
die unsymmetrischen Bitleitungen 118 dazu, dass der symmetrische
Leseverstärker
auf den Zustand der Bitleitungen hin ausgelöst wird, und Daten 125 werden von
dem Puffer 126 ausgegeben.In general, a READ operation is performed by activating the row decoder 110 performed selecting a particular line. The charge on a bit line 118 each pair of bitlines in each column discharges through the activated memory cell 103 indicating the state of active cells 103 in this column 105 represents. The column decoder 122 activates only one of the columns and connects the bitlines 118 with the input / output buffer 126 , The sense amplifiers 124 provide the driver capability to provide power to the input / output buffer 126 to disposal. If the sense amplifier 124 is activated, lead the unbalanced bit lines 118 causing the balanced sense amplifier to be triggered on the state of the bit lines, and data 125 be from the buffer 126 output.
Eine
WRITE-Operation wird durch Anlegen der Daten 125 an die
Eingangs/Ausgangs-Puffer 126 durchgeführt. Vor der WRITE-Operation
werden die Bitleitungen 118 von Vorladungs-Zellen 120 auf
einen vorgegebenen Wert vorgeladen. Das Anlegen von Eingangsdaten 125 an
die Eingangs-/Ausgangs-Puffer 126 führt dazu, dass sich die Vorladungs-Spannung
auf einer der Bitleitungen 118 entlädt, wodurch sich eine Bitleitungs-Logik
HIGH (HOCH) und eine Bitleitungs-Logik LOW (NIEDRIG) ergibt. Der
Spaltendecoder 122 wählt
eine bestimmte Spalte 105, die die Bitleitung 118 mit
den Eingangs-/Ausgangs-Puffern 126 verbindet, aus, wodurch
eine der Bitleitungen 118 entladen wird. Der Zeilendecoder 110 wählt eine
bestimmte Zeile aus, und die Informationen auf den Bitleitungen 118 werden
am Schnittpunkt der Spalte 105 mit der Zeile 106 in
die Zelle 103 geschrieben. Zu Beginn eines typischen internen
Timing-Zyklusses wird das Vorladen deaktiviert und erst wieder aktiviert,
wenn die ganze Operation durchgeführt ist. Der Spaltendecoder 122 und
der Zeilendecoder 110 werden dann aktiviert, gefolgt von
der Aktivierung des Leseverstärkers 124. Zum
Abschluss einer READ- oder einer WRITE-Operation wird der Leseverstärker 124 deaktiviert.
Darauf folgt das Deaktivieren der Decoder 110, 122;
zu diesem Zeitpunkt werden die Vorladungs-Zellen 120 während eines
folgenden PRECHARGE-Zyklusses wieder aktiviert. Im allgemeinen führt das
Aktivierthalten des Leseverstärkers 124 während der
gesamten READ/WRITE-Operation zu sehr hohem Energieverbrauch der
Vorrichtung, weil der Leseverstärker 124 nur
während
der tatsächlich
für das
Abtasten des Zustands der Speicherzelle 103 erforderlichen Zeit
aktiv zu sein braucht.A WRITE operation is done by creating the data 125 to the input / output buffers 126 carried out. Before the WRITE operation, the bitlines become 118 of precharge cells 120 preloaded to a predetermined value. The creation of input data 125 to the input / output buffers 126 causes the precharge voltage on one of the bitlines 118 discharges, resulting in a bit line logic HIGH and a bit line logic LOW. The column decoder 122 chooses a specific column 105 that the bit line 118 with the input / output buffers 126 connects, out, causing one of the bitlines 118 unloaded. The row decoder 110 selects a particular line and the information on the bitlines 118 be at the intersection of the column 105 with the line 106 into the cell 103 written. At the beginning of a typical internal timing cycle, the precharge is disabled and not activated again until the entire operation has been performed. The column decoder 122 and the row decoder 110 are then activated, followed by the activation of the sense amplifier 124 , At the end of a READ or WRITE operation, the sense amplifier becomes 124 disabled. This is followed by disabling the decoder 110 . 122 ; at this time are the pre-charge cells 120 re-activated during a subsequent PRECHARGE cycle. In general, activating the sense amplifier will result 124 during the whole READ / WRITE operation very high power consumption of the device because of the sense amplifier 124 only while actually for scanning the state of the memory cell 103 needed time to be active.
2 zeigt
eine Implementierung der Speicherzelle 103 in 1 in
Form einer CMOS-Zelle 200 mit sechs Transistoren. Die Transistorzelle 200 ist eine
Art von Transistor, die auch bei Ausführungsformen der vorliegenden
Erfindung verwendet werden kann. Die SRAM-Zelle 200 kann
in einem von drei möglichen
Zuständen
vorliegen: (1) im STABLE (STABIL)-Zustand, in dem die Zelle 200 einen
Signalwert hat, die einer logischen „1" oder logischen „0" entspricht; (2) im READ-Operation-Zustand;
oder (3) im WRITE-Operation-Zustand. Im STABLE-Zustand ist die Speicherzelle 200 effektiv
von dem Speicherkern (z.B. dem Kern 102 in 1)
getrennt. Die Bitleitungen 202, 204 werden zu
HIGH vorgeladen (logische „1"), bevor eine Operation
(READ oder WRITE) stattfinden kann. Die Zeilenauswähl-Transistoren 206, 208 werden
während
des Vorladens ausgeschaltet. Die Vorladungs-Energie wird durch Vorladungs-Zellen
(nicht gezeigt) geliefert, die mit den Bitleitungen 202, 204, ähnlich den
Vorladungszellen 12 in 1, verbunden
sind. Eine READ-Operation wird durch Durchführen eines PRECHARGE-Zyklusses initiiert,
wodurch die Bitleitungen 202, 204 auf logisch HIGH
vorgeladen und die Wortleitung 205 unter Verwendung der
Zeilenauswähl-Transistoren 206, 208 aktiviert
wird. Eine der Bitleitungen 202, 204 entlädt sich
durch die Bit-Zelle 200, und eine Differentialspannung
wird zwischen den Bitleitungen 202, 204 erzeugt.
Diese Spannung wird abgefühlt
und auf logische Pegel verstärkt.
Eine WRITE-Operation in der Zelle 200 wird nach einem weiteren
PRECHARGE-Zyklus durch Treiben der Bitleitungen 202, 204 in den
erforderlichen Zustand und Aktivieren der Wortleitung 205 durchgeführt. CMOS
ist eine erwünschte Technologie,
da der von einer derartigen SRAM-Zelle abgezogene Strom typischerweise
auf den Leckstrom der Transistoren 201a–d begrenzt ist, wenn
sie im STABLE-Zustand sind. 2 shows an implementation of the memory cell 103 in 1 in the form of a CMOS cell 200 with six transistors. The transistor cell 200 is a type of transistor that may also be used in embodiments of the present invention. The SRAM cell 200 may be in one of three possible states: (1) in the STABLE state in which the cell 200 has a signal value corresponding to a logical "1" or logical "0"; (2) in the READ operation state; or (3) in the WRITE operation state. In the STABLE state is the memory cell 200 effectively from the memory core (eg the core 102 in 1 ) separated. The bitlines 202 . 204 are precharged to HIGH (logic "1") before any operation (READ or WRITE) can take place The row select transistors 206 . 208 are switched off during pre-charging. The precharge energy is supplied by precharge cells (not shown) connected to the bitlines 202 . 204 , similar to the precharge cells 12 in 1 , are connected. A READ operation is initiated by performing a PRECHARGE cycle, whereby the bitlines 202 . 204 Logically HIGH summoned and the word line 205 using the row select transistors 206 . 208 is activated. One of the bit lines 202 . 204 discharges through the bit cell 200 , and a differential Voltage will be between the bit lines 202 . 204 generated. This voltage is sensed and amplified to logic levels. A WRITE operation in the cell 200 becomes after another PRECHARGE cycle by driving the bitlines 202 . 204 in the required state and activate the word line 205 carried out. CMOS is a desirable technology because the current drawn from such a SRAM cell is typically due to the leakage current of the transistors 201a-d is limited when they are in the STABLE state.
Mit
dem Anwachsen der Speicherzelldichte und mit der weiteren Integration
von Speicherkomponenten in komplexere Systeme wird es zwingend erforderlich,
Speicherarchitekturen zur Verfügung
zu stellen, die robust, zuverlässig,
schnell und bereichs- und leistungseffizient sind. Einzelkern-Architekturen, ähnlich denen,
die in 1 dargestellt sind, sind in zunehmendem Maße nicht
mehr fähig,
die Leistungs-, Geschwindigkeits-, Bereichs- und Robustheitsauflagen
für eine
gegebene Hochleistungs-Speicheranwendung zu erfüllen. Daher ist es erwünscht, den
Energieverbrauch zu minimieren, die Vorrichtungsgeschwindigkeit
zu erhöhen,
und die Zuverlässigkeit
und Robustheit der Vorrichtung zu verbessern, und es wurden zahlreiche
Ansätze
zu diesem Zweck entwickelt. Die Vorteile der vorliegenden Erfindung
können
im nachfolgenden Zusammenhang mit einigen dieser Ansätze besser
verstanden werden, insbesondere, da sie sich auf Energiereduzierung und
Geschwindigkeitsverbesserung sowie auf Redundanz und Robustheit
beziehen.With the growth of memory cell density and the further integration of memory components into more complex systems, it becomes imperative to provide memory architectures that are robust, reliable, fast, and space and power efficient. Single-core architectures similar to those found in 1 are increasingly unable to meet the performance, speed, range, and robustness constraints for a given high performance storage application. Therefore, it is desirable to minimize power consumption, increase device speed, and improve the reliability and robustness of the device, and numerous approaches have been developed for this purpose. The advantages of the present invention may be better understood in the following context with some of these approaches, particularly as they relate to energy reduction and speed improvement as well as redundancy and ruggedness.
ENERGIEREDUZIERUNG UND
GESCHWINDIGKEITSVERBESSERUNGENERGY REDUCTION AND
SPEED IMPROVEMENT
Unter
Bezug auf 1 wird der Inhalt der Speicherzelle 103 des
Speicherblocks 100 in dem Leseverstärker 102 unter Verwendung
eines Differentialsignals zwischen den Bitleitungen 104, 106 ermittelt.
Diese Architektur ist jedoch nicht skalierbar. Auch gibt es, wenn
der Speicherblock 100 vergrößert wird, praktische Einschränkungen
der Fähigkeit
des Leseverstärkers 102,
ein angemessenes Signal rechtzeitig an den Bitleitungen 104, 106 zu
empfangen. Das Vergrößern der
Länge der
Bitleitungen 104, 106 erhöht die assoziierte Bitleitungs-Kapazität und somit
die Zeit, die ein Signal braucht, um sich in den Bitleitungen 104, 106 zu
entwickeln. Die Leitungen 104, 106 müssen mit
mehr Energie versorgt werden, um die zusätzliche Kapazität zu überwinden.
Auch dauert es bei den Architekturen des Standes der Technik länger, längere Bitleitungen
vorzuladen, wodurch die effektive Vorrichtungsgeschwindigkeit reduziert
wird. Ähnlich
erfordert das Schreiben in längere
Bitleitungen 104, 106, wie man sie im Stand der Technik
antrifft, längeres
Vorladen, wodurch der Energiebedarf der Schaltung erhöht und die
effektive Vorrichtungsgeschwindigkeit weiter reduziert wird.With reference to 1 becomes the content of the memory cell 103 of the memory block 100 in the sense amplifier 102 using a differential signal between the bit lines 104 . 106 determined. However, this architecture is not scalable. Also, there is when the memory block 100 is increased, practical limitations of the ability of the sense amplifier 102 , an appropriate signal in time on the bit lines 104 . 106 to recieve. Increasing the length of the bitlines 104 . 106 increases the associated bit-line capacitance and thus the time it takes for a signal to propagate in the bitlines 104 . 106 to develop. The wires 104 . 106 need more energy to overcome the extra capacity. Also, the architectures of the prior art take longer to precharge longer bitlines, thereby reducing the effective device speed. Similarly, writing into longer bit lines requires 104 . 106 as encountered in the prior art, longer precharge, which increases the power requirements of the circuit and further reduces the effective device speed.
Im
allgemeinen kann ein reduzierter Energieverbrauch in Speichervorrichtungen
wie der Struktur 100 in 1 dadurch
erreicht werden, dass beispielsweise die gesamte Schaltkapazität reduziert wird
und Spannungsschwankungen minimiert werden. Die Vorteile der Energiereduzierungs-Aspekte bestimmter
Ausführungsformen
der vorliegenden Erfindung können
im Zusammenhang mit der Reduzierung der Schaltkapazität und der
Begrenzung der Spannungsschwankung besser verstanden werden.In general, a reduced power consumption in memory devices such as the structure 100 in 1 be achieved, for example, that the entire switching capacity is reduced and voltage fluctuations are minimized. The advantages of the energy reduction aspects of certain embodiments of the present invention may be better understood in the context of reducing switching capacitance and limiting voltage fluctuation.
REDUZIERUNG DER SCHALTKAPAZITÄTREDUCTION OF SWITCHING CAPACITY
Mit
der Erhöhung
der Bitdichte von Speicherstrukturen geht die Beobachtung einher,
dass Einzelkern-Speicherstrukturen mit jedem Speicherzugriff verbundene
hohe Schaltkapazitäten
aufweisen können,
die nicht zu akzeptieren sind. Der Zugriff auf eine Bitstelle in
einem derartigen Einzelkern-Speicher erfordert das Aktivieren der
gesamten Zeile, oder Wortleitung, in der die Daten gespeichert sind, sowie
das Schalten aller Bitleitungen in der Struktur. Es ist daher erwünscht, Hochleistungs-Speicherstrukturen
zu gestalten, um die gesamte Schaltkapazität während eines gegebenen Zugriffs
zu reduzieren.With
the increase
the density of memory structures is accompanied by observation
that single-core memory structures associated with each memory access
high switching capacities
can have
that are not acceptable. Access to a bit position in
Such a single core memory requires activating the
entire line, or word line, in which the data is stored, as well
the switching of all bitlines in the structure. It is therefore desirable to have high performance memory structures
to configure the total switching capacity during a given access
to reduce.
Zwei
bekannte Ansätze
zur Reduzierung der gesamten Schaltkapazität während eines Speicherstruktur-Zugriffs
umfassen das Aufteilen einer Einzelkem-Speicherstruktur in eine
Bank-Speicherstruktur und das Verwenden aufgeteilter Wortleitungsstrukturen.
Bei dem ersten Ansatz ist es notwendig, nur die bestimmte Speicherbank,
die mit der interessierenden Speicherzelle verbunden ist, zu aktivieren.
Bei dem zweiten Ansatz wird die Schaltkapazität durch Lokalisieren der Wortleitungsaktivierung
im höchsten praktizierbaren
Ausmaß reduziert.Two
known approaches
to reduce the total switching capacity during a memory structure access
include dividing a single core memory structure into one
Bank memory structure and using shared wordline structures.
In the first approach, it is necessary to use only the particular memory bank,
which is connected to the memory cell of interest.
In the second approach, the switching capacity is achieved by locating the wordline activation
in the highest practicable
Extent reduced.
Geteilter oder Bank-SpeicherkernShared or bank memory core
Ein
Ansatz zum Reduzieren von Schaltkapazitäten ist es, den Speicherkern
in getrennt schaltbare Banken von Speicherzellen aufzuteilen. Typischerweise
ist die gesamte Schaltkapazität
während
eines gegebenen Speicherzugriffs für Bank-Speicherkerne umgekehrt
proportional zur Anzahl der verwendeten Banken. Durch vernünftiges
Auswählen
der Anzahl und der Platzierung der Bankeinheiten innerhalb eines
gegebenen Speicherkern-Designs, sowie der Art der verwendeten Decodierung,
kann die gesamte Schaltkapazität,
und somit die gesamte von dem Speicherkern verbrauchte Energie,
in hohem Maße reduziert
werden. Ein Bank-Design kann auch zu einem höheren Produktausstoß führen, weil
die Speicherbänke
so angeordnet werden können,
dass eine defekte Bank funktionslos und zugriffsunfähig wird,
während
die verbleibenden funktionsfähigen Banken
des Speicherkerns in ein Produkt mit niedrigerer Kapazität gepackt
werden können.One
The approach to reducing switching capacity is to use the memory core
split into separate switchable banks of memory cells. typically,
is the total switching capacity
while
a given memory access for bank memory cores vice versa
proportional to the number of banks used. By reasonable
Choose
the number and placement of banking units within a bank
given memory core designs, as well as the type of decoding used,
can the total switching capacity,
and thus the total energy consumed by the memory core,
greatly reduced
become. A bank design can also lead to higher product output because
the memory banks
can be arranged
that a defective bank becomes inoperative and inaccessible,
while
the remaining operational banks
of the memory core packed into a lower capacity product
can be.
Bank-Designs
sind jedoch für
gewisse Anwendungen nicht geeignet. Geteilte Speicherkerne erfordern
eine zusätzliche
Decodierungs-Schaltung, um selektiven Zugriff auf einzelne Bänke zu ermöglichen,
was im Ergebnis zu einer Verzögerung
führt. Auch
verwenden viele Bank-Designs Speichersegmente, die lediglich verkleinerte
Versionen traditioneller monolithischer Kernspeicherdesigns sind,
bei denen jedes Segment eine festgeschaltete Steuerungs-, Vorladungs-,
Decodierungs-, Abtast- und Treiberschaltung
aufweist. Diese Schaltungen verbrauchen sowohl im Standby- als auch im Betriebsmodus
tendenziell viel mehr Energie als ihre assoziierten Speicherzellen.
Solche Bankstrukturen mögen einfach
zu entwerfen sein, aber die zusätzliche
Komplexität
und der zusätzliche
Energieverbrauch können
die Gesamtleistung der Speicherkomponenten reduzieren.Bank designs
are however for
certain applications are not suitable. Require shared storage cores
an additional
Decoding circuitry to allow selective access to individual banks
which resulted in a delay
leads. Also
Many bank designs use memory segments that are just downsized
Versions of traditional monolithic core memory designs are,
where each segment has a dedicated control, precharge,
Decoding, sampling and driver circuit
having. These circuits consume both in standby mode and in operation mode
tends to consume much more energy than their associated storage cells.
Such bank structures like simple
to be design, but the extra
complexity
and the extra
Energy consumption can
reduce the overall performance of the storage components.
Aufgrund
ihrer Natur sind Bank-Designs nicht dazu geeignet, vergrößert zu
werden, damit sie große
Design-Erfordernisse in sich aufnehmen. Es ist auch möglich, dass
traditionelle Bank-Designs nicht leicht an Anwendungen angepasst
werden können,
die eine Speicherkern-Konfiguration benötigen, die sich von der zugrundeliegenden
Speicherbank-Struktur wesentlich unterscheidet (z.B. eine Speicherstruktur,
die relativ wenig Zeilen von Wortlängen mit sehr langer Bitlänge benötigt). Bevorzugte Ausführungsformen
der vorliegenden Erfindung stützen
sich nicht auf eine Aufteilung der Grundspeicherstruktur von oben
nach unten unter Verwendung von Bankspeicher-Designs, sondern stellen
eine hierarchische Speicherstruktur bereit, die durch Verwendung
eines Ansatzes von unten nach oben synthetisiert wird, durch hierarchisches
Koppeln der Grundspeichermodule mit lokalisierten Entscheidungsfindungs-Merkmalen,
die synergistisch zusammenwirken, um den Gesamtenergiebedarf drastisch
zu reduzieren und die Arbeitsgeschwindigkeit der Struktur zu verbessern.
Als Minimum kann ein derartiges hierarchisches Grundmodul lokalisiertes
Bitleitungs-Abtasten aufweisen.by virtue of
By their nature, bank designs are not likely to be magnified too
be great for them
Take in design requirements. It is also possible that
Traditional bank designs are not easily adapted to applications
can be
which require a memory core configuration different from the underlying one
Memory bank structure (e.g., a memory structure,
which requires relatively few lines of very long bit length words). Preferred embodiments
support the present invention
not on a division of the basic storage structure from above
down using bank memory designs, but ask
a hierarchical storage structure prepared by use
of a bottom-up approach is synthesized by hierarchical
Coupling the basic memory modules with localized decision-making features,
which work synergistically to drastically reduce the overall energy requirements
reduce and improve the working speed of the structure.
As a minimum, such a hierarchical basic module can be located
Having bit line scanning.
Geteilte WortleitungShared word line
Häufig wird
die Bitweite eines Speicherbauteils so dimensioniert, dass sie eine
bestimmte Wortlänge
aufnehmen kann. Mit der Zunahme der Wortlänge für ein bestimmtes Design nehmen
auch die damit verbundenen Wortleitungs-Verzögerungen, die Schaltkapazität, der Energieverbrauch,
etc. zu. Zur Aufnahme sehr langer Wortleitungen kann es wünschenswert
sein, speicherumspannende globale Wortleitungen in lokale Wortleitungen
aufzuteilen, die jeweils aus kleineren Gruppen be nachbarter, wortorientierter
Speicherzellen bestehen. Jede lokale Gruppe verwendet lokale Decodierungs-
und Treiberbauteile zur Erzeugung der lokalen Wortleitungssignale, wenn
die globale Wortleitung, mit der sie verbunden ist, aktiviert ist.
Bei Anwendungen mit großen
Wortlängen
kann der zusätzliche Überhang,
der sich durch die geteilten Wortleitungen ergibt, durch reduzierte
Wortleitungs-Verzögerungen,
Energieverbrauch, etc. ausgeglichen werden. Der zusätzliche Überhang,
der sich durch bestehende geteilte Wortleitungs-Schemata ergibt,
kann dies jedoch für
viele Implementierungen ungeeignet machen. Wie bereits vorher stellt
eine bestimmte bevorzugte Ausführungsform
der vorliegenden Erfindung, anstatt die traditionelle Aufteilung
von Wortleitungen von oben nach unten zu verwenden, eine lokale
Wortleitung für das
vorgenannte Grundspeichermodul bereit, was die lokalen Entscheidungsfindungsmerkmale
des Moduls weiter verbessert. Wie vorher werden hier durch die Verwendung
eines Ansatzes von unten nach oben, um Grundspeichermodule hierarchisch zu
koppeln, mit den zusätzlichen
lokalisierten Entscheidungsfindungsmerkmalen lokaler Wortleitungen
gemäß der vorliegenden
Erfindung zusätzliche Synergien
realisiert, die den Gesamtenergieverbrauch und die Signalausbreitungszeiten
weiter reduzieren.Frequently becomes
the bit width of a memory device is dimensioned to be a
certain word length
can record. With the increase in word length for a particular design take
also the associated word line delays, the switching capacity, the energy consumption,
etc. too. For recording very long word lines, it may be desirable
be memory-spanning global word lines in local word lines
divided, each of smaller groups be nachbarter, word-oriented
Memory cells exist. Each local group uses local decoding
and driver components for generating the local wordline signals when
the global wordline to which it is connected is enabled.
For applications with large
word length
can the extra overhang,
which results from the shared word lines, by reduced
Word-line delays
Energy consumption, etc. are compensated. The extra overhang,
that results from existing shared wordline schemes,
However, this can be for
make many implementations inappropriate. As previously stated
a particular preferred embodiment
of the present invention, rather than the traditional layout
to use wordlines from top to bottom, a local one
Word line for that
aforementioned basic memory module prepared what the local decision-making features
of the module further improved. As before, here are by use
a bottom-up approach to hierarchical to basic memory modules
pair, with the extra
localized decision-making features of local wordlines
according to the present
Invention additional synergies
realizes the total energy consumption and the signal propagation times
further reduce.
SPANNUNGSSCHWANKUNGS-REDUZIERUNGS-TECHNIKENVOLTAGE Surge REDUCTION TECHNIQUES
Energiereduzierung
kann auch durch Reduzieren der Spannungsschwankungen erreicht werden,
die sich in der gesamten Struktur ergeben. Durch das Begrenzen von
Spannungsschwankungen ist es möglich,
die Energiemenge, die verbraucht wird, wenn die Spannung an einem
Knoten oder einer Leitung während
eines bestimmten Ereignisses oder einer bestimmten Operation abfällt, zu
reduzieren, sowie die Energiemenge, die erforderlich ist, um die
verschiedenen abgefallenen Spannungen nach dem bestimmten Ereignis
oder der bestimmten Operation, oder vor dem nächsten Zugriff, wieder auf
den gewünschten
Zustand zu bringen, zu reduzieren. Zwei Techniken weisen zu diesem
Zweck das Verwenden gepulster Wortleitungen sowie Leseverstärker-Spannungsschwankungs-Reduzierung
auf.energy reduction
can also be achieved by reducing the voltage fluctuations,
which arise throughout the structure. By limiting of
Voltage fluctuations it is possible
the amount of energy that is consumed when the voltage is at one
Node or a wire during
of a particular event or operation
reduce, as well as the amount of energy that is required to the
various dropped voltages after the particular event
or the particular operation, or before the next access
the wished
To bring state to reduce. Two techniques point to this
Purpose to use pulsed word lines as well as sense amplifier voltage swing reduction
on.
Gepulste WortleitungenPulsed word lines
Durch
Aktivieren einer Wortleitung gerade lange genug, um die Differentialspannung über einer ausgewählten Speicherzelle
korrekt zu ermitteln, ist es möglich,
die Bitleitungs-Spannungsentladung entsprechend einer READ-Operation
in der ausgewählten
Zelle zu reduzieren. Bei einigen Ausgestaltungen wird, durch Anlegen
eines gepulsten Signals an die assoziierte Wortleitung während eines
ausgewählten Intervalls,
ein Leseverstärker
nur während
dieses Intervalls aktiviert, wodurch die Dauer des Bitleitungs-Spannungsabfalls
reduziert wird. Diese Ausgestaltungen verwenden typischerweise eine
Form von Impulsgenerator, der einen Festdauer-Impuls erzeugt. Wenn
die Impulsdauer so ausgerichtet ist, dass sie Szenarien des schlechtesten
Timings genügt,
führt die
zusätzliche
Marge zu unnötigem
Bitleitungs-Stromabziehen während
nominaler Operationen. Es ist daher erwünscht, eine selbstbegrenzende Wortleitungs-Vorrichtung
mit selbstbestimmtem Zeitverhalten (self-timing) zu schaffen, die
auf die tatsächliche
Dauer einer gegebenen READ-Operation in einer ausgewählten Zelle
anspricht, und die die Wortleitungs-Aktivierung im wesentlichen
auf diese Dauer begrenzt. Des weiteren kann es, wenn ein Leseverstärker eine
READ-Operation in weniger als einem Speichersystem-Taktzyklus erfolgreich
durchführen
kann, auch erwünscht
sein, dass die Impulsweiten-Aktivierung asynchron in Bezug auf den
Speichersystem-Takt erfolgt. Gewisse Aspekte der vorliegenden Erfindung
stellen ein gepulstes Wortleitungssignal zur Verfügung, beispielsweise
durch Verwenden einer kooperativen Interaktion zwischen globalen und
lokalen Wortleitungs-Decodern.By activating a wordline just long enough to correctly detect the differential voltage across a selected memory cell, it is possible to reduce the bitline voltage discharge corresponding to a READ operation in the selected cell. In some embodiments, by applying a pulsed signal to the associated wordline during a selected interval, a sense amplifier is activated only during this interval, thereby reducing the duration of the bitline voltage drop. These embodiments typically use a form of pulse generator that generates a fixed duration pulse. When the pulse duration is aligned, that it satisfies worst-timing scenarios, the extra margin results in unnecessary bit-line pull-off during nominal operations. It is therefore desirable to provide a self-timing self-limiting word line device that is responsive to the actual duration of a given READ operation in a selected cell and that limits word line activation substantially to that duration. Furthermore, if a sense amplifier can successfully perform a READ operation in less than one memory system clock cycle, it may also be desirable for the pulse width activation to occur asynchronously with respect to the memory system clock. Certain aspects of the present invention provide a pulsed wordline signal, for example, by utilizing cooperative interaction between global and local wordline decoders.
Leseverstärker-Spannungsschwankungs-ReduzierungSense amplifier voltage fluctuation reduction
Bei
der Herstellung großer
Speicherarrays ist es sehr erwünscht,
die Größe einer
einzelnen Speicherzelle auf einem Minimum zu halten. Folglich können einzelne
Speicherzellen im allgemeinen keinen Treiberstrom an assoziierte
Eingangs/Ausgangs-Bitleitungen liefern. Leseverstärker werden
typischerweise verwendet, um den Wert der in einer bestimmten Speicherzelle
gespeicherten Daten zu ermitteln, und um den zum Treiben der Eingangs-/Ausgangs-Leitungen
erforderlichen Strom bereitzustellen. Bei der Ausgestaltung der
Leseverstärker
gibt es typischerweise einen Kompromiss zwischen Energie und Geschwindigkeit,
wobei schnellere Ansprechzeiten normalerweise zu höherem Energiebedarf
führen.
Schnellere Leseverstärker
können
tendenziell auch physikalisch größer sein als
langsame Vorrichtungen mit niedriger Energie. Des weiteren kann
die analoge Natur von Leseverstärkern
dazu führen,
dass sie einen wesentlichen Anteil der Gesamtenergie verbrauchen.
Obwohl eine Möglichkeit,
das Ansprechen eines Leseverstärkers zu
verbessern, ist, einen empfindlicheren Leseverstärker zu benutzen, werden alle
erzielten Vorteile durch die damit einhergehende Schaltungskomplexität ausgeglichen,
die trotzdem an erhöhter
Geräuschempfindlichkeit
leidet. Es ist dann wünschenswert,
Bitleitungs-Spannungsschwankungen einzuschränken und die von dem Leseverstärker verbrauchte
Energie zu reduzieren.at
the production of large
Storage arrays it is very desirable
the size of one
keep individual memory cell to a minimum. Consequently, individual can
Memory cells generally do not associate a driver current with
Supply input / output bit lines. Be sense amplifier
typically used to calculate the value of in a given memory cell
to determine stored data and to drive the input / output lines
provide required power. In the embodiment of
sense amplifier
there is typically a tradeoff between energy and speed,
where faster response times usually lead to higher energy requirements
to lead.
Faster sense amplifiers
can
also tend to be physically larger than
slow low energy devices. Furthermore, can
the analog nature of sense amplifiers
cause
that they consume a significant proportion of the total energy.
Although a way
the response of a sense amplifier to
is to use a more sensitive sense amplifier, all will
compensated for the advantages associated with the associated circuit complexity,
the raised anyway
sound sensitivity
suffers. It is then desirable
Limit bit line voltage variations and consumed by the sense amplifier
To reduce energy.
Bei
einer typischen Ausgestaltung ermittelt der Leseverstärker die
kleinen Differentialsignale über
einer Speicherzelle, die in Bezug auf den in der Zelle gespeicherten
Datenwert in einem unsymmetrischen Zustand sind, und verstärkt das
sich ergebende Signal auf einen logischen Pegel. Vor einer READ-Operation
werden die mit einer bestimmten Speicherspalte assoziierten Bitleitungen
auf einen ausgewählten
Wert vorgeladen. Wenn eine bestimmte Speicherzelle aktiviert ist,
wählt ein
Zeilen-Decoder die bestimmte Zeile, in der sich die Speicherzelle befindet,
aus, und ein assoziierter Spalten-Decoder wählt einen mit der bestimmten
Spalte assoziierten Leseverstärker
aus. Die Ladung auf einer dieser Bitleitungen wird durch die aktivierte
Speicherzelle auf eine Weise entladen, die dem in der Speicherzelle gespeicherten
Datenwert entspricht. Dies erzeugt ein Ungleichgewicht zwischen
den Signalen auf den gepaarten Bitleitungen und führt zu einer
Bitleitungs-Spannungsschwankung. Wenn er aktiviert ist, ermittelt
der Leseverstärker
das unsymmetrische Signal, und es verändert sich im Ansprechen hierauf der
normalerweise symmetrische Zustand des Leseverstärkers zu einem Zustand, der
den Datenwert repräsentiert.
Diese Zustandsermittlung und dieses Ansprechen erfolgt innerhalb
eines endlichen Zeitraums, während
dessen eine bestimmte Menge an Energie verbraucht wird. Je länger es
dauert, das unsymmetrische Signal zu ermitteln, desto größer ist der
Spannungsabfall auf den vorgeladenen Bitleitungen, und desto mehr
Energie wird während
der READ-Operation verbraucht. Jede Energie, die über die
tatsächlich
für das
Abtasten des Speicherzellen-Zustands benötigte Zeit hinaus verbraucht
wird, ist tatsächlich
verschwendete Energie. Bei traditionellen SRAM-Designs bleiben die
Leseverstärker, die
während
einer bestimmten READ-Operation arbeiten, während beinahe des gesamten
Lesezyklusses aktiv. Dieser Ansatz verbraucht jedoch unnötigerweise
hohe Energiemengen, wenn man in Betracht zieht, dass ein Leseverstärker nur
lange genug aktiv sein muss, um die Differentialspannung über einer ausgewählten Speicherzelle
unter Angabe des gespeicherten Speicherzustands korrekt zu ermitteln.at
In a typical embodiment, the sense amplifier detects the
small differential signals over
a memory cell with respect to that stored in the cell
Data value are in an unbalanced state, and amplifies that
resulting signal to a logic level. Before a READ operation
become the bitlines associated with a particular memory column
on a selected one
Value preloaded. If a specific memory cell is activated,
selects
Line decoder the particular line in which the memory cell is located
and an associated column decoder selects one with the particular one
Column associated sense amplifier
out. The charge on one of these bit lines is activated by the
Unload memory cell in a manner similar to that stored in the memory cell
Data value corresponds. This creates an imbalance between
the signals on the paired bit lines and leads to a
Bit-line voltage fluctuation. When activated, determined
the sense amplifier
the unbalanced signal, and it changes in response to this
normally symmetrical state of the sense amplifier to a state that
represents the data value.
This status determination and response takes place within
a finite period while
of which a certain amount of energy is consumed. The longer it is
takes to determine the unbalanced signal, the greater the
Voltage drop on the precharged bitlines, and more
Energy gets during
consumed the READ operation. Any energy over that
indeed
for the
Sampling of the memory cell state consumes time consumed
is, is actually
wasted energy. For traditional SRAM designs, the
Sense amplifier, the
while
a specific READ operation, while almost the entire
Read cycle active. However, this approach unnecessarily consumes
high amounts of energy, considering that a sense amplifier only
long enough to be active, the differential voltage across a selected memory cell
correctly specifying the stored memory state.
Es
gibt zwei allgemeine Ansätze
zum Reduzieren von Energie in Leseverstärkern. Erstens kann der Leseverstärkerstrom
durch Verwenden von Leseverstärkern,
die sich automatisch abschalten, wenn die Abtast-Operation beendet
ist, beschränkt
werden. Eine Leseverstärker-Ausgestaltung
zu diesem Zweck ist ein selbsthaltender (self-latching) Leseverstärker, der
sich abschaltet, sobald der Leseverstärker den abgetasteten Datenzustand
angegeben hat. Zweitens können
Leseverstärker-Ströme durch
Begrenzen der Aktivierung des Leseverstärkers auf genau die erforderliche
Zeitspanne beschränkt
werden. Dieser Ansatz kann durch die Verwendung einer Dummy-Spaltenschaltung,
komplett mit Bit-Zellen, Leseverstärker und Unterstüt zungsschaltungen,
realisiert werden. Durch das Vorgeben der Operation einer funktionalen
Spalte kann die Dummy-Schaltung einer Leseverstärker-Timing-Schaltung eine
Annäherung
der Aktivierungszeitraum-Eigenschaften des funktionalen Leseverstärkers in
dem Speichersystem zur Verfügung
stellen. Obwohl die Dummy-Schaltungsannäherung recht zufriedenstellend
sein kann, wird angenommen, dass alle funktionalen Leseverstärker zu
dem Zeitpunkt, zu dem die Dummy-Schaltung ihre Operation beendet,
ihre Abtast-Operation durchgeführt
haben. In dieser Hinsicht kann die Verwendung einer Dummy-Schaltung ähnlich der
Aktivierung der Leseverstärker
mit einem Festdauer-Impulssignal sein. Aspekte der vorliegenden
Erfindung stellen Schaltungen und Leseverstärker zur Verfügung, die
Spannungsschwankungen beschränken, und
die die Empfindlichkeit und Robustheit der Leseverstärker-Operation
verbessern. Beispielsweise werden kompakte, energiehaltende Leseverstärker, die
erhöhte
Widerstandsfähigkeit
gegenüber
Rauschen und gegenüber
intrinsischen und Betriebs-Offsets aufweisen, bereitgestellt. Im
Zusammenhang mit der vorliegenden Erfindung können derartige Leseverstärker sowohl
in der lokalen Modulstufe als auch überall in den höheren Stufen
einer hierarchischen Speicherstruktur erfindungsgemäß realisiert werden.There are two general approaches to reducing power in sense amplifiers. First, the sense amplifier current can be limited by using sense amplifiers which automatically turn off when the scan operation is completed. A sense amplifier design for this purpose is a self-latching sense amplifier which turns off as soon as the sense amplifier has indicated the sampled data state. Second, sense amplifier currents can be limited by limiting the activation of the sense amplifier to just the required amount of time. This approach can be realized through the use of a dummy column circuit, complete with bit cells, sense amplifiers, and support circuits. By providing the operation of a functional column, the dummy circuit of a sense amplifier timing circuit may provide an approximation of the activation period characteristics of the functional sense amplifier in the memory system. Although the dummy circuit approach can be quite satisfactory, It is assumed that all the functional sense amplifiers have their scanning operation performed at the time the dummy circuit completes its operation. In this regard, the use of a dummy circuit may be similar to activating the sense amplifiers with a fixed duration pulse signal. Aspects of the present invention provide circuits and sense amplifiers that limit voltage fluctuations and improve the sensitivity and robustness of the sense amplifier operation. For example, compact, power-sensing sense amplifiers having increased resistance to noise and to intrinsic and operational offsets are provided. In the context of the present invention, such sense amplifiers can be realized both in the local module stage and throughout the higher stages of a hierarchical memory structure in accordance with the invention.
REDUNDANZREDUNDANCY
Speicher-Designer
gleichen Energie und Vorrichtungsbereich typischerweise mit der
Geschwindigkeit aus. Hochleistungs-Speicherbauteile stellen eine
ernste Belastung für
die Energie- und Bereichsbudgets verbundener Systeme dar, insbesondere,
wenn derartige Bauteile in ein VLSI-System, beispielsweise ein digitales
Signalverarbeitungssystem, eingebettet sind. Daher ist es höchst wünschenswert,
Speicher-Untersysteme bereitzustellen, die schnell und doch energie-
und bereichseffizient sind. Hoch integrierte Hochleistungs-Bauteile
erfordern komplizierte Fabrikations- und Herstellungsverfahren.
Diese Verfahren sehen sich unvermeidbaren Parametervariationen gegenüber, die
den herzustellenden Einheiten physikalische Defekte zufügen oder das
Design derart anfällig
machen können,
dass die betroffenen Einheiten nicht mehr brauchbar sind oder unter
dem Standard liegen.Store Designer
same energy and device area typically with the
Speed off. High-performance memory components provide a
serious burden for
the energy and range budgets of connected systems, in particular,
if such components in a VLSI system, such as a digital
Signal processing system, are embedded. Therefore, it is highly desirable
Provide storage subsystems that deliver fast, yet energy-efficient
and are area efficient. Highly integrated high-performance components
require complicated fabrication and manufacturing processes.
These methods face unavoidable parameter variations that
cause physical defects to the units to be manufactured or that
Design so vulnerable
can do,
that the affected units are no longer usable or under
the standard.
Bei
einer Speicherstruktur kann die Redundanz beispielsweise deshalb
wichtig sein, weil ein Fabrikationsfehler oder ein Betriebsfehler
sogar einer Einzelbit-Zelle
zum Versagen des Systems, das von dem Speicher abhängig ist,
führen
kann. Ähnlich
können
verfahrensinvariante Merkmale nötig
sein um sicherzustellen, dass die internen Operationen der Struktur
präzisen
Timing- und Parameterbestimmungen entsprechen. Ohne Redundanz und
verfahrensinvariante Merkmale kann der tatsäch liche Herstellungsertrag
für eine
bestimmte Speicherstruktur so niedrig sein, dass es nicht akzeptiert
werden kann. Speicherstrukturen mit niedrigem Ertrag sind insbesondere
dann nicht zu akzeptieren, wenn sie in komplexere Systeme eingebettet
sind, die in sich mehrere Fabrikations- und Herstellungsanfälligkeiten
aufweisen. Ein höherer
Herstellungsertrag führt
zu niedrigeren Stückkosten,
und robustes Design führt
zu zuverlässigen
Produkten mit niedrigeren Betriebskosten. Daher ist es auch höchst erwünscht, Bauteile zu
entwerfen, die wo immer möglich
Redundanz und verfahrensinvariante Merkmale aufweisen.at
For example, redundancy may be a memory structure
be important because of a manufacturing defect or an operating error
even a single-bit cell
failure of the system which depends on the memory
to lead
can. Similar
can
process-invariant features needed
be to make sure the internal operations of the structure
precise
Timing and parameter definitions correspond. Without redundancy and
method invariant features can the actual Liche manufacturing yield
for one
certain memory structure to be so low that it is not accepted
can be. Memory structures with low yield are in particular
then not accept it when embedded in more complex systems
are that have multiple fabrication and manufacturing vulnerabilities
exhibit. A higher one
Manufacturing yield leads
at lower unit costs,
and robust design leads
too reliable
Products with lower operating costs. Therefore, it is also highly desirable to components
design wherever possible
Have redundancy and procedural invariant features.
Redundanzvorrichtungen
und -techniken stellen weitere bestimmte, bevorzugte Aspekte der vorliegenden
Erfindung dar, die einzeln oder zusammen die Funktionalität der hierarchischen
Speicherstruktur verbessern. Die vorgenannten Redundanz-Aspekte
der vorliegenden Erfindung können
die hierarchische Speicherstruktur weniger anfällig für Untauglichkeit durch Fehler
während
der Herstellung oder während
des Betriebs machen, und führen
vorteilhafterweise zu einem Speicherprodukt, das zugleich besser
herzustellen und kosteneffizient sowie im Betrieb robuster ist.
Die Redundanz in einem hierarchischen Speichermodul kann durch Hinzufügen einer
oder mehrerer redundanter Zeilen, Spalten, oder beidem, zur Grundmodul-Srtuktur
realisiert werden. Bei einem Aspekt der vorliegenden Erfindung wird
ein Decoder zur Verfügung
gestellt, der Zeilenredundanz ermöglicht. Außerdem kann eine Speicherstruktur,
die aus hierarchischen Speichermodulen zusammengesetzt ist, ein
oder mehrere redundante Module verwenden, um defekte Speicher-Schaltungen
zu mappen. Ein redundantes Modul kann einen Eins-zu-eins-Ersatz
eines defekten Moduls bereitstellen, oder es kann eine oder mehrere
Speicherzell-Schaltungen für
ein oder mehrere primäre
Speichermodule zur Verfügung
stellen.redundancy devices
and techniques set forth certain particular preferred aspects of the present invention
Invention, individually or together, the functionality of the hierarchical
Improve memory structure. The aforementioned redundancy aspects
of the present invention
the hierarchical storage structure less prone to failure by mistake
while
the manufacture or during
of operation, and lead
advantageously to a memory product that is better at the same time
and cost-effective and robust in operation.
The redundancy in a hierarchical memory module can be increased by adding a
or multiple redundant rows, columns, or both, to the base module structure
will be realized. In one aspect of the present invention
a decoder available
provided that allows line redundancy. In addition, a memory structure,
which is composed of hierarchical memory modules
or use multiple redundant modules to faulty memory circuits
to map. A redundant module can be a one-to-one replacement
of a defective module, or it may be one or more
Memory cell circuits for
one or more primary
Memory modules available
put.
SPEICHERMODUL MIT HIERARCHISCHER
FUNKTIONALITÄTSTORAGE MODULE WITH HIERARCHIC
FUNCTIONALITY
Die
erfindungsgemäße modulare,
hierarchische Speicherarchitektur stellt ein kompaktes, robustes,
energieeffizientes, hochleistungsfähiges Speichersystem zur Verfügung, das
vorteilhafterweise eine flexible und hoch skalierbare Architektur
aufweist. Die hierarchische Speicherstruktur ist aus Grundspeichermodulen
zusammengesetzt, die kooperativ gekoppelt werden können, und
die in mehreren hierarchischen Stufen angeordnet sind, um ein zusammengesetztes
Speicherprodukt mit beliebiger Spaltentiefe oder Zeilenlänge zu ergeben.
Dieser modulare Ansatz von unten nach oben lokalisiert Timing-Erwägungen,
Entscheidungsfindung und Energieverbrauch in der (den) bestimmten
Einheit(en), in der (denen) die erwünschten Daten gespeichert sind.The
inventive modular,
hierarchical storage architecture provides a compact, robust,
energy-efficient, high-performance storage system available that
advantageously a flexible and highly scalable architecture
having. The hierarchical memory structure is made up of basic memory modules
composed, which can be coupled cooperatively, and
which are arranged in several hierarchical levels to form a composite
To give memory product with any column depth or line length.
This modular bottom-up approach locates timing considerations,
Decision making and energy consumption in the particular one
Unit (s) in which the desired data is stored.
Innerhalb
einer definierten Design-Hierarchie können die Grundspeichermodule
zu einem größeren Speicherblock
gruppiert werden, der selbst mit ähnlichen Speicherstrukturen
verbunden werden kann, um noch größere Speicherblöcke zu ergeben. Diese
größeren Strukturen
können
wiederum so angeordnet sein, dass sie auf der höchsten Stufe der Hierarchie
eine komplexe Struktur schaffen. Bei der hierarchischen Abtastung
ist es erwünscht,
zwei oder mehr Stufen von Bitabtastung zur Verfügung zu stellen, wodurch die
Lese- und Schreib-Zeit der Vorrichtung verringert wird, d.h. die
effektive Vorrichtungsgeschwindigkeit erhöht wird, während die Gesamtenergie-Erfordernisse
der Vorrichtung reduziert werden. Bei einem hierarchischen Design
wird das Schalten und der Speicherzellen-Energieverbrauch während einer
Lesen-/Schreiben-Operation in der unmittelbaren Nachbarschaft der
Speicherzellen, die ausgewertet werden oder in die geschrieben wird,
lokalisiert, d.h. derjenigen Speicherzellen in ausgewählten Speichermodulen,
mit Ausnahme einer begrenzten Zahl von globalen Wortleitungs-Selektoren
und Leseverstärkern,
und Unterstützungsschaltungen.
Der Großteil
der Module, die die Speicherzellen, die ausgewertet werden oder
in die geschrieben wird, nicht enthalten, bleibt im allgemeinen
inaktiv.Within a defined design hierarchy, the base memory modules can be grouped into a larger block of memory that itself can be connected to similar memory structures to yield even larger blocks of memory. These larger structures may in turn be arranged to create a complex structure at the highest level of the hierarchy. In hierarchical scanning, it is desirable to use two or three provide more levels of bit-sampling, thereby reducing the read and write time of the device, ie, increasing the effective device speed while reducing the overall power requirements of the device. In a hierarchical design, the switching and memory cell power consumption are located during a read / write operation in the immediate vicinity of the memory cells being evaluated or written, ie, those memory cells in selected memory modules, except for a limited number of global word line selectors and sense amplifiers, and support circuits. Most of the modules that do not contain the memory cells that are being evaluated or written to remain generally inactive.
Bevorzugte
Ausführungsformen
der vorliegenden Erfindung stellen ein hierarchisches Speichermodul
zur Verfügung,
das lokales Bitleitungs-Abtasten, lokale Wortleitungs-Decodierung,
oder beides, verwendet, was den Gesamtenergie-Verbrauch und die Signalfortpflanzung
intrinsisch reduziert und die Gesamtgeschwindigkeit sowie die Design-Flexibilität und die
Skalierbarkeit erhöht.
Aspekte der vorliegenden Erfindung sehen Vorrichtungen und Verfahren
vor, die den Gesamtenergieverbrauch der hierarchischen Speicherstruktur
weiter einschränken, während sie
den Einfluss einer Mehrstufen-Hierarchie minimieren. Bestimmte Aspekte
der vorliegenden Erfindung sind darauf gerichtet, funktionale Anfälligkeiten
zu mildern, die sich aus Variationen der Betriebsparameter ergeben
können,
oder die in Bezug zum Herstellungsverfahren stehen. Außerdem sind
Vorrichtungen und Techniken offenbart, die die Verschlechterung
der Systemleistung, die sich aus zeitweisen Ineffizienzen ergibt,
vorteilhaft verbessern, einschließlich, jedoch nicht beschränkt auf, hochgenaue
Verzögerungsmessschaltung,
Diffusionsverzögerungs-Replikations-Schaltung und assoziierte
Dummy-Vorrichtungen. Bei einem weiteren Aspekt der vorliegenden
Erfindung ist ein asynchron zurücksetzbarer
Decoder vorgesehen, der die Bitleitungs-Spannungs-Entladung, die
beispielsweise einer READ-Operation in der ausgewählten Zelle
entspricht, durch Begrenzen der Wortleitungs-Aktivierung auf die
Zeit, die der Leseverstärker
tatsächlich benötigt, um
die Differentialspannung über
einer ausgewählten
Speicherzelle korrekt zu ermitteln, reduziert.preferred
embodiments
of the present invention provide a hierarchical memory module
to disposal,
local bit line sampling, local word line decoding,
or both, using what the total energy consumption and the signal propagation
intrinsically reduced and the overall speed as well as the design flexibility and the
Scalability increased.
Aspects of the present invention contemplate devices and methods
before, the total energy consumption of the hierarchical storage structure
further restrict while she
minimize the impact of a multi-level hierarchy. Certain aspects
The present invention is directed to functional susceptibilities
mitigated by variations in operating parameters
can,
or related to the manufacturing process. Besides, they are
Devices and techniques disclosed the deterioration
system performance resulting from temporary inefficiencies,
advantageously, including, but not limited to, highly accurate
Delay measurement circuit,
Diffusion delay replication circuit and associated
Dummy devices. In another aspect of the present invention
Invention is an asynchronously resettable
Decoder provided the bit line voltage discharge, the
for example, a READ operation in the selected cell
by limiting the wordline activation to the
Time, the sense amplifier
actually needed to
the differential voltage over
a selected one
To determine memory cell correctly, reduced.
HIERARCHISCHE SPEICHERMODULEHIERARCHICAL MEMORY MODULES
Bei
Speicher-Designs des Standes der Technik, beispielsweise den vorgenannten
Bank-Designs, werden große
logische Speicherblöcke
in kleinere, physikalische Module aufgeteilt, die jeweils den anwesenden Überhang
eines gesamten Speicherblocks einschließlich Predecodern, Leseverstärkern, Multiplexern
und ähnlichem
aufweisen. Zusammengenommen verhalten sich derartige Speicherblöcke wie
ein einziger Speicherblock. Bei Verwendung der vorliegenden Erfindung
können
jedoch Speicherblöcke
vergleichbarer, oder viel größerer, Größe durch Verbinden
hierarchischer funktionaler Module zu größeren physikalischen Speicherblöcken mit
beliebiger Wortanzahl und Wortlänge
bereitgestellt werden. Beispielsweise benötigen bestehende Designs, die kleinere
Speicherblöcke
zu einem einzigen logischen Block zusammenfügen, normalerweise die Replikation
der Predecoder, Leseverstärker,
und anderer Überhangsschaltungen,
die mit einem einzigen Speicherblock assoziiert wären. Gemäß der vorliegenden
Erfindung ist jedoch diese Replikation unnötig und unerwünscht. Eine
Ausführungsform
der Erfindung umfasst lokales Bitleitungs-Abtasten, bei dem eine
begrenzte Anzahl von Speicherzellen mit einem einzigen lokalen Leseverstärker gekoppelt
ist, wodurch ein Grundspeichermodul gebildet wird. Ähnliche
Speichermodule werden so gruppiert und angeordnet, dass sie das
lokale Leseverstärker-Signal
an das globale Leseverstärker-Signal
ausgeben. Somit sind die mit den Speicherzellen assoziierten Bitleitungen
nicht direkt mit einem globalen Leseverstärker gekoppelt, wodurch die
Signalfortpflanzungs-Verzögerung
und der Energieverbrauch, die typischerweise mit globalem Bitleitungs-Abtasten
verbunden sind, vermindert werden. Bei diesem Ansatz tastet der
lokale Bitleitungs-Leseverstärker
den Zustand einer ausgewählten
Speicherzelle schnell und wirtschaftlich ab und berichtet den Zustand
an den globalen Leseverstärker.
Bei einer anderen Ausführungsform der
vorliegenden Erfindung werden die Verzögerungen und der Energieverbrauch
der globalen Wortleitungs-Decodierung durch Bereitstellen eines
Speichermoduls vermindert, das aus einer begrenzten Anzahl von Speicherzellen
besteht, die lokale Wortleitungs-Decodierung aufweisen. Ähnlich zu
dem Ansatz des lokalen Bitleitungs-Abtastens kann ein einzelner
globaler Wortleitungs-Decoder mit den jeweiligen lokalen Wortleitungs-Decodern
mehrerer Module gekoppelt werden. Wenn der globale Decoder mit einer
Adresse aktiviert wird, so antwortet nur derjenige lokale Wortleitungs-Decoder,
der mit der gewünschten
Speicherzelle assoziiert ist, und aktiviert die Speicherzelle. Dieser
Aspekt ist ebenfalls besonders energieschonend und schnell, weil
das Laden auf der globalen Leitung sich auf die assoziierten lokalen Wortleitungs-Decoder
beschränkt,
und das globale Wortleitungs-Signal nur so lange vorhanden sein muss,
wie es zum Triggern der entsprechenden lokalen Wortleitung benötigt wird.
Bei einer weiteren Ausführungsform
der vorliegenden Erfindung ist ein hierarchisches Speichermodul,
das sowohl lokales Bitleitungs-Abtasten als auch lokales Wortleitungs-Decodieren
verwendet, vorgesehen, was die Vorteile beider Ansätze verwirklicht.
Jede der vorgenannten Ausführungsformen
wird im folgenden diskutiert.at
Memory designs of the prior art, for example, the aforementioned
Bank designs, will be great
logical memory blocks
divided into smaller, physical modules, each containing the overhang present
an entire memory block including predecoders, sense amplifiers, multiplexers
and the like
exhibit. Taken together, such memory blocks behave like
a single memory block. When using the present invention
can
however memory blocks
comparable, or much larger, size by joining
hierarchical functional modules to larger physical memory blocks with
any number of words and word length
to be provided. For example, existing designs require smaller ones
memory blocks
into a single logical block, usually replication
the predecoder, sense amplifier,
and other overhang circuits,
which would be associated with a single memory block. According to the present
However, this replication is unnecessary and undesirable. A
embodiment
The invention comprises local bit line scanning in which a
limited number of memory cells coupled to a single local sense amplifier
is, whereby a basic memory module is formed. Similar
Memory modules are grouped and arranged to hold the
local sense amplifier signal
to the global sense amplifier signal
output. Thus, the bit lines associated with the memory cells are
not directly coupled to a global sense amplifier, causing the
Signal propagation delay
and the power consumption typically associated with global bitline sampling
are reduced. In this approach, the touches
local bitline sense amplifiers
the state of a selected one
Memory cell quickly and economically and reports the condition
to the global sense amplifier.
In another embodiment of the
present invention, the delays and energy consumption
global wordline decoding by providing a
Memory module reduces that from a limited number of memory cells
exists that have local word line decoding. Similar to
The approach of local bit line sampling may be a single
global word line decoder with the respective local word line decoders
be coupled to several modules. If the global decoder with a
Address is activated, only the local word line decoder responds,
the one with the desired
Memory cell is associated, and activates the memory cell. This
Aspect is also particularly energy-saving and fast because
the loading on the global line is on the associated local word line decoder
limited,
and the global wordline signal only needs to be present for so long
as needed to trigger the appropriate local wordline.
In a further embodiment
The present invention is a hierarchical memory module.
this includes both local bitline scanning and local wordline decoding
provided, which realizes the advantages of both approaches.
Each of the aforementioned embodiments
will be discussed below.
Lokales Bitleitungs-AbtastenLocal bit line sampling
3 zeigt
einen Speicherblock 300, der durch Verbinden mehrerer kooperierender
einzelner Module 320a–e gebildet
ist, wobei jedes der Module 320a–e jeweils einen lokalen
Leseverstärker 308a–e aufweist.
Jedes Modul besteht aus einer vordefinierten Anzahl von Speicherzellen 325a–g,
die mit einem der jeweiligen lokalen Leseverstärker 308a–e verbunden
sind. Jeder lokale Leseverstärker 308a–e ist mit
dem globalen Leseverstärker 302 über Bitleitungen 304, 306 verbunden.
Weil jeder lokale Leseverstärker 308a–e nur
die lokalen Bitleitungen 310a–e, 312a–e der
jeweiligen Speichermodule 320a–e abtastet, wird die
für das
Vorladen der lokalen Bitleitungen 310a–e und 312a–e benötigte Zeit
und Energie wesentlich reduziert. Nur wenn der lokale Leseverstärker 308a–e ein
Signal auf den jeweiligen lokalen Leitungen 310a–e und 312a–e abtastet,
gibt er ein Signal an den globalen Leseverstärker 302 ab. Diese Architektur
verleiht einem Speicherarchitektur-Design Flexibilität und Skalierbarkeit,
weil die Speichergröße durch
Hinzufügen
lokal abgetasteter Speichermodule, wie 320a–e, erhöht werden
kann. 3 shows a memory block 300 By connecting several cooperating individual modules 320a-e is formed, each of the modules 320a-e each a local sense amplifier 308a-e having. Each module consists of a predefined number of memory cells 325a-g connected to one of the respective local sense amplifiers 308a-e are connected. Each local sense amplifier 308a-e is with the global sense amplifier 302 over bit lines 304 . 306 connected. Because every local sense amplifier 308a-e only the local bitlines 310a-e . 312a-e the respective memory modules 320a-e is sampled, which is for precharging the local bit lines 310a-e and 312a-e required time and energy significantly reduced. Only if the local sense amplifier 308a-e a signal on the respective local lines 310a-e and 312a-e it samples a signal to the global sense amplifier 302 from. This architecture provides flexibility and scalability to a memory architecture design because memory size can be increased by adding locally sampled memory modules such as memory 320a-e , can be increased.
Das
Erhöhen
der Anzahl der lokalen Leseverstärker 308a–e,
die mit den globalen Bitleitungen 304, 306 verbunden
sind, erhöht
die Belastung der globalen Bitleitungen nicht wesentlich, und erhöht auch
den Energieverbrauch in den globalen Bitleitungen 304, 306 nicht,
weil Signalentwicklung und Vorladen nur in dem lokalen Leseverstärker 308a–e stattfinden,
nahe dem in den Speicherzellen 325a–g in dem entsprechenden
Speichermodul 320a–e gefundenen
Signal.Increasing the number of local sense amplifiers 308a-e that with the global bitlines 304 . 306 are not significantly increasing the load on the global bitlines, and also increasing power consumption in the global bitlines 304 . 306 not because signal development and pre-charging only in the local sense amplifier 308a-e take place near in the memory cells 325a-g in the corresponding memory module 320a-e found signal.
Bei
bevorzugten Ausführungsformen
der vorliegenden Erfindung ist es erwünscht, dass jedes Modul ein
selbstbestimmtes Zeitverhalten aufweist. Dies bedeutet, dass jedes
Speichermodul 320a–e eine
interne Schaltung aufweisen kann, die einen ausreichenden Zeitraum
zum Stattfinden des lokalen Abtastens abtastet und erzeugt. Derartige
Schaltungen mit selbstbestimmtem Zeitverhalten sind im Stand der
Technik bekannt. Bei Einzelkern-Designs oder auch Bank-Designs können Speicherkerne
mit selbstbestimmtem Zeitverhalten für den Hochleistungsbetrieb
unge eignet sein, weil das Zeitverhalten tendenziell von dem langsamsten
der vielen Bauteile in der Struktur abhängt, und weil die Signalfortpflanzungszeit
in derart großen
Strukturen wesentlich sein kann. Die Implementierung von selbstbestimmtem Zeitverhalten
kann in diesen größeren Strukturen durch
Variationen bei den Fabrikations- und
Herstellungsverfahren nachteilig beeinflusst werden, was die Betriebsparameter
des Speicherarrays und der zugrundeliegenden Timing-Schaltungsbauteile
wesentlich beeinflussen kann.In preferred embodiments of the present invention, it is desirable for each module to have a self-determined timing. This means that every memory module 320a-e may have an internal circuit that samples and generates a sufficient amount of time to place the local sample. Such self-timed circuits are known in the art. In single-core designs, or even bank designs, self-timed memory arrays may be unsuitable for high power operation because timing tends to depend on the slowest of the many components in the structure, and because the signal propagation time in such large structures may be significant. The implementation of self-determined timing may be adversely affected in these larger structures by variations in fabrication and manufacturing techniques, which may significantly affect the operating parameters of the memory array and the underlying timing circuitry.
Bei
einem hierarchischen Speichermodul ist selbstbestimmtes Zeitverhalten
erwünscht,
weil die Timing-Pfade für
jedes Modul 320a–e nur
eine begrenzte Anzahl an Speicherzellen 325a–g über einen sehr begrenzten Signalpfad
umfassen. Jedes Modul ist bei der Bestimmung der Zeit, die benötigt wird,
um eine gegebene PRECHARGE-, READ- oder WRITE-Operation durchzuführen, tatsächlich im
wesentlichen autonom. Meistens ist die Dauer einer Operation auf
der lokalen Stufe sehr kurz in Bezug auf die Zugriffszeit der Gesamtstruktur,
so dass die Speicherstruktur 300, die aus den hierarchischen
Speichermodulen 320a–e aufgebaut
ist, nicht den normalen, mit selbstbestimmtem Zeitverhalten verbundenen
Schwierigkeiten, unterworfen ist, und auch widerstandsfähig gegenüber Variationen
bei den Fabrikations- und
Herstellungsverfahren ist.For a hierarchical memory module, self-determined timing is desirable because the timing paths for each module 320a-e only a limited number of memory cells 325a-g over a very limited signal path. In fact, each module is essentially autonomous in determining the time required to perform a given PRECHARGE, READ, or WRITE operation. Mostly, the duration of an operation at the local level is very short in terms of the access time of the forest, so the memory structure 300 coming from the hierarchical memory modules 320a-e is not subject to the normal, with self-determined timing associated difficulties, and is also resistant to variations in the manufacturing and manufacturing processes.
Im
allgemeinen können
die Kerne lokalisierter Leseverstärker 308a–e kleiner
sein als ein typischer globaler Leseverstärker 302, weil sich
innerhalb eines gegebenen Zeitraums auf den lokalen Leseverstärker-Bitleitungen 310a–e, 312a–e ein
relativ größeres Signal
entwickelt. Das heißt,
dass mehr Signal verfügbar
ist, um den lokalen Leseverstärker 308a–e zu
treiben. Bei einer Architektur, die nur einen globalen Leseverstärker aufweist,
tritt eine größere Verzögerung auf,
während
ein Signal über
den globalen Bitleitungen entwickelt wird; diese Verzögerung kann
auf Kosten erhöhten
Energieverbrauchs reduziert werden. Vorteilhafterweise können lokalen
Bitabtastungs-Implementierungen die Verzögerung reduzieren, während sie
gleichzeitig den Energieverbrauch herabsetzen.In general, the cores of localized sense amplifiers 308a-e be smaller than a typical global sense amplifier 302 because within a given time period on the local sense amplifier bitlines 310a-e . 312a-e developed a relatively larger signal. This means that more signal is available to the local sense amplifier 308a-e to drive. In an architecture having only one global sense amplifier, a larger delay occurs while a signal is developed across the global bitlines; This delay can be reduced at the cost of increased energy consumption. Advantageously, local bit-sampling implementations can reduce the delay while at the same time reducing power consumption.
Bei
gewissen Aspekten der vorliegenden Erfindung, die unten genauer
erläutert
werden, kann ein Treibersignal mit begrenzter Schwankung von dem aktiven
lokalen Leseverstärker
zu dem globalen Leseverstärker
gesendet werden. Ein volles Schwankungssignal kann ebenfalls gesendet
werden; in diesem Fall kann ein sehr einfacher digitaler Puffer
verwendet werden. Wenn jedoch ein Signal mit begrenzter Schwankung
verwendet wird, kann ein komplizierterer Leseverstärker notwendig
sein. Für
eine Anwendung mit begrenzter Energie kann es erwünscht sein,
dass zwei oder mehrere Speichermodule lokale Leseverstärker gemeinsam
verwenden. Das gemeinsame Verwenden der Leseverstärker kann
jedoch die Bitsignal-Entwicklungsleitung indirekt leicht verlangsamen,
weil während
des ersten Teils einer Abtastperiode die Kapazitäten sowohl des oberen als auch des
unteren gemeinsam verwendeten Speichermoduls entladen werden. Diese
Verlangsamung kann jedoch minimiert werden und ist relativ gering,
wenn man sie mit den Vorteilen vergleicht, die durch die Verwendung
von logischen Leseverstärkern
gegenüber
den bestehenden Architekturen, die nur globale Leseverstärker verwenden,
erzielt werden. Außerdem
können
bevorzugte Ausführungsformen
der vorliegenden Erfindung diese möglicherweise nachteiligen Wirkungen
des gemeinsamen Verwendens von Leseverstärkern dadurch umgehen, dass
sie den lokalen Leseverstärker
von assoziierten lokalen Bitleitungen, die nicht mit der abzutastenden
Speicherzelle gekoppelt sind, im wesentlichen isolieren.In certain aspects of the present invention, discussed in greater detail below, a driver signal with limited variation may be sent from the active local sense amplifier to the global sense amplifier. A full fluctuation signal can also be sent; in this case, a very simple digital buffer can be used. However, if a signal with limited variation is used, a more complicated sense amplifier may be necessary. For a limited energy application, it may be desirable for two or more memory modules to share local sense amplifiers. However, sharing the sense amplifiers can indirectly slow the bit signal development line indirectly because during the first part of a sample period, the capacitances of both the upper and lower shared memory modules are discharged. However, this slowdown can be minimized and relatively low compared to the benefits achieved by using logical sense amplifiers over existing architectures using only global sense amplifiers. In addition, preferred embodiments of the present invention may be disadvantageous Avoid the effects of sharing sense amplifiers by substantially isolating the local sense amplifier from associated local bitlines that are not coupled to the memory cell to be scanned.
4 zeigt
eine Speicherstruktur 400, die der in 3 gezeigten
Struktur 300 dadurch ähnlich ist,
dass sie lokales Bitleitungs-Abtasten von Modulen 420a–d bereitstellt.
Jedes Speichermodul 420a–d besteht
aus einer vordefinierten Anzahl von Speicherzellen 425a–g.
Die Speicherzellen 425a–g sind mit
jeweiligen lokalen Leseverstärkern 408a,
b über lokale
Bitleitungen 410a–d, 412a–d verbunden.
Anders als bei der Struktur 300 in 3, bei der
jedes Modul 320a–e einen
eigenen lokalen Leseverstärker 308a–e hat,
sind die Speichermodule 420a–d mit einem einzigen
Leseverstärker 408a,
b gepaart. Ähnlich
zu 3 zeigt 4 einen
globalen Leseverstärker 402,
der mit den lokalen Leseverstärkern 408a, 408b gekoppelt
ist. 4 shows a memory structure 400 that the in 3 shown structure 300 is similar to that of local bit line scanning of modules 420a-d provides. Each memory module 420a-d consists of a predefined number of memory cells 425a-g , The memory cells 425a-g are with respective local sense amplifiers 408a, b over local bitlines 410a-d . 412a-d connected. Unlike the structure 300 in 3 in which each module 320a-e its own local sense amplifier 308a-e has, are the memory modules 420a-d with a single sense amplifier 408a, b paired. Similar to 3 shows 4 a global sense amplifier 402 that with the local read amplifiers 408a . 408b is coupled.
5 zeigt
des weiteren, dass Speicherstrukturen wie das Modul 300 in 3 so
gekoppelt werden können,
dass die Gesamtstruktur in Adressgröße (d.h. vertikal) oder in
Bitlänge
(d.h. horizontal), oder in beidem, erweitert wird. Die in 5 gezeigte Array-Struktur
kann auch Module wie das Modul 400 in 4 verwenden. 5 zeigt
auch, dass eine zusammengesetzte Speicherstruktur 500,
die hierarchische Speichermodule verwendet, echt hierarchisch sein
kann. Die Speicherblöcke 502, 503 können aus mehreren
Speichermodulen, wie dem Speichermodul 504, bestehen; diese
können
Module sein, wie sie in Bezug auf 3 und 4 beschrieben
worden sind. Jeder Speicherblock 502, 503 verwendet
eine Zwei-Stufen-Abtastung, wie bereits gezeigt worden ist. Bei
der Struktur 500 verwenden die Speicherblöcke 502, 503 jedoch
eine Zwischenstufe des Bitleitungs-Abtastens, indem sie z.B. Mittelstufen-Leseverstärker 514, 516 verwenden.
Unter dem hierarchischen Speicherparadigma können die Mittelstufen-Leseverstärker 514, 516 mit
dem globalen Leseverstärker 520 gekoppelt
werden. In der Tat kann das hierarchische Speicher-Paradigma gemäß der vorliegenden
Erfindung eine hoch skalierbare, mehrstufige Hierarchie aufweisen,
was es dem Speicher-Designer ermöglicht,
Speicherstrukturen zu entwerfen, deren Speicherzell-Dichten und
-Konfigurationen auf die Anwendung zugeschnitten sind. Vorteilhafterweise
kann diese Skalierbarkeit und Konfigurationsfähigkeit ohne die die Speicherarchitekturen
des Standes der Technik begleitenden Verzögerungen und ohne den wesentlich
erhöhten
Energie- und Bereichsverbrauch erhalten werden. 5 further shows that memory structures like the module 300 in 3 can be coupled so that the overall structure is extended in address size (ie, vertical) or in bit length (ie, horizontal), or both. In the 5 Array structure shown can also be modules such as the module 400 in 4 use. 5 also shows that a composite memory structure 500 that uses hierarchical memory modules can be genuinely hierarchical. The memory blocks 502 . 503 can consist of multiple memory modules, such as the memory module 504 , consist; these can be modules as they relate to 3 and 4 have been described. Each memory block 502 . 503 uses a two-step scan, as has already been shown. In the structure 500 use the memory blocks 502 . 503 however, an intermediate stage of bit line sampling by, for example, using intermediate stage sense amplifiers 514 . 516 use. Under the hierarchical memory paradigm, the middle stage sense amplifiers 514 . 516 with the global sense amplifier 520 be coupled. In fact, the hierarchical storage paradigm according to the present invention may have a highly scalable, multi-level hierarchy, allowing the memory designer to design storage structures whose storage cell densities and configurations are tailored to the application. Advantageously, this scalability and configurability can be obtained without the delays accompanying the memory architectures of the prior art and without the substantially increased power and area consumption.
Einer
der Schlüsselfaktoren
beim Gestalten einer schnelleren, leistungseffizienten Vorrichtung ist,
dass die Kapazität
pro Längeneinheit
der globalen Bitleitung im Vergleich zu der Kapazität der lokalen
Bitleitungen verringert werden kann. Denn bei Verwendung des Hierarchieschema
ist die Kapazität der
globalen Bitleitung nicht mehr durch das Zellendesign beschränkt. Beispielsweise
können
Metallleitungen oben auf der Speichervorrichtung laufen. Auch kann
ein Multiplexing-Schema verwendet werden, das den Abstand der Bitleitungen
erhöht,
wodurch sie auseinander gehen und die Bitleitungs-Kapazität weiter
reduziert wird. Insgesamt kann der Abstand zwischen den globalen
Bitleitungen größer sein,
weil die Speicherzellen nicht direkt mit den globalen Bitleitungen
verbunden sind. Stattdessen ist jede Zelle, z.B. die Zelle 303 in 3,
nur mit dem lokalen Leseverstärker,
z.B. dem Leseverstärker 308a–e,
verbunden.One of the key factors in designing a faster, power-efficient device is that the capacity per unit length of the global bitline can be reduced as compared to the capacity of the local bitlines. Because when using the hierarchy scheme, the capacity of the global bitline is no longer limited by the cell design. For example, metal lines may run on top of the storage device. Also, a multiplexing scheme may be used that increases the pitch of the bitlines, thereby diverge and further reduces bitline capacitance. Overall, the distance between the global bitlines may be larger because the memory cells are not directly connected to the global bitlines. Instead, every cell is the cell, for example 303 in 3 , only with the local sense amplifier, eg the sense amplifier 308a-e , connected.
Lokale Wortleitungs-DecodierungLocal wordline decoding
6 zeigt
eine Hierarchiestruktur 600 mit hierarchischer Wortleitungs-Decodierung,
bei der jedes hierarchische Speichermodul 605 aus einer
vordefinierten Anzahl von Speicherzellen 610 aufgebaut ist,
die mit einem bestimmten lokalen Wortleitungs-Decoder 615a–c gekoppelt
sind. Jeder lokale Wortleitungs-Decoder 615a–c ist mit einem jeweiligen
globalen Wortleitungs-Decoder 620 gekoppelt. Jeder globale
Wortleitungs-Decoder 620a–d wird
aktiviert, wenn der Predecoder 622 über die Predecoder-Leitungen 623 Adressinformationen übermittelt, die
sich auf einen bestimmten globalen Wortleitungs-Decoder 620a–d beziehen.
Im Ansprechen hierauf aktiviert der globale Wortleitungs-Decoder 620a–d die
globale Wortleitung 630, die ihrerseits einen bestimmten
lokalen Wortleitungs-Decoder 615a–c aktiviert. Der lokale
Wortleitungs-Decoder 615a–c aktiviert
dann das assoziierte Speichermodul 605, so dass die bestimmte,
interessierende Speicherzelle 610 ausgewertet werden kann.
Jedes der Speichermodule 605 kann insofern als unabhängiger Speicherbestandteil
betrachtet werden, als die hierarchische Funktionalität jedes
der Module 605 von lokalem Abtasten über die lokalen Leseverstärker 608a–b,
lokalem Decodieren über
die lokalen Wortleitungs-Decoder 615a–c, oder beides, abhängt. Wie bei
anderen bevorzugten Ausführungsformen
der vorliegenden Erfindung ist es erwünscht, dass jedes Modul 605 ein
selbstbestimmtes Zeitverhalten aufweist. Selbstbestimmtes Zeitverhalten
kann besonders nützlich
sein, wenn es in Zusammenhang mit lokalem Wortleitungs-Decodieren
verwendet wird, weil ein lokales Timing-Signal von einem jeweiligen
Speichermodul 605 verwendet werden kann, um globale Wortleitungs-Aktivierung, lokales
Bitleitungs-Abtasten, oder beides, zu beenden. 6 shows a hierarchical structure 600 with hierarchical wordline decoding, in which each hierarchical memory module 605 from a predefined number of memory cells 610 is constructed with a specific local word line decoder 615a-c are coupled. Each local wordline decoder 615a-c is with a respective global wordline decoder 620 coupled. Every global wordline decoder 620a-d is activated when the Predecoder 622 via the predecoder lines 623 Transmit address information that relates to a specific global wordline decoder 620a-d Respectively. In response, the global wordline decoder activates 620a-d the global wordline 630 which, in turn, has a particular local wordline decoder 615a-c activated. The local wordline decoder 615a-c then activates the associated memory module 605 so that the particular memory cell of interest 610 can be evaluated. Each of the memory modules 605 can thus be considered as an independent memory component, as the hierarchical functionality of each of the modules 605 from local sampling via the local sense amplifiers 608a-b , local decoding via the local word line decoder 615a-c , or both, depends. As with other preferred embodiments of the present invention, it is desirable that each module 605 has a self-determined timing. Self-determined timing may be particularly useful when used in conjunction with local wordline decoding because a local timing signal from a respective memory module 605 can be used to terminate global wordline enable, bitline local sense, or both.
Ähnlich der
in 5 gezeigten Skalierung können mehrere Speichervorrichtungen 600 mit
globalen Bitleitungen oder globalen Decodierungs-Wortleitungen gekoppelt
angeordnet werden, um einen zusammengesetzten Speicherbestandteil
gewünschter
Größe und Konfiguration
zu schaffen. Bei einer Ausführungsform
der vorliegenden Erfindung werden in jedem Modul 605 256
Zeilen von Speicher verwendet, die es dem Speicher-Designer ermöglichen,
einen Speicherblock beliebiger Größe zu schaffen, der eine Körnigkeit
von 256 Zeilen aufweist. Für
Speichervorrichtungen des Standes der Technik liegt eine typische
realistische Begrenzung der Anzahl von pro Leseverstärker abgetasteten
Bits bei ca. 512 Bits. Lange Bit- oder Wortleitungen können ein Problem
darstellen, insbesondere für
WRITE-Operationen, weil der assoziierte Treiber durch die Menge der
Energie, die er erzeugen kann, und durch die Geschwindigkeit, mit
der auf Signalleitungen, beispielsweise den globalen Bitleitungen 604, 606 in 6, ausreichend
Ladung aufgebaut werden kann, eingeschränkt werden kann.Similar in the 5 shown scaling can multiple storage devices 600 coupled to global bitlines or global decode wordlines to form a composite memory component desired size and configuration. In one embodiment of the present invention, in each module 605 Uses 256 rows of memory that allow the memory designer to create a memory block of arbitrary size that has a granularity of 256 lines. For prior art memory devices, a typical realistic limitation on the number of bits sampled per sense amplifier is about 512 bits. Long bit or word lines can be a problem, especially for WRITE operations, because the associated driver can be affected by the amount of power that it can generate and by the speed with which signal lines, such as the global bit lines 604 . 606 in 6 , sufficient charge can be built up, can be restricted.
Obwohl 6 hierarchisches
Wortleitungs-Decodieren im Zusammenhang mit hierarchischen Bitleitungs-Operationen
zeigt, kann hierarchisches Wortleitungs-Decodieren auch ohne hierarchisches
Bitleitungs-Abtasten implementiert werden. Es ist bevorzugt, sowohl
das hierarchische Wortleitungs-Decodieren als auch das hierarchische
Bitleitungs-Abtasten zu verwenden, um die Synergieeffekte von weniger
Energie und höherer
Geschwindigkeit für
die gesamte Vorrichtung zu erhalten.Even though 6 shows hierarchical word line decoding in the context of hierarchical bit line operations, hierarchical word line decoding can also be implemented without hierarchical bit line scanning. It is preferable to use both hierarchical word line decoding and bit line hierarchical sampling to obtain the synergies of less energy and higher speed for the entire device.
Hierarchische FunktionalitätHierarchical functionality
Bei
typischen Ausgestaltungen wächst
die Energie ungefähr
linear zur Größe des Speichers. Gemäß der vorliegenden
Erfindung können
sich, wie in 3 bis 6 gezeigt
ist, die Energieerfordernisse jedoch nur geringfügig erhöhen, wenn die Gesamtspeicherstrukturgröße wächst, in
erster Linie deshalb, weil nur das Speichermodul und die assoziierten
lokalen Bitleitungen und lokalen Wortleitungen während einer gegebenen Operation
aktiviert werden. Aufgrund der lokalisierten Funktionalität werden die
globalen Bitleitungen und Wortleitungen für relativ kurze Zeiträume zu Beginn
und am Ende der Operation aktiviert. Auf jeden Fall wird der Energie verbrauch
im allgemeinen durch die Bitgröße des Worts und
die Grundmodulkonfiguration, d.h. die Anzahl der Zeilen und die
Zeilenlänge
der Module 620a–e, bestimmt.
Daher können
wesentliche Vorteile durch vernünftiges
Auswählen
der Konfiguration eines Speichermoduls in Bezug auf die Gesamtspeicherstrukturkonfiguration
realisiert werden. Beispielsweise kann bei einer erfindungsgemäßen Speicherstruktur
eine Verdoppelung der Größe der Speichervorrichtung
zu einem Energieverbrauchs-Zuwachs von ca. 20 Prozent und nicht,
wie bei Ausgestaltungen des Standes der Technik zu finden, zu einer
Verdoppelung führen.
Des weiteren kann eine erfindungsgemäße Speicherstruktur eine vier-
bis sechsfache Abnahme der Energieerfordernisse realisieren und
30% bis 50% schneller, und häufig
noch schneller, arbeiten als traditionelle Architekturen.In typical embodiments, the energy grows approximately linearly with the size of the memory. According to the present invention, as shown in FIG 3 to 6 however, the power requirements increase only slightly as the overall memory structure size grows, primarily because only the memory module and the associated local bitlines and local wordlines are activated during a given operation. Due to the localized functionality, the global bitlines and wordlines are activated for relatively short periods of time at the beginning and at the end of the operation. In any case, energy consumption is generally determined by the bit size of the word and the basic module configuration, ie, the number of rows and the row length of the modules 620a-e , certainly. Therefore, substantial advantages can be realized by judiciously selecting the configuration of a memory module with respect to the overall memory structure configuration. For example, in a memory structure according to the invention a doubling of the size of the memory device to an energy consumption increase of about 20 percent and not, as found in embodiments of the prior art, lead to a doubling. Furthermore, a memory structure according to the invention can realize a four to sixfold reduction in power requirements and operate 30% to 50% faster, and often faster, than traditional architectures.
7 zeigt,
dass erfindungsgemäße Speicherstrukturen,
beispielsweise die Speicherstruktur 740, voll hierarchisch
sind, indem jede Stufe innerhalb der Hierarchie lokales Bitleitungs-Abtasten,
lokales Wortleitungs-Decodieren, oder beides, umfasst. Die beispielhafte
Speicherstruktur 740 ist eine dreistufige hierarchische
Vorrichtung, wobei das Speichermodul 700 für die Grund-,
oder niedrigste, Stufe (L0) der Speicherhierarchie,
die Speichervorrichtung 720 für die Zwischenstufe (L1) der Speicherhierarchie und die Speicherstruktur 740 für die obere Stufe
(L2) der Speicherhierarchie repräsentativ
ist. Aus Gründen
der Vereinfachung ist nur eine Speicherspalte in jeder Stufe gezeigt,
so dass die Speicherspalte 702 für die Grundstufe (L0), die Speicherspalte 722 für die Zwischenstufe
(L1) und die Speicherspalte 742 für die obere
Stufe (L2) repräsentativ sein soll. 7 shows that memory structures according to the invention, for example the memory structure 740 are hierarchical in that each stage within the hierarchy includes local bitline scanning, local wordline decoding, or both. The exemplary memory structure 740 is a three-level hierarchical device, wherein the memory module 700 for the basic, or lowest, level (L 0 ) of the memory hierarchy, the memory device 720 for the intermediate stage (L 1 ) of the memory hierarchy and the memory structure 740 is representative of the upper level (L 2 ) of the memory hierarchy. For the sake of simplicity, only one storage column is shown in each stage, such that the storage column 702 for the basic level (L 0 ), the storage column 722 for the intermediate stage (L 1 ) and the storage column 742 for the upper stage (L 2 ) should be representative.
Speichervorrichtungen
der Stufe L0, z.B. das Speichermodul 700,
bestehen aus mehreren Speicherzellen, allgemein durch die Speicherzelle 701 angegeben,
die in Zeilen-, Spalten- oder 2-D-Array (Reihen und Spalten)-Formaten
angeordnet sein können.
Das Speichermodul 700 verwendet bevorzugt lokales Bitleitungs-Abtasten,
lokales Wortleitungs-Decodieren, oder beides, wie in Bezug auf 3 bis 6 beschrieben
worden ist. Bei dem vorliegenden Beispiel weist das Modul M00 sowohl lokales
Bitleitungs-Abtasten als auch lokales Wortleitungs-Decodieren auf.
Jede Speicherzelle M01 in einer jeweiligen Spalte von Speicherzellen 702 ist durch
lokale Bitleitungen 704a, 704b mit dem lokalen Leseverstärker 703 gekoppelt.
Obwohl lokales Bitleitungs-Abtasten in einer Speicherspalte durchgeführt werden
kann, die eine einzige Speicherzelle aufweist, ist es bevorzugt,
dass zwei, oder mehr, Speicherzellen 701 mit dem lokalen
Leseverstärker 703 gekoppelt
sind. Anders als einige Speichervorrichtungen des Standes der Technik,
die auf das lokale Bitleitungs-Abtasten verzichten, indem sie spezielle Speicherzellen
verwenden, die bei vollen logi schen Pegeln starke Signale bereitstellen,
kann das Modul 700 herkömmliche
Speicherzellen 701 mit niedriger Energie als einzelne Speicherzellen
verwenden, und es ist in der Tat bevorzugt, dass es diese verwendet. Ein
Vorteil des lokalen Bitleitungs-Abtastens
ist, dass der lokale Leseverstärker 703 nur
eine begrenzte Spannungsschwankung auf den Bitleitungen 704a, 704b benötigt, um
den Zustand der Speicherzelle 701 genau abzutasten, was
eine rasche Ermittlung und ein rasches Berichten des Speicherzustands
mit wesentlich geringerem Energieverbrauch als bei Ausgestaltungen
des Standes der Technik ermöglicht.
Der lokale Leseverstärker
der Stufe L0 703 ermittelt den
Speicherzustand der Speicherzelle 701 durch Koppeln des
Speicherzustandssignals über
die lokalen Bitleitungen 704a, 704b an den lokalen
Leseverstärker
der Stufe L0 703. Es ist bevorzugt,
dass das Speicherzustandssignal ein Signal mit begrenzter Spannungsschwankung
ist. Der Verstärker 703 überträgt ein abgetastetes
Signal, das für
den Speicherzustand der Speicherzelle 701 repräsentativ
ist, an den Leseverstärker
der Stufe L1 723 über die
Ausgänge 705a, 705b des
lokalen Leseverstärkers
der Stufe L0, die mit den Zwischenstufen-Bitleitungen 724a, 724b verbunden
sind. Es ist bevorzugt, dass das abgetastete Signal ebenfalls ein
Signal mit begrenzter Spannungsschwankung ist. Der Verstärker 723 wiederum überträgt ein zweites
abgetastetes Signal, das für
den Speicherzustand der Speicherzelle 701 repräsentativ
ist, an den Leseverstärker
der Stufe L2 743 über die
Ausgänge 725a, 725b des
lokalen Leseverstärkers
der Stufe L1, die mit den Bitleitungen 744a, 744b der
oberen Stufe verbunden sind. Es ist ebenfalls bevorzugt, dass das
zweite abgetastete Signal ein Signal mit begrenzter Spannungsschwankung
ist.Memory devices of the stage L 0 , for example, the memory module 700 , consist of several memory cells, generally by the memory cell 701 which may be arranged in row, column or 2-D array (row and column) formats. The memory module 700 Preferably, it uses local bitline scanning, local wordline decoding, or both as described with respect to FIG 3 to 6 has been described. In the present example, the module M00 includes both local bitline scanning and local wordline decoding. Each memory cell M01 in a respective column of memory cells 702 is through local bitlines 704a . 704b with the local sense amplifier 703 coupled. Although local bit line sampling may be performed in a memory column having a single memory cell, it is preferred that two, or more, memory cells 701 with the local sense amplifier 703 are coupled. Unlike some prior art memory devices that forego local bit line sampling by using special memory cells that provide strong signals at full logic levels, the module can 700 conventional memory cells 701 with low energy than individual memory cells, and it is indeed preferable that it uses them. An advantage of local bit line sampling is that the local sense amplifier 703 only a limited voltage fluctuation on the bit lines 704a . 704b needed to change the state of the memory cell 701 accurately scan, which allows rapid detection and rapid reporting of the memory state with much lower power consumption than in prior art designs. The local sense amplifier of stage L 0 703 determines the memory state of the memory cell 701 by coupling the memory state signal over the local bitlines 704a . 704b at the local reading amplifier of stage L 0 703 , It is preferable that the memory state signal is a signal with a limited voltage fluctuation. The amplifier 703 transmits a sampled signal indicative of the memory state of the memory cell 701 is representative of the sense amplifier of the stage L 1 723 over the exits 705a . 705b the local sense amplifier of the stage L 0 , with the intermediate stage bit lines 724a . 724b are connected. It is preferable that the sampled signal is also a signal with limited voltage fluctuation. The amplifier 723 in turn, transmits a second sampled signal indicative of the memory state of the memory cell 701 representative of the sense amplifier of stage L 2 743 over the exits 725a . 725b the local sense amplifier of the stage L 1 , which is connected to the bit lines 744a . 744b the upper level are connected. It is also preferable that the second sampled signal is a signal with limited voltage fluctuation.
Wenn
die Stufe L2 die oberste Stufe in der Speicherhierarchie
ist, wie es in dem vorliegenden Beispiel gezeigt wird, kann der
Leseverstärker 743 ein
globaler Leseverstärker
sein, der ein drittes Signal, das für die Speicherzelle 701 repräsentativ
ist, über
die Leseverstärker-Ausgangsleitungen 746a, 746b an
die (nicht gezeigte) assoziierte Eingangs-/Ausgangsschaltung weiterleitet.
Eine derartige Eingangs/Ausgangsschaltung kann der Eingangs-/Ausgangsschaltung
in 1 ähnlich
sein. Die vorliegende Erfindung sieht jedoch eine hierarchische
Struktur vor, die aus zwei, drei, vier, oder mehr Hierarchiestufen
bestehen kann. Das Signal der obersten Stufe kann ein Signal mit
voller Schwankung sein. Beim Betrachten der 7 erkennt
der Fachmann, dass „lokales
Bitleitungs-Abtasten" auf jeder
Stufe L0, L1 und
L2 in der beispielhaften Hierarchie stattfindet
und erwünscht
ist, z.B. weil nur eine begrenzte Spannungsschwankung nötig sein
kann, um den angefragten Speicherzustand von einer niedrigeren Stufe
in der Hierarchie an die nächsthöhere Stufe
zu berichten.If the stage L 2 is the topmost level in the memory hierarchy, as shown in the present example, the sense amplifier can 743 a global sense amplifier that provides a third signal to the memory cell 701 representative of the sense amplifier output lines 746a . 746b to the associated input / output circuit (not shown). Such input / output circuit may be the input / output circuit in 1 be similar to. However, the present invention provides a hierarchical structure that may consist of two, three, four, or more hierarchical levels. The top level signal may be a full swing signal. When looking at the 7 It will be appreciated by those skilled in the art that "bit line local sampling" occurs and is desired at each stage L 0 , L 1, and L 2 in the example hierarchy, eg, because only a limited voltage swing may be required to lower the requested memory state from a lower level to report the hierarchy to the next higher level.
Hierarchische
Speicherstrukturen können auch
lokales Wortleitungs-Decodieren verwenden, wie bei der Speichervorrichtung 740 gezeigt
ist. In 7 ist die Speichervorrichtung 740 die
oberste Stufe (L2) in der hierarchischen
Speicherstruktur, daher wird das ankommende globale Wortleitungssignal 746 von
den (nicht gezeigten) globalen Wortleitungs-Treibern, z.B. den globalen
Zeilen-Adressdecodern 110 in 1, empfangen.
Bei bestimmten bevorzugten Ausführungsformen
der vorliegenden Erfindung wird Predecodierung verwendet, um raschen Zugriff
auf erwünschte
Wortleitungen zu bewirken, obwohl Predecodierung nicht auf jeder
Stufe in einer bestimmten Implementierung erforderlich und erwünscht ist.
Das Signal M46 wird von dem Predecoder 747 der oberen Stufe
empfangen, predecodiert und an die globalen Wortleitungs-Decoder
der oberen Stufe (L2), z.B. den globalen
Wortleitungs-Decoder 748, weitergeleitet. Der Decoder M48
ist mittels der globalen Wortleitung 750 der oberen Stufe
an den lokalen Wortleitungs-Decoder 749 gekoppelt und aktiviert
den lokalen Wortleitungs-Decoder 749 der oberen Stufe selektiv.
Der aktivierte lokale L2-Decoder M49 wiederum
aktiviert die lokale L2-Wortleitung 751,
die das ausgewählte
Wortleitungssignal 726 an den Predecoder 727 der
Zwischenstufe (L1) weiterleitet. Der Predecoder 727 decodiert
und aktiviert den entsprechenden globalen Wortleitungs-Decoder der Zwischenstufe
(L1), z.B. den globalen Wortleitungs-Decoder 728.
Der Decoder 728 ist mit dem lokalen Wortleitungs-Decoder 729 der
Stufe L1 mittels der globalen Wortleitung 730 der
Stufe L1 gekoppelt und aktiviert diese selektiv.
Der aktivierte lokale L1-Decoder 729 wiederum
leitet ein ausgewähltes Wortleitungssignal 706 an
den Predecoder 707 der Grundstufe (L0)
weiter, der den entsprechenden globalen Wortleitungs-Decoder der
Stufe L0, z.B. den globalen Wortleitungs-Decoder 708,
decodiert und aktiviert. Der aktivierte lokale L0-Decoder 709 wiederum
aktiviert die lokale L0-Wortleitung 711 und
wählt die
Speicherzelle 701 zum Zugriff aus. In Anbetracht der vorstehenden
Erörterung
des hierarchischen Wortleitungs-Decodierens erkennt der Fachmann, dass „lokales
Wortleitungs-Decodieren" auf
jeder Stufe L0, L1 und
L2 in der beispielhaften Hierarchie auftritt
und erwünscht
ist, weil eine wesentliche Verringerung der für den Zugriff auf ausgewählte Speicherzellen
benötigten
Zeit und Energie realisiert werden kann.Hierarchical memory structures may also use local wordline decoding, as in the memory device 740 is shown. In 7 is the storage device 740 the uppermost stage (L 2 ) in the hierarchical memory structure, therefore becomes the incoming global wordline signal 746 from the global wordline drivers (not shown), eg, the global row address decoders 110 in 1 , received. In certain preferred embodiments of the present invention, predecoding is used to provide rapid access to desired wordlines, although predecoding is not required and desired at each stage in a particular implementation. The signal M46 is from the Predecoder 747 the upper stage is received, predecoded and sent to the upper-level global word line decoders (L 2 ), eg the global word line decoder 748 , forwarded. The decoder M48 is by means of the global word line 750 the upper level to the local word line decoder 749 coupled and activates the local word line decoder 749 the upper level selective. The activated local L 2 decoder M49 in turn activates the local L 2 word line 751 containing the selected wordline signal 726 to the Predecoder 727 the intermediate stage (L 1 ) passes. The Predecoder 727 decodes and activates the corresponding global word line decoder of the intermediate stage (L 1 ), eg the global word line decoder 728 , The decoder 728 is with the local word line decoder 729 the stage L 1 by means of the global word line 730 coupled to the stage L 1 and activates this selectively. The activated local L 1 decoder 729 in turn, passes a selected wordline signal 706 to the Predecoder 707 the basic stage (L 0 ), which is the corresponding global word line decoder of the stage L 0 , for example, the global word line decoder 708 , decoded and activated. The activated local L 0 decoder 709 in turn, activates the local L 0 word line 711 and selects the memory cell 701 to access. In view of the above discussion of hierarchical wordline decoding, those skilled in the art will recognize that "local wordline decoding" occurs and is desirable at each stage L 0 , L 1 and L 2 in the example hierarchy because of a substantial reduction in access to selected memory cells required time and energy can be realized.
Obwohl
das lokale Wortleitungs-Decodieren in dem Modul 700 im
Zusammenhang mit einer einzigen Spalte von Speicherzellen, nämlich den
Speicherspalten 702, 722, 742 gezeigt
ist, sieht die vorliegende Erfindung vor, dass das lokale Wortleitungs-Decodieren über zwei,
oder mehr, Spalten in jeder Hierarchiestufe durchgeführt wird,
wobei jede der Zeilen in den jeweiligen Spalten zwei oder mehr lokale
Wortleitungs-Decoder, z.B. die lokalen Wortleitungs-Decoder 709, 729, 749 ver wendet,
die mit jeweiligen globalen Wortleitungs-Decodern, z.B. den globalen
Wortleitungs-Decodern 708, 728, 748,
mittels jeweiliger globaler Wortleitungen, z.B. den globalen Wortleitungen 710, 730, 750,
gekoppelt sind. Es ist jedoch nicht erforderlich, dass in zwei Stufen
der hierarchischen Struktur dieselbe Anzahl von Zeilen und Spalten
verwendet wird. Im allgemeinen kann die Speichervorrichtung 720 aus
mehreren Speichermodulen 700 aufgebaut sein, wobei diese
Grundmodule 700 in Zeilen-, Spalten- oder 2-D-Array (Zeilen
und Spalten)-Format angeordnet sein können. Derartige Grundspeichermodule
können ähnlich den
in Bezug auf 3 bis 6 gezeigten,
sowie Kombinationen hiervon sein. Ähnlich kann die Speichervorrichtung 740 aus
mehreren Speichervorrichtungen 720 aufgebaut sein, wobei
diese Zwischenvorrichtungen 720 ebenfalls in Zeilen-, Spalten
oder 2-D-Array (Reihen und Spalten)-Format angeordnet sein können. Diese erweiterte,
und erweiterbare, Hierarchie erlaubt die Bildung mehrdimensionaler
Speichermodule, die sich von hierarchieartigen Implementierungen
des Standes der Technik unterscheiden, die im allgemeinen 2-D-Gruppierungen
von Bank-, Seiten- oder Segment-Speichervorrichtungen, oder Registerfile-Speichervorrichtungen
sind, denen es in jeder Stufe der Hierarchie an lokaler Funktionalität mangelt.Although the local wordline decoding in the module 700 in the context of a single column of memory cells, namely the memory columns 702 . 722 . 742 2, the present invention contemplates that local wordline decoding be performed over two or more columns in each hierarchy level, each of the rows in the respective columns being two or more local wordline decoders, eg, the local wordline decoders 709 . 729 . 749 used with respective global word line decoders, eg the global word line decoders 708 . 728 . 748 , by means of respective global word lines, eg the global word lines 710 . 730 . 750 , are coupled. However, it is not necessary to use the same number of rows and columns in two stages of the hierarchical structure. In general, the storage device 720 from several memory modules 700 be constructed, these basic modules 700 can be arranged in a row, column or 2-D array (rows and columns) format. Such basic memory modules may be similar to those described with respect to 3 to 6 shown, as well as combinations thereof. Similarly, the storage device 740 from several storage devices 720 be constructed, these intermediate devices 720 can also be arranged in rows, columns or 2-D array (rows and columns) format. This extended, and extensible, hierarchy allows for the formation of multi-dimensional memory modules that differ from prior art prior art hierarchical implementations, which are generally 2-D groupings of bank, page or segment memory devices, or register file storage devices There is a lack of local functionality at every level of the hierarchy.
Schneller Decoder mit
asynchronem RücksetzenFast decoder with
asynchronous reset
Typischerweise
kann lokales Decoder-Rücksetzen
verwendet werden, um enge Impulsweiten in Wortleitungen in einer
schnellen Speichervorrichtung zu erzeugen. Die in den Wortleitungs-Decoder
eingegebenen Signale werden im allgemeinen auf ein Takt- oder Chip-Auswahl-Signal
synchronisiert. Es ist jedoch erwünscht, dass die Wortleitung
unabhängig vom
Takt und auch vom Variieren der Eingangssignale in den Wortleitungs-Decoder
zurückgesetzt
wird.typically,
can perform local decoder reset
used to narrow pulse widths in word lines in one
to generate a fast memory device. The in the word line decoder
input signals are generally applied to a clock or chip select signal
synchronized. However, it is desirable that the wordline
independent of
Clock and also from varying the input signals in the word line decoder
reset
becomes.
8 ist
ein Schaltungsdiagramm, das einen asynchron zurücksetzbaren Decoder 800 gemäß diesem
Aspekt der vorliegenden Erfindung zeigt. Es kann erwünscht sein,
die AND-Funktion beispielsweise durch eine quellgekoppelte Logik
zu implementieren. Die Kapazität
am Eingang x2_n 802 kann im allgemeinen groß sein,
daher wird die AND-Funktion mit ungefähr einer Inverter-Verzögerung plus
drei Puffer-Stufen durchgeführt.
Die Puffer werden Skewing unterzogen, was die Ladungskapazität um ca.
die Hälfte
verringert und die Puffer-Verzögerung
erniedrigt. 8th is a circuit diagram showing an asynchronously resettable decoder 800 according to this aspect of the present invention. It may be desirable to implement the AND function by, for example, a source coupled logic. The capacity at the input x2_n 802 may generally be large, therefore, the AND function is performed with approximately one inverter delay plus three buffer stages. The buffers undergo skewing, which reduces the charge capacity by about half and lowers the buffer delay.
Um
die Wortleitung WL 804 unabhängig zurücksetzen zu können, ist
es erwünscht,
dass die Eingänge 802, 803 vom
Ausgang 804 isoliert werden, und der Knoten 805 sollte
auf Vdd geladen werden, wodurch der große PMOS-Treiber
M8 807 abgeschaltet wird, sobald die Wortleitung WL 804 auf
logisch HOCH gesetzt wird. Das Laden des Knotens 805 auf
Vdd kann durch eine Rückkopplungs-Rücksetz-Schleife erreicht
werden. Die Eingänge 802, 803 können von
dem Ausgang 804 durch Setzen der NMOS-Vorrichtung 808 auf
logisch LOW isoliert werden. Wenn der Ausgang WL 804 hoch
wird, wird der Monitorknoten 810 gegen Masse entladen und
die Vorrichtung M0 812 wird abgeschaltet, wodurch die Eingänge 802, 803 von
dem Ausgang WL 804 isoliert werden. Die Rückkopplungs-Schleife
lädt den
Rest der Knoten in den Puffern über
den Monitorknoten 810 vor, und der PMOSFET M13 815 wird
eingeschaltet, wodurch der Eingang x2_n 802 mit dem Knoten 810 verbunden
wird. Der Decoder 800 geht erst wieder in Betrieb, wenn
x2_n 802 auf Vdd zurückgesetzt
wird, was normalerweise passiert, wenn das Systemtaktsignal auf
logisch LOW übergeht.
Sobald x2_802 logisch HIGH ist, lädt der Knoten 810 mit
Hilfe der PMOS-Vorrichtung M14 818 auf Vdd,
und die Vorrichtung M0 812 wird eingeschaltet. Dies schaltet die
PMOS-Vorrichtung M13 815 ab, wodurch der Eingang x2_n 802 von
der Rücksetz-Schleife
isoliert wird, die den Knoten 810 verwendet. Der Decoder 800 ist
nun für
den nächsten
Eingabezyklus bereit.To the word line WL 804 To reset independently, it is desirable that the inputs 802 . 803 from the exit 804 be isolated, and the node 805 should be loaded on Vdd , causing the large PMOS driver M8 807 is switched off as soon as the word line WL 804 is set to logically HIGH. Loading the node 805 on Vdd can be achieved by a feedback reset loop. The inputs 802 . 803 can from the output 804 by setting the NMOS device 808 to be isolated logically LOW. When the output WL 804 becomes high, becomes the monitor node 810 discharged to ground and the device M0 812 is turned off, reducing the inputs 802 . 803 from the output WL 804 be isolated. The feedback loop loads the rest of the nodes in the buffers across the monitor node 810 before, and the PMOSFET M13 815 is turned on, causing the input x2_n 802 with the node 810 is connected. The decoder 800 will not start until x2_n 802 is reset to V dd , which normally happens when the system clock signal transitions to a logical LOW. As soon as x2_ 802 Logically HIGH, the node loads 810 using the PMOS device M14 818 on Vdd , and the device M0 812 is turned on. This turns on the PMOS device M13 815 which causes the input x2_n 802 is isolated from the reset loop, which is the node 810 used. The decoder 800 is now ready for the next input cycle.
Treiberschaltung mit begrenzter
SchwankungDriver circuit with limited
fluctuation
9 zeigt
eine Treiberschaltung 900 mit begrenzter Schwankung gemäß einem
Aspekt der vorliegenden Erfindung. Bei Speichern mit großer Wortlänge kann
eine beträchtliche
Menge Energie in den Datenbussen verbraucht werden. Das Begrenzen
der Spannungsschwankung in derartigen Bussen kann den Gesamtenergieverbrauch
des Systems erniedrigen. Dies kann auch für ein System gelten, bei dem
eine bedeutende Menge von Energie beim Schalten von Leitungen mit
hoher Kapazität
verbraucht wird. Die Treiberschaltung mit begrenzter Schwankung 900 kann
Energieverbrauch beispielsweise in Leitungen mit hoher Kapazität reduzieren. Wenn
das IN-Signal 902 logisch HIGH ist, leitet der NMOS-Transistor
MN1 904, und der Knoten 905 wird effektiv an Masse
gelegt. Außerdem
wird die Bitleitung 910 durch den PMOSFET MP1 912 entladen. Durch
geeignete Dimensionierung der Vorrichtung kann die Spannungsschwankung
in der Bitleitung 910 auf einen gewünschten Wert begrenzt werden, wenn
der Inverter, der durch die CMOSFETS MP2 914 und MN2 916 gebildet
wird, den PMOSFET MP1 912 OFF schaltet. Im allgemeinen
steht die Größe der Schaltung 900 in
Bezug zu der Kapazität
(CBitleitung) 918, die getrieben
wird, und zu den Größen von MP2 914 und
MN2 916. Bei einer anderen Ausführungsform dieses Aspekts der
vorliegenden Erfindung weist die Treiberschaltung mit begrenzter Schwankung
ein Tri-State Output Enable- und ein Selbstrücksetz-Merkmal auf. Die Tri-State-Funktionalität ist erwünscht, wenn
Datenleitungen ge multiplext oder gemeinsam verwendet werden. Obwohl
die Spannung an dem Speicherzell-Knoten 905 auf ca. Null
Volt schwanken kann, ist es äußerst erwünscht, dass
die Bitleitungs-Spannung nur um ca. 200–300 mV schwankt. 9 shows a driver circuit 900 with limited variation according to one aspect of the present invention. With large word length memories, a significant amount of power can be consumed in the data buses. Limiting the voltage fluctuation in such buses can lower the overall energy consumption of the system. This may also apply to a system in which a significant amount of energy is consumed in switching high capacity lines. The driver circuit with limited fluctuation 900 For example, it can reduce energy consumption in high-capacity lines. If the IN signal 902 logic high, the NMOS transistor MN1 conducts 904 , and the node 905 is effectively grounded. In addition, the bit line becomes 910 through the PMOSFET MP1 912 discharged. By suitable dimensioning of the device, the voltage fluctuation in the bit line 910 be limited to a desired value when the inverter is powered by the CMOSFETS MP2 914 and MN2 916 is formed, the PMOSFET MP1 912 OFF switches. In general, the size of the circuit 900 in relation to the capacity (C bit line ) 918 that is driven, and to the sizes of MP2 914 and MN2 916 , In another embodiment of this aspect of the present invention, the limited swing driver circuit includes a tri-state output enable and a self-reset feature. Tri-state functionality is desirable when data lines are multiplexed or shared. Although the voltage at the memory cell node 905 can fluctuate to about zero volts, it is highly desirable that the bit line voltage only varies by about 200-300 mV.
Einpolig geerdeter Leseverstärker mit
Abtast- und HaltereferenzSingle-ended sense amplifier with
Sample and hold reference
Im
allgemeinen sind einpolig geerdete Leseverstärker von Nutzen, um Metallraum
zu sparen, doch die bestehenden Ausgestaltungen sind aufgrund ihrer
Anfälligkeit
für Energiezufuhr-
und Grundrauschen tendenziell nicht robust. Bei einem weiteren Aspekt
der vorliegenden Erfindung zeigt 10 einen
einpolig geerdeten Leseverstärker 1000,
vorzugsweise mit einer Abtast- und Haltereferenz. Der Verstärker 1000 kann
beispielsweise als globaler Leseverstärker, der Eingangsdaten abtastet, von
Nutzen sein. Zu Beginn einer Operation wird DataIn 1004 abgetastet,
vorzugsweise gerade bevor die Messung beginnt. Daher beeinträchtigt das
Zufuhr-, Grund- oder
sonstige Rauschen die Referenzspannung des Leseverstärkers 1000 im
allgemeinen auf dieselbe Weise, in der das Rauschen den zu messenden
Knoten beeinträchtigt,
was die Rauschimmunität
des Leseverstärkers 1000 tendenziell
erhöht. Beide
Eingänge 1010, 1011 des
Differentialverstärkers 1012 liegen
beim Spannungspegel von DataIn 1004, wenn das Aktivierungssignal
(GWSELH) 1014 logisch LOW ist (d.h. beim Nullpotential).
Zu einem vorgewählten
Intervall vor Beginn der Messung, jedoch bevor DataIn 1013 sich
zu ändern
beginnt, wird das Aktivierungssignal (GWSELH) 1014 zu logisch HIGH,
wodurch der Eingangsknoten 1002 des Transistors M162 1008 isoliert
wird. Die DataIn-Spannung, die existiert, gerade bevor die Messung
abgenommen wird, wird abgetastet und als Referenz gehalten, wodurch
die Schaltung von Grund- oder Spannungszufuhr-Referenzen im wesentlichen
unabhängig
wird. Die Transistoren M190 1025 und M187 1026 können dem
Knoten 1021, in dem die Referenzspannung gespeichert wird,
Kapazität
hinzufügen.
Der Transistor M190 1025 kann auch als Pumpkondensator
verwendet werden, um den Spannungsabfall am Referenzknoten 1021 auszugleichen,
wenn das Aktivierungssignal HIGH wird und die Source 1002 von
M1623 1008 auf niedrigere Spannung zieht. Die Rückkopplung 1030 von
den Ausgangsdaten Data_toLSA 1035, die zu einem (nicht
gezeigten) lokalen Leseverstärker übertragen
werden, ist mit der Source/Drain des Transistors M187 1026 gekoppelt, wodurch
die Referenzspannung beim Knoten 1021 durch kapazitives
Koppeln aktiv angepasst wird, wodurch der Verstärkergewinn adaptiv angepasst
wird.In general, single-ended sense amplifiers are useful to conserve metal space, but the existing designs tend not to be robust due to their susceptibility to power and noise floor. In a further aspect of the present invention shows 10 a single-ended sense amplifier 1000 , preferably with a sample and hold reference. The amplifier 1000 may, for example, be useful as a global sense amplifier sampling input data. At the beginning of an operation Da Tain 1004 sampled, preferably just before the measurement begins. Therefore, the supply, ground or other noise affects the reference voltage of the sense amplifier 1000 generally in the same manner in which the noise affects the node to be measured, which is the noise immunity of the sense amplifier 1000 tends to increase. Both inputs 1010 . 1011 of the differential amplifier 1012 are at the voltage level of DataIn 1004 when the activation signal (GWSELH) 1014 logical is LOW (ie at zero potential). At a preselected interval before starting the measurement, but before DataIn 1013 begins to change, the activation signal (GWSELH) 1014 to logically HIGH, causing the input node 1002 of the transistor M162 1008 is isolated. The DataIn voltage, which exists just before the measurement is taken, is sampled and held as a reference, making the circuit of ground or voltage supply references essentially independent. The transistors M190 1025 and M187 1026 can the node 1021 in which the reference voltage is stored, add capacity. The transistor M190 1025 can also be used as a pump capacitor to detect the voltage drop at the reference node 1021 compensate when the activation signal becomes HIGH and the source 1002 from M1623 1008 pulls on lower tension. The feedback 1030 from the output data Data_toLSA 1035 which are transmitted to a local sense amplifier (not shown) is connected to the source / drain of the transistor M187 1026 coupled, causing the reference voltage at the node 1021 is actively adjusted by capacitive coupling, adaptively adjusting the amplifier gain.
Leseverstärker mit
Offset Cancellation und Charge-Share schwankungsbegrenzten TreibernSense amplifier with
Offset Cancellation and Charge-Share Varying Drivers
Bei
einem weiteren Aspekt der vorliegenden Erfindung ist ein Leseverstärker 1100 vom
Latchtyp mit dynamischer Offset Cancellation vorgesehen. Der Leseverstärker 1100 kann
auch als globaler Leseverstärker
von Nutzen sein und ist zum Einsatz im Zusammenhang mit hierarchischem
Bitleitungs-Abtasten geeignet. Typischerweise kann die Empfindlichkeit
von Differential-Leseverstärkern
durch die Offsets eingeschränkt
werden, die durch inhärente Prozessvariationen
für Vorrichtungen
(„Vorrichtungsanpassung") verursacht werden,
sowie durch dynamische Offsets, die sich in den Eingangsleitungen während einer
Operation mit hoher Geschwindigkeit entwickeln können. Das Vermindern des Verstärker-Offsets
führt normalerweise
zu einer entsprechenden Verminderung der für eine zuverlässige Operation
erforderlichen minimalen Bitleitungs-Schwankung. Geringere Bitleitungs-Schwankungen
können
zu schnellerer Speicheroperation mit geringerer Energie führen. Beim
Verstärker 1100 kann
der Offset in den Bitleitungen durch die drei PMOS Precharge-Balance-Transistoren
M3 1101, M4 1102, M5 1103 aufgehoben
werden; diese Anordnung ist dem Fachmann bekannt. Trotz der Precharge-Balance-Transistoren 1101-1103 kann
jedoch an den Eingängen
des Latchs ein zusätzlicher
Offset existieren. Durch das Verwenden des PMOS Balance-Transistors
(M14) 1110 kann ein Offset, der am Eingang des Differential-Leseverstärkers vom
Latchtyp vorhanden sein kann, im wesentlichen ausgeglichen werden.
Der Leseverstärker 1100 weist
einen Charge-Sharing
Treiber 1115 mit begrenzter Schwankung auf. Die globalen
Bitleitungen 1150, 1151 werden von dem Leseverstärker 1100 getrennt, wenn
der Leseverstärker 1100 nicht
benutzt wird, d.h. in einem Tri-State Zustand. Der Leseverstärker 1100 kann
sich in einem vorgeladenen Zustand befinden, wenn die beiden Eingangs/Ausgangs-Knoten
logisch HIGH sind, d.h., wenn beide PMOS Treiber M38 1130 und
M29 1131 abgeschaltet sind (Eingänge bei logisch HIGH). Ein
großer
Kondensator, C0 1135, in dem Leseverstärker 1100 kann
von zwei in Reihe geschalteten NMOS Transistoren, M37 1140 und
M40 1141, im wesentlichen bei Null Volt gehalten werden. Die
Größe des Kondensators 1135 kann
durch die Höhe
der Spannungsschwankung, die typischerweise in den globalen Bitleitungen 1120, 1121 erforderlich
ist, bestimmt werden.In a further aspect of the present invention is a sense amplifier 1100 provided by the latchtype with dynamic offset cancellation. The sense amplifier 1100 may also be useful as a global sense amplifier and is suitable for use in conjunction with hierarchical bitline scanning. Typically, the sensitivity of differential sense amplifiers may be limited by the offsets caused by inherent process variations for devices ("device matching") and by dynamic offsets that may develop in the input lines during high speed operation Amplifier offsets usually result in a corresponding reduction in the minimum bitline variation required for a reliable operation, and lower bitline variations can result in faster, lower energy memory operations 1100 For example, the offset in the bitlines may be through the three PMOS precharge balance transistors M3 1101 , M4 1102 , M5 1103 To get picked up; this arrangement is known to the person skilled in the art. Despite the precharge balance transistors 1101 - 1103 however, an additional offset may exist at the inputs of the latch. By using the PMOS balance transistor (M14) 1110 For example, an offset which may be present at the input of the latch-type differential sense amplifier can be substantially equalized. The sense amplifier 1100 has a batch sharing driver 1115 with limited variation. The global bitlines 1150 . 1151 be from the sense amplifier 1100 disconnected when the sense amplifier 1100 is not used, ie in a tri-state condition. The sense amplifier 1100 may be in a precharged state if the two input / output nodes are logic HIGH, ie if both PMOS drivers are M38 1130 and M29 1131 are switched off (inputs at logical HIGH). A large capacitor, C 0 1135 in the sense amplifier 1100 can be powered by two series-connected NMOS transistors, M37 1140 and M40 1141 , are held at substantially zero volts. The size of the capacitor 1135 may be due to the amount of voltage fluctuation that typically occurs in the global bitlines 1120 . 1121 is required to be determined.
Wenn
der Leseverstärker 1100 aktiviert
ist und die Bitleitungen 1150, 1151 logisch HIGH
sind, wird der PMOS Transistor M29 1131 angeschaltet, und
das globale Bit_n 1150 wird mit begrenzter Schwankung entladen.
Wenn ein abzutastendes Bit logisch LOW ist, wird der PMOS Transistor
M38 1130 angeschaltet, und das globale Bit 1151 wird
mit begrenzter Schwankung entladen. Dieses Schema gemeinsamer Ladung
kann zu sehr geringem Energieverbrauch führen, weil nur diejenige Ladung,
die die begrenzte Spannungsschwankung in den globalen Bitleitungen 1150, 1151 verursacht,
gegen Masse entladen wird. Dies bedeutet, dass es im wesentlichen
keinen „Überspannungsschutz-" Strom gibt. Des
weiteren kann dieser Aspekt der vorliegenden Erfindung bei Speichern
von Nutzen sein, bei denen die globalen Bitleitungen zur Eingabe
und Ausgabe gemultiplext werden.If the sense amplifier 1100 is activated and the bitlines 1150 . 1151 are logic high, the PMOS transistor M29 1131 turned on, and the global bit_n 1150 is discharged with limited fluctuation. When a bit to be sampled is logic low, the PMOS transistor becomes M38 1130 turned on, and the global bit 1151 is discharged with limited fluctuation. This common charge scheme can result in very low power consumption because only the charge that has the limited voltage swing in the global bitlines 1150 . 1151 caused to be discharged to ground. This means that there is essentially no "over-voltage protection" current Furthermore, this aspect of the present invention may be useful in memories in which the global bitlines are multiplexed for input and output.
Modulstufen-Speicher-Redundanz-ImplementierungModule-level memory redundancy implementation
In 12 weist
eine Speicherstruktur 1200, die aus hierarchischen funktionalen
Speichermodulen 1201 aufgebaut ist, vorzugsweise in jedem
Modul 1201 wenigstens eine oder mehrere redundante Speicherzeilen 1202, 1204,
eine oder mehrere redundante Speicherspalten 1205, 1208,
oder beides, auf. Es ist bevorzugt, dass die redundanten Speicherzeilen 1202, 1204 und/oder
-spalten 1206, 1208 gepaart sind, weil beobachtet
worden ist, dass Bitzellen-Versagen tendenziell paarweise auftritt.
Redundanz auf Modulebene kann, wie in 12 gezeigt
ist, wo Redundanz unter Verwendung einer vorgewählten Anzahl von redundanten
Speicherzeilen 1202, 1204 oder redundanten Speicherspalten 1206, 1208 in
dem Speichermodul 1201 implementiert ist, ein sehr bereichseffizienter
Ansatz sein, vorausgesetzt, dass die typische Anzahl von Bitzellen-Versagen
pro Modul gering bleibt. Dadurch, dass nur eine einzige Zeile 1202 oder
eine einzige Spalte 1206 oder beides in dem Speichermodul 1201 implementiert
wird, wird nur ein zusätzlicher
Multiplexer für
die jeweilige Zeile oder Spalte benötigt. Obwohl es einfacher sein
kann, redundante Speicherzellen-Schaltungen zur Verfügung zu
stellen, die während
des Testens des Produkts in der Herstellungsphase aktiviert werden
können,
kann es auch erwünscht
sein, ausgewählte
redundante Speicherzellen zu aktivieren, wenn das Speicherprodukt
im Einsatz ist, z.B. während
der Wartung oder während
des Betriebs des Produkts. Eine derartige Aktivierung kann durch
zahlreiche Techniken und Unterstützungsschaltungen,
die im Stand der Technik bekannt sind, durchgeführt werden.In 12 has a memory structure 1200 consisting of hierarchical functional memory modules 1201 is constructed, preferably in each module 1201 at least one or more redundant memory lines 1202 . 1204 , one or more redundant storage columns 1205 . 1208 , or both. It is preferred that the redundant memory lines 1202 . 1204 and / or columns 1206 . 1208 are paired because it has been observed that bit cell failure tends to occur in pairs. Redundancy at the module level can, as in 12 is shown where redundancy using a preselected number of redundant memory lines 1202 . 1204 or redundant storage columns 1206 . 1208 in the memory module 1201 is a very area-efficient approach, provided that the typical number of bit cell failures per module remains low. By doing that, only a single line 1202 or a single column 1206 or both in the memory module 1201 is implemented, only one additional multiplexer is needed for the particular row or column. While it may be simpler to provide redundant memory cell circuits that may be activated during testing of the product in the manufacturing phase, it may also be desirable to activate selected redundant memory cells when the memory product is in use, eg, during the Maintenance or during operation of the product. Such activation can be accomplished by numerous techniques and support circuits known in the art.
Speicherredundanz-Implementierung
mit redundantem ModulMemory redundancy implementation
with redundant module
Wie
in 13 gezeigt ist, kann die Speicherredundanz auch
durch Bereitstellen eines redundanten Moduls 1301 in der
Speicherstruktur 1300, die aus den primären Modulen 1304, 1305, 1306, 1307 aufgebaut
ist, implementiert werden. Das redundante Modul 1301 kann
ein Eins-zu-eins-Ersatz eines defekten primären Moduls, z.B. des Moduls 1304,
sein. Bei einem weiteren Aspekt der Erfindung kann das re dundante
Modul 1301 in kleinere redundante Speichersegmente 1310a–d aufgeteilt
sein, wobei jeweilige Segmente 13a–d als redundante Speicherzellen, z.B.
für jeweilige
Abschnitte primärer
Speichermodule 1304–1307,
die defekt sind, vorhanden sind. Die Anzahl der jedem Segment 1310a–d in
dem redundanten Speichermodul 1301 zugeteilten Speicherzellen
kann eine festgelegte Anzahl sein, oder sie kann flexibel zugeteilt
werden, um einer unterschiedlichen Anzahl defekter Speicherschaltungen
in jeweiligen primären
Speichermodulen 1304–1307 Rechnung
zu tragen.As in 13 As shown, memory redundancy may also be provided by providing a redundant module 1301 in the memory structure 1300 coming from the primary modules 1304 . 1305 . 1306 . 1307 is implemented. The redundant module 1301 may be a one-to-one replacement of a defective primary module, eg the module 1304 , be. In a further aspect of the invention, the re dundante module 1301 into smaller redundant memory segments 1310a-d be split, with respective segments 13a-d as redundant memory cells, eg for respective sections of primary memory modules 1304 - 1307 that are defective, are present. The number of each segment 1310a-d in the redundant memory module 1301 allocated memory cells may be a fixed number, or may be flexibly allocated to a different number of defective memory circuits in respective primary memory modules 1304 - 1307 Take into account.
Speicherredundanz-VorrichtungRedundant memory device
14 zeigt
einen weiteren Aspekt der vorliegenden Erfindung, der eine Implementierung
einer Zeilen- und Spaltenredundanz für eine Speicherstruktur, beispielsweise
die Speicherstruktur 100 in 1, oder
die Speicherstruktur 300 in 3, vorsieht.
Dieser Aspekt der vorliegenden Erfindung kann durch Verwenden von
Sicherungen implementiert werden, die, beispielsweise während der
Herstellung, programmiert werden können. Beispiele derartiger
Verwendungen umfassen Metallsicherungen, die elektrisch oder mittels
eines fokussierten Lasers, durchgebrannt werden, oder eine Doppel-Gate-Vorrichtung,
die dauerhaft programmiert sein kann. Obwohl die Technik angewendet
werden kann, um Zeilenredundanz oder Spaltenredundanz oder beides bereitzustellen,
wird sich die vorliegende Erörterung auf
Spaltenredundanz beziehen, bei der sowohl die Eingänge als
auch die Ausgänge
die Vorteile der Redundanz benötigen
können. 14 FIG. 12 shows another aspect of the present invention illustrating an implementation of row and column redundancy for a memory structure, such as the memory structure 100 in 1 , or the memory structure 300 in 3 , provides. This aspect of the present invention may be implemented by using fuses that may be programmed, for example during manufacture. Examples of such uses include metal fuses that are blown electrically or by a focused laser, or a dual-gate device that may be permanently programmed. Although the technique can be used to provide row redundancy or column redundancy, or both, the present discussion will refer to column redundancy in which both the inputs and the outputs may need the benefits of redundancy.
14 zeigt
eine Ausführungsform
dieses Aspekts der vorliegenden Erfindung, die vier Spaltenpaare 1402a–d mit
einem redundanten Paar 1404 aufweist. Es ist erwünscht, diesen
Aspekt der vorliegenden Erfindung in Form von Leitungspaaren zu
implementieren, da eine wesentliche Anzahl von RAM Versagen paarweise,
egal ob in Spalten oder Reihen, auftritt. Trotzdem sieht dieser
Aspekt der vorliegenden Erfindung auch Einzelleitungs-Redundanz
vor. Im allgemeinen kann die Anzahl der Sicherungen in dem Sicherungskasten 1403,
die verwendet wird, um Redundanz bereitzustellen, logarithmisch
zur Anzahl der Leitungspaare, z.B. der Spaltenpaare, in Bezug gesetzt
werden: log2 (Anzahl der Spaltenpaare),
wobei die Anzahl der Spaltenpaare auch die redundanten Paare enthält. Da Sicherungen
tendenziell groß sind,
sollte ihre Anzahl minimiert werden; somit ist die logarithmische
Beziehung von Vorteil. Die Sicherungs-Ausgänge 1405 werden in
die Decoder-Schaltungen 1406a–d eingespeist, z.B. ein
Sicherungs-Ausgang pro Spaltenpaar. Ein Sicherungs-Ausgang erzeugt
einen sogenannten „Schiebezeiger". Der Schiebezeiger
gibt das Shift Signal in dem redundant zu machenden Spaltenpaar
an und nachfolgende Spaltenpaare können dann inaktiviert werden.
Es ist erwünscht,
dass die Signale 1405 aus dem Sicherungskasten 1410 decodiert
werden, um ein Shift Signal 1412a–d in jedem Spaltenpaar
zu erzeugen. Wenn das Shift Signal 1412a–d für eine bestimmte Stelle des
Spaltenpaars 1402a–d ausgewählt ist,
wie sie von den Sicherungs-Signalen 1405 decodiert ist,
zeigt der Schiebezeiger 1412a–d auf diese Stelle. Die
Shift Signale für
diese Spalte und alle nachfolgenden Spalten rechts von der Spalte
des Paarschiebezeigers werden ebenfalls inaktiv. 14 shows an embodiment of this aspect of the present invention, the four column pairs 1402a-d with a redundant pair 1404 having. It is desirable to implement this aspect of the present invention in the form of pairs of lines, since a substantial number of RAM failures occur in pairs, whether in columns or rows. Nevertheless, this aspect of the present invention also provides single-line redundancy. In general, the number of fuses in the fuse box 1403 used to provide redundancy, logarithmically related to the number of pairs of lines, eg, the column pairs: log 2 (number of column pairs), where the number of column pairs also includes the redundant pairs. Since fuses tend to be large, their numbers should be minimized; thus, the logarithmic relationship is advantageous. The fuse outputs 1405 be in the decoder circuits 1406a-d fed, eg one fuse output per column pair. A fuse output produces a so-called "shift pointer." The shift pointer indicates the shift signal in the column pair to be made redundant, and subsequent column pairs can then be inactivated 1405 from the fuse box 1410 be decoded to a shift signal 1412a-d in each column pair. If the shift signal 1412a-d for a specific location of the column pair 1402a-d is selected as from the backup signals 1405 is decoded, the shift pointer shows 1412a-d to this place. The shift signals for this column and all subsequent columns to the right of the column shift pointer column also become inactive.
Dieser
Aspekt der vorliegenden Erfindung kann zusätzlich in 15A und 15B mittels
des vorgenannten Konzepts der „Schiebezeiger" gezeigt werden.
In 15A sind drei Spaltenpaare 1501, 1502, 1503 und
ein redundantes Spaltenpaar 1504 gezeigt. Das Schiebeverfahren
wird begrifflich mittels „Liniendiagrammen" angezeigt. Die oberen
Linien 1505–1508 der
Liniendiagramme sind repräsentativ für die Spalten 1501–1504 in
dem Speicherkern, während
die unteren Linienpaare 1509-1511 die Dateneingangs-/Datenausgangs-Paare
aus den Eingangs-/Ausgangs-Puffern sind. Wenn ein Shift Signal,
z.B. das Signal 1405 in 14, für ein bestimmtes
Spaltenpaar 1501–1503 logisch
LOW ist, ist es bevorzugt, dass die Daten in 1509-1511 mit
der jeweiligen Spalte 1501–1503, die sich direkt
darüber befindet,
durch Multiplexer verbunden werden. 15B zeigt
einen fehlerhaften Spaltenzustand. Wenn das Shift Signal logisch
HIGH ist, z.B. das Signal 1405 in 14, wird
eine fehlerhafte Spalte angezeigt, z.B. Spalte 1552. Die
aktiven Spalten 1550, 1551 bleiben fehlerfrei
und empfangen ihre Daten weiterhin über die Eingangs-/Ausgangs-Leitungen 1554, 1555.
Da jedoch die Spalte 1552 fehlerhaft ist, können Daten
von dem Eingangs-/Ausgangs-Puffer 1556 auf das redundante
Spaltenpaar 1553 gemultiplext werden. Im Diagramm erscheint
es so, dass in die Speicherkernspalten eingehende Daten nach links
verschoben werden, während
aus den Speicherkernspalten ausgehende Daten nach rechts verschoben
werden. Durch Einstellen der Stellung des Schiebezeigers, die im
allgemeinen durch den Zustand der Sicherungen bestimmt wird, kann
das nicht benutzte redundante Spaltenpaar so verschoben werden,
dass es mit einer nicht funktionalen Spalte, z.B. der Spalte 1552,
zusammenfällt,
und so den Spaltendefekt repariert, wodurch der volle funktionale
Speicherertrag erhöht
wird.This aspect of the present invention can be additionally described in 15A and 15B by means of the aforementioned concept of the "shift pointers" 15A are three column pairs 1501 . 1502 . 1503 and a redundant column pair 1504 shown. The shift method is conceptually indicated by "line diagrams." The upper lines 1505 - 1508 The line charts are representative of the columns 1501 - 1504 in the memory core, while the bottom line pairs 1509 - 1511 the data input / output pairs are from the input / output buffers. If a shift signal, eg the signal 1405 in 14 , for a specific column pair 1501 - 1503 logical is LOW, it is preferable that the data is in 1509 - 1511 with the ever right column 1501 - 1503 which is located directly above, be connected by multiplexer. 15B shows a faulty column state. If the shift signal is logically HIGH, eg the signal 1405 in 14 , a faulty column is displayed, eg column 1552 , The active columns 1550 . 1551 remain error-free and continue to receive their data through the input / output lines 1554 . 1555 , However, because the column 1552 is erroneous, data may be from the input / output buffer 1556 to the redundant column pair 1553 be multiplexed. In the chart, it appears that data entering the memory core columns is shifted to the left while data leaving the memory core columns is shifted to the right. By adjusting the position of the shift pointer, which is generally determined by the state of the fuses, the unused redundant column pair may be shifted to a non-functional column, eg, the column 1552 , collapses, thus repairing the gap defect, thereby increasing the full functional storage yield.
Auswähleinrichtung für redundante
SpeicherschaltungenSelector for redundant
memory circuits
16 zeigt
einen weiteren Aspekt der vorliegenden Erfindung, bei dem die Auswähleinrichtung 1600 eine
Form von Redundanz bereitstellen kann. Die Auswähleinrichtung 1600 kann
eine primäre
Decoder-Schaltung 1605 aufweisen, die ein globaler Wortleitungs-Decoder
sein kann, der mit einem Multiplexer 1610 gekoppelt ist.
Der Multiplexer 1610 kann durch eine Redundanzschaltung 1620 aktiviert werden,
die ein Sicherungssystem, ein programmierbarer Speicher oder eine
andere Schaltung sein kann, die ein Aktivierungssignal 1630 über den
Multiplexer 1610 an die Auswähleinrichtung 1600 bereitstellen
kann. Die Auswähleinrichtung 1600 ist
zur Implementierung von Redundanz auf Modulebene geeignet, wie diejenige,
die in Bezug auf das Modul 1200 in 12 beschrieben
ist, die für
eine gegebene Implementierung Zeilenredundanz oder Spaltenredundanz
sein kann. Im normalen Betriebsablauf wird das Eingangs-Wortleitungssignal 1650 in
der Decoder-Schaltung 1605 decodiert und, wenn in der lokalen
Wortleitung 1670 kein Fehler vorliegt, wird das Wortleitungssignal
an die erste lokale Leitung 1680 weitergeleitet. Falls
ein Fehler entdeckt wird, wählt
der Multiplexer 1610 die zweite lokale Leitung 1660 aus,
die vorzugsweise eine redundante Wortleitung ist. 16 shows a further aspect of the present invention, wherein the selector 1600 can provide some form of redundancy. The selector 1600 can be a primary decoder circuit 1605 which may be a global wordline decoder connected to a multiplexer 1610 is coupled. The multiplexer 1610 can through a redundancy circuit 1620 can be activated, which may be a backup system, a programmable memory or other circuitry that generates an activation signal 1630 over the multiplexer 1610 to the selector 1600 can provide. The selector 1600 is suitable for implementing module-level redundancy, such as the one related to the module 1200 in 12 which, for a given implementation, may be row redundancy or column redundancy. In normal operation, the input wordline signal becomes 1650 in the decoder circuit 1605 decoded and, if in the local wordline 1670 If there is no error, the word line signal goes to the first local line 1680 forwarded. If an error is detected, the multiplexer selects 1610 the second local line 1660 which is preferably a redundant word line.
Schneller
Decoder mit ZeilenredundanzMore quickly
Decoder with line redundancy
17 zeigt
eine bevorzugte Ausführungsform
der Auswähleinrichtung 1600 in 16 in
Form des Decoders 1700 mit Zeilenredundanz, wie er in einer
hierarchischen Speicherumgebung realisiert ist. Der Decoder 1700 kann
zur Implementierung von Redundanz auf Modulebene, wie derjenigen,
die in Bezug auf das Modul 1200 in 12 beschrieben
ist, besonders geeignet sein. Der globale Decoder 1700 kann ähnlich wie
der asynchron zurücksetzbare
Decoder 800 der 8 arbeiten. Im allgemeinen kann der
Decoder 1700 mit einer ersten, gewünschten Speicherzeile und einer
zweiten, alternativen Speicherzeile gekoppelt sein. Obwohl die zweite
Zeile eine physikalische Zeile neben der ersten Speicherzeile sein
kann, und eine weitere der ursprünglich
gewünschten
Zeilen des Speichermoduls, kann die zweite Zeile auch eine redundante
Zeile sein, die in dem Modul implementiert ist. Obwohl der Zeilen-Decoder 1700 bei
normalen Operationen die erste Speicherzeile decodiert, kann er
auch die zweite Speicherzeile im Ansprechen auf ein Signal zum Auswählen einer
alternativen Zeile auswählen
und decodieren. Wenn die zweite Zeile eine redundante Zeile ist, kann
es geeigneter sein anzunehmen, dass das Auswählsignal ein Signal zum „Auswählen einer
redundanten Zeile" ist.
Die vorgenannten Zeilen-Auswählsignale
sind als Eingänge 1701 und 1702 dargestellt. 17 shows a preferred embodiment of the selector 1600 in 16 in the form of the decoder 1700 with row redundancy, as implemented in a hierarchical storage environment. The decoder 1700 can be used to implement module-level redundancy, such as those related to the module 1200 in 12 described, be particularly suitable. The global decoder 1700 can be similar to the asynchronously resettable decoder 800 of the 8th work. In general, the decoder 1700 be coupled to a first, desired memory line and a second, alternative memory line. Although the second row may be a physical row next to the first memory row and another of the originally desired rows of the memory module, the second row may also be a redundant row implemented in the module. Although the line decoder 1700 during normal operations, decodes the first memory line, it may also select and decode the second memory line in response to a signal to select an alternative line. If the second row is a redundant row, it may be more appropriate to assume that the select signal is a signal for "selecting a redundant row." The aforementioned row select signals are inputs 1701 and 1702 shown.
Wenn
daher der Eingang 1701 oder 1702 aktiviert wird, überträgt der Decoder 1700 das
lokale Wortleitungs-Signal, das normalerweise auf WL 1706 ausgegeben
wird, so, dass es auf xL_Next 1705 ausgegeben wird, das
mit einer benachbarten Wortleitung gekoppelt ist. Im allgemeinen
werden, wenn ein Wortleitungs-Decoder, der sich an einer bestimmten Stelle
in einem Speichermodul befindet, ein Shift Signal empfängt, die
nach diesem Decoder verbleibenden Decoder ebenfalls verschoben,
so dass der letzte Decoder in der Reihe seine jeweiligen WL-Daten zu
einer redundanten Wortleitung verschiebt. Bei Verwendung eines zweidimensional
aufgebauten Modells kann, wenn sich eine redundante Zeile an der
unteren Position eines Modells befindet, dieser Prozess so beschrieben
werden, dass ein Fehler an einer bestimmten Stelle eine Verschiebung
aller lokalen Wortleitungen an und unterhalb der Position des Fehlers
nach unten bewirkt. Die lokalen Wortleitungen oberhalb der Position
des Fehlers können
unverändert
bleiben.If therefore the entrance 1701 or 1702 is activated, transmits the decoder 1700 the local wordline signal normally on WL 1706 is issued, so that it is on xL_Next 1705 is output, which is coupled to an adjacent word line. In general, when a wordline decoder located at a particular location in a memory module receives a shift signal, the decoder remaining after that decoder also shifts, so that the last decoder in the row shuffles its respective WL data Redundant word line shifts. Using a two-dimensional model, if a redundant row is at the bottom of a model, that process may be described as an error at a particular location causing all local wordlines to shift at and below the position of the error down. The local word lines above the position of the error can remain unchanged.
Hybride Singale Port und
Dual Port (R/W) FunktionalitätHybrid Singale Port and
Dual Port (R / W) functionality
Implementierungen
hierarchischer Speichermodule führen
zu wesentlicher Zeitersparnis, die teilweise der lokalisierten Funktionalität zu verdanken ist.
Die Signalfortpflanzungszeit an der lokalen Modulstufe ist tendenziell
wesentlich geringer als die typische Zugriffszeit einer größeren Speicherstruktur, obwohl
diese bestehende Seiten-, Bank- und Segmentspeicherarray- und Registerfile-Schemata anwendet.
Tatsächlich
können
sowohl Lese- als auch Schreib-Operationen, die auf der Grundmodulstufe durchgeführt werden,
innerhalb eines Bruchteils der Gesamtspeicherstrukturzugriffszeit
stattfinden. Des weiteren sind, weil das erfindungsgemäße Bitleitungs-Abtasten
energiesparend ist und zu keinem wesentlichen Abfall von Vorladungsspannungen führt, die
Bitleitungs-Spannungspegel nach einer Operation tendenziell marginal
erniedrigt. Als Folge hiervon ist es bei bestimmten bevorzugten
Ausführungsformen
der vorliegenden Erfindung möglich, zwei
Operationen direkt hintereinander ohne intervenierenden Vorladungszyklus
durchzuführen,
und zwar innerhalb eines einzigen Zugriffszyklusses der Gesamtspeicherstruktur.
Daher funktionien, obwohl eine Speichervorrichtung als Single Port
Vorrichtung ausgestaltet sein kann, eine bevorzugte Ausführungsform
des Speichermoduls ähnlich
einer Two Port Speichervorrichtung, was einer derartigen Ausführungsform
einen beträchtlichen
Vorteil gegenüber Speicherstrukturen
des Standes der Technik mit vergleichbarer Gesamtspeichergröße verleihen
kann.Hierarchical memory module implementations lead to significant time savings, due in part to localized functionality. The signal propagation time at the local module stage tends to be significantly less than the typical access time of a larger memory structure, even though it uses existing page, bank, and segment memory array and register file schemes. In fact, both read and write operations performed at the basic module level can be done within a fraction of the Total memory structure access time take place. Furthermore, because bit line sampling in accordance with the present invention is energy efficient and does not result in any significant drop in precharge voltages, the bit line voltage levels tend to be marginally lowered after operation. As a result, in certain preferred embodiments of the present invention, it is possible to perform two operations directly in succession without an intervening precharge cycle, within a single access cycle of the overall memory structure. Therefore, although a memory device may be configured as a single-port device, a preferred embodiment of the memory module functions similar to a two-port memory device, which can give such an embodiment a significant advantage over prior art memory structures of comparable total memory size.
18 zeigt
eine bestimmte Ausführungsform
dieses Aspekts der vorliegenden Erfindung in der Speicherstruktur 1800,
bei der sowohl lokales Bitleitungs-Abtasten als auch lokales Wortleitungs-Decodieren
verwendet werden, wie oben beschrieben ist. Die Speicherstruktur 1800 weist
das Speichermodul 1805 auf, das mit dem lokalen Wortleitungs-Decoder 1815 und
dem lokalen Bitleseverstärker 1820 gekoppelt
ist. In dem Speichermodul 1805 befindet sich eine vordefinierte
Anzahl von Speicherzellen, beispielsweise die Speicherzelle 1825,
die über
die lokale Wortleitung 1810 mit dem lokalen Wortleitungs-Decoder 1815 und über die
lokalen Bitleitungen 1830 mit dem lokalen Bitleseverstärker 1820 gekoppelt
ist. Bei der typischen Single Port Funktionalität werden die lokalen Bitleitungen 1830 sowohl
vor den READ- als auch vor den WRITE-Operationen vorgeladen. Während einer
typischen READ-Operation aktiviert der Predecoder 1835 den
entsprechenden globalen Wortleitungs-Decoder 1840, der
wiederum den lokalen Wortleitungs-Decoder 1815 aktiviert.
Sobald der lokale Wortleitungs-Decoder 1815 feststellt,
dass die assoziierte Speicherzelle 1826 auszuwerten ist, öffnet er
die Speicherzelle 1825 für die Auswertung und aktiviert
den lokalen Bitleseverstärker 1820.
Am Ende der lokalen Abtastperiode gibt der lokale Bitleseverstärker 1820 den
abgetasteten Datenwert auf die globalen Bitleitungen 1845 aus. Nachdem
der globale Leseverstärker 1850 den
Datenwert abgetastet hat, werden die Daten an den Eingangs-/Ausgangs-Puffer 1855 ausgegeben.
Wenn der READ-Operation eine WRITE-Operation folgen soll, würde eine
typische Single Port Vorrichtung eine weitere Vorladungs-Operation
durchführen,
bevor die WRITE-Operation beginnen kann. 18 shows a specific embodiment of this aspect of the present invention in the memory structure 1800 in which both local bit line scanning and local word line decoding are used as described above. The memory structure 1800 has the memory module 1805 on top of that with the local wordline decoder 1815 and the local bit sense amplifier 1820 is coupled. In the memory module 1805 There is a predefined number of memory cells, for example the memory cell 1825 passing through the local wordline 1810 with the local word line decoder 1815 and over the local bitlines 1830 with the local bit sense amplifier 1820 is coupled. The typical single-port functionality becomes the local bitlines 1830 preloaded before the READ and WRITE operations. During a typical READ operation, the Predecoder activates 1835 the corresponding global wordline decoder 1840 which in turn is the local wordline decoder 1815 activated. Once the local wordline decoder 1815 determines that the associated memory cell 1826 is to be evaluated, he opens the memory cell 1825 for the evaluation and activates the local bit sense amplifier 1820 , At the end of the local sampling period, the local bit sense amplifier outputs 1820 the sampled data value on the global bit lines 1845 out. After the global sense amplifier 1850 sampled the data value, the data is sent to the input / output buffer 1855 output. If the READ operation is to be followed by a WRITE operation, a typical single port device would perform another precharge operation before the WRITE operation can begin.
Bei
dieser bestimmten Ausführungsform
der Dual Port Funktionalität
kann der Predecodierungs-Schritt einer nachfolgenden WRITE-Operation im
wesentlichen unmittelbar nachdem der lokale Bitleitungs-Leseverstärker 1820 die
Auswertung der Speicherzelle 1825 beendet hat, beginnen,
d.h. zu Beginn des Abtast-Zyklusses für den globalen Leseverstärker 1850 und
bevor die Daten für
den Eingangs-/Ausgangs-Puffer 1855 verfügbar sind.
Daher kann, während
der Periode, die die Operation des globalen Leseverstärkers 1850 und
des Eingangs-/Ausgangs-Puffers 1855 umfasst, und während die
READ-Operation noch im Gange ist, der Predecoder 1835 die
Adresssignale für
eine nachfolgende WRITE-Operation empfangen und decodieren und den
globalen Wortleitungs-Decoder 1840 entsprechend aktivieren.
Der globale Wortleitungs-Decoder 1840 wiederum aktiviert
die lokale Wortleitung 1815 im Vorgriff auf die bevorstehende
WRITE-Operation. Sobald die Daten aus dem Eingangs/Ausgangs-Puffer 1855 ausgelesen
sind, können
die neuen mit dem WRITE-Zyklus assoziierten Daten zu dem Eingangs-/Ausgangs-Puffer 1855 zugelassen werden
und unverzüglich
ohne einen vorherigen Vorladungs-Zyklus z.B. in die Speicherzelle 1825 geschrieben
werden. Um die Speicheradressen für diese READ- und WRITE-Operationen auf eine
Art und Weise bereitzustellen, die dieser Ausführungsform der Erfindung entspricht,
ist es bevorzugt, dass der Taktzyklus des Predecoders 1810 schneller
ist als der Zugriffszyklus der Gesamtspeicherstruktur 1800. Es
kann beispielsweise erwünscht
sein, den Predecodierungs-Taktzyklus so anzupassen, dass er ungefähr das Doppelte,
oder eventuell mehr als das Doppelte, des nominalen Zugriffszyklus
für die
Struktur 1800 ist. Auf diese Art und Weise kann eine PRECHARGE-WRITE-READ-Operation
auf derselben Speicherzelle in demselben Speichermodul in weniger
als einem Zugriffszyklus durchgeführt werden, wodurch Dual Port
Funktionalität
aus einer Single Port Vorrichtung erhalten wird. Es ist auch vorgesehen,
dass die vorgenannte Ausführungsform
drei oder mehr Operationen in einem einzigen Zugriffszyklus realisieren
kann, wenn es die nicht verbrauchte Zeit während eines Zugriffszyklusses
erlaubt.In this particular embodiment of the dual-port functionality, the predecoding step of a subsequent WRITE operation may occur substantially immediately after the local bit-line sense amplifier 1820 the evaluation of the memory cell 1825 begin, ie at the beginning of the sample cycle for the global sense amplifier 1850 and before the data for the input / output buffer 1855 Are available. Therefore, during the period, the operation of the global sense amplifier 1850 and the input / output buffer 1855 and while the READ operation is still in progress, the Predecoder 1835 receive and decode the address signals for a subsequent WRITE operation and the global wordline decoder 1840 activate accordingly. The global wordline decoder 1840 in turn activates the local wordline 1815 in anticipation of the upcoming WRITE operation. Once the data from the input / output buffer 1855 can read out the new data associated with the WRITE cycle to the input / output buffer 1855 be admitted and immediately without a previous precharge cycle eg in the memory cell 1825 to be written. In order to provide the memory addresses for these READ and WRITE operations in a manner consistent with this embodiment of the invention, it is preferred that the clock cycle of the predecoder 1810 faster than the access cycle of the overall memory structure 1800 , For example, it may be desirable to adjust the predecode clock cycle to be approximately twice, or possibly more than twice, the nominal access cycle for the structure 1800 is. In this way, a PRECHARGE WRITE READ operation can be performed on the same memory cell in the same memory module in less than one access cycle, thereby providing dual port functionality from a single port device. It is also envisaged that the above embodiment can realize three or more operations in a single access cycle if it allows the unused time during an access cycle.
Zufällig ist
die oben beschriebene verbesserte Funktionalität insbesondere für große Speicherstrukturen
mit vergleichsweise kleinen einzelnen Modulen geeignet, bei denen
der Unterschied zwischen globalen und lokalen Zugriffszeiten ausgeprägter ist. Außerdem kann,
in Umgebungen, in denen Verzögerungen
aufgrund von Signalfortpflanzung über Zwischenverbindungen und
Signalfortpflanzungs-Verzögerungen
durch miteingebettete logische Bauteile zu ausreichender Leerlaufzeit
für eine
Speicherstruktur führen,
diese verbesserte Funktionalität
vorteilhafterweise von sonst „verschwendeter" Zeit Gebrauch machen.Is random
the improved functionality described above, especially for large memory structures
suitable with comparatively small individual modules in which
the difference between global and local access times is more pronounced. In addition,
in environments where delays
due to signal propagation via interconnections and
Signal propagation delays
by embedded embedded logical components to sufficient idle time
for one
Lead storage structure,
this improved functionality
advantageously make use of otherwise "wasted" time.
19 zeigt
eine hochgenaue Verzögerungsmessschaltung
(High Precision Delay Measurement; HPDM) 1900 gemäß einem
Aspekt der vorliegenden Erfindung, die Zeitmessungen von weniger als
einer einzigen Gateverzögerung
in Bezug auf die zugrundeliegende Technik bereitstellen kann. Dies können beispielsweise
Messungen von Signalverzögerungen
und -perioden, Impulsweiten, Taktskews, etc. sein. Die HPDM-Schaltung 1900 kann
auch Impuls-, Auslöse-
und Timing-Signale für
andere Schaltungen, einschließlich
Leseverstärker,
Wortleitungs-Decoder, Taktvorrichtungen, Synchronizer, Automaten,
etc. bereitstellen. In der Tat ist die HPDM-Schaltung 1900 eine
Messschaltung von breiter Anwendbarkeit. Die HPDM-Schaltung 1900 kann beispielsweise
in einem Hochleistungs-Mikroprozessor implementiert sein, bei dem
genaue Messungen von internen Zeitintervallen, möglicherweise in der Größenordnung
von einigen Picosekunden, sehr schwierig sein können, wenn Geräte außerhalb
des Mikroprozessors verwendet werden. Die HPDM-Schaltung 1900 kann
verwendet werden, um Skew zwischen Signalen präzise zu messen, und kann somit
auch verwendet werden, um gemessene Skew-Intervalle einzuführen oder
zu eliminieren. Die HPDM-Schaltung 1900 kann auch verwendet
werden, um die Signale einzelner Bauteile, die nicht oder schlecht
zusammenpassende Bauteile sein können, zu
charakterisieren, und um solche Bauteile im wesentlichen zu synchronisieren.
Des weiteren kann die HPDM-Schaltung 1900 vorteilhafterweise
in Registerfiles, Transceivern, adaptiven Schaltungen und einer
Myriade weiterer Anwendungen verwendet werden, bei denen präzise Intervallmessung
per se erwünscht
ist, sowie im Zusammenhang mit dem Anpassen des Verhaltens von Bauteilen,
Schaltungen und Systemen im Ansprechen auf diese gemessenen Intervalle. 19 shows a High Precision Delay Measurement (HPDM) 1900 in accordance with one aspect of the present invention, the time measurements are less as a single gate delay with respect to the underlying technique. These may be, for example, measurements of signal delays and periods, pulse widths, clock skews, etc. The HPDM circuit 1900 may also provide pulse, trigger, and timing signals to other circuits, including sense amplifiers, word line decoders, clocks, synchronizers, automata, etc. In fact, the HPDM circuit is 1900 a measuring circuit of wide applicability. The HPDM circuit 1900 For example, it can be implemented in a high performance microprocessor, where accurate measurements of internal time intervals, possibly on the order of a few picoseconds, can be very difficult when using devices outside the microprocessor. The HPDM circuit 1900 can be used to precisely measure skew between signals, and thus can also be used to introduce or eliminate measured skew intervals. The HPDM circuit 1900 can also be used to characterize the signals of individual components, which may be mismatched or mismatched components, and to substantially synchronize such components. Furthermore, the HPDM circuit 1900 advantageously used in register files, transceivers, adaptive circuits and a myriad of other applications where precise interval measurement per se is desired, as well as in the context of adjusting the behavior of components, circuits and systems in response to these measured intervals.
Vorteilhafterweise
kann die HPDM-Schaltung 1900 so gestaltet sein, dass sie
auf Betriebsspannungs-, Design- und Verfahrensvariationen, Gestaltungsregeln,
etc. in Bezug auf die zugrundeliegende Technologie anspricht, einschließlich, jedoch nicht
beschränkt
auf bipolare, nMOS, CMOS, BiCMOS und GaAs-Technologien. Daher wird
eine HPDM-Schaltung 1900, die so gestaltet ist, dass sie Intervalle
in Bezug auf eine 1,8 Mikron Technologie genau misst, im Betrieb
so skaliert, dass sie Intervalle in Bezug auf die 1,8 Mikron Technologie
genau misst. Obwohl die HPDM-Schaltung 1900 so
angepasst werden kann, dass sie feste Zeitintervalle misst und somit
unabhängig
von Verfahrensvariationen, Gestaltungsregeln, etc. bleibt, ist es
bevorzugt, dass die HPDM-Schaltung 1900 auf die Technologie
und Gestaltungsregeln, die gegeben sind, ansprechen darf. Im allgemeinen
kann der Kern einer effektiven HPDM-Schaltung, die Intervalle in
der Größenordnung
von Picosekunden messen kann, nur einige wenige Transistoren benötigen, die
eine minimale Grundfläche
besetzen. Dies steht in starkem Kontrast zu ihrem Gegenstück in der
menschlichen Domäne,
d.h. einem teueren, hochgenauen, in der Hand zu haltenden elektronischen
Testgerät
oder Werkbank-Gerät.Advantageously, the HPDM circuit 1900 be designed to address operating voltage, design and process variations, design rules, etc., in relation to the underlying technology, including, but not limited to, bipolar, nMOS, CMOS, BiCMOS and GaAs technologies. Therefore, an HPDM circuit 1900 Designed to accurately measure intervals relative to a 1.8 micron technology, it scales in operation to accurately measure intervals with respect to 1.8 micron technology. Although the HPDM circuit 1900 can be adapted to measure fixed time intervals and thus remains independent of process variations, design rules, etc., it is preferred that the HPDM circuit 1900 to address the technology and design rules that are given. In general, the core of an effective HPDM circuit that can measure intervals on the order of picoseconds may require only a few transistors occupying a minimum footprint. This contrasts sharply with its counterpart in the human domain, ie, an expensive, highly accurate, handheld electronic test device or workbench device.
Ein
Merkmal der HPDM-Schaltung 1900 ist der modifizierte Ringoszillator 1905.
Wie in der Technik der Ringoszillatoren bekannt ist, ist die Oszillationsperiode
T0 eines Ringoszillators mit N Stufen ungefähr gleich
2NTD, wobei TD die
große
Signalverzögerung
des Gates/Inverters jeder Stufe ist. Die vorgegebene Oszillationsperiode
T0 kann durch Auswählen der Anzahl von Gates,
die in dem Ringoszillator verwendet werden sollen, gewählt werden.
Im allgemeinen ist TD eine Funktion der
Anstiegs- und Fallzeiten, die mit einem Gate assoziiert sind, die
wiederum zu den zugrundeliegenden Parametern, einschließlich z.B.
Gatetransistorgeometrieen und Herstellungsverfahren, in Bezug stehen.
Diese Parameter sind so manipulierbar, dass TD so
eingestellt werden kann, dass es eine vorgegebene Gateverzögerungszeit
liefert. Bei einer bevorzugten Ausführungsform der vorliegenden
Erfindung im Zusammenhang mit einer spezifischen Ausführungsform
einer hierarchischen Speicherstruktur ist es erwünscht, dass die Parameter zu
einer CMOS-Vorrichtungs-Implementierung in Bezug stehen, die 0,18
Mikron (μm)
Gestaltungsregeln verwendet. Ein Fachmann erkennt jedoch, dass die
HPDM-Schaltung 1900 nicht hierauf beschränkt ist
und auch in anderen Technologien, einschließlich, jedoch nicht beschränkt auf,
bipolare, nMOS, CMOS, BiMOS, GaAs und SiGe Technologien, angewandt
werden kann, ungeachtet der Gestaltungsregeln und ungeachtet, ob
auf Si-Substrat, SOI und dessen Varianten, etc. implementiert oder
nicht.A feature of the HPDM circuit 1900 is the modified ring oscillator 1905 , As is known in the art of ring oscillators, the oscillation period T 0 of an N-ring oscillator is approximately equal to 2NT D , where T D is the large signal delay of the gate / inverter of each stage. The predetermined oscillation period T 0 can be selected by selecting the number of gates to be used in the ring oscillator. In general, T D is a function of the rise and fall times associated with a gate, which in turn relate to the underlying parameters, including, for example, gate transistor geometries and fabrication techniques. These parameters are manipulable so that T D can be set to provide a given gate delay time. In a preferred embodiment of the present invention, in the context of a specific embodiment of a hierarchical memory structure, it is desirable that the parameters be related to a CMOS device implementation using 0.18 micron (μm) design rules. However, a person skilled in the art recognizes that the HPDM circuit 1900 is not limited thereto and may be applied in other technologies including, but not limited to, bipolar, nMOS, CMOS, BiMOS, GaAs and SiGe technologies, regardless of the design rules and regardless of whether on Si substrate, SOI and its variants , etc. implemented or not.
Obwohl
die beispielhafte HPDM-Schaltung 1900 einen Ringoszillator 1905 mit
sieben (7) Stufen verwendet, können,
abhängig
von der gewünschten Oszillationsfrequenz,
mehr oder weniger Stufen verwendet werden. In diesem Beispiel weist
der Ringoszillator 1905 das NAND-Gate 1910 auf,
dessen Ausgang als Ausgang 1920 der ersten Stufe bezeichnet wird,
und sechs Inverter-Gates 1911–1916, deren Ausgänge 1921–1926 jeweils
als Ausgänge
der zweiten bis siebten Stufe bezeichnet werden.Although the exemplary HPDM circuit 1900 a ring oscillator 1905 used with seven (7) stages, more or fewer stages can be used, depending on the desired oscillation frequency. In this example, the ring oscillator points 1905 the NAND gate 1910 on, whose output as output 1920 the first stage is called, and six inverter gates 1911 - 1916 whose outputs 1921 - 1926 are each referred to as outputs of the second to seventh stage.
Zusätzlich zu
dem Ringoszillator 1905 kann die HPDM-Schaltung 1900 Speicherelemente 1930-1937 aufweisen,
die jeweils mit einer vorgewählten
Oszillatorstufe gekoppelt sind. Die Auswahl und die Anordnung der
Speicherelemente 1930-1937 ermöglichen
die Messung eines minimalen Zeitquantums TL,
das genau etwa die Hälfte
einer Gateverzögerung
ist, d.h. TL ≈ TD/2.
Die maximale Zeitdauer, TM, die von der
HPDM-Schaltung 1900 brauchbar gemessen werden kann, ist
durch Auswählen
einer oder mehrerer Vorrichtungen, oder Zähler, bestimmbar, um die Anzahl
der Oszillationszyklen, die seit der Aktivierung des Oszillators 1905 durchgeführt worden
sind, im Auge zu behalten, beispielsweise durch das ENABLE-Signal 1940.
Wenn der ausgewählte Zähler eine
einzige 3-Bit-Vorrichtung ist, können
beispielsweise bis zu acht (8) vollständige Zyklen durch den Oszillator 1905 ermittelt
werden, wobei jeder Zyklus in T0 Zeit vollendet
wird. Wenn man den einzigen 3-Bit-Zähler als Beispiel nimmt, ist
somit TM ≈ 8T0. Die verbleibenden Speicherelemente 1932-1937 können verwendet
werden, um während
eines bestimmten Oszillationszyklusses den Zeitpunkt anzuzeigen,
an dem das ENABLE-Signal 1940 deaktiviert worden ist, was
durch die Überprüfung der
jeweiligen Zustände gegebener
Speicherelemente 1932–1937 nach
der Deaktivierung des Oszillators 1905 bestimmt wird.In addition to the ring oscillator 1905 can the HPDM circuit 1900 storage elements 1930-1937 each coupled to a preselected oscillator stage. The selection and arrangement of memory elements 1930 - 1937 allow the measurement of a minimum time quantum T L , which is exactly half the gate delay, ie T L ≈ T D / 2. The maximum time duration, T M , of the HPDM circuit 1900 can be conveniently measured by selecting one or more devices, or counters, to determine the number of oscillation cycles that have elapsed since the activation of the oscillator 1905 be kept in mind, for example by the ENABLE signal 1940 , If the selected counter is a single 3-bit device, at For example, up to eight (8) complete cycles through the oscillator 1905 are determined, each cycle in T 0 time is completed. Taking the single 3-bit counter as an example, T M ≈ 8T 0 . The remaining storage elements 1932 - 1937 can be used to indicate the time at which the ENABLE signal occurs during a particular oscillation cycle 1940 has been deactivated, which by checking the respective states of given memory elements 1932 - 1937 after deactivating the oscillator 1905 is determined.
Es
ist bei der HPDM-Schaltung 1900 bevorzugt, dass ein k-Bit
positiv flankengetriggerter Zähler (PET) 1930 und
ein k-Bit negativ flankengetriggerter Zähler (NET) 1931 mit
dem Ausgang der ersten Stufe 1920 gekoppelt sind. Des weiteren
ist es bevorzugt, dass ein dual flankengetriggerter Zähler (DET) 1932–1937 mit
jeweiligen Ausgängen 1921–1925 des
Oszillators 1905 gekoppelt ist. Bei einer bestimmten Ausführungsform
der Erfindung sind PET 1930 und NET 1931 so gewählt, dass
sie jeweils drei-Bit Zähler
(d.h. k = 3) sind, und DET 1932–1937 sind so gewählt, dass
sie jeweils ein-Bit Zähler
(Latches) sind. Ein Vorteil der Verwendung von Dualflanken-Ermittlung
in den Zählern 1932–1937 ist
es, dass die Flanke eines bestimmten Oszillationssignals, das sich
durch den Ringoszillator 1905 fortpflanzt, in allen Stu fen
registriert werden kann, und dass die Position des Oszillationssignals
zu einer bestimmten Zeit daraus ermittelt werden kann. Da ein sich
fortpflanzendes Oszillationssignal seine Polarität während der sequentiell folgenden
Durchgänge
durch den Ringoszillator 1905 ändert, ist es bevorzugt, sowohl
die NET-Schaltung 1930 als auch die PET-Schaltung 1931 zu
verwenden, und es ist bevorzugt, dass die negative Flanke eines
bestimmten Oszillationssignals als Abschluss des ersten Schleifenereignisses, oder
Zyklusses, durch den Ringoszillator 1905 abgetastet wird.It's at the HPDM circuit 1900 prefers that a k-bit positive edge-triggered counter (PET) 1930 and a k-bit negatively edge-triggered counter (NET) 1931 with the output of the first stage 1920 are coupled. Furthermore, it is preferred that a dual edge-triggered counter (DET) 1932 - 1937 with respective outputs 1921 - 1925 of the oscillator 1905 is coupled. In a particular embodiment of the invention are PET 1930 and NET 1931 selected to be three-bit counters (ie, k = 3), and DET 1932 - 1937 are chosen so that they are each one-bit counters (latches). An advantage of using dual-edge detection in the counters 1932 - 1937 it is that the flank of a particular oscillation signal, passing through the ring oscillator 1905 can be registered in all Stu fen, and that the position of the oscillation signal can be determined at a certain time from it. Since a propagating oscillation signal has its polarity during the sequential passes through the ring oscillator 1905 changes, it is preferable to both the NET circuit 1930 as well as the PET circuit 1931 and it is preferred that the negative edge of a particular oscillation signal be the completion of the first loop event, or cycle, by the ring oscillator 1905 is scanned.
Die
Operation der HPDM-Schaltung 1900 kann folgendermaßen zusammengefasst
werden: mit dem auf HIGH eingestellten EnableL-Signal 1904 befindet
sich der Ringoszillator 1905 im STATIC-Modus, so dass das
Setzen des ResetL-Signals 1906 auf LOW die Zähler 1930–1937 zurücksetzt.
Das Setzen des StartH-Signals 1907 auf HIGH setzt den RS-Flip-Flop 1908,
der wiederum den Ringoszillator 1905 durch Weiterleiten
eines Oszillationssignals in den ACTIVE-Modus setzt. Jede Flanke
des Oszillationssignals kann durch Identifizieren der Schaltaktivität bei jedem
Stufenausgang 1920–1926 verfolgt werden.
PET 1930 und NET 1931, die den Ausgang 1920 der
ersten Stufe abtasten, identifizieren und zählen die Schleifenereignisse.
Es ist bevorzugt, dass die maximale zu messende Verzögerung durch die
maximale Auszählung
von PET 1930 und NET 1931 repräsentiert werden kann, so dass
die Zähler nicht überlaufen.
Um die Fortpflanzung des Oszillationssignals durch den Ringoszillator 1905 zu
stoppen, wird das StopL-Signal 1909 auf LOW gesetzt, das
RS-Flip-Flop 1908 zurückgesetzt
und der Ringoszillator 1905 in den STATIC-Betriebsmodus
zurückgeführt. Auch
werden die Daten in den Zählern 1930–1937 durch
Setzen des enL-Signals 1950 auf LOW und des enH-Signals 1951 auf
HIGH von den Ausgangsstufen 1920–1926 isoliert. Die
digitalen Daten werden dann durch die Ports lpos 1955,
lneg 1956 und del 1957 ausgelesen. Bei Kenntnis
der durchschnittlichen Stufenverzögerung können die digitalen Daten dann
interpretiert werden, um eine genaue Messung des Intervalls, während dessen
sich der Ringoszillator 1905 im ACTNE-Betriebsmodus befunden
hat, in Echtzeiteinheiten bereitzustellen. Die HPDM-Schaltung 1900 kann
so ausgestaltet werden, dass sie beispielsweise nach Ablauf einer vorgegebenen
Zeitdauer ein präzises
Takt- oder Trigger-Signal, z.B. das TRIG-Signal 1945, bereitstellt. Im
Zusammenhang mit einem Speichersystem kann eine derartige Zeitdauer
beispielsweise die Zeit sein, die erforderlich ist, um den Zustand
einer Speicherzelle abzutasten, um eine Wortleitung aktiv zu halten, etc.The operation of the HPDM circuit 1900 can be summarized as follows: with the EnableL signal set to HIGH 1904 is the ring oscillator 1905 in STATIC mode, so setting the ResetL signal 1906 on LOW the counters 1930 - 1937 resets. Setting the StartH signal 1907 on HIGH sets the RS flip-flop 1908 which in turn is the ring oscillator 1905 by passing an oscillation signal into the ACTIVE mode. Each edge of the oscillation signal can be identified by identifying the switching activity at each stage output 1920 - 1926 be followed. PET 1930 and NET 1931 that the exit 1920 the first level, identify and count the loop events. It is preferred that the maximum delay to be measured by the maximum count of PET 1930 and NET 1931 can be represented so that the counters do not overflow. To the propagation of the oscillation signal by the ring oscillator 1905 to stop, the StopL signal 1909 set to LOW, the RS flip-flop 1908 reset and the ring oscillator 1905 returned to the STATIC operating mode. Also, the data is in the counters 1930 - 1937 by setting the enL signal 1950 on LOW and the enH signal 1951 on HIGH from the output levels 1920 - 1926 isolated. The digital data is then lpos through the ports 1955 , Ineg 1956 and del 1957 read. Knowing the average step delay, the digital data can then be interpreted to accurately measure the interval during which the ring oscillator 1905 in ACTNE mode of operation, in real time. The HPDM circuit 1900 can be configured so that, for example, after a predetermined period of time, a precise clock or trigger signal, eg the TRIG signal 1945 , provides. For example, in the context of a memory system, such a period of time may be the time required to sample the state of a memory cell, to keep a wordline active, etc.
Die
durchschnittliche Stufenverzögerung durch
die Stufen 1910–1916 kann
dadurch ermittelt werden, dass der Ringoszillator 1905 für eine vorgegebene
Durchschnittszeit durch Setzen von StartH 1907 und StopL 1909 auf
HIGH betrieben wird, wodurch die Zähler 1930–1937 inkrementiert
werden. Bei einer bevorzugten Ausführungsform der vorliegenden
Erfindung wird der Überlauf
von NET 1931 im Auge behalten, wobei jedes Überlaufereignis 2k Schleifenereignisse durch den Ringoszillator 1905 anzeigt.
Es ist bevorzugt, dass dieses Im-Auge-Behalten durch eine Teilerschaltung,
beispielsweise die DIVIDE-BY-64-Schaltung 1953 durchgeführt wird. Am
Ende der vorgegebenen Durchschnittszeit können die Daten von dem Teiler 1953 durch
den Port RO_div64 1954 als Wellenform ausgelesen und dann analysiert
werden, um die durchschnittliche Oszillatorstufenverzögerung zu
ermitteln. Der Fachmann erkennt jedoch, dass die zentrale Funktionalität der HPDM-Schaltung 1900,
nämlich
eine präzise
Messung einer vorgegebenen Zeitdauer bereitzustellen, unverändert bleiben
würde,
wenn die DIVIDE-BY-64-Schaltung 1953 oder eine ähnliche
Teilerschaltung hier nicht enthalten wären.The average step delay through the steps 1910 - 1916 can be determined by the fact that the ring oscillator 1905 for a given average time by setting StartH 1907 and StopL 1909 operated on HIGH, causing the counters 1930 - 1937 be incremented. In a preferred embodiment of the present invention, the overflow is NET 1931 Keep in mind, with each overflow event 2 k Loop events by the ring oscillator 1905 displays. It is preferred that this in-eye retention be by a divider circuit, for example the DIVIDE-BY-64 circuit 1953 is carried out. At the end of the given average time, the data from the divider 1953 through the port RO_div64 1954 is read out as a waveform and then analyzed to determine the average oscillator stage delay. However, those skilled in the art will recognize that the central functionality of the HPDM circuit 1900 That is, to provide a precise measurement of a given amount of time would remain unchanged when the DIVIDE-BY-64 circuit 1953 or a similar divider circuit would not be included here.
Die
HPDM-Schaltung 1900 kann für viele Timing-Anwendungen
im Zusammenhang mit einer Speicherstruktur oder nicht im Zusammenhang
mit einer Speicherstruktur verwendet werden, beispielsweise, um
gepulste Wellenformen und Arbeitszyklen präzise zu formen, um für eine oder
mehrere getaktete Schaltungen Skewing oder Deskewing durchzuführen, oder
um den Skew solcher Schaltungen zu messen, um hochgenaue Testdaten
bereitzustellen, um den Beginn, das Ende, oder die Dauer eines Signals
oder eines Ereignisses anzuzeigen, usw. Des weiteren kann die HPDM-Schaltung 1900 auf
unzählige
andere elektronische Vorrichtungen als auf Speicherstrukturen angewendet
werden, bei denen eine präzise
Zeitmessung erwünscht
ist.The HPDM circuit 1900 may be used for many timing applications related to a memory structure or not in the context of a memory structure, for example, to precisely shape pulsed waveforms and duty cycles to skew or deskew for one or more clocked circuits, or to skew such circuits to provide highly accurate test data to the beginning, end, or duration of a sig nals or an event, etc. Furthermore, the HPDM circuit 1900 be applied to innumerable electronic devices other than memory structures where precise timing is desired.
Genaue
Schaltungen mit selbstbestimmtem Zeitverhalten sind wichtige Merkmale
robuster Speicher mit niedriger Energie. Replikations-Bitleitungs-Techniken
sind im Stand der Technik so beschrieben, dass sie das Zeitverhalten
von Steuerschaltungen und Leseverstärkern über weite Variationen im Verfahren,
die Temperatur und die Betriebsspannung an die Speicherzellcharakteristiken
anpassen. Eines der Probleme bei manchen Schemata des Standes der
Technik ist, dass gespaltene Dummy-Bitleitungen Wortleitungen zu
Gruppen zusammenhäufen,
und dass so während
eines Speicherzyklusses nur eine Wortleitung aktiviert werden kann. Vor
einer nachfolgenden Aktivierung einer Wortleitung in derselben Gruppe
müssen
die Dummy-Bitleitungen vorgeladen werden, was zu unerwünschten Verzögerungen
führt.
Die Diffusionsreplikations-Verzögerungstechnik
der vorliegenden Erfindung gleicht die Kapazität einer Dummy-Bitleitung durch
Verwenden eines Diffusionskondensators, vorzugsweise für jede Zeile,
im wesentlichen an. Manche Techniken des Standes der Technik verwenden
Replikations-Bitspalten, die zu unerwünschten Betriebsverzögerungen
beitragen können. 20 zeigt
die Diffusionsreplikations-Timingschaltung 2000,
die einen Transistor 2005 und einen Diffusionskondensator 2010 aufweist.
Es ist erwünscht,
dass der Transistor 2005 ein NMOSFET-Transistor ist, der
vorzugsweise im wesentlichen identisch zu einer Zugriffstransistorkette
ist, wenn diese in den Speicherzellen der Speicherstruktur (nicht
gezeigt) verwendet wird. Es ist auch erwünscht, dass die Kapazität des Diffusionskondensators 2010 im
wesentlichen an die Kapazität der
assoziierten Bitleitung (nicht gezeigt) angepasst ist. Diese Kapazität kann ein
vorgegebenes Verhältnis
der Gesamtbitleitungskapazität
sein, wobei das Verhältnis
der Diffusionskapazität
zur Gesamtbitleitungskapazität über Verfahrens-,
Temperatur- und Spannungsveränderungen
im wesentlichen konstant bleibt. Die Gesamtbitleitungskapazität kann sowohl die
Bitleitungsmetall- als auch die Diffusionskapazitäten umfassen.
Auf diese Weise kann auf alle Zeilen in einer Speichervorrichtung,
die die Timing-Schaltung 2000 verwenden, mit im wesentlichen
selbstbestimmtem Zeitverhalten während
der gesamten Operation unabhängig
zugegriffen werden, auch wenn eine andere Zeile in demselben Speichermodul
aktiviert und noch nicht vorgeladen worden ist. Daher können Schreiben-nach-Lesen-Operationen
ohne wesentliche Zugriffszeit- oder Bereichsstrafen in ein Speichermodul
gemultiplext werden. Es ist daher erwünscht, die Diffusionsreplikations-Verzögerungsschaltung 2000 in
einer Speicherstruktur wie der in 18 beschriebenen
Speicherstruktur 1800 zu verwenden. Die Diffusionsreplikations-Verzögerungsschaltung 2000 kann
verwendet werden, um die Abfallzeit einer Bitleitung zu bestimmen,
bevor ein Leseverstärker
aktiviert wird, wobei der Abfall auf der Bitleitung gehalten wird.
Auf diese Weise kann die Bitleitungsabfallspannung auf eine relativ
geringe Größe begrenzt
werden, wodurch Energie gespart und die Speicherzugriffszeit reduziert
wird. Des weiteren kann die Timing-Schaltung 2000 verwendet
werden, um viele Timing-Signale in einer Speicherstruktur wie der
Struktur 1800 in 18 genau
zu erzeugen, einschließlich,
jedoch nicht beschränkt
auf, PRECHARGE, WRITE und SHUT-OFF TIMING Signale.Accurate self-timed circuits are important features of robust low energy storage. Replication bit-line techniques are described in the art as adjusting the timing of control circuits and sense amplifiers over wide variations in process, temperature, and operating voltage to the memory cell characteristics. One of the problems with some prior art schemes is that split dummy bitlines cluster wordlines into groups, and thus only one wordline can be activated during a memory cycle. Prior to subsequent activation of a wordline in the same group, the dummy bitlines must be precharged, resulting in undesirable delays. The diffusion replication delay technique of the present invention substantially equalizes the capacitance of a dummy bitline by using a diffusion capacitor, preferably for each row. Some prior art techniques use replication bit columns that can contribute to undesirable operational delays. 20 shows the diffusion replication timing circuit 2000 that is a transistor 2005 and a diffusion capacitor 2010 having. It is desirable that the transistor 2005 is an NMOSFET transistor, which is preferably substantially identical to an access transistor string when used in the memory cells of the memory structure (not shown). It is also desirable that the capacitance of the diffusion capacitor 2010 is substantially matched to the capacitance of the associated bit line (not shown). This capacitance may be a predetermined ratio of total bitline capacitance, with the ratio of diffusion capacitance to total bitline capacitance remaining substantially constant over process, temperature, and voltage variations. The total bitline capacitance may include both bitline metal and diffusion capacitances. That way, all the lines in a storage device that make up the timing circuit can be 2000 be used with substantially self-determined timing throughout the operation, even if another row in the same memory module has been activated and not yet preloaded. Therefore, write-to-read operations can be multiplexed into a memory module without significant access time or area penalties. It is therefore desirable to use the diffusion replication delay circuit 2000 in a memory structure like the one in 18 described memory structure 1800 to use. The diffusion replication delay circuit 2000 can be used to determine the fall time of a bit line before a sense amplifier is activated, keeping the drop on the bit line. In this way, the bit line drop voltage can be limited to a relatively small size, thereby saving energy and reducing the memory access time. Furthermore, the timing circuit 2000 used to generate many timing signals in a memory structure like the structure 1800 in 18 to generate exactly, including, but not limited to, PRECHARGE, WRITE and SHUT-OFF timing signals.
21 zeig
eine Ausführungsform
der Diffusionsreplikations-Verzögerungsschaltung 2000 in 20.
Die Wortleitungsaktivierung einer Speicherzellfrequenz wird gepulst,
um die Spannungsschwankung in den Bitleitungen hoher Kapazität zu begrenzen,
um den Energieverbrauch zu minimieren, insbesondere bei Speicherstrukturen
mit großer Wortlänge. Um
die Größe einer
Bitleitungs-Spannungsschwankung genau zu steuern, können Dummy-Bitleitungen
verwendet werden. Es ist erwünscht, dass
diese Dummy-Bitleitungen eine Kapazität aufweisen, die ein vorgegebener
Bruchteil der tatsächlichen
Bitleitungs-Kapazität
ist. Bei einer derartigen Vor richtung kann das Kapazitätsverhältnis zwischen Dummy-Bitleitungen
und echten Bitleitungen die Spannungsschwankungen in den echten
Bitleitungen beeinträchtigen.
Bei Vorrichtungen des Standes der Technik, die Dummy-Bitleitungen
verwenden, wird eine globale Dummy-Bitleitung für einen Speicherblock mit globaler
Rücksetzschleife
verwendet. Solche Schemata des Standes der Technik, die globales Rücksetzen
verwenden, erzeugen tendenziell Impulsweiten einer Dauer, die im
wesentlichen äquivalent
zu der Verzögerung
globaler Wortleitungstreiber ist. Eine derart erweiterte Impulsweite
erlaubt eine Bitleitungs-Spannungsschwankung, die größer sein kann,
als die, die tatsächlich
zur Aktivierung eines Leseverstärkers
benötigt
wird. Dies ist bei schnellen Speicherstrukturen unerwünscht, weil
die zusätzliche,
und unnötige,
Spannungsschwankung zu einer langsameren Struktur mit größerem Energiebedarf führt. Bei
einem Aspekt der vorliegenden Erfindung werden Dummy-Bitleitungen vorzugsweise
so geteilt, dass die lokalen Bitleitungen im allgemeinen eine geringe
Kapazität
und eine kurze Entladungszeit aufweisen. Wortleitungs-Impulssignale
sehr kurzer Dauer (z.B. 500 ps oder weniger) sind erwünscht, um
die Bitleitungs-Spannungsschwankung zu begrenzen. Es kann auch erwünscht sein,
lokales Rücksetzen von
geteilten Dummy-Bitleitungen vorzusehen, um sehr kurze Wortleitungsimpulse
bereitzustellen. Die Replikations-Wortleitung 2110 kann
verwendet werden, um die Verzögerung
zwischen der Aktivierung der Speicherzelle 2120 und dem
verbundenen Leseverstärker 2130 zu
minimieren. Derartige lokale Signalgebung ist gegenüber globaler
Signalverbreitung in relativ langen Wortleitungen hoher Kapazität bevorzugt.
Die Wortleitung 2140 aktiviert die Dummy-Zelle 2150 zusammen
mit der assoziierten Speicherzelle 2120, auf die zugegriffen
werden soll. Die Dummy-Zelle 2150 kann Teil der Dummy-Spalte 2160 sein,
die in kleine Gruppen (beispielsweise acht oder sechzehn Gruppen)
aufgeteilt sein kann. Die Größe jeder
geteilten Dummy-Gruppe kann zur Anpassung der Spannungsschwankung
in der Bitleitung verändert
werden. Wenn eine Dummy-Bitleitung völlig entladen ist, kann das
Rücksetzsignal 2170 lokal erzeugt
werden, was die Wortleitung 2140 im wesentlichen gegen
Masse zieht. 21 show an embodiment of the diffusion replication delay circuit 2000 in 20 , The word line activation of a memory cell frequency is pulsed to limit the voltage fluctuation in the high capacitance bit lines to minimize power consumption, especially for large word length memory structures. To accurately control the magnitude of a bitline voltage swing, dummy bitlines may be used. It is desirable that these dummy bit lines have a capacitance that is a predetermined fraction of the actual bit line capacitance. In such an apparatus, the capacitance ratio between dummy bit lines and real bit lines may affect the voltage fluctuations in the true bit lines. In prior art devices using dummy bitlines, a global dummy bitline is used for a global reset loop memory block. Such prior art schemes that use global reset tend to produce pulse widths of a duration that is substantially equivalent to the delay of global wordline drivers. Such an expanded pulse width allows bit line voltage variation, which may be greater than that actually required to activate a sense amplifier. This is undesirable in fast memory structures because the additional, and unnecessary, voltage variation results in a slower, more energy-demanding structure. In one aspect of the present invention, dummy bitlines are preferably shared such that the local bitlines generally have a low capacitance and a short discharge time. Word line pulse signals of very short duration (eg, 500 ps or less) are desired to limit bit line voltage variation. It may also be desirable to provide local reset of shared dummy bitlines to provide very short wordline pulses. The replication wordline 2110 can be used to check the delay between the activation of the memory cell 2120 and the connected sense amplifier 2130 to minimize. Such local signaling is against global signal propagation in relatively long high capacity word lines preferred. The word line 2140 activates the dummy cell 2150 together with the associated memory cell 2120 to be accessed. The dummy cell 2150 can be part of the dummy column 2160 be divided into small groups (for example, eight or sixteen groups). The size of each divided dummy group can be changed to adjust the voltage variation in the bit line. If a dummy bitline is completely discharged, the reset signal may be 2170 locally generated what the wordline 2140 essentially pulls against mass.
22A zeigt eine gesteuerte Spannungsschwankungs-Datenbusschaltung
(CVS) 2200, die bei der Realisierung von Niedrigenergie-,
Hochgeschwindigkeits- und
dichten Verbindungs-Bussen von Nutzen sein kann. Die CVS 2200 kann
den Energieverbrauch des Busses dadurch reduzieren, dass sie eine
begrenzte, gesteuerte Spannungsschwankung auf den Bus 2215 legt.
Bei einer wesentlichen Konfiguration kann die CVS 2000 einen
Inverter 2205, einen pMOS Pass-Transistor T2 2210 und
einen nMOS Entladetransistor, beispielsweise den Transistor T1a 2205a,
aufweisen. 22A shows a controlled voltage fluctuation data bus circuit (CVS) 2200 that can be useful in the realization of low power, high speed and dense interconnect buses. The CVS 2200 can reduce bus power consumption by providing a limited, controlled voltage swing across the bus 2215 sets. In a significant configuration, the CVS 2000 an inverter 2205 , a pMOS pass transistor T2 2210 and an nMOS discharge transistor, for example transistor T1a 2205a , exhibit.
Beide
Transistoren T1a 2205a und T2 2210 können so
programmiert werden, dass sie die Geschwindigkeit und das Ausmaß von Spannungsschwankungen
auf den Bus 2215 so steuern, dass eine erste vorausgewählte Betriebscharakteristik
für den
Bus im Ansprechen auf das Eingangssignal 2220a bereitgestellt
wird. Zusätzliche
Entladetransistoren T1b 2205b und B1c 2205c können mit
dem Pass-Transistor T2 2210 gekoppelt und einzeln so programmiert
werden, dass sie jeweils eine zweite vorausgewählte Betriebscharakteristik
für den
Bus sowie eine dritte vorausgewählte
Betriebscharakteristik für
den Bus im Ansprechen auf die jeweiligen Eingangssignale 2220b, 2220c bereitstellen.
Die vorausgewählte
Betriebscharakteristik für
den Bus kann beispielsweise die Entladungsgeschwindigkeit der Busspannung
durch die jeweiligen Entladetransistoren T1a 2205a, T1b 2205b und
T1c 2205c sein, so dass der Bus 2215 codierte
Signale oder mehrstufige Logik bereitstellen kann. Zum Beispiel
kann, wie in 22A gezeigt ist, die CVS 2200 drei
bestimmte logische Pegel bereitstellen. Zusätzliche Entladetransistoren,
die so programmiert sind, dass sie zusätzliche logische Pegel bereitstellen,
können
ebenfalls verwendet werden. Daher kann der Bus 2215 zwei oder
mehr Leitungen ersetzen. Zugleich mit der Reduzierung des Energieverbrauchs
erhöht
die begrenzte Busspannungsschwankung tendenziell die Geschwindigkeit
des Busses in vorteilhafter Weise.Both transistors T1a 2205a and T2 2210 can be programmed to increase the speed and extent of voltage fluctuations on the bus 2215 so that control a first preselected operating characteristic for the bus in response to the input signal 2220a provided. Additional discharge transistors T1b 2205b and B1c 2205c can with the pass transistor T2 2210 coupled and individually programmed to each have a second preselected operating characteristic for the bus and a third preselected operating characteristic for the bus in response to the respective input signals 2220b . 2220c provide. The preselected operating characteristic for the bus may be, for example, the discharge rate of the bus voltage through the respective discharge transistors T1a 2205a , T1b 2205b and T1c 2205c be, so the bus 2215 can provide encoded signals or multi-level logic. For example, as in 22A shown is the CVS 2200 provide three distinct logical levels. Additional discharge transistors programmed to provide additional logic levels may also be used. Therefore, the bus can 2215 Replace two or more lines. Along with the reduction in power consumption, the limited bus voltage variation tends to increase the speed of the bus in an advantageous manner.
22B zeigt eine bidirektionale Datenbusübertragungsschaltung 2250,
die vernetzte Inverter I1 2260 und I2 2270 verwendet,
um den BUS 1 2252 mit dem BUS 2 2254 zu verbinden.
Es ist erwünscht, eine
getaktete Ladungs-/Entladungs-Schaltung in die bidirektionale Datenbusübertragungsschaltung
einzubauen. Der getaktete Ladetransistor MPC1 2266 und
der getaktete Entladetransistor MNC1 2268 sind mit dem
Inverter I1 2260 gekoppelt. Ähnlich ist der Inverter I2 2270 mit
dem getakteten Ladetransistor MPC2 2276 und dem getakteten
Entladetransistor MNC2 2278 gekoppelt. Die Transistoren
MPC1 2266, MNC1 2268, MPC2 2276 und MNC2 2278 werden vorzugsweise
durch das Taktsignal 2280 getrieben. 22B shows a bidirectional data bus transmission circuit 2250 , the networked inverter I1 2260 and I2 2270 used to the bus 1 2252 with the bus 2 2254 connect to. It is desirable to incorporate a clocked charge / discharge circuit into the bidirectional data bus transfer circuit. The clocked charging transistor MPC1 2266 and the clocked discharge transistor MNC1 2268 are with the inverter I1 2260 coupled. Similarly, the inverter I2 2270 with the clocked charging transistor MPC2 2276 and the clocked discharge transistor MNC2 2278 coupled. The transistors MPC1 2266 , MNC1 2268 , MPC2 2276 and MNC2 2278 are preferably by the clock signal 2280 driven.
Wenn
das Taktsignal 2280 LOW wird, schalten sich die Ladetransistoren
MPC1 2266 und MPC2 2276 ON und ermöglichen
es dem Eingangknoten 2265 von BUS 1 und dem Eingangsknoten 2258 von BUS
2 auf HIGH vorgeladen zu werden. Außerdem werden die Entladetransistoren
MNC1 2268 und MNC2 2278 OFF geschaltet, so dass
keine wesentliche Entladung stattfindet. Indem die Eingangsknoten 2256, 2258 auf
HIGH gehen, pflanzen sich jeweilige Signale durch die Inverter I1 2260 und
I2 2270 fort und werden von ihnen invertiert, wodurch jeweils
ein LOW Signal für
den Pass-Transistor MP12 2262 von BUS 1 und den Pass-Transistor
MP22 2272 von BUS 2 bereitgestellt wird, wodurch das Signal
auf BUS 1 2252 zu dem Eingangsknoten 2256 zugelassen
wird und dann durch den Eingangsknoten 2258 von BUS 2 zum
BUS 2 2254 und umgekehrt durchlaufen kann. Wenn das Taktsignal 2280 auf
HIGH ansteigt, schalten sich beide Ladetransistoren MPC1 2266 und MPC2 2276 OFF,
und die Entladetransistoren MNC 1 2268 und MNC2 2278 schalten
sich ON, wodurch die Daten auf BUS 1 2252 und BUS 2 2254 gelatcht
werden. Nach der nächsten
LOW Phase des Taktsignals 2280 pflanzt sich ein auf BUS
1 2252 oder BUS 2 2254 geänderter Signalwert zwischen
den Bussen fort.When the clock signal 2280 LOW, the charging transistors MPC1 turn on 2266 and MPC2 2276 ON and allow the input node 2265 from BUS 1 and the entrance node 2258 to be summoned by BUS 2 to HIGH. In addition, the discharge transistors MNC1 2268 and MNC2 2278 OFF, so there is no significant discharge. By the entrance node 2256 . 2258 go high, respective signals propagate through the inverter I1 2260 and I2 2270 and are inverted by them, producing a LOW signal for the pass transistor MP12 2262 from BUS 1 and the pass transistor MP22 2272 provided by BUS 2, whereby the signal on BUS 1 2252 to the entrance node 2256 is allowed and then through the entrance node 2258 from BUS 2 to BUS 2 2254 and vice versa. When the clock signal 2280 increases to HIGH, both charging transistors MPC1 turn on 2266 and MPC2 2276 OFF, and the discharge transistors MNC 1 2268 and MNC2 2278 turn ON, causing the data on BUS 1 2252 and BUS 2 2254 be licked. After the next LOW phase of the clock signal 2280 plants on BUS 1 2252 or BUS 2 2254 changed signal value between the buses.
Der
Fachmann kann viele Änderungen
und Modifikationen vornehmen, ohne vom Umfang der Erfindung abzuweichen.
Es ist daher selbstverständlich,
dass die gezeigten Ausführungsformen
nur zu Beispielszwecken dargelegt worden sind und die in den nachfolgenden
Ansprüchen
definierte Erfindung nicht einschränken.Of the
Professional can make many changes
and make modifications without departing from the scope of the invention.
It is therefore natural
that the embodiments shown
have been presented for illustrative purposes only and in the following
claims
do not restrict defined invention.