DE60107217T2

DE60107217T2 - MEMORY MODULE WITH HIERARCHICAL FUNCTIONALITY

Info

Publication number: DE60107217T2
Application number: DE60107217T
Authority: DE
Inventors: Esin Terzioglu; Cyrus Morteza AFGHAHI; Mehdi Hatamian
Original assignee: Broadcom Corp
Current assignee: Broadcom Corp
Priority date: 2000-02-02
Filing date: 2001-02-02
Publication date: 2005-12-01
Anticipated expiration: 2021-02-03
Also published as: DE60107217D1

Description

Die folgenden Patentanmeldungen, die am Anmeldungstag der vorliegenden Anmeldung für denselben Anmelder und im Namen derselben Erfinder angemeldet worden sind, offenbaren verwandte Gegenstände, wobei der Gegenstand jeder Anmeldung vollumfänglich durch Bezugnahme in er vorliegenden Anmeldung aufgenommen wird:
Memory Module with Hierarchical Functionality, Anwaltsnr. 40050/B600/JFO; High Precision Measurement Circuit, Anwaltsnr. 37079/B600/JFO; Single-Ended Sense Amplifier with Sample-and-Hold Reference, Anwaltsnr. 37362/B600/JFO; Limited Switch Driver Circuit, Anwaltsnr. 37361/B600/JFO; Fast Decoder with Asynchronous Reset with Row Redundancy; Anwaltsnr. 37115/600/JFO; Diffusion Replica Delay Circuit, Anwaltsnr. 37360/B600/JFO; Sense Amplifier with Offset Cancellation and Charge-Share Limited Swing Drivers, Anwaltsnr. 37363/B600/JFO; Memory Architecture with Single-Port Cell and Dual-Port (Read and Write) Functionality, Anwaltsnr. 37364B600/JFO; Memory Redundancy Implementation, Anwaltsnr. 37496B600/JFO; und A Circuit Technique for High Speed Low Power Data Transfer Bus, Anwaltsnr. 37497/B600/JFO.The following patent applications filed with the same Applicant and in the name of the same inventors on the filing date of the present application disclose related matters, the subject matter of each application being incorporated in its entirety by reference in the present application:
Memory Module with Hierarchical Functionality, Att. 40050 / B600 / JFO; High Precision Measurement Circuit, Att. 37079 / B600 / JFO; Single-Ended Sense Amplifier with Sample-and-Hold Reference, Att. 37362 / B600 / JFO; Limited Switch Driver Circuit, Att. 37361 / B600 / JFO; Fast Decoder with Asynchronous Reset with Row Redundancy; Anwaltsnr. 37115/600 / JFO; Diffusion Replica Delay Circuit, Att. 37360 / B600 / JFO; Sense Amplifier with Offset Cancellation and Batch Share Limited Swing Drivers, Att. 37363 / B600 / JFO; Memory Architecture with Single-Port Cell and Dual-Port (Read and Write) Functionality, Att. 37364B600 / JFO; Memory Redundancy Implementation, Att. 37496B600 / JFO; and A Circuit Technique for High Speed Low Power Data Transfer Bus, Att. 37497 / B600 / JFO.

HINTERGRUND DER ERFINDUNGBACKGROUND OF THE INVENTION

1. Gebiet der Erfindung1. Field of the invention

Die vorliegende Erfindung bezieht sich auf Speichervorrichtungen, insbesondere auf Halbleiter-Speichervorrichtungen, und im Besonderen auf skalierbare, leistungsfähige Halbleiter-Speichervorrichtungen.The The present invention relates to memory devices, in particular on semiconductor memory devices, and in particular on scalable, powerful Semiconductor memory devices.

2. Hintergrund der Technik2. Background of the art

Speicherstrukturen sind zu integralen Teilen moderner VLSI-Systeme, einschließlich digitaler Signalverarbeitungssysteme, geworden. Obwohl es typischerweise erwünscht ist, möglichst viele Speicherzellen in einen vorgegebenen Bereich aufzunehmen, ist die Speicherzelldichte normalerweise durch andere Gestaltungsfaktoren, beispielsweise Layout-Effizienz, Leistung, Energieerfordernisse und Geräuschempfindlichkeit, begrenzt.storage structures are integral parts of modern VLSI systems, including digital ones Signal processing systems, become. Although it is typically desirable preferably is to include many memory cells in a given range is the storage cell density normally by other design factors, For example, layout efficiency, performance, energy requirements and noise sensitivity, limited.

In Anbetracht des Trends zu kompakten, hochleistungsfähigen integrierten Computernetzen mit hoher Bandbreite, tragbaren Rechnern und mobilen Kommunikationsgeräten können die vorgenannten Einschränkungen der Ausgestaltung der Speicherstruktur schwerwiegende Bedingungen auferlegen, die traditionelle Spei chersysteme und Unterbestandteil-Implementationen möglicherweise nicht umgehen können.In Considering the trend towards compact, high performance integrated High bandwidth, portable and mobile computer networks communications equipment can the aforementioned limitations the design of the memory structure severe conditions impose traditional storage systems and sub-part implementations possibly can not handle.

Eine Art des Grundspeicherelements ist das Static Random Access Memory (SRAM), das seinen Speicherzustand beibehalten kann, ohne aktualisiert (refreshed) zu werden, solange die Zelle mit Energie versorgt wird. Bei einer SRAM-Vorrichtung wird der Speicherzustand normalerweise als Spannungsdifferential in einem bistabilen funktionalen Element, z.B. einer Inverterschleife, gespeichert. Eine SRAM-Zelle ist komplexer als ihr Gegenstück, eine Dynamic RAM (DRAM)-Zelle, und benötigt mehr Einzelbestandteile, vorzugsweise Transistoren. Demgemäss verbrauchen SRAM-Vorrichtungen normalerweise mehr Energie und geben mehr Wärme ab als ein DRAM mit vergleichbarer Speicherdichte und gleicher Effizienz; SRAM-Vorrichtungs-Designs mit niedrigerer Energie sind besonders geeignet für VLSI-Systeme, die hochdichte SRAM-Bestandteile benötigen, vorausgesetzt, dass diese Speicherbestandteile die häufig strengen Gesamtdesign-Beschränkungen des bestimmten VLSI-Systems beachten. Des weiteren sind die SRAM-Untersysteme vieler VLSI-Systeme häufig in Bezug auf bestimmte Design-Implementierungen integriert, wobei bestimmte Anpassungen des SRAM-Untersystems die Skalierbarkeit des SRAM-Untersystem-Designs einschränken oder sogar ausschließen. Als Folge hiervon können SRAM-Speicher-Untersystemdesigns, auch diejenigen, die als „skalierbar" angesehen werden, Designbedingungen häufig nicht erfüllen, wenn diese Speicher-Untersystemdesigns zum Einsatz in einem VLSI-System mit dem Bedarf größerer Speicherzellpopulation und/oder -dichte vergrößert werden.A The type of basic memory element is Static Random Access Memory (SRAM) that can maintain its memory state without being refreshed to become, as long as the cell is supplied with energy. At a SRAM device, the memory state is usually called voltage differential in a bistable functional element, e.g. an inverter loop, saved. An SRAM cell is more complex than its counterpart, a Dynamic RAM (DRAM) cell, and requires more individual components, preferably Transistors. Accordingly, SRAM devices usually consume more energy and give more heat as a DRAM with comparable storage density and efficiency; SRAM device designs lower energy are particularly suitable for VLSI systems, require the high-density SRAM components, provided that these storage components often stringent Overall design constraints of the specific VLSI system. Further, the SRAM subsystems many VLSI systems frequently in Integrated with specific design implementations, with specific ones Adaptations of the SRAM subsystem The scalability of the SRAM subsystem design restrict or even exclude. As a consequence, SRAM memory subsystem designs, even those that are considered "scalable" Design conditions often do not fulfill, when using these memory subsystem designs for use in a VLSI system with the need of larger storage cell population and / or density are increased.

Es besteht ein Bedarf für eine effiziente, skalierbare, hochleistungsfähige Speicherstruktur mit niedriger Energie, die es einem Systemdesigner ermöglicht, ein SRAM-Speicher-Untersystem zu generieren, das strenge Auflagen hinsichtlich Vorrichtungsbereich, Energie, Leistung, Geräuschempfindlichkeit, etc. erfüllt.It there is a need for an efficient, scalable, high-performance memory structure with lower Energy that enables a system designer to have an SRAM storage subsystem to generate strict conditions with regard to the device area, Energy, performance, noise sensitivity, etc. fulfilled.

Die US-A-5,751,648 bezieht sich auf eine zweistufige Lesetechnik für große Static Random Access Memory (SRAM)-Vorrichtungen.The US-A-5,751,648 relates to a two stage reading technique for large static Random Access Memory (SRAM) devices.

Die JP 10 134 573 bezieht sich auf eine Hauptverstärkungsschaltung für einen Halbleiterspeicher, die mit einer WRITE-Verstärkungsschaltung zusammenarbeitet.The JP 10 134 573 relates to a main amplifier circuit for a semiconductor memory, which cooperates with a WRITE amplification circuit.

Die US-A-5,247,479 bezieht sich auf einen Leseverstärker zum Einsatz im Zusammenhang mit einem Static Random Access Memory (SRAM)-Array.The US-A-5,247,479 relates to a sense amplifier for use in the context with a static random access memory (SRAM) array.

Die US-A-6,009,024 bezieht sich auf einen hochintegrierten Halbleiterspeicher mit reduziertem Bereich.The US-A-6,009,024 relates to a highly integrated semiconductor memory with reduced area.

Die EP-A-0 745 995 bezieht sich auf eine Flash-EEPROM-Speichervorrichtung zum Durchführen verschiedener Operationen in verschiedenen Sektoren, z.B. Löschen eines Sektors, während gleichzeitig ein anderer Sektor gelesen wird.EP-A-0 745 995 relates to a flash EEPROM memory device for feedthrough various operations in different sectors, eg deleting one sector while at the same time reading another sector.

Es ist Aufgabe der vorliegenden Erfindung, eine Dual Port Funktionalität aus einer hierarchischen Speicherstruktur mit Single Port zu erhalten. Diese Aufgabe wird durch das Verfahren der Ansprüche 1 und 2 gelöst. Vorteilhafte Ausführungsformen der Erfindung sind in den Unteransprüchen definiert.It Object of the present invention, a dual port functionality of a hierarchical storage structure with single port. These Task is solved by the method of claims 1 and 2. advantageous Embodiments of Invention are in the subclaims Are defined.

Die vorliegende Erfindung erfüllt den vorgenannten Bedarf durch Bereitstellen eines Speichermoduls mit hierarchischer Funktionalität. Die vorliegende Erfindung stellt des weiteren eine hierarchische Speicherstruktur bereit, die aus derartigen Speichermodulen zusammengesetzt ist. Das Speichermodul selbst kann abgestuft und hierarchisch sein, so dass eine „globale" Vorrichtung in einer bestimmten Stufe als „lokale" Vorrichtung in Bezug auf eine in der Hierarchie unmittelbar höhere Stufe klassifiziert werden kann. Andererseits kann eine „lokale" Vorrichtung in derselben bestimmten Stufe als „globale" Vorrichtung in Bezug auf eine in der Hierarchie unmittelbar niedrigere Stufe klassifiziert werden.The present invention the aforementioned need by providing a memory module with hierarchical functionality. The present invention further provides a hierarchical one Memory structure prepared, composed of such memory modules is. The memory module itself can be tiered and hierarchical, so that a "global" device in one certain stage as a "local" device in relation be classified to a level immediately higher in the hierarchy can. On the other hand, a "local" device in the same certain level as a "global" device in relation classified to a level immediately lower in the hierarchy become.

In der Grundstufe oder ersten Stufe kann ein Speichermodul eine oder mehrere Speicherzellen aufweisen, die mit einem lokalen Leseverstärker gekoppelt sind. Ein oder mehrere lokale Leseverstärker können mit einem globalen Leseverstärker gekoppelt sein und so eine spaltenorientierte Speicherstruktur bilden. Ein Speicherzustandssignal von dem Speicher wird von dem lokalen Leseverstärker empfangen, der wiederum an den globalen Leseverstärker ein lokales Speicherzustandssignal abgibt. Der globale Leseverstärker kann dieses lokale Speicherzustandssignal empfangen und im Ansprechen darauf ein globales Speicherzustandssignal bereitstellen. Mehrere Spaltenstrukturen können in Gruppen zusammengefasst werden, um für eine gegebene Stufe ein zweidimensionales Speicherarray zu bilden. In aufeinanderfolgenden höheren Stufen kann ein Speichermodul ein oder mehrere einzelne Speichermodule aufweisen, die aus einer niedrigeren Stufe aufgebaut sind. Gruppen einzelner Speichermodule können selektiv mit lokalen Leseverstärkern gekoppelt werden, die wiederum mit einem globalen Leseverstärker gekoppelt sind, der ein Signal entsprechend einer Speicherstelle entweder an die nächsthöhere Stufe oder, wenn in der höchsten Stufe der Hierarchie angeordnet, an die Speicherstruktur-E/A-Puffer, ausgeben kann.In At the basic level or first level, a memory module can be one or have a plurality of memory cells coupled to a local sense amplifier are. One or more local sense amplifiers may be coupled to a global sense amplifier and thus form a column-oriented memory structure. A memory state signal from the memory is received by the local sense amplifier, which in turn to the global sense amplifier outputs local memory state signal. The global sense amplifier can receive this local memory state signal and in response then provide a global memory state signal. Several Column structures can be grouped together to form a two-dimensional one for a given stage Storage array to form. In successive higher levels For example, a memory module can have one or more individual memory modules have, which are composed of a lower level. groups single memory modules can selective with local sense amplifiers coupled, which in turn coupled with a global sense amplifier which is a signal corresponding to a memory location either to the next higher level or, if in the highest Level of the hierarchy, to the memory structure I / O buffers, can spend.

Auch in der ersten Stufe können eine oder mehrere Zellen in dem Speichermodul mit einem lokalen Wortleitungs- oder -zeilen-Decoder gekoppelt sein. Ein oder mehrere lokale Wortleitungs-Decoder können mit einer globalen Wortleitung gekoppelt sein, wodurch eine zeilenorientierte Speicherstruktur gebildet wird. Ein globaler Wortleitungs-Decoder empfängt ein globales Selektionssignal entsprechend selektierten Speicherzellen und leitet dieses Signal an lokale Wortleitungs-Decoder weiter. Die lokalen Wortleitungs-Decoder empfangen dieses Signal und stellen ein lokales Selektionssignal zur Verfügung, das die selektierten Speicherzellen aktiviert. Wie bei den Spaltenstrukturen können mehrere Zeilen in Gruppen zusammengefasst werden, um ein zweidimensionales Speicherarray für eine gegebene Stufe zu bilden. In aufeinanderfolgenden höheren Stufen kann ein Speichermodul ein oder mehrere einzelne Speichermodule einer niedrigeren Stufe aufweisen. Gruppen einzelner Speichermodule können selektiv mit lokalen Wortleitungs-Decodern gekoppelt werden, die wiederum mit globalen Wortleitungs-Decodern gekoppelt sind, die ein Selektionssignal entsprechend einer Speicherstelle entweder von der nächsthöheren Stufe oder, wenn in der obersten Stufe der Hierarchie angeordnet, von den von den Adresseingängen getriebenen Predecoder-/Wortleitungs-Treibern empfangen.Also in the first stage can one or more cells in the memory module with a local one Word line or line decoder coupled. One or more local word line decoders can be coupled to a global wordline, resulting in a row-oriented Memory structure is formed. A global wordline decoder receives global selection signal corresponding to selected memory cells and forwards this signal to local wordline decoders. The local word line decoders receive this signal and set a local selection signal is available that the selected ones Memory cells activated. As with the column structures, several Lines are grouped together to form a two-dimensional Memory array for to form a given level. In successive higher levels For example, a memory module can have one or more individual memory modules have a lower level. Groups of individual memory modules can be selective coupled with local word line decoders, which in turn are coupled to global word line decoders, which are a selection signal according to a storage location either from the next higher level or, if arranged at the top level of the hierarchy, from that from the address entrances received Predecoder / Word Line Drivers.

Signale mit begrenzter Spannungsschwankung können von den Speicherzellen, den lokalen Leseverstärkern, den globalen Leseverstärkern, den lokalen Wortleitungs-Decodern, den globalen Wortleitungs-Decodern, oder Kombinationen hiervon bereitgestellt werden. Wo Speicherzellen Signale mit begrenzter Spannungsschwankung erzeugen, spricht der entsprechende lokale Leseverstärker auch auf ein solches Signal an. Vorzugsweise werden überall Signale mit begrenzter Spannungsschwankung eingesetzt, um den Energieverbrauch zu minimieren und die Arbeitsgeschwindigkeit des Speichermoduls und der hieraus zusammengesetzten Speicherstruktur zu maximieren. Zu diesem Zweck umfasst ein Aspekt der vorliegenden Erfindung einen einpolig geerdeten (single-ended) Leseverstärker mit Abtast- und Haltereferenz (Sample-and-Hold Reference). Bei einem anderen Aspekt der vorliegenden Erfindung wird ein Charge-Share schwankungsbegrenzter Treiber-Leseverstärker (charge-share limited-swing-driver) verwendet. Zusätzlich zur Begrenzung von Spannungsschwankungen ist es auch erwünscht, synchrone Schaltungen, beispielsweise Predecoder und getaktete Wortleitungs-Decoder, von asynchronen Schaltungen, beispielsweise lokalen Wortleitungs-Decodern, zu isolieren. Daher stellt ein weiterer Aspekt der vorliegenden Erfindung einen asynchron zurücksetzbaren Zeilendecoder zur Verfügung.signals with limited voltage fluctuation can be detected by the memory cells, the local sense amplifiers, the global sense amplifiers, the local word line decoders, the global word line decoders, or combinations thereof. Where memory cells Produce signals with limited voltage fluctuation, speaks the corresponding local sense amplifier too to such a signal. Preferably, signals are more limited everywhere Voltage fluctuation used to minimize energy consumption and the operating speed of the memory module and the resulting to maximize composite memory structure. To this end For example, one aspect of the present invention includes a single ended grounded one (single-ended) sense amplifier with sample and hold reference. At a In another aspect of the present invention, a batch share becomes more fluctuation limited Driver sense amplifier (charge-share limited-swing-driver). In addition to limiting voltage fluctuations it is also desirable synchronous circuits, for example predecoder and clocked word line decoder, asynchronous circuits, such as local word line decoders, to isolate. Therefore, another aspect of the present invention Invention asynchronously resettable Row decoder available.

Da es erwünscht ist, Signalspannungsdauer und -abfall zu steuern und dadurch Signale mit begrenzter Spannungsschwankung einzuschränken, sind Vorrichtungen vorgesehen, die ein Signal genau beenden, einschließlich einer hochgenauen Verzögerungsmessungsschaltung und einer Diffusionsreplikations-Verzögerungs schaltung (diffusion replica delay circuit). Die hochgenaue Verzögerungsmessschaltung kann außergewöhnlich genaue Zeitmessungen, beispielsweise eine Halb-Gate-Verzögerung, zur Verfügung stellen. Die hochgenaue Verzögerungsmessschaltung kann mit einem mehrstufigen Ringoszillator realisiert werden, der mit mehreren Schwingungssignaldetektoren gekoppelt sein kann, die Zähler und Signalflanken-Ermittlungsschaltungen sein können, die jeweils die Zahl der Schwingungen durch die Schaltung zählen und den Umfang bestimmen, in dem sich ein bestimmtes Schwingungssignal in dem Oszillator fortpflanzt.Since it is desired to control signal voltage duration and decay and thereby limit signals with limited voltage fluctuation, devices are provided which accurately terminate a signal, including a high accuracy delay measurement circuit and a diffusion replication delay circuit delay circuit). The high accuracy delay measurement circuit can provide exceptionally accurate time measurements, such as a half gate delay. The high accuracy delay measurement circuit can be realized with a multi-stage ring oscillator which can be coupled to a plurality of oscillation signal detectors, which can be counters and signal edge detection circuits respectively counting the number of oscillations through the circuit and determining the extent to which a particular oscillation signal enters the oscillator propagates.

Die Diffusionsreplikations-Verzögerungsschaltung schränkt das Signal mit begrenzter Spannungsschwankung durch wesentliches Replizieren einer Verzögerungscharakteristik eines vorgegebenen Speicherstruktur-Bestandteils, z.B. einer Bitleitung ein, so dass ein lokalisiertes Timingsignal erzeugt werden kann, wodurch eine hochlokalisierte Entscheidungsfindung zur Verfügung gestellt wird, was z.B. die eigenständige Operation von und den Zugriff auf Speicherstrukturzeilen ermöglicht. Eine Ausführungsform dieses Aspekts der Erfindung umfasst eine Diffusionskapazität, die im allgemeinen mit der Gesamtkapazität der assoziierten Struktur (z.B. Bitleitung) zusammenpasst, und einen Transistor, der im allgemeinen die gesammelten Charakteristiken der Transistoren, die ggf. verwendet werden, um auf die assoziierte Struktur zuzugreifen, repliziert. Eine weitere Ausführungsform dieses Aspekts der Erfindung kann Dummy-Zellen umfassen, die mit einem selektierten Wortleitungs-Decoder und einem selektierten Leseverstärker wirksam gekoppelt sind. Auch kann eine gespaltene Dummy-Bitleitung mit einer bestimmten Wortleitung assoziiert werden, wodurch eine übermäßige Verzögerung von gruppierter Wortleitungs-Assoziierung vermieden wird. Bei einem weiteren Aspekt der vorliegenden Erfindung ist ein Datentransfer-Bus vorgesehen, um eine begrenzte, gesteuerte Spannungsschwankung auf einen Datenbus anzuwenden, mit dem die verschiedenen Bestandteile der vorliegenden Erfindung gekoppelt werden können. Zusätzlich kann der Datentransfer-Bus einen programmierbaren Treiber aufweisen, der logische Signale an den Datenbus anlegen kann, einschließlich codierter Signale, logische Signale mehrerer Pegel, oder beides. Außerdem ist auch eine bidirektionale Datentransfer-Busschaltung vorgesehen.The Diffusion replication delay circuit restricts the signal with limited voltage fluctuation by essential Replicate a delay characteristic a given memory structure component, e.g. a bit line a, so that a localized timing signal can be generated, thus providing highly localized decision making becomes what e.g. the independent ones Operation of and access to memory structure lines allows. An embodiment This aspect of the invention comprises a diffusion capacity, which in the general with the total capacity of the associated structure (e.g., bitline), and a transistor, in general the collected characteristics of the transistors that may be used are replicated to access the associated structure. Another embodiment This aspect of the invention may include dummy cells associated with a selected word line decoder and a selected sense amplifier are effectively coupled. Also can be a split dummy bitline be associated with a particular wordline, causing excessive delay of grouped wordline association is avoided. At another Aspect of the present invention, a data transfer bus is provided, a limited, controlled voltage swing on a data bus apply with which the various components of the present Invention can be coupled. additionally the data transfer bus may have a programmable driver, which can apply logic signals to the data bus, including coded ones Signals, logic signals of multiple levels, or both. Besides that is also provided a bidirectional data transfer bus circuit.

Um robuste Speicherstrukturen mit hohem Ertrag bereitzustellen, insbesondere in eingebetteten Zusammenhängen, sind mehrere Redundanzvorrichtungen vorgesehen. Bei einer Ausführungsform des Redundanzaspekts der vorliegenden Erfindung sind eine redundante Gruppe von Speicherzellen und ein Redundanzregler vorgesehen. Der Redundanzregler ersetzt eine bestimmte Speichergruppe durch die re dundante Gruppe im Ansprechen auf eine Speicherbedingung, typischerweise eine inoperable oder „FAILED" Speichergruppe. Die redundante Speichergruppe kann eine Speicherzeile, eine Speicherspalte, ein vorher gewählter Abschnitt eines Speichermoduls, ein wählbarer Abschnitt eines Speichermoduls, ein Speichermodul und eine Kombination hiervon sein. Diese Ausführungsform der Redundanz kann während der Herstellung, beispielsweise durch Verwenden von Sicherungen und Decodern, implementiert werden. Oder sie kann dynamisch „vor Ort", z.B. durch Verwendung programmierbarer Schalter, implementiert werden. Die Redundanz kann auch auf andere Arten implementiert werden. Bei einer weiteren Ausführungsform der Redundanz gemäß der vorliegenden Erfindung ist ein Wortleitungs-Decoder mit Zeilenredundanz vorgesehen. Der Wortleitungs-Decoder kann mit zwei Speicherzeilen gekoppelt sein. Während der typischen Operation wählt der Wortleitungs-Decoder die erste Speicherzeile aus und decodiert sie. Im Ansprechen auf ein Andere-Zeile-Auswählen-Signal, das z.B. aus einem Zeilenversagen resultiert, wählt der Wortleitungs-Decoder jedoch stattdessen die zweite Speicherzeile aus und decodiert sie. Bei einer weiteren Ausführungsform des Redundanz-Aspekts der vorliegenden Erfindung kann der vorgenannte asynchron zurücksetzbare Zeilendecoder so modifiziert werden, dass er die oben erwähnte Zeilenredundanz aufweist. Das Speichermodul und die hierarchische Speicherstruktur gemäß der vorliegenden Erfindung können in einem Halbleiter-Bauelement, einer optischen Vorrichtung, oder einer Kombination hieraus, beispielsweise in einem Kommunikationsgerät, untergebracht sein.Around To provide robust high-yield storage structures, in particular in embedded contexts, Several redundancy devices are provided. In one embodiment The redundancy aspects of the present invention are redundant Group of memory cells and a redundancy controller provided. Of the Redundancy controller replaces a specific memory group by the re dundante group in response to a storage condition, typically an inoperable or "FAILED" storage group. The redundant storage group can be a storage line, a storage column, a previously chosen one Section of a memory module, a selectable section of a memory module Memory module and a combination thereof. This embodiment the redundancy can be during manufacturing, for example by using fuses and decoders. Or it can be dynamic "on-site", for example by use programmable switch, to be implemented. The redundancy can can also be implemented in other ways. In a further embodiment the redundancy according to the present Invention is provided a word line decoder with line redundancy. The wordline decoder can be coupled to two memory lines be. While the typical operation chooses the word line decoder outputs the first memory line and decodes she. In response to another line select signal, e.g. from a Row failure results, chooses the word line decoder, however, the second memory line instead out and decode it. In a further embodiment of the redundancy aspect The present invention can be asynchronously reset Row decoders are modified to provide the above-mentioned row redundancy having. The memory module and the hierarchical memory structure according to the present Invention can in a semiconductor device, an optical device, or a combination thereof, for example, in a communication device housed be.

Die vorliegende Erfindung weist auch ein Verfahren zum Erlangen von Dual Port Funktionalität aus einer hierarchischen Speicherstruktur mit Single Port auf. Ein Aspekt dieser Ausführungsform führt zu einer WRITE-AFTER-READ-Operation ohne einen separaten, zwischen die READ und WRITE Zyklen geschalteten, PRECHARGE Zyklus, wobei die gesamte WRITE-AFTER-READ-Operation innerhalb eines Speicherzugriffszyklusses der hierarchischen Speicherstruktur durchgeführt wird. Wo erste Daten von einer ersten Speicherstelle abgerufen und zweite Daten an einer zweiten Speicherstelle gespeichert werden sollen, weist das Verfahren das lokale Selektieren der ersten Speicherstelle auf, von der die ersten Daten abgerufen werden sollen; das lokale Lesen der ersten Daten (d.h. die READ-Operation); das globale Selektieren der zweiten Speicherstelle; im wesentlichen gleichzeitig mit dem globalen Selektieren das globale Lesen der ersten Daten an der ersten Speicherstelle; das Ausgeben der ersten Daten nach dem globalen Lesen; das Eingeben der zweiten Daten im wesentlichen unmittelbar nach dem Ausgeben der ersten Daten; das lokale Selektieren der zweiten Speicherstelle; und das Speichern der zweiten Daten (d.h. die WRITE-Operation). Wo es notwendig ist, kann ein Vorladen der erforderlichen Bitleitungen durchgeführt werden, bevor die ersten Daten lokal gelesen werden (d.h. eine PRECHARGE-Operation). Aufgrund der Effizienz, die durch eine erfindungsgemäße hierarchische Speicherstruktur realisiert wird, einschließlich der Eliminierung einer zweiten PRECHARGE-Operation unmittelbar vor der WRITE-Operation, kann eine derartige PRECHARGE/READ/WRITE-Operation in weniger als einem einzigen Speicherzugriffszyklus der hierarchischen Speicherstruktur durchgeführt werden. Tatsächlich können, wo es der Zusammenhang der gesamten hierarchischen Speicherstruktur (z.B. lange Zwischenschaltungsleitungen, große Gesamtspeicherstruktur, etc.) erlaubt, mehrere PRECHARGE/READ/WRITE-Operationen in weniger als einem Speicherzugriffszyklus durchgeführt werden. Bei einer weiteren Ausführungsform dieses Verfahrens kann eine WRITE-AFER-READ-Operation durch Zwischenschalten einer PRECHARGE-Operation zwischen aufeinanderfolgende WRITE-Operationen durchgeführt werden. Diese Ausführungsform des erfindungsgemäßen Verfahrens umfasst das globale Selektieren der ersten Speicherstelle, an der die ersten Daten gespeichert werden sollen; das Vorladen von Bitleitungen, die mit der ersten Speicherstelle gekoppelt sind (PRECHARGE1-Operation); das lokale Selektieren der ersten Speicherstelle; das Speichern der ersten Daten (WRITE1-Operation); das globale Selektieren der zweiten Speicherstelle, an der die zweiten Daten gespeichert werden sollen; im wesentlichen gleichzeitig mit dem globalen Selektieren der zweiten Speicherstelle das Vorladen von Bitleitungen, die mit der zweiten Speicherstelle gekoppelt sind (PRECHARGE2-Operation); das lokale Selektieren der zweiten Speicherstelle; und das Speichern der zweiten Daten (WRITE2-Operation). Trotz der zwischengeschalteten PRECHARGE2-Operation ermöglichen es die Effizienzen, die durch eine erfindungsgemäße hierarchische Speicherstruktur bereitgestellt werden, dass eine oder mehrere WRITE-AFTER-WRITE-Operationen in weniger als einem einzigen Speicherzugriffszyklus der hierarchischen Speicherstruktur durchgeführt werden.The present invention also includes a method for obtaining dual port functionality from a single port hierarchical storage structure. One aspect of this embodiment results in a WRITE AFTER READ operation without a separate PRECHARGE cycle coupled between the READ and WRITE cycles, where the entire WRITE AFTER READ operation is performed within a memory access cycle of the hierarchical memory structure. Where first data is to be retrieved from a first storage location and second data stored at a second storage location, the method comprises locally selecting the first storage location from which the first data is to be retrieved; local reading of the first data (ie the READ operation); the global selection of the second memory location; essentially simultaneously with the global selecting, the global reading of the first data at the first memory location; outputting the first data after global reading; inputting the second data substantially immediately after outputting the first data; local selecting the second memory location; and storing the second data (ie the WRITE operation). Where necessary, precharge the required bitlines before the first data is read locally (ie a PRECHARGE operation). Due to the efficiency realized by a hierarchical memory structure according to the invention, including the elimination of a second PRECHARGE operation immediately before the WRITE operation, such a PRECHARGE / READ / WRITE operation can be performed in less than a single memory access cycle of the hierarchical memory structure. In fact, where the context of the entire hierarchical memory structure (eg, long interconnect lines, large total memory structure, etc.) permits, multiple PRECHARGE / READ / WRITE operations can be performed in less than one memory access cycle. In another embodiment of this method, a WRITE-AFER-READ operation may be performed by interposing a PRECHARGE operation between successive WRITE operations. This embodiment of the method according to the invention comprises the global selection of the first memory location at which the first data is to be stored; precharging bitlines coupled to the first memory location (PRECHARGE1 operation); local selecting the first memory location; storing the first data (WRITE1 operation); global selecting the second memory location where the second data is to be stored; substantially simultaneously with globally selecting the second memory location, precharging bitlines coupled to the second memory location (PRECHARGE2 operation); local selecting the second memory location; and storing the second data (WRITE2 operation). Despite the intermediate PRECHARGE2 operation, the efficiencies provided by a hierarchical storage structure according to the invention allow one or more WRITE AFTER WRITE operations to be performed in less than a single memory access cycle of the hierarchical storage structure.

Die vorliegende Erfindung wird durch die nachfolgende detaillierte Beschreibung der Ausführungsformen zusammen mit den beigefügten Zeichnungen besser verstanden werden.The The present invention will become apparent from the following detailed description the embodiments together with the attached Drawings are better understood.

KURZE BESCHREIBUNG DER ZEICHNUNGENBRIEF DESCRIPTION OF THE DRAWINGS

Diese und weitere Merkmale, Aspekte und Vorteile der vorliegenden Erfindung werden besser verstanden, wenn sie in Bezug auf die folgende detaillierte Be schreibung, die beigefügten Ansprüche und die begleitenden Zeichnungen betrachtet werden. Es zeigt:These and other features, aspects and advantages of the present invention will be better understood if they detail in relation to the following Description, attached Claims and the accompanying drawings are considered. It shows:

1 ein Blockdiagramm einer beispielhaften Static Random Access Memory (SRAM)-Architektur; 1 a block diagram of an exemplary static random access memory (SRAM) architecture;

2 ein allgemeines Schaltungsschema einer beispielhaften CMOS-SRAM-Speicherzelle mit sechs Transistoren; 2 a general circuit diagram of an exemplary six-transistor CMOS SRAM memory cell;

3 ein Blockdiagramm einer Ausführungsform eines hierarchischen Speichermoduls unter Verwendung lokalen Bitleitungs-Abtastens, gemäß der vorliegenden Erfindung; 3 a block diagram of an embodiment of a hierarchical memory module using local bit line scanning, according to the present invention;

4 ein Blockdiagramm einer Ausführungsform eines hierarchischen Speichermoduls unter Verwendung einer alternativen lokalen Bitleitungs-Abtastungs-Struktur; 4 a block diagram of an embodiment of a hierarchical memory module using an alternative local bitline scanning structure;

5 ein Blockdiagramm einer beispielhaften zweidimensionalen, zweistufigen hierarchischen Speicherstruktur, die mehrere lokale Bitleitungs-Abtastungs-Module der 3 verwendet; 5 a block diagram of an exemplary two-dimensional, two-stage hierarchical memory structure, the plurality of local bit line sampling modules of 3 used;

6 ein Blockdiagramm einer beispielhaften hierarchischen Speicherstruktur, das ein Speichermodul zeigt, das sowohl lokale Wortleitungs-Decodierungs- als auch lokale Bitleitungs-Abtastungs-Strukturen verwendet; 6 10 is a block diagram of an exemplary hierarchical memory structure showing a memory module using both local word line decoding and local bit line sampling structures;

7 eine perspektivische Darstellung einer hierarchischen Speicherstruktur mit einer Drei-Stufen-Hierarchie, gemäß der vorliegenden Erfindung; 7 a perspective view of a hierarchical storage structure with a three-level hierarchy, according to the present invention;

8 ein Schaltungsschema eines asynchron zurücksetzbaren Decoders gemäß einem Aspekt der vorliegenden Erfindung; 8th a circuit diagram of an asynchronously resetable decoder according to an aspect of the present invention;

9 ein Schaltungsschema einer Treiberschaltung mit begrenzter Schwankung gemäß einem Aspekt der vorliegenden Erfindung; 9 a circuit diagram of a limited fluctuation driver circuit according to one aspect of the present invention;

10 ein Schaltungsschema einer einpolig geerdeten Leseverstärker-Schaltung mit Abtast- und Haltereferenz (Sample-and-Hold Reference) gemäß einem Aspekt der vorliegenden Erfindung; 10 a circuit diagram of a single-ended sense amplifier sample and hold reference (SAMPLE) reference circuit according to one aspect of the present invention;

11 ein Schaltungsschema einer Charge-Share, schwankungsbegrenzten Treiber-Leseverstärker-Schaltung gemäß einem Aspekt der vorliegenden Erfindung; 11 a circuit diagram of a charge-share, fluctuation-limited driver-sense amplifier circuit according to one aspect of the present invention;

12 ein Blockdiagramm, das eine Ausführungsform hierarchischer Speichermodul-Redundanz zeigt; 12 a block diagram showing an embodiment of hierarchical memory module redundancy;

13 ein Blockdiagramm, das eine andere Ausführungsform hierarchischer Speichermodul-Redundanz zeigt; 13 a block diagram showing another embodiment of hierarchical memory module redundancy;

14 ein Blockdiagramm einer Speicherredundanz-Vorrichtung, das eine weitere Ausführungsform hierarchischer Speichermodul-Redundanz zeigt; 14 a block diagram of a memory redundancy device, the another embodiment of hierarchical memory module redundancy shows;

15A eine Diagrammdarstellung des Signalflusses eines beispielhaften fehlerlosen Speichermoduls mit spaltenorientierter Redundanz; 15A a diagram of the signal flow of an exemplary error-free memory module with column-oriented redundancy;

15B eine Diagrammdarstellung des verschobenen Signalflusses des beispielhaften fehlerhaften Speichermoduls, das in 15A gezeigt ist; 15B 5 is a diagrammatic representation of the shifted signal flow of the exemplary faulty memory module which is shown in FIG 15A is shown;

16 ein verallgemeinertes Blockdiagramm einer Redundanz-Auswählschaltung, das eine weitere Ausführungsform der hierarchischen Speichermodul-Redundanz zeigt; 16 a generalized block diagram of a redundancy selection circuit showing another embodiment of the hierarchical memory module redundancy;

17 ein Schaltungsschema einer Ausführungsform eines globalen Zeilendecoders mit Zeilenredundanz gemäß der vorliegenden Erfindung; 17 a circuit diagram of an embodiment of a global row decoder with row redundancy according to the present invention;

18 ein Blockdiagramm, das Dual Port Funktionalität in einer hierarchischen Speicherstruktur mit Single Port unter Verwendung hierarchischer Speichermodule gemäß der vorliegenden Erfindung zeigt. 18 12 is a block diagram showing dual port functionality in a single port hierarchical memory structure using hierarchical memory modules according to the present invention.

19 ein schematisches Diagramm einer Ausführungsform einer hochgenauen Verzögerungsmessschaltung gemäß der vorliegenden Erfindung; 19 a schematic diagram of an embodiment of a high-precision delay measurement circuit according to the present invention;

20 ein vereinfachtes Blockdiagramm eines Aspekts der vorliegenden Erfindung unter Verwendung einer Ausführungsform einer Diffusionsreplikations-Verzögerungsschaltung; 20 a simplified block diagram of an aspect of the present invention using an embodiment of a diffusion replication delay circuit;

21 ein vereinfachtes Blockdiagramm eines Aspekts der vorliegenden Erfindung unter Verwendung einer weiteren Ausführungsform einer Diffusionsreplikations-Verzögerungsschaltung; 21 a simplified block diagram of an aspect of the present invention using a further embodiment of a diffusion replication delay circuit;

22A ein schematisches Diagramm eines weiteren Aspekts einer Ausführungsform der vorliegenden Erfindung unter Verwendung einer Hochgeschwindigkeits-Datentransfer-Busschaltung mit niedriger Energie; und 22A a schematic diagram of another aspect of an embodiment of the present invention using a high-speed low-energy data transfer bus circuit; and

22B ein schematisches Diagramm eines weiteren Aspekts einer Ausführungsform der vorliegenden Erfindung unter Verwendung einer Hochgeschwindigkeits-Datentransfer-Busschaltung mit niedriger Energie. 22B a schematic diagram of another aspect of an embodiment of the present invention using a high-speed low-power data transfer bus circuit.

DETAILLIERTE BESCHREIBUNG DER AUSFÜHRUNGSFORMENDETAILED DESCRIPTION THE EMBODIMENTS

Wie der Fachmann weiß, weisen die meisten VLSI-Systeme einschließlich Kommunikationssystemen und DSP-Vorrichtungen VLSI-Speicher-Untersysteme auf. Moderne Anwendungen von VLSI-Speicher-Untersystemen erfordern nahezu durchwegs hocheffiziente Hochleistungsimplementierungen, die Gestaltungskompromisse bei Layout-Effizienz, Geschwindigkeit, Energieverbrauch, Skalierbarkeit, Designtoleranzen und ähnlichem erhöhen. Die vorliegende Erfindung verringert diese Kompromisse durch Verwendung einer neuartigen hierarchischen Architektur. Das Speichermodul der vorliegenden Erfindung kann auch einen oder mehrere neuartige Bestandteile einsetzen, die weiter zur Effizienz und Robustheit der Speichermodule beitragen.As the expert knows Most VLSI systems include communication systems and DSP devices include VLSI memory subsystems. Modern applications VLSI memory subsystems almost always require high efficiency High performance implementations, design compromises in layout efficiency, Speed, power consumption, scalability, design tolerances and the like increase. The present invention reduces these trade-offs by use a novel hierarchical architecture. The memory module of The present invention may also include one or more novel ingredients use that further enhances the efficiency and robustness of the memory modules contribute.

Im folgenden ist es, jedoch nur zu Zwecken der Darstellung, hilfreich, die verschiedenen Aspekte und Ausführungsformen der vorliegenden Erfindung im Zusammenhang mit einer SRAM-Speicherstruktur zu beschreiben, die CMOS-SRAM-Speicherzellen verwendet. Für den Fachmann ist es jedoch selbstverständlich, dass die vorliegende Erfindung nicht auf Verfahren auf CMOS-Basis beschränkt ist, und dass die vorliegenden Aspekte und Ausführungsformen mutatis mutandis auch in von SRAM verschiedenen Kategorien von Speicherprodukten, einschließlich, jedoch nicht beschränkt auf, DRAM, ROM, PLA und ähnlichem, egal ob in einem VLSI-System eingebettet oder als eigenständige Speichervorrichtung, verwendet werden können.in the the following is helpful, but only for purposes of illustration, the various aspects and embodiments of the present invention To describe the invention in the context of an SRAM memory structure, uses the CMOS SRAM memory cells. For the However, it is obvious to a person skilled in the art that the present invention Invention is not limited to CMOS-based methods, and that the present aspects and embodiments are mutatis mutandis also in SRAM different categories of memory products, including, but not limited on, DRAM, ROM, PLA and the like, whether in a VLSI system embedded or as independent Storage device, can be used.

BEISPIELHAFTES SRAM-MODUL UND BEISPIELHAFTE SPEICHERZELLEEXEMPLARY SRAM MODULE AND EXAMPLE STORAGE CELL

1 ist ein funktionales Blockdiagramm der SRAM-Speicherstruktur 100, das die Grundmerkmale der meisten SRAM-Untersysteme aufzeigt. Das Modul 100 weist einen Speicherkern 102, eine Wortleitungssteuerung 104, eine Vorladungs-Steuerung 112, Speicheradresseingänge 114 und eine Bitleitungs-Steuervorrichtung 116 auf. Der Speicherkern 102 ist aus einem zweidimensionalen Array von K-Bits von Speicherzellen 103 zusammengesetzt, der so angeordnet ist, dass er C Spalten und R Zeilen von Bitspeicherstellen aufweist, wobei K = (C × R). Die üblichste Konfiguration des Speicherkerns 102 verwendet eine Einzelwortleitung 106, um Zellen 103 auf gepaarten differentialen Bitleitungen 118 zu verbinden. Im allgemeinen ist der Kern 102 als Array von 2^P Wortleitungen angeordnet, basierend auf einem Satz von P Speicheradresseingangsleitungen 114, d.h. R = 2^P. Daher wird die p-Bit Adresse von dem Zeilenadressdecoder 110 und dem Spaltenadressdecoder 122 decodiert. Der Zugriff auf eine gegebene Speicherzelle 103 wird in einem derartigen Einzelkern-Speicher durch Aktivieren der Spalte 105 und der Zeile 106 entsprechend der Zelle 103 durchgeführt. Die Spalte 105 wird durch Auswählen, und Schalten, aller Bitleitungen in der bestimmten Spalte entsprechend der Zelle 103 aktiviert. 1 is a functional block diagram of the SRAM memory structure 100 which shows the basic features of most SRAM subsystems. The module 100 has a memory core 102 , a wordline control 104 , a precharge control 112 , Memory address inputs 114 and a bit line control device 116 on. The memory core 102 is a two-dimensional array of K bits of memory cells 103 arranged to have C columns and R rows of bit storage locations, where K = (C × R). The most common configuration of the storage core 102 uses a single word line 106 to cells 103 on paired differential bitlines 118 connect to. In general, the core is 102 arranged as an array of 2 ^P word lines, based on a set of P memory address input lines 114 , ie R = 2 ^P. Therefore, the p-bit address of the row address decoder 110 and the column address decoder 122 decoded. The access to a given memory cell 103 is in such a single-core memory by activating the column 105 and the line 106 according to the cell 103 carried out. The gap 105 is selected by, and switching, all of the bitlines in the particular column corresponding to the cell 103 activated.

Die bestimmte Zeile, auf die zugegriffen werden soll, wird durch selektives Aktivieren des Zeilenadressdecoders 110 ausgewählt, und entspricht normalerweise nur einer vorgegebenen Zeile, oder Wortleitung, die alle Zellen 103 in der bestimmten Zeile umfasst. Der Worttreiber 108 kann die ausgewählte Wortleitung 106 so treiben, dass die ausgewählte Speicherzelle 103 auf einem bestimmten Paar von Bit leitungen 118 beschrieben oder ausgelesen werden kann, gemäß der an die Speicheradresseingänge 114 gelieferten Bitadresse.The particular row to be accessed is enabled by selectively activating the row address decoder 110 is selected, and usually corresponds to only one given line, or word line, all cells 103 in the particular line. The word driver 108 can select the selected word line 106 so drive that the selected memory cell 103 on a particular pair of bit lines 118 can be written or read according to the memory address inputs 114 supplied bit address.

Die Bitleitungs-Steuervorrichtung 116 kann Vorladungs-Zellen 120, Spalten-Multiplexer 122, Leseverstärker 124 und Eingangs-/Ausgangs-Puffer 126 aufweisen. Da differentiale Lesen/Schreiben-Schemata typischerweise für Speicherzellen verwendet werden, ist es erwünscht, dass Bitleitungen in einen definierten Zustand versetzt werden, bevor auf sie zugegriffen wird. Vorladungs-Zellen 120 können verwendet werden, um den Zustand der Bitleitungen 118 durch einen PRECHARGE-Zyklus gemäß einem vordefinierten Vorladungs-Schema einzurichten. In einem statischen Vorladungs-Schema können die Vorladungs-Zellen 120 ständig angelassen werden. Obwohl es oft einfach zu implementieren ist, kann das statische Vorladen der aktiven Operation der Vorrichtung eine große Energielast aufbürden. Dynamische Vorladungs-Schemata können zum Laden der Bitleitungen getaktete Vorladungs-Zellen 120 verwenden und können so das Energiebudget der Struktur 100 reduzieren. Zusätzlich zum Herstellen eines definierten Zustands auf den Bitleitungen 118 können die Bitleitungen 120 auch verwendet werden, um eine Angleichung von Differentialspannungen auf den Bitleitungen 118 vor einer Lese-Operation zu bewirken. Leseverstärker 124 ermöglichen es, dass die Größe der Speicherzelle 103 durch Abtasten der Differentialspannung auf der Bitleitung 118, die deren Zustand angibt, und durch Umwandeln dieser Differentialspannung in ein Signal mit logischem Pegel reduziert wird.The bit line control device 116 can pre-charge cells 120 , Column multiplexer 122 , Sense amplifier 124 and input / output buffers 126 exhibit. Since differential read / write schemes are typically used for memory cells, it is desirable that bitlines be put into a defined state before being accessed. Precharge cells 120 can be used to control the state of the bitlines 118 through a PRECHARGE cycle according to a predefined precharge scheme. In a static precharge scheme, the precharge cells 120 be started constantly. Although often easy to implement, static precharging of the active operation of the device can impose a large energy load. Dynamic precharge schemes may use precharge cells clocked to charge the bitlines 120 use and so can the energy budget of the structure 100 to reduce. In addition to establishing a defined state on the bitlines 118 can the bitlines 120 also used to approximate differential voltages on the bitlines 118 before a read operation. sense amplifier 124 allow it to be the size of the memory cell 103 by sampling the differential voltage on the bit line 118 , which indicates its state, and is reduced by converting this differential voltage into a logic-level signal.

Im allgemeinen wird eine READ-Operation durch Aktivieren des Zeilendecoders 110 durchgeführt, der eine bestimmte Zeile auswählt. Die Ladung auf einer Bitleitung 118 jedes Paars von Bitleitungen in jeder Spalte entlädt sich durch die aktivierte Speicherzelle 103, die den Zustand der aktiven Zellen 103 in dieser Spalte 105 repräsentiert. Der Spaltendecoder 122 aktiviert nur eine der Spalten und verbindet die Bitleitungen 118 mit dem Eingangs-/Ausgangs-Puffer 126. Die Leseverstärker 124 stellen die Treiberfähigkeit zum Liefern von Strom an den Eingangs-/Ausgangs-Puffer 126 zur Verfügung. Wenn der Leseverstärker 124 aktiviert wird, führen die unsymmetrischen Bitleitungen 118 dazu, dass der symmetrische Leseverstärker auf den Zustand der Bitleitungen hin ausgelöst wird, und Daten 125 werden von dem Puffer 126 ausgegeben.In general, a READ operation is performed by activating the row decoder 110 performed selecting a particular line. The charge on a bit line 118 each pair of bitlines in each column discharges through the activated memory cell 103 indicating the state of active cells 103 in this column 105 represents. The column decoder 122 activates only one of the columns and connects the bitlines 118 with the input / output buffer 126 , The sense amplifiers 124 provide the driver capability to provide power to the input / output buffer 126 to disposal. If the sense amplifier 124 is activated, lead the unbalanced bit lines 118 causing the balanced sense amplifier to be triggered on the state of the bit lines, and data 125 be from the buffer 126 output.

Eine WRITE-Operation wird durch Anlegen der Daten 125 an die Eingangs/Ausgangs-Puffer 126 durchgeführt. Vor der WRITE-Operation werden die Bitleitungen 118 von Vorladungs-Zellen 120 auf einen vorgegebenen Wert vorgeladen. Das Anlegen von Eingangsdaten 125 an die Eingangs-/Ausgangs-Puffer 126 führt dazu, dass sich die Vorladungs-Spannung auf einer der Bitleitungen 118 entlädt, wodurch sich eine Bitleitungs-Logik HIGH (HOCH) und eine Bitleitungs-Logik LOW (NIEDRIG) ergibt. Der Spaltendecoder 122 wählt eine bestimmte Spalte 105, die die Bitleitung 118 mit den Eingangs-/Ausgangs-Puffern 126 verbindet, aus, wodurch eine der Bitleitungen 118 entladen wird. Der Zeilendecoder 110 wählt eine bestimmte Zeile aus, und die Informationen auf den Bitleitungen 118 werden am Schnittpunkt der Spalte 105 mit der Zeile 106 in die Zelle 103 geschrieben. Zu Beginn eines typischen internen Timing-Zyklusses wird das Vorladen deaktiviert und erst wieder aktiviert, wenn die ganze Operation durchgeführt ist. Der Spaltendecoder 122 und der Zeilendecoder 110 werden dann aktiviert, gefolgt von der Aktivierung des Leseverstärkers 124. Zum Abschluss einer READ- oder einer WRITE-Operation wird der Leseverstärker 124 deaktiviert. Darauf folgt das Deaktivieren der Decoder 110, 122; zu diesem Zeitpunkt werden die Vorladungs-Zellen 120 während eines folgenden PRECHARGE-Zyklusses wieder aktiviert. Im allgemeinen führt das Aktivierthalten des Leseverstärkers 124 während der gesamten READ/WRITE-Operation zu sehr hohem Energieverbrauch der Vorrichtung, weil der Leseverstärker 124 nur während der tatsächlich für das Abtasten des Zustands der Speicherzelle 103 erforderlichen Zeit aktiv zu sein braucht.A WRITE operation is done by creating the data 125 to the input / output buffers 126 carried out. Before the WRITE operation, the bitlines become 118 of precharge cells 120 preloaded to a predetermined value. The creation of input data 125 to the input / output buffers 126 causes the precharge voltage on one of the bitlines 118 discharges, resulting in a bit line logic HIGH and a bit line logic LOW. The column decoder 122 chooses a specific column 105 that the bit line 118 with the input / output buffers 126 connects, out, causing one of the bitlines 118 unloaded. The row decoder 110 selects a particular line and the information on the bitlines 118 be at the intersection of the column 105 with the line 106 into the cell 103 written. At the beginning of a typical internal timing cycle, the precharge is disabled and not activated again until the entire operation has been performed. The column decoder 122 and the row decoder 110 are then activated, followed by the activation of the sense amplifier 124 , At the end of a READ or WRITE operation, the sense amplifier becomes 124 disabled. This is followed by disabling the decoder 110 . 122 ; at this time are the pre-charge cells 120 re-activated during a subsequent PRECHARGE cycle. In general, activating the sense amplifier will result 124 during the whole READ / WRITE operation very high power consumption of the device because of the sense amplifier 124 only while actually for scanning the state of the memory cell 103 needed time to be active.

2 zeigt eine Implementierung der Speicherzelle 103 in 1 in Form einer CMOS-Zelle 200 mit sechs Transistoren. Die Transistorzelle 200 ist eine Art von Transistor, die auch bei Ausführungsformen der vorliegenden Erfindung verwendet werden kann. Die SRAM-Zelle 200 kann in einem von drei möglichen Zuständen vorliegen: (1) im STABLE (STABIL)-Zustand, in dem die Zelle 200 einen Signalwert hat, die einer logischen „1" oder logischen „0" entspricht; (2) im READ-Operation-Zustand; oder (3) im WRITE-Operation-Zustand. Im STABLE-Zustand ist die Speicherzelle 200 effektiv von dem Speicherkern (z.B. dem Kern 102 in 1) getrennt. Die Bitleitungen 202, 204 werden zu HIGH vorgeladen (logische „1"), bevor eine Operation (READ oder WRITE) stattfinden kann. Die Zeilenauswähl-Transistoren 206, 208 werden während des Vorladens ausgeschaltet. Die Vorladungs-Energie wird durch Vorladungs-Zellen (nicht gezeigt) geliefert, die mit den Bitleitungen 202, 204, ähnlich den Vorladungszellen 12 in 1, verbunden sind. Eine READ-Operation wird durch Durchführen eines PRECHARGE-Zyklusses initiiert, wodurch die Bitleitungen 202, 204 auf logisch HIGH vorgeladen und die Wortleitung 205 unter Verwendung der Zeilenauswähl-Transistoren 206, 208 aktiviert wird. Eine der Bitleitungen 202, 204 entlädt sich durch die Bit-Zelle 200, und eine Differentialspannung wird zwischen den Bitleitungen 202, 204 erzeugt. Diese Spannung wird abgefühlt und auf logische Pegel verstärkt. Eine WRITE-Operation in der Zelle 200 wird nach einem weiteren PRECHARGE-Zyklus durch Treiben der Bitleitungen 202, 204 in den erforderlichen Zustand und Aktivieren der Wortleitung 205 durchgeführt. CMOS ist eine erwünschte Technologie, da der von einer derartigen SRAM-Zelle abgezogene Strom typischerweise auf den Leckstrom der Transistoren 201a–d begrenzt ist, wenn sie im STABLE-Zustand sind. 2 shows an implementation of the memory cell 103 in 1 in the form of a CMOS cell 200 with six transistors. The transistor cell 200 is a type of transistor that may also be used in embodiments of the present invention. The SRAM cell 200 may be in one of three possible states: (1) in the STABLE state in which the cell 200 has a signal value corresponding to a logical "1" or logical "0"; (2) in the READ operation state; or (3) in the WRITE operation state. In the STABLE state is the memory cell 200 effectively from the memory core (eg the core 102 in 1 ) separated. The bitlines 202 . 204 are precharged to HIGH (logic "1") before any operation (READ or WRITE) can take place The row select transistors 206 . 208 are switched off during pre-charging. The precharge energy is supplied by precharge cells (not shown) connected to the bitlines 202 . 204 , similar to the precharge cells 12 in 1 , are connected. A READ operation is initiated by performing a PRECHARGE cycle, whereby the bitlines 202 . 204 Logically HIGH summoned and the word line 205 using the row select transistors 206 . 208 is activated. One of the bit lines 202 . 204 discharges through the bit cell 200 , and a differential Voltage will be between the bit lines 202 . 204 generated. This voltage is sensed and amplified to logic levels. A WRITE operation in the cell 200 becomes after another PRECHARGE cycle by driving the bitlines 202 . 204 in the required state and activate the word line 205 carried out. CMOS is a desirable technology because the current drawn from such a SRAM cell is typically due to the leakage current of the transistors 201a-d is limited when they are in the STABLE state.

Mit dem Anwachsen der Speicherzelldichte und mit der weiteren Integration von Speicherkomponenten in komplexere Systeme wird es zwingend erforderlich, Speicherarchitekturen zur Verfügung zu stellen, die robust, zuverlässig, schnell und bereichs- und leistungseffizient sind. Einzelkern-Architekturen, ähnlich denen, die in 1 dargestellt sind, sind in zunehmendem Maße nicht mehr fähig, die Leistungs-, Geschwindigkeits-, Bereichs- und Robustheitsauflagen für eine gegebene Hochleistungs-Speicheranwendung zu erfüllen. Daher ist es erwünscht, den Energieverbrauch zu minimieren, die Vorrichtungsgeschwindigkeit zu erhöhen, und die Zuverlässigkeit und Robustheit der Vorrichtung zu verbessern, und es wurden zahlreiche Ansätze zu diesem Zweck entwickelt. Die Vorteile der vorliegenden Erfindung können im nachfolgenden Zusammenhang mit einigen dieser Ansätze besser verstanden werden, insbesondere, da sie sich auf Energiereduzierung und Geschwindigkeitsverbesserung sowie auf Redundanz und Robustheit beziehen.With the growth of memory cell density and the further integration of memory components into more complex systems, it becomes imperative to provide memory architectures that are robust, reliable, fast, and space and power efficient. Single-core architectures similar to those found in 1 are increasingly unable to meet the performance, speed, range, and robustness constraints for a given high performance storage application. Therefore, it is desirable to minimize power consumption, increase device speed, and improve the reliability and robustness of the device, and numerous approaches have been developed for this purpose. The advantages of the present invention may be better understood in the following context with some of these approaches, particularly as they relate to energy reduction and speed improvement as well as redundancy and ruggedness.

ENERGIEREDUZIERUNG UND GESCHWINDIGKEITSVERBESSERUNGENERGY REDUCTION AND SPEED IMPROVEMENT

Unter Bezug auf 1 wird der Inhalt der Speicherzelle 103 des Speicherblocks 100 in dem Leseverstärker 102 unter Verwendung eines Differentialsignals zwischen den Bitleitungen 104, 106 ermittelt. Diese Architektur ist jedoch nicht skalierbar. Auch gibt es, wenn der Speicherblock 100 vergrößert wird, praktische Einschränkungen der Fähigkeit des Leseverstärkers 102, ein angemessenes Signal rechtzeitig an den Bitleitungen 104, 106 zu empfangen. Das Vergrößern der Länge der Bitleitungen 104, 106 erhöht die assoziierte Bitleitungs-Kapazität und somit die Zeit, die ein Signal braucht, um sich in den Bitleitungen 104, 106 zu entwickeln. Die Leitungen 104, 106 müssen mit mehr Energie versorgt werden, um die zusätzliche Kapazität zu überwinden. Auch dauert es bei den Architekturen des Standes der Technik länger, längere Bitleitungen vorzuladen, wodurch die effektive Vorrichtungsgeschwindigkeit reduziert wird. Ähnlich erfordert das Schreiben in längere Bitleitungen 104, 106, wie man sie im Stand der Technik antrifft, längeres Vorladen, wodurch der Energiebedarf der Schaltung erhöht und die effektive Vorrichtungsgeschwindigkeit weiter reduziert wird.With reference to 1 becomes the content of the memory cell 103 of the memory block 100 in the sense amplifier 102 using a differential signal between the bit lines 104 . 106 determined. However, this architecture is not scalable. Also, there is when the memory block 100 is increased, practical limitations of the ability of the sense amplifier 102 , an appropriate signal in time on the bit lines 104 . 106 to recieve. Increasing the length of the bitlines 104 . 106 increases the associated bit-line capacitance and thus the time it takes for a signal to propagate in the bitlines 104 . 106 to develop. The wires 104 . 106 need more energy to overcome the extra capacity. Also, the architectures of the prior art take longer to precharge longer bitlines, thereby reducing the effective device speed. Similarly, writing into longer bit lines requires 104 . 106 as encountered in the prior art, longer precharge, which increases the power requirements of the circuit and further reduces the effective device speed.

Im allgemeinen kann ein reduzierter Energieverbrauch in Speichervorrichtungen wie der Struktur 100 in 1 dadurch erreicht werden, dass beispielsweise die gesamte Schaltkapazität reduziert wird und Spannungsschwankungen minimiert werden. Die Vorteile der Energiereduzierungs-Aspekte bestimmter Ausführungsformen der vorliegenden Erfindung können im Zusammenhang mit der Reduzierung der Schaltkapazität und der Begrenzung der Spannungsschwankung besser verstanden werden.In general, a reduced power consumption in memory devices such as the structure 100 in 1 be achieved, for example, that the entire switching capacity is reduced and voltage fluctuations are minimized. The advantages of the energy reduction aspects of certain embodiments of the present invention may be better understood in the context of reducing switching capacitance and limiting voltage fluctuation.

REDUZIERUNG DER SCHALTKAPAZITÄTREDUCTION OF SWITCHING CAPACITY

Mit der Erhöhung der Bitdichte von Speicherstrukturen geht die Beobachtung einher, dass Einzelkern-Speicherstrukturen mit jedem Speicherzugriff verbundene hohe Schaltkapazitäten aufweisen können, die nicht zu akzeptieren sind. Der Zugriff auf eine Bitstelle in einem derartigen Einzelkern-Speicher erfordert das Aktivieren der gesamten Zeile, oder Wortleitung, in der die Daten gespeichert sind, sowie das Schalten aller Bitleitungen in der Struktur. Es ist daher erwünscht, Hochleistungs-Speicherstrukturen zu gestalten, um die gesamte Schaltkapazität während eines gegebenen Zugriffs zu reduzieren.With the increase the density of memory structures is accompanied by observation that single-core memory structures associated with each memory access high switching capacities can have that are not acceptable. Access to a bit position in Such a single core memory requires activating the entire line, or word line, in which the data is stored, as well the switching of all bitlines in the structure. It is therefore desirable to have high performance memory structures to configure the total switching capacity during a given access to reduce.

Zwei bekannte Ansätze zur Reduzierung der gesamten Schaltkapazität während eines Speicherstruktur-Zugriffs umfassen das Aufteilen einer Einzelkem-Speicherstruktur in eine Bank-Speicherstruktur und das Verwenden aufgeteilter Wortleitungsstrukturen. Bei dem ersten Ansatz ist es notwendig, nur die bestimmte Speicherbank, die mit der interessierenden Speicherzelle verbunden ist, zu aktivieren. Bei dem zweiten Ansatz wird die Schaltkapazität durch Lokalisieren der Wortleitungsaktivierung im höchsten praktizierbaren Ausmaß reduziert.Two known approaches to reduce the total switching capacity during a memory structure access include dividing a single core memory structure into one Bank memory structure and using shared wordline structures. In the first approach, it is necessary to use only the particular memory bank, which is connected to the memory cell of interest. In the second approach, the switching capacity is achieved by locating the wordline activation in the highest practicable Extent reduced.

Geteilter oder Bank-SpeicherkernShared or bank memory core

Ein Ansatz zum Reduzieren von Schaltkapazitäten ist es, den Speicherkern in getrennt schaltbare Banken von Speicherzellen aufzuteilen. Typischerweise ist die gesamte Schaltkapazität während eines gegebenen Speicherzugriffs für Bank-Speicherkerne umgekehrt proportional zur Anzahl der verwendeten Banken. Durch vernünftiges Auswählen der Anzahl und der Platzierung der Bankeinheiten innerhalb eines gegebenen Speicherkern-Designs, sowie der Art der verwendeten Decodierung, kann die gesamte Schaltkapazität, und somit die gesamte von dem Speicherkern verbrauchte Energie, in hohem Maße reduziert werden. Ein Bank-Design kann auch zu einem höheren Produktausstoß führen, weil die Speicherbänke so angeordnet werden können, dass eine defekte Bank funktionslos und zugriffsunfähig wird, während die verbleibenden funktionsfähigen Banken des Speicherkerns in ein Produkt mit niedrigerer Kapazität gepackt werden können.One The approach to reducing switching capacity is to use the memory core split into separate switchable banks of memory cells. typically, is the total switching capacity while a given memory access for bank memory cores vice versa proportional to the number of banks used. By reasonable Choose the number and placement of banking units within a bank given memory core designs, as well as the type of decoding used, can the total switching capacity, and thus the total energy consumed by the memory core, greatly reduced become. A bank design can also lead to higher product output because the memory banks can be arranged that a defective bank becomes inoperative and inaccessible, while the remaining operational banks of the memory core packed into a lower capacity product can be.

Bank-Designs sind jedoch für gewisse Anwendungen nicht geeignet. Geteilte Speicherkerne erfordern eine zusätzliche Decodierungs-Schaltung, um selektiven Zugriff auf einzelne Bänke zu ermöglichen, was im Ergebnis zu einer Verzögerung führt. Auch verwenden viele Bank-Designs Speichersegmente, die lediglich verkleinerte Versionen traditioneller monolithischer Kernspeicherdesigns sind, bei denen jedes Segment eine festgeschaltete Steuerungs-, Vorladungs-, Decodierungs-, Abtast- und Treiberschaltung aufweist. Diese Schaltungen verbrauchen sowohl im Standby- als auch im Betriebsmodus tendenziell viel mehr Energie als ihre assoziierten Speicherzellen. Solche Bankstrukturen mögen einfach zu entwerfen sein, aber die zusätzliche Komplexität und der zusätzliche Energieverbrauch können die Gesamtleistung der Speicherkomponenten reduzieren.Bank designs are however for certain applications are not suitable. Require shared storage cores an additional Decoding circuitry to allow selective access to individual banks which resulted in a delay leads. Also Many bank designs use memory segments that are just downsized Versions of traditional monolithic core memory designs are, where each segment has a dedicated control, precharge, Decoding, sampling and driver circuit having. These circuits consume both in standby mode and in operation mode tends to consume much more energy than their associated storage cells. Such bank structures like simple to be design, but the extra complexity and the extra Energy consumption can reduce the overall performance of the storage components.

Aufgrund ihrer Natur sind Bank-Designs nicht dazu geeignet, vergrößert zu werden, damit sie große Design-Erfordernisse in sich aufnehmen. Es ist auch möglich, dass traditionelle Bank-Designs nicht leicht an Anwendungen angepasst werden können, die eine Speicherkern-Konfiguration benötigen, die sich von der zugrundeliegenden Speicherbank-Struktur wesentlich unterscheidet (z.B. eine Speicherstruktur, die relativ wenig Zeilen von Wortlängen mit sehr langer Bitlänge benötigt). Bevorzugte Ausführungsformen der vorliegenden Erfindung stützen sich nicht auf eine Aufteilung der Grundspeicherstruktur von oben nach unten unter Verwendung von Bankspeicher-Designs, sondern stellen eine hierarchische Speicherstruktur bereit, die durch Verwendung eines Ansatzes von unten nach oben synthetisiert wird, durch hierarchisches Koppeln der Grundspeichermodule mit lokalisierten Entscheidungsfindungs-Merkmalen, die synergistisch zusammenwirken, um den Gesamtenergiebedarf drastisch zu reduzieren und die Arbeitsgeschwindigkeit der Struktur zu verbessern. Als Minimum kann ein derartiges hierarchisches Grundmodul lokalisiertes Bitleitungs-Abtasten aufweisen.by virtue of By their nature, bank designs are not likely to be magnified too be great for them Take in design requirements. It is also possible that Traditional bank designs are not easily adapted to applications can be which require a memory core configuration different from the underlying one Memory bank structure (e.g., a memory structure, which requires relatively few lines of very long bit length words). Preferred embodiments support the present invention not on a division of the basic storage structure from above down using bank memory designs, but ask a hierarchical storage structure prepared by use of a bottom-up approach is synthesized by hierarchical Coupling the basic memory modules with localized decision-making features, which work synergistically to drastically reduce the overall energy requirements reduce and improve the working speed of the structure. As a minimum, such a hierarchical basic module can be located Having bit line scanning.

Geteilte WortleitungShared word line

Häufig wird die Bitweite eines Speicherbauteils so dimensioniert, dass sie eine bestimmte Wortlänge aufnehmen kann. Mit der Zunahme der Wortlänge für ein bestimmtes Design nehmen auch die damit verbundenen Wortleitungs-Verzögerungen, die Schaltkapazität, der Energieverbrauch, etc. zu. Zur Aufnahme sehr langer Wortleitungen kann es wünschenswert sein, speicherumspannende globale Wortleitungen in lokale Wortleitungen aufzuteilen, die jeweils aus kleineren Gruppen be nachbarter, wortorientierter Speicherzellen bestehen. Jede lokale Gruppe verwendet lokale Decodierungs- und Treiberbauteile zur Erzeugung der lokalen Wortleitungssignale, wenn die globale Wortleitung, mit der sie verbunden ist, aktiviert ist. Bei Anwendungen mit großen Wortlängen kann der zusätzliche Überhang, der sich durch die geteilten Wortleitungen ergibt, durch reduzierte Wortleitungs-Verzögerungen, Energieverbrauch, etc. ausgeglichen werden. Der zusätzliche Überhang, der sich durch bestehende geteilte Wortleitungs-Schemata ergibt, kann dies jedoch für viele Implementierungen ungeeignet machen. Wie bereits vorher stellt eine bestimmte bevorzugte Ausführungsform der vorliegenden Erfindung, anstatt die traditionelle Aufteilung von Wortleitungen von oben nach unten zu verwenden, eine lokale Wortleitung für das vorgenannte Grundspeichermodul bereit, was die lokalen Entscheidungsfindungsmerkmale des Moduls weiter verbessert. Wie vorher werden hier durch die Verwendung eines Ansatzes von unten nach oben, um Grundspeichermodule hierarchisch zu koppeln, mit den zusätzlichen lokalisierten Entscheidungsfindungsmerkmalen lokaler Wortleitungen gemäß der vorliegenden Erfindung zusätzliche Synergien realisiert, die den Gesamtenergieverbrauch und die Signalausbreitungszeiten weiter reduzieren.Frequently becomes the bit width of a memory device is dimensioned to be a certain word length can record. With the increase in word length for a particular design take also the associated word line delays, the switching capacity, the energy consumption, etc. too. For recording very long word lines, it may be desirable be memory-spanning global word lines in local word lines divided, each of smaller groups be nachbarter, word-oriented Memory cells exist. Each local group uses local decoding and driver components for generating the local wordline signals when the global wordline to which it is connected is enabled. For applications with large word length can the extra overhang, which results from the shared word lines, by reduced Word-line delays Energy consumption, etc. are compensated. The extra overhang, that results from existing shared wordline schemes, However, this can be for make many implementations inappropriate. As previously stated a particular preferred embodiment of the present invention, rather than the traditional layout to use wordlines from top to bottom, a local one Word line for that aforementioned basic memory module prepared what the local decision-making features of the module further improved. As before, here are by use a bottom-up approach to hierarchical to basic memory modules pair, with the extra localized decision-making features of local wordlines according to the present Invention additional synergies realizes the total energy consumption and the signal propagation times further reduce.

SPANNUNGSSCHWANKUNGS-REDUZIERUNGS-TECHNIKENVOLTAGE Surge REDUCTION TECHNIQUES

Energiereduzierung kann auch durch Reduzieren der Spannungsschwankungen erreicht werden, die sich in der gesamten Struktur ergeben. Durch das Begrenzen von Spannungsschwankungen ist es möglich, die Energiemenge, die verbraucht wird, wenn die Spannung an einem Knoten oder einer Leitung während eines bestimmten Ereignisses oder einer bestimmten Operation abfällt, zu reduzieren, sowie die Energiemenge, die erforderlich ist, um die verschiedenen abgefallenen Spannungen nach dem bestimmten Ereignis oder der bestimmten Operation, oder vor dem nächsten Zugriff, wieder auf den gewünschten Zustand zu bringen, zu reduzieren. Zwei Techniken weisen zu diesem Zweck das Verwenden gepulster Wortleitungen sowie Leseverstärker-Spannungsschwankungs-Reduzierung auf.energy reduction can also be achieved by reducing the voltage fluctuations, which arise throughout the structure. By limiting of Voltage fluctuations it is possible the amount of energy that is consumed when the voltage is at one Node or a wire during of a particular event or operation reduce, as well as the amount of energy that is required to the various dropped voltages after the particular event or the particular operation, or before the next access the wished To bring state to reduce. Two techniques point to this Purpose to use pulsed word lines as well as sense amplifier voltage swing reduction on.

Gepulste WortleitungenPulsed word lines

Durch Aktivieren einer Wortleitung gerade lange genug, um die Differentialspannung über einer ausgewählten Speicherzelle korrekt zu ermitteln, ist es möglich, die Bitleitungs-Spannungsentladung entsprechend einer READ-Operation in der ausgewählten Zelle zu reduzieren. Bei einigen Ausgestaltungen wird, durch Anlegen eines gepulsten Signals an die assoziierte Wortleitung während eines ausgewählten Intervalls, ein Leseverstärker nur während dieses Intervalls aktiviert, wodurch die Dauer des Bitleitungs-Spannungsabfalls reduziert wird. Diese Ausgestaltungen verwenden typischerweise eine Form von Impulsgenerator, der einen Festdauer-Impuls erzeugt. Wenn die Impulsdauer so ausgerichtet ist, dass sie Szenarien des schlechtesten Timings genügt, führt die zusätzliche Marge zu unnötigem Bitleitungs-Stromabziehen während nominaler Operationen. Es ist daher erwünscht, eine selbstbegrenzende Wortleitungs-Vorrichtung mit selbstbestimmtem Zeitverhalten (self-timing) zu schaffen, die auf die tatsächliche Dauer einer gegebenen READ-Operation in einer ausgewählten Zelle anspricht, und die die Wortleitungs-Aktivierung im wesentlichen auf diese Dauer begrenzt. Des weiteren kann es, wenn ein Leseverstärker eine READ-Operation in weniger als einem Speichersystem-Taktzyklus erfolgreich durchführen kann, auch erwünscht sein, dass die Impulsweiten-Aktivierung asynchron in Bezug auf den Speichersystem-Takt erfolgt. Gewisse Aspekte der vorliegenden Erfindung stellen ein gepulstes Wortleitungssignal zur Verfügung, beispielsweise durch Verwenden einer kooperativen Interaktion zwischen globalen und lokalen Wortleitungs-Decodern.By activating a wordline just long enough to correctly detect the differential voltage across a selected memory cell, it is possible to reduce the bitline voltage discharge corresponding to a READ operation in the selected cell. In some embodiments, by applying a pulsed signal to the associated wordline during a selected interval, a sense amplifier is activated only during this interval, thereby reducing the duration of the bitline voltage drop. These embodiments typically use a form of pulse generator that generates a fixed duration pulse. When the pulse duration is aligned, that it satisfies worst-timing scenarios, the extra margin results in unnecessary bit-line pull-off during nominal operations. It is therefore desirable to provide a self-timing self-limiting word line device that is responsive to the actual duration of a given READ operation in a selected cell and that limits word line activation substantially to that duration. Furthermore, if a sense amplifier can successfully perform a READ operation in less than one memory system clock cycle, it may also be desirable for the pulse width activation to occur asynchronously with respect to the memory system clock. Certain aspects of the present invention provide a pulsed wordline signal, for example, by utilizing cooperative interaction between global and local wordline decoders.

Leseverstärker-Spannungsschwankungs-ReduzierungSense amplifier voltage fluctuation reduction

Bei der Herstellung großer Speicherarrays ist es sehr erwünscht, die Größe einer einzelnen Speicherzelle auf einem Minimum zu halten. Folglich können einzelne Speicherzellen im allgemeinen keinen Treiberstrom an assoziierte Eingangs/Ausgangs-Bitleitungen liefern. Leseverstärker werden typischerweise verwendet, um den Wert der in einer bestimmten Speicherzelle gespeicherten Daten zu ermitteln, und um den zum Treiben der Eingangs-/Ausgangs-Leitungen erforderlichen Strom bereitzustellen. Bei der Ausgestaltung der Leseverstärker gibt es typischerweise einen Kompromiss zwischen Energie und Geschwindigkeit, wobei schnellere Ansprechzeiten normalerweise zu höherem Energiebedarf führen. Schnellere Leseverstärker können tendenziell auch physikalisch größer sein als langsame Vorrichtungen mit niedriger Energie. Des weiteren kann die analoge Natur von Leseverstärkern dazu führen, dass sie einen wesentlichen Anteil der Gesamtenergie verbrauchen. Obwohl eine Möglichkeit, das Ansprechen eines Leseverstärkers zu verbessern, ist, einen empfindlicheren Leseverstärker zu benutzen, werden alle erzielten Vorteile durch die damit einhergehende Schaltungskomplexität ausgeglichen, die trotzdem an erhöhter Geräuschempfindlichkeit leidet. Es ist dann wünschenswert, Bitleitungs-Spannungsschwankungen einzuschränken und die von dem Leseverstärker verbrauchte Energie zu reduzieren.at the production of large Storage arrays it is very desirable the size of one keep individual memory cell to a minimum. Consequently, individual can Memory cells generally do not associate a driver current with Supply input / output bit lines. Be sense amplifier typically used to calculate the value of in a given memory cell to determine stored data and to drive the input / output lines provide required power. In the embodiment of sense amplifier there is typically a tradeoff between energy and speed, where faster response times usually lead to higher energy requirements to lead. Faster sense amplifiers can also tend to be physically larger than slow low energy devices. Furthermore, can the analog nature of sense amplifiers cause that they consume a significant proportion of the total energy. Although a way the response of a sense amplifier to is to use a more sensitive sense amplifier, all will compensated for the advantages associated with the associated circuit complexity, the raised anyway sound sensitivity suffers. It is then desirable Limit bit line voltage variations and consumed by the sense amplifier To reduce energy.

Bei einer typischen Ausgestaltung ermittelt der Leseverstärker die kleinen Differentialsignale über einer Speicherzelle, die in Bezug auf den in der Zelle gespeicherten Datenwert in einem unsymmetrischen Zustand sind, und verstärkt das sich ergebende Signal auf einen logischen Pegel. Vor einer READ-Operation werden die mit einer bestimmten Speicherspalte assoziierten Bitleitungen auf einen ausgewählten Wert vorgeladen. Wenn eine bestimmte Speicherzelle aktiviert ist, wählt ein Zeilen-Decoder die bestimmte Zeile, in der sich die Speicherzelle befindet, aus, und ein assoziierter Spalten-Decoder wählt einen mit der bestimmten Spalte assoziierten Leseverstärker aus. Die Ladung auf einer dieser Bitleitungen wird durch die aktivierte Speicherzelle auf eine Weise entladen, die dem in der Speicherzelle gespeicherten Datenwert entspricht. Dies erzeugt ein Ungleichgewicht zwischen den Signalen auf den gepaarten Bitleitungen und führt zu einer Bitleitungs-Spannungsschwankung. Wenn er aktiviert ist, ermittelt der Leseverstärker das unsymmetrische Signal, und es verändert sich im Ansprechen hierauf der normalerweise symmetrische Zustand des Leseverstärkers zu einem Zustand, der den Datenwert repräsentiert. Diese Zustandsermittlung und dieses Ansprechen erfolgt innerhalb eines endlichen Zeitraums, während dessen eine bestimmte Menge an Energie verbraucht wird. Je länger es dauert, das unsymmetrische Signal zu ermitteln, desto größer ist der Spannungsabfall auf den vorgeladenen Bitleitungen, und desto mehr Energie wird während der READ-Operation verbraucht. Jede Energie, die über die tatsächlich für das Abtasten des Speicherzellen-Zustands benötigte Zeit hinaus verbraucht wird, ist tatsächlich verschwendete Energie. Bei traditionellen SRAM-Designs bleiben die Leseverstärker, die während einer bestimmten READ-Operation arbeiten, während beinahe des gesamten Lesezyklusses aktiv. Dieser Ansatz verbraucht jedoch unnötigerweise hohe Energiemengen, wenn man in Betracht zieht, dass ein Leseverstärker nur lange genug aktiv sein muss, um die Differentialspannung über einer ausgewählten Speicherzelle unter Angabe des gespeicherten Speicherzustands korrekt zu ermitteln.at In a typical embodiment, the sense amplifier detects the small differential signals over a memory cell with respect to that stored in the cell Data value are in an unbalanced state, and amplifies that resulting signal to a logic level. Before a READ operation become the bitlines associated with a particular memory column on a selected one Value preloaded. If a specific memory cell is activated, selects Line decoder the particular line in which the memory cell is located and an associated column decoder selects one with the particular one Column associated sense amplifier out. The charge on one of these bit lines is activated by the Unload memory cell in a manner similar to that stored in the memory cell Data value corresponds. This creates an imbalance between the signals on the paired bit lines and leads to a Bit-line voltage fluctuation. When activated, determined the sense amplifier the unbalanced signal, and it changes in response to this normally symmetrical state of the sense amplifier to a state that represents the data value. This status determination and response takes place within a finite period while of which a certain amount of energy is consumed. The longer it is takes to determine the unbalanced signal, the greater the Voltage drop on the precharged bitlines, and more Energy gets during consumed the READ operation. Any energy over that indeed for the Sampling of the memory cell state consumes time consumed is, is actually wasted energy. For traditional SRAM designs, the Sense amplifier, the while a specific READ operation, while almost the entire Read cycle active. However, this approach unnecessarily consumes high amounts of energy, considering that a sense amplifier only long enough to be active, the differential voltage across a selected memory cell correctly specifying the stored memory state.

Es gibt zwei allgemeine Ansätze zum Reduzieren von Energie in Leseverstärkern. Erstens kann der Leseverstärkerstrom durch Verwenden von Leseverstärkern, die sich automatisch abschalten, wenn die Abtast-Operation beendet ist, beschränkt werden. Eine Leseverstärker-Ausgestaltung zu diesem Zweck ist ein selbsthaltender (self-latching) Leseverstärker, der sich abschaltet, sobald der Leseverstärker den abgetasteten Datenzustand angegeben hat. Zweitens können Leseverstärker-Ströme durch Begrenzen der Aktivierung des Leseverstärkers auf genau die erforderliche Zeitspanne beschränkt werden. Dieser Ansatz kann durch die Verwendung einer Dummy-Spaltenschaltung, komplett mit Bit-Zellen, Leseverstärker und Unterstüt zungsschaltungen, realisiert werden. Durch das Vorgeben der Operation einer funktionalen Spalte kann die Dummy-Schaltung einer Leseverstärker-Timing-Schaltung eine Annäherung der Aktivierungszeitraum-Eigenschaften des funktionalen Leseverstärkers in dem Speichersystem zur Verfügung stellen. Obwohl die Dummy-Schaltungsannäherung recht zufriedenstellend sein kann, wird angenommen, dass alle funktionalen Leseverstärker zu dem Zeitpunkt, zu dem die Dummy-Schaltung ihre Operation beendet, ihre Abtast-Operation durchgeführt haben. In dieser Hinsicht kann die Verwendung einer Dummy-Schaltung ähnlich der Aktivierung der Leseverstärker mit einem Festdauer-Impulssignal sein. Aspekte der vorliegenden Erfindung stellen Schaltungen und Leseverstärker zur Verfügung, die Spannungsschwankungen beschränken, und die die Empfindlichkeit und Robustheit der Leseverstärker-Operation verbessern. Beispielsweise werden kompakte, energiehaltende Leseverstärker, die erhöhte Widerstandsfähigkeit gegenüber Rauschen und gegenüber intrinsischen und Betriebs-Offsets aufweisen, bereitgestellt. Im Zusammenhang mit der vorliegenden Erfindung können derartige Leseverstärker sowohl in der lokalen Modulstufe als auch überall in den höheren Stufen einer hierarchischen Speicherstruktur erfindungsgemäß realisiert werden.There are two general approaches to reducing power in sense amplifiers. First, the sense amplifier current can be limited by using sense amplifiers which automatically turn off when the scan operation is completed. A sense amplifier design for this purpose is a self-latching sense amplifier which turns off as soon as the sense amplifier has indicated the sampled data state. Second, sense amplifier currents can be limited by limiting the activation of the sense amplifier to just the required amount of time. This approach can be realized through the use of a dummy column circuit, complete with bit cells, sense amplifiers, and support circuits. By providing the operation of a functional column, the dummy circuit of a sense amplifier timing circuit may provide an approximation of the activation period characteristics of the functional sense amplifier in the memory system. Although the dummy circuit approach can be quite satisfactory, It is assumed that all the functional sense amplifiers have their scanning operation performed at the time the dummy circuit completes its operation. In this regard, the use of a dummy circuit may be similar to activating the sense amplifiers with a fixed duration pulse signal. Aspects of the present invention provide circuits and sense amplifiers that limit voltage fluctuations and improve the sensitivity and robustness of the sense amplifier operation. For example, compact, power-sensing sense amplifiers having increased resistance to noise and to intrinsic and operational offsets are provided. In the context of the present invention, such sense amplifiers can be realized both in the local module stage and throughout the higher stages of a hierarchical memory structure in accordance with the invention.

REDUNDANZREDUNDANCY

Speicher-Designer gleichen Energie und Vorrichtungsbereich typischerweise mit der Geschwindigkeit aus. Hochleistungs-Speicherbauteile stellen eine ernste Belastung für die Energie- und Bereichsbudgets verbundener Systeme dar, insbesondere, wenn derartige Bauteile in ein VLSI-System, beispielsweise ein digitales Signalverarbeitungssystem, eingebettet sind. Daher ist es höchst wünschenswert, Speicher-Untersysteme bereitzustellen, die schnell und doch energie- und bereichseffizient sind. Hoch integrierte Hochleistungs-Bauteile erfordern komplizierte Fabrikations- und Herstellungsverfahren. Diese Verfahren sehen sich unvermeidbaren Parametervariationen gegenüber, die den herzustellenden Einheiten physikalische Defekte zufügen oder das Design derart anfällig machen können, dass die betroffenen Einheiten nicht mehr brauchbar sind oder unter dem Standard liegen.Store Designer same energy and device area typically with the Speed off. High-performance memory components provide a serious burden for the energy and range budgets of connected systems, in particular, if such components in a VLSI system, such as a digital Signal processing system, are embedded. Therefore, it is highly desirable Provide storage subsystems that deliver fast, yet energy-efficient and are area efficient. Highly integrated high-performance components require complicated fabrication and manufacturing processes. These methods face unavoidable parameter variations that cause physical defects to the units to be manufactured or that Design so vulnerable can do, that the affected units are no longer usable or under the standard.

Bei einer Speicherstruktur kann die Redundanz beispielsweise deshalb wichtig sein, weil ein Fabrikationsfehler oder ein Betriebsfehler sogar einer Einzelbit-Zelle zum Versagen des Systems, das von dem Speicher abhängig ist, führen kann. Ähnlich können verfahrensinvariante Merkmale nötig sein um sicherzustellen, dass die internen Operationen der Struktur präzisen Timing- und Parameterbestimmungen entsprechen. Ohne Redundanz und verfahrensinvariante Merkmale kann der tatsäch liche Herstellungsertrag für eine bestimmte Speicherstruktur so niedrig sein, dass es nicht akzeptiert werden kann. Speicherstrukturen mit niedrigem Ertrag sind insbesondere dann nicht zu akzeptieren, wenn sie in komplexere Systeme eingebettet sind, die in sich mehrere Fabrikations- und Herstellungsanfälligkeiten aufweisen. Ein höherer Herstellungsertrag führt zu niedrigeren Stückkosten, und robustes Design führt zu zuverlässigen Produkten mit niedrigeren Betriebskosten. Daher ist es auch höchst erwünscht, Bauteile zu entwerfen, die wo immer möglich Redundanz und verfahrensinvariante Merkmale aufweisen.at For example, redundancy may be a memory structure be important because of a manufacturing defect or an operating error even a single-bit cell failure of the system which depends on the memory to lead can. Similar can process-invariant features needed be to make sure the internal operations of the structure precise Timing and parameter definitions correspond. Without redundancy and method invariant features can the actual Liche manufacturing yield for one certain memory structure to be so low that it is not accepted can be. Memory structures with low yield are in particular then not accept it when embedded in more complex systems are that have multiple fabrication and manufacturing vulnerabilities exhibit. A higher one Manufacturing yield leads at lower unit costs, and robust design leads too reliable Products with lower operating costs. Therefore, it is also highly desirable to components design wherever possible Have redundancy and procedural invariant features.

Redundanzvorrichtungen und -techniken stellen weitere bestimmte, bevorzugte Aspekte der vorliegenden Erfindung dar, die einzeln oder zusammen die Funktionalität der hierarchischen Speicherstruktur verbessern. Die vorgenannten Redundanz-Aspekte der vorliegenden Erfindung können die hierarchische Speicherstruktur weniger anfällig für Untauglichkeit durch Fehler während der Herstellung oder während des Betriebs machen, und führen vorteilhafterweise zu einem Speicherprodukt, das zugleich besser herzustellen und kosteneffizient sowie im Betrieb robuster ist. Die Redundanz in einem hierarchischen Speichermodul kann durch Hinzufügen einer oder mehrerer redundanter Zeilen, Spalten, oder beidem, zur Grundmodul-Srtuktur realisiert werden. Bei einem Aspekt der vorliegenden Erfindung wird ein Decoder zur Verfügung gestellt, der Zeilenredundanz ermöglicht. Außerdem kann eine Speicherstruktur, die aus hierarchischen Speichermodulen zusammengesetzt ist, ein oder mehrere redundante Module verwenden, um defekte Speicher-Schaltungen zu mappen. Ein redundantes Modul kann einen Eins-zu-eins-Ersatz eines defekten Moduls bereitstellen, oder es kann eine oder mehrere Speicherzell-Schaltungen für ein oder mehrere primäre Speichermodule zur Verfügung stellen.redundancy devices and techniques set forth certain particular preferred aspects of the present invention Invention, individually or together, the functionality of the hierarchical Improve memory structure. The aforementioned redundancy aspects of the present invention the hierarchical storage structure less prone to failure by mistake while the manufacture or during of operation, and lead advantageously to a memory product that is better at the same time and cost-effective and robust in operation. The redundancy in a hierarchical memory module can be increased by adding a or multiple redundant rows, columns, or both, to the base module structure will be realized. In one aspect of the present invention a decoder available provided that allows line redundancy. In addition, a memory structure, which is composed of hierarchical memory modules or use multiple redundant modules to faulty memory circuits to map. A redundant module can be a one-to-one replacement of a defective module, or it may be one or more Memory cell circuits for one or more primary Memory modules available put.

SPEICHERMODUL MIT HIERARCHISCHER FUNKTIONALITÄTSTORAGE MODULE WITH HIERARCHIC FUNCTIONALITY

Die erfindungsgemäße modulare, hierarchische Speicherarchitektur stellt ein kompaktes, robustes, energieeffizientes, hochleistungsfähiges Speichersystem zur Verfügung, das vorteilhafterweise eine flexible und hoch skalierbare Architektur aufweist. Die hierarchische Speicherstruktur ist aus Grundspeichermodulen zusammengesetzt, die kooperativ gekoppelt werden können, und die in mehreren hierarchischen Stufen angeordnet sind, um ein zusammengesetztes Speicherprodukt mit beliebiger Spaltentiefe oder Zeilenlänge zu ergeben. Dieser modulare Ansatz von unten nach oben lokalisiert Timing-Erwägungen, Entscheidungsfindung und Energieverbrauch in der (den) bestimmten Einheit(en), in der (denen) die erwünschten Daten gespeichert sind.The inventive modular, hierarchical storage architecture provides a compact, robust, energy-efficient, high-performance storage system available that advantageously a flexible and highly scalable architecture having. The hierarchical memory structure is made up of basic memory modules composed, which can be coupled cooperatively, and which are arranged in several hierarchical levels to form a composite To give memory product with any column depth or line length. This modular bottom-up approach locates timing considerations, Decision making and energy consumption in the particular one Unit (s) in which the desired data is stored.

Innerhalb einer definierten Design-Hierarchie können die Grundspeichermodule zu einem größeren Speicherblock gruppiert werden, der selbst mit ähnlichen Speicherstrukturen verbunden werden kann, um noch größere Speicherblöcke zu ergeben. Diese größeren Strukturen können wiederum so angeordnet sein, dass sie auf der höchsten Stufe der Hierarchie eine komplexe Struktur schaffen. Bei der hierarchischen Abtastung ist es erwünscht, zwei oder mehr Stufen von Bitabtastung zur Verfügung zu stellen, wodurch die Lese- und Schreib-Zeit der Vorrichtung verringert wird, d.h. die effektive Vorrichtungsgeschwindigkeit erhöht wird, während die Gesamtenergie-Erfordernisse der Vorrichtung reduziert werden. Bei einem hierarchischen Design wird das Schalten und der Speicherzellen-Energieverbrauch während einer Lesen-/Schreiben-Operation in der unmittelbaren Nachbarschaft der Speicherzellen, die ausgewertet werden oder in die geschrieben wird, lokalisiert, d.h. derjenigen Speicherzellen in ausgewählten Speichermodulen, mit Ausnahme einer begrenzten Zahl von globalen Wortleitungs-Selektoren und Leseverstärkern, und Unterstützungsschaltungen. Der Großteil der Module, die die Speicherzellen, die ausgewertet werden oder in die geschrieben wird, nicht enthalten, bleibt im allgemeinen inaktiv.Within a defined design hierarchy, the base memory modules can be grouped into a larger block of memory that itself can be connected to similar memory structures to yield even larger blocks of memory. These larger structures may in turn be arranged to create a complex structure at the highest level of the hierarchy. In hierarchical scanning, it is desirable to use two or three provide more levels of bit-sampling, thereby reducing the read and write time of the device, ie, increasing the effective device speed while reducing the overall power requirements of the device. In a hierarchical design, the switching and memory cell power consumption are located during a read / write operation in the immediate vicinity of the memory cells being evaluated or written, ie, those memory cells in selected memory modules, except for a limited number of global word line selectors and sense amplifiers, and support circuits. Most of the modules that do not contain the memory cells that are being evaluated or written to remain generally inactive.

Bevorzugte Ausführungsformen der vorliegenden Erfindung stellen ein hierarchisches Speichermodul zur Verfügung, das lokales Bitleitungs-Abtasten, lokale Wortleitungs-Decodierung, oder beides, verwendet, was den Gesamtenergie-Verbrauch und die Signalfortpflanzung intrinsisch reduziert und die Gesamtgeschwindigkeit sowie die Design-Flexibilität und die Skalierbarkeit erhöht. Aspekte der vorliegenden Erfindung sehen Vorrichtungen und Verfahren vor, die den Gesamtenergieverbrauch der hierarchischen Speicherstruktur weiter einschränken, während sie den Einfluss einer Mehrstufen-Hierarchie minimieren. Bestimmte Aspekte der vorliegenden Erfindung sind darauf gerichtet, funktionale Anfälligkeiten zu mildern, die sich aus Variationen der Betriebsparameter ergeben können, oder die in Bezug zum Herstellungsverfahren stehen. Außerdem sind Vorrichtungen und Techniken offenbart, die die Verschlechterung der Systemleistung, die sich aus zeitweisen Ineffizienzen ergibt, vorteilhaft verbessern, einschließlich, jedoch nicht beschränkt auf, hochgenaue Verzögerungsmessschaltung, Diffusionsverzögerungs-Replikations-Schaltung und assoziierte Dummy-Vorrichtungen. Bei einem weiteren Aspekt der vorliegenden Erfindung ist ein asynchron zurücksetzbarer Decoder vorgesehen, der die Bitleitungs-Spannungs-Entladung, die beispielsweise einer READ-Operation in der ausgewählten Zelle entspricht, durch Begrenzen der Wortleitungs-Aktivierung auf die Zeit, die der Leseverstärker tatsächlich benötigt, um die Differentialspannung über einer ausgewählten Speicherzelle korrekt zu ermitteln, reduziert.preferred embodiments of the present invention provide a hierarchical memory module to disposal, local bit line sampling, local word line decoding, or both, using what the total energy consumption and the signal propagation intrinsically reduced and the overall speed as well as the design flexibility and the Scalability increased. Aspects of the present invention contemplate devices and methods before, the total energy consumption of the hierarchical storage structure further restrict while she minimize the impact of a multi-level hierarchy. Certain aspects The present invention is directed to functional susceptibilities mitigated by variations in operating parameters can, or related to the manufacturing process. Besides, they are Devices and techniques disclosed the deterioration system performance resulting from temporary inefficiencies, advantageously, including, but not limited to, highly accurate Delay measurement circuit, Diffusion delay replication circuit and associated Dummy devices. In another aspect of the present invention Invention is an asynchronously resettable Decoder provided the bit line voltage discharge, the for example, a READ operation in the selected cell by limiting the wordline activation to the Time, the sense amplifier actually needed to the differential voltage over a selected one To determine memory cell correctly, reduced.

HIERARCHISCHE SPEICHERMODULEHIERARCHICAL MEMORY MODULES

Bei Speicher-Designs des Standes der Technik, beispielsweise den vorgenannten Bank-Designs, werden große logische Speicherblöcke in kleinere, physikalische Module aufgeteilt, die jeweils den anwesenden Überhang eines gesamten Speicherblocks einschließlich Predecodern, Leseverstärkern, Multiplexern und ähnlichem aufweisen. Zusammengenommen verhalten sich derartige Speicherblöcke wie ein einziger Speicherblock. Bei Verwendung der vorliegenden Erfindung können jedoch Speicherblöcke vergleichbarer, oder viel größerer, Größe durch Verbinden hierarchischer funktionaler Module zu größeren physikalischen Speicherblöcken mit beliebiger Wortanzahl und Wortlänge bereitgestellt werden. Beispielsweise benötigen bestehende Designs, die kleinere Speicherblöcke zu einem einzigen logischen Block zusammenfügen, normalerweise die Replikation der Predecoder, Leseverstärker, und anderer Überhangsschaltungen, die mit einem einzigen Speicherblock assoziiert wären. Gemäß der vorliegenden Erfindung ist jedoch diese Replikation unnötig und unerwünscht. Eine Ausführungsform der Erfindung umfasst lokales Bitleitungs-Abtasten, bei dem eine begrenzte Anzahl von Speicherzellen mit einem einzigen lokalen Leseverstärker gekoppelt ist, wodurch ein Grundspeichermodul gebildet wird. Ähnliche Speichermodule werden so gruppiert und angeordnet, dass sie das lokale Leseverstärker-Signal an das globale Leseverstärker-Signal ausgeben. Somit sind die mit den Speicherzellen assoziierten Bitleitungen nicht direkt mit einem globalen Leseverstärker gekoppelt, wodurch die Signalfortpflanzungs-Verzögerung und der Energieverbrauch, die typischerweise mit globalem Bitleitungs-Abtasten verbunden sind, vermindert werden. Bei diesem Ansatz tastet der lokale Bitleitungs-Leseverstärker den Zustand einer ausgewählten Speicherzelle schnell und wirtschaftlich ab und berichtet den Zustand an den globalen Leseverstärker. Bei einer anderen Ausführungsform der vorliegenden Erfindung werden die Verzögerungen und der Energieverbrauch der globalen Wortleitungs-Decodierung durch Bereitstellen eines Speichermoduls vermindert, das aus einer begrenzten Anzahl von Speicherzellen besteht, die lokale Wortleitungs-Decodierung aufweisen. Ähnlich zu dem Ansatz des lokalen Bitleitungs-Abtastens kann ein einzelner globaler Wortleitungs-Decoder mit den jeweiligen lokalen Wortleitungs-Decodern mehrerer Module gekoppelt werden. Wenn der globale Decoder mit einer Adresse aktiviert wird, so antwortet nur derjenige lokale Wortleitungs-Decoder, der mit der gewünschten Speicherzelle assoziiert ist, und aktiviert die Speicherzelle. Dieser Aspekt ist ebenfalls besonders energieschonend und schnell, weil das Laden auf der globalen Leitung sich auf die assoziierten lokalen Wortleitungs-Decoder beschränkt, und das globale Wortleitungs-Signal nur so lange vorhanden sein muss, wie es zum Triggern der entsprechenden lokalen Wortleitung benötigt wird. Bei einer weiteren Ausführungsform der vorliegenden Erfindung ist ein hierarchisches Speichermodul, das sowohl lokales Bitleitungs-Abtasten als auch lokales Wortleitungs-Decodieren verwendet, vorgesehen, was die Vorteile beider Ansätze verwirklicht. Jede der vorgenannten Ausführungsformen wird im folgenden diskutiert.at Memory designs of the prior art, for example, the aforementioned Bank designs, will be great logical memory blocks divided into smaller, physical modules, each containing the overhang present an entire memory block including predecoders, sense amplifiers, multiplexers and the like exhibit. Taken together, such memory blocks behave like a single memory block. When using the present invention can however memory blocks comparable, or much larger, size by joining hierarchical functional modules to larger physical memory blocks with any number of words and word length to be provided. For example, existing designs require smaller ones memory blocks into a single logical block, usually replication the predecoder, sense amplifier, and other overhang circuits, which would be associated with a single memory block. According to the present However, this replication is unnecessary and undesirable. A embodiment The invention comprises local bit line scanning in which a limited number of memory cells coupled to a single local sense amplifier is, whereby a basic memory module is formed. Similar Memory modules are grouped and arranged to hold the local sense amplifier signal to the global sense amplifier signal output. Thus, the bit lines associated with the memory cells are not directly coupled to a global sense amplifier, causing the Signal propagation delay and the power consumption typically associated with global bitline sampling are reduced. In this approach, the touches local bitline sense amplifiers the state of a selected one Memory cell quickly and economically and reports the condition to the global sense amplifier. In another embodiment of the present invention, the delays and energy consumption global wordline decoding by providing a Memory module reduces that from a limited number of memory cells exists that have local word line decoding. Similar to The approach of local bit line sampling may be a single global word line decoder with the respective local word line decoders be coupled to several modules. If the global decoder with a Address is activated, only the local word line decoder responds, the one with the desired Memory cell is associated, and activates the memory cell. This Aspect is also particularly energy-saving and fast because the loading on the global line is on the associated local word line decoder limited, and the global wordline signal only needs to be present for so long as needed to trigger the appropriate local wordline. In a further embodiment The present invention is a hierarchical memory module. this includes both local bitline scanning and local wordline decoding provided, which realizes the advantages of both approaches. Each of the aforementioned embodiments will be discussed below.

Lokales Bitleitungs-AbtastenLocal bit line sampling

3 zeigt einen Speicherblock 300, der durch Verbinden mehrerer kooperierender einzelner Module 320a–e gebildet ist, wobei jedes der Module 320a–e jeweils einen lokalen Leseverstärker 308a–e aufweist. Jedes Modul besteht aus einer vordefinierten Anzahl von Speicherzellen 325a–g, die mit einem der jeweiligen lokalen Leseverstärker 308a–e verbunden sind. Jeder lokale Leseverstärker 308a–e ist mit dem globalen Leseverstärker 302 über Bitleitungen 304, 306 verbunden. Weil jeder lokale Leseverstärker 308a–e nur die lokalen Bitleitungen 310a–e, 312a–e der jeweiligen Speichermodule 320a–e abtastet, wird die für das Vorladen der lokalen Bitleitungen 310a–e und 312a–e benötigte Zeit und Energie wesentlich reduziert. Nur wenn der lokale Leseverstärker 308a–e ein Signal auf den jeweiligen lokalen Leitungen 310a–e und 312a–e abtastet, gibt er ein Signal an den globalen Leseverstärker 302 ab. Diese Architektur verleiht einem Speicherarchitektur-Design Flexibilität und Skalierbarkeit, weil die Speichergröße durch Hinzufügen lokal abgetasteter Speichermodule, wie 320a–e, erhöht werden kann. 3 shows a memory block 300 By connecting several cooperating individual modules 320a-e is formed, each of the modules 320a-e each a local sense amplifier 308a-e having. Each module consists of a predefined number of memory cells 325a-g connected to one of the respective local sense amplifiers 308a-e are connected. Each local sense amplifier 308a-e is with the global sense amplifier 302 over bit lines 304 . 306 connected. Because every local sense amplifier 308a-e only the local bitlines 310a-e . 312a-e the respective memory modules 320a-e is sampled, which is for precharging the local bit lines 310a-e and 312a-e required time and energy significantly reduced. Only if the local sense amplifier 308a-e a signal on the respective local lines 310a-e and 312a-e it samples a signal to the global sense amplifier 302 from. This architecture provides flexibility and scalability to a memory architecture design because memory size can be increased by adding locally sampled memory modules such as memory 320a-e , can be increased.

Das Erhöhen der Anzahl der lokalen Leseverstärker 308a–e, die mit den globalen Bitleitungen 304, 306 verbunden sind, erhöht die Belastung der globalen Bitleitungen nicht wesentlich, und erhöht auch den Energieverbrauch in den globalen Bitleitungen 304, 306 nicht, weil Signalentwicklung und Vorladen nur in dem lokalen Leseverstärker 308a–e stattfinden, nahe dem in den Speicherzellen 325a–g in dem entsprechenden Speichermodul 320a–e gefundenen Signal.Increasing the number of local sense amplifiers 308a-e that with the global bitlines 304 . 306 are not significantly increasing the load on the global bitlines, and also increasing power consumption in the global bitlines 304 . 306 not because signal development and pre-charging only in the local sense amplifier 308a-e take place near in the memory cells 325a-g in the corresponding memory module 320a-e found signal.

Bei bevorzugten Ausführungsformen der vorliegenden Erfindung ist es erwünscht, dass jedes Modul ein selbstbestimmtes Zeitverhalten aufweist. Dies bedeutet, dass jedes Speichermodul 320a–e eine interne Schaltung aufweisen kann, die einen ausreichenden Zeitraum zum Stattfinden des lokalen Abtastens abtastet und erzeugt. Derartige Schaltungen mit selbstbestimmtem Zeitverhalten sind im Stand der Technik bekannt. Bei Einzelkern-Designs oder auch Bank-Designs können Speicherkerne mit selbstbestimmtem Zeitverhalten für den Hochleistungsbetrieb unge eignet sein, weil das Zeitverhalten tendenziell von dem langsamsten der vielen Bauteile in der Struktur abhängt, und weil die Signalfortpflanzungszeit in derart großen Strukturen wesentlich sein kann. Die Implementierung von selbstbestimmtem Zeitverhalten kann in diesen größeren Strukturen durch Variationen bei den Fabrikations- und Herstellungsverfahren nachteilig beeinflusst werden, was die Betriebsparameter des Speicherarrays und der zugrundeliegenden Timing-Schaltungsbauteile wesentlich beeinflussen kann.In preferred embodiments of the present invention, it is desirable for each module to have a self-determined timing. This means that every memory module 320a-e may have an internal circuit that samples and generates a sufficient amount of time to place the local sample. Such self-timed circuits are known in the art. In single-core designs, or even bank designs, self-timed memory arrays may be unsuitable for high power operation because timing tends to depend on the slowest of the many components in the structure, and because the signal propagation time in such large structures may be significant. The implementation of self-determined timing may be adversely affected in these larger structures by variations in fabrication and manufacturing techniques, which may significantly affect the operating parameters of the memory array and the underlying timing circuitry.

Bei einem hierarchischen Speichermodul ist selbstbestimmtes Zeitverhalten erwünscht, weil die Timing-Pfade für jedes Modul 320a–e nur eine begrenzte Anzahl an Speicherzellen 325a–g über einen sehr begrenzten Signalpfad umfassen. Jedes Modul ist bei der Bestimmung der Zeit, die benötigt wird, um eine gegebene PRECHARGE-, READ- oder WRITE-Operation durchzuführen, tatsächlich im wesentlichen autonom. Meistens ist die Dauer einer Operation auf der lokalen Stufe sehr kurz in Bezug auf die Zugriffszeit der Gesamtstruktur, so dass die Speicherstruktur 300, die aus den hierarchischen Speichermodulen 320a–e aufgebaut ist, nicht den normalen, mit selbstbestimmtem Zeitverhalten verbundenen Schwierigkeiten, unterworfen ist, und auch widerstandsfähig gegenüber Variationen bei den Fabrikations- und Herstellungsverfahren ist.For a hierarchical memory module, self-determined timing is desirable because the timing paths for each module 320a-e only a limited number of memory cells 325a-g over a very limited signal path. In fact, each module is essentially autonomous in determining the time required to perform a given PRECHARGE, READ, or WRITE operation. Mostly, the duration of an operation at the local level is very short in terms of the access time of the forest, so the memory structure 300 coming from the hierarchical memory modules 320a-e is not subject to the normal, with self-determined timing associated difficulties, and is also resistant to variations in the manufacturing and manufacturing processes.

Im allgemeinen können die Kerne lokalisierter Leseverstärker 308a–e kleiner sein als ein typischer globaler Leseverstärker 302, weil sich innerhalb eines gegebenen Zeitraums auf den lokalen Leseverstärker-Bitleitungen 310a–e, 312a–e ein relativ größeres Signal entwickelt. Das heißt, dass mehr Signal verfügbar ist, um den lokalen Leseverstärker 308a–e zu treiben. Bei einer Architektur, die nur einen globalen Leseverstärker aufweist, tritt eine größere Verzögerung auf, während ein Signal über den globalen Bitleitungen entwickelt wird; diese Verzögerung kann auf Kosten erhöhten Energieverbrauchs reduziert werden. Vorteilhafterweise können lokalen Bitabtastungs-Implementierungen die Verzögerung reduzieren, während sie gleichzeitig den Energieverbrauch herabsetzen.In general, the cores of localized sense amplifiers 308a-e be smaller than a typical global sense amplifier 302 because within a given time period on the local sense amplifier bitlines 310a-e . 312a-e developed a relatively larger signal. This means that more signal is available to the local sense amplifier 308a-e to drive. In an architecture having only one global sense amplifier, a larger delay occurs while a signal is developed across the global bitlines; This delay can be reduced at the cost of increased energy consumption. Advantageously, local bit-sampling implementations can reduce the delay while at the same time reducing power consumption.

Bei gewissen Aspekten der vorliegenden Erfindung, die unten genauer erläutert werden, kann ein Treibersignal mit begrenzter Schwankung von dem aktiven lokalen Leseverstärker zu dem globalen Leseverstärker gesendet werden. Ein volles Schwankungssignal kann ebenfalls gesendet werden; in diesem Fall kann ein sehr einfacher digitaler Puffer verwendet werden. Wenn jedoch ein Signal mit begrenzter Schwankung verwendet wird, kann ein komplizierterer Leseverstärker notwendig sein. Für eine Anwendung mit begrenzter Energie kann es erwünscht sein, dass zwei oder mehrere Speichermodule lokale Leseverstärker gemeinsam verwenden. Das gemeinsame Verwenden der Leseverstärker kann jedoch die Bitsignal-Entwicklungsleitung indirekt leicht verlangsamen, weil während des ersten Teils einer Abtastperiode die Kapazitäten sowohl des oberen als auch des unteren gemeinsam verwendeten Speichermoduls entladen werden. Diese Verlangsamung kann jedoch minimiert werden und ist relativ gering, wenn man sie mit den Vorteilen vergleicht, die durch die Verwendung von logischen Leseverstärkern gegenüber den bestehenden Architekturen, die nur globale Leseverstärker verwenden, erzielt werden. Außerdem können bevorzugte Ausführungsformen der vorliegenden Erfindung diese möglicherweise nachteiligen Wirkungen des gemeinsamen Verwendens von Leseverstärkern dadurch umgehen, dass sie den lokalen Leseverstärker von assoziierten lokalen Bitleitungen, die nicht mit der abzutastenden Speicherzelle gekoppelt sind, im wesentlichen isolieren.In certain aspects of the present invention, discussed in greater detail below, a driver signal with limited variation may be sent from the active local sense amplifier to the global sense amplifier. A full fluctuation signal can also be sent; in this case, a very simple digital buffer can be used. However, if a signal with limited variation is used, a more complicated sense amplifier may be necessary. For a limited energy application, it may be desirable for two or more memory modules to share local sense amplifiers. However, sharing the sense amplifiers can indirectly slow the bit signal development line indirectly because during the first part of a sample period, the capacitances of both the upper and lower shared memory modules are discharged. However, this slowdown can be minimized and relatively low compared to the benefits achieved by using logical sense amplifiers over existing architectures using only global sense amplifiers. In addition, preferred embodiments of the present invention may be disadvantageous Avoid the effects of sharing sense amplifiers by substantially isolating the local sense amplifier from associated local bitlines that are not coupled to the memory cell to be scanned.

4 zeigt eine Speicherstruktur 400, die der in 3 gezeigten Struktur 300 dadurch ähnlich ist, dass sie lokales Bitleitungs-Abtasten von Modulen 420a–d bereitstellt. Jedes Speichermodul 420a–d besteht aus einer vordefinierten Anzahl von Speicherzellen 425a–g. Die Speicherzellen 425a–g sind mit jeweiligen lokalen Leseverstärkern 408a, b über lokale Bitleitungen 410a–d, 412a–d verbunden. Anders als bei der Struktur 300 in 3, bei der jedes Modul 320a–e einen eigenen lokalen Leseverstärker 308a–e hat, sind die Speichermodule 420a–d mit einem einzigen Leseverstärker 408a, b gepaart. Ähnlich zu 3 zeigt 4 einen globalen Leseverstärker 402, der mit den lokalen Leseverstärkern 408a, 408b gekoppelt ist. 4 shows a memory structure 400 that the in 3 shown structure 300 is similar to that of local bit line scanning of modules 420a-d provides. Each memory module 420a-d consists of a predefined number of memory cells 425a-g , The memory cells 425a-g are with respective local sense amplifiers 408a, b over local bitlines 410a-d . 412a-d connected. Unlike the structure 300 in 3 in which each module 320a-e its own local sense amplifier 308a-e has, are the memory modules 420a-d with a single sense amplifier 408a, b paired. Similar to 3 shows 4 a global sense amplifier 402 that with the local read amplifiers 408a . 408b is coupled.

5 zeigt des weiteren, dass Speicherstrukturen wie das Modul 300 in 3 so gekoppelt werden können, dass die Gesamtstruktur in Adressgröße (d.h. vertikal) oder in Bitlänge (d.h. horizontal), oder in beidem, erweitert wird. Die in 5 gezeigte Array-Struktur kann auch Module wie das Modul 400 in 4 verwenden. 5 zeigt auch, dass eine zusammengesetzte Speicherstruktur 500, die hierarchische Speichermodule verwendet, echt hierarchisch sein kann. Die Speicherblöcke 502, 503 können aus mehreren Speichermodulen, wie dem Speichermodul 504, bestehen; diese können Module sein, wie sie in Bezug auf 3 und 4 beschrieben worden sind. Jeder Speicherblock 502, 503 verwendet eine Zwei-Stufen-Abtastung, wie bereits gezeigt worden ist. Bei der Struktur 500 verwenden die Speicherblöcke 502, 503 jedoch eine Zwischenstufe des Bitleitungs-Abtastens, indem sie z.B. Mittelstufen-Leseverstärker 514, 516 verwenden. Unter dem hierarchischen Speicherparadigma können die Mittelstufen-Leseverstärker 514, 516 mit dem globalen Leseverstärker 520 gekoppelt werden. In der Tat kann das hierarchische Speicher-Paradigma gemäß der vorliegenden Erfindung eine hoch skalierbare, mehrstufige Hierarchie aufweisen, was es dem Speicher-Designer ermöglicht, Speicherstrukturen zu entwerfen, deren Speicherzell-Dichten und -Konfigurationen auf die Anwendung zugeschnitten sind. Vorteilhafterweise kann diese Skalierbarkeit und Konfigurationsfähigkeit ohne die die Speicherarchitekturen des Standes der Technik begleitenden Verzögerungen und ohne den wesentlich erhöhten Energie- und Bereichsverbrauch erhalten werden. 5 further shows that memory structures like the module 300 in 3 can be coupled so that the overall structure is extended in address size (ie, vertical) or in bit length (ie, horizontal), or both. In the 5 Array structure shown can also be modules such as the module 400 in 4 use. 5 also shows that a composite memory structure 500 that uses hierarchical memory modules can be genuinely hierarchical. The memory blocks 502 . 503 can consist of multiple memory modules, such as the memory module 504 , consist; these can be modules as they relate to 3 and 4 have been described. Each memory block 502 . 503 uses a two-step scan, as has already been shown. In the structure 500 use the memory blocks 502 . 503 however, an intermediate stage of bit line sampling by, for example, using intermediate stage sense amplifiers 514 . 516 use. Under the hierarchical memory paradigm, the middle stage sense amplifiers 514 . 516 with the global sense amplifier 520 be coupled. In fact, the hierarchical storage paradigm according to the present invention may have a highly scalable, multi-level hierarchy, allowing the memory designer to design storage structures whose storage cell densities and configurations are tailored to the application. Advantageously, this scalability and configurability can be obtained without the delays accompanying the memory architectures of the prior art and without the substantially increased power and area consumption.

Einer der Schlüsselfaktoren beim Gestalten einer schnelleren, leistungseffizienten Vorrichtung ist, dass die Kapazität pro Längeneinheit der globalen Bitleitung im Vergleich zu der Kapazität der lokalen Bitleitungen verringert werden kann. Denn bei Verwendung des Hierarchieschema ist die Kapazität der globalen Bitleitung nicht mehr durch das Zellendesign beschränkt. Beispielsweise können Metallleitungen oben auf der Speichervorrichtung laufen. Auch kann ein Multiplexing-Schema verwendet werden, das den Abstand der Bitleitungen erhöht, wodurch sie auseinander gehen und die Bitleitungs-Kapazität weiter reduziert wird. Insgesamt kann der Abstand zwischen den globalen Bitleitungen größer sein, weil die Speicherzellen nicht direkt mit den globalen Bitleitungen verbunden sind. Stattdessen ist jede Zelle, z.B. die Zelle 303 in 3, nur mit dem lokalen Leseverstärker, z.B. dem Leseverstärker 308a–e, verbunden.One of the key factors in designing a faster, power-efficient device is that the capacity per unit length of the global bitline can be reduced as compared to the capacity of the local bitlines. Because when using the hierarchy scheme, the capacity of the global bitline is no longer limited by the cell design. For example, metal lines may run on top of the storage device. Also, a multiplexing scheme may be used that increases the pitch of the bitlines, thereby diverge and further reduces bitline capacitance. Overall, the distance between the global bitlines may be larger because the memory cells are not directly connected to the global bitlines. Instead, every cell is the cell, for example 303 in 3 , only with the local sense amplifier, eg the sense amplifier 308a-e , connected.

Lokale Wortleitungs-DecodierungLocal wordline decoding

6 zeigt eine Hierarchiestruktur 600 mit hierarchischer Wortleitungs-Decodierung, bei der jedes hierarchische Speichermodul 605 aus einer vordefinierten Anzahl von Speicherzellen 610 aufgebaut ist, die mit einem bestimmten lokalen Wortleitungs-Decoder 615a–c gekoppelt sind. Jeder lokale Wortleitungs-Decoder 615a–c ist mit einem jeweiligen globalen Wortleitungs-Decoder 620 gekoppelt. Jeder globale Wortleitungs-Decoder 620a–d wird aktiviert, wenn der Predecoder 622 über die Predecoder-Leitungen 623 Adressinformationen übermittelt, die sich auf einen bestimmten globalen Wortleitungs-Decoder 620a–d beziehen. Im Ansprechen hierauf aktiviert der globale Wortleitungs-Decoder 620a–d die globale Wortleitung 630, die ihrerseits einen bestimmten lokalen Wortleitungs-Decoder 615a–c aktiviert. Der lokale Wortleitungs-Decoder 615a–c aktiviert dann das assoziierte Speichermodul 605, so dass die bestimmte, interessierende Speicherzelle 610 ausgewertet werden kann. Jedes der Speichermodule 605 kann insofern als unabhängiger Speicherbestandteil betrachtet werden, als die hierarchische Funktionalität jedes der Module 605 von lokalem Abtasten über die lokalen Leseverstärker 608a–b, lokalem Decodieren über die lokalen Wortleitungs-Decoder 615a–c, oder beides, abhängt. Wie bei anderen bevorzugten Ausführungsformen der vorliegenden Erfindung ist es erwünscht, dass jedes Modul 605 ein selbstbestimmtes Zeitverhalten aufweist. Selbstbestimmtes Zeitverhalten kann besonders nützlich sein, wenn es in Zusammenhang mit lokalem Wortleitungs-Decodieren verwendet wird, weil ein lokales Timing-Signal von einem jeweiligen Speichermodul 605 verwendet werden kann, um globale Wortleitungs-Aktivierung, lokales Bitleitungs-Abtasten, oder beides, zu beenden. 6 shows a hierarchical structure 600 with hierarchical wordline decoding, in which each hierarchical memory module 605 from a predefined number of memory cells 610 is constructed with a specific local word line decoder 615a-c are coupled. Each local wordline decoder 615a-c is with a respective global wordline decoder 620 coupled. Every global wordline decoder 620a-d is activated when the Predecoder 622 via the predecoder lines 623 Transmit address information that relates to a specific global wordline decoder 620a-d Respectively. In response, the global wordline decoder activates 620a-d the global wordline 630 which, in turn, has a particular local wordline decoder 615a-c activated. The local wordline decoder 615a-c then activates the associated memory module 605 so that the particular memory cell of interest 610 can be evaluated. Each of the memory modules 605 can thus be considered as an independent memory component, as the hierarchical functionality of each of the modules 605 from local sampling via the local sense amplifiers 608a-b , local decoding via the local word line decoder 615a-c , or both, depends. As with other preferred embodiments of the present invention, it is desirable that each module 605 has a self-determined timing. Self-determined timing may be particularly useful when used in conjunction with local wordline decoding because a local timing signal from a respective memory module 605 can be used to terminate global wordline enable, bitline local sense, or both.

Ähnlich der in 5 gezeigten Skalierung können mehrere Speichervorrichtungen 600 mit globalen Bitleitungen oder globalen Decodierungs-Wortleitungen gekoppelt angeordnet werden, um einen zusammengesetzten Speicherbestandteil gewünschter Größe und Konfiguration zu schaffen. Bei einer Ausführungsform der vorliegenden Erfindung werden in jedem Modul 605 256 Zeilen von Speicher verwendet, die es dem Speicher-Designer ermöglichen, einen Speicherblock beliebiger Größe zu schaffen, der eine Körnigkeit von 256 Zeilen aufweist. Für Speichervorrichtungen des Standes der Technik liegt eine typische realistische Begrenzung der Anzahl von pro Leseverstärker abgetasteten Bits bei ca. 512 Bits. Lange Bit- oder Wortleitungen können ein Problem darstellen, insbesondere für WRITE-Operationen, weil der assoziierte Treiber durch die Menge der Energie, die er erzeugen kann, und durch die Geschwindigkeit, mit der auf Signalleitungen, beispielsweise den globalen Bitleitungen 604, 606 in 6, ausreichend Ladung aufgebaut werden kann, eingeschränkt werden kann.Similar in the 5 shown scaling can multiple storage devices 600 coupled to global bitlines or global decode wordlines to form a composite memory component desired size and configuration. In one embodiment of the present invention, in each module 605 Uses 256 rows of memory that allow the memory designer to create a memory block of arbitrary size that has a granularity of 256 lines. For prior art memory devices, a typical realistic limitation on the number of bits sampled per sense amplifier is about 512 bits. Long bit or word lines can be a problem, especially for WRITE operations, because the associated driver can be affected by the amount of power that it can generate and by the speed with which signal lines, such as the global bit lines 604 . 606 in 6 , sufficient charge can be built up, can be restricted.

Obwohl 6 hierarchisches Wortleitungs-Decodieren im Zusammenhang mit hierarchischen Bitleitungs-Operationen zeigt, kann hierarchisches Wortleitungs-Decodieren auch ohne hierarchisches Bitleitungs-Abtasten implementiert werden. Es ist bevorzugt, sowohl das hierarchische Wortleitungs-Decodieren als auch das hierarchische Bitleitungs-Abtasten zu verwenden, um die Synergieeffekte von weniger Energie und höherer Geschwindigkeit für die gesamte Vorrichtung zu erhalten.Even though 6 shows hierarchical word line decoding in the context of hierarchical bit line operations, hierarchical word line decoding can also be implemented without hierarchical bit line scanning. It is preferable to use both hierarchical word line decoding and bit line hierarchical sampling to obtain the synergies of less energy and higher speed for the entire device.

Hierarchische FunktionalitätHierarchical functionality

Bei typischen Ausgestaltungen wächst die Energie ungefähr linear zur Größe des Speichers. Gemäß der vorliegenden Erfindung können sich, wie in 3 bis 6 gezeigt ist, die Energieerfordernisse jedoch nur geringfügig erhöhen, wenn die Gesamtspeicherstrukturgröße wächst, in erster Linie deshalb, weil nur das Speichermodul und die assoziierten lokalen Bitleitungen und lokalen Wortleitungen während einer gegebenen Operation aktiviert werden. Aufgrund der lokalisierten Funktionalität werden die globalen Bitleitungen und Wortleitungen für relativ kurze Zeiträume zu Beginn und am Ende der Operation aktiviert. Auf jeden Fall wird der Energie verbrauch im allgemeinen durch die Bitgröße des Worts und die Grundmodulkonfiguration, d.h. die Anzahl der Zeilen und die Zeilenlänge der Module 620a–e, bestimmt. Daher können wesentliche Vorteile durch vernünftiges Auswählen der Konfiguration eines Speichermoduls in Bezug auf die Gesamtspeicherstrukturkonfiguration realisiert werden. Beispielsweise kann bei einer erfindungsgemäßen Speicherstruktur eine Verdoppelung der Größe der Speichervorrichtung zu einem Energieverbrauchs-Zuwachs von ca. 20 Prozent und nicht, wie bei Ausgestaltungen des Standes der Technik zu finden, zu einer Verdoppelung führen. Des weiteren kann eine erfindungsgemäße Speicherstruktur eine vier- bis sechsfache Abnahme der Energieerfordernisse realisieren und 30% bis 50% schneller, und häufig noch schneller, arbeiten als traditionelle Architekturen.In typical embodiments, the energy grows approximately linearly with the size of the memory. According to the present invention, as shown in FIG 3 to 6 however, the power requirements increase only slightly as the overall memory structure size grows, primarily because only the memory module and the associated local bitlines and local wordlines are activated during a given operation. Due to the localized functionality, the global bitlines and wordlines are activated for relatively short periods of time at the beginning and at the end of the operation. In any case, energy consumption is generally determined by the bit size of the word and the basic module configuration, ie, the number of rows and the row length of the modules 620a-e , certainly. Therefore, substantial advantages can be realized by judiciously selecting the configuration of a memory module with respect to the overall memory structure configuration. For example, in a memory structure according to the invention a doubling of the size of the memory device to an energy consumption increase of about 20 percent and not, as found in embodiments of the prior art, lead to a doubling. Furthermore, a memory structure according to the invention can realize a four to sixfold reduction in power requirements and operate 30% to 50% faster, and often faster, than traditional architectures.

7 zeigt, dass erfindungsgemäße Speicherstrukturen, beispielsweise die Speicherstruktur 740, voll hierarchisch sind, indem jede Stufe innerhalb der Hierarchie lokales Bitleitungs-Abtasten, lokales Wortleitungs-Decodieren, oder beides, umfasst. Die beispielhafte Speicherstruktur 740 ist eine dreistufige hierarchische Vorrichtung, wobei das Speichermodul 700 für die Grund-, oder niedrigste, Stufe (L₀) der Speicherhierarchie, die Speichervorrichtung 720 für die Zwischenstufe (L₁) der Speicherhierarchie und die Speicherstruktur 740 für die obere Stufe (L₂) der Speicherhierarchie repräsentativ ist. Aus Gründen der Vereinfachung ist nur eine Speicherspalte in jeder Stufe gezeigt, so dass die Speicherspalte 702 für die Grundstufe (L₀), die Speicherspalte 722 für die Zwischenstufe (L₁) und die Speicherspalte 742 für die obere Stufe (L₂) repräsentativ sein soll. 7 shows that memory structures according to the invention, for example the memory structure 740 are hierarchical in that each stage within the hierarchy includes local bitline scanning, local wordline decoding, or both. The exemplary memory structure 740 is a three-level hierarchical device, wherein the memory module 700 for the basic, or lowest, level (L ₀ ) of the memory hierarchy, the memory device 720 for the intermediate stage (L ₁ ) of the memory hierarchy and the memory structure 740 is representative of the upper level (L ₂ ) of the memory hierarchy. For the sake of simplicity, only one storage column is shown in each stage, such that the storage column 702 for the basic level (L ₀ ), the storage column 722 for the intermediate stage (L ₁ ) and the storage column 742 for the upper stage (L ₂ ) should be representative.

Speichervorrichtungen der Stufe L₀, z.B. das Speichermodul 700, bestehen aus mehreren Speicherzellen, allgemein durch die Speicherzelle 701 angegeben, die in Zeilen-, Spalten- oder 2-D-Array (Reihen und Spalten)-Formaten angeordnet sein können. Das Speichermodul 700 verwendet bevorzugt lokales Bitleitungs-Abtasten, lokales Wortleitungs-Decodieren, oder beides, wie in Bezug auf 3 bis 6 beschrieben worden ist. Bei dem vorliegenden Beispiel weist das Modul M00 sowohl lokales Bitleitungs-Abtasten als auch lokales Wortleitungs-Decodieren auf. Jede Speicherzelle M01 in einer jeweiligen Spalte von Speicherzellen 702 ist durch lokale Bitleitungen 704a, 704b mit dem lokalen Leseverstärker 703 gekoppelt. Obwohl lokales Bitleitungs-Abtasten in einer Speicherspalte durchgeführt werden kann, die eine einzige Speicherzelle aufweist, ist es bevorzugt, dass zwei, oder mehr, Speicherzellen 701 mit dem lokalen Leseverstärker 703 gekoppelt sind. Anders als einige Speichervorrichtungen des Standes der Technik, die auf das lokale Bitleitungs-Abtasten verzichten, indem sie spezielle Speicherzellen verwenden, die bei vollen logi schen Pegeln starke Signale bereitstellen, kann das Modul 700 herkömmliche Speicherzellen 701 mit niedriger Energie als einzelne Speicherzellen verwenden, und es ist in der Tat bevorzugt, dass es diese verwendet. Ein Vorteil des lokalen Bitleitungs-Abtastens ist, dass der lokale Leseverstärker 703 nur eine begrenzte Spannungsschwankung auf den Bitleitungen 704a, 704b benötigt, um den Zustand der Speicherzelle 701 genau abzutasten, was eine rasche Ermittlung und ein rasches Berichten des Speicherzustands mit wesentlich geringerem Energieverbrauch als bei Ausgestaltungen des Standes der Technik ermöglicht. Der lokale Leseverstärker der Stufe L₀ 703 ermittelt den Speicherzustand der Speicherzelle 701 durch Koppeln des Speicherzustandssignals über die lokalen Bitleitungen 704a, 704b an den lokalen Leseverstärker der Stufe L₀ 703. Es ist bevorzugt, dass das Speicherzustandssignal ein Signal mit begrenzter Spannungsschwankung ist. Der Verstärker 703 überträgt ein abgetastetes Signal, das für den Speicherzustand der Speicherzelle 701 repräsentativ ist, an den Leseverstärker der Stufe L₁ 723 über die Ausgänge 705a, 705b des lokalen Leseverstärkers der Stufe L₀, die mit den Zwischenstufen-Bitleitungen 724a, 724b verbunden sind. Es ist bevorzugt, dass das abgetastete Signal ebenfalls ein Signal mit begrenzter Spannungsschwankung ist. Der Verstärker 723 wiederum überträgt ein zweites abgetastetes Signal, das für den Speicherzustand der Speicherzelle 701 repräsentativ ist, an den Leseverstärker der Stufe L₂ 743 über die Ausgänge 725a, 725b des lokalen Leseverstärkers der Stufe L₁, die mit den Bitleitungen 744a, 744b der oberen Stufe verbunden sind. Es ist ebenfalls bevorzugt, dass das zweite abgetastete Signal ein Signal mit begrenzter Spannungsschwankung ist.Memory devices of the stage L ₀ , for example, the memory module 700 , consist of several memory cells, generally by the memory cell 701 which may be arranged in row, column or 2-D array (row and column) formats. The memory module 700 Preferably, it uses local bitline scanning, local wordline decoding, or both as described with respect to FIG 3 to 6 has been described. In the present example, the module M00 includes both local bitline scanning and local wordline decoding. Each memory cell M01 in a respective column of memory cells 702 is through local bitlines 704a . 704b with the local sense amplifier 703 coupled. Although local bit line sampling may be performed in a memory column having a single memory cell, it is preferred that two, or more, memory cells 701 with the local sense amplifier 703 are coupled. Unlike some prior art memory devices that forego local bit line sampling by using special memory cells that provide strong signals at full logic levels, the module can 700 conventional memory cells 701 with low energy than individual memory cells, and it is indeed preferable that it uses them. An advantage of local bit line sampling is that the local sense amplifier 703 only a limited voltage fluctuation on the bit lines 704a . 704b needed to change the state of the memory cell 701 accurately scan, which allows rapid detection and rapid reporting of the memory state with much lower power consumption than in prior art designs. The local sense amplifier of stage L ₀ 703 determines the memory state of the memory cell 701 by coupling the memory state signal over the local bitlines 704a . 704b at the local reading amplifier of stage L ₀ 703 , It is preferable that the memory state signal is a signal with a limited voltage fluctuation. The amplifier 703 transmits a sampled signal indicative of the memory state of the memory cell 701 is representative of the sense amplifier of the stage L ₁ 723 over the exits 705a . 705b the local sense amplifier of the stage L ₀ , with the intermediate stage bit lines 724a . 724b are connected. It is preferable that the sampled signal is also a signal with limited voltage fluctuation. The amplifier 723 in turn, transmits a second sampled signal indicative of the memory state of the memory cell 701 representative of the sense amplifier of stage L ₂ 743 over the exits 725a . 725b the local sense amplifier of the stage L ₁ , which is connected to the bit lines 744a . 744b the upper level are connected. It is also preferable that the second sampled signal is a signal with limited voltage fluctuation.

Wenn die Stufe L₂ die oberste Stufe in der Speicherhierarchie ist, wie es in dem vorliegenden Beispiel gezeigt wird, kann der Leseverstärker 743 ein globaler Leseverstärker sein, der ein drittes Signal, das für die Speicherzelle 701 repräsentativ ist, über die Leseverstärker-Ausgangsleitungen 746a, 746b an die (nicht gezeigte) assoziierte Eingangs-/Ausgangsschaltung weiterleitet. Eine derartige Eingangs/Ausgangsschaltung kann der Eingangs-/Ausgangsschaltung in 1 ähnlich sein. Die vorliegende Erfindung sieht jedoch eine hierarchische Struktur vor, die aus zwei, drei, vier, oder mehr Hierarchiestufen bestehen kann. Das Signal der obersten Stufe kann ein Signal mit voller Schwankung sein. Beim Betrachten der 7 erkennt der Fachmann, dass „lokales Bitleitungs-Abtasten" auf jeder Stufe L₀, L₁ und L₂ in der beispielhaften Hierarchie stattfindet und erwünscht ist, z.B. weil nur eine begrenzte Spannungsschwankung nötig sein kann, um den angefragten Speicherzustand von einer niedrigeren Stufe in der Hierarchie an die nächsthöhere Stufe zu berichten.If the stage L _{2 is} the topmost level in the memory hierarchy, as shown in the present example, the sense amplifier can 743 a global sense amplifier that provides a third signal to the memory cell 701 representative of the sense amplifier output lines 746a . 746b to the associated input / output circuit (not shown). Such input / output circuit may be the input / output circuit in 1 be similar to. However, the present invention provides a hierarchical structure that may consist of two, three, four, or more hierarchical levels. The top level signal may be a full swing signal. When looking at the 7 It will be appreciated by those skilled in the art that "bit line local sampling" occurs and is desired at each stage L ₀ , L _1, and L ₂ in the example hierarchy, eg, because only a limited voltage swing may be required to lower the requested memory state from a lower level to report the hierarchy to the next higher level.

Hierarchische Speicherstrukturen können auch lokales Wortleitungs-Decodieren verwenden, wie bei der Speichervorrichtung 740 gezeigt ist. In 7 ist die Speichervorrichtung 740 die oberste Stufe (L₂) in der hierarchischen Speicherstruktur, daher wird das ankommende globale Wortleitungssignal 746 von den (nicht gezeigten) globalen Wortleitungs-Treibern, z.B. den globalen Zeilen-Adressdecodern 110 in 1, empfangen. Bei bestimmten bevorzugten Ausführungsformen der vorliegenden Erfindung wird Predecodierung verwendet, um raschen Zugriff auf erwünschte Wortleitungen zu bewirken, obwohl Predecodierung nicht auf jeder Stufe in einer bestimmten Implementierung erforderlich und erwünscht ist. Das Signal M46 wird von dem Predecoder 747 der oberen Stufe empfangen, predecodiert und an die globalen Wortleitungs-Decoder der oberen Stufe (L₂), z.B. den globalen Wortleitungs-Decoder 748, weitergeleitet. Der Decoder M48 ist mittels der globalen Wortleitung 750 der oberen Stufe an den lokalen Wortleitungs-Decoder 749 gekoppelt und aktiviert den lokalen Wortleitungs-Decoder 749 der oberen Stufe selektiv. Der aktivierte lokale L₂-Decoder M49 wiederum aktiviert die lokale L₂-Wortleitung 751, die das ausgewählte Wortleitungssignal 726 an den Predecoder 727 der Zwischenstufe (L₁) weiterleitet. Der Predecoder 727 decodiert und aktiviert den entsprechenden globalen Wortleitungs-Decoder der Zwischenstufe (L₁), z.B. den globalen Wortleitungs-Decoder 728. Der Decoder 728 ist mit dem lokalen Wortleitungs-Decoder 729 der Stufe L₁ mittels der globalen Wortleitung 730 der Stufe L₁ gekoppelt und aktiviert diese selektiv. Der aktivierte lokale L₁-Decoder 729 wiederum leitet ein ausgewähltes Wortleitungssignal 706 an den Predecoder 707 der Grundstufe (L₀) weiter, der den entsprechenden globalen Wortleitungs-Decoder der Stufe L₀, z.B. den globalen Wortleitungs-Decoder 708, decodiert und aktiviert. Der aktivierte lokale L₀-Decoder 709 wiederum aktiviert die lokale L₀-Wortleitung 711 und wählt die Speicherzelle 701 zum Zugriff aus. In Anbetracht der vorstehenden Erörterung des hierarchischen Wortleitungs-Decodierens erkennt der Fachmann, dass „lokales Wortleitungs-Decodieren" auf jeder Stufe L₀, L₁ und L₂ in der beispielhaften Hierarchie auftritt und erwünscht ist, weil eine wesentliche Verringerung der für den Zugriff auf ausgewählte Speicherzellen benötigten Zeit und Energie realisiert werden kann.Hierarchical memory structures may also use local wordline decoding, as in the memory device 740 is shown. In 7 is the storage device 740 the uppermost stage (L ₂ ) in the hierarchical memory structure, therefore becomes the incoming global wordline signal 746 from the global wordline drivers (not shown), eg, the global row address decoders 110 in 1 , received. In certain preferred embodiments of the present invention, predecoding is used to provide rapid access to desired wordlines, although predecoding is not required and desired at each stage in a particular implementation. The signal M46 is from the Predecoder 747 the upper stage is received, predecoded and sent to the upper-level global word line decoders (L ₂ ), eg the global word line decoder 748 , forwarded. The decoder M48 is by means of the global word line 750 the upper level to the local word line decoder 749 coupled and activates the local word line decoder 749 the upper level selective. The activated local L ₂ decoder M49 in turn activates the local L ₂ word line 751 containing the selected wordline signal 726 to the Predecoder 727 the intermediate stage (L ₁ ) passes. The Predecoder 727 decodes and activates the corresponding global word line decoder of the intermediate stage (L ₁ ), eg the global word line decoder 728 , The decoder 728 is with the local word line decoder 729 the stage L ₁ by means of the global word line 730 coupled to the stage L ₁ and activates this selectively. The activated local L ₁ decoder 729 in turn, passes a selected wordline signal 706 to the Predecoder 707 the basic stage (L ₀ ), which is the corresponding global word line decoder of the stage L ₀ , for example, the global word line decoder 708 , decoded and activated. The activated local L ₀ decoder 709 in turn, activates the local L ₀ word line 711 and selects the memory cell 701 to access. In view of the above discussion of hierarchical wordline decoding, those skilled in the art will recognize that "local wordline decoding" occurs and is desirable at each stage L ₀ , L ₁ and L ₂ in the example hierarchy because of a substantial reduction in access to selected memory cells required time and energy can be realized.

Obwohl das lokale Wortleitungs-Decodieren in dem Modul 700 im Zusammenhang mit einer einzigen Spalte von Speicherzellen, nämlich den Speicherspalten 702, 722, 742 gezeigt ist, sieht die vorliegende Erfindung vor, dass das lokale Wortleitungs-Decodieren über zwei, oder mehr, Spalten in jeder Hierarchiestufe durchgeführt wird, wobei jede der Zeilen in den jeweiligen Spalten zwei oder mehr lokale Wortleitungs-Decoder, z.B. die lokalen Wortleitungs-Decoder 709, 729, 749 ver wendet, die mit jeweiligen globalen Wortleitungs-Decodern, z.B. den globalen Wortleitungs-Decodern 708, 728, 748, mittels jeweiliger globaler Wortleitungen, z.B. den globalen Wortleitungen 710, 730, 750, gekoppelt sind. Es ist jedoch nicht erforderlich, dass in zwei Stufen der hierarchischen Struktur dieselbe Anzahl von Zeilen und Spalten verwendet wird. Im allgemeinen kann die Speichervorrichtung 720 aus mehreren Speichermodulen 700 aufgebaut sein, wobei diese Grundmodule 700 in Zeilen-, Spalten- oder 2-D-Array (Zeilen und Spalten)-Format angeordnet sein können. Derartige Grundspeichermodule können ähnlich den in Bezug auf 3 bis 6 gezeigten, sowie Kombinationen hiervon sein. Ähnlich kann die Speichervorrichtung 740 aus mehreren Speichervorrichtungen 720 aufgebaut sein, wobei diese Zwischenvorrichtungen 720 ebenfalls in Zeilen-, Spalten oder 2-D-Array (Reihen und Spalten)-Format angeordnet sein können. Diese erweiterte, und erweiterbare, Hierarchie erlaubt die Bildung mehrdimensionaler Speichermodule, die sich von hierarchieartigen Implementierungen des Standes der Technik unterscheiden, die im allgemeinen 2-D-Gruppierungen von Bank-, Seiten- oder Segment-Speichervorrichtungen, oder Registerfile-Speichervorrichtungen sind, denen es in jeder Stufe der Hierarchie an lokaler Funktionalität mangelt.Although the local wordline decoding in the module 700 in the context of a single column of memory cells, namely the memory columns 702 . 722 . 742 2, the present invention contemplates that local wordline decoding be performed over two or more columns in each hierarchy level, each of the rows in the respective columns being two or more local wordline decoders, eg, the local wordline decoders 709 . 729 . 749 used with respective global word line decoders, eg the global word line decoders 708 . 728 . 748 , by means of respective global word lines, eg the global word lines 710 . 730 . 750 , are coupled. However, it is not necessary to use the same number of rows and columns in two stages of the hierarchical structure. In general, the storage device 720 from several memory modules 700 be constructed, these basic modules 700 can be arranged in a row, column or 2-D array (rows and columns) format. Such basic memory modules may be similar to those described with respect to 3 to 6 shown, as well as combinations thereof. Similarly, the storage device 740 from several storage devices 720 be constructed, these intermediate devices 720 can also be arranged in rows, columns or 2-D array (rows and columns) format. This extended, and extensible, hierarchy allows for the formation of multi-dimensional memory modules that differ from prior art prior art hierarchical implementations, which are generally 2-D groupings of bank, page or segment memory devices, or register file storage devices There is a lack of local functionality at every level of the hierarchy.

Schneller Decoder mit asynchronem RücksetzenFast decoder with asynchronous reset

Typischerweise kann lokales Decoder-Rücksetzen verwendet werden, um enge Impulsweiten in Wortleitungen in einer schnellen Speichervorrichtung zu erzeugen. Die in den Wortleitungs-Decoder eingegebenen Signale werden im allgemeinen auf ein Takt- oder Chip-Auswahl-Signal synchronisiert. Es ist jedoch erwünscht, dass die Wortleitung unabhängig vom Takt und auch vom Variieren der Eingangssignale in den Wortleitungs-Decoder zurückgesetzt wird.typically, can perform local decoder reset used to narrow pulse widths in word lines in one to generate a fast memory device. The in the word line decoder input signals are generally applied to a clock or chip select signal synchronized. However, it is desirable that the wordline independent of Clock and also from varying the input signals in the word line decoder reset becomes.

8 ist ein Schaltungsdiagramm, das einen asynchron zurücksetzbaren Decoder 800 gemäß diesem Aspekt der vorliegenden Erfindung zeigt. Es kann erwünscht sein, die AND-Funktion beispielsweise durch eine quellgekoppelte Logik zu implementieren. Die Kapazität am Eingang x2_n 802 kann im allgemeinen groß sein, daher wird die AND-Funktion mit ungefähr einer Inverter-Verzögerung plus drei Puffer-Stufen durchgeführt. Die Puffer werden Skewing unterzogen, was die Ladungskapazität um ca. die Hälfte verringert und die Puffer-Verzögerung erniedrigt. 8th is a circuit diagram showing an asynchronously resettable decoder 800 according to this aspect of the present invention. It may be desirable to implement the AND function by, for example, a source coupled logic. The capacity at the input x2_n 802 may generally be large, therefore, the AND function is performed with approximately one inverter delay plus three buffer stages. The buffers undergo skewing, which reduces the charge capacity by about half and lowers the buffer delay.

Um die Wortleitung WL 804 unabhängig zurücksetzen zu können, ist es erwünscht, dass die Eingänge 802, 803 vom Ausgang 804 isoliert werden, und der Knoten 805 sollte auf V_dd geladen werden, wodurch der große PMOS-Treiber M8 807 abgeschaltet wird, sobald die Wortleitung WL 804 auf logisch HOCH gesetzt wird. Das Laden des Knotens 805 auf V_dd kann durch eine Rückkopplungs-Rücksetz-Schleife erreicht werden. Die Eingänge 802, 803 können von dem Ausgang 804 durch Setzen der NMOS-Vorrichtung 808 auf logisch LOW isoliert werden. Wenn der Ausgang WL 804 hoch wird, wird der Monitorknoten 810 gegen Masse entladen und die Vorrichtung M0 812 wird abgeschaltet, wodurch die Eingänge 802, 803 von dem Ausgang WL 804 isoliert werden. Die Rückkopplungs-Schleife lädt den Rest der Knoten in den Puffern über den Monitorknoten 810 vor, und der PMOSFET M13 815 wird eingeschaltet, wodurch der Eingang x2_n 802 mit dem Knoten 810 verbunden wird. Der Decoder 800 geht erst wieder in Betrieb, wenn x2_n 802 auf V_dd zurückgesetzt wird, was normalerweise passiert, wenn das Systemtaktsignal auf logisch LOW übergeht. Sobald x2_802 logisch HIGH ist, lädt der Knoten 810 mit Hilfe der PMOS-Vorrichtung M14 818 auf V_dd, und die Vorrichtung M0 812 wird eingeschaltet. Dies schaltet die PMOS-Vorrichtung M13 815 ab, wodurch der Eingang x2_n 802 von der Rücksetz-Schleife isoliert wird, die den Knoten 810 verwendet. Der Decoder 800 ist nun für den nächsten Eingabezyklus bereit.To the word line WL 804 To reset independently, it is desirable that the inputs 802 . 803 from the exit 804 be isolated, and the node 805 should be loaded on _Vdd , causing the large PMOS driver M8 807 is switched off as soon as the word line WL 804 is set to logically HIGH. Loading the node 805 on _Vdd can be achieved by a feedback reset loop. The inputs 802 . 803 can from the output 804 by setting the NMOS device 808 to be isolated logically LOW. When the output WL 804 becomes high, becomes the monitor node 810 discharged to ground and the device M0 812 is turned off, reducing the inputs 802 . 803 from the output WL 804 be isolated. The feedback loop loads the rest of the nodes in the buffers across the monitor node 810 before, and the PMOSFET M13 815 is turned on, causing the input x2_n 802 with the node 810 is connected. The decoder 800 will not start until x2_n 802 is reset to V _dd , which normally happens when the system clock signal transitions to a logical LOW. As soon as x2_ 802 Logically HIGH, the node loads 810 using the PMOS device M14 818 on _Vdd , and the device M0 812 is turned on. This turns on the PMOS device M13 815 which causes the input x2_n 802 is isolated from the reset loop, which is the node 810 used. The decoder 800 is now ready for the next input cycle.

Treiberschaltung mit begrenzter SchwankungDriver circuit with limited fluctuation

9 zeigt eine Treiberschaltung 900 mit begrenzter Schwankung gemäß einem Aspekt der vorliegenden Erfindung. Bei Speichern mit großer Wortlänge kann eine beträchtliche Menge Energie in den Datenbussen verbraucht werden. Das Begrenzen der Spannungsschwankung in derartigen Bussen kann den Gesamtenergieverbrauch des Systems erniedrigen. Dies kann auch für ein System gelten, bei dem eine bedeutende Menge von Energie beim Schalten von Leitungen mit hoher Kapazität verbraucht wird. Die Treiberschaltung mit begrenzter Schwankung 900 kann Energieverbrauch beispielsweise in Leitungen mit hoher Kapazität reduzieren. Wenn das IN-Signal 902 logisch HIGH ist, leitet der NMOS-Transistor MN1 904, und der Knoten 905 wird effektiv an Masse gelegt. Außerdem wird die Bitleitung 910 durch den PMOSFET MP1 912 entladen. Durch geeignete Dimensionierung der Vorrichtung kann die Spannungsschwankung in der Bitleitung 910 auf einen gewünschten Wert begrenzt werden, wenn der Inverter, der durch die CMOSFETS MP2 914 und MN2 916 gebildet wird, den PMOSFET MP1 912 OFF schaltet. Im allgemeinen steht die Größe der Schaltung 900 in Bezug zu der Kapazität (C_Bitleitung) 918, die getrieben wird, und zu den Größen von MP2 914 und MN2 916. Bei einer anderen Ausführungsform dieses Aspekts der vorliegenden Erfindung weist die Treiberschaltung mit begrenzter Schwankung ein Tri-State Output Enable- und ein Selbstrücksetz-Merkmal auf. Die Tri-State-Funktionalität ist erwünscht, wenn Datenleitungen ge multiplext oder gemeinsam verwendet werden. Obwohl die Spannung an dem Speicherzell-Knoten 905 auf ca. Null Volt schwanken kann, ist es äußerst erwünscht, dass die Bitleitungs-Spannung nur um ca. 200–300 mV schwankt. 9 shows a driver circuit 900 with limited variation according to one aspect of the present invention. With large word length memories, a significant amount of power can be consumed in the data buses. Limiting the voltage fluctuation in such buses can lower the overall energy consumption of the system. This may also apply to a system in which a significant amount of energy is consumed in switching high capacity lines. The driver circuit with limited fluctuation 900 For example, it can reduce energy consumption in high-capacity lines. If the IN signal 902 logic high, the NMOS transistor MN1 conducts 904 , and the node 905 is effectively grounded. In addition, the bit line becomes 910 through the PMOSFET MP1 912 discharged. By suitable dimensioning of the device, the voltage fluctuation in the bit line 910 be limited to a desired value when the inverter is powered by the CMOSFETS MP2 914 and MN2 916 is formed, the PMOSFET MP1 912 OFF switches. In general, the size of the circuit 900 in relation to the capacity (C _{bit line} ) 918 that is driven, and to the sizes of MP2 914 and MN2 916 , In another embodiment of this aspect of the present invention, the limited swing driver circuit includes a tri-state output enable and a self-reset feature. Tri-state functionality is desirable when data lines are multiplexed or shared. Although the voltage at the memory cell node 905 can fluctuate to about zero volts, it is highly desirable that the bit line voltage only varies by about 200-300 mV.

Einpolig geerdeter Leseverstärker mit Abtast- und HaltereferenzSingle-ended sense amplifier with Sample and hold reference

Im allgemeinen sind einpolig geerdete Leseverstärker von Nutzen, um Metallraum zu sparen, doch die bestehenden Ausgestaltungen sind aufgrund ihrer Anfälligkeit für Energiezufuhr- und Grundrauschen tendenziell nicht robust. Bei einem weiteren Aspekt der vorliegenden Erfindung zeigt 10 einen einpolig geerdeten Leseverstärker 1000, vorzugsweise mit einer Abtast- und Haltereferenz. Der Verstärker 1000 kann beispielsweise als globaler Leseverstärker, der Eingangsdaten abtastet, von Nutzen sein. Zu Beginn einer Operation wird DataIn 1004 abgetastet, vorzugsweise gerade bevor die Messung beginnt. Daher beeinträchtigt das Zufuhr-, Grund- oder sonstige Rauschen die Referenzspannung des Leseverstärkers 1000 im allgemeinen auf dieselbe Weise, in der das Rauschen den zu messenden Knoten beeinträchtigt, was die Rauschimmunität des Leseverstärkers 1000 tendenziell erhöht. Beide Eingänge 1010, 1011 des Differentialverstärkers 1012 liegen beim Spannungspegel von DataIn 1004, wenn das Aktivierungssignal (GWSELH) 1014 logisch LOW ist (d.h. beim Nullpotential). Zu einem vorgewählten Intervall vor Beginn der Messung, jedoch bevor DataIn 1013 sich zu ändern beginnt, wird das Aktivierungssignal (GWSELH) 1014 zu logisch HIGH, wodurch der Eingangsknoten 1002 des Transistors M162 1008 isoliert wird. Die DataIn-Spannung, die existiert, gerade bevor die Messung abgenommen wird, wird abgetastet und als Referenz gehalten, wodurch die Schaltung von Grund- oder Spannungszufuhr-Referenzen im wesentlichen unabhängig wird. Die Transistoren M190 1025 und M187 1026 können dem Knoten 1021, in dem die Referenzspannung gespeichert wird, Kapazität hinzufügen. Der Transistor M190 1025 kann auch als Pumpkondensator verwendet werden, um den Spannungsabfall am Referenzknoten 1021 auszugleichen, wenn das Aktivierungssignal HIGH wird und die Source 1002 von M1623 1008 auf niedrigere Spannung zieht. Die Rückkopplung 1030 von den Ausgangsdaten Data_toLSA 1035, die zu einem (nicht gezeigten) lokalen Leseverstärker übertragen werden, ist mit der Source/Drain des Transistors M187 1026 gekoppelt, wodurch die Referenzspannung beim Knoten 1021 durch kapazitives Koppeln aktiv angepasst wird, wodurch der Verstärkergewinn adaptiv angepasst wird.In general, single-ended sense amplifiers are useful to conserve metal space, but the existing designs tend not to be robust due to their susceptibility to power and noise floor. In a further aspect of the present invention shows 10 a single-ended sense amplifier 1000 , preferably with a sample and hold reference. The amplifier 1000 may, for example, be useful as a global sense amplifier sampling input data. At the beginning of an operation Da Tain 1004 sampled, preferably just before the measurement begins. Therefore, the supply, ground or other noise affects the reference voltage of the sense amplifier 1000 generally in the same manner in which the noise affects the node to be measured, which is the noise immunity of the sense amplifier 1000 tends to increase. Both inputs 1010 . 1011 of the differential amplifier 1012 are at the voltage level of DataIn 1004 when the activation signal (GWSELH) 1014 logical is LOW (ie at zero potential). At a preselected interval before starting the measurement, but before DataIn 1013 begins to change, the activation signal (GWSELH) 1014 to logically HIGH, causing the input node 1002 of the transistor M162 1008 is isolated. The DataIn voltage, which exists just before the measurement is taken, is sampled and held as a reference, making the circuit of ground or voltage supply references essentially independent. The transistors M190 1025 and M187 1026 can the node 1021 in which the reference voltage is stored, add capacity. The transistor M190 1025 can also be used as a pump capacitor to detect the voltage drop at the reference node 1021 compensate when the activation signal becomes HIGH and the source 1002 from M1623 1008 pulls on lower tension. The feedback 1030 from the output data Data_toLSA 1035 which are transmitted to a local sense amplifier (not shown) is connected to the source / drain of the transistor M187 1026 coupled, causing the reference voltage at the node 1021 is actively adjusted by capacitive coupling, adaptively adjusting the amplifier gain.

Leseverstärker mit Offset Cancellation und Charge-Share schwankungsbegrenzten TreibernSense amplifier with Offset Cancellation and Charge-Share Varying Drivers

Bei einem weiteren Aspekt der vorliegenden Erfindung ist ein Leseverstärker 1100 vom Latchtyp mit dynamischer Offset Cancellation vorgesehen. Der Leseverstärker 1100 kann auch als globaler Leseverstärker von Nutzen sein und ist zum Einsatz im Zusammenhang mit hierarchischem Bitleitungs-Abtasten geeignet. Typischerweise kann die Empfindlichkeit von Differential-Leseverstärkern durch die Offsets eingeschränkt werden, die durch inhärente Prozessvariationen für Vorrichtungen („Vorrichtungsanpassung") verursacht werden, sowie durch dynamische Offsets, die sich in den Eingangsleitungen während einer Operation mit hoher Geschwindigkeit entwickeln können. Das Vermindern des Verstärker-Offsets führt normalerweise zu einer entsprechenden Verminderung der für eine zuverlässige Operation erforderlichen minimalen Bitleitungs-Schwankung. Geringere Bitleitungs-Schwankungen können zu schnellerer Speicheroperation mit geringerer Energie führen. Beim Verstärker 1100 kann der Offset in den Bitleitungen durch die drei PMOS Precharge-Balance-Transistoren M3 1101, M4 1102, M5 1103 aufgehoben werden; diese Anordnung ist dem Fachmann bekannt. Trotz der Precharge-Balance-Transistoren 1101-1103 kann jedoch an den Eingängen des Latchs ein zusätzlicher Offset existieren. Durch das Verwenden des PMOS Balance-Transistors (M14) 1110 kann ein Offset, der am Eingang des Differential-Leseverstärkers vom Latchtyp vorhanden sein kann, im wesentlichen ausgeglichen werden. Der Leseverstärker 1100 weist einen Charge-Sharing Treiber 1115 mit begrenzter Schwankung auf. Die globalen Bitleitungen 1150, 1151 werden von dem Leseverstärker 1100 getrennt, wenn der Leseverstärker 1100 nicht benutzt wird, d.h. in einem Tri-State Zustand. Der Leseverstärker 1100 kann sich in einem vorgeladenen Zustand befinden, wenn die beiden Eingangs/Ausgangs-Knoten logisch HIGH sind, d.h., wenn beide PMOS Treiber M38 1130 und M29 1131 abgeschaltet sind (Eingänge bei logisch HIGH). Ein großer Kondensator, C₀ 1135, in dem Leseverstärker 1100 kann von zwei in Reihe geschalteten NMOS Transistoren, M37 1140 und M40 1141, im wesentlichen bei Null Volt gehalten werden. Die Größe des Kondensators 1135 kann durch die Höhe der Spannungsschwankung, die typischerweise in den globalen Bitleitungen 1120, 1121 erforderlich ist, bestimmt werden.In a further aspect of the present invention is a sense amplifier 1100 provided by the latchtype with dynamic offset cancellation. The sense amplifier 1100 may also be useful as a global sense amplifier and is suitable for use in conjunction with hierarchical bitline scanning. Typically, the sensitivity of differential sense amplifiers may be limited by the offsets caused by inherent process variations for devices ("device matching") and by dynamic offsets that may develop in the input lines during high speed operation Amplifier offsets usually result in a corresponding reduction in the minimum bitline variation required for a reliable operation, and lower bitline variations can result in faster, lower energy memory operations 1100 For example, the offset in the bitlines may be through the three PMOS precharge balance transistors M3 1101 , M4 1102 , M5 1103 To get picked up; this arrangement is known to the person skilled in the art. Despite the precharge balance transistors 1101 - 1103 however, an additional offset may exist at the inputs of the latch. By using the PMOS balance transistor (M14) 1110 For example, an offset which may be present at the input of the latch-type differential sense amplifier can be substantially equalized. The sense amplifier 1100 has a batch sharing driver 1115 with limited variation. The global bitlines 1150 . 1151 be from the sense amplifier 1100 disconnected when the sense amplifier 1100 is not used, ie in a tri-state condition. The sense amplifier 1100 may be in a precharged state if the two input / output nodes are logic HIGH, ie if both PMOS drivers are M38 1130 and M29 1131 are switched off (inputs at logical HIGH). A large capacitor, C ₀ 1135 in the sense amplifier 1100 can be powered by two series-connected NMOS transistors, M37 1140 and M40 1141 , are held at substantially zero volts. The size of the capacitor 1135 may be due to the amount of voltage fluctuation that typically occurs in the global bitlines 1120 . 1121 is required to be determined.

Wenn der Leseverstärker 1100 aktiviert ist und die Bitleitungen 1150, 1151 logisch HIGH sind, wird der PMOS Transistor M29 1131 angeschaltet, und das globale Bit_n 1150 wird mit begrenzter Schwankung entladen. Wenn ein abzutastendes Bit logisch LOW ist, wird der PMOS Transistor M38 1130 angeschaltet, und das globale Bit 1151 wird mit begrenzter Schwankung entladen. Dieses Schema gemeinsamer Ladung kann zu sehr geringem Energieverbrauch führen, weil nur diejenige Ladung, die die begrenzte Spannungsschwankung in den globalen Bitleitungen 1150, 1151 verursacht, gegen Masse entladen wird. Dies bedeutet, dass es im wesentlichen keinen „Überspannungsschutz-" Strom gibt. Des weiteren kann dieser Aspekt der vorliegenden Erfindung bei Speichern von Nutzen sein, bei denen die globalen Bitleitungen zur Eingabe und Ausgabe gemultiplext werden.If the sense amplifier 1100 is activated and the bitlines 1150 . 1151 are logic high, the PMOS transistor M29 1131 turned on, and the global bit_n 1150 is discharged with limited fluctuation. When a bit to be sampled is logic low, the PMOS transistor becomes M38 1130 turned on, and the global bit 1151 is discharged with limited fluctuation. This common charge scheme can result in very low power consumption because only the charge that has the limited voltage swing in the global bitlines 1150 . 1151 caused to be discharged to ground. This means that there is essentially no "over-voltage protection" current Furthermore, this aspect of the present invention may be useful in memories in which the global bitlines are multiplexed for input and output.

Modulstufen-Speicher-Redundanz-ImplementierungModule-level memory redundancy implementation

In 12 weist eine Speicherstruktur 1200, die aus hierarchischen funktionalen Speichermodulen 1201 aufgebaut ist, vorzugsweise in jedem Modul 1201 wenigstens eine oder mehrere redundante Speicherzeilen 1202, 1204, eine oder mehrere redundante Speicherspalten 1205, 1208, oder beides, auf. Es ist bevorzugt, dass die redundanten Speicherzeilen 1202, 1204 und/oder -spalten 1206, 1208 gepaart sind, weil beobachtet worden ist, dass Bitzellen-Versagen tendenziell paarweise auftritt. Redundanz auf Modulebene kann, wie in 12 gezeigt ist, wo Redundanz unter Verwendung einer vorgewählten Anzahl von redundanten Speicherzeilen 1202, 1204 oder redundanten Speicherspalten 1206, 1208 in dem Speichermodul 1201 implementiert ist, ein sehr bereichseffizienter Ansatz sein, vorausgesetzt, dass die typische Anzahl von Bitzellen-Versagen pro Modul gering bleibt. Dadurch, dass nur eine einzige Zeile 1202 oder eine einzige Spalte 1206 oder beides in dem Speichermodul 1201 implementiert wird, wird nur ein zusätzlicher Multiplexer für die jeweilige Zeile oder Spalte benötigt. Obwohl es einfacher sein kann, redundante Speicherzellen-Schaltungen zur Verfügung zu stellen, die während des Testens des Produkts in der Herstellungsphase aktiviert werden können, kann es auch erwünscht sein, ausgewählte redundante Speicherzellen zu aktivieren, wenn das Speicherprodukt im Einsatz ist, z.B. während der Wartung oder während des Betriebs des Produkts. Eine derartige Aktivierung kann durch zahlreiche Techniken und Unterstützungsschaltungen, die im Stand der Technik bekannt sind, durchgeführt werden.In 12 has a memory structure 1200 consisting of hierarchical functional memory modules 1201 is constructed, preferably in each module 1201 at least one or more redundant memory lines 1202 . 1204 , one or more redundant storage columns 1205 . 1208 , or both. It is preferred that the redundant memory lines 1202 . 1204 and / or columns 1206 . 1208 are paired because it has been observed that bit cell failure tends to occur in pairs. Redundancy at the module level can, as in 12 is shown where redundancy using a preselected number of redundant memory lines 1202 . 1204 or redundant storage columns 1206 . 1208 in the memory module 1201 is a very area-efficient approach, provided that the typical number of bit cell failures per module remains low. By doing that, only a single line 1202 or a single column 1206 or both in the memory module 1201 is implemented, only one additional multiplexer is needed for the particular row or column. While it may be simpler to provide redundant memory cell circuits that may be activated during testing of the product in the manufacturing phase, it may also be desirable to activate selected redundant memory cells when the memory product is in use, eg, during the Maintenance or during operation of the product. Such activation can be accomplished by numerous techniques and support circuits known in the art.

Speicherredundanz-Implementierung mit redundantem ModulMemory redundancy implementation with redundant module

Wie in 13 gezeigt ist, kann die Speicherredundanz auch durch Bereitstellen eines redundanten Moduls 1301 in der Speicherstruktur 1300, die aus den primären Modulen 1304, 1305, 1306, 1307 aufgebaut ist, implementiert werden. Das redundante Modul 1301 kann ein Eins-zu-eins-Ersatz eines defekten primären Moduls, z.B. des Moduls 1304, sein. Bei einem weiteren Aspekt der Erfindung kann das re dundante Modul 1301 in kleinere redundante Speichersegmente 1310a–d aufgeteilt sein, wobei jeweilige Segmente 13a–d als redundante Speicherzellen, z.B. für jeweilige Abschnitte primärer Speichermodule 1304–1307, die defekt sind, vorhanden sind. Die Anzahl der jedem Segment 1310a–d in dem redundanten Speichermodul 1301 zugeteilten Speicherzellen kann eine festgelegte Anzahl sein, oder sie kann flexibel zugeteilt werden, um einer unterschiedlichen Anzahl defekter Speicherschaltungen in jeweiligen primären Speichermodulen 1304–1307 Rechnung zu tragen.As in 13 As shown, memory redundancy may also be provided by providing a redundant module 1301 in the memory structure 1300 coming from the primary modules 1304 . 1305 . 1306 . 1307 is implemented. The redundant module 1301 may be a one-to-one replacement of a defective primary module, eg the module 1304 , be. In a further aspect of the invention, the re dundante module 1301 into smaller redundant memory segments 1310a-d be split, with respective segments 13a-d as redundant memory cells, eg for respective sections of primary memory modules 1304 - 1307 that are defective, are present. The number of each segment 1310a-d in the redundant memory module 1301 allocated memory cells may be a fixed number, or may be flexibly allocated to a different number of defective memory circuits in respective primary memory modules 1304 - 1307 Take into account.

Speicherredundanz-VorrichtungRedundant memory device

14 zeigt einen weiteren Aspekt der vorliegenden Erfindung, der eine Implementierung einer Zeilen- und Spaltenredundanz für eine Speicherstruktur, beispielsweise die Speicherstruktur 100 in 1, oder die Speicherstruktur 300 in 3, vorsieht. Dieser Aspekt der vorliegenden Erfindung kann durch Verwenden von Sicherungen implementiert werden, die, beispielsweise während der Herstellung, programmiert werden können. Beispiele derartiger Verwendungen umfassen Metallsicherungen, die elektrisch oder mittels eines fokussierten Lasers, durchgebrannt werden, oder eine Doppel-Gate-Vorrichtung, die dauerhaft programmiert sein kann. Obwohl die Technik angewendet werden kann, um Zeilenredundanz oder Spaltenredundanz oder beides bereitzustellen, wird sich die vorliegende Erörterung auf Spaltenredundanz beziehen, bei der sowohl die Eingänge als auch die Ausgänge die Vorteile der Redundanz benötigen können. 14 FIG. 12 shows another aspect of the present invention illustrating an implementation of row and column redundancy for a memory structure, such as the memory structure 100 in 1 , or the memory structure 300 in 3 , provides. This aspect of the present invention may be implemented by using fuses that may be programmed, for example during manufacture. Examples of such uses include metal fuses that are blown electrically or by a focused laser, or a dual-gate device that may be permanently programmed. Although the technique can be used to provide row redundancy or column redundancy, or both, the present discussion will refer to column redundancy in which both the inputs and the outputs may need the benefits of redundancy.

14 zeigt eine Ausführungsform dieses Aspekts der vorliegenden Erfindung, die vier Spaltenpaare 1402a–d mit einem redundanten Paar 1404 aufweist. Es ist erwünscht, diesen Aspekt der vorliegenden Erfindung in Form von Leitungspaaren zu implementieren, da eine wesentliche Anzahl von RAM Versagen paarweise, egal ob in Spalten oder Reihen, auftritt. Trotzdem sieht dieser Aspekt der vorliegenden Erfindung auch Einzelleitungs-Redundanz vor. Im allgemeinen kann die Anzahl der Sicherungen in dem Sicherungskasten 1403, die verwendet wird, um Redundanz bereitzustellen, logarithmisch zur Anzahl der Leitungspaare, z.B. der Spaltenpaare, in Bezug gesetzt werden: log₂ (Anzahl der Spaltenpaare), wobei die Anzahl der Spaltenpaare auch die redundanten Paare enthält. Da Sicherungen tendenziell groß sind, sollte ihre Anzahl minimiert werden; somit ist die logarithmische Beziehung von Vorteil. Die Sicherungs-Ausgänge 1405 werden in die Decoder-Schaltungen 1406a–d eingespeist, z.B. ein Sicherungs-Ausgang pro Spaltenpaar. Ein Sicherungs-Ausgang erzeugt einen sogenannten „Schiebezeiger". Der Schiebezeiger gibt das Shift Signal in dem redundant zu machenden Spaltenpaar an und nachfolgende Spaltenpaare können dann inaktiviert werden. Es ist erwünscht, dass die Signale 1405 aus dem Sicherungskasten 1410 decodiert werden, um ein Shift Signal 1412a–d in jedem Spaltenpaar zu erzeugen. Wenn das Shift Signal 1412a–d für eine bestimmte Stelle des Spaltenpaars 1402a–d ausgewählt ist, wie sie von den Sicherungs-Signalen 1405 decodiert ist, zeigt der Schiebezeiger 1412a–d auf diese Stelle. Die Shift Signale für diese Spalte und alle nachfolgenden Spalten rechts von der Spalte des Paarschiebezeigers werden ebenfalls inaktiv. 14 shows an embodiment of this aspect of the present invention, the four column pairs 1402a-d with a redundant pair 1404 having. It is desirable to implement this aspect of the present invention in the form of pairs of lines, since a substantial number of RAM failures occur in pairs, whether in columns or rows. Nevertheless, this aspect of the present invention also provides single-line redundancy. In general, the number of fuses in the fuse box 1403 used to provide redundancy, logarithmically related to the number of pairs of lines, eg, the column pairs: log ₂ (number of column pairs), where the number of column pairs also includes the redundant pairs. Since fuses tend to be large, their numbers should be minimized; thus, the logarithmic relationship is advantageous. The fuse outputs 1405 be in the decoder circuits 1406a-d fed, eg one fuse output per column pair. A fuse output produces a so-called "shift pointer." The shift pointer indicates the shift signal in the column pair to be made redundant, and subsequent column pairs can then be inactivated 1405 from the fuse box 1410 be decoded to a shift signal 1412a-d in each column pair. If the shift signal 1412a-d for a specific location of the column pair 1402a-d is selected as from the backup signals 1405 is decoded, the shift pointer shows 1412a-d to this place. The shift signals for this column and all subsequent columns to the right of the column shift pointer column also become inactive.

Dieser Aspekt der vorliegenden Erfindung kann zusätzlich in 15A und 15B mittels des vorgenannten Konzepts der „Schiebezeiger" gezeigt werden. In 15A sind drei Spaltenpaare 1501, 1502, 1503 und ein redundantes Spaltenpaar 1504 gezeigt. Das Schiebeverfahren wird begrifflich mittels „Liniendiagrammen" angezeigt. Die oberen Linien 1505–1508 der Liniendiagramme sind repräsentativ für die Spalten 1501–1504 in dem Speicherkern, während die unteren Linienpaare 1509-1511 die Dateneingangs-/Datenausgangs-Paare aus den Eingangs-/Ausgangs-Puffern sind. Wenn ein Shift Signal, z.B. das Signal 1405 in 14, für ein bestimmtes Spaltenpaar 1501–1503 logisch LOW ist, ist es bevorzugt, dass die Daten in 1509-1511 mit der jeweiligen Spalte 1501–1503, die sich direkt darüber befindet, durch Multiplexer verbunden werden. 15B zeigt einen fehlerhaften Spaltenzustand. Wenn das Shift Signal logisch HIGH ist, z.B. das Signal 1405 in 14, wird eine fehlerhafte Spalte angezeigt, z.B. Spalte 1552. Die aktiven Spalten 1550, 1551 bleiben fehlerfrei und empfangen ihre Daten weiterhin über die Eingangs-/Ausgangs-Leitungen 1554, 1555. Da jedoch die Spalte 1552 fehlerhaft ist, können Daten von dem Eingangs-/Ausgangs-Puffer 1556 auf das redundante Spaltenpaar 1553 gemultiplext werden. Im Diagramm erscheint es so, dass in die Speicherkernspalten eingehende Daten nach links verschoben werden, während aus den Speicherkernspalten ausgehende Daten nach rechts verschoben werden. Durch Einstellen der Stellung des Schiebezeigers, die im allgemeinen durch den Zustand der Sicherungen bestimmt wird, kann das nicht benutzte redundante Spaltenpaar so verschoben werden, dass es mit einer nicht funktionalen Spalte, z.B. der Spalte 1552, zusammenfällt, und so den Spaltendefekt repariert, wodurch der volle funktionale Speicherertrag erhöht wird.This aspect of the present invention can be additionally described in 15A and 15B by means of the aforementioned concept of the "shift pointers" 15A are three column pairs 1501 . 1502 . 1503 and a redundant column pair 1504 shown. The shift method is conceptually indicated by "line diagrams." The upper lines 1505 - 1508 The line charts are representative of the columns 1501 - 1504 in the memory core, while the bottom line pairs 1509 - 1511 the data input / output pairs are from the input / output buffers. If a shift signal, eg the signal 1405 in 14 , for a specific column pair 1501 - 1503 logical is LOW, it is preferable that the data is in 1509 - 1511 with the ever right column 1501 - 1503 which is located directly above, be connected by multiplexer. 15B shows a faulty column state. If the shift signal is logically HIGH, eg the signal 1405 in 14 , a faulty column is displayed, eg column 1552 , The active columns 1550 . 1551 remain error-free and continue to receive their data through the input / output lines 1554 . 1555 , However, because the column 1552 is erroneous, data may be from the input / output buffer 1556 to the redundant column pair 1553 be multiplexed. In the chart, it appears that data entering the memory core columns is shifted to the left while data leaving the memory core columns is shifted to the right. By adjusting the position of the shift pointer, which is generally determined by the state of the fuses, the unused redundant column pair may be shifted to a non-functional column, eg, the column 1552 , collapses, thus repairing the gap defect, thereby increasing the full functional storage yield.

Auswähleinrichtung für redundante SpeicherschaltungenSelector for redundant memory circuits

16 zeigt einen weiteren Aspekt der vorliegenden Erfindung, bei dem die Auswähleinrichtung 1600 eine Form von Redundanz bereitstellen kann. Die Auswähleinrichtung 1600 kann eine primäre Decoder-Schaltung 1605 aufweisen, die ein globaler Wortleitungs-Decoder sein kann, der mit einem Multiplexer 1610 gekoppelt ist. Der Multiplexer 1610 kann durch eine Redundanzschaltung 1620 aktiviert werden, die ein Sicherungssystem, ein programmierbarer Speicher oder eine andere Schaltung sein kann, die ein Aktivierungssignal 1630 über den Multiplexer 1610 an die Auswähleinrichtung 1600 bereitstellen kann. Die Auswähleinrichtung 1600 ist zur Implementierung von Redundanz auf Modulebene geeignet, wie diejenige, die in Bezug auf das Modul 1200 in 12 beschrieben ist, die für eine gegebene Implementierung Zeilenredundanz oder Spaltenredundanz sein kann. Im normalen Betriebsablauf wird das Eingangs-Wortleitungssignal 1650 in der Decoder-Schaltung 1605 decodiert und, wenn in der lokalen Wortleitung 1670 kein Fehler vorliegt, wird das Wortleitungssignal an die erste lokale Leitung 1680 weitergeleitet. Falls ein Fehler entdeckt wird, wählt der Multiplexer 1610 die zweite lokale Leitung 1660 aus, die vorzugsweise eine redundante Wortleitung ist. 16 shows a further aspect of the present invention, wherein the selector 1600 can provide some form of redundancy. The selector 1600 can be a primary decoder circuit 1605 which may be a global wordline decoder connected to a multiplexer 1610 is coupled. The multiplexer 1610 can through a redundancy circuit 1620 can be activated, which may be a backup system, a programmable memory or other circuitry that generates an activation signal 1630 over the multiplexer 1610 to the selector 1600 can provide. The selector 1600 is suitable for implementing module-level redundancy, such as the one related to the module 1200 in 12 which, for a given implementation, may be row redundancy or column redundancy. In normal operation, the input wordline signal becomes 1650 in the decoder circuit 1605 decoded and, if in the local wordline 1670 If there is no error, the word line signal goes to the first local line 1680 forwarded. If an error is detected, the multiplexer selects 1610 the second local line 1660 which is preferably a redundant word line.

Schneller Decoder mit ZeilenredundanzMore quickly Decoder with line redundancy

17 zeigt eine bevorzugte Ausführungsform der Auswähleinrichtung 1600 in 16 in Form des Decoders 1700 mit Zeilenredundanz, wie er in einer hierarchischen Speicherumgebung realisiert ist. Der Decoder 1700 kann zur Implementierung von Redundanz auf Modulebene, wie derjenigen, die in Bezug auf das Modul 1200 in 12 beschrieben ist, besonders geeignet sein. Der globale Decoder 1700 kann ähnlich wie der asynchron zurücksetzbare Decoder 800 der 8 arbeiten. Im allgemeinen kann der Decoder 1700 mit einer ersten, gewünschten Speicherzeile und einer zweiten, alternativen Speicherzeile gekoppelt sein. Obwohl die zweite Zeile eine physikalische Zeile neben der ersten Speicherzeile sein kann, und eine weitere der ursprünglich gewünschten Zeilen des Speichermoduls, kann die zweite Zeile auch eine redundante Zeile sein, die in dem Modul implementiert ist. Obwohl der Zeilen-Decoder 1700 bei normalen Operationen die erste Speicherzeile decodiert, kann er auch die zweite Speicherzeile im Ansprechen auf ein Signal zum Auswählen einer alternativen Zeile auswählen und decodieren. Wenn die zweite Zeile eine redundante Zeile ist, kann es geeigneter sein anzunehmen, dass das Auswählsignal ein Signal zum „Auswählen einer redundanten Zeile" ist. Die vorgenannten Zeilen-Auswählsignale sind als Eingänge 1701 und 1702 dargestellt. 17 shows a preferred embodiment of the selector 1600 in 16 in the form of the decoder 1700 with row redundancy, as implemented in a hierarchical storage environment. The decoder 1700 can be used to implement module-level redundancy, such as those related to the module 1200 in 12 described, be particularly suitable. The global decoder 1700 can be similar to the asynchronously resettable decoder 800 of the 8th work. In general, the decoder 1700 be coupled to a first, desired memory line and a second, alternative memory line. Although the second row may be a physical row next to the first memory row and another of the originally desired rows of the memory module, the second row may also be a redundant row implemented in the module. Although the line decoder 1700 during normal operations, decodes the first memory line, it may also select and decode the second memory line in response to a signal to select an alternative line. If the second row is a redundant row, it may be more appropriate to assume that the select signal is a signal for "selecting a redundant row." The aforementioned row select signals are inputs 1701 and 1702 shown.

Wenn daher der Eingang 1701 oder 1702 aktiviert wird, überträgt der Decoder 1700 das lokale Wortleitungs-Signal, das normalerweise auf WL 1706 ausgegeben wird, so, dass es auf xL_Next 1705 ausgegeben wird, das mit einer benachbarten Wortleitung gekoppelt ist. Im allgemeinen werden, wenn ein Wortleitungs-Decoder, der sich an einer bestimmten Stelle in einem Speichermodul befindet, ein Shift Signal empfängt, die nach diesem Decoder verbleibenden Decoder ebenfalls verschoben, so dass der letzte Decoder in der Reihe seine jeweiligen WL-Daten zu einer redundanten Wortleitung verschiebt. Bei Verwendung eines zweidimensional aufgebauten Modells kann, wenn sich eine redundante Zeile an der unteren Position eines Modells befindet, dieser Prozess so beschrieben werden, dass ein Fehler an einer bestimmten Stelle eine Verschiebung aller lokalen Wortleitungen an und unterhalb der Position des Fehlers nach unten bewirkt. Die lokalen Wortleitungen oberhalb der Position des Fehlers können unverändert bleiben.If therefore the entrance 1701 or 1702 is activated, transmits the decoder 1700 the local wordline signal normally on WL 1706 is issued, so that it is on xL_Next 1705 is output, which is coupled to an adjacent word line. In general, when a wordline decoder located at a particular location in a memory module receives a shift signal, the decoder remaining after that decoder also shifts, so that the last decoder in the row shuffles its respective WL data Redundant word line shifts. Using a two-dimensional model, if a redundant row is at the bottom of a model, that process may be described as an error at a particular location causing all local wordlines to shift at and below the position of the error down. The local word lines above the position of the error can remain unchanged.

Hybride Singale Port und Dual Port (R/W) FunktionalitätHybrid Singale Port and Dual Port (R / W) functionality

Implementierungen hierarchischer Speichermodule führen zu wesentlicher Zeitersparnis, die teilweise der lokalisierten Funktionalität zu verdanken ist. Die Signalfortpflanzungszeit an der lokalen Modulstufe ist tendenziell wesentlich geringer als die typische Zugriffszeit einer größeren Speicherstruktur, obwohl diese bestehende Seiten-, Bank- und Segmentspeicherarray- und Registerfile-Schemata anwendet. Tatsächlich können sowohl Lese- als auch Schreib-Operationen, die auf der Grundmodulstufe durchgeführt werden, innerhalb eines Bruchteils der Gesamtspeicherstrukturzugriffszeit stattfinden. Des weiteren sind, weil das erfindungsgemäße Bitleitungs-Abtasten energiesparend ist und zu keinem wesentlichen Abfall von Vorladungsspannungen führt, die Bitleitungs-Spannungspegel nach einer Operation tendenziell marginal erniedrigt. Als Folge hiervon ist es bei bestimmten bevorzugten Ausführungsformen der vorliegenden Erfindung möglich, zwei Operationen direkt hintereinander ohne intervenierenden Vorladungszyklus durchzuführen, und zwar innerhalb eines einzigen Zugriffszyklusses der Gesamtspeicherstruktur. Daher funktionien, obwohl eine Speichervorrichtung als Single Port Vorrichtung ausgestaltet sein kann, eine bevorzugte Ausführungsform des Speichermoduls ähnlich einer Two Port Speichervorrichtung, was einer derartigen Ausführungsform einen beträchtlichen Vorteil gegenüber Speicherstrukturen des Standes der Technik mit vergleichbarer Gesamtspeichergröße verleihen kann.Hierarchical memory module implementations lead to significant time savings, due in part to localized functionality. The signal propagation time at the local module stage tends to be significantly less than the typical access time of a larger memory structure, even though it uses existing page, bank, and segment memory array and register file schemes. In fact, both read and write operations performed at the basic module level can be done within a fraction of the Total memory structure access time take place. Furthermore, because bit line sampling in accordance with the present invention is energy efficient and does not result in any significant drop in precharge voltages, the bit line voltage levels tend to be marginally lowered after operation. As a result, in certain preferred embodiments of the present invention, it is possible to perform two operations directly in succession without an intervening precharge cycle, within a single access cycle of the overall memory structure. Therefore, although a memory device may be configured as a single-port device, a preferred embodiment of the memory module functions similar to a two-port memory device, which can give such an embodiment a significant advantage over prior art memory structures of comparable total memory size.

18 zeigt eine bestimmte Ausführungsform dieses Aspekts der vorliegenden Erfindung in der Speicherstruktur 1800, bei der sowohl lokales Bitleitungs-Abtasten als auch lokales Wortleitungs-Decodieren verwendet werden, wie oben beschrieben ist. Die Speicherstruktur 1800 weist das Speichermodul 1805 auf, das mit dem lokalen Wortleitungs-Decoder 1815 und dem lokalen Bitleseverstärker 1820 gekoppelt ist. In dem Speichermodul 1805 befindet sich eine vordefinierte Anzahl von Speicherzellen, beispielsweise die Speicherzelle 1825, die über die lokale Wortleitung 1810 mit dem lokalen Wortleitungs-Decoder 1815 und über die lokalen Bitleitungen 1830 mit dem lokalen Bitleseverstärker 1820 gekoppelt ist. Bei der typischen Single Port Funktionalität werden die lokalen Bitleitungen 1830 sowohl vor den READ- als auch vor den WRITE-Operationen vorgeladen. Während einer typischen READ-Operation aktiviert der Predecoder 1835 den entsprechenden globalen Wortleitungs-Decoder 1840, der wiederum den lokalen Wortleitungs-Decoder 1815 aktiviert. Sobald der lokale Wortleitungs-Decoder 1815 feststellt, dass die assoziierte Speicherzelle 1826 auszuwerten ist, öffnet er die Speicherzelle 1825 für die Auswertung und aktiviert den lokalen Bitleseverstärker 1820. Am Ende der lokalen Abtastperiode gibt der lokale Bitleseverstärker 1820 den abgetasteten Datenwert auf die globalen Bitleitungen 1845 aus. Nachdem der globale Leseverstärker 1850 den Datenwert abgetastet hat, werden die Daten an den Eingangs-/Ausgangs-Puffer 1855 ausgegeben. Wenn der READ-Operation eine WRITE-Operation folgen soll, würde eine typische Single Port Vorrichtung eine weitere Vorladungs-Operation durchführen, bevor die WRITE-Operation beginnen kann. 18 shows a specific embodiment of this aspect of the present invention in the memory structure 1800 in which both local bit line scanning and local word line decoding are used as described above. The memory structure 1800 has the memory module 1805 on top of that with the local wordline decoder 1815 and the local bit sense amplifier 1820 is coupled. In the memory module 1805 There is a predefined number of memory cells, for example the memory cell 1825 passing through the local wordline 1810 with the local word line decoder 1815 and over the local bitlines 1830 with the local bit sense amplifier 1820 is coupled. The typical single-port functionality becomes the local bitlines 1830 preloaded before the READ and WRITE operations. During a typical READ operation, the Predecoder activates 1835 the corresponding global wordline decoder 1840 which in turn is the local wordline decoder 1815 activated. Once the local wordline decoder 1815 determines that the associated memory cell 1826 is to be evaluated, he opens the memory cell 1825 for the evaluation and activates the local bit sense amplifier 1820 , At the end of the local sampling period, the local bit sense amplifier outputs 1820 the sampled data value on the global bit lines 1845 out. After the global sense amplifier 1850 sampled the data value, the data is sent to the input / output buffer 1855 output. If the READ operation is to be followed by a WRITE operation, a typical single port device would perform another precharge operation before the WRITE operation can begin.

Bei dieser bestimmten Ausführungsform der Dual Port Funktionalität kann der Predecodierungs-Schritt einer nachfolgenden WRITE-Operation im wesentlichen unmittelbar nachdem der lokale Bitleitungs-Leseverstärker 1820 die Auswertung der Speicherzelle 1825 beendet hat, beginnen, d.h. zu Beginn des Abtast-Zyklusses für den globalen Leseverstärker 1850 und bevor die Daten für den Eingangs-/Ausgangs-Puffer 1855 verfügbar sind. Daher kann, während der Periode, die die Operation des globalen Leseverstärkers 1850 und des Eingangs-/Ausgangs-Puffers 1855 umfasst, und während die READ-Operation noch im Gange ist, der Predecoder 1835 die Adresssignale für eine nachfolgende WRITE-Operation empfangen und decodieren und den globalen Wortleitungs-Decoder 1840 entsprechend aktivieren. Der globale Wortleitungs-Decoder 1840 wiederum aktiviert die lokale Wortleitung 1815 im Vorgriff auf die bevorstehende WRITE-Operation. Sobald die Daten aus dem Eingangs/Ausgangs-Puffer 1855 ausgelesen sind, können die neuen mit dem WRITE-Zyklus assoziierten Daten zu dem Eingangs-/Ausgangs-Puffer 1855 zugelassen werden und unverzüglich ohne einen vorherigen Vorladungs-Zyklus z.B. in die Speicherzelle 1825 geschrieben werden. Um die Speicheradressen für diese READ- und WRITE-Operationen auf eine Art und Weise bereitzustellen, die dieser Ausführungsform der Erfindung entspricht, ist es bevorzugt, dass der Taktzyklus des Predecoders 1810 schneller ist als der Zugriffszyklus der Gesamtspeicherstruktur 1800. Es kann beispielsweise erwünscht sein, den Predecodierungs-Taktzyklus so anzupassen, dass er ungefähr das Doppelte, oder eventuell mehr als das Doppelte, des nominalen Zugriffszyklus für die Struktur 1800 ist. Auf diese Art und Weise kann eine PRECHARGE-WRITE-READ-Operation auf derselben Speicherzelle in demselben Speichermodul in weniger als einem Zugriffszyklus durchgeführt werden, wodurch Dual Port Funktionalität aus einer Single Port Vorrichtung erhalten wird. Es ist auch vorgesehen, dass die vorgenannte Ausführungsform drei oder mehr Operationen in einem einzigen Zugriffszyklus realisieren kann, wenn es die nicht verbrauchte Zeit während eines Zugriffszyklusses erlaubt.In this particular embodiment of the dual-port functionality, the predecoding step of a subsequent WRITE operation may occur substantially immediately after the local bit-line sense amplifier 1820 the evaluation of the memory cell 1825 begin, ie at the beginning of the sample cycle for the global sense amplifier 1850 and before the data for the input / output buffer 1855 Are available. Therefore, during the period, the operation of the global sense amplifier 1850 and the input / output buffer 1855 and while the READ operation is still in progress, the Predecoder 1835 receive and decode the address signals for a subsequent WRITE operation and the global wordline decoder 1840 activate accordingly. The global wordline decoder 1840 in turn activates the local wordline 1815 in anticipation of the upcoming WRITE operation. Once the data from the input / output buffer 1855 can read out the new data associated with the WRITE cycle to the input / output buffer 1855 be admitted and immediately without a previous precharge cycle eg in the memory cell 1825 to be written. In order to provide the memory addresses for these READ and WRITE operations in a manner consistent with this embodiment of the invention, it is preferred that the clock cycle of the predecoder 1810 faster than the access cycle of the overall memory structure 1800 , For example, it may be desirable to adjust the predecode clock cycle to be approximately twice, or possibly more than twice, the nominal access cycle for the structure 1800 is. In this way, a PRECHARGE WRITE READ operation can be performed on the same memory cell in the same memory module in less than one access cycle, thereby providing dual port functionality from a single port device. It is also envisaged that the above embodiment can realize three or more operations in a single access cycle if it allows the unused time during an access cycle.

Zufällig ist die oben beschriebene verbesserte Funktionalität insbesondere für große Speicherstrukturen mit vergleichsweise kleinen einzelnen Modulen geeignet, bei denen der Unterschied zwischen globalen und lokalen Zugriffszeiten ausgeprägter ist. Außerdem kann, in Umgebungen, in denen Verzögerungen aufgrund von Signalfortpflanzung über Zwischenverbindungen und Signalfortpflanzungs-Verzögerungen durch miteingebettete logische Bauteile zu ausreichender Leerlaufzeit für eine Speicherstruktur führen, diese verbesserte Funktionalität vorteilhafterweise von sonst „verschwendeter" Zeit Gebrauch machen.Is random the improved functionality described above, especially for large memory structures suitable with comparatively small individual modules in which the difference between global and local access times is more pronounced. In addition, in environments where delays due to signal propagation via interconnections and Signal propagation delays by embedded embedded logical components to sufficient idle time for one Lead storage structure, this improved functionality advantageously make use of otherwise "wasted" time.

19 zeigt eine hochgenaue Verzögerungsmessschaltung (High Precision Delay Measurement; HPDM) 1900 gemäß einem Aspekt der vorliegenden Erfindung, die Zeitmessungen von weniger als einer einzigen Gateverzögerung in Bezug auf die zugrundeliegende Technik bereitstellen kann. Dies können beispielsweise Messungen von Signalverzögerungen und -perioden, Impulsweiten, Taktskews, etc. sein. Die HPDM-Schaltung 1900 kann auch Impuls-, Auslöse- und Timing-Signale für andere Schaltungen, einschließlich Leseverstärker, Wortleitungs-Decoder, Taktvorrichtungen, Synchronizer, Automaten, etc. bereitstellen. In der Tat ist die HPDM-Schaltung 1900 eine Messschaltung von breiter Anwendbarkeit. Die HPDM-Schaltung 1900 kann beispielsweise in einem Hochleistungs-Mikroprozessor implementiert sein, bei dem genaue Messungen von internen Zeitintervallen, möglicherweise in der Größenordnung von einigen Picosekunden, sehr schwierig sein können, wenn Geräte außerhalb des Mikroprozessors verwendet werden. Die HPDM-Schaltung 1900 kann verwendet werden, um Skew zwischen Signalen präzise zu messen, und kann somit auch verwendet werden, um gemessene Skew-Intervalle einzuführen oder zu eliminieren. Die HPDM-Schaltung 1900 kann auch verwendet werden, um die Signale einzelner Bauteile, die nicht oder schlecht zusammenpassende Bauteile sein können, zu charakterisieren, und um solche Bauteile im wesentlichen zu synchronisieren. Des weiteren kann die HPDM-Schaltung 1900 vorteilhafterweise in Registerfiles, Transceivern, adaptiven Schaltungen und einer Myriade weiterer Anwendungen verwendet werden, bei denen präzise Intervallmessung per se erwünscht ist, sowie im Zusammenhang mit dem Anpassen des Verhaltens von Bauteilen, Schaltungen und Systemen im Ansprechen auf diese gemessenen Intervalle. 19 shows a High Precision Delay Measurement (HPDM) 1900 in accordance with one aspect of the present invention, the time measurements are less as a single gate delay with respect to the underlying technique. These may be, for example, measurements of signal delays and periods, pulse widths, clock skews, etc. The HPDM circuit 1900 may also provide pulse, trigger, and timing signals to other circuits, including sense amplifiers, word line decoders, clocks, synchronizers, automata, etc. In fact, the HPDM circuit is 1900 a measuring circuit of wide applicability. The HPDM circuit 1900 For example, it can be implemented in a high performance microprocessor, where accurate measurements of internal time intervals, possibly on the order of a few picoseconds, can be very difficult when using devices outside the microprocessor. The HPDM circuit 1900 can be used to precisely measure skew between signals, and thus can also be used to introduce or eliminate measured skew intervals. The HPDM circuit 1900 can also be used to characterize the signals of individual components, which may be mismatched or mismatched components, and to substantially synchronize such components. Furthermore, the HPDM circuit 1900 advantageously used in register files, transceivers, adaptive circuits and a myriad of other applications where precise interval measurement per se is desired, as well as in the context of adjusting the behavior of components, circuits and systems in response to these measured intervals.

Vorteilhafterweise kann die HPDM-Schaltung 1900 so gestaltet sein, dass sie auf Betriebsspannungs-, Design- und Verfahrensvariationen, Gestaltungsregeln, etc. in Bezug auf die zugrundeliegende Technologie anspricht, einschließlich, jedoch nicht beschränkt auf bipolare, nMOS, CMOS, BiCMOS und GaAs-Technologien. Daher wird eine HPDM-Schaltung 1900, die so gestaltet ist, dass sie Intervalle in Bezug auf eine 1,8 Mikron Technologie genau misst, im Betrieb so skaliert, dass sie Intervalle in Bezug auf die 1,8 Mikron Technologie genau misst. Obwohl die HPDM-Schaltung 1900 so angepasst werden kann, dass sie feste Zeitintervalle misst und somit unabhängig von Verfahrensvariationen, Gestaltungsregeln, etc. bleibt, ist es bevorzugt, dass die HPDM-Schaltung 1900 auf die Technologie und Gestaltungsregeln, die gegeben sind, ansprechen darf. Im allgemeinen kann der Kern einer effektiven HPDM-Schaltung, die Intervalle in der Größenordnung von Picosekunden messen kann, nur einige wenige Transistoren benötigen, die eine minimale Grundfläche besetzen. Dies steht in starkem Kontrast zu ihrem Gegenstück in der menschlichen Domäne, d.h. einem teueren, hochgenauen, in der Hand zu haltenden elektronischen Testgerät oder Werkbank-Gerät.Advantageously, the HPDM circuit 1900 be designed to address operating voltage, design and process variations, design rules, etc., in relation to the underlying technology, including, but not limited to, bipolar, nMOS, CMOS, BiCMOS and GaAs technologies. Therefore, an HPDM circuit 1900 Designed to accurately measure intervals relative to a 1.8 micron technology, it scales in operation to accurately measure intervals with respect to 1.8 micron technology. Although the HPDM circuit 1900 can be adapted to measure fixed time intervals and thus remains independent of process variations, design rules, etc., it is preferred that the HPDM circuit 1900 to address the technology and design rules that are given. In general, the core of an effective HPDM circuit that can measure intervals on the order of picoseconds may require only a few transistors occupying a minimum footprint. This contrasts sharply with its counterpart in the human domain, ie, an expensive, highly accurate, handheld electronic test device or workbench device.

Ein Merkmal der HPDM-Schaltung 1900 ist der modifizierte Ringoszillator 1905. Wie in der Technik der Ringoszillatoren bekannt ist, ist die Oszillationsperiode T₀ eines Ringoszillators mit N Stufen ungefähr gleich 2NT_D, wobei T_D die große Signalverzögerung des Gates/Inverters jeder Stufe ist. Die vorgegebene Oszillationsperiode T₀ kann durch Auswählen der Anzahl von Gates, die in dem Ringoszillator verwendet werden sollen, gewählt werden. Im allgemeinen ist T_D eine Funktion der Anstiegs- und Fallzeiten, die mit einem Gate assoziiert sind, die wiederum zu den zugrundeliegenden Parametern, einschließlich z.B. Gatetransistorgeometrieen und Herstellungsverfahren, in Bezug stehen. Diese Parameter sind so manipulierbar, dass T_D so eingestellt werden kann, dass es eine vorgegebene Gateverzögerungszeit liefert. Bei einer bevorzugten Ausführungsform der vorliegenden Erfindung im Zusammenhang mit einer spezifischen Ausführungsform einer hierarchischen Speicherstruktur ist es erwünscht, dass die Parameter zu einer CMOS-Vorrichtungs-Implementierung in Bezug stehen, die 0,18 Mikron (μm) Gestaltungsregeln verwendet. Ein Fachmann erkennt jedoch, dass die HPDM-Schaltung 1900 nicht hierauf beschränkt ist und auch in anderen Technologien, einschließlich, jedoch nicht beschränkt auf, bipolare, nMOS, CMOS, BiMOS, GaAs und SiGe Technologien, angewandt werden kann, ungeachtet der Gestaltungsregeln und ungeachtet, ob auf Si-Substrat, SOI und dessen Varianten, etc. implementiert oder nicht.A feature of the HPDM circuit 1900 is the modified ring oscillator 1905 , As is known in the art of ring oscillators, the oscillation period T _{0 of} an N-ring oscillator is approximately equal to 2NT _D , where T _{D is} the large signal delay of the gate / inverter of each stage. The predetermined oscillation period T ₀ can be selected by selecting the number of gates to be used in the ring oscillator. In general, T _{D is} a function of the rise and fall times associated with a gate, which in turn relate to the underlying parameters, including, for example, gate transistor geometries and fabrication techniques. These parameters are manipulable so that T _{D can} be set to provide a given gate delay time. In a preferred embodiment of the present invention, in the context of a specific embodiment of a hierarchical memory structure, it is desirable that the parameters be related to a CMOS device implementation using 0.18 micron (μm) design rules. However, a person skilled in the art recognizes that the HPDM circuit 1900 is not limited thereto and may be applied in other technologies including, but not limited to, bipolar, nMOS, CMOS, BiMOS, GaAs and SiGe technologies, regardless of the design rules and regardless of whether on Si substrate, SOI and its variants , etc. implemented or not.

Obwohl die beispielhafte HPDM-Schaltung 1900 einen Ringoszillator 1905 mit sieben (7) Stufen verwendet, können, abhängig von der gewünschten Oszillationsfrequenz, mehr oder weniger Stufen verwendet werden. In diesem Beispiel weist der Ringoszillator 1905 das NAND-Gate 1910 auf, dessen Ausgang als Ausgang 1920 der ersten Stufe bezeichnet wird, und sechs Inverter-Gates 1911–1916, deren Ausgänge 1921–1926 jeweils als Ausgänge der zweiten bis siebten Stufe bezeichnet werden.Although the exemplary HPDM circuit 1900 a ring oscillator 1905 used with seven (7) stages, more or fewer stages can be used, depending on the desired oscillation frequency. In this example, the ring oscillator points 1905 the NAND gate 1910 on, whose output as output 1920 the first stage is called, and six inverter gates 1911 - 1916 whose outputs 1921 - 1926 are each referred to as outputs of the second to seventh stage.

Zusätzlich zu dem Ringoszillator 1905 kann die HPDM-Schaltung 1900 Speicherelemente 1930-1937 aufweisen, die jeweils mit einer vorgewählten Oszillatorstufe gekoppelt sind. Die Auswahl und die Anordnung der Speicherelemente 1930-1937 ermöglichen die Messung eines minimalen Zeitquantums T_L, das genau etwa die Hälfte einer Gateverzögerung ist, d.h. T_L ≈ T_D/2. Die maximale Zeitdauer, T_M, die von der HPDM-Schaltung 1900 brauchbar gemessen werden kann, ist durch Auswählen einer oder mehrerer Vorrichtungen, oder Zähler, bestimmbar, um die Anzahl der Oszillationszyklen, die seit der Aktivierung des Oszillators 1905 durchgeführt worden sind, im Auge zu behalten, beispielsweise durch das ENABLE-Signal 1940. Wenn der ausgewählte Zähler eine einzige 3-Bit-Vorrichtung ist, können beispielsweise bis zu acht (8) vollständige Zyklen durch den Oszillator 1905 ermittelt werden, wobei jeder Zyklus in T₀ Zeit vollendet wird. Wenn man den einzigen 3-Bit-Zähler als Beispiel nimmt, ist somit T_M ≈ 8T₀. Die verbleibenden Speicherelemente 1932-1937 können verwendet werden, um während eines bestimmten Oszillationszyklusses den Zeitpunkt anzuzeigen, an dem das ENABLE-Signal 1940 deaktiviert worden ist, was durch die Überprüfung der jeweiligen Zustände gegebener Speicherelemente 1932–1937 nach der Deaktivierung des Oszillators 1905 bestimmt wird.In addition to the ring oscillator 1905 can the HPDM circuit 1900 storage elements 1930-1937 each coupled to a preselected oscillator stage. The selection and arrangement of memory elements 1930 - 1937 allow the measurement of a minimum time quantum T _L , which is exactly half the gate delay, ie T _L ≈ T _D / 2. The maximum time duration, T _M , of the HPDM circuit 1900 can be conveniently measured by selecting one or more devices, or counters, to determine the number of oscillation cycles that have elapsed since the activation of the oscillator 1905 be kept in mind, for example by the ENABLE signal 1940 , If the selected counter is a single 3-bit device, at For example, up to eight (8) complete cycles through the oscillator 1905 are determined, each cycle in T ₀ time is completed. Taking the single 3-bit counter as an example, T _M ≈ 8T ₀ . The remaining storage elements 1932 - 1937 can be used to indicate the time at which the ENABLE signal occurs during a particular oscillation cycle 1940 has been deactivated, which by checking the respective states of given memory elements 1932 - 1937 after deactivating the oscillator 1905 is determined.

Es ist bei der HPDM-Schaltung 1900 bevorzugt, dass ein k-Bit positiv flankengetriggerter Zähler (PET) 1930 und ein k-Bit negativ flankengetriggerter Zähler (NET) 1931 mit dem Ausgang der ersten Stufe 1920 gekoppelt sind. Des weiteren ist es bevorzugt, dass ein dual flankengetriggerter Zähler (DET) 1932–1937 mit jeweiligen Ausgängen 1921–1925 des Oszillators 1905 gekoppelt ist. Bei einer bestimmten Ausführungsform der Erfindung sind PET 1930 und NET 1931 so gewählt, dass sie jeweils drei-Bit Zähler (d.h. k = 3) sind, und DET 1932–1937 sind so gewählt, dass sie jeweils ein-Bit Zähler (Latches) sind. Ein Vorteil der Verwendung von Dualflanken-Ermittlung in den Zählern 1932–1937 ist es, dass die Flanke eines bestimmten Oszillationssignals, das sich durch den Ringoszillator 1905 fortpflanzt, in allen Stu fen registriert werden kann, und dass die Position des Oszillationssignals zu einer bestimmten Zeit daraus ermittelt werden kann. Da ein sich fortpflanzendes Oszillationssignal seine Polarität während der sequentiell folgenden Durchgänge durch den Ringoszillator 1905 ändert, ist es bevorzugt, sowohl die NET-Schaltung 1930 als auch die PET-Schaltung 1931 zu verwenden, und es ist bevorzugt, dass die negative Flanke eines bestimmten Oszillationssignals als Abschluss des ersten Schleifenereignisses, oder Zyklusses, durch den Ringoszillator 1905 abgetastet wird.It's at the HPDM circuit 1900 prefers that a k-bit positive edge-triggered counter (PET) 1930 and a k-bit negatively edge-triggered counter (NET) 1931 with the output of the first stage 1920 are coupled. Furthermore, it is preferred that a dual edge-triggered counter (DET) 1932 - 1937 with respective outputs 1921 - 1925 of the oscillator 1905 is coupled. In a particular embodiment of the invention are PET 1930 and NET 1931 selected to be three-bit counters (ie, k = 3), and DET 1932 - 1937 are chosen so that they are each one-bit counters (latches). An advantage of using dual-edge detection in the counters 1932 - 1937 it is that the flank of a particular oscillation signal, passing through the ring oscillator 1905 can be registered in all Stu fen, and that the position of the oscillation signal can be determined at a certain time from it. Since a propagating oscillation signal has its polarity during the sequential passes through the ring oscillator 1905 changes, it is preferable to both the NET circuit 1930 as well as the PET circuit 1931 and it is preferred that the negative edge of a particular oscillation signal be the completion of the first loop event, or cycle, by the ring oscillator 1905 is scanned.

Die Operation der HPDM-Schaltung 1900 kann folgendermaßen zusammengefasst werden: mit dem auf HIGH eingestellten EnableL-Signal 1904 befindet sich der Ringoszillator 1905 im STATIC-Modus, so dass das Setzen des ResetL-Signals 1906 auf LOW die Zähler 1930–1937 zurücksetzt. Das Setzen des StartH-Signals 1907 auf HIGH setzt den RS-Flip-Flop 1908, der wiederum den Ringoszillator 1905 durch Weiterleiten eines Oszillationssignals in den ACTIVE-Modus setzt. Jede Flanke des Oszillationssignals kann durch Identifizieren der Schaltaktivität bei jedem Stufenausgang 1920–1926 verfolgt werden. PET 1930 und NET 1931, die den Ausgang 1920 der ersten Stufe abtasten, identifizieren und zählen die Schleifenereignisse. Es ist bevorzugt, dass die maximale zu messende Verzögerung durch die maximale Auszählung von PET 1930 und NET 1931 repräsentiert werden kann, so dass die Zähler nicht überlaufen. Um die Fortpflanzung des Oszillationssignals durch den Ringoszillator 1905 zu stoppen, wird das StopL-Signal 1909 auf LOW gesetzt, das RS-Flip-Flop 1908 zurückgesetzt und der Ringoszillator 1905 in den STATIC-Betriebsmodus zurückgeführt. Auch werden die Daten in den Zählern 1930–1937 durch Setzen des enL-Signals 1950 auf LOW und des enH-Signals 1951 auf HIGH von den Ausgangsstufen 1920–1926 isoliert. Die digitalen Daten werden dann durch die Ports lpos 1955, lneg 1956 und del 1957 ausgelesen. Bei Kenntnis der durchschnittlichen Stufenverzögerung können die digitalen Daten dann interpretiert werden, um eine genaue Messung des Intervalls, während dessen sich der Ringoszillator 1905 im ACTNE-Betriebsmodus befunden hat, in Echtzeiteinheiten bereitzustellen. Die HPDM-Schaltung 1900 kann so ausgestaltet werden, dass sie beispielsweise nach Ablauf einer vorgegebenen Zeitdauer ein präzises Takt- oder Trigger-Signal, z.B. das TRIG-Signal 1945, bereitstellt. Im Zusammenhang mit einem Speichersystem kann eine derartige Zeitdauer beispielsweise die Zeit sein, die erforderlich ist, um den Zustand einer Speicherzelle abzutasten, um eine Wortleitung aktiv zu halten, etc.The operation of the HPDM circuit 1900 can be summarized as follows: with the EnableL signal set to HIGH 1904 is the ring oscillator 1905 in STATIC mode, so setting the ResetL signal 1906 on LOW the counters 1930 - 1937 resets. Setting the StartH signal 1907 on HIGH sets the RS flip-flop 1908 which in turn is the ring oscillator 1905 by passing an oscillation signal into the ACTIVE mode. Each edge of the oscillation signal can be identified by identifying the switching activity at each stage output 1920 - 1926 be followed. PET 1930 and NET 1931 that the exit 1920 the first level, identify and count the loop events. It is preferred that the maximum delay to be measured by the maximum count of PET 1930 and NET 1931 can be represented so that the counters do not overflow. To the propagation of the oscillation signal by the ring oscillator 1905 to stop, the StopL signal 1909 set to LOW, the RS flip-flop 1908 reset and the ring oscillator 1905 returned to the STATIC operating mode. Also, the data is in the counters 1930 - 1937 by setting the enL signal 1950 on LOW and the enH signal 1951 on HIGH from the output levels 1920 - 1926 isolated. The digital data is then lpos through the ports 1955 , Ineg 1956 and del 1957 read. Knowing the average step delay, the digital data can then be interpreted to accurately measure the interval during which the ring oscillator 1905 in ACTNE mode of operation, in real time. The HPDM circuit 1900 can be configured so that, for example, after a predetermined period of time, a precise clock or trigger signal, eg the TRIG signal 1945 , provides. For example, in the context of a memory system, such a period of time may be the time required to sample the state of a memory cell, to keep a wordline active, etc.

Die durchschnittliche Stufenverzögerung durch die Stufen 1910–1916 kann dadurch ermittelt werden, dass der Ringoszillator 1905 für eine vorgegebene Durchschnittszeit durch Setzen von StartH 1907 und StopL 1909 auf HIGH betrieben wird, wodurch die Zähler 1930–1937 inkrementiert werden. Bei einer bevorzugten Ausführungsform der vorliegenden Erfindung wird der Überlauf von NET 1931 im Auge behalten, wobei jedes Überlaufereignis 2^k Schleifenereignisse durch den Ringoszillator 1905 anzeigt. Es ist bevorzugt, dass dieses Im-Auge-Behalten durch eine Teilerschaltung, beispielsweise die DIVIDE-BY-64-Schaltung 1953 durchgeführt wird. Am Ende der vorgegebenen Durchschnittszeit können die Daten von dem Teiler 1953 durch den Port RO_div64 1954 als Wellenform ausgelesen und dann analysiert werden, um die durchschnittliche Oszillatorstufenverzögerung zu ermitteln. Der Fachmann erkennt jedoch, dass die zentrale Funktionalität der HPDM-Schaltung 1900, nämlich eine präzise Messung einer vorgegebenen Zeitdauer bereitzustellen, unverändert bleiben würde, wenn die DIVIDE-BY-64-Schaltung 1953 oder eine ähnliche Teilerschaltung hier nicht enthalten wären.The average step delay through the steps 1910 - 1916 can be determined by the fact that the ring oscillator 1905 for a given average time by setting StartH 1907 and StopL 1909 operated on HIGH, causing the counters 1930 - 1937 be incremented. In a preferred embodiment of the present invention, the overflow is NET 1931 Keep in mind, with each overflow event 2 ^k Loop events by the ring oscillator 1905 displays. It is preferred that this in-eye retention be by a divider circuit, for example the DIVIDE-BY-64 circuit 1953 is carried out. At the end of the given average time, the data from the divider 1953 through the port RO_div64 1954 is read out as a waveform and then analyzed to determine the average oscillator stage delay. However, those skilled in the art will recognize that the central functionality of the HPDM circuit 1900 That is, to provide a precise measurement of a given amount of time would remain unchanged when the DIVIDE-BY-64 circuit 1953 or a similar divider circuit would not be included here.

Die HPDM-Schaltung 1900 kann für viele Timing-Anwendungen im Zusammenhang mit einer Speicherstruktur oder nicht im Zusammenhang mit einer Speicherstruktur verwendet werden, beispielsweise, um gepulste Wellenformen und Arbeitszyklen präzise zu formen, um für eine oder mehrere getaktete Schaltungen Skewing oder Deskewing durchzuführen, oder um den Skew solcher Schaltungen zu messen, um hochgenaue Testdaten bereitzustellen, um den Beginn, das Ende, oder die Dauer eines Signals oder eines Ereignisses anzuzeigen, usw. Des weiteren kann die HPDM-Schaltung 1900 auf unzählige andere elektronische Vorrichtungen als auf Speicherstrukturen angewendet werden, bei denen eine präzise Zeitmessung erwünscht ist.The HPDM circuit 1900 may be used for many timing applications related to a memory structure or not in the context of a memory structure, for example, to precisely shape pulsed waveforms and duty cycles to skew or deskew for one or more clocked circuits, or to skew such circuits to provide highly accurate test data to the beginning, end, or duration of a sig nals or an event, etc. Furthermore, the HPDM circuit 1900 be applied to innumerable electronic devices other than memory structures where precise timing is desired.

Genaue Schaltungen mit selbstbestimmtem Zeitverhalten sind wichtige Merkmale robuster Speicher mit niedriger Energie. Replikations-Bitleitungs-Techniken sind im Stand der Technik so beschrieben, dass sie das Zeitverhalten von Steuerschaltungen und Leseverstärkern über weite Variationen im Verfahren, die Temperatur und die Betriebsspannung an die Speicherzellcharakteristiken anpassen. Eines der Probleme bei manchen Schemata des Standes der Technik ist, dass gespaltene Dummy-Bitleitungen Wortleitungen zu Gruppen zusammenhäufen, und dass so während eines Speicherzyklusses nur eine Wortleitung aktiviert werden kann. Vor einer nachfolgenden Aktivierung einer Wortleitung in derselben Gruppe müssen die Dummy-Bitleitungen vorgeladen werden, was zu unerwünschten Verzögerungen führt. Die Diffusionsreplikations-Verzögerungstechnik der vorliegenden Erfindung gleicht die Kapazität einer Dummy-Bitleitung durch Verwenden eines Diffusionskondensators, vorzugsweise für jede Zeile, im wesentlichen an. Manche Techniken des Standes der Technik verwenden Replikations-Bitspalten, die zu unerwünschten Betriebsverzögerungen beitragen können. 20 zeigt die Diffusionsreplikations-Timingschaltung 2000, die einen Transistor 2005 und einen Diffusionskondensator 2010 aufweist. Es ist erwünscht, dass der Transistor 2005 ein NMOSFET-Transistor ist, der vorzugsweise im wesentlichen identisch zu einer Zugriffstransistorkette ist, wenn diese in den Speicherzellen der Speicherstruktur (nicht gezeigt) verwendet wird. Es ist auch erwünscht, dass die Kapazität des Diffusionskondensators 2010 im wesentlichen an die Kapazität der assoziierten Bitleitung (nicht gezeigt) angepasst ist. Diese Kapazität kann ein vorgegebenes Verhältnis der Gesamtbitleitungskapazität sein, wobei das Verhältnis der Diffusionskapazität zur Gesamtbitleitungskapazität über Verfahrens-, Temperatur- und Spannungsveränderungen im wesentlichen konstant bleibt. Die Gesamtbitleitungskapazität kann sowohl die Bitleitungsmetall- als auch die Diffusionskapazitäten umfassen. Auf diese Weise kann auf alle Zeilen in einer Speichervorrichtung, die die Timing-Schaltung 2000 verwenden, mit im wesentlichen selbstbestimmtem Zeitverhalten während der gesamten Operation unabhängig zugegriffen werden, auch wenn eine andere Zeile in demselben Speichermodul aktiviert und noch nicht vorgeladen worden ist. Daher können Schreiben-nach-Lesen-Operationen ohne wesentliche Zugriffszeit- oder Bereichsstrafen in ein Speichermodul gemultiplext werden. Es ist daher erwünscht, die Diffusionsreplikations-Verzögerungsschaltung 2000 in einer Speicherstruktur wie der in 18 beschriebenen Speicherstruktur 1800 zu verwenden. Die Diffusionsreplikations-Verzögerungsschaltung 2000 kann verwendet werden, um die Abfallzeit einer Bitleitung zu bestimmen, bevor ein Leseverstärker aktiviert wird, wobei der Abfall auf der Bitleitung gehalten wird. Auf diese Weise kann die Bitleitungsabfallspannung auf eine relativ geringe Größe begrenzt werden, wodurch Energie gespart und die Speicherzugriffszeit reduziert wird. Des weiteren kann die Timing-Schaltung 2000 verwendet werden, um viele Timing-Signale in einer Speicherstruktur wie der Struktur 1800 in 18 genau zu erzeugen, einschließlich, jedoch nicht beschränkt auf, PRECHARGE, WRITE und SHUT-OFF TIMING Signale.Accurate self-timed circuits are important features of robust low energy storage. Replication bit-line techniques are described in the art as adjusting the timing of control circuits and sense amplifiers over wide variations in process, temperature, and operating voltage to the memory cell characteristics. One of the problems with some prior art schemes is that split dummy bitlines cluster wordlines into groups, and thus only one wordline can be activated during a memory cycle. Prior to subsequent activation of a wordline in the same group, the dummy bitlines must be precharged, resulting in undesirable delays. The diffusion replication delay technique of the present invention substantially equalizes the capacitance of a dummy bitline by using a diffusion capacitor, preferably for each row. Some prior art techniques use replication bit columns that can contribute to undesirable operational delays. 20 shows the diffusion replication timing circuit 2000 that is a transistor 2005 and a diffusion capacitor 2010 having. It is desirable that the transistor 2005 is an NMOSFET transistor, which is preferably substantially identical to an access transistor string when used in the memory cells of the memory structure (not shown). It is also desirable that the capacitance of the diffusion capacitor 2010 is substantially matched to the capacitance of the associated bit line (not shown). This capacitance may be a predetermined ratio of total bitline capacitance, with the ratio of diffusion capacitance to total bitline capacitance remaining substantially constant over process, temperature, and voltage variations. The total bitline capacitance may include both bitline metal and diffusion capacitances. That way, all the lines in a storage device that make up the timing circuit can be 2000 be used with substantially self-determined timing throughout the operation, even if another row in the same memory module has been activated and not yet preloaded. Therefore, write-to-read operations can be multiplexed into a memory module without significant access time or area penalties. It is therefore desirable to use the diffusion replication delay circuit 2000 in a memory structure like the one in 18 described memory structure 1800 to use. The diffusion replication delay circuit 2000 can be used to determine the fall time of a bit line before a sense amplifier is activated, keeping the drop on the bit line. In this way, the bit line drop voltage can be limited to a relatively small size, thereby saving energy and reducing the memory access time. Furthermore, the timing circuit 2000 used to generate many timing signals in a memory structure like the structure 1800 in 18 to generate exactly, including, but not limited to, PRECHARGE, WRITE and SHUT-OFF timing signals.

21 zeig eine Ausführungsform der Diffusionsreplikations-Verzögerungsschaltung 2000 in 20. Die Wortleitungsaktivierung einer Speicherzellfrequenz wird gepulst, um die Spannungsschwankung in den Bitleitungen hoher Kapazität zu begrenzen, um den Energieverbrauch zu minimieren, insbesondere bei Speicherstrukturen mit großer Wortlänge. Um die Größe einer Bitleitungs-Spannungsschwankung genau zu steuern, können Dummy-Bitleitungen verwendet werden. Es ist erwünscht, dass diese Dummy-Bitleitungen eine Kapazität aufweisen, die ein vorgegebener Bruchteil der tatsächlichen Bitleitungs-Kapazität ist. Bei einer derartigen Vor richtung kann das Kapazitätsverhältnis zwischen Dummy-Bitleitungen und echten Bitleitungen die Spannungsschwankungen in den echten Bitleitungen beeinträchtigen. Bei Vorrichtungen des Standes der Technik, die Dummy-Bitleitungen verwenden, wird eine globale Dummy-Bitleitung für einen Speicherblock mit globaler Rücksetzschleife verwendet. Solche Schemata des Standes der Technik, die globales Rücksetzen verwenden, erzeugen tendenziell Impulsweiten einer Dauer, die im wesentlichen äquivalent zu der Verzögerung globaler Wortleitungstreiber ist. Eine derart erweiterte Impulsweite erlaubt eine Bitleitungs-Spannungsschwankung, die größer sein kann, als die, die tatsächlich zur Aktivierung eines Leseverstärkers benötigt wird. Dies ist bei schnellen Speicherstrukturen unerwünscht, weil die zusätzliche, und unnötige, Spannungsschwankung zu einer langsameren Struktur mit größerem Energiebedarf führt. Bei einem Aspekt der vorliegenden Erfindung werden Dummy-Bitleitungen vorzugsweise so geteilt, dass die lokalen Bitleitungen im allgemeinen eine geringe Kapazität und eine kurze Entladungszeit aufweisen. Wortleitungs-Impulssignale sehr kurzer Dauer (z.B. 500 ps oder weniger) sind erwünscht, um die Bitleitungs-Spannungsschwankung zu begrenzen. Es kann auch erwünscht sein, lokales Rücksetzen von geteilten Dummy-Bitleitungen vorzusehen, um sehr kurze Wortleitungsimpulse bereitzustellen. Die Replikations-Wortleitung 2110 kann verwendet werden, um die Verzögerung zwischen der Aktivierung der Speicherzelle 2120 und dem verbundenen Leseverstärker 2130 zu minimieren. Derartige lokale Signalgebung ist gegenüber globaler Signalverbreitung in relativ langen Wortleitungen hoher Kapazität bevorzugt. Die Wortleitung 2140 aktiviert die Dummy-Zelle 2150 zusammen mit der assoziierten Speicherzelle 2120, auf die zugegriffen werden soll. Die Dummy-Zelle 2150 kann Teil der Dummy-Spalte 2160 sein, die in kleine Gruppen (beispielsweise acht oder sechzehn Gruppen) aufgeteilt sein kann. Die Größe jeder geteilten Dummy-Gruppe kann zur Anpassung der Spannungsschwankung in der Bitleitung verändert werden. Wenn eine Dummy-Bitleitung völlig entladen ist, kann das Rücksetzsignal 2170 lokal erzeugt werden, was die Wortleitung 2140 im wesentlichen gegen Masse zieht. 21 show an embodiment of the diffusion replication delay circuit 2000 in 20 , The word line activation of a memory cell frequency is pulsed to limit the voltage fluctuation in the high capacitance bit lines to minimize power consumption, especially for large word length memory structures. To accurately control the magnitude of a bitline voltage swing, dummy bitlines may be used. It is desirable that these dummy bit lines have a capacitance that is a predetermined fraction of the actual bit line capacitance. In such an apparatus, the capacitance ratio between dummy bit lines and real bit lines may affect the voltage fluctuations in the true bit lines. In prior art devices using dummy bitlines, a global dummy bitline is used for a global reset loop memory block. Such prior art schemes that use global reset tend to produce pulse widths of a duration that is substantially equivalent to the delay of global wordline drivers. Such an expanded pulse width allows bit line voltage variation, which may be greater than that actually required to activate a sense amplifier. This is undesirable in fast memory structures because the additional, and unnecessary, voltage variation results in a slower, more energy-demanding structure. In one aspect of the present invention, dummy bitlines are preferably shared such that the local bitlines generally have a low capacitance and a short discharge time. Word line pulse signals of very short duration (eg, 500 ps or less) are desired to limit bit line voltage variation. It may also be desirable to provide local reset of shared dummy bitlines to provide very short wordline pulses. The replication wordline 2110 can be used to check the delay between the activation of the memory cell 2120 and the connected sense amplifier 2130 to minimize. Such local signaling is against global signal propagation in relatively long high capacity word lines preferred. The word line 2140 activates the dummy cell 2150 together with the associated memory cell 2120 to be accessed. The dummy cell 2150 can be part of the dummy column 2160 be divided into small groups (for example, eight or sixteen groups). The size of each divided dummy group can be changed to adjust the voltage variation in the bit line. If a dummy bitline is completely discharged, the reset signal may be 2170 locally generated what the wordline 2140 essentially pulls against mass.

22A zeigt eine gesteuerte Spannungsschwankungs-Datenbusschaltung (CVS) 2200, die bei der Realisierung von Niedrigenergie-, Hochgeschwindigkeits- und dichten Verbindungs-Bussen von Nutzen sein kann. Die CVS 2200 kann den Energieverbrauch des Busses dadurch reduzieren, dass sie eine begrenzte, gesteuerte Spannungsschwankung auf den Bus 2215 legt. Bei einer wesentlichen Konfiguration kann die CVS 2000 einen Inverter 2205, einen pMOS Pass-Transistor T2 2210 und einen nMOS Entladetransistor, beispielsweise den Transistor T1a 2205a, aufweisen. 22A shows a controlled voltage fluctuation data bus circuit (CVS) 2200 that can be useful in the realization of low power, high speed and dense interconnect buses. The CVS 2200 can reduce bus power consumption by providing a limited, controlled voltage swing across the bus 2215 sets. In a significant configuration, the CVS 2000 an inverter 2205 , a pMOS pass transistor T2 2210 and an nMOS discharge transistor, for example transistor T1a 2205a , exhibit.

Beide Transistoren T1a 2205a und T2 2210 können so programmiert werden, dass sie die Geschwindigkeit und das Ausmaß von Spannungsschwankungen auf den Bus 2215 so steuern, dass eine erste vorausgewählte Betriebscharakteristik für den Bus im Ansprechen auf das Eingangssignal 2220a bereitgestellt wird. Zusätzliche Entladetransistoren T1b 2205b und B1c 2205c können mit dem Pass-Transistor T2 2210 gekoppelt und einzeln so programmiert werden, dass sie jeweils eine zweite vorausgewählte Betriebscharakteristik für den Bus sowie eine dritte vorausgewählte Betriebscharakteristik für den Bus im Ansprechen auf die jeweiligen Eingangssignale 2220b, 2220c bereitstellen. Die vorausgewählte Betriebscharakteristik für den Bus kann beispielsweise die Entladungsgeschwindigkeit der Busspannung durch die jeweiligen Entladetransistoren T1a 2205a, T1b 2205b und T1c 2205c sein, so dass der Bus 2215 codierte Signale oder mehrstufige Logik bereitstellen kann. Zum Beispiel kann, wie in 22A gezeigt ist, die CVS 2200 drei bestimmte logische Pegel bereitstellen. Zusätzliche Entladetransistoren, die so programmiert sind, dass sie zusätzliche logische Pegel bereitstellen, können ebenfalls verwendet werden. Daher kann der Bus 2215 zwei oder mehr Leitungen ersetzen. Zugleich mit der Reduzierung des Energieverbrauchs erhöht die begrenzte Busspannungsschwankung tendenziell die Geschwindigkeit des Busses in vorteilhafter Weise.Both transistors T1a 2205a and T2 2210 can be programmed to increase the speed and extent of voltage fluctuations on the bus 2215 so that control a first preselected operating characteristic for the bus in response to the input signal 2220a provided. Additional discharge transistors T1b 2205b and B1c 2205c can with the pass transistor T2 2210 coupled and individually programmed to each have a second preselected operating characteristic for the bus and a third preselected operating characteristic for the bus in response to the respective input signals 2220b . 2220c provide. The preselected operating characteristic for the bus may be, for example, the discharge rate of the bus voltage through the respective discharge transistors T1a 2205a , T1b 2205b and T1c 2205c be, so the bus 2215 can provide encoded signals or multi-level logic. For example, as in 22A shown is the CVS 2200 provide three distinct logical levels. Additional discharge transistors programmed to provide additional logic levels may also be used. Therefore, the bus can 2215 Replace two or more lines. Along with the reduction in power consumption, the limited bus voltage variation tends to increase the speed of the bus in an advantageous manner.

22B zeigt eine bidirektionale Datenbusübertragungsschaltung 2250, die vernetzte Inverter I1 2260 und I2 2270 verwendet, um den BUS 1 2252 mit dem BUS 2 2254 zu verbinden. Es ist erwünscht, eine getaktete Ladungs-/Entladungs-Schaltung in die bidirektionale Datenbusübertragungsschaltung einzubauen. Der getaktete Ladetransistor MPC1 2266 und der getaktete Entladetransistor MNC1 2268 sind mit dem Inverter I1 2260 gekoppelt. Ähnlich ist der Inverter I2 2270 mit dem getakteten Ladetransistor MPC2 2276 und dem getakteten Entladetransistor MNC2 2278 gekoppelt. Die Transistoren MPC1 2266, MNC1 2268, MPC2 2276 und MNC2 2278 werden vorzugsweise durch das Taktsignal 2280 getrieben. 22B shows a bidirectional data bus transmission circuit 2250 , the networked inverter I1 2260 and I2 2270 used to the bus 1 2252 with the bus 2 2254 connect to. It is desirable to incorporate a clocked charge / discharge circuit into the bidirectional data bus transfer circuit. The clocked charging transistor MPC1 2266 and the clocked discharge transistor MNC1 2268 are with the inverter I1 2260 coupled. Similarly, the inverter I2 2270 with the clocked charging transistor MPC2 2276 and the clocked discharge transistor MNC2 2278 coupled. The transistors MPC1 2266 , MNC1 2268 , MPC2 2276 and MNC2 2278 are preferably by the clock signal 2280 driven.

Wenn das Taktsignal 2280 LOW wird, schalten sich die Ladetransistoren MPC1 2266 und MPC2 2276 ON und ermöglichen es dem Eingangknoten 2265 von BUS 1 und dem Eingangsknoten 2258 von BUS 2 auf HIGH vorgeladen zu werden. Außerdem werden die Entladetransistoren MNC1 2268 und MNC2 2278 OFF geschaltet, so dass keine wesentliche Entladung stattfindet. Indem die Eingangsknoten 2256, 2258 auf HIGH gehen, pflanzen sich jeweilige Signale durch die Inverter I1 2260 und I2 2270 fort und werden von ihnen invertiert, wodurch jeweils ein LOW Signal für den Pass-Transistor MP12 2262 von BUS 1 und den Pass-Transistor MP22 2272 von BUS 2 bereitgestellt wird, wodurch das Signal auf BUS 1 2252 zu dem Eingangsknoten 2256 zugelassen wird und dann durch den Eingangsknoten 2258 von BUS 2 zum BUS 2 2254 und umgekehrt durchlaufen kann. Wenn das Taktsignal 2280 auf HIGH ansteigt, schalten sich beide Ladetransistoren MPC1 2266 und MPC2 2276 OFF, und die Entladetransistoren MNC 1 2268 und MNC2 2278 schalten sich ON, wodurch die Daten auf BUS 1 2252 und BUS 2 2254 gelatcht werden. Nach der nächsten LOW Phase des Taktsignals 2280 pflanzt sich ein auf BUS 1 2252 oder BUS 2 2254 geänderter Signalwert zwischen den Bussen fort.When the clock signal 2280 LOW, the charging transistors MPC1 turn on 2266 and MPC2 2276 ON and allow the input node 2265 from BUS 1 and the entrance node 2258 to be summoned by BUS 2 to HIGH. In addition, the discharge transistors MNC1 2268 and MNC2 2278 OFF, so there is no significant discharge. By the entrance node 2256 . 2258 go high, respective signals propagate through the inverter I1 2260 and I2 2270 and are inverted by them, producing a LOW signal for the pass transistor MP12 2262 from BUS 1 and the pass transistor MP22 2272 provided by BUS 2, whereby the signal on BUS 1 2252 to the entrance node 2256 is allowed and then through the entrance node 2258 from BUS 2 to BUS 2 2254 and vice versa. When the clock signal 2280 increases to HIGH, both charging transistors MPC1 turn on 2266 and MPC2 2276 OFF, and the discharge transistors MNC 1 2268 and MNC2 2278 turn ON, causing the data on BUS 1 2252 and BUS 2 2254 be licked. After the next LOW phase of the clock signal 2280 plants on BUS 1 2252 or BUS 2 2254 changed signal value between the buses.

Der Fachmann kann viele Änderungen und Modifikationen vornehmen, ohne vom Umfang der Erfindung abzuweichen. Es ist daher selbstverständlich, dass die gezeigten Ausführungsformen nur zu Beispielszwecken dargelegt worden sind und die in den nachfolgenden Ansprüchen definierte Erfindung nicht einschränken.Of the Professional can make many changes and make modifications without departing from the scope of the invention. It is therefore natural that the embodiments shown have been presented for illustrative purposes only and in the following claims do not restrict defined invention.

Claims

Method for providing sequential storage of first data at a first storage location ( 1825 ) having a hierarchical structure and second data at a second memory location ( 1825 ) having a hierarchical structure within an access cycle of the memory structure, the structure comprising local and global site selection, the method comprising: a. global selection of the first memory location ( 1825 ) with a hierarchical structure on which the first data is to be stored; b. Precharging the with the memory cells at the first memory location ( 1825 ) hierarchical structure coupled bitlines (PRECHARGE1 operation); c. local selection of the first memory location ( 1825 ) with a hierarchical structure; d. Saving the first data (WRITE1 operation); e. global selection of the second memory location ( 1825 ) with a hierarchical structure to store the second data; f. Preloading the with the second memory location ( 1825 ) hierarchically structured bit lines (PRECHARGE2 operation) substantially simultaneously with the global selection of the second memory location (FIG. 1825 ) with a hierarchical structure; G. local selection of the second memory location ( 1825 ) with a hierarchical structure; and h. Save the second data (WRITE2 operation).

Method for substantially concurrently retrieving first data from a first storage location ( 1825 ) and saving second data at a second storage location ( 1825 ), wherein both locations are located within a hierarchical single port memory structure with local and global data readout and local and global site selection, the method comprising: a. local selection of the first memory location ( 1825 ) from which the first data is to be retrieved; b. local read-out of the first data (READ operation); c. global selection of the second memory location ( 1825 ); d. global readout of the first data at the first memory location ( 1825 ) substantially simultaneously with global selection; e. Outputting the first data after the global readout; f. Inputting the second data substantially immediately after outputting the first data; G. local selection of the second memory location ( 1825 ); and h. Save the second data (WRITE operation).

The method of claim 2, wherein the first storage location and the second memory location has the same memory location.

The method of claim 2 or 3, further comprising precharging the first and second memory locations ( 1825 ) has coupled bitlines prior to local readout of the first data (PRECHARGE operation).

Method according to claim 2 or 3, wherein (a) to (h) within one access cycle of the memory structure ( 1805 ) be performed.

The method of claim 4, wherein a plurality of PRECHARGE-READ-WRITE operations within an access cycle of the memory structure ( 1805 ) be performed.