DE69609996T2

DE69609996T2 - DNS-basierter inhaltsadressierbarer Speicher

Info

Publication number: DE69609996T2
Application number: DE1996609996
Authority: DE
Inventors: Eric Burton Baum
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1995-02-07
Filing date: 1996-02-07
Publication date: 2001-04-05
Anticipated expiration: 2016-02-08
Also published as: JPH08212183A; DE69609996D1; EP0726530B1; EP0726530A1

Description

Gebiet der Erfindung

Die vorliegende Erfindung bezieht sich auf Assoziativspeicher und insbesondere auf die Verwendung der DNA zur Bildung von Assoziativspeichern.

Hintergrund der Erfindung

Die Verwendung der Werkzeuge der Molekularbiologie zur Lösung von Problemen der Computerwissenschaft, wie etwa das Problem des gerichteten Hamiltonschen Wegs, ist in einem Artikel von L. M. Adleman mit dem Titel "Molecular Computation of Solutions to Combinatorial Problems" in Science, Bd. 226, S. 1021 bis 1024 (1994), vorgeschlagen worden.
Die Lösung des Problems des Hamiltonschen Wegs ist irgendein Weg, der an spezifizierten Scheitelpunkten beginnt und endet und jeden weiteren Scheitelpunkt genau einmal berührt. Adlemans Lösung des Problems besteht darin, durch einen gerichteten Graphen der n Scheitelpunkte mit bezeichneten Scheitelpunkten Vin und Vout Zufallswege zu erzeugen. Es werden diejenigen Wege bewahrt, die (1) bei Vin beginnen und bei Vout enden, dabei (2) genau n Scheitelpunkte berühren, und (3) nur jene, die jeden Scheitelpunkt wenigstens einmal berühren. Alle verbleibenden Wege sind die Lösung des Problems.
Adlemans Darstellung besteht darin, jeden Scheitelpunkt einer zufälligen 20- gliedrigen DNA-Sequenz zuzuordnen. Für jede Kante des Graphen i j wird eine 20-gliedrige Sequenz erzeugt, die mit Oij bezeichnet wird, und die die letzten 10 Glieder des Scheitelpunkts i und die ersten 10 Glieder des Scheitelpunkts j enthält. Im Fall von Vin und Vout werden alle 20 Glieder verwendet, um den jeweiligen Scheitelpunkt zu bezeichnen, d. h. es wird eine 30-gliedrige Sequenz erzeugt.
Zur Durchführung des Verfahrens werden die DNA-Sequenz (die mit öi bezeichnet ist), die Watson-Crick-komplementär zur Sequenz für den Scheitelpunkt i ist, und die Sequenz Oij für alle i, j auf dem Graphen gemischt. Die Kantensequenzen Oij dienen als Verbindungseinrichtungen für die Scheitelpunktsequenzenöl, wodurch Moleküle erzeugt werden, die zufälligen Wegen durch den Graphen entsprechen.
Das Ergebnis wurde durch PCR (polymerase Kettenreaktion) unter Verwendung der Auslöser O&sub0; und &sub6; verstärkt, wobei V0 gleich Vin ist und V6 der Scheitelpunkt Vout ist. Das heißt, es wurden lediglich jene DNA- Moleküle verstärkt, die Wege codieren, die am Scheitelpunkt Vin beginnen und am Scheitelpunkt Vout enden.
Die restlichen Moleküle wurden durch ein Aragose-Gel mittels Elektrophorese gezogen. Dieser Schritt ermöglicht die Messung der molekularen Länge. Es wurden lediglich die Moleküle mit geeigneter Länge zurückbehalten.
Die verbleibende Doppelstrang-DNA wurde in einen einzelnen Strang geteilt und es wurde eine "Trennungs"-Operation ausgeführt. Die Trennungsoperation umfaßt die Schritte des Nehmens einer Sequenzöl und des Anfügens eines magnetischen Rands an die Sequenz. Diese Moleküle werden in das Reagenzglas eingesetzt, wo sie sich mit anderen Molekülen verbinden, die Oi enthalten, d. h. Codierung der Wege, die den Scheitelpunkt i enthalten. Diese verbundenen Moleküle werden anschließend magnetisch abgezogen. Dieser Vorgang wird für jeden Scheitelpunkt im Graphen wiederholt.
Das Ergebnis wird durch PCR und Elektrophorese verstärkt, um zu erkennen, ob Moleküle vorhanden sind. Die vorhandenen Moleküle entsprechen den Hamiltonschen Wegen. Wenn kein Molekül vorhanden ist, würde dies anzeigen, daß im Graph kein Hamiltonscher Weg existiert.
Anschließend schuf Lipton in einem zu veröffentlichenden Artikel (der derzeit unter /ftp/pub/people/rjl/bio.ps auf ftp.cs.princeton.edu zur Verfügung steht) einen praktischeren Algorithmus. Diese Lösung besteht darin, aus dem Reagenzglas alle Sequenzen zu extrahieren, die einen gewissen vorgegebenen Satz aufeinanderfolgender Sequenzen enthalten. Anschließend wird erfaßt, ob im Reagenzglas DNA vorhanden ist.
Die vorliegende Erfindung erweitert die obenstehend beschriebenen Werkzeuge, um einen Assoziativspeicher mit immensen Möglichkeiten zu erzeugen.

Zusammenfassung der Erfindung

Ein Assoziativspeicher ist ein Speicher, in dem Worte gespeichert und anschließend (anstatt eine spezielle Adresse wissen zu müssen) unter Verwendung lediglich von Teilinformationen oder teilweise fehlerhaften Informationen über ihren Inhalt wieder aufgerufen werden können.
Der Speicher umfaßt ein Gefäß oder ein Reagenzglas, das DNA enthält. Ein Wort wird in den Speicher geschrieben, indem ein geeignetes DNA-Molekül, das das Wort codiert, angeordnet wird. Ein einzelnes DNA-Molekül, das das Wort codiert, ist ausreichend. In der Praxis wird jedoch bevorzugt, viele Kopien des das Wort codierenden Moleküls in das Gefäß einzubringen. Das zu speichernde Wort stammt aus einem virtuellen binären Vektorraum mit möglichst hoher Dimension. Jede Komponente im Vektorraum wird durch eine spezielle kurze DNA-Sequenz repräsentiert, die beispielsweise eine Länge von 20 bis 100 Nukleotiden aufweist. Die Längen, die verwendet werden, um unterschiedliche Komponenten zu codieren, können variieren. Die Verwendung kürzerer Komponenten für mehr gebräuchlich verwendete Wortkomponenten hat einen raumeffizienten Speicher zur Folge. Die Verwendung von unterschiedlichen Längen für unterschiedliche Untersequenzen wird bei der Erkennung helfen, da die Länge eines DNA- Moleküls einfach bestimmt werden kann. Ein DNA-Molekül im Speicher entspricht einem gespeicherten virtuellen Vektor, der an allen Komponenten, für die das Molekül die entsprechende Untersequenz besitzt, eine "1" und sonst "0" aufweist. Somit können relativ kurze DNA-Moleküle kleine Vektoren (d. h., die wenige "1"en enthalten) aus einem sehr großen virtuellen Vektorraum repräsentieren. Es ist für den Fachmann selbstverständlich, daß im nachfolgenden Text die Rollen der "1"en und der "0"en vertauscht werden können. Alternativ kann jede Komponentenanzahl, jedes Komponentenwertpaar einer speziellen DNA-Untersequenz zugeordnet sein. In diesem Fall werden die "0"en ausdrücklich explizit codiert, im Gegensatz dazu, daß sie lediglich das Fehlen einer eine "1" codierenden Untersequenz bedeuten. Das DNA-Molekül, das ein spezielles Wort codiert, wird durch Verknüpfen der geeigneten Untersequenzen zusammengesetzt, die seinen speziellen Bits in beliebiger Reihenfolge entsprechen.
Der Vorgang des Erzeugens eines Assoziativspeichers unter Verwendung von DNA umfaßt das Bilden kundenspezifischer DNA-Moleküle mit geeigneten Untersequenzen im Molekül, das Anordnen der kundenspezifischen DNA-Moleküle in einem Gefäß und das Durchsuchen des Gefäßes nach DNA-Molekülen, die gewünschte Untersequenzen besitzen. Nachdem ein DNA-Molekül gefunden wurde, das die gewünschte Untersequenz enthält, wird der Rest des Moleküls ausgelesen.
Es ist demzufolge eine Hauptaufgabe der vorliegenden Erfindung, einen Assoziativspeicher unter Verwendung von DNA zu schaffen.
Es ist eine weitere Aufgabe der Erfindung, ein Verfahren zum Schreiben von Informationen in einen und zum Lesen von Informationen aus einem Assoziativspeicher, der DNA enthält, zu schaffen.
Weitere und nochmals andere Aufgaben der vorliegenden Erfindung werden offensichtlicher, wenn die nachfolgende Beschreibung in Verbindung mit der beigefügten Zeichnung gelesen wird.

Kurzbeschreibung der Zeichnung

Die einzige Figur ist ein Ablaufplan eines bevorzugten Verfahrens zur Implementierung eines Assoziativspeichers, der DNA verwendet.

Genaue Beschreibung der Erfindung

In der einzigen Figur der vorliegenden Anmeldung besteht ein erster Schritt 10 im Bilden eines kundenspezifischen DNA-Moleküls, das vorgegebene Untersequenzen besitzt, und im Anordnen des Moleküls in einem Gefäß. Die DNA-Molekülcodierung eines speziellen Worts wird ausgeführt, indem vorgegebene Untersequenzen, die den speziellen Bits entsprechen, in beliebiger Reihenfolge verknüpft werden.
Der Schritt des Bildens von Untersequenzen, die Komponenten entsprechen, kann auf verschiedene Arten realisiert werden. Es ist möglich, die Untersequenzen zu bilden, indem die Anzahl der Komponenten in der Sequenz codiert werden, denen eine andersartige "Stopp"-Sequenz folgt. Die "Stopp"-Sequenz ist so gewählt, daß sie durch ein bestimmtes Restriktionsenzym unterbrochen wird, das das Teilen eines DNA-Moleküls in seine Untersequenzkomponenten erleichtert.
Außerdem ist es möglich, anstatt einfach einen Code für die Nummer des Speicherplatzes zu verwenden, Sequenzen zu verwenden, die so gewählt sind, daß sie durch die Verwendung der Restriktionsabbildung eindeutig unterscheidbar sind, die das Lesen der Informationen, das später beschrieben wird, erleichtert. Die Restriktionsabbildung ist im Buch von B. Alberts u. a. mit dem Titel "Molecular Biology of the Cell" beschrieben, herausgegeben durch Garland Publishing, New York, 1994.
Weitere alternative Bildungsverfahren enthalten die Verwendung von Untersequenzen, die aus einem optimierten Code ausgewählt sind, der so gewählt ist, daß Erkennungsfehler minimiert werden, sowie die Verwendung von natürlich auftretenden DNA-Fragmenten.
Die gegenwärtige Technologie, die im Buch von Alberts u. a. beschrieben ist, besteht darin, daß automatisierte Oligonukleotid-Synthesizer jedes DNA- Molekül schnell erzeugen können, das bis zu ungefähr 100 Nukleotide enthält. Diese können durch wiederholte DNA-Klonungschritte in verschiedenen Kombinationen zusammengefügt werden, um lange kundenspezifisch aufgebaute DNA-Moleküle mit beliebiger Sequenz zu erzeugen. Es ist außerdem möglich, lange DNA-Sequenzen noch leichter zu erzeugen, indem ausgewählte natürlich auftretende Segmente verbunden werden.
Wenn die Untersequenzkomponenten erzeugt worden sind, können sie kostengünstig kopiert werden. Das Schreiben von Worten in den Assoziativspeicher ist relativ schnell und kostengünstig, da Reagenzgläser unterhalten werden können, die bereits jede im voraus gebildete Sequenzkomponente enthalten. Es können außerdem im voraus erzeugte Sequenzen zur Verwendung beim Zusammenfügen von Untersequenzkomponenten vorhanden sein (siehe z. B. Adleman oben).
Es gibt einen beträchtlichen Spielraum bei der Auswahl der DNA- Untersequenzen, die den Komponenten entsprechen. Die einzige Einschränkung besteht darin, daß keine der Untersequenzen weder eine Untersequenz einer anderen Komponente noch von zwei anderen verknüpften Untersequenzen ist, da dies zu Mehrdeutigkeiten im Vorgang des Wiederaufrufs führen würde. Untersequenzen mit eine Länge zwischen 10 und 100 Nukleotiden sind typischerweise ausreichend, um solche Mehrdeutigkeiten zu vermeiden (in Abhängigkeit von der Speichergröße). Es wird manchmal vorteilhaft sein, Untersequenzen mit einer andersartigen "Stopp" Untersequenz abzuschließen. Die Verwendung einer Stopp- Untersequenz wird Mehrdeutigkeiten vermeiden, die von der Verknüpfung herrühren, und wenn die Stopp-Sequenz so ausgewählt wird, daß sie durch ein bestimmtes Restriktionsenzym unterbrochen werden kann, wird dies das Zerteilen eines DNA-Moleküls in seine Untersequenzkomponenten erleichtern.
Wenn das Komplement einer Sequenz nicht zum Codieren einer weiteren Sequenz verwendet wird, werden alle komplementären Fragmente, die sich während der Vermehrung oder des Lesens einschleichen, den Speicher nicht zerstören, da die Fragmente nicht als gespeicherte Worte interpretiert werden oder leicht entfernt werden können.
Jede Untersequenzkomponente beginnt mit einer Anfangssequenz A und endet mit einer Stoppsequenz B, wobei das Molekül (d. h. das Watson- Crick-Komplement der Sequenz B, das mit dem Komplement der Sequenz A verbunden ist) als ein Mehrzweck-Bindeglied dient, um Untersequenzkomponenten in einer von der Reihenfolge unabhängigen Weise zu verbinden.
Alternativ ist es zur Bildung von Untersequenzen, die in einer vorgegebenen Reihenfolge miteinander verbunden sind, möglich, speziellere Verbindungssequenzen zu verwenden.
Nachdem kundenspezifische DNA-Moleküle gebildet und in einem Gefäß, wie etwa einem Reagenzglas, angeordnet wurden, d. h. nach dem Schritt des Schreibens, ist es notwendig, daß man den Speicher in einer inhaltsadressierbaren Weise auslesen kann, indem das Gefäß nach jenen DNA-Molekülen durchsucht wird (Schritt 20), die eine vorgegebene DNA- Sequenz oder mehrere vorgegebene Sequenzen besitzen. Das bevorzugte Verfahren zum Durchsuchen des Gefäßes bei einem vorgegebenen "Hinweis", der eine Untermenge der von Null verschiedenen Komponenten eines Worts umfaßt, besteht darin, alle DNA-Moleküle zu extrahieren, die die geeigneten Hinweis-Sequenzen enthalten. Wenn im Gefäß keine Moleküle enthalten sind, die alle geeigneten Untersequenzen enthalten, ist es alternativ möglich, die Moleküle zu extrahieren, die die meisten Übereinstimmungen enthalten, um eine oder mehrere beste Übereinstimmungen zu erhalten. Es ist außerdem möglich, nach einigen Null-Komponenten zu suchen. Aus den DNA-Übereinstimmungen werden alle Moleküle ausgelesen, die die entsprechenden Untersequenzen enthalten und diese Moleküle werden entfernt. Das Auslesen erfolgt mit einem separaten Diffusionsschritt. Die Suche ist logisch analog zu der Suche in einer Großmutterzelle eines Assoziativspeichers nach allen gespeicherten Worten, die eine bestimmte Untermenge von Bits enthalten, wie in einem Artikel von E. B. Baum u. a. mit dem Titel "Internal Representations for Associative Memory", Biological Cybernetics, Bd. 59, 1988, S. 217 bis 228 beschrieben ist.
Es gibt in der Molekularbiologie mehrere bekannte Vorgänge, die zur Durchführung einer Suche verwendet werden können. Ein bevorzugtes Suchverfahren besteht darin, zur Suche nach Untersequenzen komplementäre Untersequenzen zu verwenden, die Markierungen enthalten. Für jede im Hinweis spezifizierte Komponente wird das Komplement der entsprechenden Untersequenz der DNA, das an einem magnetischen Rand angebracht ist, in das Gefäß eingeleitet. Diese Moleküle werden sich an die DNA-Moleküle im Speicher binden, die die vorgegebenen Hinweis- Untersequenzen besitzen. Diese gebundenen Moleküle werden anschließend durch Diffusion separiert. Ein solcher Vorgang wurde im obengenannten Artikel von Adleman beschrieben. Dieser Vorgang kann nacheinander für jede im Hinweis spezifizierte Komponente wiederholt werden, bis lediglich Moleküle übrigbleiben, die Worte codieren, die im Hinweis enthalten sind. Alternativ können die magnetisch markierten Untersequenzen, die zu den Untersequenzen komplementär sind, die den im Hinweis spezifizierten Komponentenwerten entsprechen, gleichzeitig eingeleitet werden. Die am stärksten magnetischen DNA-Moleküle codieren dann das Wort mit den am meisten mit dem Hinweis übereinstimmenden Komponenten. Die Suchdauer ist im wesentlichen von der Anzahl der gespeicherten Worte unabhängig, da die chemischen Vorgänge berechnungsmäßig "parallel" ablaufen. In Abhängigkeit von der Technik der Wiedergewinnung kann die Suchdauer von der Anzahl der Komponenten in der Hinweissequenz linear abhängen.
Wenn der Hinweis sequentiell durchgegangen wird, indem zuerst alle Moleküle gefunden werden, die die erste im Hinweis spezifizierten Komponente enthalten, und anschließend die Untermengen jener Moleküle gefunden werden, die die nächste spezifizierte Komponente enthalten, würde die Wiedergewinnung eine Anzahl biologischer Operationen erfordern, die gleich der Anzahl der spezifizierten Komponenten ist. Wenn an allen spezifizierten Komponenten gleichzeitig Ränder angebracht werden und die am stärksten magnetische Komponente herausgezogen wird, würde lediglich eine einzige Operation benötigt werden. Die Zeit, die notwendig ist, um die magnetische Trennung durchzuführen, wird von der Anzahl der spezifizierten Komponenten abhängen.
Während magnetische Ränder und komplementäre Sequenzen bevorzugte Suchverfahren darstellen, würden weitere Markierungssysteme bei der Suche nach übereinstimmenden Untersequenzen von DNA-Komponenten in einem Molekül erfolgreich sein, wie es für Fachmänner selbstverständlich ist.
Es ist selbstverständlich, daß ein Anregen oder ein Mischen des Gefäßes vorteilhaft ist, um den Vorgang zu beschleunigen und um die Vermischung aller Moleküle zu sichern.
Nachdem ein DNA-Molekül gefunden wurde, das die Hinweis-Komponente enthält, wird das Molekül sequentiell geordnet, um den Rest des im Molekül gespeicherten Wortes auszulesen (Schritt 30). Dieser Schritt ist ebenfalls logisch analog zu der Leseoperation in der Großmutterspeicherzelle. Bei einem gegebenen Teilhinweis kann der Rest der Komponenten im gespeicherten Wort wiederhergestellt werden. Wie im Kapitel 7 des Buchs von Albert u. a. beschrieben ist, können DNA-Moleküle unter Verwendung einer Vielzahl von Techniken schnell verarbeitet werden. Der Vorgang kann durch eine geeignete Wahl der enthaltenen Untersequenzen beschleunigt werden, z. B. durch das Wählen von Untersequenzen derart, daß die Restriktionsabbildung unterschiedliche Komponenten eindeutig unterscheiden kann, oder daß die Moleküle durch ein spezielles Restriktionsenzym schnell in Komponenten zerteilt werden. Eine optimale Wahl der enthaltenen Sequenzen hat eine viel schnellere Identifizierung des logischen Inhalts eines gespeicherten Moleküls zur Folge als das sequentielle Ordnen eines willkürlichen DNA-Moleküls.
Es sind eine große Anzahl von Restriktionsenzymen bekannt, die DNA- Moleküle an bestimmten Speicherplätzen spalten. Indem ein vorgegebenes DNA-Moleküls verschiedenen Restriktionsenzyrnen ausgesetzt wird, wird das Molekül in Abhängigkeit von der Sequenz in Teile mit unterschiedlichen, jedoch wohldefinierten Längen gespaltet. Die Längen der Segmente liefern dann die Bedingungen der Sequenz. Häufig und sogar bei natürlich auftretender DNA sind diese Bedingungen zur Bestimmung der Sequenz ausreichend. Dieser Vorgang ist als Restriktionsabbildung bekannt. Gemäß der vorliegenden Erfindung ist es lediglich notwendig, Sequenzen zu entwerfen, die aufgrund der verschiedenen Längen, in die sie durch die zahlreichen Restriktionsenzyme gespaltet werden, leicht voneinander unterschieden werden können.
Um das Lesen zu beschleunigen und um mehr Informationen zu speichern ist es möglich, DNA-Moleküle zu speichern, die einen Adressenabschnitt und einen Datenabschnitt enthalten. Der Adressenabschnitt wird, wie obenstehend beschrieben wurde, erzeugt und durch den Inhalt adressiert. Nach dem Wiederaufruf wird der Datenabschnitt sequentiell geordnet und gelesen. Die Informationen im Datenabschnitt können zu den im Adressenabschnitt gespeicherten Informationen gleich oder von diesen verschieden sein. Die Codierung von Adressenabschnitt und Datenabschnitt kann gleich oder verschieden sein. Die Speicherung von Informationen in den Datenabschnitten in einfacher Weise als ein Wort mit der Basis vier würde, während sie kompakt ist, zum Lesen eine Technologie mit vollständiger sequentieller Ordnung erfordern.
Es ist außerdem möglich, an die gespeicherten Moleküle möglichst lange Sequenzen, die mehr Informationen enthalten, anzufügen. Diese zusätzlichen Sequenzen könnten nicht über ihren Inhalt adressiert werden, wie obenstehend beschrieben wurde. Wenn das Molekül wiederaufgerufen worden ist, wären die zusätzlichen Sequenzen jedoch lesbar. Die obenstehend beschriebene enthaltene Vorrichtung könnte beispielsweise in einfacher Weise als ein Adressierungsschema für einen gewöhnlichen RAM verwendet werden und die zusätzlich gespeicherten Sequenzen, die als Langworte gelesen werden, könnten bei diesen Adressen gespeichert werden.
In einem konventionellen RAM muß die vollständige Adresse bereitgestellt werden, um ein Wort zu lesen. Wenn der vorliegende Speicher als RAM verwendet wird, ist die Leseoperation vereinfacht, da es möglich ist, lediglich einen Rand an den DNA-Molekülen anzubringen, die das Wort codieren, von dem gewünscht ist, daß es wiederaufgerufen wird. Wenn die Adressensequenzen aus einem Fehlerkorrekturcode gewählt sind, wird der Vorgang beschleunigt, und es wird wenig wahrscheinlich sein, daß bei Molekülen, die lediglich ungefähr übereinstimmen, ein zufälliges Anhängen von an Rändern angehängten Wiederaufrufsequenzen auftritt. Deswegen werden während der Leseoperation keine weiteren Moleküle aus dem Speicher entfernt, und es wird viel einfacher, den Speicher nach dem Lesen in seinem Zustand vor dem Lesen wiederherzustellen.
Standard-Datenbankoperationen wie etwa Löschen sind außerdem möglich. Zum Löschen werden beispielsweise die geeigneten Moleküle aus der Datenbank entfernt.
Unter Verwendung der gegenwärtig zur Verfügung stehenden Technologie wird die obenstehend beschriebene Suchoperation unter Verwendung von Rändern an einer Einzelstrang-DNA ausgeführt, während die sequentielle Ordnung einer Restriktionsabbildung an einer Doppelstrang-DNA ausgeführt wird. Es ist möglich, wenn auch sehr langsam, DNA vom Doppelstrang zum Einzelstrang zu überführen und umgekehrt. Zum schnellen Suchen und sequentiellen Ordnen ist es möglich, einen Adressenabschnitt eines DNA- Moleküls, der ein Einzelstrang ist, und einen Datenabschnitt eines DNA- Moleküls, der ein Doppelstrang ist, zu verwenden.
Nach der Leseoperation müssen alle DNA-Moleküle, die entfernt wurden, wieder in den Speicher eingeführt werden, so daß gespeicherte Worte nicht verloren gehen. Ein bevorzugtes Verfahren zur Durchführung dieser Wiedereinführung besteht darin, die Moleküle wieder in Einzelstrang-DNA aufzuteilen. Die Stränge ohne angehängte Ränder werden anschließend an die Stränge angehängt, die wieder einzuführen sind. Alternativ ist es möglich, eine Kopie des gesamten Speichers zu bewahren und die Kopie nach mehreren Leseoperationen wieder einzugeben.
Unter Verwendung der gegenwärtigen Technologie liegt die Lese- und Schreibdauer in der Größenordnung von Stunden. Es gibt jedoch keine offensichtliche grundlegende Einschränkung, die verhindert, daß automatisierte Lese- und Schreiboperationen in einem molekularen Zeitmaßstab erreicht werden. Überdies kann dann, wenn Informationen in DNA eingeschlossen sind, das gesamte Gefäß relativ leicht durch DNA- Nachbildung kopiert werden. Gleichfalls können die Informationen in mehreren Gefäßes einfach verschmolzen werden, indem die Inhalte aller Gefäße physisch vermischt werden. Ein Millimol von Molekülen, die jeweils 200 Basen lang sind, würde ungefähr 50 g wiegen und ungefähr 1000 Liter in Anspruch nehmen. Ein solches Volumen könnte 10²&sup0; Worte enthalten, wobei jedes Wort mehrere tausend oder mehrere zehntausend Bits codiert.
Obwohl eine bevorzugte Ausführungsform eines Assoziativspeichers, der DNA-Moleküle verwendet, beschrieben und erläutert wurde, ist es für den Fachmann selbstverständlich, daß weitere Abwandlungen und Änderungen möglich sind, ohne vom grundlegenden Prinzip und vom Erfindungsgedanken der vorliegenden Erfindung abzuweichen.

Claims

1. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen, mit den folgenden Schritten:

Bilden von kundenspezifischen DNA-Molekülen, die mit Informationen codiert sind;

Anordnen der kundenspezifischen DNA-Moleküle in einem Gefäß;

Durchsuchen der kundenspezifischen DNA-Moleküle nach jenen Molekülen, die eine vorgegebene Untersequenz besitzen, und Auswählen der Moleküle mit der vorgegebenen Untersequenz; und

Auslesen der ausgewählten DNA-Moleküle.

2. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 1, bei dem das Bilden der kundenspezifischen DNA-Moleküle das Codieren von Komponenten eines Vektors eines gespeicherten Wortes, die einen vorgegebenen Wert besitzen, umfaßt.

3. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Verknüpfen von Untersequenzen, die einem Vektor entsprechen, der an einer vorgegebenen Komponente einen vorgegebenen Wert besitzt, umfaßt.

4. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Auswählen von DNA- Untersequenzen, die einen optimierten Code enthalten, umfaßt.

5. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Auswählen von DNA- Untersequenzen, die so gewählt sind, daß sie durch Restriktionsabbildung eindeutig unterscheidbar sind, umfaßt.

6. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Auswählen natürlich auftretender DNA-Fragmente umfaßt.

7. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Anhängen einer Stoppsequenz an eine Sequenz, der eine vorgegebene, einen vorgegebenen Wert besitzende Komponente eines Vektors zugeordnet ist, umfaßt.

8. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Anhängen einer Startsequenz und einer Stoppsequenz an eine Sequenz, der eine vorgegebene, einen vorgegebenen Wert besitzende Komponente eines Vektors zugeordnet ist, umfaßt.

9. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, wobei der vorgegebene Wert aus der Gruppe gewählt ist, die aus "1"en, "0"en und "1"en und "0"en besteht.

10. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Moleküle nach einem der Ansprüche 1 oder 2, wobei das Durchsuchen das Markie ren vorgegebener Untersequenzen aus einem DNA-Molekül und das Extrahieren markierter Moleküle umfaßt.

11. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 10, wobei das Markieren das Zuordnen magnetischer Ränder umfaßt und das Extrahieren die magnetische Separation umfaßt.

12. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach einem der Ansprüche 1 oder 2, wobei das Durchsuchen das Einführen einer DNA mit einer zu den vorgegebenen Untersequenzen komplementären Untersequenz umfaßt.

13. Assoziativspeicher, mit:

kundenspezifischen DNA-Molekülen, die mit Informationen codiert sind, wobei die Moleküle in einem Gefäß angeordnet sind;

einer Einrichtung zum Durchsuchen der kundenspezifischen DNA-Moleküle nach jenen Molekülen mit einer vorgegebenen Untersequenz; und

einer Einrichtung zum Auslesen jener Moleküle mit einer vorgegebenen Untersequenz.

14. Assoziativspeicher nach Anspruch 13, wobei die Einrichtung zum Durchsuchen das Einleiten eines markierten DNA-Moleküls mit einer zu der vorgegebenen Untersequenz komplementären Sequenz umfaßt.

15. Assoziativspeicher nach Anspruch 14, wobei die Markierung ein magnetischer Rand ist.

16. Assoziativspeicher nach Anspruch 13, wobei die codierten Informationen einen Adressenabschnitt und einen Datenabschnitt umfassen.

17. Assoziativspeicher nach Anspruch 13, wobei die Einrichtung zum Lesen ein Restriktionsenzym umfaßt.