DE69609996T2 - DNS-basierter inhaltsadressierbarer Speicher - Google Patents

DNS-basierter inhaltsadressierbarer Speicher

Info

Publication number
DE69609996T2
DE69609996T2 DE1996609996 DE69609996T DE69609996T2 DE 69609996 T2 DE69609996 T2 DE 69609996T2 DE 1996609996 DE1996609996 DE 1996609996 DE 69609996 T DE69609996 T DE 69609996T DE 69609996 T2 DE69609996 T2 DE 69609996T2
Authority
DE
Germany
Prior art keywords
dna
reading
dna molecules
associative memory
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE1996609996
Other languages
English (en)
Other versions
DE69609996D1 (de
Inventor
Eric Burton Baum
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of DE69609996D1 publication Critical patent/DE69609996D1/de
Application granted granted Critical
Publication of DE69609996T2 publication Critical patent/DE69609996T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y10/00Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C11/00Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
    • G11C11/54Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using elements simulating biological cells, e.g. neuron
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C15/00Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Nanotechnology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mathematical Physics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Neurology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Artificial Intelligence (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

    Gebiet der Erfindung
  • Die vorliegende Erfindung bezieht sich auf Assoziativspeicher und insbesondere auf die Verwendung der DNA zur Bildung von Assoziativspeichern.
  • Hintergrund der Erfindung
  • Die Verwendung der Werkzeuge der Molekularbiologie zur Lösung von Problemen der Computerwissenschaft, wie etwa das Problem des gerichteten Hamiltonschen Wegs, ist in einem Artikel von L. M. Adleman mit dem Titel "Molecular Computation of Solutions to Combinatorial Problems" in Science, Bd. 226, S. 1021 bis 1024 (1994), vorgeschlagen worden.
  • Die Lösung des Problems des Hamiltonschen Wegs ist irgendein Weg, der an spezifizierten Scheitelpunkten beginnt und endet und jeden weiteren Scheitelpunkt genau einmal berührt. Adlemans Lösung des Problems besteht darin, durch einen gerichteten Graphen der n Scheitelpunkte mit bezeichneten Scheitelpunkten Vin und Vout Zufallswege zu erzeugen. Es werden diejenigen Wege bewahrt, die (1) bei Vin beginnen und bei Vout enden, dabei (2) genau n Scheitelpunkte berühren, und (3) nur jene, die jeden Scheitelpunkt wenigstens einmal berühren. Alle verbleibenden Wege sind die Lösung des Problems.
  • Adlemans Darstellung besteht darin, jeden Scheitelpunkt einer zufälligen 20- gliedrigen DNA-Sequenz zuzuordnen. Für jede Kante des Graphen i j wird eine 20-gliedrige Sequenz erzeugt, die mit Oij bezeichnet wird, und die die letzten 10 Glieder des Scheitelpunkts i und die ersten 10 Glieder des Scheitelpunkts j enthält. Im Fall von Vin und Vout werden alle 20 Glieder verwendet, um den jeweiligen Scheitelpunkt zu bezeichnen, d. h. es wird eine 30-gliedrige Sequenz erzeugt.
  • Zur Durchführung des Verfahrens werden die DNA-Sequenz (die mit öi bezeichnet ist), die Watson-Crick-komplementär zur Sequenz für den Scheitelpunkt i ist, und die Sequenz Oij für alle i, j auf dem Graphen gemischt. Die Kantensequenzen Oij dienen als Verbindungseinrichtungen für die Scheitelpunktsequenzenöl, wodurch Moleküle erzeugt werden, die zufälligen Wegen durch den Graphen entsprechen.
  • Das Ergebnis wurde durch PCR (polymerase Kettenreaktion) unter Verwendung der Auslöser O&sub0; und &sub6; verstärkt, wobei V0 gleich Vin ist und V6 der Scheitelpunkt Vout ist. Das heißt, es wurden lediglich jene DNA- Moleküle verstärkt, die Wege codieren, die am Scheitelpunkt Vin beginnen und am Scheitelpunkt Vout enden.
  • Die restlichen Moleküle wurden durch ein Aragose-Gel mittels Elektrophorese gezogen. Dieser Schritt ermöglicht die Messung der molekularen Länge. Es wurden lediglich die Moleküle mit geeigneter Länge zurückbehalten.
  • Die verbleibende Doppelstrang-DNA wurde in einen einzelnen Strang geteilt und es wurde eine "Trennungs"-Operation ausgeführt. Die Trennungsoperation umfaßt die Schritte des Nehmens einer Sequenzöl und des Anfügens eines magnetischen Rands an die Sequenz. Diese Moleküle werden in das Reagenzglas eingesetzt, wo sie sich mit anderen Molekülen verbinden, die Oi enthalten, d. h. Codierung der Wege, die den Scheitelpunkt i enthalten. Diese verbundenen Moleküle werden anschließend magnetisch abgezogen. Dieser Vorgang wird für jeden Scheitelpunkt im Graphen wiederholt.
  • Das Ergebnis wird durch PCR und Elektrophorese verstärkt, um zu erkennen, ob Moleküle vorhanden sind. Die vorhandenen Moleküle entsprechen den Hamiltonschen Wegen. Wenn kein Molekül vorhanden ist, würde dies anzeigen, daß im Graph kein Hamiltonscher Weg existiert.
  • Anschließend schuf Lipton in einem zu veröffentlichenden Artikel (der derzeit unter /ftp/pub/people/rjl/bio.ps auf ftp.cs.princeton.edu zur Verfügung steht) einen praktischeren Algorithmus. Diese Lösung besteht darin, aus dem Reagenzglas alle Sequenzen zu extrahieren, die einen gewissen vorgegebenen Satz aufeinanderfolgender Sequenzen enthalten. Anschließend wird erfaßt, ob im Reagenzglas DNA vorhanden ist.
  • Die vorliegende Erfindung erweitert die obenstehend beschriebenen Werkzeuge, um einen Assoziativspeicher mit immensen Möglichkeiten zu erzeugen.
  • Zusammenfassung der Erfindung
  • Ein Assoziativspeicher ist ein Speicher, in dem Worte gespeichert und anschließend (anstatt eine spezielle Adresse wissen zu müssen) unter Verwendung lediglich von Teilinformationen oder teilweise fehlerhaften Informationen über ihren Inhalt wieder aufgerufen werden können.
  • Der Speicher umfaßt ein Gefäß oder ein Reagenzglas, das DNA enthält. Ein Wort wird in den Speicher geschrieben, indem ein geeignetes DNA-Molekül, das das Wort codiert, angeordnet wird. Ein einzelnes DNA-Molekül, das das Wort codiert, ist ausreichend. In der Praxis wird jedoch bevorzugt, viele Kopien des das Wort codierenden Moleküls in das Gefäß einzubringen. Das zu speichernde Wort stammt aus einem virtuellen binären Vektorraum mit möglichst hoher Dimension. Jede Komponente im Vektorraum wird durch eine spezielle kurze DNA-Sequenz repräsentiert, die beispielsweise eine Länge von 20 bis 100 Nukleotiden aufweist. Die Längen, die verwendet werden, um unterschiedliche Komponenten zu codieren, können variieren. Die Verwendung kürzerer Komponenten für mehr gebräuchlich verwendete Wortkomponenten hat einen raumeffizienten Speicher zur Folge. Die Verwendung von unterschiedlichen Längen für unterschiedliche Untersequenzen wird bei der Erkennung helfen, da die Länge eines DNA- Moleküls einfach bestimmt werden kann. Ein DNA-Molekül im Speicher entspricht einem gespeicherten virtuellen Vektor, der an allen Komponenten, für die das Molekül die entsprechende Untersequenz besitzt, eine "1" und sonst "0" aufweist. Somit können relativ kurze DNA-Moleküle kleine Vektoren (d. h., die wenige "1"en enthalten) aus einem sehr großen virtuellen Vektorraum repräsentieren. Es ist für den Fachmann selbstverständlich, daß im nachfolgenden Text die Rollen der "1"en und der "0"en vertauscht werden können. Alternativ kann jede Komponentenanzahl, jedes Komponentenwertpaar einer speziellen DNA-Untersequenz zugeordnet sein. In diesem Fall werden die "0"en ausdrücklich explizit codiert, im Gegensatz dazu, daß sie lediglich das Fehlen einer eine "1" codierenden Untersequenz bedeuten. Das DNA-Molekül, das ein spezielles Wort codiert, wird durch Verknüpfen der geeigneten Untersequenzen zusammengesetzt, die seinen speziellen Bits in beliebiger Reihenfolge entsprechen.
  • Der Vorgang des Erzeugens eines Assoziativspeichers unter Verwendung von DNA umfaßt das Bilden kundenspezifischer DNA-Moleküle mit geeigneten Untersequenzen im Molekül, das Anordnen der kundenspezifischen DNA-Moleküle in einem Gefäß und das Durchsuchen des Gefäßes nach DNA-Molekülen, die gewünschte Untersequenzen besitzen. Nachdem ein DNA-Molekül gefunden wurde, das die gewünschte Untersequenz enthält, wird der Rest des Moleküls ausgelesen.
  • Es ist demzufolge eine Hauptaufgabe der vorliegenden Erfindung, einen Assoziativspeicher unter Verwendung von DNA zu schaffen.
  • Es ist eine weitere Aufgabe der Erfindung, ein Verfahren zum Schreiben von Informationen in einen und zum Lesen von Informationen aus einem Assoziativspeicher, der DNA enthält, zu schaffen.
  • Weitere und nochmals andere Aufgaben der vorliegenden Erfindung werden offensichtlicher, wenn die nachfolgende Beschreibung in Verbindung mit der beigefügten Zeichnung gelesen wird.
  • Kurzbeschreibung der Zeichnung
  • Die einzige Figur ist ein Ablaufplan eines bevorzugten Verfahrens zur Implementierung eines Assoziativspeichers, der DNA verwendet.
  • Genaue Beschreibung der Erfindung
  • In der einzigen Figur der vorliegenden Anmeldung besteht ein erster Schritt 10 im Bilden eines kundenspezifischen DNA-Moleküls, das vorgegebene Untersequenzen besitzt, und im Anordnen des Moleküls in einem Gefäß. Die DNA-Molekülcodierung eines speziellen Worts wird ausgeführt, indem vorgegebene Untersequenzen, die den speziellen Bits entsprechen, in beliebiger Reihenfolge verknüpft werden.
  • Der Schritt des Bildens von Untersequenzen, die Komponenten entsprechen, kann auf verschiedene Arten realisiert werden. Es ist möglich, die Untersequenzen zu bilden, indem die Anzahl der Komponenten in der Sequenz codiert werden, denen eine andersartige "Stopp"-Sequenz folgt. Die "Stopp"-Sequenz ist so gewählt, daß sie durch ein bestimmtes Restriktionsenzym unterbrochen wird, das das Teilen eines DNA-Moleküls in seine Untersequenzkomponenten erleichtert.
  • Außerdem ist es möglich, anstatt einfach einen Code für die Nummer des Speicherplatzes zu verwenden, Sequenzen zu verwenden, die so gewählt sind, daß sie durch die Verwendung der Restriktionsabbildung eindeutig unterscheidbar sind, die das Lesen der Informationen, das später beschrieben wird, erleichtert. Die Restriktionsabbildung ist im Buch von B. Alberts u. a. mit dem Titel "Molecular Biology of the Cell" beschrieben, herausgegeben durch Garland Publishing, New York, 1994.
  • Weitere alternative Bildungsverfahren enthalten die Verwendung von Untersequenzen, die aus einem optimierten Code ausgewählt sind, der so gewählt ist, daß Erkennungsfehler minimiert werden, sowie die Verwendung von natürlich auftretenden DNA-Fragmenten.
  • Die gegenwärtige Technologie, die im Buch von Alberts u. a. beschrieben ist, besteht darin, daß automatisierte Oligonukleotid-Synthesizer jedes DNA- Molekül schnell erzeugen können, das bis zu ungefähr 100 Nukleotide enthält. Diese können durch wiederholte DNA-Klonungschritte in verschiedenen Kombinationen zusammengefügt werden, um lange kundenspezifisch aufgebaute DNA-Moleküle mit beliebiger Sequenz zu erzeugen. Es ist außerdem möglich, lange DNA-Sequenzen noch leichter zu erzeugen, indem ausgewählte natürlich auftretende Segmente verbunden werden.
  • Wenn die Untersequenzkomponenten erzeugt worden sind, können sie kostengünstig kopiert werden. Das Schreiben von Worten in den Assoziativspeicher ist relativ schnell und kostengünstig, da Reagenzgläser unterhalten werden können, die bereits jede im voraus gebildete Sequenzkomponente enthalten. Es können außerdem im voraus erzeugte Sequenzen zur Verwendung beim Zusammenfügen von Untersequenzkomponenten vorhanden sein (siehe z. B. Adleman oben).
  • Es gibt einen beträchtlichen Spielraum bei der Auswahl der DNA- Untersequenzen, die den Komponenten entsprechen. Die einzige Einschränkung besteht darin, daß keine der Untersequenzen weder eine Untersequenz einer anderen Komponente noch von zwei anderen verknüpften Untersequenzen ist, da dies zu Mehrdeutigkeiten im Vorgang des Wiederaufrufs führen würde. Untersequenzen mit eine Länge zwischen 10 und 100 Nukleotiden sind typischerweise ausreichend, um solche Mehrdeutigkeiten zu vermeiden (in Abhängigkeit von der Speichergröße). Es wird manchmal vorteilhaft sein, Untersequenzen mit einer andersartigen "Stopp" Untersequenz abzuschließen. Die Verwendung einer Stopp- Untersequenz wird Mehrdeutigkeiten vermeiden, die von der Verknüpfung herrühren, und wenn die Stopp-Sequenz so ausgewählt wird, daß sie durch ein bestimmtes Restriktionsenzym unterbrochen werden kann, wird dies das Zerteilen eines DNA-Moleküls in seine Untersequenzkomponenten erleichtern.
  • Wenn das Komplement einer Sequenz nicht zum Codieren einer weiteren Sequenz verwendet wird, werden alle komplementären Fragmente, die sich während der Vermehrung oder des Lesens einschleichen, den Speicher nicht zerstören, da die Fragmente nicht als gespeicherte Worte interpretiert werden oder leicht entfernt werden können.
  • Jede Untersequenzkomponente beginnt mit einer Anfangssequenz A und endet mit einer Stoppsequenz B, wobei das Molekül (d. h. das Watson- Crick-Komplement der Sequenz B, das mit dem Komplement der Sequenz A verbunden ist) als ein Mehrzweck-Bindeglied dient, um Untersequenzkomponenten in einer von der Reihenfolge unabhängigen Weise zu verbinden.
  • Alternativ ist es zur Bildung von Untersequenzen, die in einer vorgegebenen Reihenfolge miteinander verbunden sind, möglich, speziellere Verbindungssequenzen zu verwenden.
  • Nachdem kundenspezifische DNA-Moleküle gebildet und in einem Gefäß, wie etwa einem Reagenzglas, angeordnet wurden, d. h. nach dem Schritt des Schreibens, ist es notwendig, daß man den Speicher in einer inhaltsadressierbaren Weise auslesen kann, indem das Gefäß nach jenen DNA-Molekülen durchsucht wird (Schritt 20), die eine vorgegebene DNA- Sequenz oder mehrere vorgegebene Sequenzen besitzen. Das bevorzugte Verfahren zum Durchsuchen des Gefäßes bei einem vorgegebenen "Hinweis", der eine Untermenge der von Null verschiedenen Komponenten eines Worts umfaßt, besteht darin, alle DNA-Moleküle zu extrahieren, die die geeigneten Hinweis-Sequenzen enthalten. Wenn im Gefäß keine Moleküle enthalten sind, die alle geeigneten Untersequenzen enthalten, ist es alternativ möglich, die Moleküle zu extrahieren, die die meisten Übereinstimmungen enthalten, um eine oder mehrere beste Übereinstimmungen zu erhalten. Es ist außerdem möglich, nach einigen Null-Komponenten zu suchen. Aus den DNA-Übereinstimmungen werden alle Moleküle ausgelesen, die die entsprechenden Untersequenzen enthalten und diese Moleküle werden entfernt. Das Auslesen erfolgt mit einem separaten Diffusionsschritt. Die Suche ist logisch analog zu der Suche in einer Großmutterzelle eines Assoziativspeichers nach allen gespeicherten Worten, die eine bestimmte Untermenge von Bits enthalten, wie in einem Artikel von E. B. Baum u. a. mit dem Titel "Internal Representations for Associative Memory", Biological Cybernetics, Bd. 59, 1988, S. 217 bis 228 beschrieben ist.
  • Es gibt in der Molekularbiologie mehrere bekannte Vorgänge, die zur Durchführung einer Suche verwendet werden können. Ein bevorzugtes Suchverfahren besteht darin, zur Suche nach Untersequenzen komplementäre Untersequenzen zu verwenden, die Markierungen enthalten. Für jede im Hinweis spezifizierte Komponente wird das Komplement der entsprechenden Untersequenz der DNA, das an einem magnetischen Rand angebracht ist, in das Gefäß eingeleitet. Diese Moleküle werden sich an die DNA-Moleküle im Speicher binden, die die vorgegebenen Hinweis- Untersequenzen besitzen. Diese gebundenen Moleküle werden anschließend durch Diffusion separiert. Ein solcher Vorgang wurde im obengenannten Artikel von Adleman beschrieben. Dieser Vorgang kann nacheinander für jede im Hinweis spezifizierte Komponente wiederholt werden, bis lediglich Moleküle übrigbleiben, die Worte codieren, die im Hinweis enthalten sind. Alternativ können die magnetisch markierten Untersequenzen, die zu den Untersequenzen komplementär sind, die den im Hinweis spezifizierten Komponentenwerten entsprechen, gleichzeitig eingeleitet werden. Die am stärksten magnetischen DNA-Moleküle codieren dann das Wort mit den am meisten mit dem Hinweis übereinstimmenden Komponenten. Die Suchdauer ist im wesentlichen von der Anzahl der gespeicherten Worte unabhängig, da die chemischen Vorgänge berechnungsmäßig "parallel" ablaufen. In Abhängigkeit von der Technik der Wiedergewinnung kann die Suchdauer von der Anzahl der Komponenten in der Hinweissequenz linear abhängen.
  • Wenn der Hinweis sequentiell durchgegangen wird, indem zuerst alle Moleküle gefunden werden, die die erste im Hinweis spezifizierten Komponente enthalten, und anschließend die Untermengen jener Moleküle gefunden werden, die die nächste spezifizierte Komponente enthalten, würde die Wiedergewinnung eine Anzahl biologischer Operationen erfordern, die gleich der Anzahl der spezifizierten Komponenten ist. Wenn an allen spezifizierten Komponenten gleichzeitig Ränder angebracht werden und die am stärksten magnetische Komponente herausgezogen wird, würde lediglich eine einzige Operation benötigt werden. Die Zeit, die notwendig ist, um die magnetische Trennung durchzuführen, wird von der Anzahl der spezifizierten Komponenten abhängen.
  • Während magnetische Ränder und komplementäre Sequenzen bevorzugte Suchverfahren darstellen, würden weitere Markierungssysteme bei der Suche nach übereinstimmenden Untersequenzen von DNA-Komponenten in einem Molekül erfolgreich sein, wie es für Fachmänner selbstverständlich ist.
  • Es ist selbstverständlich, daß ein Anregen oder ein Mischen des Gefäßes vorteilhaft ist, um den Vorgang zu beschleunigen und um die Vermischung aller Moleküle zu sichern.
  • Nachdem ein DNA-Molekül gefunden wurde, das die Hinweis-Komponente enthält, wird das Molekül sequentiell geordnet, um den Rest des im Molekül gespeicherten Wortes auszulesen (Schritt 30). Dieser Schritt ist ebenfalls logisch analog zu der Leseoperation in der Großmutterspeicherzelle. Bei einem gegebenen Teilhinweis kann der Rest der Komponenten im gespeicherten Wort wiederhergestellt werden. Wie im Kapitel 7 des Buchs von Albert u. a. beschrieben ist, können DNA-Moleküle unter Verwendung einer Vielzahl von Techniken schnell verarbeitet werden. Der Vorgang kann durch eine geeignete Wahl der enthaltenen Untersequenzen beschleunigt werden, z. B. durch das Wählen von Untersequenzen derart, daß die Restriktionsabbildung unterschiedliche Komponenten eindeutig unterscheiden kann, oder daß die Moleküle durch ein spezielles Restriktionsenzym schnell in Komponenten zerteilt werden. Eine optimale Wahl der enthaltenen Sequenzen hat eine viel schnellere Identifizierung des logischen Inhalts eines gespeicherten Moleküls zur Folge als das sequentielle Ordnen eines willkürlichen DNA-Moleküls.
  • Es sind eine große Anzahl von Restriktionsenzymen bekannt, die DNA- Moleküle an bestimmten Speicherplätzen spalten. Indem ein vorgegebenes DNA-Moleküls verschiedenen Restriktionsenzyrnen ausgesetzt wird, wird das Molekül in Abhängigkeit von der Sequenz in Teile mit unterschiedlichen, jedoch wohldefinierten Längen gespaltet. Die Längen der Segmente liefern dann die Bedingungen der Sequenz. Häufig und sogar bei natürlich auftretender DNA sind diese Bedingungen zur Bestimmung der Sequenz ausreichend. Dieser Vorgang ist als Restriktionsabbildung bekannt. Gemäß der vorliegenden Erfindung ist es lediglich notwendig, Sequenzen zu entwerfen, die aufgrund der verschiedenen Längen, in die sie durch die zahlreichen Restriktionsenzyme gespaltet werden, leicht voneinander unterschieden werden können.
  • Um das Lesen zu beschleunigen und um mehr Informationen zu speichern ist es möglich, DNA-Moleküle zu speichern, die einen Adressenabschnitt und einen Datenabschnitt enthalten. Der Adressenabschnitt wird, wie obenstehend beschrieben wurde, erzeugt und durch den Inhalt adressiert. Nach dem Wiederaufruf wird der Datenabschnitt sequentiell geordnet und gelesen. Die Informationen im Datenabschnitt können zu den im Adressenabschnitt gespeicherten Informationen gleich oder von diesen verschieden sein. Die Codierung von Adressenabschnitt und Datenabschnitt kann gleich oder verschieden sein. Die Speicherung von Informationen in den Datenabschnitten in einfacher Weise als ein Wort mit der Basis vier würde, während sie kompakt ist, zum Lesen eine Technologie mit vollständiger sequentieller Ordnung erfordern.
  • Es ist außerdem möglich, an die gespeicherten Moleküle möglichst lange Sequenzen, die mehr Informationen enthalten, anzufügen. Diese zusätzlichen Sequenzen könnten nicht über ihren Inhalt adressiert werden, wie obenstehend beschrieben wurde. Wenn das Molekül wiederaufgerufen worden ist, wären die zusätzlichen Sequenzen jedoch lesbar. Die obenstehend beschriebene enthaltene Vorrichtung könnte beispielsweise in einfacher Weise als ein Adressierungsschema für einen gewöhnlichen RAM verwendet werden und die zusätzlich gespeicherten Sequenzen, die als Langworte gelesen werden, könnten bei diesen Adressen gespeichert werden.
  • In einem konventionellen RAM muß die vollständige Adresse bereitgestellt werden, um ein Wort zu lesen. Wenn der vorliegende Speicher als RAM verwendet wird, ist die Leseoperation vereinfacht, da es möglich ist, lediglich einen Rand an den DNA-Molekülen anzubringen, die das Wort codieren, von dem gewünscht ist, daß es wiederaufgerufen wird. Wenn die Adressensequenzen aus einem Fehlerkorrekturcode gewählt sind, wird der Vorgang beschleunigt, und es wird wenig wahrscheinlich sein, daß bei Molekülen, die lediglich ungefähr übereinstimmen, ein zufälliges Anhängen von an Rändern angehängten Wiederaufrufsequenzen auftritt. Deswegen werden während der Leseoperation keine weiteren Moleküle aus dem Speicher entfernt, und es wird viel einfacher, den Speicher nach dem Lesen in seinem Zustand vor dem Lesen wiederherzustellen.
  • Standard-Datenbankoperationen wie etwa Löschen sind außerdem möglich. Zum Löschen werden beispielsweise die geeigneten Moleküle aus der Datenbank entfernt.
  • Unter Verwendung der gegenwärtig zur Verfügung stehenden Technologie wird die obenstehend beschriebene Suchoperation unter Verwendung von Rändern an einer Einzelstrang-DNA ausgeführt, während die sequentielle Ordnung einer Restriktionsabbildung an einer Doppelstrang-DNA ausgeführt wird. Es ist möglich, wenn auch sehr langsam, DNA vom Doppelstrang zum Einzelstrang zu überführen und umgekehrt. Zum schnellen Suchen und sequentiellen Ordnen ist es möglich, einen Adressenabschnitt eines DNA- Moleküls, der ein Einzelstrang ist, und einen Datenabschnitt eines DNA- Moleküls, der ein Doppelstrang ist, zu verwenden.
  • Nach der Leseoperation müssen alle DNA-Moleküle, die entfernt wurden, wieder in den Speicher eingeführt werden, so daß gespeicherte Worte nicht verloren gehen. Ein bevorzugtes Verfahren zur Durchführung dieser Wiedereinführung besteht darin, die Moleküle wieder in Einzelstrang-DNA aufzuteilen. Die Stränge ohne angehängte Ränder werden anschließend an die Stränge angehängt, die wieder einzuführen sind. Alternativ ist es möglich, eine Kopie des gesamten Speichers zu bewahren und die Kopie nach mehreren Leseoperationen wieder einzugeben.
  • Unter Verwendung der gegenwärtigen Technologie liegt die Lese- und Schreibdauer in der Größenordnung von Stunden. Es gibt jedoch keine offensichtliche grundlegende Einschränkung, die verhindert, daß automatisierte Lese- und Schreiboperationen in einem molekularen Zeitmaßstab erreicht werden. Überdies kann dann, wenn Informationen in DNA eingeschlossen sind, das gesamte Gefäß relativ leicht durch DNA- Nachbildung kopiert werden. Gleichfalls können die Informationen in mehreren Gefäßes einfach verschmolzen werden, indem die Inhalte aller Gefäße physisch vermischt werden. Ein Millimol von Molekülen, die jeweils 200 Basen lang sind, würde ungefähr 50 g wiegen und ungefähr 1000 Liter in Anspruch nehmen. Ein solches Volumen könnte 10²&sup0; Worte enthalten, wobei jedes Wort mehrere tausend oder mehrere zehntausend Bits codiert.
  • Obwohl eine bevorzugte Ausführungsform eines Assoziativspeichers, der DNA-Moleküle verwendet, beschrieben und erläutert wurde, ist es für den Fachmann selbstverständlich, daß weitere Abwandlungen und Änderungen möglich sind, ohne vom grundlegenden Prinzip und vom Erfindungsgedanken der vorliegenden Erfindung abzuweichen.

Claims (17)

1. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen, mit den folgenden Schritten:
Bilden von kundenspezifischen DNA-Molekülen, die mit Informationen codiert sind;
Anordnen der kundenspezifischen DNA-Moleküle in einem Gefäß;
Durchsuchen der kundenspezifischen DNA-Moleküle nach jenen Molekülen, die eine vorgegebene Untersequenz besitzen, und Auswählen der Moleküle mit der vorgegebenen Untersequenz; und
Auslesen der ausgewählten DNA-Moleküle.
2. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 1, bei dem das Bilden der kundenspezifischen DNA-Moleküle das Codieren von Komponenten eines Vektors eines gespeicherten Wortes, die einen vorgegebenen Wert besitzen, umfaßt.
3. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Verknüpfen von Untersequenzen, die einem Vektor entsprechen, der an einer vorgegebenen Komponente einen vorgegebenen Wert besitzt, umfaßt.
4. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Auswählen von DNA- Untersequenzen, die einen optimierten Code enthalten, umfaßt.
5. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Auswählen von DNA- Untersequenzen, die so gewählt sind, daß sie durch Restriktionsabbildung eindeutig unterscheidbar sind, umfaßt.
6. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Auswählen natürlich auftretender DNA-Fragmente umfaßt.
7. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Anhängen einer Stoppsequenz an eine Sequenz, der eine vorgegebene, einen vorgegebenen Wert besitzende Komponente eines Vektors zugeordnet ist, umfaßt.
8. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, bei dem das Codieren das Anhängen einer Startsequenz und einer Stoppsequenz an eine Sequenz, der eine vorgegebene, einen vorgegebenen Wert besitzende Komponente eines Vektors zugeordnet ist, umfaßt.
9. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 2, wobei der vorgegebene Wert aus der Gruppe gewählt ist, die aus "1"en, "0"en und "1"en und "0"en besteht.
10. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Moleküle nach einem der Ansprüche 1 oder 2, wobei das Durchsuchen das Markie ren vorgegebener Untersequenzen aus einem DNA-Molekül und das Extrahieren markierter Moleküle umfaßt.
11. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach Anspruch 10, wobei das Markieren das Zuordnen magnetischer Ränder umfaßt und das Extrahieren die magnetische Separation umfaßt.
12. Verfahren zum Schreiben in einen und zum Lesen aus einem Assoziativspeicher aus DNA-Molekülen nach einem der Ansprüche 1 oder 2, wobei das Durchsuchen das Einführen einer DNA mit einer zu den vorgegebenen Untersequenzen komplementären Untersequenz umfaßt.
13. Assoziativspeicher, mit:
kundenspezifischen DNA-Molekülen, die mit Informationen codiert sind, wobei die Moleküle in einem Gefäß angeordnet sind;
einer Einrichtung zum Durchsuchen der kundenspezifischen DNA-Moleküle nach jenen Molekülen mit einer vorgegebenen Untersequenz; und
einer Einrichtung zum Auslesen jener Moleküle mit einer vorgegebenen Untersequenz.
14. Assoziativspeicher nach Anspruch 13, wobei die Einrichtung zum Durchsuchen das Einleiten eines markierten DNA-Moleküls mit einer zu der vorgegebenen Untersequenz komplementären Sequenz umfaßt.
15. Assoziativspeicher nach Anspruch 14, wobei die Markierung ein magnetischer Rand ist.
16. Assoziativspeicher nach Anspruch 13, wobei die codierten Informationen einen Adressenabschnitt und einen Datenabschnitt umfassen.
17. Assoziativspeicher nach Anspruch 13, wobei die Einrichtung zum Lesen ein Restriktionsenzym umfaßt.
DE1996609996 1995-02-07 1996-02-07 DNS-basierter inhaltsadressierbarer Speicher Expired - Lifetime DE69609996T2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US38499595A 1995-02-07 1995-02-07

Publications (2)

Publication Number Publication Date
DE69609996D1 DE69609996D1 (de) 2000-10-05
DE69609996T2 true DE69609996T2 (de) 2001-04-05

Family

ID=23519606

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1996609996 Expired - Lifetime DE69609996T2 (de) 1995-02-07 1996-02-07 DNS-basierter inhaltsadressierbarer Speicher

Country Status (3)

Country Link
EP (1) EP0726530B1 (de)
JP (1) JPH08212183A (de)
DE (1) DE69609996T2 (de)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE59802537D1 (de) * 1997-04-15 2002-01-31 Gmd Gmbh Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen
JP2000353156A (ja) * 1999-06-11 2000-12-19 Sentan Kagaku Gijutsu Incubation Center:Kk Np完全問題の解を得る方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0239569A4 (de) * 1985-09-20 1989-10-04 Hsg Venture Neurologische und biologische molekulare elektrooptische anordnungen und verfahren.

Also Published As

Publication number Publication date
JPH08212183A (ja) 1996-08-20
DE69609996D1 (de) 2000-10-05
EP0726530B1 (de) 2000-08-30
EP0726530A1 (de) 1996-08-14

Similar Documents

Publication Publication Date Title
Fontana et al. Statistics of landscapes based on free energies, replication and degradation rate constants of RNA secondary structures
DE68929038T2 (de) Verfahren zur Verarbeitung von digitalen Textdaten
US5050219A (en) Method of handwriting recognition
Carvalho et al. A highly scalable algorithm for the extraction of cis-regulatory regions
Drmanac et al. An algorithm for the DNA sequence generation from k-tuple word contents of the minimal number of random fragments
CN111563372B (zh) 一种基于教辅书籍出版的排版文档内容自查重方法
DE69609996T2 (de) DNS-basierter inhaltsadressierbarer Speicher
CN115101142A (zh) 一种药物-靶点交互作用预测方法、系统及终端设备
DE3244631C2 (de)
WO2011074942A1 (en) System and method of converting data from a multiple table structure into an edoc format
Haynes Collective adaptation: The exchange of coding segments
Simon Sequence comparison: some theory and some practice
US6124444A (en) DNA sequences useful for computation
CN114418014A (zh) 一种避免试题相似的试卷生成系统
EP0945705B1 (de) Erkennungssystem
WO2002005198A2 (de) Verfahren zum verarbeiten von mehreren unterschiedlichen datenstrukturen
CN115587215B (zh) 一种基于语句通顺性的残断汉简图像缀合方法
CA1293807C (en) Method of handwriting recognition
Zolyan Does a Ribosome Really Read? On the Cognitive Roots and Heuristic Value of Linguistic Metaphors in Molecular Genetics. Part 1
US11990184B2 (en) DNA backbone editing for DNA data storage
WO2002029620A1 (fr) Systeme d'extraction de caractere, procede d'extraction de caractere, et support d'enregistrement lisible par ordinateur
Bassett et al. MINITAB multivariate macros
EP4216099A1 (de) Vorrichtung und computerimplementiertes verfahren zur analyse eines hierarchischen dokuments insbesondere zum befüllen eines wissensgraphen
Ulrich Impressions and Intuition: Sense Divisions in Ancient Manuscripts of Isaiah
CN1006333B (zh) 中文输入方法

Legal Events

Date Code Title Description
8364 No opposition during term of opposition