DE69609996T2 - DNS-basierter inhaltsadressierbarer Speicher - Google Patents
DNS-basierter inhaltsadressierbarer SpeicherInfo
- Publication number
- DE69609996T2 DE69609996T2 DE1996609996 DE69609996T DE69609996T2 DE 69609996 T2 DE69609996 T2 DE 69609996T2 DE 1996609996 DE1996609996 DE 1996609996 DE 69609996 T DE69609996 T DE 69609996T DE 69609996 T2 DE69609996 T2 DE 69609996T2
- Authority
- DE
- Germany
- Prior art keywords
- dna
- reading
- dna molecules
- associative memory
- writing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 108020004414 DNA Proteins 0.000 claims description 78
- 230000015654 memory Effects 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 32
- 102000053602 DNA Human genes 0.000 claims description 22
- 230000000295 complement effect Effects 0.000 claims description 11
- 108091008146 restriction endonucleases Proteins 0.000 claims description 7
- 239000013598 vector Substances 0.000 claims description 7
- 239000012634 fragment Substances 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 3
- 238000007885 magnetic separation Methods 0.000 claims description 2
- 239000003550 marker Substances 0.000 claims 1
- 238000012360 testing method Methods 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000002773 nucleotide Substances 0.000 description 3
- 125000003729 nucleotide group Chemical group 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000004543 DNA replication Effects 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B82—NANOTECHNOLOGY
- B82Y—SPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
- B82Y10/00—Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/123—DNA computing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C11/00—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
- G11C11/54—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using elements simulating biological cells, e.g. neuron
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C15/00—Digital stores in which information comprising one or more characteristic parts is written into the store and in which information is read-out by searching for one or more of these characteristic parts, i.e. associative or content-addressed stores
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Biology (AREA)
- Nanotechnology (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Neurology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computer Hardware Design (AREA)
- Artificial Intelligence (AREA)
- Crystallography & Structural Chemistry (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
- Die vorliegende Erfindung bezieht sich auf Assoziativspeicher und insbesondere auf die Verwendung der DNA zur Bildung von Assoziativspeichern.
- Die Verwendung der Werkzeuge der Molekularbiologie zur Lösung von Problemen der Computerwissenschaft, wie etwa das Problem des gerichteten Hamiltonschen Wegs, ist in einem Artikel von L. M. Adleman mit dem Titel "Molecular Computation of Solutions to Combinatorial Problems" in Science, Bd. 226, S. 1021 bis 1024 (1994), vorgeschlagen worden.
- Die Lösung des Problems des Hamiltonschen Wegs ist irgendein Weg, der an spezifizierten Scheitelpunkten beginnt und endet und jeden weiteren Scheitelpunkt genau einmal berührt. Adlemans Lösung des Problems besteht darin, durch einen gerichteten Graphen der n Scheitelpunkte mit bezeichneten Scheitelpunkten Vin und Vout Zufallswege zu erzeugen. Es werden diejenigen Wege bewahrt, die (1) bei Vin beginnen und bei Vout enden, dabei (2) genau n Scheitelpunkte berühren, und (3) nur jene, die jeden Scheitelpunkt wenigstens einmal berühren. Alle verbleibenden Wege sind die Lösung des Problems.
- Adlemans Darstellung besteht darin, jeden Scheitelpunkt einer zufälligen 20- gliedrigen DNA-Sequenz zuzuordnen. Für jede Kante des Graphen i j wird eine 20-gliedrige Sequenz erzeugt, die mit Oij bezeichnet wird, und die die letzten 10 Glieder des Scheitelpunkts i und die ersten 10 Glieder des Scheitelpunkts j enthält. Im Fall von Vin und Vout werden alle 20 Glieder verwendet, um den jeweiligen Scheitelpunkt zu bezeichnen, d. h. es wird eine 30-gliedrige Sequenz erzeugt.
- Zur Durchführung des Verfahrens werden die DNA-Sequenz (die mit öi bezeichnet ist), die Watson-Crick-komplementär zur Sequenz für den Scheitelpunkt i ist, und die Sequenz Oij für alle i, j auf dem Graphen gemischt. Die Kantensequenzen Oij dienen als Verbindungseinrichtungen für die Scheitelpunktsequenzenöl, wodurch Moleküle erzeugt werden, die zufälligen Wegen durch den Graphen entsprechen.
- Das Ergebnis wurde durch PCR (polymerase Kettenreaktion) unter Verwendung der Auslöser O&sub0; und &sub6; verstärkt, wobei V0 gleich Vin ist und V6 der Scheitelpunkt Vout ist. Das heißt, es wurden lediglich jene DNA- Moleküle verstärkt, die Wege codieren, die am Scheitelpunkt Vin beginnen und am Scheitelpunkt Vout enden.
- Die restlichen Moleküle wurden durch ein Aragose-Gel mittels Elektrophorese gezogen. Dieser Schritt ermöglicht die Messung der molekularen Länge. Es wurden lediglich die Moleküle mit geeigneter Länge zurückbehalten.
- Die verbleibende Doppelstrang-DNA wurde in einen einzelnen Strang geteilt und es wurde eine "Trennungs"-Operation ausgeführt. Die Trennungsoperation umfaßt die Schritte des Nehmens einer Sequenzöl und des Anfügens eines magnetischen Rands an die Sequenz. Diese Moleküle werden in das Reagenzglas eingesetzt, wo sie sich mit anderen Molekülen verbinden, die Oi enthalten, d. h. Codierung der Wege, die den Scheitelpunkt i enthalten. Diese verbundenen Moleküle werden anschließend magnetisch abgezogen. Dieser Vorgang wird für jeden Scheitelpunkt im Graphen wiederholt.
- Das Ergebnis wird durch PCR und Elektrophorese verstärkt, um zu erkennen, ob Moleküle vorhanden sind. Die vorhandenen Moleküle entsprechen den Hamiltonschen Wegen. Wenn kein Molekül vorhanden ist, würde dies anzeigen, daß im Graph kein Hamiltonscher Weg existiert.
- Anschließend schuf Lipton in einem zu veröffentlichenden Artikel (der derzeit unter /ftp/pub/people/rjl/bio.ps auf ftp.cs.princeton.edu zur Verfügung steht) einen praktischeren Algorithmus. Diese Lösung besteht darin, aus dem Reagenzglas alle Sequenzen zu extrahieren, die einen gewissen vorgegebenen Satz aufeinanderfolgender Sequenzen enthalten. Anschließend wird erfaßt, ob im Reagenzglas DNA vorhanden ist.
- Die vorliegende Erfindung erweitert die obenstehend beschriebenen Werkzeuge, um einen Assoziativspeicher mit immensen Möglichkeiten zu erzeugen.
- Ein Assoziativspeicher ist ein Speicher, in dem Worte gespeichert und anschließend (anstatt eine spezielle Adresse wissen zu müssen) unter Verwendung lediglich von Teilinformationen oder teilweise fehlerhaften Informationen über ihren Inhalt wieder aufgerufen werden können.
- Der Speicher umfaßt ein Gefäß oder ein Reagenzglas, das DNA enthält. Ein Wort wird in den Speicher geschrieben, indem ein geeignetes DNA-Molekül, das das Wort codiert, angeordnet wird. Ein einzelnes DNA-Molekül, das das Wort codiert, ist ausreichend. In der Praxis wird jedoch bevorzugt, viele Kopien des das Wort codierenden Moleküls in das Gefäß einzubringen. Das zu speichernde Wort stammt aus einem virtuellen binären Vektorraum mit möglichst hoher Dimension. Jede Komponente im Vektorraum wird durch eine spezielle kurze DNA-Sequenz repräsentiert, die beispielsweise eine Länge von 20 bis 100 Nukleotiden aufweist. Die Längen, die verwendet werden, um unterschiedliche Komponenten zu codieren, können variieren. Die Verwendung kürzerer Komponenten für mehr gebräuchlich verwendete Wortkomponenten hat einen raumeffizienten Speicher zur Folge. Die Verwendung von unterschiedlichen Längen für unterschiedliche Untersequenzen wird bei der Erkennung helfen, da die Länge eines DNA- Moleküls einfach bestimmt werden kann. Ein DNA-Molekül im Speicher entspricht einem gespeicherten virtuellen Vektor, der an allen Komponenten, für die das Molekül die entsprechende Untersequenz besitzt, eine "1" und sonst "0" aufweist. Somit können relativ kurze DNA-Moleküle kleine Vektoren (d. h., die wenige "1"en enthalten) aus einem sehr großen virtuellen Vektorraum repräsentieren. Es ist für den Fachmann selbstverständlich, daß im nachfolgenden Text die Rollen der "1"en und der "0"en vertauscht werden können. Alternativ kann jede Komponentenanzahl, jedes Komponentenwertpaar einer speziellen DNA-Untersequenz zugeordnet sein. In diesem Fall werden die "0"en ausdrücklich explizit codiert, im Gegensatz dazu, daß sie lediglich das Fehlen einer eine "1" codierenden Untersequenz bedeuten. Das DNA-Molekül, das ein spezielles Wort codiert, wird durch Verknüpfen der geeigneten Untersequenzen zusammengesetzt, die seinen speziellen Bits in beliebiger Reihenfolge entsprechen.
- Der Vorgang des Erzeugens eines Assoziativspeichers unter Verwendung von DNA umfaßt das Bilden kundenspezifischer DNA-Moleküle mit geeigneten Untersequenzen im Molekül, das Anordnen der kundenspezifischen DNA-Moleküle in einem Gefäß und das Durchsuchen des Gefäßes nach DNA-Molekülen, die gewünschte Untersequenzen besitzen. Nachdem ein DNA-Molekül gefunden wurde, das die gewünschte Untersequenz enthält, wird der Rest des Moleküls ausgelesen.
- Es ist demzufolge eine Hauptaufgabe der vorliegenden Erfindung, einen Assoziativspeicher unter Verwendung von DNA zu schaffen.
- Es ist eine weitere Aufgabe der Erfindung, ein Verfahren zum Schreiben von Informationen in einen und zum Lesen von Informationen aus einem Assoziativspeicher, der DNA enthält, zu schaffen.
- Weitere und nochmals andere Aufgaben der vorliegenden Erfindung werden offensichtlicher, wenn die nachfolgende Beschreibung in Verbindung mit der beigefügten Zeichnung gelesen wird.
- Die einzige Figur ist ein Ablaufplan eines bevorzugten Verfahrens zur Implementierung eines Assoziativspeichers, der DNA verwendet.
- In der einzigen Figur der vorliegenden Anmeldung besteht ein erster Schritt 10 im Bilden eines kundenspezifischen DNA-Moleküls, das vorgegebene Untersequenzen besitzt, und im Anordnen des Moleküls in einem Gefäß. Die DNA-Molekülcodierung eines speziellen Worts wird ausgeführt, indem vorgegebene Untersequenzen, die den speziellen Bits entsprechen, in beliebiger Reihenfolge verknüpft werden.
- Der Schritt des Bildens von Untersequenzen, die Komponenten entsprechen, kann auf verschiedene Arten realisiert werden. Es ist möglich, die Untersequenzen zu bilden, indem die Anzahl der Komponenten in der Sequenz codiert werden, denen eine andersartige "Stopp"-Sequenz folgt. Die "Stopp"-Sequenz ist so gewählt, daß sie durch ein bestimmtes Restriktionsenzym unterbrochen wird, das das Teilen eines DNA-Moleküls in seine Untersequenzkomponenten erleichtert.
- Außerdem ist es möglich, anstatt einfach einen Code für die Nummer des Speicherplatzes zu verwenden, Sequenzen zu verwenden, die so gewählt sind, daß sie durch die Verwendung der Restriktionsabbildung eindeutig unterscheidbar sind, die das Lesen der Informationen, das später beschrieben wird, erleichtert. Die Restriktionsabbildung ist im Buch von B. Alberts u. a. mit dem Titel "Molecular Biology of the Cell" beschrieben, herausgegeben durch Garland Publishing, New York, 1994.
- Weitere alternative Bildungsverfahren enthalten die Verwendung von Untersequenzen, die aus einem optimierten Code ausgewählt sind, der so gewählt ist, daß Erkennungsfehler minimiert werden, sowie die Verwendung von natürlich auftretenden DNA-Fragmenten.
- Die gegenwärtige Technologie, die im Buch von Alberts u. a. beschrieben ist, besteht darin, daß automatisierte Oligonukleotid-Synthesizer jedes DNA- Molekül schnell erzeugen können, das bis zu ungefähr 100 Nukleotide enthält. Diese können durch wiederholte DNA-Klonungschritte in verschiedenen Kombinationen zusammengefügt werden, um lange kundenspezifisch aufgebaute DNA-Moleküle mit beliebiger Sequenz zu erzeugen. Es ist außerdem möglich, lange DNA-Sequenzen noch leichter zu erzeugen, indem ausgewählte natürlich auftretende Segmente verbunden werden.
- Wenn die Untersequenzkomponenten erzeugt worden sind, können sie kostengünstig kopiert werden. Das Schreiben von Worten in den Assoziativspeicher ist relativ schnell und kostengünstig, da Reagenzgläser unterhalten werden können, die bereits jede im voraus gebildete Sequenzkomponente enthalten. Es können außerdem im voraus erzeugte Sequenzen zur Verwendung beim Zusammenfügen von Untersequenzkomponenten vorhanden sein (siehe z. B. Adleman oben).
- Es gibt einen beträchtlichen Spielraum bei der Auswahl der DNA- Untersequenzen, die den Komponenten entsprechen. Die einzige Einschränkung besteht darin, daß keine der Untersequenzen weder eine Untersequenz einer anderen Komponente noch von zwei anderen verknüpften Untersequenzen ist, da dies zu Mehrdeutigkeiten im Vorgang des Wiederaufrufs führen würde. Untersequenzen mit eine Länge zwischen 10 und 100 Nukleotiden sind typischerweise ausreichend, um solche Mehrdeutigkeiten zu vermeiden (in Abhängigkeit von der Speichergröße). Es wird manchmal vorteilhaft sein, Untersequenzen mit einer andersartigen "Stopp" Untersequenz abzuschließen. Die Verwendung einer Stopp- Untersequenz wird Mehrdeutigkeiten vermeiden, die von der Verknüpfung herrühren, und wenn die Stopp-Sequenz so ausgewählt wird, daß sie durch ein bestimmtes Restriktionsenzym unterbrochen werden kann, wird dies das Zerteilen eines DNA-Moleküls in seine Untersequenzkomponenten erleichtern.
- Wenn das Komplement einer Sequenz nicht zum Codieren einer weiteren Sequenz verwendet wird, werden alle komplementären Fragmente, die sich während der Vermehrung oder des Lesens einschleichen, den Speicher nicht zerstören, da die Fragmente nicht als gespeicherte Worte interpretiert werden oder leicht entfernt werden können.
- Jede Untersequenzkomponente beginnt mit einer Anfangssequenz A und endet mit einer Stoppsequenz B, wobei das Molekül (d. h. das Watson- Crick-Komplement der Sequenz B, das mit dem Komplement der Sequenz A verbunden ist) als ein Mehrzweck-Bindeglied dient, um Untersequenzkomponenten in einer von der Reihenfolge unabhängigen Weise zu verbinden.
- Alternativ ist es zur Bildung von Untersequenzen, die in einer vorgegebenen Reihenfolge miteinander verbunden sind, möglich, speziellere Verbindungssequenzen zu verwenden.
- Nachdem kundenspezifische DNA-Moleküle gebildet und in einem Gefäß, wie etwa einem Reagenzglas, angeordnet wurden, d. h. nach dem Schritt des Schreibens, ist es notwendig, daß man den Speicher in einer inhaltsadressierbaren Weise auslesen kann, indem das Gefäß nach jenen DNA-Molekülen durchsucht wird (Schritt 20), die eine vorgegebene DNA- Sequenz oder mehrere vorgegebene Sequenzen besitzen. Das bevorzugte Verfahren zum Durchsuchen des Gefäßes bei einem vorgegebenen "Hinweis", der eine Untermenge der von Null verschiedenen Komponenten eines Worts umfaßt, besteht darin, alle DNA-Moleküle zu extrahieren, die die geeigneten Hinweis-Sequenzen enthalten. Wenn im Gefäß keine Moleküle enthalten sind, die alle geeigneten Untersequenzen enthalten, ist es alternativ möglich, die Moleküle zu extrahieren, die die meisten Übereinstimmungen enthalten, um eine oder mehrere beste Übereinstimmungen zu erhalten. Es ist außerdem möglich, nach einigen Null-Komponenten zu suchen. Aus den DNA-Übereinstimmungen werden alle Moleküle ausgelesen, die die entsprechenden Untersequenzen enthalten und diese Moleküle werden entfernt. Das Auslesen erfolgt mit einem separaten Diffusionsschritt. Die Suche ist logisch analog zu der Suche in einer Großmutterzelle eines Assoziativspeichers nach allen gespeicherten Worten, die eine bestimmte Untermenge von Bits enthalten, wie in einem Artikel von E. B. Baum u. a. mit dem Titel "Internal Representations for Associative Memory", Biological Cybernetics, Bd. 59, 1988, S. 217 bis 228 beschrieben ist.
- Es gibt in der Molekularbiologie mehrere bekannte Vorgänge, die zur Durchführung einer Suche verwendet werden können. Ein bevorzugtes Suchverfahren besteht darin, zur Suche nach Untersequenzen komplementäre Untersequenzen zu verwenden, die Markierungen enthalten. Für jede im Hinweis spezifizierte Komponente wird das Komplement der entsprechenden Untersequenz der DNA, das an einem magnetischen Rand angebracht ist, in das Gefäß eingeleitet. Diese Moleküle werden sich an die DNA-Moleküle im Speicher binden, die die vorgegebenen Hinweis- Untersequenzen besitzen. Diese gebundenen Moleküle werden anschließend durch Diffusion separiert. Ein solcher Vorgang wurde im obengenannten Artikel von Adleman beschrieben. Dieser Vorgang kann nacheinander für jede im Hinweis spezifizierte Komponente wiederholt werden, bis lediglich Moleküle übrigbleiben, die Worte codieren, die im Hinweis enthalten sind. Alternativ können die magnetisch markierten Untersequenzen, die zu den Untersequenzen komplementär sind, die den im Hinweis spezifizierten Komponentenwerten entsprechen, gleichzeitig eingeleitet werden. Die am stärksten magnetischen DNA-Moleküle codieren dann das Wort mit den am meisten mit dem Hinweis übereinstimmenden Komponenten. Die Suchdauer ist im wesentlichen von der Anzahl der gespeicherten Worte unabhängig, da die chemischen Vorgänge berechnungsmäßig "parallel" ablaufen. In Abhängigkeit von der Technik der Wiedergewinnung kann die Suchdauer von der Anzahl der Komponenten in der Hinweissequenz linear abhängen.
- Wenn der Hinweis sequentiell durchgegangen wird, indem zuerst alle Moleküle gefunden werden, die die erste im Hinweis spezifizierten Komponente enthalten, und anschließend die Untermengen jener Moleküle gefunden werden, die die nächste spezifizierte Komponente enthalten, würde die Wiedergewinnung eine Anzahl biologischer Operationen erfordern, die gleich der Anzahl der spezifizierten Komponenten ist. Wenn an allen spezifizierten Komponenten gleichzeitig Ränder angebracht werden und die am stärksten magnetische Komponente herausgezogen wird, würde lediglich eine einzige Operation benötigt werden. Die Zeit, die notwendig ist, um die magnetische Trennung durchzuführen, wird von der Anzahl der spezifizierten Komponenten abhängen.
- Während magnetische Ränder und komplementäre Sequenzen bevorzugte Suchverfahren darstellen, würden weitere Markierungssysteme bei der Suche nach übereinstimmenden Untersequenzen von DNA-Komponenten in einem Molekül erfolgreich sein, wie es für Fachmänner selbstverständlich ist.
- Es ist selbstverständlich, daß ein Anregen oder ein Mischen des Gefäßes vorteilhaft ist, um den Vorgang zu beschleunigen und um die Vermischung aller Moleküle zu sichern.
- Nachdem ein DNA-Molekül gefunden wurde, das die Hinweis-Komponente enthält, wird das Molekül sequentiell geordnet, um den Rest des im Molekül gespeicherten Wortes auszulesen (Schritt 30). Dieser Schritt ist ebenfalls logisch analog zu der Leseoperation in der Großmutterspeicherzelle. Bei einem gegebenen Teilhinweis kann der Rest der Komponenten im gespeicherten Wort wiederhergestellt werden. Wie im Kapitel 7 des Buchs von Albert u. a. beschrieben ist, können DNA-Moleküle unter Verwendung einer Vielzahl von Techniken schnell verarbeitet werden. Der Vorgang kann durch eine geeignete Wahl der enthaltenen Untersequenzen beschleunigt werden, z. B. durch das Wählen von Untersequenzen derart, daß die Restriktionsabbildung unterschiedliche Komponenten eindeutig unterscheiden kann, oder daß die Moleküle durch ein spezielles Restriktionsenzym schnell in Komponenten zerteilt werden. Eine optimale Wahl der enthaltenen Sequenzen hat eine viel schnellere Identifizierung des logischen Inhalts eines gespeicherten Moleküls zur Folge als das sequentielle Ordnen eines willkürlichen DNA-Moleküls.
- Es sind eine große Anzahl von Restriktionsenzymen bekannt, die DNA- Moleküle an bestimmten Speicherplätzen spalten. Indem ein vorgegebenes DNA-Moleküls verschiedenen Restriktionsenzyrnen ausgesetzt wird, wird das Molekül in Abhängigkeit von der Sequenz in Teile mit unterschiedlichen, jedoch wohldefinierten Längen gespaltet. Die Längen der Segmente liefern dann die Bedingungen der Sequenz. Häufig und sogar bei natürlich auftretender DNA sind diese Bedingungen zur Bestimmung der Sequenz ausreichend. Dieser Vorgang ist als Restriktionsabbildung bekannt. Gemäß der vorliegenden Erfindung ist es lediglich notwendig, Sequenzen zu entwerfen, die aufgrund der verschiedenen Längen, in die sie durch die zahlreichen Restriktionsenzyme gespaltet werden, leicht voneinander unterschieden werden können.
- Um das Lesen zu beschleunigen und um mehr Informationen zu speichern ist es möglich, DNA-Moleküle zu speichern, die einen Adressenabschnitt und einen Datenabschnitt enthalten. Der Adressenabschnitt wird, wie obenstehend beschrieben wurde, erzeugt und durch den Inhalt adressiert. Nach dem Wiederaufruf wird der Datenabschnitt sequentiell geordnet und gelesen. Die Informationen im Datenabschnitt können zu den im Adressenabschnitt gespeicherten Informationen gleich oder von diesen verschieden sein. Die Codierung von Adressenabschnitt und Datenabschnitt kann gleich oder verschieden sein. Die Speicherung von Informationen in den Datenabschnitten in einfacher Weise als ein Wort mit der Basis vier würde, während sie kompakt ist, zum Lesen eine Technologie mit vollständiger sequentieller Ordnung erfordern.
- Es ist außerdem möglich, an die gespeicherten Moleküle möglichst lange Sequenzen, die mehr Informationen enthalten, anzufügen. Diese zusätzlichen Sequenzen könnten nicht über ihren Inhalt adressiert werden, wie obenstehend beschrieben wurde. Wenn das Molekül wiederaufgerufen worden ist, wären die zusätzlichen Sequenzen jedoch lesbar. Die obenstehend beschriebene enthaltene Vorrichtung könnte beispielsweise in einfacher Weise als ein Adressierungsschema für einen gewöhnlichen RAM verwendet werden und die zusätzlich gespeicherten Sequenzen, die als Langworte gelesen werden, könnten bei diesen Adressen gespeichert werden.
- In einem konventionellen RAM muß die vollständige Adresse bereitgestellt werden, um ein Wort zu lesen. Wenn der vorliegende Speicher als RAM verwendet wird, ist die Leseoperation vereinfacht, da es möglich ist, lediglich einen Rand an den DNA-Molekülen anzubringen, die das Wort codieren, von dem gewünscht ist, daß es wiederaufgerufen wird. Wenn die Adressensequenzen aus einem Fehlerkorrekturcode gewählt sind, wird der Vorgang beschleunigt, und es wird wenig wahrscheinlich sein, daß bei Molekülen, die lediglich ungefähr übereinstimmen, ein zufälliges Anhängen von an Rändern angehängten Wiederaufrufsequenzen auftritt. Deswegen werden während der Leseoperation keine weiteren Moleküle aus dem Speicher entfernt, und es wird viel einfacher, den Speicher nach dem Lesen in seinem Zustand vor dem Lesen wiederherzustellen.
- Standard-Datenbankoperationen wie etwa Löschen sind außerdem möglich. Zum Löschen werden beispielsweise die geeigneten Moleküle aus der Datenbank entfernt.
- Unter Verwendung der gegenwärtig zur Verfügung stehenden Technologie wird die obenstehend beschriebene Suchoperation unter Verwendung von Rändern an einer Einzelstrang-DNA ausgeführt, während die sequentielle Ordnung einer Restriktionsabbildung an einer Doppelstrang-DNA ausgeführt wird. Es ist möglich, wenn auch sehr langsam, DNA vom Doppelstrang zum Einzelstrang zu überführen und umgekehrt. Zum schnellen Suchen und sequentiellen Ordnen ist es möglich, einen Adressenabschnitt eines DNA- Moleküls, der ein Einzelstrang ist, und einen Datenabschnitt eines DNA- Moleküls, der ein Doppelstrang ist, zu verwenden.
- Nach der Leseoperation müssen alle DNA-Moleküle, die entfernt wurden, wieder in den Speicher eingeführt werden, so daß gespeicherte Worte nicht verloren gehen. Ein bevorzugtes Verfahren zur Durchführung dieser Wiedereinführung besteht darin, die Moleküle wieder in Einzelstrang-DNA aufzuteilen. Die Stränge ohne angehängte Ränder werden anschließend an die Stränge angehängt, die wieder einzuführen sind. Alternativ ist es möglich, eine Kopie des gesamten Speichers zu bewahren und die Kopie nach mehreren Leseoperationen wieder einzugeben.
- Unter Verwendung der gegenwärtigen Technologie liegt die Lese- und Schreibdauer in der Größenordnung von Stunden. Es gibt jedoch keine offensichtliche grundlegende Einschränkung, die verhindert, daß automatisierte Lese- und Schreiboperationen in einem molekularen Zeitmaßstab erreicht werden. Überdies kann dann, wenn Informationen in DNA eingeschlossen sind, das gesamte Gefäß relativ leicht durch DNA- Nachbildung kopiert werden. Gleichfalls können die Informationen in mehreren Gefäßes einfach verschmolzen werden, indem die Inhalte aller Gefäße physisch vermischt werden. Ein Millimol von Molekülen, die jeweils 200 Basen lang sind, würde ungefähr 50 g wiegen und ungefähr 1000 Liter in Anspruch nehmen. Ein solches Volumen könnte 10²&sup0; Worte enthalten, wobei jedes Wort mehrere tausend oder mehrere zehntausend Bits codiert.
- Obwohl eine bevorzugte Ausführungsform eines Assoziativspeichers, der DNA-Moleküle verwendet, beschrieben und erläutert wurde, ist es für den Fachmann selbstverständlich, daß weitere Abwandlungen und Änderungen möglich sind, ohne vom grundlegenden Prinzip und vom Erfindungsgedanken der vorliegenden Erfindung abzuweichen.
Claims (17)
1. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen, mit den
folgenden Schritten:
Bilden von kundenspezifischen DNA-Molekülen, die
mit Informationen codiert sind;
Anordnen der kundenspezifischen DNA-Moleküle in
einem Gefäß;
Durchsuchen der kundenspezifischen DNA-Moleküle
nach jenen Molekülen, die eine vorgegebene Untersequenz
besitzen, und Auswählen der Moleküle mit der vorgegebenen
Untersequenz; und
Auslesen der ausgewählten DNA-Moleküle.
2. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 1, bei dem das Bilden der kundenspezifischen
DNA-Moleküle das Codieren von Komponenten eines Vektors
eines gespeicherten Wortes, die einen vorgegebenen Wert
besitzen, umfaßt.
3. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, bei dem das Codieren das Verknüpfen von
Untersequenzen, die einem Vektor entsprechen, der an
einer vorgegebenen Komponente einen vorgegebenen Wert
besitzt, umfaßt.
4. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, bei dem das Codieren das Auswählen von DNA-
Untersequenzen, die einen optimierten Code enthalten,
umfaßt.
5. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, bei dem das Codieren das Auswählen von DNA-
Untersequenzen, die so gewählt sind, daß sie durch
Restriktionsabbildung eindeutig unterscheidbar sind,
umfaßt.
6. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, bei dem das Codieren das Auswählen natürlich
auftretender DNA-Fragmente umfaßt.
7. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, bei dem das Codieren das Anhängen einer
Stoppsequenz an eine Sequenz, der eine vorgegebene, einen
vorgegebenen Wert besitzende Komponente eines Vektors
zugeordnet ist, umfaßt.
8. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, bei dem das Codieren das Anhängen einer
Startsequenz und einer Stoppsequenz an eine Sequenz, der
eine vorgegebene, einen vorgegebenen Wert besitzende
Komponente eines Vektors zugeordnet ist, umfaßt.
9. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 2, wobei der vorgegebene Wert aus der Gruppe
gewählt ist, die aus "1"en, "0"en und "1"en und "0"en
besteht.
10. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Moleküle nach einem
der Ansprüche 1 oder 2, wobei das Durchsuchen das
Markie
ren vorgegebener Untersequenzen aus einem DNA-Molekül und
das Extrahieren markierter Moleküle umfaßt.
11. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach
Anspruch 10, wobei das Markieren das Zuordnen
magnetischer Ränder umfaßt und das Extrahieren die magnetische
Separation umfaßt.
12. Verfahren zum Schreiben in einen und zum Lesen
aus einem Assoziativspeicher aus DNA-Molekülen nach einem
der Ansprüche 1 oder 2, wobei das Durchsuchen das
Einführen einer DNA mit einer zu den vorgegebenen
Untersequenzen komplementären Untersequenz umfaßt.
13. Assoziativspeicher, mit:
kundenspezifischen DNA-Molekülen, die mit
Informationen codiert sind, wobei die Moleküle in einem Gefäß
angeordnet sind;
einer Einrichtung zum Durchsuchen der
kundenspezifischen DNA-Moleküle nach jenen Molekülen mit einer
vorgegebenen Untersequenz; und
einer Einrichtung zum Auslesen jener Moleküle mit
einer vorgegebenen Untersequenz.
14. Assoziativspeicher nach Anspruch 13, wobei die
Einrichtung zum Durchsuchen das Einleiten eines
markierten DNA-Moleküls mit einer zu der vorgegebenen
Untersequenz komplementären Sequenz umfaßt.
15. Assoziativspeicher nach Anspruch 14, wobei die
Markierung ein magnetischer Rand ist.
16. Assoziativspeicher nach Anspruch 13, wobei die
codierten Informationen einen Adressenabschnitt und einen
Datenabschnitt umfassen.
17. Assoziativspeicher nach Anspruch 13, wobei die
Einrichtung zum Lesen ein Restriktionsenzym umfaßt.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38499595A | 1995-02-07 | 1995-02-07 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69609996D1 DE69609996D1 (de) | 2000-10-05 |
DE69609996T2 true DE69609996T2 (de) | 2001-04-05 |
Family
ID=23519606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE1996609996 Expired - Lifetime DE69609996T2 (de) | 1995-02-07 | 1996-02-07 | DNS-basierter inhaltsadressierbarer Speicher |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP0726530B1 (de) |
JP (1) | JPH08212183A (de) |
DE (1) | DE69609996T2 (de) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE59802537D1 (de) * | 1997-04-15 | 2002-01-31 | Gmd Gmbh | Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen |
JP2000353156A (ja) * | 1999-06-11 | 2000-12-19 | Sentan Kagaku Gijutsu Incubation Center:Kk | Np完全問題の解を得る方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0239569A4 (de) * | 1985-09-20 | 1989-10-04 | Hsg Venture | Neurologische und biologische molekulare elektrooptische anordnungen und verfahren. |
-
1995
- 1995-09-18 JP JP7238044A patent/JPH08212183A/ja active Pending
-
1996
- 1996-02-07 EP EP19960101766 patent/EP0726530B1/de not_active Expired - Lifetime
- 1996-02-07 DE DE1996609996 patent/DE69609996T2/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH08212183A (ja) | 1996-08-20 |
DE69609996D1 (de) | 2000-10-05 |
EP0726530B1 (de) | 2000-08-30 |
EP0726530A1 (de) | 1996-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fontana et al. | Statistics of landscapes based on free energies, replication and degradation rate constants of RNA secondary structures | |
DE68929038T2 (de) | Verfahren zur Verarbeitung von digitalen Textdaten | |
US5050219A (en) | Method of handwriting recognition | |
Carvalho et al. | A highly scalable algorithm for the extraction of cis-regulatory regions | |
Drmanac et al. | An algorithm for the DNA sequence generation from k-tuple word contents of the minimal number of random fragments | |
CN111563372B (zh) | 一种基于教辅书籍出版的排版文档内容自查重方法 | |
DE69609996T2 (de) | DNS-basierter inhaltsadressierbarer Speicher | |
CN115101142A (zh) | 一种药物-靶点交互作用预测方法、系统及终端设备 | |
DE3244631C2 (de) | ||
WO2011074942A1 (en) | System and method of converting data from a multiple table structure into an edoc format | |
Haynes | Collective adaptation: The exchange of coding segments | |
Simon | Sequence comparison: some theory and some practice | |
US6124444A (en) | DNA sequences useful for computation | |
CN114418014A (zh) | 一种避免试题相似的试卷生成系统 | |
EP0945705B1 (de) | Erkennungssystem | |
WO2002005198A2 (de) | Verfahren zum verarbeiten von mehreren unterschiedlichen datenstrukturen | |
CN115587215B (zh) | 一种基于语句通顺性的残断汉简图像缀合方法 | |
CA1293807C (en) | Method of handwriting recognition | |
Zolyan | Does a Ribosome Really Read? On the Cognitive Roots and Heuristic Value of Linguistic Metaphors in Molecular Genetics. Part 1 | |
US11990184B2 (en) | DNA backbone editing for DNA data storage | |
WO2002029620A1 (fr) | Systeme d'extraction de caractere, procede d'extraction de caractere, et support d'enregistrement lisible par ordinateur | |
Bassett et al. | MINITAB multivariate macros | |
EP4216099A1 (de) | Vorrichtung und computerimplementiertes verfahren zur analyse eines hierarchischen dokuments insbesondere zum befüllen eines wissensgraphen | |
Ulrich | Impressions and Intuition: Sense Divisions in Ancient Manuscripts of Isaiah | |
CN1006333B (zh) | 中文输入方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |