DE19914808A1 - Informationstragende Polymere - Google Patents

Informationstragende Polymere

Info

Publication number
DE19914808A1
DE19914808A1 DE1999114808 DE19914808A DE19914808A1 DE 19914808 A1 DE19914808 A1 DE 19914808A1 DE 1999114808 DE1999114808 DE 1999114808 DE 19914808 A DE19914808 A DE 19914808A DE 19914808 A1 DE19914808 A1 DE 19914808A1
Authority
DE
Germany
Prior art keywords
information
polymers
sequences
logomers
carrying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE1999114808
Other languages
English (en)
Inventor
Hilmar Rauhe
Udo Feldkamp
Wolfgang Banzhaf
Jonathan Howard
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rauhe Hilmar 50739 Koeln De
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to DE1999114808 priority Critical patent/DE19914808A1/de
Priority to JP2000609427A priority patent/JP2002541539A/ja
Priority to PCT/EP2000/002893 priority patent/WO2000059917A2/de
Priority to EP00925150A priority patent/EP1169330A2/de
Publication of DE19914808A1 publication Critical patent/DE19914808A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material
    • G11C13/0019RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material comprising bio-molecules
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B82NANOTECHNOLOGY
    • B82YSPECIFIC USES OR APPLICATIONS OF NANOSTRUCTURES; MEASUREMENT OR ANALYSIS OF NANOSTRUCTURES; MANUFACTURE OR TREATMENT OF NANOSTRUCTURES
    • B82Y10/00Nanotechnology for information processing, storage or transmission, e.g. quantum computing or single electron logic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/123DNA computing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C13/00Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00
    • G11C13/0002Digital stores characterised by the use of storage elements not covered by groups G11C11/00, G11C23/00, or G11C25/00 using resistive RAM [RRAM] elements
    • G11C13/0009RRAM elements whose operation depends upon chemical change
    • G11C13/0014RRAM elements whose operation depends upon chemical change comprising cells based on organic memory material

Landscapes

  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • Evolutionary Biology (AREA)
  • Plant Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Mathematical Physics (AREA)
  • Microbiology (AREA)
  • Nanotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Addition Polymer Or Copolymer, Post-Treatments, Or Chemical Modifications (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Saccharide Compounds (AREA)

Abstract

Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen Verfahren erhältliche informationstragende Polymere; Verfahren zur Isolierung, zur Vervielfältigung und zum Auslesen solcher informationstragender Polymere; polymere Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie die Verwendung informationstragender Polymere zur Herstellung von Molekulargewichtsstandards, als Marker oder Signaturen, zur Verschlüsselung von Information, als molekulare Kleber oder zur Herstellung oder Bearbeitung kleinster molekularer Strukturen.

Description

Die Erfindung betrifft Verfahren zur Herstellung informationstragender Polymere, nach diesen Verfahren erhältliche informationstragende Polymere; Verfahren zur Isolierung, zur Vervielfältigung und zum Auslesen solcher informationstragender Polymere; polymere Datenspeicher und DNA-Computer, die informationstragende Polymere umfassen sowie die Verwendung informationstragender Polymere zur Herstellung von Molekulargewichtsstandards, als Marker oder Signaturen, zur Verschlüsselung von Information, als molekulare Kleber oder zur Herstellung oder Bearbeitung kleinster molekularer Strukturen.
Es ist bekannt, Nukleinsäuren wie DNA (Deoxiribonucleic Acid = Desoxyribonukleinsäure) und RNA (Ribonucleic Acid = Ribonukleinsäure) auch außerhalb von Organismen zur Informationsverarbeitung zu verwenden. Es wurden bisher verschiedene Ansätze, DNA Moleküle zur Informationsverarbeitung zu verwenden, vorgestellt. Die WO 97/07 440 und [L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)] beschreiben ein Verfahren, einen Graphen- Algorithmus ("Hamiltonian-Pfad-Problem") als Entscheidungsproblem mit Hilfe von DNA Molekülen zu berechnen. Der Algorithmus wird implementiert, indem die Kanten und Knoten des Graphen als DNA Sequenzen repräsentiert werden. Die Berechnung des Algorithmus wird dadurch vorgenommen, daß durch die Hybridisierung komplementärer DNA Sequenzen eine Menge von Pfaden des Graphen erzeugt werden.
Aus dieser Menge von Pfaden werden dann mit Hilfe molekularbiologischer Verfahren alle Pfade entfernt, die eine falsche oder keine Lösung des Algorithmus sind. Wurden alle Schritte erfolgreich ausgeführt, so muß am Ende entweder mindestens ein DNA Strang übrigbleiben, der die richtige Lösung des Problems enthält, oder es bleibt kein DNA Strang übrig, was bedeutet, daß der Algorithmus keine Lösung hat.
Das beschriebene Verfahren setzt voraus, daß genügend viele Moleküle zur Verfügung stehen, damit jede mögliche Lösung der jeweiligen Probleminstanz statistisch mindestens einmal in der Ausgangsmenge von Pfaden vorkommt. Dies kann aufgrund der statistischen Natur der Hybridisierungsvorgänge jedoch nicht garantiert werden. Außerdem können im ersten Schritt auch zyklische Graphen entstehen, was von vorneherein die Menge falscher Lösungen vergrößert.
Der in WO 97/07 440 beschriebene Ansatz zeigt, daß Symbolverarbeitung überhaupt in vitro mit DNA Molekülen vorgenommen werden kann. Jedoch ist der beschriebene Ansatz in der Praxis kaum verwendbar: Ein Problem ist, daß der Algorithmus nicht deterministisch, sondern nur stochastisch ist, das gefundene Ergebnis ist damit nur mit einer bestimmten Wahrscheinlichkeit korrekt. Ein weiteres Problem ist, daß die Implementierung des Algorithmus nicht effizient (Laufzeit-optimal) ist, dadurch wird die Berechnung langsam. Es wird dargelegt, daß das verwendete Verfahren zur Lösung NP-vollständiger Probleme (einer Klasse von Problemen, für die nur deterministische Lösungsalgorithmen mit exponentieller Laufzeit bekannt sind und von der vermutet wird, daß es keine effizienten deterministischen Lösungsalgorithmen gibt) besonders gut geeignet sei, weil der Algorithmus aufgrund der Parallelität der ausgeführten Operationen nur lineare Laufzeit benötige. Diese Argumentation ist jedoch insofern fehlerhaft, als die lineare Laufzeit durch eine exponentielle Anzahl von Molekülen kompensiert wird. Die exponentielle Problemgröße bleibt also unverändert bestehen.
Insgesamt ist das in der WO 97/07 440 beschriebene Verfahren zu sehr eingeschränkt, um für molekulare Informationsverarbeitung über den beschriebenen Algorithmus hinaus verwendbar zu sein: Das Hamiltonian-Pfad-Problem ist fest kodiert, andere Algorithmen können damit nicht berechnet werden, jede Probleminstanz muß neu kodiert werden. Programmierung ist nicht vorgesehen, alle Schritte des Algorithmus werden von Hand ausgeführt. Ein Input- /Output-System ist nicht vorgesehen. Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung eines Computers nicht geeignet. Die WO 97/29 117 und [Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA Add, Science, 273, 220-223, (1996)] beschreiben ein Verfahren, Additionen mit Hilfe von DNA Molekülen auszuführen. Die Addition erfolgt als Schiebeoperation mit Überlauf-Übertrag in vitro mit DNA Molekülen und Primer-Elongation.
Das beschriebene Verfahren beschreibt ausschließlich Additionen. Jedoch ist selbst die Verwendung als Addierer aus mindestens zwei Gründen ungünstig: Zum einen ist Addition mit dem beschriebenen Verfahren nicht effizient (Laufzeit-optimal) implementiert. Zum anderen ist das verwendete System formal unvollständig, weil die durch Addition erzeugten Ergebnisse ihrerseits nicht mehr als Zahlen für Berechnungen verwendet werden können. Über die Addition hinausgehende Konzepte fehlen. Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung eines Computers nicht geeignet.
In [Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal Clique Problem, Science, 278, 446-449, (1997)] wird ein Verfahren beschrieben, einen Algorithmus zur Lösung des "Max-Clique-Problem"s zu implementieren. Der Algorithmus stammt aus der Graphentheorie und fällt unter die NP-vollständigen Probleme. Wie in [L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)] ist das Verfahren nur in der Lage, einen fest kodierten Lösungsalgorithmus zu berechnen. Auch hier wird das Ergebnis nur mit einer bestimmten Wahrscheinlichkeit erhalten. Das von den Autoren beschriebene Verfahren enthält keine weiterführenden Konzepte (etwa in Hinsicht der Implementierung auch anderer Algorithmen). Insgesamt ist das Verfahren zur Programmierung von Algorithmen oder zur Implementierung eines Computers nicht geeignet.
In [Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self­ assembly of DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting on DNA Based Computers, Princeton University, June 20-12, (1996)] wird erörtert, reguläre Grammatiken in DNA durch Verknüpfung von Oligonukleotiden mit "sticky ends" zu implementieren. Die Ausführungen sind jedoch rein theoretischer Natur und scheitern an wesentlichen, bisher ungelösten Problemen. Insbesondere wird nicht dargelegt, wie die zur Implementierung von Grammatiken benötigten Sequenzen konstruiert werden müssen. Gerade dies ist aber das entscheidende Problem, ohne dessen Lösung Grammatiken nicht implementiert werden können. Der Grund dafür liegt darin, daß die Sequenzen, die die Variablen und Terminale einer Grammatik repräsentieren, sowohl eindeutig, als auch untereinander hinreichend unähnlich sein müssen. Außerdem müssen sie bestimmte strukturelle, chemische und physikalische Eigenschaften erfüllen. Andernfalls sind Fehlhybridisierungen zwischen Sequenzen zwangsläufig, die bei der Polymerisierung zu ungewollten Kettenverlängerungen und Kettenabbrüchen führen und damit das Funktionieren des Verfahrens unmöglich machen. Dieses Problem verschärft sich mit der Anzahl der benötigten Sequenzen exponentiell.
Das beschriebene Verfahren wird von den Autoren selbst wieder verworfen, bzw. insofern als unzureichend bezeichnet, als es keine sonderlich interessanten Berechnungen erlaube (Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self-assembly of DNA: Some Theory and Experiments, Proceedinsrs of the 2nd DIMACS Meeting on DNA Based Computers, Princeton University, June 20-12, (1996), S. 8, 2. Absatz, 1. Zeile). Weiterführende Experimente der Autoren stützen sich entsprechend auch nicht weiter auf reguläre Grammatiken und lineare Polymere, sondern auf kontextsensitive Grammatiken zur Erzeugung von DNA Gitterstrukturen [Erik Winfree, Furong Liu, Lisa A. Wenzler & Nadrian C. Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, (1998)]. Der von den Autoren beschriebene Ansatz ist womöglich zur Erzeugung DNA­ basierter Nanostrukturen (Herstellung von Katalysatoren usw.) geeignet. Zur Informationsverarbeitung eignet er sich hingegen nicht, hier sind die erzeugten Gitterstrukturen eher hinderlich.
Zwar sprechen die Autoren von der Möglichkeit, das mathematische Konzept der "Wang tiles" durch die erzeugten Gitterstrukturen zu realisieren und damit potentiell auch für Berechnungen zu verwenden, sie bleiben aber bei der bloßen Erwähnung einer solchen Möglichkeit, ohne zu beschreiben, wie dies im Sinne einer Informationsverarbeitung genutzt werden kann.
Es ist überhaupt zweifelhaft, ob der von den Autoren beschriebene Ansatz überhaupt zu einer Informationsverarbeitung geeignet ist: Die Gitterstrukturen verhindern die Vervielfältigung informationstragender Sequenzen (z. B. durch Klonierung oder PCR = Polymerase Chain Reaction = Polymerase Kettenreaktion) und machen es unmöglich, die erzeugten Strukturen als Daten zu verwenden, weil diese nicht mehr, etwa durch PCR, ausgelesen werden können. Entsprechend sieht der gewählte Ansatz in der jetzigen Form konzeptionell gar keine Möglichkeit vor, die erzeugten Strukturen im Sinne einer Informationsverarbeitung, etwa als Daten, zu nutzen.
Aus dem Stand der Technik ist bisher kein Verfahren bekannt, das es erlaubt, DNA Moleküle für die Implementierung effizienter Algorithmen zu verwenden. Es ist kein Verfahren bekannt, Berechnungen automatisch (etwa in Art eines molekularen Computers) durchzuführen. Es ist auch kein Verfahren bekannt, Programme in Form von regulären Grammatiken mit molekularen Verfahren so zu implementieren, daß damit
  • a) unterschiedliche (im Idealfall beliebige) reguläre Grammatiken implementiert werden können
  • b) die mit regulären Grammatiken erzeugten Wörter einer Sprache ausgelesen werden können
  • c) die mit regulären Grammatiken erzeugten Wörter einer Sprache für technische Zwecke (z. B. Informationsverarbeitung, Polymerchemie) weiterverwendet werden können.
Der vorliegenden Erfindung liegt daher die Aufgabe zugrunde, ein Verfahren bereitzustellen, das es erlaubt, Informationsverarbeitung auf molekularer Basis mithilfe regulärer Grammatiken vorzunehmen, ohne dabei auf eine oder wenige Grammatiken eingeschränkt zu sein. Das Verfahren soll kompatibel zu herkömmlichen Computern sein und eine Informationsverarbeitung erlauben, die teilweise auf molekularer Basis und teilweise auf der Basis herkömmlicher Computer stattfindet. Das Verfahren soll programmierbar und weitgehend automatisierbar sein. Die innerhalb des Verfahrens erzeugten Polymere sollen lesbar und für weiterführende Anwendungen und Verfahren verwendbar sein.
Diese Aufgabe wird gelöst durch ein Verfahren zur Herstellung informationstragender Polymere, das umfaßt,
  • A) eine reguläre Grammatik G = (Σ, V, R, S) mit einem endlichen Terminalalphabet Σ, einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S zu definieren;
  • B) das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von Monomersequenzen (Oligo- oder Polymere);
  • C) mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, indem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer Grammatik G eindeutig darstellen;
  • D) aus den in Schritt III hergestellten Monomersequenzen für jede Regel der Regelmenge R von G ein die Regel repräsentierendes Oligomer (Algomer) zusammenzusetzen (Algomer-Assemblierung);
  • E) die in Schritt IV zusammengesetzten Oligomere (Algomere) zu informationstragenden Polymeren zu verknüpfen (Symbolpolymerisation).
Im Rahmen der vorliegenden Erfindung werden folgende Definitionen und Abkürzungen verwendet:
Algomer: Doppelsträngiges Oligomer, das eine Regel einer gegebenen Grammatik repräsentiert. Algomere können miteinander zu Logomeren verknüpft werden.
Auslese-PCR: PCR, die zum Auslesen der in Logomeren enthaltenen Information verwendet wird.
Bitpolymerisation: Prozeß des Verkettens von Algomeren zu Logomeren, wenn es nur zwei verschiedene Elongatoren gibt.
Elongator: Algomer mit zwei Überhangsequenzen; kann mit Terminator oder Elongator ligieren und führt zu einer Kettenverlängerung.
Grammatik: Formalismus, der Sprachen beschreibt. Er basiert auf der formalen Theorie von Sprachen [Chomsky, N., Three models for the description of language, JACM, 2 : 3, 113-124, (1956)], [Chomsky, N., On certain formal properties of grammars, lnf. and Control, 2 : 2, 137-167, (1959)], [Chomsky, N., Formal properties of grammars, Handbook of Math. Psych., 2, 323-418, (1963)].
Eine Grammatik G beschreibt eine Sprache L (G), das Alphabet dieser Sprache und deren Syntax. Nach einer Grammatik G können alle Wörter dieser Sprache erzeugt werden.
Eine Grammatik G ist ein Quadrupel (Σ, V, R, S) mit Terminalalphabet Z, Variablenmenge V, Startsymbol S und Regelmenge R.
Logomer: Polymer, das symbolische Informationen trägt und durch die Verkettung von Algomeren erzeugt wurde. Entsprechend besteht ein Logomer aus sich wiederholenden Einheiten von Algomeren. Ein Logomer repräsentiert ein Wort einer Sprache L (G), die von der entsprechenden Grammatik G erzeugt wird.
Monomer: Einzelmolekül. Mehrere Monomere können zu längeren Ketten verknüpft werden und so Oligomere und Polymere bilden.
Monomere sind im Fall von Desoxyribonukleinsäure die Nukleotide (Adenin, Cytosin, Guanin, Thymin wie auch sog. Basenanaloga wie Hypoxanthin etc.).
Oligomer: Kurzkettiges Molekül aus sich wiederholenden Einheiten (Monomeren). Auch kurze doppelsträngige Moleküle werden als Oligomere bezeichnet.
PCR: Polymerase Chain Reaction = Polymerase Kettenreaktion; Verfahren zur exponentiellen Vervielfältigung von DNA.
Die PCR benötigt ein DNA Template, das vervielfältigt wird, und zwei Primer, die jeweils gegenläufig im Template ansetzen und als Startpunkte einer DNA Polymerisation fungieren. Durch iterative Wiederholung von Schmelzen-Hybridisierung-Polymerisations-Zyklen wird das DNA Template vervielfältigt.
Polymer: Langkettiges Molekül aus sich wiederholenden Einheiten (Monomeren).
Regel: auch: Produktionsregel, Ersetzungsregel oder Ableitungsregel.
Beschreibt die Ersetzung von Symbolen durch andere. Durch die wiederholte Anwendung von Regeln können Symbolketten erzeugt werden.
Sequenz: Informatik: Abfolge von Zeichen;
Chemie: Abfolge kovalent verbundener Monomere;
Molekularbiologie: Abfolge kovalent verbundener Nukleotide.
Komplementarität: Zwei Sequenzen sind dann komplementär, wenn sie miteinander hybridisieren können. Im Falle von DNA sind z. B. die Sequenzen 5'attt3' und 5'aaat3' komplementär, die Sequenz 5'acgt3' ist zu sich selbst komplementär.
Startsymbol: Variable innerhalb einer Grammatik, von der ausgehend, durch Anwendung der Regeln der Grammatik, eine Symbolkette erzeugt werden kann.
Symbolpolymerisation: Prozeß des Verkettens von Algomeren zu Logomeren.
Terminal: Symbol einer Grammatik. Ein Terminal kann nicht weiter ersetzt (substituiert) werden. Terminale sind die "Buchstaben" der Worte einer Sprache L (G).
Terminator: Algomer mit einer Überhangsequenz. Kann nur mit Elongator ligieren. Führt zum Kettenabbruch bei einer Symbolpolymerisation.
Variable: Symbol einer Grammatik. Eine Variable kann gemäß der Regel einer Grammatik von Terminalen, Variablen oder Kombinationen von Terminalen und Variablen ersetzt werden.
Kurzbeschreibung der Abbildungen
Abb. 1: Algomere, wie in der Erläuterung zu Schritt IV des erfindungsgemäßen Verfahrens beschrieben. Die Algomere besitzen jeweils eine doppelsträngige Kernsequenz, die ein Terminal einer gegebenen Grammatik darstellt und mindestens eine einzelsträngige Überhangsequenz, die eine Variable der gegebenen Grammatik darstellt, so daß jeweils ein Algomer genau eine Regel der gegebenen Grammatik repräsentiert. X und Y sind keine Variablen, sondern Überhangsequenzen, die z. B. für eine Klonierung benutzt werden können. Mit Überstrichen dargestellte Buchstaben kennzeichnen Komplementarität. Gemäß der Definition sind A0A und A1A Elongatoren, XsA und AeY Terminatoren. Die hier dargestellten Algomere repräsentieren die im Folgenden beschriebenen Grammatik zur Erzeugung binärer Zufallszahlen.
Abb. 2: Symbolpolymerisation, wie in der Erläuterung zum erfindungsgemäßen Schritt V beschrieben. Algomere werden durch Verkettung (im Falle von DNA: Hybridisierung und Ligation) zu Logomeren verknüpft. Das Logomer Xs01010101eY beinhaltet eine terminierte Bitfolge, die durch die Überhänge X und Y in einer definierten Orientierung vervielfältigt werden kann.
Abb. 3: Muster, das die Symbolpolymerisation für binäre Zufallszahlen nach Gelelektrophorese und Färbung zeigt (Spuren 1-3). Aufgrund der zufälligen Länge der binären Zufallszahlen ergibt sich ein regelmäßiges Leitermuster. Spur 4 zeigt einen 50 bp Molekulargewichtsstandard (Gibco BRL, Life Technologies, Katalog Nr. 10416-014).
Abb. 4: Klonierung eines durch Symbolpolymerisation erhaltenen Logomers in einem Vektor, wie zu Vervielfältigung und Isolierung von Logomeren im Folgenden beschrieben.
Abb. 5: Schematische Darstellung eines Bandenmusters, das durch Auslesen eines binären Logomers durch PCR und nachfolgende Gelelektrophorese erhalten wird (im Folgenden beschrieben). Im gezeigten Beispiel haben die Algomere eine Länge von 30 bp (Überhangsequenzen nur ½ gerechnet). Bei bekannter Länge des Logomers reicht es, jeweils nur 0en oder nur 1en auszulesen. Beide Bits auszulesen dient der Kontrolle. Das Verfahren kann auch für mehrwertige Logomere (mehr als 2 Elongatoren) verwendet werden.
Abb. 6: Bandenmuster einer Gelelektrophorese nach PCR zum Auslesen von drei verschiedenen Logomeren. Die Logomere wurden nach der im Folgenden beschriebenen Grammatik für Zufallszahlen beliebiger Länge erhalten. Als Zufallszahlen von unten nach oben gelesen ist a = 262, b = 97, c = 329. M (Spur 5) ist ein 50 bp Molekulargewichtsstandard (Gibco BRL, Life Technologies, Katalog Nr. 10416-014).
Abb. 7: Schematische Darstellung des Auslesens von Logomeren durch Restriktionsverdau wie im Folgenden beschrieben. Die Elongatoren tragen Restriktionsschnittstellen, die derart asymmetrisch angeordnet sind, daß der Restriktionsverdau von Logomeren in einem eindeutigen Schnittmuster von Fragmenten resultiert. Das Schnittmuster entspricht Banden verschiedener Länge, und kann durch Gelelektrophorese sichtbar gemacht werden. R1 und R2 sind unterschiedliche Restriktionsenzyme, x und y bezeichnen die Länge der nach Restriktionsverdau erhaltenen Fragmente. Zweckmäßig ist z. B. ein Verhältnis x : y von 1 : 2.
Abb. 8: Bandenmuster, die durch Gelelektrophorese nach dem Auslesen von Logomeren durch Restriktionsverdau erhalten werden. Spur 7 und 8 enthalten Molekulargewichtsstandards (Spur 7: 50 pb Leiter, Gibco BRL, Life Technologies, Katalog Nr. 10416-014; Spur 8: 10 bp Leiter)
Abb. 9: Schematische Darstellung eines polymeren Datenspeichers auf der Basis von Algomeren und Symbolpolymerisation wie im Nachfolgenden beschrieben. Algomere können an Ankermoleküle (AM), die an einem festen Träger (C) gebunden ist, polymerisieren. Das Schreiben (W) erfolgt durch die wiederholte Abfolge (ReW) von Hybridisierungs-Ligations- Restriktionszyklen (Hyb, Lig, Res). Durch Denaturieren oder Restriktion (Den/Dig) können die erhaltenen Logomere abgetrennt und ausgelesen werden.
Abb. 10: Vereinfachte Darstellung der Bestandteile eines DNA Desktop Computers wie im Nachfolgenden beschrieben. Im Einzelnen sind:
A: Oligo-Synthesizer, B: Thermozykler, C: Reaktionskammern, D: Pipettiervorrichtung, E: Gel,
F: Scanner, G: Steuerungscomputer
Es kennzeichnen:
1: Zugabe von Oligonukleotiden, 2: Zugabe synthetisierter Oligomere in Reaktionskammern des Thermozyklers, 3: Zugabe von Lösungen und Molekülen, die zur Algomer-Assemblierung, Symbolpolymerisation, zur Isolierung von Logomeren und zum Auslesen benötigt werden.
Abb. 11: Verschlüsselung von Logomeren wie im Folgenden beschrieben. Sind die Terminatoren und die darin primenden Primer unbekannt, so ist das jeweilige Logomer verschlüsselt und kann nicht ausgelesen werden (A). Ist dagegen ein in einem Terminator primender Primer verfügbar oder die Sequenz eines Terminators bekannt, so kann das jeweilige Logomer gelesen werden (B).
Abb. 12: Y-förmiges Molekül, das als Terminator bei der asymmetrischen Verschlüsselung von Logomeren verwendet werden kann. Elongatoren können an das mit 2 markierte Ende angeknüpft werden, weitere, z. B. Y-förmige, Moleküle an die mit 1 und 3 bezeichneten Enden. Werden mehrere Y-förmige Moleküle miteinander verknüpft, so erhält man baumartige Strukturen.
Abb. 13: Logomer mit Terminatoren s und e, die als baumartige Strukturen realisiert sind.
Abb. 14: Mit einem Vektor V verknüpftes Logomer L mit baumartigen Terminatoren. Die Terminatoren sind so konstruiert, daß jeweils nur ein Ast des Terminators mit dem Vektor verknüpft werden kann.
Abb. 15: Markierung von Nukleinsäuren mit Logomeren wie im Nachfolgenden beschrieben: Um gentechnisch hergestellte oder veränderte Produkte zu markieren, wird ein Logomer mithilfe rekombinativer Techniken in einen nicht-transkribierten Bereich, z. B. vor den Promotor (P) eines zu markierenden Genes (G), eingesetzt.
Abb. 16: Markierung von Dokumenten mit Logomeren wie im Nachfolgenden beschrieben. Spur 1 zeigt den verwendeten Molekulargewichtsstandard (50 bp, Gibco BRL, Life Technologies, Katalog Nr. 10416-014), Spur 2 (0-Bits) und Spur 3 (1-Bits) das Bandenmuster des Auslesens von Logomer Nr. 330 durch PCR aus wässriger Lösung, die Spuren 4 und 5 dasselbe wie die Spuren 2 und 3, wobei hierbei jedoch das Logomer Nr. 330 nicht aus wässriger Lösung, sondern in ca. 109 Molekülen/µl getrocknet auf Papier (3M Post- lt, 1 Stunde getrocknet) als Papierschnipsel (ca. 1 mm2) in die Auslese-PCR einging.
Abb. 17: Herstellung von Molekulargewichtsstandards durch Auslese-PCR, die ein unäres Logomer als Template enthält, wie im Nachfolgenden beschrieben. 1 zeigt die Anordnung verschachtelter Primer in der Auslese-PCR, 2 das nach Gelelektrophorese der PCR-Fragmente erhaltene Bandenmuster.
Abb. 18: Verkleben von Flächen mit Nukleinsäuren wie im Nachfolgenden beschrieben. C bezeichnet die zu verklebende Fläche, Log die Logomere, die zum Verkleben an die Flächen gebunden werden. 1 zeigt das Verhalten von Flächen mit nicht-komplementären, 2 das Verhalten von Flächen mit komplementären Logomeren.
Abb. 19: Verkleben von Flächen mit Logomeren, Antikörpern und Liganden wie im Nachfolgenden beschrieben: C0 und C1 bezeichnen die zu verklebenden Flächen, die aus gleichem oder unterschiedlichem Material bestehen können. Die zu verklebenden Flächen sind mit Logomeren (Log) versetzt. An die Logomere können Proteine, z. B. Antikörper vom Typ Ab A und Ab B binden, wobei Ab A und Ab B gleich oder verschieden sein können. Ab A und Ab B sind ihrerseits durch einen Liganden (Li) miteinander verbunden.
Abb. 20: Verkleben von Flächen mit Proteinen z. B. Antikörpern ohne Verwendung von Logomeren. C0 und C1 bezeichnen die zu verklebenden Flächen, die aus gleichem oder unterschiedlichem Material bestehen können. Die Proteine vom Typ Ab A und Ab B binden direkt an die zu verklebenden Flächen und sind ihrerseits durch einen Liganden (Li) miteinander verbunden.
Erläuterung zu I Wahl von Grammatiken
Eine Grammatik ist ein Quadrupel G = (Σ, V, R, S) mit einem endlichen Terminalalphabet Σ, einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S. Für eine Sprache L (G), die durch G beschrieben wird, können alle Wörter aus L als Wörter über dem Terminalalphabet Σ gebildet werden, indem man das Startsymbol S entsprechend den Regeln aus R ableitet.
Die Definition einer Grammatik G nach Schritt I des erfindungsgemäßen Verfahrens ist insofern frei, als beliebige, endliche Mengen von Terminalen und Variablen kodiert werden können. Erfindungsgemäß bevorzugt ist jedoch die Definition von Grammatiken, die die Binärdarstellung von Daten gestattet, insbesondere von Grammatiken mit
Σ: = {0, 1, s0, s1, s2, . . ., sn-1, sn, e0, e1, e2, . . ., em-1, em} mit n, m ∈ N und n, m ≧ 0.
Diese ermöglichen die Herstellung binärer Logomere.
Zur Veranschaulichung wird im Folgenden eine erfindungsgemäß definierte reguläre Grammatik zur Erzeugung von Zufallszahlen beliebiger endlicher Länge in Binärdarstellung gezeigt:
Es sei eine Grammatik G = (Z, V, R, S) mit Terminalalphabet Σ: = {0, 1, s, e}, Variablenmenge V: = {A}, Startsymbol S und Regelmenge) R: =
{
S: = sA
A → 0A
A → 1A
A → e
},
wobei
s: = Start
e: = Ende
sind.
Mit dieser Grammatik können Wörter über dem Terminalalphabet
Σ: = {0, 1, s, e}
gebildet werden. Alle Wörter der Sprache L beginnen mit "s" und hören mit "e" auf, dazwischen befindet sich eine zufällige Anzahl (auch 0) zufälliger Bits ("0" und "1"). Wörter aus der Sprache L, die nach R gebildet werden, sind beispielsweise:
  • a) S → sA → se
  • b) S → sA → s1A → s1e
  • c) S → sA → s0A → s00A → s001A → s0010A → s0010e
  • d) S → sA → s1A → s10A → s100A → s1000A → s10000A → s100000A → s100000e
Die als Wörter der Spache L erzeugten Binärmuster können als beliebige jedoch eindeutige Darstellung von Datentypen, z. B. als Buchstaben, Zahlen, alphanumerische Zeichen oder Zeichenketten gelesen werden. Liest man sie als die Binärdarstellung von Zahlen, so sind die obigen Wörter in Dezimaldarstellung:
  • a) ∅ (leer)
  • b) 1
  • c) 2
  • d) 32.
Erläuterung zu II Das NFR-Verfahren zur Herstellung von Monomersequenzen
Das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) ist ein Verfahren zur Herstellung von Monomersequenzen (Oligo- und Polymeren, z. B. Nukleinsäuren), das gewährleistet, daß die mithilfe des Verfahrens hergestellten Monomersequenzen:
  • a) eine eindeutige und einzigartige Abfolge von Monomeren haben;
  • b) zueinander möglichst unähnlich sind und daher möglichst keine Fehlhybridisierungen untereinander eingehen;
  • c) bestimmte strukturelle Eigenschaften aufweisen, z. B. ein bestimmtes Verhältnis der verschiedenen Monomere zueinander, das Enthaltensein oder Nicht-Enthaltensein bestimmter Teilsequenzen und eine maximale Übereinstimmung (Homologie) untereinander;
  • d) bestimmte chemische Eigenschaften aufweisen, z. B. das Vorkommen bestimmter chemisch aktiver Teilsequenzen, die Einfluß auf chemische Reaktionen, im Falle von Nukleinsäuren insbesondere die Wechselwirkung mit Proteinen haben (Proteinbindungsstellen, Restriktionsschnittstellen, Stopcodons);
  • e) bestimmte physikalische Eigenschaften aufweisen, z. B. eine bestimmte Schmelztemperatur.
Das NFR-Verfahren erlaubt die Herstellung eindeutiger, möglichst unähnlicher Monomersequenzen mit vordefinierbaren strukturellen, chemischen und physikalischen Eigenschaften. Es eignet sich zur Herstellung von Monomersequenzen für kontrollierte chemische Reaktionen, wie sie z. B. für eine molekularen Informationsverarbeitung benötigt werden. Es wird in Schritt III des erfindungsgemäßen Verfahrens für die Implementierung regulärer Grammatiken verwendet.
Das NFR-Verfahren ist eine erfindungsgemäße Fortbildung des Niehaus-Verfahrens zur Erzeugung eindeutiger, möglichst unähnlicher Sequenzen, das in [Jens Niehaus, DNA Computing: Bewertung und Simulation, Diplomarbeit am Fachbereich Informatik der Universität Dortmund, Lehrstuhl XI, 116-123, (1998)] beschrieben ist, und worauf hiermit in vollem Umfang Bezug genommen wird.
Das NFR-Verfahren ist insofern eine erfindungsgemäße Fortbildung des Niehaus-Verfahrens, als erst das NFR-Verfahren die Herstellung von Monomersequenzen erlaubt, wie sie für eine Herstellung in vitro, z. B. zur Implementierung von Grammatiken, benötigt werden. Die Gründe sind im Einzelnen:
  • a) Das Niehaus-Verfahren beschreibt nur die Konstruktion von Sequenzen aus Basissequenzen der Länge 6. Da die Länge von Basissequenzen die maximal zwischen verschiedenen Monomersequenzen möglichen Überlappungen beschreibt, daher unmittelbaren Einfluß auf das Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemäßen Schritte IV und V hat, muß das Verfahren jedoch für Basissequenzen beliebiger Länge verallgemeinert werden, was im NFR-Verfahren vorgenommen wurde.
  • b) Das Niehaus-Verfahren erlaubt nur die Erzeugung von Sequenzen gleicher Länge, wohingegen das NFR-Verfahren Sequenzen unterschiedlicher Länge und unterschiedlicher Anzahl erzeugen kann. Letzteres ist für ein korrektes Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemäßen Schritte IV und V unerläßlich.
  • c) Das Niehaus-Verfahren gewährleistet Eindeutigkeit und maximale Unähnlichkeit von Sequenzen nur für Sequenzen, die durch eine einmalige Anwendung des Verfahrens erzeugt wurden. Zwingend erforderlich ist jedoch, auch zu schon existierenden Sequenzen jeweils kompatible, d. h. eindeutige und maximal unähnliche Sequenzen erzeugen zu können. Das NFR-Verfahren kann im Gegensatz zum Niehaus-Verfahren zu beliebig vorgegebenen Sequenzen kompatible (d. h. eindeutige und maximal unähnliche) neue Sequenzen erzeugen. Dabei kann das Verfahren beliebig oft auf dieselbe Menge von Sequenzen angewendet werden.
  • d) Das Niehaus-Verfahren beschränkt zwar die maximale Länge gemeinsamer Teilsequenzen, jedoch nicht deren Anzahl. Daher können 2 beliebige nach dem Niehaus- Verfahren konstruierte Sequenzen mehrere gemeinsame Teilsequenzen beinhalten, was ungewollt zu einer hohen Homologie (Sequenzübereinstimmung) führen kann. Die Homolgie hat ihrerseits unmittelbaren Einfluß auf das Hybridisierungsverhalten von Sequenzen und das Funktionieren der erfindungsgemäßen Schritte IV und V. Das NFR- Verfahren dagegen führt bei der Konstruktion von Sequenzen auch einen Homologievergleich durch und vermeidet dadurch ungewollte Fehlhybridisierungen.
  • e) Das Niehaus-Verfahren erlaubt nicht die Integration bestimmter, vorgebbarer Sequenzen und Teilsequenzen. Solche Sequenzen sind jedoch für die Ausführung und Kontrolle bestimmter chemischer Reaktionen, z. B. kontrollierter enzymatischer Wechselwirkungen, zwingend notwendig. Beispiele für solche Sequenzen sind im Falle von Nukleinsäuren Proteinbindungsstellen, Restriktionsschnittstellen und Stopcodons. Dagegen erlaubt das NFR-Verfahren die Integration beliebiger Sequenzen und Teilsequenzen in die Herstellung von Monomersequenzen und gewährleistet gleichzeitig Eindeutigkeit und maximale Unähnlichkeit.
  • f) Das Niehaus-Verfahren sieht keine Möglichkeit vor, Sequenzen mit bestimmten strukturellen, chemischen oder physikalischen Eigenschaften zu erzeugen. Dagegen enthält das NFR-Verfahren die Möglichkeit, Sequenzen mit bestimmten strukturellen, chemischen und physikalischen Eigenschaften herzustellen. Dazu zählen u. a. das Verhältnis verschiedener Monomere zueinander und die Schmelztemperatur. Auch dies ist für die Implementierung von Grammatiken in vitro eine unbedingte Voraussetzung.
  • g) Das Niehaus-Verfahren erlaubt keine direkte Erzeugung regelrepräsentierender Sequenzen, wie sie zur Implementierung von Grammatiken benötigt werden. Dagegen ermöglicht das NFR-Verfahren die Erzeugung symbolrepräsentierender Sequenzen, die zu den für die Implementierung einer Grammatik benötigten regelrepräsentierenden Sequenzen verknüpft werden können.
  • h) Nur mithilfe des NFR-Verfahrens können Sequenzen auch so konstruiert werden, daß die Eigenschaften der Eindeutigkeit, maximalen Unähnlichkeit sowie strukturelle, chemische und physikalische Eigenschaften auch für Teilsequenzen gelten. Z. B. lassen sich im Falle von Nukleinsäuren Monomersequenzen so herstellen, daß sowohl die Gesamtsequenz, als auch z. B. das erste Drittel der Sequenz einen 50%igen GC-Anteil haben. Diese Eigenschaft ist z. B. für das Funktionieren der Verkettung von Sequenzen, die pro Molekül für mehrere Hybridisierungsereignisse vorgesehen sind (wie z. B. die im Folgenden beschriebenen Algomere), eine unbedingte Voraussetzung. Nur so lassen sich z. B. Sequenzen so konstruieren, daß unterschiedliche Hybridisierungsereignisse pro Molekül gleichwahrscheinlich sind.
  • i) Nur das NFR-Verfahren erlaubt die unmittelbare, automatische Herstellung von Monomersequenzen, z. B. duch einen Oligonukleotidsynthesizer.
Zur Herstellung von Monomersequenzen werden diese durch das NFR-Verfahren konstruiert und synthetisiert. Zur Herstellung von n Monomersequenzen wird das NFR-Verfahren, wie im Folgenden beschrieben, durchgeführt, wobei zur Beschreibung des Verfahrens folgende Abkürzungen benutzt werden:
A: = Alphabet der Mächtigkeit a ∈ N;
Im Falle von DNA ist A: = {a, c, g, t} und a = 4.
Si: = Sequenz.
Folge von Elementen des Alphabets A, das einer Sequenz aus Monomeren entspricht.
Iseq: = Länge der pro Verfahrenszyklus zu konstruierenden Sequenzen.
Sseq: = Sequenz der Länge Iseq.
Sseq.k: = (k-1)-tes Monomer der Sequenz Sseq (k ∈ N k < = Iseq).
Ibas: = Länge der pro Verfahrenszyklus zur Konstruktion von Sequenzen verwendeten Basissequenzen.
Es gilt: 0 < Ibas < = Iseq.
Sbas: = Sequenz der Länge Ibas Basissequenz; Sequenzen der Länge Iseq werden aus Basissequenzen konstruiert.
Iov: = maximale Länge der Kette aufeinanderfolgender Monomere, die jeweils zwei durch das Verfahren erzeugte Sequenzen gemeinsam haben ("overlap").
Ibas - 1.
Iov/Iseq = Verhältnis von maximal erlaubter Sequenzwiederholung zu Sequenzgesamtlänge;
1. Maß für die Fehlhybridisierungswahrscheinlichkeit.
Ibas/Iseq = Verhältnis von Basissequenzlänge zu Sequenzgesamtlänge;
2. Maß für die Fehlhybridisierungswahrscheinlichkeit.
Mseq: = Menge von Sequenzen.
Mbas: = Menge aller Basissequenzen der Länge Ibas.
Mnobas: = Teilmenge der Menge von Basissequenzen der Länge Ibas, die durch Dekomposition aus Mseq erhalten würd.
|Mnobas|: = Mächtigkeit von Mnobas = Anzahl der Basissequenzen in Mnobas.
n: = Anzahl pro Verfahrenszyklus zu konstruierender Sequenzen.
ntot: = Anzahl insgesamt in allen Verfahrernszyklen hergestellter Sequenzen.
nmax: = maximale Anzahl pro Verfahrenszyklus konstruierbarer Sequenzen.
h: = Homologie. Ein Maß für die Übereinstimmung zwischen zwei Sequenzen.
Es gilt:0 < = h < = 1.
tm: = Schmelztemperatur. Für eine DNA-Sequenz wird die Schmelztemperatur nach dem Nearest Neighbour Verfahren (siehe Breslauer, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989) bestimmt:
tm = ΔH / (ΔS + R × In(C/4)) - 273,15°C
Dabei sind ΔH und ΔS Enthalpie und Entropie der DNA-Helix, R die molare Gaskonstante und C die Konzentraition der DNA-Sequenz.
Das Herstellungverfahren erfolgt als ein Abfolge beliebig, jedoch endlich vieler Verfahrensryklen, in denen ntot Sequenzen konstruiert werden, und einer nachfolgenden Synthese, in der alle ntot Sequenzen in vitro erzeugt werden.
Die maximale Anzahl nmax der pro Verfahrenszyklus konstruierbaren Sequenzen errechnet sich entsprechend den oben gegebenen Definitionen nach
nmax = (a, Ibas, Iseq): = ∟(½.((aIbas - (aIbas/2 - |Mnobas|))/(Iseq - Iov)┘.
D. h. es lassen sich maximal nmax Sequenzen der Länge Iseq aus Elementen eines Alphabetes A der Größe a (im Falle von DNA ist a:- 4) konstruieren, die in maximal Iov zusammenhängenden Ketten von Monomeren übereinstimmen. Die Anzahl der tatsächlich pro Verfahrenszyklus erhaltenen Sequenzen kann geringer sein, wenn diese bestimmte physikalische, chemische oder strukturelle Eigenschaften aufweisen sollen, oder wenn zusätzlich zu bereits vorhandenen Sequenzen weitere Sequenzen hergestellt werden.
Im Einzelnen sind folgende Verfahrensschritte nötig:
  • 1. Es werden ntot Sequenzen in z Verfahrenszyklen konstruiert und in einer Menge Mseq gesammelt. Man beginnt mit der leeren Sequenzmenge Mseq.
  • 2. Zur Sequenzmenge Mseq können einmalig, vor Beginn des Verfahrenszyklus, beliebige, jedoch eindeutige, Sequenzen hinzugefügt werden. Dies kann nützlich sein, um bestimmte Sequenzen hinzuzufügen, die aus Gründen der weiteren Anwendung in der Menge der hergestellten Monomersequenzen enthalten sein sollen. Es empfiehlt sich dabei, nicht zu viele und nicht zu lange Sequenzen hinzuzufügen, da das Verfahren für diese Sequenzen nicht dieselben Eigenschatten garantiert wie für die im Folgenden konstruierten Sequenzen.
  • 3. Beginn des Verfahrenszyklus: Es werden die strukturellen, chemischen und physikalischen Eigenschaften festgelegt, die die herzustellenden Sequenzen erfüllen müssen. Strukturelle Eigenschaften sind zumindest das Enthaltensein oder Nicht- Enthaltensein bestimmter Teilsequenzen (ggfs. auch die Positionen, an denen die Teilsequenzen in den zu erzeugenden Sequenzen enthalten oder nicht enthalten sein sollen) und das Verhältnis der Anzahl der verschiedenen Monomere zueinander (im Falle von DNA: Verhältnis GC/AT). Chemische Eigenschaften sind mindestens das Vorkommen bestimmter Teilsequenzen, die Einfluß auf die chemische Wechselwirkung mit eigenen oder anderen Substanzen haben (im Falle von DNA z. B. bestimmte Proteinbindungsstellen, Restriktionsschnittstellen wie z. B. 5'gatatc3' für EcoRV, die Stopcodons 5'tca3', 5'tta3', 5'cta3' usw.). Zu den festzulegenden physikalischen Eigenschaften zählt zumindest die Schmelztemperatur tm der herzustellenden Sequenzen.
  • 4. Es werden jetzt die Anzahl der pro Zyklus gewünschten Sequenzen n < = nmax, nach obiger Formel Iseq der zu konstruierenden Sequenzen und Ibas der zur Konstruktion benötigten Basissequenzen festgelegt. Iseq und Ibas werden nach der oben angegebenen Formel so gewählt, daß die gewünschte Anzahl n zu konstruierender Sequenzen erreicht werden kann. Da Ibas/Iseq proportional zur Fehlhybridisierungswahrscheinlichkeit ist, werden Ibas und Iseq so gewählt, daß das Verhältnis Ibas/Iseq möglichst gering ist (Werte unter 0,3 sind empfehlenswert) und Werte für Iseq gute Hybridisierungsbedingungen garantieren. Für DNA sind temperaturabhängig beliebige Werte für Iseq < 0 möglich.
  • 5. Es wird die Menge Mbas aller Sequenzen des Alphabetes A der Länge Ibas erzeugt. Die solcherart erzeugten Sequenzen werden als Basissequenzen bezeichnet. Es gibt dabei immer aIbas Basissequenzen. Diese Basissequenzen dienen der Konstruktion der herzustellenden Sequenzen. Jede Basissequenz bekommt einen Status "benutzt" oder "unbenutzt" zugewiesen. Es werden zunächst alle als unbenutzt markiert.
  • 6. Selbst-komplementäre Basissequenzen aus Mbas werden nun als benutzt markiert. Dabei gibt es genau aIbas/2 zu sich selbst komplementäre Basissequenzen.
  • 7. Sollten bereits Sequenzen in der Menge Mseq vorhanden sein, so können entweder dazu kompatible neue Sequenzen konstruiert werden oder die Sequenzen einer Teilmenge von Mseq kompatibel verlängert wenden. Dazu wird innerhalb eines Dekompositionsverfahrens aus den bereits vorhandenen Sequenzen aus Mseq eine Menge Mnobas aller Teilsequenzen der in Schritt 4 vorgegebenen Länge Ibas der Sequenzen aus Mseq gebildet:
    Setze Mnobas = {}.
    Jede Sequenz Sseq aus Mseq wird nun in (Iseq - Iov) Dekompositionsschritten zerlegt:
    Beginne mit i = 0 mit dem Dekompositionsschritt:
    Solange i < (Iseq - Iov):
    Bilde als neue Sequenz Sneu als Sequenz der Länge Ibas bestehend aus den Monomeren Sseg.i bis Sseq,i+Ibas: Sneu: = Sseq,i, . . ., Sseq.i+Ibas. Füge Sneu der Menge Mnobas hinzu.
    Setze i: = i + 1.
  • 8. Die auf diese Weise erhaltene Menge Mnobas ist definitionsgemäß eine Teilmenge von Mbas.
  • 9. Alle Basissequenzen der Menge Mbas, die auch in Mnobas vorkommen, werden als benutzt markiert, so daß für die Konstruktion von Sequenzen genau (aIbas - aIbas/2 - |Mnobas|) unbenutzte Basissequenzen übrig bleiben, aus denen nun maximal
    verschiedene neue Sequenzen konstruiert werden können, die untereinander und zu den bereits vorhandenen Sequenzen keine Basissequenzen bzw. deren Komplemente gemeinsam haben.
  • 10. Aus den Basissequenzen wird ein gerichteter Graph konstruiert, dessen Knoten bestimmte Basissequenzen repräsentieren: Der Graph enthält genau aIbas Knoten, von denen bereits (aIbas/2 + |Mnobas|) Knoten als benutzt markiert sind. Jeder Knoten ist mit einer Basissequenz Sb(i) assoziiert, die nicht zu sich selbst komplementär ist (im weiteren wird es keine Unterscheidung von Knoten und assoziierter Basissequenz geben). Es existiert eine Kante von Sb(i) nach Sb(k), wenn die Iov letzten Buchstaben von Sb(i) den Iov ersten Buchstaben von Sb(k) entsprechen, wenn also gilt:
    Sb(i),2, . . ., Sb(i),Ibas = Sb(k),1, . . ., Sb(k),Ibas-1. Der Knoten Sb~(k) wird Nachfolgeknoten von Sb(i) genannt. Der Knoten, der mit dem Komplement der Basissequenz assoziiert ist, die durch den Knoten Sb(i) kodiert wird, wird Komplementknoten zu Knoten Sb(i) genannt. Sequenzen der Länge Iseq werden gefunden, indem ein Pfad mit (Iseq - Iov) Knoten gesucht wird. Jeder Knoten darf maximal einmal benutzt werden. Außerdem darf für jeden Knoten, der in einem der Pfade liegt, der Komplementknoten in keinem Pfad vorkommen. Der Anfangsknoten des Pfades trägt wie die Sequenz einen Status "benutzt" bzw. "unbenutzt".
  • 11. Aus dem Graphen konstruiert man Sequenzen nach folgendem Verfahren:
    Kennzeichne alle unbenutzten Knoten des Graphen als unbenutzte Anfangsknoten. Für jedes s zwischen 1 und n:
    Solange Knoten Sb(k) existiert, der noch nicht als benutzter Anfangsknoten markiert ist:
    Wähle einen unbenutzten Knoten Sb(k) aus.
    Markiere Knoten Sb(k) als benutzten Anfangsknoten; außerdem:
    Markiere Sequenz Sb(k) und sein Komplement als benutzt.
    Nun wird eine neue Sequenz Sneu konstruiert, die neues Element für Mseq ist oder eine bestehenden Sequenz Ssub aus Mseq verlängert:
    Setze Sneu,o: = Sb(k),1.
    Falls sie als neue Sequenz konstruiert wird, setze i: = 0.
    Falls sie als Verlängerung einer bereits bestehenden Sequenz Ssub konstruiert wird, setze i: = Isub.
    Solange i < Iseq - (Iov-1) und i < = 0 gilt:
    Existiert kein unbenutzter Nachfolgeknoten Sb(m) von Knoten Sb(k), so markiere Knoten Sb(k) und dessen Komplementknoten als unbenutzt und setze i: = i-1.
    Sonst wähle per Zufall einen unbenutzten Nachfolgeknoten Sb(m) von Knoten Sb(k) aus und markiere bm und dessen Komplementknoten als benutzt. Setze zusätzlich: i: = i+1, k: = m, Sneu,i := Sb(m),1.
    Wenn i = Iseq - (Iov-1) ist, ist die Sequenz Sneu fertig: sie besteht aus den Buchstaben Sneu,0 bis Sneu,(Iseq - Iov).
  • 12. Zu jeder der in Schritt 10 erhaltenen Sequenzen werden die jeweiligen strukturellen, chemischen und physikalischen Eigenschaften im Vergleich zu den in Schritt 3 festgelegten Bedingungen ermittelt. Genügt die jeweilige Sequenz nicht den vorgegebenen Bedingungen, so wird sie gelöscht und die von ihr benutzten Knoten und Komplementknoten wieder als unbenutzt markiert.
  • 13. Wenn die Anzahl der konstruierten Sequenzen nicht ausreicht, kann der Verfahrenszyklus von Schritt 3 oder 4 an beliebig oft wiederholt werden. Insbesondere ist es möglich, die strukturellen, chemischen und physikalischen Kriterien und die Werte für n, Iseq, Ibas pro Verfahrenszyklus jeweils neu zu setzen. So ist es möglich, Sequenzen mit unterschiedlichen strukturellen, chemischen und physikalischen Eigenschaften, sowie unterschiedlicher Länge zu konstruieren, die trotzdem kompatibel, also eindeutig und maximal unähnlich sind. Ansonsten geht man zum nächsten Schritt, der in vitro Synthese.
  • 14. Die konstruierten Sequenzen werden in vitro, im Falle von Nukleinsäuren vorzugsweise mittels eines Oligonukleotidsynthezisers (z. B. ABI 392, ABI 398, ABI 3948 von Perkin- Elmer Applied Biosystems), synthetisiert. Dazu werden die Sequenzdaten der Steuerungseinheit des Oligonukleotidsynthesizers übermittelt und die Sequenzen als einzelsträngige Nukleinsäuren hergestellt. Die Sequenzen können auch kommerziell bestellt werden. Zweckmäßig sind PAGE-gereinigte Oligonukleotide (z. B. von ARK Scientific GmbH Biosystems, 64293 Darmstadt, erhältlich).
Erläuterung zu III Implementierung regulärer Grammatiken mit dem NFR-Verfahren
Die Herstellung von Monomersequenzen zur Darstellung der Regelmenge von Grammatiken in Schritt III des erfindungsgemäßen Verfahrens erfolgt mit Hilfe des NFR-Verfahrens (Niehaus-Feldkamp-Rauhe-Verfahren) nach Schritt II des erfindungsgemäßen Verfahrens. Zur Implementierung von Grammatiken werden nach dem NFR-Verfahren für r Regeln einer Grammatik G genau 2r Monomersequenzen hergestellt, so daß die Monomersequenzen für die s dargestellten Symbole (Terminale und Variaiblen) und die Regeln R der Grammatik G eindeutig und. zueinander möglichst unähnlich sind, sowie die geforderten strukturellen, chemischen und physikalischen Eigenschaften aufweisen.
Die Monomersequenzen werden dazu nach dem INFR-Verfahren so hergestellt, daß sie wie im Folgenden beschrieben zu Algomeren zusammengesetzt werden können. Es werden dabei jeweils 2 Monomersequenzen zu einem Algomer zusammengesetzt, das genau eine Regel R einer Grammatik G repräsentiert. Dabei enthalten beide Monomersequenzen jeweils Sequenzen, die die nach der Regel R erforderlichen zusammengehörenden Symbole (Terminale oder Variablen) enthalten.
Der Entwurf der Oligomere nach Schritt III des erfindungsgemäßen Verfahrens ist abhängig von der chemischen Natur der eingesetzten Monomere. Im bevorzugten Fall der aus Nukleotiden aufgebauten Oligomere wird folgendermaßen vorgegangen:
Algomere sind doppelsträngig und haben einen 5"-Strang (Oberstrang) und einen 3'-Strang (Unterstrang). Oberstrang und Unterstrang können die Verknüpfung jeweils einer Terminal- und einer Variablensequenz sein.
Es seien X, Z beliebige Variablen, S eine Variable, die als Startsymbol fungiert, y, z beliebige Terminalsymbole. Dann wird für jede Regel der Form:
  • a) S: = yX ein Algomer konstruiert, das eine eindeutige doppelsträngige Kernsequenz y enthält, an die am 3'-Ende eine eindeutige einzelsträngige Überhangsequenz X angehängt ist; ": =" bedeutet in diesem Fall, daß S und yX identisch sind, d. h. yX als Startermolekül fungiert.
  • b) X → yZ ein Algomer konstruiert, das eine eindeutige doppelsträngige Kernsequenz y enthält, an die am 5'-Ende eine eindeutige einzelsträngige Überhangsequenz X und am 3'-Ende eine eindeutige einzelsträngige Überhangsequenz Z angehängt ist. X kann dabei identisch mit Z sein.
  • c) X → z ein Algomer konstruiert, das eine eindeutige doppelsträngige Kernsequenz z enthält, an die am 5'-Ende eine eindeutige einzelsträngige Überhangsequenz X angehängt ist.
Algomere der Form S: = yX und X → z heißen Terminaforen ("Start", "Ende"), da sie zum Kettenabbruch während der Polymerisation im erfindungsgemäßen Verknüpfungsschritt V führen, der im Folgenden beschrieben wird; Algomere der Form X → yZ heißen Elongatoren, weil sie zu einer Kettenverlängerung während der Polymerisation im erfindungsgemäßen Verknüpfungsschritt V führen.
Vorzugsweise umfassen die in den Schritten II und III des erfindungsgemäßen Verfahrens hergestellten Monomersequenzen Nukleotide, insbesondere Ribonukleotide, besonders bevorzugt Desoxyribonukleotide. Die in Schritt II des erfindungsgemäßen Verfahrens konstruierten Monomersequenzen können vorteillhafterweise bestimmte Sequenzen, z. B. Stopcodons, Erkennungssequenzen für Nukleinsäuren spaltende Enzyme (Restriktionsnukleasen), Erkennungssequenzen für Nukleinsäure-bindende Proteine u. a. enthalten, wie sie beispielsweise in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)], [Rolf Knippers, Molekulare Genetik, Georg Thieme Verlag, (1997)] und [Benjamin Lewin, Genes V, Oxford University Press, (1994)] beschrieben werden.
Erläuterung zu IV Algomer-Assemblierung
Das Assemblieren der in Schritt III synthetisierten Sequenzen erfolgt in Schritt IV des erfindungsgemäßen Verfahrens. Im Rahmen der vorliegenden Erfindung sind zur Durchführung des Schrittes IV alle dem Fachmann bekannten Techniken, Oligomersequenzen zusammenzusetzen, einsetzbar. Im erfindungsgemäß bevorzugten Fall des Einsatzes von Nukleotidsequenzen ist es zweckmäßig folgendermaßen vorzugehen:
  • a) Die zu Elongatoren gehörenden einzelsträngigen Sequenzen werden phosphoryliert. Dazu sind verschiedene dem Fachmann bekannte Protokolle möglich, z. B. das Folgende:
    In einem 20 µl Ansatz werden 16 µl einer synthetisierten 100 µM Sequenz, 2 µl Ligationspuffer (z. B. 50 mM Tris-HCl pH 7.5, 10 mM MgCl2, 10 mM Dithiothreitol, 1 mM ATP, 25 µg/ml BSA Bovine Serum Albumin, New England Biolabs) und 2 µ1 PNK (Polynukleotidkinase, z. B. von New England Biolabs, Katalognr. #201 S oder #201 L) 1 Stunde bei 37°C inkubiert. Volumina, Inkubationszeit und -temperatur können in dem Fachmann bekannter Weise variiert werden.
  • b) Jeweils in einem Ansatz werden die zu einem Algomer gehörenden Einzelstränge (Ober- und Unterstrang) zu einem fertigen Algomer hybridisiert. Für Elongatoren können einfach die Phosphorylierungsansätze von Ober- und Unilerstrang verwendet werden. Für die Hybridisierung sind mehrere Protokolle möglich; bevorzugt ist ein Denaturierungsschrift bei etwa 95°C zu Anfang (dieser deaktiviert gleiclhzeitig die PNK in den Ansätzen der Elongatoren) und eine langsame Hybridisierung. Z. B. kann für Oligomere der Länge 30 folgendes Protokoll verwendet werden, das gemäß den Kenntnissen des Fachmanns variiert werden kann:
    In einem 40 µl Ansatz werden jeweils 20 µl des Oberstranges (100 µM) und 20 µl des Unterstranges (100 µM) in einem Thermozykler 5 Minuten auf 95°C erhitzt, 5 Minuten auf 72°C inkubiert und dann 25 Minuten jeweils 1°C pro Minute abgekühlt.
Erläuterung zu V Herstellung von Logomeren durch Verkettung von Algomeren Symbolpolymerisation
In Schritt V des erfindungsgemäßen Verfahrens werden die Algomere zu längerkettigen, informationstragenden Polymeren (Logomeren) verknüpft. Da Algomere die Regelmenge R einer Grammatik G darstellen, entsprechen alle dabei erzeugten Logomere Wörtern der Sprache L(G), die durch die Grammatik G beschrieben wird.
Der geregelte Prozeß der Verkettung von Algomeren zu Logomeren wird als "Symbolpolymerisation" bezeichnet, im Falle, daß die Terminalsymbole Bits repräsentieren, das heißt, im Falle, daß gilt:
Σ: = {0, 1, s0, s1, s2, . . .,sn-1, sn, e0, e1, e2, . . .,em-1, em} mit n,m ∈ e N und n, m < 0
wird der Prozeß als "Bitpolymerisation" bezeichnet.
Im Rahmen der vorliegenden Erfindung sind zur Durchführung des Schrittes V alle dem Fachmann bekannten Techniken, Oligomere zu Polymeren zu verknüpfen, einsetzbar. Im erfindungsgemäß bevorzugten Fall des Einsatzes von Oligonukleotiden ist es zweckmäßig, die zu verknüpfenden Algomere in Gegenwart von Ligase zu inkubieren. Beispielsweise kann nach folgendem Protokoll vorgegangen werden, das gemäß den Kenntnissen des Fachmanns variiert werden kann:
In einem 27 µl Ansatz werden 1 µl 50 µM "Start"-Algomer, 1 µl 50 µM "Ende"-Algomer und 2× jeweils 10 µl 40 µM Elongator-Algomere (aus Schritt IV des erfindungsgemäßen Verfahrens erhalten), 1,5 µl 10 mM rATP und 3,5 µl T4 DNA Ligase mit 400 NEB Units/µl (z. B. Katalognr. #202S und #202L NEB) zwischen 4°C und 25°C für 2 bis 24 Stunden inkubiert. Andere Reaktionsvolumina funktionieren analog. Inkubationszeit und -temperatur können in dem Fachmann bekannter Weise variiert werden.
Abb. 3 zeigt das Resultat einer solchen Symbolpolymerisation.
Es können dabei grundsätzlich beliebig viele Algomere, die keine Terminatoren sind, verknüpft werden. Der Polymerisationsvorgang kommt für jedes einzelne Logomer dann zu einem Stillstand, wenn das entsprechende Molekül an seinen Enden jeweils ein Algomer trägt, das als Terminatormolekül ("Start", "Ende") fungiert.
Vereinzelung und Vervielfältigung von Logomeren durch Klonierung
Ein weiterer Gegenstand der vorliegenden Erfindung ist ein Verfahren zur Isolierung und Vervielfältigung von informationstragenden Polymeren, die nach einem der vorhergehenden Ansprüche erhalten wurden, das dadurch gekennzeichnet ist, daß man in Schritt V erhaltene informationstragende Polymere in Klonierungsvektoren ligiert, kompetente Zellen mit diesen Vektoren transformiert und die erfolgreich transformierten Bakterien anhand von Selektionsmarkern selektioniert.
Die aus Schritt V des oben beschriebenen erfindungsgemäßen Verfahrens (Symbolpolymerisation) erhaltenen Logomere können zum Zwecke der Vereinzelung und Vervielfältigung kloniert werden.
Dazu wird der verwendete Klonierungsvektor mit Restriktionsenzymen aufgeschnitten und ein Logomer hineinligiert. Das Verfahren stellt sicher, daß nur fertig polymerisierte (mit Terminatoren versehene) Logomere mit dem Zielvektor ligiert werden können. Korrekt in den Zielvektor ligierte Logomere bilden ein wieder ringförmiges Molekül. Die Vereinzelung von Logomeren erfolgt durch die Transformation von Bakterien mit dem Molekülgemisch, das das Resultat der Ligation ist. Die Vektoren tragen Selektionsmarker (vorzugsweise Antibiotika- Resistenz z. B. Ampicillin-Resistenz), mit denen erfolgreich transformierte Bakterien ausgewählt werden können. Da jedes Bakterium nur ein Plasmid exprimiert, ist jedes erfolgreich transformierte Bakterium Träger genau eines Logomers. Solcherart klonierte Logomere können dann zur weiteren Verwendung einfach und in großen Mengen (auf Fest- oder in Flüssigmedium, Fermentern) vervielfältigt werden.
Die aus Schritt V des erfindungsgemäßen Verfalhrens erhaltenen Logomere werden zum Zwecke der Vereinzelung und Vervielfältigung in einem beliebigen Klonierungsvektor (Plasmid) kloniert, der Restriktionsschnittstellen trägt, die zu den Sequenzüberhängen der Terminatoren der Logomere kompatibel sind (z. B. HindIII, BamHI Erkennungssequenzen im Klonierungsvektor pBluescript II KS +/-, Stratagene, Katalog Nr. #212207). Die Klonierung erfolgt nach üblichen Laborprotokollen, wie z. B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben. Z. B. kann folgendes Protokoll verwendet werden, das gemäß den Kenntnissen des Fachmanns variiert werden kann:
a) Restriktion und Präparation des Klonierungsvektors
Zur Klonierung können beliebige Klonierungsvektoren verwendet werden, wie sie für molekularbiologische Verfahren üblich sind. (Geeignet ist z. B. das Plasmid pBluescript II KS +/-, Stratagene, Katalog Nr. #212207). Das Plasmid wird einem Restriktionsverdau mit zwei Restriktionsenzymen unterworfen, die Überhänge erzeugen, die zu den Terminatoren der Logomere kompatibel sind. Als Restriktionsenzyme können z. B. BamHI und HindIII (z. B. von NEB, New England Biolabs, Katalog Nr.: #136S und #104S) verwendet werden. Dazu kann ein übliches Restriktionsprotokoll verwendet werden, das gemäß den Kenntnissen des Fachmanns variiert werden kann, z. B. das Folgende:
In einem 50 µl Ansatz werden 30 µl Plasmid (0,7 µg/µl), 5 µl 10× Puffer (z. B. NEB2, New England Biolabs), 5 µl BamHI (100 units), 5 µl HindIII (100 units) und Spl BSA 10× für 1-2 Stunden bei 37°C inkubiert. Zur Kontrolle wird 1 µl des Ansatzes, sowie eine entsprechende Menge ungeschnittenes Plasmid auf einem 1% Agarose Gel (z. B. UItraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027) elektrophoretisch aufgetrennt. Zur Präparation der DNA wird der Restriktionsansatz phenolisiert, die DNA gefällt und wiederaufgenommen:
  • - Ansatz auf 200 µl mit Aqua dest. auffüllen
  • - 200 µl Phenol zugeben, vortexen, bei 10000 g 3 Minuten zentrifugieren
  • - Überstand aufnehmen und 200 µl Chloroform zugeben, vortexen, bei 10000 g 3 Minuten zentrifugieren
  • - Überstand aufnehmen, mit 1/10 Vol. 3M NaAc ansäuern und mit 2,5× Volumen 100% EtOH versetzen, vortexen, für mindestens 15 Minuten auf -70°C
  • - mindestens 15 Minuten auf 10000 g zentrifugieren, Überstand abnehmen und verwerfen
  • - mit ca. 500 µl 70% EtOH waschen, für 5-10 Minuten auf 10000 g zentrifugieren, Überstand abnehmen und verwerfen
  • - Pellet trocknen und in Aqua dest. wiederaufnehmen, so daß das geschnittene Plasmid mit 100 ng/µl bis 1 µg/µl vorliegt (höhere Konzentrationen sind auch möglich). Plasmid kann für weitere Ligationen nötigenfalls verdünnt werden.
b) Ligation des Logomers in den Klonierungsvektor
Die in Schritt V des erfindungsgemäßen Verfahrens erhaltenen Logomere und die präparierten Klonierungsvektoren werden ligiert. Durch die Art und Weise der Präparation ist gewährleistet, daß möglichst nur die gewünschten Ligationen stattfinden: Die Terminatoren der Logomere tragen zwei verschiedene Überhangsequenzen, die zu den durch Restriktion entstandenen Überhangsequenzen des Klonierungsvektors kompatibel sind. Dadurch können die Logomere nur in einer definierten Richtung in clen Klonierungsvektor ligieren. Außerdem sind die Terminatoren der Logomere nicht phosphoryliert, weshalb Logomere ausschließlich mit den Überhangsequenzen des Klonierungsvektors ligieren können. Die Ligation erfolgt nach einem üblichen Ligationsprotokoll wie z. B. in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben, das gemäß den Kenntnissen des Fachmanns variiert werden kann, beispielsweise wie folgt:
Das molare Verhältnis Logomere/Klonierungsvektor kann z. B. 500 betragen, in 10 µl Gesamtvolumen werden:
1 µl Plasmid (10 ng/µl = 5 nM)
0,5 µl 4 µM Logomere aus Schritt V des erfindungsgemäßen Verfahrens
1 µl 10× Ligationspuffer
0,5 µl T4 DNA Ligase (400 u/µl)
7 µl H2O
für 12 Stunden auf 16°C ligiert.
Das Protokoll kann gemäß den Kenntnissen des Fachmanns variiert werden. Z. B. ist es möglich, ein Protokoll zur TCL (Temperature Cycle Ligation, [Lund, A. H., Duch, M., Pedersen, F. S. Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: (4), 800-801, (1996)]) zu verwenden.
Der erhaltene Ligationsansatz wird nun für die Transformation kompetenter Zellen verwendet, wie nachfolgend beispielhaft gezeigt:
c) Transformation kompetenter Zellen
Die Transformation von Bakterien (kompetente Zelllen, Hoststamm z. B. dH5α, GIBCO BRL, Katalog Nr.: 18258-012) mit dem Ligationsansatz aus b) erfolgt nach einem der üblichen Protokolle, wie z. B. in [J. Sambrook, E. F, Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben wird und das gemäß den Kenntnissen des Fachmanns variiert werden kann, z. B. wie folgt:
  • - 200 µl kompetenter Zellen (∿ 5×107 CFU = Colony Forming Units, bei -70°C gelagert) werden aufgetaut und auf Eis gestellt
  • - Etwa 1 ng des Ligationsansatzes aus b) wird dazu pipettiert und 20-30 Minuten auf Eis stehen gelassen, alle 5 Minuten vorsichtig mixen
  • - Hitzeschock: Ansatz 2 Minuten auf 42°C, zurück auf Eis
  • - 0,8 ml LB-Medium (+ 0,02 M MgSO4 + 0,01 M KCl) zugeben
  • - Ansatz 20-60 Minuten im Reagenzglas auf 37°C rollen
  • - 0,1-1 ml auf Agarplatte (mit Antibiotikum, z. B. Ampicillin) ausplattieren und über Nacht auf 37°C
Die Transformation fungiert dabei als Selektionsverfahren auf erfolgreich klonierte Logomere und als Isolationsverfahren einzelner Logomere, weil jede Bakterienzelle genau ein Plasmid exprimiert.
Außer dem genannten Verfahren der Klonierung, das erfindungsgemäß bevorzugt ist, können die in Schritt V des erfindungsgemäßen Verfahrens erhaltenen informationstragenden Polymere (Logomere) mit folgenden Verfahren isoliert und vervielfältigt werden:
Isolation durch Hybridisierung und chromatographische Methoden
Hierbei wird das aus einer Symbolpolymerisation erhaltene Molekülgemisch über ein Trägermaterial gegeben, an das Oligomere ("Ankersequenzen") gebunden sind, die ihrerseits an die Terminatoren der Logomere binden können. Die gebundenen Logomere werden dann einzeln aufgenommen und können nach Bedarf vervielfältigt werden. Es sind hierzu verschiedene Verfahren einsetzbar:
  • a) Affinitätschromatographie; dabei werden Ankersequenzen, die zu den überhängenden Enden der Terminatoren kompatible Enden besitzen, z. B. an eine Hydroxylapatit-Säule gebunden. Die aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen Logomere werden über die Säule gegeben, wodurch die Logomere durch Hybridisierung an die Ankersequenzen binden können. Die solcherart gebundenen Logomere werden dann einzeln aufgenommen.
  • b) Ankersequenzen werden an eine Membran (z. B. Gene Screen Plus, DuPont, Biotechnology Systems; Hybond-N, Amersharn Life Sciences) kovalent gebunden. Die Membran ist gerastert, d. h. in einzelne Felder unterteilt. Pro Feld wird genau eine Ankersequenz kovalent an die Membran gebunden. Danach werden die aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen Logomere über die Membran gegeben und mit den Ankersequenzen hybridisiert. Die Membran wird daraufhin in die einzelnen Felder des Rasters zerschnitten. Die einzelnen Felder, die nun maximal ein an die jeweilige Ankersequenz gebundenes Logomer enthalten, können jetzt in separate Gefäße (z. B. Eppendorf Tubes) überführt werden. Sodann Ikönnen die Logomere durch Denaturieren von der Membran getrennt werden. Beim Denaturieren ist zu beachten, daß die Denaturierungstemperatur so gewählt ist, daß sie hoch genug ist, um Logomer und Ankersequenz zu trennen, jedoch nicht so hoch, daß das Logomer selbst vollständig aufschmilzt.
Isolation durch Verdünnung
Bei der Isolation durch Verdünnung werden die Logomere, die als Gemisch aus einer Symbolpolymerisation erhalten werden, soweit verdünnt, daß in einem jeweiligen Zielvolumen statistisch genau ein Molekül enthalten ist. Dieses kann dann mit Hilfe der PCR aufgespürt und vervielfältigt werden. Die Verdünnung des Ausgangsvolumens in Zielvolumina kann dabei gleichzeitig geschehen, so daß ein Ausgangsvolumen auf n Zielvolumina verdünnt wird. Dazu wird erfindungsgemäß wie folgt vorgegangen:
Zu einem, aus Schritt V des erfindungsgemäßen Verfahrens erhaltenen, Gemisch von Logomeren in einem Ausgangsvolumen Va wird ein Verdünnungsfaktor ermittelt, der n in Va enthaltene Logomere so auf n Zielvolumina Vz verdünnt, daß in jedem Zielvolumen Vz statistisch genau ein Logomer enthalten ist. Um den Verdünnungsfaktor zu ermitteln wird ein Aliquot des Ausgangsvolumens (z. B. 1 µl) in einer Verdünnungsreihe austitriert. Von jeder Verdünnung der Reihe wird dann ein Aliquot (z. B. 1 µl) als Template einer PCR-Reaktion verwendet, um zu ermitteln, in welchen Verdünnungen noch Logomere detektierbar sind. Erhält man solcherart die letzte Verdünnung, die noch Logomere enthält, und die Verdünnung, die schon keine mehr enthält, läßt sich ein ungefährer Verdünnungsfaktor angeben, der gerade noch ungefähr ein Logomer enthält. Gegebenenfalls kann dieser Verdünnungsfaktor durch Austitrieren der letzten Verdünnung, die noch Logomere enthält, genauer bestimmt werden. Dabei verwendet man entsprechend kleinere Verdünnungsschritte (verdünnt man z. B. in der ersten Verdünnungsreihe immer 1 : 10, so kann man in der 2. Verdünnungsreihe z. B. 1 : 2 verdünnen; das Verfahren der genaueren Bestimmung des Verdünnungsfaktors kann dabei prinzipiell mit beliebiger Genauigkeit angewendet werden).
Da die PCR der Verdünnungen dazu dient, festzustellen, ob sich überhaupt noch Logomere in der Verdünnung befinden, kann die PCR auf mindestens zweierlei Weise durchgeführt werden:
  • a) Als Primer dienen zwei gegenläufige, in den Terminatoren primende Primer, z. B. der 5'- Strang des Start-Terminators und der 3-Strancfdes Ende-Terminators. Ansonsten sind die PCR-Bedingungen wie weiter unten unter Vervielfältigung von Logomeren durch PCR beschrieben.
  • b) Die PCR wird wie die zum Auslesen der Logomere durchgeführt, es reicht jedoch ein Ansatz mit einem Paar von Primern wie unter Auslesen von Logomeren mittels PCR im Folgenden beschrieben.
Zur Kontrolle werden die durch PCR erhaltenen DNA Fragmente durch Gelelektrophorese sichtbar gemacht. Dazu wird z. B. ein 2-4%iges Agarose-Gel (z. B. UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027) und als Molekulargewichtsstandard z. B. eine 50 bp-Leiter (Gibco BRL, Life Technologies, Katalog INr. 10416-014) verwendet. Das erhaltene Gel wird 5 Minuten in 0,001% Ethidiumbromid gefärbt und unter UV sichtbar gemacht.
Vervielfältigung von Logomeren
Die aus einer Symbolpolymerisation erhaltenen Logomere können - je nach ihrer beabsichtigten Verwendung - vervielfältigt werden. Dies ist beispielsweise für die Visualisierung der gespeicherten Information oder die Weiterverwendung der Logomere als Marker zur Kennzeichnung von Stoffen und Gegenständen nötig.
Vervielfältigung von Logomeren durch PCR
Bei diesem Verfahren werden Logomere durch FCR vervielfältigt. Das zu vervielfältigende Logomer dient als Template, die benötigten Primer primen jeweils gegenläufig in den Terminatoren (entweder 5'-Start und 3'-Ende, oder 5'-Ende und 3-Start), so daß das Logomer vollständig vervielfältigt wird. Alternativ können die Primer, sofern das zu vervielfältigende Logomer von weiterer DNA umgeben ist, auch weiter außerhalb des Logomers primen.
Für die PCR-Ansätze, die in dem Fachmann bekannter Weise variiert werden können, werden z. B. folgende Reagentien und Bedingungen verwendet:
dNTPs (z. B. Pharmacia Biotech, Katalog Nr.: 27-2035-01/2/3), Taq-Polymerase (z. B. Gibco- BRL, Katalog Nr.: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCl2 (z. B. GIBCO- BRL, Katalog Nr.: 18067-017)
Als PCR-Programm kann beispielsweise folgendes Protokoll (Primer: 30-mere) verwendet werden:
Ein weiterer Gegenstand der Erfindung sind informationstragende Polymere, die gemäß den oben beschriebenen erfindungsgemäßen Verfahren erhältlich sind.
Auslesen der in Logomeren enthaltenen Information
Fertige Logomere können entweder mittels PCR (Polymerase Chain Reaction = Polymerasekettenreaktion), was erfindungsgemäß bevorzugt ist, oder mittels Restriktionsverdau gelesen werden. Dabei hat die PCR-Methode den Vorzug, bereits geringste Mengen DNA solcherart vervielfältigen zu können, daß die Logomere direkt nach der PCR und einer Gel-Auftrennung gelesen werden können. Im Falle von binären Logomeren kann das durch die PCR-Methode auf einem Gel erhaltene Bandenmuster unmittelbar als Binärcode gelesen werden.
Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zum Auslesen von Information aus informationstragenden Polymeren, die wie oben beschrieben erhalten und/oder isoliert und vervielfältigt wurden, dadurch gekennzeichnet, daß man
  • a) n das informationstragende Polymer enthaltende Lösungen mit jeweils einem Paar gegenläufiger Primer versetzt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht;
  • b) mindestens n-1 PCR-Ansätze durchführt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht Lind jeweils ein Primer eines jeden Paares in dem dem Elongator gegenüberliegenden Terminator primt und der andere Primer in dem Elongator selbst primt;
  • c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Länge durch Elektrophorese auftrennt und d) das aus der Elektrophorese erhaltene Muster optisch ausliest.
Das Verfahren kann auch unter Verwendung verschiedenfarbiger fluoreszenzmarkierter Primer oder Nukleotide durchgeführt werden. Dadurch wird es möglich, mehrere Ansätze verschiedenfarbig zu markieren und mehrere Ansätze in einer Spur gelelektrophoretisch zu lesen. Überdies kann der Ausleseprozeß dadurch mit modernen Sequenziermaschinen (z. B. von ABI erhältlich) automatisiert werden.
Auslesen von Logomeren mittels PCR
Um die in Logomeren enthaltenen Informationen sichtbar zu machen, können die Logomere mithilfe der PCR ausgelesen werden. Die Methode des Auslesens binärer Muster mit PCR wurde als DNA Typing bereits von [Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-­ 209, (1991)] beschrieben. Die dort beschriebene Methode wird hier in einer abgewandelten Form als Auslese-PCR zum Auslesen der Logomere benutzt. Unterschiede zu der in [Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)] beschriebenen Methode bestehen darin, daß hier synthetisch erzeugte Templates verwendet werden, die nicht notwendig binäre Muster enthallen. Außerdem werden PCR- und Gel- Elektrophorese-Bedingungen so gewählt, daß das Ergebnis direkt vom Gel gelesen werden kann, ohne daß die als Bandenmuster erhaltenen Signale zusätzlich durch Blotting verstärkt werden müssen.
a) PCR
Für das Auslesen eines Logomers werden für n Elongatoren der zugrundeliegenden Grammatik mindestens n-1, meistens aber n PCR-Ansätze gebraucht. Jeder PCR-Ansatz enthält das zu lesende Logomer als Template und außerdem ein Paar gegenläufiger Primer, von denen einer im Elongator, der andere im, dem Elongator gegenüberliegenden, Terminator primt (z. B. 5'-"Start" und 3'-0, siehe Abb. 5). Für die PCR kann jeder handelsübliche Thermozykler (z. B. PTC-100, MJ Research) verwendet werden. Als zweckmäßig für die Länge der Primer haben sich 20-30 bp erwiesen, jedoch sind auch andere Längen verwendbar. Je nach Primerlänge muß die Annealing-Temperatur entsprechend gewählt werden (kann z. B. mithilfe des Programmes Oligo 5.0 bestimmt werden). Zweckmäßige Annealingtemperaturen sind für 20-mere ca. 55°C, für 30-mere etwa 65°C bis 74°C. Für die PCR-Ansätze werden z. B. folgende Reagentien und Protokolle verwendet, die in dem Fachmann bekannter Weise variiert werden können:
dNTPs (Pharmacia Biotech, Katalog Nr.: 27-2035-01/213), Taq-Polymerase (Gibco-BRL, Katalog Nr.: 18038-034, 18038-042, 18038-067), PCR-Puffer, MgCl2 (GIBCO-BRL, Katalog Nr.: 18067-017)
Um genügend DNA zu erhalten, so daß das erhaltene Bandenmuster nach der Gelelektrophorese direkt vom Gel gelesen werden kann, kann jeder PCR-Ansatz m mal angesetzt werden. Z. B. kann m = 4 sein.
Als PCR-Programm kann folgendes Protokoll (Primer: 30-mere) verwendet werden:
Nach durchgeführter PCR ist es für die Lesbarkeit der Bandenmuster der nachfolgenden Gelelektrophorese evtl. zweckmäßig, möglichst viel amplifizierte DNA in möglichst geringem Volumen zu halten, das dann auf ein Gel geladen werden kann. Dazu können die Volumina auf geeignete Weise (z. B. mit einer SpeedVac, z. B. SpeedVac Concentrator, Savant) eingeengt werden.
b) Gelelektrophorese
Die für jeden Elongator aus der PCR erhaltenen DNA Fragmente haben verschiedene Länge. Werden sie durch Elektrophorese aufgetrennt, so ergeben die unterschiedlichen Längenfragmente ein spezifisches Muster, anhand dessen sich das zu lesende Logomer identifizieren läßt (siehe Abb. 5 und Abb. 6). Für die Gelelektrophorese kann ein 4% Agarose-Gel (z. B. UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510- 027), als Molekulargewichtsstandard z. B. eine 50 bp-Leiter (Gibco BRL, Life Technologies, Katalog Nr.: 10416-014) verwendet werden. Die Auftrennung der DNA erfolgt in einer Gelkammer in geeigneter Weise, z. B. 1 : 45 Stunden bei 60 V. Hier sind die Parameter jedoch relativ frei wählbar, insbesondere kann die Gel-Laufzeit weiter verkürzt werden.
Das erhaltene Gel wird 5 Minuten in 0,001% Ethidliumbromid gefärbt und unter UV sichtbar gemacht.
Ein Beispiel für ein solcherart erhaltenes Gel findet sich exemplarisch unter Abb. 6.
Auslesen von Logomeren durch Restriktionsverdau
Logomere können durch Restriktionsverdau ausgelesen werden. Dazu müssen die Elongatoren so konstruiert sein, daß sie asymmetrisch versetzte Restriktionsschnittstellen tragen. Jeder Elongator trägt dabei eine spezifische Restriktionsschnittstelle. Beispielsweise kann das Restriktionsenrym EcoRV (z. B. NEB, Katalog Nr. #195S) für 0-Elongatoren und Smal (z. B. NEB, Katalog Nr. #141S) für 1-Elongatoren verwendet werden.
Zum Lesen wird das zu lesende Logomer in verschiedenen Restriktionsansätzen geschnitten. Dazu wird pro Elongator ein Restriktionsansatz mit dem jeweiligen Restriktionsenzym gebildet. Die aus der Restriktion erhaltenen DNA Fragmente sind von verschiedener Länge. Werden sie durch Elektrophorese aufgetrennt, so ergeben clie unterschiedlichen Längenfragmente ein spezifisches Muster, anhand dessen sich das zu lesende Logomer identifizieren läßt.
Das folgende Beispiel zeigt die DNA-Fragmentlängen aller binären Logomere mit 4 Bit ohne Terminatoren mit Elongatorlänge = 30 bp; Restriktionsschnittstelle pro Elongator nach 10 bp.
Im obigen Beispiel (4 Bits) erkennt man, daß die Längenmuster der Zahlen 0010 und 0100 bei Restriktion des 0-Bits nicht eindeutig ist. 0010 und 0100 lassen sich jedoch anhand der Längenmuster bei Restriktion des 1-Bits unterscheiden.
Im Einzelnen wurde zur Durchführung des obigen Beispiels folgendermaßen vorgegangen, wobei sich die Protokolle gemäß den Kenntnissen des Fachmanns variieren lassen:
a) DNA Extraktion
Eine z. B. durch Vereinzelung und Vervielfältigung von Logomeren durch Klonierung erhaltene Bakterienkolonie wird zum Animpfen von 2-5 ml einer 37°C Übernachtkultur verwendet (z. B. LB-Medium mit 10 µg/l Ampicillin wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). Als Klonierungsvektor können hier z. B. pGEM-T Easy (Promega, Katalog Nr. A1360) und binäre Logomere auch ohne Terminatoren verwendet werden. Aus der Übernachtkultur wird die das Logomer enthaltende Plasmid-DNA isoliert (z. B. mithilfe des Qiagen Plasmid Miniprep Kit, Qiagen, Katalog Nr. 12123, oder durch alkalische Lyse wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben).
b) Restriktion
Die aus a) erhaltene Plasmid DNA wird für n Elongatoren in n Restriktionsansätzen geschnitten. Jeder Restriktionsansatz enthält ein Restriktionsenzym, das in einem spezifischen Elongator schneidet und ein Restriktlionsenzym, das das Logomer aus der Klonierungssite ausschneidet. Im verwendeten Beispiel wurden folgende Ansätze verwendet:
Die angegebenen Ansätze werden 1 Stunde auf 37°C inkubiert.
c) Gelelektrophorese
Die aus b) erhaltenen DNA Fragmente werden elektrophoretisch aufgetrennt (z. B. 4% Agarose UltraPure™ von Gibco BRL, Life Technologies, Katalog Nr.: 15510-027), mit Ethidiumbromid (0,001%) gefärbt und unter UV sichtlbar gemacht (siehe Abb. 8).
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung binärer Logomere:
Binäre Logomere werden mit Grammatiken erzeugt, in denen gilt:
Σ: = {0, 1, s0, s1, s2, . . ., sn-1, sn, e0, e1, e2, . . ., em-1, em} mit n, m ∈ e N und n, m ≧ 0.
Sie ermöglichen die einfachste und universellste Darstellung von Daten, wie sie auch von herkömmlichen Datenverarbeitungsmaschinen eingesetzt wird. Binäre Logomere sind Resultat einer Bitpolymerisation. Da abhängig von der jeweils gewählten Grammatik nahezu beliebige Symbole und Regeln kodiert werden können, können damit ebenso beliebige Daten und Datentypen erzeugt werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung von Zeichenalphabeten:
Logomere können eingesetzt werden, um die Zeichen eines gewählten Alphabetes zu kodieren. Die Zeichenlänge kann dabei unterschiedlich gewählt werden, sinnvoll ist es jedoch, die auch für herkömmliche Datenverarbeitungsanlagen benutzten Zeichenlängen (Halbbyte, 1-Byte, 2-Byte, 4-Byte, 8-Byte usw.) zu verwenden. Ebenso ist die Konvention für die Interpretation der dargestellten Zeichen wahlfrei. Gie Zeichen können Zahlen, Buchstaben, alphanumerische Zeichen oder beliebige andere Datenstrukturen sein.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung eines 1-Byte Alphabetes:
Es sei eine Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, 1, s, e}, Variablenmenge
V: = { S0, S1, S2, S3, S4, S5, S6, S7, S8}, Startsymbol S und Regelmenge) R: =
{
S: = sS0
S0 → 0S1
S0 → 1S1
S1 → 0S2
S1 → 1S2
S2 → 0S3
S2 → 1S3
S3 → 0S4
S3 → 1S4
S4 → 0S5
S4 → 1S5
S5 → 0S6
S5 → 1S6
S6 → 0S7
S6 → 1S7
S7 → 0S8
S7 → 1S8
S8 → e
}
wobei:
s := Start
e := Ende Beispiel:
nach den Regeln der angegebenen Grammatik können alle 8-Bit Zeichen erzeugt werden:
z. B.: Erzeugung der 8-Bit 0, 00000000:
S → sS0 → s0S1 → s00S2 → s000S3 → s0000S4 → s00000S5 → s000000S6 → s0000000S7 → s00000000S8 → s00000000e
z. B.: Erzeugung der 8-Bit 255, 11111111:
S → sS1 → s1S1 → s11S2 → s111S3 → s1111S4 → s11111S5 → s111111S6 → s1111111S7 → s11111111S8 -< s11111111e
z. B.: Erzeugung der 8-Bit 85, 01010101:
S → sS0 → s0S1 → s01S2 → s010S3 → s0101S4 → s01010S5 → s010101S6 → s0101010S7 → s01010101S8 → s01010101e
Die für die Implementierung in vitro benötigten Sequenzen werden nach dem NFR-Verfahren, wie in den erfindungsgemäßen Schritten II und III beschrieben, hergestellt. Algomere und Logomere werden, wie in den erfindungsgemäßen Schritten IV-V beschrieben, hergestellt und die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfältigung von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfältigt. Die solcherart erzeugten alphanumerischen Zeichen können jetzt für verschiedene technische Zwecke (z. B. die Markierung und Identifizierung von Stoffen) eingesetzt werden und, evtl. nach zusätzlichen technischen Schritten, gemäß dem erfindungsgemäßen Verfahren zum Auslesen von Information aus informationstragenden Polymeren (wie oben beschrieben) ausgelesen werden.
Da die hier erzeugten Binärmuster wahlfrei als Daten und Symbole gelesen werden können, können sie z. B. als alphanumerische Zeichen interpretiert werden. Werden sie als Zahlen interpretiert, so erzeugt die angegebene Grammatik 3-Bit Zufallszahlen. Aus einer genügend großen Menge zufälliger 8-Bit Binärmuster können alle 8-Bit Muster isoliert und als Bibliothek (z. B. zur Darstellung aller alphanumerischen Zeichen) angelegt werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Darstellung von Zeichenketten:
Da Algomere so hergestellt werden können, daß sich unterschiedlich lange Logomere erzeugen lassen, ist es möglich, auch Zeichenketten darzustellen. Aus praktischen Gründen ist es jedoch zweckmäßig, nur wenige Zeichen pro Logomer vorzusehen. Z. B. kann ein einzelnes Logomer 4 Bit (Halbbyte) oder 8 Bit (1 Byte) enthalten. (Falls mehr Bit erforderlich sind, sollten zweckmäßigerweise immer Vielfache von 8 Bit = 1 Byte verwendet werden.) In Binärdarstellung können dann beliebige alphanumerische Zeichen in beliebiger Kodierung (z. B. ASCII, ANSI, ISO 8859-x, Unicode) dargestelltt werden. Dabei kann sich ein Zeichen auch über mehrere Logomere erstrecken (Bsp.: Halbbyte-Darstellung, bei der sich jeweils ein 1-Byte Zeichen über zwei Logomere erstreckt, oder Unicode, bei der sich ein 16-Bit Zeichen über zwei 8-Bit oder vier 4-Bit Logomere erstreckt). Für die Darstellung von Zeichenketten ist es dann nötig, die einzelnen Zeichen mit Positionsinformation zu versehen. Dazu reicht es, in den jeweiligen Grammatiken verschiedene Terminatoren (z. B. verschiedene "Start"- Terminatoren) zu verwenden, deren Sequenzen jeweils die Positionsinformation repräsentieren. Beispiel: Es sei eine Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = (0, 1, e, s0, s1, s2, . . ., sn-1, sn}, Variablenmenge V: = (S0, S1, S2, S3, S4, S5, S6, S7, S8}, Startsymbol S und Regelmenge R: =
{
S := siS0
S0 → 0S1
S0 → 1S1
S1 → 0S2
S1 → 1S2
S2 → 0S3
S2 → 1S3
S3 → 0S4
S3 → 154
S4 → 0S5
S4 → 1S5
S5 → 0S6
S5 → 1S6
S6 → 0S7
S6 → 1S7
S7 → 0S8
S7 → 1S8
S8 → e
}
wobei:
s; : = Start, mit i = {0, . . ., n}
e: = Ende.
Das mit dieser Grammatik erzeugte 1-Byte Alphabet reicht z. B. für alle alphanumerischen Zeichen des ASCII, ANSI oder ISO 8859-x Standards. Für eine Zeichenkette der Längen werden n verschiedene Terminatoren benötigt, so daß die mit dieser Grammatik erzeugten Zeichenketten wie folgt aufgebaut sind:
s0xe, s1xe, . . ., sn-1xe, snxe
wobei x eine beliebige Binärdarstellung mit, in diesem Fall, 8 Bit ist.
Es bedeutet dann:
s0xe: = Zeichen x an Position 0 (0.tes Zeichen)
s1xe: = Zeichen x an Position 1 (1.tes Zeichen)
s2xe: = Zeichen x an Position 2 (2.tes Zeichen)
usw.
Mit der Grammatik läßt sich beispielsweise die Zeichenkette "Elisabeth" im ASCII-Code darstellen:
s001000101e, s101101100e, s201101001e, s301110011e, s401100001e, s501100010e, s601100101e, s701110100e, s801101000e
Alternativ kann auch Σ: = {0, 1, s, e0, e1, e2, . . ., en-1, en} gewählt werden, wodurch die Zeichenkette "Elisabeth" im ASCII-Code als:
s01000101e0, s01101100e1, s01101001e2, s01110011e3, s01100001e4, s01100010e5, s01100101e6, s01110100e7, s01101000e8
dargestellt wird. Eine weitere Möglichkeit ist Σ: = {0, 1, s0, s1, s2, . . ., sn-1, sn, e0, e1, e2, . . ., en-1, en}, womit die Zeichenkette "Elisabeth" im ASCII-Cade als:
s001000101e0, s101101100e0, s201101001e2, s301110011e3, s401100001e4, s501100010e5, s601100101e6, s701110100e7, s801101000e8
dargestellt wird.
In Halbbyte-Darstellung mit Positionsinformation würde die Zeichenkette "Elisabeth" im ASCII- Code dargestellt als:
s0100e, s10101e, s20110e, s31100e, s40110e, s51001e, s60111e, s70011e, s80110e, s90001e, s100110e, s110010e, s120110e, s130101e, s140111e, s150100e, s160110e, s171000e
Aufgrund der Positionsinformation, die durch die Sequenz der Terminatoren repräsentiert wird, können die einzelnen Zeichen völlig unabhängig voneinander verarbeitet werden und z. B. getrennt voneinander gelesen werden. Mit einem solchen Alphabet ist die Darstellung beliebiger Datentypen möglich. Z. B. können z. B. jeweils zwei Byte (0. + 1., 2. + 3., . . ., n. + n+1.) zu einem 2-Bytecode (z. B. Unicode) zusammengefaßt werden. Alphanumerische Zeichenketten können verwendet werden, um beliebige Bezeichner (Namen, Zahlen, Datum usw.) darzustellen.
Die für die Implementierung in vitro benötigten Sequenzen werden nach dem NFR-Verfahren, wie in den erfindungsgemäßen Schritten II und III beschrieben, hergestellt. Algomere und Logomere werden, wie in den erfindungsgemäßen Schriften IV-V beschrieben, hergestellt, die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfältigung von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfältigt. Die solcherart erzeugten alphanumerischen Zeichen und Zeichenketten können jetzt für verschiedene technische Zwecke (z. B. die Markierung und Identifizierung von Stoffen) eingesetzt werden und, evtl. nach zusätzlichen technischen Schritten, gemäß dem erfindungsgemäßen Verfahren zum Auslesen von Information aus informationstragenden Polymeren (wie oben beschrieben) ausgelesen werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Implementierung eines Zufallszahlengenerators:
Für bestimmte Probleme der Informatik (z. B. Simulationen) und der Mathematik werden Zufallszahlen benötigt. Diese werden im allgemeinen rechnergestützt durch Algorithmen erzeugt. Da diese Algorithmen jedoch deterministisch sind, handelt es sich bei den erzeugten Zufallszahlen nur um Pseudo-Zufallszahlen. Überdies sind die erzeugten Zahlenreihen aufgrund der unterschiedlichen Güte der Algorithmen unterschiedlich gut randomisiert. Für manche Anwendungen werden daher echte Zufallszahlen benötigt. Ist dies der Fall, muß ein physikalischer Prozeß in die Erzeugung von Zufallszahlen einbezogen werden. Ein solcher Prozeß ist etwa das Rauschen der Soundkarte in einem PC, das von entsprechender Software verarbeitet wird.
Mithilfe der hier beschriebenen Verfahren kann ein echter Zufallszahlengenerator implementiert werden, der Zufallszahlen sehr viel schneller erzeugt, als es mit herkömmlichen Verfahren möglich ist.
Der Zufallszahlengenerator wird mit folgender Grammatik implementiert (Grammatik für binäre Zufallszahlen beliebiger Länge):
G = (Σ, V, R, S) mit Σ: = {0, 1, s, e}, V: = {S},
R: =
{
S: = sA
A → 0A
A → 1A
A → e
}
wobei
s: = Start
e: = Ende
Mit dieser Grammatik können Wörter über dem oben angegebenen Terminalalphabet L = {0, 1, s, e} gebildet werden. Alle Wörter der Sprache L beginnen mit "s" und hören mit "e" auf, dazwischen befindet sich eine zufällige Anzahl (auch 0) zufälliger Bits ("0" und "1").
Beispiel: Wörter aus der Sprache L, die nach R gebildet werden:
S → sA → se
S → sA → s1A → s1e
S → sA → s0A → s00A → s001A → s0010A → s0010e
S → sA → s1A → s10 62137 00070 552 001000280000000200012000285916202600040 0002019914808 00004 62018A → s100A → s1000A → s10000A → s100000A → s100000e
Die als Wörter der Spache L erzeugten Binärmuster können als Buchstaben, Zahlen, alphanumerische Zeichen oder Zeichenketten gelesen werden. Liest man sie als die Binärdarstellung von Zahlen, so sind diese Binärmuster in Dezimaldarstellung:
∅3 (leer)
1
2
32
und können als Zufallszahlen verwendet werden. Zur in vitro Implementierung eignen sich prinzipiell beliebige Sequenzen, solange sie eindeutig und zueinander maximal unähnlich sind. Z. B. können folgende Algomere verwendet werden:
Die dazu benötigten Sequenzen sind handelsüblich. Sie können z. B. bestellt werden als 40 nmol, PAGE gereinigt (ARK-Scientific, Darmstadt) und z. B. 100 µM in Aqua dest. aufgenommen werden (empfohlene Lagerung bei -20°C). Aus den Sequenzen werden, wie im erfindungsgemäßen Schritt IV beschrieben, Algomere hergestellt. Diese Algomere werden, wie im erfindungsgemäßen Schritt V beschrieben, zu Logomeren polymerisiert und können gemäß dem erfindungsgemäßen Verfahren zum Auslesen von Information aus informationstragenden Polymeren (wie oben beschrieben) ausgelesen werden. Derart erzeugte Zufallszahlen sind in Abb. 6 zu sehen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Verschlüsselung von Logomeren:
Die in Logomeren enthaltene Information kann verschlüsselt werden. Dazu fungiert mindestens einer der für die Auslese-PCR benötigten Primer als geheimer Schlüssel (siehe Abb. 11). Bevorzugt ist dies einer der in den Terminatoren primenden Primer. Ist die Sequenz dieses Primers (Schlüsselsequenz) und der Primer selbst nur autorisierten Zugreifern bekannt, so ist die in den derart verschlüsselten Logomeren enthaltene Information auch nur autorisierten Zugriffen zugänglich.
Um ein Auslesen der in den Logomeren enthaltenen Information ohne diesen Schlüssel zu verhindern, müssen weitere Vorkehrungen getroffen werden. Versuche, die Verschlüsselung zu brechen, können darauf beruhen, über die Vervielfältigung nicht-geheimer Sequenzen auch die Logomere zu lesen. Sofern bakterielle Vektoren zur Klonierung von Logomeren verwendet werden, könnte ein potentieller Angreifer z. B. versuchen, die gesamte Klonierungssite mit PCR zu vervielfältigen und dann mit Sequenzierung zu lesen oder über die zur Selektion benötigten Resistenzgene in die Klonierungssite "hineinzulesen". Auch könnten die Elongatoren selbst als Ansatzpunkte für ein PCR-basiertes Lesen der geheimen Sequenz(en) dienen.
Solchen Angriffsversuchen ist gemein, daß sie über nicht-geheime Sequenzen versuchen könnten, die Schlüsselsequenz zu entschlüsseln und darüber die verschlüsselte Sequenz zu lesen. Eine Abwehr derartiger Angriffsversuche kann dadurch erfolgen, daß zum Informationstransport über Logomere immer nur vollständig geheime Sequenzen verwendet werden. Jedoch ist dies evtl. zu aufwendig und kostenträchtig. Stattdessen oder ergänzend dazu können die informationstragenden Logomere mit Sequenzen (Scheinsequenzen) versetzt werden, die dieselben potentiellen Angriffspunkte (z. B. Bits, Resistenzgene) enthalten, jedoch jeweils andere Schlüsselsequenzen. Durch diese Scheinsequenzen laufen potentielle Angiffsversuche ins Leere, weil für den nicht-autorisierten Zugreifer alle Einzelsequenzen ununterscheidbar und dadurch die verschlüsselten Informationen verborgen sind. Mit je mehr Scheinsequenzen ein Logomer versetzt ist, um so schwieriger wird es, die Schlüsselsequenz zu brechen.
Das Verfahren entspricht einer molekularen Steganografie und wird exemplarisch anhand der Verschlüsselung von Zeichen eines 1-Byte Alphabetes gezeigt:
Es sei die verwendete Grammatik G = (Σ, V, R, S) nmt Terminalalphabet Σ: = {0, 1, skey, s0, s1, s2, . . ., sf-1, sf, e}, wobei f ∈ N, f ≧ 1. skey ist der geheime Schlüssel. Für eine Schlüssellänge von I ist dann die maximale theoretische Verschlüsselung Keymax = aI, die maximal verwendbare Verschlüsselung Keyeff = aI-d, wobei d die Anzahl der Basen angibt, in der sich ein Scheinschlüssel von dem richtigen Schlüssel unterscheiden muß, damit in der Auslese- PCR kein Scheinschlüssel die richtige Sequenz lesen und umgekehrt der richtige Schlüssel kein Scheinlogomer (sondern nur das Ziellogomer) auslesen kann. Für hochspezifische PCR Konditionen kann d ≧ 1 werden. Weiterhin gibt Keyimp = Anzahl Scheinschlüssel + 1 die tatsächlich verwendete Verschlüsselung und Keymin = 1 + x die minimale Verschlüsselung an. Dabei ist x die zu einer minimalen Verschlüsselung nötige Anzahl von Scheinlogomeren. Diese kann im Falle der Verwendung von n Logomeren als Informationsträger größer als n gewählt werden.
Für Zeichenketten ergibt sich automatisch eine zusätzliche Verschlüsselung, weil hier die für einen potentiellen Angreifer unbekannte Reihenfolge der Zeichen zusätzlich verschlüsselnd wirkt.
Beispiel: Für eine Grammatik mit Zeichenketten von n 1-Byte Zeichen wird folgende Grammatik G verwendet:
Es sei G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, 1, skey0, skey1, skey2, . . ., skeyn-1, skeyn, s0, s1, s2, . . ., sf-1, sf, e}, wobei n, f ∈ N, n ≧ 1. n gibt dabei die Anzahl der verwendeten echten Schlüssel, f die Anzahl der verwendeten Scheinschlüssel an; die verwendete Variablenmenge V und die verwendete Regelmenge R sind dabei wahlfrei und abhängig von der zu kodierenden Information.
Grammatiken mit anderer Zeichenkodierung funktionieren analog. Die für die Implementierung in vitro benötigten Sequenzen werden nach dem NFR-Verfahren, wie in den erfindungsgemäßen Schritten II und III beschrieben, hergestellt. Algomere und Logomere werden, wie in den erfindungsgemäßen Schritten IV-V beschrieben, hergestellt, die erhaltenen Logomere vorzugsweise mittels des unter Vereinzelung und Vervielfältigung von Logomeren durch Klonierung beschriebenen Verfahrens isoliert und vervielfältigt. Die solcherart erzeugten Logomere können, wie bereits als Auslese-PCR beschrieben, ausgelesen werden, wobei - wie beschrieben - einer der zum Auslesen benötigten Primer, bevorzugt einer der in den Terminatoren primenden Primer, als geheimer Schlüssel fungiert. Mit der oben beschriebenen Grammatik werden zusätzlich zu den informationstragenden Logomeren "Scheinsequenzen" ("Scheinlogomere") erzeugt, die einen nicht-autorisierten Auslese-Zugriff auf die in den Logomeren enthaltenen Informationen verhindern sollen. Das Verfahren kann für alle Anwendungen von Logomeren benutzt werden und hat u. a. den Vorzug, durch die Spezifität des als geheimer Schlüssel benutzten Primers sehr effektiv zu sein.
Basierend auf der beschriebenen Methode können symmetrische und asymmetrische Verschlüsselungsverfahren implementiert werden. Für ein symmetrisches Verschlüsselungsverfahren reicht es, daß sich die Teilnehmer A und B einer Kommunikation auf eine geheimgehaltene Schlüsselsequenz einigen. Teilnehmer B verschlüsselt eine als Logomer gespeicherte Nachricht an A, indem B Logomere nur mit den geheimen Terminatoren herstellt und seine Nachricht mit zusätzlichen Logomeren versetzt, die andere Terminatoren tragen. Nur A ist es dann möglich, das zum Auslesen benötigte Primerpaar bereitzustellen, da nur A die benötigte Terminatorsequenz kennt.
Ein asymmetrisches Verschlüsselungsverfahren erfordert dagegen zusätzlichen Aufwand, z. B. den Einsatz von Molekülen mit irregulären Formen (siehe z. B. Abb. 12 und Abb. 13): Will ein Kommunikationsteilnehmer B eine verschlüsselte Nachricht an A schicken, so bekommt er von A einen öffentlichen Schlüssel, den er zur Verschlüsselung der als Logomer repräsentierten Nachricht verwenden kann. Der öffentliche Schlüssel von A besteht aus einem Paar von Terminatoren und einem Pool zusätzlicher Scheinterminatoren mit ähnlichen Eigenschaften, jedoch abweichenden Sequenzen und anderen 3'-Überhangsequenzen. Von den echten Terminatoren ist lediglich die 3' Überhangsequenz bekannt, mit der sie an die - öffentlich bekannten - Elongatoren verknüpft werden kann. Zur Verschlüsselung einer Nachricht erzeugt B Logomere, wobei er in der Symbolpolymerisationsreaktion den von A öffentlich bereitgestellten Schlüssel (enthaltend Terminatoren und Scheinterminatoren) verwendet. Die Art und Weise der Terminatoren gewährleistet nun, daß lediglich A in der Lage ist, die solcherart verschlüsselte Nachricht wieder zu lesen: Da nur A die tatsächliche Sequenz der echten Terminatoren kennt, ist nur A in der Lage, die als Logomere verschlüsselte Nachricht über Auslese-PCR wieder zu lesen.
Weil der öffentliche Schlüssel potentiell über die bekannte Überhangsequenz zu den Elongatoren angreifbar ist (weil die Scheinterminatoren diese Überhangsequenz nicht besitzen dürfen, kann ein potentieller Angreifer eine beliebige Sequenz an die echten Terminatoren knüpfen, wodurch die Sequenz der Terminatoren identifiziert werden kann), werden als Terminatoren Moleküle auf der Basis irregulärer Formen, z. B. auf der Basis der in Abb. 12 gezeigten Y-förmigen Moleküle verwendet. Die gezeigten Y-förmigen Moleküle lassen sich zu weiter verzweigten baumartigen Molekülen zusammensetzen. Die Wurzel eines solchen als Baum realisierten Terminatormoleküls enthält dann die zu den Elongatoren kompatible Überhangsequenz, während nur eine der Äste des Baumes die echte Terminatorsequenz enthält. Da die verschlüsselte Nachricht wie oben beschrieben zusätzlich mit Scheinlogomeren versetzt ist, kann dann nur A, der die echte Terminatorsequenz kennt, aus der Menge der Moleküle die richtige Nachricht durch Verknüpfen mit dem kompatiblen Vektor herausfiltern, wohingegen ein potentieller Angreifer ohne Kenntnis der echten Terminatorsequenz dies nicht kann.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Verschlüsselung mit Echtzeit-Identifizierung:
Ohne das Auslesen der in verschlüsselten Logomeren enthaltenen Informationen kann das Vorhandensein der Schlüsselsequenz selbst Auskunft darüber geben, ob ein gekennzeichnetes Produkt echt ist, oder nicht. Die Information über die Authentizität des gekennzeichneten Produktes kann dabei über einen Prozeß, bei dem der Schlüsselprimer als Hybridisierungssonde einer Fluoreszenz-Nachweisreaktion dient, verifiziert oder falsifiziert werden.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen informationstragenden Polymere, zur Verschlüsselung von Information.
Die oben beschriebenen Verfahren ermöglichen beispielsweise einen Test der Qualität von Oligonukleotiden:
Ein typisches Problem bei der Herstellung von Oligonukleotiden, z. B. für molekularbiologische Zwecke, ist die Qualitätskontrolle derselben, die aufgrund des Herstellungsprozesses und der schwankenden Qualität der verwendeten Chemikalien problematisch ist.
Das in den erfindungsgemäßen Schritten I-V beschriebene Verfahren kann benutzt werden, die Qualität von Oligonukleotiden zu testen. Dazu wird eine binäre Grammatik wie die für den Zufallszahlengenerator (s. o.) oder eine unäre Grammatik wie die zur Herstellung von Molekulargewichtsstandards (s. u.) zur Erzeugung beliebig langer Logomere verwendet. Bei ansonsten identischen Bedingungen ist dann die Länge der aus einer Symbolpolymerisation (Schritt V des erfindungsgemäßen Verfahrens) erhaltenen Logomere direkt proportional zur Qualität der verwendeten Oligonukleotide: Je länger die elektrophoretisch sichtbar gemachten Logomere sind, desto besser ist die Qualität der verwendeten Oligonukleotide. Ein Beispiel für die aus einer Symbolpolymerisation erhaltene Leiter unterschiedlich langer Logomere findet sich unter Abb. 3.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen informationstragenden Polymere, zur Qualitätskontrolle synthetisch hergestellter Oligonukleotide.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung von Logomeren als Marker und Signaturen:
Aufgrund der Fähigkeit, prinzipiell beliebige Informationen darzustellen, lassen sich die hier beschriebenen Logomere als Marker verwenden, um Erzeugnisse, Produkte, Stoffe und Geräte zu kennzeichnen.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen informationstragenden Polymere, als Marker oder Signaturen.
Die Logomere können als "binäres Etikett" verwendet werden, das einem Erzeugnis hinzugefügt wird und Informationen über das derart gekennzeichnete Erzeugnis enthält. Die Logomere können dabei z. B. Informationen über
  • a) Hersteller
  • b) Produkt (z. B. Seriennummer)
  • c) Verwendungszweck
  • d) Stoffklasse
  • e) Gefahrenklasse
  • f) Qualität
  • g) Reinheit
  • h) Produktions- und Verfallsdatum
enthalten. Es lassen sich damit nahezu beliebige Produkte und Erzeugnisse mit nahezu beliebigen Informationen versehen. Da die Logomere ungiftig und biologisch abbaubar sind, können sie auch für hochsensible Produkte wie Nahrungsmittel, Medikamente und pharmazeutische Erzeugnisse eingesetzt werden.
Gekennzeichnete Erzeugnisse können z. B. sein:
  • a) chemische Erzeugnisse, z. B. Lacke, Farben, Öle, Schmier- und Treibstoffe, Lösungsmittel, Tinte usw.
  • b) flüssige Materialien: Lösungen, Suspensionen, Emulsionen
  • c) gentechnische Erzeugnisse
  • d) Nahrungsmittel, z. B. zur Kennzeichnung gentechnisch veränderter Bestandteile oder dem Monitoring von Nahrungsmitteln während des Produktionsprozesses
  • e) Medikamente und pharmazeutische Erzeugnisse
  • f) Papiererzeugnisse, Dokumente, Geld
  • g) Geräte
Der Bedarf zur Kennzeichnung von Produkten besteht in den unterschiedlichsten Bereichen und aufgrund unterschiedlicher Anforderungen. Gründe für eine Kennzeichnung können z. B. sein: Qualitätssicherung beim Produktionsprozeß, Überwachung der Produktreinheit und Vermeidung von Kontaminationen, Schutz vor Fälschung und Produktpiraterie, Nachweis bestimmter Produktbestandteile, Produktkennzeichnung mit beliebigen Produktinformationen. Dieser Bedarf stellt sich auch in besonders sensiblen Bereichen, etwa bei der Kennzeichnung von Nahrungsmitteln, medizinischen und pharmazeutischen Erzeugnissen und gentechnisch hergestellten oder veränderten Erzeugnissen. Hier ist es wünschenswert, daß Informationen über das jeweilige Produkt direkt am Produkt verfügbar sind, insbesondere wenn Verwechselungen oder Fälschungen vermieden werden sollen und auch die Identifikation unterschiedlicher Bestandteile eines Erzeugnisses gewünscht ist.
Es gibt zahlreiche Beispiele für den Bedarf von Produktkennzeichnungen. Z. B. können Logomere als Seriennummern eingesetzt werden, die in Autolacke gemischt werden, wodurch der Fahrzeughalter im Versicherungsfall (z. B. Unfall oder Diebstahl) identifiziert werden kann. Durch Produktkennzeichnungen könnte die Qualität und Reinheit chemischer Erzeugnisse überwacht und Kontaminationen vermieden werden. Ein permanentes Problem ist die Fälschung von Dokumenten, Unterschriften und Geld, die hochentwickelte Kennzeichnungsverfahren nötig macht.
Vor allem vor dem Hintergrund von Tierkrankheiten und -seuchen (BSE, Schweinepest, Salmonellenvergiftungen usw.) stellt sich das Problem der Qualitätssicherung von Nahrungsmitteln und der Kennzeichnung von Endprodukten, um kontaminierte Produkte vom Verbrauch fernzuhalten. Ein weiteres Problem sind Nahrungsmittel, die gentechnisch hergestellte Bestandteile enthalten. Diese Bestandteile können ohne ein Kennzeichnungsverfahren im Endprodukt überhaupt nicht oder nur sehr schwer nachgewiesen werden. Das Problem stellt sich insbesondere dadurch, daß viele Nahrungsmittel Bestandteile unterschiedlicher Herkunft enthalten und die Produktionswege teilweise undurchschaubar sind.
Das Problem der Kennzeichnung stellt sich z. B. auch im Bereich von Blutprodukten, wo z. B. durch Pooling Kontaminationen auftreten können. Auch wäre es hier z. T. wünschenswert, Informationen über Identität, Herkunft, Produktions- und Verfallsdatum direkt mit dem Produkt verfügbar zu haben. Ähnliches gilt auch für Medikamente und pharmazeutische Produkte.
Bisher verwendet man zur Kennzeichnung und Markierung von Farben, Lacken, Treibstoffen, usw. verschiedene Kohlenstoffverbindungen, Polyaniline, Flüssigkristalle oder andere chemische Verbindungen. Diese Stoffe und Verbindungen haben unterschiedliche Schwächen: sie sind z. T. toxisch, nur schwer biologisch abbaubar, die verfügbare Informationskapazität ist stark eingeschränkt, sie wechselwirken chemisch mit bestimmten Stoffen oder sind nur teuer und aufwendig herzustellen.
Für den Einsatz zur Kennzeichnung von sensiblen und hochsensiblen Erzeugnissen wie Nahrungsmitteln oder Medikamenten sind die genannten Stoffe und Verbindungen aufgrund der genannten Nachteile überhaupt nicht geeignet.
Die Anforderungen, die sich für ein Kennzeichnungsverfahren von beliebigen Erzeugnissen stellen umfassen zumindest:
  • - Die Kennzeichnung sollte direkt im oder am Erzeugnis verfügbar sein;
  • - die Kennzeichnung sollte gut nachweisbar sein;
  • - die Kennzeichnung muß gesundheitlich unbedenklich sein.
Gegenüber den bisher verwendeten Verbindungen haben die hier beschriebenen Logomere folgende Vorzüge:
  • - Kodierung beliebiger Informationen,
  • - hohe Speicherkapazität,
  • - gesundheitlich unbedenklich,
  • - chemisch, biologisch, pharmakologisch und genetisch neutral,
  • - leicht biologisch abbaubar (Biomoleküle),
  • - keine Umweltbelastung,
  • - sehr gute Nachweisbarkeit,
  • - hohe Kompatibilität zu bestehenden Techniken der Informatik und Molekularbiologie (PCR),
  • - Informationen können verschlüsselt werden und eignen sich auch zu Authentifizierung und Verschlüsselung,
  • - Identifikation einzelner Bestandteile in Produktmischungen,
  • - billig in großen Mengen herzustellen (Klonierung, Vervielfältigung mit Bakterien in Fermentern).
Diese Eigenschaften machen Logomere für die genannten Aufgaben sehr viel besser geeignet als die bestehenden Techniken. Überdies erschließen sich Einsatzbereiche, die mit den bisherigen Techniken nicht möglich waren.
Aufgrund der Eigenschaften nukleinsäurebasierler Logomere können diese auch zur Kennzeichnung von besonders sensiblen Produkten wie Nahrungsmitteln und pharmazeutischen Erzeugnissen verwendet werden.
Die Gründe dafür liegen zum einen in der chemischen Beschaffenheit nukleinsäurebasierter Logomere und zum anderen in der Kodierung von Informationen in Logomeren:
  • 1. Als Grundbausteine des Lebens" sind Nukleinsäuren Elementarbausteine aller bisher bekannten biologischen Lebensformen. Daher können sie aufgrund ihrer chemischen Beschaffenheit für keinen bekannten biologischen Organismus schädlich sein ("biochemische Kompatibilität"). Aufgrund der enthaltenen genetischen Informationen (des enthaltenen Programmes) können Nukleinsäuren jedoch sehr wohl potentiell schädlich sein, wenn sie in einem Organismus abgelesen werden: Falls sie etwa für giftige Proteine kodieren oder (wie im Falle viralen Erbgutes) einen jeweiligen Zielorganismus "umprogrammieren" können. Die hier verwendeten Logomere können jedoch aus den im Folgenden genannten Gründen keine für einen Organismus schädlichen Informationen enthalten.
  • 2. Logomere enthalten keine genetischen, d. h. biologisch relevanten Informationen ("semantische Inkompatibilität"): Bezüglich der enthaltenen Informationen entsprechen Logomere Buchstaben, Zahlen oder Folgen von Buchstaben und Zahlen in Binärkodierung, die für uns oder einen Computer, jedoch nicht für den genetischen Apparat eines Organismus lesbar sind. Für einen biologischen Organismus sind sie schlicht "Unsinnscode".
  • 3. Logomere, insbesondere die Algomere, aus denen sie aufgebaut sind, sind zu kurz um auch nur zufällig biologisch relevante Informationen zu enthalten.
  • 4. Um jede Eventualität (der unwahrscheinliche Fall, daß die Binärinformationen der Logomere auf irgendeine Weise von irgendeinem Organismus als genetisch relevante Information interpretiert wird) auszuschließen, werden die zur Kodierung von Symbolen verwendeten Sequenzen im Falle sensibler Anwendungsbereiche mit Stopcodons versehen, so daß sie niemals von einem biologischen Organismus abgelesen werden können.
  • 5. Als elementare Bestandteile aller biologischen Organismen sind Nukleinsäuren in unserer Umwelt allgegenwärtig. Sie werden in kürzester Zeit abgebaut.
Um als Marker eingesetzt zu werden, können Logomere nach den in den erfindungsgemäßen Schritten I-V beschriebenen Verfahren erzeugt und nach den erfindungsgemäßen oben beschriebenen Verfahren vervielfältigt werden. Je nach Einsatzbereich können zur Vervielfältigung der Logomere verschiedene Verfahren und verschiedene Aufarbeitungsprozesse vorgenommen werden. Zur Kennzeichnung petrochemischer Erzeugnisse z. B. können Logomere durch Klonierung in Bakterien vervielfältigt werden. Um unnötige Kontaminationen zu vermeiden, können die erhaltenen Bakterien lysiert werden. Eine spezielle Aufreinigung der Logomer-DNA ist im Allgemeinen nicht nötig.
Zur Herstellung von Logomeren für sensible und hochsensible Produkte ist dagegen ein aufwendigeres Vervielfältigungs- und Aufreinigungsverfahren nötig. Ziel ist dabei der Erhalt möglichst reiner Logomere. Um biologische Zwischenschritte zu vermeiden, kann die Vervielfältigung - wie erfindungsgemäß beschrieben - mit PCR vorgenommen werden. Sollte eine Vervielfältigung durch Klonierung vorgenommen werden, so ist die Aufreinigung der erhaltenen DNA aus Bakterien nötig. Sind die Logomere in bakteriellen Vektoren kloniert, so ist ein gezielter Abbau dieser Resistenzgene (z. B. durch Restriktionsenzyme) Bestandteil einer weiteren Aufarbeitung.
Logomere können zur Kennzeichnung eines Produktes unmittelbar mit diesem verbunden werden. Sie können z. B. in flüssige Stoffe gemischt werden oder auf feste Stoffe aufgebracht werden. Im Falle gentechnischer Erzeugnisse können die Logomere mithilfe von Rekombinations- und Klonierungstechniken kovalent mit dem zu kennzeichnenden Produkt verbunden werden.
Die Kennzeichnung von Stoffen und Produkten durch Logomere ermöglichen u. a. das Monitoring von Produktionsprozessen, die Qualitätskontrolle, die Identifikation einzelner Bestandteile und den quantitativen und qualitativen Nachweis von Kontaminationen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse:
Die hier beschriebenen Logomere können zur Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse verwendet werden.
Bisher werden insbesondere zur Identifikation gentechnisch hergestellter oder veränderter Erzeugnisse in Nahrungsmitteln "klassische" melekularbiologische Methoden wie PCR, Restriktionsverdau, Southernblot-Hybridisierung und Sequenzierung verwendet. Mit diesen Methoden ist jedoch eine Charakterisierung gentechnischer Erzeugnisse und Bestandteile noch sehr aufwendig und erfordert für jedes zu charakterisierende Erzeugnis eigene Methoden und Verfahren.
Insgesamt gibt es bisher kein universelles Kennzeichnungsverfahren für gentechnisch hergestellte Erzeugnisse. Ein solches Kennzeichnungsverfahren muß mehrere Kriterien erfüllen:
  • - die Kennzeichnung muß gesundheitlich absolut unbedenklich sein,
  • - die Kennzeichnung sollte untrennbar mit dem gekennzeichneten Produkt verbunden sein,
  • - die Kennzeichnung sollte fälschungssicher sein,
  • - die Kennzeichnung sollte genügend Informationen speichern können,
  • - die Kennzeichnung sollte in geringen Mengen nachweisbar und lesbar sein.
Der Einsatz nukleinsäurebasierter Logomere zur Kennzeichnung gentechnischer Erzeugnisse erfüllt diese Kriterien und hat darüber hinaus folgende Vorzüge:
  • - Logomere können nahezu beliebige Informationen speichern;
  • - einzelne Bestandteile können schnell und hochempfindlich nachgewiesen werden;
  • - zum Auslesen der Informationen kann eine bis ins Detail standardisierte Methode eingesetzt werden (Ausleseverfahren nach dem erfindungsgemäßen Verfahrens, dabei können standardisierte Primer verwendet werden);
  • - die Sequenz der gesuchten Gene kann vollkommen unbekannt sein;
  • - die Sequenz der nachgewiesenen Gene kann geheim sein, ohne daß die Identifizierung oder Authentifizierung eingeschränkt ist;
  • - zusätzliche Sicherheitsmechanismen können zusätzlich durch Verschlüsselung implementiert werden.
Im Einzelnen geht man zur Kennzeichnung von gentechnisch erzeugten oder veränderten Erzeugnissen beispielsweise folgendermaßen vor:
Zur Herstellung von Markern wird eine beliebige geeignete Grammatik, z. B. wie die für den Zufallszahlengenerator, das 1-Byte Alphabet oder für Zeichenketten bereits beschriebene, verwendet. Aus den mit der Grammatik erzeugten Zeichen werden die zur Darstellung von Markern benötigten Zeichen entnommen und dem zu kennzeichnenden Erzeugnis hinzugefügt. Dazu können die als Logomere hergestellten Zeichen auf folgende Weise in das zu kennzeichnende Erzeugnis eingebracht werden:
  • a) durch Beimischung; hierbei werden Logomere, wie in den erfindungsgemäßen Verfahren beschrieben, hergestellt, isoliert und vervielfältigt.
  • b) durch Klonierung, wie im erfindungsgemäßen Verfahren beschrieben; Abb. 6 zeigt z. B. die Kennzeichnung bakterieller Klone durch Logomere, die durch Verwendung der bereits beschriebenen Grammatik für den Zufallszahlengenerator hergestellt wurden.
  • c) durch den Einsatz rekombinativer Techniken; hierbei werden Logomere erfindungsgemäß hergestellt, isoliert und vervielfältigt. Die solcherart gewonnenen Logomere werden jetzt durch den Einsatz rekombinativer Techniken in das zu kennzeichnende Erzeugnis eingebracht. Dazu kann z. B. die Methoden des Gene-Targeting durch homologe Rekombination [Capecchi M. R., Altering the genome by homologous recombination. Science, 244(4910), 1288-1292, (1989)] oder z. B. das Cre-loxP System [Kilby, N. J., Snaith, M. R. & Murray, J. A., Site-specific recombinases: tools for genome engineering, Trends Genet., 9, 413-421, (1993)] verwendet werden. Z. B. können erfindungsgemäß erhaltene Logomere mit Hilfe dieser Techniken vor oder hinter eine bestimmte Nukleinsäuresequenz (Gen) gesetzt werden, die sie bezeichnen sollen. In diesem Falle wird ein Logomer gewissermaßen als "Etikett" an ein gentechnisches Produkt "angeheftet" und kann Auskunft über Hersteller, Produktgruppe, Gefahrenklasse, Verfallsdatum o. ä. geben (siehe Abb. 15).
Das Verfahren eignet sich z. B. für alle Organismen (Mikroorganismen, Pflanzen, Tiere). Z. B. lassen sich Klone von Mikroorganismen oder Pflanzen kennzeichnen. Das Verfahren eignet sich z. B. auch für die Kennzeichnung von Rindern zur Bekämpfung der Rinderseuche BSE.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung von Nahrungsmitteln:
Aufgrund von Krankheiten, Seuchen oder Kontaminationen können Nahrungsmittel gesundheitsschädlich oder gefährlich sein. Beispiele sind Krankheiten wie BSE, Schweinepest, Salmonellenvergiftungen. Es kann wünschenswert sein, Produkt und Hersteller identifizieren zu können, um notfalls bestimmte Produkte und Produktreihen umgehend aus dem Handel zu nehmen, untersuchen zu können und geeignete Gegenmaßnahmen zu ergreifen.
Für hochsensible Erzeugnisse wie Nahrungsmittel gelten dabei die Kriterien für die Kennzeichnung gentechnischer Erzeugnisse insbesondere (siehe: Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse).
Insgesamt gibt es auch für gentechnisch hergestellte Nahrungsmittel bisher kein universelles Kennzeichnungsverfahren. Bisher ist die Identifikation gentechnisch hergestellter oder veränderter Bestandteile in Nahrungsmitteln daher roch schwierig und aufwendig. Es werden dazu "klassische" molekularbiologische Methoden wie PCR, Restriktionsverdau, Southernblot- Hybridisierung und Sequenzierung verwendet, um diese Erzeugnisse zu charakterisieren.
Aufgrund der Rinderseuche BSE wurde speziell für dlie Kennzeichnung von Rindern und deren Produkten (Rindfleisch und Milch) ein immunologisches Kennzeichnungsverfahren vorgeschlagen, das auf der Immunisierung der zu markierenden Tiere mit spezifischen Proteinen basiert ("Ohrmarke im Blut soll BSE Rinder aufspüren", Süddeutsche Zeitung Nr. 283, 08.12.1998, Seite v2/9). Durch die dadurch verursachte Produktion spezifischer Antikörper im jeweils gekennzeichneten Zieltier, die mutmaßlich in allen Geweben nachzuweisen ist, kann die Kennzeichnung über einen Immun-Assay (ELISA) wieder gelesen werden. Ein solches Verfahren ist jedoch prinzipiell auf höhere Wirbeltiere beschränkt. Außerdem ist die für das Verfahren verfügbare Informationsmenge sehr begrenzt, die informationstragenden Proteine sind nicht hitzebeständig und das Verfahren erfordert vergleichsweise hohe Mengen Substanz für Immunisierung und Nachweisreaktion.
Auch im Fall von Nahrungsmitteln können Logomere auf Nukleinsäurebasis, wie bereits unter "Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse" beschrieben, zur Kennzeichnung eingesetzt werden. Logomere können dabei Informationen über Hersteller, Verfallsdatum, Seriennummer u. a. enthalten. Das Verfahren zur Kennzeichnung von Nahrungsmitteln ist dabei dasselbe, wie bereits unter "Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung gentechnisch hergestellter oder veränderter Erzeugnisse" beschrieben. Mithilfe der dort aufgeführten gentechnischen Rekombinations- und Klonierungstechniken können einzelne Organismen gekennzeichnet werden, sodaß ein einzelner Organismus sowie alle seine Nachfahren identifizierbar sind.
Das Kennzeichnungsverfahren durch Logomere ermöglicht dadurch:
  • - ein Monitoring des Zielproduktes über den gesamten Herstellungs- und Verarbeitungsprozesses bis zum Endverbraucher,
  • - eine einheitliche, schnelle und einfache Identifikation einzelner Bestandteile.
Als Beimischung eignen sich Logomere auf Nukleinsäurebasis zur Kennzeichnung von Getränken.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Kennzeichnung medizinischer und pharmazeutischer Produkte:
Aufgrund der Nichttoxizität eignen sich Logomere auf Nukleinsäurebasis zur Kennzeichnung sensibler und hochsensibler Erzeugnisse. Neben Nahrungsmitteln sind dies auch medizinische und pharmazeutische Produkte. Um Verwechselungen, Kontaminationen und Fälschungen ausschließen zu können, können Logomere z. B. medizinischen und pharmazeutischen Produkten beigemischt werden.
Der Vorteil der Kennzeichnung durch Logomere ist dabei, daß die Kennzeichnung unmittelbar mit dem gekennzeichneten Erzeugnis verbunden ist und daß sich Erzeugnisse z. B. individuell kennzeichnen lassen. Auf diese Weise ist ein Monitoring des Herstellungsprozesses möglich, Erzeugnisse lassen sich auch nach mehrmaligem Umfüllen eindeutig identifizieren und Kontaminationen sowie das Poolen von Proben können nachgewiesen werden. Mithilfe von Logomeren läßt sich z. B. im Falle von Blutkonserven Herstellungs- und Verfallsdatum, Blutgruppe und Hersteller kennzeichnen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise Authentifizierung und Fälschungssicherung:
Logomere können zur Authentifizierung von Erzeugnissen, Gegenständen und Geräten verwendet werden. Dazu werden Logomere vorzugsweise erfindungsgemäß erzeugt und vervielfältigt.
Werden solcherart erhaltene Logomere auf Erzeugnisse, Gegenstände und Geräte an-/­ aufgebracht oder zugemischt, so können die in Logomeren enthaltenen erfindungsgemäß jederzeit wieder ausgelesen werden. Sollten zur Erzeugung der Logomere Verschlüsselungstechniken verwendet werden, wie bereits beschrieben, so erfordert das Auslesen autorisierten Zugriff.
Beispielsweise können erfindungsgemäß erhaltene Logomere in wässriger Lösung (vorzugsweise zu 103 bis 1018 Molekülen/µl) unmittelbar zur Kennzeichnung auf Dokumente aufgebracht werden. Als solches können sie als Echtheitszertifikat des solcherart markierten Dokumentes dienen. Zum Auslesen der als Kennzeichner dienenden Logomere wird einfach ein kleines Schnipsel des Papiers (1 mm2 ist ausreichend) als Template einer erfindungsgemäßen PCR-Auslesereaktion verwendet. Ein Beispiel findet sich in Abb. 16.
In dem zugrundeliegenden Ausleseexperiment wurde zum Test des Prinzips ein Logomer in wässriger Lösung in ca. 109 Molekülen/µl auf 3M Postlt Papier ca. 1 Stunde getrocknet und 1 mm2 des Post-lts als Template einer Auslese-PCR verwendet. Es können Dokumente beliebiger Papierqualität verwendet werden, z. B. 80 g/m2 Standardkopierpapier.
Dasselbe Verfahren eignet sich auch zur Kennzeichnung von Geld oder Geldscheinen, wobei hier Vorteile darin bestehen,
  • - auch bereits gedruckte Scheine markieren zu können,
  • - Seriennummern vergeben zu können,
  • - Verschlüsselung einzusetzen.
Um Dokumente möglichst in Echtzeit auf Authentizität prüfen zu können, kann einer der zum Auslesen in der PCR benutzten Primer auch als Hybridisierungsonde für eine nachfolgende Färbe-Nachweisreaktion (z. B. mit einem interkalierenden Farbstoff, z. B. Ethidiumbromid) verwendet werden.
Ein weiteres Beispiel ist die Authentifizierung flüssiger Lösungen, Suspensionen und Emulsionen mit Logomeren. So kann etwa Tinte mit Logomeren individuell markiert werden, so daß Unterschriften damit auf Echtheit überprüft werden können.
Ein weiteres Beispiel ist die Kennzeichnung von Automobilen durch das Versetzen des Autolackes mit Logomeren. Dabei werden Logomere dem Autolack (oder anderen Bestandteilen des KFZ) als Beimischung zugesetzt. Die zugesetzten Logomere können dabei Informationen über Seriennummer, Hersteller, Fahrzeugtyp o. a. Angaben enthalten. Aufgrund dieser Informationen kann im Falle von Unfall, Diebstahl oder illegaler Entsorgung ein Fahrzeug identifiziert werden. Ein Vorteil der hier beschriebenen Methode liegt darin, daß schon Lackspuren zur Identifikation des Fahrzeuges ausreichen, was insbesondere bei Unfällen von Interesse sein kann. Ein weiterer Vorteil ist, daß die Identität eines Fahrzeuges nur sehr aufwendig zu fälschen ist. Dazu müßten erstens alle gekennzeichneten Bestandteile entfernt, zweitens eine gefälschte Identität eingerichtet werden. Dieses Unterfangen ist alleine durch den mechanischen Aufwand sehr schwierig, außerdem läßt sich durch den Einsatz kryptografischer Methoden das Nachmachen und Nachahmen von Kennungen beliebig erschweren. Zum Auslesen der als Logomere enthaltenen Informationen, werden die Logomere aus dem Lack isoliert und können dann wie in der Beschreibung zum Auslesen der in Logomeren enthaltenen Information, vorzugsweise durch PCR, ausgelesen werden. Dazu wird eine Probe des Lackes entnommen, mit einem geeigneten Lösungsmittel (Terpentin o. ä.) gelöst und mit gleichem Volumen Wasser versetzt. Durch nachfolgende Zentrifugation werden hydrophile und hydrophobe Bestandteile getrennt. Daraufhin nimmt man die wässrige Phase auf (worin sich die hydrophilen nukleinsäurebasierten Logomere befinden) und fällt die enthaltenen Logomere nach den üblichen Methoden (z. B. wie in [J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)] beschrieben). Nach der Fällung können die erhaltenen Logomere nach den erfindungsgemäßen Verfahren, z. B. durch Auslese-PCR, ausgelesen werden.
Daher sind weitere Gegenstände der vorliegenden Erfindung die Verwendungen informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen informationstragenden Polymere, zum Zwecke der Qualitätssicherung, der Fälschungssicherung, der Kennzeichnung von Lebensmitteln, der Kennzeichnung gentechnischer, chemischer, medizinischer und pharmazeutischer Erzeugnisse, der Kennzeichnung von Organismen, der Kennzeichnung von Dokumenten, der Kennzeichnung von Geld, der Kennzeichnung von Gegenständen und Maschinen, der Kennzeichnung von Lösungen, Suspensionen und Emulsionen sowie der Authentifizierung von Personen und Gegenständen.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung von Molekulargewichtsstandards:
Zu den typischen Verfahren der molekularbiologischen Analytik gehört die elektrophoretische Längenauftrennung von DNA- und RNA-Fragmenten. Um die Länge solcher Fragmenten bei der Elektrophorese zu bestimmen, verwendet man üblicherweise einen Molekulargewichtsstandard ("Leiter"), der Fragmente bekannter Länge enthält und zum Vergleich mit den Fragmenten der zu analysierenden Proben dient.
Bisher gibt es Molekulargewichtsstandards, die entweder unregelmäßige Leitern enthalten (z. B. Boehringer V, Boehringer Mannheim, Katalog Nr.: 821 705) oder regelmäßige Leitern mit regelmäßigen Fragment-Längenabständen (z. B. 50 bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10416-014). Keine der bisherigen Leitern hat dabei kürzere Längenabstände als 10 bp (z. B. 10 bp Leiter Gibco BRL, Life Technologies, Katalog Nr. 10821-015).
Mit den hier beschriebenen Verfahren können gezielt DNA Fragmente verschiedener Länge und definierter Längenabstände hergestellt werden. Diese Fragmente können als Molekulargewichtsstandards genutzt werden, wobei das Verfahren erlaubt, prinzipiell beliebige Längen und beliebige Längenabstände zu realisieren. Insbesondere sind Längenabstände bis hinab zu 1 bp Abstand, also Molekulargewichtsstandards höchster Auflösung, möglich.
Das Verfahren beruht darauf, Logomere als Template einer Auslese-PCR zu verwenden, deren Resultat ein Gemisch von DNA Fragmenten definierter Länge und definierter Längenabstände ist. Es basiert auf den bereits beschriebenen erfindungsgemäßen Verfahren zur Erzeugung und dem Auslesen von Logomeren.
DNA Fragmente verschiedener Länge in sehr kurzen, regelmäßigen Abständen können erhalten werden, wenn ein unäres Polymer als Template einer Auslese-PCR mit verschachtelten Primern fungiert. Der 5'-Primer primt in der Start-Sequenz des Polymers. Als gegenläufige 3' Primer fungiert eine Gruppe von Primern, die verschachtelt in dem Elongator ansetzt (in Abb. 17 dargestellt als 3 Ebenen gegeneinander versetzter Primer). Da das Polymer aus Wiederholungen nur eines Elongator-Moleküls besteht, erhält man für n Wiederholungen und m verschachtelte 3' Primer n.m Banden. Das Verfahren funktioniert auch spiegelbildlich mit einem im Ende-Terminator primenden Primer und dementsprechen gegenläufigen 5' Primern. Die erhaltenen Banden können als Molekulargewichtsstandards z. B. in Elektrophoresen eingesetzt werden.
Für hochauflösende Molekulargewichtsstandards ist die Verwendung unärer Logomere und verschachtelter Primer am zweckmäßigsten. Jedoch ist das Verfahren nicht darauf beschränkt, da im Prinzip alle im erfindungsgemäßen Schritt I beschriebenen Grammatiken verwendet werden können.
Unäre Logomere beliebiger Länge können mit einer Grammatik G = (Σ, V, R, S) mit Terminalalphabet Σ: = {0, s, e}, Variablenmenge V: = {A}, Startsymbol S und Regelmenge
R: =
{
S: = sA
A → aA
A → e
}
hergestellt werden. Sollte es nötig sein, unäre Logomere definierter Länge herzustellen, muß dementsprechend die Variablenmenge und damit auch die Zahl der Elongatoren größer gewählt werden (wie z. B. in der Grammatik zur Implementierung eines 1-Byte Alphabets bereits beschrieben). Je nach gewünschter Länge der zu erzeugenden DNA Fragmente kann außerdem die Länge der Algomere variiert werden.
Die so erzeugten Logomere können nach den erfindungsgemäßen Verfahren vereinzelt und vervielfältigt werden.
Das Erzeugen von DNA-Fragmenten definierter Länge und definierter Längenabstände erfolgt vorzugsweise mit PCR analog dem erfindungsgemäßen Verfahren zum Auslesen von Logomeren. Für hochauflösende Molekulargewichtsstandards wird pro Elongator mindestens ein Primer, meistens sogar eine Anzahl mehrerer Primer verwendet, die gegeneinander verschoben sind. Die Anzahl der Primer pro Elongator ist abhängig von den gewünschten Längenabständen. Ist etwa gewünscht, Algomere der Länge 30 bp zu verwenden und sollen die Längen der erzeugten DNA Fragmente jeweils 10 bp Unterschied haben, so sind pro Elongator drei Primer, die jeweils genau 10 bp gegeneinander verschoben sind, eingesetzt werden.
Für die Synthese von Sequenzen zur Herstellung von Algomeren und Logomeren müssen die Anforderungen erfüllt werden, die bereits unter Schritt II des erfindungsgemäßen Verfahrens beschrieben wurden. Insbesondere gewährleistet das verwendete NFR-Verfahren dadurch, daß die jeweils als Template dienenden Teilsequenzen einen gleichen GC-Anteil besitzen können, den Einsatz verschachtelter Primer und die Ausgewogenheit des AT/GC Verhältnisses der erzeugten DNA Fragmente. Letzteres ist insbesondere angesichts dessen entscheidend, daß das Laufverhalten von DNA Fragmenten in der Elektrophorese nicht nur von der Länge, sondern auch von der Zusammensetzung der Fragmente abhängt. Dies gilt insbesondere für hochauflösende Molekulargewichtsstandards in denen es nur sehr geringe Längenabstände gibt.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen informationstragenden Polymere, zur Herstellung von Molekulargewichtsstandards.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung polymerer Datenspeicher:
Die beschriebenen Logomere können als RAM (Lesen und Schreiben) und ROM (nur Lesen) Datenspeicher hoher Kapazität und niedrigen Energieverbrauchs genutzt werden. Um eine möglichst hohe Informationsdichte zu gewährleisten und die Handhabung des Speichers möglichst einfach zu machen, werden die Logomere an einen festen Träger gebunden. Dies gewährleistet, daß die Logomere einzeln adressiert, d. h. einzeln geschrieben, gelesen und gelöscht werden können (siehe Abb. 9).
Die benötigten Schreib- und Leseoperationen werden auf der Basis der im erfindungsgemäßen Schritt V und der unter Auslesen der in Logomeren enthaltenen Information beschriebenen enzymatischen Reaktionen durchgeführt, die ihrerseits durch Temperaturänderungen gesteuert werden. Die Temperaturänderungen können entweder per Laser oder durch Erhitzen und Abkühlen des festen Trägers z. B. in einem Thermozykler durchgeführt werden.
Zum Schreiben wird eine Modifikation des oben beschriebenen Verfahrens der Symbolpolymerisation verwendet. Die Polymerisation findet an einem festen Träger statt, die Algomere werden durch wiederholte Restriktions-Ligationszyklen miteinander verkettet.
Um einzelne, adressierbare Speicherzellen herzustellen, werden in bestimmten Abständen einzelsträngige "Ankermoleküle" irreversibel (durch UV-Bestrahlung oder im Ofen) an den Träger gebunden. Der solcherart mit Ankermolekülen versehene Träger kann nun reversibel mit Logomeren beschrieben werden, die in einem Löschvorgang wieder davon entfernt werden können.
Bei einem Schreibvorgang werden zuerst spezifische Algomere ("Starter-Algomere") durch Hybridisierung an die Ankermoleküle gebunden. Diese Starter-Algomere sind ihrerseits Ausgangspunkt einer Symbolpolymerisation, bei der weitere Algomere miteinander verkettet werden. Die Verkettung der Algomere erfolgt dabei, abweichend von dem im Schritt V des erfindungsgemäßen Verfahrens beschriebenen Vorgehen, durch wiederholte Zyklen von Restriktion und Ligation. Bei jedem Zyklus wird das jeweils letzte Algomer einer polymerisierenden Kette mit einem Restriktionsenzym geschnitten, so daß eine einzelsträngige Überhangsequenz (Elongationspunkt) entsteht, an die seinerseits das nächstfolgende Algomer durch Ligation gebunden werden kann.
Für den solcherart beschriebenen Schreibvorgang müssen die Algomere ein spezifisches Design aufweisen:
  • a) Jedes zu schreibende Algomer besitzt eine einzelsträngige Überhangsequenz, mit der es an den Elongationspunkt eines Logomers binden kann.
  • b) Ein Algomer, das nur eine einzelsträngige Überhangsequenz besitzt mit der es an einen Elongationspunkt binden kann, selbst aber keine Restriktionsschnittstelle besitzt, durch die es von Restriktionsenzymen erkannt werden kann und damit nicht als Elongationspunkt dienen kann, heißt Ende-Algomer.
  • c) Jedes zu schreibende Algomer, das nicht das Ende-Algomer ist, besitzt ein doppelsträngiges Ende, worin sich die Erkennungssequenz für das jeweils gewählte Restriktionsenzym befindet. Bei einer Restriktion spaltet das Enzym das Algomer, so daß eine einzelsträngige Überhangsequenz entsteht, die ihrerseits selbst wieder als Elongationspunkt dienen kann.
  • d) Jedes fertige Logomer besitzt genau ein Starter- und ein Ende-Algomer. Starter- und Ende-Algomere sind, entsprechend der oben gegebenen Definition, Terminatoren.
  • e) Die Überhangsequenzen der Algomere sind kompatibel zu einem jeweils gewählten Restriktionsenzym, so daß ein zu verkettendes Algomer an den Elongationspunkt eines Logomers binden kann und der nachfolgend durch Restriktion entstehende Elongationspunkt identisch zu seinem Vorläufer ist.
  • f) Die im Algomer auf die Überhangsequenz folgende Sequenz ist solcherart gewählt, daß ein verkettetes Algomer durch einen nachfolgenden Restriktionsvorgang nicht wieder abgespalten werden kann.
Als fester Träger eignen sich Membranen wie Gene Screen Plus (DuPont, Biotechnology Systems, Katalog Nr.: NEF-986 oder NEF-987), Hybond-N (Amersham Life Sciences, Katalog Nr.: RPN 82N oder RPN 137 N), Silizium-, Silicat-Oberflächen oder Glas. Die Ankermoleküle werden jeweils kovalent daran gebunden (UV-Bestrahlung oder Hitze).
Damit die Moleküle einzeln adressierbar sind, müssen sie in regelmäßigen Abständen auf dem Träger angebracht werden.
Als Restriktionsenzyme eignen sich handelsübliche Enzyme, vorzugsweise solche, die nicht bei 65°C deaktiviert werden (z. B. HindIII).
Die Schreiboperationen basieren darauf, daß die zum Schreiben verwendeten Enzyme unterschiedliche Temperaturoptima haben. So liegt das Temperaturoptimum der zum Verketten von Symbolen verwendeten Ligase bei 16°C, wohingegen die benötigten Restriktionsenzyme nur bei 37°C funktionieren. Dadurch ist das getaktete Schreiben von Symbolen in Zyklen von Restriktion und Ligation möglich.
Da alle Lese- und Schreiboperationen mithilfe von Enzymen durchgeführt werden, ist es nötig, den Träger temperieren zu können. Dabei können, bei der Verwendung eines Thermozyklers und thermomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation unterworfen werden. Alternativ können Speicherzelllen einzeln und unabhängig voneinander zugegriffen werden, wenn ein entsprechend kleiner Schreib-/Lesekopf eingesetzt wird. Dieser Schreib-/Lesekopf muß einerseits als Pipettiervorrichtung für die benötigten Moleküle (Enzyme, Algomere) dienen und andererseits die für eine bestimmte Manipulation benötigte Temperatur erzeugen (z. B. mit Hilfe eines Lasers).
Beim Löschvorgang wird ein Logomer durch Denaturierung vom jeweiligen Ankermolekül gelöst. Das Ankermolekül steht danach wieder für einen Schreibvorgang zur Verfügung. Für einen Lesevorgang wird ein Logomer durch Denaturierung von einem Ankermolekül gelöst. Es kann dann nach den erfindungsgemäßen Verfahren ausgelesen werden.
Die beschriebenen Operationen Schreiben, Löschen, Lesen werden durch Enzyme bei verschiedenen Temperaturen durchgeführt. Dabei können, bei der Verwendung eines thermomanipulierbaren Materials, alle Speicherzellen simultan derselben Operation unterworfen werden. Alternativ können Speicherzelllen einzeln und unabhängig voneinander zugegriffen werden, wenn ein entsprechend kleiner Schreib-/Lesekopf eingesetzt wird. Dieser Schreib-/Lesekopf muß einerseits als Pipettiervorrichtung dienen und andererseits die für eine bestimmte Manipulation benötigte Temperatur erzeugen.
Der Vorteil des hier vorgestellten Polymerspeichers besteht gegenüber den bisher verwendeten Materialien in einer höheren Speichendichte (DNA Moleküle haben eine Größe, die bei 10-10 m liegt), und einem sehr viel geringeren Energieverbrauch (zur Berechnung der in enzymatischen Reaktionen benötigten Energie siehe [L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)]). Außerdem ergibt sich eine erheblich verbesserte Umweltverträglichkeit, weil die hier beschriebenen Polymere Biomoleküle ohne jegliche Toxizität sind.
Der hier beschriebene Ansatz hat gegenüber den bisher für das DNA Computing verwendeten wässrigen Lösungen den Vorzug höherer Speichendichte und der Adressierbarkeit einzelner Polymere.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein polymerer Datenspeicher, umfassend erfindungsgemäße informationstragende Polymere, erfindungsgemäße Verfahren zur Verknüpfung von Molekülen, erfindungsgemäße Ausleseverfahren oder erfindungsgemäße Isolierungs- und Vervielfältigungsverfahren.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung eines DNA Computers:
Mithilfe der bereits beschriebenen Informationsdarstellung durch Algomere und Logomere kann ein DNA Computer konstruiert werden. Der DNA Computer umfaßt (s. Abb. 10):
  • a) Oligonukleotidsynthesizer
  • b) Thermozykler
  • c) Pipettiervorrichtung
  • d) Vorrichtung zur Isolation von Polymeren
  • e) Vorrichtung zur Auftrennung von Nukleinsäuren, z. B. Elektrophoresesystem
  • f) Scanner
  • g) Steuerungsrechner (Workstation, z. B. PC)
Der DNA Computer ist konstruiert als ein Hybridsystem, bei dem einfache, rechenintensive Algorithmen oder die Speicherung von Daten mithilfe von DNA und den dazu benötigten Geräten (Geräte a) bis e)) vorgenommen werden und ein herkömmlicher Computer (vorzugsweise Workstation, z. B. PC) als Host und Steuerungsrechner dient.
Der DNA Computers beinhaltet mindestens einen Thermozykler, der als "Informationsreaktor" dient und über den Steuerungsrechner gesteuert werden kann (z. B. MJ Research PTC-100, Eppendorf Mastercycler). In den Tubes oder Mikrotiterplatten des Thermozyklers befinden sich Molekülgemische aus Nukleinsäuren, Enzymean und weiteren chemischen Substanzen (z. B. Puffer, Nukleotide), die für die Algomer-Assemblierung (Schritt IV des erfindungsgemäßen Verfahrens) und die Symbolpolymerisation (Schritt V des erfindungsgemäßen Verfahrens) benötigt werden. Programmiert wird der DNA Computer durch die Implementierung von Algorithmen als Grammatiken (Schritt I des erfindungsgemäßen Verfahrens). Die für dlie Grammatiken jeweils benötigten Monomersequenzen werden durch das NFR-Verfahren und die Benutzung eines Oligonukleotidsynthesizers (z. B. ABI 392, ABI 398, ABI 3948 von Perkin-Elmer Applied Biosystems) hergestellt (Schritte II und III des erfindungsgemäßen Verfahrens). Diese Monomersequenzen gehen als Input in den Thermozykler ein, in dem die Algomer- Assemblierung (Schritt IV des erfindungsgemäßen Verfahrens) stattfindet.
Die so gewonnenen Algomere werden in eine oder mehrere Reaktionskammern des Thermozyklers überführt, wo sie zu Logomeren verknüpft werden (Symbolpolymerisation, Schritt V des erfindungsgemäßen Verfahrens). Die so gewonnen Logomere werden in einer eigenen Vorrichtung isoliert und vervielfältigt. Diese Vorrichtung kann nach den Prinzipien arbeiten, die in dem erfindungsgemäßen Verfahren beschrieben worden sind. Nach Isolierung und Vervielfältigung können die Logomere gelesen werden. Dazu werden sie wiederum in einem Thermozykler erfindungsgemäß ausgelesen. Die aus dem Ausleseverfahren resultierenden Nukleinsäurefragmente können, wie bereits beschrieben, durch Gelelektrophorese gelesen werden. Hier dient das Gelelektrophoresegerät als Ausgabegerät des DNA Computers, die solcherart erhaltenen Bandenmuster werden von einem Scanner in den Steuerungsrechner eingelesen.
Der Steuerungsrechner nimmt jetzt seinerseits aufgrund der solcherart erhaltenen Ergebnisse weitere Berechnungen und Steuerungen vor und setzt ggfs. weitere molekulare Reaktionen in Gang. Z. B. kann der Steuerungscomputer aufgrund erhaltener Ergebnisse die Neuimplementierung von Grammatiken (Herstellung von Oligomeren mit dem NFR- Verfahren) veranlassen. Auf diese Weise können die durch molekulare Verfahren als Logomere erhaltenen Informationen nicht nur als passive Daten sondern auch als Instruktionen (und Adressen) dienen. Dadurch ist ein sich selbst steuernder Prozeß verschiedener Algorithmen möglich, der für eine universelle Datenverarbeitung nötig ist.
Der DNA Computer verarbeitet dabei Informationen als Oligo- und Polymere. Als Speicherzellen der Daten dienen Klonierungsvektonen (Plasmide), die sich in flüssiger Lösung oder auf einem festen, adressierbaren Träger befinden.
Der DNA Computer ist wie oben beschrieben mittels Grammatiken programmierbar und kann von einem herkömmlichen Computer, der als Steuerungsrechner und Host-System fungiert, gesteuert werden. Da der DNA Computer bestimmte Operationen in molaren Größenordnungen (z. B. die Symbolpolymerisation, wie in Schritt V des erfindungsgemäßen Verfahrens beschrieben, in 1012-1020 Elementaroperationen pro Sekunde) vornehmen kann, ist eine mögliche Anwendung die Berechnung einfacher, rechenintensiver Algorithmen. Jedoch kann der DNA Computer auch für andere Anwendungen, z. B. die Erzeugung bestimmter, regelmäßiger DNA Strukturen, die z. B. innerhalb der Nanotechnologie interessant sind, verwendet werden.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher ein DNA-Computer, umfassend erfindungsgemäße informationstragende Polymere. Ein weiterer Gegenstand der vorliegenden Erfindung ist ein DNA-Computer, in dem ein erfindungsgemäßes Ausleseverfahren und/oder erfindungsgemäße Isolierungs- und Vervielfältigungsverfahren eingesetzt werden.
Die oben beschriebenen Verfahren ermöglichen beispielsweise die Herstellung kleinster molekularer Strukturen mit Logomeren:
Mit den hier beschriebenen Logomeren lassen sich kleinste molekulare Strukturen (Nanostrukturen) herstellen. Bausteine solcher Strukturen sind Algomere, die zu regelmäßigen Mustern von Logomeren zusammengefügt werden können. Z. B. können verschiedene Algomere mit unterschiedlichen Fremdmolekülen (Liganden) dotiert werden, um regelmäßige, höhermolekulare Muster der jeweiligen Liganden zu erhalten. Die Logomere fungieren dabei als "Skelett" molekularer Baugruppen von Liganden.
Z. B. könnte ein binäres Logomer alternierende Muster leitfähiger und nicht-leitfähiger Liganden enthalten. Durch die Anordnung vieler Logomere auf einem festen Träger können so Leiterbahnen im Nanometerbereich entstehen.
Als Liganden können aber auch Biomoleküle, Antikörper, optisch aktive Moleküle o.a. verwendet werden.
Logomere können als "intelligenter" Klebstoff eingesetzt werden (siehe Abb. 18). Dabei macht man sich die Hybridisierung komplementärer Nukleotide zunutze. Bringt man auf die zu verklebenden Flächen Logomere auf, die etwa kovalent an die zu verklebenden Flächen gebunden werden, so können ansonsten völlig identische Flächen nur dann verkleben, wenn sie komplementäre Sequenzen aufweisen, da nur jeweils Flächen komplementärer Nukleinsäuren Wasserstoffbrückenbindungen ausbilden. Die "Intelligenz" des Klebstoffes besteht also in einer durch die jeweils verwendeten Sequenzen hochselektiven Adhäsionswirkung. Dabei kann auch die Adhäsionsstärke für zu verklebende Flächen genau eingestellt werden: Zum einen kann über die Dichte der Logomere auf den jeweiligen Flächen deren Adhäsionsstärke eingestellt werden, zum anderen kann über das AT/GC Verhältnis der Logomere deren Schmelzpunkt variiert werden, so daß verklebte Flächen bei unterschiedlichen Temperaturen ihre Adhäsion verlieren. Aufgrund der Tatsache, daß hier unschädliche, leicht abbaubare Biomoleküle als Klebstoff verwendet werden, können derartige Klebstoffe auch zur medizinische Verwendung (z. B. Chirurgie, Mikrochirugie) eingesetzt werden. Eine andere Verwendung ist die Nutzung des beschriebenen Verfahrens in Hochpräzisions- und Authentifizierungsanwendungen.
Versetzt man die zur Herstellung von Logomeren verwendeten Algomeren mit Sequenzen zur Bindung von Liganden, so können stärkere Adhäsionswirkungen erreicht werden. Solche Liganden können im Falle von DNA DNA-bindenden Proteinen, z. B. spezifische, gegen DNA- Sequenzen gerichtete Antikörper sein. Diese können z. B. jeweils über einen weiteren Liganden untereinander verbunden werden (siehe Abb. 19). Eine einfache, nicht­ programmierbare Adhäsionswirkung kann auch ohne Logomere erreicht werden, wenn die verwendeten Proteine (z. B. Antikörper) ihrerseits an die zu verklebenden Flächen binden können (wie z. B. Antikörper, wenn die zu verklebende Fläche ihr Antigen ist). Siehe dazu auch Abb. 20. Einfachere Klebstoffe sind möglich, wenn, an bestimmte Flächen spezifisch bindende, Proteine gentechnisch hergestellt werden.
Mit Logomeren können Oberflächen unterschiedlichster Struktur und unterschiedlichster physikalischer Eigenschaften hergestellt werden. Den Anwendungen ist gemein, daß sich mit den Logomeren nahezu beliebige Muster im Nanometerbereich bilden lassen, die das Skelett kleinster molekularer Bauelemente sein können.
Ein weiterer Gegenstand der vorliegenden Erfindung ist daher die Verwendung informationstragender Polymere, insbesondere der erfindungsgemäß erhältlichen informationstragenden Polymere, zur Herstellung oder Bearbeitung kleinster molekularer Strukturen oder als molekularer Kleber.
Referenzen
Patente
Veröffentlichungen
L. M. Adleman, Molecular Computation of Solutions to Combinatorial Problems, Science, 266, 1021-1024, (1994)
Breslauer, K. J., Frank, R., Blocker, H., Marky, L. A., Proc. Natl. Acad. Sci., 83, 3746-3750, 1989
Capecchi M. R., Altering the genome by homologous recombination. Science, 244(4910), 1288-­ 1292, (1989)
Chomsky, N., Three models for the description of language, JACM, 2 : 3, 113-124, (1956)
Chomsky, N., On certain formal properties of grammars, Inf. and Control, 2 : 2, 137-167, (1959)
Chomsky, N., Formal properties of grammars, Handbook of Math. Psych., 2, 323-418, (1963)
Frank Guarnieri, Makiko Fliss, Carter Bancroft, Making DNA Add, Science, 273, 220-223, (1996)
John E. Hopcroft, Formal Languages And Their Relation To Automata, (1969)
Jeffreys, Minisatellite reapeat coding as a digital approach to DNA typing, Nature, 354, 204-209, (1991)
Kilby, N. J., Snaith, M. R. & Murray, J. A., Site-specific recombinases: tools for genome engineering, Trends Genet., 9, 413-421, (1993)
Rolf Knippers, Molekulare Genetik, Georg Thieme Verlag, (1997)
Benjamin Lewin, Genes V, Oxford University Press, (1994)
Lund, A. H., Duch, M., Pedersen, F. S. Increased cloning efficency by temperature-cycle ligation, Nucleic Acids Research, 24: (4), 800-801, (1996)
J. Sambrook, E. F. Fritsch, T. Maniatis, Molecular Cloning, A Laboratory Manual, (1989)
Jens Niehaus, DNA Computing: Bewertung und Simulation, Diplomarbeit am Fachbereich Informatik der Universität Dortmund, Lehrstuhl XI, 116-123, (1998)
Qi Ouyang, Peter D. Kaplan, Shumao Liu, Albert Libchaber, DNA Solution of the Maximal Clique Problem, Science, 278, 446-449, (1997)
Erik Winfree, Xiaoping Yang, Nadrian C. Seeman, Universal Computation via Self-assembly of DNA: Some Theory and Experiments, Proceedings of the 2nd DIMACS Meeting on DNA Based Computers, Princeton University, June 20-12, (1996)
Erik Winfree, Furong Liu, Lisa A. Wenzler & Nadrian C. Seeman, Design and self-assembly of two-dimensional DNA crystals, Nature, 394, 539-544, (1998)

Claims (31)

1. Verfahren zur Herstellung von informationstragenden Polymeren, das umfaßt,
  • A) eine reguläre Grammatik G = (Σ, V, R, S) mit einem endlichen Terminalalphabet Σ, einer endlichen Variablenmenge V, einer endlichen Regelmenge R und einem Startsymbol S zu definieren;
  • B) das NFR-Verfahren (Niehaus-Feldkamp-Rauhe-Verfahren) zur Herstellung von Monomersequenzen;
  • C) mit dem NFR-Verfahren eine in Schritt I definierte Grammatik zu implementieren, indem damit Monomersequenzen hergestellt werden, die die Regelmenge R einer Grammatik G eindeutig darstellen;
  • D) aus den in Schritt III hergestellten Monomersequenzen für jede Regel der Regelmenge R von G ein die Regel repräsentierendes Oligomer zusammenzusetzen;
  • E) die in Schritt IV zusammengesetzten Oligomere zu informationstragenden Polymeren zu verknüpfen.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß das Terminalalphabet Σ einer Grammatik G die Terminale 0, 1, n Startterminale s (s0, s1, . . ., sn) und m Endterminale e (e0, e1, . . ., em), enthält, wobei n und m jeweils größer oder gleich 0 sind und eine natürliche Zahl darstellen.
3. Verfahren nach Anspruch 1 oder 2, dadurch gekennzeichnet, daß die in Schritt III konstruierte Monomersequenz Nukleotide, insbesondere Ribonukleotide, besonders bevorzugt Desoxyribonukleotide umfaßt.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß die in Schritt III konstruierte Monomersequenz Proteinerkennungssequenzen (z. B. Restriktionsschnittstellen, Proteinbindungsstellen, Stopcodons) umfaßt.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß man die Synthese der Monomersequenzen in Schritt II und III in vitro, vorzugsweise mittels eines Oligonukleotid-Synthezisers vornimmt.
6. Verfahren zur Isolierung und Vervielfältigung von informationstragenden Polymeren, die nach einem der vorhergehenden Ansprüche erhalten wurden, dadurch gekennzeichnet, daß man in Schritt V erhaltene informationstragende Polymere in Klonierungsvektoren ligiert, kompetente Zellen mit diesen Vektoren transformiert und die erfolgreich transformierten Bakterien anhand von Selektionsmarkern selektioniert.
7. Verfahren zum Auslesen von Information aus informationstragenden Polymeren, die nach einem der vorhergehenden Ansprüche erhalten oder isoliert und vervielfältigt wurden, dadurch gekennzeichnet, daß man
  • a) mindestens n-1 das informationstragende Polymer enthaltende Lösungen mit jeweils einem Paar gegenläufiger Primer versetzt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht;
  • b) mindestens n-1 PCR-Ansätze durchführt, wobei n für die Zahl der als Elongatoren in dem Polymer enthaltenen Oligomere steht und jeweils ein Primer eines jeden Paares in dem dem Elongator gegenüberliegenden Terminator primt und der andere Primer in dem Elongator selbst primt;
  • c) die aus der PCR erhaltenen Polymer-Fragmente nach ihrer Länge durch Elektrophorese auftrennt und
  • d) das aus der Elektrophorese erhaltene Muster optisch ausliest.
8. Verfahren nach Anspruch 7, dadurch gekennzeichnet, daß das Auslesen in Schritt d) automatisiert durch einen Scanner oder eine Sequenziermaschine erfolgt.
9. Informationstragendes Polymer, erhältlich nach einem der Ansprüche 1 bis 6.
10. Zufallszahlengenerator, umfassend informationstragende Polymere, insbesondere Polymere nach Anspruch 9.
11. Polymerer Datenspeicher, umfassend informationstragende Polymere nach Anspruch 9.
12. DNA-Computer, umfassend informationstragende Polymere nach Anspruch 9.
13. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Herstellung von Molekulargewichtsstandards.
14. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Darstellung von Datenstrukturen.
15. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 als Marker oder Signaturen.
16. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Qualitätssicherung.
17. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Fälschungssicherung.
18. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung gentechnischer Erzeugnisse.
19. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung von Lebensmitteln.
20. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung von Organismen.
21. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung chemischer Erzeugnisse.
22. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung medizinischer und pharmazeutischer Erzeugnisse.
23. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung von Dokumenten.
24. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung von Geld.
25. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung von Gegenständen und Maschinen.
26. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Kennzeichnung von Flüssigkeiten, Lösungen, Suspensionen oder Emulsionen.
27. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zur Verschlüsselung von Information.
28. Verwendung von informationstragenden Polymeren, insbesondere von Polymeren nach Anspruch 9 zum Zwecke der Authentisierung von Personen und Gegenständen.
29. Verwendung von informationstragenden Polymeeren, insbesondere von Polymeren nach Anspruch 9 als molekulare Kleber.
30. Verwendung von informationstragenden Polynneren nach Anspruch 9 zur Herstellung oder Bearbeitung kleinster molekularer Strukturen.
31. Verwendung von informationstragenden Polymeren nach Anspruch 9 zur Qualitätskontrolle synthetisch hergestellter Oligonukleotide.
DE1999114808 1999-03-31 1999-03-31 Informationstragende Polymere Withdrawn DE19914808A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE1999114808 DE19914808A1 (de) 1999-03-31 1999-03-31 Informationstragende Polymere
JP2000609427A JP2002541539A (ja) 1999-03-31 2000-03-31 情報伝達及び情報処理ポリマー
PCT/EP2000/002893 WO2000059917A2 (de) 1999-03-31 2000-03-31 Informationstragende und informationsverarbeitende polymere
EP00925150A EP1169330A2 (de) 1999-03-31 2000-03-31 Informationstragende und informationsverarbeitende polymere

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE1999114808 DE19914808A1 (de) 1999-03-31 1999-03-31 Informationstragende Polymere

Publications (1)

Publication Number Publication Date
DE19914808A1 true DE19914808A1 (de) 2000-10-19

Family

ID=7903204

Family Applications (1)

Application Number Title Priority Date Filing Date
DE1999114808 Withdrawn DE19914808A1 (de) 1999-03-31 1999-03-31 Informationstragende Polymere

Country Status (4)

Country Link
EP (1) EP1169330A2 (de)
JP (1) JP2002541539A (de)
DE (1) DE19914808A1 (de)
WO (1) WO2000059917A2 (de)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10120349A1 (de) * 2001-04-21 2002-10-31 Michael Schwertner Verfahren zur Erfassung molekularer Bindungsereignisse auf Affinitätssensoren
DE10236034A1 (de) * 2002-08-06 2004-02-19 Hilmar Rauhe Markierungssubstanz
DE10260805A1 (de) * 2002-12-23 2004-07-22 Geneart Gmbh Verfahren und Vorrichtung zum Optimieren einer Nucleotidsequenz zur Expression eines Proteins
DE102008008193A1 (de) 2008-02-08 2009-08-13 Schaeffler Kg Lager mit Markierung
DE102009060836A1 (de) 2009-12-29 2011-06-30 3mach GmbH, 72414 Anschmutzung

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0103364D0 (en) * 2001-02-10 2001-03-28 Nat Inst Of Agricultural Botan Storage of encoded information within biological macromolecules
US20050053968A1 (en) * 2003-03-31 2005-03-10 Council Of Scientific And Industrial Research Method for storing information in DNA
JP2004329014A (ja) * 2003-04-30 2004-11-25 Id Technica:Kk 偽造行為防止機能を備えた識別手段を付加する識別添加物質及び識別情報保持物並びに識別情報保持物の不正使用検出方法
JP4752041B2 (ja) * 2004-02-12 2011-08-17 独立行政法人 国立印刷局 偽造防止用紙、該用紙の製造方法及び該用紙の識別方法
JP4619012B2 (ja) * 2004-02-19 2011-01-26 トヨタ自動車株式会社 三次元dnaネットワークの構築方法
JP2006094807A (ja) * 2004-09-30 2006-04-13 Nissan Motor Co Ltd 情報化核酸担持微粒子及びその製造方法
JP2006094814A (ja) * 2004-09-30 2006-04-13 Nissan Motor Co Ltd 情報化核酸及びこれを用いた情報化核酸組成物
JP2007237299A (ja) * 2006-03-06 2007-09-20 Osaka Industrial Promotion Organization Dnaを用いた部品組付方法、部品組付基材、組付部品
JP5200069B2 (ja) * 2010-07-27 2013-05-15 トヨタ自動車株式会社 三次元dnaネットワーク
WO2016149296A1 (en) * 2015-03-17 2016-09-22 Apdn (B.V.I.) Inc. Method for authenticating active pharmaceutical ingredients

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5843661A (en) * 1996-04-24 1998-12-01 California Institute Of Technology Method for construction universal DNA based molecular turing machine

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2649518B1 (fr) * 1989-07-07 1991-10-18 Bioprobe Systems Sa Procede et dispositif de marquage crypte de haute securite pour la protection d'objets de valeur
US6652808B1 (en) * 1991-11-07 2003-11-25 Nanotronics, Inc. Methods for the electronic assembly and fabrication of devices
US5804373A (en) * 1995-03-31 1998-09-08 Nec Research Institute, Inc. Molecular automata utilizing single- or double-strand oligonucleotides
WO1997024699A1 (en) * 1995-12-29 1997-07-10 S. E. Axis Limited Authentication of articles
EP0976060B1 (de) * 1997-04-15 2001-12-19 Gmd - Forschungszentrum Informationstechnik Gmbh Frei programmierbares, universelles parallel-rechnersystem zur durchführung von allgemeinen berechnungen

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5843661A (en) * 1996-04-24 1998-12-01 California Institute Of Technology Method for construction universal DNA based molecular turing machine

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Chem. Abstr. 125(1996)194609y *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10120349A1 (de) * 2001-04-21 2002-10-31 Michael Schwertner Verfahren zur Erfassung molekularer Bindungsereignisse auf Affinitätssensoren
DE10120349B4 (de) * 2001-04-21 2004-10-28 Michael Schwertner Verfahren zur Erfassung molekularer Bindungsereignisse auf Affinitätssensoren
DE10236034A1 (de) * 2002-08-06 2004-02-19 Hilmar Rauhe Markierungssubstanz
DE10260805A1 (de) * 2002-12-23 2004-07-22 Geneart Gmbh Verfahren und Vorrichtung zum Optimieren einer Nucleotidsequenz zur Expression eines Proteins
US8224578B2 (en) 2002-12-23 2012-07-17 Geneart Ag Method and device for optimizing a nucleotide sequence for the purpose of expression of a protein
DE102008008193A1 (de) 2008-02-08 2009-08-13 Schaeffler Kg Lager mit Markierung
DE102009060836A1 (de) 2009-12-29 2011-06-30 3mach GmbH, 72414 Anschmutzung
WO2011079839A2 (de) 2009-12-29 2011-07-07 3Mach Gmbh Anschmutzung

Also Published As

Publication number Publication date
WO2000059917A2 (de) 2000-10-12
WO2000059917A3 (de) 2001-02-01
JP2002541539A (ja) 2002-12-03
EP1169330A2 (de) 2002-01-09

Similar Documents

Publication Publication Date Title
DE19914808A1 (de) Informationstragende Polymere
Chen et al. Nanopore-based DNA hard drives for rewritable and secure data storage
Wang et al. Paranemic crossover DNA: there and back again
Shapiro Evolution: a view from the 21st century
Shapiro How life changes itself: The Read–Write (RW) genome
Zahradka et al. Reassembly of shattered chromosomes in Deinococcus radiodurans
CA2395874C (en) Dna-based steganography
Kim et al. Self-replication of DNA rings
CN109477130A (zh) 通过迭代dna编辑的存储
Zhu et al. Image Encoding Using Multi‐Level DNA Barcodes with Nanopore Readout
Shapiro et al. What prevents mainstream evolutionists teaching the whole truth about how genomes evolve?
Charles et al. Design of abiological digital poly (phosphodiester) s
US7056724B2 (en) Storing data encoded DNA in living organisms
Stoltzfus Mutation, randomness, and evolution
CN107002069A (zh) 环状dna的扩增方法
US20230175078A1 (en) Rna detection and transcription-dependent editing with reprogrammed tracrrnas
Gogolok et al. STAR: a simple TAL effector assembly reaction using isothermal assembly
Patel A molecular propeller
Park et al. Emerging strategies in infohybrid systems
EP1865070A1 (de) Verfahren zur Markierung von Produkten mit Nukleinsäuren für den Identitäts- und Herkunftsnachweis der Produkte
Jernigan et al. Capillary electrophoresis single‐strand conformational polymorphisms as a method to differentiate algal species
Rauhe et al. Digital DNA molecules
Holden et al. Encrypted oligonucleotide arrays for molecular authentication
Danilevich et al. New insight into formation of DNA-containing microparticles during PCR: the scaffolding role of magnesium pyrophosphate crystals
Danilevich et al. The structural peculiarities of condensed DNA micro-and nanoparticles formed in PCR

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: RAUHE, HILMAR, 50739 KOELN, DE

8139 Disposal/non-payment of the annual fee