-
Die
Erfindung betrifft einen universellen DNA-Computer, bestehend aus
einer Mehrzahl von Bioreaktoren und Filterstufen, die zu einer statischen
Anordnung fest verbunden sind und mit der beliebige mathematische
Operationen ausführbar
sind. Die Erfindung betrifft weiterhin ein Verfahren zur Abarbeitung
von mathematischen Operationen auf Basis von molekularbiologischen
Techniken mittels eines solchen DNA-Computers.
-
Aus
der Druckschrift G. Paun. Splicing – a challenge for formal language
theorists. Journal of Automata, Languages and Combinatorics, vol.
4, no. 1, p. 3–16,
1999 ist ein Verfahren zur Ausführung
von mathematischen Operationen mittels DNA-Sequenzen bekannt. Bei
dieser Lösung
wird zum Erreichen universeller Berechnungsstärke unendlich viel DNA-Material
benötigt.
Die Beschreibung erfolgt auf einem sehr hohem Abstraktionsniveau.
Die Lösung
ist nicht laborpraktisch implementierbar.
-
In
der Druckschrift E. Csuhaj-Varju, R. Freund, L. Kari, G. Paun. DNA
computation based an splicing: universality results. Technical report
185-2/FR-2/95, TU Wien, Institute for Computer Languages, Wien,
Austria, 1995 wird eine Methode beschrieben, die zum Erreichen universeller
Berechnungsstärke
eine molekularbiologische Operation benötigt, die die Anzahl von Strangduplikaten
in einem Bioreaktor exakt bestimmt. Eine solche Methode ist derzeit
nicht bekannt. Die Beschreibung der Lösung erfolgt auf sehr hohem
Abstraktionsniveau und ist nicht laborpraktisch implementierbar.
-
Die
in der Druckschrift T. Yokomori, S. Kobayashi, C. Ferretti. On the
power of circular splicing systems and DNA computability. IEEE International
Conference an Evolutionary Computation, Indiana University, Purdue
University, Indianapolis, Illinois, 1997 beschriebene Lösung benötigt zum
Erreichen universeller Berechnungsstärke speziell konstruierte DNA-Ringe.
Die in einem Bioreaktor vorliegende finale Mischung aus unterschiedlichen
DNA-Ringen kann mit dem Stand der Technik in der Molekularbiologie
nicht hinreichend genau ausgelesen werden. Die Beschreibung der
Lösung
erfolgt auf sehr hohem Abstraktionsniveau und ist nicht laborpraktisch
implementierbar.
-
Bei
der in E. Csuhaj-Varju, L. Kari, G. Paun. Test tube distributed
systems based an splicing. Computers and AI, vol. 15(2–3), p.
211–232,
1996 beschriebenen Lösung
kann die Anzahl benötigter
Bioreaktoren in Abhängigkeit
des zu lösenden
Problems beliebig groß werden.
Einer Verringerung der DNA-Konzentration in den einzelnen Bioreaktoren
infolge von Verteilschritten wird nicht entgegengewirkt. Dadurch
kann die DNA-Konzentration unter die Erkennbarkeitsschwelle absinken.
Die Lösung
ist nicht laborpraktisch implementierbar.
-
Aus
der Druckschrift E. Laun, K. J. Reddy. Wet splicing systems. Proceedings
of 3rd DIMACS Workshop an DNA Based Computers, University of Pennsylvania,
p. 115–126,
1997 ist eine Lösung
bekannt geworden, die sich auf die laborpraktische Implementierung
des Spleissens für
genau einen Spezialfall beschränkt. Die
Druckschrift enthält
keinen Hinweis darauf, dass das Spleissen als ein Baustein für einen
universellen DNA-Computer herangezogen werden kann.
-
Aus
der
WO 97/07440 A1 ist
ein Molekular Computer bekannt geworden, der sich auf die sogenannte brute-force-Strategie
für NP-Probleme
beschränkt.
Mit dieser Lösung
ist kein universell verwendbarer Computer realisierbar.
-
Aus
der
US 5.804.373 ist
ein Molekular Computer bekannt, der auf der Nutzung von Einzel- oder Doppelstrang-DNA
basiert. Der Vorrat an oberflächenfixierten
informationstragenden DNA-Einheiten (Speicherkapazität) kann
bei Algorithmenabarbeitung sehr schnell erschöpft sein, wenn die nichtdeterministische
Turingmaschine von einer Konfiguration fortlaufend in sehr viele
mögliche
Folgekonfigurationen übergeht,
die alle weiterverfolgt werden müssen.
Das Auslesen des Ergebnisses, d. h. die Auswertung der oberflächenfixierten DNA-Einheiten
ist nicht beschrieben und wegen der speziellen zur Fixierung eingesetzten
Methode auch nicht mittels Standardtechniken zu erreichen.
-
Aus
der
US 5.843.661 ist
eine Methode zur Konstruktion einer universellen DNA-basierten molekularen
Turing-Maschine bekannt. Die Abarbeitung der mathematischen Operationen
bzw. molekularbiologischen Techniken erfolgt vollständig sequentiell.
Es ist weder Datenparallelität
noch Befehlsparallelität
gegeben. Die Lösung
erfordert eine Vielzahl sehr spezieller Restriktionsenzyme (sogenannte
nichtpalindromische Restriktionsendonucleasen, die die DNA außerhalb
ihrer Erkennungssequenz schneiden). Enzyme mit diesen Eigenschaften
sind in der benötigten
Anzahl unterscheidbarer Erkennungssequenzen und Schnittpositionen
nicht oder nur schwer verfügbar,
deshalb ist eine laborpraktische Implementierbarkeit nur in Spezialfällen gegeben. Es
besteht eine relativ große
Gefahr der Ergebnisverfälschung
durch Seiteneffekte und deren Aufsummierung in jedem Turingtakt.
Ein korrektes Auslesen der finalen Bandinschrift (Ergebnis) ist
deshalb sehr schwierig.
-
Aus
der
WO 00/12752 A1 ist
eine mechanische Turing-Maschine für die Verarbeitung von DNA-Sequenzen
bekannt. Beschrieben ist eine vollständig sequentielle Arbeitsweise,
weder Datenparallelität
noch Befehlsparallelität
sind gegeben. Es besteht auch hier eine Gefahr der Ergebnisverfälschung
durch Seiteneffekte und Aufsummierung der Seiteneffekte in jedem
Turingtakt. Ein korrektes Auslesen der finalen Bandinschrift (Ergebnis)
ist deshalb sehr schwierig. Bei dieser Lösung werden außerdem mechanische
(verschleißbehaftete)
Komponenten verwendet.
-
In
der
WO 00/44094 A1 wird
ein Molekular Computer beschrieben, der ebenfalls nicht universell
einsetzbar ist. Die Lösung
beschränkt
sich auf ausgewählte
Computerkomponenten (arithmetisch-logische Einheit und Speicher),
repräsentiert
jedoch keinen vollständigen
Computer. Die Übertragung
von Informationen findet mittels elektrischer Signale statt. Ebenso
finden elektrische/elektronische Bauteile Verwendung. Der Datenträger besteht
aus nichtbiologischen Materialien. Das Grundprinzip (Funktionsweise)
basiert auf neuronalen Netzen, d. h. die Verarbeitungseinheit zwischen
Eingabe und Ausgabe muss für
erstmalig bearbeitete Aufgabenstellungen neu trainiert werden. Ergebnisse
sind Näherungslösungen.
-
In
der Druckschrift J. S. McCaskill: „Optically programming DNA
computing in microflow reactors”,
BioSystems 59 (2001), S. 125–138 & Bib., available
online: 20 March 2001; eHB wird eine Anordnung von Mikroflussreaktoren
gezeigt. Mit dieser Anordnung wird nur eine DNA-basierte molekularbiologische
Operation ausgeführt.
Die Lösung
einer bestimmten Aufgabe mit einer molekularbiologische Operation
erfordert eine aufgabenbezogene Zusammenschaltung der Mikroflussreaktoren.
Damit weist die D1 an sich keine Ähnlichkeit mit einer universellen
Rechnerarchitektur oder einem universellen DNA-Computer auf.
-
Die
Aufgabe der Erfindung besteht darin, eine Anordnung für einen
DNA-Computer sowie ein Verfahren zur Abarbeitung von mathematischen
Operationen mittels eingeführter
molekularbiologischer Techniken anzugeben, um universell ein breites
Spektrum von mathematischen Operationen ausführen zu können, die insbesondere mittels
elektronisch basierter Rechentechnik nicht in beherrschbaren Zeitläufen ausführbar sind.
-
Erfindungsgemäß wird die
Aufgabe durch einen DNA-Computer mit den im Anspruch 1 genannten Merkmalen
gelöst.
Vorteilhafte Varianten der Anordnung sind Gegenstand von Unteransprüchen.
-
Weiterhin
wird die Aufgabe in Verbindung mit den im Oberbegriff des Anspruchs
6 genannten Merkmalen dadurch gelöst, dass als Eingangsgrößen in Bioreaktoren
DNA-Sequenzen bestimmter Längen
und Basenfolge eingegeben werden, zur Ausführung molekularbiologischer Operationen
in den Bioreaktoren Enzyme in die Bioreaktoren zugegeben werden,
wodurch eine Veränderung
der DNA-Sequenzen mit anschließender Filterung
in den dazu vorgesehenen Filterstufen zur Abarbeitung der mathematischen
Operationen erfolgt, und eine Ausgabe des Ergebnisses in einen dafür vorgesehenen
Bioreaktor durch eine spezifische Länge und/oder Basenfolge zumindestens
einer DNA-Sequenz erfolgt.
-
Der
DNA-Computer arbeitet ausschliesslich mittels definierter Abfolgen
wohluntersuchter molekularbiologischer Prozesse, die als einzigen
Datentraeger lineare DNA (Desoxyribonucleinsaeure) verwenden. Die zu
verarbeitenden Daten werden in Form von DNA-Strängen
gemäß Spezifikation
kodiert und durch die die Berechnung tragenden molekularbiologischen
Prozesse modifiziert. Die am Ende eines Berechnungsprozesses vorliegende,
zur Sequenzierung geeignete DNA repräsentiert das Berechnungsergebnis.
Der abzuarbeitende Algorithmus ist durch spezifizierte Prozessparameter
und genutzte Reagenzien eindeutig beschrieben. Der DNA-Computer
ist derart konstruiert, dass sich damit alle algorithmisch lösbaren (turing-berechenbaren) Aufgabenstellungen
auch tatsächlich
bearbeiten lassen.
-
Gegenüber elektronischen
Rechnern wie PCs besitzt der DNA-Computer den Vorteil, dass DNA
eine deutlich höhere
Speicherkapazität
und Speicherdichte ermöglicht,
als sie elektronische Speicherbausteine gestatten. Zudem lässt sich
DNA-Material beliebiger Herkunft (z. B. Genomsequenzen verschiedener
Organismen) unmittelbar verarbeiten und muss nicht erst aufwendig
in eine für
elektronische Computer nutzbare Form transformiert werden. Der DNA-Computer benötigt keine
elektronischen oder elektromechanischen Komponenten und unterliegt
deshalb keinerlei mechanischem Verschleiß wie beispielsweise Festplatten.
Da der DNA-Computer
ausschließlich
DNA in natürlich
vorkommender Form benutzt und die DNA auch durch die verwendeten
molekularbiologischen Prozesse nicht von ihrer natürlichen
chemischen Form und Struktur abweicht, ist das DNA-Material wiederverwendbar
und recyclingfähig.
Umweltbelastende und schwer entsorgbare Abprodukte, wie sie beispielsweise
durch Elektronikschrott entstehen, treten beim DNA-Computer nicht
auf.
-
Der
universelle DNA-Computer besteht aus einer Anordnung von mehreren
Bioreaktoren und Filterstufen. Zu Beginn wird eine Befüllung mit
DNA sowie mit spezifischen die DNA verändernden biologischen Substanzen
vorgenommen. Dabei werden unter diesen biologischen Substanzen Reagenzien
verstanden, die bei spezifizierten Umgebungsbedingungen (z. B. Temperatur,
pH-Wert) eine reproduzierbar nutzbare die DNA verändernde
Wirkung entfalten. Unter DNA-verändernden
Wirkungen wird verstanden:
- – gezielter Umbau chemischer
Bindungen,
- – innerhalb
von DNA-Strängen
(z. B. beim Zerschneiden eines DNA-Stranges),
- – zwischen
verschiedenen DNA-Strängen
(z. B. beim Zusammenfügen
zweier DNA-Stränge),
- – zwischen
DNA-Strängen
und Molekülen
oder chemischen Gruppen, die an Strangenden angelagert oder von
Strangenden entfernt werden (z. B. beim Phosphatgruppen-Abbau von
Strangenden),
- – Konvertierungen
zwischen DNA-Einzelsträngen
und DNA-Doppelsträngen,
- – Strangseparationen
nach verschiedenen physikalischen oder chemischen Merkmalen.
-
Die
DNA-verändernden
Wirkungen werden durch Einsatz spezifischer Enzyme, durch Schaffung
spezieller Umgebungsbedingungen (z. B. Temperatur-Zeit-Verläufe, pH-Milieus)
sowie durch Ausnutzung der elektrischen Ladung von DNA erzielt.
Mittels gesteuerter Verkettung solcher Wirkungen realisiert man
die dem DNA-Computer zugrundeliegenden Elementaroperationen Spleissen
und Filtern.
-
Die
Erfindung wird nachfolgend an Hand von Ausführungsbeispielen näher erläutert. In
den Zeichnungen zeigen:
-
1 eine
schematische Darstellung eines erfindungsgemäßen DNA-Computers
-
2 eine
formale Beschreibung des erfindungsgemäßen DNA-Computers gemäß 1
-
3 eine
formale Beschreibung des erfindungsgemäßen DNA-Computers gemäß 1 für die konkrete
Anwendung eines zu lösenden
Rucksackproblems
-
4 eine
Darstellung der Abarbeitung des Rucksackproblems auf der Ebene DNA-kodierender ergebnisrelevanter
Zeichenketten
-
1 zeigt
eine schematische Darstellung eines erfindungsgemäßen DNA-Computers
sowie die prinzipielle Arbeitsweise des DNA-Computers. Der DNA-Computer
besteht aus 6 Bioreaktoren T1–T6,
die über
jeweils einen Zulauf an ein Leitungssystem angeschlossen sind. In
den Bioreaktoren T1–T5
sind molekularbiologische Operationen ausführbar, wozu DNA-Sequenzen und
Enzyme und ggf. weitere Hilfsstoffe einfüllbar sind. Der Bioreaktor
T6 ist nur über
einen Zulauf an das Leitungssystem angeschlossen ist. An jeden Ablauf der
Bioreaktoren T1–T5
ist eine der Gesamtzahl der Bioreaktoren T1–T6 entsprechende Anzahl von
Filtern F1–F6
in Parallelschaltung angeschlossen. Die Ausgänge der Filter F1–F6 sind
so mit den Zuläufen
der Bioreaktoren T1–T6
verbunden, dass Filter mit gleichen Filtereigenschaften an den selben
Bioreaktor T1; T2; T3; T4; T5; T6 angeschlossen sind. Der Bioreaktor
T6 dient zur Aufnahme der DNA-Sequenz, die das gesuchte Ergebnis
repräsentiert.
-
Die
verarbeiteten DNA-Stränge
lassen sich entsprechend des Enthaltenseins bestimmter DNA-Subsequenzen zu spezifischen
Gruppen zusammenfassen. Jeder dieser Gruppen ist in 1 ein
entsprechendes Platzhaltersymbol zugeordnet. Insgesamt werden gemäß der Darstellung
in 1 sechs spezifische Gruppen von DNA-Sequenzen
unterschieden, die in separate Bioreaktoren eingehen und dort jeweils
gespleisst werden. Durch die in den Bioreaktoren T1 bis T5 parallel
ablaufenden Spleiss-Operationen werden DNA-Stränge gezielt rekombiniert, d.
h. an bestimmten Stellen zerschnitten und die Schnittfragmente werden
anschliessend neu zusammengesetzt. Dabei kann eine Vielzahl bisher
nicht vorhandener DNA-Sequenzen entstehen, die sich jedoch immer
eindeutig jeweils einer Gruppe zuordnen lassen. In 1 ist
dieser Prozess vereinfacht durch die Entstehung einer Mischung aus
allen Platzhaltersymbolen in den Bioreaktoren T1 bis T5 dargestellt. Der
initial leere Bioreaktor T6 dient zum Auffangen genau der Gruppe
von DNA-Sequenzen,
die das Berechnungsergebnis verkörpert.
Im Bioreaktor T6 findet folglich keine Spleiss-Operation statt.
Ebenso ist an den Bioreaktor T6 keine Filterstufe an einen Ablauf
angeschlossen.
-
Die
nach dem Spleissen in den Bioreaktoren T1 bis T5 jeweils vorliegende
Menge von DNA-Strängen gelangt über Pipelines
zu einer Filteranordnung die den Bioreaktoren parallel nachgeschaltet
ist. Jeder Filter Fi (i = 1, ..., 6) extrahiert genau jene Gruppe
von DNA-Strängen,
die wiederum in den zugeordneten Bioreaktor Ti eingeht. Dabei werden
alle separierten Stränge
der jeweiligen Filter Fi vereinigt und hinreichend dupliziert. Die
Duplizierung findet unmittelbar nach der Filterung statt. Die durch
die Spleiss-Operation in einem bestimmten Bioreaktor entstandene
DNA wird somit nachfolgend auf alle Bioreaktoren entsprechend der
Gruppenzugehörigkeit
verteilt. Die Schrittfolge ”Spleissen”, ”Filtern” und ”Verteilen” wird fortlaufend
wiederholt und solange angewendet, bis im Bioreaktor T6 hinreichend
viele Ergebnis-DNA-Stränge
mit gewünschten
Eigenschaften (Länge,
Enthaltensein bestimmter Subsequenzen) auswertbar vorliegen.
-
Die
Darstellung aus 1 sowie die Techniken des Spleissens,
Filterns und Verteilens wird nachfolgend schrittweise verfeinert
und dabei detaillierter beschrieben, um einerseits den DNA-Computer zu spezifizieren
und andererseits seine universelle Einsatzfähigkeit zu erläutern.
-
Im
mathematischen Sinne lassen sich DNA-Stränge als endliche Wörter bzw.
Wortbestandteile formaler Sprachen auffassen. Wörter entstehen durch Verkettung
(Aneinanderreihung) von Zeichen aus einem Zeichenvorrat (Alphabet),
wobei jedes Zeichen eineindeutig einem DNA-Doppelstrangabschnitt (DNA-Fragment) entspricht.
Eine (endliche oder unendliche) Menge von Wörtern wird als formale Sprache
bezeichnet. Formale Sprachen werden hinsichtlich ihrer Ausdruckskraft
(Mächtigkeit)
in Klassen eingeteilt. Als allgemeinste Klasse gilt die Klasse der
rekursiv aufzählbaren
Sprachen.
-
Sogenannte
Chomsky-Grammatiken dienen als generatives Beschreibungsmittel für formale
Sprachen und verkörpern
ein anerkanntes Berechnungsmodell. Sie sind in der Lage, genau die
zu einer Sprache gehörenden
Wörter
zu erzeugen. Chomsky-Grammatiken vom Typ 0 besitzen eine universelle
Berechnungsstärke.
Dies bedeutet, dass sie in der Lage sind, die Klasse der rekursiv
aufzählbaren
Sprachen zu beschreiben.
-
Beliebige
Berechnungsaufgaben und algorithmisch lösbare Probleme können konstruktiv
auf Chomsky Typ0-Grammatiken abgebildet werden. Die Ableitung von
Wörtern
der zugrundeliegenden formalen Sprache stellt einen Berechnungsprozess
dar, und die generierten Wörter
der Sprache repräsentieren
das Berechnungsergebnis. Die Arbeitsweise des DNA-Computers simuliert
beliebige derartige Berechnungsprozesse, wobei der abzuarbeitende
Algorithmus (das Programm) einschließlich der Eingabedaten entweder
unmittelbar als Chomsky Typ0-Grammatik gegeben oder gleichwertig
als beliebige deterministische Turingmaschine notiert ist, die im
Vorfeld der Berechnung konstruktiv in eine ergebnisäquivalente
Chomsky Typ0-Grammatik transformiert wird.
-
Das
Modell der deterministischen Turingmaschine ist ebenfalls ein anerkanntes
und etabliertes universelles Berechnungsmodell, das beliebige Berechnungen
auszuführen
vermag. Der DNA-Computer
generiert durch wiederholte Anwendung der Operationsfolge ”Spleissen”, ”Filtern” und ”Verteilen” in den
Bioreaktoren schrittweise die Wörter
der durch die Chomsky Typ0-Grammatik
gegebenen Sprache, die letztendlich im Bioreaktor T6 als Berechnungsergebnis
zur Verfügung
stehen.
-
Die
in dieser Erfindung beschriebene Anordnung kann wie folgt formal
beschrieben werden:
Der erfindungsgemäße DNA-Computer, nachfolgend
verkürzt
als TT6 bezeichnet, ist ein formales System TT6 = (V, Σ, T1, T2, T3,
T4, T5, T6) mit folgender Bedeutung der Komponenten:
V bezeichnet den Zeichenvorrat von Symbolen, die vom TT6 verarbeitet
werden können.
Jedes Symbol aus V ist eindeutig repräsentiert durch einen spezifischen
DNA-Doppelstrang, charakterisiert durch seine Basenabfolge und Stranglänge. Σ bezeichnet den
Zeichenvorrat von Symbolen, aus denen sich die vom TT6 ausgegebenen
Verarbeitungsergebnisse zusammensetzen. Jedes Symbol aus Σ ist eindeutig
repräsentiert
durch einen spezifischen DNA-Doppelstrang, charakterisiert
durch seine Basenabfolge und Stranglänge. Alle Symbole aus Σ sind auch
in V enthalten.
-
Weiterhin
besteht die Biohardware TT6 aus 6 Reagenzgläsern, nachfolgend T1 bis T6 genannt.
Jedes Reagenzglas Ti mit i = 1, ..., 6 wird
durch drei Komponenten beschrieben: Ti =
(Ai, Ri, Fi).
-
Ai bezeichnet eine endliche Menge von Axiomen,
mit denen vor Beginn einer Verarbeitung das Reagenzglas Ti initialisiert wird. Jedes Axiom aus Ai besteht aus einer endlichen Abfolge von
Symbolen aus V. Die konkreten Mengen Ai werden
in Abhängigkeit
von der zu lösenden
Problemklasse spezifiziert.
-
Die
Menge Ri bezeichnet eine endliche Menge
von Spleiss-Regeln, die im Reagenzglas Ti anwendbar sind
und dort eine gezielte Rekombination der enthaltenen DNA-Doppelstränge vornehmen,
welche durch Zeichenketten kodiert sind, die sich aus einer Abfolge
von Symbolen aus Σ ergeben.
Jede Spleiss-Regel setzt sich aus vier entsprechenden Zeichenketten
zusammen, die durch die Symbole # und $ voneinander getrennt sind. Eine
Spleiss-Regel der Form u1#u2$u3#u4 besagt, dass
zwei geeignet aus dem Reagenzglasinhalt von Ti ausgewählte Zeichenketten
nach folgender Vorschrift rekombiniert werden: Eine der beiden Zeichenketten
enthalte die Subsequenz u1u2,
die andere u3u4.
Die Zeichenketten werden zwischen u1 und
u2 sowie zwischen u3 und u4 aufgespaltet, so dass vier Einzelfragmente
entstehen. Diese vier Einzelfragmente werden anschließend derart
durch Ligation miteinander verkettet, dass die ursprünglichen
zwei Zeichenketten wieder entstehen sowie zusätzlich zwei Zeichenketten,
die als Subsequenz u1u4 und
u3u2 enthalten.
Die Subsequenzen u1u2 sowie
u3u4 lassen sich
den Erkennungssequenzen und Spaltstellen konkreter Restriktionsenzyme
zuordnen. Die konkreten Mengen Ri werden
in Abhängigkeit
von der zu lösenden
Problemklasse spezifiziert.
-
Fi bezeichnet die endliche Menge von Filtermustern
für das
Reagenzglas Ti. Durch die Filtermuster in Fi ist der dem Reagenzglas Ti nachgeschaltete
Filter spezifiziert. Genau diejenigen DNA-Stränge können den Filter nach Ti passieren, die als Anfangs- und Endstück exakt
die in einem Filtermuster aus Fi angegebenen beiden
Zeichenketten besitzen. Jedes Filtermuster ist beschrieben durch
ein Paar von Zeichenketten, die jeweils aus Abfolgen von Symbolen
aus V zusammengesetzt sind. Jedes Filtermuster kodiert ein Primerpaar
für eine
Polymerase-Kettenreaktion (PCR). Der Filterprozess besteht aus einer
Abfolge von PCR und stellt zusätzlich
hinreichend viele Strangduplikate für nachfolgende Verarbeitungsschritte
im TT6 zur Verfügung.
Die konkreten Mengen Fi werden in Abhängigkeit
von der zu lösenden
Problemklasse spezifiziert.
-
Die
Abarbeitung von Algorithmen auf TT6 erfolgt durch fortlaufend hintereinander
ausgeführte
Verarbeitungsschritte, die zeitparallel und synchron in den Reagenzgläsern des
TT6 ablaufen. Jeder Verarbeitungsschritt des TT6 gliedert sich in
drei aufeinanderfolgende Teilschritte, die als Spleissen, Filtern
und Verteilen bezeichnet werden.
-
Im
ersten Teilschritt, dem Spleissen, wird in jedem Reagenzglas Ti auf den dort jeweils vorliegenden Zeichenketten
eine Spleiss-Regel aus Ri angewandt, sofern
mindestens eine solche existiert. Gibt es mehrere anwendbare Spleiss-Regeln,
so wird eine davon willkürlich
ausgewählt.
Ist keine Spleiss-Regel anwendbar, so bleibt der Inhalt des Reagenzglases
Ti während
dieses Teilschrittes unverändert.
Eine Spleiss-Regel aus Ri ist genau dann
anwendbar, wenn im Reagenzglas Ti mindestens
zwei Zeichenketten vorliegen, wobei eine Zeichenkette davon die
Subsequenz u1u2 und
die andere die Subsequenz u3u4 enthält.
-
Im
zweiten Teilschritt, dem Filtern, stellt jedes Reagenzglas Tj Kopien ausschließlich derjenigen Zeichenketten
bereit, die in andere Reagenzgläser,
d. h. in die Ti mit i ≠ j, verteilt werden. Zu diesem
Zweck wird für
jedes Filtermuster aus Fi eine PCR durchgeführt, wobei
die jeweiligen, durch das Filtermuster bestimmten Primerpaare zum
Einsatz kommen. Durch dieses Filterprinzip wird sichergestellt,
dass nur diejenigen Zeichenketten dupliziert werden, die im Zielreagenzglas
in die Weiterverarbeitung einbezogen sind. Auf diese Weise wird
eine Ressourcenminimierung erreicht.
-
Der
dritte Teilschritt realisiert das eigentliche Verteilen: alle zur Übertragung
in das Reagenzglas Ti, i = 1, ..., 6 vorbereiteten
Zeichenkettenduplikate aus anderen Reagenzgläsern werden zusammengeführt und dem
Reagenzglas Ti hinzugefügt.
-
Mit
der Hintereinanderausführung
aller drei Teilschritte ist ein Verarbeitungsschritt des TT6 abgeschlossen.
T6 ist durch die Spezifik der Mengen A6, R6 und F6 als gesondertes Ergebnisreagenzglas ausgewiesen,
in das ausschließlich
Verarbeitungsergebnisse eingebracht werden und in welchem keine
Spleiss-Regeln zur Anwendung kommen.
-
Die
Algorithmen, die auf dem erfindungsgemäßen DNA-Computer TT6 abgearbeitet
werden können, werden
in Form einer Chomsky-Grammatik vom Typ 0 in Kuroda-Normalform notiert.
Der Stand der Technik gestattet es, beliebige Algorithmen konstruktiv
in eine solche Form zu transformieren, so dass die Biohardware TT6
dem Anspruch an einen universellen Computer gerecht wird.
-
Aus
der gegebenen Chomsky-Grammatik vom Typ 0 in Kuroda-Normalform wird
entsprechend der in 2 dargestellten Vorschrift eine
konkrete Belegung aller Parameter des TT6 definiert. Alle Bestandteile
der Grammatik werden in korrespondierende Parameter des TT6 aufgenommen.
Solche Parameter sind beispielsweise die Initialbelegungen Ai der einzelnen Reagenzgläser Ti sowie
die Zeichenketten, welche Erkennungssequenzen und Spaltstellen für die Anwendung
von Spleiss-Regeln beinhalten. Die durch die Filtermuster in F1 bis F5 bestimmten
PCR-Primerpaare sind unabhängig
vom abzuarbeitenden Algorithmus und somit von der gegebenen Chomsky-Grammatik.
Sie lassen sich durch systemeigene feste Zeichenketten beschreiben
und können
aus diesem Grund durch einen konstanten, immer wieder verwendungsfähigen DNA-Pool
kodiert und eingesetzt werden.
-
Die
in den einzelnen Reagenzgläsern
spezifizierten Spleiss-Regeln r
ij ∊ R
i erfüllen
die nachstehend beschriebenen Aufgaben:
-
Ausführungsbeispiel
-
Als
Ausführungsbeispiel
für die
Biohardware TT6 wird ein entsprechender DNA-Computer spezifiziert, der
das als NP-vollständig
bekannte Rucksackproblem aus der Klasse kombinatorischer Suchprobleme
löst.
-
Das
Rucksackproblem auf natürlichen
Zahlen ist wie folgt definiert: Gegeben seien n natürliche Zahlen a1, ..., an mit n ∊ IN\{0}
sowie eine natürliche
Zahl b. Gibt es eine Teilmenge I ⊆ (1, 2, n} mit Σ i<1ai =
b?
-
Die
Zahlen a1 bis an lassen
sich als Gewichte der Gegenstände
1 bis n auffassen. Das Rucksackproblem kann durch die Fragestellung
veranschaulicht werden, ob es eine Packmöglichkeit eines Rucksacks mit einer
Auswahl aus diesen Gegenständen
gibt, so dass der Rucksackinhalt exakt dem Referenzgewicht b beträgt. Die
Anzahl n der Gegenstände
stellt die Problemgröße dar.
Mit n Gegenständen
existieren 2n Packmöglichkeiten des Rucksacks.
-
Die
nachstehend angegebene Chomsky-Grammatik vom Typ 0 beschreibt einen
Lösungsalgorithmus für beliebige
Rucksackprobleme:
G = (VG, Σ, PG, SG)
VG = {H, C, D} ∪ {Ai|i
= 1, ..., n} ∪ {SG}
Σ =
{yes}
PG = {(SG → CA1A2 ... AnD)} ∪
{(Ai → Ha_i)|i = 1, ..., n} ∪
{(Ai → ε)|i = 1,
..., n} ∪
{(CHbD → yes)}
-
Im
Falle der Lösung ”ja” wird die
Ergebniszeichenkette ”yes” erzeugt
und ausgegeben.
-
Weiterführend wird
das konkrete Rucksackproblem mit drei Gegenständen und ihren Gewichten a1 = 3, a2 = 1, a3 = 2 sowie dem Referenzgewicht b = 3 betrachtet,
für welches
sich folgende Chomsky-Grammatik des Typs 0 ergibt:
G = (VG, Σ,
PG, SG)
VG = {H, C, D, A1,
A2, A3, SG}
Σ =
{yes}
PG = {(SG → CA1A2A3D),
(A1 → HHH),
(A1 → ε),
(A2 → H),
(A2 → ε),
(A3 → HH),
(A3 → ε),
(CHHHD → yes)}
-
Nach Überführung dieser
Grammatik in Kuroda-Normalform entsteht:
GKN =
(VG, Σ,
PG, SG)
VG = {H, C, D, A1,
A2, A3, SG, E1, E2,
E3, F1, G1, G2, G3,
G4}
Σ =
{yes}
PG = {(SG → CE1), (E1 → A1E2), (E2 → A2E3), (E3 → A3D),
(A1 → HF1), (F1 → HH), (A1 → ε),
(A2 → H),
(A2 → ε),
(A3 → HH),
(A3 → ε),
(CH → G1), (G1H → G2), (G2H → G3), (G3D → G4), (G4 → yes)}
-
Aus
der Chomsky-Grammatik GKNF wird unter Nutzung
der Vorgaben für
die Systembeschreibung aus 2 eine konkrete
Biohardware TT6, wie in 3 dargestellt, spezifiziert.
Die 4 zeigt die schrittweise Verarbeitung der aus
GKNF resultierenden Zeichenketten. Die in
jedem Schritt neu entstehenden, ergebnisrelevanten Zeichenketten
sind in 4 dargestellt.